Statisztika I. GZM, EE, TV szakok (nappali tagozat) 2012-2013-as tanév I. félév
Oktató: Dr. Csáfor Hajnalka tanszékvezető főiskolai docens Regionális és Környezetgazdaságtan Tsz. E-mail:
[email protected]
Té kö ök Témakörök
Statisztikai alapfogalmak Statisztikai elemzések viszonyszámokkal Statisztikai adatok és információk grafikus megjelenítése M Mennyiségi i é i iismérv é szerinti i ti elemzés l é ((számított á ít tt é és helyzeti középértékek, szóródás mutatói, aszimmetria)) Indexszámítás (érték-, ár- és volumenindexek, területi indexek és indexsorok) Sztochasztikus kapcsolatok vizsgálata (asszociáció és vegyes kapcsolat)
(Részletesen a tantárgyi programban, ami a GTI honlapján érhető el.)
Köt l ő és Kötelező é ajánlott já l tt irodalmak i d l k Kötelező irodalom:
Dr. Illyésné dr. Molnár Emese: Statisztikai feladatgyűjtemény I Perfekt Kiadó 2009 I. 2009. Továbbá a zárthelyi dolgozatok anyagát képezik az előadásokon és szemináriumokon elhangzottak.
Ajánlott irodalom:
Korpás Attiláné dr.: Általános statisztika I. Nemzeti Tankönyvkiadó 2005. Hunyadi László – Vita László: Statisztika I. BA tankönyv AULA Kiadó Bp. 2009. Molnár Máténé dr. – Tóth Mártonné dr.: Általános statisztika példatár I. I Nemzeti Tankönyvkiadó 2005 2005.
Számonkérés és értékelés
A gyakorlatokon való részvétel kötelező, a félév során – igazolástól függetlenül – legfeljebb 3 alkalommal lehet a gyakorlaton való részvételt elmulasztani.
A félév folyamán két – egyenként 50 pontos – dolgozat megírására kerül sor. A félév végi harmadik, gyakorlati jegy pótló dolgozat egy 100 pontos – az egész félév anyagát felölelő – dolgozat. A gyakorlatokon k l t k való ló számonkérések á ké é k során á ttovábbi ábbi pontok t k szerezhetők. h tők
A két zárthelyi dolgozat – vagy azok sikertelensége esetén a pótló dolgozat – és a szemináriumokon esetlegesen szerzett pontok alapján a féléves teljesítményértékelés a következőképpen történik: 88 100 pont 88-100 75-87 pont 62-74 pont 50-61 pont 50 pont alatt
5 (jeles) 4 (jó) 3 (közepes) 2 (elégséges) 1 (elégtelen)
1 ZH: október 17. 1. 17 2. ZH: december 5. Pót ZH: december 12.
Statisztikai p g alapfogalmak (2012. szeptember 12. 10.00-11.30)
Statisztikai alapfogalmak
Statisztika fogalma, tárgya és szerepe St ti tik i sokaság Statisztikai k á é és iismérv é Mérési szintek Statisztikai adat és mutatószám Statisztikai sorok Statisztikai táblák Adatfelvétel, adatszerzési módok Kérdőívszerkesztés A statisztikai adatok pontossága
Statisztika fogalma Tömegesen előforduló jelenségek egyedeire vonatkozó tk ó (elméleti ( l él ti és é gyakorlati) k l ti) tevékenység: t ék é
adatgyűjtés – gyakorlati tevékenység adatfeldolgozás tudományos y módszertan adatok d t k elemzése l é
a vizsgált jelenség számszerű, tömör jellemzése. Pl. népszámlálás, földtulajdon-összeírás (gyak.), vizsgálati i ál ti módszerek ód k ki kiválasztása ál tá ((elm.) l )
Statisztika fogalma A statisztika tárgyát képező tömeges jelenségek között találunk a hétköznapi életben előforduló és a társadalmigazdasági jelenségeket is, ami alapján megkülönböztetünk: Általános statisztikát és Szakstatisztikákat (gazdaság-, népesség-, ágazati-, társadalomstatisztika, stb. A jelenségeket le lehet írni egyszerűbb eszközökkel és bonyolultabb matematikai-statisztikai módszerekkel. Ennek megfelelően megkülönböztetünk: Leíró statisztikát és Statisztikai következtetést
Statisztika fogalma
Egyidős az állammal… Mo on a XVIII Mo-on XVIII.sz. sz az „első első összeírás” összeírás XIX.sz. a statisztika komoly fejlődésnek indul: kialakul az intézményrendszer intézményrendszer, központi adatszolgáltatás (Fényes Elek, Kőrösi József) Központi p Statisztikai Hivatal ((KSH,1867) , ) 1993-as XLVI-os törvény a statisztikáról 223/2009/EK rendelet az európai p statisztikáról Regionális adatszolgáltatás prioritása (NUTS-1. ország, NUTS-2: régió, NUTS-3: megye)
Statisztikai sokaság és ismérv
Statisztikai sokaság: A megfigyelés tárgyát képező egyedek összessége. (élőlény, tárgy, intézmény, stb.)
Egyedek, egységek: a sokaság legkisebb részei
Sokaság fajtái:
diszkrét – folytonos (elkülönült egységek – önkényes elkülönítés) álló – mozgó (időpont – időtartam) véges – végtelen (véges sok elem – végtelen sok elem)
Statisztikai sokaság és ismérv
Statisztikai ismérvek: Olyan vizsgálati szempontok, amelyek alapján l já a sokaság k á egységei é i jjellemezhetők ll h ők g ismérvek esetén – és – megkülönböztető egymást nem fedő részekre bontható. Egy adott ismérv szerinti lehetséges tulajdonságokat (előfordulási lehetőségeit) az ismérv változatainak nevezzük nevezzük.
Statisztikai sokaság és ismérv
Ismérvek fajtái (tulajdonság fajtája): 1) Időbeli ismérvek 2) Területi ismérvek 3) Mennyiségi ismérvek Tárgyi ismérvek 4) Minőségi ismérvek - Alternatív ismérvek - több változattal rendelkező ismérvek - Közös ismérvek - Megkülönböztető Megkülönbö tető ismér ismérvek ek
Mérési szintek Csak a mennyiségi ismérvek adatai számadatok, de bizonyos szabályok mellett minden ismérv lehetséges változatai számértékké alakíthatók alakíthatók. Mérés: számok meghatározott szabályok szerinti hozzárendelése jelenségekhez (dolgok (dolgok, tárgyak, események), illetve azok bizonyos tulajdonságaihoz. tulajdonságaihoz
Mérési szintek 4 féle mérési szintet (skálát) különböztetünk meg:
Névleges/nominális Né l / i áli mérési é é i szint i Sorrendi/ordinális mérési szint Különbségi/intervallum mérési szint Arányskálán történő mérés
Mérési szintek
Névleges/nominális mérési szint: Számok közvetlen hozzárendelését jelenti az egységekhez. Ezek ún. kódszámok, amelyek csak a sokaság egyedeinek gy azonosítását szolgálják. g j (azonosság és különbözőség) Közük semmilyen reláció nem áll fenn, fenn és velük számtani művelet nem végezhető. Pl: rendszám, irányítószám, megyék száma
Mérési szintek
Sorrendi/ordinális mérési szint: A sokaság egyedeihez – bizonyos közös tulajdonság alapján – rendelt skálaérték sorrendisége írja le azok viszonyát. Az egységhez rendelt számérték sorrendje pontosan tükrözi az adott egység valamilyen szempontból vett sorrendjét sorrendjét. A számértékek magukban nem hordoznak információt ((különbségeik g nem értelmezhetők), ), csak azoknak a rendje. Pl: hallgatók osztályzatai, osztályzatai áruk minőség szerinti osztályozása, katonai rendfokozat, stb.
Mérési szintek
Különbségi/intervallum mérési szint: Kezdőpontja önkényesen választott választott. A skálaértékek sorrendje és különbségei is i f információt á iót h hordoznak d k a sokaság k á egyes egyedeiről. A skálán az értékek aránya és összege nem értelmezhető. Pl: a +10 és a +20 C fokok közötti különbség ugyanannyi, mint a -5 és a +5 C ffokok közötti különbség.
Mérési szintek
Arányskálán történő mérés: A legtöbb információt nyújtó mérés. A kezdőpont egyértelműen rögzített, ennek köszönhetően két skálaérték egymáshoz gy viszonyított y aránya y is meghatározhatóvá válik. Adatain minden matematikai művelet végezhető. Az értékek különbségei bizonyos esetekben csak arányskálával egyetemben értelmezhetők: 800 Æ 1.000 (200 emelkedés) 10.000 Æ 10.200
Pl: életkor,, termelési érték,, jövedelem j nagysága gy g (amelyeket mind 0 értékről kiindulva mérik)
Feladat/1. Sokaság
Egy konkrét egység A magyar Kiss Réka népesség 2007. január elsején
Ismérv
Születési idő Lakóhely Nem Életkor
Ismérvváltozat
Ismérvfajta/ Mérési skála 1976 Időbeli/ intervallum Budapest Területi/ nominális Nő Minőségi/ nominális 29 Mennyiségi/ y g arány
Feladat/2. Adottak az alábbi sokaságok: Magyarország népessége 2006. jan.1-jén 10 076 581 fő. A budapesti férfiak sörfogyasztása a 2006-os VB idején. BCE oktatói 2006 2006. szept szept. 4 4-én. én Jótékonysági koncertek 2006-ban a Zeneakadémián. Feladat: Állapítsa meg a sokaságok típusát és egységeit!
Feladat/3. Döntse el az alábbi ismérvekről, hogy mennyiségi vagy minőségi g ismérvek-e!
Nem (férfi, nő)
Életkor Él tk
Magasság
Testsúly
Családi állapot
Iskolai végzettség g g
Foglalkozás
Bruttó havi fizetés
Statisztikai adat és mutatószám
Statisztikai adat: Az egyedekről szerezhető információ. (szám, vagy számszerű jellemző) fogalmi jegy időbeli azonosító térbeli azonosító számérték mértékegység
Statisztikai mutatószám: Valamilyen y statisztikai módszerrel a rendelkezésre álló adatokból számított származtatott statisztikai mérőszám.
(mérés vagy számlálás) (Havi) Átlagbér Magyarországon 2008-ban bruttó
Például:
194.000 Ft/fő/hó
Statisztikai sorok A sokaság egy ismérv szerinti tömör jellemzése. j Sorkészítés célja szerint: Csoportosító sor Összehasonlító sor Leíró sor
Valódi statisztikai sorok (azonos fajtájú adatokból) Nem valódi statisztikai sor (különböző fajtájú adatokból)
Ismérvfajtáknak megfelelően: Időbeli (tartam-állapot), területi, minőségi, mennyiségi + leíró sorok Sorok készítése:
ismérvváltozatok
számszerű értékek
Statisztikai sorok
Csoportosító statisztikai t ti tik i sor: A sokaság belső összefüggéseit fejezi ki, csoportosítás céljából készül, adatai összegezhetők. (időbeli, területi, minőségi, mennyiségi)
Ismérvváltozatok ált t k
Egységek száma
C1 C2 . . Ci . Ck
f1 f2 . . fi . fk
Összesen:
N
Statisztikai sorok
Például: A teremben ülő hallgatók hajszín szerint. minőségi csoportosító statisztikai sor
Hajszín
Hallgatók száma/fő
barna szőke fekete vörös ősz egyéb
23 12 4 2 2 1
Összesen:
44
Statisztikai sorok
Összehasonlító statisztikai t ti tik i sor: Összehasonlító adatok d t k statisztikai t ti tik i sorba rendezve, összehasonlítási céllal, adataik nem összegezhetők összegezhetők. (idősor, területi)
Ismérvváltozat C1 C2 . . Ci . Ck
Számérték/ mértékegység adat adat . . adat . adat
Statisztikai sorok
Például: egy f l ő kt tá i felsőoktatási intézmény nappali tagozatos hallgatóinak átlagos havi ösztöndíja 2004 és 2010 között Összehasonlító időbeli sor
É Év
Havi átlagos ösztöndíj (Ft/hallgató)
2004 2005 2006 2007 2008 2009 2010
12.600 Ft 13.200 Ft 13.800 Ft 14.100 Ft 14 000 Ft 14.000 14.200 Ft 15.000 Ft
Statisztikai sorok Statisztika sorok kellékei:
Cím (sokaság pontos megnevezése, megnevezése a közös ismérvek felsorolása) T l jd Tulajdonságok, á k iismérvváltozatok é ált t k ffelsorolása l lá Ismérvváltozatoknak megfelelő gyakoriságok felsorolása Összesen rovat ((csak a csoportosító p sor estében) A forrás megnevezése
Statisztikai táblák Statisztikai sorok összefüggő gg rendszere.
Egyszerű tábla (összehasonlító és/vagy leíró sorok) Nincs csoportosító sora sora, egy adata adata, egy statisztikai sor tagja.
Csoportosító tábla (csoportosító és/vagy összehasonlító vagy leíró sorok) Egyirányú csoportosítást tartalmaz, egy adata egy statisztikai sor tagja.
Kombinációs tábla (csoportosító sorok) Csak csoportosító sorokat tartalmaz, egy adata egyidejűleg több statisztikai sor tagja.
Statisztikai táblák
Egyszerű statisztikai tábla Egy gy városban az orvosellátottság g alakulása: Év
Orvosok száma (fő)
Lakosok száma (fő)
Egy orvosra jutó lakosok száma
1990
240
80 000
333,3
1999
360
100 000
277,8
Statisztikai táblák
Csoportosító statisztikai tábla Búzatermelés adatai 1991-ben: Körzet
Termés (ezer tonna)
Termésátlag (t/ha)
Dunántúl
2000
5,2
Alföld
3000
5 31 5,31
Észak
705
4,71
Összesen
5705
…
Statisztikai táblák
Kombinációs statisztikai tábla Egy felsőfokú intézmény nappali tagozatos hallgatónak jegyei statisztikából 1991/1992 II. félév:
Osztályzat
A
B
C
Összesen
kar hallgatóinak megoszlása 5
19
23
19
61
4
32
49
40
121
3
24
36
56
116
2
20
36
82
138
1
1
2
18
21
Összesen
96
146
215
457
Statisztikai táblák A statisztikai táblák részei:
Oszlop (a táblázat egy oszlopa) Sor (a táblázat egy sora) Rovat (sor és oszlop találkozása) Fejrovat (a táblázat első sora, mely szövegesen tartalmazza az egyik ismérv változatait) Oszloprovat (a táblázat első oszlopa, mely szövegesen tartalmazza a másik szerinti ismérvváltozatokat) Összegrovat (a sorok és oszlopok összességét t t l tartalmazza) )
Statisztikai táblák Dimenziószám: Azt mutatja, hogy a tábla egy statisztikai adata egyidejűleg hány statisztikai sor tagja. Tábl ké íté szabályai: Táblakészítés bál i
Cím (azonosítókkal!, idő, hely, stb.) Old l Oldalrovatok t k (f (fejrovat j té és oszloprovat) l t) megnevezése é Egy rovat sem üres (--, ●(●); … , 0,0) Megjegyzés (ha valamely rovatában lévő adat eltérő mértékegységű) Forrásmegjelölés o ás egje ö és ((!))
Adatszerzési módok Teljes körű felvétel
Részleges felvétel
Reprezentatív p megfigyelések
Monográfia g
Vé et e e Véletlenen alapuló
Egyéb részleges adatfelvétel
Nem véletlen Ne vé et e (kontrolált)
Kérdőívszerkesztés
Alapos szakmai hozzáértés Tömör egyértelmű, Tömör, egyértelmű könnyen megválaszolható kérdések Főleg feleletválasztós (karikázós, x-elős és kevés kifejtendő j választ igénylő) g y ) Ne legyen túl hosszú Ajánlott j az anonim adatfelvétel Kompromisszum: csak a legfontosabb dolgokat kérdezzük Vé l Véglegesítés í é előtt: lő próbalekérdezés ób l ké d é Ha nyereményhez kötjük, növelhető a válaszadási arány
Adatok pontossága
ˆ A Mért adat d
± aˆ
αˆ
aˆ = ˆ A
Abszolút b l hibakorlát hib k l Relatív l hibakorlát hib k l
Szignifikáns g számjegyek: j gy a pontosnak p tekinthető számjegyek 10 k aˆ ≤ , ahol h l 2
Például Mo. népessége (90-ben): 10.277 ezer ± 500 fő
l l ó kiírt kií szignifikáns i ifiká számjegy á j helyértéke h l é ék 10 k : a legutolsó
Feladatok (stat. (stat alapfogalmak) Perfekt P f kt Statisztika St ti tik I. I példatár: éld tá 57/4, 58/7, 59/9, 60/11, 60/13, 61/14, 61/15, 61/16, 63/20, 63/21, 64/23, 64/26 További gyakorló feladatok az általános statisztika I. I (zöld) példatárból: 11/2, 12/3 (sokaság fajtája) 12/4, 12/4 13/5 13/5, 13/6 13/6,13/7, 13/7 14/8 14/8, 14/9 14/9, 14/10 14/10, 15/11 (sokaság és ismérvfajták) 15/13 (százalék és százalékpont)
Statisztikai elem ések elemzések viszonyszámokkal (2012. szeptember 19. 10.00-11.30)
Viszonyszámok Viszonyszám y fogalma g Viszonyszámok fajtái Megoszlási M lá i é és kkoordinációs di á ió viszonyszámok Dinamikus viszonyszámok Viszonyszámok közötti összefüggések Intenzitási viszonyszámok y
Viszonyszámok Viszonyszám: y két,, egymással gy kapcsolatban p álló statisztikai adat hányadosa (V)
A , ahol h lA A: a viszonyítás i ítá tá tárgya V= (viszonyítandó adat) B B: a viszonyítás alapja Azonos adatokból (% v. együtthatós) – Különböző fajta adatokból (int.)
Viszonyszámok fajtái
Csoportosító sorokból:
Összehasonlító sorokból:
Megoszlási viszonyszámok (Vm) Koordinációs viszonyszámok (Vk)
Dinamikus viszonyszámok (Vd: Vdl és Vdb) F l d t és Feladaté tteljesítménymutató lj ít é t tó (Vf és é Vt) Területi összehasonlító (Vö)
Leíró sorokból:
Intenzitási viszonyszámok (Vi)
Viszonyszámok fajtái
Megoszlási viszonyszám: rész és egész egymáshoz viszonyított y arányát y fejezi j ki Koordinációs viszonyszám: a sokaság két részadatát viszonyítja Dinamikus viszonyszám: idősor adataiból számított hányados A (a ( tárgyidősz á idő ak k adata) d ) V= B (a bázis időszak adata) Intenzitási viszonyszám: különböző fajta, különböző mértékegységűgy g de egymással gy kapcsolatban p lévősokaság adataiból számított viszonyszám
Viszonyszámok fajtái
Megoszlási viszonyszám: A (a sokaság egy részadata) Vm = B (a sokaság egészére vonatkozó adat)
Pl. 26 fiú és 32 lány jár a csoportba, összesen 58 hallgató (100%).
26 Vm = = 0,45 58 32 Vm = = 0,55 58
45 % a fiúk aránya Összesen: 100% 55% a lányok arány
Viszonyszámok fajtái
Koordinációs viszonyszám: A (viszonyított részadat) Vk = B (a viszonyítás alapjául szolg. szolg részadat)
Pl. mozilátogató g nők: 1942 fő,, mozilátogató g férfiak: 1876
1942 Vk = = 1,035 1876
1000 mozilátogató ffi-ra 1035 mozilátogató nő jut
1876 Vk = = 0,966 1942
1000 mozilátogató nőre 966 mozilátogató ffi jut
Viszonyszámok fajtái
Koordinációs viszonyszámokból az eredeti adatok d t k ismerete i t nélkül élkül iis számíthatók á íth tók megoszlási viszonyszámok. A férfiak aránya:
1000 Vm = = 49,14 1000 + 1035
966 Vm = = 49,14 1000 + 966
A nők aránya:
1035 Vm = = 50,85 1000 + 1035
1000 Vm = = 50,86 1000 + 966
Dinamikus viszonyszámok y
Bázisviszonyszám: Bá i i á Vdb db / b = t yb
yi Vdl / l = Láncviszonyszám: Lá i á y i −1
Feladat/1. Az alábbi táblázatban 2000-2005 közötti idegenforgalommal kapcsolatos adatok láthatók: Magyarországra érkező külföldiek
Külföldre utazó magyarok
ezer fő
ezer fő
2000
31 141
11 065
2001
30 679
11 167
2002
31 739
12 966
2003
31 412
14 283
2004
36 635
17 558
2005
38 555
18 622
Év
Elemezze bázis- és láncviszonyszámokkal a Magyarországra érkező külföldiek és a külföldre utazó magyarok számának alakulását!
Megoldás
Megoldás
Di Dinamikus ik viszonyszámok i á k Viszonyszámok közötti összefüggések: 1. Az első (azaz nulladik) időszakra nem tudunk láncviszonyszámot számolni 2. Az állandó bázisul választott időszakban a bázisviszonyszám értéke 1, azaz 100% 3. Az állandó és a bázisul választott időszak után következő időszakban a bázis és a láncviszonyszám megegyezik 4. Láncból bázis: adott időszak bázisviszonyszáma kiszámolható az adott időszak és az azt megelőző időszakok láncviszonyszámainak k szorzataként:
l 2 ⋅ l3 ... ⋅ l k = bk → ∏ l i = bi i 2 i=2
5. Bázisból lánc: adott időszak láncviszonyszáma kiszámítható az adott időszak és az azt megelőző időszak bázisviszonyszámának há hányadosaként: d ké t b i
bi −1
= li
Viszonyszámok közötti összefüggések Magyarországra érkező külföldiek esetén:
Pl : Pl.:
l2002
b 2002 1,, 0192 = = = 1, 1 0345 b 2001 0,9852
Külföldre utazó magyarok esetén: Pl.:
b
2003
= l2001 ⋅ l2002 ⋅ l2003 = 1, 0092 ⋅1,1611⋅1,1016 = 1, 2908
Viszonyszámok fajtái Pl. bázisévben (tavaly) 100 autót szereltem össze, erre az évre 120-at terveztem, de csak 110 lett belőle
Feladatmutató viszonyszám:
Tárgyid. tervezett adata Vf = Bá i id adata Bázisid. d
120 Vf = = 1,2 100
Teljesítménymutató viszonyszám:
Tárgyid. tényleges adata Tárgyid Vt = Tárgyid. tervezett teljesítménye
110 Vt = = 91,66 120
Viszonyszámok fajtái
Területi összehasonlító viszonyszám: Vö =
Viszonyítandó terület adata Viszonyítá y s alapjául pj szolg. g terület adata
Pl. Heves megye és BAZ megye népességének Pl összehasonlítása: Heves megye népessége 328000 Vö = = = 0, 4437 739143 BAZ megye gy népessége p g
Intenzitási viszonyszám Vi = A/B A/B, megmutatja, megmutatja hogy a vizsgált jelenség milyen intenzitással fordul elő valamely más jelenség környezetében. környezetében
Sűrűségmutatók: Pl: népsűrűség, 1 négyzetkilométerre jutó lakos szám
Ellátottságot kifejező mutatók: Pl orvossall való Pl: ló ellátottság llát tt á
Színvonalmutatók: Pl: 1 főre jutó átlagkereset, átlagkereset 1 dolgozóra jutó termelési érték, 1 főre jutó GDP
Arányszámok: Pl: 100 főre jutó születések száma, halálozási arányszám
Intenzitási viszonyszám
Egyenes intenzitási viszonyszám: A mutató színvonalának alakulása egybeesik az int. y növekedésével. viszonyszám Pl: orvosok száma / lakosok száma (ezer fő) ((1000 lakosra jjutó orvosok száma))
Fordított intenzitási viszonyszám: Amikor a jelenség színvonala javul, akkor a fordított int. viszonyszám értéke csökken. Pl: lakosok száma (e fő) / orvosok száma (1 orvosra jutó lakosok száma)
Intenzitási viszonyszám
Nyers intenzitási viszonyszám: (a teljes sokasághoz viszonyítunk) Pl: tejhozam / tehenek száma dolgozók / hallgatók
Tisztított intenzitási viszonyszám: (csak a jelenséggel szorosan kapcsolatban álló részhez viszonyítunk) Pl: tejhozam / tejelő tehenek száma oktatók / hallgatók
Viszonyszámok gyakorlása A következő adatok az 1998. évi statisztikai évkönyvből származnak:
Az egy fő A főre jjutó tó GDP 1998 1998-ban b 4694 USD volt, lt amii az előző lő ő évinél é i él 5,1%-kal volt több. Az építőiparban a 100 fizikaira jutó szellemi foglalkozásúak száma 29 fő, a fizikaiak aránya pedig 77, 4% volt 1998-ban. 1998-ban az 1000 lakosra jutó születések száma 9,6 volt. A felsőoktatásban egy oktatóra 12,1 hallgató jutott 1998-ban. A PSZF-en 1998-ban oklevelet szerzett hallgatók 61,9%-a nő volt. Budapest népessége 1990-ről 1999-re (január 1-jei adatok alapján 8,8%-kal csökkent. 1998 b az egy fő 1998-ban főre jjutó tó é évii átl átlagos gyümölcsfogyasztás ü öl f tá 62 62,6 6 kkg volt.
Feladat: Nevezze meg a felsorolt viszonyszámok fajtáit és jelölje meg kiszámításuk módját! (Zöld példatár 19/22)
Feladatok (viszonyszámok) Perfekt Statisztika II. példatár: 72/39, 73/41, 73/43, 76/48 66/28, 67/30, 68/32, 69/33, 75/47, 78/52, 78/53 , 79/54, 80/56 További gy gyakorló feladatok az általános statisztika (zöld) példatárból: 16/15, 17/18, 18/20, 19/23 15/13 (százalék és százalékpont), 43/81, 43/81 43/82, 43/82 41/77, 41/77 41/78, 41/78 42/79, 42/79 42/80 (viszonyszámok és összefüggéseik)
Népességstatisztikai p g definíciók
Definíciók
Lakónépesség: az adott területen lakóhellyel rendelkező rendelkező, és másutt tartózkodási hellyel nem rendelkező személyek valamint az ugyanezen személyek, területen tartózkodási hellyel rendelkező személyek y együttes gy száma.
Természetes szaporodás (fogyás): az élveszületések és a halálozások különbözete.
Definíciók
Tényleges szaporodás (fogyás): a természetes szaporodás (fogyás) és a vándorlási á d lá i (b (belföldi lföldi é és nemzetközi) tkö i) külö különbözet bö t (+,–) összege. Gyermeknépesség eltartottsági rátája: a gyermeknépesség (0–14 éves) a 15–64 éves népesség g százalékában. Idős népesség eltartottsági rátája: az idős népesség (65–X éves) a 15–64 éves népesség százalékában. százalékában Eltartott népesség rátája: a gyermeknépesség (0–14 éves) és az idős népesség (65–X éves) a 15–64 éves népesség százalékában.
Definíciók Öregedési index: az idős népesség (65– X éves) a gyermeknépesség (0–14 (0 14 éves) százalékában. Házasságkötés: a hivatalosan eljáró anyakönyvvezető előtt – két tanú jjelenlétében – kötött házasság. g Válás: a jogerőre emelkedett bírói ítélettel felbontott vagy gy érvénytelenített y házasság. g Jogerőre az a házasságot felbontó vagy érvénytelenítő ítélet emelkedett, amely ellen ll további ábbi jjogorvoslatnak l kh helye l nincs. i
Definíciók Élveszületés: (az ENSZ ajánlása szerint) É olyan magzat világrajövetele, aki az él t k valamilyen életnek l il jjelét lét ((mint i t lé légzés é vagy szívműködés, illetőleg köldökzsinórpulzáció) adja adja, tekintet nélkül arra arra, hogy mennyi ideig volt az anya méhében és mennyi ideig élt élt. Teljes termékenységi arányszám: azt fejezi ki ki, hogy az adott év kor szerinti születési gyakorisága mellett egy nő élete folyamán hány gyermeknek adna életet életet.
Definíciók
Halálozás: az élet minden jjelének végleges g g elmúlása az élveszületés megtörténte után bármikor, azaz az életműködésnek a születés utáni megszűnése megszűnése, a feléledés képessége nélkül nélkül.
Halálok: mindazon betegség betegség, kóros állapot vagy sérülés, amely vagy eredményezte, vagy hozzájárult j a halálhoz ((halálozáshoz), ) valamint olyan baleset vagy erőszak körülménye, amely halálos sérülést okozott.
Definíciók
Várható átlagos élettartam: azt fejezi ki, hogy a különböző életkorúak az adott év halandósági viszonyai mellett még hány évi élettartamra számíthatnak. Csecsemőhalálozás: az élveszületést követően az egyéves gy kor betöltése előtt bekövetkezett halálozás. A halvaszülött és a születésének évfordulóján j meghalt g gy gyermek nem csecsemőhalott. Csecsemőhalálozási arányszám: ezer élveszülöttre jutó egy éven aluli meghalt.
G fik ábrázolás Grafikus áb á lá
Grafikus ábrázolás Az adatok megjelenítésének, szemléltetésének fontos eszköze. Információ megjelenítése képi formában (megérteni és készíteni is fontos) formában. Alapelvei: Áttekinthetőség (csak azt mutassa, amire szolgál) Célorientáltság és homogenitás Egyszerűség Rekonstruálhatóság Optikailag semleges méretezés Cím, Cím egyértelmű jelmagyarázatok jelmagyarázatok, mértékegységek, forrásra való hivatkozás szüks.
G fik ábrázolás Grafikus áb á lá Bizonyos elemzési Bi l é i eszközökhöz kö ökhö bi bizonyos ábrázolási módok tartoznak. Általában Ált láb szoftverekkel ft kk l ((speciális iáli rajzoló j ló szoftverekkel) készülnek.
A grafikus ábrák fajtái: 1. Koordináta-rendszeren alapuló ábrák 2. Nem koordináta-rendszeren alapuló ábrák
Grafikus ábrázolás Koordináta-rendszeren alapuló ábrák: Pontdiagram Bot-ábra Bot ábra Vonaldiagram Oszlopdiagram (hisztogram) Szalagdiagram Sugárdiagram g g
Grafikus ábrázolás
Pontdiagram: két egymással összefüggésben lévő mennyiségi ismérv értékeinek ábrázolása koordinátarendszerben. (idő és menny. sorok)
Grafikus ábrázolás
Bot ábra: gyakorisági soroknál, ha kevés és diszkrét a mennyiségi ismérv
Grafikus ábrázolás
Vonaldiagram: o a d ag a idősorok dőso o ada adatainak a a koordinátarendszerben való ábrázolása. G akorisági soroknál poligonnak ne Gyakorisági nevezzük. e ük
Grafikus ábrázolás
Oszlopdiagram: összehasonlítás az oszlopok magasságával. á á l (ö (összehasonlítás) h lítá )
Grafikus ábrázolás Osztott O t tt oszlopdiagram: l di a csoportosító t ító sorokk ábrázolásának eszköze, az összehasonlítandó oszlopon l b belül lül a megoszlás lá tterületarányos ül t á ábrázolása.
Grafikus ábrázolás Hisztogram: Mennyiségi sor esetén az oszlopok között nincs hézag
Grafikus ábrázolás
Szalagdiagram: Az oszlopdiagram az X és Y tengelyeinek felcserélésével kapjuk. kapjuk
Grafikus ábrázolás Korfa: A szalagdiagram speciális alkalmazása a korfa, amely egy összetett szalagdiagram.
Grafikus ábrázolás
Sugárdiagram: poláris koordináta rendszeren alapul, önmagában ss até ő cciklikus us visszatérő folyamatok esetében célszerű alkalmazni, vagy ha szerkezeti változásokat szeretnénk kiemelni. kiemelni A magyar népesség korösszetételének változása
G fik ábrázolás Grafikus áb á lá Néhány nem koordináta-rendszeren Néhá k di át d alapuló ábra: Kördiagram Kartogram K t Kartodiagram g Ponttérkép Piktogram Pikt (fi (figurális áli áb ábrázolás) á lá ) Box o & whiskers s e s áb ábra a ((kvartilis a se eloszlás) os ás)
Grafikus ábrázolás
Kördiagram: megoszlás ábrázolása körcikkek segítségével. Mind szerkezetet, mind pedig abszolút nagyságot gy g tud jjellemezni ((megoszlások, g , összehasonlítás)
Grafikus ábrázolás
Kartogram: területi sorok ábrázolása térképen, az egyes régiók é iók eltérő lté ő színeivel í i lé érzékelteti ék lt ti a köztük lévő különbséget.
Grafikus ábrázolás
Kartodiagram: t ül ti sorok területi k esetén alkalmazható, lk l h tó az egyes földrajzi egységek é k adatait d t it a térképen elhelyezett lh l tt diagrammal áb á lj ábrázolja.
Grafikus ábrázolás
Ponttérkép: a t ül ti sorok területi k szemléltetésére h használható, álh tó a pontok sűrűsége ű ű é az adott területhez t t ó adat tartozó d t nagyságára utal. t l
Grafikus ábrázolás
Piktogram: figurális ábrázolás, mely a jelenséget megtestesítő különböző nagyságú figurák alapján fejezi ki a nagyságrendi relációt.
Grafikus ábrázolás x mini
Q1
Me
Q3
x max
Box & whiskers ábra: a kvartilis eloszlás (az ( adatok nevezetes osztópontjainak, jelen esetben negyedelő gy p pontjainak j a helyzetét) y ) szemlélteti.
Mennyiségi ismérv ( ) szerinti elemzés (1) (2012. szeptember 26. 10.00-11.30)
LEÍRÓ statisztika A leíró statisztika: olyan módszerek és mutatószámok, amelyek segítségével akár egy nagyobb sokaságot, akár egy mintát viszonylag könnyen és jól lehet valamilyen mennyiségi ismérv szerint tömören, tömören egy mutatószámmal jellemezni. A sokaság (vagy minta) tömör jellemzése alapvetően 3 szempont szerint történhet: 1. Kö é é ték k a sokaság/minta Középértékek: k á / i t jjellemző ll őé értékének téké k é és értékeinek meghatározása 2 2. Szóródás: adatok különbözőségének vizsgálata 3. Alakmutatók: a gyakorisági görbe alakjának a vizsgálata 4 4. További elemzési módszerek: koncentráció, koncentráció idősorok elemzése átlagokkal
G k i á i sorok Gyakorisági k A mennyiségi ismérv szerint csoportosító sorokat gyakorisági soroknak nevezzük. A gyakorisági sorok fajtái: Rangsor: ha kevés számú diszkrét mennyiségi ismérv szerint csoportosítjuk a sokaságot. (amikor az összes ismérvváltozat felsorolható a gyakoriságokkal.) Osztályközös gyakorisági sor: folytonos, folytonos illetve sok változattal rendelkező diszkrét ismérv szerinti csoportosításkor csoportosításkor, a csoportokat osztályközökkel (intervallumokkal) adjuk meg.
Gyakorisági sorok Példa rangsorra:
Ha egyedi értékek vannak, k pl. l 3b barátnő á ő statisztika dolgozatának átlaga: E d é Eredményeik: ik 1 1, 5 5, 3 Átlag=9:3= 3
Egy 20 fős szemináriumi csoport érdemjegyei statisztikából Érdemjegy (x)
Hallgatók száma/fő (f)
5
3
x: átlagolandó érték
4
8
f gyakoriság f: k i á
3
6
2
2
1
1
Összesen
20
G k i á i sorok Gyakorisági k Példa osztályközös gyakorisági sorra: Egy Heves megyei település lakásállományának vizsgálata a lakások értéke szerint millió Ft-ban (1998-ban): Lakások értéke (millió Ft) (x)
Lakások száma (db) (f)
3 0 – 4, 3,0 4 5
12
4,5 – 6,0
20
6,0 – 7,5
30
7,5 – 10,0
27
10, 0 – 13,0
11
Összesen
100
G k i á i sorok Gyakorisági k Példa osztályközös gyakorisági sorra: Egy Heves megyei település lakásállományának vizsgálata a lakások értéke szerint millió Ft-ban (1998-ban): Osztályközepek (x)!
Lakások értéke (millió Ft) (x)
Lakások száma (db) (f)
3,75 ,
3,0 , – 4,, 5
12
5,25
4,5 – 6,0
20
6,75
6,0 – 7,5
30
8,75
7,5 – 10,0
27
11,50
10, 0 – 13,0
11
Öss esen Összesen
100
Gyakorisági sorok Oszt. közép
Lakásár (m Ft)
(x)!
(x)
száma (db)
3,75
3,0 – 4,5
12
12
120
10,0
10,0
5,25
4,5 – 6,0
20
32
108
16,5
6 75 6,75
6 0 – 7,5 6,0 75
30
62
88
8,75
7,5 – 10,0
27
89
11,50
10,0 – 13,0
31
Összesen
120
Lakások
f’
f”
g
g’
g”
s (fx)
s’
z’
z”
100,0
45,00
45,00
945,25
4,8
4,8
100.0
26,5
90,0
105,00
150,00
900,25
11,1
15,9
95,2
25 0 25,0
51 5 51,5
73 5 73,5
202 50 202,50
352 5 352,5
795 25 795,25
21 4 21,4
37 3 37,3
84 1 84,1
58
22,5
74,0
48,5
236,25
588,75
592,75
25,0
62,3
62,7
120
31
26,0
100,0
26,0
356,50
945,25
356,50
37,7
100.0
37,7
-
-
100,0
-
-
945,25
-
-
100.0
-
-
((f%))
s’’
z (s%)
(f)
1) Középértékek
Számított középértékek (átlagok) számtani átlag harmonikus átlag mértani átlag négyzetes átlag
Helyzeti középértékek: módusz medián kvartilisek
Középértékekkel szembeni követelmények x mini < K < x max 1. közepes helyet foglaljon el az értékek között 2. tipikus érték legyen: álljon közel az előforduló értékek zöméhez 3. legyen pontosan definiálva 4. könnyen értelmezhető legyen 5. számítása egyszerűen elvégezhető legyen
Átlagok
Súlyozatlan/egyszerű átlagot számítunk: ha az értékek csak egyszer fordulnak elő ( (egyedi di é értékek) ték k) vagy ugyanannyiszor i
Súlyozott átlagot számítunk: ha az értékek többször fordulnak elő és nem ugyanannyiszor) gy y )
Egyszerű átlag Az értékek egyszer fordulnak elő:
Az értékek többször, de gy y fordulnak elő: ugyanannyiszor
Érdemjegy (x)
Hallgatók száma/fő (f)
Érdemjegy (x)
Hallgatók száma/fő (f)
5
1
5
2
4
1
4
2
3
1
3
2
2
1
2
2
1
1
1
2
Összesen
5
Összesen
10
Súlyozott átlag Az értékek többször, de nem ugyanannyiszor fordulnak elő: Érdemjegy ((x))
Hallgatók száma/fő ((f))
5
3
4
8
3
6
2
2
1
1
Összesen
20
Átl Átlagok k Súlyozatlan Súlyozott Számtani x
fx ∑ x=
i
i
n
Harmonikus x
x ∑ x= x=
h
Mértani xg
Négyzetes xq
n
n
x =
1 ∑x i
x = ∏ xi n
x=
∑x n
i
fi fi xi
x = ∏ xi n
2 i
∑ ∑
x=
∑ ∑f
f i xi i
fi 2
Ugyanazon pozitív értékekből számított átlagok nagyságrendje
x min ≤ x h ≤ x g ≤ x ≤ x q ≤ x max x
x
és h
és
xg
xq
érzékeny a kiugróan alacsony értékekre
érzékeny a kiugróan magas értékekre
Példa/1: ((egyszerű/súlyozatlan gy y átlagok g – az értékek csak egyszer fordulnak elő (egyedi értékek) vagy ugyanannyiszor) Az átlagolandó értékek: 3, 4, 5, 8 – az értékek egyszer fordulnak elő (vagy: 3, 3, 4 ,4, 5, 5, 8, 8 – az értékek többször, de ugyanannyiszor fordulnak elő) Feladat a) b) c) d) e)
Számítsa ki a számtani, a harmonikus, a mértani és a égy etes át átlagot! agot négyzetes Hasonlítsa össze a kapott eredményeket! Állapítsa meg ugyanazon pozitív számokból számolt átlagok j sorrendjét! Amennyiben az átlagolandó értékek között szerepelne még egy kiugróan alacsony érték (pl. 1), akkor mely átlagok reagálnának rá érzékenyen? Mely átlagok értékét befolyásolja jobban, ha az átlagolandó értékek között még egy kiugróan magas érték (pl. 32) is található?
Megoldás Mértani átlag:
Számtani átlag:
3+ 4+5+8 x= =5 4 Harmonikus átlag:
xh =
4 1 1 1 1 + + + 3 4 5 8
x g = 4 3 ⋅ 4 ⋅ 5 ⋅ 8 = 4.681 Négyzetes átlag:
= 4.404
32 + 42 + 52 +82 114 xq = = = 28,5 = 5.339 4 4
Példa/2 (súlyozott Példa/2: ( úl tt átlag átl – az értékek é ték k több többször ö fordulnak elő és nem ugyanannyiszor) Az átlagolandó értékek és a hozzájuk tartozó súlyok: ( xi ) adatok: 3, 4, 5, 8 ( f i ) gyakoriság: 4, 4, 1, 1 Feladat: a)) Számítsa S á í ki a számtani, á i ah harmonikus, ik a mértani és a négyzetes átlagot!
Megoldás Számtani átlag g
4 ⋅ 3 + 4 ⋅ 4 + 1⋅ 5 + 1⋅ 8 x= = 4.1 10 Harmonikus átlag:
xh =
Mértani átlag:
x g = 10 34 ⋅ 4 4 ⋅ 51 ⋅ 81 = 3.907 Négyzetes átlag:
2 2 2 2 10 10 = = 3.762 x = 4 ⋅ 3 + 4 ⋅ 4 + 1⋅ 5 + 1⋅ 8 = 4.347 4 4 1 1 2.658 q 10 + + + 3 4 5 8
A számtani átlag néhány tulajdonsága 1 1. 2.
∑ (x
i
)
− x = 0 Æ az átlagtól vett eltérések
(előjeles hibák) összege nulla négyzetes minimum tulajdonság: 2 ∑ (x i − A ) = minimum , ha A= x
3. az átlagolandó értékek additív transzformációjával (ha
4.
minden átlagolandó értékhez hozzáadunk egy konstans értéket) az átlag is a transzformációnak megfelelően nő vagy csökken az átlagolandó értékek multiplikatív transzformációjával (ha minden átlagolandó értéket megszorzunk egy k konstans t elemmel) l l) az átl átlag iis a ttranszformációnak f á ió k megfelelően változik
Számtani átlag előnyei
Számítása egyszerű, tömör, világos Minden adathalmazból kiszámítható, és csak egy van belőle Ugyanazon típusú számszerű jellemzők összehasonlítását teszi lehetővé sokaság g vagy gy minta esetén Kiszámításához nem szükséges az egyedi értékek számszerű ismerete, elegendő azok összegét tudni tudni.
Számtani átlag hátrányai
Kiugróan magas, vagy kiugróan alacsony egyedi értékek (outlier-ek) esetén az átlag „torz” lehet, és nem jellemzi j ll i jól a sokaságot k á t , ugyanis i az adatok d t k többségétől eltér O ál kö ö gyakori Osztályközös k i sornál ál nem tudunk d k pontos átlagot számolni, az így kiszámított (osztályközepek felhasználásával) érték csak becslés/közelítés becslés/közelítés. Nyitott osztályközök esetén (amikor az osztályköz h hosszúságát ú á át akkorának kk á k ttekintjük, ki tjük mint i t az alsó l ó vagy a felső szomszédos osztályköz) az általunk meghatározott alsó vagy felső határnál kisebb vagy nagyobb értékeket figyelmen kívül hagyjuk.
Medián az az ismérvérték, amelyiknél az összes előforduló ismérvérték fele kisebb, fele nagyobb. (rangsorba rendezett adatok közül a középső elemhez tartozó ismérvérték) a) meghatározása egyedi értékekből (amiket először rangsorolni kell): páratlan tagszám esetén az n 2+ 1 -edik edik érték, páros tagszám esetén (amikor a sorszám két érték közé esik), akkor az érintett 2 érték ( n -dik és az n + 1 -dik 2 2 tagok) számtani átlaga. b) Meghatározása diszkrét mennyiségi ismérvek gyakorisági rangsorából: az n 2+ 1 -dik taghoz tartozó ismérvérték (páratlan tagszám esetén), páros tagszám esetén a két középső taghoz tartozó ismérvértékek számtani átlaga. c) becslése osztályközös gyakorisági sorból: n osztópont: n − f me' − 1 2 Me = x me 0 + 2 ⋅ h me , ahol f
f me f 'me−1
me
: a medián osztályközének a gyakorisága, : a medián osztályközét megelőző osztályköz kumulált gyakorisága
Medián előnyei
Egyértelműen meghatározható, minden adathalmaznak d th l k lét létezik ik mediánja, diá j é és csak k egy van belőle. A medián rangsorba rendezett minőségi ismérvekből is megállapítható A medián értéke független a szélső értékektől. Kiugróan g magas g vagy gy alacsony y értékek esetén (amelyekre nem érzékeny) jobban jellemzi a sokaságot g mint a számtani átlag. g
Medián hátrányai
Csak rangsorba rendezett értékekből állapítható meg Ha egy minta alapján akarunk következtetni a teljes sokaságra, akkor a számtani átlag matematikai-statisztikai szempontból alkalmasabb mutatószám.
Módusz rangsor (diszkrét ismérv) esetén: a leggyakrabban előforduló érték f l t folytonos ismérv i é esetén: té a gyakorisági görbe maximumához tartozó érték A módusz
a kiugró, extrém értékekre érzéketlen nem mindig g létezik (p (például,, ha minden érték egyforma valószínűséggel fordul elő) Ha több különböző érték azonos gyakorisággal fordul elő, akkor több módusz is lehet.
Módusz becslése osztályközös gyakorisági sorból k1 Mo = xmo0 + ⋅ hmo k1 + k2
, ahol
x mo 0: a móduszt tartalmazó osztályköz alsó határa k1 = f mo − f mo −1
k 2 = f mo − f mo +1 hmo : a móduszt tartalmazó osztályköz hossza Nem egyenlő osztályközök esetén a módusz becslése f* átszámított gyakoriságok k i á k alapján l já történik. tö té ik
Módusz előnyei és hátrányai Előnyök: Mennyiségi jellemzők esetén is használható Hasonlóan a mediánhoz, nem érzékeny a szélső, kiugró értékekre Hátrányok: Sok esetben nem alkalmas a sokaság g jellemzésére, mert nem minden esetben létezik, és van hogy gy több is van belőle.
Példa/1 (egyedi Példa/1. ( di é értékek) ték k) Egy bp.-i lakóparkban télen megkérdezték a 3 szobás l ká k ttulajdonosait, lakások l jd it h hogy mennyii volt lt az előző lő ő havi h i rezsiköltségük. Az alábbi adatokat kapták ezer Ft-ban: 75, 64, 69, 80, 76, 77, 86, 79, 65, 72, 73, 75, 75, 70 Feladat: Jellemezzük a 3 szobás lakástulajdonosok előző havi rezsiköltségét az adott esetben felhasználható középértékekkel! ö épé té e e (át (átlag, ag, módusz, ódus , medián) ed á )
Megoldás Számtani átlag: X=
75 + ... + 70 = 74 14
A lakástulajdonosok előző havi átlagos rezsiköltsége 74 ezer Ft.
Rangsor készítése: 64 65 64, 65, 69 69, 70 70, 72 72, 73 73, 75, 75 75 75, 75 75, 76, 76 77 77, 79 79, 80 80, 86 Medián: n + 1 15 = = 7,5 2 2
Módusz: Mo=75 ezer Ft
Me=75 ezer Ft ÆA lakástulajdonosok felének 75 ezer Ft-nál kevesebb (a lakástulajdonosok másik felének pedig 75 ezer Ft-nál nagyobb) volt az előző havi rezsiköltsége. A legtöbb lakástulajdonos előző havi rezsije 75 ezer Ft.
Példa/2. (egyenlő osztályközök) Egy benzinkútnál a napi eladott mennyiség szerint a személygépkocsik megoszlása a következő volt: Értékesített benzin mennyisége (liter)
Gépkocsik száma
10 – 19
10
20 – 29
28
30 – 39
42
40 – 49
15
50 – 59
5
Összesen
100
Feladat: Számítsa ki és értelmezze az átlagot! Becsülje meg a mediánt és a móduszt, és írja le jelentésüket!
Megoldás Értékesített benzin mennyisége (liter)
Gépkocsik száma
Osztályközép
Kumulált gyakoriság
10 – 19
10
15
10
20 – 29
28
25
38
30 – 39
42
35
80
40 – 49
15
45
95
50 –59 59
5
55
100
Összesen
100
---
---
fx ∑ x= ∑f
i i i
10 ⋅15 + 28 ⋅ 25 + ... + 5 ⋅ 55 = = 100
32,7 liter
A gépkocsik átlagosan 32,7 32 7 litert tankoltak a benzinkútnál az adott napon.
Megoldás Medián: sme= n = 100 = 50 2
2
' és f ≥ 50 → Me a 3 3. osztályközben van
n − f ' me−1 50 − 38 2 30 = + ⋅ 10 = 32,86 , liter Me = xme,0 + hme 42 f me
A gépkocsik fele 32,86 liter benzinnél kevesebbet tankolt, a gépkocsik másik fele pedig ennél többet az adott napon. Módusz: 3. osztályközben van k1 (42− 28) Mo= xmo,0 + ⋅ hmo = 30+ ⋅10= 33,41 liter k1 + k2 (42− 28) + (42−15) A legtöbb kocsi 33,41 liter benzin körüli mennyiséget tankolt az adott napon.
Példa/3. (nem egyenlő osztályközök) 1999 b az átl 1999-ben átlagkeresetek k t k alakulása l k lá egy vállalatnál áll l t ál Keresetek (ezer Ft)
Létszám
40 – 50
12
50 – 60
20
60 – 80
34
80 – 100
32
100 – 150
14
150 – 200
3
Összesen
115
Feladat: S á ít ki és Számítsa é é értelmezze t l az átl átlagot! t! Becsülje meg a mediánt, a móduszt és a kvartiliseket és írja le jelentésüket!
Csak a MÓDUSZHOZ!
Megoldás g Keresetek (ezer Ft) (x)
Létszám (f)
Osztályközép (x)
Kumulált gyakoriság (f’)
f* (új oszt.köz= 20e Ft)
40 – 50
12
45
12
24
50 – 60 (Q1),(Mo)
20
55
32
40
60 – 80 (Me)
34
70
66
34
80 – 100 (Q3)
32
90
98
32
100 – 150
14
125
112
5,6
150 – 200
3
175
115
12 1,2
115
---
---
---
Összesen
fx ∑ x= ∑f
i i i
gyakoriság 45⋅12 + 55⋅ 20 + ... + 175⋅ 3 f *= ⋅ új oszt. köz h. = = 75,1eFt eredeti oszt. köz h. 115
A vállalatnál a dolgozók átlagosan 75,1 ezer Ft-ot keresnek.
Megoldás Medián: sme= n = 115 = 57,5 2
2
((A Me 3. osztályközben y van.))
n − f ' me−1 57 ,5 − 32 2 60 = + ⋅ 20 = 75 ezer Ft Me = xme,0 + hme 34 f me A dolgozók fele 75 ezer Ft-nál kevesebbet keresett, (a másik fele pedig ennél többet) az adott évben.
Alsó kvartilis:
n 115 = = 28,75 4 4
(A Q1 a 2. osztályközben van.)
n − f 'q1−1 28,75−12 = + ⋅10= 50 Q1 = xq1,0 + 4 ⋅ hq1 20 fq1
58,375 ezer Ft
A dolgozók negyede 58,4 ezer Ft-nál kevesebbet keresett, (három negyede pedig ennél többet) az adott évben.
Megoldás Felső kvartilis: sq3= 3n = 3 ⋅115 = 86,25 4
4
((A Q3 4. osztályközben y van.))
3⋅ n − f ' q3−1 86,25 − 66 4 80 = + ⋅ 20 = 92,65eFt Q3 = xq3,0 + hq3 32 f q3 A dolgozók negyede 92,65 ezer Ft-nál többet keresett, (a három negyede pedig ennél kevesebbet) az adott évben. évben
Módusz:
(A Mo a 2. osztályközben van.)
(40−24) k1 = + 50 ⋅10= 57,27eFt Mo= xmo,0 + ⋅ hmo (40−24) +(40−34) k1 + k2 A dolgozók legtöbbje 57,27 ezer Ft-ot keresett az adott évben.
Mennyiségi ismérv ( ) szerinti elemzés (2) (2012. október 3. 10.00-11.30)
2) S Szóródás ó ódá Az értékek különbözőségét, változékonyságát nevezzük szóródásnak. Az értékek különbözősége egyrészt az értékek egymástól való külö bö ő é é másrészt különbözőségén, á é t valamely l l kö középértéktől é é téktől való ló eltérésében fejezhető ki.
Szóródási mérőszámok A legfontosabb szóródási mérőszámok: 1. Terjedelem, R (vagy IQR) 2 Átlagos eltérés 2. eltérés, δ 3. Szórás, б (vagy s – minta esetén) 4. Relatív szórás, V 5 (Átlagos különbség 5. különbség, G)
Szóródási mérőszámok 1) Terjedelem: annak az intervallumnak a hossza, amelyen belül az ismérvértékek elhelyezkednek. y
R = xmax − xmin Interkvartilis terjedelem: annakk az intervallumnak i t ll kah hosszát át ffejez j ki ki, amelyben l b az ismérvértékek középső 50%-át találjuk.
IQR = Q 3 − Q1
Szóródási mérőszámok 2) Átlagos eltérés: az átlagtól vett eltérések számtani átlaga. Azt mutatja, hogy az ismérvértékek átlagosan mennyivel térnek el a számtani átlagtól. Mértékegysége megegyezik az alapadatok mértékegységével, számítása: Egyszerű: Súlyozott: k
n
δ=
∑ di
δ=
i =1
n
di = xi − x
∑f ⋅d i
i =1
k
∑f i =1
i
i
Szóródási mérőszámok 3) Szórás: az átlagtól vett eltérések négyzetes átlaga Azt mutatja, hogy az ismérvértékek átlagosan mennyivel térnek el a számtani átlagtól. Mértékegysége megegyezik az alapadatok mértékegységével. Egyszerű: Súlyozott:
σ=
∑ ( x − x)
2
i
n di = xi − x
σ=
∑
f i ( xi − x) 2
∑f
i
Szóródási mérőszámok Szórás minta esetén (s): jelentése szintén az átlagtól vett eltérések négyzetes átlaga, de ezt a f formulát lát a mintából i tából tö történő té ő – az egész é sokaságra k á vonatkozó – következtetés esetén használjuk. (Bővebben a mintából történő következtetések témakörben kerül rá sor a Statisztika II. kurzus során ) során.) Egyszerű: Súlyozott:
s=
∑ ( x − x)
2
s=
i
n −1
di = xi − x
∑ ∑f
f i ( xi − x) 2 i
−1 1
A szórás néhány tulajdonsága
A szórás akkor és csak akkor nulla, ha minden ismérvérték egyenlő. egyenlő Az xi ismérvértékek additív transzformációja után a szórás nem változik változik. Az xi ismérvértékek multiplikatív transzformációja után a szórás a transzformációnak megfelelően változik.
Szóródási mérőszámok 4)) Relatív szórás különböző alapadatok vagy ismérvértékek szóródásának összehasonlítására szolgál. g Mértékegység nélküli szám, általában százalékos formában adják meg.
V =
σ x
0 ≤ V ≤ n −1
Szóródási mérőszámok 5) Átlagos különbség, G (Gini-féle mutató) az ismérvértékek egymástól mért abszolút eltéréseinek a számtani átlaga. (Leginkább a koncentráció vizsgálatánál alkalmazható alkalmazható.))
1 n n G = 2 .∑∑ xi − x j n j =1 i =1 1 G = 2 .∑∑ f i ⋅ f j ⋅ xi − x j n j =1 i =1 k
k
Empirikus p eloszlások típusai
Egy móduszú eloszlás
Több módoszú eloszlás
Aszimmetrikus i ik
Szimmetrikus
Mérsékelten
Bal oldali
Jobb oldali
Erősen
J alakú
Fordított J alakú
S i Szimmetrikus t ik eloszlás l lá
Aszimmetrikus eloszlások Bal oldali aszimmetria Jobb oldali aszimmetria
Mo
< Me
< x
x < M e < M o
Erősen aszimmetrikus eloszlások J alakú
Fordított J alakú
A i Aszimmetrikus t ik eloszlások l lá k
3) Alakmutatók arra szolgálnak, hogy tömör számszerű formában jellemezzék, hogy milyen tekintetben és milyen mértékben tér el az adott eloszlás a normális eloszlás gyakorisági görbéjéből. Mértékegység nélküli mutatók.
Aszimmetria mutatók A-mutató
F- mutató
Pearson-féle Pearson féle mutatószám:
((kvartiliseken alapul) p )
A=
x − Mo M
F0,25
σ
A abszolút értékének nincs korlátja, de ritkán vesz fel 1-nél nagyobb értéket.
Ha
(Q3 − Me) − (Me − Q1 ) = (Q3 − Me) + (Me − Q1 ) -1≤ F ≤1
+, bal oldali aszimmetria - , jobb oldali aszimmetria 0 , szimmetrikus az eloszlás
4) További elemzési módszerek Koncentráció Idősorok elemzése átlagokkal
Koncentráció
Gazdasági életben: erőforrások tömörülése, összpontosulása p
Statisztikailag: ismérv
egy sokaság mennyiségi szerinti vizsgálata
Koncentráció:
az értékösszeg jelentős része a sokaság kevés egységére összpontosul
Koncentráció A koncentráció a relatív gyakoriságok (g i) és a relatív értékösszegek (z i ) összehasonlításával elemezhető. Ha az egyes osztályközökhöz tartozó g i és z i értékek azonosak azonosak, az a koncentráció hiányaként értelmezhető, eltérésük viszont a koncentrációt jelzi jelzi.
Lorenz görbe Lorenz-görbe Egységoldalú négyzetben elhelyezett ábra, amely a kumulált relatív értékösszegeket értékeket a kumulált relatív gyakoriságok é té e e értékeinek függvényében ábrázolja.
Lorenz-görbe
Koncentráció hiánya esetén a görbe egybeesik az átlóval. Minél távolabb esik a görbe az átlótól, annál nagyobb fokú a koncentráció.
Felhasználása: relatív koncentráció szemléltetése interpoláció több ismérv koncentrációjának egybevetése adott ismérv koncentrációjának időbeli vagy térbeli egybevetése
Koncentrációs együttható A Lorenz-görbe és az átló által bezárt területet koncentrációs területnek nevezzük. Ha koncentrációs területet a háromszög területéhez viszonyítjuk, akkor e hányados alapján következtetni tudunk a koncentráció mértékére. A koncentrációs terület arányát a koncentrációs együtthatóval mérjük.
G K= 2x
(ahol G: az átlagos különbség (Gini-féle mérőszám)) K értéke [0,1] intervallumban mozoghat, koncentráció hiány esetén K=0 K 0, és a K minél közelebb van 1-hez 1 hez, annál erősebb a koncentráció.
Koncentráció
Abszolút koncentráció: az értékösszeg kevés egységére összpontosul (pl.: energiaiparban, gépkocsigyártásban)
Relatív koncentráció: az értékösszeg relatív értelemben kevés egységnél összpontosul (pl : személyi jövedelemben) (pl.:
Koncentráció É É Ö ÉRTÉKÖSSZEG (s) tőke,, vagyon, gy , termelés,, forgalom, eredmény export, p , import p
SOKASÁG Á (n) gazdasági g g szervezetek
országok, g , termékek, gazdasági szervezetek mezőgazdasági földterület, gazdasági szervezetek, eszközállomány, tulajdonosok áll táll á állatállomány lakossági jövedelem, lakosság, vagyon háztartások
Idősorok elemzése átlagokkal Tapasztalati idősor:
időtényező:
t1 , t 2 , ..., t i , ..., t n
megfigyelt érték:
y1, y2 , ..., yi , ..., yn
Idősorok elemzése átlagokkal Idősorelemzés egyszerű eszközei: dinamikus viszonyszámok ((bázis-,, és láncviszonyszámok): y ) idősor adataiból számított hányadosok grafikus ábrázolás
átlagok
Idősorok elemzése átlagokkal Időegységre számított átlagok
Stock típusú idősor esetén: (s ámtani átlag) (számtani yi ∑ y= n (tartam-idősor)
Flow típusú idősor esetén: (kronologikus átlag) y1 y + y 2 + ... + y n − 1 + n 2 y = 2 n −1
(állapot-idősor)
Idősorok elemzése átlagokkal
Változások átlaga
Átlagos abszolút változás d =
∑d
i
=
y n − y1 , ahol n −1
n −1 d i = y i − y i −1
Átlagos relatív változás l = n−1 ∏li = n−1
yn y , ahol li = i y1 yi−1 i 1
Feladatok (mennyiségi ismérv szerinti elemzés) Perfekt Statisztika I. példatár: 128/1, 128/2, 130/5, 131/8, 134/12, 134/13, 137/17, 138/19, 138/20, 139/23, 141/25, 145/32, 148/36,149/38 gyakorló feladatok az általános statisztika További gy I. (zöld) példatár:
24/38,, 24/39 (egyedi ( gy értékekből – súlyozatlan) y ) 25/42 (rangsorból – súlyozott) 26/45, 27/46, 29/51 (osztályközös gyakorisági sorok – egyenlő osztályköz esetén) 26/44,, 27/47, 28/48, 28/49, 29/50, 29/52, 32/56 ((nem egyenlő osztályközök) 35/65 (koncentráció)
Mennyiségi ismérv ( ) szerinti elemzés (3) (2012. október 10. 10.00-11.30)
K Komplex l gyakorló k ló feladatok f l d t k megoldása ldá Középértékek, szóródási mutatók és alakmutatók számítása:
Egyedi értékekből Rangsorból Osztályközös gyakorisági sorból (egyenlő osztályközök tál kö ök esetén) té ) Osztályközös gyakorisági sorból (nem egyenlő osztályközök esetén) Koncentráció mértékének meghatározása g (grafikusan)
Zárthelyi dolgozat ( (ZH1) ) (2012. október 17. 10.00-11.30)
I d Indexszámítás á ítá (1) ((2012. 0 o október tóbe 24. 10.00–11.30) 0 00 30)
Időbeli összehasonlítás viszonyszámokkal Bauxittermelés adatai (ezer tonna) Bauxittermelés (ezer tonna) Hónap
Vd 1991
1992
Január
150
100
66,7
Február
200
150
75,0
Március
250
230
92,0 ,
Összesen
600
480
80,0
Indexszámítás de s á tás Az indexszámok valamilyen szempontból összetartozó, de különnemű (különböző mértékegységű), közvetlenül nem összesíthető javak összességére (aggregált sokaság) vonatkozóan a mennyiségek (q - quantity), az árak (p - price) és az értékadatok (v - value) időbeli vagy térbeli összehasonlítására szolgálnak. Egy jószág(csoport) értékét a mennyisége és az egységára határozza meg: v = q ⋅ p A nem összegezhető (különböző mértékegységű) termékek az értékösszegük alapján elemezhetők. Az összetartozó de különnemű termékekből álló (heterogén) termékcsoport n n összértékét aggregátumnak (A) nevezzük:
A = ∑ qi pi = ∑ vi i =1
i =1
Indexek: termékek azonos körére vonatkozó két időben (vagy térben Æ területi indexek) különböző aggregátum hányadosai.
Aggregát értékadatok Az indexszámításban négyféle aggregátumot* használunk fel: 1.
∑q0 p0
valós aggregátum
2.
∑q1 p0
fiktív aggregátum
3.
∑ q0 p1
∑ q1 p1
fiktív aggregátum valós aggregátum
*Aggregálás: egy heterogén jószágcsoport értékben való összegzése. A tárgyidőszaki aggregát értéket (aggregátumot) folyóáras értékadatnak nevezzük.
Indexszámítás Háztartások egy főre jutó élelmiszerfogyasztása Fogy. gy menny. y Megnev.
Egységár/Ft gy g
Mértékegység
1980
1988
1980
1988
S té hú Sertéshús
k kg
20
21
75 50 75,50
144 40 144,40
Tojás
db
230
234
2,20
3,30
Tej
l
89
105
6,00
10,50
Étolaj
l
3
5
28,50
38,40
. .
Egyedi indexek (egy jószágcsoportra – egyfajta termékre – vonatkozó indexek, tkp. viszonyszámok) ahol: Egyedi árindex: p1: tárgyidőszak egységára p1 p0: bázisidőszak egységára
ip =
p0
ip
Egyedi volumenindex:
q1 iq = q0 Egyedi értékindex:
v1 q1 p1 iv = = v0 q0 p0
ahol: q1: tárgyidőszaki gy mennyiség y g q0: bázisidőszak mennyiség
iv = i q ⋅ i p ahol: v1: tárgyidőszaki termékérték v0: bázisidőszaki termékérték
Indexszámítás Megnev.
Mért. egys.
Fogy. menny. 1980
1988
Egységár 1980
1988
Egyedi indexek
iq
ip
iv
Sertéshús
kg
20
21
75,50
144,40
105,0
191,3
200,86
Tojás
db
230
234
2,20
3,30
101,7
150,0
152,55
Tej
l
89
105
6,00
10,50
118,0
175,0
206,50
Étolaj
l
3
5
28,50
38,40
166,7
134,7
224,54
. .
Többféle termékre – heterogén g jószágcsoportra – vonatkozó indexek - együttes indexek aggregát formái 0 Értékindex:
Árindex: (a mennyiségek q adatok d t k állandók) áll dók)
Volumenindex: (az árak, p adatok állandók)
∑v1 ∑ q1 p1 Iv = = ∑v0 ∑ q0 p0
Iv = Iq ⋅ I
1 p
I v = I q1 ⋅ I p0
∑ qs p1 0 ∑q0 p1 I 1 = ∑q1 p1 Ip = Ip = p q p ∑q1 p0 ∑ q s p0 ∑00 ∑ q1 ps 0 ∑ q p 1 ∑ q p 1 0 1 1 Iq = ∑ q0 p s I q = ∑ q p I q = ∑ q p 0 0 0 1
I d Indexszámítás á ítá Megnev.
Mért. egys.
Sertéshús Tojás
Fogy. gy menny. y
Egységár gy g
Egyedi gy indexek
iq
ip
iv
144 40 144,40
105 0 105,0
191 3 191,3
200 86 200,86
2,20
3,30
101,7
150,0
152,55
105
6 00 6,00
10 50 10,50
118 0 118,0
175 0 175,0
206 50 206,50
5
28,50
38,40
166,7
134,7
224,54
1980
1988
1980
kg
20
21
75 50 75,50
db
230
234
T j Tej
l
89
Étolaj
l
3
1988
. .
I
0 p
=
∑q ∑q
0
p1
0 p0 ∑ q1 p1 F 0 1 I = I ⋅ I Iv = p p p ∑ q p 1 1 1 ∑ q0 p0 I p = ∑ q1 p 0
∑ q1 p 0 ∑ q0 p0 F I q = I q0 ⋅ I q1 ∑ q1 p1 1 Iq = ∑ q 0 p1
I q0 =
I d Indexszámítás á ítá (2) ((2012. 0 november o e be 7. 10.00–11.30) 0 00 30)
Értékindex-számítás Az értékindex a termékek bizonyos körére nézve az érték változását mutatja meg. (pl. árbevétel változás)
∑ v1 ∑ q1 p1 Iv = = ∑ v0 ∑ q 0 p 0
Az értékindex átlagformái: ahol a súlyok a valós aggregátumok/értékadatok és az egyedi értékindexek az átlagolandó értékek:
∑ q 0 p 0 ⋅ iv ∑ v 0 ⋅ iv Iv = = ∑ q0 p0 ∑ v0
∑ q1 p1 ∑ v1 = Iv = q1 p1 v1 ∑ ∑ iv iv
Árindex-számítás Az árindex az árszínvonal változásának mértékét mutatja a vizsgált termékek összességére vonatkozóan. Súlyozott, alapformulájú árindexek:
∑ qs p1 Ip = ∑ qs p0 q p ∑ = ∑q p
Laspeyres árindex ((bázisidőszaki súlyozású) y ):
I
Paashe árindex (tárgyidőszaki súlyozású) :
∑q1 p1 I = ∑q1 p0
Fisher árindex:
I pF = I p0 ⋅ I1p
0 p
0
1
0
0
1 p
Az á A árindex i d átlagformái ál f ái (á (árindexi d számítás egyedi árindexekből) ahol a súlyok az értékadatok, az átlagolandó értékek az egyedi árindexek:
∑q0 p0 ⋅ip ∑v0 ⋅ip 0 Ip = = ∑q0 p0 ∑v0 ∑ q1 p1 ∑ v1 I = = q1 p1 v1 ∑ ∑ ip ip 1 p
∑ q0 p1 I = q0 p1 ∑ ip 0 p
I = 1 p
∑ q1 p0 .i p ∑ q1 p0
Volumenindex-számítás A volumenindex a termékek bizonyos körére vonatkozóan a mennyiségek változását méri. Súlyozott alapformájú volumenindex:
∑ q1 ps Iq = ∑ q0 p s
Laspeyres volumenindex (bázisidőszaki súlyozású) :
I q0 =
∑ q1 p 0 ∑ q0 p0
∑ q1 p1 ∑ q0 p1
Paashe volumenindex ( á idő (tárgyidőszaki ki súlyozású) úl á ú) :
I q1 =
Fisher volumenindex:
IqF = Iq0 ⋅ Iq1
A volumenindex átlagformái (volumenindex(volumenindex számítás egyedi volumenindexekből) ahol a súlyok az értékadatok, az átlagolandó értékek az egyedi volumenindexek:
Iq0 =
∑ q0 p0 ⋅ iq ∑q0 p0
=
∑v0 ⋅ iq ∑v0
∑ q1 p1 ∑ v1 I = = q1 p1 v1 ∑ ∑ iq iq 1 q
∑q1 p0 I = q1 p0 ∑ iq 0 q
I = 1 q
∑ q0 p1 ⋅ iq ∑ q0 p1
Feladat: Egy bolt három termékének forgalmára vonatkozó adatok láthatók az alábbi táblázatban:
Termék
Mértékegység
Értékesítés mennyisége
Egységár (Ft)
2004
2005
2004
2005
I. vaj
db
4500
5400
220
235
II. kenyér
kg
2875
3335
90
90
l
2125
1870
140
175
III. tejj
Feladat: Számítsa ki az egyedi volumen-, ár-, és értékindexeket! Hogyan változott a bolt összbevétele? (Iv) Hogyan változott az értékesített termékek á í árszínvonala? l ? (I (Ip)) Számítsa ki az együttes volumenváltozást! (Iq)
E Egyedi di indexek i d k
A Aggregátumok át k
Értékindex a megfelelő aggregátumok hányadosaként ∑ q1 p1 1896400 Iv = = ∑ q0 p0 1546250
= 1, 226 → 122 , 6 %
az egyedi értékindexek súlyozott számtani átlagaként: ∑ v0 ⋅ iv 990000⋅1,282 + 258750⋅1,16 + 297500⋅1,1 = = 1,226 → 122,6% Iv = ∑ v0 1546250
az egyedi értékindexek súlyozott harmonikus átlagaként: Iv =
∑ v1 1896400 = = 1,226 → 122 ,6% v1 1269000 300150 327250 + + 1,282 1,16 1,1 iv
∑
Laspeyres-féle árindex ∑ q0 p1 1688125 I = = = 1,097 → 109,7% ∑ q0 p0 1546250 0 p
I 0p
=
∑ v0 ⋅ i p ∑ v0
990000 ⋅1,0682 + 258750 ⋅1 + 297500 ⋅1,25 = = 1,097 → 109,7% 1546250
Paashe-féle árindex ∑ q1 p1 1896400 I = = = 1,083→108,3% ∑ q1 p0 1749950 1 p
1896400 ∑ q1 p1 I = = = 1,083 → 108,3% q1 p1 1269000 300150 327250 + + ∑ i 1,0682 1 1,25 p 1 p
Fisher-féle árindex A Laspeyres-és a Paashe index súlyozatlan mértani átlaga
I pF = I p0 ⋅ I 1p = 1,09715 ⋅1,0837 = 1,0904 → 109,04%
Volumenindexek ∑ q1 p0 1749950 I = = = 1,132 → 113,2% ∑ q0 p0 1546250 0 q
∑ q1 p1 1896400 I = = = 1,123 → 112 ,3 % ∑ q 0 p1 1688125 1 q
I = I ⋅ I = 1,1317 ⋅1,1234 = 1,1274 → 112,74% F q
0 q
1 q
Az érték-, érték volumenvolumen és árindex közötti összefüggés
iv = i q ⋅ i p Iv = I ⋅ I 0 q
1 p
I v = I q1 ⋅ I p0
I v = I qF ⋅ I pF
Különbségfelbontás K v = ∑ q1 p1 − ∑ q 0 p 0
K v = ∑ q1 p1 − ∑ q 0 p 0
K q0 = ∑ q1 p 0 − ∑ q 0 p 0
K q1 =
K 1p = ∑ q1 p1 − ∑ q1 p0
K p0 = ∑ q 0 p1 − ∑ q 0 p 0
∑ q1 p1 − ∑ q 0 p1
Összefüggések:
Kv = Kq0 + K1p = Kq1 + K p0
Feladatok (indexszámítás) Perfekt Statisztika I. példatár: 207/1(x), 217/1, 218/3, 219/5, 219/6, 220/7, 220/8, 221/10, 222/12, 223/14, 224/17 További gy gyakorló feladatok az általános statisztika (zöld) példatárból: 88/201, 88/201 88/202 88/202, 89/203 89/203, 89/204 89/204, 89/205 89/205, 90/207, 91/210, 91/211, 92/213
I d Indexszámítás á ítá (3) ((2012. 0 november o e be 14. 10.00–11.30) 0 00 30)
Indexszámok gyakorlati alkalmazása Cserearány-mutatók: a gazdálkodó szervezetek által eladott termékek árindexét viszonyítjuk a vásárolt termékek árindexéhez. árindexéhez Cserearány-index y ((terms of trade): ) az adott ország által exportált és az általa importált termékek árindexeinek a hányadosa. y Egységnyi gy g y exportért, hányszor többet, vagy kevesebbet tudunk importálni a tárgyidőszakban a bázisidőszakhoz képest.
I d Indexszámok á k gyakorlati k l ti alkalmazása lk l á Árolló: azt mutatja meg, hogy valamilyen bevételt biztosító termékek bázisidőszakival azonos volumenéért a tárgyidőszakban mennyivel nagyobb vagy kisebb volumenű másféle termék kapható cserébe. Agrárolló: a mezőgazdasági ő d á i termelőiár-indexet lőiá i d osztjuk j ka mezőgazdasági ráfordítások árindexével.
A fogyasztói árindex (CPI)
A fogyasztói árszínvonal változását méri.
Azt mutatja meg, hogy a lakosság által f fogyasztási tá i célra él vásárolt á á lt ttermékek ék k é és szolgáltatások árai átlagosan hogyan változtak az egyik ik idő időszakról k ól a másikra. á ik
Az infláció mérőeszközeként is használják, de ez nem jelent fogalmi azonosítást.
A hazai fogyasztói árindex árindex-számítás számítás fő jellemzői (Consumer Price Index – CPI)
a teljes lakosságra vonatkozik a vásárolt fogyasztás gy ((fogyasztói gy kosár)) árváltozását tükrözi mintavételes módszerrel készül kínálati árakra épül (reprezentáns árak) havonta készül Laspeyres-típusú (bázisidőszaki súlyozású) a globális árindex mellett különböző termékcsoportokra és lakossági rétegekre is készül index a közzététel meghatározott g szabályozás y szerint történik
Az indexszámítás adatforrásai Két alappillér: 1. 900 reprezentánsra vonatkozó ármegfigyelés 2. az indexszámításhoz tartozó súlyok meghatározása A 160 árucsoporthoz, az ún. alapsorokhoz tartozó súlyarányok a fogyasztás szerkezetét képviselik.
A fogyasztói árindex árindex-számítás számítás harmonizációja az EU országokban A harmonizálás célja: Az egyes országok fogyasztói árindexeinek összehasonlítása A térségekre, g , országcsoportokra g p számított globális indexhez olyan alapadatok biztosítása, melyek egységesen kezelhetők Az egyes országok fogyasztói árindex árindexszámításának módszertani javítása A CPI gy gyakorlatias és alacsony y költségigényű gg y meghatározása
HICP:Harmonizált Fogyasztói Árindex Á
Indexsorok Kettőnél több időszakra vonatkozó indexek sorozata Indexsorok de so o fajtái: ajtá a)
b)
c)
Tartalma szerint - értékindexsor - árindexsor ái d - volumenindexsor Viszonyítás rendje szerint - bázisindexsor - láncindexsor Súlyozás módja szerint - állandó súlyozású indexsor - változó súlyozású indexsor (B (B,T) T)
Indexsorok
Értékindexsorok:
Volumenindexsorok:
Bázis
Állandó súlyozású
Változó Vált ó súlyozású úl á ú (B,T) (B T) Lánc
Állandó Áll dó súlyozású úl á ú
Változó súlyozású (B,T)
Bázis Lánc
Árindexsorok:
Bázis
Állandó súlyozású
Változó Vált ó súlyozású úl á ú (B,T) (B T) Lánc
Állandó Áll dó súlyozású úl á ú
Változó súlyozású (B,T)
I d Indexsorok k É Értékindexsorok:
Bázis-értékindexsor (0 (0. év a bázis)
∑q ∑q
0
p0
0
p0
,
∑q p ∑q p
1 1
0
,
0
∑q ∑q
2
p2
0
p0
, ... ,
∑q ∑q
n
pn
0
p0
n
pn
(100%)
Lánc-értékindexsor
−,
∑q ∑q
1
p1
0
p0
,
∑q p ∑q p 2
2
1
1
, ... ,
∑q ∑q
n -1
p n -1
Indexsorok Bázis volumenindexsorok:
Állandó súlyozású bázis-volumenindexsor: (bázis: a 0. időszak mennyisége, állandó súly: a 0. időszak ára) 100%,
∑q p ∑q p
1 0 0
,
0
2
0
0
0
, ... ,
∑q p ∑q p n
0
0
0
Változó súlyozású bázis-volumenindexsor (bázis: 0. év) - (B) 100 %,
∑q p ∑q p
∑q p ∑q p 1
0
0
0
∑q p ∑q p
2 1
,
, ... ,
0 1
∑q p ∑q p n
n -1
0
n -1
Vált ó súlyozású Változó úl á ú bá bázis-volumenindexsor i l i d (bá (bázis: i 0 0. é év)) - (T) 100 %, %
∑q p ∑q p 1
1
0
1
,
∑q p ∑q p 2
2
0
2
, ... ,
∑q p ∑q p n
n
0
n
Indexsorok Lánc volumenindexsorok:
Állandó súlyozású lánc-volumenindexsor: (állandó súly: a 0. időszak ára) −,
1
0
0
0
∑q p ∑q p
,
2
0
1
0
, ... ,
∑q ∑q
n
p0
n -1
p0
Változó súlyozású lánc-volumenindexsor - (B) −,
∑q p ∑q p
∑q p ∑q p 1
0
0
0
∑q p ∑q p
2 1
,
, ... ,
1 1
∑q ∑q
n
p n -1
n -1
p n -1
Vált ó súlyozású Változó úl á ú lá lánc-volumenindexsor l i d - (T) −,
∑q p ∑q p 1
1
0
1
,
∑q p ∑q p 2
2
1
2
, ... ,
∑q ∑q
n
pn
n -1
pn
Indexsorok Bázis árindexsorok:
Állandó súlyozású bázis-árindexsor: (bázis: a 0. időszak mennyisége, állandó súly: a 0. időszak menny.) 100 %,
∑q p ∑q p
0 1
0
,
0
0
2
0
0
, ... ,
∑q p ∑q p 0
n
0
0
Változó súlyozású bázis-árindexsor (bázis: 0. év) - (B) 100 %,
∑q p ∑q p
∑q p ∑q p 0
1
0
0
∑q p ∑q p
1 2
,
, ... ,
1 0
∑q ∑q
n -1
pn p
n -1 0
Vált ó súlyozású Változó úl á ú bá bázis-árindexsor i ái d (bá (bázis: i 0 0. é év)) - (T) 100 %, %
∑q p ∑q p 1
1
1
0
,
∑q p ∑q p 2
2
2
0
, ... ,
∑q ∑q
n
pn
n
p0
Indexsorok Lánc árindexindexsorok:
Állandó súlyozású lánc-árindexsor: (állandó súly: a 0. időszak ára) −,
0
p1
0
p0
∑q p ∑q p
,
0
2
0
1
, ... ,
∑q p ∑q p 0
0
n
n -1
Változó súlyozású lánc-árindexsor - (B) −,
∑q ∑q
∑q ∑q
0
p1
0
p0
,
∑q p ∑q p 1
2
, ... ,
1 1
∑q ∑q
n -1
n -1
pn
p n -1
Vált ó súlyozású Változó úl á ú lá lánc-árindexsor ái d - (T) −,
∑q p ∑q p 1
1
1
0
,
∑q p ∑q p 2
2
2
1
, ... ,
∑q p ∑q p n
n
n
n -1
T ül ti indexek Területi i d k
Forgalom-, g , vagy gy termelésadatok térbeli összehasonlításának eredményeként jönnek létre
Az eddig alkalmazott 0 (bázisidőszak) és 1 (tárgyidőszak) jelölések A-ra és B re módosulnak (A és B a két terület jelölik) B-re
Az értékindexet területi összehasonlítás esetén nem értelmezzük!
Az összehasonlításnak nincs egyértelmű sorrendje: felcserélhető a viszonyítandó és a viszonyítás alapjául szolgáló terület: A/B és B/A relációjú (területi) ár- és volumenindexeket is számolhatunk
Eltérő Elté ő valutájú l tájú országok á k esetén té az á árindex i d számlálója á lálój é és a nevezője őj nem azonos mértékegységű, ezért nem %-os értékként értelmezzük Æ A/B relációjú index esetén jelentése: B ország 1 valutaegysége A ország há valutaegységével hány l t é é l egyenértékű. é tékű B/A relációjú lá iójú iindex d esetén té A ország á egy valutaegysége B ország hány valutaegységével egyenértékű.
A területi összehasonlításnál ((eltérő valuták)) a különböző súlyozású y indexek közötti eltérés jóval nagyobb lehet, mint az időbeli összehasonlításnál, ezért a Fisher-formula használata kötelező.
T ül ti volumenindex Területi l i d Legfontosabb alkalmazási területe a nemzetközi összehasonlítás Területi T ül ti volumenindex l i d aztt ffejezi j i ki ki, h hogy az ö összehasonlítandó h lít dó területen a termelés (értékesítés) mennyisége hányszorosa az összehasonlítás alapjául pj szolgáló g terület termelésének (értékesítésének). Fisher Iq A / B
∑ q A pB ∑ q A p A = ⋅ ∑ qB pB ∑ qB p A
∑qB pB I = Iq ∑qA pB B B/ A
∑qA pB I = Iq ∑qB pB
∑qB pA Iq = ∑qA pA A B/ A
B A/ B
Fisher B/ A
Iqq
∑qA pA I = Iq ∑qB pA A A/ B
∑ qB pB ∑ qB pA = ⋅ ∑ qA pB ∑ qA pA
Területi ü árindex á Azonos valutájú országok esetén a területi árindex árszínvonal összehasonlítást jelent. Eltérő valutájú országok esetén a területi árindex a vásárlóerő paritást fejezi ki. Vásárlóerő paritás (PPP): azt mutatja meg meg, hogy egy adott ország egységnyi valutája a másik ország hány egységnyi valutájával egyenértékű a vizsgált termékek körében.
∑ qB pA ∑ qA pA Fisher IpA/ B = ⋅ ∑ qB pB ∑ qA pB B ország egységnyi valutája A ország ennyi egységnyi valutájával egyenértékű.
A ország egységnyi valutája B ország y egységnyi gy g y valutájával j egyenértékű. gy ennyi
Fisher B/ A
Ip
∑ qB pB ∑ qA pB = ⋅ ∑ qB pA ∑ qA pA
Feladatok ((területi indexek,, indexsorok) Perfekt Statisztika I. példatár: 212/2, 217/2 (területi indexek) 230/28, 230/28 230/29 (indexsorok) További gyakorló feladatok az általános statisztika (zöld) példatárból: 101/239, 102/240 (területi indexek) 97/230, 98/231, 98/232, 99/234 (indexsorok)
Stochasztikus p (1) ( ) kapcsolatok (2012. november 21. 10.00–11.30)
Ismérvek közötti kapcsolatok S i ik i iismérvek: Statisztikai é k
Minőségi ismérvek Mennyiségi ismérvek Időbeli ismérvek Területi ismérvek
Eddig g a sokaságokat g egy gy ismérv szerint elemeztük,, most a sokaságokat egyszerre két – egymással valamilyen kapcsolatban álló – megkülönböztető ismérv szerinti csoportosításban, t ítá b azaz kkombinációs bi á ió tábláb táblába rendezve d vizsgáljuk. A vizsgálat célja pedig az, hogy van-e és ha van, akkor milyen erősségű/jellegű a kapcsolat a vizsgált két ismérv között.
I é k kö Ismérvek közötti ötti kapcsolatok k l t k a két ismérv (x és y) független egymástól, egymástól ha x ismérv szerinti hovatartozás nem ad semmiféle többletinformációt az y szerinti hovatartozásról. (ezekkel nem kell foglalkoznunk) a két ismérv között sztochasztikus összefüggés van, ha az egyik ismérvváltozathoz való tartozásból tendenciaszerűen tendenciaszerűen, valószínűségi jelleggel következtethetünk a másik ismérv szerinti hovatartozásra. Æ Statisztika a két ismérv függvényszerű kapcsolatban áll egymással, ha a vizsgált egységek x szerinti hovatartozásának ismeretében teljesen egyértelműen megmondható azok y szerinti hovatartozása is. is (ezt a matematika vizsgálja)
Sztochasztikus kapcsolatok Különböző okozati jellege lehet az egyes ismérveknek: x ismérv: ok (magyarázó változó) y ismérv: é okozat (eredményváltozó) ( ) (pl. jövedelemnagyság és húsfogyasztás) Vannak olyan y esetek, amikor az ismérvek kölcsönösen hatnak egymásra, vagyis az okokozati viszonyy nem egyértelmű, gy az okság g kölcsönös. (pl. ár és kereslet)
Ismérvek közötti kapcsolatok A két ismérv jellege szerint a következő sztochasztikus kapcsolatokat különböztethetjük meg: asszociációs kapcsolat: az egymással kapcsolatban álló ismérvek minőségi vagy területi ismérvek (pl.: nem (férfi,nő) – dohányzás) vegyes kapcsolat: k l t az egyik ik vizsgált i ált iismérv é tterületi ül ti vagy minőségi ismérv, a másik mennyiségi (pl.: iskolai végzettség -1 főre jutó bruttó havi jövedelem) korrelációs kapcsolat: mindkét vizsgált ismérv mennyiségi ismérv (pl.: 1 főre jutó bruttó havi jövedelem-1 jövedelem 1 főre jutó élelmiszerfogyasztás) Æ egyszerre több ismérv között vizsgálható a sztochasztikus kapcsolat (II. félév anyaga) rangkorreláció: mindkét ismérv ordinális mérési szintű szintű, vagyis sorrendi skálán mérhető.
Ismérvek közötti kapcsolatok Az asszociáció és a vegyes kapcsolat esetén egyszerre csak két ismérv közötti kapcsolatot vizsgálhatjuk. Arra keressük a választ, hogy a két ismérv között: van-e kapcsolat? ha h van kkapcsolat, l t akkor kk az milyen il erős? ő ? A korrelációs kapcsolat (mennyiségi ismérvek kapcsolatának a vizsgálata) több elemzési lehetőséget biztosít hiszen itt azt is meg tudjuk vizsgálni biztosít, vizsgálni, hogy az egyik ismérv milyen számszerű hatással van a másik (vagy több) ismérv alakulására.
Kontingencia tábla X/Y
Kontingencia tábla f ij =
együttes gyakoriságok, tényleges gyakoriság a kontingencia tábla i sorában és j oszlopában p
fi. =
peremgyakoriságok, az összesen rovat gyakoriságai A x ismérvváltozattal Az ismér álto attal rendelkező rendelke ő elemek száma s áma
f. j =
p peremgyakoriságok, gy g , az összesen rovat gy gyakoriságai g az y ismérvváltozattal rendelkező elemek száma
n=
a sokaság elemeinek a száma
Asszociációs kapcsolat szorosságának mérése 1) Alternatív ismérvek esetén: 2 x 2 kontingencia tábla:
X/Y / x1 x2 Összesen
y1 f11 f21 f.1
A két ismérv függetlensége esetén
Yule –együttható (Y):
y2 f12 f22 f.2
Összesen Ö f1. f2. n
f11 f12 = f 21 f 22
f11 f 22 − f 21 f12 Y= f11 f 22 + f 21 f12 − 1 ≤ Y ≤ 1
Asszociációs kapcsolat szorosságának mérése A Yule-mutató tulajdonságai:
0 ≤ Y ≤1 Y =0 0 < Y <1 Y =1
Teljes függetlenség, a kapcsolat teljes hiánya
Sztochasztikus kapcsolat
Függvényszerű kapcsolat
Asszociációs kapcsolat szorosságának mérése 2)) Általánosan alkalmazható mutatószám (alternatív és két ismérvváltozatnál több változattal rendelkező ismérvek esetén egyaránt): (ahol s az egyik ismérv változatainak, míg t a másik ismérv változatainak a számát jelenti): Csuprov-mutató (T):
χ2
T =
n ⋅ ( s − 1) ⋅ ( t − 1)
,ahol
f = * ij
f
*
ij
=
,ahol
χ
f i. ⋅ f. j n
függetlenség esetén feltételezett gyakoriság a kontingencia tábla i sorában és j oszlopában
2
( f = ∑∑ i
j
ij
− f f * ij
*
)
2
ij
0〈T 〈 4
s −1 t −1
Asszociációs kapcsolat szorosságának mérése A Csuprov-mutató tulajdonságai:
0 ≤ T ≤1 s
ha s=t esetén a Cramer-mutatót (C) használjuk:
T
0 ≤ C ≤1 s=t =2
Esetén Y és T mutatók is alkalmazhatók, a T mutató alakja ebben az esetben:
T max
, ahol T max =
s −1 t −1
C =
T =
4
f 11 ⋅ f 22 − f 12 ⋅ f 21 f ⋅1 ⋅ f ⋅ 2 ⋅ f 1 ⋅ ⋅ f 2 ⋅
Feladatok (asszociáció) Perfekt P f kt Statisztika St ti tik I. I példatár: éld tá 240/2, 241/3, 248/1, 248/2, 249/3, 250/5, 250/6 , 252/10, 254/13 255/14, 255/14 255/15 255/15, 257/17 257/17, 257/18 257/18, (ezeknél csak a kapcsolat szorosságát jelző mutatókat kell kiszámolni)
További gyakorló feladatok az általános statisztika (zöld) példatárból: 60/127, 60/128, 60/130, 60/132
Stochasztikus p (2) ( ) kapcsolatok (2012. november 28. 10.00–11.30)
Vegyes kapcsolat Vegyes kapcsolat: az egyik vizsgált ismérv területi vagy minőségi i ő é i iismérv é ((azaz nem mennyiségi i é i iismérv), é ) a másik mennyiségi ismérv (pl.: iskolai végzettség - 1 fő jutó főre j tó b bruttó ttó h havii jö jövedelem) d l ) A vegyes kapcsolat elemzése során azt vizsgáljuk vizsgáljuk, hogy a mennyiségi ismérv szóródását mennyiben befolyásolja a minőségi vagy a területi ismérv szerinti csoportosítás.
Heterogén sokaságok összetett, minőségileg különböző részekből állnak. Heterogén sokaság átlaga a részsokaságokra számított átlagok súlyozott átlaga. Jelölések: x j : j-edik csoport átlaga nj : j-edik csoport tagszáma j = 1, . . . , m : a csoportok száma
nj n
x
m
x=
= w j : súlyarány : a teljes sokaságra számított átlag
∑n j =1
m
j
xj
∑nj j =1
m
v = ∑ wj x j j =1
Heterogén sokaságok Jelölések: n = a sokaság tagszáma m = a csoportok száma n j = a j-edik sokaság tagszáma x j = a j-edik csoport átlaga x = a sokaságg átlaga g ((főátlag) g) xij = a j-edik sokaság i-edik eleme
Csoportok
nj
xj
Csoportonkénti szórás σ j
C1
n1
C2
n2
x1 x2
…
…
…
σ2
Ck
nk
xk
σk
…
…
…
…
Cm
nm
xj
σm
n
x
Összesen
Elemszám
Csoportátlag
σ1 …
σ
Például: Egy vidéki nagyváros ingatlanügynökségén értékesítésre váró ingatlanok: g Eladási ár (m Ft)
Panellakások száma
Nem panelből készült lakások száma
Összes lakás (db)
6,1 – 8,0
8
2
10
8,1 – 10,0
15
5
20
10,0 – 15,0
34
12
46
15,0 – 20,0
24
14
38
20,1 – 25,0
7
19
26
25,1 – 30,0
2
8
10
90
60
150
Összesen
A könnyebb áttekinthetőség kedvéért a számításokat táblázatba foglalhatjuk: Építőanyag p y g
Ingatlanok g száma n j
Csoportátlag p g (eladási ár m Ft)
xj
Csoportonkénti p szórás σ
Panel
90
13,872
4,72
Nem panel
60
18,358
5,93
Összesen
150
15,670
5,68
n
x
σ
j
Jelölések x ij − x
( xij − x j ) (x j − x)
= teljes j eltérés ( d ij ) = belső eltérés ( Bij ) = külső eltérés ( K j )
σ 2 σB
= teljes szórásnégyzet
σ
= külső szórásnégyzet gy
2
2 K
= belső szórásnégyzet
Szórásnégyzetek kiszámítása nj
σ = 2
σ = 2 B
σ
2 K
m
∑∑
( x ijj − x )
i =1 j =1
S = n
n
2 − x x ( ) ∑∑ ij j
n =
2
∑n
j
=
2 n σ ∑j j
n
(x j − x) n
2
SB = n
SK = n
S tteljes S: lj eltéréslté é négyzetösszeg SB: belső eltérésnégyzetösszeg SK:
külső eltérésnégyzetösszeg
Összefüggések = B ijj + K j x ij − x = ( xij − x j ) + ( x j − x ) d
Teljes eltérés
σ
2
Teljes szórásnégyzet
ijj
Belső eltérés
= σ
+ σ
Belső szórásnégyzet
S = S Teljes eltérés négyzet összeg
2 B
Külső eltérés
B
Külső szórásnégyzet
+ S
Belső eltérés négyzet összeg
2 K
K
Külső eltérés négyzet összeg
Feladat: Egy főiskolán 4 szakon folyik bachelor képzés. Az alábbi táblázatban a hallgatók napi tanulásra fordított idejére vonatkozó tk ó adatok d t k ttalálhatók: lálh tók Szak
átlaga
szórása
Hallgatók % os %-os megoszlása
Emberi erőforrás
1,5
1,2
24
Gazdálkodás menedzsment
2,25
0,8
26
Nemzetközi gazdálkodás
1,75
1,5
20
Pénzügy-számvitel
2,75
1,3
30
Számítsa ki aσ B , σ K ,σ
Napi tanulásra fordított idő (óra)
mérőszámokat és értelmezze azokat!
Megoldás x = 0,24 ⋅ 1,5 + 0,26 ⋅ 2,25 + 0,2 ⋅ 1,75 + 0,3 ⋅ 2,75 = 2,12
σ = 0,24 ⋅ (1,5 − 2,12) + ... + 0,3 ⋅ (2,75 − 2,12) = 0,2431 σ k = 0,49 2 K
2
2
σ B2 = 0,24⋅1,22 + 0,26⋅ 0,82 + 0,2 ⋅1,52 + 0,3 ⋅1,32 = 1,469 σ B = 1,212 σ 2 = σ B2 + σ K2 σ 2 = 1,469 + 0,2431 = 1,7121 → σ = 1,308
A vegyes k kapcsolat l t mutatószámai t tó á i Szórásnégyzet-hányados: megmutatja, hogy a minőségi vagy területi ismérv szerinti csoportosítás hány %-ban befolyásolja a mennyiségi ismérv szóródását szóródását.
σ σ SK SB H = =1− = =1− σ σ S S 2
2 K 2
2 B 2
Szóráshányados: a szórásnégyzet-hányados négyzetgyöke, amely megmutatja, hogy milyen szoros a kapcsolat a nem mennyiségi (csoportosító) és a mennyiségi ismérv között között. 2 2 σ σ σ SK SB 2 K K B H= H = = = 1− 2 = = 1− 2 σ σ σ S S
A vegyes kapcsolat mutatóinak értelmezése
0 < H <1
0 < H <1 2
H =H =0 2
H = H =1 2
Sztochasztikus kapcsolat
Teljes függetlenség, a kapcsolat teljes hiánya
Függvényszerű, determinisztikus kapcsolat
Feladatok (vegyes kapcsolat) Perfekt P f kt Statisztika St ti tik I. I példatár: éld tá 264/1, 267/2, 273/1, 273/2, 274/3, 274/5, 275/6, 275/7, 279/14, 280/15, 280/16, 281/18 (a 18 18-as as feladat b) részének a megoldása hátul nem jó!)
További gyakorló feladatok az általános statisztika (zöld) példatárból: 63/137, 65/140, 66/141, 66/143, 67/144
Zárthelyi dolgozat ( (ZH2) ) (2012. december 5. 10.00–11.30)
Zárthelyi dolgozat ((Pót ZH)) (2012. december 12. 10.00–11.30)