Statisztika 3. Dr Gősi Zsuzsanna Egyetemi adjunktus
Koncentráció mérése Koncentráció általában a jelenségek tömörülését, összpontosulását értjük. Koncentráció meglétéről gyorsan tájékozódhatunk, ha sokaságot egy mennyiségi ismérv alapján csoportosítjuk. A koncentráció számításánál un. relatív gyakoriságot és a relatív értékösszeget számolhatjuk.
A városok népességmegoszlása 1997 1997--ben Népesség (fő)
Városok száma
2000 2000--4999
20
5000 5000--9999
61
10000 10000--49999
105
50000 50000--99999
11
100000 100000--
8
Összesen
205
Koncentráció erőssége Erős koncentráció, ha a sokaság nagy hányadához a teljes értékösszeg kis hányada tartozik – vagyis a sokaság kis hányada az értékösszeg jelentős hányadát tudhatja magáénak. A koncentrációt ábrázoló görbe: a Lorenz görbe
Csoportosított adatok átlaga, szórása
Átlagok Statisztika vizsgálat során feltételezzük, hogy a sokaság homogén. Heterogén sokaságot esetében viszonylag egyszerűen, valamilyen ismérv alapján homogén részekre bonthatjuk.
A sportra fordított napi időmennyiség Megnevezés
férfi
nő
Megkérde Megkérde-zettek száma
Megoszlás (%)
Napi átlagos idő (óra)
A sportolás időtarta időtarta-mának szórása
120
60
3
1,5
80
40
2
0,5
Szórás Belső szórás: a csoportokon belüli szórást mutatja Külső szórás: csoportok átlagainak szórása Teljes szórás: a két tényező együttes értéke
Kapcsolatvizsgálatok Független Sztochasztikus – a kapcsolat valószínűsíthető – Asszociációs – mindkét ismérv minőségi – Vegyes – az ok minőségi az okozat mennyiségi – Korrelációs – mindkét ismérv mennyiségi
Determinisztikus
Intenzitás mérőszáma A T mutató fejezi ki a kapcsolat erősségét Az értéke -1 és +1 között lehet – az előjel a kapcsolat irányát mutatja A mutatószám értékei a következőket fejezhetik ki – – – – –
0 nincs kapcsolat 0 < T < 0,3 gyenge a kapcsolat 0,3 < T < 0,7 közepes szorosságú kapcsolat 0,7 < T < 1 erős kapcsolat 1 függvényszerű vagy determinisztikus kapcsolat
A felmérés eredménye Játékhely
A vizsgálat eredménye
Összesen
Győzelem
Vereség
Otthon
39
9
48
Idegenben
11
21
32
Összesen
50
30
80
Kontigenciatábla Ismérv
B ismérv változatai
Összesen
változatai
B
B
A1
f11
f12
S1
A2
f21
f22
S2
Összesen
O1
O2
n
Idősorok elemzése
Idősor elemzés A klasszikus idősor elemzés abból a feltételezésből indul ki, hogy az idősort egy tartós, hosszú távú tendencia (trend), szabályos hullámmozgások, periodikus ingadozások (szezonalitás) határozzák meg és ezektől eseti, egyenként nem jelentős eltérítő hatást vált ki a véletlen ingadozás.
Az idősor elemzés eszközei Grafikus ábrázolás: lehetővé teszi a fő tendenciák vonások felismerését. Bázis ill. láncviszonyszámok – az idősorok gyors, előzetes elemzésére szolgál. Egyszerűbb eszközök az un. átlagok – Számtani átlag – Kronologikus átlag
Kronologikus átlag Egy adott időszak korrekt jellemzéséhez vizsgált időszakon éven kívüli megfigyelés is szükséges, de az első és utolsó megfigyelés – csak fél súllyal szerepel. Képlete y1 .... yn y y k 2 n 1 2 2 yt n 1
Létszámadat a 2006 2006--os évre vonatkozóan Hónapok
Alkalmazottak száma
Január
50
Február
55
Március
62
Április
48
Május
56
Június
60
Július
58
Augusztus
52
Szeptember
48
Október
49
November
52
December
51
Január
48
Idősorok összetevői Trend vagy alapirányzat – egy határozottan jelentkező tendencia Periodikus ingadozás – rendszeresen ismétlődő hullámzás (pl idegenforgalom, gázfogyasztás) Véletlen ingadozás – szabálytalan mozgás /Idősor elemzés esetén ezt a három hatást kell elkülöníteni/
Idősorok kapcsolata Additív kapcsolat – az idősor a trend hatás a periodikus hatás és a véletlen ingadozás összege Multiplikatív kapcsolat – az idősor érték a három tényező szorzata
Két fő módszere Mozgó átlagok módszere – többszörös átlagolás Analitikus trendszámítás – az idősort matematikai függvénnyel fejezzük ki – Lineáris (egyenes) függvény – Exponenciális függvény – Másodfokú polinom – Logisztikus görbe
Lineáris trendfüggvény
y b b t t
0
1
t t y y b t t t
1
b0 y b1 t
2
Olimpia résztvevők adatai Helyszín
Év
Résztvevők száma
London
1948
4 092
Helsinki
1952
5 429
Melbourne
1956
3 178
Róma
1960
5 313
Tokió
1964
5 133
Mexikóváros
1968
5 498
München
1972
7 121
Montreal
1976
6 043
Moszkva
1980
5 283
Los Angeles
1984
6 802
Szoül
1988
8 473
Barcelona
1992
9 368
Atlanta
1996
10 322
Sydney
2000
11 651
Athén
2004
10 500
Összesen
104 216
Indexszámítás
Alapvetés Bevétel = egységár x mennyiség Jelölése v = p x q Egyedi indexek p1 – Egyedi árindex i p p0 q1 – Egyedi volumenindex i q q0 – Egyedi értékindex
p1q1 iv p0 q 0
Egy stadion bevételi adatai Megnevezés
Belépőjegy
Reklám Reklám-felület
Szeptember
Szeptember
Október
November
Egységár p0
Mennyiség q0
Egységár p1
Mennyiség q1
800
5000
880
4000
8000
100
7200
120