Statisztika Politológus képzés
Daróczi Gergely Politológia Tanszék
2012. április 17.
Outline
1
Leíró statisztikák
2
Középértékek Példa Esettanulmány
3
Szóródási mutatók Példa Esettanulmány
4
Néhány megjegyzés a grafikonokról
5
Számítások
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
2 / 35
Adatelemzés #1
Átlag: 56.9 % Daróczi Gergely (PPKE BTK)
Medián: 52 %
Módusz: 48 % és 78 % Statisztika
Szórás: 18,8 2012-04-17
3 / 35
Leíró statisztikák Középértékek
Számos különbözo˝ középérték (átlag) áll a kutató rendelkezésére - azok ˝ elonyeivel és hátrányaival együtt:
1 2
xn 1 n x = x1 +x2 +···+ n ∑i =1 i n p √ Mértani átlag: n ∏ni=1 xi = n x1 x2 · · · xn
Számtani átlag:
3
Módusz: leggyakoribb érték
4
Medián: a statisztikai sokaságot kétfelé vágó érték
5
Midrange:
max x +min x 2
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
4 / 35
Leíró statisztikák Példák
˝ Mely középérték(ek)kel jellemezné a következoket?
1
Egy szemeszterben gyujtött ˝ jegyek.
2
A könyvtárban lévo˝ hallgatók száma.
3
˝ hajszín a Campuson. A legjellemzobb
4
A budapesti lakosok fizetése.
5
Egy sítáborban elköltött eurók száma.
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
5 / 35
Leíró statisztikák Esettanulmány
Értelmezze, szükség esetén javítsa a következo˝ állításokat!
1
„1940 és 1948 között az átlagos heti juttatások összege 107 százalékkal emelekedett a United States Steel Corporation-ben.”
2
„Az átlagos fizetés $ 5.000 körül mozgott 1942-ben.”
3
„Az autóbalesetben való elhalálozás valószínusége ˝ kétszer nagyobb, ˝ ˝ mint repülobalesetet szenvedni (+ statisztikus a repülon).”
4
˝ „Tamás IQ-ja 98, Lindáé pedig 101. Egy újabb példája annak, hogy a nok sokkal intelligensebbek a férfiaknál.”
5
„Ezen a héten feleannyit dolgoztam, mint tavaly ilyenkor.”
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
6 / 35
Leíró statisztikák Esettanulmány
˝ European Values Study Milyen középértékekkel jellemezné a következo, (Hungary, 2008)-ból származó változókat: „Kérem mondja meg a következo˝ állításokról, hogy azokat mindig ˝ ˝ megengedhetonek tartja-e (10), vagy soha meg nem engedhetonek tartja (10, vagy valami a ketto˝ között.”
1
Állami juttatásokat jogtalanul igénybe venni
2
Abortusz
3
Válás
4
Jegy és bérlet nélkül utazni egy tömegközlekedési eszközön
5
Homoszexualitás
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
7 / 35
Leíró statisztikák Esettanulmány
600
˝ „Kérem mondja meg a következo˝ állításokról, hogy azokat mindig megengedhetonek tartja-e ˝ (10), vagy soha meg nem engedhetonek tartja (10, vagy valami a ketto˝ között.” – Jegy és bérlet nélkül utazni egy tömegközlekedési eszközön
Átlag: 2.751 400
Módusz: 1
0
200
Medián: 1
1
Daróczi Gergely (PPKE BTK)
2
3
4
5
6
7
8
9
Statisztika
10
2012-04-17
8 / 35
Leíró statisztikák Esettanulmány
300
350
˝ „Kérem mondja meg a következo˝ állításokról, hogy azokat mindig megengedhetonek tartja-e ˝ (10), vagy soha meg nem engedhetonek tartja (10, vagy valami a ketto˝ között.” – Válás
200
250
Átlag: 5.824
150
Módusz: 5
0
50
100
Medián: 5
1
Daróczi Gergely (PPKE BTK)
2
3
4
5
6
7
8
9
Statisztika
10
2012-04-17
9 / 35
Leíró statisztikák Esettanulmány
600
700
˝ „Kérem mondja meg a következo˝ állításokról, hogy azokat mindig megengedhetonek tartja-e ˝ (10), vagy soha meg nem engedhetonek tartja (10, vagy valami a ketto˝ között.” – Homoszexualitás
400
500
Átlag: 3.261
300
Módusz: 1
0
100
200
Medián: 1
1
Daróczi Gergely (PPKE BTK)
2
3
4
5
6
7
8
9
Statisztika
10
2012-04-17
10 / 35
Leíró statisztikák Esettanulmány
Hallgatók közötti intelligencia-teszt eredménye:
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
11 / 35
Leíró statisztikák Esettanulmány
Hallgatók közötti intelligencia-teszt eredménye:
100
Átlag: 99.6 Módusz: 89.2 Medián: 99.8
0
50
Frequency
150
Histogram of t
60
80
100
120
t
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
12 / 35
Leíró statisztikák Esettanulmány
Hallgatók közötti intelligencia-teszt eredménye:
● ● ●
120
130
●
100
110
Átlag: 99.6
90
Módusz: 89.2
70
80
Medián: 99.8 ●
60
●
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
13 / 35
Leíró statisztikák Esettanulmány
Magyar munkavállalók fizetése:
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
14 / 35
Leíró statisztikák Esettanulmány
400
Magyar munkavállalók fizetése:
200
Módusz: 72554 Medián: 114613
0
100
Frequency
300
Átlag: 113721
0
Daróczi Gergely (PPKE BTK)
50000
100000
150000
200000
Statisztika
2012-04-17
15 / 35
Leíró statisztikák Esettanulmány
Magyar munkavállalók fizetése:
●
● ● ● ● ● ● ● ●
Átlag: 113721
150000
200000
● ●
100000
Módusz: 72554
50000
Medián: 114613 ● ● ● ● ● ● ●
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
16 / 35
Leíró statisztikák Esettanulmány
˝ Mi történik, ha a mintába egy kiemelkedoen gazdag alany is bekerül?
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
17 / 35
Leíró statisztikák Esettanulmány
●
10000000
100000000
●
Átlag: 471150 Módusz: 72554
100000
●
●
Daróczi Gergely (PPKE BTK)
● ● ● ●
10000
0
100000000
1000000
300000000
500000000
˝ Mi történik, ha a mintába egy kiemelkedoen gazdag alany is bekerül?
●
Statisztika
Medián: 116299
2012-04-17
18 / 35
Leíró statisztikák Szóródási mutatók
Számos különbözo˝ szóródási mutató áll a kutató rendelkezésére - azok ˝ elonyeivel és hátrányaival együtt. A homogenitás, variabilitás kiragadott ˝ méroeszközei:
1
Terjedelem: max x − min x
2
Empirikus szórás: σ =
3
Variancia: σ 2
q
∑Ni=1 (xi −x )2 n−1
4
A kvartilisek (Q1, Q2, Q3) négy egyenlo˝ részre osztják a rendezett mintát: Q2 felezi a mintát (tehát megegyezik a mediánnal); Q1 a minta alsó felének, Q3 a felso˝ felének közepe.
5
Interkvartilis terjedelem (IQR): Q3 − Q1
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
19 / 35
Leíró statisztikák Interkvartilis terjedelem
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
20 / 35
Leíró statisztikák Interkvartilis terjedelem
Hallgatók közötti intelligencia-teszt eredménye:
●
● ●● ●
70
Daróczi Gergely (PPKE BTK)
●● ● ●●
80
90
100
Statisztika
110
120
●
130
2012-04-17
21 / 35
Leíró statisztikák Esettanulmány
Lyotard : A posztmodern állapot (1979)
„vége a nagy elveszéléseknek” „anything goes” „posztmodern kor és posztmodern kultúra” Vajon mi történik a normákkal?
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
22 / 35
Leíró statisztikák Esettanulmány
˝ „Kérem mondja meg a következo˝ állításokról, hogy azokat mindig megengedhetonek tartja-e ˝ (10), vagy soha meg nem engedhetonek tartja (10, vagy valami a ketto˝ között.” – Homoszexualitás (1982-1991) Hungary (1991)
0
0
200
200
400
Frequency
600 400
Frequency
800
600
1000
1200
Hungary (1982)
2
4
6
8
10
2
x = 1.447407; σ = 1.419384
Daróczi Gergely (PPKE BTK)
4
6
8
10
x = 2.713547; σ = 3.230236
Statisztika
2012-04-17
23 / 35
Leíró statisztikák Példa
200
Frequency
100
100
0
0
50
Frequency
150
300
200
400
Mi magyarázza az átlagok alacsony különbségét?
−4
−3
−2
−1
0
1
2
3
−0.4
x = −0.1; σ = 1.019
−0.2
0.0
0.2
0.4
x = 0; σ = 0.453
Mi a magyarázat arra, hogy az elso˝ példában magasabb a szórás?
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
24 / 35
Leíró statisztikák Esettanulmány
Egy eddig elhallgatott leíró statisztikai mutató: szumma
Milyen problémát sejtünk a fentebbi ábrához tartozó „kutatás” mögött? Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
25 / 35
Néhány megjegyzés a grafikonokról Palacsintás példa
Forrás: Daróczi Gergely (PPKE BTK)
http://faculty.washington.edu/chudler/stat3.html Statisztika
2012-04-17
26 / 35
Néhány megjegyzés a grafikonokról Palacsintás példa
Forrás: http://faculty.washington.edu/chudler/stat3.html
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
27 / 35
Néhány megjegyzés a grafikonokról Palacsintás példa
Forrás: http://faculty.washington.edu/chudler/stat3.html
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
28 / 35
Néhány megjegyzés a grafikonokról Palacsintás példa
Forrás: http://faculty.washington.edu/chudler/stat3.html Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
29 / 35
Számítások ˝ A várható értékrol
Szükséges képletek:
számtani átlag: x =
∑ni=1 xi n
˝ (becslofüggvény)
q (x −x )2 korrigált empirikus szórás: σ = ∑ni=1 i n standard/mintavételi hiba: SE = √σn konfidencia intervallum: x ± SE · z ahol z = 1.96
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
30 / 35
Számítások ˝ A várható értékrol
1
√
σ 2π
exp
−x 2 2σ 2
σ 34% 0.1%
2%
34%
14%
14%
2%
0.1% x
−3σ
−2σ
−σ
σ
2σ
3σ
standard normális eloszlás: x = 0, σ = 1 Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
31 / 35
Számítások Egy nagyon egyszeru˝ példa
Játékszabály Egy hatoldalú dobókockával gurítunk: Ha a dobás páratlan, a játékos a dobott összeget megnyeri. Amennyiben a dobás páros, úgy o˝ fizet két dollárt a banknak. ˝ Adatgyujtés: ˝ elozetes számítások helyett belevetjük magunkat a játékba, és a következo˝ értékeket dobjuk.
Folytassuk a játékot?
Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
32 / 35
A mintavételi hiba Egy egyszeru˝ példa
X = {−2, 2, 4, −2, −2, 6} −2 + 2 + 4 + 2 + 2 + 6 6 1 x= = = =1 6
r σ=
6
1
(−2 − 1)2 + (2 − 1)2 + (4 − 1)2 + (−2 − 1)2 + (−2 − 1)2 + (6 − 1)2 r =
9 + 1 + 9 + 9 + 9 + 25
SE =
5 3.521363
√
6
=
5 r
=
62
=
5 3.521363 2.44949
=
√
12.4 = 3.521363
= 1.437591
A várható érték valahol -1.87 és 3.87 között (CI) található 95%-os döntési szinten. Hogyan döntenénk? Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
33 / 35
Computation Theoretical solution
●
0.20 0.10
0.15
Density
0.25
0.30
˝ Felejtkezzünk el az empirikus adatokról egy idore, és vizsgáljuk meg a valódi várható értéket!
−2
0
●
●
●
2
4
6
Winnings
Mi a probléma az ábrával? Daróczi Gergely (PPKE BTK)
Statisztika
2012-04-17
34 / 35
Köszönöm a figyelmet!
Daróczi Gergely
[email protected]