Statisztika Politológus képzés
Daróczi Gergely Politológia Tanszék
2012. február 28.
Outline
1
Változók és mérési szintek Mérési szintek Példák
2
A változók közötti kapcsolatról Grafikus példák A relációk típusai További példák A korrelációs együttható
3
˝ fázisai A kutatás fobb
Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
2 / 25
Változók és mérési szintek Egy konkrét példa
Hány éves Ön? >18 19-24 25-30 31-40 41-100 100<
Mutassa be a fenti példában a változót és annak attribútumait!
Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
3 / 25
Változók és mérési szintek Tipológia
A változók típusai Belso˝ változók Függo˝ változó kvalitatív változók kvantitatív változók
Független változó kvalitatív változók kvantitatív változók
Külso˝ változók Kontroll-változó Egyéb változók
Hozzon 1-1 példát a fentebbi típusokra!
Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
4 / 25
Mérési szintek Kvalitatív és kvantitatív változók
Kvalitatív változók: Nominális: egymást kizáró, a teljes válasz-univerzumot lefedo˝ kategóriák ˝ Ordinális: u.a., mint fentebb + a kategóriák sorbarendezhetoek
Klasszifikáció Sorrend Egyenlo˝ távolságok Nullpont
Nominális
Ordinális
Intervallum
Arány
X
X X
X X X
X X X X
Kvantitatív változók: Intervallum: u.a., mint fentebb + a kategóriák egyenlo˝ távolságra találhatóak Arány: u.a., mint fentebb + nullpont Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
5 / 25
Mérési szintek Példák
Határozza meg a következo˝ változók mérési szintjét! nem iskolai végzettség fizetés IQ tanulmányi átlag kor kedvenc szín születési hely
Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
6 / 25
A változók és attribútumaik Teszt!
˝ Milyen változók, milyen mérési szintek feleltethetoek meg az alábbi kérdéseknek/kijelentéseknek?
˝ ˝ ol, ˝ mint a fiatalabbak. Az idosebb emberek jobban félnek a bunöz ˝ okt ˝ A gazdasági fejlodés valóban a várható életkor csökkenésével jár együtt? Melyik a legnagyobb magyar focidrukker csapat? Minél hosszabb az eljegyzés, annál hosszab a házasság. Mely foglalkozás bír a legnagyobb presztízzsel?
Attribútumok?
Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
7 / 25
A változók közötti kapcsolatról Egy grafikus ábrázolás
53.940 diamonds ● ● ● ● ● ● ● ● ● ●
$15,000
$10,000
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
Good
Very Good
Premium
Ideal
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
$5,000
Fair
ggplot(diamonds, aes(cut, price)) + geom_boxplot() + xlab(’’) + ylab(’’) + scale_y_continuous(formatter="dollar") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
8 / 25
Az adatbázis szerkezete ggplot2/diamonds Prices of 50,000 round cut diamonds Description: A dataset containing the prices and other attributes of almost 54,000 diamonds. The variables are as follows: • price. price in US dollars (\$326--\$18,823) • carat. weight of the diamond (0.2--5.01) • cut. quality of the cut (Fair, Good, Very Good, Premium, Ideal) • colour. diamond colour, from J (worst) to D (best) • clarity. a measurement of how clear the diamond is (I1 (worst), SI1, SI2, VS1, VS2, VVS1, VVS2, IF (best)) • x. length in mm (0--10.74) • y. width in mm (0--58.9) • z. depth in mm (0--31.8) • depth. total depth percentage = z / mean(x, y) = 2 * z / (x + y) (43--79) • table. width of top of diamond relative to widest point (43--95) Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
9 / 25
A változók közötti kapcsolatról Egy grafikus ábrázolás
ggplot(diamonds, aes(carat, price)) + geom_point() + geom_smooth() + ylab(’’) + scale_y_continuous(formatter="dollar") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
10 / 25
A változók közötti kapcsolatról Egy grafikus ábrázolás
53.940 diamonds
12000
10000
cut
8000
Fair
N
Good 6000
Very Good Premium Ideal
4000
2000
0 I1
SI2
SI1
VS2
clarity
VS1
VVS2
VVS1
IF
ggplot(diamonds, aes(clarity, fill=cut)) + geom_bar() + ylab("N") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
11 / 25
A változók közötti kapcsolatról Egy grafikus ábrázolás
53.940 diamonds Fair
Good
Premium
Ideal
Very Good
5000 4000 3000 2000 1000
N
0 5000 4000 3000 2000 1000 0 I1
SI2 SI1 VS2 VS1 VVS2VVS1 IF
I1
SI2 SI1 VS2 VS1 VVS2VVS1 IF
I1
SI2 SI1 VS2 VS1 VVS2VVS1 IF
clarity
ggplot(diamonds, aes(clarity)) + geom_bar() + ylab("N") + facet_wrap(~ cut) + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
12 / 25
A változók közötti kapcsolatról Egy grafikus ábrázolás
ggplot(diamonds, aes(carat, price, color=clarity)) + geom_point() + ylab(’’) + scale_y_continuous(formatter="dollar") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
13 / 25
A változók közötti kapcsolatról Egy grafikus ábrázolás
ggplot(diamonds, aes(carat, price, color=cut)) + geom_point() + ylab(’’) + facet_wrap(~ clarity,nro scale_y_continuous(formatter="dollar") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
14 / 25
A változók közötti kapcsolatról Egy grafikus ábrázolás
Price of a diamond (N=53.940)
4%
3%
2%
1%
0%
0
5000
10000
15000
Online kutatást végeztünk az Interneten gyémántot árusító emberek között. ˝ és megbízhatóságáról? Mit gondolhatunk a kutatás érvényességérol Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
15 / 25
A változók közötti kapcsolat lehetséges típusai
Lehetséges kapcsolat két változó között: együttjárás, asszociáció, korreláció , hamis/látszólagos összefüggés, hatás, a hatás iránya, okság.
szignifikáns. . .
Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
16 / 25
A változók közötti kapcsolatról A hatás iránya 53.940 diamonds
$15,000
$10,000
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
D
E
F
G
H
I
J
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
$5,000
ggplot(diamonds, aes(color, price)) + geom_boxplot() + xlab(’’) + ylab(’’) + scale_y_continuous(formatter="dollar") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
17 / 25
Puska A gyémánt színei
Forrás: http://en.wikipedia.org/wiki/Diamond_color
Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
18 / 25
A változók közötti kapcsolatról Magas korreláció
A korrelációs együttható magas értéke nem cáfolható. Vajon miért? Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
19 / 25
A változók közötti kapcsolatról Magas korreláció
A korrelációs együttható magas értéke nem cáfolható. És? Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
20 / 25
A változók közötti kapcsolatról Correlation does not imply causality!
Forrás:http://xkcd.com/552/
Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
21 / 25
A változók közötti kapcsolatról Alacsony korrelációs együttható. Nincs kapcsolat?
Forrás: http://xkcd.com/323/ Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
22 / 25
A változók közötti kapcsolatról Korreláció
Pozitív („egyenes arányosság”: R = 1), negatív („fordított arányosság”: R = −1), lineáris, négyzetes . . . és korrelálatlan (R = 0) kapcsolat R: korrelációs együttható
Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
23 / 25
˝ fázisai A kutatás fobb Egy folyamatábra
A kutatási probléma meghatározása
A kutatási terv elkészítése Mintavétel
A mérés módjának meghatározása
Adatgyujtés ˝
Az adatok feldolgozása
Adatelemzés és értelmezés Daróczi Gergely (PPKE BTK)
Statisztika
2012-02-28
24 / 25
Köszönöm a figyelmet!
Daróczi Gergely
[email protected]