5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě své sedmnáctileté dcery. James Truslow Adams
Kvantitativní metody B
Co se dozvíte
o o o o o
Asociace, kovariance a korelace, míry závislosti. Modelování statistické závislosti. Regresní přímka, metoda nejmenších čtverců. Vybrané nelineární závislosti. Měření kvality modelu.
Kvantitativní metody B
2
Asociace míra závislosti mezi četnostmi výskytu hodnot dvou kvalitativních znaků X a Y v kontingenční tabulce expected
hypotetické (očekávané) sdružené četnosti eij pro nezávislé hodnoty xi a yj platí:
eij = nij
míra (ne)závislosti kvalitativních znaků G r – počet řádků (obměn znaku X) s – počet sloupců (obměn znaku Y)
Kvantitativní metody B
3
Míry asociace
[: chí – kvadrát :]
G jako Pearsonova χ2 míra asociace znaků X a Y G=0 G = n.h
znaky X a Y jsou nezávislé znaky X a Y jsou maximálně závislé h = min (r - 1 ; s - 1)
Cramerův kontingenční koeficient V V=0 V=1
Kvantitativní metody B
znaky jsou nezávislé znaky jsou maximálně závislé
4
Příklad Je politická orientace závislá na vzdělání? orientace
nij
Σ
střed
pravice
ZŠ
5
5
2
12
SŠ
3
13
8
24
VŠ
1
10
3
14
9
28
13
50
Σ
5 − 2,16 ) ( G= 2,16
2
5 − 6, 72 ) ( +
Cramerův koeficient:
6, 72
V=
Kvantitativní metody B
2
vzdě vzdělání
vzdě vzdělání
levice
orientace
eij
Σ
levice
střed
pravice
ZŠ
2,16
6,72
3,12
12
SŠ
4,32
13,44
6,24
24
VŠ
2,52
7,84
3,64
14
9
28
13
50
Σ
3 − 3, 64 ) ( + ... +
2
3, 64
G 7,11 = = 0, 27 n⋅h 50 ⋅ 2
= 7,11 slabá závislost 5
Kovariance kovariance sxy vyjadřuje vzájemný vztah proměnných X a Y
pro populaci bude ve jmenovateli n
vyjadřuje intenzitu lineární závislosti mezi X a Y sxy > 0 sxy < 0 sxy = 0
přímá (pozitivní) závislost nepřímá (negativní) závislost lineárně nezávislé veličiny
Kvantitativní metody B
X↑ X↑
Y↑ Y↓
6
Korelace korelační koeficient rxy – relativní vyjádření vztahu mezi X a Y
−1 ≤ rxy ≤ +1
vyjadřuje intenzitu lineární závislosti mezi X a Y rxy > 0 rxy < 0
převažuje rostoucí závislost mezi x a y převažuje klesající závislost mezi x a y
rxy = 0 rxy = ±1
znaky x a y jsou lineárně nezávislé znaky x a y jsou lineárně závislé
Kvantitativní metody B
7
Příklad – korelační tabulka Lze dosažené známky z mikro (Mi) a Makro (Ma) ekonomie považovat za nezávislé veličiny? Mi \ Ma
1
2
3
Σ
1
16
4
2
22
2
8
3
4
15
3
3
5
5
13
Σ
27
12
11
50
X – známka z Mi Y – známka z Ma
střední hodnoty a rozptyly:
22 ⋅1 + 15 ⋅ 2 + 13 ⋅ 3 x= = 1,82 50 27 ⋅1 + 12 ⋅ 2 + 11⋅ 3 y= = 1, 68 50 Kvantitativní metody B
22 ⋅12 + 15 ⋅ 22 + 13 ⋅ 32 − 50 ⋅1,822 s = = 0, 681 49 27 ⋅12 + 12 ⋅ 22 + 11⋅ 32 − 50 ⋅1, 682 2 sy = = 0, 671 49 2 x
8
Příklad kovariance
16 ⋅1⋅1 + 4 ⋅1⋅ 2 + ... + 5 ⋅ 3 ⋅ 3 − 50 ⋅1,82 ⋅1, 68 sxy = = 0, 268 49 korelační koeficient
0, 268 rxy = = 0,396 0, 681 ⋅ 0, 671 Mezi oběma předměty je slabá pozitivní závislost.
Kvantitativní metody B
9
Regresní funkce korelace a regrese korelace – vzájemný (lineární) vztah proměnných regrese – matematické vyjádření vztahu mezi proměnnými regresní model: X1 . . . Xk
?
Y = f(X1, X2, …, Xk) + e Y deterministická složka
náhodná složka
lze vypočítat Kvantitativní metody B
10
Přečtěte si Matematické pojmy poskytují hlubší pohled na ekonomické koncepce a dodávají jim přesnost a jasnost jasnost.. Mnoho ekonomických jevů může být bráno jako matematické proměnné, např. např. příjmy, výnosy, náklady, ceny, zásoby, atd. atd. V ekonomii se snažíme určit vztahy mezi těmito proměnnými proměnnými.. Takovým speciálním případem vyjádření vztahů mezi proměnnými je regresní funkce funkce.. Doc.. RNDr Doc RNDr.. Ing. Ing. Petr Fiala, CSc CSc.., MBA. MBA. Úvod do kvantitativní ekonomie
Kvantitativní metody B
11
Jednoduchá lineární regrese Lineární regrese
lineární regresní model
60 55 50 45 y
40 35
rovnice regresní přímky
30 25 20 15 8
13
18
23
28
33
x
[ xi ; yi ] [ xi ; y)i ]
body náležící souboru znaků X, Y body ležící na regresní přímce
Kvantitativní metody B
12
Metoda nejmenších čtverců reziduum
yi ) yi
ei
xi
metoda nejmenších čtverců – minimalizuje rozptyl hodnot kolem regresní přímky
) 2 SSE = ∑ ei2 = ∑ ( yi − yi ) min ! i
i
SSE – Sum of Squared Errors Kvantitativní metody B
13
Koeficienty lineární regrese rovnice regresní přímky:
regresní koeficient b1 směrnice regresní přímky mezní přírůstek závisle proměnné Y
∆X = 1
→
∆Y = b1
koeficient b0 průsečík regresní přímky s osou y přímka prochází těžištěm
Kvantitativní metody B
[x ; y ] 14
Kvalita regresního modelu determinační koeficient R2 rozptyl teoretických hodnot
rozptyl empirických hodnot
0 ≤ R2 ≤ 1 jakou část variability závislé proměnné Y lze vysvětlit vlivem nezávislé proměnné X
pro lineární modely je determinační koeficient druhou mocninou koeficientu korelace Kvantitativní metody B
15
Sdružené regresní přímky
odhad proměnné Y pro X = xi
odhad proměnné X pro Y = yi Regresní nůžky
12000 11500 11000 10500 10000 9500 9000 8500 8000 250
300
350
400
450
500
≠1 Kvantitativní metody B
16
Příklad závislost známek ze zkoušek mikro (X) a makro (Y): y = f(x)
x = g(y)
b1 =
0, 268 = 0,39 0, 681
0, 268 a1 = = 0, 40 0, 671
b0 = 1, 68 − 0,39 ⋅1,82 = 0,96 x
1
2
3
y
1,35
1,74
2,13
a0 = 1,82 − 0, 40 ⋅1, 68 = 1,15 y
1
2
3
x
1,55
1,95
2,35
makro je lehčí než mikro Kvantitativní metody B
17
Nelineární regresní modely parabolická (kvadratická) regrese
Kvadratická regrese 90 85 80 75
Y
70 65 y = -0,0825x2 + 4,423x + 19,415 R2 = 0,919
60 55 50 45 40 10
hyperbolická regrese
15
20
25
30
35
40
45
50
X
Hyperbolická závislost 80
Y - počet kontaktů / týden
70 60 50 40 30 20 10 0 0
10
20
30
40
50
60
70
X - vzdálenost v m
exponenciální regrese
Exponenciální regrese 80 70 60
x
y = 2,0758.1,072 2 R = 0,9424
y
50 40 30 20 10 0 20
25
30
35
40
45
50
55
x
Kvantitativní metody B
18
Parabolická regrese regresní funkce:
řešíme soustavu rovnic:
KDY ? proměnná Y se mění rychleji než lineárně proměnná Y mění průběh Kvantitativní metody B
19
Hyperbolická regrese regresní funkce:
rovnice lineární v parametrech (substitucí lze převést na lineární)
KDY ? modelování nepřímé úměrnosti proměnná Y konvexně klesá Kvantitativní metody B
20
Exponenciální regrese regresní funkce:
rovnice linearizovatelná transformací (logaritmováním lze převést na lineární)
KDY ? proměnná Y roste rychleji než kvadraticky Kvantitativní metody B
21
Příklad – nelineární regrese Tabulka uvádí závislost mezi vzdáleností pracovníků na pracovišti v metrech a četností jejich pracovních styků za týden: vzdálenost
3
8
9
12
20
32
52
počet styků
25
18
10
9
7
5
3
graf napovídá:
30
25
použijeme hyperbolickou regresi
20
15
10
5
0 0
10
20
30
40
50
Kvantitativní metody B
60
22
Příklad výpočtem dostaneme:
kvalita modelu – determinační koeficient: vypočteme rozptyly:
s y2 = 61
sY2 = 54
2 s R 2 = Y2 = 0,886 = 88, 6% sy
kvalita modelu je poměrně vysoká
Kvantitativní metody B
23
Proč matematické modely? matematický model je abstraktní reprezentace ekonomických vztahů v reálném světě matematika zavádí přesnost do definic a vztahů matematika je jazyk, který usnadňuje sdělování ekonomických koncepcí matematické modely můžeme zkoumat nezávisle na realitě HMOTNOST = -77 + 0,83 VÝŠKA -6,78 POHLAVÍ + 0,27 VĚK
Kvantitativní metody B
24
Co Vás čeká příště Analýza časových řad o o o o o
Časové řady a jejich rozklad. Elementární analýza časové řady. Analýza trendu, typy trendů časových řad. Analýza sezónnosti, sezónní odchylky a indexy. Prognózování budoucího vývoje.
Kvantitativní metody B
25