´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
KGG/STG Statistika pro geografy 9. Korelacˇnı´ analy´za
Mgr. David Fiedor 20. dubna 2015
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Analy´za za´vislostı´
v rˇadeˇ geograficky´ch disciplı´n studujeme jevy, u ktery´ch vysˇetrˇujeme nikoliv pouze jednu vlastnost (statisticky´ znak), ny´brzˇ znaku˚ neˇkolik tyto znaky mohou by´t navza´jem za´visle´ cı´lem te´to cˇa´sti statistiky je vysˇetrˇit, do jake´ mı´ry spolu dva cˇi vı´ce statisticky´ch znaku˚ souvisı´ (hodnota jednoho znaku podminˇuje hodnotu znaku druhe´ho)
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Analy´za za´vislostı´ - prˇ´ıklady pouzˇitı´
zkouma´nı´ vztahu mezi teplotou vzduchu a nadmorˇskou vy´sˇkou mnozˇstvı´ sra´zˇek a velikost odtoku pocˇet dojı´zˇdeˇjı´cı´ch a vzda´lenost od centra dojizˇd’ky mnoho dalsˇ´ıch vztahu˚ . . .
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Analy´za za´vislostı´
zaby´vat se budeme urcˇenı´m sı´ly za´vislosti (korelacˇnı´ pocˇet) a take´ druhu za´vislosti (regresnı´ pocˇet) je potrˇeba rozlisˇovat zkouma´nı´ za´vislosti pro ru˚zne´ typy statisticky´ch znaku˚ (nomina´lnı´, ordina´lnı´, intervalove´ a pomeˇrove´)
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Vztahy mezi velicˇinami
Vztahy jednostranne´ Zmeˇna statisticke´ho znaku jednoho souboru na´hodne´ velicˇiny (neza´visle promeˇnne´) podminˇuje zmeˇnu statisticke´ho znaku souboru druhe´ na´hodne´ velicˇiny (za´visle promeˇnne´). Vztahy vza´jemne´ Nelze rozlisˇit mezi souborem za´visle a neza´visle promeˇnne´ (naprˇ. vztah hodnot teplot vzduchu na dvou sousednı´ch stanicı´ch).
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Druhy za´vislostı´
1
2
za´vislost funkcˇnı´ - kazˇde´ hodnoteˇ znaku neza´visle promeˇnne´ na´hodne´ velicˇiny x odpovı´da´ vzˇdy pouze jedina´ urcˇita´ hodnota za´visle promeˇnne´ velicˇiny y za´vislost korelacˇnı´ - se zmeˇnou hodnoty znaku neza´visle promeˇnne´ x se meˇnı´ podmı´neˇna´ rozdeˇlenı´ relativnı´ch cˇetnostı´ hodnoty znaku za´visle promeˇnne´ y tak, zˇe zmeˇna x podminˇuje zmeˇnu pru˚meˇru y¯ souboru˚ hodnot y, odpovı´dajı´cı´ch dany´m hodnota´m x
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Druhy za´vislostı´
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
Kontingencˇnı´ tabulka Tabulka: Kontingencˇnı´ tabulka
Nejvysˇsˇ´ı dosazˇene´ vzdeˇla´nı´ ´ ˇ Urovenˇ spokojenosti ZS SSˇ VSˇ ni. 1 50 30 10 90 2 30 50 20 100 3 10 20 30 60 4 50 10 50 110 n.j 140 110 110 360 pozorovane´ cˇetnosti v jednotlivy´ch „bunˇka´ch“ tabulky oznacˇuje obecneˇ dveˇma indexy nij margina´lnı´ cˇetnosti - ten index, prˇes ktery´ je scˇı´ta´no je oznacˇen tecˇkou 9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
ˇ tyrˇpolnı´ tabulka C v prˇ´ıpadeˇ alternativnı´ch znaku˚ dosta´va´me cˇtyrˇpolnı´ tabulku alternativnı´ znaky - majı´ pouze dveˇ mozˇne´ varianty hodnot
ˇ tyrˇpolnı´ tabulka Tabulka: C
prava´ci muzˇi 43 zˇeny 44 celkem 87
9. Korelacˇnı´ analy´za
leva´ci 9 4 13
celkem 52 48 100
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
Meˇrˇenı´ za´vislosti kvalitativnı´ch znaku˚ nulova´ hypote´za H0 : X , Y jsou neza´visle´ na´hodne´ velicˇiny proti alternativeˇ, zˇe nejsou neza´visle´ test zalozˇen na porovna´nı´ zjisˇteˇny´ch cˇetnostı´ nij a tzv. ni. n.j teoreticky´ch cˇetnostı´ , ktere´ by si meˇly by´t n podobne´ testova´ statistika K (tzv. Pearsonova) ma´ tvar, prˇicˇemzˇ r , s jsou pocˇty variant znaku˚ r
K =
s
∑∑
i =1 j =1
9. Korelacˇnı´ analy´za
ni. n.j nij − n ni. n.j n
2
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
Meˇrˇenı´ za´vislosti kvalitativnı´ch znaku˚
meˇly by by´t splneˇny podmı´nky dobre´ aproximace, tj. ni. n.j teoreticke´ cˇetnosti by meˇly asponˇ v 80 % n prˇ´ıpadu˚ naby´vajı´ hodnoty veˇtsˇ´ı nebo rovny peˇti (a celkoveˇ neklesnout pod 2) prˇi platnosti nulove´ hypote´zy a splneˇnı´ uvedene´ podmı´nky se testova´ statistika K rˇ´ıdı´ rozdeˇlenı´m χ2 ((r − 1)(s − 1))
kriticky´ obor W = χ21−α ((r − 1)(s − 1)), ∞
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
Crame´ru˚v koeficient
s V =
K , n (m − 1)
kde m = min{r , s } koeficient naby´va´ hodnot mezi 0 a 1 cˇı´m blı´zˇe k 1, tı´m je za´vislost teˇsneˇjsˇ´ı; cˇı´m blı´zˇe je k 0, tı´m je za´vislost volneˇjsˇ´ı
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
Vy´znam hodnot Crame´rova koeficientu
mezi 0 azˇ 0,1 ⇒ zanedbatelna´ za´vislost mezi 0,1 azˇ 0,3 ⇒ slaba´ za´vislost mezi 0,3 azˇ 0,7 ⇒ strˇednı´ za´vislost mezi 0,7 azˇ 1 ⇒ silna´ za´vislost
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
Prˇ´ıklad Pro vy´beˇr studentu˚ zjisˇt’ujeme, zda existuje vztah mezi sportem, ktery´ provozujı´ a sportovnı´mi porˇady, ktere´ sledujı´ v televizi. Tabulka: Kontingencˇnı´ tabulka
Televize hry hry 133 atletika 15 gymnastika 4 plava´nı´ 9 n.j 161
Sportova´nı´ atletika gymnastika plava´nı´ ni. 6 2 4 145 10 4 3 32 1 25 0 30 0 1 17 27 17 32 24 234
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
ˇ esˇenı´ R oveˇrˇenı´ podmı´nek dobre´ aproximace nulova´ hypote´za: neexistuje vztah mezi provozovany´m sportem a sportem sledovany´m v televizi vy´pocˇet testovacı´ho krite´ria K ; K = 273,3 zjistı´me hodnotu prˇ´ıslusˇne´ho kvantilu χ2 rozdeˇlenı´ pro (4 − 1) · (4 − 1) = 9 stupnˇu˚ volnosti, tj. 16,9 zamı´ta´me proto nulovou hypote´zu a tvrdı´me, zˇe vztah mezi sledovany´mi a provozovany´mi sporty je statisticky vy´znamny´
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
ˇ esˇenı´ R
pomocı´ vy´pocˇtu Crame´rova koeficientu jesˇteˇ mu˚zˇeme kvantifikovat mı´ru za´vislosti tohoto s vztahu K hodnotu urcˇı´me ze vztahu V = , kde n (m − 1) m = min{r , s } V = 0,62, cozˇ povazˇujeme za strˇednı´ za´vislost
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
ˇ esˇenı´ - postup v syste´mu STATISTICA R
vytvorˇ´ıme novy´ datovy´ soubor o 3 promeˇnny´ch (TV, ˇ etnost) a 16 prˇ´ıpadech (vsˇechny Sportova´nı´, C varianty z tabulky) kontingencˇnı´ tabulku vytvorˇ´ıme takto: Statistiky–Za´kladnı´ statistiky/tabulky–OK–Specif. Tabulky–List 1 TV, List 2 Sportova´nı´–OK a zapneme promeˇnnou vah (cˇetnost); na za´lozˇce Mozˇnosti zasˇkrtneme Procenta z pocˇtu v rˇa´dku a Procenta z pocˇtu ve sloupci–Vy´pocˇet
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
ˇ esˇenı´ - postup v syste´mu STATISTICA R oveˇrˇ´ıme podmı´nky dobre´ aproximace: Statistiky–Za´kladnı´ statistiky/tabulky–Kontingencˇnı´ tabulky–OK–Specif. Tabulky–List 1 TV, List 2 Sportova´nı´–OK, zapneme promeˇnnou vah (cˇetnost) OK, Vy´pocˇet a na za´lozˇce Mozˇnosti zasˇkrtneme Ocˇeka´vane´ cˇetnosti hodnotu testove´ statistiky a Crame´ru˚v koeficient dostaneme tak, zˇe na za´lozˇce Mozˇnosti zasˇkrtneme Pearsonu˚v & M-V chı´ kvadra´t a Crame´rovo V, na za´lozˇce Detailnı´ vy´sledky vybereme Detailnı´ 2 rozm. tabulky
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
Koeficient porˇadove´ korelace Spearmanu˚v koeficient rs pouzˇ´ıva´ se k urcˇenı´ za´vislosti kvalitativnı´ch znaku˚ ordina´lnı´ho typu kazˇde´ hodnoteˇ xi , yi prˇirˇadı´me porˇadove´ cˇı´slo pxi a pyi podle velikosti hodnot xi a yi urcˇı´me rozdı´ly Di dvojic porˇadovy´ch cˇı´sel odpovı´dajı´cı´ch si hodnot rs = 1 −
9. Korelacˇnı´ analy´za
6 ∑ Di2 ) n · (n 2 − 1
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
Vlastnosti Spearmanova koeficientu porˇadove´ korelace
platı´ vztah −1 ≤ rs ≤ 1 koeficient je rezistentnı´ („odolny´“) vu˚cˇi odlehly´m hodnota´m pouzˇ´ıva´ se v situacı´ch, kdy: zkoumana´ data majı´ asponˇ ordina´lnı´ charakter nelze prˇedpokla´dat, zˇe vztah mezi velicˇinami X , Y je linea´rnı´ na´hodny´ vy´beˇr nepocha´zı´ z dvourozmeˇrne´ho norma´lnı´ho rozdeˇlenı´
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
Testova´nı´ porˇadove´ neza´vislosti ordina´lnı´ch velicˇin
nulova´ hypote´za: X , Y jsou porˇadoveˇ neza´visle´ na´hodne´ velicˇiny jako testovacı´ krite´rium slouzˇ´ı Spearmanu˚v koeficient porˇadove´ korelace rs kriticky´ obor W = h−1, −rs , 1 − α/2(n )i ∪ hrs , 1 − α/2(n ), 1i, prˇitom rs , 1 − α/2(n ) je kriticka´ hodnota, kterou najdeme v tabulka´ch
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
Prˇ´ıklad Kvantifikujte vztah mezi dobou, po kterou jsou pole ponecha´na ladem a pocˇtem rostlinny´ch druhu˚ (na m2 ). Tabulka: Zjisˇteˇna´ data
Pocˇet roku˚ Pocˇet druhu˚ 1 2 2 3 3 5 4 4 8 7 10 6 ¿ 10 7 9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
ˇ esˇenı´ R
prˇirˇadı´me hodnota´m jejich porˇadı´ urcˇı´me diference mezi odpovı´dajı´cı´mi si porˇadovy´mi daty vypocˇı´ta´me Spearmanu˚v koeficient - rs = 0,902 v tabulka´ch najdeme pro n = 7 a pro α = 0,05 kritickou hodnotu 0,786 existuje statisticky vy´znamny´ vztah mezi dobou, po kterou jsou pole ponecha´na ladem a pocˇtem rostlinny´ch druhu˚, ktere´ se na nich vyskytujı´
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Meˇrˇenı´ sı´ly za´vislosti velicˇin nomina´lnı´ho typu Meˇrˇenı´ sı´ly za´vislosti velicˇin ordina´lnı´ho typu
ˇ esˇenı´ - pomocı´ syste´mu STATISTICA R
Statistiky–Neparametricke´ statistiky–Korelace–OK vybereme Vytvorˇit detailnı´ report–Promeˇnne´ X, Y–OK–Spearmanu˚v koef. R. jelikozˇ pocˇet dvojic nenı´ dostatecˇny´, mu˚zˇeme z te´to tabulky pouzˇ´ıt hodnotu testovacı´ho krite´ria, ale nemeˇli bychom pouzˇ´ıvat k interpretaci p-hodnotu v tabulka´ch najdeme kritickou hodnotu, vytvorˇ´ıme kriticky´ obor a mu˚zˇeme ucˇinit za´veˇr o testu
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Kovariance Kovariancı´ dvou na´hodny´ch velicˇin X , Y rozumı´me strˇednı´ hodnotu soucˇinu centrovany´ch velicˇin, tj. cˇı´slo ∑(xi − x¯ ) · (yi − y¯ ) Sxy = . n−1 obdoba rozptylu charakterizuje promeˇnlivost realizacı´ na´hodny´ch velicˇin X , Y kolem jejich strˇednı´ch hodnot kladna´ hodnota kovariance znamena´, zˇe velicˇiny X , Y spolu bud’ rostou nebo klesajı´; za´porna´ hodnota znamena´, zˇe jedna z velicˇin roste a druha´ klesa´ omezenost spocˇı´va´ v tom, zˇe se jedna´ o mı´ru absolutnı´ - nelze ji pouzˇ´ıt k porovna´nı´ teˇsnosti vztahu dvou cˇi vı´ce dvojic vy´beˇrovy´ch souboru˚ 9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Kovariance
Na´vod na vy´pocˇet kovariance v syste´mu STATISTICA: Statistiky–Vı´cena´sobna´ regrese–Promeˇnne´ Neza´visla´ X, Za´visla´ Y–OK–OK–Residua/prˇedpoklady/prˇedpoveˇdi–Popisne´ statistiky–Dalsˇ´ı statistiky–Kovariance ve vy´stupu obdrzˇ´ıme tabulku, kde na hlavnı´ diagona´le jsou rozptyly promeˇnny´ch X , Y mimo hlavnı´ diagona´lu jsou kovariance
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Koeficient korelace rxy nejpouzˇ´ıvaneˇjsˇ´ı charakteristika k vyja´drˇenı´ za´vislostı´ mezi dveˇma velicˇinami narozdı´l od kovariance se jedna´ o relativnı´ mı´ru za´vislosti urcˇı´me ji jako podı´l kovariance a soucˇinu smeˇrodatny´ch odchylek sx a sy obou vy´beˇru˚
rxy
Sxy =r = sx · sy
1 ∑(xi − x¯ ) · (yi − y¯ ) n−1 1 1 ∑(xi − x¯ )2 · ∑(yi − y¯ )2 n−1 n−1
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Koeficient korelace
Hodnota korelacˇnı´ho koeficientu kolı´sa´ v intervalu od -1 do 1: rxy = 0 neza´vislost rxy ⇒ −1 neprˇ´ıma´ za´vislost rxy =⇒ 1 prˇ´ıma´ za´vislost
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Testova´nı´ vy´znamnosti korelacˇnı´ho koeficientu pro testova´nı´ vy´znamnosti korelacˇnı´ho koeficientu je zapotrˇebı´ oveˇrˇit normalitu obou promeˇnny´ch dalsˇ´ı podmı´nkou pouzˇitı´ jsou dvojrozmeˇrnost norma´lnı´ho rozdeˇlenı´ (kazˇde´ hodnoteˇ znaku velicˇiny x odpovı´da´ soubor hodnot znaku y, ktery´ ma´ norma´lnı´ rozdeˇlenı´ a naopak) poslednı´ podmı´nkou je linearita vztahu hodnot x a y (regresnı´ cˇa´ra je prˇ´ımka) nulova´ hypote´za tvrdı´, zˇe se korelacˇnı´ koeficient nelisˇ´ı od nuly (tedy zˇa´dna´ za´vislost) tvar testovacı´ho krite´ria nebudeme uva´deˇt 9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Prˇ´ıklad Jaka´ je za´vislost mezi pH pu˚dy na vy´sypka´ch a pocˇtem rostlinny´ch druhu˚?
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
ˇ esˇenı´ R
vypocˇı´ta´me hodnotu korelacˇnı´ho koeficientu Statistiky–Za´kladnı´ statistiky/tabulky–Korelacˇnı´ matice–OK–1 seznam promeˇnny´ch–X, Y–OK a na za´lozˇce Mozˇnosti zrusˇ´ıme volbu Vcˇetneˇ pru˚meˇru˚ a sm. odch.–Vy´pocˇet na za´lozˇce Mozˇnosti zvolı´me Zobrazit r, p-hodnoty a N–Vy´pocˇet
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Koeficient determinace
cˇasto se koeficient korelace ve vy´pocˇtech doplnˇuje 2 hodnotou koeficientu determinace rxy tato hodnota kolı´sa´ v intervalu 0 azˇ 1 vyna´soben stem uda´va´ v procentech tu cˇa´st rozptylu za´visle promeˇnne´ y, ktera´ je vysveˇtlena (podmı´neˇna) zmeˇnami hodnot neza´visle promeˇnne´ x
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy
´ vod U Analy´za za´vislosti kvalitativnı´ch znaku˚ Analy´za za´vislosti velicˇin intervalove´ho a pomeˇrove´ho typu
Deˇkuji za pozornost...
9. Korelacˇnı´ analy´za
KGG/STG Statistika pro geografy