Gradientová analýza
Gradient • Gradient – změna některého faktoru prostředí • Historické zdroje – Teorie vegetačního kontinua (Gleason 1917, Ramenskij 1924) – Wisconsinská škola (50. léta): Curtis, McIntosh, Bray – R. H. Whittaker (1956, 1960)
Tři hlavní problémy s daty o společenstvech • „zero truncation problem“ • dáno výběrem měřítka „významu“ (performance) druhu = abundance • pokud druh chybí (tj. abundance = 0), chybí i informace o tom „jak moc nevhodné je prostředí pro druh“ • odpovědní křivky druhů jsou většinou komplikované a
vztahy mezi druhy jsou většinou nelineární • odpovědní křivky druhů nejsou většinou „ideální“, ale
„zrnité“ • druhy jsou většinou méně abundantní než je jejich potenciál v daném bodu gradientu prostředí • důvodem je vliv dalších proměnných prostředí, interakcí mezi druhy, náhody a limitů šíření taxonů
Ideální vs. reálné? Lineární a unimodání model
• hodně idealistické • vhodné pro velmi krátké gradienty
• chování druhu je popsatelné optimem (průměr), standard. odchylkou a výškou vrcholu • vztah 2 druhů s unimod. Gausovým modelem odpovědi je nelineární a komplikovaný (→ →)
Parametry Gaussovy křivky
t - tolerance rozdíl mezi optimem a polohou inflexního bodu Gaussovy křivky c maximální mohutnost populace
u – druhové optimum (x-ová souřadnice vrcholu křivky
hodnoty faktoru prostředí (gradient)
Odpovědní křivky druhů A a B k faktoru prostředí X a očekávané abundance druhů Lineární model
Unimodální model
(Jongman et al. 1995, p. 94)
Přímá a nepřímá gradientová analýza
Přímá gradientová analýza – analyzuje změny druhového složení podle známého a předem stanoveného jednoho nebo několika gradientů prostředí (ekoklina) – např. nadmořská výška rybník – litorál – rákosiny – louky pH půdy
Nepřímá gradientová analýza – analyzuje variabilitu druhového složení společenstva nezávisle na prostředí – hledá směr největší variability druhového složení (cenoklina) – komplexní gradient prostředí
Gradienty prostředí
Přímé – bezprostředně ovlivňují růst rostlin světlo teplota voda živiny
Nepřímé (zástupné) – snadno se měří a korelují s přímými faktory nadmořská výška geologické podloží typ půdy sklon a orientace svahu aj.
Přehled ordinace
Metody gradientové analýzy
Regrese – regression (přímá GA) Kalibrace – calibration (nepřímá GA) Ordinace – (indirect) ordination (nepřímá GA) Ordinace s omezením – constrained (direct) ordination (přímá GA)
Přímá a nepřímá gradientová analýza: přehled
Regrese
lineární model
– – – –
yki = ak + bkxi + eki yki ... odpověď k-tého druhu na i-té lokalitě ak ... posun přímky (intercept) bk ... sklon přímky (slope) eki ... chyba
unimodální model proložení Gaussovské křivky pomocí GLIM (= generalized linear modeling) vážené průměrování (weighted averaging) – uk = Σi ( yki xi / yk . )
Regrese
mnohonásobná regrese (multiple regression) regrese jedné závisle proměnné na několika nezávisle proměnných
logistická regrese (logistic regression) regrese s kategoriální závisle proměnnou; odhaduje se pravděpodobnost, že při dané hodnotě nezávisle proměnné dosáhne závisle proměnná hodnoty 1
Kalibrace
“obrácená regrese” známe: druhové složení na lokalitě i – vztah mezi druhy a faktory prostředí odhadujeme: faktory prostředí na lokalitě i
Kalibrace: lineární model Druh 1 Druh 2 Druh 3
Faktor prostředí
Σk yki bk xi = ––––––––– Σk bk2
Kalibrace: unimodální model Σk yki uk xi = ––––––––– Σk yki
pracuje s druhovými optimy (= indikační hodnoty)
zpravidla zanedbává rozdílné tolerance druhů
využívá tabelovaných hodnot optim druhů
Ellenberg 1974, 1979, Ellenberg et al. 1992 (střední Evropa) • světlo (1–9) • teplota (1–9) • kontinentalita (1–9)
vlhkost (1–12) reakce (1–9) živiny (1-9)
halofilnost (0-2)
Zólyomi et al. 1966, Borhidi, Soó, Simon (Maďarsko) Landolt 1977 (Švýcarsko) Jurko 1990 (Slovensko)
Ellenbergovy tabulky – ukázka tabulek + výpočtu
(Lepš et Šmilauer, 2003, p. 33)
(Ellenberg et al. 1992, p. 100)
Ellenbergovy indikační hodnoty: srovnání smrkových lesů tří pohoří Reakce
Vlhkost
9
7
8
Ellenberg moisture value
Ellenberg reaction value
7
6
5
4
6
5
3
2
1
4
Alps
Carpathians
Bohemian Massif
Alps
Carpathians
Bohemian Massif
Ellenbergovy indikační hodnoty: projekce do síťových map rozšíření
(Chytrý et al. 1999, Preslia 71: 1–19)
Ellenbergovy indikační hodnoty: změny druhového složení v čase
(Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28: 225–245)
Kritika Ellenbergovy metody
ordinální stupnice neumožňuje provádět základní aritmetické výpočty hodnoty jsou tabelovány pro Německo, zatímco v jiných oblastech se druhy mohou chovat jinak druhy často nejsou taxonomicky a ekologicky homogenní a různé ekotypy mohou mít různá optima průměry jsou zatíženy chybou vyplývající z interakce mezi faktory prostředí Faktor DUSÍK má charakter DOSTUPNOSTI ŽIVIN (tj. spíše fosforu) další čtení: Mucina (1985; Biologia), Jurko (1986; Biologia), Klimeš (1987; Preslia)
Ordinace: 2 různé způsoby přístupu 1. nalezni konfiguraci snímků v ordinačním prostoru tak, aby vzdálenost mezi vzorky v prostoru korespondovala nejlépe s nepodobností jejich druhového složení ............. multidimenzionální škálování (multidimensional scaling, MDS) ----metrické MDS (Analýza hlavních kordinát, PCoA) ----ne-metrické MDS 2. nalezni „latentní proměnné“ (ordinační osy), které reprezentují nejlepší prediktory pro hodnoty všech druhů -> vyžaduje specifikaci modelu odpovědi druhu k takové latentní proměnné ............ lineární a unimodální techniky ordinace
Běžné ordinační techniky (ter Braak and Prentice 1988)
Indirect gradient analysis • Distance-based approaches Polar ordination, PO (Bray-Curtis ordination) Principal Coordinates Analysis, PCoA (Metric multidimensional scaling) Nonmetric Multidimensional Scaling, NMDS
• Eigenanalysis-based approaches Linear model Principal Components Analysis, PCA
Unimodal model Correspondence Analysis, CA (Reciprocal Averaging) Detrended Correspondence Analysis, DCA
Direct gradient analysis Linear model Redundancy Analysis, RDA
Unimodal model Canonical Correspondence Analysis, CCA Detrended Canonical Correspondence Analysis, DCCA
Základní přehled hlavních ordinačních technik Metoda
Použitá míra nepodobnosti (vzdálenosti, distance)
Proměnné
PCA
Euklideovská vzdálenost
Kvantitativní data, lineární vztah (pozor na dvojité nuly)
PCoA, MDS
jakákoliv
Libovolné, i smíšené
NMDS
jakákoliv
Libovolné, i smíšené
CA
Chi-square vzdálenost (distance)
Nezáporné, škálově homogenní kvantitativní nebo binární data (abundance nebo prezence-absence)
Faktorová analýza
Euklideovská vzdálenost
Kvantitativní data, lineární vztah (pozor na dvojité nuly) (Legendre & Legendre 1998, p. 388)
Přehled základních typů ordinace v historickém kontextu
Ordinace
lokalizace vzorků v mnohorozměrném prostoru, jehož osami jsou druhy
Abundance druhu B
Ordinace Ale také: • lokalizace druhů v mnohorozměrném prostoru, jehož osami jsou vzorky
Abundance ve vzorku 2
Ordinační metody
zjednodušují mnohorozměrný prostor na 1–4 rozměry (princip není v redukci, ale v rotaci pohledu) 1. osa zachycuje směr největší variability v hyperprostoru 2. osa zachycuje další směr největší variability nezachycený 1. osou => nekoreluje s 1. osou (= orthogonalita) další osy zachycují další směry největší variability, nezachycené předchozími osami a nekorelují s předchozími osami variabilita zachycená jednotlivými osami je vyjádřena tzv. charakteristickými čísly (eigenvalues)
1.5
Příklad ordinačního diagramu 21
28 17
15 14 30 29
11 10 9 2 6 5 20 12 7
8 16 13
1
-1.0
4 3
-1.5
1.0
ordinační osy
Centroid a inertia • Centroid je střed objektu. Např. bod daný souřadnicemi průměry dimenzí objektu (délka, výška, šířka). Pokud se objekty liší v hustotě, je nutné zahrnout tuto variabilitu do výpočtu polohy centroidu. • Inertia je tendence objektu ležícího na daném místě v něm zůstat. Hodnota inertia objektu je přímo závislá na tom, jak je masa objektu rozložena kolem centroidu objektu. (= měřítko variability v mnohorozměrném prostoru)
Iterativní algoritmus ordinace
Krok 1: Každému vzorku je přidělena určitá libovolná, ale navzájem nestejná hodnota (stanovištní skore) xi Krok 2: Pro každý druh se vypočítá závislost na hodnotách stanovištních skore xi (lineární regresí druhů na stanovištní skore pro lineární model nebo váženým průměrováním pro unimodální model) Krok 3: Vypočítají se nové hodnoty xi kalibrací s užitím závislostí získaných v předešlém kroku Krok 4: Odstranění zmenšení měřítka Krok 5: Pokud se hodnoty xi během cyklu nezměnily (změna je menší než stanovená mez), cyklus se zastavuje, v opačném případě se vrací na krok 2
Analýza hlavních komponent, PCA Principal Components Analysis
Hotelling (1933) Lineární model (iterativní algoritmus využívá lineární regrese) Hlavní uplatnění při analýze kvantitativních dat (faktory prostředí, taxonomická data) nebo relativně homogenních dat o druhovém složení (krátký, ostrý gradient) Dvě nejpoužívanější varianty
PCA na kovarianční matici (species-centered PCA) •xi’ = xi – Σ xi / n
o nelze použít u proměnných měřených v různých jednotkách, málo vhodná u druhových dat s procentickými pokryvnostmi PCA na korelační matici (standardized PCA) • xi – Σ xi / n •xi’ = –––––––––––– • sx
o dává všem proměnným stejnou váhu
Jak funguje PCA?
centroid Centrování + (standardizace)
Druhy X1, X2, X3 Standardizované osy S1, S2, S3 Ordinační osy PCA 1, 2, 3
rotace
Ordinační diagram PCA: druhy 1.0
Škálování druhových skóre I A lo gen P oa tri E ly rep P oa ann
Agr sto
Jun buf Cir arv
P oa pra
Jun art R an fla E le pal
Lol per Tri rep
Cal cus
Ran acr R um ace T ri pra A ch mil
Em p nig Sal rep A ir pra H yp rad
Pla lan
-0.8
P ot pal
A nt odo
-1.0
1.0
Co značí délky vektorů druhů: 1. standardizace – skóre děleno standardní odchylkou výsledkem je korelační biplot a délka vektoru je měřítkem fitu (R, mnohonásobný korelační koeficient) příslušného druhu v ordinačním diagramu. 2. bez dělení standardní odchylkou: délka odráží změny v abundanci druhu (dlouhý vektor = velká změna abundance, často dominantní druhy).
Ordinační diagram PCA: druhy 1.0
Škálování druhových skóre II Příklad: stejný datový soubor
hypnando
Vlevo: druhová skóre transformována (děleno standardní odchylkou)
cynopoly
paralong
hypncupr lophbarb
Dole vpravo: druhová skore bez transformace
-1.0
hypnando
2.5
plagchas schistsp plagtsuc
0.6
hypncupr cynopoly paralong grimhart lophbarb leucglau isotalop schistsp rhizpunc plagchas plagtsuc
-0.5
-0.2
leucglau grimhart
-4.0
2.0
1.0
Ordinační diagram PCA: snímky 3 4
13 9
12 8
2
16
1 7 10
14
15
30
5 20
11
-0.8
6
28 17 21
-1.0
29
1.5
Dvě možnosti prezentace:
o distance biplot: o
o o o
1.0
PCA: Biplot a „biplot rule“ vzdálenosti mezi objekty jsou aproximací jejich Euklideovských vzdáleností délka vektoru druhu indikuje jeho příspěvek k tomuto prostoru úhly mezi vektory druhů nemají význam vhodné pro reprezentaci vztahů mezi plochami
Poa tri
o o
13
Ely rep Poa pra
9
Agr sto
12 Jun buf Sag pro Che alb 8 Cir arv
2
Bel per Lol per Bro hor Jun art
1
16
Tri rep
vzdálenosti mezi objekty nejsou aproximací jejich Euklideovských vzdáleností délka vektoru druhu je aproximací jeho standardní odchylky (variability) úhel mezi vektory druhů reprezentuje jejich korelaci vhodné pro reprezentaci vztahů mezi druhy
Ran fla
Rum ace 7 5
Ach mil10 Tri pra 6
Pla lan
Leo aut Ant odo
Pot pal Vic lat 11
14
Emp nigrut Bra Air pra Hyp rad
Ele pal Cal cus 15
Sal rep
20
18 17 19
-1.0
o
Alo gen 4
o correlation biplot: o
3
-1.0
1.0
Kolik os (komponent)? o V případě standardizované PCA je možné interpretovat osy s vlastními čísly > 1
o Pro nestandardizovanou PCA je možné interpretovat osy s vlastními čísly > průměrné vlastní číslo všech os
o Empiricky: interpretovatelných je několik první os, většinou 2-4 o pomocné kritérium: Broken stick model (Frontier 1976)
Výhody a nevýhody PCA + Lze použít i na ordinální či binární data (ale ne smíšená)
Není vhodná pro vícestavové kvalitativní znaky
PCA je dostatečně robustní Efekt podkovy u binárních (nevyžaduje data s dat mnohorozměrně normálním rozdělením) Počet znaků by měl být menší než počet vzorků (nevýhoda u RAPD či AFLP)
Analýza hlavních koordinát (PCoA) • umožňuje pracovat se všemi typy proměnných a s různými
mírami nepodobnosti (distancí), i neeukleidovskými → může být s nimi problém některé hodnoty vlastních čísel mohou být negativní (řešení: transformace hodnot koef. disimilarity nebo ignorace negat. hodnot)
• obecnější forma PCA – zobrazí pouze Euklideovskou část matice vzdáleností = nejlepší možná Euklideovská aproximace originální matice nepodobností !!! • pracujeme pouze s několika prvními osami • nevýhoda: nespecifikuje vztah druhů k ordinačním osám – volná volba modelu (lineární, unimodální...) + souřadnice objektů na ordinačním grafu nejsou lineárně závislé na hodnotách původních znaků
Duchoslav et al., Ann. Bot. 2010
Nemetrické mnohonásobné škálování (NMDS) • cílem analýzy není uchování vzdáleností mezi objekty, ale pořadí vzdáleností mezi objekty, v několika málo dimenzích (tj. podobnější objekty jsou si blíže a méně podobné dále v ordinačním prostoru) • umožňuje pracovat se všemi typy proměnných a s různými mírami nepodobnosti (distancí), i neeukleidovskými, symetrickými a nesymetrickými • vhodná též pro situace, kdy chybějí některé párové hodnoty distancí Stress: míra kvality ordinace, míra shody založená na diferencích mezi fitovanou vzdáleností modelem (dij) a predikovanou (dij) regresní funkcí mezi empirickou vzdáleností a fitovanou vzdáleností
• rozsah 0-1, čím nižší, tím lepší, do 0.15 akceptovatelné, dle hodnoty volíme počet os Doporučené čtení: Fasham M. (1977), Ecology 58: 551-561.
NMDS - příklad Matice nepodobností mezi sporty
Korespondenční analýza (CA) I. Correspondence Analysis
Unimodální model (iterativní algoritmus využívá váženého průměrování) Hlavní uplatnění při analýze dat o druhovém složení, která obsahují hodně nulových hodnot Vážené průměrování zahrnuje standardizaci jak snímky tak druhy jakékoliv dva vzorky s identickými relativními abundancemi (vz. A: 1,2,3; vz. B: 10,20,30) budou považovány za identické !!!
Odstranění zmenšení měřítka: xresc=(x-xmin)/(xmax-xmin)*délka
(Lepš et Šmilauer 2003, p. 36)
Korespondenční analýza (CA) II. • Eigenvalue měří zároveň míru separace nik mezi druhy podél osy • Pokud chci vědět % vysvětlené variability dané osy, musím dělit hodnotu eigenvalue celkovou variabilitou (total inertia) • problém: efekt podkovy (arch effect) a zkreslení ekologické vzdálenosti
Detrendovaná korespondenční analýza, DCA, Detrended Correspondence Analysis
Odstraňuje z CA „arch effect“ a zkreslené ekologické vzdálenosti (v CA jsou snímky se stejnými rozdíly v druhovém složení umístěny blíže k sobě na koncích než uprostřed ordinační osy) Detrendování (detrending) – odstraňuje “arch effect” po segmentech (by segments) přes mnohočleny (by polynomials) – máš-li v DCA analýze kovariáty či faktory prostředí, použij tento typ !!!
Přeškálování (rescaling) – srovnává ekologické vzdálenosti po přeškálování je průměrná rychlost objevování se a mizení druhů na gradientech přibližně konstantní SD units (jednotky směrodatné odchylky)
na vzdálenosti 1 SDU se vymění 1/2 druhů ve snímcích na vzdálenosti 4 SDU se úplně změní druhové složení snímků
Arch efekt v CA
Detrendování po segmentech
Hill & Gauch 1980, Vegetatio 42: 47–58
Přeškálování Originální gradient
1. Osa CA
1. Osa DCA
1.5
Ordinační diagram DCA: vzorky 21
28 17
15 14 30 29
11 10 9 2 6 5 20 12 7
8 16 13
1
-1.0
4 3
-1.5
1.0
1.5
Ordinační diagram DCA: druhy Air pra Hip rha
Vic lat
Hyp rad
Emp nig
Sal rep
Pot pal
Ant odo Pla lan Ach mil Tri pra
Leo aut Ran acr
Cal cus Bra rut Ran fla
Tri rep
Rum ace
Jun art
Bro hor Bel per Poa pra Lol per Poa ann
Ele pal Jun buf Sag pro
Ely rep
Agr sto
Poa tri Alo gen
-1.5
Che alb Cir arv
-1.5
1.5
4
DCA: joint diagram a „centroid principe“ Dvě možnosti škálování:
Sal rep 19
Sag pro Leo aut
Ant odo
1. distance rule: pro dlouhé strmé 18 Jun buf 14 15 12 16 Agr sto Tri rep gradienty (nad 2 Ele pal 8 13 Alo gen SD; Hillovo 9 4 3 škálování)
17
Bra rut
20
11
Pla lan Rum ace
6
5 7 10 2
Bel per
Ran fla Jun art
Poa tri
Poa pra Lol per
Ach mil
2. biplot rule: pro krátké gradienty (do 2 SD)
1
Bro hor
-1
Ely rep
-1
5
Příklady použití ordinačních technik
DCA: ordinační diagram s klasifikací + Interpretace os pomocí korelační analýzy I
(Hanáková et Duchoslav, Čas. Slez. Mus. 2002, p. 246-247)
DCA: ordinační diagram s klasifikací + Interpretace os pomocí korelační analýzy II
Vztah průměrné indikační hodnoty pro dusík a pozicí fyt.snímků na 1. ordinační ose DCA (viz předchozí snímek prezentace)
(Hanáková et Duchoslav, Čas. Slez. Mus. 2002, p. 246-247)
Ordinační diagram s klasifikací
Chytrý & Sádlo 1997, Ann. Bot. 55: 105–126
Ordinační diagram s klasifikací
Chytrý & Sádlo 1997, Ann. Bot. 55: 105–126
Změny vegetace hodnocené ordinací
Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28: 225–245
Změny vegetace hodnocené ordinací
Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28: 225–245
Změny vegetace hodnocené ordinací
Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28: 225–245
Přímá ordinace (ordinace s omezením) Direct (constrained) ordination
metoda přímé gradientové analýzy spojení ordinace a lineární regrese nehledá se cenoklina, ale popisuje se změna druhového složení v závislosti na měřených proměnných prostředí není vhodná, když nemáme žádnou představu o vztahu mezi proměnnými prostředí a druhovým složením společenstva: tehdy použijeme spíš nepřímou ordinaci je vhodná pro hodnocení ekologických experimentů nebo pozorování, kdy nás zajímá vztah druhového složení k předem vybraným proměnným
Iterativní algoritmus přímé ordinace
Do iterativního algoritmu nepřímé ordinace se přidá: Krok 3a: Výpočet mnohonásobné lineární regrese získaných stanovištních skóre na měřených proměnných prostředí a nahrazení původních stanovištních skóre hodnotami aproximovanými touto regresí
Metody přímé ordinace
Analýza redundance (redundancy analysis, RDA) – metoda pro lineární model odvozená od PCA Kanonická korespondenční analýza (canonical correspondence analysis, CCA) – metoda pro unimodální model odvozená od CA Detrendovaná kanonická korespondenční analýza (detrended canonical correspondence analysis, DCCA) – metoda pro unimodální model odvozená od DCA
Jak pracuje CCA…nejlepší gradient...
Metody přímé ordinace (RDA) 1.0
1.0
Dune Meadow Data 15
A1
Pot pal 14
5
20
Ran acr
21
Rum ace Tri pra Tri rep
28 6 2
3
Bel per Vic lat
12
11 17 10
-0.6
Moisture
29 30
-0.6
Cal cus Agr sto Ran fla Che alb
Jun buf Alo gen Jun art Hyp rad Emp nig Sal rep
8
9
Cir arv
Ely rep Leo aut Poa ann Poa tri Hip rha
4 13 16
Bra rut
-0.6
1 7
Ele pal
1.2
-0.6
1.2
Metody přímé ordinace (RDA) Dune Meadow Data
Axes Eigenvalues : Species-environment correlations : Cumulative percentage variance of species data: of species-environment relation: Sum of all unconstrained eigenvalues Sum of all canonical eigenvalues
1 .227 .902
2 .028 .597
3 .212 .000
4 .115 .000
22.7 89.0
25.5 100.0
46.7 .0
58.2 .0
Total variance 1.000
1.000 .255
Metody přímé ordinace (CCA) 2.5
2.5
Dune Meadow Data Pot pal
15
20
A1
5
6
12
4 3
13 16
10 9
8 29 30
Agr sto
Cal cus Ran fla Che alb
Jun art
Hyp rad Air pra Sal rep
-1.5 -1.0
Ele pal
Poa tri Alo gen Poa ann Ant odo Jun buf Hip rha Sag pro
Moisture
-1.5
21
Ran acr
Pla lan Rum ace Tri rep Bel per Cir arv Leo aut Bra rut
17
2 1
Tri pra
28
11 7
14
2.0
Emp nig
-1.0
2.0
Metody přímé ordinace (CCA) Dune Meadow Data
Axes Eigenvalues: Species-environment correlations: Cumulative percentage variance of species data: of species-environment relation: Sum of all unconstrained eigenvalues Sum of all canonical eigenvalues
1 .414 .921
2 .111 .728
3 .401 .000
4 .277 .000
19.4 78.9
24.6 100.0
43.4 .0
56.5 .0
Total inertia 2.130
2.130 .524
Metody přímé ordinace (CCA) 2.0
2.0
Dune Meadow Data s nominálními proměnnými prostředí
21
Hip rha Air pra Ant odo 5 28
17
Hayfield 9
10 20
29 30
7
8
Haypastu 1
2
6
3
4
12
Emp nig
Hyp rad Vic lat Pla lan Jun art Ach mil Ran acr Rum ace Leo aut Bra rut Ran fla Tri rep Bel per Bro hor Poa pra Jun buf Poa ann Tri pra Agr sto Lol per Poa tri Sag pro
14
Pasture A1 16
11
Sal rep
Moisture 15
13
Cal cus Ele pal
Pot pal
Cir arv
-1.5
-1.5
Alo gen
-1.0
2.5
-1.0
Che alb
2.5
Metody přímé ordinace (CCA) Dune Meadow Data s nominálními proměnnými prostředí
Axes Eigenvalues: Species-environment correlations: Cumulative percentage variance of species data: of species-environment relation: Sum of all unconstrained eigenvalues Sum of all canonical eigenvalues
1 .426 .929
2 .152 .684
3 .144 .793
4 .043 .776
20.0 55.7
27.1 75.5
33.9 94.3
35.9 100.0
Total inertia 2.130
2.130 .765
Kódování proměnných prostředí v přímé ordinaci Dune Meadow Data ENVIRONMENTAL DATA IN FULL FORMAT - DUNE MEADOW DATA (I5,F5.0,1X,2F3.0,3X,3F2.0,3X,4F2.0) 10 1 2.8 1 4 0 1 0 1 0 0 0 2 3.5 1 2 0 1 0 0 1 0 0 3 4.3 2 4 0 1 0 1 0 0 0 4 4.2 2 4 0 1 0 1 0 0 0 5 6.3 1 2 1 0 0 0 0 1 0 6 4.3 1 2 0 1 0 0 0 1 0 7 2.8 1 3 0 0 1 0 0 1 0 8 4.2 5 3 0 0 1 0 0 1 0 9 3.7 4 1 1 0 0 0 0 1 0 10 3.3 2 1 1 0 0 0 1 0 0 11 3.5 1 1 0 0 1 0 1 0 0 12 5.8 4 2 0 1 0 1 0 0 0 13 6.0 5 3 0 1 0 1 0 0 0 14 9.3 5 0 0 0 1 0 0 0 1 15 11.5 5 0 0 1 0 0 0 0 1 16 5.7 5 3 0 0 1 1 0 0 0 17 4.0 2 0 1 0 0 0 0 0 1 28 4.6 1 0 1 0 0 0 0 0 1 29 3.7 5 0 1 0 0 0 0 0 1 30 3.5 5 0 1 0 0 0 0 0 1 0 0.0 0 0 0 0 0 0 0 0 0 A1 MoistureManure HayfieldHaypastuPasture SF BF HF NM Sample 1Sample 2Sample 3Sample 4Sample 5Sample 6Sample 7Sample 8Sample 9Sample10 Sample11Sample12Sample13Sample14Sample15Sample16Sample17 SupplSAM Duplic17 Sample18Sample19Sample20
Parciální ordinace
Odstraňuje část variability vysvětlené “nezajímavými” proměnnými (např. vliv bloku při hodnocení dat z pokusů) Následně se přímými nebo nepřímými ordinačním metodami analyzuje zbytková variabilita Technicky: “nezajímavé”
proměnné se definují jako kovariáty (koproměnné, covariables) provede se regrese proměnných prostředí na kovariátách a rezidua této regrese zaujmou místo původních proměnných prostředí
ordinační osy parciální ordinace reprezentují čistý vliv proměnných prostředí, s vyloučením vlivu kovariát
Parciální CCA Dune Meadow Data 4
4
kovariáta: vlhkost, proměnná prostředí: hloubka půdního horizontu A1
Emp nig Air pra Hyp rad 21 29 17
Ant odo Sal rep 11 28 5 30
10
6
14
Pla lan Vic lat Tri pra Rum ace Bra rut Ran acr Sag pro Cal cus Bro hor Bel per Ele pal Poa pra Poa ann Agr sto Alo gen Che alb
15
7 20 8 2 16 12 9 13 1 43
-1
-1
A1
-2
3
Hip rha
-2
Pot pal
3
Parciální CCA Dune Meadow Data kovariáta: vlhkost, proměnná prostředí: hloubka půdního horizontu A1
Axes Eigenvalues: Species-environment correlations: Cumulative percentage variance of species data: of species-environment relation: Sum of all unconstrained eigenvalues Sum of all canonical eigenvalues
1 .125 .725
2 .401 .000
3 .277 .000
4 .199 .000
7.2 100.0
30.4 .0
46.4 .0
57.9 .0
Total inertia 2.130
1.730 .125
Case study: Jak ovlivňuje podíl smrku ve stromovém patru druhové složení podrostu? •Model: •Partial RDA •Envir. variable •Picea cover
Covariables •Altitude •Slope aspect •Slope inclination •Mineral soil depth •Free carbonate depth •Mottling depth •Tree layer cover
•Results: •Ax 1 eigenvalue •Ax 1 significance •% variance of species data •% variance of spec.-env. relation
0.022 0.001 2.7 100
• •RDA Ax 1 scores: •positive •Dicranum scopa •Plagiomn affine •Plagiothe curvif •Pleuroziu schre •Hypnum cupres
0.36 0.32 0.29 0.28 0.26
negative Fagus sylvatica Sanicula europa Carex flacca Cicerbita alpina Veronica monta
-0.36 -0.29 -0.27 -0.22 -0.21
Ewald 2000, Appl. Veg. Sci. 3: 123-138
Rozklad variance (variance partitioning) Borcard et al. 1992, Ecology 73: 1045–1055
odděluje varianci vysvětlenou dvěma skupinami proměnných např. abiotické vs. biotické faktory proměnné prostředí vs. čas edafické vs. klimatické proměnné vlastnosti přírodního prostředí vs. zásahy člověka
Rozklad variance (variance partitioning) Borcard et al. 1992, Ecology 73: 1045–1055 celková variabilita sdílená variabilita
zbytková variabilita variabilita vysvětlená první skupinou proměnných
variabilita vysvětlená druhou skupinou proměnných
Rozklad variance (variance partitioning) Borcard et al. 1992, Ecology 73: 1045–1055
celková variabilita druhových dat (total inertia) minus součet zelené, fialové a červené variability variabilita variabilita variabilita vysvětlená vysvětlená vysvětlená jednou 1. skupinou 2. skupinou ze dvou skupin proměnných proměnných proměnných v analýze v analýze, kde v analýze, kde bez kovariát minus 2. skupina 1. skupina variabilita vysvětlená proměnných proměnných v analýze tvoří kovariáty s kovariátami tvoří kovariáty
Permutační test (Monte Carlo test)
•
Testuje, zda vybraná proměnná prostředí má signifikantní vliv na druhové složení Nulová hypotéza: variabilita druhového složení je nezávislá na testované proměnné prostředí Spočítá se statistika F (poměr variability vysvětlené regresí a reziduální variability) pro reálná data Permutace: náhodně se přeskupí hodnoty proměnné prostředí mezi jednotlivými snímky a spočítá se F
Envir. variable 3 5 3 8 4 6 ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––– Species 1 0 2 0 1 1 2 Species 2 1 1 1 0 3 3 Species 3 2 2 1 0 0 1
Permutační test (Monte Carlo test)
Permutace se provede mnohokrát a vždy se zaznamená hodnota F Udělá se rozložení těchto hodnot a porovná se s hodnotou F pro skutečná (nepermutovaná) data
•
rozložení hodnot F pro všechny permutace
F původních dat ⇒ vliv proměnné je signifikantní
F původních dat ⇒ vliv proměnné je nesignifikantní
F
Permutační test (Monte Carlo test)
19 permutací – test pro 5% hladinu významnosti (P<0.05) 99 permutací – test pro 1% hladinu významnosti (P<0.01) 999 permutací – test pro 0.1% hladinu významnosti (P<0.001)
Permutační test (Monte Carlo test)
test první kanonické osy – např. zajímá-li nás vliv jedné kvantitativní proměnné test všech kanonických os – např. zajímá-li nás vliv nominální proměnné s několika kategoriemi test částečného (podmíněného; partial, conditional) vlivu proměnné, jsou-li v modelu zahrnuty už jiné proměnné
Permutační test (Monte Carlo test)
unrestricted permutations – data nemají žádnou vnitřní strukturu, zápisy jsou nezávislé unrestricted permutation within blocks defined by covariables –2 –5 –6
7 2 2
6 3 5
5 3 3
3 | 7 6 | 4 7 | 3
2 3 4
3 3 2
4 5 8
5 8 5
3 2 7
8 7 3
restricted permutations for time series or line transects – pro potenciálně autokorelovaná data –2 –5 –3
3 7 3
3 3 7
7 6 8||2 2 3
5 3 4
3 7 5
7 6 3
2 3 5 3 8||2
4 7 3
5 2 7
3 3 6
8 4 5
split-plot design – složitější uspořádání: “split plots” jsou vřazeny do “whole plots”
Příklady použití přímé ordinace pro studium vztahů mezi druhovým složením a vnějšími faktory
Změna vegetace v čase: opakování starých fytocenologických snímků
testovaná proměnná: čas (nominální proměnná: staré zápisy – 0, nové zápisy – 1) kovariáty: jakékoliv změřené proměnné, které mohou ovlivňovat variabilitu vegetace v prostoru např. nominálně kódovaná lokalita nominálně kódované geologické podloží topografický index xericity nadmořská výška
randomizace: unrestricted permutations; jsou-li nominální kovariáty, unrestricted permutations within blocks defined by covariables
Změna vegetace v čase: trvalé plochy
testovaná proměnná: čas jeden záznam každoročně nebo studium změn během jediné sezóny kovariáty: jakékoliv změřené proměnné, které mohou ovlivňovat variabilitu vegetace v prostoru randomizace: restricted permutations for time series or line transects within blocks defined by covariables (jednotlivé plochy jsou definovány jako kovariáty); jsou-li další nominální kovariáty, použije se split-plot design
víceleté studium s několika záznamy v každém roce kovariáty: tytéž, navíc nominální proměnné kódující sezónu (např. květen, červenec, září) nebo čas od začátku roku randomizace: je-li sezóna kódována nominálními proměnnými, použije se split-plot design, kde plochy jsou randomizovány odděleně ve whole plots a sezóny ve split-plots
Permutace dat z trvalých ploch V každém obdélníku restricted permutations for time series
Whole plots Plot 1
Plot 2
Plot 3
1997 1998 1999 2000 2001
1997 1998 1999 2000 2001
1997 1998 1999 2000 2001
1997 1998 1999 2000 2001
1997 1998 1999 2000 2001
1997 1998 1999 2000 2001
Analýza dat z transektů
testovaná proměnná: např. pH, hloubka půdy, pokryvnost stromového patra apod., zaznamenávané na transektu randomizace: restricted permutation for time series or line transects prochází-li transekt výrazným gradientem, lze tento gradient odstranit použitím pořadí plochy na transektu jako kovariáty společná analýza dat z více transektů variabilita mezi transekty se může odstranit definováním transektů jako série nominálních kovariát randomizace restricted permutation for time series or line transects, blocks defined by covariables
Analýza terénních manipulativních pokusů
testovaná proměnná: interakce času a pokusného zásahu (např. kosení a kontrola) kovariáty: nominálně kódované plochy (zahrnují i pokusné zásahy), čas randomizace: split-plot design: whole plots (zásahy): freely exchangeable split plots (stejné plochy v různých časech: restricted permutation for time series or line transects
je-li víc typů pokusných zásahů, testují se společně, každý jako interakce s časem v jednom modelu, čas jako kovariáta každý zvlášť jako interakce s časem, přičemž vždy interakce ostatních zásahů s časem jsou kovariáty a čas je také kovariáta
Kódování orientace svahu •PDSI modely
360o = 0o 315o
–(potential direct solar irradiation)
45o
•Heat index (Parker 1988) o
o
270
90
–HI = cos (orientace – 225o) * tg sklonu Topografický
135o
225o o
180
index relativní vlhkosti (Parker 1982) vrchol hřebene = 0, dno údolí = 20 JJZ = 0, SSV = 20 o o sklon > 30 = 0, 0 = 10 konvexní = 0, konkávní = 10