Smíšené regresní modely při sledování obsahu těžkých kovů v sedimentech řeky Moravy Marie Forbelská Masarykova univerzita Brno – Přírodovědecká fakulta Ústav matematiky a statistiky
3.–5. 6. 2012
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
1 / 36
Obsah
1
Skupinově závislá data
2
Jednoduché modely
3
Obecná definice LMM modelů
4
Odhady parametrů
5
Jednoduchý model pro reálná data
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
2 / 36
Skupinově závislá data
Skupinově závislá data
Klasické statistické metody se obvykle zajímají buď nezávislými pozorováními nebo časovými řadami V praxi se však občas setkáváme s daty, která se sestávají z nezávislých skupin vzájemně závislých pozorování.
Ke správné a efektivní analýze takových dat potřebujeme speciální a zatím relativně málo známé metody.
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
3 / 36
Skupinově závislá data
Typy skupinově závislých dat Skupinově závislá data lze zhruba rozdělit do tří skupin 1
čistě skupinová data – pozorování, který se týkají skupin vzájemně spřízněných a souvisejících objektů či subjektů, např. pozorování na členech jedné rodiny či sourozencích na výrobcích pocházejících ze stejné dílny na plodinách sklizených z různých částí téhož pole
2
opakovaná měření – učiněná na téže jednotce
3
longitudinální data – opakovaná měření probíhající v čase
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
4 / 36
Skupinově závislá data
Specifikace skupin
1
Čistě skupinová data – vyznačují se tím, že nemají žádné přirozené uspořádání mezi jednotlivými závislými měřeními.
2
Opakovaná měření – pozorování jsou uspořádána podle pořadí: první, druhé, třetí . . .
3
Longitudinální data – navíc poskytují informaci o čase měření; podobají se pozorováním kratších úseků nezávislých časových řad.
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
5 / 36
Skupinově závislá data
Cíle modelování skupinově závislých dat
Modelovat závislost jejich středních hodnot a rozptylu na experimentálních podmínkách, při nichž byla učiněna jednotlivá měření na pozorovaných charakteristikách experimentálních objektů
Tato formulace vede k problému regresního modelování po skupinách korelovaných pozorování. jako funkce experimentálních podmínek charakteristik měřených objektů rizikových faktorů, apod.
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
6 / 36
Skupinově závislá data
Matematická formulace problému Značení index j (j = 1, . . . , N) – označení nezávislé experimentální jednotky (skupiny, subjekty) dvojice indexů ji (i = 1, . . . , nj ) – označení pro korelovaná pozorování na j-té jednotce N P n= nj – celkový počet pozorování j=1
Yji = β0 + xji1 β1 + · · · + xjip βp + εji – regresní model pro ji-té měření, kde εji – náhodné odchylky s nulovou střední hodnotou a pro něž C (εji , εj 0 i 0 ) = 0 pro j 6= j 0 , ale C (εji , εji 0 ) může být nenulové.
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
7 / 36
Skupinově závislá data
Maticový zápis pro j -tou jednotku
Yj = Xj β + εj Yj = (Yj1 , . . . , Yjnj )0 – vektor opakovaných měření na j -té jednotce 0 xj1 1 .. xji1 (nenáhodná) . , kde xji = Xj = .. matice plánu .. pro j -tou jednotku . . 0 x jip xjnj 0 εj = (εj1 , . . . , εjnj ) ∼ Nnj (0, σ 2 Σj ) – vektor náhodných chyb pro j -tou jednotku β = (β0 , . . . , βp )0 – vektor neznámých parametrů
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
8 / 36
Skupinově závislá data
Společný maticový zápis
Y = Xβ + ε ,
Y1 Y = ... ,
kde
ε ∼ Nn (0, Σ)
X1 X = ... ,
YN
XN
Σ1
Σ=σ
0 .. .
2
0
Marie Forbelská (MU – ÚMS)
0 .. . ..
. ···
··· .. . .. . 0
ε1 ε = ... , εN
0 .. . ΣN
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
9 / 36
Skupinově závislá data
Náhodné efekty a lineární smíšený model
Znovu předpokládáme model Yj = Xj β + εj , kde εj ∼ Nnj (0, σ 2 Σj ) Rozptylová matice určující korelace mezi Yji a Yji 0 není diagonální var εj = Vj = σ 2 Σj = Vj (ψ) a lineární smíšený model odhaduje vektor parametrů ψ z pozorovaných dat (tj. na základě prediktorů) společně s regresními parametry β . Parametrizace rozptylu může mít několik komponent, mezi nimiž hrají důležitou roli náhodné efekty. Dále na jednoduchém motivačním příkladu ukážeme, jak fungují náhodné efekty v případě lineárního růstového modelu.
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
10 / 36
Jednoduché modely
Jednoduché příklady
Uvažujme lineární růstový model Yji = β0 + β1 tji + εji , kde EYji = β0 + β1 tji a tji je čas i -tého pozorování subjektu j . Pokud například odezvu Yji interpretujeme jako výšku sledovaného subjektu (člověka, stromu, apod.) v čase tji , pak parametr β0 označuje průměrnou výšku v čase 0 a β1 je průměrný přírůstek za jednotku času.
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
11 / 36
Jednoduché modely
Náhodný absolutní člen Předpokládejme, že sledovaní jedinci mají tendenci být buď systematicky vyšší nebo systematicky nižší než průměr, a to po celou dobu sledování. Proto pro j -tý subjekt zavedeme nepozorovanou náhodnou odchylku od průměru b0 ∼ N(0, σ02 ) . Pak model upravíme takto Yji = β0 + β1 tji + b0 + ηji , kde | {z } εji
ηji ∼ iid N(0, σ 2 ) a ηji ⊥ b0 . Pak C (εji ,εji 0 √ ji Dεji 0
R(Yji , Yji 0 ) = R(εji , εji 0 ) = √Dε
(b0+ηji ,b0+ηji 0 )
=√
b0+ηji
√
b0+ηji 0
σ2
0 0 = DbDb = σ2 +σ 2 > 0 0+Dηji 0
Navíc pořád bude platit EYji = β0 + β1 tji
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
12 / 36
Jednoduché modely
Náhodný absolutní člen i směrnice
Nyní budeme předpokládat, že sledovaní jedinci se liší nejen polohou, ale i směrnicí růstu. Zavedeme navíc nepozorovanou náhodnou veličinu b1 ∼ N(0, σ12 ) . Pak model upravíme takto Yji = β0 + β1 tji + b0 + b1 tji + ηji , kde {z } | εji
ηji , b0 , b1 jsou nezávislé náhodné veličiny. Pak C (Yji , Yji 0 )= C (εji , εji 0 ) = C (b0 +b1 tji +ηji , b0 +b1 tji 0 +ηji 0 ) a vidíme, že v = Db0 + tji tji 0 Db1 = σ02 + tji tji 0 σ12 > 0
modelu s náhodnou směricí jak rozptyl Yji , tak kovariance mezi Yji a Yji 0 rostou s časem.
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
13 / 36
Obecná definice LMM modelů
Lineární smíšený model (Linear Mixed Model – LMM) Obecný model s náhodnými efekty zobecňuje princip, který jsme ilustrovali zavedením náhodného absolutního členu a náhodné směrnice. Uvažujme náhodné parametry pro jakékoli prediktory. Dostaneme model Yj = Xj β + Zj bj + η j , kde | {z } εj
matice plánu Xj je typu nj × k (k = p + 1) a Zj je typu nj × q , vektor pevných efektů β je typu k × 1 vektor náhodných efektů bj ∼ Nq (0, D) je typu q × 1 η j ∼ Nnj (0, σ 2 Σj ) , oba normální vektory bj a η j jsou nezávislé. Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
14 / 36
Obecná definice LMM modelů
Varianční struktura LMM Zavedením náhodných efektů modelujeme rozptyl Vj = DYj = Dεj = D(Zj bj + η j ) = Zj DZ0j + σ 2 Σj (a tím i korelace mezi Yji a Yji 0 ) Pro longitudinální data přidáme autoregresní složku Wj (t), tj. εj = Zj bj + Wj (t) + η j , kde Wj (t) je vektor hodnot autoregresního procesu v časech t = (tj1 , . . . , tjnj )0 s rozptylem τ 2 a korelační funkcí R(Wj (s1 ), Wj (s2 )) = e −φ|s1−s2 |
Pak autokorelační složka vnáší do modelu pozitivní korelace, které klesají se vzrůstajícím rozdílem času. Časově blízká pozorování jsou pak více korelovaná, než pozorování vzdálená.
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
15 / 36
Odhady parametrů
Odhady parametrů v LMM modelech
Parametry LMM modelu se odhadují za předpokladu, že všechny složky náhodné chyby mají mnohorozměrné normální rozdělení. Označíme-li neznámé parametry matice Vj jako ψ a budeme-li předpokládat, že je známe, pak ML–odhad −1 N N X X b= β X0j Vj−1 Xj X0j Vj−1 Yj (1) j=1
j=1
Lze ukázat, že jde o nejlepší nestranný lineární odhad (Best Linear Unbiased Estimator, BLUE) pro β , kde nejlepší znamená, že má minimální střední kvadratickou chybu.
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
16 / 36
Odhady parametrů
BLUP–odhady náhodných efektů
Chceme–li predikovat náhodné efekty, použijeme podmíněnou střední hodnotu E (bj |Yj ) Za předpokladu, že ψ známe dostaneme bj = DZ0 V−1 (Yj − Xj β), b j j
(2)
Lze ukázat, že jde o nejlepší nestranný lineární prediktor (Best Linear Unbiased Predictor, BLUP) pro bj , kde nejlepší je opět ve smyslu minimální střední kvadratické chyby.
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
17 / 36
Odhady parametrů
ML (REML) odhady ψ Odhad parametrů ψ se provádí pomocí metody maximální věrohodnosti (ML-odhad, l1 ), popř. REML (Restricted Maximum Likelihood, l2 ). l1 (ψ; y1 , . . . , yN )= c1 − l2 (ψ; y1 , . . . , yN )= c2 −
1 2 1 2
− 12
N P j=1 N P
log(|Vj |) − log(|Vj |) −
j=1 N P
1 2 1 2
N P j=1 N P
rj0 Vj−1 rj
(3)
rj0 Vj−1 rj
j=1
log(|X0j Vj−1 Xj |)
(4)
j=1
kde rj = yj − X0j
N P j=1
!−1 X0j Vj−1 Xj
N P j=1
!−1 X0j Vj−1 yj
c1 a c2 jsou vhodné konstanty.
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
18 / 36
Odhady parametrů
Numerické výpočty
Rovnice (3) a (4) se maximalizují iterativně (Fisher scoring, Newton–Raphson, více viz Demidenko, 2004). b b V rovnicích (1) a (2) se neznámé ψ nahradí ψ ML nebo ψ REML , v tom případě mluvíme o empirickém BLUE odhadu pro β , popř. empirickém BLUP odhadu pro bj Pro testování fixních efektů, náhodných efektů a variančních komponent se využívají testy poměrem věrohodností nebo Waldovy testy (více Verbeke and Molenberghs, 2000).
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
19 / 36
Odhady parametrů
Predikce
Prediktor pro podmíněnou střední hodnotu E (Yj |bj ) = µj|bj = Xj β + Zj bj dostaneme po dosazení příslušných odhadů do rovnic (1) a (2) 0 −1 b b b b µd j|bj = Xj β + Zj bj = Xj β + Zj DZj Vj (Yj − Xj β) b + Zj DZ0 V−1 Yj = (Inj − Zj DZ0j Vj−1 )Xj β j j b + (In − Σj V−1 Xj )Yj . = Σj V−1 Xj β j
j
j
b Vidíme, že výraz µd j|bj je váženým průměrem Xj β (vztahující se k celé populaci) a Yj (vztahující se k subjektu j ).
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
20 / 36
Jednoduchý model pro reálná data
Dlouhodobé sledování obsahu prioritních a dalších nebezpečných látek v sedimentech řeky Moravy v letech 1997 – 2010 V nejvíce zatížených úsecích, situovaných v podélném profilu řeky Moravy mezi 298. a 93. říčním kilometrem, bylo sledováno více než 50 ukazatelů ze skupin těžké kovy, polychlorované bifenyly (PCB), organochlorované pesticidy (OCP) a polyaromatické uhlovodíky (PAU).
Příklad prezentuje první výsledky účelového sledování a následného statistického zhodnocení časového vývoje obsahu prioritních a dalších nebezpečných látek v sedimentech řeky Moravy, a to v letech 1997 – 2010.
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
21 / 36
Jednoduchý model pro reálná data
Specifikace sběru dat Vzorky sedimentů byly odebírány v 7 lokalitách v podélném profilu řeky Moravy 1. Šumperk pod 5. Uherské Hradiště pod 2. Olomouc pod 6. Hodonín pod 3. Kroměříž pod 7. Lanžhot pod 4. Otrokovice pod ze dna tzv. brodící metodou pomocí ručního vzorkovače na tyči. Část předupraveného vzorku pak byla uřčena ke stanovení těžkých kovů olova (Pb), rtuti (Hg), kadmia (Cd) a niklu (Ni).
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
22 / 36
Jednoduchý model pro reálná data
Model Yji = β0 + β1 tji + εji = β0 + β1 tji + bj0 + ηji | {z } εji
lokality j = 1, . . . , 7 ηji ∼ N(0, σj2 ) (heteroskedastický) bj0 ∼ N(0, σb2 ) počty pozorování uvnitř lokalit nj lokalita 1997 Šumperk pod 2 Olomouc pod 2 Kroměříž pod 0 Otrokovice pod 2 Uherské Hradiště pod 2 Hodonín pod 2 Lanžhot pod 2 P 12
1998 2 2 2 2 2 2 2 14
Marie Forbelská (MU – ÚMS)
1999 2 2 2 2 2 2 0 12
2000 2 2 2 2 2 2 0 12
2001 2 2 2 2 2 2 2 14
2002 2 2 2 2 2 2 2 14
2003 2 1 2 1 2 2 0 10
2004 2 2 2 3 2 2 2 15
LMM–obsah těžkých kovů v řece Moravě
2005 2 2 2 2 2 3 2 15
2006 1 1 1 1 1 1 2 8
2008 1 2 2 2 2 0 2 11
2009 2 2 2 2 2 0 2 12
2010 1 1 1 1 1 0 1 6
3.–5. 6. 2012
P 23 23 22 24 24 20 19 155
23 / 36
Jednoduchý model pro reálná data 2000
Olovo – Pb
Morava − Šumperk pod
2005
2010
2000
Morava − Olomouc pod
Morava − Kroměříž pod
2005
2010
Morava − Otrokovice pod
●
300 ●
250 200
●
150 ●
100
Pb[mg/kg]
50
●
● ●
● ● ● ● ●
● ●
● ● ●
●
● ● ● ● ● ● ● ● ●
● ● ● ●
● ●
0
Morava − Uherské Hradiště pod
●
● ● ● ● ●
● ●
● ● ● ● ● ● ● ● ● ● ● ● ●
Morava − Hodonín pod
● ● ● ●
●
● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ●
Morava − Lanžhot pod 300 250 200
●
150
● ● ● ● ● ● ● ● ● ● ● ● ●
2000
100
●
●
●
● ● ● ● ●
2005
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ●
● ● ●
● ●
● ● ●
50 0
2010
2000
2005
2010
year 2000
Morava − Šumperk pod
2005
2010
2000
Morava − Olomouc pod
Morava − Kroměříž pod
2005
2010
Morava − Otrokovice pod
●
●
●
5 ● ●
4 ● ● ● ● ●
● ●
●
● ●
●
● ●
●
●
● ● ●
● ● ● ● ● ● ●
●
3
logPb[mg/kg]
● ● ● ● ●
●
● ●
●
● ●
● ●
● ●
●
● ●
●
●
●
● ● ● ●
● ●
● ● ●
● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ●
●
● ● ●
2
Morava − Uherské Hradiště pod
Morava − Hodonín pod
Morava − Lanžhot pod
●
5 ●
● ● ●
● ● ● ● ● ●
●
● ● ●
●
●
● ● ● ●
● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ●
●
●
● ● ● ●
● ● ● ● ●
3
●
2000
2005
4
2
2010
2000
2005
2010
year
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
24 / 36
Jednoduchý model pro reálná data 2000
Rtuť – Hg
Morava − Šumperk pod
2005
2010
2000
Morava − Olomouc pod
Morava − Kroměříž pod
2005
2010
Morava − Otrokovice pod
●
2.0 1.5 1.0 ●
●
Hg[mg/kg]
0.5 0.0
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ●
● ● ●
● ●
Morava − Uherské Hradiště pod
● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ●
Morava − Hodonín pod
● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ●
Morava − Lanžhot pod 2.0 1.5 1.0
●
● ● ●
●
● ● ● ● ● ● ● ●
2000
● ● ● ● ●
2005
0.5 ● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ●
● ●
● ● ● ● ●
0.0
2010
2000
2005
2010
year 2000
Morava − Šumperk pod 1
2005
2010
2000
Morava − Olomouc pod
Morava − Kroměříž pod
0
● ●
● ● ● ● ●
●
logHg[mg/kg]
−3
2010
●
●
−1 −2
2005
Morava − Otrokovice pod
●
●
●
● ● ●
● ●
●
● ●
●
● ●
● ●
● ●
● ● ●
●
● ● ●
●
● ● ● ●
● ● ● ●
●
● ● ●
● ● ●
● ● ● ●
●
●
●
● ● ● ●
●
● ● ●
● ● ● ● ● ● ● ● ●
● ● ● ● ●
● ● ●
Morava − Uherské Hradiště pod
Morava − Hodonín pod
Morava − Lanžhot pod 1 0
●
●
●
● ● ●
● ● ●
● ● ● ● ● ●
●
● ● ●
●
● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
●
● ● ● ● ●
●
● ● ●
● ● ● ● ●
−2 −3
●
2000
2005
−1
2010
2000
2005
2010
year
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
25 / 36
Jednoduchý model pro reálná data 2000
Kadmium – Cd
Morava − Šumperk pod
2005
2010
2000
Morava − Olomouc pod
Morava − Kroměříž pod
2005
2010
Morava − Otrokovice pod
4
3
2 ● ●
●
1
Cd[mg/kg]
●
● ● ● ● ●
● ●
●
●
● ● ●
● ● ● ●
●
●
● ● ● ● ● ●
● ● ● ●
● ● ● ● ●
● ●
● ●
● ● ● ● ●
● ●
● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ●
● ●
●
● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ●
● ● ●
0
Morava − Uherské Hradiště pod ●
Morava − Hodonín pod
Morava − Lanžhot pod 4
●
3 ● ● ● ●
2
● ● ●
●
● ●
●
● ● ●
● ●
●
●
2000
● ●
2005
●
● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
●
●
●
● ●
● ● ● ● ●
1
0
2010
2000
2005
2010
year 2000
Morava − Šumperk pod
2005
2010
2000
Morava − Olomouc pod
Morava − Kroměříž pod
2005
2010
Morava − Otrokovice pod
1 0
● ●
● ● ● ●
● ● ● ● ● ●
−1
● ● ●
●
● ● ● ● ●
● ● ● ● ● ● ●
● ● ● ● ●
● ●
● ● ● ● ●
●
● ● ● ●
● ● ●
● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ●
●
● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ● ●
●
● ● ●
●
●
logCd[mg/kg]
−2 −3
Morava − Uherské Hradiště pod ●
Morava − Lanžhot pod 1
● ●
● ●
●
Morava − Hodonín pod
●
● ●
●
● ●
● ● ●
● ● ●
● ●
●
●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ●
●
●
●
● ●
● ● ● ● ●
0 −1 −2
●
2000
2005
−3
2010
2000
2005
2010
year
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
26 / 36
Jednoduchý model pro reálná data 2000
Nikl – Ni
Morava − Šumperk pod
2005
2010
2000
Morava − Olomouc pod
Morava − Kroměříž pod
2005
2010
Morava − Otrokovice pod
100 ● ●
80 ●
Ni[mg/kg]
40
●
● ●
●
● ● ● ●
● ●
● ●
Morava − Uherské Hradiště pod
●
●
●
●
●
Morava − Hodonín pod
● ● ●
●
●
●
●
● ● ●
● ● ● ●
●
●
● ●
60
● ● ●
●
80
●
●
● ●
100
●
●
● ● ● ● ●
Morava − Lanžhot pod ●
● ●
● ●
● ●
●
●
●
●
● ●
20
● ● ●
● ● ● ●
● ●
●
●
● ●
60
●
● ● ● ● ●
● ● ●
●
● ● ●
●
● ●
●
40 ●
●
●
●
20
●
2000
2005
2010
2000
2005
2010
year 2000
Morava − Šumperk pod
2005
2010
● ●
● ●
4.0
●
● ● ● ●
2005
2010
Morava − Otrokovice pod ●
● ●
● ● ●
●
● ● ● ●
●
●
●
●
●
● ●
● ●
●
● ●
● ● ●
● ●
●
●
● ●
3.0
logNi[mg/kg]
Morava − Kroměříž pod ●
4.5
3.5
2000
Morava − Olomouc pod
●
● ●
●
● ● ● ● ●
● ●
●
●
●
● ●
2.5
Morava − Uherské Hradiště pod
Morava − Hodonín pod
Morava − Lanžhot pod ●
4.5
● ●
● ● ●
●
●
●
●
● ●
● ● ● ●
●
●
●
●
● ●
● ● ● ● ●
● ● ●
●
● ● ●
●
● ●
3.5
● ●
●
●
4.0
●
3.0 ●
2.5 2000
2005
2010
2000
2005
2010
year
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
27 / 36
Jednoduchý model pro reálná data
Výpočet v prostředí R
library(nlme) t <- year - 2003 model<-lme(y~t,data,random=~1|locality, weights=varIdent(form=~1|locality), na.action = na.omit) summary(model)
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
28 / 36
Jednoduchý model pro reálná data
Olovo - Pb Linear mixed-effects model fit by REML Data: data AIC BIC logLik 193.0593 222.9636 -86.52963 Random effects: Formula: ~1 | locality (Intercept) Residual StdDev: 0.1215337 0.7152695 Variance function: Structure: Different standard deviations per stratum Formula: ~1 | locality Parameter estimates: Morava - Šumperk pod Morava - Olomouc pod 1.0000000 0.4156350 Morava - Uherské Hradiště pod Morava - Hodonín pod 0.5931589 0.6695564 Fixed effects: y ~ t Value Std.Error DF t-value p-value (Intercept) 3.582707 0.05720364 141 62.63075 0.0000 t 0.014127 0.00703942 141 2.00680 0.0467 Correlation: (Intr) t 0.018 Standardized Within-Group Residuals: Min Q1 Med Q3 -2.96290294 -0.43938097 -0.07563171 0.43379565
Morava - Kroměříž pod 0.8607895 Morava - Lanžhot pod 0.2898930
Morava - Otrokovice pod 0.3959277
Max 3.56820630
Number of Observations: 149 Number of Groups: 7
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
29 / 36
Jednoduchý model pro reálná data
Olovo - Pb −5
Morava − Šumperk pod
0
5
−5
Morava − Olomouc pod
Morava − Kroměříž pod
0
5
Morava − Otrokovice pod
6
5
4
NEK−RP
NEK−RP
NEK−RP
NEK−RP
log(Pb)
3
2
Morava − Uherské Hradiště pod
Morava − Hodonín pod
Morava − Lanžhot pod 6
5
NEK−RP
NEK−RP
NEK−RP
4
3
2 −5
0
5
−5
OLS fitted curve
Marie Forbelská (MU – ÚMS)
0
year−2003
river averaged curve
LMM–obsah těžkých kovů v řece Moravě
5
location specific curve
3.–5. 6. 2012
30 / 36
Jednoduchý model pro reálná data
Rtuť - Hg Linear mixed-effects model fit by REML Data: data AIC BIC logLik 208.6709 238.2994 -94.33546 Random effects: Formula: ~1 | locality (Intercept) Residual StdDev: 0.1997158 0.9465204 Variance function: Structure: Different standard deviations per stratum Formula: ~1 | locality Parameter estimates: Morava - Šumperk pod Morava - Olomouc pod 1.0000000 0.5659930 Morava - Uherské Hradiště pod Morava - Hodonín pod 0.4919709 0.5011731 Fixed effects: y ~ t Value Std.Error DF t-value p-value (Intercept) -1.532692 0.08478625 137 -18.077123 0.0000 t -0.000878 0.00685534 137 -0.128075 0.8983 Correlation: (Intr) t 0.004 Standardized Within-Group Residuals: Min Q1 Med Q3 -3.04813481 -0.65959081 0.07809591 0.63179852
Morava - Kroměříž pod 0.4167185 Morava - Lanžhot pod 0.1773115
Morava - Otrokovice pod 0.2944500
Max 2.77514292
Number of Observations: 145 Number of Groups: 7
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
31 / 36
Jednoduchý model pro reálná data
Rtuť - Hg −5
Morava − Šumperk pod
0
5
−5
Morava − Olomouc pod
Morava − Kroměříž pod
0
5
Morava − Otrokovice pod
3 2 1 0 −1
NEK−RP
NEK−RP
NEK−RP
NEK−RP
−2
log(Hg)
−3
Morava − Uherské Hradiště pod
Morava − Hodonín pod
Morava − Lanžhot pod 3 2 1 0
NEK−RP
NEK−RP
NEK−RP
−1 −2 −3
−5
0
5
−5
OLS fitted curve
Marie Forbelská (MU – ÚMS)
0
year−2003
river averaged curve
LMM–obsah těžkých kovů v řece Moravě
5
location specific curve
3.–5. 6. 2012
32 / 36
Jednoduchý model pro reálná data
Kadmium - Cd Linear mixed-effects model fit by REML Data: data AIC BIC logLik 199.7368 229.6412 -89.86842 Random effects: Formula: ~1 | locality (Intercept) Residual StdDev: 0.1353709 0.5714681 Variance function: Structure: Different standard deviations per stratum Formula: ~1 | locality Parameter estimates: Morava - Šumperk pod Morava - Olomouc pod 1.0000000 0.6380117 Morava - Uherské Hradiště pod Morava - Hodonín pod 1.1976323 1.1036569 Fixed effects: y ~ t Value Std.Error DF t-value p-value (Intercept) -0.3182117 0.06197359 141 -5.134635 0e+00 t -0.0246454 0.00699199 141 -3.524809 6e-04 Correlation: (Intr) t 0.01 Standardized Within-Group Residuals: Min Q1 Med Q3 -3.93709373 -0.59880135 0.07143175 0.63996725
Morava - Kroměříž pod 0.5532498 Morava - Lanžhot pod 0.3270760
Morava - Otrokovice pod 0.5530684
Max 2.11808314
Number of Observations: 149 Number of Groups: 7
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
33 / 36
Jednoduchý model pro reálná data
Kadmium - Cd −5
Morava − Šumperk pod
1
0
5
−5
Morava − Olomouc pod
NEK−RP
NEK−RP
Morava − Kroměříž pod
NEK−RP
0
5
Morava − Otrokovice pod
NEK−RP
0
−1
log(Cd)
−2
−3
Morava − Uherské Hradiště pod
NEK−RP
Morava − Hodonín pod
NEK−RP
Morava − Lanžhot pod
1
NEK−RP
0
−1
−2
−3 −5
0
5
−5
OLS fitted curve
Marie Forbelská (MU – ÚMS)
0
year−2003
river averaged curve
LMM–obsah těžkých kovů v řece Moravě
5
location specific curve
3.–5. 6. 2012
34 / 36
Jednoduchý model pro reálná data
Nikl - Ni Linear mixed-effects model fit by REML Data: data AIC BIC logLik 108.6352 134.9825 -44.31761 Random effects: Formula: ~1 | locality (Intercept) Residual StdDev: 0.003858363 0.4539426 Variance function: Structure: Different standard deviations per stratum Formula: ~1 | locality Parameter estimates: Morava - Šumperk pod Morava - Olomouc pod 1.0000000 0.7358266 Morava - Uherské Hradiště pod Morava - Hodonín pod 0.8001173 0.6859501 Fixed effects: y ~ t Value Std.Error DF t-value p-value (Intercept) 3.659876 0.03394462 97 107.81904 0 t 0.039504 0.00760393 97 5.19526 0 Correlation: (Intr) t 0.081 Standardized Within-Group Residuals: Min Q1 Med Q3 -2.79472216 -0.58620001 0.07943316 0.69946996
Morava - Kroměříž pod 0.7145150 Morava - Lanžhot pod 0.7251079
Morava - Otrokovice pod 0.7510095
Max 2.18148263
Number of Observations: 105 Number of Groups: 7
Marie Forbelská (MU – ÚMS)
LMM–obsah těžkých kovů v řece Moravě
3.–5. 6. 2012
35 / 36
Jednoduchý model pro reálná data
Nikl - Ni −5
0
5
−5
Morava − Šumperk pod
Morava − Olomouc pod
Morava − Kroměříž pod
Morava − Uherské Hradiště pod
Morava − Hodonín pod
Morava − Lanžhot pod
0
5
Morava − Otrokovice pod
5.0 4.5 4.0 3.5 3.0
log(Ni)
2.5
5.0 4.5 4.0 3.5 3.0 2.5
−5
0
5
−5
OLS fitted curve
Marie Forbelská (MU – ÚMS)
0
year−2003
river averaged curve
LMM–obsah těžkých kovů v řece Moravě
5
location specific curve
3.–5. 6. 2012
36 / 36