Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna1
1
ČHMÚ, OPZV, Na Šabatce 17, 143 06 Praha 4 - Komořany
[email protected], tel. 377 256 617
Abstrakt: Referát stručně seznamuje s nejdůležitějšími vlastnostmi časových řad výšky hladiny vody v mělkých vrtech pozorovací sítě Českého hydrometeorologického ústavu. Důraz je kladen na grafické znázornění vlastností dat. Klíčová slova: statistická analýza, časové řady, podzemní vody
1. Základní vlastnosti časových řad Výšky hladiny vody v mělkých vrtech pozorovací sítě Českého hydrometeorologického ústavu jsou měřeny v metrech nadmořské výšky nejčastěji s periodou jeden týden, postupně se zaváděním automatického měření se přechází na denní měření. Časový režim výšek hladin vody ve vrtech je užitečné rozložit na tři složky. První představuje dlouhodobé kolísání hladin, nejlépe se charakterizuje pomocí časové řady ročních průměrů nebo mediánů. Druhou představuje roční chod hladin a třetí složku tvoří velmi krátkodobé děje (vliv vydatných srážek, čerpání v blízkosti objektu, vliv blízkého toku a podobně). Na Obr.1 je příklad režimu vrtu, u kterého je prakticky zcela potlačena složka ročního chodu. Graf jeho autokorelační funkce je na Obr.3. Opačný extrém je patný na Obr.2. U tohoto objektu je složka ročního chodu velmi silně zastoupena. Potvrzuje to i graf jeho autokorelační funkce na Obr. 4. Objekt je měřen s týdenním krokem, to představuje 52 až 53 měření ročně a tomu odpovídá i lokální maximum autokorelační funkce. Většina pozorovaných objektů vykazuje režimy, které leží mezi dvěma výše popsanými extrémy.
1.1.1999
1.1.1997
1.1.1995
1.1.1993
1.1.1991
1.1.1989
1.1.1987
1.1.1985
1.1.1983
1.1.1981
1.1.1979
Objekt: VP0435
1.1.1977
1.1.1973
1.1.1971
238.0 237.0 236.0 235.0 234.0 233.0
1.1.1975
Výška [ m n.m.]
Obrázek 1 Graf výšky hladiny vody ve vrtu, ukázka objektu se zcela potlačeným ročním chodem.
Výška [ m n.m.] 242.0
Objekt: VP0635
241.5 241.0 240.5
Obrázek 2 Graf výšky hladiny vody ve vrtu, ukázka objektu s výrazným ročním chodem.
1.1.1999
1.1.1997
1.1.1995
1.1.1993
1.1.1991
1.1.1989
1.1.1987
1.1.1985
1.1.1983
1.1.1981
1.1.1979
1.1.1977
1.1.1975
1.1.1973
1.1.1971
240.0
Obrázek 3 Výstup z programu CTPA, graf autokorelační funkce dat z obrázku 1, objekt se zcela potlačeným ročním chodem
Obrázek 4 Výstup z programu CTPA, graf autokorelační funkce dat z obrázku 2, objekt s výrazným ročním chodem
2. Roční chod
Výška [m n.m.]
Roční chod je možné názorně zobrazit například pomocí rozptylového diagramu měsíčních průměrů výšek hladin vody ve vrtu. Na Obr. 5 je ukázka takového diagramu pro vrt, jehož časový režim je zobrazen na Obr. 2 a to pro stejné časové období 1971-2000. U naprosté většiny měřených objektů se během roku podstatně mění nejen střední hodnota, ale i rozptyl a šikmost dat. Například pro vrt VP0635 je podle Tab. 1 v březnu průměrná hodnota výšky 241,4m n.m., směrodatná odchylka 0,21m a šikmost -0,51. V září je průměr 240,8m n.m., směrodatná odchylka 0,24m a šikmost -0,74. Rozdíl průměrů března a září je tedy téměř třikrát větší, než je březnová směrodatná odchylka a březnový průměr je dokonce větší, než je největší zářijová, říjnová nebo listopadová hodnota. Tuto skutečnost je třeba respektovat při výpočtu takových charakteristik jako jsou kvantily, pravděpodobnosti překročení nebo křivky překročení. Vždy je třeba je vztahovat k určitému ročnímu období. Znalost charakteristik ročního chodu pro daný měřený objekt je důležitá pro krátkodobé předpovědi výšky hladin v daném roce. Pomocí znalosti jarního maxima je možné odhadnout vývoj v následujících několika měsících za předpokladu, že ve vegetační části roku nedojde k vydatným srážkám, povodni apod. Jednotlivé mělké vrty se od sebe liší podle toho, ve kterém měsíci u nich obvykle dosahuje hladina vody maxima nebo minima. Na Obr. 6 je mapa kalendářních měsíců s nejmenším dlouhodobým průměrem výšek hladin vody ve vrtu a na Obr. 7 pak s největším průměrem. Objekt: VP0635
242 241.8 241.6 241.4 241.2 241 240.8 240.6 240.4 240.2 240 1
2
3
4
5
6 7 Měsíce
8
9
10
11
12
Obrázek 5 Znázornění ročního chodu,rozptylový diagram měsíčních průměrů výšek hladin vody ve vrtuVP0635 pro období 1971-2000 .
Měsíc
Průměr
Medián
[--] 1 2 3 4 5 6 7 8 9 10 11 12
[m n.m.] 241.28 241.37 241.42 241.34 241.19 241.05 240.98 240.90 240.83 240.84 240.94 241.11
[m n.m.] 241.32 241.37 241.46 241.38 241.21 241.04 240.97 240.86 240.85 240.84 240.90 241.17
Směrodatná odchylka [m] 0.30 0.24 0.21 0.21 0.19 0.21 0.25 0.25 0.24 0.27 0.34 0.36
Koeficient šikmosti [---] -1.16 -0.75 -0.51 -0.52 -0.40 0.14 -0.30 -0.19 -0.74 -0.35 0.19 -0.38
Tabulka 1 Měsíční průměry, mediány, směrodatné odchylky a koeficienty šikmosti výšek hladin vody ve vrtu VP0365 pro období 1971-2000
Obrázek 6 Mapa kalendářních měsíců s nejmenším dlouhodobým průměrem výšek hladin vody ve vrtu pro období 1971-2000
Obrázek 7 Mapa kalendářních měsíců s největším dlouhodobým průměrem výšek hladin vody ve vrtu pro období 1971-2000
3. Střednědobé trendy v datech Pro celkem 345 mělkých vrtů víceméně rovnoměrně rozložených na území Čech (odpovídá přibližně povodí Labe i s přítoky) byly vypočítány průměrné roční výšky hladin vody. Dále byla data průměrů roků pro každý objekt zvlášť normalizována odečtením celkového průměru řady a vydělena směrodatnou odchylkou. Byla tak pro každý vrt získána poměrná veličina vyjadřující odchylku od průměru vyjádřenou v násobku směrodatné odchylky. Pro takto normalizovaná data byl pro každý rok vypočítán průměr pro celou oblast Čech a zanesen do časového grafu na Obr.8. Na jeho základě si lze udělat alespoň přibližnou představu o typickém časovém průběhu ročních průměrů hladin vrtů v oblasti Čech. Pomocí podrobnější analýzy lze vysledovat především tyto skutečnosti: Data jsou závislá. Mezi po sobě následujícími roky existuje silná autokorelace, jak je patrné z autokorelační funkce na Obr. 10 i z výsledku testu na Obr. 11. V důsledku toho jsou v grafech patrné „vlny“ (pseudoperiody). Během třicetiletí 1971-2000 lze vysledovat celkem tři výraznější pseudoperiody. Nadprůměrné výšky hladin byly naměřeny v létech 1975-1982, 1986-1988 a 1996-1997. S postupující dobou se podprůměrná období prodlužují na úkor nadprůměrných. Celkový trend je tedy spíše klesající (pro velkou závislost v datech a krátké období měření to ale lze těžko dokázat pomocí běžných statistických testů, určitým pokusem o to je výsledek testu na Obr. 12, kde pořadový koeficient korelace vychází záporný a lze tedy předpokládat klesající trend v datech). Stejným způsobem byl sestrojen i graf pro oblast povodí Moravy na Obr. 9 a také pro 16 dalších menších oblastí.
Relativní odchylka od průměru 2
Oblast: Čechy
1.5 1 0.5 0 -0.5 -1 -1.5 1970
1975
1980
1985 Roky
1990
1995
2000
Obrázek 8 Graf relativních odchylek ročních průměrů výšek hladin vody ve vrtech.Průměr pro oblast Čechy .
Relativní odchylka od průměru 2
Oblast: Morava
1.5 1 0.5 0 -0.5 -1 -1.5 -2 1970
1975
1980
1985 Roky
1990
1995
2000
Obrázek 9 Graf relativních odchylek ročních průměrů výšek hladin vody ve vrtech.Průměr pro oblast Morava
Obrázek 10 Výstup z programu CTPA, Graf autokorelační funkce dat z obrázku 8 (oblast Čechy)
Testy náhodnosti, počet iterací Soubor : CECHY.txt Proměnná: -
Stanice: Počet dat: n = 30 Období : 1971 - 2000
K odhalení změny spíše periodického charakteru Kritické hodnoty: 10 - 21 na hladině významnosti 0.050 pro n1 <= 20 a n2 <= 20 Výsledky: počet iterací = 8 n1 = 15 n2 = 15 Hypotéza H0 : uspořádání řady je náhodné Alternativa H1 : uspořádání řady není náhodné Interpretace výsledků: Hypotézu H0 vzhledem k H1 zamítáme
Obrázek 11 Výstup z programu CTPA, iterační test náhodnosti dat z obrázku 8 (oblast Čechy)
Testy náhodnosti, Kendallův koeficient pořadové korelace Soubor : CECHY.txt Proměnná: -
Stanice: Počet dat: n = 30 Období : 1971 - 2000
Zaměřen na posuzení existence systematického posunu Kritická hodnota = 1.960 na hladině významnosti 0.050 Výsledky: Kendallův koeficient = -0.283 hodnota testové statistiky = 2.194 Hypotéza H0: uspořádání řady je náhodné Alternativa H1: uspořádání řady není náhodné Interpretace výsledků: Hypotézu H0 zamítáme
Obrázek 12 Výstup z programu CTPA, test náhodnosti-Kendalův koeficient pořadové korelace data z obrázku 8 (oblast Čechy)
Seznam použitého programového vybavení: Procházka, M., Deyl, M. (2000): Program CTPA ArcView GIS 3.2, ESRI 2000 Kupka. K. (2004): QC.Expert V2.7, TriloByte Pardubice