Magyarország-Románia Határon Átnyúló Együttműködési Programból 2007 – 2013 támogatott projekt (Projekt regisztrációs szám: HURO/0801/047)
„Kutatási program a Körös medence Bihar-Bihor területén, a határon átnyúló felszín alatti víztest hidrogeológiai viszonyainak, állapotának megismerésére (HURO)”
Dinamikus faktoranalízis és klaszteranalízis
2010. december
Jelentés
Szerződés száma:
8608/26.07.2010
Projekt címe:
„Kutatási program a Körös medence Bihar-Bihor területén, a határon átnyúló felszín alatti víztest hidrogeológiai viszonyainak, állapotának megismerésére (HURO)” Magyarország-Románia Határon Átnyúló Együttműködési Programból 2007 – 2013 támogatott projekt
Munkafázis
Dinamikus faktoranalízis és klaszteranalízis
Teljesítés:
2010. december
Megbízó:
Consiliul Judeţean Bihor
Megbízott:
KSZI-Geogold Carpatin
Törvényes képviselő:
Kissné Jáger Erika
Projektvezető:
Ambrus Magdolna
Készítette:
Geogold Carpatin Srl. Dr. Kovács József
1. Tartalomjegyzék
1.
TARTALOMJEGYZÉK
1
2.
A FELHASZNÁLT MATEMATIKAI MÓDSZEREKRŐL
2
2.1. 2.2. 2.3. 2.4. 2.5.
KLASZTERANALÍZIS (DÉVÉNYI D. - GULYÁS O, 1988 ALAPJÁN) DISZKRIMINANCIA ANALÍZIS 5 WILKS’ Λ STATISZTIKA 5 BOX-AND-WHISKERS PLOT 6 DINAMIKUS FAKTORANALÍZIS (KOVÁCS J., 2007 ALAPJÁN) 6
3
3. FORRÁSOK PARAMÉTEREINEK ADATELEMZŐ MÓDSZEREKKEL 9 3.1. 3.2. 3.3.
VIZSGÁLATA
CSOPORTOSÍTÁS A SZERVETLEN PARAMÉTEREKRE CSOPORTOSÍTÁS A SZERVES PARAMÉTEREKRE ÖSSZEFOGLALÁS 21
10 17
4. VÍZTERMELŐ KUTAK PARAMÉTEREINEK TÖBBVÁLTOZÓS ADATELEMZŐ MÓDSZEREKKEL 23 4.1.
CSOPORTOSÍTÁS AZ ÖSSZES MÉRT PARAMÉTERRE
5. DINAMIKUS FAKTOR ANALÍZIS TALAJVÍZSZINT KÚTJAIRA 34 5.1. 5.2.
A FELHASZNÁLT ADATOK 34 EREDMÉNYEK ÉS ÉRTÉKELÉSÜK – A VIZSGÁLT TERÜLETEN 35 5.3. FAKTORSÚLYOK VIZSGÁLATA 38 5.4. ÖSSZEFOGLALÁS 41 6.
FELHASZNÁLT IRODALOM
TÖBBVÁLTOZÓS
VIZSGÁLATA
23
ALKALMAZÁSA
BIHAR
MEGYE
DINAMIKUS FAKTORANALÍZIS ALKALMAZÁSA A
43
1
2. A felhasznált matematikai módszerekről A földtudományokban rendelkezésre álló és vizsgált adathalmazt egy négydimenziós térben (1. ábra) lehet elképzelni, ahol a tengelyeket az idő, a kémiai, vizsgált komponensek és a megfigyelési pontok adják. Utóbbit egy ’x’ és egy ’y’ koordináta, vagyis két dimenzió határoz meg, így bővül ki a három dimenzió az absztrakt négy dimenziós térre.(Kovács, 2007; Kovács et al, 2008). Annak függvényében, hogy melyik tengelyt metszük el egy arra merőleges síkkal, más-más vizsgálati módszert kell alkalmazni. A tengelyeket metsző síkokat nevezzük el S1, S2 és S3 síknak. S1 síkban (ilyen adatok voltak a vízkémiai paraméterek) többváltozós adatelemző módszerek alkalmazására van lehetőség. A mintavételi pontok hasonlóságát klaszteranalízissel vizsgáltuk, a csoportok létezésének ellenőrzésére diszkriminancia analízist is alkalmaztunk. S2 sík esetén az adott paraméter idősorát kaptuk meg mintavételi helyenként. Itt nyilvánvalóan idősoros vizsgálatok elvégzésére van lehetőség, ezek közül említhetőek a trend, periódus és zaj elemzésére vonatkozó módszerek. Ezek a „klasszikus” módszerek azonban céljainknak nem feleltek meg, ezért ebben az esetben egy célorientált és modern eszközt, a dinamikus faktoranalízist alkalmaztuk. Végül S3 síkban egy kiválasztott mintavételi helyen a paraméterek idősorai elemezhetők idősoros vizsgálatokkal. Ilyen irányú vizsgálatokra a kutatás céljainak megvalósításában, nem volt szükség. Kémiai komponensek z CO 32-
NO 3Cl-
S2
Na + Mg 2+ Ca 2+
t4
t3
t2
t1
S3 mf1 mf3 mf2 (x1, y1) (x2, y2) (x3, y3)
mfn (xn, yn)
Megfigyelési pontok
S1 tn Idő t
1. ábra. Adathalmaz ábrázolása négy dimenzióban (Kovács, 2007)
2
2.1. Klaszteranalízis (Dévényi D. - Gulyás O, 1988 alapján) A térben lévő mintavételi pontok hasonlóságának meghatározására a klaszteranalízis alkalmazható ahol minden paramétert azonos súlytényezővel vettünk figyelembe. A klaszteranalízis eredményét dendrogramokon kaptuk meg, és térképen ábrázoltuk (2. ábra), ahol az azonos csoporthoz tartozó mintavételi pontokat azonos geometriai alakzattal jelöltük. A klaszteranalízis talajvízszintekre történő alkalmazását Yakowitz mutatta be először 1976-ban a Vízgazdálkodási Intézet és az Arizonai Egyetem közös kutatási programja keretében. Hazánkban felszínalatti vizek vízszint- (Kovács, 2007), vízkémiai- (Kovács et al., 1997, 1998) és felszíni vizek paramétereinek idősoraira (Kovács, 2005; Kovács et al., 2008) használták nagy hatékonysággal. A klaszterezés felfogható egy kódolási műveletként, amely során a sok jellemzővel leírt bonyolult objektum egy számmal, csoportjának kódjával (klaszterének számával) jellemezhető. Ez a kód a csoportba tartozó objektumok általános és közös tulajdonságait tükrözi, azaz az egy csoportba tartozók hasonlóak. Ezeket a csoportokat klasztereknek nevezzük. A továbbiakban az objektumok összességét X-szel, az egyes osztályozandó objektumokat Xi-vel jelöljük, azaz X= {X1,X 2,. .. ,Xn }, ahol n az objektumok száma. Feltételezzük, hogy az egyes objektumok N-dimenziós vektorok, XiЄRN, Xi= {Xi1,Xi2, .. . ,Xin }, vagyis az objektumokat tulajdonságaik, jellegük valamilyen számszerűsíthető értékeinek sorozatával definiáljuk. Xi gyakran egy valószínűségi vektorváltozó mintájának i-edik eleme (vagy annak is felfogható). Azoknak az osztályoknak a számát, amelyekbe az {Xi} objektumokat csoportosítani kívánjuk, M-mel jelöljük. Mindegyik Ci klaszter az objektumnak egy részhalmazát tartalmazza:
Ci = {Xi1, Xi 2,..., Xi | Ci |}. Itt és a továbbiakban |Ci| jelöli az i-edik klaszterben lévő objektumok számát. Azt, hogy egy Xj objektum i-edik klaszterbe tartozik, XjЄCi-vel jelöljük. Az osztályok (klaszterek) az X-be tartozó valamennyi objektumot tartalmazzák, azaz valamely objektum egy és csakis egy klaszterbe tartozhat. Vagyis {C1, C2, ..., CM} klaszterek rendszere az X objektumösszesség egy felbontása; M
X = U Ci
és
Ci ∩ Cj = 0, ha i ≠ j.
i =1
Rögtön észrevehető, hogy egy X objektumrendszerhez általában számtalan klasztercsoportot lehet rendelni. A hasonló objektumok egy klaszterbe tartoznak, a különböző tulajdonságúak pedig nem tartoznak ugyanabba a klaszterbe. A hasonlóság mérésére a metrikát alkalmazzuk. A metrika (távolság) két objektumhoz (N-dimenziós vektorhoz) egy nemnegatív számot rendel, azaz : : RN × RN → R+ úgy, hogy (x, y) szimmetrikus, nemnegatív függvény, és igaz rá a háromszögegyenlőtlenség. Ha kicsi, akkor azt mondjuk, hogy a két objektum hasonló, amennyiben zérus, akkor azonos is. Ha nagy, akkor a tulajdonságaik eltérésére mutat, és az objektumok nem hasonlók. Munkánk során a klaszterezés módszerei közül az úgynevezett hierarchikus osztályozást alkalmaztuk, ami kezdetben minden elemet külön osztálynak tekint, majd az osztályok összevonásával lépésről lépésre újabb osztályozási szinteket alakít ki mindaddig, amíg az összes elem egyetlen osztályba nem kerül.
3
Az osztályozási algoritmus eredménye olyan fa-struktúrával jelenik meg, ahol a fa csomópontjaihoz h Є [0, max d(A, B)] értékek tartoznak. Az elmondottakat egy egyszerű példán keresztül mutatjuk be, ahol az egész számok objektumokat reprezentálnak. Az S-nek egy adott partíciója a fa-struktúra egy h szintjéhez tartozik, a sorozat első eleme az izolált pontok halmaza, az utolsó pedig az összes objektumból álló halmaz. Az ilyen típusú fa-struktúrát dendrogramnak nevezzük (2. ábra).
h4 h3 h2 h1 h0 1
2
4
7
8
2. ábra: dendrogram A különböző klasszifikáló módszerek minden esetben valamilyen osztályozást létesítenek az objektumok összességében. A kapott osztályozást többféle szempont szerint minősíthetjük. 1. Ahhoz, hogy két osztályozás összehasonlítható legyen, szükséges (de nem elégséges) feltétel, hogy az osztályok megfeleltethetők legyenek egymásnak, abban az értelemben, hogy a megfelelő osztályokba ugyanannyi objektum tartozzon. 2. A klasszifikációs módszerektől megköveteljük, hogy az eredmény független legyen a kiinduló osztályozástól. Egy további gyakori követelmény, hogy a módszer a lineáris transzformációkkal szemben invariáns legyen, azaz ha az x1, ..., xn pontok helyett az ax1+b, ..., axn+b pontokra alkalmazzuk az eljárást, az eredmény ne változzon. A hierarchikus csoportosító módszerek közül Ward csoportosító eljárását alkalmaztam, aki abból az információveszteségből indult ki, amely a megfigyelések csoportokba történő összevonásából ered. Ezt az információveszteséget úgy definiálta, mint a megfigyelések csoportátlagoktól való eltérési négyzetének összegét. Jelöljük T-vel a teljes mintaeltérés négyzetösszegét. Ekkor érvényes a következő felbontás: T=B+K g
ni
∑∑ ( x i =1 j =1
g
ij
ni
g
− x ) = ∑∑ ( xij − xi ) + ∑ ni ( x i − x ) 2 , , ahol 2
i =1 j =1
2
i −1
B a csoporton belüli eltérések négyzetösszege, K a csoportok közötti eltérések négyzetösszege, g a csoportok száma, ni az i-edik csoport elemszáma, xij az i-edik csoportba tartozó j-edik megfigyelés, xi az i-edik csoport átlaga, x a teljes minta átlaga. 4
Adott mintánál a T egyértelműen meghatározott. A B és K a csoportosítástól függően változik. A cél olyan csoportosítás létrehozása, ahol B minimális. Az algoritmus a következő lépésekre bontható: - n számú csoporttal kezdjük, akkor minden csoport egyelemű, így B = 0; - azt a két csoportot vonjuk össze, amely esetén B minimálisan növekszik; - a második lépést mindaddig folytatjuk, amíg egyetlen csoportot nem kapunk. A Ward-technika fogyatékossága, hogy nem adja minden esetben a B minimális értékét. Így előfordulhat, hogy a háromcsoportos felbontás minimális értéket adó változata a következő lépésben, két csoport esetén lesz optimális. 2.2. Diszkriminancia analízis A klaszteranalízis által meghatározott csoportok létezéséről meg kell győződni. Hipotézisvizsgálatként diszkriminancia analízist használtunk. Ezzel tudtuk ellenőrizni, hogy a mintavételi pontok csoportba tartozása valós-e, és ha igen, ez hány százalékban valósítható meg az adott független változókkal. E független változó metrikus-, míg a függő (csoportosító változó) nem metrikus, hanem általában kategorizált skálán mért. A csoportosító változó elnevezés onnan ered, hogy ez a változó lesz a csoportosítás alapja. A diszkriminancia analízis matematikailag arra keresi a választ, hogy a létrehozott csoportok mely változók alapján különböznek, azaz a csoportokba való tartozás előre jelezhető-e a független változók egy kiválasztott csoportja alapján. A regresszió elemzés egyenlete sokban hasonlít a diszkriminancia analíziséhez, de míg az első esetben a függő változóra adunk becslést, addig a második esetben arra, hogy az adott megfigyelés a csoporthoz tartozik-e, vagy sem. A klaszteranalízis (melynek ellenőrzésére a diszkriminanciaanalízist alkalmaztuk) és a diszkriminanciaelemzés közös vonása, hogy mindkét esetben csoportokat alakítunk ki, csak míg az első esetében ezek a csoportok előre nem adottak, addig a második esetben a csoportok előre adottak és a vizsgálat célja, hogy meghatározzuk a független változók azon lineáris kombinációját, ami a „legjobban” elkülöníti a csoportokat. 2.3. Wilks’ λ statisztika A felszín alatt zajló folyamatok jellegéből következik, hogy vannak olyan paraméterek, amelyek nagyobb-, és vannak, amelyek kisebb mértékben befolyásolják a hidrogeológiai folyamatokat, a kőzet víz kölcsönhatást stb., fontos információ annak ismerete, hogy mely paraméterek hogyan határozták meg a mintavételi pontok csoportba tartozását. Erre a alkalmas módszer a Wilks’ λ statisztika becslése. Ezt a statisztikát a csoportátlagok azonosságának tesztelésére alkalmazzák. A λ számított értéke a csoportokon belüli és a teljes eltérések négyzetösszegeinek hányadosa:
∑∑ (x Wilks’ λ = ∑∑ (x i
i
ij
− xi )
ij
− x)
2
j
2
j
Ha a kapott λ érték egyenlő 1-el (λ=1) akkor a csoportok átlagai nem különböznek, tehát a vizsgált paraméter nem befolyásolta a csoportok alakulását. Ha a kapott λ érték egyenlő 0-val (λ=0) akkor a paraméter maximálisan befolyásolta a csoportok alakulását. Összegezve, a vizsgált paraméter λ értéke minél inkább egyhez közeli az annál kevésbé befolyásolja a csoportok alakulását.
5
2.4. Box-and-whiskers plot A klaszteranalízissel meghatározott csoportok statisztikáit – mint fontos információkat úgynevezett box-and-whiskers plot-okon mutatjuk be. Ezek a diagramok az adatok statisztikai megjelenítésének egyik eszközei. Segítségükkel valószínűségi változók több paraméterét ábrázolhatjuk egy ábrán, ezzel megkönnyítve az értelmezést (3. ábra).
3. ábra: Box-and-whiskers plot A box-ok (dobozok) felső és alsó határa között az interkvartilis terjedelem található (felső és alsó kvartilis különbsége). A doboz felső határa a felső, alsó határa pedig az alsó kvartilist jelöli. A fekete vízszintes vonal a dobozon belül a medián1. A doboz tetejéből és aljából kiálló függőleges vonal végpontjai a 1,5-szeres interkvartilis terjedelmet adják meg. Ha a kapott érték a 1,5-3-szoros interkvartilis terjedelmen belül van, akkor kiugró értéknek tekintjük (jele: ° ), míg ha a 3-szoros interkvartilis terjedelmen is kívül esik, akkor extrém értéknek vesszük (Sajtos és Mitev 2007). A dinamikus faktor analízis eredményeinek azonosításakor felhasználjuk a korrelációszámítást, aminek célja a valószínűségi változók lineáris kapcsolatának, kapcsolatuk intenzitásának és irányának mérése. A korrelációs együttható a sztochasztikus kapcsolatok szorosságának mérésére szolgáló dimenzió nélküli mérőszám, értéke -1 és 1 között változhat. A korreláció alatt az egyszerű korrelációs együttható két vizsgált változó kovarianciájának2 a két változó szórásával normált értékét értjük (jele: r). Ha r = 1, a két paraméter pozitív, lineáris, függvénykapcsolat van, ha r = -1, negatív, míg ha r = 0 nincs lineáris kapcsolat közöttük, így a két paraméter korrelálatlan. 2.5. Dinamikus faktoranalízis (Kovács J., 2007 alapján) A vizsgált területen a sekély felszínalatti víz természetes vízszintingadozásait, nagy területre változások érték. Ennek okai lehetnek természetesek (csapadék idő és térbeli eloszlásának változásai) illetve mesterségesek (vízkitermelés). Ezek hatása érezhető. A meglévő 1
A medián az az érték, amely „alatt” illetve „felett” helyezkedik el a mért értékek 50%-a. A kvartilisek ugyanezt jelentik azzal a különbséggel, hogy a 25%-os alsó kvartilis jelenti azt az értéket, ami „alatt” illetve „felett” helyezkedik el a mért értékek 25, illetve 75%-a. A felsõ kvartilis esetén pedig ez „alatt” illetve „felett” helyezkedik el a mért értékek 75, illetve 25%-a. 2 Két különböző változó együttmozgását adja meg, de értéke lehet (attól függően, hogy eloszlású valószínűségi változókról van szó) tetszőleges valós szám. Tehát, a sztochasztikus kapcsolat szorosságára nehéz lenne követeztetni. Célszerűbb egy olyan együtthatót választani, ami meghatározott kereteken belül mozoghat.(=korrelációs együttható) (Reimann- V. Nagy 1984)
6
determinisztikus modellek mellett, az idősoros vizsgálati módszerek lehetőséget adnak a hatótényezők sztochasztikus értelmezésére is. Nem nyilvánvaló, miként lehet meghatározni egy adott megfigyelési ponton például a vízkiemelés hatását, különösen, ha figyelembe vesszük a csapadékból származó utánpótlódás véletlen jellegét. A vízszintingadozások alapjául szolgáló rejtett háttérhatások meghatározásának hagyományos eljárása a faktoranalízis. Mivel ez független megfigyelésekre kidolgozott módszer - ami viszont a vízszint idősorok esetében nem áll fenn, hiszen azok dinamikus szerkezetét figyelembe kell venni – faktoranalízis helyett a dinamikus faktoranalízist kell alkalmazni. E megfontolások alapján kialakítható volt egy valószínűségelméleten nyugvó matematikai modell. Az egyes megfigyelő kutak által biztosított adatok időfüggő véletlen mennyiségek megfigyeléseinek, méréseinek tekinthetők, s így az egyes kutak hidrográfjai felfoghatóak sztochasztikus folyamatok realizációiként. Az egyes megfigyelési pontokhoz (kutakhoz) tartozó folyamatok azonban nem önmagukban álló, egymástól független jelenségek, hanem egy és ugyanazon természeti jelenség különböző lokális körülmények közötti megnyilvánulásai. Ezért természetes ezeket a folyamatokat összefogva egyetlen többdimenziós folyamat komponenseiként szemlélni, mely komponensek természetesen valószínűségelméletileg összefüggőek. Hangsúlyozni kell azonban, hogy ez az összefüggés térbeli szerkezethez kötött, és ekkor az adatok egyetlen egydimenziós, de téridő-függő sztochasztikus folyamat megfigyeléseként interpretálhatóak, azonban jelen munkánkban nem ezt a megközelítést tartjuk célravezetőnek. A térbeli függésről azt feltételezzük, hogy a különböző helyeken megfigyelt folyamatok ugyanazon néhány látens hatás – például párolgás, beszivárgás, vízkiemelés - befolyása alatt állnak, és csupán e hatások intenzitása függ a helytől. Így először ezen hatások identifikálása, majd pedig intenzitásuk térbeli eloszlásának becslése a célunk. A következőkben az általunk használt dinamikus faktor-modell rövid leírására kerül sor. Egy szokásos faktor-modell egyenlőség: Y = A⋅F +ε
(1)
azt fejezi ki, hogy az Y megfigyelés úgy áll elő, mint néhány látens hatásnak (a faktorok F vektora) az A mátrix által meghatározott lineáris kombinációjához adódott véletlen zaj (ε) eredője. A megfigyelhető idősorok száma általában jelentősen nagyobb, mint a faktorok száma, így a faktormodell alkalmazása egyfajta dimenzió redukciót jelent. A dinamikus faktormodellek esetén figyelembe vett döntő különbség az, hogy mind a megfigyelések, mind a faktorok empirikus idősorok, s nem az általános modelleknél feltett független megfigyelések. A modell leírásának teljessé tételéhez a faktorok dinamikus szerkezetét pontosabban meg kell adni. Mindenek előtt az A-mátrix révén adott lineáris transzformációnak időtől függetlennek kell lennie. A megfigyelések időfüggőségét hangsúlyozandó, t függvényeként írjuk őket: Y(t) = (Y1(t),…,YN(t))′ , 0 ≤ t ≤ T . és ezen N-dimenziós idősor gyenge stacionaritását is feltételezzük – eltekintve egy lehetséges lineáris trendtől. Ezzel a rendszert - trendtől eltekintve – stabilnak, azonos valószínűségi törvényszerűséget követőnek tételezzük fel az időben. Így (1) új formája az alábbi: Y (t ) = A ⋅ F (t ) + ε (t ) . (2) melyben az A-mátrix N×M tagú és determinisztikus. A faktor idősor F(t) ennek megfelelően M dimenziós - M<
0 ≤ t ≤ T,
7
Végezetül az egyenletben szereplő
′ ε (t ) = (ε 1 (t ),..., ε N (t )) , 0 ≤ t ≤ T . egy N dimenziós Gauss fehér zaj. Jegyezzük meg itt, hogy ha a faktor is Gauss folyamat, akkor a modell linearitása miatt a megfigyelések is Gauss-folyamatok lesznek, és a gyenge stacionaritásból az erős is következik. Az F(t) faktorok bizonyos értelemben véve optimális becslésének megtalálására törekszünk:
(
)
′ Fˆ (t ) = Fˆ1 (t ),..., FˆM (t ) Modellünk becslésének a következő három, természetes követelményre kell összpontosítania: (i) A faktorok becslésének a megfigyelések idő-független homogén, lineáris transzformációinak kell lenniük. Fˆ (t ) = B ⋅ Y (t ) (3) (ii) Az Fj(t) faktor idősor-komponenseknek múltbeli viselkedésük alapján lineárisan jól előrejelezhetőknek kell lenniük. E követelmény biztosan teljesül, ha azokat Lj rendű autregressziós folyamatoknak tekintjük, egy konstanst is megengedve az autoregresszióban, a lineáris trend leírására: Lj
F j (t ) = c j , 0 + ∑ c j ,k ⋅ F j (t − k ) + δ j (t )
(4)
k =1
Ebben az egyenletben a δ j (t)-k Gauss fehér zajok, függetlenek egymástól és ε(t )-től. Az autoregresszió választását nem csak egyszerű dinamikus szerkezete indokolja, hanem az a tény is, hogy a megfigyelőkutak hidrográfjai egyébként megbízhatóan modellezhetők autoregresszív folyamatokkal. (iii) A faktorok időfüggetlen lineáris transzformációja Yˆ (t ) = D ⋅ Fˆ (t ) (5) az Y(t) megfigyelések „jó” becsléseit kell eredményezze – ezeket faktor-prediktoroknak nevezzük. A modell-becslés folymatában feltesszük, hogy a látens faktorok előírt szerkezete ~ átörökítődik becsléseikre is, és ennek megfelelően Fˆ j (t) legjobb empirikus előrejelzése, F j (t ) az alábbiak szerint kapható meg: L
j ~ F j (t ) = c j , 0 + ∑ c j ,k ⋅ Fˆ j (t − k )
(6)
k =1
Másként szólva, ez épp a becsült faktorok behelyettesítése az autoregresszió legjobb előrejelzésébe. A valós értékek természetesen nem ismertek, így a cj,k együtthatókat becsülni kell. Ennek következményeképp a behelyettesítésre nem garantálható a (6) által adott előrejelzés optimalitása, mert ez egy autoregresszív folyamatra csak ismert együtthatók esetén teljesül. ~ Ennek tudatában fogjuk a (6) kifejezést használni a becsült faktorok F (t ) időbeli előrejelzésére. Így a faktorok megfigyelésekből becsült értékének és előrejelzésének különbsége kiszámítható minden t időpillanatra, 0 ≤ t ≤ T, és ezt centrálva a (4) autoregressziós folyamatot generáló zaj becslését kaphatjuk meg: ~ ~ δˆ j (t ) = F j (t ) − Fˆ j (t ) − F j − Fˆ j
[
]
8
(Bármely X(t) esetén X
jelöli az időátlagot: X =
1 T ∑ X (t ) .) A δj(t)-k idő szerinti T + 1 t =0
négyzetösszegét nevezzük az ℰ(d) becsült dinamikus hibának: M
T
2 ℰ(d) = ∑ ∑ δˆ j (t ) j =1 t = L j
Hasonlóan, az (5) kifejezésben meghatározott faktor prediktor értéke teszi lehetővé, hogy a (2) kifejezés zajának, ε(t)-nek becslését előállítsuk, mint a ténylegesen megfigyelt értékek és a faktor-prediktorok centrált (0 várható értékű) különbségét: εˆi (t ) = Yi (t ) − Yˆi (t ) − Yi − Yˆi ,
[
]
melynek idő szerinti négyzetösszege ℰ(s) a becsült statikus hiba: N
T
ℰ(s) = ∑∑ εˆi (t ) . 2
i =1 t = 0
Amennyiben egyik vagy másik megfigyelés jelentősége hagsúlyozottabb, vagy egyik vagy másik előrejelzés pontossága fontos szempont, úgy e cél eléréséhez mind a dinamikus, mind a statikus hiba definíciójába súlyokat éptíthetünk be. Mivel ezzel a lehetőséggel a továbbiakban nem kívánunk élni, ezért ennek formális leírásától e helyen eltekintünk. Az előírt (i)-(iii) követelményeket teljesítendő, a modell becslését akkor tekintjük „jó”nak, ha a becsült statikus és dinamikus hibák összege minimális. Ez a következő függvény minimalizálását jelenti: N
T
M
T
2 2 ℰ(s)+ℰ(d) = Ψ (T ) = ∑∑ εˆi (t ) + ∑∑ δˆ j (t ) i =1 t = 0
(7)
j =1 t = 0
az alábbi, a faktorok korrelálatlanságára tett feltételezésből származó megszorítás mellett: var Fˆ = I M (8)
()
3. Források paramétereinek vizsgálata többváltozós adatelemző módszerekkel A vizsgált területen (Béli-hegység, Királyerdő, Réz-hegység, Tasádi-dombság) 133 forrásból vett vízmintáknak számos kémiai és fizikai paramétereire történt helyszíni és laboratóriumi vizsgálat. Ezek többsége szervetlen paraméterekhez kapcsolódik, de voltak olyanok melyek valamilyen módon szerves anyagokhoz kapcsolódnak illetve kapcsolhatók. 9
Ennek megfelelően, vizsgálataink alapvetően kétféleképpen végezhetők el. Az egyik - a szervetlen környezetre utaló - paraméterekre (pH, vas, mangán, nátrium, kálium, magnézium, klorid, hidrokarbonát, szulfát), míg a másik a szerves környezetre utaló paraméterkörrel (ammónium, nitrit, nitrát, KOI). Fontos megjegyeznünk, hogy számos olyan paraméter volt, amelyek mért értékei kimutatási határ alatt voltak. Ezeket a csoportosítás során a kimutatási határérték felével vettük figyelembe. Mielőtt adatelemző módszerekkel csoportosítást végeznénk, meg kell néznünk, hogy a négy különböző területről vett minták a terület függvényében milyen mértékben alkotnak csoportokat, hiszen a mintázott területek különböző földtani helyzetben vannak, így lehetséges, hogy a kémiai paraméterek alapján mintáink elkülönülnek annyira, hogy ez a területi elkülönültség elegendő további vizsgálatok céljaira. A választ diszkriminancia analízis alkalmazásával kaptuk meg, miszerint, ha a csoportosító változónak azt a területet jelöljük meg, ami a minta származási helye, akkor a csoportosítás csak 81,2%-ban helyes. Más szavakkal a minták egy ötöd része olyan „helyzetben van”, hogy térbeli elhelyezkedésének viszonyai nem határozzák meg egyértelműen kémiai paraméterei alakulását. Ebből az eredményből következik, hogy a mintavételi pontokat matematikai eszközökkel csoportosítsuk, határozzuk meg az egyes csoportok jellemző tulajdonságait és térbeli elhelyezkedését. 3.1. Csoportosítás a szervetlen paraméterekre A csoportosítást klaszteranalízissel végeztük, helyességét diszkriminancia analízissel javítottuk és ellenőriztük. A számítások végeredményeként, a források 100%-át sikerült matematikai értelemben helyesen csoportba sorolni, amellett, hogy a keresztellenőrzés 90,9%volt. Ez azt jelenti, hogy adatelemzési szempontból lehet néhány olyan mintavételezési pont, aminek elhelyezkedése nem a megfelelő csoportban van. Kilenc csoport elkülönítésére került sor. A 9-es számú csoport, ami egyetlen mintavételi pontot tartalmazott, a klaszterezési eredményen is jól látható volt, hogy az rendkívül távol helyezkedett el a többi csoporttól. Ez a tény előre vetíti, hogy ez a mintavételi pont valószínűsíthetően több paraméter esetében jelentősen különbözik a többi forrástól. Kérdésként merül fel, hogy melyek voltak azok a paraméterek, amelyek jelentősebb mértékben szóltak bele a csoportok kialakulásába. Ezt mutatja be a Wilks' Lambda statisztika (1. táblázat).
10
vastartalom (mg/dm3) 0.006 magnéziumion tart. (mg/dm3) 0.210 hidrokarbonát-ion tart. (mg/dm3) 0.244 nátriumion tart. (mg/dm3) 0.259 mangán tartalom (mg/dm3) 0.289 kalciumion tart. (mg/dm3) 0.297 szulfátion tart. (mg/dm3) 0.300 kloridion tart. (mg/dm3) 0.339 pH 0.376 káliumion tart. (mg/dm3) 0.618 1.táblázat: Wilks' Lambda statisztika A Wilks' Lambda statisztika értékek azt mutatják, hogy mindegyik – bár mértékében különböző – vizsgálatba bevont paraméter jelentős szerepet töltött be a csoportok kialakításában, legkevésbé a kálium tartalom befolyásolja a csoportok kialakulását, azzal együtt, hogy 0,61 Wilks' Lambda statisztika értéke nem nagy, távol van az egytől, tehát még ez a paraméter is jelentős befolyással bír. Megjegyzendő, hogy a vastartalom a vizsgált területen fellelhető laterites képződményekből származik. Az egyes csoportokban helyet foglaló minták darabszámát és a csoportokon belül a mintázott területek arányát a 2. táblázat, míg a csoportok „összetételét” a területek százalékában a 3. táblázat mutatja be. A csoportban levő Királyerdő Tasádi-dombság Réz Béli Csoport száma mintavételi (%) (%) hg. (%) hg. (%) pontok száma 1 31 90.3 9.6 2 44 86.3 6.8 6.8 3 28 53.5 28.5 17.8 4 2 100 5 3 33.3 66.6 6 8 62.5 25 12.5 7 4 75 25 8 12 8.3 8.3 16.6 66.6 9 1 100 2.táblázat:A csoportokban helyet foglaló minták darabszáma és a csoporton belül a mintázott területek aránya.
11
Csoport összetétele a mintázott területek %-ában Csoport Réz Béli száma Királyerdő Tasádi-dombság hg. hg. 1 32.2 14.3 2 43.7 14.3 14.3 3 17.2 38.1 23.8 4 2.3 5 25 9.5 6 50 23.8 4.8 7 3.4 4.8 8 1.1 25 9.5 38.1 9 4.8 3.táblázat: A csoportok „összetétele” a területek százalékában A táblázatok tanúsága szerint 4 nagyobb csoport van, ezekben foglal helyet a mintázott pontok több mint 80 %-a. A legtöbb minta Királyerdőből származik. A csoport összetételek a mintázott területek százalékában c. összeállításból kiderül, hogy a királyerdei minták gyakorlatilag az első három, a Réz – és a Béli – hegység mintái szétszórtan, míg a Tasádidombságban vett négy minta három csoportban foglal helyet. A 3. táblázat kissé más megvilágításba helyezi a csoportok jellemző összetételét. Kiderül, hogy az 1. és 2. csoportot királyerdei minták jellemzik, nem elhanyagolható mennyiségű Réz- és Béli – hegységbeli mintákkal. A Béli – hegység legjellemzőbb csoportjaként a 8-ast, míg a Réz-hegység legjellemzőbb csoportjaként a 3-as csoport jelölhető meg. Az egyszerre figyelembe vett, több paraméter által kialakított csoportok box-whisker’s ábráit paraméterenként érdemes áttekinteni, de mivel a csoportok által lefedett területek nem esnek egybe a földrajzi területekkel, célszerű minden paraméter esetére kettő box-whisker’s ábrát megtekinteni. Az egyiket területi, míg a másikat a klaszteranalízis eredménye alapján. Itt jegyezzük meg, hogy a területek elnevezése nem fért ki az ábrára ezért azokat számokkal láttuk el.
4/a-b. ábra: 1: Béli – hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (pH) Az összes mintában a négy területen, az átlagos pH tartalom 7.27 (4/a-b. ábra). A Rézhegységben mérték a legkisebb értékeket. A medián nem a dobozok közepén helyezkedik el, ami azt jelenti, hogy a pH értékek nem normális eloszlásúak. Két terület adatai tartalmaznak
12
kiugró értékeket, darabszám szerint többet a Királyerdő, kettő darab extrém értékkel. A sokváltozós adatelemzéssel kapott csoportosítás más képet mutat, jelentősen differenciálja a csoportokat pH szerint. Így fordulhat elő, hogy az 1. (leginkább királyerdei minták) és 8-as csoportban (vegyes összetételű csoport, sok Béli-hegységbeli mintával) a pH mediánja 7.8 körüli. A 4. csoport, mely kettő darab királyerdei minta, mediánja a legkisebb (6.)
5/a-b. ábra: 1: Béli – hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Mangán koncentráció) Az 5/a-b. ábrákon visszatükröződik, hogy a minták jelentős részénél (81%) a kimutatási határ alatt voltak a mangán koncentráció értékek, néhány, statisztikai értelemben kiugró és extrém érték mellett, melyek mind a három hegység területén jelentkeznek. A csoportosítás nyomán látható, a 4. csoport két királyerdői valamint az 5. csoport, elsősorban Réz-hegységi mintáinak emelkedettebb koncentráció tartalma. A királyerdei minták nagyobb részét tartalmazó 1., 2.és 6. csoport gyakorlatilag csak kimutatási határ alatt tartalmazott mangánt, hasonlóan a sok Béli-hegységbeli mintát magába foglaló 8 csoporthoz. A 9. csoport (Réz-hegységbeli, R-21 minta) a mangán esetében is kiemelkedően magas mangán tartalommal bír.
6/a-b. ábra: 1: Béli – hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Nátrium ion koncentráció) A nátrium ion koncentrációjára vonatkozóan (6/a-b ábrák) területi vonatkozásban a Rézhegység és a Tasádi-dombság mutatja a legnagyobb koncentrációt, míg a legkisebbeket a Királyerdei minták mutatják, bár ez utóbbi több kiugró illetve extrém értéket is tartalmaz, aminek részben oka, hogy az interkvartilis terjedelem egyébként a legszűkebb, és a medián
13
értéke is nagyon alacsony. Egyértelműen kijelenthető, hogy a legalacsonyabb Na koncentrációval a Királyerdei minták bírnak, innen származik az a 13 darab minta is, amelyek Na ion koncentrációja kimutatási határ alatt van. A Béli-hegység mintái is kisebb koncentrációt mutatnak, de van kettő minta, ami a hegységet jellemző koncentrációtól jelentősen eltér (B-7 kiugró, B-3 extrém értékkel). A klaszter analízis alapján egy kissé differenciáltabb képet kapunk. Az első négy csoport, melyek főleg királyerdei mintákból állnak, illetve azok vannak még e csoportokban a Béli-hegységből illetve a Réz-hegységből, amelyek alacsony (általában 5 mg/dm3 alatti) Na koncentrációval bírnak. Szintén alacsony a koncentráció tartalom a 7. és a 8. csoportok esetében, a Béli-hegység illetve a Réz-hegység alacsonyabb Na koncentrációjú mintái találhatók meg itt. Az 5. és a 6. csoportoknak magasabb a Na koncentráció tartalma. Az 5. csoport csak Tasádi-dombsági illetve Réz-hegységi mintákat tartalmaz. A 6-os számú csoport mintáinak nagyobb része (5 darab), pedig a Királyerdő emelkedettebb Na koncentrációjú mintái közül kerül ki.
7/a-b. ábra: 1: Béli – hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Kálium tartalom) A kálium tartalom általában nagyon alacsony. Egyetlen minta kivételével (Királyerdő, Ke22, 8.69 mg/dm3, 7/a-b. ábrák) 4 mg/dm3 alatti mért érékeket találunk. A mintavételezett területek közül a Tasádi-dombság vett 4 darab minta nagyobb koncentráció mutat a többihez képest (7/a-b. ábrák), így lehetséges, hogy az egyéb területeken a kálium alacsonyabb, mint 2 mg/dm3 értékeket mutat. A klaszterezéssel meghatározott csoportok sem mutatnak jelentős eltéréseket, kivéve a 4 számú csoportot, ami összesen kettő darab királyerdei mintából áll, amiből az egyik az előbb már említett Ke-22, míg a másik Ke-12 (1.54 mg/dm3 értékkel).
14
8/a-b. ábra: 1: Béli – hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Kálcium ion koncentráció) A kalcium ion vonatkozásában, az egyes területekre vonatkozóan a Béli-hegység mintái általában a legkisebb és a Tasádi-dombság levő minták koncentráció tartalma a legnagyobb (8/a-b. ábrák). A csoportosítási eljárás alkalmazásaként árnyaltabb és változatosabb képet láthatunk. Ezt az elég kicsi Wilks' Lambda statisztika érték is mutatja (0.29). Fontos eredménynek tűnik, hogy a kalcium tartalom szempontjából a főleg Királyerdei mintákat tartalmazó 1. és 2. csoport között jelentős különbségek vannak. A legmagasabb mért értékeket is itt találjuk (Királyerdő, Ke-18, 147 mg/dm3 illetve Királyerdő, Ke-25, 195 mg/dm3). Legalacsonyabb a Ca+ tartalom a 3. (28 darab minta) és a 4. (2 darab királyerdei minta) csoportokban. Ezek közül a 3-ikban mintegy 15 a Királyerdőből származik, igen alacsony kalcium koncentráció tartalommal. A 6., 7., 8. csoportok koncentráció tartalma az 1. és a 2. csoport közé esik.
9/a-b. ábra: 1: Béli–hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Magnézium ion koncentráció) A magnézium esetében a Királyerdő mintáinak van legkisebb koncentrációja, több kiugró és extrém érték mellett (9/a-b. ábrák). A Tasádi-dombságban vett minták lényegesen nagyobb koncentráció tartalommal bírnak. A Béli és a Réz hegység mediánja közel egyező 9-10 mg/dm3. A Wilks' Lambda statisztika érték mutatja (0.21), hogy ez az ion a második legfontosabb csoportképző paraméter. Az első 4 csoport alacsonyabb (a minták túlnyomó részénél 5mg/dm3 alatti) míg a többinél ettől magasabb értékeket találunk, míg 9. csoport (Réz-hegységből, R-21 minta) a magnézium esetében is kiemelkedően magas értékekkel bír.
15
10/a-b. ábra: 1: Béli – hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Klorid ion koncentráció) A klorid ion tartalom (10/a-b. ábrák) gyakorlatilag minden területen kisebb mint 15 mg/dm3. Legnagyobb a Tasádi-dombságban levő négy mintában, míg Királyerdőben a minták 50% 2 mg/dm3 koncentráció tartalommal bír. Ennek oka, hogy a kimutatási határ alatt levő 11 darab minta is innen származik. A klorid ion koncentrációja a Béli- (5 mg/dm3 alatti) és a Rézhegységekben 10 mg/dm3 alatti, de 3-4 mg/dm3 feletti értékekkel. A klaszterezés talán legfontosabb eredménye az 5. és a 6. csoport emelkedettebb klorid ion tartalma, amely csoportok már egyéb paraméterek esetében is jelentős különbségekkel bírtak a többiekhez képest.
11/a-b. ábra: 1: Béli–hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Hidrogénkarbonát ion koncentráció) A hidrogénkarbonát ion jelentős koncentrációban van jelen, területenként bizonyos esetekben nagy különbségekkel (11/a. ábra). A csoportosításban ez az ion jelentős szereppel bír. Ez a tény jól látszik a 11/b. ábrán. Az egyes csoportokban (11/b. ábra) a koncentráció tartalmak – képileg – hasonlóan alakulnak, mint a kalcium esetében, kivételt a 9., csoport (Rézhegységből, R-21 minta) kiemelkedően magas értéke jelenti.
16
12/a-b. ábra: 1: Béli – hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Szulfát ion koncentráció)Kálium tartalom A szulfáttartalom vonatkozásában (12/a-b. ábra) a Béli-hegység és Királyerdő vonatkozásában a medián 10 mg/dm3. Ennek az az oka, hogy jelentős, gyakorlatilag 50% volt azoknak a mintavételezési pontoknak a száma, amelyekben a szulfát ion tartalom kisebb volt, mint az alkalmazott módszer kimutatási határa és ezek a minták főként a Béli-hegységben és a Királyerdőben helyezkednek el. A legtöbb kiugró és extrém értékkel a Királyerdő néhány mintája bír. Az adatelemző módszer eredményeként egy árnyaltabb képet kaphatunk. Így az 1. csoport mediánja kimutatási határ alatt van, ugyanakkor tudjuk, hogy ez a csoport főként a Királyerdőből tartalmaz mintákat. A 2. jellemzően szintén erről a területről tartalmaz mintákat, de már a medián magasabban helyezkedik el. Érdekes a 3. csoport, ami csak 50%-ban királyerdei minta. E csoport mediánja a kimutatási határ, az a néhány minta, ami mérhető értékkel rendelkezik, területi elhelyezkedése vegyes (Béli - és Réz – hegység, Királyerdő). A további csoportokban általában jelentősebb szulfát ion mennyiséget mértek, és mint eddigi vizsgálati eredményeink alapján tudjuk ezek, elhelyezkedése nem köthető szigorúan egyetlen területhez. 3.2. Csoportosítás a szerves paraméterekre A vizsgált területen 133 forrásból vett vízmintákat olyan kémiai paraméterekre is vizsgálták, amelyek szerves anyagokhoz (kémiai oxigén igény, nitrit, nitrát, ammónia) esetleg mezőgazdasági tevékenységhez kapcsolódnak (foszfát). Ezekre a paraméterekre is vizsgálatot kívántunk végezni, abból a célból, hogy megadjuk azon mintáknak a csoportjait, melyek hasonló módon szennyezettek. Számos olyan paraméter volt, amelyek mért értékei kimutatási határ alatt voltak. Ezeket a csoportosítás során a kimutatási határ értékével vettük figyelembe. A területenként vett mintaszámokat a 4. táblázat mutatja be. Terület (Teritoriu) Mintaszám Béli-hgy (Codru) 21 Királyerdő (Padurea Craiului) 87 Tasádi dombság (Tasad) 4 Réz-hgy (Plopis) 21 4.táblázat. A területenként vett mintaszámok.
17
Csoportosítást klaszter analízissel végeztük, helyességét diszkriminancia analízissel ellenőriztük és javítottuk. A számítások végeredményeként, a mintavételi pontok 99,2%-át sikerült matematikai értelemben helyesen csoportba sorolni. Fontosnak tartottuk megtudni, hogy a csoportosításba bevont paraméterek közül melyek milyen mértékben befolyásolták a csoportosítást. Eszerint az ammóniumion, foszfátion és a KOI ps tartalom közel azonosan nagy mértékben játszott szerepet a csoportosításban. Ezeknek a paramétereknek ilyen nagy szerepe felhívja a figyelmet, hogy a mintázott területeken néhol jelentős és környezetvédelmi szempontból valószínűleg aggályos antropogén tevékenység folyik. Legkevésbé volt szerepe a nitrát ionnak (lásd 5. táblázat). ammóniumion tart. (mg/dm3) 0.263 foszfátion tart. (mg/dm3) 0.297 KOI ps (mg/dm3) 0.317 nitrition tart. (mg/dm3) 0.381 3 nitrátion tart. (mg/dm ) 0.825 5. táblázat. A csoportosításba bevont paraméterek befolyásoló ereje. A boksz-whisker’s plotokat ezen paraméterekre vonatkozóan úgy véltük célszerű kétféle képpen megadni. Az egyiket mintavételi területek szerint, azért hogy legyen áttekintő kép egy – egy terület viszonyairól, a másik a matematikai csoportosítás szerinti, ami alapján pontosabb információt kaphatunk az antropogén tevékenységből származó szennyezettség mértékére. Az egyes csoportokban levő minták területi hovatartozását mutatja be a 6. táblázat. Csoport Grupe 1 2 3 4 5 6 7 8 Béli-hgy Codru 2 3 10 1 1 2 1 1 Királyerdő Padurea Craiului 39 6 25 1 3 10 1 2 Tasád Tasad 2 1 Réz-hgy Plopis 2 9 2 2 2 3 1 Összesen 41 11 46 4 7 14 5 4 6.táblázat. A csoportosítás alapján az egyes minták területi eloszlása. Az 1. és a 6. számú csoportokat egyértelműen a Királyerdőbeli minták túlsúlya jellemzi. Királyerdőből jelentős számú minta van jelen a 3. csoportban is, de itt helyezkedik el a Béli- és a Réz-hegységbeli minták túlnyomó része is. Kissé hasonló a helyzet a 2. csoportban is, de itt csak 11 minta foglal helyet. A többi csoport kisebb számú tagokból áll és területileg is változatos eloszlással bírnak.
18
13/a-b. ábra: 1: Béli–hgy, 2: Királyerdő, 3: Réz-hgy, 4: Tasádi-dombság (KOI ps) A KOI ps legmagasabb értékekkel a Tasádi dombság mintáiban van jelen. Ez a tény a kevés mintaelemszámra való tekintettel a területre nem általánosítható. A legkisebb értékeket a Királyerdő és a Réz hegység mediánja veszi fel, a dobozok szélessége is kicsi (itt helyezkednek el a minták darabszám szerinti 50%-a), viszont van néhány kiugró, sőt extrém érték is (13./a ábra). A klaszter analízis segítségével képzett csoportok (13./b ábra) differenciáltabb képet adnak. Rávílágítanak arra, hogy a Királyerdő (és a Béli-hegység) területén kicsi KOIps értékek vannak de van néhány olyan pont amelyek nagyobb mért értékekkel bírnak. Azonban ez nem egyedi, más területek vonatkozásában is megjelenik ez a tapasztalat.
14/a-b. ábra: 1: Béli–hgy, 2: Királyerdő, 3: Réz-hgy, 4: Tasádi-dombság (Ammónium koncentráció) Az ammónium fontos, szerves anyag jelenlétére utaló paraméter. A Királyerdő mintáinak mintegy 50%-a kimutatási határ alatti koncentrációt tartalmaznak (ez igaz a Béli – és a Rézhegység vonatkozásában is), de vannak olyan mérési pontok ahol kiugró és extrém értékek is megjelennek. A legmagasabb értékkel a Réz hegység egyik mintája bír (R-19), de más területek esetén is több helyen előfordulnak 100mg/dm3 nagyobb értékek (14/a ábra). A 7. számú csoport 5 mintája kiemelkedően magyas, míg 2. csoport magas koncentrációkat mutat (14/b ábra). Ezekben a csoportokban elhelyezkedő minták leginkáb a Királyerdőből és a Réz-hegységből származnak.
19
15/a-b. ábra: 1: Béli–hgy, 2: Királyerdő, 3: Réz-hgy, 4: Tasádi-dombság (Nitrát koncentráció) A nitrát kopncentráció álatalában nem túl magas, de mindegyik területen megfigyelhető néhány kiugró és extrém érték (15/a ábra). Az adatelemzés nyomán megállapítható, hogy az első négy csoport általában kissé alacsonyabb nitrát koncentrációval rendelkezik. Ezekben helyezkedik el a Királyerdő mintáinak túlnyomó része, de igen jelentős számú minták vannak egyéb területekről is. A többi csoport kisebb nagyobb mértékben nagyobb nitrát tartalmat mutat, vegyesen a különböző területekről (15/b ábra).
16/a-b. ábra: 1: Béli–hgy, 2: Királyerdő, 3: Réz-hgy, 4: Tasádi-dombság (Nitrit koncentráció) A nitrit koncentráció a minták túlnyomó többségében kimutatási határ alatt van, De minden területen vannak magasabb értékeket mutató megfigyelési pontok (16/a-b ábrák).
20
17/a-b. ábra: 1: Béli–hgy, 2: Királyerdő, 3: Réz-hgy, 4: Tasádi-dombság (Foszfát tartalom) A foszfát tartalom (17/a-b. ábrák) a minták többsésgében több mint 100mg/dm3. A legemelkedettebb a Királyerdőben, a legmagasabb koncentráció is itt található. Ez mivel több mint 500 mg/dm3 már meghaladja a 6/2009. (IV.14.) KvVM-EüM-FVM együttes rendeletben a felszín alatti víz foszfát tartalmára vonatkozó határértéket (500 mg/dm3). Hegyvidéki, ritkán lakott területen a Királyerdő és Béli – hegység mért értékei felhívják a figyelmet arra, hogy feltételezhetően mezőgazdasághoz kötődő foszfát forrás van jelen a területeken. Ezek kiderítése és ellenőrzése a jó vízminőség megőrzése szempontjából fontos. 3.3. Összefoglalás A terepi mintavételezés nyomán készített laborvizsgálatok eredményei lehetővé tették, hogy a hidrogeológiai szempontból legfontosabb paraméterek alapján csoportosítsuk a mintavételi pontokat és jellemezzük azokat a különböző paraméterek szempontjából. A csoportokat különböző színekkel jelölve tekintsük meg azok térbeli elhelyezkedését (18. ábra). Összefoglalóan láthatóak, az eddigi vizsgálati eredmények „képi” megfogalmazása, miszerint a mintavételezett területekhez tartozó mintavételi pontok nem határoznak meg egy – egy csoportot. Az adatelemző módszerek alkalmazásának eredményeivel ez a tény egybevág. A csoportok alakulásának oka, hogy az egyes hegységekben a földtani helyzet nem homogén. Tehát nem csak karsztos illetve nem karsztos területekről van szó. Ez az oka annak, hogy egy területen (hegységen) belül különböző csoportok határozhatók meg a legfontosabb kémiai paraméterek alapján. Ugyanakkor, más-más területeken levő források kémiai összetétele lehet hasonló. Ennek oka, hogy ha az adott területeket felépítő kőzet összetétel hasonló, a kőzet-víz kölcsönhatás eredménye létrehozhat hasonló összetételű vizeket. Ilyen módon a csoportok „mozaikos” elhelyezkedése nem meglepő. Annak kiderítése, hogy adott csoport miért az adott területen helyezkedik el, további részletesebb vizsgálatot igényel, ha lehet több mintavételi ponttal és egyéb hidrogeológiai módszerek bevonásával. A szerves anyagokhoz és a mezőgazdasághoz kötődő paraméterek vizsgálata alapján kijelenthető, hogy a vizsgált mintavételi pontokon a vizek általában jó minőségűek. Azonban néhány ponton emelkedett koncentráció értékek tapasztalhatók. Ezt valószínűsíthetően a környezetben meglévő (elsősorban mezőgazdasági) területhasználat okozza. A nagyobb mért értékek azért veszélyesek, mert jelentős a vizsgált területeken a karsztos képződmények elterjedtsége. A karszt öntisztulási képessége – elsősorban a gyors vízáramlás miatt – igen kicsi. Ezért egy-egy szennyező pont nagy területek vízkészletét teheti, illetve teszi tönkre. Ezért mindenképpen erőteljesen javasolt a további kutatás, a szennyező források megtalálása és azok 21
megszüntetése. E cél érdekében egy monitoring rendszer kiépítése és fenntartása hosszú távon szükséges, ami térben és időben tájékoztatást ad a felszínalatti vizek vízminőségének alakulásáról.
18. ábra:
Az egyes csoportok térbeli elhelyezkedése
22
4. Víztermelő kutak paramétereinek vizsgálata többváltozós adatelemző módszerekkel A vizsgált területen 100 kútból vett vízmintáknak számos kémiai és fizikai paramétereire történt helyszíni és laboratóriumi vizsgálat (lásd 7. táblázat). Ezek között voltak olyanok melyek szerves vagy szervetlen komponensekhez kapcsolódnak. Ennek megfelelően, ha azt keressük, mely kutak hasonlítanak paramétereiket tekintve egymáshoz, a csoportosításra több lehetőség nyílik, mi az összes olyan paraméter vettük figyelembe, amelyek egymással nem korrelálnak. Itt jegyezzük meg, hogy számos olyan paraméter volt, amelyek mért értékei kimutatási határ alatt voltak. Ezeket a csoportosítás során a kimutatási határ értékével vettük figyelembe. 4.1. Csoportosítás az összes mért paraméterre A csoportosítás helyességét diszkriminancia analízissel javítottuk és ellenőriztük. A számítások végeredményeként, a kutak 96%-át sikerült matematikai értelemben helyesen csoportba sorolni. 8 csoport elkülönítésére került sor (8. táblázat). Az egyes csoportok csoport közepei elkülönülnek egymástól. A 8 számú csoport - ami egyébként egyetlen megfigyelési pontot tartalmaz, rendkívül távol helyezkedett el az összes többi csoporttól. Ez a tény előre vetíti, hogy ez a kút valószínűsíthetően több paraméter esetében jelentősen különbözik a többi kúttól. Természetes kérdésként merül fel, hogy melyek voltak azok a paraméterek, amelyek jelentősebb mértékben szóltak bele a csoportok kialakulásába. Ezt mutatja be a Wilks' Lambda statisztika (7. táblázat). Ebből az látszik, hogy leginkább a nitrition, majd a nátriumion, m-lúgosság illetve a nitrátion a legfontosabb, csoportosítást befolyásoló tényezők. Ez azt jelenti, hogy a települések szennyvízkezelésének hiányosságai és a mezőgazdasági tevékenység jelentősen érinti a vízminőséget. Ez figyelemre méltó, különösen akkor, ha figyelembe vesszük, hogy a mintázott vizek többsége több tíz, esetleg száz méterre szűrőzött kutakból származik.
23
nitrition tart. (mg/dm3) Nátriumion tart. (mg/dm3) m-lúgosság (mmol/dm3) nitrátion tart. (mg/dm3) hidrokarbonát-ion tart. (mg/dm3) mangán tartalom (mg/dm3) oxigén fogy. (mg/dm3) Kalciumion tart. (mg/dm3) kloridion tart. (mg/dm3) Ammóniumion tart. (mg/dm3) Terepen mért_Hőmérséklet (oC) pH magnéziumion tart. (mg/dm3) Arzén tart. (µg/dm3) szulfátion tart. (mg/dm3) káliumion tart. (mg/dm3) vastartalom (mg/dm3) foszfátion tart. (µg/dm3)
0.232 0.280 0.282 0.300 0.303 0.349 0.362 0.365 0.435 0.568 0.573 0.610 0.634 0.707 0.753 0.801 0.802 0.803
7.táblázat: Wilks' Lambda statisztika a mért paraméterekre vonatkoztatva Legkevésbé néhány szervetlen paraméter befolyásolja a csoportosítást. Ezek között foglal helyet a vas-, kálium- és a szulfátion. A csoportosítást „matematikai” értelemben helyesnek találtuk. A csoportok képzésénél minden mért komponenst azonos súlytényezővel és egyszerre vettük figyelembe. Az egyes csoportokban helyet foglaló mintaszámokat a 8. táblázat mutatja be.
Mintaszám Csoportszám (Darab) 1 44 2 4 3 6 4 4 5 7 6 30 7 3 8 1 8.táblázat: Az egyes csoportokban lévő mintaszámok További vizsgálat tárgyát képezi, hogy az egyes paraméterek, milyen értékekkel bírnak az egyes csoportokban. Erre szolgálnak a box-whisker’s plot-ok. Bár a csoportosításba nem tettük bele a kutak szűrőzésének mélységét, viszont a 19. ábra azt mutatja be, hogyan alakulnak az egyes csoportok szűrőközepeinek statisztikái.
24
19 ábra: Szűrőközép értékek az egyes csoportokban A legkisebb szűrőközép értékekkel a 3. csoport rendelkezik. Bár a legnagyobb mediánnal az 5. csoport bír, de ugyanakkor az adatok interkvartilis terjedelme is itt a legnagyobb (más szavakkal: a szűrőközepek 50%-a ebben az intervallumban foglal helyet, ami 100 – 400 m között van). A mediánokat tekintve többi csoport szűrőközepei mintegy 100 m-es intervallumot fognak át.
20 ábra: Terepen mért vízhőmérsékleti adatok A 20 ábra a terepen mért víz hőmérsékleteket mutatja be. Azt érzékelhetjük, hogy bár az interkvartilis terjedelem intervallumai jelentős mértékben átfedik egymást, a mért hőmérséklet adatok az egyes csoportokban bizonyos mértékig elkülönülnek, és a mélyebben szűrőzött kutakban (ld.: 19. ábra) jellemzőek a magasabb értékek. Fontos megjegyezni, hogy nem látunk kiugró adatokat az egyes csoportokban.
25
21 ábra: Terepen mért fajlagos vezetőképesség . A 21. ábrán a terepen mért fajlagos vezető képességet láthatjuk. Amint tudjuk ez a paraméter az összes oldott anyag tartalom mennyiségétől függ. Az összes oldott anyag tartalom pedig szoros kapcsolatban van a kőzet – víz kölcsönhatással, figyelembe véve azoknak a kőzeteknek a minőségét, amiben a víz tartózkodott és a közöttük levő kölcsönhatás idejének hosszát. Ezt a paramétert a csoportosításba, mint paramétert nem tettük bele. Ennek oka, hogy – a paraméter természetéből adódóan – több más paraméterrel korrelál, így más paramétereket nem egyszer, hanem kétszer is figyelembe vettük volna, aminek következtében a csoportosítás helytelen eredményre vezethet. Másik oldalról tekintve, a csoportosításban több olyan paraméter volt, ami bizonyos értelemben és mértékig a vezetőképességben is benne van. Ebből a szempontból tekintve az ábrát, a legkisebb vezetőképessége az 1. csoportnak van (átlag 425 µS), míg a 7. (átlag 1870 µS) és a 8-as (3969! µS) csoportoknak a legnagyobb. A 8. csoport egyetlen mintavételi pontból áll, ez a Szurdok II. – K-65 jelű minta. A 7-es csoport mely szintén jelentősen elkülönül, három mintavételi pontot foglal magába (Hortobágy K-29, Hortobágy Szásztelek K-30, Kocsoba K-92). Kisebb, de szintén jelentős vezetőképességgel bírnak a 2., 3 és 5. csoportok, átlagosan 726, 870 illetve 775 µS értékekkel. Az adatok összehasonlításához érdemes figyelembe venni, hogy az összes mintázott kút fajlagos vezetőképességének átlaga 620 µS. Összességében erről a paraméterről elmondhatjuk, hogy az a megközelítés, miszerint nem vettük bele közvetlenül a csoportosításba, közvetve azonban több paraméteren keresztül igen, helyes volt és jelentősen elkülönülnek e paraméter szempontjából a csoportok.
22 ábra: Terepen mért pH értékek.
26
A 22. ábrán a pH értékek statisztikái kerülnek bemutatásra csoportonként. A legkisebb pH-val a 8. csoport egyetlen tagja (Szurdok II. – K-65) rendelkezik, 6.5 értékkel. A 6. csoport nagy, átlagosan 8.2 értékekkel bír. A 3. csoport és a 4. csoport pH-ja a legkisebb (átlag 7.1 és 7.3), míg a többiek átlagosan 7.7 körüli értékeket mutatnak. A 22 ábrából megállapítható, hogy a pH néhány csoportban jelentős eltéréseket mutat, de például az 1. és 2. csoport esetében ez a megállapítás nem igaz. Ez az eredmény egybevág a Wilks' Lambda statisztika eredménnyel, ahol látszik (7. táblázat), hogy a pH egy „átlagos” csoportképző paraméter.
23 ábra: Metilorange-lúgosság Az 23. ábra egy jelentős csoportképző paraméter (Wilks' Lambda statisztika 0.282) a metilorange-lúgosság, aminek néhány statisztikájának csoportonkénti alakulását mutatja. Látható, hogy az egyes csoportok között jelentős különbségek vannak. Vélhetően ez az oka annak, hogy ez a paraméter jelentős csoportképző szerepet tölt be. Az oxigén fogyasztás (melynek ábráját nem mutatjuk be), néhány esetben „extrém” nagy értékekkel rendelkezik, így a 8. (Szurdok II. – K-65 jelű minta) és 7. (Hortobágy K-29, Hortobágy Szásztelek K-30, Kocsoba K-92) csoport 4 darab kútja. A többi csoport ugyan különbözik egymástól, de ennek mértéke az előzőekhez viszonyítva csekély.
24 ábra: Ammónium ion koncentráció Az ammónium vonatkozásában (24. ábra) a 7. csoport három kútja nagy értékekkel bír. A többi csoport esetében többnyire mérhető értékek vannak, de gyakori (különösen a 6. csoportban) a csoportokban levő kiugró illetve az extrém értékek jelenléte. Ez jól mutatja, hogy
27
függetlenül attól, milyen mélyen szűrőzöttek a kutak (lásd 19. ábra) előfordulnak bennük jelentős felszíni eredetű szerves anyag szennyezésre utaló nagy ammónium értékek.
25 ábra: Nátrium ion koncentráció A nátrium ion tartalom (25. ábra) jelentős eltéréseket mutat, ahogy a Wilks’ Lambda statisztika értéke is alacsony (0.280). Kiemelnénk itt a 7., 5. és a 2. csoportokat. Ennek a paraméternek az alakulása is független a szűrőzési mélységtől. Például, hasonló szűrőzési mélysége van az 1. és 2. csoportoknak, de a nátrium ion tartalom jelentősen eltér. Hasonló a helyzet a 6. és 7. csoporta nézve is. Ezek alapján valószínűsíthető, hogy a nátrium tartalom egy része lokális felszíni szennyezésekből ered.
26 ábra: Kálium ion koncentráció A 26. ábrán látható kálium ion tartalom egy kimagasló adatot tartalmaz a 3. csoportban található extrém, 40.5 mg/dm3 -es értékkel. A csoport mediánja, 1.17 mg/dm3. Ebben az esetben valószínűsíthetően elírásról lehet szó. Ennek ellenére ennek a mintának, minden valószínűség szerint e csoportban van a helye, mivel a csoportosítás több más paraméter értékeinek együttes figyelembe vételételével történt. Hasonló lehet a helyzet az 1. csoport esetében is. A kálium tartalom az esetek többségében 5 mg/dm3 alatt van. Ebből a megközelítésből érthető, hogy relatíve nagy (0.801) a paraméter Wilks' Lambda statisztika értéke, ami azt jelenti, hogy a kálium ion csoportképző „ereje” a többi elemhez képest kisebb.
28
27 ábra: Kalcium ion koncentráció A 27. ábrán a kalcium ion tartalom kimagasló értéke a 8. csoport (Szurdok II. – K-65 jelű minta 1089 mg/dm3) Emellett vannak különbségek a csoportok között, bár ezek nem annyira jelentősek, hasonlóan a kálium ionhoz. A csoport átlagok 13 – 63 mg/dm3 között változnak, kivéve a 4. csoport 4 darab mintáját amelyeknek átlaga 138 mg/dm3 . A látszólag kisebb változékonyság ellenére a kalcium ion Wilks' Lambda statisztika értéke csak 0.365, ami azt mutatja, hogy a kalcium jelentős mértékben szólt bele a csoportok kialakításába.
28 ábra: Magnézium ion koncentráció A 28. ábrán bemutatott magnézium ion bizonyos vonatkozásokban hasonlóságokat mutat a kalcium ionnal. Így itt is extrém csoportként viselkedik a 8. csoport (Szurdok II. – K-65 jelű minta) kimagaslóan nagy (120 mg/dm3 ) értéke miatt. A kalcium ionhoz hasonlóan a 3. és 4. csoportban levő magnézium ion koncentrácó magas (31.4 illetve 20.4 mg/dm3 ) Érdemes összehasonlítani a nátrium koncentrációkat a kalcium és magnézium adatokkal. Általában ahol magasabb a nátrium tartalom, ott alacsonyabb a kalcium és a magnézium értéke; illetve fordítva. Ez magyarázható a felszínalatti vízáramlási pályák mentén zajló ioncsere folyamatokkal is, melyek a víz nátrium ionokban való dúsulását eredményezik.
29
29 ábra: Klorid ion koncentráció A 29. ábrán bemuatott klorid ion Wilks' Lambda statisztika értéke (0,43) a kalcium ion hasonló. Alapvetően két csoportban van jelen magasabb koncenrációban (3. és 7. csoport). A klorid iont mint úgynevezett konzervatív komponenst tartjuk számon, ez azt jelenti, hogy a nagyobb klorid ion koncentrációnak elméletileg hosszabb áramlási pályát kellene jelölnie.
30 ábra: Hidrogénkarbonát-ion koncentráció A hidrogénkarbonát (30. ábra) domináns anionnak tekintendő, mind a vizek kémiai jellegét mind a csoportok kialakulását (ld.: 7. táblázat) tekintve is. Az egyes csoportok között jelentős különbségek figyelhetők meg e paraméter koncentrációját illetően.
31 ábra: Szulfátion koncentráció 30
A szulfátion koncentrációja (31. ábra) az első három csoportban kissé nagyobb, míg a többiben kisebb, kivéve a 8. csoportot, ahol extrém magas (586 mg/dm3 )értékekkel bír. A csoportok átlagos szulfátion tartalma 24 – 67 mg/dm3.
32 ábra: Nitrit ion koncentráció A 32. ábra a nitrition ioncentráció alakulását mutatja be. Több csoportban kimutatási határ alatti koncentráció található, néhányban azonban mérhető mennyiség. A 2. csoport minden mintavételi pontjában emelkedettebb koncentrációkat láthatunk.
33 ábra: Nitrát ion koncentráció A 33. ábrán látható nitrát ionkoncentráció alakulásának jellege hasonló mint amit a nitritnél láthattunk, azzal a különbséggel, hogy legnagyobb koncentrációt a 3. csoportban találhatunk.
31
34 ábra: Foszfát ion koncentráció A 34. ábra a foszfát iont mutatja be. az első három csoportban alcsonyabb. míg a többiben magasabb foszfát koncentrációval. Származását tekintve valószínűsíthető, hogy ez a komponens a mezőgazdasági tevékenység egyik következménye. Miután áttekintettük az egyes paraméterek koncentrációjának csoportonkénti alakulását, helyezzük el térben is az egyes mintavételi pontokat (35. ábra). Ennek lényege, hogy a sokváltozós adatelemző mdszerek által hasonlónak, tehát egy csoportba tartozónak vélt mintavételi pontokat azonos színkulccsal (36. ábra) jelöljük.
35 ábra: A mintavételi pontok térbeli elhelyezkedése
32
36 ábra: A mintavételi pontok térbeli elhelyezkedésének jelmagyarazáta Általánosságban elmondható, hogy a vizsgált terület K-i részén inkább az 1., míg ettől nyugatabbra a 6. csoport foglal leginkább helyet. Ez az elhelyezkedés intermediális jellegű áramlási jellegre utal. Ugyanakkor a jelentős nátrium és hidrogénkarbonát tartalom alapján a mintázott vizek többnyire nátrium-hidrogénkarbonát-típusú, sekély gravitációs áramlási rendszerekből származó vizekre utalnak. A helyenként megnövekedett kloridion tartalommal jellemezhető csoportok (3. és 7.) egyben sekély szűrőközép értékekkel is bírnak (ld.: 19. ábra), így inkább lokális, esetleg felszíni szennyező eredetet jeleznek. Abban az esetben, ha a térképet részleteiben tekintjük át, annak mozaikos jellege szembetűnő ami szintén lokális áramlási rendszerek jelenlétére utal, melyek a helyi topográfiai viszonyoktól erősen függenek. A jelentős ammónium, nitrit és nitrát valamint foszfor tartalom szintén jelentős felszíni eredetű szennyezettségre, és ugyanakkor a lokális beáramlási területek jelentőségére utal. Ez a megállapítás aláhúzza a dinamikus faktor analízis átal kapott eredmények jelentőségét illetve egybeesik velük. Amint láttuk a 2. faktort a lefelé irányúló anyagáramlásként azonosítottuk, a beszivárgó csapadék és a felszínalatti víztermelés együttes hatásaként. Ezeknek a hatásoknak a konkrét megvalósulásait láthatjuk a szerves anyagokhoz köthető paraméterek ivóvízben történő megjelenésében.
33
5. Dinamikus faktor analízis alkalmazása Bihar megye talajvízszint kútjaira 5.1. A felhasznált adatok Számításaink elvégzéshez, a magyar oldalon, Hajdú-Bihar Megyéből, a Debreceni VIZIG területéről több mint 150 talajvízszint megfigyelő kút idősora állt rendelkezésünkre. A megfigyelési időszak tág határok között mozgott. Bizonyos kutakban 1933-ban kezdődtek az észlelések, és napjainkban is folynak. Az észlelések kezdetétől a mérések gyakorisága – azaz a mintavétel – nem volt állandó, három naponkénti, hetenkénti, illetve az utóbbi időkben az óránkénti regisztrálás is előfordul. A dinamikus faktoranalízis elvégzésének feltételeit az 1986 és 2007 közötti időszakban 98 észlelőkút adatsora elégítette ki, melyek térbeli elhelyezkedése a vizsgált területen nem egyenletes, annak ÉNy-i részén a legsűrűbb (37. ábra). Bemeneti adatként a kutak vízszintje tengerszintfeletti magasságának évenkénti átlagát használtuk fel. Ennek legfőbb oka, hogy a hosszabb távú változásokat kívántuk figyelemmel kísérni. Bihar megyéből (Románia) 14 kút adatát kaptuk meg, 2004-2009 közötti időtartamban. Ezek az adatok nem voltak felhasználhatóak két okból. Az egyik, hogy az idősorok intervalluma öt esztendő volt, ami nem elégséges ahhoz, hogy a háttér tényezőket (faktor idősorok) becsüljük. A másik ok, hogy ezek az adatok nem eredeti megfigyeléseket tartalmaztak, hanem a megfigyelések valamely statisztikáit, mediánt, minimum és maximum értékeket havi bontásban. Vizsgálatainkhoz éves átlagokra volt szükségünk. A mediánok átlagait azonban ha kiszámítjuk évenként, az idősorok viselkedésében olyan „torzulást” állítunk elő, amivel jelentősen megváltoztatjuk az idősorok tulajdonságait. Az említett művelettel – egyszerűbben fogalmazva – kisimítottuk volna az eredeti hidrográfok fluktuációját, aminek következtében vizsgálataink hibás eredményt szolgáltattak volna. 350000
300000
250000
DEBRECEN PÜSPÖKLADANY
200000
150000
100000 750000
800000
850000
900000
37 ábra: A vizsgált területen lévő észlelőkutak térbeli elhelyezkedése
34
Az eredmények (faktor idősorok) azonosításához a vízmérleg egyes elemeinek idősoraira van szükség. Magyarországon a vízkitermelési adatok országos nyilvántartása az 1990-es években bekövetkezett politikai és gazdasági változásainak következtében, valamint az ellenőrző szervek hatáskörének nem megfelelő lehatárolása miatt, a vizsgált időszakban nem reprezentatív. Ezért Marton L - Szanyi J., 2000-ben publikált, a Debreceni Vízművek termelési adatait használtuk fel (38. ábra), mint olyan idősort, ami jól mutatja a területen a vízkitermelés időbeli változásait. Az azonosításhoz 10 meteorológiai állomás (Debrecen, Görbeháza, Hajdúdorog, Hajdúszoboszló, Nyírábrány, Nyírbátor, Pocsaj, Polgár, Püspökladány, Szeghalom) havi csapadék adatai kerültek felhasználásra. 5.2. Eredmények és értékelésük – A dinamikus faktoranalízis alkalmazása a vizsgált területen A becsült faktoridősorokat a vízmérleg elemeivel korreláltattuk, azért hogy megállapítsuk, mely hidrológiai folyamattal azonosítható. Major P. (1993) becsülte ezek átlagos értékeit az Alföldön (9. táblázat).
38 ábra: Debreceni Vízművek termelési adatai (Marton L - Szanyi J., 2000) beszivárgás a talajvízbe
106 mm/év
feláramlás a rétegvízből
5 mm/év
párolgás a talajvízből
87 mm/év
talajvíz tározódás (emelkedés)
2 mm/év
mélyebb rétegekbe történő 20 mm/év leszivárgás 9. Táblázat. Az Alföld talajvízháztartásának paraméterei (Major, 1993)
35
Első faktor A talajvízpárolgást (ET) a talajvízháztartási jelleggörbe alkalmazásával határoztuk meg. A vizsgálatba bevont 98 kút környezetére határoztuk meg az evaporáció idősorait, majd ezek mediánjával és átlagával jellemeztük a teljes területre vonatkozó idősort. Az ábrán bemutatásra kerül az evaporáció (medián, átlag) és a faktor idősorok alakulása. Az evaporáció idősorok és a faktor idősorok közötti igen szoros a lineáris kapcsolat. A korrelációs együtthatók: rrmedián;faktidősor=0,941 rrátlag;faktidősor=0,915-os (39. ábra). Az eredmények alapján, az első faktor azonosítására vonatkozó vizsgálataink összegzéseként, igazoltnak látjuk azt a feltételezésünket, hogy az I. faktor a talajvíz evaporációjával azonosítható.
39 ábra: Az evaporáció (medián és átlag) és az első faktoridősor alakulása. Második faktor A vízháztartási egyenlet szintén jelentős eleme a csapadék talajvízbe szivárgó hányada. A második faktor idősort ezzel hasonlítottuk össze. A vizsgált terület éghajlati sajátosságainak következtében, a téli félévben lehulló csapadék túlnyomó része eljut a talajvízig, a vegetációs időszakban ennek nagy részét a növények használják fel, azonban ennek kezdete és vége az adott év időjárásának megfelelően akár 1-2 hónappal is csúszhat. De hosszabb időszakot tekintve, a december és március között hullott csapadék összeg jól reprezentálja a talajvizet tápláló beszivárgó hányad évenkénti alakulását. Ennek alapján becsültük a talajvizet tápláló csapadékmennyiséget 10 csapadékmérő állomáson. Ahhoz, hogy megismerjük az egyes évek átlagoshoz való viszonyát, létrehoztuk az átlagtól való eltérések összegének idősorát. A második faktor idősora és az így becsült beszivárgás idősor között szoros a lineáris kapcsolat, a legjobb eredményt a február-márciusi csapadékkal kaptuk, a korrelációs együttható 0,83 (40. ábra).
36
40 ábra: 1986 és 2006 között lehulló csapadék mennyisége és a második faktor idősor alakulása A vízmérlegben másik lefelé irányuló anyagáramlásként a rétegvíztermelés hatására megnövekedő leszivárgás is szerepel, aminek jelentőségére több szerző is felhívta a figyelmet (JUHÁSZ, 1981; MARTON & SZANYI, 2000). Ezért a talajvízszint és a vízkitermelés közötti kapcsolatot és annak szorosságát is próbáltuk becsülni. Mivel ebben az esetben, időben elnyúló (hosszan tartó) folyamatról van szó, a kapcsolatot keresztkorrelációval vizsgáltuk. Az eredményeket a 10. táblázatban közöljük. Látható, hogy a talajvízszintek és a vízkitermelés közötti kapcsolat két éves időeltolásig egyre szorosabbá válik, majd ezután csökken. A lineáris kapcsolat a talajvízszint és a kitermelés között, a négyéves időeltolás esetén is csak az esetek 36,7 %-ában teljesül. Mivel a talajvízszint idősort faktorokra bontottuk és így azokban az egyes háttértényezők jelennek meg, a faktorokkal is kerestük a vízkitermelés kapcsolatát. Azt találtuk, hogy a második faktor idősor időeltolás nélkül is szoros kapcsolatot mutat a vízkitermeléssel (r=0,836), de maximumát kettő éves időeltolásnál éri el. A kapcsolat szorossága ekkor 0,905! Ez az jelenti, hogy a lineáris kapcsolat a talajvízszint és a vízkitermelés között 1-2 év elteltével az esetek több mint 81%-ban létrejön. Ez fontos eredmény. Erőteljesen látszik, hogy a faktor idősor tisztán mutatja a háttérhatást! A keresztkorreláció időbeli alakulásának grafikus képét a 41. ábra mutatja be. Időeltolás (év) 0 Korr. Együttható (vízszint)0.061 Korr. Együttható (II. faktor) 0.836
1 0.376 0.901
2 0.534 0.905
3 0.566 0.838
4 0.606 0.718
5 0.461 0.553
6 0.331 0.288
10. táblázat: Keresztkorrelációs együtthatók a vízkitermelés kapcsolatára a talajvízszintek mediánjával és a második faktorral.
37
41 ábra: Keresztkorrelációs együtthatók az időeltolás (év) függvényében a vízkitermelés kapcsolatára a talajvízszintek mediánjával és a második faktorral. A második faktorra vonatkozó vizsgálatok összegzéseként, az eredmények alapján igazoltnak látjuk azt a feltételezésünket, hogy a második faktor a lefelé irányuló vízforgalommal azonosítható, ami két részfolyamatból áll. Az egyik a beszivárgás, a másik az időben hosszan elnyúló, mélyebb rétegek felé történő átszivárgás.
5.3. Faktorsúlyok vizsgálata Amennyiben a faktor idősorok azonosítása megtörtént, azok faktorsúlyai is meghatározhatóak. Ezek a vízszint idősorok alakulását befolyásoló tényezők intenzitására utalnak. A számítások eredményeként a hatások erőssége minden megfigyelési helyen meghatározottá válik, aminek következtében térbeli eloszlásuk is megadható. Első lépésként a kutakhoz rendelt faktorsúlyokból empirikus félvariogramokat számoltunk (42. ábra), melyek kétküszöbűek, 8 km valamint 13 km-es hatástávolsággal. Ez alapján következtethetünk arra, hogy a kiszámolt faktor idősorok súlyai térbeli struktúrával rendelkeznek. Jelen eredményben egy hatótényező (evaporáció) két különböző léptéke tükröződik vissza. Az evaporáció függ a talajvízmélységtől, és ezt két tényező befolyásolja. Az egyik (véleményünk szerint a kisebb) a mélyebb rétegekből történő vízkitermelés hatására bekövetkező lokális vízszintsüllyedés, míg a másik (véleményünk szerint a nagyobb) a topográfia és a talajvízmélység kapcsolatával hozható összefüggésbe.
38
42 ábra: Az első faktor súlytényezőire szerkesztett empirikus és illesztett variogramok. A faktorsúlyok felhasználásával térkép szerkeszthető az azonosított folyamat területi változékonyságának és intenzitásának bemutatására (43. ábra). Tehát azt látjuk, hogy hol mekkora az esélye a talajvízbe jutó beszivárgásnak. A faktorsúly-térképen 98, egyenlőtlenül elhelyezkedő mintavételi pont alapján az megállapítható, hogy a nagyobb értékek a kiáramlási területeket jelzik, az alacsonyabbak a nagy víztermeléssel jellemezhető települések közelében jelennek meg.
TIS ZA
300000
280000
1
260000
0.8
DEBRECEN
240000
0.6
PÜSPÖKLADANY
0.4
220000 BE RE TT YÓ
0.2
200000
0 780000
800000
820000
840000
860000
880000
43 ábra: A becsült beszivárgás (I. faktor) súlyainak térképe
39
Hasonlóan jártunk el a második faktor esetében is, súlytényezőinek empirikus félvariogramját a 44. ábra mutatja be. A hatástávolság 6 és 33 kilométer. Láthatjuk, hogy e faktor esetében is megismerhetőek a térbeli szerkezet tulajdonságai. A variogram két küszöbértéke, véleményünk szerint a két kialakító folyamatra utal. A rétegek közötti kommunikáció megnövekedése lokális jelentőségű, míg a csapadékból történő beszivárgást a felszín közeli rétegek regionális változékonysága befolyásolja leginkább. A kisebbik hatástávolság az első faktor súlytényezőivel közel egyező értéket mutat, ami úgy véljük, hogy a létrehozó folyamat – lokális talajvízszint süllyedés - szempontjából érthető.
44 ábra: A második faktor súlytényezőire szerkesztett empirikus és illesztett variogramok. A második faktor súlytényezőinek térképén (45. ábra). a sűrűbb megfigyelési pontokkal rendelkező területeken elég pontos képet kaptunk a lefelé mutató anyagforgalom intenzitásáról. így például a hátságokon, amelyek beszivárgási területek, a súlytényezők nagyok, itt a beszivárgó csapadék hatása erősebben mutatkozik meg a vízszint idősorokban, mint az alacsonyabban elhelyezkedő területeken.
40
45 ábra: A lefelé irányuló vízforgalom (II. faktor) súlyainak térképe 5.4. Összefoglalás Hajdú-Bihar megye területén az emberi beavatkozás következtében, a felszínalatti víz kivételek következtében nagy területre kiterjedő vízszintsüllyedések jelentek meg. A meglévő determinisztikus modellek mellett, az idősoros vizsgálati módszerek lehetőséget adnak a hatótényezők sztochasztikus értelmezésére is. Nem nyilvánvaló, miként lehet meghatározni egy adott megfigyelési ponton a vízkiemelés hatását, különösen, ha figyelembe vesszük a csapadékból származó utánpótlódás véletlen jellegét. A vízszintingadozások alapjául szolgáló rejtett háttérhatások meghatározásának hagyományos eljárása a faktoranalízis. Mivel ez független megfigyelésekre kidolgozott módszer - ami viszont a vízszint idősorok esetében nem áll fenn, hiszen azok dinamikus szerkezetét figyelembe kell venni – ezért faktoranalízis helyett a dinamikus faktoranalízist kellett alkalmaztunk. Eredményként két dinamikus faktor idősort határoztunk meg, amelyek a függőlegesen zajló vízforgalom tagjai. Az első faktor e vízforgalom felfelé mutató tagjával, evaporációval, míg a második faktort e vízforgalom lefelé mozgó elemeivel, a beszivárgással és a később bekövetkező mélyebb rétegek felé irányuló átszivárgással sikerült azonosítanunk. A kapott eredmények jól szemléltetik, hogy a dinamikus faktoranalízis alkalmazásával a talajvízszintek alakulását befolyásoló folyamatok időbeli változása pontosabban megismerhető és azonosítható. A leírtakat a 46 ábra szemlélteti.
41
46 ábra: A beszivárgás és a mélyebb rétegek felé irányuló átszivárgás szemléltetése A dinamikus faktoranalízis másik hozadéka, hogy a faktorokhoz faktorsúlyokat is rendel. Ezek az adott látens hatás intenzitásának mérőszámai, hiszen azt a súlytényezőt adják meg, amennyivel az adott faktor a megfigyelést, azaz a hidrográfot előállító lineáris kombinációban szerepel. Esetünkben tehát a faktorsúlyok a függőleges vízforgalom felfelé és lefelé mutató tagjai intenzitásának egy adott megfigyelési helyhez tartozó objektív mérőszámai. Ezek ismerete fontos, mert megnyitja az utat a sérülékenység egzakt, kvantitatív vizsgálatához.
42
6. Felhasznált irodalom DÉVÉNYI DEZSŐ és GULYÁS OTTÓ: Matematikai statisztikai módszerek meteorológiában. Egyetemi tankönyv, Tankönyvkiadó, Budapest, 1988, p.: 443
a
KOVÁCS J. – MÁRKUS L. – CSEPREGI A., 1997: Grouping of Wells by Groundwater Levels and Chemical Data, Europian Union of Geosciences 9.kongresszusa, Abstract supplement, p.287 KOVÁCS J. – SZÉKELY I., 1998: Analysis of short time series; an application to chemical composition data of thermal water sources of Budapest, VII. International Congress of Ecology, Firenze, abstract: p. 236. KOVÁCS J. – KONCZ D., 2005: Vízkémiai paraméterek vizsgálata a Dunántúli– középhegységben, Karsztfejlődés X., pp.: 49–60. KOVÁCS J., 2007: Modern geomatematikai módszerek alkalmazása hidrogeológiai feladatok megoldására, Doktori (Ph.D.) értékezés, Szeged, kézirat KOVÁCS J. – CZAUNER B. – KOVÁCSNÉ SZÉKELY I. – BORSODI A. – RESKÓNÉ NAGY M., 2008: A Balaton eltérő vízminőséggel rendelkező térségeinek változásai és a mért vízminőségi idősorok mintázatai, 1985-2004 között, Hidrológiai Közlöny, 88 évf. 6. szám, 172-174 REIMANN J. - V. NAGY I., 1984: Hidrológiai statisztika, Tankönyvkiadó, Budapest, p.: 519 SAJTOS L. - MITEV A., 2007: SPSS kutatási és adatelemzési kézikönyv. Alinea Kiadó, Budapest, p.:402 MAJOR P., 1993: A Nagy-Alföld talajvízháztartása–Hidrológiai Közlöny, LXXIII. évf. 1. szám 40–43. o MARTON, L., SZANYI, J., 2000: A talajvíztükör helyzete és a rétegvíztermelés kapcsolata Debrecen térségében. Hidrológiai Közlöny, 80.évf. 1.sz., pp: 2-18.
43