DOKTORI ÉRTEKEZÉS
WANTUCHNÉ DOBI ILDIKÓ 2002
1
NAPI METEOROLÓGIAI IDİSOROK TÖBBDIMENZIÓS SZTOCHASZTIKUS MODELLEZÉSE
MATEMATIKA DOKTORI ISKOLA ALKALMAZOTT MATEMATIKA PROGRAM
EÖTVÖS LORÁND TUDOMÁNYEGYETEM TERMÉSZETTUDOMÁNYI KAR
Témavezetı:
Dr. Szeidl László Meteorológus konzulens:
Dr. Mika János
ORSZÁGOS METEOROLÓGIAI SZOLGÁLAT
2
Tartalomjegyzék
A disszertáció tézisei I. Célkitőzés
1
II. Módszerek és adatok
2
III. Eredmények
3
IV. A hasznosítás lehetıségei
5
V. Az értekezéshez kapcsolódó publikációk
6
Bevezetés
8
1. Szakirodalmi elızmények
11
1. 1. Sztochasztikus idıjárás generátor modellek
11
1. 2. Csapadék állapot modellek
16
1.3. A klímaváltozás leskálázása
18
2. A disszertációban felhasznált meteorológiai adatok
22
3. Száraz és csapadékos tartamok elemzése, modellezése
24
3. 1. Függetlenség vizsgálat
25
3.2. Eloszlásillesztés
29
4. Elıkészítı lépések
34
4. 1. Transzformációk
34
4.1.1. Sokéves napi átlag és szórás számítása száraz és csapadékos napok szerint
35
4.1.2. Fourier sorfejtés alkalmazása a sokéves feltételes statisztikákra
35
4.1.3. Simított sorok elıállítása Inverz Fourier Transzformációval
36
4.1.4. Rezidum sorok elıállítása a simított sorok felhasználásával
38
4. 2. Idıjárási paraméterek néhány jellemzıje
46
4.3. Faktoranalízis
47
4.4. Normalitás vizsgálat
49
4.5. Feltételes korreláció, autokorreláció
52 3
5. Modellfejlesztés lépései
57
5.1. Kísérlet együttes autoregresszív modellezésre
57
5.2. Modellezés Johnson eloszlással
59
6. Idıjárás generátor modell és szimuláció
60
7. Verifikáció
62
Függelékek
65
Hivatkozások
71
Köszönetnyilvánítás
78
Összefoglaló
79
Summary
80
4
I. CÉLKITŐZÉS
A meteorológia a statisztika és a sztochasztikus folyamatok egyre bıvülı eszközrendszerét alkalmazza az idıjárás-elırejelzés és az éghajlatkutatás különféle területein. A matematikai módszertan és a számítástechnika fejlıdése mellett ebben az is szerepet játszik, hogy a hidro-termodinamika determinisztikus egyenletrendszernek egyre kisebb térés idıbeli léptékben lehetséges megoldása, továbbá az új környezeti problémák, és adatrendszerek megjelenése korábban nem ismert feladatokat fogalmaz meg az alkalmazott matematika számára. Jelen dolgozatban a feladat egy adott pont napi idıjárásának a kezdetiértékektıl független, vagyis a determinisztikus kezelhetıség maximum 2-3 hetes idıtávján túli szimulációja. Ennek érdekében olyan többdimenziós statisztikai modellt fejlesztettünk ki, amely lehetıvé teszi a tényleges meteorológiai idısorokkal statisztikai értelemben azonos, belsıleg konzisztens adatsorok szimulációját. Az ilyen eljárásokat a szakirodalomban (Sztochasztikus) Idıjárás Generátor Modelleknek (IGM) nevezik.
A modell felépítését elsısorban a leggyakoribb alkalmazás, a globális klímaváltozás regionális kockázatait vizsgáló különféle (agrometeorológiai, hidrológiai, stb.) hatásvizsgálati modellek éghajlati adat szükséglete határozta meg, ami az e folyamatokat befolyásoló napi idıjárási elemek tetszıleges hosszúságú adatsorainak elıállítását jelentette. Az alkalmazások adatigényének együttes kielégítése érdekében kilenc meteorológiai elem párhuzamos modellezését tőztük ki célul, ami többszöröse az eddig közzétett IGM-ek dimenziószámának.
A nemzetközi szakirodalomban elérhetı IGM modellek áttekintése után a Racskó és mtsai (1991) által publikált háromváltozós (napi középhımérséklet, csapadék, napfénytartam) modelljének továbbfejlesztése mellett döntöttünk. Megıriztük ennek az alapkoncepcióját, az új modell is az egymás utáni napok száraz/csapadékos állapotából indul ki, vagyis az egymást követı száraz és csapadékos szériák hosszának, mint önálló sztochasztikus folyamatnak a statisztikus tulajdonságaira épül. E diszkrét folyamat kisebb általánosításán, s az elemek számának bıvítésén túl meghaladtuk – a klímaváltozás hatásvizsgálataiban világszerte gyakran hivatkozott – dolgozat eredményeit abban is, hogy a változók egymástól független elıállítása helyett többváltozós folyamattal végeztük a szimulációt, felhasználva a nem normális eloszlások esetén ajánlott Johnson transzformációt.
5
A fenti fı alkalmazás érdekében a modell paraméterei változtathatók, ami lehetıvé teszi a generátor alkalmazását más, a regionális éghajlati forgatókönyvek által elırevetített, jövıbeli klíma értékre is. A modell paraméterek becslését 45 év hosszúságú bázis–idıszakra végeztük el, ennek során a szimulált és a tényleges idısorok közötti megfelelés alatt a feltételes átlag, szórás, ferdeség, lapultság, korreláció és autokorreláció értékek statisztikai értelemben vett megegyezését követeltük meg.
II. MÓDSZEREK ÉS ADATOK
A dolgozatban a valószínőségelméleti fogalmak, statisztikai módszerek és a sztochasztikus
folyamatok
elméletének
széles
körő
alkalmazására
törekedtünk.
A meteorológiai elemek idısorainak elemzése során felhasználtuk a becsléselmélet (pl. legkisebb négyzetek) és a hipotézis vizsgálat különféle módszereit (Komogorov– Szmirnov próba, t, u, χ2, Mann–Whitney teszt), továbbá a faktoranalízis, a többdimenziós normális eloszlás, valamint a különféle alap és keverék eloszlások illesztésére és a regressziós becslésekre vonatkozó ismereteket. Az évszakos menet kiszőréséhez, valamint a gyengén stacionárius idısorok becslésénél az idısor analízis egyes elemeit, pl. Fourier transzformációt, kovariancia becslést, az elsırendő autoregresszív folyamatot alkalmaztunk. A többdimenziós folyamat modellezésének egyik fontos eleme a többváltozós Johnson eloszlás felhasználása. Az elemzéseknél felhasznált egyes próbák és módszerek részletes leírását az Értekezés Függelékként tartalmazza.
A modell szerkezeti felépítéséhez és parametrizálásához tanuló adatbázisként az OMSZ két eltérı éghajlatú fıállomásán Szegeden és Szombathelyen 1951 és 1995 közötti, napi közép-, valamint maximum- és minimum-hımérséklet, csapadékösszeg, napfénytartam, relatív nedvesség, felhızet, szélsebesség és légnyomás értékeit használtuk fel. Az állomások kiválasztását az éghajlati sajátosságoknak az ország területén belül viszonylag nagy eltérése, valamint a megfigyelések kellı minıségbiztosítottsága indokolta.
A számításokhoz elsısorban a Statistica for Windows 5.1, esetenként az SPSS for Windows 6.1, valamint a Statgraphics 5.1 software csomagokat alkalmaztuk. Több vizsgálat adatkezelése C program megírását és futtatását tette szükségessé.
6
III. EREDMÉNYEK
1. A modell vezérparaméterének az egymást követı száraz ill. csapadékos napokból álló, egynemő szakaszok sorozatát választottuk. Egy-egy ilyen szakaszt az állapot típusa, kezdı napja (éven belüli elhelyezkedése) és hossza (tartama) jellemez. Az egymást követı szakaszok hosszára vonatkozóan igazoltuk, hogy azok függetlenek tekinthetık mind az ellentétes típusú (elsı rendő), mind a megelızı azonos típusú (másodrendő) szériák hosszától.
2. A száraz ill. nedves idıszakok hosszának modellezése érdekében, az év minden hónapjára nézve
eloszlásokat
illesztettünk
a
szériákból
számított
tartamgyakoriságokra.
E számítások szerint a keverék eloszlások pontosabb eredményeket biztosítanak, mint a klasszikus geometriai eloszlás. Két geometriai eloszlás összege csak a csapadékmentes szakaszok esetén javítja az illeszkedést, ugyanakkor a geometriai és Poisson eloszlás keveréke mind a száraz, mind a csapadékos tartamokra minden hónapban egyaránt magas megbízhatósági szinten illeszkedik a Magyarországon éghajlatát jellemzı, viszonylag rövid csapadékos és a jóval hosszabb száraz szakaszokra.
3. A meteorológiai elemek idısoraiból a sokévi átlagok és szórások éves menetét a Fourier felbontás elsı három komponensének felhasználásával eltávolítottuk. A fennmaradó, immár zérus várható értékő és 1 szórású, reziduum sorokban az egynemő szakaszokon belüli, további összefüggéseket kerestünk. Megállapítottuk, hogy a tartamok hossza szerint nem szükséges megkülönböztetés, ellenben lényeges eltérés adódott a vizsgált összes elem havonkénti átlagai között aszerint, hogy a szakasz hányadik napjáról van szó. A csapadékos idıszakon belül az elsı napokon az átlagértékek jellemzı eltérést mutatnak az idıszak többi napjához viszonyítva. A száraz tartamokon belül ugyanez a helyzet, sıt itt további csoportosítást is kell tenni. Nevezetesen, a második és a harmadik nap együtt kezelhetı, míg az elsı és a legalább negyedik nap feltételes átlagai külön átlagolandók. Ezeket a meteorológiai szempontból is értelmezhetı tulajdonságokat az éves menetnél leírt standardizálást kiegészítı, újabb transzformáció formájában építettük be a modellbe.
4. A változók lineáris összefüggése alapján, megkíséreltük a kilenc elem csoportosítását ez által bizonyos további vizsgálatok számát szándékoztunk redukálni (5. és a 6. tézisnél). Ennek érdekében faktoranalízist végeztünk száraz és a csapadékos napokra külön-külön. 7
Az eredmények szerint három faktorcsoport különíthetı el, az elsıbe tartozik a maximum, minimum- és középhımérséklet, a másodikba a relatív nedvesség, a felhızet és a napfénytartam, míg a harmadikba a szélsebesség és a légnyomás. A csapadék mennyisége - a fenti három közül - havonta más-más csoportba sorolható.
5. A változók normalitását számos teszt és folyamat feltételezi, ezért a perem eloszlásokat elemenként és együttesen a Kolmogorv – Szmirnov valamint a Mardia-féle együtthatókon alapuló
próbák
segítségével
vizsgáltuk.
Egyváltozós
esetben
a
3. tézispontban ismertetett transzformációkat követıen a maximum, minimum és átlag hımérséklet, a relatív nedvesség és a légnyomás az év folyamán normális eloszlásúnak adódott száraz ill. csapadékos esetben egyaránt. Az elızı tézispontban felsorolt faktorcsoportokból találtunk egy-egy elemet (maximum hımérséklet, relatív nedvesség és légnyomás), amelyek perem és együttes eloszlása egyaránt normálisnak adódott.
6.
A 3. tézispontban ismertetett módon transzformált meteorológiai elemek egymást követı értékei közötti korrelációkat száraz és csapadékos szériákon belül, valamint a típusváltásokra havonta külön u próbával teszteltük. Az elızı tézispontban felsorolt három elemre igazoltuk, hogy az egy napos eltolással kapott idısorok korrelációja szempontjából nincs jelentısége annak, hogy az egymást követı napok közül melyik párost tekintjük. Más szóval, az adott száraz ill. nedves tartamon belül a vizsgált elemek sorozata, mint sztochasztikus folyamat, gyengén stacionáriusnak tekinthetı.
7. További tesztekkel megmutattuk, hogy mind a 9 standardizált változó Johnson eloszlásba sorolható, amely magába foglalja a normális, lognormális, korlátos és korlátlan nem normális eloszlásokat. A többváltozós Johnson eloszlás módosításának felhasználásával standard normális eloszlású véletlen számokból adott statisztikai jellemzıkkel rendelkezı, szimulált idısorokat állítottunk elı. A feltételes autoregresszív folyamatot kibıvítettük az összes elemre oly módon, hogy a véletlen tagot többváltozós Johnson eloszlással állítottuk elı. Ezek az összefüggések biztosítják a szimulált sorok ferdeség, lapultság, korreláció és autokorrelációis értékeinek reprodukálhatóságát. Az átlagokat és a szórásokat a 3. tézispontban felsorolt transzformációk inverz mőveletei, a gyakoriságokat csonkítással állítottuk be a megfelelı értékekre. A mintaszámítások szerint a modell megırzi a kívánt statisztikai tulajdonságokat a mesterséges sorokban.
8
IV. A HASZNOSÍTÁS LEHETİSÉGEI
A kifejlesztett modell leggyakoribb felhasználási területe a klímaváltozási szcenáriók regionális hatásának kockázati analízise. Ennek során a hatásvizsgálati számítások idıjárási bemenı adatait az IGM szolgáltatja, amelynek paramétereit a jelenkori értékekre beállítva elıáll a kontrollfutás. Ezt követıen a globális klímamodellek eredmény-mezıinek térbeli és idıbeli “leskálázását” végzı valamilyen mőveletsor nyomán az IGM paraméterei megfelelı beállításával lehetıvé válik, hogy adott területen, pl. egy adott szántóföldi növény produktivitásában bekövetkezı változásokat megbecsüljük.
Magyarországon egyetemeken és kutató intézetekben nagy számban készítenek ill. alkalmaznak hatásvizsgálati modell-számításokat, amelyek éghajlati adatokkal történı ellátása jelenleg csak részben megoldott. Az alkalmazott eljárások ugyanis általában a szükségesnél kevesebb
-
legfeljebb
három
–
idıjárási
elem
szimulációját
teszik
lehetıvé.
A dolgozatunk tárgyát képezı modell elsısorban ezt a hiányosságot hivatott pótolni, ami a modell általános jellege, azaz a kevés megszorító feltétele miatt –legalább az országon belülminden bizonnyal változatlan szerkezetben, a helyi adottságokhoz igazító paraméter beállítással megoldható. A száraz/csapadékos szériákra vonatkozó eredmény önmagában is fontos annak meteorológiai jelentısége miatt.
A kifejlesztett idıjárás-generátor további hasznosítása más alkalmazott klimatológiai feladatokban is lehetséges. Ennek azonban a szimulált számadatokhoz, még inkább magához a generátor számítógépes realizációjához való hozzáférés is egyik alapfeltétele. A dolgozat leírásban arra törekedtünk, hogy a képletek alapján könnyen algoritmizálható legyen az eljárás, így jól felhasználható legyen programcsomag készítésére.
******** A disszertáció 80 számozott oldalt, ezen belül 14 ábrát, 14 táblázatot valamint 86 irodalmi hivatkozást tartalmaz.
9
V. ÉRTEKEZÉS TÉMAKÖRÉHEZ KAPCSOLÓDÓ PUBLIKÁCIÓK
Bálint G., Dobi I. and Mika J., 1996: Runoff simulation assuming global warming scenarios. In: Proc.18th Conf. Danube Countries, 25-30 August, 1996, Graz, Austria, 131-136. Bálint G., Gauzer B., Dobi I. and Mika J., 1995: The use of global warming scenarios for low flow simulation. In: Drought in the Carpathians’ Region (ed. Vermes L.), 3-5 May, 1995, Göd, Hungary, 65-77. Dobi I., 1987: Csapadék idısorok analízise Markov-láncok felhasználásával. Szakdolgozat, Témavezetı: Dr. Matyasovszky István) Dobi-Wantuch I., Mika J. and Szeidl L., 2000: Modelling wet and dry spells with mixture distributions. Meteorology and Atmos. Phys.,Vol. 73, 245-256. Dobi I., Mika J. and Szeidl L., 1996: On modelling daily rainfall occurrences. In: Proc. 17th Intern. Conf. on Carpathian Meteorology, 14-18 Oct. 1996, Visegrád, Hungary, 46-51. Dobi I., Mika J., Bálint G. and Gauzer B., 1995: Runoff simulation assuming global warming scenarios. In Proc. 2nd. Intern. Conf. on "Hydrological Processes in the Catchment", (ed. Wieznik, B.), 23-26 April, 1995, Cracow , Poland, 391-399. Dobi I., Mika J., Pröhle T. and Szeidl L., 1996: On improvement of weather generators: Nonsinusoidal features in the annual cycles of daily means and inter-annual variability. In: Regional WS on Climate Variability, Climate Change Vulnerability and Adaptation, (ed. I. Nemesova, R. Huth), 11-16 Sept., 1995, Prague, Czech Rep., 315-320. Kovács-Láng E., Kröel-Dulay Gy., Kertész M., Fekete G., Mika J., Dobi-Wantuch I., Rédei T., Rajkai K., Hahn I. and Bartha S., 2000: Changes in the composition of sand grasslands along a climatic gradient in Hungary and implications for climate change. Phytocoenologia 30, 385-407. Matyasovszky I., Dobi I., 1989: Csapadék idısorok vizsgálatának módszerei Markov láncok alkalmazásával. (Methods for analysis of time series of precipitation data using Markov chains) Idıjárás, 93 (5), 276-288.
10
Mika J. és Wantuchné Dobi I., 1998: Kis globális változások térbeli és idıbeli leskálázása hatásvizsgálati célokra. In: Az éghajlatváltozás következményei (szerk. Dunkel Z.) Meteorológiai Tudományos Napok, 1997 nov. 20-21, Budapest, 105-116. Nagy J., Huzsvai J., Mika J., Dobi I., Fodor N. and Kovács G.J., 1999: A method to link general circulation model to weather generator and crop models for long term decisions. MODSS'99 Conference, Brisbane, Australia, 1-6 August, 1999. Wantuchné Dobi I., 1997: Analysis and simulation of daily meteorological time series, In Statistics at Universities: Impact for Society, 22- 23 May, 1997, Budapest, Hungary, 115-120. Wantuchné Dobi I., 1997: Napi meteorológiai adatsorok sztochasztikus modellezése idıjárásgenerátorokkal, Egyetemi Meteorológiai Füzetek 9, 26-31. Wantuchné Dobi I., 1998: Napi meteorológiai idısorok vizsgálata és sztochasztikus modellezésének lehetıségei. II Erdı és klíma konferencia. 1997 jún. 4-6, Sopron, 57-61.
11
Bevezetés
A valószínőségszámítás és a matematikai statisztika a klímakutatásban alapvetı eszköz. Az éghajlat tanulmányozásánál a nagyszámú megfigyelési adatból álló idısorok statisztikai elemzésére és modellezésére alkalmazzák. Az éghajlat mőködését vezérlı fizikai folyamatokat általában dinamikai módszerekkel modellezik, tapasztalatok szerint azonban ezek az eljárások a klímára jellemzı változékonyságot (Storch és Zwiers, 1998) nem mindenben tudják “utánozni”. Például a külsı éghajlati kényszerek okozta hosszabb-rövidebb ingadozásokat (változásokat) csak akkor, ha ezen kényszerek idıbeli alakulása ismert. A matematikai módszertan és a számítógépes megvalósítás fejlıdése mellett a sztochasztikus modellek elterjedésében szerepet játszik, hogy a hidro-termodinamika determinisztikus egyenletrendszernek egyre kisebb tér- és idıbeli léptékben lehetséges megoldása, továbbá az új környezeti problémák, és adat-rendszerek megjelenése korábban nem ismert feladatokat fogalmaz meg az alkalmazott matematika számára.
Hasselmann ˙(1976) javasolta elsıként, hogy ún. Sztochasztikus Klíma Modellt (SCM) alkalmazzanak a klímakutatásra. Elmélete szerint a rövid ideig tartó fluktuációk, zajok alakítják ki az éghajlati rendszer alacsony frekvenciás változékonyságát, vagyis e fluktuációk integrált értékei hatással vannak a lassú változásokra. Ebbıl adódóan az SCM-ek kezdetben fontos szerepet játszottak a klíma belsı összefüggéseinek, természetes ingadozásának ill. az antropogén
levegıszennyezés
következtében
valószínősíthetı
megváltozásának
megértésében. Megfelelı paraméter-választással ugyanis képesek voltak visszaadni a földi éghajlat ingadozásainak a paleoklíma rekonstrukciókból többé-kevésbé ismert idıbeli spektrumát.
Az SCM modellekkel rokon a dolgozat témáját képezı, a jelen ill. a feltételezett jövıbeli klímára jellemzı napi, lokális meteorológiai adatok elıállítására alkalmas többváltozós Sztochasztikus Idıjárás Generátor Modellek (IGM). Jelen dolgozatban a feladat egy adott pont napi idıjárásának a kezdeti-értékektıl független, vagyis a determinisztikus kezelhetıség maximum 2-3 hetes idıtávján túli szimulációja. Ahhoz, hogy az ilyen típusú modelleket el tudjuk helyezni a globális klímaváltozás kapcsolatos kutatások között, szükséges a témakör rövid áttekintésére. Azonban, hogy ne törjük meg a jelen bevezetı fonalát és belsı arányait ezt az 1.3 pontban, az IGM-ek szakirodalmi elızményei után tesszük meg. 12
Magyarországon
az
elmúlt
években
fokozódott
az
igény a klímaváltozás
mezıgazdasági, hidrológiai és egyéb ökológiai következményeinek vizsgálata iránt (Mika, 2000; Harnos, 1998; Kovács és Dunkel, 1998; Kröel-Dulay és mtsai, 1998; Kertész és mtsai, 1998; Gilyénné és Nováky, 1998). Az ELTE Meteorológiai Tanszék a csapadék makrocirkulációs típusokra épülı szemi-empirikus leskálázási modelljének fejlesztésében vett részt (Matyasovszky és Bogárdi, 1994, 1996). A módszert többek között a Balaton vízgyőjtıjére vonatkozó tanulmányokban alkalmazták.
Mika (1991) a térbeli leskálázáshoz a múltban végbement hazai és a földgömbi léptékő változások közötti összefüggéseket feltáró regressziós eljárást dolgozott ki, amely szeletelés néven terjedt el a hazai és a nemzetközi szakirodalomban. A módszer sokoldalú felhasználását a disszertáció (Mika, 2000) táblázatai foglalják össze.
Hantel és Ács (1995) az ellentétes irány, a kis léptékekben megfigyelt viselkedés általánosítása érdekében dolgozott ki eljárást, amely kis idı és tér skálán a felszíni hı és csapadék
fluxus
modellezésére
alkalmaz
determinisztikus
fizikai
összefüggéseket.
Feltételezése szerint a lokálisról a globális szintre történı “felskálázás” lehetıvé teszi az eltérı idı és térskálák közötti közvetlen kapcsolat megteremtését.
Dolgozatunk szempontjából alapvetı fontosságú az idıbeli leskálázást végzı sztochasztikus idıjárás generátor modell, melyet Racskó, Szeidl és Semenov 1991-ben publikáltak. A modell a csapadékos szériákon alapul, a paraméterek megfelelı módosításával alkalmas az átlaghımérséklet, csapadék és napfénytartam megváltozott klímára jellemzı napi idısorainak szimulációjára.
Disszertációnkban olyan napi sztochasztikus idıjárás generátor modellek tárgyalására szorítkozunk, melyek vezérparamétere a csapadékállapot. A választás egyik indoka az, hogy a csapadék elıfordulása ill. hiánya esetén a többi változónál szignifikáns eltérés tapasztalható. Másfelıl a csapadék becslése a fizikai és numerikus modellekben nem kielégítı. Az irodalom tapasztalatai alapján azonban az ilyen típusú modell lehetıséget nyújt a kiemelt szempontként kezelt aszályos periódusok megfelelı elıállítására (Racskó és mtsai, 1991). További meghatározó szempont, hogy a rendelkezésünkre álló adatbázis és számítástechnikai lehetıségek elegendıek a számítások elvégzéséhez. Tekintettel a hatásvizsgálatok adatigényére (l. 2. fejezet 1. táblázat), valamint arra, hogy az IGM több meteorológiai adat 13
generálására alkalmas, mint a többi eljárás, valamint figyelembe véve az irodalmi áttekintésben (1. 1. fejezet) felvázolt tapasztalatokat, mindezek arra a következtetésre vezettek, hogy célszerő a jelen klíma reprodukálására alkalmas sztochasztikus idıjárás generátor modell továbbfejlesztése mellett dönteni. Mika (1998, 2000) táblázatban foglalta össze a napi sztochasztikus idıjárás generátorok különféle hazai hatásvizsgálatokban történı alkalmazásait. Az ilyen típusú modelleket fıként a növényfejlıdési és a hidrológiai modellekben alkalmazzák, de felhasználhatók a klíma természetes változékonyságának elemzésére, az extrém értékek vizsgálatára valamint az idısorban lévı adathiány esetén pótlásra is (Guenni és mtsai, 1990 a,b)
A következı fejezetben áttekintjük a csapadék állapoton alapuló napi sztochasztikus idıjárás generátor modellek típusait, a különféle modellek elınyeit és korlátjait. Ezt követıen sorra vesszük a Racskó és mtsai (1991) modellhez képest történı változtatásokat. A meteorológiai elemek számát a hatástanulmányok adat igényeibıl kiindulva maximálisan kilenc elemre kívántuk bıvíteni. A csapadék tartamok modellezése különösen nagy súllyal bír, ezért külön fejezetben foglalkozunk vele (3. fejezet). Az idısorok alkalmasan választott transzformációt és elemzést a 4. fejezet tartalmazza. Sorra vesszük azokat az irodalomban elfogadott eljárásokat is melyek esetünkben nem vezettek kielégítı eredményre az 5. fejezetben. A többdimenziós modellt a 6. fejezetben mutatjuk be, az ezt követı fejezetben a modell jóságát teszteljük.
14
1. Szakirodalmi elızmények
Az idıjárás generátorok tulajdonképpen az idıjárási változók megfigyelt sorainak statisztikai modelljei, melyeket adott helyre vonatkozó napi idıjárási adatokat elıállító speciális véletlen szám generátoroknak is tekinthetünk. A csapadék állapotán alapuló napi SWG modelleknek alapvetıen két típusa van (Storch és mtsai, 2000) a különbözı rendő Markov
láncokat
alkalmazó
valamint
a
tartam-hossz
összefüggéseken
alapuló
megközelítések. A kétállapotú elsırendő Markov lánc alkalmazását a száraz és csapadékos napok sorozatainak szimulációjára Gabriel és Neumann (1962) ajánlotta elsıként. A véletlen folyamatot oly módon állították elı, hogy adott nap csapadék állapotára csak az elızı nap van hatással, a csapadékos napokon a napi összeget pedig valószínőség eloszlással képezték. A többi elem statisztikái a nap száraz ill. csapadékos állapotának függvényében szimulálták. A szerzık feltételezték, hogy a paraméterek évszakonként állandók.
1. 1. Sztochasztikus idıjárás generátor modellek
Ezen koncepció alapján Jones és mtsai (1970) szimulációs eljárást dolgoztak ki gabonanövekedési modellek számára, amelyben a napi csapadék állapotát vették figyelembe. A mennyiségét csonkított gamma eloszlással állították elı, a párolgást és a hımérsékleteket pedig negyedrendő polinomokkal közelítették. A számítások tapasztalatai alapján a hımérsékletek elıállítására normális eloszlást ajánlottak. Bruhn és mtsai (1980) a paradicsom tanulmányozása céljából továbbfejlesztették a modellt. A Markov lánc optimális rendjét az Akaike féle információs kritériummal ellenırizték New York és Geneva 10 év hosszúságú adatain. A szerzık feltételezték, hogy a hımérsékletek eloszlása szignifikánsan különbözik az elızı napi csapadékállapottól függıen, továbbá a maximumot az elızı napi, a minimumot az aznapi maximum hımérséklet befolyásolja. Kolmogorov-Szmirnov teszttel igazolta hogy az aktuális nap minimum és maximum hımérséklete valamint az elızı napi maximum a háromváltozós normális eloszlással közelíthetı. A sugárzásról és a relatív nedvességrıl szintén normális eloszlást feltételeztek. Ez utóbbi két elemre a ferdeség tesztelés során jelentıs eltérés adódott, az éves keresztkorrelációkban is elıfordult szignifikáns különbség.
A témakörben a legtöbbet hivatkozott cikk Richardson korai publikációja (1981). A csapadék mennyiségének szimulációjához a számítás egyszerősége miatt exponenciális eloszlást használt, azzal a megjegyzéssel, hogy a kétparaméteres gamma illetve a 15
háromparaméteres kevert exponenciális eloszlást valószínőleg jobb illeszkedést biztosít. A paraméterek számának csökkentése érdekében maximum-, minimum-hımérséklet és a sugárzás feltételes átlagainak és szórásainak idısoraiból maximum likelihood módszerrel 14 napos intervallumokra becsült, majd Fourier soruk elsı két harmonikusának figyelembe vételével eltávolította az éves menetet, ezt követıen pedig standardizálta a változók reziduumait. Mindhárom elem feltételes soraira a Matalas (1967) által ajánlott elsırendő lineáris autoregresszív folyamatot alkalmazta. Néhány amerikai város (Temple, Atlanta és Spokane) 20 éves csapadék adata valamint a többi változóra 5 éves adatsor képezte a tanuló adatbázist. A csapadékküszöb 0,01 inch (0,254 mm) volt.
Wilks a Richardson féle modell klímaváltozásra történı alkalmazhatóságát illusztrálta 1992-ben publikált cikkében. Mindössze annyi módosítást hajtott végre, hogy a napi csapadékösszeg elıállításához gamma eloszlást használt. A valódi és a megnövekedett CO2 szintre vonatkozó havi GCM outputok felhasználásával eljárást dolgozott ki a klímaváltozást tükrözı átlagok és szórások kiszámítására. Mearns és mtsai (1997) szerint ez a módszer a hımérséklet autokorrelációját és a csapadék éven belüli változékonyságát alulbecsli, ezzel együtt a CERES – búza modell érzékenységi vizsgálatára számára jól használhatónak ítélte.
Tekintettel arra, hogy a modell könnyen algoritmizálható számos programcsomag készült. Az eredeti cikk alapján íródott a WGEN (Richardson, 1981, Richardson és Wright, 1984) és több módosított, tovább fejlesztett változat, melyekrıl az alábbiakban adunk áttekintést. A gabonanövekedési és ökológiai modellek különféle formátumban igénylik az adatokat, a WeatherMan nevő programcsomag (Pickering és mtsai, 1994) ennek a technikai problémának a megoldására készült egyesítve az említett és a SIMMETEO (Geng és mtsai, 1986) nevő programokat, és kibıvítve az elemek sorát a fotoszintetikusan aktív sugárzással. Kisebb módosításokkal készült a WXGEN (Sharpley és Williams, 1990) speciálisan az EPIC (Erosion & Productivity Impact Calculator) számára. Ezzel a modellel elıállított sorokat tesztelte Wallis (1993) öt texasi állomásra, szerinte az extrém hımérsékletek, valamint a különféle tartamú csapadékos ill. a hosszú száraz idıszakok gyakorisága a valóditól eltérı, ami pedig a környezeti károk becslésénél igen jelentıs hibaforrás.
Az Euro Weather Generator nemzetközi program részeként alkalmazták a WTHGEN programcsomagot, amely gamma eloszlással elıállított szélsebesség és a minimum hımérsékletekbıl számított telítési gıznyomás értékekkel bıvült (Voet és mtsai, 1996). 16
A ClimGen (Stöckle és mtsai, 1998) a csapadékmennyiséghez és a szélsebességhez Weibull eloszlást illeszt, Fourier sor helyett kvadratikus spline-t használ és a páranyomás hiányt számol. A szél és a harmatpont elıállításával bıvített változat a GEM (Hanson és Johnson, 1998). Parlange és Katz (2000) ez utóbbit és a WXGEN verziókat alkalmazta módosításokkal. Lényegében a nem-normális eloszlású változókat, nevezetesen a “nyers” szél és a harmatpont adatokat transzformálták, továbbá a program felügyeli, hogy a szimulált maximum és minimum hımérséklet valóban rendezett mintát alkosson. Megállapították, hogy a hımérséklet és csapadék szórásnégyzetét erısen alulbecsüli az eljárás. Továbbá hátrány, hogy más éghajlatú helyeken eltérı típusú transzformáció szükséges.
Egymástól függetlenül fejlesztették a hidrológiai alkalmazások igényeihez igazodó USECLIMATE (Hanson, 1993), a CLIGEN (Nicks és Gander, 1993). Lényeges különbség, hogy az elıbbinél Fourier illesztést használtak, a csapadék állapotok sorozatinak szimulációjához kevert exponenciális eloszlást alkalmaztak, valamint figyelembe vették a változók közötti keresztkorrelációkat is. Ebbıl adódóan egyértelmően jobb eredményeket adott a havi és évi tesztek alapján (Johnson és mtsai, 1996), mint a diszkrét havi parametrizációt, ferde normális eloszlást valamint kizárólag csapadék állapottól való függést figyelembe vevı CLIGEN. Mindkettınél elıfordult, hogy a napi minimum meghaladta a minimumot (Semenov és mtsai, 1998; Hayhoe, 2000), a hımérsékletek és a sugárzás szórásánál szintén megemlítik a szerzık az alulbecslést.
Alapvetıen a Wilks féle (1992) modellen alapszik a Met&Roll (Dubrovsky, 1995), annyi a különbséggel, hogy az éves menet simítására robosztus lokálisan súlyozott regressziót alkalmaz, és nem használ empirikus paraméter formulákat. Dubrovsky (1997) 17 csehországi állomás 30 éves adatsorán végzett összehasonlító vizsgálatai képezték a további fejlesztések kiindulópontját. E vizsgálatok tapasztalatai a következık: 1. A sugárzás, maximum és minimum hımérsékletek közötti kereszt- és autokorreláció éven belül változását figyelembe kell venni. 2. A hosszú száraz idıszakok, eloszlását alulbecsüli a kétállapotú elsırendő Markov lánc. 3. A sugárzás havi átlagának és a csapadék havi összegének változékonysága egész évben alulbecsült. Az extrém hımérsékletek havi átlagának változékonysága nyáron felül-, télen alulbecsült.
17
A további fejlesztések fıként ez utóbbi pontatlanságok elkerülését célozták (Dubrovsky mtsai 2000): 1.
A kereszt és autokorrelációk éves menete bekerült a programba,
2.
Harmadrendő Markov láncot alkalmaztak elsırendő helyett,
3.
Havi generátorral reprodukálták a hónapon belüli változékonyságot.
A fejlesztés minden fázisában tesztelték az alkalmazásokra gyakorolt következményeket a CERES-búza valamint a SAC-SMA lefolyás modelleken. Tapasztalataik szerint a meteorológiai adatok szimulációjának javulása a hatásvizsgálatok eredményét kevéssé befolyásolta.
Racskó és társai (1991) magyarországi állomások, Kompolt és Iregszemcse 1951-1985 csapadék, középhımérséklet és napfénytartam adataira végzett vizsgálatokat. Az extrém hosszúságú száraz idıszakok tartamának alulbecslése motiválta a szerzıket a másik típus, a száraz nedves idıszakok hosszát is figyelembe vevı modell megalkotására. Ezzel összefüggésben vizsgálták az elemek tartam-hossztól, (száraz v. csapadékos) típusától ill. tartamon belüli elhelyezkedésétıl való függését. A tartamon belül az elsı nap és a többi között feltételes eloszlásoknál tapasztalt szignifikáns eltérés kivételével a legtöbb ilyen kapcsolatot elhanyagolhatónak találták.
A száraz illetve csapadékos szériákat függetlennek tekintve az adott kezdıpontú tetszıleges hosszúságú csapadékos szakaszok hosszát geometriai, a szárazakét pedig a hossztól függıen kevert geometriai eloszlásokkal állították elı, eltérı paramétereket választva a rövid (legfeljebb 7 napos) ill. hosszú csapadékmentes szakaszokra. A paramétereket az eltérı hosszúságú tartamok gyakoriságaiból becsülték és minden elemnél Fourier simítást alkalmaztak az éves menet eltávolításához
A csapadék összeg kevert exponenciális eloszlásúnak adódott. A 4 mm-nél kisebb csapadékú napokat egyenletes eloszlással, a 20 mm meghaladó mennyiségeket – tekintettel arra, hogy a napok száma nem elegendı a megfelelı eloszlás kiválasztásához – az átlaggal becsülték, a közepes mennyiségő csapadékhoz pedig exponenciális eloszlást illesztettek. Az átlaghımérséklet sorozatoknál figyelembe vették az említett szérián belüli eltérést, ennek megfelelıen különbözı paraméterő normális eloszlást alkalmaztak. Télen, csapadékos napokon a nulla napfénytartam valószínősége igen nagy, ami elrontja az eloszlás normalitását. Ezért a teljesen borult napok valószínőségeit a mintából számították, a többire pedig normális 18
eloszlást alkalmaztak (Semenov, 1991). A modellhez programcsomag készült, amelyet LARS_WG (Long Ashton Research Station Weather Generator) néven klímaváltozási szcenáriók vizsgálatainál elsısorban termésbecslı modellekben alkalmaznak (Semenov és Borow, 1997, 1999). A LARS_WG és a WGEN produktumainak összehasonlítását ázsiai, európai és orosz adatokon Semenov és társai (1998) végezték el. Az elıbbinél alkalmazott flexibilis fél- empirikus eloszlások a különféle klímákon végzett tesztek szerint jobb illeszkedést tettek lehetıvé, mint a WGEN-ben felhasznált standard eloszlások. Mindkét generátornál a napi és havi változékonyság egyaránt pontatlannak adódott.
A két modellre vonatkozó, a szakirodalomban elérhetı összes kritikai felvetést Hayhoe (2000) foglalta össze. Következtetése, hogy a Racskó és mtsai (1991) által kidolgozott modell fél-empirikus eloszlásokat használ fel, emiatt általános tapasztalat, hogy jobb illeszkedést biztosít, mint a WGEN. Ezzel együtt azonban több paraméter becslését igényli, emiatt a szerzı a WXGEN korábban idézett pontatlanságainak korrigálása mellett döntött. Az alábbi módosításokat hajtotta végre: 1. gyakoriságokat
kéthavi
adatokból
számította,
növelve
ez
által
a
becslések
megbízhatóságát, 2. elsırendő Markov lánc helyett másodrendőt használt, 3. spline interpolációt alkalmaz Fourier transzformáció helyett, 4. csapadék-mennyiség logaritmusával, szimulációnál exponenciális transzformációval számolt, 5. a maximum és minimum hımérsékletek rendezettségéthez külön feltételt vett figyelembe, 6. havi átlagokat és szórásokkal további korrekciót hajtott végre, 7. az éven belül kéthavonta különbözı korrelációikat alkalmazott. Kanadai állomások 20 év maximum, minimum hımérséklet, csapadék és sugárzás valamint 30 év mesterséges sorainak összehasonlítása a szélsı értékek, a kis valószínőségő események és a fagymentes napok számának tesztelésére is kiterjedt. Az eredmények egyértelmően javulást bizonyítanak minden tesztnél.
Hayhoe (2000) véleménye szerint megfigyelt és szimulált adatok közötti eltérés egy része a folyamatok véletlenszerő jellegébıl adódik, ez a hiba elkerülhetetlen még az elvileg tökéletes modellnél is. Az eltérés másik része a modellválasztás és az ezzel járó egyszerősítések következménye. Az illeszkedés jóságának elvi korlátot szab tehát a rendszer természetes belsı változékonysága, a statisztikai szempontból rendszerint nem elegendıen 19
nagy véges mintaszám, a becslési és interpolációs eljárások pontossága. További hibaforrás hogy az elemek eloszlása általában ferdébb a normálisnál. Ez utóbbi probléma kiküszöbölhetı a Johnson által kidolgozott ún. normál score transzformációval. Az idıjárás generátor további fejlesztésénél a megfelelı illeszkedésen túl tehát arra kell törekedni, hogy a fizikai kényszereket a lehetı legnagyobb mértékben vegye figyelembe a modell. Az SWG a légkörben lezajló fizikai folyamatokat csak részben tudja visszaadni. Az általunk vizsgált modell típusnál a vezérparaméter, azaz a csapadék értékei szerinti feltételes eloszlásokkal számolnak, amely behatárolja a légköri elemek között figyelembe vehetı kölcsönhatásokat.
Mindezek ismeretében felmerül a kérdés, hogy milyen további összefüggéseket lehet még beépíteni a generátorba? 1. Amennyiben a tartamokon alapuló modellt választjuk, a száraz illetve csapadékos idıszakon belüli kapcsolatok feltárásával újabb tulajdonságok megırzésére nyílik lehetıség. 2. Nagyon fontos a tartamok pontos reprodukálása, hiszen ennek a résznek a modellezése meghatározza a többi elem szimulációját, ezért ezzel a témával külön is foglalkozunk. 3. Szükség van arra, hogy kibıvítsük az elemek körét, figyelembe véve a hatásvizsgálatok maximális adatigényét és a rendelkezésre álló klíma adatokat. 4. A nem normális eloszlások transzformációja szintén tovább javíthatja az eredményeket. 5. Törekedni kell továbbá arra, hogy lehetıleg minél több kiválasztott meteorológiai elemet együttesen, többváltozós folyamatként modellezzük, megırizve ezáltal a köztük lévı kapcsolatokat.
1.2 Csapadék-állapot modellek
A csapadékos és száraz idıszakok hosszának diszkrét modellezésével fıként a hidrológiai szakirodalom foglalkozik. Mivel a tartam modell meghatározó része a dolgozatnak ki kell térnünk a témakörnek áttekintésére. Az egymást követı száraz és csapadékos napok sorozatainak legelterjedtebb modellje az elızı fejezetben említett homogén, kétállapotú, elsırendő Markov lánc (Gabriel és Neumann, 1962). A számítások viszonylagos egyszerősége miatt igen elterjedt ez a módszer (Katz, 1974; 1981; Bruhn mtsai, 1980; Richardson, 1981; Geng és Auburn, 1986; Wilks, 1992; Dubrovsky, 1995). Korábbi számításaink szerint (Matyasovszky és Dobi, 1986) legfeljebb 10 napos tartamokra az elsırendő Markov lánc jól illeszkedik. 20
Ismeretes, hogy adott kezdıpontú tetszıleges hosszúságú száraz ill. csapadékos idıszak bekövetkezésének valószínőségét leíró eloszlás ebben a modellben geometriai, amely a tapasztalatok szerint a hosszú száraz periódusokat jelentıs mértékben alul-, a rövideket pedig felülbecsüli (Berger és Goossens, 1983; Foufoula-Georgiou és Lettenmaier, 1987; Bárdossy, 1993; Lana és Burgueňo 1998). Racskó mtsai (1991) számításai szerint Magyarországon, Kompolton (1951-85) a 19 napot meghaladó aszályos idıszakok elsırendő Markov lánccal elıállított valószínősége egy nagyságrenddel alulbecsülte a megfigyelt relatív gyakorisági értékeket.
A Markov lánc rendjének növelése tőnne a legkézenfekvıbb megoldásnak az említett hiba kiküszöbölésére. Gates és Tong (1976) véleménye szerint legalább másodrendő Markov lánc szükséges az említett Gabriel és Neumann (1962) cikkben felhasznált adatsorra. Stern (1982) nigériai adatokra (Samaru, 48 év) elsı- ill. másodrendő Markov láncot illesztett 20 mm-es csapadékküszöb mellett. Magashegyi adatokra (Sonnblick, Alpok 3100 m, 1901-70) másodrendő lánccal jó illeszkedést kapott Cehak és Withalm(1980), trópusi területen (Guatemala, Columbia, Niger) pedig a 9 napnál rövidebb idıszakokra harmad-rendő Markov láncot találtak megfelelınek (Jones és Thornton, 1993). Mimioku (1984) görögországi állomásokon (13-20 év) havonta más (0 -tól 3-ad) rendő Markov láncot alkalmazott. A fenti vizsgálatok azt mutatják, hogy az optimális rend megválasztása erısen függ a megfigyelt adatsortól. Chin (1977) 100 Egyesült Államokbeli állomás 25 évnyi adatsorán végzett számításai szerint hely és idıszak, azaz klíma és évszakfüggı. További lényeges szempont a becsülendı paraméterek száma, ami kétállapotú, k-ad rendő Markov lánc esetén 2k-al egyenlı. Tapasztalat szerint a rend növelése alapvetıen nem küszöböli ki az elsırendő Markov
láncnál
említett illeszkedési hibákat, ugyanakkor a rendszámmal együtt
exponenciálisan növekvı paraméterszám valamint a vizsgált idıszakra vonatkozó relatíve kis megfigyelésszám miatt a paraméterek becslésének a bizonytalanságát erısen növelik.
Berger és Goossens (1983) belgiumi adatokra (Uccle, 1901-1975) 1-4 rendő Markov lánccal elıállított száraz és csapadékos tartamgyakoriságokat hasonlította össze geometriai, logaritmikus, illetve Eggenberger-Pólya eloszlással kapott eredményekkel. A χ2 próbák szerint a száraz és a rövid csapadékos tartamokra a 4-ed rendő Markov, a hosszú csapadékosakra pedig az Eggenberger-Pólya eloszlás illeszkedett legjobban. Ez utóbbi a negatív binomiális eloszlás, amely független geometriai eloszlások konvolúciójaként állítható elı, elsırendő esetben pedig azonos a geometriai eloszlással. 21
Bárdossy (1993) a csapadék idıbeli és térbeli modelljeit összefoglaló tanulmányában a diszkrét modellek összehasonlításánál egy németországi (Essen-Steele) állomás adatsorai alapján (1952-87) arra a következtetésre jutott, hogy Markov felújítási folyamat feltételezésével, maximum likelihood becsléssel kapott száraz ill. csapadékos sorok illeszkedése jobb, mint az 1-3 rendő Markov lánccal, illetve a DMA(2), DARMA(1,1) folyamat alkalmazásával kapott eredmények. Ebben a modellben (Foufoula-Georgiou és Lettenmaier, 1987) az egymást követı napok helyett tartamokat, nevezetesen a csapadékos napok között eltelt idıt állítják elı két geometriai eloszlás súlyozott összegével. Az elv hasonló a Racskó és mtsai cikkben (1991), ahol szintén jó eredménnyel modellezik a száraz ill. nedves napokból álló sorozatokat eltérı paraméterő geometriai eloszlásokkal. Ezeknek a referenciáknak az eredményei azt sugallják, hogy a tartamok geometriai eloszlás valamiféle keverékével történı elıállítása ígéretes megoldás a hosszú periódusok kielégítı reprodukálása szempontjából.
Ugyanakkor Lana és Burgueňo (1998) spanyolországi vizsgálatai szerint (Catalonia 69 mérıhely, 13-58 év) az extrém hosszúságú (22-50 napot meghaladó) száraz idıszakokra jól illeszkedik a Poisson eloszlás, amely elvileg akár az elıforduló másod-maximumok megjelenítésére is alkalmas lehet. Megjegyezzük, hogy a Poisson eloszlás bizonyos feltételek teljesülése esetén a Poisson folyamatot alkalmazó folytonos csapadék modellek kiindulásául is szolgál. Mielıtt rátérünk a fent ismertetett tapasztalatok figyelembe vételével megválasztott csapadék tartam modell leírására, röviden áttekintjük a kitőzıtt feladat alkalmazásához szükséges klímaváltozással kapcsolatos ismereteket.
1.3 A klímaváltozás leskálázása
Az utóbbi évtizedekben egyértelmő igazolást nyert, hogy növekszik az antropogén eredető légköri üvegházgázok koncentrációja. A Klímaváltozás Kormányközi Bizottsága (IPCC – Intergovernmental Panel on Climate Change) rendszeresen jelentéseket készít, melyek a CO2 növekedésének mértékében a lehetséges és a kívánatos jövıre vonatkozó globális tendenciákat (szcenáriókat) prognosztizálnak elsısorban a Föld átlaghımérsékletére vonatkozóan.
22
Bizonyos, hogy a klímaváltozás jövıben valószínősíthetı hatása régiónként, sıt ökológiai rendszerenként eltérı lesz. Bár a feladat nagyon összetett és vitatott, ennek ellenére nagyon fontos a globális éghajlati tendenciák regionális (lokális) lebonthatóságának vizsgálata, a gazdasági, hidrológiai és ökológiai következmények becslése (Bartholy és Matyasovszky, 1998, Harnos, 1998). A változásra való felkészüléshez szükséges különféle gazdaságpolitikai stratégiák kidolgozása céljából ún. hatásvizsgálati másnéven impakt modellek segítségével elemzik a kis térségekre vonatkozó kockázati tényezıket.
Mint ismeretes a globális változások várható mértékét, az Általános Cirkulációs Modellek ( GCM - General Circulation Models) prognosztizálják. A GCM-ek az éghajlati rendszer legfontosabb, determinisztikusan leírható fizikai folyamatait veszik figyelembe, ezért számításigényük rendkívül nagy, az eredmények idıbeli és térbeli felbontását a számítógépek mindenkori teljesítıképessége határozza meg. A jelenlegi GCM-ek a CO2 növekedése következtében beálló általános cirkuláció jellemzıit évszakos átlagokban és kb. kontinentális térskálán megfelelıen tükrözik, azonban a 2-300 km-es rácstávolság miatt szükségszerően figyelmen kívül hagyják az idıjárást közvetlenül kialakító mezo skálájú folyamatok, pl. frontok, ciklonok vagy anticiklonok hatását (Semenov és Barrow, 1997). Ez a felbontás nyilvánvalóan nem elegendı, pl. a gabonanövekedés elemzésénél használatos talaj – növény – klíma, ill. a lefolyást vizsgáló vízháztartás – klíma ill. más, ehhez hasonló kapcsolatokat vizsgáló modellek számára. Ezek a vizsgálatok a különféle globális alternatíváknak megfelelı (rendszerint lokális, napi skálájú) ún. regionális éghajlati forgatókönyveket igényelnek (Giorgi és Mearns, 1991; Wilks, 1992). Következésképpen szükség van olyan módszerekre, amelyek segítségével kisebb régiókban is becsülhetık a feltételezett változások.
A GCM-ekbıl származó rácsponti (grid-) adatokat a megfelelı regionális ill. lokális tér valamint megfelelı idıbeli léptékre “leskálázó” (angolul: down-scaling) eljárásoknak különféle típusai különböztethetık meg (Dubrovsky, 2000). 1)
a direkt, növekményszerő módosítás (Bacsi és Hunkár, 1994),
2)
a dinamikai csatolt vagy beágyazott módszerek (Giorgi és Mearns, 1991),
3)
a sztochasztikus leskálázó eljárások (Matyasovszky és Bogárdy, 1994,1996; ),
4)
az empirikus és félempirikus modellek (Semenov és Borrow, 1997)
5)
Idıjárás Generátorok.
A módszerekrıl részletes áttekintést nyújt Giorgi és Mearns (1991), valamint Bartholy és mtsai (1994, 2001) munkája. 23
Kezdetben népszerő volt a direkt módszer alkalmazása is, amelynél a megváltozott klímára jellemzı idısorokat a GCM szcenárióknak megfelelıen adott grid cellára vonatkozó értékek közvetlen felhasználásával módosították. A hımérsékletekre additív, a csapadék és sugárzás
értékekre
multiplikatív
összefüggéseket
alkalmaztak.
Az
eljárás
korlátja
természetesen a modellek pontatlansága, vagyis a felbontás korlátozott voltából, vagyis számos fontos fizikai folyamat figyelmen kívül maradásából fakadó hiba.
A második megközelítési mód esetében, a GCM eredményeket a rövid távú elırejelzésben is használatos, finom felbontású mezo-skálájú (LAM - Limited Area Models) modellekbe alkalmazzák bemenı adatként, ezek nagy számításigényő módszerek. Elıreláthatólag a csatolt ill. beágyazott modellek idıvel alkalmassá válnak majd a hatásvizsgálatok céljára, jelenleg azonban még csak a lényegesen kisebb számításigényő statisztikai módszerekkel kombinált modellekhez hasonló eredményeket képesek elıállítani.
A sztochasztikus leskálázó modellek a nagytérségő cirkuláció és a regionális, lokális meteorológiai változók közötti statisztikai kapcsolatokon alapulnak (Bartholy és mtsai, 2001). Elsı lépésként a felszíni és a közép troposzférikus légnyomás eloszlás figyelembe vételével makrocirkulációs típusokat (CP - Circulation Pattern) hoznak létre, és minden napot besorolnak egy típusba. A sztochasztikus modell a lokális változó típusok szerinti feltételes eloszlásait állítja elı. A klímaváltozás hatását a GCM-bıl nyert cirkulációs állapotra vonatkozó
számítással
középhımérsékletet
nyerik.
felhasználó
Ez
az
alkalmazás
hidrológiai
tipikusan
modellekben
a
fordul
csapadékot elı
és
(Bartholy
a és
Matyasovszky, 2001; Katz, 1982). Semenov és Barow (1997, 1999) szerint túl sokféle kapcsolat megırzıdését kívánja ez a megközelítés, mivel pl. feltételezi, hogy a GCM-ek képesek pontosan szimulálni a CP típusok gyakoriságait, továbbá a csapadék és hımérséklettel való kapcsolat is megmarad. Az említett elemek és az adott hely cirkulációs típusai közötti kapcsolatok lokális jellege miatt valamely országra kidolgozott módszer másutt nem használható.
Mindegyik downscaling módszernek vannak elınyei és korlátai
közülük a
félempirikus modellek képviselik talán a legjobb kompromisszumot (Bartholy és Matyasovszky, 1998). Az empirikus és szemi-empirikus modellek közös vonása, hogy rendszerint felszíni ill. felszín közeli adatokkal dolgoznak, a bemenı adataik a vizsgált területet lefedı rácspontra esı kevés számú GCM grid outputok, a kimenı adatok pedig 24
lokális léptékőek, ennek következtében a számítások rendszerint PC környezetben elvégezhetık. Ezen módszereknek is megvan az említett hiányossága miszerint az elemek között a jelenben feltárt kapcsolatok a jövıben is fennmaradnak (Dubrovsky és mtsai, 2000). A felsorolt elınyök miatt mégis széles körben elterjedt a félempirikus módszerek alkalmazása.
A direkt módszernél említettük, hogy nem célszerő a GCM-ek rácsponti értékeit közvetlenül, vagy azok interpolációjával származtatni. Ehelyett célszerő a durva felontású megváltozás mezıket valamilyen módon térben leskálázni a hatásvizsgálatokhoz szükséges léptékre, az idıbeli leskálázáshoz pedig sztochasztikus idıjárás generátort alkalmazni (Mika és Wantuchné, 1998). Az SWG kiküszöböli a direkt módszer hibáit, azáltal, hogy a modellek ill. algoritmusok képesek az idıjárási elemek sztochasztikus és dinamikus sajátosságait egyaránt megırzı idısorok elıállítására. A szimulált sorok statisztikai értelemben konzisztensek, azaz momentumaiknak, korreláció struktúrájuknak azonosnak kell lennie a valódi sorokéval valamint az átlagra és varianciára vonatkozó paraméterei egyaránt változtathatók kell hogy legyenek. Ez utóbbi tulajdonság teszi lehetıvé, hogy a megváltozott klímára jellemzı adatsorokat állításunk elı, ehhez azonban tudnunk kell, hogy a globális változások a lokális terülten milyen mértékben módosítják a modell paramétereit. A térbeli leskálázás problémaköre azonban túlmutat jelen dolgozat keretein.
25
2. A disszertációban felhasznált meteorológiai adatok
Az idıjárás generátorokkal kapcsolatos nemzetközi kutatások összehangolása érdekében a BAHC (Biospheric Aspects of the Hidrological Cycle) "the Weather Generator Projet" elnevezéső 4 sz. munkacsoportot hozott létre (IGBP Report, 1993). Felmérésük alapján készült a hatásvizsgálati modellek meteorológiai adatszükségletét tartalmazó 1. táblázat (Bass, 1993). Néhány a bevezetıben említett magyarországi alkalmazás: GAPI lefolyás modell (Bálint és mtsai, 1995), CERES gabonanövekedési modell (Bacsi és Hunkár, 1994; Kovács és Dunkel, 1998), ARCHWEAT búza modell (Harnos, 1998;), homoki gyepekre alkalmazott modell (Kröel-Dulay mtsai, 1998)- jelenlegi meteorológiai adatigényét aláhúzással jelöljük a táblázatban.
Minimális halmaz
Ökológiai modellek
Hidrológiai modellek
csapadékösszeg & forma
csapadékösszeg
max & min hımérséklet
átlag hımérséklet
globál és nettó sugárzás
globálsugárzás
vdp
specifikus nedvesség v. vdp
szélsebesség További halmaz
nedves hımérséklet
max & min hımérséklet
légnyomás
szélsebesség
par
légnyomás relatív nedvesség napfénytartam felhızet rövid és hosszúhullámú sugárzás 1.táblázat
A klímaváltozás ökológiai és hidrológiai következményeit szimuláló modellek meteorológiai adatigénye napi idı- és 10 km-es térskálán. Rövidítések: VDP – vízgız telítési hiány, azaz az adott hımérséklethez tartozó telítési páranyomás és az aktuális páranyomás különbsége ("Vapour Pressure Deficit"); PAR – fotoszintetikusan aktív sugárzás, azaz a globálsugárzásnak a növények által felhasználható hullámhosszak közés esı része ("Photosynthetically Active Radiation")
26
Az állomások kiválasztásánál figyelembe vettük Mika és mtsai (1994) eredményét, amely szerint 16 magyarországi állomás adatainak faktoranalízise alapján a Palmer-féle aszályindex (PDSI) Z-komponense - a PDSI havi változásának háromszorosa - az ország területét két régióra bontja. E régiók centrumainak tekinthetı a melegebb, mediterrán hatás alatt álló Szeged és az Alpok miatt hővösebb, csapadékosabb Szombathely. Mindkettı ún. elsırendő WMO állomás, megfigyelési sorozatukból olyan idıszakot választottunk, amelyre feltételezhetı, hogy az adatsoruk homogén. Az Országos Meteorológiai Szolgálat rendelkezésünkre bocsátotta Szeged (46o 15' N, 20o 06' E, 82 m) és Szombathely (47o 16' N, 16o 38' E, 224 m) 1951-1995 napi értékeit az alábbi meteorológiai elemekre: - csapadékösszeg (mm) - maximum hımérséklet ( oC), - átlag hımérséklet (oC), - minimum hımérséklet (oC), - napfénytartam (óra), - felhızet (1-8 okta), - relatív nedvesség (%), - szélsebesség (m/s), - légnyomás (hPa).
A meteorológiai adatok napi három – helyi középidıben 7, 14 és 21 órakor végzett mérések – átlagolásával készültek. Kivételt képeznek a napi csapadékösszegek, amelyeket a reggel 7 órás észlelések szolgáltatnak. Ebbıl következik, hogy a hajnalban hullott csapadék az elızı napi összeget növeli. A 0,1 mm-nél kevesebb csapadék az ún. nyom. A csapadékküszöb megválasztására vonatkozó elemzéseinket a következı fejezetben részletezzük. A szökınapokat a számítások egyszerősítése érdekében figyelmen kívül hagytuk.
27
3. Száraz és csapadékos tartamok elemzése, modellezése
A továbbiakban a napi csapadékösszegek sorozatait diszkrét idejő sztochasztikus folyamatnak tekintjük és {Rt}-vel jelöljük, ahol t = 1,2,...365,...,N⋅365 a megfigyelt nap sorszáma a teljes idıszakban, N = 45 a megfigyelt évek száma. Megadott K küszöbértéktıl függıen Rt < K esetén a napot száraznak (d), különben pedig csapadékosnak, ill. rövidebben nedvesnek (w) nevezzük .
A szakirodalomban eltérı csapadékküszöb értékeket alkalmaznak. Erre vonatkozó tapasztalatainkat valamint a továbbiakban ismertetésre kerülı saját vizsgálatainkat publikáltuk [Dobi és mtsai, 1996, 2000; Wantuchné 1997, 1998]. A küszöb-választás három gyakorlati kritérium egyidejő teljesülése miatt végül a csapadék megfigyelés mennyiségi küszöbét is jelentı 0,1 mm-t választottuk. E határmennyiség ugyanis ugyanolyan jól szétválasztja a többi meteorológiai elemet, mint az alternatívaként végigszámolt 0,3 mm ill. 1,0 mm (napi átlag). Ugyanakkor a csapadékos napoknak a magyarországi nagytérségő cirkulációt reprezentáló Péczely - típusok (Péczely, 1957) közötti, feltételes gyakoriságai alig különböznek a három küszöbérték esetén. A fı döntési szempont tehát végül az volt, hogy a legalacsonyabb érték adja a leginkább szimmetrikus gyakorisági eloszlást a (kisebbségben lévı) csapadékos és a (többséget alkotó) száraz napok között.
A választott 0,1 mm küszöb szerint az {Rt} adatsort kétállapotú d és w jelekbıl álló jelsorozattá redukáltuk. Ezután a jelen szakaszban a napok sorozatai helyett elıállítottuk a csapadékost követı, ill. azt megelızı, száraz napok egymásutánjaiból képezett idıszakokat, az ún. száraz napokból álló szériákat, valamint analóg módon a csapadékos szériákat (1. ábra). Jelölje Zn = (tn, Xn),n = 0, 1, 2,..., az {Rt} folyamatból származó tartam folyamatot, ahol 1 ≤ tn ≤ 365
jelenti azt, hogy az egymást követı szériák közül az n-edik sorszámú
kezdıpontja az év hányadik napjára esik, míg Xn írja le a széria hosszát és annak száraz vagy nedves állapotát. Ekkor a Zn, n=0,1,2,... folyamat lehetséges értékeinek halmaza (állapottere): Z= {1,2,...,365}×X , ahol a különbözı hosszúságú száraz ill. nedves szériák lehetséges halmazát jelölje D = {di, 1 ≤ i ≤ P}, ill. W = {wj , 1 ≤ j ≤ M}. Itt P ill. M jelöli a reálisan elıfordulható száraz ill. nedves szériák hosszának maximális értékeit és legyen X = {D ∪ W}.
28
d1
d4 W
W
D
D
D
D
w2
W w1
D
d1 W
W
D
w1
1. ábra A száraz (D) / nedves (W) szériák értelmezése.
3.1 Függetlenség vizsgálat
A modellezés számára alapvetı kérdés, hogy amennyiben egyedi napok helyett az ily módon definiált szériákat vizsgáljuk – melyek akár több ciklon, anticiklon átvonulást is lefedhetnek – milyen függıségi kapcsolatokat találhatunk e szakaszok hossza között? Hasonlóan az egymást követı napokra elvégzett rend vizsgálatokhoz esetünkben elıször az egymást követı, ellentétes jellegő szakaszok (pl. szárazat követı csapadékos ill. csapadékosat követı száraz, azaz dw és wd, ahol d ∈ D és w ∈ W) között elsırendőnek nevezhetı kapcsolatot elemeztük. Másrészt azt sem tartottuk kizártnak, hogy létezhet másodrendőnek nevezhetı függés az azonos jellegő idıszakok, pl. egy néhány napos csapadékos tartamot megelızı és azt követı száraz idıszakok közt (dwd ill. wdw). Ezeknek az összefüggéseknek a tisztázására többféle jól ismert elméleti megközelítés lehetséges. Például ellenırizhetı a függetlenséget megfogalmazó nullhipotézis a Markov-függıséget jelentı ellenhipotézissel szemben (pl. Cox és Hinkley, 1978); vizsgálható a függetlenségi hipotézis, pl. a Kendall-féle rangkorrelációk segítségével, vagy más módszerekkel is.
Ellentétben az egymást követı napokra vonatkozó vizsgálatokkal, itt eleve a szériákra vonatkozó megfigyelésszám majdnem egy nagyságrenddel kisebb, az állapottér pedig lényegesen nagyobb. Az itt elmondottakon kívül a következı körülményeket is figyelembe kell venni. A számításokhoz rendelkezésre álló mintaszámokat a közös részmintához tartozás kritériumául választott idıintervallum behatárolja. Bár az évszak a mintaszám alakulása szempontjából kedvezı lenne, tapasztalatunk szerint ez a bontás még részben elfedi az éves menet jellemzıit. A természetes évszakok kiválasztására irányuló számításaink nem vezettek sikerre, mivel a homogenizálási módszerrel (Szentimrey, 1996) elemenként eltérı hosszúságú 29
idıszakok adódtak. A gyakran alkalmazott 10 napos periódusokra a hisztogrammok alakja erısen változik a dekád kezdıpont eltolásának hatására. E megfontolások alapján a havi bontást választottuk és a vizsgálatokat ezekre az idıszakokra végeztük el.
A 2. ábra érzékelteti, hogy a függetlenségi vizsgálatokhoz - az adott hónapra vonatkozó kis mintaszámok miatt – állapot összevonások nélkül nem tudjuk figyelembe venni az összes eltérı hosszúságú tartamot. Elsı közelítésben az állapotteret rövid és hosszú száraz, ill. csapadékos tartamokra szőkítettük le. Ekkor a Zn*= (tn, Xn*) módosított folyamat állapottere Z*= {1,2,...,365}×X* ahol X* = {dS, dL, wS, w L}. Itt dS ill. wS jelöli a rövid száraz ill. csapadékos szériát, dL ill. wL pedig a hosszú szárazat ill. csapadékosat, továbbá H és J a rövid és hosszú tartamok határait. Feltételeztük, hogy a Zn* folyamat egy adott hónapon belül idıben közelítıen homogénnek tekinthetı, vagyis az Xn* sorozat együttes eloszlása nem függ a tn idıpontoktól, ezért elegendı vizsgálni önmagában az Xn* folyamatot, melynek lehetséges állapotai ebben az esetben:
d S ha 1 ≤ S ≤ H d L ha H < L ≤ P * Xn = w S ha 1 ≤ S ≤ J w L ha J < S ≤ M Amennyiben az így leszőkített állapottér esetén kimutatható függıségi kapcsolat az Xn* sorozatra, úgy érdemes tovább finomítani ezt a felbontást. A határokat variáltuk, megválasztásuknál figyelembe vettük a tartamok havonkénti gyakorisági eloszlásait és az egyes kategóriákba jutó esetszámokat. H-t 4 napnak, J-t pedig a kevés hosszú csapadékos szakaszra való tekintettel, 2 napnak vettük. Az Xn* folyamat közvetlenül egymást követı állapotai között feltételezett függetlenséget az alábbi módon ellenıriztük. Minden hónapra kiszámítottuk az (Xn'*, Xn'+1*) tartampárok gyakoriságait olymódon, hogy a száraz szériát követı csapadékos párok (dw) esetén Xn'* = dS vagy dL és Xn'+1* = wS ill. wL ahol n', (1<= n' <= N*365) azokat az indexeket jelöli, amelyekre a tn' és tn'+1 idıpontok mindegyike a megadott hónapba esik. Ez esetben a kérdéses mullhipotézis: P( X *n ′ = d j , X *n′ +1 = w i ) = P( X *n′ = d j ) P( X *n ′ +1 = w i ) , ahol értelemszerően i,j = S,L. Fordított helyzetekre, azaz a csapadékossal kezdıdı tartam párokra (wd ) analóg módon végeztük a számítást.
30
2. ábra A 15 napnál hoszabb száraz tartamok gyakorisága 0.1 mm (piros) és 1.0 mm (kék) küszöbválasztás esetén.
A függetlenség - vizsgálatra χ2 próbát alkalmaztunk, melynek részeredményeit (J = 1 és H = 1,2,3,4 határokra) a megfelelı esetekre a 2. táblázatban közöljük. A próba egy szabadsági fokú, a 0,95 szinthez tartozó kritikus értéket meghaladó statisztikát vastaggal szedtük. A χ2 próba szerint a hipotézist elfogadhatjuk, tehát beláttuk hogy a rövid és hosszú száraz és csapadékos idıszakokat (egy kivételtıl eltekintve) függetlennek tekinthetık. Az Xn* folyamat egymást követı azonos jellegő állapotai közötti másodrendő kapcsolatokat hasonló gondolatmenet alapján vizsgáltuk. Képeztük a váltakozó jellegő szériák sorozataiból álló (Xn'*, Xn'+1*, Xn'+2*) hármasok gyakoriságait, amelyeket pl. a száraz kezdıállapot (dwd) esetén az Xn'* = dS, dL , Xn'+1* = wS, wL és Xn'+2* = dS, dL események alapján értelmeztünk. A nullhipotézis ekkor: P( X *n ′ = d j , X *n ′ +1 = w i , X *n ′ +2 = d k ) = P( X *n ′ = d j ) P( X *n ′ +1 = w i ) P( X *n ′ +2 = d k ) , ahol i, j, k = S, L. A számításokat az egymást követı csapadékos (wdw) szériákra is elvégeztük az elsırendő vizsgálattal megegyezı feltételekkel. A χ2-próba ez esetben három szabadsági fokú. A 0,95 megbízhatósági szinthez tartozó értékeket szintén a 2. táblázat mutatja. Az eredmények szerint az egymás utáni azonos jellegő szériák is függetlennek tekinthetık.
31
wdw (df = 3) Wet =1 nap
wd (df = 1) Wet =1 nap Dry
1
2
3
4
Jan
0.2
0.1
2.1
1.4
Feb
0.5
1.0
0.0
Már
0.3
0.2
Ápr
1.1
Máj
1
2
3
4
Jan
1.1
0.8
0.6
1.0
0.1
Feb
3.1
3.5
1.7
1.6
0.1
0.3
Már
1.3
2.3
3.6
2.9
0.0
0.4
0.0
Ápr
1.8
2.0
2.3
2.3
0.2
1.0
2.5
2.7
Máj
5.0
5.1
4.8
1.9
Jún
0.1
0.1
0.2
0.2
Jún
5.4
7.1
8.3
8.5
Júl
0.1
1.7
3.5
4.1
Júl
0.3
2.3
4.6
2.1
Aug
3.2
2.3
2.3
1.4
Aug
1.6
2.1
3.7
2.6
Sept
0.7
1.2
1.8
0.0
Sept
0.8
2.2
1.9
1.1
Okt
0.8
0.0
0.2
0.1
Okt
0.5
0.3
1.3
1.1
Nov
0.0
0.1
0.8
2.7
Nov
5.0
1.2
0.3
0.3
Dec
1.5
0.2
0.0
0.0
Dec
2.6
3.5
11.4
2.7
dw (df = 1) Wet =1 nap Dry
Dry
dwd (df = 3) Wet =1 nap
1
2
3
4
Jan
0.4
0.5
0.1
0.4
Feb
0.3
0.1
0.1
Már
0.4
1.0
Ápr
0.0
Máj
Dry
1
2
3
4
Jan
0.7
2.0
4.6
5.9
0.4
Feb
1.2
3.1
2.5
2.0
0.5
0.6
Már
1.4
2.0
0.2
1.8
0.0
0.4
0.0
Ápr
4.0
3.0
1.9
3.6
0.9
2.9
2.7
0.5
Máj
2.2
3.5
3.2
2.8
Jún
0.3
2.1
3.6
3.5
Jún
0.6
3.1
6.2
8.3
Júl
0.0
1.4
3.5
1.7
Júl
0.9
6.9
7.8
9.4
Aug
0.1
0.5
1.1
0.7
Aug
6.4
2.3
5.6
3.1
Sept
0.0
1.1
0.0
0.1
Sept
2.5
1.4
2.8
1.3
Okt
0.4
0.2
1.2
1.1
Okt
2.2
0.1
1.1
0.1
Nov
1.5
0.8
0.0
0.1
Nov
1.2
3.4
1.0
5.2
Dec
0.2
1.9
9.2
1.0
Dec
2.8
0.5
1.2
2.4
2. táblázat χ próba eredményei az elsırendő (balra) és másodrendő (jobbra) függetlenség vizsgálatok esetén 2
(J=1 nap) Szegeden 1951-1990. Vastagon szedtük a 0,95 szignifikancia szintet meghaladó értékeket. 32
3.2 Eloszlásillesztés
Ezt követıen, az elızı fejezetben összefoglalt szakirodalom tapasztalatait figyelembe véve, illeszkedés vizsgálatot végeztünk. Egymástól független havi száraz és csapadékos szériákra geometriai (1) és kevert eloszlásokat illesztettünk az alábbi módon. Egyrészt vettük két geometriai eloszlás súlyozott összegét (GG) a (2) képlet szerint, másrészt geometriai és Poisson eloszlások súlyozott összegével (PG) számoltunk (3) alapján.
P( ξ = k ) = ⋅p ⋅ (1 − p) k −1 , k = 1,2,...
(1)
P1( ξ = k ) = r ⋅ p1 ⋅ (1 − p1 )k−1 + (1− r ) ⋅ p2 ⋅ (1 − p2 )k−1 , k = 1,2,...
(2)
P2 ( ξ = k ) = s ⋅ q ⋅ ( 1 − q ) k −1 + ( 1 − s ) ⋅
λ k −1 e − λ , k = 1,2,... ( k − 1 )!
(3)
ahol r és s a keverék eloszlások súlytényezıi. A korábban használt P és M praktikusan megválasztott konstansok, melyek mellett az ezeknél hosszabb szériák megjelenésének valószínősége gyakorlatilag már nullának tekinthetı. Az eloszlások paramétereit és a súlytényezıket kvázi-Newton módszerrel becsültük a négyzetes eltérést minimalizáló veszteség-függvény mellett. A számítások eredményeit a 3. ábra mutatják havonta a száraz (felül) ill. csapadékos tartamokra (alul). A szemléletesség kedvéért mindegyik ábrán feltüntettük a geometriai eloszláshoz tartozó, gyenge éves menetet mutató p értékeket is. Szembetőnı, hogy a súlytényezık a különbözı klímájú állomásokra az év folyamán eltérı mértékben ingadoznak.
A száraz tartamoknál r és p2 szabályos éves menetet mutat Szegedre, Szombathelyre azonban – a két állomás eltérı klímájának (gyakorisági eloszlásának) egyik sajátosságaként hektikus. A jellemzıen rövid csapadékos esetekben a nullához közeli súlytényezık (néhány kivételtıl eltekintve) eliminálják a második tagot. Ilyenkor az egyszerő geometriai eloszlás gyakorlatilag megegyezik a (2) alapján kevert geometriaival. A Poisson eloszlás figyelembevételével kapott s és λ görbék minden esetben markánsan eltérnek. A száraz tartamokra vonatkozó 3. ábra felsı részén látszik, hogy a súlytényezık értéke rendszerint magas, sıt néhány hónapban közelítıleg egy, ami arra utal, hogy a geometriai tag dominál a keverék eloszlásban. A Poisson eloszlás hozzájárulása elsısorban a hosszú tartamoknál érzékelhetı. Csapadékos esetben (3. ábra alsó része) az alacsonyabb s értékek mellett - fıként Szombathelyre - a Poisson eloszlás hatása hatékonyabbá válik.
Szeged (1951-95)
Szombathely (1951-95)
1.0
1.0
GG
0.8
0.8
0.6
0.6
0.4
0.4
0.2 0.0 1
2
3
4
5
6
7
8
9
10 11 12
1.0
0.2
R p1 p2 p
1
0.8
0.8
0.6
0.6
0.4
0.4
1
2
3
4
5
6
7
8
9
10 11 12
3
4
5
6
7
8
9
10 11 12
0.2
S q l p
0.0
2
1.0
PG
0.2
R p1 p2 p
0.0
S q l p
0.0 1
2
3
4
5
6
7
8
9
10 11 12
3. ábra Felül: A száraz tartamokra illesztett eloszlások paraméterei és a súlytényezıi havonta: felül a két geometriai,
alul
a
geometriai
és
Poisson
eloszlások
súlyozott
összegére.
A bal oldali ábrák Szegedre, a jobb oldaliak Szombathelyre vonatkoznak. (Jelölés: λ = l). Alul: ua. csapadékos tartamokra. Szombathely (1951-95)
Szeged (1951-95) 1.0
GG
0.8
1.0 0.8
0.6
0.6
0.4
0.4
0.2 0.0 1
2
3
4
5
6
7
8
9
10 11 12
1.0
R p1 p2 p
PG
0.8
0.2 0.0 1
0.4
0.4
0.0 1
2
3
4
5
6
7
8
9
10 11 12
4
5
6
7
8
9
10 11 12
0.8 0.6
s q l p
3
1.0
0.6
0.2
2
R p1 p2 p
0.2 0.0 1
2
3
4
5
6
7
8
9
10 11 12
s q l p
34
Szeged DRY
G
MG
Jan
25.1 (9)
9.2 (11)
Feb
21.1 (8)
3.7 (10)
Márc
8.7 (10)
Szombathely PG 8.5 (11) 11.1 (9)
G
MG
PG
11.5
(10)
9.2 (10)
9.2 (10)
12.0
(8)
4.4 (9)
4.4 (9)
5.8 (11)
6.1 (10)
7.9
(10)
6.5 (10)
8.3 (10)
Ápr
12.9 (9)
9.8 (9)
10.2 (10)
11.7
(9)
5.3 (10)
5.4 (10)
Máj
5.3 (9)
5.0 (9)
5.4 (9)
8.2
(9)
6.9 (10)
7.1 (10)
Jún
18.9 (7)
2.3 (9)
2.7 (9)
9.9
(7)
5.5 (8)
4.6 (8)
Júl
26.2 (10)
6.8 (12)
6.6 (12)
5.4
(9)
5.4 (9)
4.6 (9)
Aug
25.1 (11)
15.9 (12)
13.3 (12)
15.3
(9)
13.8 (9)
11.7 (10)
Szept
15.3 (10)
5.8 (12)
5.9 (12)
12,0
(9)
9.1 (11)
9.1 (11)
Okt
51.9 (9)
12.3 (12)
9.5 (13)
35.4
(9)
7.6 (12)
9.3 (11)
Nov
17.4 (8)
4.5 (10)
5.0 (9)
19.9
(9)
15.6 (9)
Dec
13.8 (7)
8.5 (8)
9.3 (9)
19.7
(8)
5.6 (9)
WET
G
MG
PG
G
18.7 (9) 1.9 (10)
MG
PG
Jan
4.9 (6)
5.0 (6)
2.5 (5)
3.4 (5)
3.4 (5)
0.7 (5)
Feb
5.2 (6)
5.2 (6)
6.1 (6)
9.9 (5)
10.0 (5)
12.6 (5)
Márc
0.5 (5)
0.5 (5)
0.4 (5)
16.1 (6)
16.5 (6)
3.3 (5)
Ápr
7.0 (6)
7.1 (6)
6.9 (6)
6.0 (6)
6.0 (6)
0.9 (5)
Máj
6.6 (6)
6.6 (6)
6.6 (6)
6.1 (6)
7.4 (7)
6.2 (6)
Jún
1.9 (5)
1.9 (5)
2.3 (5)
1.1 (6)
1.1 (6)
0.7 (6)
Júl
0.8 (4)
0.8 (4)
1.1 (5)
6.6 (6)
6.7 (6)
1.8 (5)
Aug
0.3 (4)
0.3 (4)
0.3 (4)
2.6 (5)
2.7 (5)
2.3 (5)
Szept
5.8 (4)
5.9 (4)
3.3 (4)
8.9 (5)
8.9 (5)
2.3 (5)
Okt
5.2 (5)
5.3 (5)
5.1 (5)
1.0 (5)
1.1 (5)
0.7 (5)
Nov
0.8 (6)
0.8 (6)
0.5 (6)
6.7 (6)
5.7 (6)
3.7 (6)
Dec
10.0 (6)
10.0 (6)
4.0 (5)
2.8 (6)
2.8 (6)
2.8 (6)
3. táblázat Az illeszkedésvizsgálat eredményei: χ2 értékek (szabadsági fokuk) havonta száraz és nedves idıszakokra Szegeden és Szombathelyen. A vastagított értékek a megfigyelt eloszlástól vett szignifikáns eltérést jelezik, 95% megbízhatósági szinten. Rövidítések: G - geometriai, GG - két geometriai súlyozott összege, PG - Poisson és geometriai súlyozott összege.
35
A fenti eloszlások illeszkedését χ2 próbával teszteltük, a 3. táblázatban vastaggal szedtük a 0,95 szinten szignifikáns eltérést mutató értékeket. Zárójelben tőntettük fel a szabadsági fokok számát, amelyek különbségeit a száraz és csapadékos szériák havonta eltérı hossza - emiatt eltérı darabszáma - és a kis gyakoriságok szükséges összevonása indokolja.
A száraz tartamoknál a keverék eloszlások eredménye hasonló: egyetlen kivétellel (Szombathely november) az illeszkedés lényegesen jobb, mint a geometriai eloszlásé. Csapadékos tartamokra az egyszerő geometriai eloszlás is megbízható, a PG eloszlás azonban, néhány kivételtıl (pl. február) eltekintve, – fıként Szombathelyre – sokkal kisebb hibával közelíti a mintát. A PG eloszlás tehát mindkét esetben egyértelmően jobb, mint a G.
A 4. ábrán olyan hónapokat mutatunk be, melyeknél a Poisson eloszlás alkalmazása "látványosan" javít az illeszkedésen. Korrigálja a geometriai eloszlás jellegébıl adódó jellegzetes hibákat, nevezetesen a bal oldali hisztogrammnál a kis valószínőségő részeket, a jobb oldalinál pedig az 1-2 napos csapadékos szériák túlbecslését.
100
40 OBS G PG GG
30
80
60
20 40
10
0
20
0
1
3
5
7
9 11 13 15 17 19 21 23 25 27 29 31 33
1
3
5
7
9
WET
DRY
4. ábra A száraz tartamokra illesztett eloszlások Szegeden októberben (bal), és csapadékos tartamokra Szombathelyen márciusban (jobb). Rövidítések: OBS - megfigyelés, G - geometriai, GG - két geometriai, PG-kevert Poisson és geometriai eloszlás keveréke.
A keverék eloszlások módosító hatása fıként nagy k értékek esetén, az extrém száraz tartományban jelentkezik. Ennek érzékeltetésére összehasonlítottuk a három eloszlásból adódó kis valószínőségő - az aszályok megfelelı modellezése szempontjából azonban döntı fontosságú - tartamok számát. A 0.98-ad rendő kvantilist meghaladó ill. a 45 év alatt 36
elıfordult leghosszabb tartamok alapján számított elméleti és a valódi mintaszámok eltérését Szegedre a 5. ábrán tőntettük fel. Látható az ábrán, hogy a keverék eloszlások kevésbé térnek el a tapasztalati gyakoriságoktól, mint az egyszerő geometriai eloszlás. Februárban és októberben a PG, augusztusban az GG-vel kapott extrém tartamgyakoriságok száma az adott intervallumban igen jó egyezést mutat a szegedi mintáéval. További három hónapban valamivel több (lásd az ábrán a pozitív tartományba esést), rendszerint azonban csak legfeljebb néhány darab mutat kevesebbet hosszú tartamok esetén a várható számnál.
6 G GG PG
Number of cases
4 2 0 -2 -4 -6 -8
1
2
3
4
5
6
7
8
9
10
11
12
5. ábra A geometriai és a keverék eloszlásokkal elıállított extrém hosszú száraz (0,98-ad rendő kvantilist meghaladó) tartamok számának eltérése a tapasztalati gyakoriságoktól Szegeden, 1951-95. (Minél rövidebb az oszlop, annál jobb az illeszkedés.)
A Szegedre és Szombathelyre kapott eredmények egyaránt azt igazolják, hogy a száraz és csapadékos tartamok modellezésére alkalmas a geometriai és Poisson eloszlás súlyozott összege, amely a Magyarországon jellemzı hosszú száraz és jellegzetesen rövid csapadékos tartamokra minden hónapban magas megbízhatósági szinten illeszkedik.
37
4. Elıkészítı lépések
Ismert, hogy a meteorológiai paraméterek idısoraiban az évszakos változásoknak megfelelıen éves menet jelentkezik. Ennek kiküszöbölésére szokás használni additív (illetve multiplikatív) modelleket. Ezt követve a meteorológiai idısorokat felbontjuk determinisztikus és sztochasztikus tagok összegére (ill. szorzatára). Korábbi vizsgálataink szerint az egymást követı száraz / csapadékos szériák hossza független valószínőségi változóknak tekinthetık (az eloszlásokkal összefüggı becslési kérdésekre részletesen kitértünk). Ez a felismerés vezetett ahhoz a gondolathoz, hogy a különbözı meteorológiai paramétereket megvizsgáljuk külön - külön a száraz / csapadékos napokból álló szakaszokon.
Dolgozatunkban a csapadék állapotától függı feltételes idısor modellt dolgoztunk ki. Elsı lépésként a mérések sorozatáról a 4. 1. fejezetben megmutattuk, hogy a vizsgált változók állapotterét a csapadék állapota kettéválasztja és szignifikánsan eltérı statisztikai mutatókkal rendelkezı mintákat eredményez. Ennek értelmében a száraz illetıleg csapadékos napok szerint kettéválasztott mintákból elıször a determinisztikus tagokat távolítottuk el oly módon, hogy az adott hely éghajlatára jellemzı átlagok és szórások periodikus éves menetét kiküszöböltük a feltételes sorokból. Ezt követıen ebben a fejezetben a maradék rezidum sor jellemzıit tanulmányoztuk. A hasonló elven nyugvó modellekhez képest sokkal részletesebb vizsgálatokat végeztünk az összes általunk vizsgált meteorológiai változónak a csapadékos ill. száraz tartamok hossza szerinti valamint a tartamokon belül a sorszámok szerinti összefüggések megismerésére (4. 1. 4. fejezet). A fejezet további részében ( 4.2, 4.3, 4.4) az idısor analízis standard eljárásainak felhasználásával tártuk fel a modell kialakításához szükséges információkat. Az eredményekre épülı modell fejlesztési lépéseit az 5. fejezetben kerülnek ismertetésre.
4.1 Transzformációk
A szakirodalomban az éves periódus eltávolítására leggyakrabban alkalmazott eljárás a Fourier transzformáció (Amed et al., 1986; Dévényi és Gulyás, 1988; Panofsky és mtsai, 1958), amely a gyakorlatban néhány együttható segítségével lehetıvé teszi az idısor "jó" közelítését. A paraméterek száma nem elhanyagolható szempont a modell kiválasztásnál, hiszen a paraméterek változtatása teszi lehetıvé a klímaváltozással összefüggı alkalmazást.
38
A Fourier transzformáció számításigénye mindkét módszer esetén N2 nagyságrendő, ezért célszerő nagy mintaszám esetén a gyors Fourier transzformációt alkalmazni (FFT). Ezáltal N⋅ln(N) szorzóval arányos lesz azon mőveletek száma, melyek elıállítják az együtthatókat, illetve inverz FFT esetén a közelítı sort. Az alábbi négy pontban ismertetjük az alkalmazott számítás algoritmusát.
4.1.1 Sokéves napi átlag és szórás számítása száraz és csapadékos napok szerint A ξj(h,t) valószínőségi változó értékét a j-edik meteorológiai elemre (j=1,…,8) a h-adik év
(h=1,…,N;
N=45) t-edik napján (t=1…,365) jelölje
feltételes
várhatóértéket
csapadékos
esetben
a
xj(h,t). Adott napon a
következıképpen
értelmezzük
E[ξj(h,t) | R(h,t)>0] ahol R(h,t) a napi csapadékösszeg, illetıleg E[ξj(h,t) | R(h,t)=0] csapadékmentes napokon. Az átlaggal történı becsléseket az alábbi módon végeztük el:
xW j (t ) =
1 n
n
∑ x i, j (h, t )
x Dj ( t ) =
és
i =1 { R ( h , t ) >0}
1 m
m
∑ x i, j (h , t )
i =1 {R ( h , t )=0}
ahol j = 1,…,8 és n = n(t) a csapadékos, m = m(t) a száraz napok száma az év t-ik napján és minden t = 1,…,365 esetén n + m = N. Az empirikus szórások számítása:
n
m
∑ (x i, j (h, t) − x Wj ( t))
sW j (t)
=
i =1 {R j ( h , t ) > 0}
n
∑ (x i, j (h, t ) − x Dj ( t))
ill.
s Dj ( t )
=
i =1 {R j ( h , t ) =0}
m
4.1.2 Fourier sorfejtés alkalmazása a sokéves feltételes statisztikákra
A sokéves feltételes átlagok és szórások diszkrét értékeit periodikus függvénnyel közelíthetjük, ezért a vizsgált statisztikák simítására célszerő alkalmazni a Diszkrét Fourier Transzformáltat (DFT) (Richardson, 1981; Racskó és mtsai 1991). A közelítı függvény komplex alakját Székely (1994) nyomán a Függelékben közöljük. Jelölje fi, i = 1,...M, M=365 diszkrét, valós értékő minta elemeket. Ekkor a DFT komplex együtthatói az alábbi módon állíthatók elı: Dn =
1 M −1 2π f k exp − i nk , ∑ M k =0 M
n = 0,...M − 1 .
39
A transzformált elemek között szimmetria összefüggések állnak fenn, nevezetesen DM-n = Dn* ahol a D-n = Dn* komplex konjugált és D0 jelöli a stacionárius tagot, valamint D0 és DN/2 valósak. Az n-edik harmonikus megmagyarázza a szórásnégyzet Cn2/ 2s2 százalékát, ahol az n-edik harmonikus amplitúdója Cn2 = An2 + Bn2 és s2 pedig a teljes szórásnégyzet. Tapasztalatok szerint meteorológiai idısoroknál az N/2 számú harmonikus helyett az elsı néhány tag kielégítı pontosságú közelítést eredményez (Panofsky, 1958; Richardson, 1981). A komplex együtthatók valós és képzetes részét Szegedre a 4. táblázat tartalmazza.
SZÁRAZ Re Im Re (D 1) (D 1) (D 2) D0 16,6 -6,4 1,6 -0,9 Max. hım. Átlag Szórás 4,4 0,4 -0,3 -0,0 10,7 -5,7 1,4 -0,4 Átl. Hım. Átlag Szórás 3,8 0,4 -0,2 0,1 5,3 -4,7 1,3 -0,1 Min. hım. Átlag Szórás 3,9 0,9 -0,1 0,10 72,2 5,9 0,7 1,8 Rel. Nedv. Átlag Szórás 8,2 -0,2 -0,3 -0,9 6,9 -2,1 0,0 -0,2 Napf. Tart. Átlag Szórás 3,1 -0,1 -0,2 -0,1 Átlag 3,8 0,5 -0,2 0,2 Felhızet Szórás 2,1 0,1 -0,0 -0,0 Átlag 3,2 0,1 -0,3 -0,1 Szél Szórás 1,5 0,1 -0,1 -0,0 0,2 Légnyomás Átlag 1019,0 2,1 0,6 Szórás 6,2 1,5 -0,4 0,2
CSAPADÉKOS Im Re Im Re (D 2) D0 (D 1) (D 1) (D 2) -0,1 15,3 -5,8 1,7 -0,5 -0,1 4,5 0,2 -0,1 -0,1 0,0 10,5 -4,9 1,6 -0,3 -0,1 3,6 0,3 -0,1 0,1 0,1 6,7 -4,3 1,5 -0,2 -0,1 3,5 0,6 -0,1 0,1 0,1 80,3 4,1 0,1 0,7 0,1 8,6 -0,9 0,1 -0,6 -0,1 3,2 -1,4 0,1 0,2 0,1 2,8 -0,7 -0,0 -0,0 0,2 6,2 0,5 -0,1 -0,0 0,0 1,5 -0,1 0,0 -0,0 0,0 3,7 0,2 -0,2 -0,1 -0,0 1,5 0,2 -0,1 -0,0 0,0 1012,9 0,4 0,5 0,3 -0,1 6,3 -1,4 -0,3 0,1
Im (D 2) -0,0 -0,1 0,1 -0,1 0,1 -0,1 0,2 0,0 -0,1 -0,0 0,1 -0,0 0,0 0,0 -0,1 0,1
4. táblázat Fourier együtthatók száraz (bal) és csapadékos (jobb) napokon (Szeged 1951-95).
4.1.3 Simított sokéves feltételes átlagok elıállítása Inverz Fourier Transzformációval
A táblázatban szereplı transzformáltak ismeretében adott elem Inverz Diszkrét Fourier Transzformációval a következıképpen állítható elı:
fn =
2
2π
∑ D k exp(i M nk)
k =0
40
Az fn függvényt a hullámmal jelölt, simított feltételes átlagok ill. szórások: ~ ~D ~W ~D xW j ( t ) , x j ( t ) , s j ( t ) és s j ( t ) elıállítására alkalmazzuk. Az 6. ábra illusztrálja, hogy a simított sokéves átlagok és szórások a tanulmányozott elemek mindegyikénél szignifikánsan különböznek a csapadék állapotától függıen, valamint markáns éves menetet mutatnak csapadékos és száraz napokon egyaránt.
HÕMÉRSÉKLETEK
FELHÕZET
35
8
30 7 25
20
6
15 5 10
5
4 DMAXM WMAXM
0
DTEMPM WTEMPM
3
DMINM
-5
WMINM -10
2 0
30
60
90
120
150
180
210
240
270
300
330
360
0
30
60
90
120
NAPFÉNYTARTAM
150
180
210
240
270
300
330
360
270
300
330
360
SZÉLSEBESSÉG
12
4.8
10
4.4
8
4.0
6
3.6
4
3.2
2
2.8
0
2.4 0
30
60
90
120
150
180
210
240
270
300
330
360
0
30
60
90
120
RELATÍV NEDVESSÉG
150
180
210
240
LÉGNYOMÁS
92
1024
88
1022
84
1020
80
1018
76
1016
72
1014
68
1012
64
1010
DRY
60
WET
1008 0
30
60
90
120
150
180
210
240
270
300
330
360
0
30
60
90
120
150
180
210
240
270
300
330
360
6. ábra Meteorológiai elemek sokévi feltételes átlagainak éves menete Fourier sorral simított száraz (piros) és csapadékos (kék) napokon.
41
4.1.4 Rezidum sorok elıállítása a simított sorok felhasználásával
A napi idısorban lévı átlagos éves menet eltávolítására érdekében a simított feltételes átlagok és szórások felhasználásával standardizáltuk a különbözı elemek napi értékit, figyelembe véve a nap száraz ill. csapadékos állapotát: x j (h , t ) − ~ xW j (t ) ha R (h , t ) > 0 ~s W ( t ) j y j (h , t ) = ~D x j (h , t ) − x j ( t ) ha R (h , t ) = 0 ~s D ( t ) j Ez a lineáris transzformáció nagy pontossággal nulla átlagúvá és egy szórásúvá alakítja az {yj(h,t); j=1,..8; h=1…45, t=1…365) mintákat, ugyanakkor az eredeti sorokra jellemzı ferdeséget, lapultságot és korrelációkat megırzi. Így a periodikus függvénnyel leírható komponenseket eltávolítottuk az adatsorokból, s a továbbiakban a reziduum tagok modellezésére törekszünk. Az 7. ábra illusztrálja a számítás fıbb lépéseit. NAPFÉNYTARTAM 18 Száraz Csapadékos 14
1951
ÁTLAG
10
6
2
-2 4.6
4.0
SZÓRÁS
3.4
2.8
2.2
1.6
1.0 4 3 2
REZIDUM
1 0 -1 -2 -3 -4 0
30
60
90
120
150
180
210
240
270
300
330
360
7. ábra A napfénytartam napi menete 1955-ben, a sokéves napi átlagok (felül) és szórások (középen) csapadékos és száraz napokon, valamint a rezidum sor(alul). (Szeged 1951-1995).
42
A felsı grafikon a napfénytartam feltétel nélküli napi összegeit mutatja egy adott évben (1955-ben: folytonos szürke görbe). A Fourier sorral simított 45 éves feltételes átlagot (felül) és szórást (középen) a folytonos piros görbe ábrázolja csapadékos, a kék pedig a száraz napok átlagaként. A napfénytartam átlagos értéke száraz napokon lényegesen magasabb, mint csapadékos esetekben. A szórás csapadékos napok szerinti éves menetét nagyobb éves ingás jellemzi, mint a szárazét. Alul a standardizálással elıállított maradék sor látható.
További próbákra van szükség annak ellenırzésére, hogy található-e szignifikáns különbség az elemek feltételes statisztikáiban tetszıleges hosszúságú száraz (csapadékos) idıszakon belül. Amennyiben az 1, 2, 3, ≥4 napjaira vonatkozó átlagok és szórások között találunk eltéréseket, akkor nem elegendı csak csapadékos és száraz napok szerint szétválasztani az adatokat, hanem az eredményeknek megfelelıen a szériákon belül további megkülönböztetés szükséges.
A kérdés megválaszolásához elıször kiszámítottuk a feltételeknek megfelelı statisztikákat, melyek közül a maximum hımérsékletre, a relatív nedvességre és a légnyomásra vonatkozó átlagokat és szórásokat a tartamon belüli sorszámuk szerint a 8. és 9. ábrákon tőntettük fel. A megközelítıleg nulla várható értéket ill. egységnyi szórást jelzı (piros) vonal körül eltérı mértékben szóródnak a szakaszon belüli sorszámra utaló jelek.
Különösen szembetőnı az elsı napok elkülönülése a többitıl (8. ábra). A piros pontok, a száraz ill. csapadékos feltételtıl függıen, rendszerint ellentétes elıjelőek. Példaként a relatív nedvességnél maradva, száraz szériákban az elsı napra vonatkozó átlagok lényegesen nagyobbak, mint késıbb, hiszen a levegı a következı napokon a hımérséklet emelkedésével párhuzamosan, relatíve kiszárad.
Mindez a tartamokon belül az elsı napok szisztematikus megkülönböztetésére utal. Ahhoz, hogy az elsı, második, stb. napokra vonatkozó átlagok (szórások) azonosságának hipotézisét konkrét valószínőségi szinten el tudjuk dönteni a normalitás feltételezése mellett, az átlagok összehasonlítására páronként u, a szórásokra pedig F próbát alkalmaztuk (5. táblázat). Amennyiben az egy dimenziós normalitási teszt szerint valamely elem nem volt normális eloszlásúnak tekinthetı, akkor a Mann-Whitney teszt szerint jártunk el.
43
Max. hım.
Átl. hım
Min. hım
Rel. nedv.
Napf. tart.
Felhızet D
W
D
W
D
W
D
W
D
Jan.
0.7
1.1
0.2
1.7
0.1
2.6
0.9
2.3
0.2 -1.7 0.4
0.5 -0.1 -1.1 -2.2 1.2
Febr.
1.0 -0.6 1.6 -0.3 1.7
0.1
0.2
0.9
0.2 -0.4 0.3
0.5 -0.5 -0.1 -1.2 2.3
Márc.
1.4
0.2
1.6
0.4
1.3
1.2
0.0 -0.3 -0.7 -1.1 1.1
0.8 -0.6 -0.3 -2.5 1.5
Ápr.
1.5
0.1
1.9
0.1
1.1
0.6
2.3
0.4 -0.5 0.9
Máj.
1.1
0.4
1.6 -0.1 1.8
0.3
1.0
0.1 -0.5 -0.3 0.8
Jún.
0.8 -0.2 1.0 -0.7 0.5 -1.0 1.5
0.2 -1.6 0.4
Júl.
-0.6 -0.6 -0.6 -1.1 -0.3 0.2
0.8
0.7
0.8 -0.7 0.9
Aug.
0.8
0.5 -0.9 -0.1 -0.4 0.3
1.5
0.4 -0.3 0.1 -0.8 -3.1 0.3 -2.0 0.2
Szept.
0.1 -0.9 0.6 -0.7 1.1
2.5
Okt.
2.4 -0.8 2.4
0.1
0.7
1.3 -1.2 1.9
Nov.
1.3 -0.0 1.3
0.2
0.9
0.5
Dec.
-0.6 -0.1 -0.3 -0.1 -0.3 -0.5 2.3 -0.2 -1.4 0.1
0.9
0.6
W
D
W
Nyomás
D
0.0
W
Szél
D
W
0.1 -0.9 -2.6 -0.5 -3.8 2.4 0.2 -0.7 0.0 -2.6 1.5
1.6 -0.6 -2.8 -0.8 -2.7 3.1
3.1 -0.2 -1.4 0.7
1.3 -0.2 0.9 -2.3 1.4
0.4
0.1 -2.8 -0.0 2.2
1.0 -0.5 -1.7 1.8
0.4
0.7
0.0 -4.6 1.4
1.7 -0.9 -3.3 1.0 0.4 -1.8 -3.7 3.3
1.4 -0.1 -0.3 -1.4 -2.8 0.6
5. táblázat Két mintás u próbával számított próbastatisztikák. H0: az egy napos szériákra és a több napos tartamok elsı napjaira számított átlagok megegyeznek. Kiemeltük az N (0,1) eloszlás 0,95 szignifikancia szinthez tartozó 1,64 értéket meghaladó u statisztikákat. (D - csapadékos, W - száraz)
A számítást havonként minden elemre a csapadékos szériák elsı és második (W1 & W2), második és harmadik (W2 & W3), harmadik és legalább negyedik (W3 & W4) napjára elvégeztük. Az 6. táblázatban a 0,95 szinthez tartozó szignifikáns eltéréseket jelöltük (csillaggal az átlag, körrel a szórás esetén). A szürke háttérszínezés jelzi azokat az átlépéseket és hónapokat, amikor a Kolmogorov - Szmirnov próba szerint nem normális az eloszlás. A legtöbb eltérést az elsı és a második napok feltételes átlagai között tapasztaltuk, amik csaknem minden elemre legalább az év felében szignifikánsnak adódtak. Szintén nem hagyható figyelmen kívül a 3. és a 4. tartam-kategória (3 illetve legalább 4 nap) közötti különbség, különösen a gyakran igen hosszú száraz szériák maximum-, minimum- és átlaghımérsékleténél.
A szériákon belül tehát mindenképpen meg kell különböztetnünk az elsı napokat. Ezt is lehet azonban tovább “bontani” egy napos tartamokra, illetve a legalább két napos tartamok elsı napjaira. Kérdés, hogy ezek átlagai között van-e különbség? Ennek megválaszolására a
44
szórások és a mintaszámok ismeretében, a normális eloszlás feltételezése mellett, u próbát végeztünk. A teszt értékeket száraz és csapadékos szériákra a 6.a. és b. táblázat tartalmazza. A standard normális eloszlás 0,95 szinthez tartozó 1,6-et meghaladó érték jelzi. Csaknem mindegyik elemnél csupán néhány (0-4) hónapban találtunk szignifikáns eltérést, ami nem indokolja, hogy a legalább két napos tartamokon belül további megkülönböztetést tegyünk. Kivételt képez a légnyomás, amely szoros összefüggésben áll a légköri cirkulációs folyamatokkal (frontok áthaladásával, stb.), ezért másként viselkedik csapadékos idıszakba ágyazott száraz nap esetén, mint egy valódi száraz periódus kezdetén.
Összefoglalva a grafikus ábrázolások és a különféle próbák tapasztalatait, a transzformált sorokat havonta az alábbi csoportok szerint választottuk szét: A csapadékos idıszakokon belül az elsı napok elkülönülnek a többitıl. A száraz tartamokon belül három kategóriát célszerő megkülönböztetni: elsı napok, második és harmadik napok, valamint negyedik és ezt követı sorszámú napok. Ezt követıen havonta csoportonként kiátlagoltuk, majd kivontuk az yj(h,t) értékekbıl. Képletekkel leírva az alábbi módon hajtottuk végre a centrálást:
E( y j ( h , t ) | W = 1, k = 1..12 ) E( y j ( h , t ) | W > 1, k = 1..12 ) z j ( h , t ) = y j ( h , t ) − E( y j ( h , t ) | D = 1, k = 1..12 ) E( y ( h , t ) | 2 ≤ D ≤ 4 , k = 1..12 ) j E( y j ( h , t ) | D ≥ 5, k = 1..12 ) ahol W a csapadékos, D pedig a száraz nap tetszıleges hosszúságú tartamon belüli sorszámát jelöli. A havi feltételes átlagok eltávolítása után a keletkezett zj(h,t) sorok átlaga 10-17 pontosságig zéró, másrészt a szimuláció során ezen átlagok hozzáadása a generált adatokhoz lehetıvé teszi a tartamon belüli változékonyság jellemzıinek reprodukálását. Reziduum sorokként fogunk hivatkozni a fenti módon elıállított mintákra és a továbbiakban ezek képezik majd számításaink alapját.
45
ÁTLAG
SZÓRÁS 1.2
1.0
0.8 1.1
0.4
0.2
0.0
-0.2
-0.4 W1
-0.6
Std. maximum hõmérséklet
Std. maximum hõmérséklet
0.6
W2
1.0
0.9
0.8
0.7 W1 W2
0.6
W3
-0.8
W3
W4
W4
-1.0
0.5
1
2
3
4
5
6
7
8
9
10
11
12
1.0
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
1.2
0.8 1.1
1.0
0.4
Std. relatív nedvesség
Std. relatív nedvesség átlaga
0.6
0.2
0.0
-0.2
-0.4
0.9
0.8
0.7
-0.6 0.6
-0.8
-1.0
0.5
1
2
3
4
5
6
7
8
9
10
11
12
1.0
1.2
0.8 1.1
0.6 1.0
Std. légnyomás
Std. légnyomás
0.4
0.2
0.0
-0.2
-0.4
0.9
0.8
0.7
-0.6 0.6
-0.8
-1.0
0.5
1
2
3
4
5
6
7
8
9
10
11
12
8. ábra Három meteorológiai elem feltételes havi átlagai a nedves szériák elsı (W1), második (W2), harmadik (W3) és legalább negyedik (W4) napján.
46
ÁTLAG
SZÓRÁS 1.2
1.0
0.8 1.1
0.4
0.2
0.0
-0.2
-0.4 D1
-0.6
Std. maximum hõmérséklet
Std. maximum hõmérséklet
0.6 1.0
0.9
0.8
0.7 D1
D 2 -0.8
D2
0.6
D 3
D3
D 4
D4 0.5
-1.0 1
2
3
4
5
6
7
8
9
10
11
12
1.0
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
1.2
0.8 1.1
1.0
0.4
Std. relatív nedvesség
Std. relatív nedvesség
0.6
0.2
0.0
-0.2
-0.4
0.9
0.8
0.7
-0.6 0.6
-0.8
-1.0
0.5
1
2
3
4
5
6
7
8
9
10
11
12
1.0
1.2
0.8 1.1
0.6 1.0
Std. légnyomás
Std. légnyomás
0.4
0.2
0.0
-0.2
-0.4
0.9
0.8
0.7
-0.6 0.6
-0.8
-1.0
0.5
1
2
3
4
5
6
7
8
9
10
11
12
9. ábra Három meteorológiai elem feltételes havi átlagai száraz szériák elsı (D1), második (D2), harmadik (D3) és legalább negyedik (D4) napján.
47
SMAX
SMEAN
SMIN
SSUN
WET W1 & W2 m s I II III IV V VI VII VIII IX X XI XII
I II III IV V VI VII VIII IX X XI XII
W2 & W3 m s
W3 & W4 m s
W1 & W2 m s
W2 & W3 m s
W3 & W4 m s
W1 W2 & & W2 W3 m s m s * * • * • * * * • • * •
W3 W1 W2 W3 & & & & W4 W2 W3 W4 m s m s m s m s • * * • • * * * • * * • * * * * * * • * * * • * * * * * • * * * * * * * * * * * * * * * • * * • * • * * * * * * * • • • * • * • * • * • • SREL SCLOUD SWIND SPRES W1 W2 W3 W1 W2 W3 W1 W2 W3 W1 W2 W3 & & & & & & & & & & & & W2 W3 W4 W2 W3 W4 W2 W3 W4 W2 W3 W4 m s m s m s m s m s m s m s m s m s m s m s m s * • * * • * * • * • * • * * * * • * * * • * * • * * * * * * * • * * * * • * * * * • * • * * • * * • * • * * • * * • * • * * • 6.a. táblázat Csapadékos széria 1, 2, 3, ≥4 napjaira számított átlagok és szórások (lásd. 8. és 9. ábra) összehasonlítása. * u próba szerint 0,95 szinten az átlagok eltérnek • F próba szerint 0,95 szinten a szórások eltérnek Szürke háttér azt jelzi, hogy nem normális eloszlásokat hasonlítunk össze.
48
SMAX
SMEAN
SMIN
SSUN
DRY D1 & D2 m s
I II III IV V VI VII VIII IX X XI XII
I II III IV V VI VII VIII IX X XI XII
D2 & D3 m s
D3 & D4 m s
D1 & D2 m s * *
D2 & D3 m s
D3 & D4 m s
D1 D2 & & D2 D3 m s m s * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * • * SREL SCLOUD SDIND D1 D2 D3 D1 D2 D3 D1 D2 & & & & & & & & D2 D3 D4 D2 D3 D4 D2 D3 m s m s m s m s m s m s m s m s * * • * * • * * * * * * * • * * * * * • * * * * * * * * * * * * * * * • * * • * * * • * * • * * * * • * * • * *
D3 & D4 m s
D1 & D2 m s
* * * * * *
* * * * * *
D2 & D3 m s
D3 & D4 m s * *
• •
• * *
•
*
*
* • SPRES D3 D1 D2 & & & D4 D2 D3 m s m s m s * * • * • * * * * * * * * * * * * • * * *
D3 & D4 m s * * * • *
* *
6.b. táblázat ua. mint 6.a. ábra száraz szériákra.
49
4.2 Idıjárási paraméterek néhány jellemzıje
Adott (havi) idıszakban az egymást követı száraz ill. csapadékos szériák hossza független valószínőségi változóknak tekinthetı. Ezen idıszakon belül a száraz / csapadékos széria hosszak külön - külön azonos eloszlást követnek (Erre vonatkozóan ld. korábbi vizsgálatainkat.) Ez vetette fel annak gondolatát, hogy az idıjárási paraméterek sorozatát az adott idıszakra vonatkozóan külön vizsgáljuk a száraz / csapadékos szakaszokon.
Az egymást követı napok idıjárási paramétereinek modellezése a következık szerint történik. Az egymást követı száraz vagy nedves állapotát megadja a száraz/nedves szériák modellje (3.2 fejezet). A többi meteorológiai paraméter az így adottnak tekinthetı száraz/csapadékos napok sorozatára épül, mintegy a száraz/csapadékos állapottól függı valószínőségi modell. Vizsgálataink alátámasztják, hogy adott hónapban a száraz/nedves napokból álló szakaszok a saját centrálás és normalizálás után gyengén stacionárius sorozatnak tekinthetık. Ez kínálja annak a lehetıségét, hogy a modellezés fázisában elsırendő autoregresszív modellt használjunk.
A korábbiakban alkalmazott jelölések kibıvítésével az alábbiakban adjuk meg a modellt. Jelölje: a nap száraz /nedves állapotát a({t}), ahol a({t}) = D, W; 0 ≤ h ≤ P ha a = D a széria hosszát h({t}), ahol h ({t}) = ; 1 ≤ h ≤ S ha a = W a szérián belül elfoglalt sorszámot d*({t}), ahol 0 ≤ d*({t}) ≤ h({t});
t a minta éven belül sorszámát pedig {t}, {t} = t − + 1. 365 A fenti értelemben Zt folyamatot az alábbi módon állítjuk elı: Zt = v(a({t}), h({t}), d*({t})) ⋅Ut + u(a({t}), h({t}), d*({t})), ahol az Ut elsırendő feltételes autoregresszív folyamat:
Ut+1=AUt + Bεt.
Mielıtt rátérnénk az autoregresszív folyamattal kapcsolatos vizsgálatainkra, megmutatjuk a rezidum sorok néhány, a továbbiakban részben felhasználásra kerülı tulajdonságát.
50
4.3 Faktoranalízis
A vizsgált összes meteorológiai változót faktoranalízis segítségével csoportosítottuk olymódon, hogy elkülönítettük azokat azon elemeket, amelyek egymástól lineárisan függetlennek tekinthetık, illetve amelyeknél a változók között szoros lineáris kapcsolat mutatható ki. A számításokat a "Statistica for Windows, Factor Analysis" modulja segítségével végeztük el a kilenc meteorológiai elemre (1951-1995), havonként, külön-külön az említett száraz ill. csapadékos idısorokra, valamint a teljes mintára. Az aktuális faktorszám kiválasztása a Kaiser féle kritérium alapján (Statistica for Windows III kötet 3204. old.) az 1-nél nagyobb sajátérték meghatározásával történt. A faktorok elkülönítéséhez az alapértelmezésként ajánlott normalizált Varimax rotációt alkalmaztuk (Móri, 1999; Statistica for Windows III kötet).
A sajátértékek kumulatív összegei szerint három faktor a figyelembe vett elemek közös faktorokkal kifejezhetı varianciájának 70-82 % -ának leírását teszi lehetıvé. A faktorok osztályozását a rotált faktor értékek alapján, a 7. táblázatba összegyőjtött faktorsorszámok szerint végeztük el teljes (ALL) mintára ill. csak csapadékos (DET) és csak száraz (DRY) napokra. A táblázatban a 0,7-es korrelációt meghaladó faktorok sorszámait tőntettük fel, zárójelben lévı faktorok értéke 0,5 és 0,7 közötti. Azonos szín és minta jelzi a faktoranalízis szerint megegyezı csoportba tartozó elemeket. A rotáció miatt az elsı és második faktorok (a száraz napokra vonatkozó táblázat kivételével) felcserélıdnek az év egy részében, ennek azonban az osztályok kiválasztására nézve nincs jelentısége.
A 7. táblázat alapján a vizsgált elemek között az alábbi összetartozó csoportok különíthetık el: I maximum-, minimum-, átlag hımérséklet; II napfénytartam, relatív nedvesség, felhızet; III szél, légnyomás. A csapadék és többi elem között tipikusan nem lineáris a kapcsolat, ezért a napi csapadékösszeg minden más elemtıl függetlenül kezelendı.
51
ALL PREC MAX TEMP MIN SUN REL CLOUD WIND PRES Jan (3) 1 1 1 2 2 2 3 3 Feb (2) 1 1 1 2 2 2 3 (3) Márc (1) 2 2 2 1 1 1 3 (1) Ápr (1) 2 2 2 1 1 1 3 (1) Máj (1) 2 2 2 1 1 1 3 (1) Jún (1) 2 2 2 1 1 1 (2) (1) Júl (1) 2 2 2 1 1 1 (1) 1 Aug (1) 2 2 2 1 (1) 1 (1) (1) Szept (1) 2 2 2 1 1 1 3 (1) Okt (1) 2 2 2 1 1 1 3 (1) Nov (3) 1 1 1 2 2 2 3 (3) Dec (3) 1 1 2 2 2 2 3 3 WET PREC MAX TEMP MIN Jan (3) 1 1 1 Feb (3) 1 1 1 Márc (2) 1 1 1 Ápr (1) 2 2 2 Máj (1) 2 2 2 Jún (3) 2 2 2 Júl (2) 1 1 2 Aug (3) 1 2 2 Szept (2) 1 2 2 Okt (2) 1 1 1 Nov (3) 1 1 1 Dec (3) 1 1 1
SUN REL CLOUD WIND PRES 2 (2) 2 3 (3) 2 2 2 3 (3) 2 2 2 3 (3) 1 1 1 3 (3) 1 1 1 3 3 1 1 1 3 (1) 1 1 1 3 2 1 1 1 3 3 1 1 1 3 (2) 2 2 2 3 3 2 2 2 3 3 2 (2) 2 3 3
DRY PREC MAX TEMP MIN Jan 1 1 1 Feb 1 1 1 Márc 1 1 1 Ápr 1 1 1 Máj 1 1 1 Jún 1 1 1 Júl 1 1 2 Aug 2 2 2 Szept 1 1 1 Okt 1 1 1 Nov 1 1 1 Dec 1 1 1
SUN REL CLOUD DIND PRES 2 (2) 2 3 3 2 (2) 2 3 (3) 2 (2) 2 3 (2) 2 (2) 2 3 (2) 2 2 2 3 (2) 2 2 2 3 (2) 1 (1) 1 (1) (2) 1 1 1 3 (2) 2 2 1 3 (1) 2 (3) 2 3 (1) 2 (2) 2 3 (3) 2 (3) 2 3 (3)
7. táblázat Faktor csoportok havonta a teljes (ALL) mintára, ill. a csapadékos (WET) és a száraz (DRY) napokra. (Maximális faktorszám: 3, sajátérték > 1,0.) A táblázatban a 0.7 -es korrelációt meghaladó faktorok sorszámait tőntettük fel, zárójelben lévı faktorok értéke 0.5 és 0.7 közötti. Azonos szín és minta jelzi a faktoranalízis szerint megegyezı csoportba tartozó elemeket.
52
4.4 Normalitás vizsgálat
A 4.1 fejezetben ismertetett transzformáció nulla várható értékő és egységnyi szórású sorokat hozott létre. A reziduumok normalitását azonban ellenırizni kell, egyrészt a normalitást feltételezı próbák alkalmazhatósága, másrészt a szimuláció során alkalmazásra kerülı eloszlások megválasztása miatt. Ismeretes, hogy a N(m,σ) eloszlású valószínőségi változó standardizáltja N(0,1) eloszlású változó, illetve ennek fordítottja is igaz, vagyis standard normális eloszlású változóhoz találhatók olyan paraméterek, melyek lineáris transzformációt követıen elıállítják a keresett normális eloszlású mintát (pl. Mogyoródi, 1993). Ez a tétel lehetıvé teszi, hogy az elızı fejezetben tárgyalt módon elıállított reziduum sorokra elvégezzük a normalitást vizsgáló próbákat, és azok eredményeit kiterjesszük az eredeti változókra. Elsı lépésként változónként külön-külön grafikus eljárást alkalmaztunk, majd Kolmogorov-Szmirnov próbát végeztünk, végül kiszámoltuk az egyváltozós ferdeségés lapultság-értékeket valamint ezek korrigált és normalizált értékeit.
Kétdimenziós normál valószínőségi görbén az X tengelyen a rendezett minta elemek vannak feltőntetve (j=1,…,n), az Y tengelyen pedig a feltételezett nomális valószínőségi értékek: z j = Φ −1[(3 * j − 1) /(3 * n + 1)] ahol Φ-1 az inverz normális kumulatív eloszlás függvény (Statistica III, 2475 old.) Az egyenestıl vett jelentısebb eltérés arra utal, hogy a minta nem tekinthetı normális eloszlásúnak, mint pl. napfénytartam, a felhızet és a szél reziduumok esetén - tipikusnak tekinthetı - száraz júniusi napokon (10. ábra). Az elhajlást részben a szélsı értékek (pl. nulla érték) nagy gyakorisága okozza. A Kolmogorov-Szmirnov próbastatisztikákat (1. Függelék) és azok szignifikancia szintjeit ismert paraméter esetén a 8. táblázatba győjtöttük össze. A 0,05-nál kisebb p értékek esetén azt mondjuk, hogy a hipotézist 0,95 szinten elvetjük. A modell számára olyan változókat keresünk melyek együttes normális eloszlásúaknak tekinthetık. Ez utóbbi feltétel kielégítésének szükséges, de nem elégséges feltétele a peremeloszlások normálitása. A maximum hımérséklet és a légnyomás minden hónapban, a relatív nedvesség néhány téli hónap kivételével normálisnak adódott. Ezt követıen megvizsgáltuk, hogy ezt a három elemet valamely több dimenziós eloszlás perem eloszlásainak tekintve, az együttes eloszlás is normálisnak tekinthetı-e.
53
4
3
3
3
3
2
2
2
2
1
1
1
1
0
-1
0
-1
0
-1
0
-1
-2
-2
-2
-2
-3
-3
-3
-3
-4 -4
-3
-2
-1
0
1
2
-4 -3.5
3
-2.5
-1.5
-0.5
Std. Max. Hõm.
0.5
1.5
2.5
-4 -3.5
3.5
-4 -2.5
-1.5
-0.5
Std. átl. hõm.
0.5
1.5
2.5
3.5
-4
3
3
3
3
2
2
2
2
1
1
1
1
0
-1
Expected Normal Value
4
Expected Normal Value
4
-1
0
-1
-2
-2
-3
-3
-3
-3
-4 -2.5
-4 -3.5
-4
0.5
1.5
2.5
3.5
-2.5
Std. felhõzet
-1.5
-0.5
0.5
1.5
2.5
-3
-2
-1
Std. napfénytartam
0
1
2
0
1
2
3
4
5
1
2
3
4
-1
-2
-0.5
-1
0
-2
-1.5
-2
Std. Rel. nedv.
4
0
-3
Std. Min. hõm.
4
Expected Normal Value
Expected Normal Value
Expected Normal Value
4
Expected Normal Value
4
Expected Normal Value
Expected Normal Value
4
3
4
5
6
-4 -5
-4
-3
-2
Std. szél
-1
0
Std. légnyomás
10. ábra Reziduumok normál valószínőségi görbéi száraz napokon júniusban.
* DRY,° DET SMAX SMEAN SMIN SREL SCLOUD SSUN SDIND
I
II
* ° * ° * ° * ° * ° * °
* * °
* ° * ° * °
III
IV
V
VI
VII
VIII
*
* ° * ° * °
* ° * ° * °
* ° * ° * °
X
XI XII
° * ° * ° * °
* ° * ° * ° * ° * °
* °
°
* ° * ° * °
IX
* ° * ° * °
* ° * ° * °
* ° * ° * °
° * ° * ° * °
SPRES 8. táblázat Ismert paraméterő Kolmogorov-Szmirnov próba alapján a normális eloszlástól 0,95 szignifikancia szinten eltérı hónapokat száraz napokon *, csapadékos napokon pedig °jelöli.
54
A többváltozós normalitás tesztelése céljából a Mardia - féle többváltozós lapultságon alapuló együtthatók (Krishnaiah, 1980) felhasználásával, a Statistica SEPATH moduljával végeztünk különféle próbákat. A Mardia alapú kappa - becslések, valamint a relatív többváltozós lapultság formuláit 2. Függelékben soroljuk fel. Az eredményeket a 9.a,b,c táblázatok tartalmazzák.
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
W 1,523 0,308 -0,991 0,147 0,359 0,658 -0,535 -0,094 -0,544 -0,197 -0,199 D
0,573
-0,25
-0,534 -0,589 -0,408 -0,448 -0,324 -0,089
-0,83
0,653
-0,99
XII 1,21 -0,496
9.a táblázat A többváltozós lapultság Mardia együtthatói havonta csapadékos (W) ill, száraz(D) napokon.
I
II
III
IV
0,610 -1,963 0,305
V
VI
VII
0,763
1,469
-,999
VIII
IX
X
XI
-2,543 -0,927 -0,338 -0,406
XII
W
3,47
2,59
D
1,583 -0,642 -1,482 -1,556 -1,088 -1,155 -0,924 -0,257 -2,398 1,924 -2,633 -1,28 9.b táblázat Normalizált sokváltozós lapultság együtthatói havonta csapadékos (W) ill, száraz(D) napokon. A ±1,96-ot meghaladó értékeket vastaggal szedtük.
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
W 0,102 0,021 -0,066 0,010 0,024 0,046 -0,999 -0,094 -0,036 -0,013 -0,013 0,081 D
0,038 -0,017 -0,036 -0,039 -0,027
-0,03
-0,022 -0,006 -0,055 0,044 -0,066 -0,033
9.c táblázat Mardia-alapú kappa értékek együtthatói havonta csapadékos (W) ill. száraz (D) napokon.
A többváltozós lapultság Mardia együtthatói, amelyeknek többváltozós normális eloszlás esetén zérushoz közeli értékeknek kellene lenniük, a 9.a táblázat szerint - 0,991 és 1,523 között változnak. A normalizált sokváltozós lapultság együtthatókra a ±1,96 konfidencia intervallumba tartozó értékek esetén a hónapok többségénél 0,95 szinten nem jutunk ellentmondásra a hipotézissel. A Mardia-alapú kappa értékek többváltozós normális eloszlás esetén zérushoz közeliek, így e teszt alapján is elfogadhatjuk a mullhipotézist, miszerint a maximum hımérséklet, a relatív nedvesség és a légnyomás együttesen normális eloszlásúnak tekinthetık.
55
4.5 Feltételes korreláció és autokorreláció
A különbözı változók közötti lineáris kapcsolatokat a kereszt korrelációs mátrix, az azonos valószínőségi változók egymást követı értékei közötti összefüggéseket, azaz a sorokon belüli függıséget, pedig az autokorrelációs mátrix segítségével lehet számszerősíteni. A reziduum sorok alapján számítottuk ki ezeket a feltételes statisztikákat. A 11. ábra illusztrálja, a maximum hmérsékletnek a többi változóval vett kereszt korrelációs együtthatók száraz napokon havonta. Az átlaggal vett szoros lineáris kapcsolattól eltekintve nem elhanyagolható éves menet.
11. ábra Maximum hımérséklet többi elemmel vett korrelációs együtthatói havonta száraz napokon.
Az idısorokon belüli, egy napos késleltetéső autokorrelációk rendszerint szintén nem hagyhatók figyelmen kívül. Mivel a száraz és csapadékos idıszakok váltakozása miatt a minta nem összefüggı, célszerő az egymást követı napok közötti korrelációkat, illetve a váltásokat típusonként külön megvizsgálni. Ez okból havonta végeztük a számításokat száraz (i=1) ill., csapadékos (i=2) szériákban valamint a tetszıleges hosszúságú csapadékos (ill. száraz) szériák utolsó és tetszıleges tartamú száraz (ill. csapadékos) szériák elsı napjaira (i=3 ill. i=4). 56
Vizsgáltuk tehát a ξ = ξijk(t) valószínőségi változót, ahol j = 1, 2, 3 az elızı fejezet eredményeinek figyelembe vételével kiválasztott elemeket jelöli, sorrendben a maximum hımérsékletet, a relatív nedvességet ill. a légnyomást, A hónapot k, a tetszıleges hosszúságú száraz vagy csapadékos tartamon belül a nap sorszámát pedig t jelöli. Például ξ = ξ111(t=1) jelöli a száraz idıszak maximum hımérsékletét januárban, a tetszıleges hosszúságú ilyen szakasz elsı napján. A mintaszámok a tartamhosszal rohamosan (közel exponenciálisan) csökkenek (12 ábra teteje). Ezt figyelembe véve, 1- 4 napos tartamokra végeztük el a számításokat. Bevezettük az η=ξijk(t-1) jelölést az egy nappal korábbi mintaelemekre, Ekkor adott feltételek mellett az n1 mintaszámot a két minta hosszának minimuma határozza meg, Tekintsük tehát a (ξ,η) valószínőségi változó párra vett n1 elemő mintát, A változó párok korrelációs együtthatóit jelölje R1=R1(ξ,η), becslésüket pedig ρ1 ≈ R1 : n
∑ (ξ i − ξ )(ηi − η ) ρ1 =
i =1
n
n
i =1
i =1
∑ (ξ i − ξ )2 ∑ (ηi − η )2 ahol
ξ=
1 n1
n1
∑ ξi i =1
ill. η =
1 n1
n1
∑ ηi , i =1
A nagyszámú eredmény szemléletes áttekintése céljából a 12. ábrán a váltást jellemzı (DW ill. WD) korrelációkat, majd a száraz tartamon belüli együtthatókat egymás mellett ábrázoltuk. Az azonos skálabeosztás miatt a bal oldali ábrákon látható száraz esetekre nagyobb együtthatók jellemzık, mint a csapadékos szériákban. Az eltérés egy-egy görbe mentén rendszerint néhány tized, szigorúan véve mégsem összemérhetık a korrelációk tekintettel arra, hogy az X tengely mentén feltőntetett együtthatók eltérı nagyságú mintákból származnak, és emiatt az együtthatók becslésébıl adódó konfidencia intervallumok is különböznek. A két tapasztalati korrelációs együttható azonosságának tesztelésére a mintaszámot is figyelembe vevı u próbát alkalmaztunk, ld. Vincze (1975) az alábbi módon. A fentiek szerint definiáljuk a (ξ,ω) változópárt, ahol legyen ξ=ξijk(t) és ω=ξijk(t+1); a mintaszámot jelölje n2, a korrelációs együtthatót R2=R2(ξ,ω), becslését
pedig ρ2,
A nullhipotézis szerint: H0: R1 = R2,
57
A becslések ismeretében elıállítjuk az alábbi valószínőségi változókat:
Z1 =
1 1 + ρ1 ln 2 1 − ρ1
ill. Z 2 =
1 1+ ρ2 ln , 2 1− ρ2
Ezek jó közelítéssel normális eloszlásúnak tekinthetık és a mullhipotézis fennállása esetén várható értékeik azonosak, ezért az alábbi u statisztika N(0,1) eloszlású.
u=
Z1 − Z 2 1 1 + n1 − 3 n 2 − 3
Az u próba értékeit részben a 10. táblázat tartalmazza. Amennyiben a próbastatisztika értéke a (-2, +2) intervallumba esik, akkor 0,98-as szinten elfogadjuk a mullhipotézist, amely szerint a két korrelációs együttható megegyezik. Az u értékek alapján szignifikáns eltérés leggyakrabban a maximum hımérsékleteknél fordul elı a típusváltások alkalmával (4 - 4 hónapban), Ugyanakkor, a tartamokon belüli korrelációk azonban (egy-egy hónaptól eltekintve) állandónak vehetık,
Ismeretes, hogy a gyenge értelemben vett stacionárius folyamatok esetén a második momentumok végesek, a kovarianciák pedig invariánsak az idıeltolással szemben (Karlin és Taylor, 1986), Mivel egységnyi szórású sorokat használunk, a kovarianciák megegyeznek a korrelációkkal, A fenti vizsgálat eredményei szerint az egy napos eltolással kapott idısorok esetén nincs jelentısége annak, hogy az adott típuson belüli tartam melyik részét vesszük. Tehát adott tartamon belüli folyamat gyengén stacionáriusnak tekinthetı.
58
MINTASZÁM 300
300
250
250 I
I 200
200
II
IV
IV 150
150
V
VII
VII 100
VIII
VIII IX
IX
X
X 50
V VI
VI 100
II III
III
50
XI
XI XII
XII 0
0 DW
D2
D3
D4
D5
WD
W2
W3
W4
W5
MAXIMUM HÕMÉRSÉKLET 1.0
1.0
0.9
0.9
0.8
0.8
0.7
0.7
0.6
0.6
0.5
0.5
0.4
0.4 DW
D1_2
D2_3
D3_4
D4_5
WD
W1_2
W2_3
W3_4
W4_5
WD
W1_2
W2_3
W3_4
W4_5
WD
W1_2
W2_3
W3_4
W4_5
RELATÍV NEDVESSÉG 0.9
1.0
0.8 0.9 0.7 0.8
0.6 0.5
0.7 0.4 0.6
0.3 0.2
0.5 0.1 0.4
0.0 DW
D1_2
D2_3
D3_4
D4_5
LÉGNYOMÁS 1.0
1.0
0.9
0.9
0.8
0.8
0.7
0.7
0.6
0.6
0.5
0.5
0.4
0.4 DW
D1_2
D2_3
D3_4
D4_5
SZÁRAZ
CSAPADÉKOS 12. ábra
Az egy napos késleltetéső autokorrelációs együtthatók értékei havonta a száraz (bal) és a csapadékos (jobb) idıszakokban, ill. típus-váltáskor.
59
DRY Korreláció Párok I II III IV V VI VII VIII IX X XI XII DRY Korreláció Párok I II III IV V VI VII VIII IX X XI XII
Maximum hımérséklet WD & D1_2
D1_2 & D2_3
D2_3 & D3_4
D3_4 & D4_5
Relatív nedvesség WD & D1_2
D1_2 & D2_3
D2_3 & D3_4
D3_4 & D4_5
Légnyomás WD & D1_2
D1_2 & D2_3
D2_3 & D3_4
D3_4 & D4_5
1,92 1,37 -0,20 0,19 -0,14 0,61 -0,99 -0,67 -1,63 -0,50 0,92 0,30 0,67 -1,05 -0,49 -1,47 -0,15 0,11 -0,40 1,09 -0,48 0,86 0,71 0,15 0,54 0,97 0,44 0,00 -3,22 1,27 0,50 0,43 -1,13 0,00 -0,38 0,97 -0,88 1,12 0,40 0,35 0,28 1,69 -1,45 -1,37 -1,09 0,64 1,60 0,50 -2,00 -0,76 -0,41 0,00 -2,72 1,31 2,25 0,43 0,42 0,34 -1,16 -0,74 0,28 1,89 0,79 0,00 -2,88 -0,83 -0,11 0,2 0,38 0,15 0,38 -0,78 -2,47 -0,26 0,41 1,18 -1,22 0,69 1,96 1,44 -1,89 -0,97 0,97 -0,32 -1,88 0,78 -2,99 -2,14 -2,91 0,00 -0,94 -0,95 0,19 0,71 -0,68 -1,23 -2,68 0,00 -0,50 -1,36 -0,99 1,43 -0,36 -0,75 -2,00 -0,88 1,15 1,12 -1,01 0,00 -0,55 0,55 0,15 1,23 1,31 2,00 -0,23 0,22 1,49 0,26 0,80 0,65 -1,54 -0,98 1,50 1,73 0,82 -0,47 -0,84 0,39 0,52 -1,78 -0,29 0,00 -0,39 -1,16 1,76 0,19 0,00 0,81 -0,24 1,81 1,19 0,46
Maximum hımérséklet
Relatív nedvesség
Légnyomás
DW W1_2 W2_3 W3_4 DW W1_2 W2_3 W3_4 DW W1_2 W2_3 W3_4 & & & & & & & & & & & & W1_2 W2_3 W3_4 W4_5 W1_2 W2_3 W3_4 W4_5 W1_2 W2_3 W3_4 W4_5
-0,60 0,26 0,18 0,28 -3,18 0,44 -3,19 -0,87 -0,74 0,58 -2,67 2,18
-1,62 -0,18 0,13 1,20 -1,98 0,40 -1,13 0,33 0,78 0,94 -1,18 0,98
-1,91 -1,13 -0,87 -1,04 -1,81 -2,00 -0,75 -2,07 0,53 -1,53 -0,56 -0,34
0,32 -1,46 1,00 0,38 -0,33 0,20 -0,44 -0,59 1,46 -0,58 0,91 0,00
1,59 1,67 0,37 1,95 0,68 0,92 2,01 0,43 1,31 0,86 0,60 1,02
2,28 -1,45 -0,66 -1,10 0,94 1,15 1,53 0,29 -0,27 0,29 1,56 -0,18
1,89 -1,95 0,00 -0,39 1,49 0,91 0,12 -1,15 -0,94 -0,08 0,57 -1,17
1,18 0,22 0,22 0,75 -0,73 -0,73 -0,94 0,55 0,36 0,52 0,36 0,36 0,27 1,82 2,25 0,46 0,18 0,18 -1,12 -0,16 -0,46 0,30 0,79 0,65 1,14 -0,55 -1,05 -0,59 0,32 0,67 -0,29 1,01 0,39 -0,35 1,10 0,00
-0,43 -0,86 -0,36 -0,12 1,81 0,38 1,46 1,41 0,00 0,00 1,29 0,82
-0,24 -0,19 0,32 -0,24 0,36 -0,80 1,55 2,08 0,67 -0,53 0,24 -0,30
10. táblázat Az u próba értékei száraz ill. csapadékos idıszakokban Jelölés: DD : tetszıleges hosszúságú száraz szériák utolsó és rá a következı csapadékos széria elsı napjai közti korrelációk adott elemre, adott hónapban. D1_2: legalább két napos száraz szériák elsı és második napjai közötti korrelációk. D2_3: legalább három napos száraz szériák második és harmadik napjai közti korrelációk. D3_4: legalább négy napos száraz szériák harmadik és negyedik napjai közti korrelációk. D4_5: legalább öt napos száraz szériák negyedik és ötödik napjai közötti korrelációk.
60
5. A modellfejlesztés lépései
5.1 Kísérlet együttes autoregresszív modellezésre (Néhány negatív eredménnyel járó kísérlet tapasztalatai.)
Többváltozós idısorok elıállítására a meteorológiai szakirodalomban gyakorta alkalmaznak elsırendő autoregresszív folyamatot, mely adott kereszt- és egy lépéses korrelációval rendelkezı idısorokat eredményez. (Ennek a megközelítésnek a hibáit már korábban elemeztük.) A száraz ill. csapadékos feltételek mellett a maximum hımérséklet, a relatív nedvesség és légnyomás idısorok elıállítására programot készítettünk és a paramétereket havonként becsültük. A felhasznált módszer leírását Richardson (1981) cikke alapján 3. Függelék tartalmazza. Az említett három változó esetén a számítás eredményeinek illusztrálására a 11. táblázatban megmutatjuk a megfigyelt minták közötti, valamint néhány szimulációval
elıállított
idısoron
belüli
korrelációkat.
A
kereszt
korrelációk
összehasonlítására Füstös és Kovács (1989, 99-100 old.) által ajánlott t-eloszlást használtuk.
A mőveleteket megismételtük a maximum, minimum és átlag hımérsékletekkel, ekkor a minimum értékek között sok esetben indokolatlan nagyság szerinti relációk (pl. a minimumnál alacsonyabb napi átlag) léptek fel. Más változó hármasokra kapott generált idısorok gyakoriságai, különösen a korlátos elemeknél (pl. csapadék, napfénytartam) erısen eltértek a valódi értékektıl és gyakran irreális értékek (pl. negatív csapadékösszeg) fordultak elı. Ebbıl azt a következtetést vontuk le, az említett autoregresszív folyamat ebben a formában a kilenc változóra nem terjeszthetı ki.
Kísérletet tettünk a fennmaradó hat elem elıállítására a fenti három, jól modellezhetı paraméterhez, mint független változókhoz kapcsolódó, különféle regressziós eljárások felhasználásával. A maximum hımérséklet, a relatív nedvesség és légnyomás idısoraira egyváltozós, háromváltozós, a szórás korrekciójára szolgáló ún. “inflated” (Kaas,1993) valamint többszörös lineáris regressziót illesztettünk. E próbálkozások azonban nem vezettek sikerre: mindegyik számítás hasonló eredményt adott, a korrelációk és az autokorrelációk minden esetben jelentısen magasabbak lettek a valódiaknál. Mivel ezt a módszert teljesen el kellett vetnünk, a részeredményekre sem kívánunk részletesebben kitérni.
61
Légnyomás, Maximum hımérséklet
Relatív nedvesség, Légnyomás
Maximum hımérséklet, Relatív nedvesség
SZÁRAZ CSAPADÉKOS Obs. Gen.1 Gen.2 Obs. Gen.1 Gen.2 I II III IV V VI VII VIII IX X XI XII I II III IV V VI VII VIII IX X XI XII I II III IV V VI VII VIII IX X XI XII
-0,13 -0,17 -0,37 -0,34 -0,22 -0,19 -0,33 -0,47 -0,16 -0,12 -0,23 -0,19 0,08 0,03 -0,02 -0,11 -0,17 -0,23 -0,17 0,00 -0,10 -0,03 0,10 0,16 -0,33 -0,32 -0,21 -0,16 -0,17 -0,06 -0,12 -0,24 -0,31 -0,41 -0,43 -0,35
-0,01 -0,15 -0,29 -0,27 -0,14 -0,15 -0,27 -0,45 -0,13 -0,03 -0,19 -0,17 0,03 0,08 -0,06 -0,15 -0,13 -0,23 -0,17 0,03 -0,11 -0,08 0,13 0,17 -0,32 -0,29 -0,21 -0,19 -0,12 -0,04 -0,14 -0,21 -0,27 -0,41 -0,44 -0,34
-0,06 -0,16 -0,36 -0,30 -0,19 -0,16 -0,26 -0,45 -0,16 -0,20 -0,25 -0,17 0,02 0,08 0,04 -0,12 -0,17 -0,20 -0,17 -0,06 -0,09 0,01 0,13 0,15 -0,33 -0,42 -0,30 -0,20 -0,11 -0,01 -0,14 -0,23 -0,32 -0,39 -0,36 -0,30
-0,10 -0,30 -0,51 -0,50 -0,55 -0,46 -0,56 -0,61 -0,50 -0,47 -0,47 -0,32 0,07 0,12 0,04 -0,03 -0,09 -0,14 -0,21 -0,11 -0,04 0,01 0,26 0,19 -0,43 -0,36 -0,29 -0,27 -0,07 0,00 -0,07 -0,06 -0,30 -0,30 -0,44 -0,40
0,03 -0,28 -0,48 -0,47 -0,56 -0,42 -0,47 -0,56 -0,43 -0,38 -0,48 -0,25 0,01 0,14 0,15 -0,04 -0,02 -0,15 -0,19 -0,14 -0,03 -0,03 0,27 0,18 -0,35 -0,35 -0,33 -0,19 -0,11 0,05 -0,13 -0,04 -0,23 -0,23 -0,41 -0,40
-0,08 -0,15 -0,45 -0,48 -0,53 -0,36 -0,50 -0,54 -0,46 -0,39 -0,41 -0,22 0,09 0,10 0,02 -0,00 -0,05 -0,07 -0,24 -0,13 -0,05 0,02 0,25 0,17 -0,43 -0,36 -0,29 -0,23 -0,12 -0,10 -0,02 -0,10 -0,27 -0,32 -0,42 -0,39
11. táblázat Autoregresszív folyamat alkalmazásával elıállított két véletlen szimuláció (Gen1, Gen2) és a transzformált valódi (Obs) minták közötti kereszt korrelációk. A 0,95 szinten szignifikáns eltéréseket vastagított számok jelzik.
62
5.2 Modellezés Johnson eloszlással
Olyan eljárást kerestünk, amely mind az összes vizsgált változót együttesen képes elıállítani. Az elızı fejezetekben megmutattuk, hogy a meteorológiai elemek feltételes eloszlásához a normális eloszlás rendszerint nem illeszkedik megfelelıen. Hayhoe (2000) megemlíti, hogy a nem normális eloszlások esetén célszerő Johnson transzformációt alkalmazni, amely a valószínőségi változók eléggé bı osztályára az eloszlásokat klasszikus eljárásokkal kezelhetı standard normális eloszlásúvá alakítja.
Az egyváltozós eset leírását megtaláljuk Hahn és Shapiro (1967), Slifker és Shapiro (1980) munkájában, a többváltozós transzformációt Stanfield és mtsai. (1996) szimulációs konferenciára készült publikációjában. Ez utóbbi tartalmazza a módszernek egyfajta kibıvítését, amely lehetıvé teszi, hogy az eloszlások széles osztályára többváltozós idısorokat állítsunk elı az átlag, a szórás, a ferdeség, a lapultság és az elemek közötti korrelációk megırzésével. Az eredetileg biomechanikai vizsgálatok céljára kifejlesztett modellt meteorológiai idısorokra alkalmaztuk. Tapasztaltuk, hogy a 2. Függelékben ismertetett módszerrel elıállíthatók olyan számsorok, melyek a felsorolt paraméterekben megegyeznek a bemenı adatként használt minták paramétereivel. Ugyanakkor az eljárás nem biztosította a megfelelı változók idısorán belüli korrelációt, ami így nem is teljesült a szimulált adatsorokban.
A vázolt hosszadalmas kísérletezés eredményeit összegezve jutottunk el a megoldáshoz. Felhasználtuk az autoregresszív folyamatnak azon tulajdonságát, miszerint a kereszt-korrelációk és az egy lépéses autokorrelációk megırzıdnek a folyamat alkalmazása során, továbbá figyelembe vettük azt a felismerést, hogy a Stanfield és munkatársai által kidolgozott Johnson transzformáció kibıvített változata -a 4. fejezetben ismertetett transzformált sorra alkalmazva is- képes elıállítani adott ferdeségő és lapultságú többváltozós idısorokat. Arra a következtetésre jutottunk tehát, hogy a két módszer egyidejő alkalmazására van szükség. Amennyiben a többváltozós folyamat zaj tagja nem véletlen fehér zaj, hanem nulla várható értékő, egy szórású, adott ferdeségő és lapultságú Johnson eloszlású véletlen szám, a szimulált kilenc (a száraz napokon csak nyolc) változós minták megfelelıen reprodukálják a megkívánt statisztikákat (ferdeség, lapultság, korreláció, egy lépéses autokorreláció).
63
6. Idıjárás generátor modell és szimuláció
Az X folyamatot akarjuk modellezni a száraz és csapadékos napokra külön-külön az alábbi módon. Jelölje X = {Xi (t,j), i=1...9} vektor az i-ik meteorológiai elem realizációi, ahol t=1,...365 a nap éven belüli sorszáma, j=1...45 pedig az év száma. Belátható, hogy az adathalmaz felbontható a száraz (D) és a csapadékos (W) napok diszjunkt halmazaira:
X=XD∪XW és XD∩XW=0 A 3.1 fejezetben igazoltuk, hogy az egymást követı szériák elsı és másodrendben is függetlenek, ezért a paramétereket száraz ill csapadékos idıszakokra külön-külön, havonként becsüljük a mintából. A száraz ill. csapadékos szériák sorozatait (amiket 3. fejezetben definiálunk) a többi elemtıl függetlenül a Poisson és geometriai eloszlások keverék eloszlással modelleztük ( 3.2 fejezet):
P2 ( ξ = k ) = s ⋅ q ⋅ ( 1 − q )k−1 + ( 1 − s ) ⋅
λk −1 e −λ ( k − 1 )!
k=1,2,…n és ahol s a keveréket alkotó geometriai eloszlás súlytényezıje. Az eloszlások paramétereit és a súlytényezıket kvázi-Newton módszerrel (Statistica for Windows Time Series modul) becsüljük a négyzetes eltérést minimalizáló veszteség-függvény mellett.
A többváltozós folyamat egymástól független száraz és csapadékos sorozatainak modellezésére az alábbi feltételes autoregresszív folyamatot alkalmaztunk:
Yi+1 = AYi + Bηi+1 i = 1,...n ahol Yi , Yi+1 és ηi+1 zérus várható értékő vektorok, ηi az Yi-tıl független többváltozós Johnson eloszlású változó. Az A és B mátrix kiszámítási módja: A = C1C0-1.
BBT = C 0 − C1C0−1C1T ahol C0=E(Yi, YiT) és C1= E(Yi+1, YiT) (m×m)-es mátrixok. C0 kovariancia mátrix, amely fıátlójában a szórásnégyzeteket tartalmazza, C1 fıátlójában az egy lépéses autokovarianciák, a többi helyen az egy lépéses kereszt kovarianciák állnak. A spektrális felbontási tétel felhasználásával kapjuk, hogy B= ΘΛΘT ahol Θ a sajátvektorokat, Λ a sajátértékeket jelöli. Az A és B mátrixok biztosítják a kereszt korrelációk és az egy lépéses autokorrelációk reprodukálását.
64
A zaj tagot a szimuláció során véletlen szám generátorral elıállított standard normális eloszlású változóból az inverz transzformáció segítségével állíthatjuk elı:
Z−γ η = ξ + λ ⋅ g −1 δ ahol
e z S L ( lognormális ) család z −z ( e − e ) / 2 S U ( korlátlan ) család g( z ) = −z S B ( korlátos ) család 1 /( 1 + e ) z S N ( normális ) család A ferdeség és lapultság becslésére többféle képlet használatos. Ezek közül a Stanfield féle módszer az alábbi alakot alkalmazza: N
N
∑ (X j − X ) 3 aX=
j=1
Nσ
∑ (X j − X ) 4 bX =
és
3
j=1
Nσ 4
Az η valószínőségi változó aX ferdeség és bX lapultság vektorának ismeretében a következı módon állítható elı az aη és bη vektor:
[ ]a ] (b − Ψ
aη = ΘX
[
bη = ΘX
( 3 ) −1
( 4 ) −1
X
(6a)
X
X
)
(6b)
ahol ΘX jelöli a k-adik Hadamard szorzatot, ΨX = (Ψ1,…,Ψν) pedig a segédvektort. Definíció szerint (Kitamura, 1995; Styan, 1973) ΘX(k) = [Θi,j(k)], ahol k = 3, 4, ν
illetve Ψi = 6∑
ν
∑ Θ i2, jΘ i2,l
és i = 1,…ν.
W illeszkedésének jóságát meghatározza
j=1 l= j+1
Y elıállítása. Stanfield és munkatársai szerint amikor bη ≥ ay(2) + 1 korrekciót kell
végrehajtani, bη := ay(2) + 1,25. A szimulált Zt sor elıállítása a 4.2 fejezetben leírt eljárással történt, majd a korlátos változók értékkészletein kívül esést biztosan megakadályozó csonkítást végeztünk. Erre ritkán, a paraméterbecslés pontatlanságai ill. kerekítései miatt volt szükség.
65
7. Verifikáció
A dolgozatban feladatának a modell elméleti megalapozását tekintettük emiatt elegendınek találtuk néhány hónapra illusztrálni a generátor mőködését. A felhasznált számítási eljárás sem tette lehetıvé a teljes idısor tesztelhetıségét. A csapadék tartam szimulációs részt a 3. fejezetben már ellenıriztük. Ebben a részben a 4.1. fejezetben ismertetett transzformációkkal elıállított idısorok paramétereit tekintettük bemenı adatnak, a januári és a júniusi száraz ill. csapadékos mintákkal teszteltük az elızı fejezetben leírt képletekkel elıállított folyamatot. A számításokat a Statistica for Windows programcsomag felületén alkalmazható Statistica Basic valamint Fortran szubrutinok meghívásával oldottuk meg az alábbi lépések szerint: 1. A 4.1 fejezetben leírt módon transzformált mintára µ X, σ X, C0, C1, A, B, Θ X, aX és bX kiszámítása. 2. Az aη és bη értékek meghatározása minden változóra, szükség esetén bη korrekciója.
3. Johnson eloszlás paramétereinek (γ, δ, λ, ξ) meghatározása AS99 algoritmus alkalmazásával .(Prog. Algorithm, 1976). 4. Y elıállítása: standard normális eloszlású véletlen számsor szimulációja véletlen szám generátorral, majd ezt követıen az AS100 algoritmus (Prog. Algorithm, 1976). felhasználásával standardizált aX és bX ferdeségő és lapultságú Johnson eloszlásúvá történı transzformációja. 5. A folyamat elıállítása a feltételes autoregresszív modellel. 6. Inverz centrálás és standardizálás és az eloszlások csonkítása.
A modellel történı szimulációt a júniusi száraz és csapadékos mintákkal illusztráljuk. A 12. táblázat a aX, bX, aη, bη, γ, δ, λ, ξ értékeit paramétereket tartalmazza. A 13. táblázatban a száraz júniusi minta és a szimulált sor átlagainak t-próbával történt összehasonlítása. A 14. ábra a valódi és a szimulált, csonkított minták gyakorisági eloszlásait mutatja. Különösen a korlátos értékkészlető idısorokra (pl. csapadék, napfénytartam) jellemzı gyakoriságok jelzik látványosan a változtatás lényegét, a szimulált sorok eloszlása az utóbbi esetben sokkal jobban közelíti a valódi adatsorokét, mivel a megadott módon végzett szimuláció a ferdeség és lapultság értéit pontosabban állítja be. A 14. táblázat a korrelációkat tartalmazza a szintelen mezıkben a valódi, a színezettekben egy januári csapadékos szimulációban.
66
WET zmin zsun zrel ztemp zcloud zmax zwind zpres zprec DRY Zmin Zsun Zrel Ztemp zcloud Zmax Zwind Zpres
aX -0,278 0,166 -0,271 -0,242 -0,497 -0,333 1,252 -0,180 2,42 aX -0,169 -1,017 0,173 -0,117 0,249 -0,218 0,872 -0,139
bX 2,600 2,131 2,728 2,711 2,822 2,897 5,984 3,345 10,303 bX 2,727 3,705 3,185 2,406 2,319 2,549 3,808 0,022
aY -0,278 0,171 -0,459 -2,317 -2,279 -2,640 1,555 -0,194 2,741 aη -0,169 -1,019 0,139 0,022 -0,937 -0,216 1,859 -0,164
bY 2,600 2,100 2,620 -1,393 5,139 7,842 7,917 3,409 11,593 bη 2,727 3,707 3,248 -4,813 -3,563 2,539 7,706 3,026
γ -0,663 0,220 -0,87 -0,791 -1,076 -1,448 -4,694 0,859 2,156 γ 0,100 -1,426 -0,889 -0,236 -3,879 -0,517 2,606 -0,107
δ 1,553 0,944 1,901 1,925 1,448 2,291 2,525 3,839 0,751 δ 0,840 1,032 4,414 1,369 3,374 1,547 1,085 0,162
λ 7,014 4,641 8,432 8,459 7,040 10,412 0,685 3,616 8,739 λ 4,259 6,344 4,214 6,144 -1,00 6,904 1,082 2,316
ξ -4,183 -2,101 -5,108 -5,037 -4,660 -6,735 -2,32 0,843 -0,835 ξ -2,13 -4,837 -0,877 -3,307 3,300 -3,97 -1,214 -1,253
típus 3 3 3 3 3 3 2 2 3 típus 3 3 2 3 1 3 3 3
12. táblázat Júniusi csapadékos és száraz napokra a transzformált mintából számított paraméterek aX, bX, aη bη , γ, δ, λ, ξ értékei és a Johnson eloszlás típusa. (1=SL, 2=SU, 3=SB, 4=SN) DRY JUN
Obs
Gen
t
p
Zmin
13,8
13,9
-0,45
0,65
Zsun
5,7
5,9
-0,75
0,45
Zrel
74,8
74,9
-0,08
0,93
Ztemp
18,5
18,7
-0,97
0,32
Zcloud
5,6
5,5
0,36
0,71
Zmax
24,5
24,7
-1,17
0,23
Zwind
3,2
3,2
0,82
0,41
Zpres
1012,1
1012,1
0,06
0,94
Zprec
5,71
7,8
-0,03
0,97
13. táblázat Valódi (Obs) és egy szimulált (Gen) minta átlagai, valamint a t-próba értékei száraz napokon júniusban (df=551).
67
14. ábra A megfigyelt és a szimulált értékeke gyakoriságai
WET JAN
MIN
SUN
REL
TEMP
CLOUD
MAXI
WIND
PRES
PREC
SMIN
1,00
-0,11
0,07
0,94
0,19
0,84
0,18
-0,37
0,11
SSUN
-0,22
1,00
-0,34
-0,03
-0,65
0,11
0,05
0,02
-0,15
SREL
0,08
-0,38
1,00
-0,00
0,30
-0,11
-0,34
0,01
0,19
STEMP
0,93
-0,13
-0,00
1,00
0,09
0,95
0,22
-0,41
0,12
SCLOUD
0,26
-0,65
0,34
0,15
1,00
-0,06
-0,04
-0,05
0,17
SMAXI
0,81
0,03
-0,11
0,94
-0,02
1,00
0,25
-0,42
0,08
SWIND
0,17
0,06
-0,38
0,21
-0,11
0,28
1,00
-0,41
0,11
SPRES
-0,34
0,08
0,02
-0,38
-0,08
-0,40
-0,35
1,00
-0,27
SPREC
0,16
-0,17
0,18
0,19
0,14
0,13
0,01
-0,23
1,00
14. táblázat A kereszt korrelációk a megfigyelt és a szimulált (szürke cellákban) adatok között, csapadékos januári napokon.
68
1. Függelék Egyváltozós normalitás vizsgálat Kolmogorov –Szmirnov próbával. A részeredményeinek illusztrációja. data file: 550C5195.STA [ 16425 cases Dith 67 variables ] STAT. BASIC STATS Variable SMAX STEMP SMIN SSUN SREL SCLOUD SDIND SPRES
Kolmogorov-Smirnov Test (550c5195.sta) (Mean & standard deviation knoDn) DRY Jan N max D p 915 .034497 p > .20 915 * .083761 * p < .01 * 915 * .109548 * p < .01 * 915 * .161563 * p < .01 * 915 * .060911 * p < .01 * 915 * .082571 * p < .01 * 915 * .119581 * p < .01 * 915 .024819 p > .20
STAT. BASIC STATS Variable SMAX STEMP SMIN SSUN SREL SCLOUD SDIND SPRES
Kolmogorov-Smirnov Test (550c5195.sta) (Mean & standard deviation knoDn) DRY Feb N max D p 790 .027607 p > .20 790 .047575 p < .10 790 * .086462 * p < .01 * 790 * .112519 * p < .01 * 790 .038303 p < .20 790 * .069120 * p < .01 * 790 * .092623 * p < .01 * 790 .023426 p > .20
STAT. BASIC STATS Variable SMAX STEMP SMIN SSUN SREL SCLOUD SDIND SPRES
Kolmogorov-Smirnov Test (550c5195.sta) (Mean & standard deviation knoDn) DRY Márc N max D p 924 .025860 p > .20 924 .024595 p > .20 924 .037197 p < .20 924 * .111845 * p < .01 * 924 .023274 p > .20 924 * .054599 * p < .01 * 924 * .101496 * p < .01 * 924 .025325 p > .20
STAT. BASIC STATS Variable SMAX STEMP SMIN SSUN SREL SCLOUD SDIND SPRES
Kolmogorov-Smirnov Test (550c5195.sta) (Mean & standard deviation knoDn) DRY Márc N max D p 838 .035848 p > .20 838 .035918 p > .20 838 .021800 p > .20 838 * .107393 * p < .01 * 838 .028970 p > .20 838 * .055106 * p < .05 * 838 * .092653 * p < .01 * 838 .031989 p > .20
69
2. Függelék Egy- és többváltozós normalitás vizsgálatnál alkalmazott tesztek.
Egyváltozós ferdeség a j-edik változóra: N
N ∑ (X ij − X • j ) 3 i =1
γ1 j =
N N ∑ (X ij − X • j ) 2 i =1
3
ahol X•j jelöli a változó átlagát és s2j a szórásnégyzetét: X•j =
1 N ∑ X ij N i =1
s 2j =
1 N ∑ (X ij − X • j ) N i =1
Egyváltozós lapultság a j-edik változóra:
N
N ∑ (X ij − X • j ) 4 γ2j =
i =1
2
N N ∑ (X ij − X • j ) 2 − 3 i=1
a fenti formulák alkalmazásával a Mardia fél együtthatók kiszámítása: 1 N γ 2 = ∑ {( x i − x )′S −1 ( x i − x )}2 − p(p + 2) N i =1 ahol xi az i-edik megfigyeléseket tartalmazó vektor, x a mintaátlag, p a megfigyelések száma és S a minta kovariancia mátrixa. A normalizált többváltozós lapultság definiciója: κ 0 =
γ2 8p ( p + 2) / N
A Mardia alapú kappa számítási módja: κ1 =
.
γ2 . p(p + 2)
70
3. Függelék Az AR(1) folyamat paraméterbecslése
A többváltozós gyengén stacionárius folyamaton alapuló elsırendő autoregresszív folyamat definíciója (Matalas, 1967):
X i +1 = AX i + Bε i +1 i = 1,...n ahol Xi, Xi+1 és εi+1 zérus várható értékő vektorok, εi független az Xi-tıl. Az egyenlet mindkét oldalát megszorozva XiT-vel és képezve a várható értékét, a következı összefüggést kapjuk: E (X i +1, X iT ) = AE(X i , X iT ) + BE (ε i +1, X iT ) .
Vezessük be az alábbi jelöléseket: C0=E(Xi, XiT) és C1= E(Xi+1, XiT) (m×m)-es mátrixok. C0 kovariancia mátrix, amely fıátlójában a szórásnégyzeteket tartalmazza, C1 fıátlójában az egy lépéses autokovarianciák, a többi helyen az egy lépéses kereszt kovarianciák állnak. Az A mátrix kiszámítási módja: A=C1C0-1.
B mátrix becslését Xi+1T-vel való szorzást követıen - az elıbbihez hasonló módon - kapjuk, az egyenlet átrendezésével az alábbi alakhoz jutunk:
BBT = C0 − C1C 0−1C1T A spektrálfelbontási tétel felhasználásával kapjuk, hogy B= ΘΛΘT ahol Θ a sajátvektorokat, Λ a sajátértékeket jelöli.
71
4. Függelék Egy- és többváltozós Johnson eloszlás és ezek a kiterjesztett változata
Ismeretlen eloszlású folytonos valószínőségi változó (X) Johnson transzformációval standard normális eloszlásúvá alakítható. A transzformáció általános alakja:
X −ξ Z = γ + δ ⋅ g λ
(1)
ahol X tetszıleges eloszlású folytonos valószínőségi változó, Z standard normális eloszlású, γ és δ az alak, λ a skála, ξ a hely paraméter, g(⋅) pedig olyan függvény, amely a Johnson féle transzformációs rendszerben négy eloszlás családot definiál: S L (log normális) család ln( y) ln[ y + y 2 + 1] S U (korlátlan) család g ( y) = S B (korlátos) család ln[ y /(1 − y)] y S N (normális) család
(2)
A szimuláció során véletlen számmal generált standard normális eloszlású változóból az inverz transzformáció segítségével állíthatjuk elı X-et:
Z−γ X = ξ + λ ⋅ g −1 δ
(3)
ahol
e z S L (log normális) család z −z (e − e ) / 2 S U (korlátlan) család g ( z) = −z S B (korlátos) család 1 /(1 + e ) z S N (normális) család
(4)
Esı lépésben az adott mintához a megfelelı típusú eloszlást ill. a hozzá tartozó függvényt kell kiválasztani. Hahn és Shapiro (1967) a harmadik és negyedik standardizált momentum ismeretében ad összefüggést a típusok kiválasztásához és megadja a momentumbecslést. A dolgozat számára megfelelı ez a módszer, hiszen az Applied Statistics Fortran algoritmus győjteményében az AS90 felhasználásával elvégezhetık a paraméterek elıállításához szükséges számítások (Hill et al., 1976). A négy paraméter megadásával az AS100 algoritmussal (Hill, 1976) végrehajtható a transzformáció ill. az inverz transzformáció. A teljesség kedvéért megemlítjük, hogy Slifker és Shapiro (1980) a percentilisek módszerrel
72
határozta meg az eloszlást és becsülte meg a paramétereket. A FITTR1 programcsomag (Wilson,???) pedig az említetteken kívül még további négy becslési eljárást kínál fel.
Az ismertetett eljárás általánosítható többváltozós esetre oly módon, hogy X=(X1… Xν)T perem eloszlásait egyváltozós Johnson eloszlásokkal közelítjük (Stanfield et
al., 1996). Tapasztalatok szerint ez a módszer jól alkalmazható az átlagra szimmetrikus eloszlásoknál, de ahol a ferdeség számottevı a korreláció mátrix nem elég pontos. Ennek probléma elkerülése érdekében Stanfield et al. (1996) többváltozós Johnson rendszer kiterjesztését javasolja. A szerzık tapasztalatai szerint az ismertetésre kerülı módszerrel az eredeti minta elsı négy momentumával és korrelációival megegyezı sorok szimulálhatók. A Stanfield et al. (1996) cikk 4-ik fejezetét az alábbiakban néhány helyen kibıvítettük és a Függelékben levezetésekkel egészítettük ki. Jelölje X=(X1… Xν)T azaz ν darab változó N elemő mintáit tartalmazó mátrixot, melynek várható érték vektora µX, szórás mátrixa σX = diag[Var1/2(X1),…, Var1/2(Xν)] és korrelációs mátrixa CX. Ismeretes, hogy CX szimmetrikus pozitív definit mátrix (Dévényi és Gulyás, 1988). A Cholesky felbontás tétele értelmében ez szükséges és elégséges feltétele olyan alsó háromszög mátrix X = [Θi,j] = CX1/2
létezésének, amelyre teljesül, hogy
CX = ΘXΘXT (Stoyan és Takó, 1995, I kötet 65.oldal).
Ha Y=(Y1… Yν)T standardizált Johnson eloszlású
valószínőségi változó, azaz
Yi i=1,…, ν nulla várható értékő és egy szórású, adott aY ferdeség és bY lapultság értékekkel, akkor W = µX + σX ΘX Y
(5)
és W mátrix ugyanolyan várhatóérték, ferdeség és lapultság vektorral valamint szórás, és kovariancia mátrixal rendelkezik, mint X.
N
N
∑ (X j − X ) 3 aX=
j=1
Nσ
3
∑ (X j − X ) 4 és
bX =
j=1
Nσ 4
73
Θ X Y = σ −X1 (W − µ X ) .
Az W = µX + σX ΘX Y összefüggésbıl kiindulva kapjuk, hogy
Az egyenlet bal oldalára vezessünk be új jelölést és írjuk fel komponensekre: k
Wk = ∑ υ k , j Y j . Ekkor a harmadik momentum: j=1
k
k
j=1
j=1
E ( Wk3 ) = E (∑ υ k , j ⋅ Y j ) 3 = ∑ υ 3k , j ⋅ EY j3 továbbá alkalmazva a ferdeség definícióját és figyelembe véve, hogy a szórás és a mintaszám az egyenlet mindkét oldalán lévı változóra megegyezik, azt kapjuk, hogy aW = ΘX3aY mivel aW ≅ aX ebbıl következik a (6a) összefüggést.
A negyedik momentum: k
E ( Wk4 ) = E (∑ υ k , j ⋅ Y j ) 4 = E ( j=1
k
k
= E[(∑ j=1
∑
υ k ,i υ k , j υ k ,m υ k ,n Yi Y j Ym Yn ) i , j, m , n =1 k
= E[(∑ υ k2 , j Y j2 + 2 j=1
k
∑ υ k ,m υ k ,n Ym Yn ) ⋅ (∑ υ k2 ,p Yp2 + 2
1≤ m < n ≤ k
υ k2 , j Y j2 ) 2
+4
p =1
∑ (υ k ,m υ k ,n Ym Yn )
2
1≤ m < n ≤ k
=
∑ υ k ,q υ k ,r Yq Yr )]
1≤q < r ≤ k
k
] = ∑ υ 4k , j EY j4 + 6 j=1
∑ υ k2 ,m υ k2 ,n EYm2 EYn2
1≤ m < n ≤ k
mátrixos alakban: b W = Θ 4X a X + Ψ X , mivel bW ≅ bX ebbıl adódik (6b). Az X ferdeség aX és lapultság bX vektorának ismeretében az alábbi módon állítható elı aY és bY vektor:
[ ]a ] (b = [Θ
aY = ΘX bY
( 3) −1
(6a)
X
( 4 ) −1
X
X
− ΨX )
(6b)
ahol ΘX jelöli a k-adik Hadamard szorzatot, ΨX = (Ψ1,…,Ψν) pedig a segédvektort. Definíció szerint (Kitamura, 1995; Styan, 1973) ΘX(k) = [Θi,j(k)] ahol k = 3, 4, ν
illetve Ψi = 6∑
ν
∑ Θ i2, jΘ i2,l
és i = 1,…ν. W illeszkedésének jóságát meghatározza Y
j=1 l= j+1
elıállítása. Tapasztalatok szerint (Stanfield et al., 1986) a fenti módon elıállított ferdeségen korrekciót kell végrehajtani abban az esetben, amikor bY ≥ ay(2) + 1 ekkor bY = ay(2) + 1,25.
74
HIVATKOZÁSOK Bacsi, Zs. and M. Hunkár, 1994: Assessment of the impact of climate change on the yields of winter wheat and maize, using crop models, Idıjárás, 98 (2), 119-134. Bárdossy, A., 1993: Stochastische modelle zur Beschreibung der raum-zeitlichen variabilität des Niederschlages. IHW Heft 44. Bartholy, J. and I. Matyasovszky, 1998: A Kárpát-medence hõmérsékleti és csapadék viszonyainak alakulása a globális éghajlat változások tükrében. IMetetorológiai Tudományos Napok, 1997 nov. 20-21, 117-126. Bartholy, J., I. Matyasovszky and T. Weidinger, 2001: Regional climate change in Hungary: a survey and a stochastic downscaling method. Idıjárás, 105 (1), 1-17. Bartholy, J., T. Pálvölgyi, I. Matyasovszky and T. Weidinger, 1994: Towards narrowing uncertainties of regional climate changes predictions by general ciculation models and empirical methods. In: Proc. XVIIth Conference of the Danube Countries on Hydrological Forecasting and Hydrological Basis of Water Management (Budapest, Hungary, 5-9, September, 1994), 409 - 415. Bass, B, 1993: Development of the Weather Generatot. In: BAHC Focus 4. The Weather generator project. Toronto, Canada, 1-3 December 1993, 21-33. Bálint, G., B. Gauzer, I.W. Dobi and J. Mika, 1995: On hydrological aspects of climate changes based on diurnal simulations. In: Drought in the Carpathians’ Region (BudapestAlsógöd, Hungary, 3-5 May, 1995), 65-77. Bálint, G., I.W. Dobi and J. Mika, 1996: Runoff simulation assuming global warming scenarios. In: Proceedings 18th Conference of the Danube Countries on Hydrological Forecasting and Hydrological Bases of Weather Management ( Gratz, Austria, 25 - 30 August, 1996 ), 131-136. Berger, A., Goossens, Chr., 1983: Persistence of wet and dry spells at Uccle (Belgium). J. Climatol., Vol. 3, N 1, 21-34. Bruhn, J.A., W.E. Fry and G.W. Fick, 1980: Simulation of daily weather data using theoretical probability distributions. J. of Appl. Met. 19 (9), 1029-1036. Cehak, K., Withalm, J., 1980: Über die Gültigkeit eines Markow-Ketten Modells für Niederschlagsperioden im Hochgebirge. Meteorol. Rundsch., Vol. 33, N 5, 148-155.
75
Chin, E.H., , 1977: Modelling daily precipitation occurrence process with Markov chain. Water Resour. Res., Vol. 13, N 6, 949-956. Cox and Hinkley, 1978 (19) Dobi, I.W., Mika J. and L. Szeidl, 1996: On modelling daily rainfall occurrences. In: Proc. 17th Int. Conf. on Carpathian Meteorology (Visegrád, Hungary, 14-18 Oct. 1996), 46-51. Dobi-Wantuch I., Mika J. and Szeidl L., 2000: Modelling wet and dry spells with mixture distributions. Meteorology and Atmos. Phys.,Vol. 73, 245-256. Dévényi D., Gulyás O., 1988: Matematikai statisztikai módszerek a meteorológiában. Tankönyvkiadó, Budapest. Domonkos P. és Mika J., 1992: Az idıjárási elemek közötti összefüggések vizsgálata faktoranalízissel. Hegyfoki Kabos Emlékülés, Debrecen, 140-146. Dubrovsky, M., 1995: Met&Roll: The weather generator for investigating potential impacts of climate change on agriculture. Manuscript to EGS XX General Assembly, (Hamburg, BRD, 37 April, 1995). Dubrovsky, M Zdenek Z. and M. Stastná, 2000: Sensitivity of CERES-maize yields to statistical structure of daily weather series. Climate change 46, 447-472. Éltetı Ö., Meszéna Gy. és Ziermann M., 1982: Sztochasztikus módszerek és modellek. Közgazdasági és Jogi Könyvkiadó, Budapest. Foufoula-Georgiou, E. and D.P. Letettenmaier, 1987: A Markov renewal model for rainfall occurrences. Water Res. Res., 23 (5), 875-884. Füstös L. és Kovács E., 1989: A számítógépes adatelemzés statisztikai módszerei. Tankönyvkiadó, Budapest. Gilyénné Hofer Alice és Nováky Béla, 1998: Az éghajlati hatásvizsgálatok megalapozása a Zala-vízgyőjtı lefolyásának vizsgálatára. Vízügyi Közlemények LXXX. Évf. 3. füzet, 508-521. Gabriel, K.R., Neumann, J.A., 1962: Markov chain model for daily rainfall occurrence at TelAviv. Quarterly Journal of Royal Meteorological Society, Vol. 88, N 375, 90-95. Gates, P., Tong, H., 1976: On Markov chain modelling to some weather data. J. Appl. Meteorol., Vol. 15, 1145-1151.
76
Geng, S. and J.S. Auburn, 1986: Weather simulation models based on summaries of longterm data. In Int. Symp. on Impact of Weather Parameters on the Growth and Yield of Rice. 710 Apr.IRRI, Manila, Philippes., 237-254. Geng, S., F.W.T.Penning de Vries and I. Suppit, 1986: A simple method for generating daily rainfall data. Agricultural and Forest Meteorology, 36, 363-376. Giorgi, F. and L.O. Mearns, 1991: Approaches to the simulations of regional climate change: a review. Reviews of Geophysics, 29 (2), 191-216. Guenni, L., 1994: Spatial Interpolations of the parameters of stochastic weather models. BAHC Rep. No. 3, G. Paoli (ed.), IRR, 61-79. Hahn, G.J. and Shapiro, S.S., 1967: Statistical models in engineering. New York: John Wiley & Sons, Inc. Hanson, C.L. et al., 1989: Daily precipitation simulation model for mountainous areas. Tran. ASAE, Vol. 32, N 3, 865-873. Hantel, M. and F. Ács, 1995: Physical aspects of the weather generator. Submitted to J. of Hidrology. Harnos, Zs, 1998: A klímaváltozás várható alakulása és hatása néhány gazdasági növény termeszthetıségére. In: Metetorológiai Tudományos Napok, 1997 nov. 20-21, 55-66. Hasselmann, 1976: Stochastic climate models. Part I. Theory. Tellus. 28, 473-485. Hayhoe, H.N., 2000: Improvements of stochastic weather data generators for diverse climate. Clim. Res., Vol. 14, 75-87. Hill, I.D., R.Hill and R.L.Holder, 1976: Fitting Johnson curves by moments. Journal Roy. Stat.Soc., Ser. C, Vol 25, 180. IGBP Report No. 27; 1993: Biospheric Aspects of the Hydrological Cycle.The Operational Plan. Ed. By BAHC Core Project Office Johnson G.L., C.L.Hanson, S.P. Hardegree and E.B.Ballard, 1996: Stochastic Weatther Simulation: Overwiew and Analysis of two Commonly Used Models. J.of Appl. Met., 35, 1878-1896. Jones, J.W., R.F. Colwick and E.D. Threadgill, 1970: A simulated environmental model of temperature, evaporation, rainfall and soil moisture. Transactions of the ASAE, 366-372.
77
Jones, P.G. and P.K.Thornton, 1993: A rainfall generator for agricultural applications in the tropics. Agricultural and Forest Meteorology, 63, 1-19. Kaas, E., 1993: Greenhouse induced climate change in the Nordic countries as simulated with the Hamburg climate model. Part 2: Statistical Interpretation, Danish Meteorological Institute Scientific report 93-3. Karlin, S - Taylor, H. M.,1986: Sztochasztikus folyamatok. Gondolat Kiadó, Budapest. Katz, R.W., 1981: On some criteria for estimating the order of a Markov chain. Technometrics, Vol. 23, 243-249. Katz, R.W., 1982: Procedures for determining the statistical significance of precipitation changes simulates by an atmospheric general circulation model. Clim. Res. Inst. Rept., N 33. Kovács Géza és Dunkel Zoltán, 1998: A klímaváltozás várható következményei Magyarország szántóföldjein a következı félszázadban. In: Metetorológiai Tudományos Napok, 1997 nov. 20-21, 181-194. Krishnaiah, P.R., 1980: Analysis of variance. Handbook of statistics. Vol1. North-Holland Publishing Company. Kröel-Dulay György, Bartha Sándor, Wantuchné Dobi Ildikó, Kovács-Láng Edit és Debra P. Coffin, 1998: Mechanisztikus szimulációs modellek alkalmazása száraz homoki gyepek klímaváltozással kapcsolatos dinamikájának predikciójára. In: Metetorológiai Tudományos Napok, 1997 nov. 20-21, 269-274. Lana, X. and A. Burgueňo, 1998: Probabilities of repeted long dry episodes based on the Poisson distribution. An example for Catalonia (NE Spain). Theor. Appl.Climatol., Vol. 60, 111-120. Matalas, N.C., 1967: Mathematical assessment os synthetic hydrology. Water Resources Research, Vol. 3., No. 4., 937-945. Matematikai statisztika, 1995: Szerk. Mogyoródi József és Michaletzky György. Nemzeti tankönyvkiadó, Budapest. Matyasovszky,I, 1986: Meteorológiai idısorok modellezése ARMA-folyamatok segítségével. Idıjárás, 90 (4), 240-250. Matyasovszky, I., Bogárdy, I., 1994: Comparison of two general ciculation models to downscale temperature and precipitation under climate change. Water Resources Research, Vol. 30, No. 12, p. 3437-3448.
78
Matyasovszky, I., Bogárdy, I.,
1996:Downscalling two versions of a general ciculation
models to estimate local hydroclimatic factors under climate change. Hidrological Science, 41 (1), 117-129. Matyasovszky I. and I.W. Dobi, 1989: Methods for analysis of time series of precipitation data using Markov chains (in Hungarian), Idıjárás, Vol. 93, No. 5, 276-288. Matyasovszky,I., A. Bardossy, L. Duckstein, 1993: Space-time precipitation reflecting climate change. Hidrological Sciences, 38, 6, 539-558. Mearns, L.O. 1997: On the statistical evaluation of climate model experiments. Climatic Change. 37, 443-448. Mearns, L.O., C. Rosenzweig and R. Goldberg, 1995: Mean and variance change in climate scenarios: methods, agricultural applications and measures of uncertainty. Climatic Change. 35, 367-396. Mika, J., 1991: A globális felmelegedés regionális éghajlati sajátosságai hazánk térségében. Kandidátusi értekezés. Budapest. Mika,J., 1998: A globális felmelegedés várható magyarországi sajátosságai. Magyarország éghajlata. Szerk: Justyák J. , Budapest. Mika J. és Wantuchné Dobi Ildikó, 1998: Kis globális változások térbeli és idıbeli leskálázása hatásvizsgálati célokra. In: Metetorológiai Tudományos Napok, 1997 nov. 20-21, 99-102. Mimioku, M., 1984: A study for improving precipitation occurences modelling with Markov chain. J. Hydrol., Vol. 70, N 1-4, 25-33. Móri T., 1999: Fõkomponens- és faktoranalízis. (kézirat) Móri T. és Székely G. (szerk.), 1986:Többváltozós statisztikai analízis. Mőszaki Könyvkiadó, Budapest. Panofsky, H.A. and G.W.Brier, 1958: Some Application of Statistics to Meteorology, The Pennsylvanian State University. Péczely,G.,
1957:Grosswetterlagen
in
Ungarn.
Kleinere
Veröffentlichungen
der
Zentralanstalt für Meteorologie, Budapest, 30. Pickering, N.B., J.W. Hansen, J.W. Jones, C.M. Wels, V.K. Chan and D.C. Godwin. 1994: WeatherMan: A utility for managing and generating daily weather data. Agron. J. 86, 332337. 79
Prog. Algorithm as 99, 1000: Applied Statistics (1976) vol. 25. Racsko, P., L. Szeidl, and M. Semenov, 1991: A serial approach to local stochastic weather models. Ecological Modelling, 57, 27-41. Richardson, C.W, 1981: Stochastic simulation of daily precipitation, temperature, and solar radiation. Water. Resources Research, 17, 182-190. Richardson, C.,W. Wright, D.A., 1984: WGEN: A model for generating daily weather variables. USDA Publications ARS-8, 83 pp. Semenov, M.A. and E.M. Barrow, 1997: Use of stochastic weather generator in the development of climate change scenarios. Climate Change, 35, 397-414. Semenov, M.A. and E.M. Barrow, 1999:
Scaling consideration for agricultural climate
change impact assessment. ECLAT-2 Workshop October 13-15, 1999, Potsdam, Germany (manuscript). Slifker, J. F. and S.S.Shapiro, 1980: The Johnson system: selection and parameter estimation. Technometrics, Vol.22, No.2. 239-246. Stanfield, P.M., J.R.Wilson, G.A.Mirka, N.F.Glasscock, J.P.Psohogios, J.R.Davis, 1996: Multivariate input modeling with Johnson distributions. In: Proc. Of the 1966 Winter simulation conference. Ed. J.M.Charnes, D.J.Morice, D.T.Brunner and J.J.Swain,1457-1464. Stern, R.D., 1982: Computing a probability distribution for the start of the rains from Markov Chain model for precipitation. J. of Appl. Met., Vol. 21, 420-423. Storch,H. and A.Navarra, 1993: Analysis of climate variability. Springer. von Storch, H and F. W. Zwiers, 1998: Statistical analysis in climate research, Cambridge University press. von Storch, H., Hewitson, B. and L. Mearns, 2000: Review of empirical downscaling techniques. In: Regional climate development under global warming. (Ed. by T. Iversen and B. A. K. Hoiskar) General Technical Report No. 4. Conf. Proceedings RegClim Spring Meeting Jevnaker, Torbjornrud, Norway, 8.-9. May 2000, p. 29-46. Statistica for Windows, 1995, Statsoft (ISBN 1-884233-12-0) Stoyan G. és Takó G., 1995:Numerikus módszerek. Budapest, ELTE Typotex.
80
Stöckle, C.O., G.B. Bellocchchi and R. Nelson, 1998: Evaluation of weather generator CLIMGEN for several world locations. Proceedings of the 7th ICCTA , November 15-18, 1998, Florence. Székely, V., 1994: Képkorrekció, hanganalízis, térszámítás. Computer Books, Budapest. Szentimrey, T., 1996: Statistical methods for homogenization: break points detection weighting of reference series, In: Proc. of the 13th Conference for Homogenization of Surface Climatological Data (Budapest, Hungary, 6-12 Oct.1996), 47-62. Tusnády G. és Ziermann M. (szerk.), 1986: Idõsorok analízise. Mőszaki Könyvkiadó, Budapest. Voet, P van der, K. Kramer and C.A. van Diepen, 1996: Parametrization of the Richardson weather generator within the European Union. Report 92. The Winand Staring Centre, Wageningen, The Niederlands. Join Reserarch Centre, SC-DLO. Wilks, D., 1992: Adapting stochastic weather generation algorithm for climate change studies. Climate Change, 22, 67-84.
81
KÖSZÖNETNYILVÁNÍTÁS Köszönetemet szeretném kifejezni -
Szeidl Lászlónak és Mika Jánosnak az évek során a nyújtott számtalan szakmai tanácsukért, a sok idıért és energiáért, a lelkiismeretes és kitartó segítségükért és lankadatlan bíztatásukért, amivel lehetıvé tették számomra a modell elkészítését;
-
az Országos Meteorológiai Szolgálatnak a rendelkezésemre bocsátott adatokért, technikai feltételekért valamint azért, hogy lehetıségem volt a modellt jelentıs részben a munkaköri leírásom részeként elkészíteni;
-
a publikációs listában szereplı szerzıtársaimnak, akiktıl sokat tanulhattam;
-
Pröhle Tamásnak a SPSS programcsomag megismerésében nyújtott segítségéért;
-
kollégáim közül szintén hálámat szeretném kinyilvánítani Práger Tamásnak és. Szentimrey
Tamásnak
a
matematikai
fogalmak
alkalmazásakor
felmerülı
problémáim esetén nyújtott gyors segítségükért, Ihász Istvánnak, a Fourier Transzformációt
meghívó
fortran
programok
elkészítésében,
valamint
Randriamanpianina Rogernak különféle számítástechnikai kérdések megoldásában nyújtott segítségéért; -
a felsorolásban szereplı külföldi kollégáimnak (András Bárdossy, Harry Pavlopoulos, Raymond Sneyers és Yuki Seo) akik olyan cikkeket küldtek, melyeket a dolgozathoz felhasználtam; Martin Dubrovskynak akivel többször módomban állt tapasztalatot cserélni; valamint Paul M. Stanfieldnek, aki e-mailen nyújtott tanácsaival segített, hogy a cikkében kidolgozott módszert megfelelıen alkalmazzam;
-
végül, de nem utolsó sorban családomnak. Szeretetük, buzdításuk adott erıt és lehetıséget arra, hogy a Doktori Iskolával járó feladatokat elvállalhassam és végig vihessem. Hálás vagyok férjemnek Wantuch Ferencnek, aki azzal is segítette munkámat, hogy megtanított a C nyelvő programozásra. Neki és gyermekeimnek, Ágnesnek és Viktornak, hogy elviselték, hogy évekig kevesebb idım és energiám maradt rájuk. Végezetül hálásan köszönöm nemrég elhunyt édesanyámnak, aki egész életében buzdított a tanulásra és minden erejével támogatta tanulmányaimat.
A dolgozat témája az alábbi Országos Tudományos Kutatási Alap támogatásokból részesült: OTKA: F-022445, T-025803, T-032214, T-021166, T-022358;
82
Összefoglaló
A dolgozat a valószínőségszámítás, a statisztika és a sztochasztikus folyamatok eszközrendszerének
felhasználását
mutatta
be
az
éghajlat
modellezés
területén.
A célkitőzésben szereplı feladat egy adott földrajzi hely napi idıjárását többdimenziós sztochasztikus folyamatként elıállító ún. Idıjárás Generátor Modell kifejlesztése volt. E modell szerint az idıjárási paraméterek alakulása az egymást követı, egyformán csapadékmentes, illetve csapadékos napok sorozataiból képzett, ún. száraz és nedves idıszakokra épült, mint e két állapottól függı, feltételes valószínőségi modell. Kimutattuk továbbá, hogy a feltételes statisztikák attól is függnek, hogy hányadik napról van szó e szakaszokon belül. E feltételes statisztikákat kilenc (száraz szakaszokra nyolc) meteorológiai változóra határoztuk meg. A száraz és a csapadékos szériák egymástól független sorozatainak elıállítására külön modellként a Poisson és a Geometriai eloszlás keveréke bizonyult a legalkalmasabbnak. A determinisztikus éves menet, valamint a szériákon belüli sorszám hatásának eltávolítására centráló és normáló transzformációkat hajtottunk végre. A vizsgálatok alátámasztották, hogy a száraz ill. csapadékos szakaszokon belül a rezidumok idısorai már minden hónapban gyengén stacionárius sorozatnak tekinthetık. Erre a gondolatmenetre alapoztuk az elsırendő feltételes autoregresszív modell használatát. Felhasználtuk továbbá, hogy a maradéktagok mindegyike nem normális Johnson eloszlású oly módon, hogy zaj tagként adott paraméterő Johnson eloszlású véletlen számokat alkalmazunk. Ezzel a megoldással kilencváltozósra bıvítettük a modellt, amelyben az ismertetett lépések biztosították a szimulált sor és a megfigyelt sor paraméterei közötti, statisztikai értelemben vett azonosságot. Az idısorok belsı összefüggéseit két magyarországi állomás 9 meteorológiai elemének 45 év hosszúságú napi adatsorain tanulmányoztuk. A fejlesztés lépéseit tesztekkel ellenıriztük, az eredményeket ábrák és táblázatok teszik szemléletessé. Az Értekezésben ismertetett modell elméleti alapot nyújt a hazai klímaváltozás következményeit vizsgáló agrometeorológiai, hidrológiai és ökológiai hatástanulmányok meteorológiai kiszolgálására. A fejlesztés következı lépése a dolgozatban alkalmazott leírások alapján egy felhasználóbarát programcsomag készítése.
83
Summary
The dissertation demonstrates a system of applications in the field of climate research, incorporating theorems and methodology of Probability theory, Statistics and Stochastic processes. The aim of the study is to develop a Weather Generator Model which is able to simulate diurnal weather sequences of a given geographical locality as a multivariate stochastic process.
According to this model, the weather parameters are based on the so called dry and wet series, i.e. spells, representing identically dry or rainy consecutive days, performing as a probability model, conditioned by these two states. It is demonstrated that the conditional statistics also depend on the serial number of the day within a given series. Conditional statistics are determined for nine meteorological variables (eight variables for dry spells). Simulation of the dry and wet duration, which perform statistically independent of the previous ones, is the most successful by mixture distribution of Poisson and Geometrical distributions. Transformations of centralization and normalization are performed to remove the deterministic annual cycle and the effect of serial number within a spell. The investigations demonstrate that the residual variables can already be considered, as weakly stationary processes within both the dry and wet series. The use of first-order conditional autoregressive model is based on this idea. It is also utilized, that all the residuals exhibit non-normal Johnson distribution in the way, that random numbers of Johnson distribution are used for simulation of the noise terms. The model is extended to treat nine variables by this solution, and the above steps accomplish an identity between the simulated and observed series in statistical sense.
Internal relations among the time series are investigated for daily weather sequences of two Hungarian stations in a 45 year period, including nine meteorological parameters. Each step of the model development is checked by corresponding tests. The results are illustrated by series of figures and tables. The Model, specified in the Dissertation, provides a theoretical basis to support agrometeorological, hydrological and ecological climate impact studies from meteorological point of view in Hungary. The next step of the development will be to compile a user friendly software package, based on the specifications applied in the Dissertation.
84