dc_483_12
Bifurkációk komplex rendszerek differenciálegyenleteiben
Simon L. Péter Eötvös Loránd Tudományegyetem Matematikai Intézet Alkalmazott Analízis és Számításmatematikai Tanszék
Akadémiai doktori értekezés
2012
dc_483_12 ii
dc_483_12
Tartalomjegyzék 1. Bevezetés 1.1. Reakció-diffúzió egyenletek . . . . . . . . . . . . . . . . . . . . . . . 1.1.1. Reakció-diffúzió egyenletek kutatásának fontosabb területei 1.1.2. Reakció-diffúzió egyenletekkel kapcsolatos saját eredmények 1.2. Hálózati folyamatok . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1. Hálózati folyamatokkal kapcsolatos saját eredmények . . . .
. . . . .
2. Stacionárius megoldások 2.1. Irodalmi áttekintés . . . . . . . . . . . . . . . . . . . . . . . . 2.2. A "time-map" módszer . . . . . . . . . . . . . . . . . . . . . . 2.2.1. A "time-map" monotonitása . . . . . . . . . . . . . . . 2.2.2. A "time-map" értelmezési tartománya . . . . . . . . . 2.2.3. A "time-map" határértékei az értelmezési tartomány pontjaiban . . . . . . . . . . . . . . . . . . . . . . . . . 2.3. A megoldások száma konvex f esetén . . . . . . . . . . . . . . 2.4. Kvázilineáris egyenlet megoldásainak száma . . . . . . . . . . 2.5. A megoldások száma szinguláris f esetén . . . . . . . . . . . . 2.5.1. A megoldások száma f (u) = u−α + up esetén . . . . . 2.5.2. A megoldások száma f (u) = up − u−α és n = 1 esetén 2.5.3. A megoldások száma f (u) = u−α − up esetén . . . . . 2.6. Stabilitás konvex és konkáv f esetén . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . határ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3. Utazó hullám megoldások 3.1. Utazó hullámok létezése . . . . . . . . . . . . . . . . 3.2. Utazó hullámok stabilitása . . . . . . . . . . . . . . . 3.3. A linearizálással kapott operátor spektruma . . . . . 3.3.1. A spektrum jellemzése az invariáns alterekkel 3.3.2. Az Evans-függvény . . . . . . . . . . . . . . . 3.4. Stabilitásvizsgálat egy egyenlet, m = 1 esetén . . . .
. . . . . .
4. Hálózati folyamatok 4.1. A matematikai modell . . . . . . . . . . . . 4.1.1. A csúcsok állapotát leíró dinamikák 4.1.2. Hálózatok típusai . . . . . . . . . . . 4.2. Járványterjedés hálózaton . . . . . . . . . . 4.2.1. Homogén fokszámeloszlású gráf . . . iii
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . .
. . . . . . . . . . .
. . . . . . . . . . .
1 2 2 4 6 8 11 12 14 15 19 20 21 24 26 27 29 32 32
. . . . . .
35 35 37 38 39 42 43
. . . . .
49 49 49 52 55 57
dc_483_12 iv
TARTALOMJEGYZÉK 4.2.2. Heterogén fokszámeloszlású gráf . . . 4.2.3. Effektív fokszám modell . . . . . . . 4.2.4. Momentum lezárással felírt modellek 4.2.5. Háztartás típusú modellek . . . . . . 4.3. A numerikus szimuláció . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
58 60 62 64 65
5. SIS dinamika általános gráfon 5.1. Alapegyenletek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2. Az alapegyenletek egyszerűsítése összevonással . . . . . . . . . . . . 5.2.1. Összevonás három csúcsú teljes gráf esetén . . . . . . . . . . . 5.2.2. Lineáris differenciálegyenletek összevonása . . . . . . . . . . . 5.2.3. Az SIS dinamikához tartozó alapegyenlet összevonása a gráf automorfizmusainak segítségével . . . . . . . . . . . . . . . . 5.3. Összevonás különböző típusú gráfokon . . . . . . . . . . . . . . . . . 5.3.1. Összevonás teljes gráf esetén . . . . . . . . . . . . . . . . . . 5.3.2. Összevonás csillag gráf esetén . . . . . . . . . . . . . . . . . . 5.3.3. Összevonás háztartás típusú gráf esetén . . . . . . . . . . . . 5.3.4. Összevonás körgráf esetén . . . . . . . . . . . . . . . . . . . . 5.4. Várható értékekre vonatkozó egyenletek . . . . . . . . . . . . . . . . 5.4.1. Differenciálegyenlet a csúcsok számának várható értékére . . . 5.4.2. Differenciálegyenlet az élek számának várható értékére . . . .
67 67 71 72 73
6. Közelítő differenciálegyenletek 6.1. Az alapegyenlet közelítő differenciálegyenletei . . . 6.2. Közelítés elsőrendű parciális differenciálegyenlettel 6.3. Sztochasztikus módszer . . . . . . . . . . . . . . . 6.4. Végtelen rendszer a momentumokra . . . . . . . . 6.4.1. Kato-féle perturbációs módszer . . . . . . . 6.4.2. Elemi bizonyítás a (6.3) együtthatók esetén 6.5. Operátor félcsoportok módszere . . . . . . . . . . Hivatkozások
. . . . .
. . . . . . .
. . . . .
. . . . . . .
. . . . .
. . . . . . .
. . . . .
. . . . . . .
. . . . .
. . . . . . .
. . . . .
. . . . . . .
. . . . .
. . . . . . .
. . . . .
. . . . . . .
. . . . .
. . . . . . .
. . . . . . .
74 77 77 78 79 80 81 82 84 89 91 93 95 99 102 104 110 117
dc_483_12
1. fejezet
Bevezetés A differenciálegyenletek kvalitatív elméletének kezdeteit rendszerint Poincaré munkásságáig vezetik vissza, amikor a természettudományokban (akkor elsősorban a fizikában) felmerülő összetett rendszereket leíró differenciálegyenletekről kiderült, hogy többségükben nem lineárisak, és ezek megoldása képlettel ritkán adható meg. A komplex rendszer fogalma a természettudományokban, a fizikában, kémiában és biológiában többé kevésbé jól körülhatárolt, rendszerint olyan, sok összetevőből álló rendszert értenek alatta, melynek elemei valamilyen struktúra alapján kapcsolódnak össze. Ha ebben a struktúrában valamilyen szabályosság van, mint például egy kristály szerkezete, akkor a matematikai modell parciális differenciálegyenletként adható meg. Azonban számos esetben a kapcsolatok sokkal bonyolultabb rendszert alkotnak, mint például az internet szerkezete, vagy egy sejt metabolikus hálózata, ilyen esetekben a matematikai modell egy komplex hálózat, illetve a hálózaton megadott differenciálegyenlet-rendszer. A természettudományokban megjelenő komplex rendszerek több esetben nemcsak motiválták a matematikai vizsgálatokat, hanem új matematikai területek megszületésében és fejlődésében jelentős szerepet játszottak. A XX. század közepétől napjainkig az alábbi három jelentős diszciplína megjelenésének lehetünk tanúi: • Káoszelmélet • Térbeli jelenségek (mintázatok és utazó hullámok) leírása • Hálózati folyamatok.
Történeti megjelenésük a fenti sorrendben a XX. század hatvanas és nyolcvanas éveire, illetve a XXI. század első évtizedére tehető. Érdekes módon mindháromnak van sokkal korábbi matematikai előfutára, Poincaré munkássága a XX. század elején, Kolmogorov, Petrovszkij, Piszkunov, valamint Turing dolgozatai a XX. század közepén, illetve Erdős és Rényi cikke 1959-ben. Azonban a területek fejlődésének megindulásához megfelelő számítástechnikai háttérre is szükség volt. Így a káoszelmélet indulását nagyban segítették Lorenz numerikus vizsgálatai a meteorológiában megjelenő egyszerű háromváltozós közönséges differenciálegyenlet-rendszerrel kapcsolatban. A térbeli jelenségeket leíró parciális differenciálegyenletek effektív numerikus megoldására a 80-as években érett meg a helyzet, míg a milliós nagyságrendű csúccsal rendelkező gráfok számítógépes kezelése a XX. század végén vált elérhetővé. A fenti három 1
dc_483_12 2
1. FEJEZET. BEVEZETÉS
területen megindult kutatások a matematika saját belső fejlődésére is nagy hatással voltak. A dinamikai rendszerek kvalitatív elmélete a múlt század hatvanas éveitől jelentős fejlődésnek indult az alkalmazások felől érkező hatásnak köszönhetően. A hetvenes és nyolcvanas évektől fordult az érdeklődés a végtelen dimenziós fázisterű dinamikai rendszerek (lényegében parciális és késleltetett differenciálegyenletek) felé, ahol nagy erővel megindult a véges dimenzióban ismert tételek általánosítása a különböző végtelen dimenziós esetekre. A hálózati folyamatok vizsgálata egyelőre a numerikus kísérletek szintjén mozog, a matematika területén kapcsolódik a gráfelmélethez, a Markov-folyamatokhoz és a dinamikai rendszerekhez is, a szerző véleménye szerint még nem alakult ki a jelenségek leírására alkalmas matematikai struktúra. Saját kutatásaink az elmúlt nagyjából tíz évben a két utóbbi területre, nevezetesen a reakció-diffúzió egyenletek területére és a hálózaton zajló járványterjedés modellezésének területére estek. Ezeken belül is elsősorban a modellként kapott differenciálegyenletek bifurkációit, azaz a paraméterek változása során bekövetkező kvalitatív változásokat vizsgáltuk. Ilyen témájú kutatási eredményeinket vázlatosan ismertetjük a továbbiakban a bevezetésben, majd a fontosabb részeket fejtjük ki az értekezésben.
1.1. Reakció-diffúzió egyenletek A reakció-diffúzió egyenletek matematikailag szemilineáris parabolikus parciális differenciálegyenletek, melyek általános alakja ∂t u = D∆u + f (u),
(1.1)
ahol u : R+ × Rn → Rm az ismeretlen függvény, f : Rm → Rm folytonosan differenciálható függvény és D pozitív elemű diagonális mátrix (az idő szerinti parciális deriválást, illetve a tér szerinti Laplace-operátort koordinátánként alkalmazzuk az u függvényre). Az egyenlethez különböző peremfeltételek tartozhatnak, utazó hullámok vizsgálata esetén például az egyenletet a teljes Rn téren tekintik, ekkor a peremfeltételek u korlátosságára vagy végtelenbeli határértékére vonatkoznak. Korlátos tartomány esetén mindhárom típusú szokásos peremfeltétel előfordul a vizsgálatokban. A peremfeltétel mellett természetesen az u(·, 0) kezdeti függvény megadása is szükséges. Az egyenlet neve a kémiai alkalmazásból származik, ez esetben uk (t, x) a k-adik (k = 1, 2, . . . , m) anyag koncentrációját jelenti a t időpontban és az x helyen, továbbá a jobboldal első tagja fejezi ki a diffúziót, a második pedig a kémiai reakciókat. Az egyenlet azonban számos más fizikai, biológiai, közgazdasági jelenség modellje is lehet a járványterjedéstől az ingerület vezetésen át a mintázat képződésig. Reakció-diffúzió egyenletek különböző alkalmazásairól számtalan publikáció között több könyv is található. Ezekről, valamint az elméleti eredményekről adunk összefoglalást a következő szakaszban. Ezt követően mutatjuk be saját eredményeinket, amelyek reakció-diffúzió egyenletekkel kapcsolatosak.
1.1.1. Reakció-diffúzió egyenletek kutatásának fontosabb területei A reakció-diffúzió egyenletek kutatásának elindításában úttörő szerepet játszó dolgozatokként a következőket szokás megemlíteni. Fisher 1937-ben írt dolgozata [60] a
dc_483_12 1.1. REAKCIÓ-DIFFÚZIÓ EGYENLETEK
3
gének terjedésével foglalkozik, Kolmogorov, Petrovszkij és Piscunov ugyanebből az évből származó munkája [89] az utazó hullámok kutatását indította el, Turing 1952es cikke [143] pedig a mintázatképződés vizsgálatának előfutára. Számtalan dolgozat megjelenését követően Fife 1979-ben írott könyve [59] összefoglalást adott a kémiai és biológiai alkalmazásokról, valamint a kvalitatív vizsgálat addigi eredményeiről egy egyenletre (m = 1) vonatkozóan (stacionárius megoldások és utazó hullámok létezése és stabilitása). Smoller 1983-as monográfiája [136] az alkalmazások mellett rendszerek (m > 1) esetében részletesen tárgyalja utazó hullámok létezésének bizonyítását topologikus módszerekkel (Conley-féle index). Grindrod 1991-ben megjelent könyve [69] a mintázatok és utazó hullámok tárgyalásához szükséges matematikai eszközöket mutatja be. Kuramoto, valamint Phillipson és Schuster művei [92, 121] a kémiai, Murray és Britton munkái [30, 109] a biológiai, Rubinstein monográfiája [128] az elektro-kémiai, Giovagnili, valamint Zeldovich és munkatársai által írott könyvek [65, 152] pedig az égéselméleti és lángterjedési alkalmazásokról adnak áttekintést. A több egyenletből álló rendszerek vizsgálata a kilencvenes években terjedt el. Az elsősorban populációdinamikához tartozó biológiai alkalmazásokat Leung [103] monográfiája, a fiziológiai modelleket pedig Keener és Sneyd könyvei [84, 85] tárgyalják. Farkas Miklós könyvében [57] nemcsak reakció-diffúzió egyenletek, hanem közönséges differenciálegyenlet-rendszerek biológiai alkalmazására is számos példát láthatunk. A reakció-diffúzió egyenletek kutatása az alkalmazásokon kívül a dinamikai rendszerek elméletéből nőtt ki, ugyanis az U (t) = u(·, t) függvényt bevezetve az (1.1) egyenlet az U˙ (t) = AU (t) + F (U (t)) (1.2) absztrakt Cauchy-feladatként írható fel. Kézenfekvő tehát megvizsgálni, hogy az x(t) ˙ = f (x(t)) közönséges differenciálegyenlet-rendszerre vonatkozó eredmények menynyiben általánosíthatók az (1.2) végtelen dimenziós feladatra. Ismert, hogy a közönséges differenciálegyenlet-rendszer megoldásai dinamikai rendszert határoznak meg. A (1.2) egyenlet esetében ennek bizonyítása azért sokkal nehezebb feladat, mert a jobboldalon szereplő A operátor nem korlátos. Az ötvenes évektől kezdődően kifejlesztett operátor félcsoport elmélet segítségével kidolgozták az (1.2) Cauchyfeladatra vonatkozó egzisztencia elméletet, melyről például Henry, Rothe, Pazy illetve Cazenave és Haraux könyvében, valamint Amann dolgozatában olvashatunk [4, 37, 70, 120, 126]. A dinamikai rendszer létezésének bizonyításával megkezdődhetett a kvalitatív tulajdonságok tanulmányozása. Ez magában foglalja a stacionárius, periodikus, kaotikus, illetve utazó hullám megoldások létezésének, pontos számának, valamint stabilitásának vizsgálatát. A speciális típusú megoldásokon kívül fontos kérdés a megoldások aszimptotikus (hosszú idő utáni) viselkedése, valamint az attraktorok létezésének kérdése, és vonzási tartományaik meghatározása, melyet általánosan tárgyal Robinson könyve [125], valamint Fiedler és Scheel összefoglaló dolgozata [58]. A közönséges differenciálegyenleteknél tapasztalt jelenségek természetesen a végtelen dimenziós megfelelőjük esetében is megjelennek, számos új jelenség kíséretében. A kvalitatív vizsgálatban fontos szerepet játszanak a variációs módszerek [6, 48, 139], az alsó és felső megoldások konstruálásán alapuló monoton módszerek [48, 118], valamint a topológiai módszerek, melyek fő eszközei a Leray-Schauder fokszám és a Conley-féle index [32, 48, 136]. A stacionárius megoldások számával kapcsolatos
dc_483_12 4
1. FEJEZET. BEVEZETÉS
eredményekről részletes összefoglalást fogunk adni a 2.1. alfejezetben, addig is az ezzel foglalkozó könyvek és összefoglaló munkák közül kiemeljük Lions dolgozatát [102] és Shi könyvét [134]. Az utazó hullámokat a 3. fejezetben fogjuk részletesen tárgyalni, most csak a [145] monográfiára utalunk. A kvalitatív elméletnek ez a két területe az, amellyel magunk is foglalkoztunk. A következő szakaszban áttekintést adunk az általunk vizsgált kérdésekről.
1.1.2. Reakció-diffúzió egyenletekkel kapcsolatos saját eredmények A különböző alkalmazásokban megjelenő reakció-diffúzió egyenletekkel kapcsolatos eredményeinket ismertetjük először részletesebben. Az elméleti jellegű eredményeket, melyek a stacionárius és utazó hullám megoldásokkal kapcsolatosak csak vázlatosan mutatjuk be, mert ezekről a későbbi fejezetekben részletesen szó lesz. Alkalmazások Kémiai hullámok geometriai leírása Az első, témával kapcsolatos kutatásaink kémiai hullámok geometriai leírására irányultak. Ennek eredményeit tartalmazzák a [156, 157, 158] dolgozatok, melyekben elméleti leírást adunk gyűrű alakú közegben terjedő kémiai hullámokról. Elektrolit dióda Később az elektrolit dióda matematikai modellezésével foglalkoztunk. Ez egy nyitott kémiai rendszer: a reaktor egy polimer gél, amely egy savas és egy lúgos közeget köt össze, melyek között adott potenciálkülönbség van. A kísérletekben a dióda áram-feszültség karakterisztikáját mérik. A félvezető diódához hasonlóan nyitóirányú feszültségnél a karakterisztika nagyobb meredekségű, mint záróirányú esetén. Az elektrolit dióda matematikai modellje egy reakció-diffúzió típusú parciális differenciálegyenlet-rendszer, amely a Nernst-Planck egyenletekből származtatható. Ezen rendszer analitikus megoldása nem állítható elő, ezért a stacionárius megoldásokat egyrészt a Nernst-Planck egyenletek analitikus megoldásaival, illetve ezek megfelelő csatlakoztatásával közelítettük, másrészt numerikusan határoztuk meg [159, 160, 161]. Lángterjedés A Leedsi Egyetemen működő kutatócsoporttal való együttműködésben lángterjedést leíró reakció-diffúzió egyenletek utazó hullám megoldásait vizsgáltuk több dolgozatban. A [162] cikkben az égést egy elsőrendű, exoterm reakció adja meg, a hőveszteséget egy lineáris függvény írja le. Az ebben szereplő paraméter függvényében numerikusan meghatároztuk a hullám megoldásokat és azok sebességét. A paraméter egy kritikus értéke alatt két megoldása van a peremérték- feladatnak, felette pedig nincs megoldás. Ezen modellben megjelenő különböző bifurkációk részletes numerikus vizsgálatát tartalmazza a [169] publikáció. A [163, 165] dolgozatokban az elsőrendű, exoterm reakció mellett egy endoterm reakció is szerepel, amely a fizikai
dc_483_12 1.1. REAKCIÓ-DIFFÚZIÓ EGYENLETEK
5
hőveszteséget pótolja. Az endoterm reakció sebességét jellemző paraméter függvényében meghatároztuk a hullám megoldásokat. Kiderült, hogy itt is nyereg-csomó bifurkáció van egy kritikus paraméter értéknél; ezalatt három megoldás van, felette pedig egy megoldás. A [168] cikkben egy két reakciólépésből álló endoterm reakció is szerepel, amely a hőveszteséget írja le. A témában közölt előző dolgozatainkhoz képest ez egy kémiailag sokkal reálisabb modell. A változók száma az eddigi kettő, illetve három helyet most öt, és a paraméterek száma is növekedett. Így többféle bifurkációs diagrammot kellett elkészíteni. Kiderült, hogy bizonyos paraméter tartományokban négy utazó hullám megoldás is van. Két helyen is találtunk nyeregcsomó bifurkációt. Ezután a lángterjedést leíró utazó hullám megoldások stabilitását vizsgáltuk. A [164] dolgozatban a [162] cikkbeli modellben kapott utazó hullám stabilitását vizsgáltuk, míg a [166] publikáció a [165] cikkbeli három változós modell utazó hullám megoldásainak stabilitásával foglalkozik. A lángterjedési modellekben kapott utazó hullámok stabilitásának vizsgálatával kapcsolatos eredményeket, és az Evans-függvény ilyen rendszerekre történő alkalmazását foglaltuk össze a [167] cikkben. Két-dimenziós tartományban terjedő utazó hullámok stabilitásának vizsgálatával is foglalkoztunk. Ebben az esetben a síkhullám terjedési irányára merőleges perturbációi is megmaradhatnak. Ez olyan típusú instabilitás, ami a szokásos egydimenzióban terjedő utazó hullámoknál nem léphet fel. Tehát a szokásos értelemben stabilis hullám egy két-dimenziós tartományban tekintve instabilis lehet. Meg lehet határozni az ilyen típusú instabilitás feltételét. A [170] dolgozatban a [162] cikkbeli modell esetében numerikusan meghatároztuk, hogy milyen paraméter értékeknél lép fel ez a bifurkáció. Kémiai reakciók A [173, 174] dolgozatokban egy autokatalitikus reakciót tartalmazó reakció-diffúzió egyenletrendszer radiálisan szimmetrikus stacionárius megoldásait vizsgáltuk. Meghatároztuk, hogy mely reakciórend esetén van ilyen stacionárius megoldás, melyet numerikusan is kiszámítottunk. A [171, 172] cikkekben a Belouszov-Zsabotyinszkij reakció Oregonátor modelljében az utazó hullám megoldásokat tanulmányoztuk. Az első dolgozatban numerikusan meghatároztuk a nyereg-csomó bifurkációt, és elméleti becslést adtunk ennek helyére. A második dolgozatban kimutattuk, hogy az elektromos térerősséget, mint paramétert változtatva nyereg-csomó bifurkáció során két utazó hullám megoldás jelenik meg. Az utazó hullámok numerikus meghatározásán kívül elméleti becslést adtunk a paraméterek azon értékére, amelyek mellett az utazó hullám megoldások léteznek. Elméleti vizsgálatok Az elméleti jellegű eredményeink a stacionárius és utazó hullám megoldásokkal kapcsolatosak. A stacionárius állapotok számának és stabilitásának vizsgálata során először olyan szemilineáris elliptikus egyenletek bifurkációit vizsgáltuk, melyekben konvex, vagy konkáv nemlineáris tag szerepel. Az egy-dimenziós esetben sikerült a pozitív megoldások számában bekövetkező összes lehetséges bifurkációt leírni [178], melyről
dc_483_12 6
1. FEJEZET. BEVEZETÉS
a 2.3. szakaszban lesz szó. Ezeket az eredményeket kvázilineáris egyenletre is általánosítottuk [182], melyet a 2.3. szakaszban tárgyalunk. Több dimenziós esetben a megoldások stabilitását tudtuk jellemezni [179], melyet kvázilineáris egyenletekre is általánosítottunk [180], ezeket az eredményeket a 2.6. szakaszban olvashatjuk. A [175] dolgozatban játékelméleti modellekből származó, nem-folytonos jobboldalú reakció-diffúzió egyenletek megoldásának létezését bizonyítottuk, és a stacionárius megoldások vizsgálatával foglalkoztunk. A [176] dolgozatban egy Kolmogorov-Petrovszkij-Piscunov típusú nemlinearitást tartalmazó szemilineáris elliptikus egyenletet vizsgáltunk. A probléma egy valószínűségszámításbeli kérdés kapcsán vetődött fel. A dolgozatban megmutattuk, hogy az egyenletnek nincs olyan megoldása, amely az egész n-dimenziós téren értelmezve van és értékei 0 és 1 közé esnek. Több dolgozatban foglalkoztunk olyan szemilineáris differenciálegyenlethez tartozó peremérték probléma pozitív megoldásai számának vizsgálatával, melyben a nemlinearitás f (u) = up ± u−α alakú, azaz egy negatív és egy pozitív kitevős hatványfüggvény összege, a megoldás pedig egy gömb peremén nulla. Itt a fő probléma a nemlinearitás szingularitása a peremen. A nem-szinguláris egyenletre vonatkozó eredmények természetesen erre az esetre nem alkalmazhatók, de sikerült az ott alkalmazott módszereket a szinguláris esetre is kiterjeszteni. Az f (u) = up + u−α esetet a [183] dolgozatban vizsgáltuk, az f (u) = up −u−α esethez tartozó eredményeink pedig a [184, 185] cikkekben jelentek meg. Ezen eredményeket részletesen a 2.5. alfejezet tárgyalja. Az utazó hullámokkal kapcsolatos elméleti eredmények az Evans-függvény módszerhez kötődnek. A módszer alkalmazásának elméleti hátterét a [177] cikkben írtuk le, melyről a 3. fejezetben olvashatunk.
1.2. Hálózati folyamatok A hálózati folyamatok matematikai leírását célszerű egy egyszerű, de mégis komoly matematikai kihívást jelentő motiváló példán, nevezetesen az SIS típusú járványterjedésen bemutatni. Tekintsünk egy N csúcsú, irányítatlan, hurokélmentes gráfot. A gráf csúcsai kétféle állapotban, fertőző (I), illetve egészséges (S), lehetnek. A gráf egy csúcsának állapota kétféleképpen változhat: egy I típusú csúcs adott valószínűséggel meggyógyul, azaz S típusú lesz, illetve egy S típusú csúcsot az I típusú szomszédai valamilyen valószínűséggel megfertőznek, és maga is I típusú lesz. Mind a fertőzést és a gyógyulást független Poisson-folyamattal írjuk le, azaz egy rövid ∆t idő alatt egy S típusú csúcs, melynek k darab I típusú szomszédja van 1 − exp(−kτ ∆t) valószínűséggel megfertőződik, azaz I típusú lesz, míg egy I csúcs 1 − exp(−γ∆t) valószínűséggel meggyógyul, azaz S típusú lesz, ahol τ és γ adott pozitív számok, melyeket fertőzési, illetve gyógyulási rátának fogunk hívni. Az alapvető kérdés az, hogy hogyan változik időben a fertőző csúcsok számának várható értéke. Emellett természetesen fontos kérdés ennek szórása, vagy a még pontosabb leírás kedvéért a fertőző csúcsok eloszlásának időbeli változása. A járványterjedésen kívül számos más jelenség vezet hasonló matematikai problémához, például a híresztelések terjedése társadalmi hálózaton, vagy az aktivitás
dc_483_12 1.2. HÁLÓZATI FOLYAMATOK
7
terjedése biológiai neurális hálózatokon. A hálózati folyamatok vizsgálata viszonylag új kutatási terület, ennek ellenére matematikai leírásáról már megjelentek összefoglaló munkák, Newman, Barabási és Watts könyve [113], Barrat, Barthélemy és Vespignani monográfiája [15], valamint kifejezetten a járvány és híresztelés terjedésről Draief és Massoulié könyve [49]. A fenti motiváló példák alapján körülhatárolható az a matematikai struktúra, amelyben vizsgálatainkat végezni fogjuk. Legyen adott egy N csúcsú gráf, melynek csúcsai véges sok (m) állapot valamelyikében lehetnek, és legyen adott egy dinamika, amely megadja, hogy a csúcsok állapota hogyan változik a szomszédos csúcsok állapotától függően. A modell egy mN elemű állapottéren megadott folytonos idejű Markov-lánc, melynek állapotegyenlete egy mN egyenletből álló lineáris közönséges differenciálegyenlet-rendszer. Ezt a rendszert a következő szakaszban felírjuk általánosan, majd bemutatjuk, hogy különböző típusú gráfokon, milyen dinamikákat vizsgáltak eddig az irodalomban. A kutatások célja annak felderítése, hogy a gráf szerkezetének ismeretében mit tudunk mondani a folyamat fenti jellemzőiről. Mivel az állapottér ilyen nagy méretű, azért eddig viszonylag kevés olyan eredmény született, ami a gráf szerkezetét kapcsolatba tudta hozni például a fertőző csúcsok számának várható értékével. A kérdés fontossága, és a számítási kapacitás jelentős megnövekedése hatására azonban a kilencvenes évek végére számos olyan dolgozat született (elsősorban biológusok és fizikusok munkái), amelyben különböző gráfokon Monte-Carlo szimuláció segítségével összehasonlították a járványterjedés folyamatát. A Monte-Carlo szimuláció pontos algoritmusát alább fogjuk ismertetni, azt azonban a részletes ismertetés nélkül is állíthatjuk, hogy a szimulációk alapján numerikus tapasztalatot szerezhetünk, de elméleti összefüggést nem tudunk megállapítani a gráf szerkezete és a folyamat jellemzői között. Az értekezésben azt fogjuk vizsgálni, hogy a folyamatot leíró Markov-lánc alapegyenletének nevezett differenciálegyenletben hogyan jelenik meg a gráf struktúrája, és a differenciálegyenletek elmélete eszközeinek segítségével mit lehet mondani a gráf szerkezete és a folyamat jellemzői közötti kapcsolatról. Egy hálózati folyamat leírására természetesen nem kizárólag a fenti matematikai struktúra alkalmas. A 4.2 szakaszban ismertetjük, hogy a járványterjedési dinamikák esetében a fenti modellen kívül milyen más modelleket vezettek be. Hangsúlyozzuk, hogy ebben az értekezésben nem célunk a járványterjedés modellezése. Ez a biológus és fizikus irodalomban nagyon széles körben vizsgált kérdés, melynél a jóság kritériuma a mérési adatokkal való egyezés. Ezzel szemben a matematikai vizsgálat célja: egy adott matematikai modell minél alaposabb megértése, illetve esetleg különböző modellek összehasonlítása matematikai szempontból. Kutatásai területünk tehát a fenti, a gráffal és a véges állapotterű dinamikával megadott, mN egyenletből álló lineáris rendszer vizsgálata. A cél először a modell formális definiálása, majd a differenciálegyenletek elméletének eszközeivel a modell redukálása olyan egyszerűbb rendszerekre, amelyek kvalitatív vizsgálata minél többet elárul a modell viselkedéséről. A továbbiakban röviden áttekintjük saját kutatási eredményeinket.
dc_483_12 8
1. FEJEZET. BEVEZETÉS
1.2.1. Hálózati folyamatokkal kapcsolatos saját eredmények A hálózati folyamatokkal kapcsolatos saját kutatásaink a dinamikai rendszerek és reakció-diffúzió egyenletek vizsgálata során szerzett tapasztalatainkra épülnek. Kutatásaink kezdetén különböző típusú hálózatokat és folyamatokat leíró kompartment modelleket vizsgáltunk a differenciálegyenletek kvalitatív elméletének eszközeivel. Ezután SIS típusú járványterjedés esetén a 2N egyenletből álló alapegyenlet-rendszer redukálásának lehetőségeit tanulmányoztuk. A legutóbbi kutatásaink adaptív hálózatok megértését célozzák meg. Olyan folyamatokat tanulmányozunk, amelyeknél gráf maga is megváltozik a csúcsok állapotától függően. A folyamat során élek szűnnek meg, illetve jönnek létre a végpontjaik állapotától függően. Az alábbiakban az e három területen végzett munkánkat foglaljuk össze. Az értekezésben részletesen az alapegyenlet-rendszer redukálásával kapcsolatos eredményeinket mutatjuk be. Információ és járványterjedés Amennyiben a gráf pontos szerkezete nem ismert (ez áll fenn általában valós modellek esetén), akkor a gráf struktúráját valamennyiben magában foglaló, mégis jelentős egyszerűsítéseket tartalmazó modelleket célszerű bevezetni. Ezen modellek esetében az egyszerű járványterjedésnél összetettebb folyamatok is vizsgálhatók. A témával foglalkozó első dolgozatunkban egy olyan közönséges differenciálegyenlet-rendszert vizsgáltunk, amely az úgynevezett preferált kapcsolódással jellemezhető hálózaton történő járványterjedést ír le. Egy ilyen hálózatot olyan véletlen gráffal modelleznek, amelyben a csúcsok kétféle fokszámúak, nevezetesen vannak sok, illetve kevés szomszéddal rendelkező csúcsok. Ezenkívül a modell megadott paraméterei jellemzik, hogy a magas illetve alacsony fokszámú csúcsok milyen arányban kötődnek az ugyanolyan, illetve ellenkező típusúakhoz, azaz egy adott típusú (fokszámú) csúcs milyen típusúakhoz való kapcsolódást preferál. A [186] dolgozatban megvizsgáltuk, hogy különböző kapcsolódási preferenciák esetén a differenciálegyenlet-rendszer megoldásainak tulajdonságaiból mire lehet következtetni a járvány lefolyását illetően. Két további dolgozatban [187, 189] olyan differenciálegyenleteket vizsgáltunk, amelyek a járvány terjedésével párhuzamosan a járvánnyal kapcsolatos információ terjedését is modellezik a hálózaton. Ezekben a gráfon a csúcsok kapcsolódását véletlenszerűnek tekintjük, a differenciálegyenlet kompartment típusú modellből származik, mind a fertőző, és az egészséges csúcsok két kompartmentbe sorolhatók, aszerint, hogy a járvány terjedéséről rendelkeznek-e információval, illetve tájékozatlanok. Különböző feltételezésekből kiindulva számos differenciálegyenlet-rendszer felírható. Az egyszerűbb modelleket analitikusan megvizsgálva sikerült az információ és betegségterjedés kapcsolatáról biológiailag is releváns elméleti eredményeket igazolni, és ezekkel a szimulációból kapott eredményeket alátámasztani. Az alapegyenlet redukciója Az alapegyenlettel kapcsolatos eredményeink az SIS típusú járványterjedés esetére vonatkoznak. A [188] dolgozatban tetszőleges gráf esetén felírtuk az alapegyenletet, amely az irodalomban addig nem jelent meg. Megmutattuk, hogy a gráf automorfizmuscsoportjának ismeretében az egyenletrendszer mérete jelentősen csökkenthető
dc_483_12 1.2. HÁLÓZATI FOLYAMATOK
9
(akár N lineáris függvénye is lehet, ha a gráfnak elegendően sok automorfizmusa van). Ugyanebben a dolgozatban bebizonyítottuk, hogy tetszőleges gráf esetén az I típusú csúcsok számának várható értéke kielégíti az úgynevezett mean-field differenciálegyenletet. A [190] dolgozatban a párok számának várható értékére vonatkozó differenciálegyenleteket is levezettük tetszőleges gráf esetén. Ezeket az eredményeket az értekezés 5.4. szakaszában mutatjuk be. Amennyiben az alapegyenlet redukálható N + 1 egyenletre (például teljes gráf esetén), akkor a redukált rendszerből a várható értékre vonatkozó egyenlet lezárására is levezethetők képletek. Ezzel nem-lineáris, viszont kevés egyenletet tartalmazó rendszert kaphatunk, amely N → ∞ esetén az eredeti egzakt rendszer határátmeneteként adódik. A határátmenet egzakt bizonyítását, különböző esetekre a [192, 193, 194] cikkek tartalmazzák. Ezen eredményeket az értekezés 6.1. szakaszában tárgyaljuk. Adaptív hálózatok Az adaptív hálózatokkal kapcsolatos munkánk keretében olyan folyamatokat tanulmányoztunk, amelyeknél az élek létrehozása és megszüntetése a csúcsok állapotától függ. Ez a járványterjedés esetében például azzal motiválható, hogy a fertőzöttekkel a többi csúcs igyekszik megszűntetni a kapcsolatát, és ezzel egyidejűleg új kapcsolatokat hoz létre. A neurális hálózatok modellezése során is fontos annak vizsgálata, hogy a folyamat során maga a gráf hogyan változik, ennek például az embrionális fejlődés során van hatása az agy kialakulására. Az előző vizsgálatainkhoz hasonlóan a csúcsok kétféle állapotban lehetnek, fertőzött (I) és egészséges ( S). Így háromféle él fordulhat elő a gráfban SS, SI és II típusú. Ezek létrehozására és megszüntetésére három-három rátát adtunk meg, és felírtunk egy öt-változós differenciálegyenlet rendszert az S és I típusú csúcsok, valamint a háromféle él számának megváltozására. A rendszerben két paraméter a csúcsok típusának megváltozásával kapcsolatos, hat paraméter pedig az élek létrehozását és elvágását jellemzi. Ebben a rendszerben számos bifurkáció fordulhat elő. A [191] dolgozatban a differenciálegyenlet megoldásait hasonlítottuk össze a Monte-Carlo szimulációból kapott eredményekkel, és azt vizsgáltuk, hogy az élek változását meghatározó dinamikától függően milyen egyezést mutat a kétféle megközelítés. A rendszerben megjelenő bifurkációk elméleti vizsgálatát a [195] dolgozatban közöltük. Kiderítettük, hogy legfeljebb három egyensúlyi pont lehet, melyek közül az egyik a triviális, ún. fertőzés nélküli egyensúly, melyben az I csúcsok száma nulla. Háromféle bifurkációt találtunk a rendszerben. Az első a fertőzés nélküli egyensúlyban megjelenő transzkritikus bifurkáció, melynek során a triviális egyensúly elveszíti stabilitását, és egy ún. endemikus egyensúly jelenik meg. A második bifurkáció nyereg-csomó típusú, ennek során két endemikus egyensúly jöhet létre. Végül az egyik endemikus egyensúlyban Hopf-bifurkáció következhet be, amely szuperkritikus típusúnak bizonyul, mivel stabil határciklushoz vezet.
dc_483_12 10
1. FEJEZET. BEVEZETÉS
dc_483_12
2. fejezet
Reakció-diffúzió egyenletek stacionárius megoldásai Ebben a fejezetben az egy reakció-diffúzió egyenletre (m = 1) vonatkozó, stacionárius megoldások számával kapcsolatos eredményeinket ismertetjük. Legyen Ω ⊂ Rn sima határú tartomány, a legtöbb esetben ez gömb lesz, és tekintsük a ∆u + f (u) = 0 szemilineáris elliptikus egyenletet azonosan nulla Dirichlet peremfeltétel, azaz u|∂Ω = 0 mellett. Vizsgálatunk tárgya a pozitív megoldások száma. A kérdésfelvetés ilyen formában nagyon általános, az irodalomban több ezer publikáció található ezzel kapcsolatosan, melyek különböző tartományok és különböző nemlinearitások esetén tárgyalják a kérdést. (A Mathematical Reviews keresője az "elliptic positive solution" szavakra mintegy 6500 találatot ad.) Általános tartomány esetén a megoldások számának vizsgálatára topológiai, variációs és monoton módszereket, valamint bifurkációs technikákat alkalmaznak. A nemlinearitások tekintetében jelentős és gyors fejlődésnek lehetünk tanúi az irodalmat tanulmányozva. Először monoton f függvények esetén vizsgálták a kérdést, majd a konkáv és konvex függvények után olyanok következtek, melyek egy szakaszon konvexek egy másikon pedig konkávak. Az eredmények nagyrészt a megoldás létezéséről, illetve egyértelműségéről szólnak. Több megoldás létezésének bizonyítása jóval nehezebb feladat, a megoldások pontos számának eldöntése pedig csak speciális esetekben sikerül. Az általunk kitűzött cél az általános kérdésfelvetésnél annyiban egyszerűbb, hogy gömb tartományon vizsgáljuk a feladatot, viszont szeretnénk a megoldások pontos számát megadni, legalábbis bizonyos nemlinearitások esetén. A továbbiakban tehát a ∆u + f (u) = 0 BR -ben
(2.1)
u = 0 ∂BR -en
(2.2)
peremérték-problémát vizsgáljuk, ahol BR az origó közepű R sugarú gömb. Gömb tartomány esetén a pozitív megoldásokról ismert, hogy radiálisan szimmetrikusak [62], ezért a feladat az alábbi, közönséges differenciálegyenletre vonatkozó 11
dc_483_12 12
2. FEJEZET. STACIONÁRIUS MEGOLDÁSOK
peremérték-feladatra redukálódik. ru′′ (r) + (n − 1)u′ (r) + rf (u(r)) = 0 ′
u (0) = 0, u(R) = 0.
(2.3) (2.4)
Célunk tehát ezen feladat pozitív megoldásainak pontos számát meghatározni. A fejezet felépítése a következő. Először a mi vizsgálatainkhoz kapcsolódó ismert eredményeket tárgyaljuk, majd vizsgálatunk eszközével a "time-map" leképezéssel kapcsolatos alapvető definíciókat és tételeket ismertetjük. Ezt követően mutatjuk be a konvex f függvényekre, kvázilineáris egyenlet esetén p-konvex függvényekre, valamint szinguláris nemlinearitásokra vonatkozó eredményeinket. Végül a stacionárius megoldások stabilitásáról szóló eredményeinket ismertetjük.
2.1. Irodalmi áttekintés Az irodalomban a (2.1)-(2.2) peremérték-feladat helyett legtöbbször a ∆u + λf (u) = 0 B1 -ben
(2.5)
u = 0 ∂B1 -en
(2.6)
problémát vizsgálják, melyben az R helyett a λ a paraméter. Egyszerű változótranszformáció mutatja, hogy a két feladat az R2 = λ helyettesítéssel √ ekvivalens. Ugyanis, ha u megoldása a (2.1)-(2.2) problémának, akkor U (y) = u( λy) megoldása a (2.5)(2.6) feladatnak. Ebben a szakaszban a (2.5)-(2.6) peremérték-feladattal kapcsolatos eredményeket foglaljuk össze. Megjegyezzük, hogy számos dolgozat foglalkozik a feladattal más tartományokon, például gyűrű alakú tartományon, vagy teljes téren [95]. Ezeket az eredményeket itt nem ismertetjük. A vizsgálatok természetesen az f (u) = u lineáris esetből indultak ki, amelynél pontosan akkor létezik pozitív megoldás, ha λ = λ1 , a −∆ operátor sajátértéke. (Ekkor végtelen sok pozitív megoldás van). Az első nem-lineáris eredmény az f (u) = up függvényre vonatkozott, Pohozaev 1965-ben bebizonyította [122], hogy pontosan akkor létezik pozitív megoldás, ha p < n+2 n−2 . A bizonyítás két új gondolaton alapult. Pohozaev egyrészt levezetett egy (később róla elnevezett) azonosságot, melynek radiális megoldásokra vonatkozó alakját, (2.26)-t, később használni fogjuk. Ennek segítségével egyszerűen látható, hogy p ≥ n+2 n−2 esetén nincs megoldás. Másrészt variációs módszer alkalmazásával igazolta, hogy p < n+2 n−2 esetén van pozitív megoldás (amely egy megfelelően választott funkcionál feltételes szélsőértéke), sőt ez egyértelmű is. Pohozaev ezen eredménye nagy hatással volt a későbbi vizsgálatokra. Joseph és n+2 Lundgren 1973-ban az f (u) = (1 + u)p esetet vizsgálták [78]. Kiderült, hogy p = n−2 esetén itt is jelentősen megváltozik a megoldások száma. Míg a kritikus érték alatt pontosan kettő megoldás van, ha λ egy adott érték alatt van, és nincs megoldás ezen érték feletti λ esetén, addig p > n+2 n−2 esetén olyan λ értékek is vannak, amelyeknél végtelen sok pozitív megoldás van. A megoldások pontos számát fázissík analízissel tudták meghatározni, az egyenletet autonóm két-változós rendszerré transzformálva. A későbbi intenzív kutatásokat Brezis és Nirenberg 1983-as cikke [28] indította el. Ebben foglalkoztak először az f (u) = up + uq esettel, elsősorban akkor, amikor
dc_483_12 2.1. IRODALMI ÁTTEKINTÉS
13
n+2 és 1 ≤ q < n+2 p = n−2 n−2 . A q = 1 esetben igazolták, hogy a megoldás létezésének feltétele n ≥ 4 esetén λ < λ1 , n = 3 esetén pedig λ ∈ (λ1 /4, λ1 ). A q > 1 esetben megmutatták, hogy bármely pozitív λ választása mellett létezik megoldás, ha n ≥ 4, vagy n = 3 és 3 < q < 5 (ekkor a kritikus kitevő n+2 n−2 = 5). Az n = 3 és 1 < q ≤ 3 esetben megmutatták, hogy csak bizonyos λ értékek felett van megoldás. Brezis és Nirenberg ezen cikke nyomán sokan vizsgálták a megoldások pontos számát. Míg Brezis és Nirenberg általános tartományon tanulmányozták a kérdést, addig a megoldások pontos számával kapcsolatos eredmények elsősorban a gömb tartomány és radiális megoldások esetére vonatkoztak. Atkinson és Peletier 1986ban megmutatták [8], hogy az előbb említett p = 5, n = 3 és 1 < q ≤ 3 esetben gömbön létezik legalább két pozitív megoldás, ha λ bizonyos érték felett van. Ezután az eredmény után intenzív kutatás indult meg azzal a céllal, hogy kiderítsék, mely n p q és 1 ≤ q < p < n+2 n−2 értékek mellett lesz az f (u) = u + u esetben a pozitív megoldás egyértelmű. A q = 1 esetben az egyértelműséget különböző módszerekkel egymástól függetlenül többen is bebizonyították: Zhang [153], illetve Kwong és Li [97] 1992-ben, Srikanth [138] 1993-ban, valamint Adimurthi és Yadava [1] (kvázilineáris egyenletre is) 1994-ben. Ezekben a dolgozatokban az egyértelműséget p = n+2 n−2 esetén is igazolták. Ha q > 1, akkor láttuk, hogy p = n+2 n−2 esetén lehet két megoldás is, azonban n+2 a p < n−2 esetben csak egyértelműségi eredmények vannak. Az első, korai eredmény Ni és Nussbaum nevéhez fűződik [114]. Már 1985-ban bebizonyították, hogy n 1 ≤ q < p < n−2 esetén a megoldás egyértelmű. Zhang 1995-ben [154] azt mutatta meg, hogy n(p − 1) ≤ 2(q + 1) esetén egyértelmű a megoldás. Végül Erbe és n+2 Tang 1997-ben [54] bebizonyították, hogy p − 1 ≤ q < p < n−2 esetén a megoldás egyértelmű. Ez utóbbi eredményből az is következik, hogy ha n ≥ 6, akkor a teljes n+2 esetén egyértelmű a megoldás, ugyanvizsgált tartományban, azaz 1 ≤ q < p < n−2 n+2 is n ≥ 6 esetén n−2 ≤ 2, így p − 1 ≤ q automatikusan teljesül. A három dolgozat [54, 114, 154] eredményét érdemes a (p, q) paraméter síkon összehasonlítani, amint n+2 a 2.1. ábrán látható az n = 3 esetben. Az 1 ≤ q < p < n−2 háromszögben a megadott szakaszoktól balra eső részben igazolták a fenti dolgozatok szerzői az egyértelműséget. Mint láttuk, n ≥ 6 esetén az egész háromszögben egyértelműség van, azonban 2 < n < 6 esetén a háromszög bizonyos részein a megoldások száma nem ismert. Numerikus vizsgálataink azt mutatják, hogy az egyértelműség nem is igaz a háromszög jobboldali éle mellett. A 0 < q < 1 esetet is többen vizsgálták a megoldások száma szempontjából. n esetén egy Ouyang és Shi 1999-ben igazolták [116], hogy n ≥ 4 és 1 < p < n−2 bizonyos λ érték alatt két megoldás van, felette pedig nincs megoldás. Yadava [149] megmutatta, hogy ez az állítás n = 3 esetén és valamivel bővebb (p, q) tartományban n+2 is igaz. Ez a tartomány azonban még nem fedte le a 0 < q < 1 < p ≤ n−2 téglalapot. Végül Tang 2003-ban igazolta, hogy az állítás fennáll a teljes téglalapban [141]. A 0 < q < p < 1 háromszögben található p és q értékekre az f (u) = up + uq függvény szublineáris, ezért minden λ esetén pontosan egy pozitív megoldása van a (2.5)-(2.6) peremérték-feladatnak, általános tartomány esetén is [29]. A szuperkritikus (p > n+2 n−2 ) tartomány nagy részében nem ismert a megoldások
dc_483_12 14
2. FEJEZET. STACIONÁRIUS MEGOLDÁSOK 5
q n=3
4.5
Zhang
4 3.5 3 2.5
Erbe, Tang
Ni, Nussbaum
2 1.5 1 0.5 0
0
1
2
3
4
5
p
2.1. ábra. A (2.5)-(2.6) peremérték-feladat megoldásának egyértelműsége f (u) = up + uq és n = 3 esetén. A [54, 114, 154] dolgozatokban adott feltételek összehasonlítása. Az egyértelműség az 1 ≤ q < p < n+2 n−2 háromszögben a megadott szakaszoktól balra eső részben teljesül. Az n = 3 esetben a kritikus érték n+2 n−2 = 5, és a [114] dolgozatban n szereplő határ n−2 = 3. n+2 pontos száma. Mindössze annyit mondhatunk, hogy ha p > q > n−2 , akkor a Pohozaev-azonosságból egyszerűen következik, hogy nincs megoldás. A fenti összefoglalást az f (u) = up + uq függvény esetére végeztük el, azonban az említett dolgozatok nagy része általánosabb f függvényekre vonatkozik. Pohozaev [122] dolgozata után többen vizsgálták a konvex f függvény esetét. Mint láttuk, már az f (u) = (1 + u)p esetében is rendkívül bonyolult lehet a bifurkációs diagram, ezért konvex esetben csak az n = 1 esetben lehet teljes leírást adni. Laetsch dolgozatai [98, 99] és Schaaf [130] könyve nyomán megadtuk a bifurkációs diagrammok teljes osztályozását konvex f és n = 1 esetén [178]. A konvex esethez képest konkáv f függvényekre teljesebb leírás adható több dimenziós tartományok esetén is. Erről számos eredményt olvashatunk Castro és munkatársai dolgozataiban [34, 35, 36]. A konvex-konkáv típusú nemlinearitások (amikor f egy szakaszon konvex, egy másikon pedig konkáv) vizsgálata Ambrosetti, Brezis és Cerami cikkével kezdődött [5]. Ebben az esetben elsősorban az f (u) = up − uq , f (u) = up + uq (q < 1), illetve f (u) = u(u − b)(c − u) függvények adják a vizsgálatok motivációját. Ezekkel számos szerző foglalkozott [54, 90, 91, 115, 116, 147, 155]. Kiemelendő Ouyang és Shi [116] dolgozata, melyben bizonyos kiegészítő feltételeket teljesítő konvex-konkáv típusú nemlinearitások esetén megadják a bifurkációs diagrammok teljes osztályozását.
2.2. A "time-map" módszer Ebben a szakaszban bemutatjuk vizsgálataink legfontosabb eszközét az ú.n. célbalövéses, vagy "time-map" módszert. A módszer lényege, hogy a (2.3) differenciálegyenletet először a (2.4) peremfeltétel helyett az u(0) = c,
u′ (0) = 0
(2.7)
dc_483_12 2.2. A "TIME-MAP" MÓDSZER
15
kezdeti feltétellel tekintjük. Az egyenlet az r = 0 pontban adott kezdeti feltétel mellett szinguláris, így a hagyományos egzisztencia és unicitás tétel nem alkalmazható. Azonban annak bizonyításához hasonlóan igazolható, hogy a fenti kezdeti feltétel mellett létezik egyetlen C 2 megoldás u(·, c) bármely c > 0 esetén [137]. Ezután a peremérték-probléma megoldását az ú.n. célbalövéses módszerrel keressük (shooting), azaz a c értékét változtatjuk mindaddig, amíg olyan megoldást kapunk, amelynek első gyöke a R pontban van. Ehhez definiáljuk az alábbi leképezést (timemap). D(T ) = {c > 0 : ∃r > 0 u(r, c) = 0}. (2.8)
T (c) = min{r > 0 : u(r, c) = 0} ;
A (2.3)-(2.4) peremérték-probléma pozitív megoldásainak száma tehát egyenlő a T (c) = R egyenlet c-re kapott megoldásainak számával. Ennek meghatározásához a T leképezés alábbi tulajdonságaira van szükség: • T értelmezési tartománya; • T határértéke az értelmezési tartomány határpontjaiban; • T monotonitása az értelmezési tartomány részintervallumaiban. A következő szakaszokban a time-map fenti három tulajdonságának általános vizsgálatával foglalkozunk.
2.2.1. A "time-map" monotonitása A monotonitás meghatározásához célszerű a T függvényt meghatározó u(T (c), c) ≡ 0
u(r, c) > 0,
0 < r < T (c)
implicit egyenletet használni. Az egyenletet differenciálva, a T függvény deriváltjára az alábbi adódik ∂r u(T (c), c)T ′ (c) + ∂c u(T (c), c) ≡ 0. (2.9)
A T szélsőértékeinek vizsgálatakor szükség van a második derivált előjelére azokban a pontokban, ahol az első derivált eltűnik. A fenti egyenletet deriválva azt kapjuk, hogy T ′ (c) = 0 esetén ∂r u(T (c), c)T ′′ (c) + ∂c2 u(T (c), c) = 0.
(2.10)
A (2.9) és (2.10) egyenletekben szereplő c szerinti parciális deriváltakat a variációs egyenletből határozhatjuk meg. A továbbiakban az f függvényről mindig feltételezzük a kellő simaságot a megfelelő deriváltak létezéséhez. Deriváljuk tehát a (2.3) differenciálegyenletet c szerint. Bevezetve a h(r, c) = ∂c u(r, c),
z(r, c) = ∂c2 u(r, c)
függvényeket, az alábbi kezdetiérték-feladatokat kapjuk rh′′ (r, c) + (n − 1)h′ (r, c) + rf ′ (u(r, c))h(r, c) = 0 ′
h(0, c) = 1, h (0, c) = 0,
(2.11) (2.12)
dc_483_12 16
2. FEJEZET. STACIONÁRIUS MEGOLDÁSOK rz ′′ (r, c) + (n − 1)z ′ (r, c) + rf ′ (u(r, c))z(r, c) + rf ′′ (u(r, c))h2 (r, c) = 0(2.13)
z(0, c) = 0, z ′ (0, c) = 0,(2.14)
Ezen függvények segítségével a (2.9) és (2.10) egyenletek az alábbi alakba írhatók u′ (T (c), c)T ′ (c) + h(T (c), c) = 0,
(2.15)
u′ (T (c), c)T ′′ (c) + z(T (c), c) = 0,
(2.16)
ahol az utóbbi csak T ′ (c) = 0 esetén áll fenn. Vegyük észre, hogy ezekben az egyenletekben u′ (T (c), c) < 0, hiszen T (c) az u függvény első zérushelye. Így T ′ (c) és T ′′ (c) előjelét a h és z függvény előjele határozza meg. Ezen függvények gyökeinek elhelyezkedését a Sturm-féle szeparációs tétel segítségével fogjuk vizsgálni. Ezen tételek alkalmazásakor szükség lesz a v(·, c) = u′ (·, c) függvényre. Az erre vonatkozó differenciálegyenletet és kezdeti feltételt az u függvényre vonatkozó (2.3) differenciálegyenletből (pontosabban annak r-rel elosztott alakjából), valamint a (2.7) kezdeti feltételből r szerinti deriválással kapjuk n−1 )v(r, c) = 0 r
(2.17)
v(0, c) = 0, v ′ (0, c) = −
f (c) . (2.18) n
rv ′′ (r, c) + (n − 1)v ′ (r, c) + (rf ′ (u(r, c)) −
A deriváltra vonatkozó kezdeti feltételt a (2.3) differenciálegyenletből u′′ (0) kifejezésével és a L’Hospital-szabály alkalmazásával kapjuk. Az alábbiakban, ha nem okoz félreértést, akkor az u, h, z, v függvények második változóját nem írjuk ki, tehát például u(r, c) helyett u(r)-et írunk. A továbbiakban alapvető fontosságú lesz az alábbi Lemma [178]. 2.1. Lemma. Ha n = 1, akkor a h függvénynek legfeljebb egy gyöke lehet a [0, T (c)] intervallumban. Bizonyítás. Az n = 1 esetben a h és v függvényre vonatkozó (2.11) és (2.17) differenciálegyenlet megegyezik. Ezért a Sturm-féle szeparációs tétel szerint a két függvény gyökei elválasztják egymást. Ha a h függvénynek lenne két gyöke a [0, T (c)] intervallumban, akkor a v függvénynek is lenne gyöke, azaz u′ valahol 0 lenne a (0, T (c)) intervallumban. Ez azonban lehetetlen, ugyanis egyrészt a radiális szimmetriára vonatkozó [62] cikkbeli tételből u′ (r) < 0 is következik minden r ∈ (0, T (c)] esetén, másrészt ez elemien is igazolható, ahogy hamarosan látni fogjuk. A Lemmát a [178] dolgozatban bizonyítottuk ilyen egyszerű formában, ugyanis ennek segítségével konvex nemlinearitás esetén teljes leírás adható a megoldások pontos számáról. A későbbi vizsgálatokban alapvető szerepet játszik az alábbi feltétel, melynek az irodalomban "disconjugacy" feltétel a neve: A h függvénynek legfeljebb egy gyöke lehet a [0, T (c)] intervallumban.
(2.19)
A Lemma szerint, ez bármely f függvény esetén teljesül, ha n = 1. Azonban n > 1 esetén csak bizonyos függvényekre igaz. Amint ez közvetve már ismert volt, a (2.19)
dc_483_12 2.2. A "TIME-MAP" MÓDSZER
17
n+2 esetén [78], valamint feltétel nem igaz például az f (u) = (1+u)p függvény, és p > n−2 5 2 az f (u) = u + u függvény és n = 3 esetén [8]. A feltétel teljesülésének bizonyítása a legtöbb esetben meglehetősen nehéz. Azonban mivel kulcsszerepet játszik a megoldások pontos számának meghatározásában, azért számos speciális esetben igazolták n > 1 esetén is. Az f (u) = up + λuq függvény esetében különböző p és q értékekre a 2.1. szakaszban felsorolt dolgozatok mindegyikében, ahol egyértelműséget igazolnak, bebizonyítják a (2.19) feltételt. Az f (u) = up − λu függvény esetében Kwong [96] és McLeod [108] igazolták a feltétel teljesülését. Nézzük meg most, hogy a T deriváltjaira vonatkozó fenti képletek a Sturm-féle szeparációs tétel segítségével hogyan használhatók a T monotonitásának eldöntésére. A Sturm-féle szeparációs tétel közvetlen alkalmazása helyett, az annak bizonyításában használt alábbi azonosságot fogjuk használni. Legyenek u1 , u2 : [r1 , r2 ] → R kétszer folytonosan differenciálható függvények. Ekkor Z r2 (rn−1 u′1 (r))′ u2 (r) − (rn−1 u′2 (r))′ u1 (r)dr = (2.20) r1
r2n−1 (u′1 (r2 )u2 (r2 ) − u1 (r2 )u′2 (r2 )) + r1n−1 (u1 (r1 )u′2 (r1 ) − u′1 (r1 )u2 (r1 )). 2.1. Állítás. Tegyük fel, hogy teljesül a (2.19) feltétel és f szuperlineáris, azaz uf ′ (u) − f (u) > 0 minden u > 0 esetén, (vagy másszóval f (u) u szigorúan monoton ′ növő). Ekkor fennáll T < 0. Bizonyítás. Az u és h függvényekre (2.3) és (2.11) alapján fennállnak az (rn−1 u′ )′ + rn−1 f (u) = 0,
(rn−1 h′ )′ + rn−1 f ′ (u)h = 0
(2.21)
differenciálegyenletek. Szorozzuk meg az első egyenletet h-val, a másodikat pedig uval, vonjuk ki egymásból a kettőt, majd integráljunk a [0, T (c)] intervallumon. Ekkor a (2.20) azonosságot alkalmazva r1 = 0, r2 = T (c), u1 = u, u2 = h esetén Z
T (c) 0
rn−1 h(r) u(r)f ′ (u(r)) − f (u(r)) dr = (T (c))n−1 u′ (T (c))h(T (c)).
Ebből következik, hogy a h függvénynek van gyöke a [0, T (c)] intervallumban, ugyanis, ha nem lenne ott gyöke, akkor a baloldal pozitív, a jobboldal pedig negatív lenne. Most kap szerepet a (2.19) feltétel, ugyanis ekkor a 2.1. Lemma miatt a h függvénynek nem lehet több gyöke, tehát h(T (c)) < 0. Ebből viszont (2.15) szerint következik T ′ (c) < 0. 2.2. Állítás. Legyen n ≥ 1, és tegyük fel, hogy f szublineáris, azaz uf ′ (u)−f (u) < 0 minden u > 0 esetén, (vagy másszóval f (u) u szigorúan monoton fogyó). Ekkor fennáll T ′ > 0. Bizonyítás. Megmutatjuk, hogy a h függvénynek nincs gyöke a [0, T (c)] intervallumban. Ugyanis tegyük fel, hogy h(r∗ ) = 0 és r∗ a h első gyöke, (ezért h′ (r∗ ) < 0). Szorozzuk meg a (2.21) első egyenletét h-val, a másodikat pedig u-val, vonjuk ki
dc_483_12 18
2. FEJEZET. STACIONÁRIUS MEGOLDÁSOK
egymásból a kettőt, majd integráljunk a [0, r∗ ] intervallumon. Ekkor a (2.20) azonosságot alkalmazva r1 = 0, r2 = r∗ , u1 = h, u2 = u esetén Z r∗ rn−1 h(r) f (u(r)) − u(r)f ′ (u(r)) dr = (r∗ )n−1 u(r∗ )h′ (r∗ ). 0
Ekkor a baloldal pozitív, a jobboldal pedig negatív, amely azt igazolja, hogy a h függvénynek nincs gyöke a [0, T (c)] intervallumban. Így tehát h(T (c)) > 0, melyből (2.15) szerint következik T ′ (c) > 0. Megjegyezzük, hogy a szuperlinearitás és a szublinearitás a függvény konvexitásával függ össze, hiszen az l(u) = uf ′ (u) − f (u) függvényre l′ (u) = uf ′′ (u). Ezért f ′′ > 0 és f (0) ≤ 0 esetén, l(0) ≥ 0 és l′ (u) > 0, így uf ′ (u) − f (u) = l(u) > 0, amennyiben u > 0. Hasonlóan f ′′ < 0 és f (0) ≥ 0 esetén, l(0) ≤ 0 és l′ (u) < 0, így uf ′ (u) − f (u) = l(u) < 0, amennyiben u > 0. Tehát az alábbi egyszerű Állítás áll fenn. 2.3. Állítás. Ha f ′′ > 0 és f (0) ≤ 0, akkor f szuperlineáris. Ha f ′′ < 0 és f (0) ≥ 0, akkor f szublineáris. A T függvény monotonitásának vizsgálata után térjünk rá most szélsőértékeinek vizsgálatára. 2.4. Állítás. Tegyük fel, hogy a (2.19) feltétel teljesül és f ′′ > 0. Ekkor T ′ (c) = 0 esetén fennáll T ′′ (c) < 0, azaz T szélsőértéke csak maximum lehet. Bizonyítás. A T ′ (c) = 0 feltételből (2.15) szerint következik h(T (c)) = 0. Így a (2.19) feltétel miatt h(r) > 0 a [0, T (c)) intervallumban. Végezzük el a h és z függvény Sturm-féle összehasonlítását. Ezekre a függvényekre (2.11) és (2.13) alapján fennállnak a (rn−1 h′ )′ + rn−1 f ′ (u)h = 0,
(rn−1 z ′ )′ + rn−1 (f ′ (u)z + f ′′ (u)h2 ) = 0
(2.22)
differenciálegyenletek. Szorozzuk meg az első egyenletet z-vel, a másodikat pedig hval, vonjuk ki egymásból a kettőt, majd integráljunk a [0, T (c)] intervallumon. Ekkor a (2.20) azonosságot alkalmazva r1 = 0, r2 = T (c), u1 = h, u2 = z esetén Z T (c) rn−1 h3 (r)f ′′ (u(r))dr = (T (c))n−1 h′ (T (c))z(T (c)). 0
Mivel a baloldal pozitív és h′ (T (c)) < 0 (hiszen T (c) a h első gyöke), azért z(T (c)) < 0, melyből (2.16) szerint következik T ′′ (c) < 0. Teljesen hasonlóan igazolható az alábbi. 2.5. Állítás. Tegyük fel, hogy a (2.19) feltétel teljesül és f ′′ < 0. Ekkor T ′ (c) = 0 esetén fennáll T ′′ (c) > 0, azaz T szélsőértéke csak minimum lehet. Ezen állítások lehetővé teszik, hogy n = 1 esetén teljes leírást adjunk konvex és konkáv f esetén a megoldások számáról. Ehhez azonban még szükség van a T értelmezési tartományának és határértékeinek meghatározására. Ezekkel foglalkozunk a következő szakaszokban.
dc_483_12 2.2. A "TIME-MAP" MÓDSZER
19
2.2.2. A "time-map" értelmezési tartománya Az értelmezési tartomány meghatározásához célszerű bevezetni az n = 1 esethez tartozó Hamilton- függvényt H(r) :=
u′ (r)2 + F (u(r)), 2
(2.23)
Ru ahol F (u) := 0 f . Az n > 1 esetben ez Ljapunov-függvényként szolgál, ugyanis ′2 H ′ (r) = − n−1 r u (r) ≤ 0. Könnyen látható, hogy amennyiben az u függvénynek van ′ gyöke, akkor u (r) < 0 minden r ∈ (0, R] esetén, ahol R jelöli az első gyököt. Ilyen esetben tehát fenn kell állnia az u′′ (0) < 0 egyenlőtlenségnek, amelyből f (u(0)) > 0 következik. Ezzel a következőt igazoltuk. 2.6. Állítás. Ha c ∈ D(T ), akkor f (c) > 0. Könnyen kaphatunk ennél jobb feltételt is a Ljapunov függvény segítségével. Ugyanis c ∈ D(T ) esetén bármely d ∈ (0, c) számhoz van olyan r > 0, melyre u(r) = d. Így F (d) = F (u(r)) = H(r) −
u′ (r)2 < H(r) ≤ H(0) = F (c), 2
amely az alábbit bizonyítja. 2.7. Állítás. Ha c ∈ D(T ), akkor F (c) > F (d) minden d ∈ (0, c) számra. Az értelmezési tartományra tehát fennáll D(T ) ⊂ {c > 0 : F (c) > F (d) ∀ d ∈ (0, c) és f (c) 6= 0} =: Pf .
(2.24)
Az n = 1 esetben pontosan megadható az értelmezési tartomány. 2.8. Állítás. Ha n = 1, akkor D(T ) = Pf . A differenciálegyenlet (2.21) képletbeli alakját integrálva Z r n−1 ′ ρn−1 f (u(ρ))dρ. −r u (r) =
(2.25)
0
Ha f pozitív, akkor létezik olyan r1 > 0 és K > 0, hogy minden r > r1 esetén K u′ (r) ≤ − rn−1 . Ezért ha n ≤ 2, akkor u nem lehet minden r > 0 esetén pozitív, valahol eléri a nullát. Így az alábbit igazoltuk 2.9. Állítás. Legyen n ≤ 2. Ekkor, ha f (u) > 0 minden u ∈ (0, +∞) esetén, akkor D(T ) = (0, +∞), azaz ekkor is teljesül D(T ) = Pf . Magasabb dimenzió esetén f pozitivitásából nem következik, hogy D(T ) = Pf . Erre a legegyszerűbb példa az f (u) = up függvény p ≥ (n + 2)/(n − 2) esetén. Ekkor ugyanis D(T ) = ∅ és Pf = (0, +∞). Az előbbi bizonyítása az alábbi Pohozaevazonosságon alapul [122]. rn u′2 (r) + 2rn F (u(r)) + (n − 2)rn−1 u(r)u′ (r) = (2.26) r Z sn−1 [2nF (u(s)) − (n − 2)u(s)f (u(s))] ds. 0
dc_483_12 20
2. FEJEZET. STACIONÁRIUS MEGOLDÁSOK
Ugyanis p ≥ (n+2)/(n−2) esetén a jobboldal nem pozitív, míg, ha az u függvénynek lenne gyöke, akkor ott a baloldal pozitív lenne. A p kitevőre vonatkozó feltétel éppen a kritikus Szoboljev-kitevőt adja. Pohozsaev variációs módszerrel bebizonyította, hogy p < (n+2)/(n−2) esetén van megoldása a peremérték-problémának, akkor D(T ) = Pf . Ha azonban az f függvényre fennáll f (0) > 0, akkor a (2.25) képlet segítségével, ha pedig az f függvényre lineáris alsó becslés adható, akkor a megfelelő lineáris egyenlettel való Sturm összehasonlítás segítségével megmutatható, hogy a megoldások elérik a nullát, azaz fennáll a következő. 2.10. Állítás. Legyen n ≥ 1, α ∈ (0, +∞]. Ha f > 0 a (0, α) intervallumban és lim inf f (u) u > 0, akkor (0, α) ⊂ D(T ). Következésképpen, ha f (α) = 0, akkor (0, α) u→0
maximális részintervalluma D(T )-nek.
2.2.3. A "time-map" határértékei az értelmezési tartomány határpontjaiban Az alábbi állításokat a T határértékeiről a [178] dolgozatban bizonyítottuk. A bizonyításokat itt nem közöljük. A következő Állítást ismét Sturm típusú összehasonlítással lehet igazolni. 2.11. Állítás. Legyen n ≥ 1, és 0 ∈ ∂D(T ). (a) Ha f (0) > 0, akkor lim T = 0. 0
(b) Ha f (0) = 0 és f ′ (0) > 0, akkor lim T ∈ (0, +∞). 0
(c) Ha f (0) = 0 és f ′ (0) = 0, akkor lim T = +∞. 0
2.12. Állítás. Legyen n ≥ 1, és legyen c > 0 a ∂D(T ) \ D(T ) halmaz eleme. Ekkor lim T = +∞. c
Az alábbi állítás bizonyításában fontos szerepet játszik az n = 1 feltétel, ugyanis ebben az esetben a T függvény integrál előállítását kell használni. 2.13. Állítás. Legyen n = 1, és +∞ ∈ ∂D(T ). (a) Ha lim
f (u) u
= +∞, akkor lim T = 0.
(b) Ha lim
f (u) u
= L ∈ (0, +∞), akkor lim T =
(c) Ha lim
f (u) u
= 0, akkor lim T = +∞.
u→+∞
u→+∞
u→+∞
+∞
+∞
π √ . 2 L
+∞
2.14. Állítás. A 2.13. Állítás (c) része fennáll n ≥ 1 esetén is.
dc_483_12 2.3. A MEGOLDÁSOK SZÁMA KONVEX F ESETÉN
21
A [183] dolgozatban igazoltuk a Pohozsaev-egyenlőtlenség felhasználásával, hogy a 2.13. Állítás (a) része fennáll n ≥ 1 esetén is a szubkritikus esetben. Ezt fogalmazzuk meg a következő Állításban. 2.15. Állítás. Tegyük fel, hogy f (u) > 0, ha u > 0, valamint létezik és véges a n+2 lim fu(u) határérték, ha 1 < p < 2∗ , ahol 2∗ = n−2 , ha n > 2, és 2∗ = ∞, ha n ≤ 2. p
u→∞
Ekkor létezik olyan c0 > 0, melyre (c0 , ∞) ⊂ D(T ) és lim T = 0. +∞
2.3. A megoldások száma konvex f esetén Ebben a szakaszban a konvex f függvényeket fogjuk osztályozni a "time-map" alakja szerint, azaz meghatározzuk, hogy R függvényében hány pozitív megoldása van a (2.1)-(2.2) peremérték-problémának. Az n = 1 esetben teljes osztályozást tudunk adni, azaz bármely konvex f függvény esetén meg tudjuk adni a pozitív megoldások pontos számát. Az n > 1 esetben is számos ismert eredményt kapunk meg egyszerűbb bizonyítással, ekkor azonban az osztályozás nem teljes. Mutatni fogunk olyan eseteket, amelyeknél a megoldások pontos számának kérdése még nyitott probléma. Az ebben a szakaszban szereplő eredmények nagyrészt a [178] dolgozatban jelentek meg. A "time-map" alakját, amint a fejezet elején már említettük, három fontos tulajdonság jellemzi: az értelmezési tartomány, a monotonitás, és a határértékek. Amint látni fogjuk az osztályozás alapját a határértékek adják, amelyeket f (0) előjele, valamint f végtelenbeli viselkedése határoz meg a 2.11. és 2.13. Állítás szerint. Osztályozásunk első szintjét f végtelenbeli viselkedése adja. Eszerint háromféle függvényt különböztetünk meg: • aszimptotikusan szuperlineáris ( lim
u→+∞
• aszimptotikusan lineáris ( lim
u→+∞
f (u) u
• aszimptotikusan szublineáris ( lim
u→+∞
f (u) u
∈ (0, +∞)) és f (u) u
Megjegyezzük, hogy f konvexitása miatt lim f (u) u határérték létezik.
u→+∞
= +∞),
≤ 0). f (u) u
monoton nagy u esetén, ezért a
Kezdjük vizsgálatainkat a legegyszerűbb, azaz a szublineáris esettel. Ekkor a konvexitás miatt f csökkenő, így csak az f (0) > 0 eset érdekes számunkra, hiszen különben f negatív, így a 2.6. Állítás miatt a (2.1)-(2.2) feladatnak nincs pozitív megoldása. Az f tehát egy pozitív értékből indul és csökken. Legyen az első gyöke α, amennyiben nincs gyöke, akkor legyen α = ∞. A 2.10. Állítás szerint ekkor D(T ) = (0, α). A 2.11. Állítás szerint lim0 T = 0, a 2.12., vagy α = ∞ esetén a 2.14. Állítás szerint pedig limα T = ∞. Végül a 2.5. Állítás szerint T szigorúan monoton növő. Így T értékkészlete a (0, ∞) intervallum, és minden értéket pontosan egyszer vesz fel. Ezzel a következő Tételt igazoltuk.
dc_483_12 22
2. FEJEZET. STACIONÁRIUS MEGOLDÁSOK
2.1. Tétel. Legyen f konvex, aszimptotikusan szublineáris függvény, melyre f (0) > 0. Ekkor bármely R > 0 esetén a (2.1)-(2.2) peremérték-problémának pontosan egy megoldása van. Aszimptotikusan szuperlineáris és lineáris f esetén a teljes osztályozás csak n = 1 esetén ismert. Az osztályozás f (0) előjele szerint történik. Az ezzel kapcsolatos eredményeinket foglalja össze a következő két tétel [178]. A tételek részben általánosíthatók az n > 1 esetre is, ezek az eredmények is a [178] dolgozatban olvashatók. 2.2. Tétel. Legyen n = 1, f : [0, ∞) → R, f ∈ C 2 szigorúan konvex függvény, melyre lim f (u) u = +∞. u→+∞
(i) Ha f (u) > 0 (u ∈ [0, ∞)), akkor létezik olyan Rsup > 0, hogy a (2.1)-(2.2) peremérték-problémának R < Rsup esetén két megoldása, R = Rsup esetén egy megoldása van, R > Rsup pedig nincs megoldása. (ii) Ha f (0) > 0 és az f függvénynek van gyöke a (0, ∞) intervallumban, akkor a (2.1)-(2.2) peremérték-problémának két megoldása van minden R > 0 esetén. (iii) Ha f (0) = 0 és f ′ (0) > 0, akkor létezik olyan Rsup > 0, hogy a (2.1)-(2.2) peremérték-problémának egy megoldása van R < Rsup esetén, és nincs megoldása, ha R ≥ Rsup . (iv) Ha f (0) = 0 és f ′ (0) ≤ 0, akkor a (2.1)-(2.2) peremérték-problémának egy megoldása van minden R > 0 esetén. (v) Ha f (0) < 0, akkor létezik olyan Rsup > 0, hogy a (2.1)-(2.2) peremértékproblémának egy megoldása van R ≤ Rsup esetén, és nincs megoldása, ha R > Rsup . Bizonyítás. Mindegyik esetben a T grafikonjának alakját határozzuk meg, ennek segítségével eldönthető, hogy R különböző értékei esetén hány megoldása van a T (c) = R egyenletnek. (i) A 2.11. és 2.13. Állítás szerint lim0 T = lim+∞ T = 0. Így a T függvénynek van egy maximuma, amely a 2.4. Állítás miatt az egyetlen szélsőértéke. Tehát T növekszik nullától valamely Rsup > 0 számig, utána pedig csökken nulláig. A T grafikonjának alakját a 2.2. ábra (a) részén láthatjuk. (ii) A 2.8. Állítás szerint D(T ) két részintervallumból áll, legyenek ezek (0, α) és (β, ∞). A 2.11., 2.12. és 2.13. Állításból következik, hogy lim0 T = lim+∞ T = 0 és limα− T = limβ + T = +∞. A 2.4. Állítás miatt T -nek nem lehet szélsőértéke, így szigorúan monoton mindkét részintervallumon. Tehát T minden pozitív értéket kétszer vesz fel. A T grafikonjának alakját a 2.2. ábra (b) része mutatja. (iii) A 2.10., 2.11. és 2.13. Állítás miatt D(T ) = (0, ∞), valamint fennáll lim+∞ T = 0 és lim0 T = Rsup , ahol Rsup > 0 a linearizált egyenlet, u′′ + f ′ (0)u = 0, megoldásának első gyöke. Az 2.1. Állításból következően T szigorúan csökken,
dc_483_12 2.3. A MEGOLDÁSOK SZÁMA KONVEX F ESETÉN
1
23
2
(a)
0.8
(b)
1.5
0.6 1 0.4 0.5
0.2 0
0
5
1
10
0
0
5
3
(c)
10
(d)
0.8 2
0.6 0.4
1
0.2 0
0
5
10
0
1
1.05
1.1
1.15
1.2
2.2. ábra. A (2.1)-(2.2) peremérték-problémához tartozó T leképezés grafikonjának alakja a 2.2. Tételben felsorolt eseteknek megfelelően. ezért a (0, Rsup ) intervallumban minden értéket pontosan egyszer vesz fel. A T grafikonjának alakját a 2.2. ábra (c) részén láthatjuk. (iv) Ha f ′ (0) = 0, akkor a 2.8. és 2.11. Állítások szerint D(T ) = (0, ∞) ás lim0 T = +∞. Ha f ′ (0) < 0, akkor a 2.8. és 2.12. Állítások szerint létezik olyan β > 0, hogy D(T ) = (β, ∞) és limβ + T = +∞. Mindkét esetben fennáll lim+∞ T = 0. Az 2.1. Állításból következően T szigorúan csökken nulláig. A T grafikonját a 2.2. ábra (d) részén folytonos vonal mutatja. (v) A 2.8. Állítás szerint D(T ) = [β, ∞) valamilyen β > 0 esetén. Mivel lim+∞ T = 0, azért ismét az 2.1. Állításból következően T szigorúan csökken nulláig. A T grafikonját a 2.2. ábra (d) részén szaggatott vonal mutatja. Tekintsük végül az aszimptotikusan lineáris esetet. Ekkor az előző Tételhez képest a lényeges változás, hogy lim+∞ T = R∞ a 2.13. Állításból következően. A fenti Tétel bizonyításának kis módosításával az alábbit kapjuk. 2.3. Tétel. Legyen n = 1, f : [0, ∞) → R, f ∈ C 2 szigorúan konvex függvény, π √ melyre lim f (u) u = L ∈ (0, +∞) és R∞ := 2 L . u→+∞
(i) Ha f (u) > 0 (u ∈ [0, ∞)), akkor létezik olyan Rsup > R∞ , hogy a (2.1)(2.2) peremérték-problémának R ≤ R∞ és R = Rsup esetén egy megoldása, és R∞ < R < Rsup esetén két megoldása van, R > Rsup esetén pedig nincs megoldása.
dc_483_12 24
2. FEJEZET. STACIONÁRIUS MEGOLDÁSOK
(ii) Ha f (0) > 0 és f -nek van gyöke a (0, ∞) intervallumban, akkor a (2.1)-(2.2) peremérték-problémának egy megoldása van R ≤ R∞ , és két megoldása van R > R∞ esetén. (iii) Ha f (0) = 0 és f ′ (0) > 0, akkor létezik olyan Rsup > R∞ , hogy a (2.1)-(2.2) peremérték-problémának nincs megoldása, ha R ≤ R∞ , egy megoldása van, ha R∞ < R < Rsup , és nincs megoldása, ha R ≥ Rsup . (iv) Ha f (0) = 0 és f ′ (0) ≤ 0, akkor a (2.1)-(2.2) peremérték-problémának nincs megoldása R ≤ R∞ esetén, és egy megoldása van R > R∞ esetén. (v) Ha f (0) < 0, akkor létezik olyan Rsup > R∞ , hogy a (2.1)-(2.2) peremértékproblémának nincs megoldása, ha R ≤ R∞ , egy megoldása van, ha R∞ < R ≤ Rsup , és nincs megoldása, ha R > Rsup .
2.4. Kvázilineáris egyenlet megoldásainak pontos száma Az előző szakaszban ismertetett, konvex nemlinearitásra vonatkozó eredményeinket a [182] dolgozatban általánosítottuk kvázilineáris egyenletre és p-konvex nemlinearitásra. Tekintsük a következő peremérték-feladatot. (|u′ |p−2 u′ )′ + f (u) = 0
u(−R) = u(R) = 0,
(2.27) (2.28)
ahol p ≥ 2 és f a [0, ∞) intervallumon értelmezett C 1 függvény, amely az alábbi értelemben p-konvex. 2.1. Definíció. Legyen p ≥ 2, és tegyük fel, hogy az f ∈ C 1 [0, ∞) függvénynek van abszolút minimuma. Az f függvényt (szigorúan) p-konvexnek nevezzük, ha bármely α ∈ [0, ∞) minimumpont esetén a k(u) := függvény (szigorúan) növő.
f ′ (u) |u − α|p−2
(u ∈ [0, ∞), u 6= α)
Megjegyezzük, hogy p = 2 esetén visszakapjuk a szokásos konvexitást, másrészt p > 2 esetén a p-konvexitásból következik a konvexitás. Célunk a (2.27)-(2.28) peremérték-feladat pozitív megoldásai pontos számának meghatározása. Ehhez ismét a megfelelő kezdetiérték-feladatból indulunk ki. Technikai nehézséget jelent, hogy a megoldások az u(r0 ) = c, u′ (r0 ) = 0 kezdeti feltétel mellett általában nem egyértelműek, azonban igazolható, hogy f (c) 6= 0 esetén egyértelműség van, f (c) = 0 esetén pedig a konstans megoldáson kívül pontosan egy lokálisan növő, és egy lokálisan fogyó megoldás van. Így bevezethető a time-map, és ennek segítségével megadható a peremérték-feladat megoldásainak pontos száma. A [182] dolgozatban részletesen vizsgáltuk a time-map értelmezési tartományát, határértékeit és monotonitását. Megjegyezzük, hogy a határérték kiszámításánál a π szerepét a Z 1 1 2π √ πp = 2 dt = π p p p sin 1−t 0 p
dc_483_12 2.4. KVÁZILINEÁRIS EGYENLET MEGOLDÁSAINAK SZÁMA
25
veszi át [51]. A time-map segítségével sikerült szuper-p-lineáris és aszimptotikusan p-lineáris, p-konvex f függvények esetén a megoldások számáról az alábbi két Tételt igazolni. 2.4. Tétel. Legyen f ∈ C 2 [0, ∞) szigorúan p-konvex, f (0) ≤ 0, és +∞.
(u) lim fp−1 u→+∞ u
=
(u) = 0, akkor bármely R > 0 esetén a (2.27)-(2.28) (i) Ha f (0) = 0 és limu→0 ufp−1 peremérték-feladatnak pontosan egy megoldása van. 1/p πp (u) (ii) Legyen f (0) = 0 és limu→0 ufp−1 = m ∈ (0, ∞). Legyen R0 := p−1 m 2 . Ekkor a (2.27)-(2.28) peremérték-feladatnak pontosan egy megoldása van R < R0 esetén, és nincs megoldása R ≥ R0 esetén.
(iii) Legyen f (0) = 0 és f ′ (0) < 0, vagy f (0) < 0. Ekkor létezik olyan R1 > 0, hogy a (2.27)-(2.28) peremérték-feladatnak pontosan egy megoldása van R ≤ R1 esetén, és nincs megoldása R > R1 esetén. 2.5. Tétel. Legyen f ∈ C 2 [0, ∞) szigorúan p-konvex, f (0) ≤ 0, és 1/p πp L ∈ (0, +∞). Továbbá legyen R∞ := p−1 L 2 .
(u) lim fp−1 u→+∞ u
=
(u) = 0, akkor a (2.27)-(2.28) feladatnak nincs meg(i) Ha f (0) = 0 és limu→0 ufp−1 oldása R ≤ R∞ esetén, és egy megoldása van R > R∞ esetén. 1/p πp (u) (ii) Legyen f (0) = 0 és limu→0 ufp−1 = m ∈ (0, ∞), valamint R0 := p−1 m 2 . Ekkor a (2.27)-(2.28) feladatnak nincs megoldása R ≤ R∞ , illetve R ≥ R0 esetén, és egy megoldása van R∞ < R < R0 esetén.
(iii) Legyen f (0) = 0 és f ′ (0) < 0, vagy f (0) < 0. Ekkor létezik olyan R1 > 0, hogy a (2.27)-(2.28) peremérték-feladatnak nincs megoldása R ≤ R∞ , illetve R > R1 esetén, és egy megoldása van R∞ < R ≤ R1 esetén. A fenti Tételek nem vonatkoznak az f (0) > 0 esetre, ugyanis ekkor játszik szerepet az, hogy a kezdetiérték-feladat megoldása nem egyértelmű. Ennek ugyanis a pozitív megoldások esetén akkor lehet szerepe, ha az f függvénynek olyan gyöke van, ahol deriváltja negatív. A [182] dolgozatban az ilyen tulajdonságú p-konvex függvények esetében is sikerült leírást adni a pozitív megoldások számáról. Az erről szóló Tétel technikai részleteit a jelen dolgozatban mellőzzük, helyette egy példát mutatunk erre az esetre. Az f (u) = u2 − 4u + 3 függvénynek két pozitív gyöke van. A peremérték-feladat egy megoldása látható a 2.3. ábrán. Nyilvánvaló, hogy a megoldás konstans szakaszainak ("dead core") hosszát változtatni lehet (az egyik oldalit a másik rovására), így végtelen sok pozitív megoldás van. Azonban igazolható, hogy az egy maximummal rendelkező megoldás a konstans szakaszok hosszától eltekintve egyértelmű. Ha az intervallum hosszabb, akkor több maximummal rendelkező megoldások is lehetnek, a maximumok közötti szakaszok hossza természetesen változtatható.
dc_483_12 26
2. FEJEZET. STACIONÁRIUS MEGOLDÁSOK u 4
2
dead core
0 −15
x −10
−5
0
5
10
15
2.3. ábra. A (2.27)-(2.28) peremérték-feladat egy pozitív megoldása f (u) = u2 −4u+3 esetén.
2.5. A megoldások száma szinguláris f esetén Ebben a szakaszban ismertetjük a [183, 184, 185] dolgozatokban megjelent eredményeinket a (2.1)-(2.2) pozitív megoldásainak pontos számáról abban az esetben, amikor f a következő alakú. • f (u) = u−α + up , • f (u) = up − u−α , • f (u) = u−α − up , ahol α ∈ (0, 1) és p > 0 paraméter. (Az f (u) = −u−α − up triviális eset azért marad ki, mert ekkor f (u) < 0, így nincs pozitív megoldás.) Az f (u) = up + u−α nemlinearitás és tetszőleges Ω ⊂ Rn tartomány esetén Hernandez és Mancebo, valamint Stuart igazolták [71, 140], hogy pontosan egy megoldás van, ha 0 < p < 1. A p > 1 esetet Coclite és Palmieri vizsgálták [40]. Megmutatták, hogy létezik olyan R∗ , hogy ha R < R∗ , akkor létezik legalább egy megoldás, ha pedig R > R∗ , akkor nincs megoldás. Ha az Ω tartomány gömb, akkor a szubkritikus 1 < p < (n + 2)/(n − 2) esetben igazoltuk [183], hogy R < R∗ esetén van legalább két megoldás. Az n = 1 speciális esetben pontosan két megoldás van (ekkor p-re csak a p > 1 feltételnek kell teljesülnie). Az f (u) = up − u−α esetet általános Ω ⊂ Rn tartományon tárgyalja Diaz dolgozata [46], a p = 0 esetben, valamint Zhang cikke [154] a 0 < p < 1 esetben. Megmutatták, hogy gömb tartomány esetén létezik olyan R∗ , hogy nincs megoldás R < R∗ esetén, és létezik legalább egy megoldás R > R∗ esetén. Az egy-dimenziós (n = 1) esetet p = 0 esetén Choi és munkatársai tanulmányozták [41]. Bebizonyították, hogy R bizonyos értékeinél két megoldás is lehet, valamint sejtéseket fogalmaztak meg a
dc_483_12 2.5. A MEGOLDÁSOK SZÁMA SZINGULÁRIS F ESETÉN
27
megoldások pontos számát illetően. A sejtéseket a [184] dolgozatban bebizonyítottuk, ezzel teljes leírást adtunk a megoldások pontos számáról. Igazoltuk, hogy az 1/2 ≤ α < 1 esetben létezik olyan R∗ , hogy ha R < R∗ , akkor nincs megoldás, ha pedig R > R∗ , akkor egy megoldás van. A 0 < α < 1/2 esetben azonban bonyolultabb a viselkedés. Ekkor létezik olyan R0 < R∗ , hogy ha R < R0 , akkor nincs megoldás, ha R0 < R < R∗ , akkor két megoldás van, végül ha R > R∗ , akkor egy megoldás van. Ezt az eredményünket, amely a p = 0 esetre vonatkozik, általánosítottuk a p ∈ (0, 1) esetre is [185]. Megmutattuk, hogy hasonló a bifurkációs struktúra, csak az α = 1/2 helyett az α = (p + 1)/2 értéknél jelenik meg a két megoldás. Abban a dolgozatban a p > 1 esetben is meghatároztuk a megoldások számát. Ekkor azonban egyszerűbb jelenséget tapasztalunk (és a bizonyítás is sokkal egyszerűbb), nevezetesen létezik olyan R∗ , hogy ha R < R∗ , akkor egy megoldás van, ha pedig R > R∗ , akkor nincs megoldás. Végül az f (u) = u−α −up esetben a (2.1) egyenletben szereplő operátor monoton, így a megoldás minden p > 0 és tetszőleges Ω ⊂ Rn tartomány esetén egyértelmű [71]. Megjegyezzük, hogy a gömbön a pozitív megoldások radiális szimmetriája nem ismert, ezért módszerünkkel nem biztos, hogy az összes megoldást megkapjuk. A továbbiakban csak a radiálisan szimmetrikus megoldások számával foglalkozunk. Az alábbiakban bemutatjuk az n = 1 esetben a teljes osztályozást. A "time-map" értelmezési tartományára és határértékeire vonatkozó állításaink a szinguláris nemlinearitás esetére is érvényesek. A monotonitásra vonatkozó eredményekhez a T leképezés deriválhatóságát kell bebizonyítani, hiszen a differenciálegyenlet megoldásának kezdeti feltételtől való differenciálható függése akkor ismert, ha a jobboldal maga is differenciálható. Ezt a technikai nehézséget az n = 1 esetben azzal küszöbölhetjük ki, hogy a T függvényre az alábbi jól ismert integrál előállítást használjuk [178] c T (c) = √ 2
Z
0
1
1 p ds. F (c) − F (cs)
(2.29)
A többdimenziós esetben a T függvény helyett a [183] dolgozatban pozitív η esetén a Tη (c) = min{r ∈ (0, T (c)) : u(r, c) = η } (2.30)
függvényt vizsgáltuk. Ennek differenciálhatósága következik a szokásos tételekből. Megmutattuk, hogy a Tη függvények kompakt intervallumokon egyenletesen konvergálnak a T függvényhez, amint η → 0, ami bizonyítja T folytonosságát. Ezenkívül bebizonyítottuk, hogy T örökli a Tη függvények monotonitási tulajdonságait.
2.5.1. A megoldások száma f (u) = u−α + up esetén A 2.10. és 2.11. Állítás szerint D(T ) = (0, ∞) és lim T (c) = 0. Ha p < 1, akkor c→0
a 2.14. Állítás miatt lim T (c) = ∞. Ha 1 < p < (n + 2)/(n − 2), akkor 2.15. Állítás c→∞
szerint lim T (c) = 0. A p = 1 és p > (n + 2)/(n − 2) esetekben a T végtelenbeli c→∞ határértéke nem ismert. Ha p ≤ 1, akkor T szigorúan növekszik, ugyanis uf ′ (u) − f (u) = (p − 1)up − (α + −α 1)u < 0, így a 2.2. Állítás szerint T ′ > 0.
dc_483_12 28
2. FEJEZET. STACIONÁRIUS MEGOLDÁSOK 3
T(c) α = 0.2
p = 0.5
2.5
2
p=1 1.5
1
0.5
p=5 0
0
5
10
c 15
2.4. ábra. A T grafikonjának háromféle lehetséges alakja az f (u) = u−α + up nemlinearitás és n = 1 esetén. A p értékeit a három lehetséges osztályból (p < 1, p = 1, p > 1) választottuk: p = 0.5, p = 1 és p = 5, mindhárom esetben α = 0.2. A p > 1 esetben a ’time-map’ monotonitása nem ismert. Amint fent említettük, a [183] dolgozatban a Tη függvények segítségével igazoltuk, hogy T folytonos, így mivel nullában és végtelenben nulla a határértéke (1 < p < (n + 2)/(n − 2) esetén), azért létezik maximuma. Az ennél nagyobb R értékekre tehát nincs megoldása a peremérték-problémának. Az n = 1 esetben az f konvexitása miatt a 2.4. Állítás szerint T -nek nem lehet minimuma, így pontosan egy maximum van, amely előtt T növekszik, utána pedig csökken. Az n = 1 esetben T grafikonjának alakja a p = 1 esetre is meghatározható. Ugyanis ekkor a 2.13. Állítás szerint lim T (c) = π/2. Így tehát T értékkészlete a c→+∞
(0, π/2) intervallum, amelyben minden értéket pontosan egyszer vesz fel. A T grafikonjának háromféle lehetséges alakja a 2.4. ábrán látható. Ezzel a következő Tételt igazoltuk a (2.1)-(2.2) peremérték-probléma pozitív, radiálisan szimmetrikus megoldásainak számáról. 2.6. Tétel. Legyen f (u) = u−α + up és α ∈ (0, 1). 1. Legyen n ≥ 1 és p < 1. Ekkor bármely R > 0 esetén a (2.1)-(2.2) peremértékproblémának pontosan egy pozitív radiálisan szimmetrikus megoldása van. 2. Legyen n = 1 és p = 1. Ekkor, ha 0 < R < π/2, akkor egy pozitív megoldás van, ha pedig R ≥ π/2, akkor nincs megoldás. 3. Legyen n ≥ 1 és 1 < p < (n + 2)/(n − 2), ha n > 2. Ekkor létezik olyan Rmax > 0, hogy legalább két megoldás van R < Rmax esetén, és nincs megoldás R > Rmax esetén. Továbbá, ha n = 1, akkor R < Rmax esetén pontosan két megoldás, R = Rmax esetén pedig egy megoldás van. Megjegyezzük, hogy a Tétel 3. állítását a [183] dolgozatban az alábbi általánosabb függvényosztályra bizonyítottuk.
dc_483_12 2.5. A MEGOLDÁSOK SZÁMA SZINGULÁRIS F ESETÉN
29
• f (u) ≥ m > 0 (u > 0); f (u) határérték létezik és p u→∞ u n+2 ∗ n−2 , ha n > 2 és 2 = ∞ ha n ≤
• A lim
véges valamely 1 < p < 2∗ esetén, ahol 2∗ = 2;
• Valamely α ∈ (0, 1) esetén lim sup uα f (u) ∈ [0, ∞); u→0
• f szigorúan konvex C 2 függvény.
2.5.2. A megoldások száma f (u) = up − u−α és n = 1 esetén Ebben az esetben a T függvényt jellemző Állítások nagy része nem alkalmazható n > 1 esetén, azért csak az n = 1 esettel foglalkozunk. A T értelmezési tartományát a 2.8. Állítás segítségével határozhatjuk meg. Az F (u) = up+1 /(p+1)−u1−α /(1−α) függvény ábrázolásával egyszerűen láthatjuk, hogy D(T ) = [cp,α , ∞), ahol cp,α az F függvény gyöke. Az F (cp,α ) = 0 egyenletet megoldva az alábbit kapjuk cp,α =
p+1 1−α
1 p+α
(2.31)
.
A T függvény határértéke a 2.13. Állítás szerint a következőképpen függ p értékétől. Ha p > 1, akkor lim T (c) = 0, ha p = 1, akkor lim T (c) = π/2, végül ha c→+∞
p < 1, akkor lim T (c) = ∞.
c→+∞
c→+∞
A p ≥ 1 esetben T szigorúan csökken, ugyanis uf ′ (u) − f (u) = (p − 1)up + (α + 1)u−α > 0, így a 2.1. Állítás szerint T ′ < 0. A p < 1 esetben az f konkáv, így a 2.5. Állítás szerint T -nek nem lehet maximuma. Ezért T monotonitását T ′ (cp,α ) előjele határozza meg. Ugyanis, ha T ′ (cp,α ) ≥ 0, akkor T szigorúan növő, hiszen végtelenben a határértéke végtelen, és nem lehet maximuma. Ha T ′ (cp,α ) < 0, akkor T -nek pontosan egy minimum pontja van, ez előtt szigorúan fogyó, utána pedig szigorúan növő. A T ′ (cp,α ) előjelét a p = 0 esetben a [184] dolgozatban határoztuk meg, kiderült, hogy α < 1/2 esetén negatív, α > 1/2 esetén pedig pozitív. A 0 < p < 1 esetben is sikerült pontos feltételt adni az előjelre a [185] cikkben, ezt fogalmazzuk meg az alábbi Lemmában. 2.2. Lemma. Legyen n = 1, f (u) = up − u−α és p ∈ (0, 1). Ha 2α < p + 1, akkor T ′ (cp,α ) < 0. Ha 2α > p + 1, akkor T ′ (cp,α ) > 0. Bizonyítás. A bizonyítás a T függvény (2.29) integrál előállításán alapszik. A (2.29) képletet c szerint deriválva a 1 T (c) = √ 2 2 ′
Z1 0
2F (c) − 2F (cs) − cf (c) + csf (cs) ds (F (c) − F (cs))3/2
(2.32)
dc_483_12 30
2. FEJEZET. STACIONÁRIUS MEGOLDÁSOK
deriváltat kapjuk. Helyettesítsük be ebbe az f (s) = sp − s−α , F (s) = sp+1 /(1 + p) − s1−α /(1 − α), valamint a c = cp,α képleteket. Felhasználva, hogy 1−α cp+1 p,α /(p + 1) = cp,α /(1 − α),
rövid számolás után a következőt kapjuk T ′ (cp,α ) = (2.33) s Z1 1 p+1 (p − 1)s1+p + (1 + α)s1−α − p − α (s1−α − s1+p )−3/2 ds. p+1 2 2cp,α 0
Az sp+α = t helyettesítéssel az integrál az alábbi alakot ölti T ′ (cp,α ) =
(2.34) 1 2
s
p+1 2cp+1 p,α
Z1 0
1+p 3α−1 1−α p − 1 p+α 1 + α p+α −1 t t + − 1 (1 − t)−3/2 t 2(p+α) dt. p+α p+α
Vegyük észre, hogy α ≤ 1/3 esetén az integrál nullában divergens (mivel t kitevője kisebb, mint −1), ezért α ≤ 1/3 esetén T ′ (cp,α ) = −∞ (függetlenül a p értékétől). Ha α > 1/3, akkor az integrál explicit módon megadható a Γ-függvény segítségével. A Γ-függvényről tudjuk, hogy x > 0 esetén Γ(x) > 0, valamint, hogy x ∈ (−1, 0) esetén Γ(x) < 0. Az alábbi Állítás a Lemma bizonyítását adja, ugyanis α > 1/3 esetén 2α−p−1 2(p+α) > −1, így az Állításban szereplő tört számlálója pozitív, a nevezője pedig akkor vált előjelet, amikor 2α − p − 1 = 0. 2.16. Állítás. Ha α > 1/3, akkor T ′ (cp,α ) =
s
3α−1 Γ 2(p+α) π(p + 1) p+1 2cp,α Γ 2α−p−1 2(p+α)
Az Állítást a [185] cikkben bizonyítottuk. Itt röviden csak a következő átalakításokat mutatjuk meg, amelyek egy integrál kiszámítására vezetik vissza az Állítást. Az 1−α 1+α , B= . A= p+α p+α jelölések bevezetésével p−1 = 1 − A, p+α
1+p = 1 + B, p+α
3α − 1 A = − B. 2(p + α) 2
Ezeket behelyettesítve (2.34) kifejezésbe, az alábbit kell igazolni. Z1 0
√ A (1 − A)t1+B + AtB − 1 (1 − t)−3/2 t 2 −B−1 dt = 2 π
Γ( A2 − B)
Γ( A2 − B − 21 )
.
(2.35)
dc_483_12 2.5. A MEGOLDÁSOK SZÁMA SZINGULÁRIS F ESETÉN
4
T(c)
2
α = 0.7
3.5
T(c) α = 0.7
1.95
p = 0.3
3
31
1.9
p = 0.9
1.85 2.5 1.8
p = 0.9
2
1.75 1.5
p=1
1.7
1
1.65
0.5 0
p=1
1.6
p=5 0
5
10
c 15
1.55
0
10
20
c
30
2.5. ábra. A T grafikonjának négy féle lehetséges alakja az f (u) = up − u−α nemlinearitás és n = 1 esetén. A p értékeit a négy lehetséges osztályból (p > 1, p = 1, 2α − 1 < p < 1 és 0 < p ≤ 2α − 1) választottuk: p = 5, p = 1, p = 0.9 és p = 0.3, mindegyik esetben α = 0.7. A p = 0.9 és p = 1 értékhez tartozó görbéket a jobboldali ábrán nagyobb c tartományban is ábrázoltuk. Ennek bizonyítása a Γ-függvénnyel kapcsolatos azonosságok, valamint a Γ-függvény és a hipergeometrikus sor összefüggését felhasználó hosszadalmas számolás eredménye. A T grafikonjának tehát négy különböző alakja lehet a p értékétől függően. A p > 1, p = 1, 2α − 1 < p < 1 és 0 < p ≤ 2α − 1 esetekben a T grafikonja a 2.5. ábrán látható. Ezzel a következő Tételt igazoltuk a (2.1)-(2.2) peremérték-probléma pozitív megoldásainak számáról az n = 1 esetben. 2.7. Tétel. Legyen n = 1, f (u) = up − u−α és α ∈ (0, 1). 1. Ha p > 1, akkor létezik olyan Rmax > 0, hogy a (2.1)-(2.2) peremértékproblémának pontosan egy pozitív megoldása van R ≤ Rmax esetén, és nincs megoldása R > Rmax esetén. 2. Ha p = 1, akkor létezik olyan Rmax > 0, hogy pontosan egy pozitív megoldás van π/2 < R ≤ Rmax esetén, és nincs megoldás, ha R > Rmax vagy R ≤ π/2. 3. Ha 2α − 1 < p < 1, akkor létezik olyan Rmax > 0 és 0 < Rmin < Rmax , hogy a megoldások száma nulla, R < Rmin esetén, egy R = Rmin esetén, kettő Rmin < R ≤ Rmax esetén, és egy R > Rmax esetén. 4. Ha 0 < p ≤ 2α − 1, akkor létezik olyan Rmin > 0, hogy pontosan egy pozitív megoldás van R ≥ Rmin esetén, és nincs megoldás R < Rmin esetén.
dc_483_12 32
2. FEJEZET. STACIONÁRIUS MEGOLDÁSOK 5
T(c)
4.5
p=2
4 3.5
α = 0.2
3 2.5 2 1.5 1 0.5 0
0
0.2
0.4
0.6
0.8
1
c
2.6. ábra. A T grafikonja az f (u) = u−α − up nemlinearitás esetén (p = 2, α = 0.2).
2.5.3. A megoldások száma f (u) = u−α − up esetén
A 2.10., 2.11. és 2.12. Állítás szerint D(T ) = (0, 1), lim T = 0 és lim T = ∞. A T 0
1
függvény szigorúan növő, ugyanis f ′ < 0 miatt uf ′ (u) − f (u) < 0, ezért a 2.2. Állítás szerint T ′ > 0. Tehát T értékkészlete a (0, ∞) intervallum, és abban minden értéket pontosan egyszer vesz fel. A T grafikonja a 2.6. ábrán látható. Ezzel az alábbi tételt igazoltuk. 2.8. Tétel. Legyen n ≥ 1, f (u) = u−α − up , p > 0 és α ∈ (0, 1). Ekkor a (2.1)-(2.2) peremérték-problémának pontosan egy pozitív, radiálisan szimmetrikus megoldása van bármely R > 0 esetén. Megjegyezzük, hogy a megoldás egyértelműsége ebben az esetben általános tartományon is igaz [71].
2.6. Stabilitás konvex és konkáv f esetén Ebben a szakaszban a ∂t u = ∆u + f (u) h(x)u + g(x)∂ν u = 0 ∂Ω-án
(2.36) (2.37)
szemilineáris parabolikus egyenlet stacionárius megoldásainak stabilitását vizsgáljuk. Legyen Ω ⊂ Rn korlátos, sima határú tartomány, f szigorúan konvex, vagy konkáv C 2 függvény a [0, ∞) intervallumon, valamint h és g nemnegatív függvények, amelyek az Ω tartomány ∂Ω határán nem tűnnek el egyszerre. (Egy f függvényt szigorúan konvexnek (konkávnak) nevezünk, ha f ′′ ≥ 0 (f ′′ ≤ 0) és nem konstans egyetlen intervallumon sem.) Shivaji és munkatársai igazolták [33, 107], hogy ha f ′′ > 0 és f (0) ≤ 0, akkor a (2.36)-(2.37) feladat minden nem-triviális, nemnegatív megoldása instabilis. Először monoton növő függvényre bizonyították az állítást [33]. A nem monoton esetet
dc_483_12 2.6. STABILITÁS KONVEX ÉS KONKÁV F ESETÉN
33
először Tertikas [142] igazolta alsó és felső megoldások segítségével. Ezt a bizonyítást később Maya és Shivaji [107] egyszerűsítették, a monoton esetre való visszavezetéssel, az f függvényt felbontva egy monoton és egy lineáris függvény összegére. A [179] dolgozatban a tételre közvetlen, egyszerű bizonyítást adtunk, melyet alább ismertetünk. Ez a bizonyítás nemcsak sokkal rövidebb, hanem rávilágít arra, hogy a stacionárius megoldás instabilitásának hátterében az f függvény konvexitása, és nem monotonitása áll. A bizonyítás módja egyben lehetőséget ad arra is, hogy a tétel konkáv függvényekre vonatkozó megfelelőjét is igazoljuk. Az alábbit fogjuk tehát bizonyítani. 2.9. Tétel. (i) Ha f ′′ > 0 és f (0) ≤ 0, akkor (2.36)-(2.37) minden nem-triviális, nemnegatív stacionárius megoldása instabilis. (ii) Ha f ′′ < 0 és f (0) ≥ 0, akkor (2.36)-(2.37) minden nem-triviális, nemnegatív stacionárius megoldása stabilis. Bizonyítás. Legyen u a (2.36)-(2.37) stacionárius megoldása, azaz (2.38)
∆u + f (u) = 0
(2.39)
h(x)u + g(x)∂ν u = 0 ∂Ω-án . Tekintsük, az ezen stacionárius megoldáshoz tartozó linearizált egyenletet: ∆v + f ′ (u)v = λv
(2.40) (2.41)
h(x)v + g(x)∂ν v = 0 ∂Ω-án .
Jelölje ennek első sajátértékét λ1 . Ennek előjele határozza meg az u stacionárius megoldás stabilitását. Amennyiben λ1 > 0, akkor u instabilis, ha pedig λ1 < 0, akkor u stabilis. Továbbá ismert, hogy az első sajátértékhez tartozó sajátfüggvény nemnegatív. Szorozzuk meg a (2.40) egyenletet u-val, a (2.38) egyenletet v-vel, vonjuk ki egymásból a kettőt, majd integráljuk a kapott egyenletet az Ω tartományon. Ekkor az Z Z Z ′ (u∆v − v∆u) + v(uf (u) − f (u)) = λ uv Ω
Ω
Ω
egyenlethez jutunk. A Green-formula miatt az első tag nulla, ezért Z Z ′ v(uf (u) − f (u)) = λ uv . Ω
(2.42)
Ω
Legyen l(u) = uf ′ (u) − f (u), ekkor l′ (u) = uf ′′ (u). Az első esetben l(0) ≥ 0 és l′ (u) > 0 miatt l(u) > 0 minden u > 0 esetén. A második esetben l(0) ≤ 0 és l′ (u) < 0 miatt l(u) < 0 minden u > 0 esetén. Így az első esetben (2.42) baloldala pozitív, így u és v pozitivitása miatt λ1 > 0, amelyből u instabilitása következik. A második esetben hasonló módon azt kapjuk, hogy λ1 < 0, ezért u stabilis.
dc_483_12 34
2. FEJEZET. STACIONÁRIUS MEGOLDÁSOK
Megjegyezzük, hogy az f (0) előjelére vonatkozó feltétel bizonyos értelemben szükséges. Ugyanis, ha Ω gömb, és nem teljesül az előjel feltétel, akkor tipikusan két pozitív stacionárius megoldás van, melyek különböző stabilitásúak. A fenti tétel az alábbi általánosabb esetben is igaz. Legyen L egy általános elliptikus operátor: Lu := −div (A(x)∇u) ahol A(x) ∈ Rn×n szimmetrikus, egyenletesen pozitív definit. Tekintsük az alábbi parabolikus feladatot. ∂t u = Lu + f (x, u) h(x)u + g(x)∂Aν u = 0 ∂Ω-án ,
(2.43) (2.44)
ahol ∂Aν u := Aν · ∇u jelöli a konormális irányú deriváltat, és u 7→ f (x, u) szigorúan konvex vagy konkáv minden x ∈ Ω esetén. A 2.9. Tétel alábbi általánosítását a [179] dolgozatban bizonyítottuk. 2.10. Tétel. (i) Ha u 7→ f (x, u) szigorúan konvex és f (x, 0) ≤ 0 minden x ∈ Ω esetén, akkor (2.43)-(2.44) minden nem-triviális, nemnegatív stacionárius megoldása instabilis. (ii) Ha u 7→ f (x, u) szigorúan konkáv és f (x, 0) ≥ 0 minden x ∈ Ω esetén, akkor (2.43)-(2.44) minden nem-triviális, nemnegatív stacionárius megoldása stabilis. A bizonyítás egyszerű gondolata a tétel további általánosításaira is lehetőséget ad. A [180] dolgozatban az elliptikus operátor helyett a kvázilineáris esetre, azaz pLaplace operátorra, is bizonyítottuk az analóg tételt. Ezután késleltetést tartalmazó parciális differenciálegyenletre is kiterjesztettük az állítást [181].
dc_483_12
3. fejezet
Reakció-diffúzió egyenletek utazó hullám megoldásai Ebben a fejezetben a térbeli tartomány egydimenziós (n = 1) és nem korlátos. Tekintsük tehát a ∂t u = D∂xx u + f (u), (3.1) reakció-diffúzió egyenletet, melyben u : R+ × R → Rm az ismeretlen függvény, D pozitív elemű diagonális mátrix és f : Rm → Rm folytonosan differenciálható függvény. Az egyenlet u(t, x) = U (x−ct) alakú megoldását, melyben U : R → Rm függvény, c sebességgel haladó utazó hullám megoldásnak nevezik. Az U függvény teljesíti az alábbi közönséges differenciálegyenlet-rendszert: DU ′′ (y) + cU ′ (y) + f (U (y)) = 0,
(y = x − ct).
(3.2)
Ehhez a másodrendű egyenlethez természetes módon peremfeltételek is tartoznak. Adott U− , U+ ∈ Rm esetén a lim U = U− ,
lim U = U+
−∞
+∞
peremfeltételhez tartozó utazó-hullámot frontnak nevezzük, amennyiben U− 6= U+ , valamint pulzusnak nevezzük, ha U− = U+ . Ha az U függvény periodikus, akkor a "wave train" elnevezést használják. Az utazó hullámokat több dimenziós térbeli tartományok esetén is definiálják az (1.1) reakció-diffúzió egyenletre, melyben u : R+ × Rn → Rm az ismeretlen függvény. Az egyenlet u(t, x) = U (hk, xi − ct) alakú megoldását, melyben U : R → Rm függvény, a k ∈ Rn vektor irányában c sebességgel haladó síkhullám megoldásnak nevezik. A továbbiakban itt csak az n = 1 esettel foglalkozunk.
3.1. Utazó hullámok létezése Az utazó hullám létezésének igazolásához meg kell mutatni, hogy van olyan c ∈ R sebesség, amelyhez a (3.2) egyenletnek van az előírt peremfeltételt kielégítő megoldása. Az ilyen típusú bizonyítások prototípusát ismertetjük röviden az alábbiakban. 35
dc_483_12 36
3. FEJEZET. UTAZÓ HULLÁM MEGOLDÁSOK
Tekintsük az m = 1 esetben az U ′′ (y) + cU ′ (y) + f (U (y)) = 0
(3.3)
egyenletet a lim U = 1, −∞
lim U = 0 +∞
(3.4)
peremfeltétellel. Az f (u) = u(1 − u) nemlinearitással az egyenletet Kolmogorov, Petrovszkij és Piszkunov vizsgálták először [89], ebben az esetben gyakran KPPegyenletként hivatkoznak rá. Másik fontos nemlinearitás a FitzHugh-Nagumo egyenletből [61] származó f (u) = u(1 − u)(u − a), valamely a ∈ (0, 1) esetén. Az utazó hullám létezése szempontjából a két eset lényegesen eltér egymástól. Írjuk át ugyanis a (3.3) másodrendű egyenletet elsőrendű rendszerré: U′ = V V
′
= −f (U ) − cV
(3.5) (3.6)
Ennek a rendszernek egyensúlyi pontja a (0, 0) és az (1, 0) pont. A peremfeltételekből megmutatható, hogy az U ′ függvénynek ±∞-ben 0 a határértéke, ezért az utazó hullámnak a (3.5)-(3.6) elsőrendű rendszerben a (0, 0) és (1, 0) pontokat összekötő heteroklinikus pálya felel meg. A KPP-egyenlet esetében ha c > 0, akkor az egyik egyensúlyi pont stabil csomó, a másik pedig nyereg és a nyeregből kiinduló pálya (instabil sokaság) a stabil csomóba fut be. Azaz bármely c > 0 esetén van utazó hullám megoldás. Könnyen igazolható, hogy ez a megoldás c > 2 esetén pozitív, különben előjelet vált. A [89] cikkben igazolták, hogy a végtelen sok utazó hullám megoldás közül csak a c = 2 sebességhez tartozó stabilis. A FitzHugh-Nagumo típusú nemlinearitás esetében mindkét egyensúlyi pont nyereg, az ezeket összekötő pálya nem tipikus. Valóban megmutatható, hogy csak egyetlen olyan c érték létezik, amely mellett van a két nyeregpontot összekötő pálya, azaz utazó hullám megoldás. Térjünk vissza az általános esethez, a (3.2) egyenlethez. Ez a másodrendű rendszer egy 2m változós elsőrendű rendszerré írható. Ennek a rendszernek keressük egy heteroklinikus, homoklinikus vagy periodikus pályáját a peremfeltételeknek megfelelően. Ha (3.2) egy egyenletből áll, azaz m = 1, akkor az imént látotthoz hasonlóan viszonylag egyszerű fázissík analízissel kaphatunk feltételeket utazó hullám létezésére. Fife az alábbi általános állítást bizonyítja ([59] 4.15 Tétel) 3.1. Tétel. Legyen f ∈ C 1 (0, 1) függvény, melyre f (0) = f (1) = 0. • Ha f > 0 a (0,1) intervallumban, akkor létezik olyan c∗ , melyre c > c∗ esetén létezik a (3.3) egyenletnek a (3.4) peremfeltételt kielégítő pozitív utazó hullám megoldása. • Ha van olyan a ∈ (0, 1), melyre f < 0 a (0,a) intervallumban és f > 0 az (a,1) intervallumban, akkor létezik egyetlen olyan c érték, melyre a (3.3) egyenletnek létezik a (3.4) peremfeltételt kielégítő pozitív utazó hullám megoldása.
dc_483_12 3.2. UTAZÓ HULLÁMOK STABILITÁSA
37
Tehát az állandó előjelű, KPP-típusú nemlinearitás esetén végtelen sok c érték mellet létezik utazó hullám megoldás, míg az egy előjelváltással rendelkező, FHNtípusú nemlinearitás esetében, csak egyetlen c értéknél van utazó hullám. Ha (3.2) több egyenletből áll, azaz m > 1, akkor az egyensúlyi pontokat összekötő pályát magasabb (legalább négy) dimenziós fázistérben kell keresni, amely már jóval nehezebb feladat. Ebben az esetben az utazó hullám létezésének igazolására kétféle módszert szoktak alkalmazni. Az egyik hatékony eszköz ilyen típusú problémák kezelésére a Conley index, melyet részletesen tárgyal Smoller könyve [136]. A másik módszer a Leray-Schauder fokszám alkalmazása, amely technikailag nehéz, mivel a térbeli tartomány nem korlátos. A módszer leírása egy lángterjedéssel kapcsolatos modell esetében Berestycki és munkatársai dolgozatában olvasható [19].
3.2. Utazó hullámok stabilitása Az utazó-hullámra vonatkozó (3.2) egyenlet autonóm, ezért, ha U egy megoldás, akkor ennek minden vízszintes eltoltja is az, azaz U ∗ (y) = U (y + y0 ) is megoldása a (3.2)egyenletnek tetszőleges y0 ∈ R esetén. Ezért az utazó hullám stabilitását pálya stabilitásként célszerű definiálni (a periodikus pálya stabilitásához hasonlóan). Ebben az esetben a pályamenti aszimptotikus stabilitást szokták stabilitásnak nevezni. 3.1. Definíció. Az U utazó hullám stabilis, ha a (3.1) rendszer u megoldására, melyre |u(0, x) − U (x)| elegendően kicsi minden x ∈ R esetén, van olyan x0 ∈ R, amellyel t → ∞ esetén sup |u(t, x) − U (x0 + x − ct)| → 0. x∈R
A létezéshez hasonlóan a stabilitásvizsgálat is lényegesen eltér egy egyenlet (m = 1), illetve több egyenletből álló rendszer (m > 1) esetében. Ugyanis m = 1 esetén a (3.2) típusú szemilineáris parabolikus egyenletre a maximum elvből levezethető egy összehasonlítási tétel, amelynek segítségével stabilitási tételek igazolhatók [59]. Ebben az esetben nem csak a fenti definícióbeli lokális stabilitás igazolható, hanem az utazó hullám vonzási tartományára is adható becslés. A KPP-egyenletre vonatkozóan ilyen típusú tételt igazoltak [89]-ben. Bebizonyították, hogy ha az u(0, ·) kezdeti függvény ugró függvény, azaz negatív x esetén 1, pozitív x esetén 0 az értéke, akkor létezik olyan ψ függvény, amelyre t → ∞ esetén sup |u(t, x) − U (ψ(t) + x − c∗ t)| → 0
(3.7)
x∈R
és ψ ′ (t) → 0, ahol c∗ a 3.1. Tételben adott minimális sebesség. Az FHN-típusú, előjelváltó nemlinearitás esetében az alábbi, [59] könyvben található tétel igaz. 3.2. Tétel. Legyen f ∈ C 1 (0, 1) olyan függvény, melyre f (0) = f (1) = 0, és van olyan a ∈ (0, 1), melyre f < 0 a (0,a) intervallumban és f > 0 az (a,1) intervallumban. Ekkor az egyetlen utazó hullám stabilis.
dc_483_12 38
3. FEJEZET. UTAZÓ HULLÁM MEGOLDÁSOK
Ha a (3.2) rendszer több egyenletből áll, akkor általában nem érvényes az összehasonlítási tétel. Ekkor az utazó hullám lokális stabilitását linearizálással lehet eldönteni. Ehhez helyettesítsük be a (3.1) egyenletbe az u(t, x) = U (x−ct)+v(t, x−ct) függvényt. Az f (U + v) helyére beírva az f (U ) + f ′ (U )v lineáris közelítést, valamint felhasználva a U függvényre vonatkozó (3.2) egyenletet a v függvényre az alábbi lineáris parabolikus egyenletet kapjuk. ∂t v = D∂yy v + c∂y v + f ′ (U (y))v.
(3.8)
Ekkor a következő két kérdés merül fel. • Milyen feltételek mellet lesz a (3.8) egyenlet azonosan nulla megoldása stabilis? • Következik-e ebből az utazó hullám stabilitása? Az első kérdésre választ kaphatunk, ha a (3.8) lineáris egyenlet megoldását v(t, y) = exp(λt)V (y) alakban keressük. Ekkor a V függvényre a DV ′′ (y) + cV ′ (y) + f ′ (U (y))V (y) = λV (y)
(3.9)
egyenletet kapjuk. A fenti alakú v megoldások Reλ < 0 esetén tartanak nullához t → +∞ mellett. Ezért várható, hogy a (3.8) lineáris egyenlet nulla megoldásának stabilitását az (LV )(y) = DV ′′ (y) + cV ′ (y) + f ′ (U (y))V (y), (3.10) BU C(R, Cm )∩C 2 (R, Cm ) térben értelmezett másodrendű differenciáloperátor spektruma határozza meg. Fontos észrevennünk, hogy a 0 sajátértéke az operátornak az U ′ sajátfüggvénnyel. (Ez egyszerűen következik a (3.2) egyenlet differenciálásából.) Ez a tény egyébként összhangban van azzal, hogy az utazó hullám megoldás minden vízszintes eltoltja szintén utazó hullám. Így tehát, amint az utazó hullám a hagyományos értelemben nem lehet aszimptotikusan stabilis (csak pályamenti stabilitás várható), úgy a linearizálással kapott L operátor spektruma sem lehet teljes egészében a komplex sík baloldali részén, a 0 mindig sajátérték. A fent feltett kérdésekre végülis az alábbi tétel ad választ ([136] 25. Fejezet). 3.3. Tétel. Ha 0 egyszeres sajátértéke az L operátornak, a többi sajátértékekre Reλ < 0, és van olyan β < 0, melyre Reλ < β minden λ ∈ σess (L) esetén, akkor az U utazó hullám stabilis. Esetünkben a lényeges spektrumot az alábbi értelemben használjuk σess (L) := {λ ∈ σ(L) | λ nem izolált sajátérték véges multiplicitással}.
3.3. A linearizálással kapott operátor spektruma Ebben a szakaszban a BU C(R, Cm ) ∩ C 2 (R, Cm ) téren értelmezett (LV )(y) = DV ′′ (y) + cV ′ (y) + Q(y)V (y),
(3.11)
operátor spektrumát vizsgáljuk. Ezt az operátort az utazó hullám körüli linearizálással kaptuk, akkor Q(y) = f ′ (U (y)) volt. Most csak annyit teszünk fel a Q
dc_483_12 3.3. A LINEARIZÁLÁSSAL KAPOTT OPERÁTOR SPEKTRUMA
39
függvényről, hogy Q : R → Rm×m folytonos, és a Q± = limy→±∞ Q(y) határértékek léteznek. Az operátor spektrumát általában nem lehet explicit módon meghatározni csak abban az esetben, amikor az operátor állandó együtthatós, azaz Q konstans függvény. Az alábbi példában ezt m = 1 esetén kiszámítjuk, ugyanis ez a speciális eset a későbbi vizsgálatok szempontjából hasznos lesz. 3.1. Példa. Legyenek c, q ∈ R adott számok és tekintsük az alábbi állandó együtthatós operátort LV = V ′′ + cV ′ + qV. A λ ∈ C szám reguláris értéke az L operátornak, ha a V ′′ + cV ′ + (q − λ)V = W
(3.12)
egyenletnek létezik pontosan egy, W -től folytonosan függő V ∈ BU C(R, C) megoldása bármely W ∈ BU C(R, C) esetén. A homogén egyenlet (melyben W = 0) megoldásait a V (y) = c1 exp(µ1 y) + c2 exp(µ2 y) képlet adja, melyben µ1,2 a µ2 + cµ + q − λ = 0 egyenlet megoldásai. A fenti V függvényre V ∈ BU C(R, C) pontosan akkor, ha Reµ1,2 = 0, ami akkor teljesül, ha Reλ = q −
Imλ c
2
.
Ezen egyenletet kielégítő λ komplex számok tehát az L operátor spektrumában vannak. Az inhomogén egyenlet (W 6= 0) a konstans variációs formula segítségével oldható meg. Igazolható, hogy a fenti egyenletet nem teljesítő λ számokra a (3.12) egyenletnek létezik pontosan egy, W -től folytonosan függő V ∈ BU C(R, C) megoldása bármely W ∈ BU C(R, C) esetén, azaz ekkor λ reguláris érték. Tehát az L operátor spektruma a 2 λ2 σ(L) = σess (L) = P := {λ1 + iλ2 ∈ C | λ1 = q − }. c parabola, amely a 3.1. ábrán látható. Ha c = 0, akkor a spektrum a H = {λ1 < q} félegyenes.
3.3.1. A spektrum jellemzése az invariáns alterekkel Térjünk vissza az általános (3.11) operátor spektrumának vizsgálatára. Célszerű bevezetni az LV = λV másodrendű egyenlethez tartozó elsőrendű rendszert. Legyen X1 = V , X2 = V ′ , ekkor az elsőrendű rendszer X ′ (y) = Aλ X(y), ahol Aλ (y) =
0 I −1 D (λI − Q(y)) −cD−1
(3.13)
.
(3.14)
dc_483_12 40
3. FEJEZET. UTAZÓ HULLÁM MEGOLDÁSOK
P
q
3.1. ábra. Az LV = V ′′ + cV ′ + qV operátor spektruma. Mivel a Q függvénynek van határértéke ±∞-ben, azért léteznek az A± λ = lim Aλ (y) y→±∞
határértékek is. Az A± λ mátrixok stabil, instabil és centrális alterének dimenziója fontos szerepet fog játszani. Jelölje az A+ λ mátrix pozitív, negatív, illetve nulla + + valósrészű sajátértékeinek számát (multiplicitással számítva) n+ u (λ), ns (λ) és nc (λ). − − − − Hasonlóan definiáljuk az nu (λ), ns (λ), nc (λ) számokat az Aλ mátrixra. Ezek a számok tehát a megfelelő instabil, stabil és centrális alterek dimenziói. Az 3.1. Példában szereplő operátor esetében érdemes megvizsgálni, hogy milyen kapcsolatban vannak ezek a dimenziók az operátor spektrumával. Ekkor LV = V ′′ + cV ′ + qV , így 0 1 − + Aλ = Aλ = . λ − q −c
Ezen mátrix karakterisztikus egyenlete µ2 + cµ + q − λ = 0. Könnyen igazolható, hogy c > 0 esetén fennállnak az alábbiak. 2 λ ± • Ha Reλ < q− Im , akkor Reµ1 < 0, Reµ2 < 0, ezért n± s (λ) = 2, nu (λ) = 0, c n± c (λ) = 0.
2 λ ± , akkor Reµ1 = 0, Reµ2 < 0, ezért n± • Ha Reλ = q− Im s (λ) = 1, nu (λ) = 0, c n± c (λ) = 1.
2 λ ± • Ha Reλ > q− Im , akkor Reµ1 > 0, Reµ2 < 0, ezért n± s (λ) = 1, nu (λ) = 1, c n± c (λ) = 0.
Az egyes invariáns alterek dimenzióját a 3.2. ábrán összegeztük. A 3.1. Példában láttuk, hogy az operátor spektruma a 3.2. ábrán látható parabola, tehát az állandó együtthatós esetben a spektrum azon λ számokból áll, melyekre n± c (λ) > 0. A következő tétel szerint ezek a számok az általános (nem állandó együtthatós) esetben is a spektrumhoz tartoznak, azonban ekkor olyan λ számok is benne lehetnek e spektrumban, melyekre n± c (λ) = 0.
dc_483_12 3.3. A LINEARIZÁLÁSSAL KAPOTT OPERÁTOR SPEKTRUMA
P
41
ns=1 nu=1 nc=0
ns=1 nu=0 nc=1
q ns=2 nu=0 nc=0
3.2. ábra. Az állandó együtthatós LV = V ′′ + cV ′ + qV operátorhoz tartozó invariáns alterek dimenziója. 3.4. Tétel. Tegyük fel, hogy az alábbi feltételek közül legalább az egyik teljesül: R +∞ |Aλ (y) − A+ (a) n+ c (λ) > 0 és 0 λ| < ∞ R0 − (b) n− c (λ) > 0 és −∞ |Aλ (y) − Aλ | < ∞.
Ekkor λ ∈ σ(L).
A tételt a [177] cikkben igazoltuk, a bizonyítás a [50] könyvben levő, nemautonóm lineáris egyenletek aszimptotikus viselkedését leíró tételen alapul. − A továbbiakban tehát elég az n+ c (λ) = 0 = nc (λ) esettel foglalkozni. Ebben az esetben exponenciális dichotómiák és perturbációs tételek segítségével az alábbi tétel igazolható, [42, 129]. − 3.5. Tétel. Tegyük fel, hogy n+ c (λ) = 0 = nc (λ). 2m + altér, amelyből indítva a (3.13) • Létezik olyan n+ s (λ) dimenziós Es (λ) ⊂ C rendszer megoldásait, azok végtelenben nullához tartanak. − 2m altér, amelyből indítva a (3.13) • Létezik olyan n− u (λ) dimenziós Eu (λ) ⊂ C rendszer megoldásait, azok −∞-ben nullához tartanak.
Ha egy nem nulla kezdeti feltétel benne van az Es+ (λ) és az Eu− (λ) altérben is, akkor az abból induló megoldás +∞-ben és −∞-ben is nullához tart, így λ sajátérték, ha dim(Es+ (λ) ∩ Eu− (λ)) > 0. Exponenciális dichotómiák segítségével az alábbi tételt igazoltuk [177]. − 3.6. Tétel. Tegyük fel, hogy n+ c (λ) = 0 = nc (λ).
(i) A λ szám pontosan akkor sajátértéke az L operátornak, ha dim(Es+ (λ)∩Eu− (λ)) > 0.
dc_483_12 42
3. FEJEZET. UTAZÓ HULLÁM MEGOLDÁSOK
(ii) A λ szám pontosan akkor reguláris értéke az L operátornak, ha Es+ (λ)⊕Eu− (λ) = C2m . Felhasználva, hogy Es+ (λ)⊕Eu− (λ) = C2m ekvivalens a dim Es+ (λ)+dim Eu− (λ) = 2m és dim(Es+ (λ) ∩ Eu− (λ)) = 0 feltételekkel, egyszerűen adódik az alábbi következmény. − 3.1. Következmény. Tegyük fel, hogy n+ c (λ) = 0 = nc (λ).
1. Ha dim Es+ (λ) + dim Eu− (λ) > 2m, akkor λ sajátértéke az L operátornak. 2. Ha dim Es+ (λ) + dim Eu− (λ) < 2m, akkor λ ∈ σ(L). 3. Ha dim Es+ (λ)+dim Eu− (λ) = 2m és dim(Es+ (λ)∩Eu− (λ)) = 0, akkor λ reguláris értéke az L operátornak. 4. Ha dim Es+ (λ) + dim Eu− (λ) = 2m és dim(Es+ (λ) ∩ Eu− (λ)) > 0, akkor λ sajátértéke az L operátornak. − 3.1. Megjegyzés. Ha n+ c (λ) = 0 = nc (λ), akkor az L − λI operátor Fredholm, és Fredholm indexe α(L − λI) = dim Es+ (λ) + dim Eu− (λ) − 2m, [70, 117].
3.3.2. Az Evans-függvény Az Es+ (λ) és Eu− (λ) alterek dimenziója explicit módon meghatározható, hiszen ezekhez csak az A± λ mátrixok sajátértékei valósrészének előjelét kell kiszámítani. Azonban + dim(Es (λ) ∩ Eu− (λ)) meghatározásához a (3.13) differenciálegyenlet rendszert kell megoldani, amely kivételes esetektől eltekintve, nem állandó együtthatós, így csak numerikusan lehet a megoldását előállítani. Ez vezet az Evans-függvény definíciójához [56]. Legyen − + − + − Ω = {λ ∈ C : n+ c (λ) = 0 = nc (λ), ns (λ) 6= 0 6= nu (λ), és ns (λ) + nu (λ) = 2m}.
Adott λ ∈ Ω számra jelölje az Es+ (λ) altér egy bázisát v1+ , . . . , vn++ , az Eu− (λ) altér s
egy bázisát pedig v1− , . . . , vn−− . Ekkor dim(Es+ (λ) ∩ Eu− (λ)) > 0 éppen azt jelenti, u hogy a két bázis lineárisan összefüggő. Az Evans-függvényt ezen 2m vektor által meghatározott determinánsként definiáljuk. Ez a determináns tehát pontosan akkor nulla, ha λ sajátértéke az L operátornak.
3.2. Definíció. Az L operátorhoz tartozó (egy) Evans-függvény D : Ω → C D(λ) = det v1+ . . . vn++ v1− . . . vn−− s
u
Láttuk, hogy az Evans-függvény zérushelyei éppen az operátor sajátértékei. Ez a tulajdonság független a definícióban szereplő bázisok választásától. Megmutatható, hogy a bázisok megfelelő választása mellett az Evans-függvény analitikus az Ω tartományon, és a sajátértékek multiplicitása megegyezik az Evans-függvény gyökeinek multiplicitásával [3]. Az analitikusság miatt a D gyökei izoláltak, tehát a dim Es+ (λ) + dim Eu− (λ) = 2m tartományban csak izolált sajátértékei lehetnek az operátornak. Így a 3.1. Következmény felhasználásával az L operátor lényeges spektrumát az alábbi módon tudjuk explicit módon meghatározni [177].
dc_483_12 3.4. STABILITÁSVIZSGÁLAT EGY EGYENLET, M = 1 ESETÉN
43
3.2. Következmény. Az L operátor lényeges spektruma − + − σess (L) = {λ ∈ C : n+ c (λ) > 0 vagy nc (λ) > 0 vagy ns (λ) + nu (λ) 6= 2m}.
Összefoglalva az eddigieket, az L operátor spektrumát a következőképpen lehet meghatározni. • A lényeges spektrum explicit módon kiszámítható az A± λ mátrixok sajátértékei valósrésze előjelének kiszámításával a 3.2. Következmény felhasználásával. • Az izolált sajátértékeket az Evans-függvény gyökei adják, ezeket azonban csak numerikusan lehet meghatározni, mivel az Evans-függvény értékeit csak a (3.13) nem állandó együtthatós lineáris differenciálegyenlet-rendszer megoldásával lehet kiszámítani.
3.4. Stabilitásvizsgálat egy egyenlet, m = 1 esetén Ha a (3.1) rendszer egy egyenletből áll, azaz m = 1, akkor az előző szakaszban ismertetett linearizálással történő stabilitásvizsgálat analitikusan, azaz numerikus közelítések nélkül is végrehajtható. Legyen most U : R → R az U ′′ + cU ′ + f (U ) = 0 U (−∞) = U− ,
(3.15) (3.16)
U (+∞) = U+ ,
egyenlet megoldása, ahol f ∈ C 1 (R, R), U− , U+ ∈ R, és tegyük fel hogy c ≥ 0 (ez U− és U+ felcserélésével elérhető). Az U stabilitását meghatározó, linearizálással kapott operátor L(V ) = V ′′ + cV ′ + f ′ (U )V. (3.17) A q(y) = f ′ (U (y)) függvény folytonos, és ±∞-ben van határértéke: q + = f ′ (U+ ),
q − = f ′ (U− ).
(3.18)
Ha az U függvény ±∞-ben exponenciálisan tart az U+ és U− határértékekhez, (ami általában teljesül), akkor a 3.4. Tételben szereplő integrálok konvergensek. Az A± λ mátrixok esetünkben 2 × 2 méretűek, és a µ1,2 sajátértéküket meghatározó karakterisztikus egyenletük µ2 + cµ + q ± − λ = 0. (3.19) Az operátor lényeges spektrumának meghatározásához szükség van azon λ értékekre, + − melyekre n+ c (λ) ≥ 1 és nc (λ) ≥ 1. Ha nc (λ) ≥ 1, akkor µ = iω megoldása a (3.19) egyenletnek. Ezt behelyettesítve a (3.19) egyenletbe kapjuk, hogy azon λ értékek, melyekre n+ c (λ) ≥ 1, a P
+
+
= {λ1 + iλ2 ∈ C | λ1 = q −
λ2 c
2
}
(3.20)
dc_483_12 44
3. FEJEZET. UTAZÓ HULLÁM MEGOLDÁSOK
parabolán helyezkednek el. Könnyen látható, hogy a parabola bal oldalán dim Es+ (λ) = 2, a jobb oldalán pedig dim Es+ (λ) = 1, ezt tüntettük fel a 3.3. ábrán. Hasonlóan, azon λ értékek, melyekre n− c (λ) ≥ 1 a P − = {λ1 + iλ2 ∈ C | λ1 = q − −
λ2 c
2
(3.21)
}.
parabolán helyezkednek el. Könnyen látható, hogy a parabola bal oldalán dim Eu− (λ) = 0, a jobb oldalán pedig dim Eu− (λ) = 1, szintén a 3.3. ábra szerint. 4 3
P−
P+
2 1
1
2
2
a
0
q−
−1
q+
1
0 1
−2 −3 −4 −4
−3
−2
−1
0
1
2
3
4
4 3
P+
P−
2
1 1
2
1
0
q+
0
−1
b
0
q− 1
−2 −3 −4 −4
−3
−2
−1
0
1
2
3
4
3.3. ábra. A (3.17) függvény-együtthatós operátor spektruma. A P + és P − parabolákat a (3.20), (3.21) képletek határozzák meg. A felső számok az Es+ (λ) altér dimenzióját, az alsó számok pedig az Eu− (λ) altér dimenzióját mutatják. A 3.4. Tételt, illetve a 3.1. és 3.2. Következményt felhasználva az L operátor spektrumára az alábbi tételt kapjuk. 3.7. Tétel. • A P + és P − parabolák, valamint a közöttük levő tartomány alkotja az L operátor lényeges spektrumát. Ha q + > q − , akkor a parabolák közötti tartomány minden pontja sajátérték (lásd 3.3a. ábra), ha viszont q + < q − , akkor egyik sem az (lásd 3.3b. ábra).
dc_483_12 3.4. STABILITÁSVIZSGÁLAT EGY EGYENLET, M = 1 ESETÉN
45
• A paraboláktól balra fekvő tartomány minden pontja az L operátor reguláris értéke. • A paraboláktól jobbra fekvő tartomány minden pontja az L operátornak vagy reguláris értéke vagy izolált sajátértéke. Esetünkben azt is el lehet dönteni analitikusan (numerikus közelítés nélkül), hogy a jobboldali komplex félsíkban vannak-e izolált sajátértékek. (Az izolált sajátértékeket azonban csak numerikusan lehet kiszámítani.) Legyen λ izolált sajátérték a V sajátfüggvénnyel. Ekkor igazolható [50], hogy a w(x) = V (x) exp(cx/2) függvényre w ∈ L2 (R) és lim w = lim w′ = 0. ±∞
(3.22)
±∞
Differenciálás után pedig azt kapjuk, hogy w′′ + (q(x) −
c2 )w = λw. 4
(3.23)
Ezt az egyenletet megszorozva w konjugáltjával, majd integrálva −∞-től +∞-ig a +∞ +∞ Z Z c2 2 ′ 2 |w(x)|2 (q(x) − )|w(x)| − |w (x)| dx = λ 4
−∞
(3.24)
−∞
egyenletet kapjuk. Ezek alapján a következő Állításokat tudjuk igazolni. 3.1. Állítás. Az L operátor izolált sajátértékei valósak, kisebbek a max |q| − c2 /4 számnál, és mindegyikhez egydimenziós sajátaltér tartozik. Bizonyítás. A (3.24) egyenletben minden integrál valós, ezért λ is valós. Feltehető, R +∞ hogy −∞ |w(x)|2 = 1, ezért ismét a (3.24) egyenletből λ < max |q| − c2 /4. Legyenek V1 és V2 a λ sajátértékhez tartozó sajátfüggvények. Megmutatjuk, hogy ezek egymás konstansszorosai. Legyenek wi (x) = Vi (x) exp(cx/2), i = 1, 2. Felhasználva a w függvényekre vonatkozó (3.23) egyenletet ′ w1′ w2 − w1 w2′ = w1′′ w2 − w1 w2′′ = 0.
Ezért a w1′ w2 − w1 w2′ függvény konstans. A (3.22) peremfeltételek miatt w1′ w2 − w1 w2′ = 0, így egy olyan szakaszon, melyen w2 nem tűnik el azt kapjuk, hogy (w1 /w2 )′ = 0, azaz w1 /w2 konstans függvény. A (3.23) egyenlet megoldásának egyértelműsége miatt w1 és w2 egymás konstansszorosai, így ez a V1 és V2 függvényekre is igaz. 3.2. Állítás. Legyenek λ1 és λ2 az L operátor izolált sajátértékei a V1 és V2 sajátfüggvénnyel. • Legyenek y1 és y2 a V2 egymást követő gyökei. Ha V1 nem nulla a zárt [y1 , y2 ] intervallumban, akkor λ1 > λ2 .
dc_483_12 46
3. FEJEZET. UTAZÓ HULLÁM MEGOLDÁSOK • Ha sem V1 sem V2 nem vált előjelet (egész R-ben), akkor λ1 = λ2 és a V1 és V2 függvények egymás konstansszorosai.
Bizonyítás. Vezessük be ismét a wi (x) = Vi (x) exp(cx/2), i = 1, 2 függvényeket, amelyek kielégítik a (3.23) egyenletet. Szorozzuk meg a w1 függvényre vonatkozó egyenletet w2 -vel, a a w2 függvényre vonatkozó egyenletet w1 -gyel, majd ezeket vonjuk ki egymásból. Ekkor az alábbi egyenlethez jutunk w1′′ w2 − w1 w2′′ = (λ1 − λ2 )w1 w2 . Integráljuk ezt az egyenletet y1 -től y2 -ig. Parciális integrálás után, felhasználva, hogy w2 (y1 ) = w2 (y2 ) = 0 kapjuk a Z y2 ′ ′ w1 w2 (3.25) w2 (y1 )w1 (y1 ) − w2 (y2 )w1 (y2 ) = (λ1 − λ2 ) y1
összefüggést. Feltehető, hogy az (y1 , y2 ) intervallumon a w1 és w2 függvény is pozitív, az előbbiről azt is tudjuk, hogy az intervallum végpontjaiban is pozitív. Mivel a w2 függvény a két gyök között pozitív, azért w2′ (y1 ) > 0 és w2′ (y2 ) < 0. (A szigorú egyenlőtlenség a megoldás egyértelműségéből következik, hiszen ha például w2′ (y1 ) = 0 lenne, akkor w2 (y1 ) = 0 miatt a w2 a konstans nulla függvény lenne.) A (3.25) bal oldala tehát pozitív. Mivel a jobb oldalon az integrál pozitív, azért λ1 − λ2 > 0, amit bizonyítani akartunk. A második rész igazolásához is a (3.25) összefüggést használjuk, ezúttal y1 = −∞, y2 = +∞ a szereposztás. Ekkor (3.25) bal oldala nulla, így mivel a jobb oldali integrál nem nulla, azért λ1 − λ2 = 0. A 3.1. Állítás szerint ezen λ1 sajátértékhez tartozó sajátaltér egydimenziós, tehát a V1 és V2 függvények egymás konstansszorosai. 3.3. Állítás. Az L operátor legnagyobb izolált sajátértékéhez tartozó sajátfüggvénynek nincs gyöke, azaz feltehető, hogy pozitív. Bizonyítás. Vezessük be az +∞ Z c2 I(w) = (q(x) − )w(x)2 − w′ (x)2 dx, 4 −∞
2
w ∈ L (R),
+∞ Z |w(x)|2 = 1
−∞
funkcionált. Igazolható, hogy az L operátor legnagyobb izolált sajátértéke az I funkcionál maximuma. Tegyük fel, hogy a w függvénynek van gyöke. Ekkor legyen w ˜ egy olyan függvény, amely a gyök egy környezetén kívül megegyezik a w függvénnyel, egy szűkebb környezetben viszont azonosan nulla. Igazolható, hogy a környezetet elegendően kicsire választva I(w) ˜ > I(w). Ezért, ha w a legnagyobb izolált sajátértékhez tartozik, akkor ez adja I maximumát, így nem lehet gyöke. Emlékeztetünk arra, hogy a nulla az L operátornak sajátértéke az U ′ sajátfügvénnyel, amint ez (3.15) deriválásból azonnal következik. Ha U ′ előjelet vált, akkor a 3.3. Állítás szerint nem 0 a maximális sajátérték, azaz az L operátornak van pozitív izolált sajátértéke. Ha viszont U ′ nem vált előjelet, akkor a 3.2. Állítás szerint a 0 egyszeres sajátérték, és a tőle lineárisan független sajátfüggvények előjelet váltanak, így az azokhoz tartozó sajátértékek negatívak. Ezzel tehát az L operátor izolált sajátértékeiről a következő állítást igazoltuk.
dc_483_12 3.4. STABILITÁSVIZSGÁLAT EGY EGYENLET, M = 1 ESETÉN 3.8. Tétel.
47
• Ha U ′ előjelet vált, akkor az L operátornak van pozitív sajátértéke.
• Ha U ′ nem vált előjelet, akkor az L operátornak a 0 egyszeres sajátértéke, a többi izolált sajátérték pedig negatív. Az m = 1 esetben a linearizálás segítségével a 3.3. 3.7. és 3.8. Tételek alapján az utazó hullám stabilitásáról az alábbi tételt kapjuk. 3.9. Tétel. Ha az U függvény szigorúan monoton, és teljesül f ′ (U− ) < 0 valamint f ′ (U+ ) < 0, akkor az utazó hullám stabilis. Ha az U függvény nem monoton, akkor az utazó hullám instabilis. Bizonyítás. Ha az U függvény szigorúan monoton, azért U ′ nem vált előjelet, így a 3.8. Tétel szerint az L operátornak a 0 egyszeres sajátértéke, a többi izolált sajátérték pedig negatív. A 3.7. Tételben szereplő, lényeges spektrumot meghatározó parabolák a negatív félsíkban fekszenek f ′ (U− ) < 0 és f ′ (U+ ) < 0 miatt (ezek a számok adják a parabolák valós tengellyel való metszéspontjait). Tehát teljesül az L operátor spektrumára a 3.3. Tételben szereplő feltétel, így az utazó hullám stabilis. Ha az U függvény nem monoton, akkor U ′ előjelet vált, így a 3.8. Tétel szerint az L operátornak van pozitív sajátértéke. Végül vizsgáljuk meg mit ad stabilitási tételünk a KPP-típusú állandó előjelű, és az FHN-típusú, azaz előjelváltó f esetében. Az FHN esetben (mint például f (u) = u(1 − u)(u − a)) láttuk, hogy az utazó hullám a megfelelő elsőrendű rendszerben két nyeregpontot összekötő pályához tartozik, és csak egyetlen c érték esetében létezik. A fázissík vizsgálatával egyszerűen belátható, hogy ezen pálya mentén U ′ állandó előjelű, azaz U szigorúan monoton. Esetünkben U− = 1 és U+ = 0, így teljesül az f ′ (U− ) < 0 és f ′ (U+ ) < 0 feltétel. A 3.9. Tétel szerint tehát az FHN esetben az egyetlen utazó hullám megoldás stabilis. A KPP esetben, amikor f (u) = u(1−u), láttuk, hogy az utazó hullám a megfelelő elsőrendű rendszerben c > 0 esetén létezik, és ekkor egy nyeregpontból egy stabil csomópontba, vagy fókuszpontba befutó pályához tartozik. Ha 0 < c < 2, akkor a pálya stabil fókuszpontba fut be, így a pálya mentén U nem monoton, tehát az utazó hullám megoldás instabilis. Ha c ≥ 2, akkor a pálya stabil csomópontba fut be, és a pálya mentén U ′ állandó előjelű. Azonban ebben az esetben U− = 1 és U+ = 0, így f ′ (U− ) < 0 és f ′ (U+ ) > 0, tehát a 3.9. Tétel nem alkalmazható a stabilitás vizsgálatára. Amint kiderül, lásd Fife könyvében [59] a 4.5 szakaszban, az utazó hullám a 3.1. Definíció értelmében nem stabilis, azonban a minimális sebességhez tartozó hullám a (3.7) egyenletben definiált értelemben stabilis.
dc_483_12 48
3. FEJEZET. UTAZÓ HULLÁM MEGOLDÁSOK
dc_483_12
4. fejezet
Hálózati folyamatok Ennek a fejezetnek a célja azon matematikai modell pontos meghatározása, amellyel foglakozni fogunk, valamint az ezzel kapcsolatos irodalom ismertetése és saját kutatásaink elhelyezése a hálózat kutatás szövevényes rendszerében.
4.1. A matematikai modell Legyen adott egy N csúcsú, irányítatlan, hurokélmentes gráf, valamint legyen adott egy véges állapothalmaz {a1 , a2 , . . . am }, amely megadja, hogy az egyes csúcsok mely állapotban lehetnek. Így a gráf összes lehetséges állapotainak halmaza mN , hiszen minden csúcs m különböző állapot valamelyikében lehet. Egy csúcs állapotának változását Poisson-folyamattal írjuk le, azaz egy kis ∆t idő alatt annak valószínűsége, hogy egy ai állapotban levő csúcs aj állapotba kerül az 1 − exp(−λij ∆t) számmal adható meg, ahol a λij számot az átmenet rátájának fogjuk nevezni. Így a modell definiálásához a λij rátákat kell megadni, melyek természetesen a szomszédos csúcsok állapotától függhetnek. Az állapothalmazt és az átmenetek rátáit megadó függvényt fogjuk a továbbiakban dinamikának nevezni [66]. A szakasz további részében ismertetünk néhány dinamikát, valamint a fontosabb hálózat típusokat, amelyeket széleskörben vizsgáltak.
4.1.1. A csúcsok állapotát leíró dinamikák Először a járványterjedést leíró dinamikákat ismertetjük, mert ezek ezek képezik saját kutatásaink tárgyát. A Bevezetésben már ismertettük a legegyszerűbb, és igen gyakran vizsgált dinamikát, az SIS típusú járványterjedést. Ez olyan fertőzések modellezésére alkalmas, amelyben a fertőzésen átesett egyedek nem nyernek immunitást, így a fertőzött, I típusú egyedek újra fertőzhetők, azaz S típusúak lesznek. A csúcsok tehát kétféle állapotban, S és I lehetnek. Kétféle átmenet lehetséges: fertőzés, melynek során egy S csúcs I típusú lesz, ennek rátája kτ , ahol k adja meg az S csúcs I típusú szomszédainak számát; valamint gyógyulás, melynek során egy I csúcs S típusú lesz, ennek rátája γ a szomszédos csúcsok típusától függetlenül. A leggyakrabban vizsgált járványterjedési dinamika az SIR típusú, amely olyan fertőzések leírására alkalmas, amelyben a fertőzésen átesett egyedek immunitást nyernek. Ez esetben a fertőzött, I típusú egyedek egy újabb osztályba kerülnek, melyet R 49
dc_483_12 50
4. FEJEZET. HÁLÓZATI FOLYAMATOK
(recovered) jelöl. A csúcsok tehát háromféle állapotban, S, I és R lehetnek, melyek között a fenti kétféle átmenet lehetséges, azzal a változtatással, hogy a gyógyulás most I → R átmenetet jelent. A járványterjedést számos más dinamikával is lehet modellezni, ezek közül csak megemlítünk néhányat. Ha az immunitás nem végleges, akkor szokás az SIRS modellt használni, melynél háromféle állapot van, azonban a fenti átmeneteken kívül az R → S átmenet is megengedett. Ha az egészséges egyedek a betegséget megkapva nem lesznek azonnal fertőzöttek, akkor egy újabb osztályt célszerű bevezetni, amelyet E (exposed) jelöl. Ebben az esetben négyféle állapotban lehet egy csúcs: {S, E, I, R}, és a következő átmenetek fordulhatnak elő: S → E, E → I, I → R. Ezt a dinamikát nevezik SEIR típusúnak. Ha a betegség után az egyed nem szerez immunitást, akkor ehelyett az SEIS dinamikával modellezhető a folyamat. A járványterjedési modellekből kiindulva kezdték meg a híresztelések (rumour) terjedésének modellezését, melynek mára igen kiterjedt irodalma van [77, 104, 110, 151]. Ezek a modellek szociológiai vizsgálatokból indultak ki, melyek során emberek egy csoportja által alkotott ismeretségi hálózaton hírek, híresztelések pletykák terjedésének mechanizmusát vizsgálták. Ezek igen fontosak lehetnek a politikai közvélemény formálása, vagy a pénzügyi piacok viselkedése szempontjából, ezért számos szociológus és politológus kutatásait motiválták. Mára annak modellezése is nagyon fontossá vált, hogy egy új információt (például egy új márka bevezetését, vagy egy új videót), hogyan lehet az interneten minél hatékonyabban elterjeszteni, melyre ú.n. gossip (pletyka) algoritmusokat is alkalmaznak [77]. Az SIR betegségterjedéshez hasonlóan az információ terjedés szempontjából is háromféle állapotban lehetnek a csúcsok: tájékozatlanok (ignorants), akik nem ismerik a híresztelést, terjesztők (spreaders), akik ismerik a hírt és terjesztik is, valamint akadályozók (stiflers), akik ismerik a hírt, de nem terjesztik. A továbbiakban ezeket az osztályokat X, Y és Z fogja jelölni. A csúcsok állapota a következőképpen változhat. Egy tájékozatlan csúcs a terjesztő típusú szomszédai számával arányosan maga is terjesztővé válhat, ez tehát egy X → Y átmenet, melynek rátája kτ , ahol k adja meg az X csúcs Y típusú szomszédainak számát. Egy terjesztő (Y ) kétféleképpen változhat akadályozóvá (Z), egyrészt spontán módon γ rátával, amely kifejezi azt, hogy idővel a pletyka egyre kevésbé fontos számára, azaz fokozatosan feledésbe merül; másrészt jp rátával, ahol j jelöli az Y csúcs Y és Z típusú szomszédainak számát, p pedig adott paraméter. Ez utóbbi átmenet azt fejezi ki, hogy minél többen ismerik a terjesztő szomszédai közül a pletykát, annál kevésbé érdekes a továbbadása. Tehát kétféle átmenet lehetséges: X → Y , melynek rátája kτ , valamint Y → Z, melynek rátája γ + jp. Megjegyezzük, hogy ez a legegyszerűbb modell, ennek számos általánosítását, illetve finomítását vizsgálták és vizsgálják, például a [110] dolgozatban. Hálózati folyamatok egyik igen fontos típusa az aktivitás terjedése biológiai neurális hálózatokon. Neurális hálózatokat általában az itt bemutatottnál bonyolultabb modellekkel írják le, ugyanis a neuronok állapotát egy folytonos változó, a membránpotenciál jellemzi. Így minden neuronhoz egy közönséges differenciálegyenlet tartozik, amely tartalmaz a szomszédos neuronok állapotát jellemző tagokat. Az így kapott csatolt differenciálegyenlet-rendszert nagyon sokan vizsgálták, az eredményekről kiváló összefoglalást ad a [38] dolgozat, amely számos hivatkozást tartalmaz. Ez esetben azonban a modell igen összetett lesz, ezért nagyon speciális gráfok esetén
dc_483_12 4.1. A MATEMATIKAI MODELL
51
is nehéz elméleti eredményeket levezetni. A gráfstruktúra hatásának vizsgálatához célszerű a dinamikát egyszerűsíteni, hogy a modell kezelhető legyen. A dinamika jelentős egyszerűsítését jelenti a diszkrét állapottér bevezetése, amikor a neuronnak csak véges sok állapotát különböztetjük meg [18, 67, 131]. A legegyszerűbb esetben a neuront két állapotúnak tekintjük, nevezetesen aktív, vagy inaktív lehet. A folyamat pontosabb leírását kapjuk, ha ezekhez hozzáveszünk egy harmadik állapotot is, amelyben a neuron egy ideig nem aktiválható (refractory). Kétállapotú neuronokból álló hálózatunk esetében a matematikai modell a következő. Tételezzük fel először, hogy minden neuron a gerjeszthető (excitatory) típusba tartozik. Ekkor a gráf csúcsai kétféle állapotban lehetnek: aktív (E+ ) és inaktív (E− ), melyek között a következő átmenetek jöhetnek létre. Egy aktív neuron inaktívvá válik, ezen folyamat rátáját jelölje α, valamint egy inaktív neuron az aktív szomszédai hatására aktívvá válik. Ezen folyamat rátája f (iwE + hE ), ahol i az aktív szomszédok száma, wE és hE adott konstansok, f pedig a tangens hiperbolikusz, vagy hasonló jellegű függvény. Ez a ráta azt fejezi ki, hogy egyrészt a szomszédoktól függetlenül minden neuronra hat valamilyen külső gerjesztés, melyet a hE paraméter jellemez, másrészt a gerjesztés függ az aktív szomszédok számától (valamilyen wE súllyal megszorozva ezek számát), de a járványterjedéstől eltérően a szomszédok számától nem lineárisan függ az átmenet rátája, hanem a tangens hiperbolikusz függvényhez hasonló telítődés szerint, tehát nagyon sok aktív szomszéd már nem növeli az átmenet valószínűségét. Ha a hálózat nemcsak gerjeszthető, hanem gátló (inhibitory) neuronokat is tartalmaz, akkor a gráf csúcsai négyféle állapotban lehetnek: E+ , E− , I+ , I− , az utóbbi kettő jelöli a gátló aktív és inaktív neuronokat. A neuronok állapota aktív és inaktív között változhat, a gerjeszthető (E típusú) neuronok mindvégig gerjeszthetők maradnak, hasonlóképpen a gátlók is gátlók maradnak a folyamat során. Tehát négyféle átmenet lehetséges, melyek rátái a következőképpen adhatók meg. A fenti α rátával egy E+ vagy I+ neuron inaktívvá válhat, azaz átkerül az E− , illetve I− osztályba. Egy inaktív neuron aktívvá válásának rátája gerjeszthető neuron (E− ) esetében f (iwE − jwI + hE ), ahol i az aktív gerjeszthető (E+ ) szomszédok száma, j az aktív gátló (I+ ) szomszédok száma, wE , wI és hE adott konstansok, f pedig a fent említett függvény. Egy inaktív gátló neuron (I− ) aktívvá válásának rátája f (iwE − jwI + hI ), ahol i ismét az aktív gerjeszthető (E+ ) szomszédok száma, j az aktív gátló (I+ ) szomszédok száma és hI a gátló neuronokra ható külső gerjesztést megadó konstans. Az alábbiakban összefoglaljuk a fent ismertetett dinamikákat. Az egyes típusoknál megadjuk a csúcsok lehetséges állapotainak halmazát, a lehetséges átmeneteket, valamint ezek rátáit. A rátán, amint fent definiáltuk, azt értjük, hogy a Poissonfolyamat esetében a kis ∆t idő alatt bekövetkező átmenet 1 − exp(−λ∆t) valószínűségét megadó képletben mennyi a λ paraméter értéke. • SIS járványterjedés
A csúcsok lehetséges állapotainak halmaza: {S, I}. Átmenetek és rátáik
– S → I, λ = kτ , k a szomszédos I csúcsok száma.
– I → S, λ = γ
dc_483_12 52
4. FEJEZET. HÁLÓZATI FOLYAMATOK • SIR járványterjedés
A csúcsok lehetséges állapotainak halmaza: {S, I, R}. Átmenetek és rátáik
– S → I, λ = kτ , k a szomszédos I csúcsok száma. – I → R, λ = γ
• Híresztelés terjedése
A csúcsok lehetséges állapotainak halmaza: {X, Y, Z} (tájékozatlan, terjesztő, akadályozó). Átmenetek és rátáik – X → Y , λ = kτ , k a szomszédos Y csúcsok száma.
– Y → Z, λ = γ + jp, j a szomszédos Y és Z csúcsok együttes száma. • Aktivitás terjedése neuron hálózatban
A csúcsok lehetséges állapotainak halmaza: {E+ , E− , I+ , I− } (gerjeszthető aktív és inaktív, gátló aktív és inaktív). Átmenetek és rátáik – E+ → E− , λ = α.
– E− → E+ , λ = f (iwE − jwI + hE ), i, j a szomszédos E+ , és I+ csúcsok száma. – I+ → I− , λ = α.
– I− → I+ , λ = f (iwE − jwI + hI ), i, j a szomszédos E+ , és I+ csúcsok száma.
4.1.2. Hálózatok típusai Ebben a szakaszban ismertetjük a leggyakrabban vizsgált gráf típusokat, amelyeken hálózati folyamatokat tanulmányoznak. Mivel a dolgozat tárgyát differenciálegyenletek képezik, azért a jelen szakaszban természetesen nem célunk a különböző gráf típusok kimerítő tárgyalása, mindössze a további vizsgálatainkhoz szükséges gráfokkal kapcsolatos ismereteket szeretnénk összefoglalni. A hálózati folyamatok vizsgálatának első lépése minden esetben a teljes gráf vizsgálata, amely lényegében azt jelenti, hogy a hálózatnak nincs szerepe, hiszen minden csúcs hatással van minden más csúcsra. Ebben az esetben a folyamatot közönséges differenciálegyenlettel jól lehet közelíteni, ha gráf csúcsszáma elegendően nagy. A modell változói az xk (t) függvények, amelyek az ak típusú (k = 1, 2, . . . m) csúcsok számát adják meg a t időpontban. Ezekre a függvényekre az átmeneti ráták ismeretében egyszerű kompartment modellt lehet felírni. Az SIS dinamika esetében például a differenciálegyenletek a következő alakot öltik: x˙ S = γxI − τ xS xI , x˙ I = −γxI + τ xS xI [27, 44]. (Mivel xS (t) + xI (t) = N , a csúcsok száma, azért valójában egy egyenlet elegendő a folyamat leírásához.)
dc_483_12 4.1. A MATEMATIKAI MODELL
53
A legegyszerűbb hálózat, amelynél már a folyamat térbelisége is szerepet kap a rács. Nagyszámú csúccsal rendelkező gráfok esetében ekkor a folyamat parabolikus parciális differenciálegyenlettel közelíthető. A járványterjedés esetében reakciódiffúzió egyenletekkel írható le a folyamat. Ekkor a modell változói a helytől és időtől függő uk (t, x) függvények, amelyek az ak típusú (k = 1, 2, . . . m) csúcsok sűrűségét adják meg a t időpontban és az x helyen. Az SIS dinamika esetében például az I típusú csúcsok számát megadó reakció-diffúzió egyenlet a következő alakba írható: ∂t uI = D∆uI + τ uI (1 − uI ) − γuI . Ilyen típusú járványterjedési modelleket sokan vizsgáltak, bonyolultabb dinamika esetén is [30, 47]. Társadalmi hálózatokon zajló folyamatok, mint például a hírek terjedése, vagy a járványterjedés, szempontjából fontosak az olyan gráfok, amelyek kisebb teljes gráfokból épülnek fel. Ezeket gyakran háztartás szerkezetű gráfoknak nevezik, mivel a kisméretű teljes gráfok háztartásokat reprezentálnak, amelyek valamilyen módon összeköttetésben állnak egymással. A járványterjedés modellezésénél használt különböző háztartás hálózatokat a következő szakaszban részletesen fogjuk ismertetni [9, 10, 12, 64, 72, 74, 127]. A legtöbb esetben közönséges differenciálegyenletrendszerekkel modellezhetők ezek a folyamatok, ugyanis két szintű teljes keveredést tételeznek fel, egyrészt a háztartásokon belül, másrészt a háztartások között. A valóságban vizsgált hálózatok esetében a legritkább esetben lehet a hálózatot megadó gráfot pontosan megadni, egyrészt a csúcsok és élek nagy száma, másrészt a kapcsolatokról való ismeret szegényessége miatt. Ezért a hálózat modellezésének kézenfekvő útja a véletlen gráfok használata, amely lényegében azt jelenti, hogy a hálózatot nem egy gráffal adjuk meg, hanem gráfok egy halmazával, amelyből a folyamat egy realizációja során véletlenszerűen választunk egy gráfot. A véletlen gráfok hatalmas irodalommal rendelkeznek, és számos kérdést vetettek fel. Itt csak néhány fontosabb típust ismertetünk, és utalunk az alapvető monográfiákra [22, 25, 112]. Az egyes típusok ismertetésénél alapvetően a [25] könyv 1. fejezetére támaszkodunk. Véletlen gráfokat matematikai szempontból először Erdős és Rényi, valamint tőlük függetlenül Gilbert vizsgáltak 1959-ben [53, 63]. Adott n és m pozitív egész esetén a G(n, m) Erdős-Rényi véletlen gráf egy véletlenszerűen választott gráf az összes olyan gráfok halmazából, amelyeknek n csúcsa és m éle van. (Feltételezve, hogy a véletlenszerű választásnál minden gráfot azonos valószínűséggel választhatjuk.) Megjegyezzük, hogy a Gilbert féle definícióban nem az élek száma, hanem az egyes élek létrehozásának valószínűsége, p adott. Egyszerűen látható, hogy m és p kö2m zött fennáll a p = n(n−1) összefüggés. Az Erdős-Rényi véletlen gráf fokszámeloszlása binomiális, amelyet nagy csúcsszám esetén Poisson-eloszlással közelíthetünk. Erdős és Rényi világhírű eredménye a gráf legnagyobb komponense méretével kapcsolatos fázisátmenet felfedezése. Nevezetesen, p = c/n esetén, ha c < 1 akkor a legnagyobb komponens O(log n) méretű, míg c > 1 esetén O(n) méretű. Az Erdős-Rényi véletlen gráf, c > 1 esetén rendelkezik a valóságos hálózatok "kis-világ" tulajdonságával, nevezetesen az átlagos úthossz két csúcs között (a legrövidebb utak átlagos hossza bármely két csúcsra kiszámítva) jóval kisebb a csúcsok számánál. Igazolható, hogy ez O(log n) nagyságrendű, amely népszerűen kifejezi azt, hogy két tetszőleges személy összeköthető ismerősök legfeljebb öt hosszúságú láncolatával, amelyet először Karinthy Frigyes fogalmazott meg 1929-ben a Minden másképpen van című tárcagyűjteményének "Láncszemek" című fejezetében [43].
dc_483_12 54
4. FEJEZET. HÁLÓZATI FOLYAMATOK
A valóságos hálózatok vizsgálata során kiderült, hogy a "kis-világ" tulajdonság mellett fontos szerepe van a hálózat klaszterezettségének, amelynek legegyszerűbb jellemzője a klaszterezettségi együttható. Ez azt adja meg, hogy egy csúcs szomszédai között milyen valószínűséggel van él. Az Erdős-Rényi véletlen gráf klaszterezettségi együtthatója 1/n nagyságrendű, míg a valóságos hálózatoké általában sokkal nagyobb, melyet népszerűen úgy lehet kifejezni, hogy a barátom barátja nagy valószínűséggel nekem is barátom. Felmerült tehát az igény olyan véletlen gráfok bevezetésére, amelyek a "kis-világ" tulajdonság mellett viszonylag nagy klaszterezettségi együtthatóval rendelkeznek. Ez vezetett a kilencvenes évek végén a Watts-Strogatz modell definiálásához [148]. A modell egy n csúcsú körgráfból indul ki, amelynek minden csúcsát összekötjük a legközelebbi k szomszédjával (a mellette levő két csúcsot is beleszámítva). Ezután egy β ∈ [0, 1] paramétert választva, végighaladunk a gráf csúcsain és az egyes csúcsokból a nagyobb indexű csúcsba futó éleket (egymástól függetlenül) β valószínűséggel megszüntetjük. Végül egy megszüntetett él helyett az adott csúcsból egy véletlenszerűen választott csúcsba egy új élet hozzáveszünk a gráfhoz. Az algoritmus így egy olyan gráfot hoz létre, amelynek nk/2 csúcsa van (a k számot párosnak kell választani). A β paraméter értékét változtatva olyan gráfokat kaphatunk, amelyek interpolációt jelentenek a β = 0 esethez tartozó reguláris gráf és a β = 1 esethez tartozó Erdős-Rényi véletlen gráf között. A β = 0 esetben nagy a klaszterezettség, de nincs "kis-világ" tulajdonság, míg a β = 1 esetben éppen fordítva, kicsi a klaszterezettség, viszont fennáll a "kis-világ" tulajdonság. Watts és Strogatz megmutatták, hogy β értéke megválasztható olyan módon, hogy viszonylag nagy a klaszterezettség mellett a "kis-világ" tulajdonság is teljesüljön. A Watts-Strogatz modellben kapott véletlen gráf jobban hasonlít a valóságos hálózatokra, mint az Erdős-Rényi véletlen gráf, azonban egy lényeges szempontból, a fokszámeloszlást tekintve lényegesen eltér azoktól. Egy gráf fokszámeloszlása p(k) azt adja meg, hogy a csúcsok hányad részének k a fokszáma. Mind az Erdős-Rényi és a Watts-Strogatz véletlen gráf esetében p(k) értéke exponenciálisan csökken, ahogy k növekszik. Azaz nagyon kis valószínűséggel fordulnak elő ezekben a véletlen gráfokban magas fokú csúcsok. A valóságos hálózatokban, azonban a magas fokszámú csúcsok meglehetősen tipikusak. Számos különböző hálózatot megvizsgálva kiderült, hogy a fokszámeloszlás nagy k értékekre hatványfüggvényel adható meg, azaz nagy k esetén p(k) ≈ ck −γ valamilyen γ esetén (amely tipikusan 2 és 3 közötti értéket vesz fel a vizsgált hálózatokban). A különböző hálózatok vizsgálatával kapott eredményekről kiváló összefoglalást olvashatunk Albert és Barabási cikkében [2]. Barabási és Albert a [14] dolgozatban bevezettek egy preferált kapcsolódással létrehozott véletlen gráf modellt, amelyben a fokszámeloszlás nagy k értékekre hatványfüggvényel adható meg. Barabási és Albert valójában nem a véletlen gráfot definiálták, hanem egy algoritmust adtak, amely egy gráfot hoz létre a következőképpen. Egy kis gráfból kiindulva csúcsok egyenkénti hozzávételével konstruálják meg az n csúcsú gráfot. Egy új csúcs hozzávételekor mindig adott számú él indul ki belőle, amelyekkel a már meglevő csúcsokhoz olyan módon kötődik, hogy minél nagyobb fokszámú egy csúcs, annál nagyobb valószínűséggel kötődik hozzá. A [14] dolgozatban az algoritmus nincs teljes matematikai szigorúsággal megadva, a véletlen gráf pontos definícióját, azaz az LCD modellt (linearized chord diagrams), Bollobás és Riordan adták meg a [26] dolgozatban. Megjegyezzük, hogy a fokszámeloszlás tekintetében a Barabási-Albert
dc_483_12 4.2. JÁRVÁNYTERJEDÉS HÁLÓZATON
55
modell megfelel a valóságos hálózatoknak, és a "kis-világ" tulajdonsággal is rendelkezik, azonban a klaszterezettségi együtthatója jóval kisebb a valóságos hálózatokénál. Véletlen gráfok egyik igen fontos típusa a reguláris véletlen gráf. Egy n csúcsú r-reguláris véletlen gráf az összes n csúcsú r-reguláris gráfok halmazából véletlenszerűen választott gráf, olyan módon, hogy minden gráf választásának valószínűsége azonos. A reguláris véletlen gráf általánosítása az adott fokszám sorozattal, d1 , d2 , . . . dn rendelkező véletlen gráf. Ezeket a véletlen gráfokat a Bollobás-féle konfigurációs tér segítségével lehet definiálni, ezért használják ezekre a konfigurációs modell elnevezést [21]. A konfigurációs modellel létrehozott véletlen gráfot szemléletesen úgy lehet elképzelni, hogy az i-edik csúcsba rajzolunk di darab tüskét, vagy másszóval "fél-élet", majd ezeket véletlenszerűen összekötjük (olyan módon, hogy hurokélek és többszörös élek ne legyenek a gráfban) [25]. Különböző véletlen gráf modellek közös keretbe foglalhatók a Bollobás, Janson és Riordan [23] által bevezetett általános struktúra segítségével. A modell egy κ : [0, 1]2 → R+ szimmetrikus, mérhető magfüggvény megadásán alapul. Ezután a [0, 1] intervallumból választunk n darab véletlen számot egyenletes eloszlással, melyeket x1 , . . . , xn jelöl. A gráf csúcshalmaza legyen {1, 2, . . . , n}, az i-edik és jedik csúcs összekötésének valószínűsége pedig legyen pij = min{1, κ(xi , xj )/n}. A √ κ(x, y) = c/ xy magfüggvényt választva például a Barabási-Albert modellhez jutunk. A modell ilyen formában való megadása teszi lehetővé, hogy a kapott véletlen gráf fontos tulajdonságait, mint például a fokszámeloszlás, vagy klaszterezettség egzakt módon lehessen vizsgálni. Megjegyezzük, hogy a [23] dolgozatban a fentinél általánosabb konstrukció szerepel, a [0, 1] intervallum és az egy-dimenziós Lebesguemérték helyett egy általános szeparábilis metrikus tér, és azon egy Borel-mérték. Amint fent említettük, a fokszámeloszlás tekintetében a Barabási-Albert modell megfelel a valóságos hálózatoknak, azonban a klaszterezettségi együtthatója jóval kisebb a valóságos hálózatokénál. Bollobás, Janson és Riordan a fenti véletlengráf modelljüket véletlen hipergráfok felhasználásával kiterjesztették olyan módon, hogy hatványfüggvény fokszámeloszlású véletlen gráfban a klaszterezettségi együttható egy széles tartományban beállítható legyen [24].
4.2. Járványterjedés hálózaton A járványterjedés matematikai modellezésének kezdetei a XX. század elejére nyúlnak vissza, a leggyakrabban idézett dolgozat ebből az időszakból Kermack és McKendrick 1927-es cikke [86]. Ekkor még hálózatokat nem vizsgáltak, a modellek kompartment jellegűek voltak. A legegyszerűbb modellben két kompartment van, az egészséges és beteg egyedek, melyeket S (susceptible), illetve I (infected) jelöl. Ezeket időben változó függvényeknek tekintve, és feltételezve, hogy a fertőzés bármely két egyed között lehetséges, kapjuk a legegyszerűbb, úgynevezett SIS modellt. S˙ = γI − τ SI, I˙ = τ SI − γI.
(4.1) (4.2)
Ebben megjelennek a járványterjedés matematikai leírásának alapvető paraméte-
dc_483_12 56
4. FEJEZET. HÁLÓZATI FOLYAMATOK
rei a fertőzési ráta τ , valamint a fertőző periódus hosszát jellemző gyógyulási ráta γ. A másik legfontosabb modell, amely az immunitást nyert egyedeket (R) is figyelembe veszi, az SIR modell S˙ = −τ SI, I˙ = τ SI − γI, R˙ = γI.
(4.3) (4.4) (4.5)
Ezek a modellek képezik a járványterjedés differenciálegyenletekkel történő modellezésének alapját. Ezekből kiindulva megérthető a járványterjedés folyamata, kiszámítható, hogy várhatóan a populáció mekkora részét fogja elérni a betegség, meghatározhatók fontos küszöbértékek, mint például a reprodukciós szám R0 , amely meghatározza, hogy a járvány a teljes populációban elterjed, vagy rövid idő után megszűnik, illetve a kritikus oltási küszöb, amelyből a hatóságok a szükséges oltóanyag mennyiségét meg tudják becsülni. A fenti modellekből kiindulva számos összetettebb, a valóságot jobban leíró modell született. Mivel a hálózatokkal kapcsolatos vizsgálatok ismertetése a célunk, azért a differenciálegyenletekkel megadható kompartment modelleket, és az azokkal kapcsolatos eredményeket itt nem tárgyaljuk, csak utalunk a matematikai epidemiológia néhány fontos tankönyvére, Anderson és May 1991-es munkájára [7], Brauer, van den Driessche és Wu 2008-ban megjelent könyvére [27], valamint Daley és Gani 1999-es [44], illetve Diekmann és Heesterbeek 2000-ben [47], valamint Keeling és Rohani 2008-ban [83] publikált monográfiájára. A járványterjedés matematikai modellezése a fenti típusú kompartment modellekkel mindig korlátozott, hiszen nem tudja figyelembe venni, hogy a fertőzés mely egyedről melyikre juthat át. Ennek leírására célszerű megállapítani a kapcsolati struktúrát, amely megadja, hogy melyik egyed melyikkel van, vagy lehet kapcsolatban [16, 75, 81, 82, 106, 111, 146]. Ez a struktúra természetes módon egy gráffal adható meg, és bizonyos esetekben adatokból meghatározható, például háziállatok fertőző betegségeinek gazdaságok, illetve piacok közötti terjedése esetén. Ennek fontos szerepe van például a száj és körömfájás, vagy a sertés influenza terjedésének megakadályozásában [68, 87, 135]. Nemi úton terjedő betegségek terjedésének megakadályozása érdekében is gyakran gyűjtenek adatokat a kapcsolati hálózat pontos szerkezetéről [100, 123]. A hálózat pontos ismeretében Monte-Carlo szimulációval vizsgálható a betegség terjedésének folyamata, azonban analitikus vizsgálatra ez nem ad lehetőséget a modell komplexitása miatt. Így például a fent említett küszöbértékek matematikai kiszámítására a konkrét hálózatok ismerete nem ad lehetőséget. Ha tehát célunk az, hogy a hálózat szerkezetének hatását a járványterjedés folyamatára matematikailag vizsgáljuk, akkor olyan modelleket kell létrehoznunk, amelyek tükrözik a valóságos hálózat szerkezetét, de ugyanakkor matematikai módszerekkel is kezelhetők. A továbbiakban ezeket a modelleket fogjuk ismertetni SIS, illetve SIR típusú fertőzés esetén. Az SIS típusú járványterjedés legegyszerűbb modelljében azt feltételezik, hogy a folyamat egyetlen függvénnyel, a fertőző egyedek számának időbeli változásával, I(t)-vel leírható. Később látni fogjuk, hogy erre a függvényre fennáll az ˙ = τ NSI (t) − γI(t) I(t)
(4.6)
dc_483_12 4.2. JÁRVÁNYTERJEDÉS HÁLÓZATON
57
összefüggés, ahol NSI (t) az SI típusú élek számát jelenti a gráfban t időpontban. Megjegyezzük, hogy az 5.4.1. szakaszban igazolni fogjuk, hogy a várható értékekre ez az egyenlet tetszőleges kapcsolati hálózat esetében valóban fennáll, és a folyamat alapegyenletéből levezethető. A fenti egyenlet természetesen csak akkor alkalmas az I függvény meghatározására, ha az SI élek számát, NSI (t)-t ki tudjuk fejezni az I(t) segítségével. Ez egzakt módon nem tehető meg, azonban különböző gráfokon megfelelően választott közelítések igen jó eredményeket adnak.
4.2.1. Homogén fokszámeloszlású gráf A legegyszerűbb közelítést akkor kapjuk, ha feltételezzük, hogy az N csúcsú hálózat minden csúcsa azonos, vagy közel azonos fokszámú, jelölje az átlagos fokszámot n. Tekintsünk egy S csúcsot, és az abból kiinduló n élt. A gráf maradék N −1 csúcsa között I(t) darab I típusú van, ezért véletlenszerű összeköttetést feltételezve (azaz feltéve, hogy a különböző típusú csúcsok egyforma valószínűséggel kötődnek egymáshoz) az n él közül átlagosan nI(t)/(N − 1) darab vezet egy I csúcshoz. Tehát egy S csúcsból átlagosan nI(t)/(N − 1) darab SI típusú él indul ki. Mivel az S csúcsok száma a t időpontban N −I(t), azért az SI élek számára az NSI (t) = n(N −I(t))I(t)/(N −1) közelítést kapjuk. Ezt behelyettesítve a (4.6) egyenletbe az I függvényre az ˙ =τ I(t)
n (N − I(t))I(t) − γI(t) N −1
(4.7)
differenciálegyenletet kapjuk. Megjegyezzük, hogy teljes gráf esetén, amikor n = N − 1, ez visszaadja a (4.2) differenciálegyenletet. A fenti egyenlet egyszerűen kiterjeszthető az SIR típusú járványterjedés leírására, az S(t) függvény, és a rá vonatkozó differenciálegyenlet bevezetésével. Ekkor az egyenletrendszer a következő alakba írható: n S(t)I(t), N −1 n ˙ S(t)I(t) − γI(t). I(t) = τ N −1
˙ S(t) = −τ
(4.8) (4.9)
Az R függvényre nem írtuk fel a differenciálegyenletet, mivel az R(t) = N −S(t)−I(t) összefüggésből is meghatározható. A közelítés jóságát az irodalomban általában a Monte-Carlo szimulációval való összehasonlítással szokták vizsgálni. A 4.1. ábrán láthatjuk, hogy teljes gráf esetén a fenti közelítés jó egyezést mutat a Monte-Carlo szimulációval. Körgráf esetén az egyezés sokkal rosszabb, amit a 4.2. ábra mutat. Ekkor ugyanis az a feltételezés, hogy különböző típusú csúcsok egyforma valószínűséggel kötődnek egymáshoz, meglehetősen kevéssé teljesül, hiszen a betegség terjedése során a kezdeti I típusú csúcs mellett lesznek I csúcsok, és a betegség a körön front szerűen terjed, tehát, ahová még nem jutott el, ott az S csúcsok mellett S csúcsok vannak. A körgráfon kívül más ritka gráfon, például rácson, is elég rossz a közelítés, szintén a fent említett ok miatt. Azonban véletlen gráfok esetén sokkal jobb eredményt kapunk, amint a 4.3. ábrán látható. Ezen az ábrán két különböző típusú véletlen gráfon, melyeken azonos az átlagos fokszám, azaz n értéke, futtatott Monte-Carlo szimuláció eredményét hasonlítjuk össze a (4.7) differenciálegyenlet megoldásával.
dc_483_12 58
4. FEJEZET. HÁLÓZATI FOLYAMATOK
90 80 70
I(t)
60 simulation mean−field
50 40 30 20 10
0
0.5
1
1.5
t
4.1. ábra. A (4.7) differenciálegyenlet megoldásának összehasonlítása a Monte-Carlo szimulációval N = 100 csúcsú teljes gráf és SIS típusú dinamika esetén, τ = 0.1, γ = 1. Az egyik véletlen gráfot a Bollobás-féle konfigurációs modellel állítottuk elő olyan módon, hogy minden csúcs fokszáma n = 5 legyen, azaz egy reguláris véletlen gráfot adunk meg. A másik véletlen gráfot az Erdős-Rényi modell szerint hoztuk létre olyan p érték választásával, hogy az átlagos fokszám szintén n = 5 legyen. Az ábrán megfigyelhetjük, azt az egyébként általánosan tapasztalt tényt, hogy a (4.7) differenciálegyenlet a reguláris véletlen gráfok esetén adja a legjobb közelítést. 100 90 80 70
I(t)
60 simulation mean−field
50 40 30 20 10 0
0
5
10
15
20
t
4.2. ábra. A (4.7) differenciálegyenlet megoldásának összehasonlítása a Monte-Carlo szimulációval N = 100 csúcsú körgráf és SIS típusú dinamika esetén, τ = 5, γ = 1.
4.2.2. Heterogén fokszámeloszlású gráf A szimulációval való összehasonlítás is mutatja, hogy a (4.7) differenciálegyenlet elég pontatlan közelítést adhat, hiszen a hálózat szerkezetét nem lehet vele mo-
dc_483_12 4.2. JÁRVÁNYTERJEDÉS HÁLÓZATON
80
80
70
70
60
60
50
50 simulation mean−field
40
I(t)
I(t)
59
30
30
20
20
10
10
0
0
1
2
3
4
5
simulation mean−field
40
0
0
1
t
2
3
4
5
t
4.3. ábra. (A 4.7) differenciálegyenlet megoldásának összehasonlítása a Monte-Carlo szimulációval N = 100 csúcsú Erdős-Rényi (bal oldalon), illetve reguláris véletlen gráf (jobb oldalon) és SIS típusú dinamika esetén, n = 10, τ = 0.5, γ = 1. dellezni. A legelső pontosabb modell a hálózat fokszámeloszlását veszi figyelembe [101, 119]. Legyen a k fokú csúcsok száma Nk , és a maximális fokszám M . Ekkor nyilván N1 + N2 + . . . + NM = N . A modell megadásához szükséges kompartmentek: S1 , S2 , . . . , SM , valamint I1 , I2 . . . , IM , az 1, 2, . . . , M fokszámú S, illetve I típusú csúcsok. A k fokú I típusú csúcsok számára az alábbi differenciálegyenletet írták fel a [119] dolgozatban. I˙k (t) = τ kΘ(t)(Nk − Ik (t)) − γIk (t),
(4.10)
ahol N 1 X Θ(t) = jIj (t), hkiN j=1
N 1 X hki = jNj (t). N j=1
A differenciálegyenlet jobboldalán szereplő két tag az Sk → Ik , illetve az Ik → Sk típusú átmeneteknek felel meg. Az első tag azt fejezi ki, hogy egy Sk osztályban levő csúcs τ kΘ(t) valószínűséggel megfertőződhet, ennek heurisztikus magyarázata ugyanaz, mint ami a (4.7) differenciálegyenlet bevezetésénél szerepelt, ugyanis Θ(t) a t időpontban az I típusú csúcsokból kiinduló élek arányát adja meg. A fenti modell azt tételezi fel, hogy a gráfban a csúcsokat a fokszámuktól függetlenül kötjük össze. A modell a hálózat finomabb szerkezetét is figyelembe tudja venni, ha bevezetjük a p(j|k) mennyiséget, amely azt adja meg, hogy a k fokú csúcsok hányad része kötődik j fokú csúcshoz. Ekkor az egyenlet a következő alakot ölti [88]. I˙k (t) = τ kΘk (t)(Nk − Ik (t)) − γIk (t), (4.11) ahol Θk (t) =
N X j=1
p(j|k)Ij (t)
Ij (t) . Nj
dc_483_12 60
4. FEJEZET. HÁLÓZATI FOLYAMATOK
Megjegyezzük, hogy ha a csúcsokat a fokszámuktól függetlenül kötjük össze, akkor jN p(j|k) = hkiNj , így visszakapjuk a (4.10) differenciálegyenletet. A fenti modell segítségével a [186] dolgozatban azt is vizsgáltuk, hogy ha a gráfban csak kétféle fokszámú csúcs van, akkor ezek egymáshoz való kapcsolódásának mértékétől, melyet aszortativitásnak neveznek, hogyan függenek a járvány terjedésének fontosabb jellemzői.
4.2.3. Effektív fokszám modell A numerikus szimulációkkal való összehasonlításból kiderült, hogy ha a fokszámeloszlás meglehetősen heterogén, azaz nagyon széles skálán változik a csúcsok fokszáma, mint például Barabási-Albert véletlen gráf esetén, akkor a (4.11) differenciálegyenletrendszer nem ad elég pontos közelítést. Ennek magyarázatára Ball és Neal [11] kidolgozták az effektív fokszám (effective degree) fogalmát. Ennek segítségével az SIR esetben felírtak egy sokkal jobb közelítést adó, viszont sokkal több egyenletből álló differenciálegyenlet-rendszert. Az SIS típusú járványterjedésre Lindquist és munkatársai írták fel a megfelelő egyenletrendszert [101], amelyet az alábbiakban ismertetünk. Az eddigi modellekben a k fokú csúcsokat mindössze két kompartmentre bontottuk, Sk jelölte a k fokú csúcsok közül az S típusúak kompartmentjét, Ik , pedig az I típusúakét. Az effektív fokszám modellben a k fokú csúcsokat kétszer k + 1 kompartmentre bontjuk: Sk,0 , Sk−1,1 , . . . , S0,k , valamint Ik,0 , Ik−1,1 , . . . , I0,k , ahol Ss,i jelöli azon S típusú csúcsokat, melyeknek s darab S szomszédjuk és i darab I szomszédjuk M P 2(k + 1) = M (M + 3) van. Ha a csúcsok fokszáma 1 és M között van, akkor ezzel k=1
kompartmentet hozunk létre, azaz differenciálegyenlet-rendszerünk ennyi egyenletből fog állni. Megjegyezzük, hogy a kompartmentek nagy száma adhatja az effektív fokszám modell gyenge pontját, ugyanis például Barabási-Albert típusú véletlen gráf esetén könnyen előfordulhatnak magas fokszámú csúcsok, például M = 100 nem irreális, így az egyenletrendszer akár 10000 egyenletből is állhat. Az Ss,i kompartmentből háromféle átmenet lehetséges. Az S csúcs megfertőződésével átkerülhetünk az Is,i osztályba, melynek rátája τ iSs,i , hiszen az S csúcsnak i darab fertőző szomszédja van. A második típusú átmenet akkor következik be, ha az S csúcsnak az egyik I típusú szomszédja meggyógyul, azaz átjutunk az Ss+1,i−1 kompartmentbe. Ennek rátája γiSs,i , hiszen az S csúcsnak i darab fertőző szomszédja van. A harmadik típusú átmenet akkor következik be, ha az S csúcsnak az egyik S típusú szomszédja megfertőződik, azaz átjutunk az Ss−1,i+1 kompartmentbe. Ennek rátáját az alábbi heurisztikus valószínűségi okoskodással kaphatjuk meg. Ez esetben egy SS típusú él egyik végpontja fertőződik meg. Tekintsük először egy tetszőleges SS típusú él egyik végpontját, amely valamely Sj,l kompartmentbe tartozik, ahol j és l értéke 1 és k között van, ahol k a csúcs fokszáma (így j + l = k), és k értéke 1 és M között van. Ezen S típusú végpontnak l darab fertőző szomszédja van, ezért τ l rátával fertőződik meg, és mivel j darab S szomszédja van, azért megfertőződése esetén az SS élek száma j-vel csökken. Így az SS élek csökkenésének összrátáját úgy kapjuk,
dc_483_12 4.2. JÁRVÁNYTERJEDÉS HÁLÓZATON
61
hogy ezt összegezzük az összes Sj,l kompartmentre, amellyel az alábbit kapjuk τ
M X X
jlSj,l .
k=1 j+l=k
Most már csak azt kell meghatároznunk, hogy az SS típusú élek hányad része olyan, amely egy Ss,i típusú S csúcshoz vezet. Az ilyen élek száma sSs,i , míg az összes SS élek száma M X X jSj,l . k=1 j+l=k
A kettő arányát kell megszoroznunk az SS élek csökkenésének összrátájával, így kapjuk az Ss,i kompartmentből az Ss−1,i+1 kompartmentbe jutás rátáját: τ GsSs,i ,
PM P k=1
j+l=k
jlSj,l
k=1
j+l=k
jSj,l
ahol G = PM P
.
Tehát az Ss,i kompartmentből háromféleképpen lehet kijutni, és ezek rátáját meghatároztuk. Ebbe a kompartmentbe bejutni is háromféleképpen lehet. Az első a csúcs gyógyulásával, azaz az Is,i kompartmentből, melynek rátája nyilván γIs,i . A második bejutási lehetőség egy szomszéd gyógyulásával az Ss−1,i+1 kompartmentből, melynek rátája γ(i + 1)Ss−1,i+1 , mivel az i + 1 darab fertőző szomszéd bármelyike meggyógyulhat. Végül bejuthatunk egy szomszéd megfertőződésével az Ss+1,i−1 kompartmentből, melynek rátája a fentihez hasonló okoskodással G(s + 1)Ss+1,i−1 , ahol G a fenti kifejezés. Mivel az Ss,i kompartmentből háromféleképpen lehet kijutni, és háromféleképpen lehet bejutni is, azért a rá vonatkozó differenciálegyenletben hat tag fog szerepelni. Az Is,i kompartmentbe való be- és kijutást hasonlóképpen lehet megadni, így kapjuk végül az alábbi M (M + 3) egyenletből álló differenciálegyenletrendszert. S˙s,i = −τ iSs,i + γIs,i + γ((i + 1)Ss−1,i+1 − iSs,i ) + τ G((s + 1)Ss+1,i−1 − sSs,i ), ˙ Is,i = τ iSs,i − γIs,i + γ((i + 1)Is−1,i+1 − iIs,i )
(4.12) (4.13)
+ τ H((s + 1)Is+1,i−1 − sIs,i ),
ahol
PM P k=1
j+l=k
H = PM P k=1
l2 Sj,l
j+l=k jIj,l
.
A fenti rendszer közelítésének pontosságát a [101] dolgozatban vizsgálták egy konfigurációs modellel létrehozott véletlen gráfon, melyben a fokszámeloszlást előírták, és a maximális fokszám M = 10 volt. Kiderült, hogy míg a (4.10) rendszer viszonylag gyenge közelítést ad, addig a (4.12)-(4.13) rendszer megoldása meglehetősen jól közelíti a Monte-Carlo szimulációból kapott eredményeket.
dc_483_12 62
4. FEJEZET. HÁLÓZATI FOLYAMATOK
4.2.4. Momentum lezárással felírt modellek A különböző kompartment modellek vizsgálatának egyik tanulsága az, hogy a kompartmentek számát növelve egyre pontosabb közelítését kapjuk a Monte-Carlo szimulációból kapott eredményeknek, ráadásul egyre több véletlen gráf típus esetén jók a modellek, azonban a növekvő méretű differenciálegyenlet-rendszerek kezelése is egyre nehézkesebb. A továbbiakban olyan rendszereket mutatunk, amelyek csak néhány egyenletből állnak, mégis gráfok széles skálájára jó közelítést adnak. Térjünk vissza a kiindulási (4.6) differenciálegyenlethez. Az 5.4.1. szakaszban megmutatjuk, hogy az I típusú csúcsok számának várható értékére tetszőleges gráf esetén fennáll az ˙ = τ [SI] − γ[I] [I] differenciálegyenlet, ahol [SI] az SI típusú élek számának várható értékét jelenti. Mivel ez szintén ismeretlen, azért a fenti egyenlet önmagában nem alkalmas az [I] meghatározására. Az eddigi kompartment modellek azt célozták meg, hogy az SI típusú élek számának várható értékét valamilyen módon összefüggésbe hozzuk I értékével. Most azonban egy egészen más megközelítést mutatunk, nevezetesen azt, amikor az [SI] függvényre is felírunk differenciálegyenletet. Az 5.4.2. szakaszban megmutatjuk, hogy tetszőleges gráf esetén fennáll az ˙ = τ [SI] − γ[I], [I] ˙ [SI] = γ([II] − [SI]) + τ ([SSI] − [ISI] − [SI]), ˙ [II] = −2γ[II] + 2τ ([ISI] + [SI]),
˙ [SS] = 2γ[SI] − 2τ [SSI]
(4.14) (4.15) (4.16) (4.17)
differenciálegyenlet-rendszer, ahol [SSI], illetve [ISI] az ilyen típusú hármasok várható értékét jelöli. Ez az egyenletrendszer továbbra sem zárt, azonban heurisztikus valószínűségi okoskodással a fenti hármasok várható értékére levezethető közelítő képlet, amely csak a párok várható értékét használja. Az ilyen képleteket nevezik momentum lezárási formuláknak (moment closure). A legegyszerűbb típus, amely reguláris véletlen gráf esetén igen jó eredményt ad, a következő okoskodáson alapszik [80, 105, 124, 144]. Legyen ismét n egy csúcs átlagos fokszáma, és tételezzük fel, hogy a gráf homogén fokszámeloszlású, azaz minden csúcs foka az n-hez közel van. Az [SSI] várható érték kiszámításához tekintsünk egy S csúcsot és határozzuk meg, hogy az n szomszédja közül átlagosan hány I és hány S típusú van. Az S csúcsok száma átlagosan [S], így ezekből összesen n[S] él indul ki. Az SI típusú élek átlagos száma [SI], így egy véletlenszerűen választott S csúcsból kiinduló él [SI]/n[S] valószínűséggel vezet egy I csúcshoz. Így egy S csúcsból kiinduló n él közül átlagosan n[SI]/n[S] = [SI]/[S] darab SI típusú. Hasonló érveléssel, a maradék n − 1 él [SS]/n[S] arányú része vezet egy másik S csúcshoz. Tehát az olyan SSI hármasok száma, melyek középső S csúcsa egy adott rögzített S csúcs az [SI] [SS] (n − 1) [S] n[S] képlettel adható meg. Mivel minden S csúcsra ennyi SSI hármas illeszkedik, azért az SSI hármasok várható értékét a fenti képletet [S]-sel megszorozva kapjuk, azaz
dc_483_12 4.2. JÁRVÁNYTERJEDÉS HÁLÓZATON
63
az alábbi formulával közelíthetjük: [SSI] ≃
n − 1 [SS][SI] . n [S]
Hasonló módon az ISI hármasok várható értékére az alábbi képletet kapjuk [ISI] ≃
n − 1 [SI]2 , n [S]
felhasználva, hogy [IS] = [SI]. Ezeket a közelítő képleteket a (4.14)-(4.17) differenciálegyenlet-rendszerbe helyettesítve kapjuk a legegyszerűbb momentum lezárással felírt modellt. A fenti levezetés meglehetősen heurisztikusnak tűnhet, ezért célszerű a differenciálegyenletekből kapott [I](t) várható értéket a Monte-Carlo szimulációból kapott értékkel összehasonlítani. Tekintsünk egy konfigurációs modellel előállított reguláris véletlen gráfot, melyben minden csúcs foka n = 10. Egy N = 100 csúcsú gráfon 1000 szimuláció átlagát mutatja a 4.4. ábra. Láthatjuk, hogy a differenciálegyenletekből kapott [I](t) várható érték igen jó közelítést ad. 80 70 60
I(t)
50 simulation pair approximation
40 30 20 10 0
0
1
2
3
4
5
t
4.4. ábra. (A 4.14)-(4.17) differenciálegyenlet-rendszer megoldásának összehasonlítása a Monte-Carlo szimulációval N = 100 csúcsú reguláris véletlen gráf esetén, n = 10, τ = 0.5, γ = 1. Ezt az ábrát érdemes összehasonlítani a 4.3. ábrával, amelyen ugyanezen szimuláció eredményét a (4.7) differenciálegyenlet megoldásával közelítettük. A két ábra összehasonlítása mutatja, hogy a hármasok szintjén történő lezárás sokkal jobb közelítést ad, mint a párok szintjén történő lezárás. Természetes módon vetődik fel a magasabb szinten történő lezárás gondolata. A [73] dolgozatban felírták a négyesek szintjén történő lezárást, és összehasonlították a Monte-Carlo szimulációval. Természetesen az így kapott differenciálegyenlet-rendszer jobb közelítést adott, azonban a javulás már nem volt olyan jelentős, mint a párokról hármasokra való áttérés. Bár a fenti lezárás igen jó közelítést ad reguláris véletlen gráf esetén, ha ettől eltérő, de még mindig homogén fokszámeloszlású gráfot veszünk, akkor a közelítés
dc_483_12 64
4. FEJEZET. HÁLÓZATI FOLYAMATOK
meglehetősen pontatlan lehet [190]. Ez például akkor látható, ha a gráfban jelentős klaszterezettség van [31]. Ennek mérésére szolgál a klaszterezettségi együttható φ, amely azt adja meg, hogy a gráfban található összes hármasok hányad része háromszög. A fenti heurisztikus érvelést módosítva Keeling a következő lezárást vezette be egy általános ABC hármas várható értékének közelítésére [80] n − 1 [AB][BC] N [AC] [ABC] ≃ (1 − φ) + φ . n [B] n [A][C] Ez φ = 0 esetén visszaadja a fenti lezárásokat. A fenti képletet szintén a (4.14)(4.17) differenciálegyenlet-rendszerbe helyettesítve kapunk egy jobb közelítő modellt. Ennek pontosságát ismét a Monte-Carlo szimulációval való összehasonlítás mutatja. Ilyen összehasonlításokat különböző klaszterezettség esetén többek között a [190] dolgozatban vizsgáltunk.
4.2.5. Háztartás típusú modellek A járványterjedés gyakran bizonyos csoportokon belül sokkal erősebb, míg a különböző csoportok között kevésbé meghatározó. Humán betegségek esetén ilyen csoportra természetes példa egy munkahelyi közösség vagy egy család. Ezen jelenséget széleskörben vizsgálták és vizsgálják az úgynevezett háztartás típusú hálózatok (networks with household structure) segítségével [9, 10, 12, 64, 72, 74, 127]. Álljon a hálózat m háztartásból, melyekben a legegyszerűbb esetben azonos számú, n, egyén van, azaz összesen N = mn elemű a hálózat. Az egy háztartáson belüli (within) fertőzés rátáját jelölje λW , két különböző háztartásban levő egyed közötti (between) fertőzés rátáját pedig λB . A folyamat leírásához kétféleképpen lehet választani a kompartmenteket. Az első leírásban vezessük be az yi (t) függvényeket, amelyek az i-edik háztartásban a fertőzött egyedek arányát adják meg a t időpontban. Ezekre SIS típusú fertőzés esetén az alábbi differenciálegyenlet-rendszer írható fel [10] y˙ i = λW yi (1 − yi ) +
X λB (1 − yi ) yj − γyi , m−1
i = 1, 2, . . . m.
(4.18)
j6=i
Ebben az első tag a háztartáson belüli fertőzést, a második a háztartások közötti fertőzést, a harmadik pedig a gyógyulást fejezi ki. A folyamat másik modelljében jelölje xk (t) azon háztartások arányát, amelyekben k fertőzött egyén van a t időpontban. Ezekre az alábbi rendszer írható fel n
x˙ k = − +
X λW λB lxl − γkxk , k(n − k)xk − (n − k)xk n n
(4.19)
l=1
n
X λB λW lxl (k − 1)(n − k + 1)xk−1 + (n − k + 1)xk−1 n n l=1
+ γ(k + 1)xk+1 ,
k = 0, 1, 2, . . . n.
(A k = 0 és k = n értékekre az egyenlet a nem megfelelő indexű tagok elhagyásával értelemszerűen módosul.) A differenciálegyenlet-rendszer megoldásainak viselkedését
dc_483_12 4.3. A NUMERIKUS SZIMULÁCIÓ
65
a [10] dolgozatban vizsgálták részletesen n = 2 esetén. Ekkor az egyenletben szereplő három paraméter, λW , λB , γ ismeretében megadható az endemikus egyensúly (vannak fertőzöttek is a populációban, tehát x0 6= 1) létezésének pontos feltétele. Tetszőleges n esetén a [64] dolgozatban található hasonló, de nem szükséges és elégséges feltétel.
4.3. A numerikus szimuláció SIS típusú betegségterjedés esetén a rendszer állapotere a {0, 1}N halmaz. Jelölje a rendszer t időpontbeli állapotát x(t) ∈ {0, 1}N , ennek k-adik koordinátája xk (t), melynek értéke 0, ha a k-adik csúcs S típusú, illetve 1, ha I típusú. Jelölje a gráf szomszédsági mátrixát A. Ekkor az Ax(t) vektor azt adja meg, hogy az egyes csúcsoknak hány I szomszédjuk van. Mivel csak az S csúcsok esetében van szükségünk az I típusú szomszédok számára, azért ezt a vektort koordinátánként megszorozzuk az e − x(t) vektorral, ahol e a csupa egyesből álló vektor. A koordinátánként való szorzásra vezessük be a ∗ jelölést: x ∗ y = (x1 y1 , x2 y2 , . . . , xN yN ). Így az Ax(t) ∗ (e − x(t)) vektor S csúcsokhoz tartozó koordinátái azt adják meg, hogy az S csúcsoknak hány I típusú szomszédjuk van, azon koordinátái pedig nullák, amelyek az x(t) vektorban I csúcsoknak felelnek meg. Mind a fertőzést és a gyógyulást független Poisson-folyamatnak tekintjük. Ez azt jelenti, hogy egy rövid ∆t idő alatt 1 − exp(−mτ ∆t) annak a valószínűsége, hogy egy S csúcs, melynek m darab I szomszédja van, megfertőződik. Itt a τ számot nevezzük fertőzési rátának. Hasonlóan, egy rövid ∆t idő alatt 1 − exp(−γ∆t) annak a valószínűsége, hogy egy I csúcs meggyógyul. A γ számot gyógyulási rátának nevezzük. Megjegyezzük, hogy a gyógyulás a szomszédok állapotától, és így a gráftól is független. A Monte-Carlo szimuláció során tehát generálunk egy r ∈ [0, 1]N véletlen számokból álló vektort. Tekintsük a gráf egy csúcsát, jelölje ennek sorszámát j, és nézzük először azt az esetet, amikor ez a csúcs a t időpontban S típusú, azaz xj (t) = 0. A t + ∆t időpontban ez a csúcs I típusú lesz, azaz megfertőződik, ha rj < 1 − exp (−(Ax(t) ∗ (e − x(t)))j τ ∆t) . Nézzük most azt az esetet, amikor ez a csúcs a t időpontban I típusú, azaz xj (t) = 1. A t + ∆t időpontban ez a csúcs S típusú lesz, azaz meggyógyul, ha rj < 1 − exp(−γ∆t). A ∆t számot kellően kicsire kell választani ahhoz, hogy a Monte-Carlo szimulációk sokszori megismétlése jól közelítse a Poisson-folyamatot. Ennek numerikus részletei nem képezik a dolgozat tárgyát, annyit azonban érdemes megemlíteni, hogy a ∆t megfelelő választását ellenőrizhetjük azzal is, hogy a szimuláció során ∆t idő alatt csak egy csúcsnál történjen változás. Amennyiben a ∆t elegendően kicsi, akkor használhatjuk az 1 − exp(−x) = x lineáris közelítést. Ennek segítségével könnyen
dc_483_12 66
4. FEJEZET. HÁLÓZATI FOLYAMATOK
felírható, hogy mi annak feltétele, hogy a j-edik csúcsban változás történjen, nevezetesen rj < (Ax(t) ∗ (e − x(t))τ + x(t)γ)j ∆t. Legyen v ∈ {0, 1}N olyan vektor, amelynek azon j koordinátáinál van 1, ahol a fenti feltétel fennáll, a többi koordinátája 0. Képlettel megadva v=
1 (sign[Ax(t) ∗ (e − x(t))τ ∆t + x(t)γ∆t − r] + e) , 2
ahol a sign függvényt egy vektorra koordinátánként alkalmazzuk. A v vektor tehát azt adja meg, hogy a [t, t + ∆t] időintervallumban mely csúcsoknál történik változás. A változást megadó vektor pedig e−2x(t), ugyanis ebben a vektorban az S csúcsoknál +1, az I csúcsoknál pedig −1 szerepel. Így ∆t idő elteltével az állapotvektor x(t + ∆t) = x(t) + v ∗ (e − 2x(t))
(4.20)
lesz. A Monte-Carlo szimuláció algoritmusa tehát a következő. Megadunk egy kezdeti x(0) állapotot, illetve egy M lépésszámot, és a fenti képlettel meghatározzuk a ∆t, 2∆t, . . . M ∆t időpontokban az állapotvektort. A szimulációt kellően sokszor megismételve, és az eredmények átlagát véve a folyamat jó közelítését kapjuk. Ha véletlen gráfon zajló folyamatot modellezünk, akkor az algoritmus valamivel bonyolultabb. Ekkor ugyanis sem a gráf szomszédsági mátrixa, A, sem a kezdeti állapotvektor x(0) nem rögzített. A szomszédsági mátrix helyett mátrixok egy A halmaza adott, ez adja meg, hogy milyen típusú véletlen gráfról van szó. A szimuláció ekkor a következőképpen zajlik. Véletlenszerűen választunk egy A ∈ A mátrixot (általában egyenletes eloszlás szerint, vagy generálunk egy gráfot az A halmazból), majd generálunk egy véletlen kezdeti állapotot, szintén valamilyen előírt halmazból (legtöbbször azt írjuk elő, hogy hány egyes legyen benne). Ezután a (4.20) képlet alapján kiszámítjuk az állapotvektort a ∆t, 2∆t, . . . M ∆t időpontokban. Ezt megismételjük kellően sokszor, de minden esetben új A ∈ A mátrixot és x(0) kezdeti állapotot generálunk. A numerikus szimulációval kapott eredményeket különböző gráfok esetében a 4.2. és 4.3. ábrákon láthatjuk.
dc_483_12
5. fejezet
SIS dinamika általános gráfon Tekintsünk ismét egy N csúcsú, irányítatlan, hurokélmentes gráfot, szomszédsági 2 mátrixát jelölje G ∈ {0, 1}N , azaz gij = 1, amennyiben az i és j csúcs össze vannak kötve, egyébként pedig gij = 0. A hálózaton SIS típusú járványterjedést fogunk vizsgálni, azaz a gráf csúcsai kétféle állapotban, fertőző (I), illetve egészséges (S), lehetnek. A gráf egy csúcsának állapota kétféleképpen változhat: egy I típusú csúcs adott valószínűséggel meggyógyul, azaz S típusú lesz, illetve egy S típusú csúcsot az I típusú szomszédai valamilyen valószínűséggel megfertőznek és maga is I típusú lesz. A gráf összes lehetséges állapotainak 2N elemű halmaza alkotja az állapotteret, melyen a fenti átmenetek egy Markov-láncot határoznak meg. A fertőzési rátát szokásos módon τ , a gyógyulási rátát pedig γ fogja jelölni. A következő alfejezetben ezen Markov-lánc alapegyenletét fogjuk felírni tetszőleges gráf esetén. A gráf tetszőleges voltát azért hangsúlyozzuk, mert az irodalomban, Sharkey más megközelítést alkalmazó dolgozatait kivéve [132, 133], csak speciális gráfok esetén írták fel az alapegyenletet, tetszőleges gráfra az alapegyenletet a [188] dolgozatban adtuk meg.
5.1. Alapegyenletek Egy adott időpontban minden csúcs egészséges (S) vagy fertőző (I), ezért a rendszer állapota egy N hosszúságú vektorral adható meg, melynek minden eleme S vagy I. Így a Markov-lánc állapottere az S = {S, I}N vagy S = {0, 1}N , 2N elemet tartalmazó halmaz. A rendszer dinamikáját az átmenet mátrix határozza meg, amely azt adja meg, hogy az egyes állapotokból milyen valószínűséggel jut a rendszer egységnyi idő alatt egy másik állapotba. A folyamatot folytonos idejűnek tekintve az átmenet mátrix segítségével felírható az alapegyenlet, amely egy lineáris differenciálegyenletrendszer az egyes állapotok valószínűségeire. Ennek felírásához először célszerű a 2N elemet tartalmazó állapotteret a következő N + 1 részhalmazra felbontani. Legyen S 0 az az állapot, amelyben minden csúcs S típusú, azaz S 0 = (S, S, . . . , S). Jelölje S k azon állapotok halmazát, amelyekben k darab I típusú csúcs van. Az S k részhalmazban tehát Nk állapot van. Végül jelölje S N a csupa I csúcsból álló állapotot, azaz S N = (I, I, . . . , I). Az S k részhalmaz elemeit jelölje S1k , S2k , . . . , Sckk , ahol ck = Nk . Az Sjk állapotban az l-edik csúcs típusát jelölje Sjk (l), tehát Sjk (l) = S, vagy Sjk (l) = I. Amint fent említettük, a rendszer állapota kétféleképpen változhat. 67
dc_483_12 68
5. FEJEZET. SIS DINAMIKA ÁLTALÁNOS GRÁFON • Fertőzés: Egy S csúcs I típusú lesz, ami Sjk → Sik+1 típusú átmenet, ahol j és i olyanok, hogy ∃ l, amelyre Sjk (l) = S, Sik+1 (l) = I, és Sjk (m) = Sik+1 (m) ∀ m 6= l. Továbbá ∃ r 6= l, amelyre Sjk (r) = I és glr = 1 (azaz van (S, I) típusú él az l és r csúcs között). • Gyógyulás: Egy I csúcs S típusú lesz, ami Sjk → Sik−1 típusú átmenet, ahol j és i olyanok, hogy ∃ l, amelyre Sjk (l) = I, Sik−1 (l) = S, és Sjk (m) = Sik−1 (m) ∀ m 6= l. Ez azt jelenti, hogy az Sjk és Sik−1 állapotok csak egy csúcsnál, nevezetesen az l-edik csúcsnál különböznek.
A folyamatot egy folytonos idejű Markov-lánccal fogjuk leírni. Jelölje Xjk (t) annak valószínűségét, hogy a t időpontban a rendszer az Sjk állapotban van. Legyen X k (t) = (X1k (t), X2k (t), . . . , Xckk (t)) a k beteget tartalmazó állapotok valószínűségeit tartalmazó ck -dimenziós vektor, k = 0, 1, . . . , N . A fenti átmenetek az Xjk (t) függvényekre egy lineáris, állandó együtthatós differenciálegyenlet-rendszert határoznak meg, ezt fogjuk alapegyenletnek, vagy master egyenletnek nevezni. Mivel az átmenetek során a fertőző csúcsok száma legfeljebb eggyel változhat, azért az alapegyenlet az alábbi blokk-tridiagonális alakba írható. X˙ k = Ak X k−1 + B k X k + C k X k+1 ,
k = 0, 1, . . . , N,
(5.1)
ahol A0 és C N zérus mátrixok. A fenti egyenlet mátrix alakja X˙ = P X, ahol
P =
B0 C 0 0 A1 B 1 C 1 0 A2 B 2 0 0 A3 .. .. . . ··· 0 0 ···
0 0 C2 B3
0 0 0 C3
··· ···
··· AN
0 0 0 0 .. . BN
.
Megjegyezzük, hogy az irodalomban gyakran a P mátrix transzponáltját használják, ez esetben X nem oszlop, hanem sorvektor, mi azonban a differenciálegyenletrendszerek hagyományainak megfelelően a változók oszlopvektoros jelölését fogjuk használni. Az Ak mátrixok írják le a fertőzés, a C k mátrixok pedig a gyógyulás folyamatát. A hálózat szerkezete az Ak mátrixokban tükröződik. Ezen mátrixok elemeit az alábbi módon lehet meghatározni. Jelölje Aki,j az Ak mátrix i-edik sorának j-edik elemét. Ez a szám adja meg az Sjk−1 állapotból az Sik állapotba történő átmenet rátáját. Az S k−1 osztálynak ck−1 , az S k osztálynak pedig ck eleme van, ezért az Ak mátrixnak ck sora és ck−1 oszlopa van. Az Aki,j elem pontosan akkor nem nulla, ha az Sjk−1 és Sik állapotok csak egy csúcsban térnek el egymástól, legyen ez az l-edik csúcs, és
dc_483_12 5.1. ALAPEGYENLETEK
69
fennáll Sjk−1 (l) = S, Sik (l) = I, valamint Sjk−1 (m) = Sik (m) minden m 6= l esetén. Továbbá léteznie kell olyan r 6= l számnak, amelyre Sjk−1 (r) = I és glr = 1 (azaz az l-edik és r-edik csúcsot egy (S, I) él köti össze). Ebben az esetben Aki,j = τ · #{r ∈ {1, 2, . . . , N } : Sjk−1 (r) = I, glr = 1}.
(5.2)
Az Ak mátrix felépítésének szemléltetéséhez tekintsünk egy Sjk−1 állapotot, és válasszunk egy olyan l indexet, melyre Sjk−1 (l) = S, azaz az l csúcs S típusú. Ezután gyűjtsük össze azon i ∈ {1, 2, . . . , ck } indexeket, melyekre az Sjk−1 és Sik állapotok csak az l csúcsnál különböznek, azaz Sik (l) = I és Sjk−1 (m) = Sik (m) minden m 6= l esetén. Jelölje q azon csúcsok számát, melyek az Sjk−1 állapotban I típusúak, és össze vannak kötve az l csúccsal, ami S típusú. Ekkor Aki,j = τ q. Megismételve ezt az eljárást minden olyan l ∈ {1, 2, . . . , N } számra, melyre Sjk−1 (l) = S, észrevehetjük, hogy az Sjk−1 állapotban az (S, I) élek számát τ -val megszorozva, az Ak mátrix j-edik oszlopának összegét kapjuk. Tehát minden j ∈ {1, 2, . . . , ck−1 } esetén fennáll ck X
Aki,j = τ NSI (Sjk−1 ),
(5.3)
i=1
ahol NSI (Sjk−1 ) jelöli az Sjk−1 állapotban az (S, I) élek számát. k a C k mátrix i-edik sorának j-edik elemét. Ez a szám adja meg az S k+1 Jelölje Ci,j j állapotból az Sik állapotba történő átmenet rátáját. Az S k+1 osztálynak ck+1 , az S k osztálynak pedig ck eleme van, ezért a C k mátrixnak ck sora és ck+1 oszlopa van. A k elem pontosan akkor nem nulla, ha az S k+1 és S k állapotok csak egy csúcsban Ci,j i j térnek el egymástól, legyen ez az l-edik csúcs, és fennáll Sjk+1 (l) = I, Sik (l) = S, k = γ. Az valamint Sjk+1 (m) = Sik (m) minden m 6= l esetén. Ebben az esetben Ci,j Sjk+1 állapotban a gráfnak k + 1 darab I típusú csúcsa van, ezért a C k mátrix j-edik oszlopában összesen k + 1 elem van, amelyek egyenlőek γ-val, a többi elem pedig nulla. Így bármely j ∈ {1, 2, . . . , ck+1 } esetén fennáll ck X
k Ci,j = γ(k + 1).
(5.4)
i=1
A B k mátrixok diagonálisak ck darab sorral és oszloppal. Ugyanis a B k mátrix elemei az Sik → Sjk típusú átmenetek rátáit adják meg, ezek viszont csak abban az esetben nem nullák, ha i = j. A B k mátrix átlójában szereplő elemeket az határozza meg, hogy a P mátrix minden oszlopában az elemek összege nulla. Így az átló elemeire a következőt kapjuk ck+1 k Bi,i
=−
X j=1
ck−1
Ak+1 j,i
−
X
k−1 Cj,i .
(5.5)
j=1
Érdemes az N = 3 csúccsal rendelkező teljes gráf (háromszög gráf) esetén felírni az alapegyenletet. Ekkor az állapottérnek 23 eleme van, amelyeket a fenti módon
dc_483_12 70
5. FEJEZET. SIS DINAMIKA ÁLTALÁNOS GRÁFON
négy osztályba sorolhatunk be az I típusú csúcsok száma szerint. Ebben az esetben tehát X 0 = XSSS , X 1 = (XSSI , XSIS , XISS ), X 2 = (XSII , XISI , XIIS ), X 3 = XIII , és X = (X 0 , X 1 , X 2 , X 3 ). A P mátrix N = 3 esetén az alábbi alakú
B0 C 0 0 0 A1 B 1 C 1 0 P = 0 A2 B 2 C 2 . 0 0 A3 B 3 Az egyes részmátrixokat a fenti szabályok alapján elkészítve az alábbiakat kapjuk. B0 =
0 A1 = 0 , 0
0
C0 =
,
γ γ γ
,
−2τ − γ 0 0 , 0 −2τ − γ 0 B1 = 0 0 −2τ − γ
−2τ − 2γ 0 0 , 0 −2τ − 2γ 0 B2 = 0 0 −2τ − 2γ
τ τ 0 A2 = τ 0 τ , 0 τ τ
A3 =
2τ
2τ
2τ
,
B3 =
γ γ 0 C1 = γ 0 γ , 0 γ γ
−3γ
,
γ C2 = γ . γ
Itt például az A2 mátrix első oszlopának elemei (τ τ 0) az alábbi átmenetek rátáit adják: SSI → SII, SSI → ISI és SSI → IIS. Az első két átmenet esetében azért szerepel τ , mert az SSI állapotban a második, illetve az első, S típusú csúcsnak egy I típusú szomszédja van. A harmadik átmenet nem valósulhat meg, mert a két állapot között több, mint egy helyen van különbség. Az (5.1) lineáris differenciálegyenletrendszer az alábbi alakba írható X˙ 0 = B 0 X 0 + C 0 X 1 , X˙ 1 = A1 X 0 + B 1 X 1 + C 1 X 2 , X˙ 2 = A2 X 1 + B 2 X 2 + C 2 X 3 , X˙ 3 = A3 X 2 + B 3 X 3 .
dc_483_12 5.2. AZ ALAPEGYENLETEK EGYSZERŰSÍTÉSE ÖSSZEVONÁSSAL
71
Az X 1 és X 2 vektorokhoz tartozó egyenleteket koordinátánként kiírva, és szemléletesebb jelölésekre áttérve az alapegyenlet a következő alakot ölti. X˙ SSS = γ(XSSI + XSIS + XISS ), X˙ SSI = γ(XSII + XISI ) − (2τ + γ)XSSI , X˙ SIS = γ(XSII + XIIS ) − (2τ + γ)XSIS ,
X˙ ISS = γ(XISI + XIIS ) − (2τ + γ)XISS , X˙ SII = γXIII + τ (XSSI + XSIS ) − 2(τ + γ)XSII , X˙ ISI = γXIII + τ (XSSI + XISS ) − 2(τ + γ)XISI , X˙ IIS = γXIII + τ (XSIS + XISS ) − 2(τ + γ)XIIS , X˙ III = −3γXIII + 2τ (XSII + XISI + XIIS ),
Az átmenet mátrix tehát a következő
0 γ γ γ 0 0 0 0 0 −2τ − γ 0 0 γ γ 0 0 0 0 −2τ − γ 0 γ 0 γ 0 0 0 0 −2τ − γ 0 γ γ 0 . P = 0 τ τ 0 −2τ − 2γ 0 0 γ 0 τ 0 τ 0 −2τ − 2γ 0 γ 0 0 τ τ 0 0 −2τ − 2γ γ 0 0 0 0 2τ 2τ 2τ −3γ (5.6) A három csúcsú teljes gráfhoz hasonlóan tetszőleges gráf esetén elkészíthető az SIS típusú dinamikát leíró Markov-lánc alapegyenlete. Készítettünk egy MATLAB programot, amely a gráf szomszédsági mátrixából kiindulva előállítja a P átmenet mátrixot. Fontos megjegyezni, hogy ez csak kisebb gráfok esetén használható, hiszen például egy N = 20 csúcsú gráf esetén a P mátrix már 220 méretű. Mivel a feladat könnyen kezelhetetlen méretűvé válhat, azért a továbbiakban azt mutatjuk meg, hogy bizonyos gráfok esetén az exponenciális méretű feladat polinomiális méretűvé tehető.
5.2. Az alapegyenletek egyszerűsítése összevonással Megfelelő tulajdonságú, nagyméretű lineáris közönséges differenciálegyenlet-rendszerekből úgynevezett összevonással (lumping) előállítható olyan kisebb méretű lineáris rendszer, amelynek megoldása az eredeti nagyméretű rendszer megoldásairól is szolgáltat információt. A továbbiakban megmutatjuk, hogy ez alkalmazható az alapegyenletre, amennyiben a gráf automorfizmus csoportja kellően nagy. Látni fogjuk, hogy ilyen gráfoknál az egyenletek száma 2N -ről akár O(N )-re, vagy O(N k )-ra csökkenthető. Ezeket az eredményeinket a [188] dolgozatunk tartalmazza. A módszer lényegét célszerű először egy kisméretű gráfon megmutatni.
dc_483_12 72
5. FEJEZET. SIS DINAMIKA ÁLTALÁNOS GRÁFON
5.2.1. Összevonás három csúcsú teljes gráf esetén Három csúccsal rendelkező teljes gráf esetén a P mátrixot az (5.6) egyenlet adja, melynek segítségével felírhatók az alapegyenletek az X 0 , X 1 , X 2 , X 3 függvényekre. Az összevonás lényege az alábbi új függvények bevezetése: x0 = X 0 ,
x1 = X11 + X21 + X31 ,
x2 = X12 + X22 + X32 ,
x3 = X 3 .
Adjuk össze az X11 , X21 , X31 változókra vonatkozó differenciálegyenleteket, illetve az X12 , X22 , X32 változókra vonatkozó differenciálegyenleteket. Ekkor az imént bevezetett x0 , x1 , x2 , x3 függvényekre az alábbi 4-változós lineáris differenciálegyenlet-rendszert kapjuk x˙ 0 = γx1 , x˙ 1 = 2γx2 − (2τ + γ)x1 ,
x˙ 2 = 3γx3 + 2τ x1 − 2(τ + γ)x2 ,
x˙ 3 = 2τ x2 − 3γx3 .
Az összevonással kapott rendszer x˙ = Qx alakba írható, ahol 0 γ 0 0 0 −2τ − γ 2γ 0 . Q= 0 2τ −2(τ + γ) 3γ 0 0 2τ −3γ
A Q mátrix elemeit az Ak , B k és C k mátrixok oszlopösszegeiből kapjuk. Ha például az x1 → x2 átmenetet tekintjük, akkor az x2 -re vonatkozó differenciálegyenletben a 2τ x1 tagot az τ τ 0 A2 = τ 0 τ 0 τ τ
mátrix oszlopösszegeiből kapjuk. Esetünkben, és mint később látni fogjuk, az általános esetben is, az összevonás feltétele az, hogy az A2 mátrix minden oszlopának összege ugyanannyi legyen. Az összevonás során az eredeti 8 változós rendszerből egy 4 változós rendszert kaptunk, ami nyilván információvesztéssel jár, azonban az alkalmazás szempontjából fontos mennyiség, nevezetesen az egészséges és fertőző csúcsok számának várható értéke [S](t) és [I](t) a 4-változós rendszerből is meghatározható, hiszen [I](t) = x1 (t) + 2x2 (t) + 3x3 (t),
[S](t) = 3x0 (t) + 2x1 (t) + x2 (t).
A továbbiakban ezt az egyszerű gondolatmenetet általánosítjuk tetszőleges gráfra. Mielőtt azonban ezt megtennénk, ismertetjük az összevonás módszerét általános lineáris differenciálegyenlet esetén.
dc_483_12 5.2. AZ ALAPEGYENLETEK EGYSZERŰSÍTÉSE ÖSSZEVONÁSSAL
73
5.2.2. Lineáris differenciálegyenletek összevonása Legyen A egy tetszőleges n × n méretű mátrix, és tekintsük az X˙ = AX lineáris differenciálegyenlet-rendszert. 5.1. Definíció. Az X˙ = AX lineáris rendszert összevonhatónak nevezzük, ha megadható az {1, 2, . . . , n} halmaz olyan {L1 , L2 , . . . , Lm } partíciója, amely rendelkezik az alábbi tulajdonságokkal. Az {1, 2, . . . , m} halmaz bármely j és l eleméhez van olyan Bjl szám, melyre X Air , ∀ r ∈ Ll , Bjl = i∈Lj
azaz a fenti összeg nem függ r választásától, amennyiben r ∈ Ll . Az m × m-es B mátrixot nevezzük az A mátrix összevonásának, és az Y˙ = BY lineáris differenciálegyenletet az eredeti X˙ = AX rendszer összevonásának. A rendszer összevonhatóságát jellemzi az alábbi Állítás. 5.1. Állítás. Ha a B mátrix az A összevonásával keletkezett, akkor megadható olyan m × n méretű T mátrix, melyre T A = BT . Bizonyítás: Definiáljuk a T mátrixot a következőképpen. Ha i ∈ Lj , akkor legyen Tji = 1, a T többi eleme pedig legyen nulla. Ekkor a T A mátrix j-edik sorának r-edik eleme n X X Air = Bjl , Tji Air = (T A)jr = i=1
i∈Lj
ahol l olyan index, amelyre r ∈ Ll . A BT mátrix j-edik sorának r-edik eleme (BT )jr =
m X
Bjk Tkr = Bjl ,
k=1
ahol l olyan index, amelyre r ∈ Ll , feltéve, hogy T minden oszlopában pontosan egy helyen szerepel 1, a többi elem 0. Ez utóbbi tény egyszerűen következik abból, hogy {L1 , L2 , . . . , Lm } egy partíció. A mátrix összevonhatósága a következő módon vonja maga után a differenciálegyenlet-rendszer összevonhatóságát. 5.2. Állítás. Legyen B az n×n méretű A mátrix összevonásával keletkezett m×m-es mátrix, és legyen T az a mátrix, amelyre fennáll T A = BT . A T mátrix segítségével vezessük be az eredeti X vektor m dimenziós összevonását a következőképpen: Y = T X. Ekkor a t 7→ Y (t) függvény teljesíti az Y˙ = BY lineáris differenciálegyenletet. Bizonyítás: Az Y függvényt deriválva, és felhasználva, hogy X teljesíti az X˙ = AX lineáris rendszert Y˙ = T X˙ = T AX = BT X = BY.
dc_483_12 74
5. FEJEZET. SIS DINAMIKA ÁLTALÁNOS GRÁFON
A lineáris rendszer összevonásához tehát a fázistér egy 5.1. Definíciónak megfelelő partícióját kell megadni. A partíció ismeretében egyszerűen előállítható a T mátrix, majd annak segítségével az összevont rendszer B mátrixa. Azonban a megfelelő partíció meghatározása általánosságban igen nehéz feladat. A következő szakaszban visszatérünk az SIS típusú dinamikával tetszőleges gráfra felírt alapegyenlet P mátrixának összevonhatóságához. Ekkor tehát egy tetszőleges A mátrix összevonása helyett a speciális szerkezetű P mátrix összevonásáról lesz szó. Megmutatjuk, hogy a megfelelő partíció hogyan állítható elő a gráf automorfizmuscsoportjának ismeretében.
5.2.3. Az SIS dinamikához tartozó alapegyenlet összevonása a gráf automorfizmusainak segítségével Tekintsük ismét az (5.1) lineáris rendszert, amelyben a P mátrix blokk-tridiagonális struktúrájú. Erre a rendszerre fogjuk most alkalmazni az összevonás előző szakaszban ismertetett általános módszerét, kihasználva a mátrix blokk-tridiagonális struktúráját. Induljunk ki a fázistér speciális felépítéséből. Az előző szakaszban a fázistér általánosan az {1, 2, . . . , n} halmaz volt. Az SIS dinamika és N csúcsú gráf esetén a fázistér 2N elemű, azonban az {1, 2, . . . , 2N } halmaz helyett tekintsük az 5.1 szakasz elején bevezetett S halmazt fázistérnek. Ugyanis ezt a halmazt az I csúcsok száma szerint elő lehet állítani S = ∪S k alakban, amely felbontást célszerű az összevonás során is megőrizni, azért, hogy az összevonás után is meg lehessen határozni az I típusú csúcsok számának várható értékét. Ugyanis egy tetszőleges összevonás során előfordulhat, hogy olyan mértékű az információvesztés, ami az összevonást haszontalanná teszi. Például a triviális összevonás esetén, amikor a T mátrix egy csupa egyesből álló sorvektor, az összevonással kapott B mátrix 1 × 1 méretű nulla mátrix, ugyanis a P mátrix minden oszlopa zéró összegű. Így az összevont rendszerből csak azt lehet megtudni, hogy minden időpontban az állapotok valószínűségeinek összege egy, azonban például az I típusú csúcsok számának várható értéke nem határozható meg belőle. Mivel számunkra ennek meghatározása az egyik cél, azért a továbbiakban csak olyan összevonásokat tekintünk megengedettnek, amelyek megőrzik az I típusú csúcsok számát. Ez azt jelenti, hogy a partíciót csak úgy lehet megválasztani, hogy egy osztályba csak olyan állapotok kerülhetnek, amelyekben az I csúcsok száma azonos. Ezt fejezi ki a következő definíció. 5.2. Definíció. Az (5.1) lineáris rendszer (illetve a megfelelő Markov-lánc) összevonható, ha az S fázistérnek van olyan {L1 , L2 , . . . , Lm } partíciója, amely rendelkezik az alábbi két tulajdonsággal. 1. Bármely l számhoz létezik olyan k, amelyre Ll ⊂ S k . 2. Bármely j, l ∈ {1, 2, . . . , m} számokhoz van olyan Qjl , amelyre X Pir , ∀ r ∈ Ll , Qjl = i∈Lj
azaz a fenti összeg nem függ r választásától, amennyiben r ∈ Ll . Az m × m méretű Q mátrixot nevezzük a P összevonásának.
(5.7)
dc_483_12 5.2. AZ ALAPEGYENLETEK EGYSZERŰSÍTÉSE ÖSSZEVONÁSSAL
75
Megjegyezzük, hogy a Definíció első részében az eredeti rendszer fázisterének az S halmazt tekintjük, a második részben viszont a fázisteret az {1, 2, . . . , 2N } halmazzal azonosítjuk. Ezen kettősség elkerülése érdekében célszerű a partíció osztályaira az alábbi jelölést használni. Azokat az osztályokat, amelyek az S k részhalmazai jelölje Lk1 , Lk2 , . . . , Lklk . Ekkor fenn kell állnia annak, hogy S k = Lk1 ∪ Lk2 ∪ . . . ∪ Lklk , és a partícióban az összes osztályok száma m = l0 + l1 + . . . + lN . Érdemes megemlíteni, hogy mindig fennáll l0 = lN = 1, mivel S 0 és S N részhalmazok egy eleműek. Az osztályok ezen új jelölésével a Definíció első része automatikusan teljesül, a második rész pedig az Ak és C k mátrixok segítségével az alábbi módon fejezhető ki. 5.1. Lemma. Az (5.1) lineáris rendszer összevonható, ha minden k ∈ {0, 1, 2, . . . , N } esetén megadható az S k halmaz olyan Lk1 , Lk2 , . . . , Lklk partíciója, amely rendelkezik a következő tulajdonságokkal. k Bármely p ∈ {1, 2, . . . , lk−1 } és r ∈ {1, 2, . . . , lk } esetén létezik olyan Arp szám, amelyre X k Akij , ∀ S jk−1 ∈ Lpk−1 , (5.8) Arp = Sik ∈Lkr
azaz a fenti összeg független j-től, amennyiben Sjk−1 ∈ Lpk−1 .
k
Bármely p ∈ {1, 2, . . . , lk+1 } és r ∈ {1, 2, . . . , lk } esetén létezik olyan C rp szám, amelyre X k k Cij , ∀ S k+1 ∈ Lk+1 (5.9) C rp = p , j Sik ∈Lkr
azaz a fenti összeg független j-től, amennyiben Sjk+1 ∈ Lk+1 p . Bizonyítás: Amint fent említettük, csak azt kell igazolni, hogy az 5.2. Definíció második feltétele teljesül. Tekintsünk két tetszőleges osztályt, legyenek ezek Lj és Ll . Az osztályok új jelölése szerint létezik olyan k ∈ {0, 1, 2, . . . , N } és r ∈ {1, 2, . . . , lk }, hogy Lj = Lkr , valamint létezik olyan h ∈ {0, 1, 2, . . . , N } és p ∈ {1, 2, . . . , lh }, hogy Ll = Lhp . Az (5.1) egyenletben szereplő P mátrix blokk-tridiagonális szerkezete miatt a következő négy esetet érdemes külön-külön kezelni: h = k − 1, h = k, h = k + 1 vagy h értéke ettől eltérő. Ugyanis, tekintve a lehetséges átmeneteket, amelyekkel a rendszer egy S k halmazhoz tartozó állapotba juthat, nyilvánvaló, hogy az S k−1 halmazhoz tartozó állapotokból kerülhet ide fertőzéssel, az S k+1 halmazhoz tartozó állapotokból pedig gyógyulással. A többi S l halmazból, azaz l ∈ {0, 1, 2, . . . , N } \ {k − 1, k + 1} esetén nem juthat ide. A továbbiakban mind a négy esetre külön megmutatjuk, hogy fennáll az összevonás definíciójában szereplő (5.7) egyenlet. A h = k − 1 esetben a P mátrix azon része, amely az (5.7) egyenletben szereplő indexekhez tartozik az Ak mátrix része, ezért az (5.7) egyenlet ekvivalens az (5.8) egyenlettel. A h = k + 1 esetben a P mátrix azon része, amely az (5.7) egyenletben szereplő indexekhez tartozik a C k mátrix része, ezért az (5.7) egyenlet ekvivalens az (5.9) egyenlettel. A h = k esetben a P mátrix azon része, amely az (5.7) egyenletben szereplő indexekhez tartozik a B k mátrix része, ezért az (5.7) egyenlet ekvivalens a következővel. Bármely p ∈ {1, 2, . . . , lk }
dc_483_12 76
5. FEJEZET. SIS DINAMIKA ÁLTALÁNOS GRÁFON k
és r ∈ {1, 2, . . . , lk } számhoz van olyan B rp , amelyre k
B rp =
X
Sik ∈Lkr
k Bij , ∀ Sjk ∈ Lkp .
(5.10)
Az utóbbi egyenletet az (5.8) és (5.9) egyenletekből kapjuk, az (5.16) felhasználásával, azaz figyelembe véve, hogy a P mátrix oszlopainak összege zérus. Végül, ha h 6= k − 1, h 6= k és h 6= k + 1, akkor a P mátrix azon része, amely az (5.7) egyenletben szereplő indexekhez tartozik, csak nullákat tartalmaz, így (5.7) nyilvánvalóan fennáll. Fő eredményünk bizonyítása előtt emlékeztetünk a gráf automorfizmus és a gráf automorfizmuscsoportjának definíciójára. 5.3. Definíció. Legyen G = G(V, E) egy gráf, melynek csúcshalmazát V (G), élhalmazát E(G) jelöli. Egy Φ : V (G) → V (G) bijekciót a gráf automorfizmusának nevezünk, ha xy ∈ E(G) pontosan akkor áll fenn, ha Φ(x)Φ(y) ∈ E(G). A gráf összes automorfizmusainak halmazát a kompozícióval, mint művelettel ellátva, a gráf automorfizmuscsoportjának nevezzük, és Aut(G)-vel jelöljük ([150]). Esetünkben a gráf csúcsai színezettek, azaz S vagy I típusúak lehetnek. A gráf automorfizmusnak a színezést is meg kell őriznie, azaz bármely x, y ∈ V (G) esetén az x és Φ(x) csúcsnak, illetve az y és Φ(y) csúcsnak ugyanolyan típusúnak kell lennie. Azt mondjuk, hogy a Φ automorfizmus az Sik állapotot az Sjk állapotba viszi, ha Sik (l) = Sjk (Φ(l)) minden l ∈ {1, 2, . . . , N } esetén. Most meg tudjuk fogalmazni fő eredményünket, amely a gráf automorfizmuscsoportját összeköti a Markov-lánc összevonhatóságával. 5.1. Tétel. Vezessük be az S állapottérben az alábbi ekvivalenciarelációt. Az Sik és Sjk állapotok ekvivalensek, ha a gráfnak van olyan automorfizmusa, amely az egyiket a másikba viszi. Ezen ekvivalenciareláció osztályai az (5.1) rendszer összevonását adják. Bizonyítás: Használjuk az osztályok jelölésére az 5.1. Lemmában bevezetett jelöléseket. Megmutatjuk, hogy fennáll az (5.8) egyenlet. Az (5.9) egyenlet bizonyítása teljesen hasonló, ezért annak részleteit mellőzzük. Legyenek k ∈ {0, 1, 2, . . . , N }, p ∈ {1, 2, . . . , lk−1 } és r ∈ {1, 2, . . . , lk } tetszőleges számok. Legyen Sik1 ∈ Lkr , Sjk−1 ∈ Lpk−1 , valamint legyen z = Aki1 j1 6= 0. Ez azt jelenti, hogy az Sik1 és Sjk−1 1 1 állapotok csak egy csúcsban különböznek egymástól, jelölje ezt a csúcsot u, és legyen Sik1 (u) = I, Sjk−1 (u) = S. Továbbá (5.2) szerint, az Sjk−1 állapotban azon I típusú 1 1 csúcsok száma, amelyek össze vannak kötve az u csúccsal, egyenlő z/τ -val (lásd az A mátrix definícióját). Tekintsük most az Lpk−1 osztály egy másik elemét, azaz legyen Sjk−1 ∈ Lpk−1 . Ekkor van a gráfnak olyan automorfizmusa, amely az Sjk−1 állapo2 1 k−1 k tot az Sj2 állapotba viszi. Ezt az automorfizmust az Si1 állapotra alkalmazva az állapotok ugyanolyan Sik2 ∈ Lkr állapotot kapjuk. Ez azt jelenti, hogy az Sik2 és Sjk−1 2 k−1 k viszonyban vannak egymással, mint az Si1 és Sj1 állapotok. Ezért fennáll Aki2 j2 = z.
dc_483_12 5.3. ÖSSZEVONÁS KÜLÖNBÖZŐ TÍPUSÚ GRÁFOKON
77
Tehát, ha az Ak mátrix j1 -edik oszlopában van egy nem nulla elem z, egy olyan sorban, amelynek sorszáma az Lkr osztályba tartozik, akkor ez a z elem megjelenik a j2 -edik oszlopban is, egy olyan sorban, melynek sorszáma az előzőtől eltérő lehet, de szintén az Lkr osztályba tartozik. Ez éppen az (5.8) egyenlet fennállását igazolja. A Tétel szerint tehát a gráf automorfizmusainak segítségével meghatározhatjuk azokat az állapotokat, amelyek összevonhatók egymással. Például kiindulva egy Sjk állapotból és alkalmazva rá a gráf automorfizmusait, olyan állapotokhoz jutunk, amelyek egymással összevonhatók. Azaz a {Φ(Sjk ) : Φ ∈ Aut(G)} halmaz egy osztály lesz az {L1 , L2 , . . . , Lm } partícióban.
5.3. Összevonás különböző típusú gráfokon Ebben a szakaszban néhány gráftípus esetén mutatjuk meg a fenti általános Tétel alkalmazhatóságát, szemléltetve ezzel azt, hogy a gráf szerkezetének ismeretében hogyan csökkenthető az alapegyenlet-rendszer mérete.
5.3.1. Összevonás teljes gráf esetén Ebben a szakaszban megmutatjuk, hogy teljes gráf esetén a 2N -dimenziós (5.1) egyenletrendszer összevonható N +1-dimenziós rendszerré. Az irodalomban az összevonással kapott rendszert szokták kiindulásként használni, ugyanis valószínűségi érveléssel egyszerűen bevezethető, a 2N -dimenziós általános alapegyenletből a [188] dolgozatban vezettük le először. Megjegyezzük, hogy 3 csúcsú teljes gráf esetén az 5.2.1. szakaszban már levezettük az összevonással kapott egyenleteket, ezt a levezetést általánosítjuk most tetszőleges méretű teljes gráfra. A teljes gráf automorfizmuscsoportja az SN permutációcsoport, ezért az S l halmazhoz tartozó bármely két állapot között megadható automorfizmus. Ez azt jelenti, hogy két olyan állapot, melyekben azonos számú I csúcs van, azonos osztályban vannak. Így összesen N + 1 osztály keletkezik az összevonás után, az I csúcsok száma szerint, ezek tehát: Ll = S l , l ∈ {0, 1, . . . , N }. Tehát m = N +1 az egyenletek száma az összevonás után, és az összevonás mátrixa, T , a következő alakú S0 0 0 0 0 0 S1 0 0 0 0 0 T = 0 0 S2 0 0 ··· ··· 0 0 0 0 0 SN ahol Sk = (1, 1, . . . , 1) egy ck hosszúságú vektor. Tehát az új ismeretlen függvények, (melyek számértékűek) xk =
ck X
Xjk = Sk X k ,
k = 1, . . . , N.
j=1
A következő Lemma adja meg, hogy az összevonás után ezen függvényekre milyen differenciálegyenlet-rendszert kapunk.
dc_483_12 78
5. FEJEZET. SIS DINAMIKA ÁLTALÁNOS GRÁFON
5.2. Lemma. Ha G teljes gráf, akkor az xk függvények a következő differenciálegyenleteket teljesítik. x˙ 0 = γx1 , x˙ k = (k + 1)γxk+1 + (k − 1)(N − k + 1)τ xk−1 − (k(N − k)τ + kγ)xk ,
x˙ N
= (N − 1)τ xN −1 − N γxN ,
ahol k = 1, 2, . . . , N − 1. Bizonyítás: Az X k függvényekre vonatkozó (5.1) egyenletrendszer ck egyenletből áll. Összeadva ezeket az egyenleteket az x˙ k = Sk Ak X k−1 + Sk B k X k + Sk C k X k+1 egyenlethez jutunk. Ezután a Lemma az (5.4) egyenletből és az alábbi 5.3. Állításból következik. 5.3. Állítás.
1. Sk Ak = (k − 1)(N − k + 1)τ Sk−1 .
2. Sk B k = −(k(N − k)τ + kγ)Sk . Bizonyítás: 1. Mivel a gráf teljes, azért bármely j ∈ {1, 2, . . . , ck } esetén az SI típusú élek száma NSI (Sjk ) = k(N − k), mivel minden I típusú csúcs össze van kötve az összes S típusú csúccsal. Így (5.3) szerint bármely j ∈ {1, 2, . . . , ck−1 } esetén fennáll az alábbi k
(Sk A )j =
ck X i=1
Aki,j = τ NSI (Sjk−1 ) = (k − 1)(N − k + 1)τ.
Ebből következik, hogy Sk Ak = (k − 1)(N − k + 1)τ Sk−1 , mivel a bal és a jobb oldal j-edik koordinátája megegyezik. 2. Ez az állítás az előzőből valamint az (5.4) és (5.5) egyenletből következik.
5.3.2. Összevonás csillag gráf esetén Tekintsünk egy N csúcsú csillag gráfot, amelyben egy központi csúcs össze van kötve a többi csúccsal, azok között pedig nincs él. Számozzuk meg úgy a gráf csúcsait, hogy a központi csúcs legyen az N -edik. Tehát például SS . . . SI az az állapot, amelyben a központi csúcs I típusú, a külső csúcsok pedig S típusúak. Megmutatjuk, hogy ezen gráf esetén a 2N -dimenziós (5.1) egyenletrendszer összevonható egy 2N -dimenziós rendszerré. A csillag gráf automorfizmuscsoportja az SN−1 permutációcsoport, mivel a gráf egy automorfizmusa a központi csúcsot helybenhagyja, a többi N − 1 csúcsot pedig tetszőlegesen permutálhatja. Ezért két állapot akkor vihető egymásba automorfizmussal, ha a központi csúcs mindkettőben azonos típusú, és a külső csúcsok között ugyanannyi I (és egyben S) típusú van. Ezért l = 1, 2, . . . , N − 1 esetén az S l állapothalmaz, amely azokat az állapotokat tartalmazza, amelyeknél a gráfban l darab I
dc_483_12 5.3. ÖSSZEVONÁS KÜLÖNBÖZŐ TÍPUSÚ GRÁFOKON
79
típusú csúcs van, a következő két osztályba vonható össze. Az első osztályhoz tartozó állapotokban a központi csúcs I típusú, és a külső csúcsok között l −1 darab I típusú van. A második osztályban a központi csúcs S típusú, és a külső csúcsok között l darab I típusú van. Az l = 0 és l = N esetben nyilván egy osztály van. Ez azt jelenti, hogy az összevonás után 2(N − 1) + 2 = 2N osztály keletkezik, nevezetesen : L1 = S 0 , L2N = S N , L2k = {Sjk : Sjk (N ) = I}, L2k+1 = {Sjk : Sjk (N ) = S}, k ∈ {1, 2, . . . , N − 1} esetén. Az összevonás utáni változókat a következőképpen vezetjük be X X x0 = X 0 , xN = X N , xk1 = Xjk , xk2 = Xjk , Sjk (N )=I
Sjk (N )=S
ahol k = 1, . . . , N − 1. Az 5.2. Lemmához hasonlóan igazolható a következő. 5.3. Lemma. Ha G csillag gráf, akkor az xki függvények teljesítik az alábbi összevont differenciálegyenleteket. x˙ 0 = γ(x11 + x12 ), x˙ k1 = (N − k + 1)τ x1k−1 + (k − 1)τ x2k−1 − (kγ + (N − k)τ )xk1 + kγxk+1 1 , x˙ k2 = −k(γ + τ )xk2 + γ(xk+1 + (k + 1)xk+1 1 2 ),
x˙ N
−1 −1 = τ xN + (N − 1)τ xN − N γxN , 1 2
N N ahol k = 1, 2, . . . , N − 1, és az x01 = 0, x02 = x0 , xN 1 = x , x2 = 0 jelöléseket használtuk.
5.3.3. Összevonás háztartás típusú gráf esetén A járványterjedéssel kapcsolatos irodalomban gyakran használnak olyan gráfokat, amelyeknél kisméretű teljes gráfok (ezek a háztartások) vannak összekötve egymással valamilyen szabály szerint [12, 72, 74, 127]. Tekintsük most azt az esetet, amikor minden háztartásban egy olyan csúcs van, amelynek van összeköttetése más háztartásokkal, ezt nevezzük a háztartás külső csúcsának, a többi csúcsokat, amelyek tehát csak a háztartás többi csúcsával vannak összekötve, belső csúcsoknak hívjuk. Az összevonás szempontjából legegyszerűbb esetet fogjuk vizsgálni, amelyben minden külső csúcs össze van kötve egymással, és a háztartások mindössze két eleműek, tehát egy külső és egy belső csúcsból állnak, amint az 5.1. ábra mutatja. A külső csúcsok tehát egy N/2 csúcsú (N páros szám) teljes gráfot alkotnak, és mindegyik egy belső csúcshoz kapcsolódik ezen kívül, tehát fokszámuk N/2. A belső csúcsok csak a nekik megfelelő külső csúcshoz kapcsolódnak, így fokszámuk 1. MegmutatN juk, hogy ezen gráf esetén a 2 -dimenziós (5.1) egyenletrendszer összevonható egy N/2+3 -dimenziós rendszerré. Hasonlóan igazolható, hogy ha n darab k csúcsból 3 álló háztartás van (ekkor N = nk), akkor az összevonással kapott rendszer n+2k−1 2k−1 egyenletből áll. Az így kapott gráf automorfizmuscsoportja SN/2 , mivel egy automorfizmus a külső csúcsokat tetszőlegesen permutálhatja, és amennyiben az automorfizmus hatása a külső csúcsokon adott, akkor ez már meghatározza, hogy a belső csúcsokat hova viheti. Az összevonást megadó partíció meghatározásához vegyük észre, hogy
dc_483_12 80
5. FEJEZET. SIS DINAMIKA ÁLTALÁNOS GRÁFON
5.1. ábra. A legegyszerűbb háztartás típusú gráf, amelyben minden háztartás két csúcsból áll. a kételemű háztartások négyféle állapotban lehetnek, nevezetesen: SI háztartás, amelyben a külső csúcs S, a belső pedig I típusú, valamint hasonló jelöléssel IS, SS, II háztartások. Ezért két állapot akkor vihető egymásba automorfizmussal, ha bennük az SI, IS, SS és II háztartások száma egyforma. Tehát a partíció egy osztályát azok az állapotok képezik, amelyekben adott számú SI, IS, SS és II háztartás van. A különböző osztályokat pedig az határozza meg, hogy hányféleképpen lehet a négyféle háztartásból N/2 darabot ismétléssel kiválasztani. Ezért a partíció osztályainak száma, vagyis az összevonással kapott lineáris rendszer mérete 4+N/2−1 N/2+3 = . Az 5.2. Lemmához hasonlóan most is felírható az összevo3 N/2 nással kapott lineáris differenciálegyenlet-rendszer, azonban mivel ennek mérete N 3 nagyságrendű, azért az általános felírástól eltekintünk.
5.3.4. Összevonás körgráf esetén Tekintsünk egy N csúcsú körgráfot, amelyben minden csúcs a két szomszédjával van összekötve. A körgráf automorfizmuscsoportja a DN diédercsoport, melyben N forgatás és N tükrözés van. Mivel ez a csoport mindössze 2N elemű, azért a partíció minden osztályában legfeljebb 2N elem lehet, így az összevonás során legalább 2N /(2N ) osztályt kapunk, tehát összevonással a feladatot nem lehet polinomiális méretűre redukálni. Viszonylag kis csúcsszám esetén azonban az összevonás jelentős egyszerűsítést jelenthet. Tekintsük példaként az N = 5 esetet. Ekkor |D5 | = 10 , az automorfizmuscsoportot öt tükrözés és öt forgatás alkotja. A partíció osztályai az Li (i = 1, 2, . . . , m) halmazok, ahol m értékét még nem ismerjük. Az osztályokat az 5.2. Definíció szerint úgy kell meghatározni, hogy minden i = 1, 2, . . . , m számhoz létezzen olyan k ∈ {0, 1, . . . , N }, melyre Li ∈ S k . Ennek alapján az első osztály nyilván egy elemű L1 = {(SSSSS)}. A következő osztály L2 = S 1 = {(SSSSI), (SSSIS), (SSISS), (SISSS), (ISSSS)}, ugyanis nyilvánvaló, hogy a forgatásokat az (SSSSI) elemre alkalmazva az S 1 halmaz összes elemét megkapjuk, azaz ez a részhalmaz adja az (SSSSI) elem pályáját. Az S 2 halmaz
dc_483_12 5.4. VÁRHATÓ ÉRTÉKEKRE VONATKOZÓ EGYENLETEK
81
elemei azonban már nem vonhatók össze egyetlen osztályba. Ugyanis ennek elemei S2
=
{(SSSII), (SSISI), (SISSI), (ISSSI), (SSIIS), (SISIS), (ISSIS), (SIISS), (ISISS), (IISSS)}
nyilvánvalóan kétfélék. Az (SSSII) ∈ S 2 elem pályája alkotja az L3 osztályt: {Φ((SSSII)) : Φ ∈ Aut(C5 )} =
{(SSSII), (ISSSI), (SSIIS), (SIISSS), (IISSS)} = L3 .
Ezeket az elemeket már az öt forgatás segítségével megkapjuk, a tükrözések nem adnak a pályához újabb elemet. Ez mutatja, hogy a körgráf esetén mi korlátozza az összevonás hatékonyságát. Az S 2 halmaz további öt eleme alkotja a következő osztályt: L4 = {(SSISI), (SISSI), (SISIS), (ISSIS), (ISISS)}. Hasonló módon további négy osztályt kapunk, így végül a 25 = 32 egyenletből álló alapegyenlet 8 egyenletre redukálható az összevonás segítségével. Az N = 6 és N = 7 csúcsú körgráf esetén a 64, illetve 128 egyenletből az összevonás után 13, illetve 18 egyenletet kapunk. Az összevont rendszer méretét úgy kaphatjuk meg, hogy az egyes állapotokra alkalmazzuk az összes automorfizmust, és megállapítjuk a kapott osztályok elemszámát. Ha a gráf csúcsszáma prímszám, N = p, akkor igazolható, hogy az osztályok száma (2p−1 − 1)/p + 2(p−1)/2 + 1. Ha a gráf csúcsainak száma nem prím, akkor az összevonással kapott rendszer egyenleteinek száma nem ismert.
5.4. Várható értékekre vonatkozó egyenletek Ebben a szakaszban a 2N egyenletből álló (5.1) rendszer egyszerűsítésének egy másik módját az ún. mean-field típusú, azaz átlagolt egyenletek levezetését tárgyaljuk. Ezek létjogosultságát többek között az is indokolja, hogy a 2N egyenletből álló teljes rendszer megoldása, az összes lehetséges állapot valószínűségének időbeli változását adná meg, amelyre valójában nincs szükség. Az elsődlegesen érdekes mennyiség az I, illetve S típusú csúcsok számának várható értéke [I](t) =
ck N X X k Xjk (t), k=0
[S](t) =
j=1
N X k=0
(N − k)
ck X
Xjk (t),
(5.11)
j=1
ahol rövidség kedvéért ismét a ck = Nk jelölést használtuk. A mean-field típusú, azaz átlagolt egyenletek első fajtája ezen várható értékekre vonatkozó differenciálegyenlet. Ebben az egyenletben, mint látni fogjuk, megjelenik az SI típusú élek számának várható értéke ck N X X [SI] = NSI (Sjk )Xjk (t), (5.12) k=0 j=1
NSI (Sjk−1 )
Sjk−1
ahol jelöli az állapotban az (S, I) élek számát. Az átlagolással kapott egyenletek másik fajtája az I és S csúcsok számának várható értékén kívül bizonyos típusú élek számának várható értékére vonatkozó differenciálegyenleteket is
dc_483_12 82
5. FEJEZET. SIS DINAMIKA ÁLTALÁNOS GRÁFON
tartalmaz. Az első típusba tartozókat a csúcsok szintjén felírt differenciálegyenleteknek nevezzük, a másodikhoz tartozókat pedig párok, vagy élek szintjén felírt egyenleteknek. Az irodalomban mindkét típusú mean-field egyenlet ismert [75, 82, 124], azonban ezeket valószínűségszámítási megfontolásokból vezették le, és általánosan elfogadott volt, hogy csak bizonyos gráf típusok esetén érvényesek, nevezetesen olyanok esetében, amelyekre az adott valószínűségszámítási érvelés érvényes. A [188, 190] dolgozatokban megmutattuk, hogy mind a csúcsokra, mind az élekre felírt átlagolt egyenlet tetszőleges gráf esetén érvényes, ugyanis az általános (5.1) alapegyenletből levezethető. A szakasz első részében a csúcsokra vonatkozó, a második részében pedig az élekre vonatkozó átlagolt egyenlet levezetését ismertetjük.
5.4.1. Differenciálegyenlet a csúcsok számának várható értékére Az [I](t), illetve [S](t) várható értékre vonatkozó differenciálegyenlet levezetése azon alapszik, hogy ezek az egyes állapotok, (5.1) rendszerben szereplő Xjk (t) valószínűségeinek lineáris kombinációi. Az (5.11) képletben szereplő függvényeket deriválva majd az (5.1) differenciálegyenletet felhasználva az [I](t), illetve [S](t) függvényekre az alábbi differenciálegyenleteket kapjuk. 5.2. Tétel. Az [I](t) és [S](t) várható értékek teljesítik az alábbi differenciálegyenleteket ˙ = γ[I] − τ [SI], [S] ˙ = τ [SI] − γ[I]. [I]
(5.13) (5.14)
Bizonyítás: Emlékeztetünk arra, hogy Sk = (1 1 . . . 1)P jelöli azt az egyesekből álló k sormátrixot, melynek ck oszlopa van. Ezzel a jelöléssel cj=1 Xjk = Sk X k (itt X k -t oszlopvektornak tekintjük). Ekkor az (5.11) egyenletből [I](t) =
N X
kSk X k ,
[S](t) =
N X k=0
k=0
(N − k)Sk X k .
(5.15)
Ezzel a jelöléssel (5.5) a következő alakot ölti, k Bi,i = −(Sk+1 Ak+1 )i − (Sk−1 C k−1 )i , k = (S B k ) . Így minden i = 1, . . . c esetén és mivel B k diagonális mátrix, azért Bi,i i k k
(Sk B k )i = −(Sk+1 Ak+1 )i − (Sk−1 C k−1 )i . Ezzel a következő egyenletet kapjuk Sk+1 Ak+1 + Sk B k + Sk−1 C k−1 = 0,
(5.16)
amely minden k = 0, 1, . . . , N esetén fennáll. Megjegyezzük, hogy AN +1 és C −1 nulla mátrixok. Deriváljuk az [I](t) függvényt, majd az X k függvények deriváltjának kifejezésére használjuk fel az (5.1) egyenletet. Ekkor a következőt kapjuk. ˙ = [I]
N X k=0
kSk X˙ k =
N X k=0
kSk (Ak X k−1 + B k X k + C k X k+1 ) =
dc_483_12 5.4. VÁRHATÓ ÉRTÉKEKRE VONATKOZÓ EGYENLETEK N X
k
kSk A X
k−1
N X
+
k
kSk B X +
k+1
(k + 1)Sk+1 A
k
X +
N X
k
k
kSk B X +
N X k=0
N X k=1
k=0
k=0
N −1 X
kSk C k X k+1 =
k=0
k=0
k=1
N −1 X
k
83
(k − 1)Sk−1 C k−1 X k =
(k + 1)Sk+1 Ak+1 + kSk B k + (k − 1)Sk−1 C k−1 X k .
Ezután (5.16) alapján az ˙ = [I]
N X k=0
Sk+1 Ak+1 − Sk−1 C k−1 X k
differenciálegyenlethez jutunk. Ezután (5.14) az alábbi Állításból következik. Az [S](t) függvényre vonatkozó differenciálegyenlet hasonlóan vezethető le, így a bizonyítását itt mellőzzük. 5.4. Állítás. 1. Sk−1 C k−1 = γkSk PN k−1 X k = γ[I] 2. k=0 Sk−1 C 3.
PN
k+1 X k k=0 Sk+1 A
= τ [SI]
Bizonyítás: 1. Az (5.4) egyenlet szerint minden j ∈ {1, 2, . . . , ck } esetén ck−1
(Sk−1 C
k−1
)j =
X
k−1 Ci,j = γk,
i=1
amelyből Sk−1 C k−1 = γkSk következik, ugyanis a jobb- és baloldal j-edik koordinátája megegyezik. 2. Ez az állítás azonnal következik az elsőből (5.15) felhasználásával. 3. Az (5.3) egyenlet szerint minden j ∈ {1, 2, . . . , ck } esetén ck+1 k+1
(Sk+1 A
)j =
X
k Ak+1 i,j = τ NSI (Sj ),
i=1
amelyből N X k=0
Sk+1 Ak+1 X k =
ck N X X k=0 j=1
(Sk+1 Ak+1 )j Xjk = τ
ck N X X k=0 j=1
NSI (Sjk )Xjk (t) = τ [SI].
dc_483_12 84
5. FEJEZET. SIS DINAMIKA ÁLTALÁNOS GRÁFON
Hangsúlyozzuk, hogy az (5.13)-(5.14) differenciálegyenlet-rendszer bármely gráf esetén fennáll, azonban mivel nem zárt, azaz tartalmaz egy újabb ismeretlen függvényt [SI]-t, azért önmagában nem alkalmas az [I](t), illetve [S](t) függvények meghatározására. Ennek kiküszöbölésére kétféle megközelítést szoktak alkalmazni. Az egyik megoldást az jelenti, hogy az [SI] értéket valamilyen közelítés segítségével kifejezik az [S] és [I] értékével. Ezt nevezik az egyenlet lezárásának. Mivel az SI párok számára vonatkozik a lezárás, azért ezt pár lezárásnak (pair closure) nevezik. A másik megoldás az, ha az [SI] függvényt deriválva, erre is levezetünk valamilyen differenciálegyenletet. Az első megközelítéssel kapcsolatos kérdéseket részletesen vizsgáljuk a 6. fejezetben. A másodikról pedig a következő szakaszban lesz szó.
5.4.2. Differenciálegyenlet az élek számának várható értékére Az (5.13)-(5.14) egyenletekből látható, hogy az S, illetve I típusú csúcsok számának várható értékét megadó differenciálegyenletben az SI párok számának várható értéke jelenik meg. Ezért célszerű a párok várható értékére is felírni differenciálegyenletet. Ebben az egyenletben a különböző hármasok várható értéke fog megjelenni, amelyet intuitívan a következőképpen magyarázhatunk. Például egy (S, S) pár (S, I) típusú párrá válhat, ha ez egyik S csúcs egy harmadik (fertőző) csúcstól megkapja a fertőzést. Az ilyen fertőzések gyakorisága természetesen az (S, S, I) hármasok számától függ. A párok és hármasok közötti pontos kapcsolatot az alábbi Tételben fogalmazzuk meg. 5.3. Tétel. Az [S], [I], [SI], [II] és [SS] várható értékek teljesítik az alábbi differenciálegyenlet-rendszert. ˙ = γ[I] − τ [SI], [S] ˙ = τ [SI] − γ[I], [I] ˙ [SI] = γ([II] − [SI]) + τ ([SSI] − [ISI] − [SI]),
˙ [II] = −2γ[II] + 2τ ([ISI] + [SI]), ˙ [SS] = 2γ[SI] − 2τ [SSI].
(5.17) (5.18) (5.19) (5.20) (5.21)
A fenti egyenletrendszert először Rand és Keeling vezették be [80, 124] heurisztikus valószínűségi érvelés alapján reguláris véletlen gráfra. A [190] dolgozatban megmutattuk, hogy a fenti rendszer tetszőleges gráf esetén fennáll, és az (5.1) alapegyenletekből levezethető. Az alábbiakban ezt a bizonyítást ismertetjük. Bizonyítás: Az [S] és [I] várható értékekre vonatkozó egyenleteket az előző szakaszban már levezettük, most csak a párok várható értékével foglalkozunk. Tekintsük először az (I, I) párokat. Ezek várható értéke [II] =
N X k=0
NII (S k )X k ,
(5.22)
dc_483_12 5.4. VÁRHATÓ ÉRTÉKEKRE VONATKOZÓ EGYENLETEK
85
ahol NAB (S k ) egy ck hosszúságú sorvektor, melynek j-edik koordinátája az (A, B) párok számát adja az Sjk állapotban. Hasonló módon az (A, B, C) hármasok számát az NABC (S k ) sorvektor tartalmazza. Az (5.22) egyenletet deriválva az alábbit kapjuk. ˙ = [II]
N X
NII (S k )X˙ k =
=
k
ahol az
k−1
+
N X
k
k
k
NII (S )B X +
N −1 X
NII (S k )C k X k+1
k=0
k=0
N X k=0
A0
k
NII (S )A X
k=1
=
NII (S k )(Ak X k−1 + B k X k + C k X k+1 )
k=0
k=0
N X
N X
NII (S k+1 )Ak+1 + NII (S k )B k + NII (S k−1 )C k−1 X k ,
és C N nulla mátrixok. A B k mátrixot tartalmazó tag az k NII (S k )B k = (NII (S1k )B1,1 , ..., NII (Sckk )Bckk ,ck ),
k az N (S k )B k vektor j-edik komalakba írható, ahol (NII (S k )B k )j = NII (Sjk )Bj,j II k ponense. A B mátrixok diagonálisak, és (5.5) szerint kifejezhetők az Ak+1 és C k−1 mátrixokkal, így a j-edik komponens ! ck+1 ck−1 X X k−1 k NII (Sjk )Bj,j = NII (Sjk ) − Ak+1 Ci,j . i,j − i=1
i=1
Az A és C mátrixok (5.3) és (5.4) definícióját felhasználva, a fenti kifejezés a következőképpen írható. NII (Sjk ) −τ NSI (Sjk ) − kγ = −τ (NII (Sjk )NSI (Sjk )) − kγNII (Sjk ). Ez a komponensenként felírt azonosság vektori alakban a következőt adja.
˙ = [II] (5.23) N h i X NII (S k+1 )Ak+1 − τ NII (S k ) ∗ NSI (S k ) − γkNII (S k ) + NII (S k−1 )C k−1 X k , k=0
ahol a ∗ művelet vektorok koordinátánkénti szorzását jelenti, azaz például NII (Sik ) ∗ NSI (Sik ) = (NII (S1k )NSI (S1k ), ..., NII (Sckk )NSI (Sckk )). Az (5.23) egyenletben az első két tag a fertőzést, a második kettő pedig a gyógyulást fejezi ki. Ezek megfelelnek az (5.20) egyenletben szereplő tagoknak. Ugyanis, ha az (5.20) egyenletet átírjuk az ˙ = −2γ [II]
N X k=0
NII (S k )X k + 2τ
N X k=0
NISI (S k )X k + 2τ
N X k=0
NSI (S k )X k ,
dc_483_12 86
5. FEJEZET. SIS DINAMIKA ÁLTALÁNOS GRÁFON
alakba, amelyben az (5.22) jelölést használjuk, akkor az (5.20) egyenlet az alábbi Állításból következik. Ezen Állítást igazolva a Tétel (5.20) egyenletét bizonyítjuk. Az (5.19) és (5.21) egyenletek igazolása hasonlóan történik, ezeket itt nem részletezzük. 5.5. Állítás. Az alábbi azonosságok minden t > 0 esetén fennállnak. −2γ 2τ
=
N X
NII (S k )X k (t) =
k=0 N h X
N h i X −γkNII (S k ) + NII (S k−1 )C k−1 X k (t)
(5.24)
k=0
i NISI (S k ) + NSI (S k ) X k (t)
(5.25)
k=0 N h X k=0
i NII (S k+1 )Ak+1 − τ NII (S k ) ∗ NSI (S k ) X k (t).
Bizonyítás: Az Állítás igazolásához azt fogjuk megmutatni, hogy mindkét egyenlet esetében az X k (t) tag szorzóját képező ck hosszúságú vektorok koordinátái az egyenlet két oldalán megegyeznek. Azaz belátjuk, hogy ezen vektorok j-edik koordinátái azonosak minden j = 1, 2, . . . ck esetén. Tehát a következő két azonosságot fogjuk igazolni. −2γNII (Sjk ) = −γkNII (Sjk ) + (NII (S k−1 )C k−1 )j ,
(5.26)
2τ (NISI (Sjk ) + NSI (Sjk )) = (NII (S k+1 )Ak+1 )j − τ (NII (S k ) ∗ NSI (S k ))j . (5.27) A fenti állítások igazolásához fel fogjuk használni a P mátrixra vonatkozó (5.3) és (5.4) azonosságokat, valamint a következő három állítást. k−1 Akj,i 6= 0 ⇒ Ci,j 6= 0,
(5.28)
ck−1
X
Akj,i
=
τ NII (Sjk ),
(5.29)
NISI (Sjk )
=
ck−1 1 X k+1 k+1 Ai,j (Ai,j − τ ). τ2
(5.30)
i=1
i=1
Az alábbiakban először e három állítást igazoljuk. Az (5.28) állításhoz emlékeztetünk arra, hogy az (5.28) képletben Akj,i adja az Sik−1 állapotból az Sjk állapotba való átmenet rátáját. Mivel Akj,i 6= 0, azért ez az átmenet létrejöhet, így ez a két állapot pontosan egy helyen különbözik egymástól, jelölje ezt l. Ezzel tehát Sjk (l) = I és Sik−1 (l) = S, ami egyben azt is jelenti, hogy az ellenkező folyamat is, azaz az Sjk állapotból az Sik−1 állapotba történő átmenet is megvalósulhat, hiszen ez azt fejezi ki, hogy az l-edik csúcsban levő fertőző egyed meggyógyul. Ennek az ellenkező
dc_483_12 5.4. VÁRHATÓ ÉRTÉKEKRE VONATKOZÓ EGYENLETEK
87
k -val, és mivel beláttuk, hogy ez a folyamat irányú átmenetnek a rátáját jelöltük Ci,j is megvalósulhat, azért ennek rátája nem nulla, amit igazolni akartunk. Az (5.29) állítás igazolásához vegyük észre, hogy (5.29) adja az Sjk állapotba fertőzéssel való bejutás összrátáját. Ez azt jelenti, hogy az Sjk állapotban a k fertőzött közül bármelyiket kiválasztva, található olyan Sik−1 állapot, amely csak egy helyen, jelölje ezt ismét l, tér el az Sjk állapottól, azaz Sjk (l) = I és Sik−1 (l) = S. Az l-edik csúcsban levő S csúcs megfertőződésének rátája qτ , ahol q az adott S csúcs fertőző szomszédainak száma. Amennyiben ez a fertőzés bekövetkezik, akkor az (I, I) típusú élek száma q-val növekszik meg. Ha számba vesszük az összes olyan fertőzést, amely az Sjk állapothoz vezet, akkor ezen átmenet rátáinak összege τ NII (Sjk ), amely éppen a kívánt (5.29) képletet bizonyítja. Az (5.30) állítás bizonyításához tekintsünk egy S típusú csúcsot, legyen ez ismét az l-edik, melynek q darab I szomszédja van. Ekkor ezen csúcshoz tartozó (I, S, I) hármasok száma q(q − 1). Mivel Ak+1 adja az Sjk állapotból az Sik+1 állapotba i,j (fertőzéssel) történő átmenet rátáját, azért Ak+1 i,j /τ = q, amennyiben a fenti átmenet során éppen az előbb említett l-edik csúcs fertőződik meg. Így az (I, S, I) hármasok száma 1 q(q − 1) = 2 Ak+1 (Ak+1 i,j − τ ). τ i,j Ennek segítségével az összes (I, S, I) hármasok számát megadhatjuk, ha a fentit összegezzük a ck−1 lehetséges Sjk → Sik+1 átmenetre, mellyel az (5.30) képletet kapjuk. A fenti gondolatmenethez hasonlóan meghatározhatjuk, hogy egy Sjk állapotból Sik+1 állapotba fertőzéssel történő átmenet során, valamint egy Sik−1 állapotból Sjk állapotba szintén fertőzéssel történő átmenet során hogyan változik az (I, I) párok száma. Ekkor a következő azonosságokat kapjuk
2 NII (Sik+1 ) = NII (Sjk ) + Ak+1 , τ i,j 2 NII (Sik−1 ) = NII (Sjk ) − Akj,i . τ
(5.31) (5.32)
Ezek tehát csak akkor állnak fenn, ha az Sjk → Sik+1 , illetve Sjk → Sik+1 átmenetek megvalósulhatnak. Ehhez fenn kell álljon, hogy ezen állapotok között csak egy csúcsban lehet különbség, azaz, például a második azonosság esetében létezik olyan l, melyre Sjk−1 (l) = S, Sik (l) = I, és Sjk−1 (m) = Sik (m) minden m 6= l esetén. Továbbá léteznie kell olyan r 6= l számnak, melyre Sjk−1 (r) = I és glr = 1 (azaz az l-edik és r-edik csúcs között egy (S, I) él van, amely a fertőzést lehetővé teszi). A fenti azonosságok felhasználásával most térjünk rá (5.26) bizonyítására. Az első rész (5.26) alapján a következő módon alakítható át. (NII (S k−1 )C k−1 )j = γ(k − 2)NII (Sjk )
(5.33)
A baloldal (5.32) segítségével így írható ck−1
X i=1
(NII (Sjk )
ck−1 ck−1 X 2 k 2 X k k−1 k−1 k−1 k − Aj,i )Ci,j = Aj,i Ci,j . NII (Sj )Ci,j − τ τ i=1
i=1
dc_483_12 88
5. FEJEZET. SIS DINAMIKA ÁLTALÁNOS GRÁFON
Az (5.28) egyenletből következik, hogy Ak nem nulla elemei a C k−1 nem zérus elemeit szorozzák. Mivel a C k−1 minden nem nulla eleme γ-val egyenlő, azért Ak minden nem nulla eleme γ-val szorzódik. Az (5.33) egyenlet baloldalának további átalakításához felhasználjuk a következőket. Az Ak mátrix j-edik sorának összege NII (Sjk ), amely Pck−1 k−1 nem függ az összegzési indextől, i-től, valamint (5.4) szerint i=1 Ci,j = kγ, j-től függetlenül. Ezekkel az (5.33) egyenlet baloldala így írható: Ck−1
X i=1
k−1 (NII (Sjk )Ci,j − 2γNII (Sjk )) = kγNII (Sjk ) − 2γNII (Sjk ) = γ(k − 2)NII (Sjk ),
amely az Állítás első részét, (5.26)-t bizonyítja. A második rész igazolásához az (5.27) azonosságot fogjuk bizonyítani. Ehhez induljunk ki NII (Sik+1 ) képletéből az (5.31) egyenletben. Szorozzuk meg az egyenletet Ak+1 i,j -vel, ekkor 2 k+1 2 k+1 k NII (Sik+1 )Ak+1 i,j = NII (Sj )Ai,j + (Ai,j ) . τ
(5.34)
k A fentiek szerint (5.31) csak akkor áll fenn, ha Ak+1 i,j 6= 0. Azonban Ai,j = 0 esetén (5.34) nyilván igaz lesz. Ezért az (5.34) egyenletet minden i-re összegezhetjük, amellyel a következőt kapjuk. ck+1
X
ck+1
NII (Sik+1 )Ak+1 i,j
=
i=1
X
NII (Sjk )Ak+1 i,j
i=1
Ez az alábbival ekvivalens.
i=1
ck+1
(NII (S
k+1
k+1
)A
)j
NII (Sjk )
=
ck+1 2 X k+1 2 + (Ai,j ) . τ
X
Ak+1 i,j
i=1
ck+1 2 X k+1 2 (Ai,j ) + τ i=1 ck+1
= τ NII (Sjk )NSI (Sjk ) +
2 X k+1 2 (Ai,j ) τ i=1
= τ (NII (S k ) ∗ NSI (S k ))j +
ck+1 2 X k+1 2 (Ai,j ) , τ i=1
amely a következőképpen alakítható át, hogy (5.27) baloldalát megkapjuk: (NII (S k+1 )Ak+1 )j − τ (NII (S k ) ∗ NSI (S k ))j =
ck+1 2 X k+1 2 (Ai,j ) . τ
(5.35)
i=1
Végül (5.30) és (5.3) felhasználásával (5.35) az alábbit adja: (NII (S
k+1
k+1
)A
)j
k
k
− τ (NII (S ) ∗ NSI (S ))j = 2τ ck−1
= 2τ
1 X k+1 Ai,j NISI (Sjk ) + τ i=1
Ezzel az állítás második részét igazoltuk.
!
ck−1 1 X k+1 2 (Ai,j ) τ2 i=1
!
= 2τ NISI (Sjk ) + 2τ NSI (Sjk ).
dc_483_12
6. fejezet
Közelítő differenciálegyenletek Az előző fejezetben láttuk, hogy SIS dinamika esetén tetszőleges gráfon történő betegségterjedés leírható a 2N differenciálegyenletből álló alapegyenlet-rendszerrel. Megjegyezzük, hogy más két állapotú dinamika esetén (azaz olyannál, amelynél a csúcsok kétféle állapotban lehetnek) hasonlóan felírható az alapegyenlet. Az egyenletek nagy száma miatt természetesen egyszerűbb modellek bevezetése szükséges. Láttuk, hogy a gráf automorfizmusainak ismeretében a rendszer redukálható, különösen egyszerű struktúrájú gráfok esetében, az összevonás segítségével. Ekkor is azonban még O(N k ) egyenletből álló differenciálegyenlet-rendszert kapunk. Az 5.4.1. szakaszban megmutattuk, hogy a betegek számának várható értékére tetszőleges gráf esetén fennáll az ˙ = τ [SI] − γ[I] [I]
differenciálegyenlet, amely azonban tartalmazza az SI típusú élek számának várható értékét is. Mivel ez szintén ismeretlen, azért a fenti egyenlet önmagában nem alkalmas az [I] meghatározására. Az egyenlet lezárásának nevezik az olyan közelítő képleteket, amelyek az SI típusú élek számának várható értékét valamilyen módon összefüggésbe hozzák I értékével. A 4.2.1. szakaszban ilyenre mutattunk példát homogén fokszámeloszlású gráf esetén. Ekkor a csúcsok fokszámát n-nel jelölve, az SI élek számára az Nn−1 (N − I(t))I(t) közelítést szokás alkalmazni, melyre 4.2.1. szakaszban kombinatorikus érvelésen alapuló heurisztikus magyarázatot adtunk. Ezzel a közelítéssel az I˜ közelítő függvényre az I˜˙ = τ
n ˜ ˜ − γ I˜ I(N − I) N −1
(6.1)
differenciálegyenletet kapjuk. A közelítés jóságát az irodalomban általában a MonteCarlo szimulációval való összehasonlítással szokták vizsgálni. A 4.2.1. szakaszban a 4.1. ábrán mutattuk meg, hogy teljes gráf esetén a fenti közelítés jó egyezést mutat a Monte-Carlo szimulációval. Körgráf esetén az egyezés sokkal rosszabb, amit a 4.2. ábra mutat. Azonban véletlen gráfok esetén sokkal jobb eredményt kapunk, amit a 4.3. ábrán szemléltettünk. Természetes kérdés, hogy a közelítés pontosságára az alapegyenletből, a szimuláció felhasználása nélkül tudunk-e becslést adni. Azaz például igazolható-e, hogy valamilyen határátmenet során a (6.1) egyenlet pontossá válik? A jelen fejezetben erre a kérdésre adunk választ. 89
dc_483_12 90
6. FEJEZET. KÖZELÍTŐ DIFFERENCIÁLEGYENLETEK
Amint fent említettük, a (6.1) közelítés csak homogén fokszámeloszlású gráf esetén lesz alkalmazható. Három példán vizsgáltuk a szimulációval való összehasonlítást, a teljes gráfon, a körgráfon és homogén véletlen gráfon. A körgráf esetén nem kaptunk jó egyezést, a véletlen gráf esetén pedig egyelőre nem ismert az alapegyenlet az irodalomban, így csak a teljes gráf esetén van remény a közelítés pontosságának egzakt becslésére. A teljes gráf esetén az alapegyenletek az alábbi N + 1 egyenletre redukálhatók az összevonás segítségével: p˙k = ak−1 pk−1 − (ak + ck )pk + ck+1 pk+1 ,
k = 0, . . . , N,
(6.2)
ahol pk (t) annak valószínűsége, hogy a t időpontban k fertőzött csúcs van, és ak = τ k(N − k),
ck = γk.
(6.3)
Ha kezdetben m darab fertőző csúcs van a teljes gráfban, akkor a fenti differenciálegyenlet-rendszert a pm (0) = 1,
pk (0) = 0,
k 6= m
(6.4)
kezdeti feltétellel kell megoldani. A fertőző csúcsok számának várható értékének kö˜ zelítésére felírt (6.1) egyenletben teljes gráf esetén n = N − 1, így az x(t) = I(t)/N skálázott új változóra, amely a fertőzött csúcsok arányát adja meg, a differenciálegyenlet x˙ = βx(1 − x) − γx,
(6.5)
ahol β = τ N . Itt feltételezzük, hogy β független N értékétől, és τ = β/N az N értékével változik, ugyanis csak ebben az esetben várható, hogy N → ∞ esetén nemtriviális határátmenetet kapunk. A fertőzött csúcsok arányának várható értéke a (6.2) egyenlet megoldása után az N
[I](t) X k = pk (t) N N
(6.6)
k=0
képletből kapható meg. A közelítés pontosságáról az alábbi Tétel igazolható. 6.1. Tétel. Legyen x a (6.5) egyenlet megoldása az x(0) = m/N kezdeti feltétel mellett, valamint legyen [I](t) a fenti képlet szerinti várható érték, melyben pk a (6.2) megoldása a (6.4) kezdeti feltétellel. Ekkor minden t0 > 0 számhoz van olyan K > 0, melyre fennáll x(t) − [I](t) ≤ K , t ∈ [0, t0 ]. N N Ebben a fejezetben áttekintjük azokat a módszereket, amellyel a fenti Tétel, illetve az ilyen típusú általánosabb állítások igazolhatók.
dc_483_12 6.1. AZ ALAPEGYENLET KÖZELÍTŐ DIFFERENCIÁLEGYENLETEI
91
6.1. Az alapegyenlet közelítő differenciálegyenletei Induljunk ki a (6.2) lineáris rendszerből, melyet úgy tekinthetünk, mint a {0, 1, . . . , N } állapotterű Markov-folyamat alapegyenletét, melyben pk (t) jelöli a k-adik állapot valószínűségét a t időpontban. A folyamatról mindössze annyit teszünk fel, hogy a kadik állapotból csak a k+1-edik, vagy k−1-edik állapotba mehet át. Ilyen folyamatra példa a fent említett SIS típusú fertőzés terjedése teljes gráfon, de homogén véletlen gráfon is alkalmazható közelítésként ez az alapegyenlet. Természetesen számos más folyamat is ilyen típusú alapegyenletre vezet, a [191] dolgozatban egy adaptív hálózatban az aktivált élek számának leírása használtunk ilyen típusú egyenletet. Az egyenletrendszert megoldva az N X k y1 (t) = pk (t) N k=0
várható értéket szeretnénk meghatározni. Célunk egy olyan (6.5) típusú közelítő differenciálegyenlet levezetése, amelyből a fenti várható értékre közelítést kaphatunk a (6.2) alapegyenlet megoldása nélkül, valamint a közelítés pontosságára is becslést tudunk igazolni. Az y1 várható értékre az alábbi egyszerű Lemmát felhasználva kaphatunk differenciálegyenletet. 6.1. Lemma. Legyen rk (k = 0, 1, 2, . . .) egy adott sorozat, és tekintsük az r(t) =
N X
rk pk (t)
k=0
függvényt, melyben a pk függvényeket a (6.2) egyenletrendszer határozza meg. Tegyük fel továbbá, hogy aN = 0 és c0 = 0. Ekkor fennáll r˙ =
N X k=0
(ak (rk+1 − rk ) + ck (rk−1 − rk )) pk .
Bizonyítás: A (6.2) egyenletek alapján r˙ =
=
N X
rk p˙k =
k=0 N −1 X k=0
N X k=1
rk ak−1 pk−1 −
rk+1 ak pk −
N X
N X
rk (ak + ck )pk +
rk ck+1 pk+1
k=0
k=0
rk (ak + ck )pk +
k=0
N −1 X
N X
rk−1 ck pk .
k=1
Felhasználva, hogy aN = 0 és c0 = 0, az alábbi módon a kívánt állítást kapjuk. r˙ =
N X k=0
(rk+1 ak − rk (ak + ck ) + rk−1 ck ) pk =
N X k=0
(ak (rk+1 − rk ) + ck (rk−1 − rk ))pk .
dc_483_12 92
6. FEJEZET. KÖZELÍTŐ DIFFERENCIÁLEGYENLETEK
Az y1 várható érték deriváltjának meghatározásához alkalmazzuk a Lemmát az rk = k/N sorozatra. Ekkor N X ak − ck pk . (6.7) y˙ 1 = N k=0
Ebből az y1 függvényre akkor kaphatunk differenciálegyenletet, ha a jobboldalt is sikerül az y1 segítségével kifejezni. A legegyszerűbb esetben, amikor ak és ck lineárisan függ k-tól, ez közvetlenül megkapható. Legyen ugyanis ak = Ak (k = 0, 1, . . . , N −1) és ck = Ck, ekkor a fenti képletből y˙ 1 = (A − C)y1 , azaz a várható érték ezen egyszerű lineáris differenciálegyenlet megoldásából közvetlenül megkapható a (6.2) alapegyenlet megoldása nélkül. A fent tárgyalt (6.3) esetben az együtthatók nemlinearitása miatt ilyen módon nem kapunk differenciálegyenletet y1 -re. A τ = β/N feltételezéssel az y1 deriváltjára az N N X X k k k k β (1 − ) − γ y˙ 1 = F ( )pk pk = N N N N k=0
k=0
összefüggést kapjuk, ahol F (x) = βx(1 − x) − γx. Ebből formálisan úgy kaphatunk differenciálegyenletet az y1 függvényre, ha feltételezzük, hogy az F függvény alkalmazása és a várható érték képzése egymással felcserélhető. Ekkor ugyanis a jobbaldal F (y1 ) lenne, amely éppen a (6.5) egyenletet adja. A (6.3) általánosításaként tekintsük a sokak által vizsgált, lásd például [20, 55, 93], úgynevezett sűrűségfüggő (density dependent) esetet. Ekkor a (6.2) egyenletekben szereplő ak és ck egy A és C függvény segítségével a következő módon adható meg: ck ak k k , . (6.8) =A =C N N N N Ekkor a (6.7) egyenletből N X k k A y˙ 1 = −C pk . N N k=0
Ha formálisan ismét feltételezzük, hogy az F = A − C függvény alkalmazása és a várható érték képzése egymással felcserélhető akkor a jobbaldal F (y1 ) lesz. Így a sűrűségfüggő esetben az x˙ = A(x) − C(x) (6.9) közelítő differenciálegyenletet kapjuk. A közelítés pontosságát tehát az |x − y1 | eltérés adja. A sűrűségfüggő esetben igazolható, hogy ez az eltérés nullához tart N → ∞ esetén, sőt, amint a 6.1. Tételben, az ott tárgyalt speciális esetre megfogalmaztuk, az eltérés 1/N nagyságrendű. Az eltérés nullához tartását először Kurtz [93] igazolta a hetvenes évek elején valószínűségszámítási és operátor félcsoportokat használó
dc_483_12 6.2. KÖZELÍTÉS ELSŐRENDŰ PARCIÁLIS DIFFERENCIÁLEGYENLETTEL 93 módszerekkel. Ezt később absztrakt keretbe foglalták martingál elmélet felhasználásával [55]. Ezen bizonyítás lényegét a 6.3. szakaszban fogjuk ismertetni. Diekmann és Heesterbeek [47] monográfiájában az alapegyenletből N → ∞ esetén egy elsőrendű parciális differenciálegyenletet származtatnak, amelyből heurisztikusan levezetik a (6.9) közelítő differenciálegyenletet. Ezen levezetés szigorú bizonyítását a [188] dolgozatban közöltük, itt pedig a 6.2. szakaszban fogjuk ismertetni. Ez a bizonyítás a Kurtz féle valószínűségszámítási bizonyításhoz hasonlóan mély tételek alkalmazására épül, mint látni fogjuk. A 6.4. szakaszban "elemi" bizonyítást adunk a tételre. Ez a bizonyítás csak a közönséges differenciálegyenletek elméletének alapvető eszközeit igényli, és a nemcsak pontonkénti, hanem egyenletes konvergenciát ad, hibabecsléssel együtt. A bizonyítás alapvetően új gondolata az összes momentumokra (nemcsak a várható értékre, mint első momentumra) felírt végtelen sok egyenletből álló közönséges differenciálegyenlet-rendszer bevezetése és alkalmazása becslések levezetésére. Az itt ismertetendő bizonyítás a [193] dolgozatban jelent meg. A momentumokra kapott végtelen rendszer vizsgálatának módszerét a (6.3) együtthatóknál általánosabb (6.2) alakú alapegyenlet esetére is kiterjesztettük Kato [79] és Banasiak [13] eredményeire alapozva. Az ezzel kapcsolatos eredményeket, melyeket a [192] dolgozatban publikáltunk, szintén a 6.4. szakaszban ismertetjük. A közelítés pontosságára vonatkozó eredményeinket a [192] dolgozatban egységes keretbe foglaltuk, és új bizonyítást is adtunk a Tételre, amely most csak az operátorfélcsoportok elméletének alapvető állításait használja, és (6.2) alakú alapegyenletek széles skálájára alkalmazható. Az egyik legfontosabb eredmény, hogy a sűrűségfüggési megszorító feltétel enyhíthető, ugyanis az állítást igazoltuk az úgynevezett aszimptotikusan sűrűségfüggő esetre is. Ezen eredményeket a 6.5. szakaszban ismertetjük.
6.2. Közelítés elsőrendű parciális differenciálegyenlettel Ebben a szakaszban visszatérünk ahhoz az esethez, amikor a (6.2) egyenletben az együtthatókat (6.3) alakban adjuk meg. (Ez az SIS típusú fertőzés teljes gráfon történő terjedésének alapegyenlete.) Ebben az esetben a közelítő egyenlet (6.5), és a fertőzött csúcsok számának várható értékét a (6.6) képlet adja. A közelítés pontosságának becslésére egy elsőrendű parciális differenciálegyenletet vezetünk be a következő egyszerű ötlet alapján. Nagy N esetén a pk (t) diszkrét eloszlást közelítsük egy ρ(t, z) sűrűségfüggvénnyel, melyben az új z ∈ [0, 1] változót a z = k/N képlet kapcsolja össze a diszkrét eloszlással. Ezzel a p˙k (t), pk (t), pk−1 (t) és pk+1 (t) formálisan rendre a következőkkel helyettesíthető: ∂t ρ(t, z), ρ(t, z), ρ(t, z − 1/N ) és ρ(t, z + 1/N ). Ezen helyettesítésekkel a (6.2) rendszer k-adik egyenletéből az alábbi egyenletet kapjuk. ∂t ρ(t, z) = (N z + 1)γρ(t, z + 1/N ) + (N z − 1)(N − N z + 1)ρ(t, z − 1/N )β/N − (N z(N − N z)β/N + N zγ)ρ(t, z). Íjuk be ebbe a ρ(t, z + 1/N ) = ρ(t, z) + ∂z ρ(t, z)/N,
ρ(t, z − 1/N ) = ρ(t, z) − ∂z ρ(t, z)/N,
dc_483_12 94
6. FEJEZET. KÖZELÍTŐ DIFFERENCIÁLEGYENLETEK
közelítéseket, majd hagyjuk el az 1/N és 1/N 2 nagyságrendű tagokat. Egyszerű átalakítások után a ρ függvényre az alábbi elsőrendű parciális differenciálegyenletet kapjuk. ∂t ρ = zγ∂z ρ + (2z − 1)βρ − z(1 − z)β∂z ρ + γρ.
Ez a g(z) = γz − βz(1 − z) függvény bevezetésével a ∂t ρ = ∂z (gρ)
(6.10)
egyenlethez vezet. Egy ilyen típusú egyenlet megoldásához meg kell adnunk egy ρ(0, z) = ρ0 (z)
(6.11)
típusú kezdeti feltételt. A változók közötti z = k/N formális kapcsolat miatt (6.4) alapján az alábbi kezdeti feltétel megadása kézenfekvő. m+1 m
N X k k 1 N ρ(t, ) N N N k=0
összeg az
N
Z
1
zρ(t, z)dz
0
R1 integrál közelítő összege. Mivel 0 ρ0 (z)dz = 1/N , azért az alábbi i∗ függvény tekinthető az [I](t)/N várható érték közelítésének R1 zρ(t, z)dz ∗ . (6.12) i (t) = R0 1 0 ρ0 (z)dz A 6.1. Tétel igazolásához azt fogjuk megmutatni, hogy az i∗ (t) közel van x(t)-hez és [I](t)/N -hez is. Az előbbi igazolásához az x(t) és i∗ (t) explicit előállítását fogjuk használni. A (6.5) egyenlet megoldása x(t) =
B(t)x0 , β − γ − A(t)x0
alakban adható meg, ahol x0 = x(0) a kezdeti feltétel és A(t) = β − β exp((β − γ)t),
B(t) = (β − γ) exp((β − γ)t).
A (6.10) elsőrendű parciális differenciálegyenletet megoldva a (6.12) képletből az 2A(t) N (β − γ) B(t) log 1 + −1 + i∗ (t) = A(t) A(t) 2N (β − γ − A(t)i0 ) − A
megoldást kapjuk. Az i∗ (t) és x(t) fenti explicit előállítását felhasználva elemien (bár hosszabb számolás után) igazolható az alábbi Lemma.
dc_483_12 6.3. SZTOCHASZTIKUS MÓDSZER
95
6.2. Lemma. Legyen ρ a (6.10)-(6.11) rendszer megoldása, és legyen i∗ a (6.12) által megadott függvény. Legyen x a (6.5) differenciálegyenlet x(0) = m/N kezdeti feltételhez tartozó megoldása. Ekkor bármely t ≥ 0 esetén lim |x(t) − i∗ (t)| = 0.
N →∞
Térjünk most rá annak bizonyítására, hogy i∗ (t) közel van [I](t)/N -hez is. Ezt a következő Lemmában fogalmazzuk meg. 6.3. Lemma. Legyen pk a (6.2) lineáris rendszer (6.4) kezdeti feltételhez tartozó megoldása. Legyen ρ a (6.10)-(6.11) rendszer megoldása, és legyen i∗ a (6.12) által megadott függvény. Ekkor bármely t ≥ 0 esetén lim |
N →∞
[I](t) − i∗ (t)| = 0. N
A lemma bizonyítása azon alapszik, hogy a (6.2) lineáris rendszer (6.10) parciális differenciálegyenlet térbeli (azaz z változóban vett) diszkretizációjának tekinthető. Parciális differenciálegyenletek meglehetősen általános osztályára ismert (pl. [76] 3. és 4. fejezete), hogy a diszkretizációs lépés nullához tartásával, amely esetünkben N végtelenhez tartását jelenti, a diszkretizáció az eredeti rendszerhez tart. A lemma állítása ezen általános eredményekből következik. A két fenti lemmából tehát az alábbi tételt kapjuk, amely a 6.1. Tétel gyengített alakjának tekinthető. 6.2. Tétel. Legyen pk a (6.2) lineáris rendszer (6.4) kezdeti feltételhez tartozó megoldása, valamint x a (6.5) differenciálegyenlet x(0) = m/N kezdeti feltételhez tartozó megoldása. Ekkor bármely t ≥ 0 esetén lim |x(t) −
N →∞
[I](t) | = 0. N
6.3. Sztochasztikus módszer Jelölje ebben a szakaszban (I(t))t≥0 a (6.2) alapegyenlettel leírt sztochasztikus folyamatot, a (6.3) együtthatók választása esetén. Azaz (I(t))t≥0 megadja egy t időpontban a teljes gráfban a fertőző csúcsok számát. Megmutatjuk, hogy I(t)/N sztochasztikusan konvergál a (6.5) egyenlet x(t) megoldásához, amint N → ∞, azaz fennáll a következő Tétel. 6.3. Tétel. Ha x(0) = [I](0)/N , akkor minden T > 0 számhoz van olyan K > 0, hogy bármely δ > 0 és t ∈ [0, T ] esetén fennáll P (|x(t) −
K I(t) | > δ) ≤ . N N δ2
dc_483_12 96
6. FEJEZET. KÖZELÍTŐ DIFFERENCIÁLEGYENLETEK
Fontos megjegyezni, hogy ez a Tétel erősebb a 6.2. Tételnél, mivel a sztochasztikus konvergenciából következik a várható érték konvergenciája. Ezenkívül megjegyzendő, hogy a tétel fennáll tetszőleges sűrűségfüggő folyamatra, melyek általános alakját a (6.8) képlet adja meg (azaz az együtthatók (6.3) képletbeli speciális választása nem szükséges). Ekkor az x függvény a (6.9) differenciálegyenlet megoldása. A bizonyítás hasonló a fenti speciális esetéhez, ezért csak ebben az esetben mutatjuk be a tétel bizonyítását. Ez a megközelítés az I(t) alábbi előállításán alapul. t t Z Z S(s) ds − Y2 γI(s) ds , I(t) = I(0) + Y1 βI(s) N
(6.13)
0
0
ahol Y1 és Y2 Poisson-folyamatok λ = 1 paraméterrel. Az egyenletet ilyen alakban a [94] könyvben, illetve az [55] monográfia 11. fejezetének 2. szakaszában találhatjuk meg. Az egyenlet levezetését itt nem mutatjuk be, martingál- és félcsoportelméleti meggondolásokon alapszik, a részletek a [94] könyvben találhatók meg. Azonban az egyenlet fennállása intuitív módon egyszerűen indokolható az alábbi módon. Az Y1 Poisson-folyamat azt adja meg, hogy a [0, t] időintervallumban hány fertőzés történt, ugyanis intenzitása az argumentumában levő integrállal fejezhető ki. Hasonlóképpen az Y2 Poisson-folyamat a [0, t] időintervallumban történt gyógyulásokat számolja meg. Ezzel a fertőző csúcsok t időpontbeli számát úgy fejezhetjük ki, hogy a betegek kezdeti számához hozzáadjuk a fertőzések számát, majd levonjuk a gyógyulások számát. A továbbiakban feltételezve a (6.13) egyenlet fennállását, bebizonyítjuk a 6.3. Tételt. A 6.3. Tétel bizonyítása: Vezessük be az iN (t) =
I(t) N
(6.14)
jelölést, valamint legyenek Y˜i (τ ) = Yi (τ ) − τ a fenti Yi folyamatok várható értékre centralizált változatai, azaz E(Y˜i (τ )) = 0 bármely τ esetén. Osszuk el a (6.13) egyenletet N -nel, ekkor némi átalakítás után a következő egyenlethez jutunk.
iN (t) = iN (0) +
Zt 0
F (iN (s))ds +
t Z S(s) 1 ˜ ds Y1 βI(s) − N N 0
t Z 1 ˜ Y2 γI(s) ds , N
(6.15)
0
ahol F (x) = βx(1−x)−γx. Ha t ∈ [0, T ], akkor az Y˜1 argumentumában levő integrál értéke 0 és βN T közé esik. Hasonlóan az Y˜2 argumentumában levő integrál értéke 0
dc_483_12 6.3. SZTOCHASZTIKUS MÓDSZER
97
és γN T között van. Ezért fennállnak az alábbi egyenlőtlenségek. t Z S(s) ds ≤ Y˜1 (βN T ), sup Y˜1 βI(s) N t∈[0,T ] 0 t Z sup Y˜2 γI(s) ds ≤ Y˜2 (γN T ). t∈[0,T ]
(6.16)
(6.17)
0
A tétel bizonyítása az alábbi Állításon alapszik, amely egy nagy számok törvénye típusú segédtétel, és bizonyítása Csebisev-egyenlőtlenségből következik. 6.1. Állítás. Legyen X(t) Poisson-folyamat λ = 1 paraméterrel, valamint legyen Y (t) = X(t) − t és c > 0 pozitív szám. Ekkor bármely ε > 0 és n ∈ N esetén fennáll a 1 c P |Y (cn)| > ε ≤ 2 n nε egyenlőtlenség.
Bizonyítás: Egyszerűen látható, hogy E(Y (t)) = 0 és D2 (Y (t)) = t igaz minden t esetén. Bevezetve a Zn = Y (cn)/n változót, szintén könnyen igazolható, hogy E(Zn ) = 0 és D2 (Zn ) = c/n minden n-re. Ezután Zn -re alkalmazhatjuk a Csebisev-egyenlőtlenséget, és a kívánt állítást kapjuk. Alkalmazzuk először a fenti Állítást az t t Z Z S(s) 1 1 ds − Y˜2 γI(s) ds (6.18) yN (t) = Y˜1 βI(s) N N N 0
0
folyamat felső becslésére a következőképpen. A (6.17) egyenlőtlenségből sup |yN (t)| ≤
t∈[0,T ]
1 ˜ 1 Y1 (βN T ) + Y˜2 (γN T ), N N
(6.19)
így, ha sup |yN (t)| > ε
t∈[0,T ]
akkor az
1 ˜ ε 1 ˜ ε vagy Y1 (βN T ) > Y2 (γN T ) > N 2 N 2 egyenlőtlenségek közül legalább egy fennáll. Ezért a P ( sup |yN (t)| > ε) valószínűt∈[0,T ]
ség a fenti két kifejezés közül a nagyobbikkal felülről becsülhető, amiből nyilvánvalóan következik, hogy a kettő összegével is felülről becsülhető, azaz P ( sup |yN (t)| > ε) ≤ P ( t∈[0,T ]
1 ˜ 1 ε ε Y1 (βN T ) > ) + P ( Y˜2 (γN T ) > ). N 2 N 2
(6.20)
dc_483_12 98
6. FEJEZET. KÖZELÍTŐ DIFFERENCIÁLEGYENLETEK
Ezzel a 6.1. Állításból az alábbi egyenlőtlenséget kapjuk. P ( sup |yN (t)| > ε) ≤ t∈[0,T ]
4(β + γ)T . N ε2
(6.21)
Térjünk rá most iN (t) és x(t) különbségének becslésére. 6.2. Állítás. Legyen x(t) a (6.5) differenciálegyenlet megoldása, és legyen iN (t) a (6.14) képlettel definiált függvény. Jelölje M az F függvény [0, 1] intervallumra vonatkozó Lipschitz konstansát. Ekkor, ha iN (0) = x(0), akkor bármely t ≥ 0 esetén igaz az |iN (t) − x(t)| ≤ |yN (t)|eM t egyenlőtlenség.
Bizonyítás: Az iN és x függvényekre teljesülnek az iN (t) = iN (0) +
Zt
F (iN (s))ds + yN (t)
0
és x(t) = i(0) +
Zt
F (x(s))ds
0
integrálegyenletek. Vonjuk ki egymásból a két egyenletet, alkalmazzuk a kezdeti feltételek azonosságát és F Lipschitz folytonosságát. Ekkor az |iN (t) − x(t)| ≤ |yn (t)| +
Zt 0
M |iN (s) − x(s)|ds
egyenlőtlenséghez jutunk, amelyből a Gronwall-lemma segítségével a kívánt állítás azonnal következik. Tehát, ha sup |iN (t) − x(t)| > δ, t∈[0,T ]
akkor sup |yN (t)| > δe−M T .
t∈[0,T ]
Ezért P ( sup |iN (t) − x(t)| > δ) ≤ P ( sup |yN (t)| > δe−M T ). t∈[0,T ]
t∈[0,T ]
Végül használjuk fel a (6.21) becslést, és a P ( sup |iN (t) − x(t)| > δ) ≤ t∈[0,T ]
4(β + γ)T e2M T , N δ2
egyenlőtlenséget kapjuk, amellyel a 6.3. Tételt bebizonyítottuk.
dc_483_12 6.4. VÉGTELEN RENDSZER A MOMENTUMOKRA
99
6.4. Végtelen rendszer a momentumokra Tekintsük ismét a (6.2) lineáris rendszert, amely a {0, 1, . . . , N } állapotterű Markovfolyamat alapegyenlete, melyben pk (t) jelöli a k-adik állapot valószínűségét a t időpontban. Ebben a szakaszban feltételezzük, hogy a folyamat sűrűségfüggő, azaz ck ak k k , , (6.22) =A =C N N N N továbbá az A és C függvény polinom, azaz A(x) =
l X
gj xj ,
C(x) =
l X
hj xj .
j=0
j=0
Tekintsük azt a valószínűségi változót, amely a k-adik állapothoz a hozzá. Ennek n-edik momentuma yn (t) =
N X k n k=0
(6.23)
N
pk (t),
k N
számot rendeli
n = 1, 2, . . . ,
(6.24)
(y1 (t) a várható értéke, amely számunkra igazán érdekes). A 6.1. szakaszban az y1 (t) várható érték deriváltjára a 6.1. Lemma segítségével vezettük le a (6.7) képletet. Alkalmazzuk most ismét ezt a Lemmát az rk = (k/N )n választással az yn deriváltjának levezetésére. Ehhez szükségünk lesz az alábbi képletekre. Legyen Rk,n =
(k + 1)n − k n − nk n−1 , N n−1
valamint dn (t) =
N X
Qk,n =
(k − 1)n − k n + nk n−1 , N n−1
(ak Rk,n + ck Qk,n )pk (t).
(6.25)
k=0
Ekkor a 6.1. Lemma alapján y˙ n (t) =
n−1 N X k k n−1 ak ck n n−1 + Rk,n + −n n−1 + Qk,n pk (t), N N N N k=0
ezért
n−1 N X ak − ck 1 k y˙ n (t) = n · · pk (t) + dn (t). · N N N
(6.26)
k=0
Mivel az aNk és cNk a (6.23) feltevés szerint Nk polinomjaként írható fel, azért a jobboldal első tagja az ym (t) függvények lineáris kombinációjaként írható fel. (Az m index maximális értéke az A és C polinomok fokától függ.) A binomiális tétel felhasználásával k,n és Qk,n felírható k hatványainak segítségével, így dn is kifejezPR n hető dn (t) = m=1 dnm ym (t) alakban a dnm együtthatók megfelelő választásával. Ezzel (6.26) úgy tekinthető, mint az yn ismeretlen függvényekre felírt végtelen sok egyenletből álló lineáris differenciálegyenlet-rendszer. A rendszert azonban nem a
dc_483_12 100
6. FEJEZET. KÖZELÍTŐ DIFFERENCIÁLEGYENLETEK
szokásos mátrix alakban adtuk meg, mert célszerű az O( N1 ) nagyságrendű tagokat különválasztani, az N → ∞ határátmenet kezelése érdekében. Mivel a dn tartalmazza N -et, azért a határátmenet vizsgálatához meg kell mutatnunk, hogy dn korlátos marad N → ∞ esetén (hiszen csak így tud a dn előtti 1/N tényező érvényesülni). Ezt fogalmazza meg az alábbi Lemma. 6.4. Lemma. Van olyan c (N -től független) szám, amellyel a dn függvények teljesítik az alábbi egyenlőtlenséget minden t ≥ 0 esetén. 0 ≤ dn (t) ≤ c ·
n · (n − 1) . 2
(6.27)
Bizonyítás: Alkalmazzuk a Taylor-formulát másodrendű Lagrange-féle maradéktaggal egy f függvényre. (x − x0 )2 , f (x) = f (x0 ) + f ′ (x0 )(x − x0 ) + f ′′ (ξ) 2 ahol ξ az x0 és x közötti szám. Ebből könnyen kaphatunk az Rk,n és Qk,n kifejezésekre megfelelő becsléseket. Például a fenti képletet az f (x) = xn , x = k + 1 és x0 = k szereposztással alkalmazva Rk,n =
n(n − 1) ξ n−2 2 N n−1
adódik, ahol ξ ∈ [k, k + 1]. Hasonlóan x = k − 1 és x0 = k esetén a Qk,n =
n(n − 1) η n−2 2 N n−1
eredményt kapjuk, melyben η ∈ [k, k + 1]. Ezért Rk,n és Qk,n nem negatív értékek, amelyből dn (t) ≥ 0 azonnal adódik. Továbbá ξ/N ≤ 1, η/N ≤ 1 és (6.22) a következő egyenlőtlenséget adja ak Rk,n + ck Qk,n ≤
ck n(n − 1) n(n − 1) ak + ≤c· , 2 N N 2
ahol c jelöli az A és C polinomok [0, 1] intervallumon felvett maximumai közül a nagyobbikat. Ezután az állítás egyszerűen következik a (6.25) képletből, felhasználva, P p hogy N k=0 k (t) = 1. Vezessük be a qj := gj − hj , j = 0, 1, . . . , l, (6.28) jelöléseket. Ekkor (6.22) és (6.23) felhasználásával a (6.26) rendszer a következő alakba írható y˙ n (t) = n ·
N X l X k=0 j=0
qj
k N
n+j−1
· pk (t) +
1 dn (t) N
dc_483_12 6.4. VÉGTELEN RENDSZER A MOMENTUMOKRA
101
azaz a két összegzést felcserélve y˙ n (t) = n · a
l X
qj yn+j−1 (t) +
j=0
1 dn (t). N
(6.29)
Tekintsük most az N → ∞ határátmenetet, ekkor a 6.4. Lemma miatt formálisan z˙n (t) = n ·
l X
qj zn+j−1 (t)
(6.30)
j=0
(n = 1, 2, . . .) végtelen rendszerhez jutunk. Ezt a rendszert a (6.29) végtelen rendszer közelítésének tekinthetjük nagy N esetén. A közelítő rendszer legfontosabb előnye, hogy a számunkra érdekes kezdeti feltételhez tartozó megoldása explicit módon megadható egy egyszerű nemlineáris differenciálegyenlet (nem rendszer) segítségével. Ugyanis a (6.4) kezdeti feltétel az yn momentumokra (6.24) alapján az yn (0) = mn /N n kezdeti feltételt adja, tehát a zn függvényekre vonatkozó (6.30) végtelen rendszert is tekintsük a mn , n = 1, 2, . . . Nn kezdeti feltétellel. A (6.30) végtelen rendszerrel kapcsolatban az új és alapvető észrevétel az, hogy célszerű a megoldását zn = z n alakban keresni, ahol z egy egyelőre ismeretlen függvény. Ha z(0) = m/N , akkor ezek a függvények teljesítik a kezdeti feltételt. Nézzük, hogy mit kapunk, ha a (6.30) végtelen rendszerbe helyettesítjük őket. Könnyen látható, hogy az n-edik egyenlet egyszerűsíthető lesz nz n−1 -nel, és a zn (0) =
z˙ =
l X j=0
qj z j = A(z) − C(z)
(6.31)
polinom jobboldalú közönséges differenciálegyenlethez jutunk, felhasználva az A és C függvények (6.23) képletben megadott alakját. Ha tehát z megoldása ennek az egyszerű egyenletnek, akkor a zn = z n függvények megoldását adják a (6.30) végtelen rendszernek. A (6.31) egyenlet pedig nem más, mint a (6.2) alapegyenlethez tartozó várható értékre vonatkozó (6.9) mean-field egyenlet. Ezzel tehát a momentumokra vonatkozó végtelen rendszerből is levezettük a (6.9) mean-field egyenletet, de ami ennél jelentősebb, teljesen új módszert kaphatunk annak igazolására, hogy N → ∞ esetén az y1 várható érték a (6.9) mean-field egyenlet z megoldásához tart. Sőt, azt is igazolni tudjuk majd, hogy nemcsak a várható értékre, mint első momentumra, hanem bármely yn momentumra jó közelítést ad a (6.9) egyenletből kapott z n függvény. Az alábbi két szakaszban bizonyítást adunk arra, hogy az |yn − zn | eltérés 1/N nagyságrendű N → ∞ esetén. Az első bizonyítás, amelyet a 6.4.1. szakaszban ismertetünk, egy lineáris rendszerekre vonatkozó absztrakt perturbációs tételen alapszik. Azonban, mint látni fogjuk, ez csak akkor érvényes, ha a qj együtthatók bizonyos előjelfeltételeket teljesítenek. A számunkra fontos (6.3) esetben ez az előjelfeltétel nem teljesül, ezért erre az esetre a 6.4.2. szakaszban mutatunk egy eleminek nevezhető (mivel mélyebb funkcionálanalízisbeli tételeket nem használ fel), de meglehetősen sok lépésből álló új bizonyítást.
dc_483_12 102
6. FEJEZET. KÖZELÍTŐ DIFFERENCIÁLEGYENLETEK
6.4.1. Kato-féle perturbációs módszer Vezessük be formálisan a sorozatok ℓ1 terén az alábbi operátort. (Lf )n := n ·
l X
qj fn+j−1 ,
n = 1, 2, . . . ,
j=0
valamint vezessük be a sorozatok terébe képező valós változós y(t) := (yn (t))n∈N ,
z(t) := (zn (t))n∈N
és
d(t) := (dn (t))n∈N
függvényeket. Ekkor a (6.29) rendszer az y(t) ˙ = Ly(t) +
1 d(t), N
(6.32)
a (6.30) rendszer pedig a (6.33)
z(t) ˙ = Lz(t)
absztrakt formába írható, amivel az előbbi rendszer az utóbbi 1/N nagyságrendű perturbációjaként fogható fel. Így a kívánt, az y(t) − z(t) különbség nagyságára vonatkozó becslés a konstans variációs formula következményeként adódik, amennyiben az operátort egy megfelelő téren értelmezni tudjuk. Ehhez Kato [79], valamint Banasiak és munkatársainak [13] alábbi eredményét fogjuk használni. 6.5. Lemma. Legyen D(Lmax ) := f ∈ ℓ1 : Lf ∈ ℓ1 ,
Lmax := L|D(Lmax ).
Tegyük fel, hogy a q0 , q2 , . . . , ql ≥ 0, q1 ≤ 0, valamint q0 + q1 + · · · + ql ≤ 0,
q0 − q2 − 2q3 − 3q4 − 4q5 − · · · − (l − 1)ql ≤ 0
előjelfeltételek fennállnak. Ekkor létezik olyan (L, D) operátor, amelyre L ⊂ Lmax és (L, D) egy erősen folytonos, kontrakciókból álló (T (t))t≥0 operátorfélcsoport generátora az ℓ1 téren. A Lemma kis módosítása [79] 1. Tételének. A tételhez az L operátornak megfelelő végtelen mátrix oszlopösszegeit kell kiszámítani. A fenti feltevések mellett ezek nem pozitívak, azaz (n + 1)q0 + nq1 + (n − 1)q2 + (n − 2)q3 + · · · + (n − l + 1)ql ≤ 0,
n = 1, 2, . . . .
Kato fenti tételében egyenlőtlenség helyett egyenlőség van, azonban a bizonyítás változtatás nélkül ebben az esetben is érvényes. A Lemma felhasználásával az alábbi Tételt tudjuk igazolni.
dc_483_12 6.4. VÉGTELEN RENDSZER A MOMENTUMOKRA
103
6.4. Tétel. Tegyük fel, hogy fennállnak a 6.5. Lemma előjelfeltételei. Ekkor létezik olyan k · kw norma, amellyel definiált súlyozott ℓ1w tér pozitívan invariáns a (6.29) és (6.30) egyenletekre, azaz z0 = y0 ∈ ℓ1w kezdeti feltétel esetén az y(t) és z(t) megoldások is ebben a térben vannak, és teljesül az alábbi becslés. Minden T > 0 esetén van olyan K > 0, melyre K ha t ∈ [0, T ], (6.34) N azaz a (6.29) egyenlet megoldása a (6.30) megoldásához tart korlátos időintervallumon N → ∞ esetén. ky(t) − z(t)kw ≤
Bizonyítás: Válasszunk egy tetszőleges r ∈ (0, 1) számot és vezessük be az x = (xn )n∈N sorozatra az ∞ X |xn |rn kxkw := n=1
normát. Legyen
ℓ1w
az ezzel a normával definiált súlyozott ℓ1 tér. Ekkor (6.27) szerint
kd(t)kw ≤ c ·
∞ X
n=1
n(n − 1)rn =: K ∗ < ∞,
t ∈ R+ .
Alkalmazzuk a 6.5. Lemmát az ℓ1w téren. A kapott operátort, amely formálisan úgy hat, mint L, jelölje (Lw , Dw ), az ℓ1w téren értelmezett kontrakció félcsoportot, amelynek Lw a generátora, pedig jelölje (Tw (t))t≥0 . Alkalmazzuk most a konstans variációs formulát (lásd például a III.1.7 Következményt az [52] könyvben). Z t 1 Tw (t − s)d(s) ds · y(t) = Tw (t)y0 + N 0 Z t 1 Tw (t − s)d(s) ds · = z(t) + N 0 bármely y0 ∈ ℓ1w esetén. Tehát Z t 1 1 ky(t) − z(t)kw ≤ kTw (t − s)kw · kd(s)kw ds ≤ · · t · K ∗, N 0 N
(6.35)
amiből a kívánt (6.34) becslés következik. Az alábbi Következményben összefoglaljuk, hogy a fenti általános Tétel mit ad a mean-field egyenlettel való közelítés pontosságáról. 6.1. Következmény. Tekintsük a (6.2) alapegyenletet, melyben az együtthatókat a (6.22) és (6.23) képletek adják. Tegyük fel, hogy a (6.28) együtthatókra teljesülnek a 6.5. Lemma előjelfeltételei. Legyenek a pk függvények a (6.2) rendszer (6.4) kezdeti feltételhez tartozó megoldásai. Legyen y1 a (6.24) képlettel megadott várható érték, és legyen z a (6.9) mean-field egyenlet z(0) = y1 (0) kezdeti feltételhez tartozó megoldása. Ekkor minden T > 0 esetén van olyan K > 0, melyre |y1 (t) − z(t)| ≤
K N
ha t ∈ [0, T ].
dc_483_12 104
6. FEJEZET. KÖZELÍTŐ DIFFERENCIÁLEGYENLETEK
A Következmény alkalmazhatóságát az előjelfeltétel jelentősen korlátozza. Bár bizonyos rendszerekben, például a [191] dolgozatunkban szereplő adaptív hálózat esetén teljesül a feltétel, az egyik leggyakrabban vizsgált esetben, teljes gráfon történő SIS típusú járványterjedés esetén, amikor a (6.2) alapegyenlet együtthatóit (6.3) adja meg (τ = β/N feltételezésével), a feltétel nem teljesül. Ugyanis ekkor A(x) = βx(1 − x),
C(x) = γx,
így a (6.22) együtthatók q0 = 0,
q1 = β − γ,
q2 = −β,
azaz a q2 ≥ 0 feltétel sérül. Ez vezetett minket egy új, az előjelfeltételeket nem használó, azonban speciálisan a (6.3) képletben megadott együtthatók esetére alkalmazható bizonyítás kidolgozásához. Ezt a bizonyítást ismertetjük a következő szakaszban.
6.4.2. Elemi bizonyítás a (6.3) együtthatók esetén Ebben a szakaszban tehát visszatérünk a teljes gráf és az SIS dinamika esetéhez, amelynél a (6.2) alapegyenlet együtthatóit (6.3) adja meg, és τ = β/N . Ekkor a (6.29) végtelen rendszer az y˙ j (t) = j(β − γ)yj (t) − jβyj+1 (t) +
1 dj (t), N
(6.36)
alakba írható, ahol a dj függvényeket (6.25) adja meg, a (6.30) végtelen rendszer pedig az alábbi alakot ölti z˙j (t) = j(β − γ)zj (t) − jβzj+1 (t).
(6.37)
A kezdeti feltétel mindkét rendszerhez ugyanaz, yj (0) = zj (0) = mj /N j . Amint fent említettük, a (6.37) rendszer ezen kezdeti feltételhez tartozó megoldása zj = z j alakban kereshető, ahol z megoldása a z˙ = (β − γ)z − βz 2
(6.38)
differenciálegyenletnek a z(0) = m/N kezdeti feltétellel. Ebben a szakaszban a következő Tételt fogjuk igazolni. 6.5. Tétel. Ha a (6.36) és (6.37) megoldásai ugyanabból az yj (0) = mj /N j = zj (0) kezdeti feltételből indulnak ki, akkor bármely T > 0 számhoz van olyan K > 0, amellyel fennáll az alábbi becslés 0 ≤ z1 (t) − y1 (t) ≤
K N
ha t ∈ [0, T ].
A Tétel bizonyításához számos Lemmán és segédállításon keresztül fogunk eljutni. Először azt igazoljuk, hogy a (6.37) rendszer megoldása a megadott kezdeti feltétel mellett egyértelmű, azaz zj = z j fennáll.
dc_483_12 6.4. VÉGTELEN RENDSZER A MOMENTUMOKRA
105
6.6. Lemma. A (6.37) rendszernek a zj (0) = mj /N j kezdeti feltétel mellett egyetlen olyan megoldása van, ami egyenletesen korlátos, azaz létezik olyan M szám, amelyre |zj (t)| ≤ M minden j esetén. Ez a megoldás zj = z j alakban adható meg, ahol z a (6.38) megoldása. Bizonyítás: Mivel a (6.37) rendszer homogén és lineáris, azért az egyértelműséghez elég igazolni, hogy a nulla kezdeti feltételt csak a konstans nulla megoldás teljesíti. Másrészt a rendszer autonóm volta miatt elég igazolni az állítást valamilyen T hosszúságú időintervallumon. Azaz elegendő bizonyítani, hogy van olyan T > 0, hogy ha minden j esetén zj (t0 ) = 0 egy adott t0 esetén, akkor zj a konstans nulla függvény a [t0 , t0 + T ] intervallumon. Indukcióval igazolhatjuk, hogy zj a konstans nulla függvény a [kT, (k + 1)T ] intervallumon minden k ∈ N esetén. Ezért végül csak azt fogjuk igazolni, hogy van olyan T > 0, hogy ha minden j esetén zj (0) = 0, akkor zj a konstans nulla függvény a [0, T ] intervallumon. Szorozzuk meg a (6.37) egyenletet exp(−j(β − γ)t)-vel, és vezessük be a vj (t) = zj (t) exp(−j(β − γ)t) függvényeket. Jelölje α a β − γ különbséget. Ekkor a vj függvényre vonatkozó differenciálegyenlet v˙ j (t) = −jβvj+1 (t)eαt .
(6.39)
Megmutatjuk, hogy vj (0) = 0 és vj (t) ≤ M minden j esetén van olyan T > 0, hogy vj (t) = 0 minden t ∈ [0, T ] esetén. Integráljuk a (6.39) egyenletet, a vj (0) = 0 kezdeti feltétel miatt vj (t) = −jβ
Z
t
vj+1 (s)eαs ds.
(6.40)
0
Alkalmazzuk ezt az egyenletet iteratív módon, így v1 kifejezhető a vj+1 segítségével az alábbi módon Z t j−1 βj j v1 (t) = (−1) j j−1 vj+1 (s)eαs eαt − eαs ds. (6.41) α 0
Válasszunk most egy olyan T pozitív számot, amelyre β(exp(αT ) − 1)/α < 1. Ekkor minden t ≤ T és s ∈ [0, t] esetén fennáll β(exp(αt) − exp(αs))/α < 1. Ezért (6.41) jobboldala felülről becsülhető jq j konstansszorosával, ahol q = β(exp(αT ) − 1)/α < 1, mivel vj egyenletesen korlátos. Tehát j → ∞ esetén a jobboldal nullához tart, amiből következik, hogy v1 (t) = 0 minden t ∈ [0, T ] esetén. Ezután a (6.39) képletet j = 1 esetén alkalmazva kapjuk, hogy v2 (t) = 0 is fennáll minden t ∈ [0, T ] esetén, és indukcióval vj (t) = 0 is következik minden t ∈ [0, T ] és minden j ∈ N esetén. Ebből vj (t) = zj (t) exp(−j(β − γ)t) miatt az állítás következik. Először bebizonyítjuk a Tételben szereplő baloldali egyenlőtlenséget. 6.3. Állítás. A 6.5. Tétel feltételei mellet minden t ≥ 0 esetén fennáll y1 (t) ≤ z1 (t).
dc_483_12 106
6. FEJEZET. KÖZELÍTŐ DIFFERENCIÁLEGYENLETEK
Bizonyítás: Mivel az y2 − y12 variancia nemnegatív, azért y12 (t) ≤ y2 (t) minden t-re igaz. Egyszerűen látható, hogy d1 = 0, ezért a (6.36) rendszer első egyenlete y˙ 1 = (β − γ)y1 − βy2 . Ebből y˙ 1 ≤ (β − γ)y1 − βy12 . Tegyük fel indirekt módon, hogy van olyan t2 > 0, amelyre y1 (t2 ) > z1 (t2 ). Ekkor van olyan t1 < t2 , amelyre y1 (t1 ) = z1 (t1 ) és y1 (t) > z1 (t) minden t ∈ (t1 , t2 ] esetén. Vezessük be a v(t) = y1 (t) − z1 (t) függvényt. Ekkor az F (x) = (β − γ)x − βx2 jelöléssel v˙ = y˙ 1 − z˙1 ≤ F (y1 ) − F (z1 ) ≤ M (y1 − z1 ) = M v ahol M az F függvény Lipschitz-konstansa a [0, 1] intervallumon. Alkalmazzuk a v függvényre a Gronwall-lemmát a [t1 , t2 ] intervallumon. Ekkor v(t1 ) = 0 miatt v(t) ≤ 0 adódik minden t ∈ [t1 , t2 ] esetén, ami ellentmond annak, hogy y1 (t) > z1 (t) minden t ∈ (t1 , t2 ] esetén. A következő két Lemmában bebizonyítjuk, hogy ha j elegendően nagy, akkor zj ≤ yj . Ezt az eredményt a 6.9. Lemma bizonyításában fogjuk használni. 6.7. Lemma. Megadható olyan j0 ∈ N és δ > 0, amelyekre zj (t) ≤ yj (t), minden j ≥ j0 és t ∈ [0, δ] esetén. Bizonyítás: A zj felső becslésének levezetéséhez felhasználjuk, hogy zj = z j , és z-re explicit képlet adható a (6.38) egyenlet megoldásával. Bevezetve a q = m/N = z(0) és felhasználva az α = β − γ jelöléseket a (6.38) egyenlet megoldása z(t) =
αq . (α − βq) exp(−αt) + βq
A becslést az α − βq < 0 és α − βq > 0 esetben külön végezzük el. 1. Eset Ha α − βq < 0, akkor a z függvény csökkenő. Ekkor válasszunk egy t′ > 0 és α′ < α számot úgy, hogy exp(−αt) ≤ 1 − α′ t,
ha t ∈ [0, t′ ]
teljesüljön. Ekkor minden t ∈ [0, t′ ] esetén z(t) ≤
q αq = , (α − βq)(1 − α′ t) + βq 1 + ct
ahol c = −α′ (α − βq)/α > 0. Így zj (t) ≤
qj , (1 + ct)j
ha t ∈ [0, t′ ].
(6.42)
dc_483_12 6.4. VÉGTELEN RENDSZER A MOMENTUMOKRA
107
Az yj függvényre triviális alsó becslés az yj (t) ≥ (m/N )j pm (t) egyenlőtlenség. A pm (t) függvényre alsó becslést kapunk, ha megszorozzuk a (6.2) egyenletet ebk t -vel, majd integráljuk a [0, t] intervallumon. Ekkor Z t Z t pk (t)ebk t = pk (0) + ak−1 pk−1 (s)ebk s ds + ck+1 pk+1 (s)ebk s ds. (6.43) 0
0
Ha k = m, akkor a pm (0) = 1 kezdeti feltétel miatt pm (t) ≥ e−bm t minden t > 0 esetén. Az e−bm t ≥ 1 − bm t egyenlőtlenség miatt yj (t) ≥ q j (1 − bm t) ha t ≥ 0.
(6.44)
Alkalmazzuk most az alábbi 6.4. Állítást a d = bm választással. Tetszőleges t0 < 1/bm esetén válasszuk a j0 indexet az Állítás szerint. Legyen δ = min{t′ , t0 }. Ekkor minden j ≥ j0 és t ∈ [0, δ] esetén a (6.42) és (6.44) egyenlőtlenségből következik, hogy qj ≤ q j (1 − bk0 t) ≤ yj (t). zj (t) ≤ (1 + ct)j 2. Eset Ha α − βq ≥ 0, akkor a z függvény növő. A bizonyítás ebben az esetben is hasonló, ezért csak vázlatosan ismertetjük. A z(t) függvényre vonatkozó felső becslésből a [0, 1/α] intervallumon az alábbi következik qj zj (t) ≤ , (6.45) (1 − ct)j
ahol c = α − βq. Az yj függvényre vonatkozó alsó becsléshez induljunk ki az yj (t) ≥ (m/N )j pm (t)+ ((m + 1)/N )j pm+1 (t) egyenlőtlenségből. Felhasználva a pm (t) és pm+1 (t) értékére vonatkozó alsó becsléseket, azt kapjuk, hogy van olyan j1 ∈ N és t′ > 0, melyekre minden t ∈ [0, t′ ] és j ≥ j1 esetén yj (t) ≥ q j (1 + dj t),
(6.46)
ahol d ∈ (1, 1 + 1/N q). Ezután az alábbi 6.5. Állítást alkalmazva kapjuk a kívánt eredményt. Most igazoljuk azt a két segédállítást, amelyet a fenti Lemma bizonyítása során felhasználtunk. 6.4. Állítás. Bármely c és d pozitív, valamint t0 ∈ (0, 1/d) számhoz létezik olyan j0 ∈ N természetes szám, amellyel minden j ≥ j0 és t ∈ [0, t0 ] esetén az (1 + ct)−j ≤ 1 − dt egyenlőtlenség fennáll. Bizonyítás: Vezessük be az f (t) = 1/(1 − dt) és g(t) = (1 + ct)j függvényeket. Megmutatjuk, hogy van olyan j0 ∈ N, hogy minden j ≥ j0 és t ∈ [0, t0 ] esetén fennáll az f (t) ≤ g(t) egyenlőtlenség. Mivel f (0) = 1 = g(0), azért elég igazolni, hogy f ′ (t) ≤ g ′ (t) igaz minden t ∈ [0, t0 ] értékre. Az f és g függvényeket deriválva f ′ (t) =
d d ≤ 2 (1 − dt) (1 − dt0 )2
dc_483_12 108
6. FEJEZET. KÖZELÍTŐ DIFFERENCIÁLEGYENLETEK
és g ′ (t) = jc(1 + ct)j−1 ≥ jc.
Válasszunk egy olyan j0 számot, amelyre fennáll
d ≤ j0 c. (1 − dt0 )2
Ekkor bármely j ≥ j0 és t ∈ [0, t0 ] esetén f ′ (t) ≤
d ≤ j0 c ≤ jc ≤ g ′ (t). (1 − dt0 )2
6.5. Állítás. Legyen c > 0 és d > 1. Ekkor bármely t0 ∈ (0, (d − 1)/dc) számhoz van olyan j0 ∈ N természetes szám, amellyel minden j ≥ j0 és t ∈ [0, t0 ] esetén az (1 − ct)−j ≤ 1 + dj t egyenlőtlenség fennáll. Bizonyítás: Vezessük be az f (t) = (1 − ct)−j és g(t) = 1 + dj t függvényeket. Megmutatjuk, hogy van olyan j0 ∈ N, hogy minden j ≥ j0 és t ∈ [0, t0 ] esetén fennáll az f (t) ≤ g(t) egyenlőtlenség. Mivel f (0) = 1 = g(0), azért elég igazolni, hogy f ′ (t) ≤ g ′ (t) igaz minden t ∈ [0, t0 ] értékre. Az f és g függvényeket deriválva f ′ (t) = jc(1 − ct)−j−1 ≤ jc(1 − ct0 )−j−1
és g ′ (t) = dj . A t0 ∈ (0, (d − 1)/dc) feltétel miatt d(1 − ct0 ) > 1, ezért van olyan j0 szám, amelyre c ≤ dj (1 − ct0 )j , ha j ≥ j0 . j 1 − ct0 Így bármely j ≥ j0 és t ∈ [0, t0 ] esetén f ′ (t) ≤
jc ≤ dj = g ′ (t) (1 − ct0 )j+1
fennáll. A következő egyszerű Állításra az alábbi 6.8. Lemma bizonyítása során lesz szükség. 6.6. Állítás. Minden k ∈ {0, 1, . . . , N } és t > 0 esetén fennáll pk (t) > 0. Bizonyítás: Ha k = m, akkor a pm (0) = 1 kezdeti feltétel felhasználásával a (6.43) egyenlőségből következik, hogy pm (t) ≥ e−bm t > 0 minden t > 0 értékre. Ha k > m, akkor az állítás indukcióval igazolható. Ugyanis pk−1 (t) > 0 esetén (6.43) szerint Z t −bk t pk (t) ≥ ak−1 e pk−1 (s)ebk s ds > 0. 0
Hasonló indukciós bizonyítás alkalmazható a k < m esetben is.
dc_483_12 6.4. VÉGTELEN RENDSZER A MOMENTUMOKRA
109
6.8. Lemma. Bármely T > 0 számhoz létezik olyan j1 ∈ N, amelyre ha j ≥ j1 ,
zj (t) ≤ yj (t),
t ∈ [0, T ].
Bizonyítás: A zj függvényre a zj = z j összefüggés alapján kaphatunk felső becslést. A (6.38) differenciálegyenletből egyszerűen következik, hogy ha z(0) > 1 − γ/β, akkor z csökkenő függvény. Ha viszont az ellenkező egyenlőtlenség áll fenn a z(0) = m/N kezdeti feltételre, akkor z növő függvény, viszont értéke az 1 − γ/β egyensúlyi állapot fölé nem nőhet. Ezért q = max{m/N, 1 − γ/β} felső becslést ad z értékére, azaz z(t) ≤ q minden t ≥ 0 esetén. Ebből következik, hogy zj (t) ≤ q j
ha t ≥ 0.
(6.47)
Adjunk most yj -re alsó becslést. Válasszunk egy olyan k ∈ {0, 1, . . . , N } indexet, amelyre k/N > q, majd vezessük be a j0 és δ számokat a 6.7. Lemma szerint. Legyen r = min{pk (t) : t ∈ [δ, T ]} > 0. Az r pozitivitása a 6.6. Állításból következik. Végül válasszunk egy olyan j1 ≥ j0 számot, hogy r(k/N )j > q j igaz legyen minden j ≥ j1 számra. Ekkor minden t ∈ [δ, T ] esetén yj (t) ≥
k N
j
pk (t) ≥
k N
j
r > q j ≥ zj (t).
Másrészt a 6.7. Lemma szerint zj (t) ≤ yj (t) ha t ∈ [0, δ], mivel j ≥ j1 ≥ j0 . A Tételünk bizonyításához szükséges utolsó Lemma megfogalmazásához minden j ∈ N és j ≥ 1 esetén vezessük be az új uj függvényt a következő képlettel u j = yj − z j . A (6.36) és (6.37) differenciálegyenleteket egymásból kivonva, az új függvényre az u˙ j (t) = j(β − γ)uj (t) − jβuj+1 (t) +
1 dj (t) N
differenciálegyenletet kapjuk, az uj (0) = 0 kezdeti feltétellel. 6.9. Lemma. Bármely T > 0 számhoz van olyan r ∈ N és Kr > 0, melyekkel |ur (t)| ≤
Kr N
ha t ∈ [0, T ].
(6.48)
dc_483_12 110
6. FEJEZET. KÖZELÍTŐ DIFFERENCIÁLEGYENLETEK
Bizonyítás: A 6.8. Lemma szerint található olyan r ∈ N, amelyre ur (t) ≥ 0 és ur+1 (t) ≥ 0, ha t ∈ [0, T ]. Tekintsük most a (6.48) differenciálegyenletet a j = r választással. Szorozzuk meg ezt az egyenletet exp(−r(β − γ)t)-vel, majd integráljuk 0-tól t-ig. Ekkor Z Z t 1 t dr (s)e−r(β−γ)s ds. ur+1 (s)e−r(β−γ)s ds + ur (t)e−r(β−γ)t = −βr N 0 0 Mivel ur+1 (t) ≥ 0 és a dr függvényre fennáll a 6.4. Lemmában megadott felső becslés, azért 1 (r − 1)(β + γ) r(β−γ)t 0 ≤ ur (t) ≤ e . N 2(β − γ) Tehát a Kr =
(r−1)(β+γ) r(β−γ)T 2(β−γ) e
választással fennáll a bizonyítandó állítás.
Ezzel elérkeztünk fő eredményünk, a 6.5. Tétel bizonyításához. A 6.5. Tétel bizonyítása: Válasszuk meg az r és Kr számokat a 6.9. Lemma szerint. Indukcióval igazoljuk, hogy bármely j = 1, 2, . . . , r − 1 számhoz van olyan Kj , amellyel |uj (t)| ≤
Kj N
ha t ∈ [0, T ].
Így j = 1 esetén a 6.3. Állítással együtt ez az egyenlőtlenség a 6.5. Tétel állítását adja. A 6.9. Lemma szerint az egyenlőtlenség fennáll j = r esetén, így elegendő azt igazolni, hogy ha fennáll j + 1-re, akkor igaz j-re is. Szorozzuk meg a (6.48) differenciálegyenletet exp(−j(β − γ)t)-vel, majd integráljuk 0-tól t-ig. Ekkor Z t Z 1 t uj+1 (s)e−j(β−γ)s ds + uj (t)e−j(β−γ)t = −βj dj (s)e−j(β−γ)s ds. N 0 0 Alkalmazzuk az |uj+1 (t)| ≤ Kj+1 /N indukciós feltevést és a dj függvényre vonatkozó 6.4. Lemmabeli felső becslést. Ezekből a Kj = választással
2βKj+1 + (j − 1)(β + γ) j(β−γ)T e 2(β − γ) |uj (t)| ≤
Kj . N
6.5. Operátor félcsoportok módszere Tekintsük ismét a (6.2) lineáris rendszert, amely a {0, 1, . . . , N } állapotterű Markovfolyamat alapegyenlete. A (6.2) rendszerben pk (t) jelöli a k-adik állapot valószínűségét a t időpontban. Az eddigiekben feltételeztük, hogy a folyamat sűrűségfüggő,
dc_483_12 6.5. OPERÁTOR FÉLCSOPORTOK MÓDSZERE
111
azaz az ak és ck együtthatókat a (6.22) képlet adja meg. Most valamivel általánosabb feltételt adunk meg az együtthatókra, nevezetesen azt feltételeztük, hogy a folyamat aszimptotikusan sűrűségfüggő, azaz az együtthatók az AN és CN függvényekkel az alábbi módon adhatók meg ak = AN (k),
(6.49)
ck = CN (k),
és az alábbi határértékek bármely x ∈ [0, 1], esetén léteznek A(x) = lim
N →∞
AN (N x) , N
C(x) = lim
N →∞
CN (N x) , N
(6.50)
ahol A és C (legalább) folytonos függvények a [0, 1] intervallumon. Megjegyezzük, (N x) és C(x) = hogy a sűrűségfüggő eset ennek speciális esete, akkor A(x) = ANN CN (N x) minden N -re. N Bevezetve a −b0 c1 0 ··· ··· 0 a0 −b1 c2 ··· ··· 0 0 a −b c · · · 0 1 2 3 GN := . .. .. .. .. .. .. . . . . . 0 0 · · · aN −2 −bN −1 cN 0 0 ··· 0 aN −1 −bN tridiagonális mátrixot, ahol
bk = ak + ck ,
k = 0, . . . , N,
(6.51)
és a p(t) = (p0 (t), p1 (t), . . . , pN (t))T oszlopvektort, a (6.2) lineáris rendszer, azaz az alapegyenlet a p(t) ˙ = GN p(t) (6.52) alakba írható. A pk (t) valószínűségek a k pk (t) = P XN (t) = N képlettel adhatók meg, ahol az XN (t) Markov-folyamat értékei a 1 2 0, , , . . . , 1 N N halmazból valók. A pk (t) valószínűségek az átmenet valószínűségekkel a pk (t) =
N X
pj,k (t)pj (0),
j=0
formában fejezhetők ki, ahol k j pj,k (t) = P XN (t) = | XN (0) = N N
dc_483_12 112
6. FEJEZET. KÖZELÍTŐ DIFFERENCIÁLEGYENLETEK
az a feltételes valószínűség, amely megadja, hogy a j-edik állapotból indulva milyen valószínűséggel kerül a rendszer t idő múlva a k-adik állapotba. A (6.52) alapegyenletből nyilvánvaló, hogy az átmenet mátrixa ⊤
TN (t) := [pj,k (t)] = eGN t . A sűrűségfüggő esethez hasonlóan most is, azaz az aszimptotikus sűrűségfüggés esetén, a (6.9) ún. mean-field egyenletet fogjuk közelítő egyenletként használni, melynek alakja x˙ = A(x) − C(x). (6.53) Ezen szakasz fő eredménye a következő tétel, amely a mean-field egyenlet megoldása és a várható érték eltérésére ad egyenletes becslést. 6.6. Tétel. Legyen pk a (6.2) alapegyenlet pm (0) = 1, pj (0) = 0, j 6= m kezdeti feltételnek eleget tevő megoldása. Legyen y1 (t) =
N X k pk (t) N k=0
a folyamat várható értéke, x pedig a (6.53) differenciálegyenlet megoldása az x(0) = m kezdeti feltétel mellett. Tegyük fel továbbá, hogy a (6.50) határértékek y1 (0) = N egyenletesek abban az értelemben, hogy létezik olyan L szám, melyre minden x ∈ [0, 1] és N ∈ N esetén fennáll |A(x) −
AN (N x) L |≤ N N
|C(x) −
,
CN (N x) L |≤ . N N
(6.54)
Ekkor minden t0 > 0 számhoz létezik olyan M , melyre |x(t) − y1 (t)| ≤
M , t ∈ [0, t0 ]. N
A fent definiált (TN (t))t≥0 operátor félcsoport egyenletesen folytonos a CN +1 téren bármely N ∈ N esetén. Ebből következően (TN (t)f )
j N
N X k f = · pj,k (t), N
(6.55)
k=0
amennyiben f = (f0 , . . . , fN ) ∈ CN +1 , ahol a 1 2 N +1 C ≡ f | f : {0, , , · · · , 1} → C N N azonosítással élünk. A továbbiakban tegyük fel, hogy A, C ∈ C 2 [0, 1]. Jelölje a (6.53) egyenlet x0 kezdeti feltételhez tartozó megoldását ϕ(t, x0 ), ekkor a (T (t)f )(x0 ) := f (ϕ(t, x0 )),
f ∈ C([0, 1]), t ≥ 0
(6.56)
dc_483_12 6.5. OPERÁTOR FÉLCSOPORTOK MÓDSZERE
113
operátor félcsoport erősen folytonos a C([0, 1]) téren (lásd például a [52] könyv 3.28. fejezetét), generátorát jelölje (G, D(G)). Ezenkívül tudjuk, hogy f ∈ C 1 ([0, 1]) esetén (Gf )(x0 ) = (A(x0 ) − C(x0 )) · f ′ (x0 ).
A Tétel bizonyítása azon alapszik, hogy a (TN (t))t≥0 félcsoport a (T (t))t≥0 félcsoport approximációjának tekinthető. Azonban a két félcsoport különböző tereken hat, míg az első az XN := CN +1 téren, addig a második az X := C 1 ([0, 1]) függvénytéren. Ahhoz, hogy közös térben alkalmazhassunk approximációs tételt, vezessük be a következő operátorokat JN : XN → X,
JN (f ) := g,
PN : X → XN ,
PN (g) := f, melyre f
k N
=g
k N
(6.57) , k = 0, . . . , N
(6.58)
olyan módon, hogy kJN k ≤ 1, kPN k ≤ 1, N ∈ N és PN JN = IXN , JN PN f → f,
N ∈ N;
N → ∞ ∀f ∈ X
teljesüljön (lásd [17] 3.5. Definíció). Az approximációs eredményt a következő Lemmában fogalmazzuk meg. 6.10. Lemma. Tegyük fel, hogy teljesülnek a 6.6. Tétel feltételei. A (TN (t))t≥0 és (T (t))t≥0 operátor félcsoportokra a következő teljesül. Bármely f ∈ C 2 ([0, 1]) függvényhez és t0 > 0 számhoz van olyan M = M (f, t0 ) > 0 konstans, melyre minden t ∈ [0, t0 ] esetén fennáll k(PN T (t) − TN (t)PN )f k ≤
M , N
(6.59)
ahol PN a (6.58) projekciót jelöli. Bizonyítás: A GN és G generátorokra bármely f ∈ C 2 ([0, 1]) esetén fennállnak az alábbi azonosságok. k k k k (PN Gf ) = A −C · f′ ; N N N N k k ck f ( Nk ) − f ( k−1 ak f ( k+1 N ) − f(N ) N ) (GN PN f ) − , = · · 1 1 N N N N N k = 0, . . . , N. A félcsoportok különbségére vonatkozó becslést a generátorok különbségére vonatkozó becslésből fogjuk levezetni. A generátorok különbsége az alábbi módon két részre bontható. k k k k ak ck k − (GN PN f ) = A − −C + f′ (PN Gf ) N N N N N N N ! ! k k−1 k+1 k ) − f ( ) ) − f ( ) f ( f ( ck a k k k N N N N + f ′( ) − + − f ′( ) . 1 1 N N N N N N
dc_483_12 114
6. FEJEZET. KÖZELÍTŐ DIFFERENCIÁLEGYENLETEK
Az első rész a (6.54) aszimptotikus sűrűségfüggés alapján a következőképpen becsülhető k ) A (N k k L a N k N A (6.60) − = A − ≤ , N N N N N valamint
k ) C (N L c k k N k N C − = C − ≤ N N N N N
(6.61)
felhasználva f ′ korlátosságát. A második rész becsléséhez alkalmazzuk a Taylor-formulát az f ∈ C 2 ([0, 1]) függvényre. Bármely k = 0, . . . , N számhoz létezik olyan ξk ∈ ( Nk , k+1 N ), melyre f ( k+1 ) − f ( k ) ′′ (ξ )
f 1 1 k ′ k N N
f ′′ . − f ( ) = N · · 2 ≤ (6.62) 1 N 2 N 2N N
Mivel az A és C függvények korlátosak a [0, 1] intervallumon (hiszen benne vannak a C 2 [0, 1] térben), azért a (6.60) és (6.61) feltételek miatt aNk és cNk egyenletesen korlátosak k = 0, . . . , N és N ∈ N esetén. Ezért bármely f ∈ C 2 ([0, 1]) függvényhez van olyan K > 0 szám, melyre k(PN G − GN PN ) f k ≤
K ′′ L kf k + kf ′ k. N N
(6.63)
Egyszerűen igazolható, hogy bármely N esetén a TeN (t) := JN TN (t)PN , t ≥ 0 e N := JN GN PN generátorokkal, ahol a operátorok erősen folytonosak az X téren a G JN a (6.57) képletben definiált operátor. Alkalmazzuk a konstans variációs formulát (Corollary III.1.7 az [52] könyvben) a vetítéssel kapott félcsoportok különbségére. Ekkor tetszőleges f ∈ C 2 ([0, 1]) esetén (PN T (t) − TN (t)PN ) f = PN T (t)f − TeN (t)f Z t e N T (s)f ds PN TeN (t − s) G − G = 0 Z t TN (t − s) (PN G − GN PN ) T (s)f ds. = 0
A (6.63) becslésből, felhasználva, hogy T (t) az X tér C 2 ([0, 1]) alterét önmagába képezi (lásd [39] Theorem 1.3), azt kapjuk, hogy minden f ∈ C 2 ([0, 1]) függvényhez léteznek olyan K ∗ > 0 és L∗ > 0 konstansok, melyekkel k(PN T (t) − TN (t)PN ) f k ≤
Z
0
t
K∗ L∗ · k(T (s)f )′′ k + · k(T (s)f )′ k ds. N N
Mivel A, C ∈ C 2 ([0, 1]), azért a (6.53) egyenlet ϕ megoldása is C 2 függvénye a kezdeti feltételnek. Ezért minden s ∈ [0, t] számhoz van olyan Kt > 0, mellyel
(T (s)f )′′ = (f ◦ ϕ(s, ·))′′ = (f ′′ ◦ ϕ) · (ϕ′ )2 + (f ′ ◦ ϕ) · ϕ′′ ≤ Kt · kf kC 2 ,
dc_483_12 6.5. OPERÁTOR FÉLCSOPORTOK MÓDSZERE
115
és hasonlóan k(T (s)f )′ k ≤ Kt∗ · kf kC 2 . Ebből következően minden f ∈ C 2 ([0, 1]) függvényhez és t0 > 0 számhoz van olyan M = M (f, t0 ) > 0 konstans, hogy minden t ∈ [0, t0 ] esetén M . k (PN T (t) − TN (t)PN ) f k ≤ N A most bizonyított Lemma segítségével igazoljuk a 6.6. Tételt. A 6.6. Tétel bizonyítása: Alkalmazzuk a 6.10. Lemmát az f = id[0,1] függvényre. Ekkor minden t0 > 0 számhoz van olyan M = M (id, t0 ) konstans, mellyel minden t ∈ [0, t0 ] esetén k(PN T (t) − TN (t)PN ) idk ≤
M . N
(6.64)
Vegyük észre, hogy (6.24) és (6.55) szerint a következő összefüggés áll fenn y1 (t) =
N N N X X k X k pj,k (t) · pj (0) · pk (t) = · N N k=0
k=0
=
N X
pj (0)
j=0
N X k=0
j=0
N
id(
X k j pj (0) · (TN (t)PN id) ( ) ) · pj,k (t) = N N j=0
= hp(0), TN (t)PN idi. Továbbá (6.56) alapján
k k ) = ϕ(t, ). N N A pm (0) = 1, pj (0) = 0, j 6= m kezdeti feltétel miatt x(0) = y1 (0) = m . Ezért a fentiekből x(t) = ϕ t, N m |y1 (t) − x(t)| = hp(0), TN (t)PN idi − ϕ(t, ) N m M m , = (TN (t)PN id) ( ) − (PN T (t)id) ( ) ≤ N N N (PN T (t)id) (
ahol az utolsó lépésben (6.64)-t használtuk fel.
m N,
így
dc_483_12 116
6. FEJEZET. KÖZELÍTŐ DIFFERENCIÁLEGYENLETEK
dc_483_12
Irodalomjegyzék [1] Adimurthi, Yadava, S.L., An elementary proof of the uniqueness of positive radial solutions of a quasilinear Dirichlet problem, Arch. Rational Mech. Anal. 127 (1994), 219-229. [2] Albert, R., Barabási, A.-L., Statistical mechanics of complex networks, Rev. Mod. Phys. 74 (2002), 47-97. [3] Alexander, J., Gardner, R., Jones, C., A topological invariant arising in the stability analysis of travelling waves, J. Reine Angew. Math. 410 (1990), 167212. [4] Amann, H., Dynamic theory of quasilinear parabolic equations, II.: Reaction diffusion systems, Diff. Int. Eqns. 3 (1990), 13-75. [5] Ambrosetti, A., Brezis, H., Cerami, G., Combined effects of concave and convex nonlinearities in some elliptic problems, J. Func. Anal. 122 (1994), 519-543. [6] Ambrosetti, A., Prodi, G., A Primer of Nonlinear Analysis, Cambridge UP, 1993. [7] Anderson R.M., May, R.M., Infectious diseases of humans: dynamics and control, Oxford University Press 1991. [8] Atkinson, F.V., Peletier, L.A., Elliptic equations with nearly critical growth, J. Diff. Eqns. 70 (1987), 349-365. [9] Ball, F., Mollison, D., Salia-Tomba, G., Epidemics with two levels of mixing, Ann. Appl. Prob. 7 (1997), 46-89. [10] Ball, F., Stochastic and deterministic models for SIS epidemics among a population partitioned into households, Math. Biosci. 156 (1999), 41-68. [11] Ball, F., Neal, P., Network epidemic models with two levels of mixing, Math. Biosci. 212 (2008), 69-87. [12] Ball, F., Sirl, D., Trapman, P., Threshold behaviour and final outcome of an epidemic on a random network with household structure, Adv. Appl. Prob. 41 (2009), 765-796. [13] Banasiak, J., Lachowicz, N., Moszyński, N., Semigroups for generalized brithand-death equations in ℓp spaces, Semigroup Forum 73 (2006), 175-193. 117
dc_483_12 118
IRODALOMJEGYZÉK
[14] Barabási, A.-L., Albert, R., Emergence of scaling in random networks, Science 286 (5439) (1999), 509-512. [15] Barrat, A., Barthélemy, M., Vespignani, A., Dynamical processes on complex networks, Cambridge University Press, Cambridge, 2008. [16] Barthélemy, M., Barrat, A., Pastor-Satorras, R., Vespignani, A., Dynamical patterns of epidemic outbreaks in complex heterogeneous networks, J. Theor. Biol. 235 (2005), 275-288. [17] Bátkai, A., Csomós, P., Nickel, G., Operator splittings and spatial approximations for evolution equations, J. Evol. Equ. 9 (2009), 613-636. [18] Benayoun, M., Cowan, J.D., van Drongelen, W., Wallace, E., Avalanches in a stochastic model of spiking neurons, PLOS Comp. Biol. 6 (7) (2010), e1000846. [19] Berestycki, H., Nicolaenko, B., Scheurer, B., Traveling wave solutions to combustion models and their singular limits, SIAM J. Math. Anal. 16 (1985), 1207-1242. [20] Bobrowski, A., Functional Analysis for Probability and Stochastic Processes. An Introduction, Cambridge, 2005. [21] Bollobás, B., A probabilistic proof of an asymptotic formula for the number of labelled regular graphs, Europ. J. Combin. 1 (1980), 311-316. [22] Bollobás, B., Random graphs, Cambridge University Press, Cambridge, 2001. [23] Bollobás, B., Janson, S., Riordan, O., The phase transition in inhomogeneous random graphs, Random Structures Algorithms 31 (2007), 3-122. [24] Bollobás, B., Janson, S., Riordan, O., Sparse random graphs with clustering, Random Structures Algorithms 38 (2011), 269-323. [25] Bollobás, B., Kozma, R., Miklós, D., Handbook of large-scale random networks, János Bolyai Math. Soc. and Springer-Verlag, Budapest, Berlin 2009. [26] Bollobás, B., Riordan, O., The diameter of a scale-free random graph, Combinatorica 24 (2004), 5-34. [27] Brauer, F., van den Driessche, P., Wu, J., Mathematical epidemiology, In Lecture Notes in Mathematics, Springer-Verlag, Berlin, Heidelberg, 2008. [28] Brezis, H., Nirenberg, L., Positive solutions of nonlinear elliptic equations involving critical Sobolev exponents, Comm. Pure Appl. Math. 36 (1983), 437-477. [29] Brezis, H., Oswald, L., Remarks on sublinear elliptic equations, Nonlin. Anal. 10 (1986), 55-64. [30] Britton, N.F., Reaction-diffusion equations and their applications to biology, Academic Press, London, 1986.
dc_483_12 IRODALOMJEGYZÉK
119
[31] Britton, T., Deijfen, M., Lageras, A.N., Lindholm, M., Epidemics on random graphs with tunable clustering, J. Appl. Probab. 45 (2008), 743-756. [32] Brown, R.F., A topological introduction to nonlinear analysis, Birkhäuser, Boston, MA, 2004. [33] Brown, K.J., Shivaji, R., Instability of nonnegative solutions for a class of semipositone problems, Proc. AMS 112 (1991), 121-124. [34] Castro, A., Sudhasree, G., Uniqueness of stable and unstable positive solutions of semipositone problems, Nonlin. Anal. 22 (1994), 425-429. [35] Castro, A., Shivaji, R., Positive solutions for a concave semipositone Dirichlet problem, Nonlin. Anal. 31 (1998), 91-98. [36] Castro, A., Sudhasree, G., Shivaji, R., Branches of radial solutions for semipositone problems, J. Diff. Eqns. 120 (1995), 30-45. [37] Cazenave, T., Haraux, A., An introduction to semilinear evolution equations, Oxford UP, 1998. [38] Cessac, B., A view of neural networks as dynamical systems, Int. J. Bif. Chaos 20 (2010), 1585-1629. [39] Chicone, C., Ordinary Differential Equations with Applications. Texts in Applied Mathematics, 34. Springer, New York, 2006. [40] Coclite, M.M, Palmieri, G., On a singular nonlinear Dirichlet problem, Comm. Partial Diff. Eqns. 14 (1989), 1315-1327. [41] Choi, Y.S., Lazer, A.C., McKenna, P.J., Some remarks on a singular elliptic boundary value problem, Nonlin. Anal. 32 (1998), 305-314. [42] Coppel, W.A., Dichotomies in stability theory, Lect. Notes Math. 629, Springer, 1978. [43] Csermely P., A rejtett hálózatok ereje, Vince Kiadó, 2005. [44] Daley, D.J., Gani, J., Epidemic modelling: An Introduction, Cambridge University Press, 1999. [45] Díaz, J.I., Hernández, J., Mancebo, F.J. , Branches of positive and free boundary solutions for some singular quasilinear elliptic problems, J. Math. Anal. Appl. 352 (2009), 449-474. [46] Díaz, J.I., Morel, J.M., Oswald, L., An elliptic equation with singular nonlinearity, Comm. Partial Diff. Eqns. 12 (1987), 1333-1344. [47] Diekmann, O., Heesterbeek, J.A.P., Mathematical epidemiology of infectious diseases: model building, analysis and interpretation, John Wiley & Sons Ltd, Chichester, UK, 2000.
dc_483_12 120
IRODALOMJEGYZÉK
[48] Drábek, P., Milota, J., Methods of nonlinear analysis. Applications to differential equations, Birkhäuser, Basel, 2007. [49] Draief, M., Massoulié, L., Epidemics and rumours in complex networks, London Mathematical Society Lecture Note Series, 369. Cambridge University Press, Cambridge, 2010. [50] Eastham, M.S.P., The asymptotic solution of linear differential systems, Clarendon Press, Oxford, 1989. [51] Elbert, Á., A half-linear second order differential equation, Coll. Math. Soc. J. Bolyai 30 (1981), 153-180. [52] Engel, K.-J., Nagel, R., One-Parameter Semigroups for Linear Evolution Equations. Graduate Texts in Math., vol. 194, Springer-Verlag, 2000. [53] Erdős, P. Rényi, A., On Random Graphs I, Publ. Math. Debrecen 6 (1959), 290-297. [54] Erbe, L., Tang, M., Uniqueness theorems for positive radial solutions of quasilinear elliptic equations in a ball, J. Diff. Eqns. 138 (1997), 351-379. [55] Ethier, S. N., Kurtz, T. G., Markov Processes: Characterization and Convergence. John Wiley & Sons Ltd, USA, 2005. [56] Evans, J.W., Nerve axon equations IV: The stable and unstable impulse, Indiana Univ. Math. J. 24 (1974/75), 1169-1190. [57] Farkas, M., Dynamical models in biology, Academic Press, San Diego, CA, 2001. [58] Fiedler, B., Scheel, A., Spatio-temporal dynamics of reaction-diffusion patterns, in Trends in nonlinear analysis, 23-152, Springer, Berlin, 2003. [59] Fife, P.C., Lecture notes in biomathematics, Springer, 1979. [60] Fisher, R.A., The wave of advance of advantegeous genes, Ann. Eugenics 7 (1937), 353-369. [61] FitzHugh, R., Mathematical models of excitation and propagation in nerve, in H.P. Schwan, ed. Biological Engineering, McGraw-Hill, N.Y., 1-85 (1969). [62] Gidas, B., Ni, W.N., Nirenberg, L., Symmetry and related properties via the maximum principle, Comm. Math. Phys. 68 (1979), 209-243. [63] Gilbert, E. N., Random graphs, Ann. Math. Stat. 30 (1959), 1141-1144. [64] Ghoshal, G., Sander, L. M., Sokolov, I. M., SIS epidemics with household structure: the self-consistent field method, Math. Biosci. 190 (2004), 71-85. [65] Giovangigli, V., Multicomponent flow modeling, Birkhauser, 1999.
dc_483_12 IRODALOMJEGYZÉK
121
[66] Gleeson, J.P., High-accuracy approximation of binary-state dynamics on networks, Phys. Rev. Letters 107 (2011), 068701. [67] Goltsev, A. V., de Abreu, F. V., Dorogovtsev, S. N., Mendes, J. F. F., Stochastic cellular automata model of neural networks, Phys Rev E 81 (2010), 061921. [68] Green, D. M., Kiss, I. Z., Kao, R. R., Modelling the initial spread of footand-mouth disease through animal movements, Proc. R. Soc. B 273 (2006), 2729-2735. [69] Grindrod, P., Patterns and Waves: The Theory and Applications of ReactionDiffusion Equations, Oxford UP, 1991. [70] Henry, D., Geometric theory of semilinear parabolic equations, Springer, 1981. [71] Hernández, J., Mancebo, F.J., Singular elliptic and parabolic equations, Handbook of differential equations, M. Chipot, P. Quittner eds., Vol.3., 317-400, Elsevier, (2006). [72] Hiebeler, D., Moment equations and dynamics of a household SIS epidemiological model, Bull. Math. Biol. 68 (2006), 1315-1333. [73] House, T., Davies, G., Danon, L., Keeling, M.J., A Motif-Based Approach to Network Epidemics, Bull. Math. Biol. 71 (2009), 1693-1706. [74] House, T., Keeling, M.J., Deterministic epidemic models with explicit household structure, Math. Biosci. 213 (2008), 29-39. [75] House, T., Keeling, M.J., Insights from unifying modern approximations to infections on networks, J. Roy. Soc. Interface 8 (2011), 67-73. [76] Hundsdorfer, W., Verwer, J.G., Numerical solution of time-dependent advection-diffusion-reactions equations, Springer, 2003. [77] Isham, V., Harden, S., Nekovee, M., Stochastic epidemics and rumours on finite random networks, Physica A 389 (2010), 561-576. [78] Joseph, D.D., Lundgren, T.S., Quasilinear Dirichlet problems driven by positive sources, Arch. Rational Mech. Anal. 49 (1973), 241-269. [79] Kato, T., On the semi-groups generated by Kolmogoroff’s differential equations, J. Math. Soc. Japan 6 (1954), 1-15. [80] Keeling, M.J., The effects of local spatial structure on epidemiological invasions, Proc. R. Soc. Lond. B 266 (1999), 859-867. [81] Keeling, M.J., The implications of network structure for epidemic dynamics, Theor. Popul. Biol. 67 (2005), 1-8. [82] Keeling, M.J., Eames, K.T.D., Networks and epidemic models, J. Roy. Soc. Interface 2 (2005), 295-307.
dc_483_12 122
IRODALOMJEGYZÉK
[83] Keeling, M.J., Rohani, P., Modeling infectious diseases in humans and animals, Princeton University Press, Princeton, NJ, 2008. [84] Keener, J., Sneyd, J., Mathematical physiology. Vol. I: Cellular physiology, Springer, New York, 2009. [85] Keener, J., Sneyd, J., Mathematical physiology. Vol. II: Systems physiology, Springer, New York, 2009. [86] Kermack, W.O., McKendrick, A.G., A contribution to the mathematical study of epidemics, Proc. R. Soc. London Ser. A 115 (1927), 700-721. [87] Kiss, I.Z., Green, D.M., Kao, R.R., The network of sheep movements within Great Britain: network properties and their implications for infectious disease spread, J. R. Soc. Interface 3 (2006), 669-677. [88] Kiss, I.Z., Green, D.M., Kao, R.R., The effect of network heterogeneity and multiple routes of transmission on final epidemic size, Math. Biosci. 203 (2006), 124-136. [89] Kolmogorov, A., Petrovsky, I., Piscounov, N., Study of the diffusion equation with growth of the quantity of matter and its application to a biological problem, (French) Moscow Univ. Bull. Math. 1 (1937), 1-25. [90] Korman, P., Li, Y., Ouyang, T., An exact multiplicity result for a class of semilinear equations. Comm. Partial Diff. Eqns. 22 (1997), 661-684. [91] Korman, P., Uniqueness and exact multiplicity of solutions for a class of Dirichlet problems, J. Diff. Eqns. 244 (2008), 2602-2613. [92] Kuramoto, Y., Chemical oscillations, waves, and turbulence, Springer, Berlin, 1984. [93] Kurtz, T.G., Solutions of ordinary differential equations as limits of pure jump Markov processes, J. Appl. Prob. 7 (1970), 49-58. [94] Kurtz, T.G., Biological growth and spread, In: Lect. Notes Biomath. 38 (1980), 449-467. [95] Kuzin, I., Pohozaev, S., Entire solutions of semilinear elliptic equations, Birkhäuser, Basel, 1997. [96] Kwong, M.K., Uniqueness of positive radial solutions of ∆u − u + up = 0 in Rn , Arch. Rat. Mech. Anal. 105 (1989), 243-266. [97] Kwong, M.K., Li, Y., Uniqueness of radial solutions of semilinear elliptic equations, Trans. Amer. Math. Soc. 333 (1992), 339-363. [98] Laetsch, T., The number of solutions of a nonlinear two point boundary value problem, Indiana Univ. Math. J. 20 (1970), 1-14.
dc_483_12 IRODALOMJEGYZÉK
123
[99] Laetsch, T., The theory of forced, convex, autonomous, two point boundary value problems, Rocky Mountain J. Math. 15 (1985), 133-154. [100] Liljeros, F., Edling, C. R., Amaral, L. A. N., Stanley, H. E., Aberg, Y., The web of human sexual networks, Nature 411 (2001), 907-908. [101] Lindquist, J., Ma, J., van den Driessche, P., Willeboordse, F.H., Effective degree network disease models, J. Math. Biol. 62 (2011), 143-164. [102] Lions, P.L., On the existence of positive solutions of semilinear elliptic equations, SIAM Rev. 24 (1982), 441-467. [103] Leung, A.W., Nonlinear systems of partial differential equations. Applications to life and physical sciences, World Scientific Publishing, Hackensack, NJ, 2009. [104] Maki, D.P., Mathematical Models and Applications, with Emphasis on Social, Life, and Management Sciences, Prentice-Hall, Englewood Cliffs, NJ, 1973. [105] Matsuda, H.N., Ogita, A., Sasaki, A., Sato, K., Statistical mechanics of populations: The lattice Lotka Volterra model, Prog. Theor. Phys. 88 (1992), 1035-1049. [106] May, R.M., Lloyd, A.L., Infection dynamics on scale-free networks, Phys. Rev. E 64 (2001), 066112. [107] Maya, C., Shivaji, R., Instability of nonnegative solutions for a class of semilinear elliptic boundary value problems, J. Comp. Appl. Math. 88 (1998), 125-128. [108] McLeod, K., Uniqueness of positive radial solutions of ∆u + f (u) = 0 in Rn II, Trans. Amer. Math. Soc. 339 (1993), 495-505. [109] Murray, J.D., Mathematical biology, Springer, Berlin, 1993. [110] Nekovee, M., Moreno, Y., Bianconi, G., Marsili, M., Theory of rumour spreading in complex social networks, Physica A 374 (2007), 457-470. [111] Newman, M. E. J., Spread of epidemic disease on networks Phys. Rev. E 66 (2002), 016128. [112] Newman, M. E. J., Networks: An Introduction, Oxford, 2010. [113] Newman, M. E. J., Barabási, A.-L., Watts, D.J., The structure and dynamics of networks, Princeton University Press, Princeton, NJ, 2006. [114] Ni, W.M., Nussbaum, R.D., Uniqueness and nonuniqueness for positive radial solutions of ∆u + f (u, r) = 0, Comm. Pure Appl. Math. 38 (1985), 67-108. [115] Ouyang, T., Shi, J., Exact multiplicity of positive solutions for a class of semilinear problem. J. Diff. Eqns. 146 (1998), 121-156.
dc_483_12 124
IRODALOMJEGYZÉK
[116] Ouyang, T., Shi, J., Exact multiplicity of positive solutions for a class of semilinear problem:II. J. Diff. Eqns. 158 (1999), 94-151. [117] Palmer, K.J., Exponential dichotomies and Fredholm operators, Proc. AMS 104 (1988), 149-156. [118] Pao, C.V., Nonlinear parabolic and elliptic equations, Plenum Press, New York, 1992. [119] Pastor-Satorras, R., Vespignani, A., Epidemic dynamics and endemic states in complex networks, Phys Rev E 63 (2001), 066117. [120] Pazy, A., Semigroups of linear operators and applications to partial differential equations, Springer, New York, 1983. [121] Phillipson, P.E., Schuster,P., Modeling by nonlinear differential equations. Dissipative and conservative processes, World Scientific Publishing, Hackensack, NJ, 2009. [122] Pohozaev, S.I., Eigenfunctions of the equation ∆u + f (u) = 0, Soviet Math. 5 (1965), 1408-1411. [123] Potterat, J.J., Muth, S.Q., Rothenberg, P.B., Zimmerman-Rogers, H., Green, D.L., Taylor, J.E., Bonney, M.S., White, H.A., Sexual network structure as an indicator of epidemic phase, Sex. Transm. Infect. 78 (2002), 152-158. [124] Rand, D.A., Correlation equations for spatial ecologies, In: McGlade, J (ed.) Advanced Ecological Theory, pp. 100-142. Blackwell, Oxford, 1999. [125] Robinson, J.C., Infinite-dimensional dynamical systems. An introduction to dissipative parabolic PDEs and the theory of global attractors, Cambridge UP, 2001. [126] Rothe, F., Global solutions of reaction-diffusion systems, Lecture Notes in Math. 1072, Springer, Berlin, 1984. [127] Ross, J.V., House, T., Keeling, M.J., Calculation of disease dynamics in a population of households, PLoS ONE 5 (2010), e9666. [128] Rubinstein, I., Electro-diffusion of ions, SIAM, Philadelphia, PA, 1990. [129] Sandstede, B., Scheel, A., On the structure of spectra of modulated travelling waves, Math. Nachr. 232 (2001), 39-93. [130] Schaaf, R., Global Solution Branches of Two Point Boundary Value Problems, Springer Lect. Notes in Math. 1458, 1990. [131] Schmidt, D., Best, J., and Blumberg, M.S., Random graph and stochastic process contributions to network dynamics (To appear in AIMS Proceedings) (2012).
dc_483_12 IRODALOMJEGYZÉK
125
[132] Sharkey, K., Deterministic epidemiological models at the individual level, J. Math. Biol. 57 (2008), 311-331. [133] Sharkey, K., Deterministic epidemic models on contact networks: correlations and unbiological terms, Theor. Popul. Biol. 79 (2011), 115-129. [134] Shi, J., Solution set of semilinear elliptic equations. Global bifurcation and exact multiplicity, World Scientific Publishing, Hackensack, NJ, 2010. [135] Smith, G. J. et al. , Origins and evolutionary genomics of the 2009 swine-origin H1N1 influenza A epidemic, Nature 459 (2009), 1122-1125. [136] Smoller, J.A., Shock waves and reaction diffusion equations, Springer, 1983. [137] Smoller, J.A., Wassermann, A.G., Existence, uniqueness, and nondegeneracy of positive solutions of semilinear elliptic equations, Comm. Math. Phys. 95 (1984), 129-159. [138] Srikanth, P.N., Uniqueness of solutions of nonlinear Dirichlet problems, Diff. Int. Eqns. 6 (1993), 663-670. [139] Struwe, M., Variational Methods, Applications to Nonlinear Partial Differential Equations and Hamiltonian Systems, Springer, 1990. [140] Stuart, C.A., Existence and approximation of solutions of nonlinear elliptic equations, Math. Z. 147 (1976), 53-63. [141] Tang, M., Exact multiplicity for semilinear elliptic Dirichlet problems involving concave and convex nonlinearities, Proc. Royal Soc. Edin. A 133 (2003), 705717. [142] Tertikas, A., Stability and instability of positive solutions of semipositone problems Proc. AMS 114 (1992), 1035-1040. [143] Turing, A.M., The chemical basis of morphogenesis, Phil. Trans. R. Soc. Lon. B 237 (1952), 37-72. [144] van Baalen, M., Pair Approximations for different spatial geometries, In: Dieckmann, U., Law, R., Metz, J.A.J. (eds.) The geometry of ecological interactions: Simplifying complexity, 359-387, Cambridge University Press, 2000. [145] Volpert, A.I., Volpert, V.A., Volpert, V.A., Traveling wave solutions of parabolic systems, AMS, 1994. [146] Volz, E., SIR dynamics in random networks with heterogeneous connectivity, J. Math. Biol. 56 (2008), 293-310. [147] Wang, S.H., Yeh, T.S., A complete classification of bifurcation diagrams of a Dirichlet problem with concave-convex nonlinearities, Math. Anal. Appl. 291 (2004), 128-153.
dc_483_12 126
IRODALOMJEGYZÉK
[148] Watts, D. J., Strogatz, S., Collective dynamics of ’small-world’ networks, Nature 393 (6684) (1998), 440-442. [149] Yadava, S.L., Exact number of positive solutions of the Dirichlet problem: −∆u = up + uq in a ball, in Geometry, analysis and applications (Varanasi, 2000), 283-292, (2001). [150] Yap, H.P. Some topics in graph theory, LMS Lecture Notes Series 108, Cambridge University Press, 1986. [151] Zanette, D.H., Dynamics of rumor propagation on small-world networks, Phys. Rev. E 65 (2002), 041908. [152] Zeldovich, Ya.B., Barenblatt, G.I., Librovich, V.B., Makhviladze, G.M., The mathematical theory of combustion and explosions, Consultants Bureau, 1985. [153] Zhang, L., Uniqueness of positive solutions of ∆u+u+up = 0 in a ball, Comm. Partial Diff. Eqns. 17 (1992), 1141-1164. [154] Zhang, L., On a Dirichlet problem with a singular nonlinearity, J. Math. Anal. Appl. 194 (1995), 103-113. [155] Zhao, Y., Wang, Y., Shi, J., Exact multiplicity of solutions and S-shaped bifurcation curve for a class of semilinear eliptic equations, Math. Anal. Appl. 331 (2007), 263-278. Saját publikációk [156] Simon, P.L., Farkas, H., Geometric theory of trigger waves - A dynamical system approach, J. Math. Chem. 19 (1996), 301-315. [157] Lázár, A., Försterling, H.-D., Farkas, H., Simon, P.L., Volford, A., Noszticzius, Z., Waves of excitation on non-uniform membrane rings, caustics and reverse involutes, Chaos 7 (1997), 731-737. [158] Volford, A., Simon, P.L., Farkas, H., Noszticzius, Z., Rotating chemical waves: theory and experiments, Physica A 274 (1999), 30-49. [159] Hegedűs, L., Kirschner, N., Wittmann, M., Simon, P.L., Noszticzius, Z., Amemiya, T., Ohmori, T., Yamaguchi, T., Nonlinear effects of electrolyte diodes and transistors in a polymer gel medium, Chaos 9 (1999), 283-297. [160] Merkin, J.H., Simon, P.L., Noszticzius, Z., Analysis of the electrolyte diode. Electro- diffusion and chemical reaction within a hydrogel reactor, J. Math. Chem. 28 (2000), 43- 58. [161] Ivan, K., Wittmann, M., Simon, P. L, Noszticzius, Z., Vollmer, J., Electrolyte diodes and hydrogels: Determination of concentration and pK value of fixed acidic groups in a weakly charged hydrogel, Phys. Rev. E 70 (2004), 061402.
dc_483_12 IRODALOMJEGYZÉK
127
[162] Simon, P.L., Kalliadasis, S., Merkin, J.H., Scott, S.K., Quenching of flame propagation with heat loss, J. Math. Chem. 31 (2002), 313-332. [163] Simon, P.L., Kalliadasis, S., Merkin, J.H., Scott, S.K., Quenching of flame propagation through endothermic reaction, J. Math. Chem. 32 (2002), 73-98. [164] Simon, P.L., Kalliadasis, S., Merkin, J.H., Scott, S.K., Evans function analysis of the stability of non-adiabatic flames, Combust. Theor. Mod. 7 (2003), 545561. [165] Simon, P.L., Kalliadasis, S., Merkin, J.H., Scott, S.K., Inhibition of flame propagation by an endothermic reaction, IMA J. Appl. Math. 68 (2003), 537562. [166] Simon, P.L., Kalliadasis, S., Merkin, J.H., Scott, S.K., Stability of flames in an exothermic-endothermic system. IMA J. Appl. Math. 69 (2004), 175-203. [167] Simon, P.L., Kalliadasis, S., Merkin, J.H., Scott, S.K., On the structure of the spectra for a class of combustion waves, J. Math. Chem. 35 (2004), 309-328. [168] Simon, P.L., Kalliadasis, S., Merkin, J.H., Scott, S.K., The effect of a radical scavenger on the propagation of flames in an exothermic-endothermic system, J. Math. Chem. 38 (2005), 203-231. [169] Simon, P.L., Merkin, J.H., Scott, S.K., Bifurcations in non-adiabatic flame propagation models, in Focus on Combustion Research, ed. Sung Z. Jiang, Nova Science Publishers, New York, pp. 315-357, (2006). [170] Simon, P.L., Transverse instability of non-adiabatic flames, Lect. Ser. Computer and Computational Sci. 7 (2006), 1398-1401. [171] Kiss, I.Z., Merkin, J.H., Scott, S.K., Simon, P.L., Travelling waves in the Oregonator model for the BZ reaction, Phys. Chem. Chem. Phys. 5 (2003), 5448 - 5453. [172] Kiss, I.Z., Merkin, J.H., Scott, S.K., Simon, P.L., Electric field effects on travelling waves in the Oregonator model for the BZ reaction, Quart. J. Mech. Appl. Math. 57 (2004), 467-494. [173] Jakab, E., Horvath, D., Merkin, J.H., Scott, S.K., Simon, P.L., Toth., A., Isothermal flame balls, Phys. Rev. E 66 (2002), 016207. [174] Jakab, E., Horvath, D., Merkin, J.H., Scott, S.K., Simon, P.L., Toth., A., Isothermal flame balls: Effect of autocatalyst decay, Phys. Rev. E 68 (2003), 03621. [175] Hofbauer, J., Simon, P.L., An existence theorem for parabolic equations on RN with discontinuous nonlinearity, Electr.J. Qual. Theor. Diff. Eqns. 8 (2001), 1-9.
dc_483_12 128
IRODALOMJEGYZÉK
[176] Engländer, J., Simon P.L., Nonexistence of solutions to KPP-type equations of dimension greater than or equal to one, Electr. J. Diff. Eqns. Vol. 2006 (2006), No. 09, 1-6. [177] Simon, P.L., On the structure of spectra of travelling waves, Electr.J. Qual. Theor. Diff. Eqns. 15 (2003), 1-19. [178] Karátson, J., Simon, P.L., Bifurcations of semilinear elliptic equations with convex nonlinearity, Electr. J. Diff. Eqns. 1999 (43) (1999), 1-16. [179] Karátson, J., Simon, P.L., On the stability properties of nonnegative solutions of semilinear problems with convex or concave nonlinearity, J. Comp. Appl. Math. 131 (2001), 497-501. [180] Karátson, J., Simon, P.L., On the linearized stability of positive solutions of quasilinear problems with p-convex or p-concave nonlinearity, Nonlin. Anal. 47 (2001), 4513-4520. [181] Farkas, G., Simon, P.L., Stability properties of positive solutions to partial differential equations with delay, Electr. J. Diff. Eqns. 2001 (64) (2001), 1-8. [182] Karátson, J., Simon, P.L., Exact multiplicity for degenerate two-point boundary value problems with p-convex nonlinearity, Nonlin. Anal. 52 (6) (2003), 1569-1590. [183] Hernández, J., Karátson, J., Simon, P.L., Multiplicity for semilinear elliptic equations involving singular nonlinearity, Nonlin. Anal. 65 (2006), 265-283. [184] Horváth, T., Simon, P.L., On the exact number of solutions of a singular boundary value problem, J. Diff. Int. Eqns. 22 (2009), 787-796. [185] Simon, P.L., Exact multiplicity of positive solutions for a class of singular semilinear equations, Diff. Eq. Dyn. Sys. 17 (2009), 147-161. [186] Kiss, I.Z., Simon, P.L., Kao, R.R., A contact-network-based formulation of a preferential mixing model, Bull. Math. Biol. 71 (2009), 888-905. [187] Kiss., I.Z., Cassell, J., Recker, M., Simon, P.L., The impact of information transmission on epidemic outbreaks, Math. Biosci. 225 (2010), 1-10. [188] Simon, P.L., Taylor, M., Kiss, I.Z., Exact epidemic models on graphs using graph automorphism driven lumping, J. Math. Biol. 62 (2010), 479-508. [189] Hatzopoulos, V., Taylor, M., Simon, P.L., Kiss, I.Z., Multiple sources and routes of information transmission: implications for epidemic dynamics, Math. Biosci. 231 (2011), 197-209. [190] Taylor, M., Simon, P. L., Green, D. M., House, T., Kiss, I. Z., From Markovian to pairwise epidemic models and the performance of moment closure approximations, J. Math. Biol. 64 (2012), 1021-1042.
dc_483_12 IRODALOMJEGYZÉK
129
[191] Kiss., I.Z., Berthouze, L., Taylor, T.J., Simon, P.L., Modelling approaches for simple dynamic networks and applications to disease transmission models, Proc. Roy. Soc. A 468 (2141), (2012), 1332-1355. [192] Bátkai, A., Kiss, I.Z., Sikolya.E., Simon, P.L., Differential equation approximations of stochastic network processes: an operator semigroup approach, Netw. Heter. Media 7 (2012), 43-58. [193] Simon, P.L., Kiss, I.Z., From exact stochastic to mean-field ODE models: a new approach to prove convergence results, IMA J. Appl. Math., 2012, doi: 10.1093/imamat/hxs001. [194] Simon, P.L., Kiss, I.Z., New moment closures based on a priori distributions with applications to epidemic dynamics, Bull. Math. Biol., 74 (2012), 15011515. [195] Szabó, A., Simon, P.L., Kiss., I.Z., Detailed study of bifurcations in an epidemic model on a dynamic network, Diff. Eqn. Appl., 4 (2012), 277-296.