Óbudai Egyetem BGK
Fejezetek a matematikából
Hanka László Fejezetek a matematikából Egyetemi jegyzet
Budapest, 2013 ÓE - BGK - 3041
Óbudai Egyetem BGK
Szerző: Dr. Hanka László adjunktus (OE BGK) Lektor: Hosszú Ferenc mestertanár (OE BGK)
Fejezetek a matematikából
Óbudai Egyetem BGK
Fiamnak Boldizsárnak
Fejezetek a matematikából
Óbudai Egyetem BGK
Fejezetek a matematikából
Óbudai Egyetem BGK
Fejezetek a matematikából
Előszó Ez az elektronikus egyetemi jegyzet elsősorban mérnökhallgatóknak szól. Kettős célt szolgál. Egyrészt biztosítani szeretnénk a lehetőséget, hogy a BSc szak viszonylag csekély számú matematika óráján el nem hangzott, de a műszaki tárgyak megértéséhez és feldolgozásához elengedhetetlenül szükséges tananyagot a hallgató önállóan, vagy egy választható kurzus keretein belül megtanulhassa. Ugyanakkor tankönyvként szolgálhat azon MSc szakos hallgatók számára is, akik a feldolgozott fejezetek közül valamelyiket tanulmányaik során hallgatják. A jegyzet elsősorban a gyakorlatra helyezi a hangsúlyt. Természetesen cél az, hogy a hallgatók megismerjenek olyan fejezeteket a matematikából, amely az alapképzésbe vagy esetleg a mesterképzés keretei közé sem fér be, de a mérnöki gyakorlat számára elengedhetetlen. Szeretnénk szélesíteni a leendő mérnökök látókörét további matematikai ismeretekkel, bemutatni különböző elméleteket és ezek módszereit, de elsősorban úgy, hogy az elmélet alkalmazását példákon keresztül illusztráljuk. A 210 részletesen kidolgozott feladat és a 45 ábra segíti az elmélet megértését. Természetesen a megfogalmazott állítások nagy részét bebizonyítjuk, de nem mindegyiket. Nem matematikusok számára íródott ez a jegyzet, hanem mérnökök számára. Ezért azokat az állításokat igazoljuk, amelyek elősegítik a témakör logikájának pontosabb megértését és esetleg az alkalmazott ötletek segítséget nyújthatnak a gyakorlati problémák megoldásában. A túlzottan bonyolult, szélsőségesen elméleti fejtegetéseket mellőztük, egy érdeklődő hallgató igény szerint ezeknek utána tud nézni a jegyzet végén közölt szakirodalomban. A feldolgozott témakörök a következők. Lineáris algebra és mátrixelmélet, differenciálegyenletek és differenciálegyenlet rendszerek elmélete, sorelmélet, Taylor-sorok és valós valamint komplex Fourier-sorok elmélete. Mindenütt igyekeztünk az alkalmazásokat nagy hangsúllyal szerepeltetni. Külön kiemeljük, hogy a másodrendű differenciálegyenletek fejezetében részletesen tárgyaljuk a harmonikus, csillapított és gerjesztett rezgések elméletét, amelynek ismerete egy mérnökember számára nélkülözhetetlen. Egy jól képzett mérnök természetesen állandóan képzi magát, ez a jegyzet természetesen nem egy kimerítő tárháza a szüksége ismereteknek, de úgy gondoljuk, első lépésnek első lépésként megfelelő, mert nagyon reméljük, hogy mindenkiben felmerül az önképzés, továbbképzés igénye. Ebben a jegyzetben együtt gondolkodásra invitáljuk a tisztelt Olvasót, ezért a szöveg megfogalmazása némileg különbözik a szokásos „száraz” matematikai fogalmazástól. Megpróbáltunk „hangosan gondolkodni”, hogy az olvasó érezze, milyen új kérdések fogalmazódnak meg egy elmélet kifejtése során, és azokra hogyan lehet válaszolni. A jegyzet feldolgozásához, a matematika felfedezéséhez sok örömöt és sikerélményt kíván a Szerző Budapest, 2013. május. 31.
5
Óbudai Egyetem BGK
Fejezetek a matematikából
6
Óbudai Egyetem BGK
Fejezetek a matematikából
1. fejezet Mátrixelmélet, Lineáris algebra
7
Óbudai Egyetem BGK
Fejezetek a matematikából
8
Óbudai Egyetem BGK
Fejezetek a matematikából
1. Lineáris algebra 1.1. A lineáris tér. Alapfogalmak A lineáris algebra legfontosabb fogalmai közé tartozik a lineáris tér, vagy más néven a vektortér fogalma. Ez bizonyos tulajdonságoknak, feltételeknek eleget tevő elemek, objektumok halmaza. A lineáris tér legalapvetőbb fogalmai közé tartoznak a bázis, a dimenzió. A következőkben a felsorolt fogalmak tisztázásával, majd a lineáris algebra apparátusának alkalmazásával foglalkozunk. Célunk elsősorban az, hogy a későbbi fejezetekben részletesen tárgyalt differenciálegyenlet rendszerek valamint a Fourier-sorok elméletét megalapozzuk. A matematikában nagyon gyakori műveletek az összeadás és a számmal való szorzás. A vektortér olyan elemhalmaz, amelyben ez a két művelet értelmezve van, és amely műveletektől megköveteljük azokat a tulajdonságokat, amelyeket a matematika konkrét objektumainak tanulmányozása során megismertünk. 1.1.Definíció: Legyenek az x, y, z, … elemek (általános értelemben vett „vektorok”) egy bizonyos L halmaz elemei, α, β, γ,… pedig legyenek valós számok. Ekkor az (L, R) párt valós lineáris térnek, vagy valós vektortérnek nevezzük, ha teljesülnek az alábbi axiómák. (A továbbiakban egyszerűen az L szimbólummal hivatkozunk egy vektortérre. ) A) Az L halmaz bármely két xL és yL eleméhez egyértelműen hozzá van rendelve az L halmaznak egy eleme, amelyet az x és y összegének nevezünk és x+y-nal jelölünk, és erre a műveletre érvényesek az alábbi tulajdonságok: 1. x+y = y+x, tehát az összeadás kommutatív; 2. (x+y)+z = x+(y+z), tehát az összeadás asszociatív; 3. létezik L-ben úgynevezett nullelem (nullvektor), jele 0, amelyre igaz, hogy tetszőleges xL esetén x+0 = x; 4. minden L-beli x-nek létezik ellentettje, jele –x; melyre teljesül, hogy x + (–x) = 0. B) Az L halmaz bármely xL eleméhez és bármely αR valós számhoz egyértelműen hozzá van rendelve az L halmaznak egy eleme, amelyet az α valós szám és xL szorzatának nevezünk és α∙x-szel jelölünk, és erre a műveletre érvényesek az alábbi tulajdonságok: 1. az 1R valós számnak és az xL elemnek a szorzata éppen x, minden L-beli x-re, azaz 1∙x = x; 2. tetszőleges αR és βR valós számok és tetszőleges xL esetén a szorzás asszociatív, azaz α(βx) = (αβ)x; 3. a szorzás az összeadásra nézve disztributív művelet, azaz tetszőleges α, β valós számok és tetszőleges x, yL elemek esetén(α+β)x = αx + βx, illetve α(x+y) = αx + αy.
9
Óbudai Egyetem BGK
Fejezetek a matematikából
A fenti definícióban, mint látható valóban azok a műveletek és műveleti azonosságok szerepelnek, amelyeket a matematika különböző területein, már megismertünk, mondhatnánk, nem láttunk semmi újat. Nos a lényeg éppen ebben van. A lineáris algebra alapvető fogalma a lineáris tér, éppen azokat a törvényszerűségeket, szabályokat keressük a lineáris algebrában, amelyek a fenti tulajdonságok érvényesülése esetén biztosan teljesülnek, függetlenül attól, hogy mik is annak a „misztikus”L halmaznak az elemei. Ebben éppen a matematika lényege tükröződik, hogy tudniillik általánosít, általános tételeket keres, miközben elvonatkoztat a konkrétumoktól, csak azokkal a részletekkel törődik, amelyek valóban fontosak. Ennek megfelelően, ha lineáris térről vagy vektortérről beszélünk, akkor az L halmaz elemeit általános értelemben vett „vektor”-nak nevezzük, még akkor is, ha az elemek nem a klasszikus értelemben vett vektorok.A későbbiekben, mint eddig is tettük, a „vektorokat” vastag betűvel írjuk, akkor is ha nem a klasszikus értelemben vett vektorokról van szó. Az L halmaz elemeitől, tehát a vektoroktól való megkülönböztetésképpen, a valós számokat skalároknak nevezzük. 1.1.Példa: Példák lineáris térre 1. A hagyományos, n valós komponensű vektorok halmaza, jele:Rn, a műveletek pedig a hagyományos vektorösszeadás, és vektor számmal való szorzása. A „vektortér” elnevezés éppen innen származik. 2. Egy adott [a, b] intervallumon értelmezett valós értékű függvények halmaza a szokásos függvényösszeadásra és számmal való szorzásra vonatkozólag. Itt tehát a „vektor” egy függvény. Ezzel a vektortérrel dolgozunk majd a Fourier-sorok elméletében. 3. Az n sorú és k oszlopú (tehát „n-szer k-as”) valós komponensű mátrixok halmaza, jele Rnxk, a szokásos mátrixösszeadásra és számmal való szorzásra. Ez esetben a „vektor” egy mátrix. A lineáris tér bizonyos részhalmazainak kitüntetett szerepe van. Ezek azok a részhalmazok, amelyek önmagukban is vektorterek, tehát amelyekre teljesül a vektortér definíciójában szereplő hét axióma. 1.2.Definíció: Az L lineáris tér L’ részhalmazát az L vektortér alterének (lineáris altér) nevezzük, ha az L’ halmaz ugyancsak vektortér az L-ben értelmezett műveletekre, azaz teljesülnek a vektortér axiómák. Egyszerűen megfogalmazható egy feltétel arra vonatkozólag, hogy egy L’ részhalmaz altér legyen. 1.1.Tétel: Az L lineáris tér L’ részhalmaza akkor és csak akkor altér, ha tetszőleges α és β skalárok, valamint tetszőleges x, yL’ esetén teljesül, hogy αx + βyL’. Ez másképpen úgy fogalmazható, hogy egy L’ részhalmaz pontosan akkor altér, ha a lineáris kombináció képzése nem vezet ki az L’ halmazból. Bizonyítás: A vektortér axiómák szerint elemek egy halmaza akkor vektortér, ha értelmezve van egy összeadás és egy skalárral való szorzás, amelyre teljesül a hét műveleti tulajdonság. Mivel L’ részhalmaza L-nek és L-ben teljesülnek ezek az axiómák, nyilván igaz, hogy L’-ben is teljesülnek. Kizárólag azt kell megkövetelnünk, hogy
10
Óbudai Egyetem BGK
Fejezetek a matematikából
1. „Az L’ halmaz bármely két xL’ és yL’ eleméhez egyértelműen hozzá van rendelve az L’ halmaznak egy eleme, amelyet az x és y összegének nevezünk és x+ y-nal jelölünk.” 2. „Az L’ halmaz bármely xL’ eleméhez és bármely α R valós számhoz egyértelműen hozzá van rendelve az L’ halmaznak egy eleme, amelyet az α valós szám és xL’ szorzatának nevezünk és α∙x-szel jelölünk.” Mivel megköveteltük, hogy a lineáris kombináció ne vezessen ki az L’-ből ez a két feltétel nyilvánvalóan teljesül. ■ A tétel úgy is fogalmazható, hogy az L lineáris tér egy L’ részhalmaza pontosan akkor altér, ha tetszőleges elemeinek összes lineáris kombinációját is tartalmazza. 1.3.Definíció: Azt a legszűkebb L’ lineáris teret, amely az x1, x2, x3, …xnL-beli vektorokat tartalmazza az x1, x2, x3, …xn vektorok által generált altérnek (vektorok által kifeszített altérnek) nevezzük. Nyilvánvaló az alábbi állítás. 1.2.Tétel: Az x1, x2, x3, …xnL-beli vektorok által generált L’ altér nem más, mint az x1, x2, x3, …xn vektorok összes lineáris kombinációinak halmaza. Tehát L ' 1x1 2 x2 ... n xn 1, 2 ,..., n R;
Bizonyítás: Egyrészt azt kell bizonyítani, hogy a lineáris kombináció nem vezet ki az L’-ből. Ez nyilvánvaló, mert definíció szerint az összes lineáris kombinációt tartalmazza. Másrészt azt kell igazolni, hogy ez a legszűkebb ilyen vektortér, de ez is nyilvánvaló, hiszen ha ennél szűkebb lenne, már nem tartalmazhatná valamennyi lineáris kombinációt, így a lineáris kombináció kivezetne L’-ből. ■ 1.2.Példa: Példák lineáris altérre. Vektorterek lineáris altereire hozunk példákat. A fentiek szerint egy részhalmaz akkor altér, ha zárt a lineáris kombináció képzésére. Ilyen halmazokat említünk. 1. Az R2-ben, tehát a síkban, altér minden olyan egyenes, amely az origóra illeszkedik, azaz ha végiggondoljuk ez az altér az
L ' x x R 2 , R ; alakú elemek halmaza. Ez igaz általában Rn-ben is, csak n> 3 esetén az „egyenes”-nek már nincs szemléletes tartalma, viszont éppen a fenti formulával értelmezhető. Ha az egyenes nem illeszkedik az origóra, akkor nem altér, mert egy vektortérnek mindig eleme a nullvektor. 2. Az R3-ban, tehát a térben, altér minden olyan sík, amely az origóra illeszkedik, tehát az
L ' 1x1 2 x2 x1 , x2 R3 ; 1 , 2 R ; 11
Óbudai Egyetem BGK
Fejezetek a matematikából
alakú elemek halmaza. Ez igaz általában Rn-ben is, csak n> 3 esetén a „sík”-nak már nincs szemléletes tartalma, viszont éppen a fenti formulával értelmezhető. Ha a sík nem illeszkedik az origóra, akkor nem altér, mert egy vektortérnek mindig eleme a nullvektor. 3. Egy adott [a, b] intervallumon értelmezett valós értékű folytonos/differenciálható/integrálható függvények halmaza a szokásos függvényösszeadásra és számmal való szorzásra vonatkozólag. Ezek a bevezetőben említett 2. példabeli vektortér alterei. 4. Az n sorú és k oszlopú (tehát „n-szer k-as”) valós komponensű mátrixok Rnxk vektorterében azon mátrixok, amelyekre igaz, hogy i>j esetén aij = 0. Ez szemléletesen azt jelenti, hogy a bal felső sarokból induló átló alatt minden komponens zérus. stb.
12
Óbudai Egyetem BGK
Fejezetek a matematikából
1.2.Vektorrendszerek és tulajdonságaik 1.4.Definíció: Legyenek x1, x2, x3, …xn L-beli vektorok, α1, α2, α3, …αn pedig legyenek valós számok. Ekkor az α1x1+ α2x2+ α3x3+ …+αnxn összeget az x1, x2, x3, …xn vektorok lineáris kombinációjának nevezzük. A lineáris tér definíciója szerint ez az összeg is eleme az L halmaznak! Miért alapvető ez a fogalom? Azért, mert mint a vektortér definíciójában láttuk összesen két művelet van értelmezve egy lineáris térben, így ha adva van egy { x1, x2, x3, …xn } vektorrendszer, akkor a fenti kifejezés a lehető legáltalánosabb műveletet adja meg, amit ezzel a vektorrendszerrel el lehet végezni. Tisztázzuk miért is fontos ez. Vektortereket akarunk leírni, vizsgálni. A legtöbb gyakorlatban fontos vektortérnek végtelen sok eleme van. De felmerül a kérdés. Ha meg akarunk adni egy vektorteret, akkor ismernünk kell a vektortér összes elemét? A válasz nyilvánvalóan nem. Azért, mert kezünkben van a lineáris kombináció fogalma, segítségével egy vektorrendszer felhasználásával újabb L-beli vektorokat állíthatunk elő. Nyilvánvaló, hogy ha ismertnek tekintjük vektorok egy x1, x2, x3, …xn rendszerét, akkor a belőlük lineáris kombináció útján előállítható összes vektort is ismertnek tekinthetjük! A kérdés most már az, hogy milyen tulajdonságú, és hány elemű kell, hogy legyena vektorrendszer, hogy azt mondhassuk, lineáris kombinációikkal az összes L-beli vektort meg tudjuk adni. Ennek a kérdéskörnek a tisztázásához van szükség az alábbi fogalmakra. 1.5.Definíció:Az L lineáris tér x1, x2, x3, …xn vektorrendszerét a lineáris tér generátorrendszerének nevezzük, ha ezen vektorok lineáris kombinációjaként az összes L-beli vektor előállítható, azaz ha yL tetszőleges, akkor léteznek olyan α1, α2, α3, …αnR valós számok, hogy teljesül az α1x1+ α2x2+ α3x3+ …+αnxn= yegyenlőség. Világos, hogy egy vektortér megadásához ezek szerint elég a tér egy generátorrendszerét megadni! 1.3.Példa: Példák generátorrendszerre. 1. A sík, azaz R2 megadásához például elegendő megadni két nem párhuzamos, nullvektortól különböző vektort. Az elemi vektorgeometriából ugyanis ismert a paralelogramma szabály a vektorok összeadására, és ennek fordítottja a vektorfelbontás módszere. Eszerint, ha adva van két nem párhuzamos vektor a síkban, akkor tetszőleges síkbeli vektor felbontható a megadott két vektorral párhuzamos összetevőkre. Tehát R2-nek generátorrendszere két nem párhuzamos vektor. Természetesen kettőnél több vektor is generátorrendszer, ha van közöttük kettő nem párhuzamos! 2. A „3-dimenziós tér”, azaz R3 generátorrendszere az előző gondolatmenet mintájára: bármely olyan vektorrendszer, amely tartalmaz legalább 3 olyan vektort, amelyek nincsenek egy síkban.
13
Óbudai Egyetem BGK
Fejezetek a matematikából
1.6.Definíció: Az L lineáris tér x1, x2, x3, …xn vektorrendszerét lineárisan függetlennek nevezzük, ha az α1x1+ α2x2+ α3x3+ …+αnxn= 0 (0L) összefüggés csak α1= α2= α3= …=αn=0 (0R) esetén áll fenn.Ezt a lineáris kombinációt triviális lineáris kombinációnak nevezzük. 1.7.Definíció: Az L lineáris tér x1, x2, x3, …xn vektorrendszerét lineárisan összefüggő-nek nevezzük,ha az α1x1+ α2x2+ α3x3+ …+αnxn= 0 (0L) összefüggés úgy teljesül, hogy legalább egy j indexre αj ≠ 0. Ez utóbbi definíciót fogalmazhattuk volna úgy is, hogy „az x1, x2, x3, …xnvektor-rendszer lineárisan összefüggő, ha nem független”, hiszen nyilvánvaló, hogy két egymást kölcsönösen kiegészítő tulajdonságról van szó! Próbáljuk meg, amennyire lehet, szemléletessé tenni ezt a két fogalmat. 1. Mit jelent két vektor lineáris összefüggősége. Ha α1x1+ α2x2= 0 esetén példáulα1≠0 akkor ebből az egyenletből x1 kifejezhető az alábbi módon: x1 2 x2 , tehát az egyik vektor a másik 1 vektornak valós számszorosa, más szóval skalárszorosa, ami pontosan annyit jelent, hogy az egyik vektor párhuzamos a másik vektorral. Két vektor esetében a lineáris összefüggőség egyenértékű a párhuzamossággal. Azaz, ha két vektor lineárisan független, akkor azok nem párhuzamosak! 2. Mit jelent három vektor lineáris összefüggősége? Ha α1x1+ α2x2+ α3x3= 0esetén például α1≠0 akkor ebből az egyenletből x1 kifejezhető az alábbi módon x1
2 x 2 3 x3 ; 1 1
tehát az egyik vektor a másik két vektor skalárszorosainak összege, tehát lineáris kombinációja. Az elemi vektorgeometriából tudjuk, ez pontosan annyit jelent, hogy az x1 vektor benne fekszik az x2ésx3 vektorok által kifeszített síkban. Három vektor esetében a lineáris összefüggőség egyenértékű azzal, hogy a három vektor egy síkban van. Tehát, ha három vektor lineárisan független, akkor azok szükségképpen nem egysíkúak. A lineáris összefüggőség lényegét tisztázza az alábbi tétel. 1.3.Tétel: Az L lineáris tér x1, x2, x3, …xn vektorrendszere akkor és csak akkor lineárisan összefüggő, ha létezik ezen vektorok között legalább egy olyan vektor, amely kifejezhető a többi vektorok lineáris kombinációjaként. 14
Óbudai Egyetem BGK
Fejezetek a matematikából
Bizonyítás: Tegyük fel elsőként, hogy az egyik vektor, például xj kifejezhető a többi lineáris kombinációjakét x j 1x1 ... j 1x j 1 j 1x j 1 ... n xn ekkor nullára redukálva az egyenletet, azt kapjuk, hogy 1x1 ... j 1x j 1 x j j 1x j 1 ... n xn 0;
és ebben az előállításban az xj együtthatója nem nulla, tehát előállítható a nullvektor a nemtriviális lineáris kombinációval. Ez pontosan azt jelenti, hogy a rendszer lineárisan összefüggő. megfordítva, tegyük fel, hogy a rendszer lineárisan összefüggő. Azaz teljesül, hogy 1x1 ... j 1x j 1 j x j j 1x j 1 ... n xn 0;
és például αj ≠ 0. Ekkor az egyenletből az xj vektor kifejezhető a következő módon
xj
j 1 j 1 1 x1 ... x j 1 x j 1 ... n xn , j 0; j j j j
Ez pedig pontosan azt jelenti, hogy az egyik vektor kifejezhető a többi vektorok lineáris kombinációjaként. Ezt kellett igazolni. ■ Térjünk vissza ezek után a generátorrendszer szerepének vizsgálatára. A generátorrendszer vektorainak lineáris kombinációjával a tér összes vektora előállítható. Tegyük fel, hogy a x1, x2, x3,… , xk, …xn generátorrendszer lineárisan összefüggő, például azxk vektor előállítható a többi n –1 db vektor lineáris kombinációjaként: β1x1+ β2x2+…+ βk–1xk–1+ βk+1xk+1+ …+βnxn= xk; Ha ezek után egy yL vektor előállításában az xk vektor szerepel α1x1+ α2x2+ …+αkxk+ …+αnxn= y akkor xk-t helyettesíthetjük a fenti összeggel, amely esetben a következőt kapjuk α1x1+ α2x2+ …+αk(β1x1+ β2x2+…+ βk–1xk–1+ βk+1xk+1 …+βnxn)+ …+αnxn= y Ez az előállítás pontosan azt jelenti, hogy az yL vektor azxkvektor elhagyásával megmaradó vektorrendszer lineáris kombinációjaként is előáll. Ez másképpen is fogalmazható. Voltaképpen igazoltunk egy tételt. 1.4.Tétel: Ha egy lineárisan összefüggő generátorrendszerből egyenként elhagyjuk azokat a vektorokat, amelyek előállíthatók a rendszer többi vektorának lineáris kombinációjaként, akkor továbbra is generátorrendszert kapunk.■ 15
Óbudai Egyetem BGK
Fejezetek a matematikából
Ezzel a módszerrel redukálhatjuk egy generátorrendszer elemszámát.Kérdés, hogy meddig lehet, illetve meddig érdemes ezt az eljárást folytatni. Nyilván addig, amíg egy lineárisan független generátorrendszerhez jutunk. 1.8.Definíció: Az L lineáris tér b1, b2, b3, …bn generátorrendszerét a lineáris tér bázisának nevezzük, ha ez a vektorrendszer lineárisan független. A bázis legfontosabb tulajdonságára világít rá az alábbi tétel. 1.5.Tétel: Ha ab1, b2, b3, …bnvektorrendszer bázis az L lineáris térben, akkor tetszőleges yL vektor egyértelműen felírható a bázisvektorok lineáris kombinációjaként. Tehát léteznek olyan α1, α2, α3, …αnRegyütthatók, melyekre y = α1b1+ α2b2+ α3b3+ …+αnbn továbbá az α1, α2, α3, …αnRegyütthatók egyértelműen meghatározottak. Bizonyítás: A α1, α2, α3, …αnRegyütthatók létezése abból adódik, hogy a b1, b2, b3, …bnvektorrendszer generátorrendszer. Az egyértelműséget indirekt bizonyítjuk. tegyük fel, hogy létezik két különböző előállítás, azaz egyrészt y 1b1 ... j b j ... nbn ;
másrészt pedig y 1b1 ... j b j ... nbn ;
Képezzük most a felírt két egyenlőség különbségét
1 1 b1 ... j j b j ... n n bn 0; Tekintettel arra, hogy definíció szerint a bázis lineárisan független vektorok rendszere, azt kaptuk, hogy a nullvektort előállítottuk egy lineárisan független rendszer lineáris kombinációjával. Ez azonban csak a triviális lineáris kombináció lehet, azaz j j minden j indexre, ami ellentmond az indirekt feltevésnek, tehát az előállítás valóban egyértelmű. ■ A tétel jelentősége a következőkben áll. Ha rögzítünk egy B = {b1, b2, b3, …bn } bázist az L lineáris térben, akkor bármely yL vektor egyértelműen meghatároz egy (α1, α2, α3, …αn) rendezett szám n-est. Fordítva nyilvánvaló, egy (α1, α2, α3, …αn) szám n-es egyértelműen meghatároz egy yL vektort a fenti lineáris kombináció segítségével. Ez azt jelenti, hogy rögzített bázis esetén az L-beli vektorok azonosíthatók valós számokból álló rendezett szám n-esekkel, azaz klasszikus értelemben vett n-komponensű vektorokkal. Az egyértelműség miatt bevezethetünk egy elnevezést.
16
Óbudai Egyetem BGK
Fejezetek a matematikából
1.9.Definíció: Ha B = {b1, b2, b3, …bn } rögzített bázis az L vektortérben és y = α1b1+ α2b2+ α3b3+ …+αnbn; akkor az α1, α2, α3, …αn valós számokat az yL vektor B bázisra vonatkozó koordinátáinak nevezzük.A koordináták felírására az alábbi jelölést alkalmazzuk: 1 2 y . . n B
Tehát ha egy L-beli vektort megadunk a koordinátáival, akkor megegyezés szerint a koordinátákat oszlopvektorban írjuk fel. A vektor melletti jobb alsó index utal a Bbázisra! A bázis előállítása során elméletben kiindultunk egy generátorrendszerből, és ezt a rendszert redukáltuk úgy, hogy a végeredmény egy független generátorrendszer legyen. De nyilván sokféleképpen találhatunk egy generátorrendszert, ennek redukálása során egy másik bázishoz juthatunk. Felmerül a kérdés, hogy van-e valami közös az L tér különböző bázisaiban. Erre ad választ az alábbi, bizonyítás nélkül közölt tétel. 1.6.Tétel: Az L lineáris tér bármely két bázisának elemszáma azonos. ■ Eszerint akárhogyan is állítunk elő egy bázist az mindig ugyanannyi elemű lesz. Ez feljogosít bennünket az alábbi fogalom értelmezésére: 1.10.Definíció: Az L lineáris tér bázisának elemszámát a vektortér dimenziójának nevezzük. 1.4.Példa: Lássunk néhány példát. 1. Az R2 vektortérben – amely azonosítható a síkkal – egy jól ismert bázis a következő
1 i ; 0
0 j 1
ez a vektorrendszer nyilván bázis, hiszen lineárisan független (nem párhuzamosak), és generátorrendszer is, hiszen például az
y R2 vektor tetszőleges α és β valós számok esetén nyilvánvalóan egyértelműen előállítható i és j vektorok segítségével az alábbi módon 17
Óbudai Egyetem BGK
Fejezetek a matematikából 1 0 y ; 0 1
Tehát a B0 = {i, j} vektorpár bázis R2-ben, és az α, β valós számok az y vektor B0 bázisra vonatkozó koordinátái. A könnyebb általánosítás kedvéért bevezetjük az e1 = iés az e2 = j jelöléseket és bevezetünk egy elnevezést. Az R2vektortér B0 = { e1, e2 }bázisát standard bázisnak nevezzük, és megállapodunk a következőben, ha mást nem említünk, akkor bázison mindig a standard bázist értjük. Az előbbi definíció szerint R2tehát 2 dimenziós vektortér. 2. Hasonlóan gondolható végig az R3 vektortér esete az i, j és k vektorokra vonatkozólag, azzal a különbséggel, hogy i, j és kazért függetlenek, mert nincsenek egy síkban. A standard B0 bázis elemei az e1 = i,e2 = j, e3 = k vektorok, és így R3 egy 3-dimenziós lineáris tér. 3.Az előző két gondolatmenet könnyen általánosítható Rn-re. 1.11.Definíció: Az
1 0 0 0 0 1 0 0 e1 0 ; e2 0 ; e3 1 ;.....e n 0 ; . . . . 0 0 0 1 vektorrendszer bázis Rn-ben, amely bázist az előzőekhez hasonlóan Rnstandard bázisának nevezünk, és amelynek a jele B0. Ismét felhívjuk a figyelmet a megállapodásra, miszerint ha egyebet nem mondunk, bázison mindig a standard bázist értjük! A korábbiak szerint Rn tehát egy n-dimenziós vektortér. A korábbiak szerint már könnyen látható, de a módszerek gyakorlásaképpen igazoljuk az alábbi alapvető állítást. 1.7.Tétel: A standard bázis valóban bázisa Rn-nek, tehát egy lineárisan független generátorrendszer. Bizonyítás: Először megmutatjuk általánosan, hogy a vektorrendszer lineárisan független. Állítsa tehát elő a nullvektort az alábbi lineáris kombináció 1e1 ... j e j ... nen 0;
azaz koordinátánként írva
18
Óbudai Egyetem BGK
Fejezetek a matematikából
1 0 0 0 ... ... ... ... 1 0 ... j 1 ... n 0 0 ; azaz ... ... ... ... 0 0 1 0
1 0, ... 0, j ... n 0,
Kaptuk tehát, hogy a nullvektort csak a triviális lineáris kombináció állítja elő. Ez éppen a függetlenséget igazolja. Legyen ezek után azyRn tetszőleges vektor, koordinátákkal megadva
1 2 y . . n B0 Teljesen világos, hogy ekkor teljesül az 1 1 0 0 ... ... ... 2 y . 1 0 ... j 1 ... n 0 1e1 ... j e j ... nen ; . ... ... ... n 0 0 1
egyenlőség, és az is hogy az együtthatók egyértelműen meghatározottak. Éppen ezt kellett igazolni. ■ A bázis tehát egy nagyon különleges vektorrendszer egy lineáris térben, mindemellett a legfontosabb vektorrendszer. Nem árt ha több szempontból is megvilágítjuk ezt a fogalmat. Könnyű átgondolni, hogy az alábbi állítások mind a bázist határozzák meg. 1.8.Tétel: 1. Egy vektortérben a maximális elemszámú lineárisan független rendszer bázis. 2. Egy vektortérben a minimális elemszámú generátorrendszer bázis. 3. Egy n-dimenziós vektortérben bármely n db lineárisan független rendszer bázis. 4. Egy n-dimenziós vektortérben bármely n elemű generátorrendszer bázist alkot. ■ Ezt a tételt akkor célszerű alkalmazni, ha egy konkrét esetben bázist keresünk. Ha teljesül az előbbi négy állítás valamelyike, akkor biztosak lehetünk afelől, hogy bázist találtunk.
19
Óbudai Egyetem BGK
Fejezetek a matematikából
1.3. Elemi bázistranszformáció Induljunk ki a következő problémából. Adott az R2 lineáris tér alábbi y vektora a standard B0 bázisban. 3 y 2 B0
Hogyan változnak meg az y koordinátái, ha a standard bázis egyik vektorát kicseréljük egy másik vektorra, azaz áttrérünk egy másik bázisra. Például cseréljük ki az e1 vektort az u vektorra, ahol az u koordinátái természetesen B0-ban, az alábbi vektorral adottak 1 u 1 B0
Felmerül a kérdés, van-e ennek értelme. Mivel u nem párhuzamos e2-vel, így a B1 = {u, e2}rendszer továbbra is lineárisan független generátorrendszere, mivel n = 2 elemű, lineárisan független rendszer, tehát bázisa R2-nek. Megkérdezhetjük, hogy ebben a bázisban mely valós számok az y vektor koordinátái. Ehhez csak arra kell válaszolni, hogy az y vektort az u és e2 vektorok mely lineáris kombinációja állítja elő. A számítás a következő:y = 3e1+ 2e2, másrészt u = 1e1+1e2 = e1+ e2 ahonnan e1= u–e2. Ezt behelyettesítjük az y előállításába, kapjuk, hogyy = 3(u–e2 ) + 2e2 = 3u–e2. Ami pontosan azt jelenti, hogy megkaptuk az y vektor B1 = {u, e2}bázisra vonatkozó koordinátáit. Ezek a következők 3 y 1 B1
Megváltoztak a koordináták, de ez természetes, hiszen megváltozott a bázis is. Jól jegyezzük meg tehát, hogy egy vektor koordinátái nem abszolút értelemben léteznek, hanem mindig függenek a bázistól. A fenti konkrét példában követett gondolatmenetet általánosítjuk. 1.12.Definíció: Legyen adott egy B = {b1, b2, b3,…, bk, …bn }bázis L-ben, továbbá adott egy u-val jelölt vektor. Ha a B bázis egy vektorát, például a bk vektort kicseréljük az u vektorra, azaz áttérünk a B1 = {b1, b2, b3,…,bk–1,u, bk+1, …bn }bázisra, akkor ezt a transzformációt elemi bázistranszformációnak nevezzük. A konkrét példával ellentétben tehát az elemi bázistranszformáció nem csak a standard bázisról való áttérést jelenti, hanem bármely bázisból kiindulhatunk és készíthetünk új bázisokat. Mi a feladat, ha áttértünk egy új bázisra. Mindig az, hogy kiszámítjuk bizonyos – egy adott probléma kapcsán felmerülő – vektorok koordinátáit az új bázisban. Ez a módszer nagyon hatékony. A későbbiekben látni fogjuk számos alkalmazását. Most csak címszavakban említjük meg mire használható: lineáris függetlenség, lineáris összefüggőség vizsgálata, kompatibilitásvizsgálat, homogén és inhomogén lineáris egyenletrendszerek megoldása, mátrixok invertálása,…stb. 20
Óbudai Egyetem BGK
Fejezetek a matematikából
Annak érdekében, hogy a későbbiekben ezeket a problémákat egységes alapokon meg tudjuk oldani, levezetjük a transzformációt általánosan. Legyen adott egy B = {b1, b2, b3,…, bk, …bn }bázis L-bentovábbá legyen adott egy u-val jelölt vektor, melynek B-beli előállítása a következő u = β1b1+ β2b2+…+ βkbk+ …+βnbn; és tegyük fel, hogy például βk ≠ 0. Legyen továbbá xL egy tetszőleges vektor, melynek előállítása a B bázisban x = α1b1+ α2b2+…+ αkbk+ …+αnbn; Cseréljük ki a B bázis bk vektorát u-ra ha lehet, vizsgáljuk meg, hogy a kapott vektorrendszer bázist alkot-e L-ben, és ha igen számítsuk ki x koordinátáit az új B1 = {b1, …, bk–1, u, bk+1, …bn} bázisban. Mivel βk ≠ 0 ezért oszthatunk vele, tehát az u-t előállító egyenletből kifejezhető a bk vektor bk
1 1 b1 2 b 2 ... k 1 bk 1 u k 1 b k 1 ... n b n ; k k k k k k
Ezt az összeget be tudjuk helyettesíteni az x-et előállító egyenletben a bk helyére
1 x 1b1 ... k 1bk 1 k 1 b1 2 b2 ... u ... n b n k 1b k 1 ... nb n ; k k k k rendezzük most ezt az összeget. Az adódik, hogy
x 1 1 k b1 ... k 1 k 1 k bk 1 k u k 1 k 1 k bk 1 ... n n k bn ; k k k k k Megkaptuk amit kerestünk, az x vektor előállítását a B1 bázisban.Válaszoljunk a felmerült problémákra is. 1. A B1 = {b1, …, bk–1, u, bk+1, …bn} vektorrendszer valóban bázis, hiszen generátorrendszer, ugyanis az x ezen vektorok segítségével is előállítható. Továbbá n db vektort tartalmaz a rendszer, és egy n dimenziós térben minden n elemű generátorrendszer bázis. 2. Felmerül a kérdés, hogy mi a csere feltétele. Az, hogy az u vektor kiindulási B bázisban történő előállításában, a bk vektor βk együtthatója 0-tól különbözzön. A βk valós számot az elemi bázistranszformáció generáló elemének nevezzük. A báziscsere abból állt tehát, hogy az eredeti B bázis bk vektorát kicseréltük az u vektorra, így előállítottunk egy új B1 bázist, és megkaptuk az x vektor B1-beli koordinátáit. Az u vektor „belépett a bázisba”, a bk vektor pedig „kilépett a bázisból”. Vegyük észre, hogy mellékeredményként még azt is megkaptuk, hogy a kilépő bk vektornak mik a koordinátái az új 21
Óbudai Egyetem BGK
Fejezetek a matematikából
bázisban. Eredményeinket a könnyebb áttekinthetőség és egyszerűbb alkalmazhatóság kedvéért táblázatba foglaljuk, annál is inkább, mert az elemi bázistranszformációt alkalmazó számításoknál is mindig táblázatokkal dolgozunk majd. A táblázat szerkezete a következő. Az első oszlopban mindig az aktuális bázisvektorok állnak, a többi oszlopban pedig azon vektorok aktuális bázisra vonatkozó koordinátái, amelyeket be akarunk vinni a bázisba, illetve amelyeknek keressük a koordinátáit az új bázisban. A fentiekben egy vektort cseréltünk, és egy x vektornak számítottuk a koordinátáit. A táblázat azonban nem csak egy x hanem még egy y vektor koordinátáinak transzformációját is mutatja azért, hogy jobban átlássuk a transzformáció mikéntjét, ha egyszerre több vektort transzformálunk.
b1
… …
u β1
… …
x α1
y γ1
b2
…
β2
…
α2
γ2
…
…
…
…
…
…
bk
…
k
…
αk
γk
…
…
…
…
…
…
bn
…
βn
…
αn
γn
B
Táblázat. Az elemi bázistranszformáció induló táblázata
Ha feltesszük, hogy βk≠0 akkor kicserélhetjük az u és bk vektorokat. βk a transzformáció generáló eleme. A transzformáció eredményét az alábbi táblázat tartalmazza: B1
…
bk 1 k 2 k
…
b1
…
b2
…
…
…
…
u
…
…
…
bn
…
x 1 1 k k 2 2 k k
y 1 1 k k 2 2 k k
…
…
…
1 k
…
k k
k k
…
…
…
…
n k
…
… …
n
Táblázat. Az elemi bázistranszformáció táblázata
22
n k k
n
n k k
Óbudai Egyetem BGK
Fejezetek a matematikából
Az egyes transzformációs lépéseket az alábbiakban fogalmazhatjuk meg: 1. A generáló elem helyére a reciprokát írjuk. 2. A generáló elem sorának többi elemét elosztjuk a generáló elemmel. 3. A generáló elem oszlopának többi elemét elosztjuk a generáló elem ellentettjével. 4. A táblázat többi részén a számítás a következő: A generáló elem oszlopában kiszemelünk egygeneráló elemtől különböző értéket. Ezt elosztjuk a generáló elemmel, a kapott hányadossal megszorozzuk a generáló elem sorának az elemeit, és ezeket a szorzatokat rendre kivonjuk a „kiszemelt elem” sorának elemeiből. A transzformációt tehát soronként végezhetjük.
23
Óbudai Egyetem BGK
Fejezetek a matematikából
1.4. Az elemi bázistranszformáció alkalmazásai Az elemi bázistranszformáció alkalmazása lényegében az alábbi eljárás. Adott egy vektorrendszer, amelynek ismertek a koordinátái valamilyen bázisban, általában, ha mást nem mondunk a standard bázisban, de ez nem lényeges kitétel. A vektorrendszer elemei közül ahányat csak lehet, beviszünk a bázisba, persze egyesével, hiszen elemi bázistranszformációk egymásutánját alkalmazzuk. Ezt az eljárást alkalmazzuk ameddig csak lehet, illetve ameddig szükséges. Az alkalmazások során szükségünk lesz néhány fogalomra, ezeket értelmezzük a továbbiakban. 1.13.Definíció: Azt mondjuk, hogy az x1, x2, x3, …xn vektorrendszer rangja k, ha van a vektorrendszerben k db lineárisan független vektor, de bármely legalább k +1 elemű részrendszer lineárisan összefüggő. Egyszerűen fogalmazva a rang a rendszerből kiválasztható lineárisan független vektorok maximális száma. Kérdés, hogy hogyan vizsgáljuk meg egy vektorrendszer rangját elemi bázistranszformációval. Úgy, hogy a vektorrendszer vektorai közül annyit viszünk be a bázisba, amennyit csak lehet, ameddig még találunk βk≠0 generáló elemet. Mivel ezeket a vektorokat bevittük a bázisba, és a bázis lineárisan független rendszer, a bevitt vektorok rendszere lineárisan független. Eszerint a rang egyenlő azon vektorok számával ahányat a bázisba vittünk. Ezt a számítást a lineáris egyenletrendszerek megoldása során fogjuk alkalmazni. 1.5.Példa: Határozzuk meg az a1 = [1, 3, 0, 1]T, a2 = [0, –1, 1, 0]T, a3 = [1, 2, –1, 3]T, a4 = [1, –1, 2, 3]T vektorokból álló vektorrendszer rangját. Adjunk meg lineárisan független vektorokat, és ha a rendszer lineárisan összefüggő, adjuk meg a köztük lévő lineáris kapcsolatot. Alkalmazzunk elemi bázistranszformációt.
a1
a2
a3 a 4 a1 a3 a 4 a3 a 4 a 4
a1 1 0 1 1 1 1 3 1 2 1 3 1 a 2 0 1 1 2 0 1 a3 1 0 3 3 1 3
1 0 1 1 2 2 1 0 2 1 2 3 3 2 2 1
A számítások eredménye a következő. A vektorrendszer rangja 3, mert három lineárisan független vektor van a rendszerben, ez egyértelmű, független a generáló elemek választásától. Ezek például az a1, a2 és a3 vektorok. Természetesen ez függ attól, hogy mely oszlopokban választjuk a generáló elemeket. Az a4 vektorral együtt azonban már lineárisan összefüggő rendszert alkotnak. A lineáris kapcsolat a táblázat utolsó oszlopából olvasható le, amely szerint
a4 0 a1 3 a2 1 a3 ;
24
Óbudai Egyetem BGK
Fejezetek a matematikából
Ennek az egyenlőségnek a helyessége a vektorok koordinátái alapján azonnal látható. 1.14.Definíció: Azt mondjuk, hogy az yL vektor kompatibilis az x1, x2, x3, …xnLvektorrendszerrel, ha y előállítható az x1, x2, x3, …xn vektorok lineáris kombinációjaként. Ha nem állítható elő, akkor inkompatibilisnek nevezzük. Kérdés, hogy hogyan vizsgálunk kompatibilitást elemi bázistranszformációval. Úgy, hogy a vektorrendszer elemeit és az y-t is szerepeltetjük egy transzformációs táblázatban. Elvégzünk annyi elemi transzformációt, amennyit csak lehet – vigyázva arra, hogy az y-t ne vigyük a bázisba - amíg akad olyan xivektor, amit még be tudunk vinni a bázisba, és ezek után megnézzük az y vektor koordinátáit. A koordináták megadják, hogy az y-t mely lineáris kombináció állítja elő. Ha ebben csak az xi vektorok szerepelnek, akkor y kompatibilis, ha viszont van az előállításban egy vektor az eredeti bázisból is akkor inkompatibilis. 1.6.Példa: Vizsgáljuk meg, hogy azy1 = [5, 8, 3, 2]T, y2 = [5, 0, 0, 5]T vektorok kompatibilisek-e az x1 = [1, 0, 0, 2]T, x2 = [2, 1, 0, 0]T,x3 = [0, 2, 1, 0]T,x4 = [3, 3, 1, 2]T vektorokból álló vektorrendszerrel. Alkalmazzunk elemi bázistranszformációt.
x1 x2 x1 1 2 x 2 x3 e4
0 0 2
x3
x 4 y1 y 2 x 2
0 3 5 1 2 3 8 0 1 1 3 0 0 2 2
5 0 0 5
2 1 0 4
x3 0 2
1 0
x 4 y1 y 2 x 2
x 4 y1 y 2 x 4 y1 y 2
3 5 5 2 3 5 5 1 1 5 3 8 0 1 1 2 0 1 2 0 1 3 0 0 1 3 0 1 3 0 4 8 5 4 4 8 5 0 0 5
A számítások eredménye a következő. Az y1 vektor kompatibilis a vektorrendszerrel, mert előállítható csak a rendszerhez tartozó vektorok lineáris kombinációjaként. Az y2 vektor viszont nem kompatibilis a vektorrendszerrel, mert előállításához szükség van még az e4 vektorra is. A táblázatból leolvasható, hogy az előállítások a következők.
y1 1 x1 2 x2 3 x3 ; y 2 5 x1 5 e4 ; Mellesleg a számításból az is kiderül, hogy az { x1, x2,x3,x4 } vektorrendszer rangja 3, például lineárisan független vektorok az x1, x2,x3 vektorok, az x4 ezektől lineárisan függ, a táblázat alapján az
x4 1 x1 1 x2 1 x3 ; összefüggés szerint. Ha a rendszerhez hozzávesszük az y1 vektort, a rendszer rangja nem növekszik, tehát az { x1, x2,x3,x4, y1 } vektorrendszer rangja is 3, azonban ha a rendszert az y2 vektorral bővítjük ki, akkor a rang növekszik, tehát az { x1, x2,x3,x4, y2} vektorrendszer rangja 4.
25
Óbudai Egyetem BGK
Fejezetek a matematikából
Fontosabb alkalmazásokat látunk majd a későbbiekben lineáris egyenletrendszerek megoldásánál és mátrixok inverzének meghatározásánál. De mielőtt számításokat végzünk, szükségünk van a mátrix fogalmára.
26
Óbudai Egyetem BGK
Fejezetek a matematikából
1.5. Mátrixok 1.15.Definíció: Valós számoknak az alábbi sémában való elrendezését mátrixnak nevezzük.
a11 a12 a a A 21 22 ... ... an1 an 2
... a1k ... a2 k ... ... ... ank
Az A mátrix – a vektorhoz hasonlóan vastagon szedve –aij komponense a mátrix i-edik sorának jedik eleme, az indexek közül első tehát a sorindex, a második pedig az oszlopindex. Ennek a mátrixnak n sora és k oszlopa van, szokás ezt „n-szer k-as”, jelöléssel n×k-as mátrixnak nevezni. Az n×k méretű valós komponensű mátrixok halmazára használjuk az Rn×k jelölést. A mátrixokat általában az "ABC" nyomtatott, vastagon szedett nagybetűivel jelöljük. Sokszor hasznos az alábbi általános jelölés, amely utal arra, hogy hogyan jelöljük a mátrix komponenseit. Ha ARn×k akkor
A aij
i 1...n , j 1...k
vagy egyszerűen csak A aij ;
Az alábbiakban néhány speciális mátrixot értelmezünk. 1.16.Definíció: Azt a mátrixot, amelynek egyetlen oszlopa van oszlopvektornak nevezzük. Ez a mátrix lényegében megegyezik a hagyományos értelemben vett n-komponensű vektorokkal, tehát az Rn×1 halmazt azonosítjuk az Rn halmazzal.
a1 a a 2 R n R n1 ... an 1.17.Definíció: Azt a mátrixot, amelynek egyetlen sora van sorvektornak nevezzük. Ez a mátrix lényegében megegyezik a hagyományos értelemben vett k-komponensű vektorokkal, tehát az R1×khalmazt azonosíthatjuk az Rk halmazzal.
b b1 b2 ... bk R k " " R1k Világos azonban, hogy a vektor kifejezés ezek után félreértést okozhat, hiszen az előbbiek szerint jelenthet oszlopvektort is és sorvektort is. Ezt elkerülendő jegyezzük meg a következő megállapodást. A továbbiakban, ha „vektor”-t mondunk, akkor az mindig oszlopvektort jelent. A fenti egyenlőségjel azért idézőjeles, mert bár az azonosítás jogos, de az említett
27
Óbudai Egyetem BGK
Fejezetek a matematikából
megegyezés szerint az imént megfogalmazott azonosítás alapján értelmezzük a vektort és az Rn halmazt. 1.18.Definíció: Kvadratikusnak vagy négyzetesnek nevezünk egy mátrixot, ha sorainak száma egyenlő oszlopainak számával, ha tehát n = k.
a11 a12 a a B 21 22 ... ... an1 an 2
... a1n ... a2 n R nn ; ... ... ... ann
Egy kvadratikus mátrixnak van egy különleges „részhalmaza”, azon elemek, amelyeknek sor- és oszlopindexe megegyezik. Ezt a részhalmazta mátrix főátlójának nevezzük. Az n×n-es mátrixot szokás n-edrendű mátrixnak nevezni. A kvadratikus mátrix főátlójában levő komponensek összegét a mátrix nyomának (trace) vagy idegen szóval spurjának nevezzük. Ezt a fogalmat a sajátértékek elméletében fogjuk használni.
tr B a11 a22 ... ann ; 1.19.Definíció: Alsó illetve felső háromszögmátrixnak nevezzük azt a kvadratikus mátrixot, amelyben rendre a főátló felett illetve a főátló alatt minden komponens zérus. Ezek szokásos jelölése L (lower) és U (upper)
a11 0 a a L 21 22 ... ... an1 an 2
... 0 a11 a12 0 a ... 0 22 nn R ; U ... ... ... ... ... ann 0 0
... a1n ... a2 n R nn ; ... ... ... ann
1.20.Definíció: Diagonális mátrixnak nevezzük azt a kvadratikus mátrixot, melyben a főátlón kívül minden elem zérus.
a11 0 0 a 22 D ... ... 0 0
... 0 ... 0 R nn ; ... ... ... ann
Ha egy a R n vektorból képezünk diagonális mátrixot, akkor az azt jelenti, hogy egy olyan n-ed rendű mátrixot értelmezünk, amelynek főátlójában állnak az a vektor komponensei. Az alkalmazott jelölések bevezetésével
28
Óbudai Egyetem BGK
Fejezetek a matematikából
a1 a1 0 a 0 a 2 a 2 R n ; esetén diag a a ... ... ... an 0 0
... 0 ... 0 R nn ... ... ... an
1.21.Definíció: Nullmátrixnak nevezzük azt a mátrixot, amelynek minden komponense 0 R. Azaz
0 0 0 ... 0
0 0 ... 0
... ... ... ...
0 0 R nk ; ... 0
A nullmátrixnak nem kell szükségképpen kvadratikusnak lenni. A nullmátrix definiáló tulajdonsága, hogy tetszőleges ARn×kesetén teljesül, hogy A + 0 = 0 + A = A. Az algebrában az ilyen tulajdonságú objektumot nevezzük nullelemnek. A továbbiakban a mátrixok körében végezhető műveletekkel foglalkozunk.
29
Óbudai Egyetem BGK
Fejezetek a matematikából
1.6. Műveletek mátrixokkal A mátrixok halmazában is értelmezünk műveleteket, az összeadást és a skalárral (tehát valós számmal) való szorzást és mátrixok szorzatát. Az első két említett művelet felhasználásával mátrixok halmaza is egy vektortér. Az osztás művelete nem értelmezhető közvetlenül. Az osztás fogalmának az általánosítása a mátrix inverzének a fogalma. Ezeket a fogalmakat értelmezzük a következőkben. 1.22.Definíció: Az A aij Rn×kmátrixnak és az αR valós számnak a szorzata a következő
A aij R nk Tehát egy mátrixot úgy szorzunk egy valós számmal, hogy a mátrix minden komponensét megszorozzuk a valós számmal, továbbá egy n×k-as mátrix valós számszorosa is n×k-as mátrix. 1.7.Példa: Végezzük el az alábbi skalár-mátrix szorzást. 0 4 2 0 1 8 4 3 5 1 12 20 4 ; 2 4 7 8 16 28
1.23.Definíció: Az A aij Rn×k és a B bij Rn×k mátrixok összege az az n×k méretű mátrix, melyre
A B aij bij R nk Tehát összeadni csak azonos méretű mátrixokat lehet, és két mátrixot úgy adunk össze, hogy a „megfelelő helyen álló” komponenseit rendre összeadjuk. Az eredmény természetesen ugyanolyan méretű mátrix, mint az összeg tagjai. 1.8.Példa: Végezzük el az alábbi összeadást. 1 0 4 7 3 0 5 2 4 0 1 5 9 2 5 8 7 4 2 8 2 6 3 16 ; 3 1 0 2 4 4 3 6 1 5 3 8
Az összeadás és a szorzás műveleti tulajdonságaira igaz az alábbi állítás.
30
Óbudai Egyetem BGK
Fejezetek a matematikából
1.9.Tétel: Mátrixok összeadása és skalárral való szorzása kommutatív és asszociatív művelet, valamint a skalárral való szorzás az összeadásra nézve disztributív, azaz a) A B B A; A B C A B C : A B C; b) A A; A A : A; c) Α A A; A B A B; Bizonyítás: Az állítások a definíciók közvetlen következményei. ■ Látható tehát, hogy a valós számmal való szorzás és az összeadás során n×k méretű mátrixokból indulunk ki, és az eredmény ugyanilyen típusú mátrix, ez a két művelet tehát „nem vezet ki” az n×k-as mátrixok Rn×khalmazából.Világos, hogy a korábban értelmezett 0Rn×k nullmátrixra tetszőleges ARn×k mátrix esetén teljesül, hogy A + 0 = 0 + A = A.A legutolsó tétel figyelembe vételével, ha még hozzátesszük a tételbeli műveleti tulajdonságokhoz a nullmátrix fogalmát, akkor látható, hogy az n×k-as mátrixok Rn×khalmaza valós vektortér a most definiált számmal való szorzásra és összeadásra vonatkozólag. A kérdés, hogy mi ennek a vektortérnek egy bázisa és mennyi a vektortér dimenziója. Könnyen ellenőrizhető, hogy az
0 ... 0 ... ... Bij 0 ... 1 ... ... 0 ... 0 ...
0 ... 0 ; i 1, 2,3,..., n; j 1, 2,3,..., k ; ... 0
mátrixrendszer bázisa azRn×k vektortérnek, ahol Bij az a mátrix, amely i-edik sorának j-edik komponense 1 a többi komponens zérus, amiből következik, hogy ez a vektortér n·k dimenziós. 1.24.Definíció: Az A aij Rn×k mátrix transzponáltja az az AT aij' Rk×n mátrix, melyre teljesül, hogy aij' a ji . Vagyis az AT transzponált mátrix i-edik sorának j-edik komponense megegyezik az A mátrix j-edik sorának i-edik komponensével. A transzponálás tehát azt jelenti, hogy a mátrix sorai és oszlopai „szerepet cserélnek”, tehát az Ai-edik sorából lesz az ATi-edik oszlopa és fordítva. Ha a mátrix nem négyzetes, akkor a mátrix és transzponáltja nem azonos méretűek. Négyzetes mátrixok esetében mátrix és transzponáltja egyező méretűek, azaz ha ARn×n akkor ATRn×n. Ebben az esetben a transzponálás egyenértékű a főátlóra történő tükrözéssel. A főátló komponensei helyben maradnak, a többi elem pedig a főátlóra tükröződik.
31
Óbudai Egyetem BGK
Fejezetek a matematikából
1.9.Példa: Transzponáljuk az alábbi mátrixokat. 3 2 3 5 4 A 5 0 ; AT ; 2 0 1 4 1
1 2 7 1 0 3 B 0 4 1 ; BT 2 4 9 ; 3 9 5 7 1 5
A transzponálással kapcsolatosan alapvető a következő állítás. 1.10.Tétel:Az A mátrix transzponáltjának transzponáltja az A, tehát saját maga, összeget tagonként lehet transzponálni, skalárszoros transzponáltja pedig a transzponált skalárszorosa, vagyis
A T
T
A;
A B T AT BT ; A T AT ;
Bizonyítás: Ezek az egyenlőségek a definíciók közvetlen következményei. ■ A transzponálás nagyon hasznos, ha vektorokról beszélünk. Egy vektor, ami megegyezés szerint oszlopvektor, helytakarékosan írható, ha felhasználjuk a transzponálás műveletét. Világos, hogy az
a1 a T a 2 ; a a1 a2 ... an ; aT a1 a2 ... an ; ... an jelölések ugyanazt az aRn vektort jelentik. A továbbiakban mi is alkalmazzuk ezt a jelölést, ha oszlopvektorról van szó. 1.25.Definíció: Az ARn×n mátrixot szimmetrikusnak nevezzük, ha megegyezik a transzponáltjával, azaz A szimmetrikus ha teljesül, hogy AT = A. Azt is mondhatjuk, hogy egy szimmetrikus mátrix tükrös a főátlójára. Az ARn×n mátrixot ferdén szimmetrikusnak nevezzük, ha transzponáltja a Amátrix ellentettje, azaz ha teljesül, hogy AT = –A. Ebben az esetben, tekintettel arra, hogy a főátló komponensei transzponálás során a helyükön maradnak, és csak a 0 az a valós szám, melynek ellentettje saját maga, egy ferdén szimmetrikus mátrix főátlójában minden komponens zérus. 1.10.Példa: Az A mátrix szimmetrikus, a B mátrix ferdén szimmetrikus.
1 5 1 7 0 2 1 3 5 2 2 1 ; B 2 0 7 0 ; A 1 2 0 4 1 7 0 5 7 1 4 3 3 0 5 0 32
Óbudai Egyetem BGK
Fejezetek a matematikából
Szimmetrikus és ferdén szimmetrikus mátrixok fogalmával kapcsolatban alapvető a következő állítás. 1.11.Tétel: Minden ARn×n mátrix felbontható egy szimmetrikus és egy ferdén szimmetrikus mátrix összegére. Bizonyítás: Világos az alábbi azonosság A
A AT A AT ; 2 2
és könnyen ellenőrizhető, hogy az összeg első tagja szimmetrikus, a második tagja pedig ferdén szimmetrikus, hiszen
T AT AT A AT 2 2
T
T AT AT AT A A AT ; 2 2 2
T
AT A A AT ; 2 2
Ezzel az állítást igazoltuk. ■ 1.11.Példa: Alkalmazzuk az előző tételt. Legyen 2 6 4 2 0 2 T A 0 1 4 ; ekkor A 6 1 8 ; 2 8 3 4 4 3
és nyilvánvaló, hogy az 2 3 3 0 3 1 A AT A AT 3 1 6 ; 3 0 2 ; 2 2 3 6 3 1 2 0
mátrixok rendelkeznek a kívánt tulajdonsággal és összegük az A mátrix. Most rátérünk mátrixok szorzásának értelmezésére. Mátrixok szorzása definiálható, ha felidézzük a vektorok klasszikusskaláris szorzatának fogalmát.
egyszerűbben
1.26.Definíció: Az aT = [a1, a2, …an] Rn és bT = [b1, b2, …bn ] Rn vektorok aTb-vel jelölt skaláris szorzata a következő valós szám aTb = a1b1 + a2b2 + …+ anbn; tehát a két n komponensű vektor „megfelelő koordinátái szorzatának összege”. Világos, hogy csak akkor létezik a két vektor skaláris szorzata, ha a két vektor komponenseinek száma egyenlő. A jelölésben is utalunk arra a lényeges momentumra, hogy egy sorvektort szorzunk 33
Óbudai Egyetem BGK
Fejezetek a matematikából
oszlopvektorral. Ez lényeges, mert ilyen módon értelmezzük általánosan két mátrix szorzatát. Ezek után definiálhatjuk általánosan mátrixok szorzatát. A skaláris szorzatra bevezetünk egy más, gyakran előnyösebben alkalmazható jelölést. Az aT = [a1, a2, …an] Rn és bT = [b1, b2, …bn ] Rn vektorok aTb skaláris szorzatát jelölje
aTb a, b ; A skaláris szorzattal kapcsolatosan fontos lerögzítenünk az alábbi műveleti tulajdonságokat. 1.12.Tétel: A skaláris szorzat tulajdonságai a) szimmetrikus, azaz aTb bTa, más jelöléssel a, b b, a ; b) homogén abban az értelemben, hogy a, b a, b , R; c) disztributív, tehát a b, c a, c b, c ; d) „pozitív definit”, azaz a, a 0; és pontosan akkor a, a 0 ha a 0; Bizonyítás: Az a), b) és c) állítás a definíció közvetlen következménye, a d) állítást részletezzük csak, azonban ez is nyilvánvaló. LegyenaT = [a1, a2, …an] Rn, ekkor n
a, a a1a1 a2 a2 ... an an ai2 ; i 1
Innen az állítás következik, hiszen n db nem negatív szám összege nem lehet negatív, és egy négyzetösszeg pontosan akkor zérus, ha minden tagja zérus. ■ Ha a skaláris szorzás fogalmát általánosítani szeretnénk komplex esetre, amely fogalmat mi elméletben használunk majd a továbbiakban, akkor a következőképpen kell módosítanunk a definíciót. 1.27.Definíció: Komplex skaláris szorzat fogalma. Az aT = [a1, a2, …an] Cn és bT = [b1, b2, …bn ] Cn komplex vektorok skaláris szorzata definíció szerint
a, b : aTb; ; Ami a valós esethez képest annyi módosítást jelent, hogy a második tényező komplex konjugáltját kell venni, és az így kapott vektorral kell ugyanazt a műveletet elvégezni, tehát a, b a1b1 a2b2 ... anbn ;
ahol a „vonás” szokás szerint a komplex konjugáltat jelöli. Természetesen, ha a vektorok valósak, ez a definíció egybeesik a korábbival.Komplex skaláris szorzásra az előzővel analóg tétel fogalmazható meg, melynek bizonyítását az olvasóra bízzuk. 34
Óbudai Egyetem BGK
Fejezetek a matematikából
1.13.Tétel: A komplex skaláris szorzat tulajdonságai a) „szimmetrikus”, azaz a, b b, a ; b) homogén abban az értelemben, hogy a, b a, b , C; és a, b a, b , C; c) disztributív, tehát a b, c a, c b, c ; d) „pozitív definit”, azaz a, a 0; és pontosan akkor a, a 0 ha a 0; A skaláris szorzással kapcsolatosan általánosítunk egy fogalmat és egy tételt, amely az analitikus geometriában alapvető fontosságú. Ez a fogalom a merőlegesség, amelyet magasabb dimenzióban és általánosabb körülmények között ortogonalitásnak nevezünk. 1.28.Definíció: Az aT = [a1, a2, …an] Rn és bT = [b1, b2, …bn ] Rnvektorokat ortogonálisnak nevezzük, ha skaláris szorzatuk zérus, azaz ha teljesül, hogy
aTb a, b 0; 1.12.Példa: Az aT = [1, 2, –3, 5] R4 és bT = [3, –1, 7, 4 ] R4 négydimenziós vektorok ortogonálisak, ugyanis
aTb a, b 1 3 2 1 3 7 5 4 3 2 21 20 0; Egy további általánosítást fogalmazunk meg, amely ugyancsak az analitikus geometriában tapasztalt összefüggés megfelelője. Mivel egy három dimenziós aT = [a1, a2, a3] R3 vektor hosszát az a a12 a22 a32 ;
összefüggéssel értelmezzük, ami nem más, mint az n-dimenzióbeli n
a, a a1a1 a2 a2 ... an an ai2 ; i 1
skaláris szorzat négyzetgyökének speciális esete, ezért értelmezzük egy vektor hosszának fogalmát. 1.29.Definíció: Az aT = [a1, a2, …an] Rnvektor hosszát az
a
a, a a1a1 a2 a2 ... an an
n
ai2 ; i 1
formulával értelmezzük. Ha egyeT = [e1, e2, …en] Rn vektorra egységvektornak nevezzük. 35
e 1 teljesül, akkor
Óbudai Egyetem BGK
Fejezetek a matematikából
Ezek után rátérhetünk a mátrtixszorzás általános definíciójára. 1.30.Definíció: Mátrixok sor-oszlop szorzása Az A aij Rn×k és B b jr Rk×m mátrixok C = AB szorzata az a C cir Rn×m mátrix amely i-edik sorának r-edik eleme, tehát a cir komponens, az A mátrix i-edik sorának és a B mátrix r-edik oszlopának skaláris szorzata, azaz k
cir ai1b1r ai 2b2r ... aik bkr aisbsr ; s 1
ahol i = 1,2,…n; j = 1,2,…m tetszőleges egész számok. Mivel az A mátrixnak n sora, a B-nek pedig m oszlopa van, összesen n∙m ilyen skaláris szorzást kell elvégeznünk, ami azonnal indokolja is, hogy a szorzatmátrix miért n×m típusú mátrix, azaz miért van n sora és m oszlopa. Mivel a skaláris szorzás csak akkor értelmes, ha a két vektornak ugyanannyi komponense van, ezért világos, hogy két mátrix csak abban az esetben szorozható össze, ha az első tényező soraiban ugyanannyi elem van, mint a második tényező oszlopaiban. Másképpen fogalmazva ez azt jelenti, hogy az A mátrix oszlopainak száma meg kell egyezzen a B mátrix sorainak számával. Ezért az A n×k-as a B pedig k×m-es mátrix. Célszerű megjegyezni a „sor-oszlop szorzás” kifejezést, mert ez utal a definícióban foglaltakra. A szorzás végrehajtásánál célszerű használni a „Falk-sémá”-nak nevezett elrendezést, amely az alábbiakban látható
... ... ... ... ... ... a a A i1 i 2 ... ... ... ...
... ... ... aik ... ... ... ...
... ... B ... ... ... ... ... ... ... ... c ... ir AB ... ... ... ... ... ... ... ... ... b1r ... b2 r ... ... ... bkr
Ha az AB szorzatot kívánjuk kiszámítani, akkor a sémában a bal alsó sarokba írjuk az A mátrixot, a jobb felső sarokba pedig a B mátrixot, a szorzatmátrix pedig a jobb alsó sarokba kerül, mégpedig úgy, hogy az A mátrix i-edik sorának és a Bmátrixr-edik oszlopának a „kereszteződésébe” írjuk a cir skaláris szorzatot. Ez az elrendezés megkönnyíti a szorzás elvégzését, persze ha van elég rutinunk, a sémát mellőzhetjük. A szorzás műveletének tulajdonságait tisztázza az alábbi állítás.
36
Óbudai Egyetem BGK
Fejezetek a matematikából
1.14.Tétel: Mátrixok szorzása asszociatív művelet, továbbá a szorzás az összeadásra nézve disztributiv, ugyanakkor a szorzás nem kommutatív. Azaz a) (AB)C = A(BC) =:ABC b) A(B + C) = AB + AC c) AB ≠ BA Bizonyítás: Az asszociativitás és a disztributivitás a szorzás definíciójának következménye. A kommutativitással kapcsolatos állítás igazolására elég példát hoznunk arra, hogy a művelet nem kommutatív. Több példát is mutatunk. 1. Legyen például AR2×3, BR3×4, ekkor AB értelmezett és ABR2×4, a BA szorzat azonban nem értelmezett. 2. Ha például AR2×3, BR3×2 akkor bár az AB és a BA szorzat is értelmezett, de mégsem egyenlők, hiszen ABR2×2, BAR3×3 és világos, hogy ha a mátrixok nem azonos méretűek, akkor nem is lehetnek egyenlők. 3. Felmerül a kérdés, hogy kvadratikus mátrixok esetén, ahol AB és BA egyaránt értelmezett és mindkettő azonos méretű, teljesül-e az egyenlőség. Egy egyszerű példa meggyőz bennünket, hogy ekkor sem teljesül a kommutativitás. Legyen például
1 2 2 0 4 4 2 4 A ; B ; BA Ekkor: AB 0 1 1 2 1 2 1 4 tehát valóban nem teljesül az egyenlőség. ■ Mátrixok szorzásával kapcsolatban felmerül még egy érdekes dolgog, amely például a valós számok halmazában nem igaz. Egy példával illusztráljuk a mondandónkat. 1.13.Példa: Számítsuk ki az A és B mátrixok szorzatát ha 2 3 5 1 3 5 A 1 4 5 ; B 1 3 5 ; 1 3 4 1 3 5
Egyszerűszámolással adódik, például a Falk-séma alkalmazásával, hogy 0 0 0 AB 0 0 0 ; de A 0 és B 0; 0 0 0
Tehát mátrixok halmazában előfordulhat az a meglepő eredmény, hogy nem nulla mátrixok szorzata a nullmátrix. Emlékezzünk vissza a valós számok halmazára, ahol az ab = 0 egyenletből következik, hogy a = 0 vagy b = 0. Mátrixok körében ez a következtetés tehát nem igaz.
37
Óbudai Egyetem BGK
Fejezetek a matematikából
A szorzással kapcsolatosan igazolunk egy alapvető fontosságú, de egyszerű állítást. 1.15.Tétel: Ha ARn×k valamint BRk×p, akkor teljesül, hogy
AB T BT AT ; Bizonyítás: Megmutatjuk, hogy a két oldalon azonos méretű mátrixok szerepelnek, és azt, hogy komponensenként megegyeznek. Mivel ABRn×p ezért (AB)TRp×n. Másrészt ATRk×n valamint BTRp×k ahonnan következik, hogy BTATRp×n tehát a méreteik valóban megegyeznek. Határozzuk meg az (AB)T mátrix i-edik sorának j-edik komponensét. Ez megegyezik az AB mátrix j-edik sorának i-edik komponensével, tehát ha az A mátrix j-edik sorát ajT jelöli, valamint a B mátrix i-edik oszlopát bijelöli, akkor a kérdéses komponens éppen az ajTbi skaláris szorzattal egyezik meg. A jobboldali szorzat i-edik sorának j-edik komponens pedig a BT mátrix i-edik sorának és az A mátrix j-edik oszlopának skaláris szorzata, azaz biTaj mivel pedig a skaláris szorzás értelmezése szerint nyilvánvalóan ajTbi = biTaj az állítást igazoltuk. ■ A későbbiekben hasznunkra lesz egy állítás, amely a szorzást a szimmetriával kapcsolja össze. 1.16.Tétel: Tetszőleges ARn×k mátrix esetén az AAT és az ATA mátrix szimmetrikus mátrix. Bizonyítás: Igazoljuk, hogy AAT szimmetrikus, a másik állítás hasonlóan bizonyítható. Először megmutatjuk, hogy a szorzatnak tetszőleges méretű, nem feltétlenül kvadratikus mátrix esetén van értelme. Ha ARn×k akkor ATRk×n, így az AAT szorzat értelmezve van, hiszen az első tényezőnek ugyanannyi oszlopa van ahány sora a második tényezőnek. Ebből az is következik, hogy AATRn×n, tehát a szorzat minden esetben n-ed rendű kvadratikus mátrix. Már csak azt kell igazolnunk, hogy a szorzat egybeesik a transzponáltjával. Ez is teljesül, ugyanis az előző tétel alapján
AA A T
T
T
T
AT AAT ;
Ezt kellett igazolni. ■ A továbbiakban a mátrixok szorzásának speciális eseteit vizsgáljuk. 1. Vektorok skaláris szorzata.Célszerű precízebben megfogalmazni ezek után a skaláris szorzás definícióját, ugyanis a skaláris szorzás egy különleges mátrixszorzat. Miután a mátrixok szorzását sor-oszlop szorzásként definiáltuk, világos, hogy a skaláris szorzásnál az első tényező sorvektor, a második tényező pedig oszlopvektor kell, hogy legyen. Ezt hangsúlyoztuk már a skaláris szorzás fenti definíciójában is. Ha felidézzük azt a megállapodásunkat, miszerint a vektor mindig oszlopvektort jelent, és adottak az aRn és bRn vektorok, koordinátákkal felírva aT = [a1, a2, …an] Rn és bT = [b1, b2, …bn ] Rn. Ekkor a skaláris szorzatuknak csak úgy van értelme, hogy ha az a vektorból először egy sorvektort készítünk, azaz transzponáljuk és az aRntranszponáltjának és a b-nek írjuk fel a sor-oszlop szorzatát. Eszerint, ha aRn×1 és
38
Óbudai Egyetem BGK
Fejezetek a matematikából
bRn×1akkor aTR1×n és így már értelmezett az aTb mátrixszorzás. Eszerint az aRn és bRn skaláris szorzata a következő
aT b a1 a2
b1 b n ... an 2 ai bi ... i 1 bn
2. Mátrix szorzása oszlopvektorral. Erre a műveletre szükségünk lesz a lineáris egyenletrendszerek megoldásánál, ezért emeljük ki külön. Legyen A aij Rn×k egy n×k-as mátrix és x = [xj] Rk egy k-dimenziós vektor. Komponenseikkel felírva:
a11 a12 a a22 A 21 ... ... an1 an 2
... a1k x1 x ... a2 k és x 2 ; ... ... ... ... ank xk
Mivel az An×k-as mátrix az x vektor pedig egy k×1-es mátrixnak tekinthető az Ax szorzat értelmes, írjuk fel a szorzás eredményét.
a11 a12 a a Ax 21 22 ... ... an1 an 2
... a1k x1 a11 x1 a12 x2 ... a1k xk ... a2 k x2 a21 x1 a22 x2 ... a2 k xk Rn ; ... ... ... ... ... ank xk an1 x1 an 2 x2 ... ank xk
Hangsúlyozzuk, hogy a szorzás eredménye ugyancsak egy n×1 méretű vektor, és ez a vektor nem más, a szorzás értelmezése szerint, mint az A mátrix oszlopvektorainak lineáris kombinációja, ahol az együtthatók éppen az x vektor koordinátái. Ugyanis gondoljuk végig, a szorzás során az A mátrix első oszlopának komponenseit mindig az x1 koordinátával szorozzuk, a második oszlopot x2-vel, stb. Mivel a szorzás nem kommutatív, ki kell térnünk a fordított sorrendben vett mátrix-vektor szorzásra is. 3. Sorvektor szorzása mátrixszal. Legyen A aij Rn×k egy n×k-as mátrix és x = [xj] Rn egy n-dimenziós vektor. Ekkor értelmezve van az xTA vektor mátrix-szorzat
39
Óbudai Egyetem BGK
xT A x1
x2
a11 a ... xn 21 ... an1
Fejezetek a matematikából a12 a22 ... an 2
T
... a1k a11 x1 a21 x2 ... an1 xn ... a2 k a12 x1 a22 x2 ... an 2 xn R1k ; ... ... ... ... ank a1k x1 a2 k x2 ... ank xn
Hangsúlyozzuk, hogy a művelet eredménye egy k komponensű sorvektor, csak helytakarékossági okokból írtuk oszlopvektor transzponáltjaként. Kiemeljük, hogy a művelet eredménye nem más, mint az A mátrix sorvektorainak lineáris kombinációja, ahol a kombináció együtthatói éppen az x vektor koordinátái. Utolsóként egy nagyon különleges, elméleti szempontból nagyon jelentős szorzásműveletre térünk ki. 4. Vektorok diadikus szorzata. Két vektort nem csak úgy szorozhatunk össze, hogy a sorrendet hangsúlyozva, sorvektort szorzunk oszlopvektorral, amikor is a két vektor koordinátáinak száma egyenlő, hanem úgy is szorozhatunk, hogy oszlopvektort szorzunk sorvektorral. Ebben az esetben azonban nem szükséges, hogy a koordináták száma megegyezzen. 1.31.Definíció: Az aRn és bRk vektorok diadikus szorzata az abTRn×k mátrix, azaz
a1 a1b1 a1b2 a a b a b 2 T ab b1 b2 ... bk 2 1 2 2 ... ... ... an anb1 anb2
... a1bk ... a2bk R nk ; ... ... ... anbk
Az abTRn×k mátrix neve diád. 5. Egységmátrix. Vessük fel a következő problémát. Keressük az n×n-es kvadratikus mátrixok halmazában azt az E-vel jelölt mátrixot, amelyre tetszőleges ARn×n esetén teljesül, hogy AE = EA = A Gondoljunk a valós számok halmazának 1R elemére (ahol 1 a valós számok halmazának „egységeleme”) erre tetszőleges aR esetén teljesül, hogy a∙1 = 1∙a = a. Ennek mintájára nevezzük E-t egységmátrixnak az Rn×n halmazban. Kérdés, hogy mik az elemei. A szorzás definícióját felhasználva könnyen ellenőrizhető, hogy az
1 0 E ... 0
0 1 ... 0
40
... .. ... ...
0 0 ; ... 1
Óbudai Egyetem BGK
Fejezetek a matematikából
mátrix megfelel a követelményeknek. Az egységmátrix tehát az a négyzetes mátrix (minden n-re) amelynek főátlójában 1-esek állnak, az összes többi eleme pedig zérus. Ez a fogalom azon túl, hogy elméleti jelentősége van, számunkra is fontos, visszatérünk még rá az inverzmátrix tárgyalásánál. 6. Permutáló mátrix.Permutáló mátrixnak nevezzük azt a mátrixot, amely az E egységmátrixból úgy keletkezik, hogy sorainak vagy oszlopainak sorrendjét megváltoztatjuk, permutáljuk. Jele általában P. A permutáló mátrixnak minden sorában és minden oszlopában pontosan 1 db 1-es van a többi komponense pedig zérus. 1.14.Példa: Permutáló mátrix például az alábbi.
0 1 P 0 0
0 0 0 1
1 0 0 0
0 0 ; 1 0
Derítsük ki ennek a mátrixnak a „hatását” ha vele balról vagy jobbról megszorzunk egy negyedrendű mátrixot. Legyen
1 0 A 2 1
3 2 5 4 7 1 ; 9 4 3 5 0 2
és számítsuk ki a PA valamint AP szorzatokat. A szorzások eredménye a következő.
0 1 PA 0 0 1 0 AP 2 1
0 1 0 1 3 0 0 0 0 4 0 0 1 2 9 1 0 0 1 5 3 2 5 0 4 7 1 1 9 4 3 0 5 0 2 0
2 7 4 0 0 1 0 0 0 0 1 0
5 2 1 1 3 1 2 0 0 3 0 4 1 9 0 5
9 3 5 4 5 1 3 2
3 2 5 ; 0 2 7 1 1 2 0 7 ; 2 4 1 0 4
Vegyük észre a következőket. 1. Ha balról szorzunk egy permutáló mátrixszal, akkor a szorzás eredménye a következő: Ha az (i, j) pozícióban van egy 1-es, akkor a szorzás hatására a mögötte álló mátrix j-edik sorát az i-edik sorba helyezi át. 41
Óbudai Egyetem BGK
Fejezetek a matematikából
2. Ha jobbról szorzunk egy permutáló mátrixszal, akkor a szorzás eredménye a következő: Ha az (i, j) pozícióban van egy 1-es, akkor a szorzás hatására az előtte álló mátrix i-edik oszlopát a j-edik oszlopba helyezi át. Ennek megértéséhez semmi mást nem kell tennünk, mint felidézni, hogy egy sorvektorral balról szorozva egy mátrixot, a mátrix sorainak lineáris kombinációját kapjuk. Ha pedig egy oszlopvektorral jobbról szorzunk egy mátrixot, akkor a mátrix oszlopainak lineáris kombinációját kapjuk. A permutáló mátrixok alkalmazásának speciális esete – amelyet egyenletrendszereknél alkalmazunk majd – például két sor cseréje. Ez egyszerűen megvalósítható az alábbi módon. Ha az i-edik és a j-edik sort szeretnénk felcserélni, akkor a permutáló mátrix az egységmátrixból úgy születik, hogy annak i-edik és j-edik sorát felcseréljük. 1.15.Példa: Egy negyedrendű mátrix esetében, ha fel szeretnénk cserélni az 1. és 3. sort, akkor a permutáló mátrix és a szorzás az előbbi példabeli A mátrixot használva a következő.
0 0 PA 1 0
0 1 0 0
1 0 0 0
0 1 0 0 0 2 1 1
3 2 5 2 4 7 1 0 9 4 3 1 5 0 2 1
42
9 4 3 4 7 1 ; 3 2 5 5 0 2
Óbudai Egyetem BGK
Fejezetek a matematikából
1.7. Kvadratikus mátrix determinánsa 1.32.Definíció: Legyen A aij Rn×n egy négyzetes mátrix. A-hoz az alábbi definícióval hozzárendelünk egy valós számot, amelyet az A mátrix determinánsának nevezünk
det A A 1
I P
P
a11 a22 ... ann
ahol az összegzés az 1,2,3,…n számok összes P permutációjára (összes lehetséges sorrendjére) vonatkozik, az I(P) pedig az α1, α2, α3,…αn permutációban az inverziók („előzések”, transzpozíciók) számát jelenti. Az n×n méretű mátrix determinánsát n-ed rendű determinánsnak nevezzük. 1.16.Példa: Az 1,2,3,4,5 egész számok egy permutációja a 2,5,3,1,4 sorozat. Ebben az alábbi párokat írhatjuk fel az adott sorrendnek megfelelően: 2-5, 2-3, 2-1, 2-4, 5-3, 5-1, 5-4, 3-1, 3-4, 1-4. Azokat a párokat, amelyek inverziót – tehát a természeteshez képest fordított sorrendet – jelentenek aláhúztuk. Tehát ebben a példában I = 5. Az összegzést az 1,2,3,…n számok összes lehetséges permutációjára ki kell terjeszteni, ezek száma n!, azaz „n faktoriális”, (n! = 1∙2∙3∙…∙n), ami azt jelenti, hogy a fenti „szummában” n! számú tag van. Ez már kis n esetén is nagy szám: 2! = 2, 3! = 6, 4! = 24, 5! = 120,…stb. Ez mutatja, hogy a determináns kiszámítása már nem túl nagy méretek esetén is elég nehézkes, nagyon nagy n esetén még egy számítógépnek is komoly feladat a számítás elvégzése. Mivel azonban néha gép nélkül is ki kell tudnunk számolni egy determináns értékét ezért kidolgoztak olyan tételeket, amelyek segítségével a számítás könnyebben kivitelezhető. 1.17.Példa: Először a definíció alapján kiszámítjuk a 2×2-es mátrix determinánsát.
a a Legyen A 11 12 . Ekkor detA = a11∙a22 – a12∙a21 a21 a22 Az összegzés az 1,2 számok összes lehetséges permutációjára kiterjed: P = {(1,2); (2,1)}. Nézzük az elemek „második indexeit”. Az első tagban az indexek sorrendje 1,2 itt nincs inverzió, I = 0, (–1)0=1, a másodikban pedig 2,1 itt az inverziók száma I = 1, (–1)1= –1. Ezzel igazoltuk a „kifejtés” helyességét. A számítást könnyű megjegyezni: a főátlóbeli elemek szorzatából kivonjuk a „mellékátló”-beli elemek szorzatát. Fontossága miatt egyszerűbb jelölésekkel is felírjuk a determinánst.
a b c d
ad bc;
1.18.Példa: Kézi számítások során gyakran találkozunk harmadrendű determinánssal. Számítsuk ki ezt is. Mivel 3! = 6, ennek a determinánsnak a kifejtése során 6 tagot kell kapnunk. Ez a 6 tag a következő 43
Óbudai Egyetem BGK
Fejezetek a matematikából
a11 a12 a21 a22
a13 a23 a11a22 a33 a12 a23a31 a13a21a32 a11a23a32 a12 a21a33 a13a22 a31;
a31
a33
a32
Ha most a szorzatokban szereplő tényezők második indexeit vizsgáljuk, akkor ezek a következők: (1,2,3); (2,3,1); (3,1,2); (1,3,2); (2,1,3); (3,2,1). Látható, hogy ezzel megkaptuk 3 db szám összes lehetséges permutációit, és az is ellenőrizhető, hogy ezen permutációkban az inverziók száma rendre a következő: 0, 2, 2, 1, 1, 3. Tehát az első három tag esetében páros számú a következő három tag esetében pedig páratlan számú. Mivel a (–1) páros kitevőjű hatványa +1, páratlan kitevőjű hatványa pedig –1, ez már indokolja is a determináns kifejtésében szereplő tagok előjelét. Kizárólag harmadrendű determináns kifejtése elvégezhető egy speciális módon, amelyet Sarrus-szabályként ismerünk. Ehhez egészítsük ki a mátrixot még két oszloppal úgy, hogy a mátrix után leírjuk még az első és a második oszlopot ebben a sorrendben, a11 a21
a12 a22
a13 a11 a23 a21
a12 a22 ;
a31
a32
a33 a31
a32
majd a kapott sémát kifejtjük a következő módon. Az ábrán folytonos vonallal jelölt „átlók” mentén álló komponenseket összeszorozzuk, majd a szorzatokat összeadjuk, majd ebből kivonjuk a szaggatott vonalak mentén álló komponensek szorzatait. Ha a szorzásokat elvégezzük akkor jól láthatóan rendre a definíció alapján adódó hat tagot kapjuk előjelhelyesen. 1.19.Példa: Számítsuk ki a következő harmadrendű determinánst a Sarrus-szabállyal. 1 3 2 1 3 2 1 3 2 1 3 2 1 3 2 1 6 36 20 8 15 36 19; 4
5
6
4
5
6 4
5
A kifejtést lehetővé tevő általános tétel megfogalmazásához szükség van még egy fogalomra. 1.33.Definíció: Az n-ed rendű
a11 a12 a a A 21 22 ... ... an1 an 2
... a1n ... a2 n ; ... ... ... ann
mátrix aij eleméhez tartozó előjeles aldeterminánst a következő módon értelmezzük.
44
Óbudai Egyetem BGK
Fejezetek a matematikából
a11 ... ai 1,1 i j Aij 1 det ai 1,1 ... a n1
...
a1, j 1
a1, j 1
...
...
...
...
...
... ai 1, j 1
ai 1, j 1 ...
... ai 1, j 1 ai 1, j 1 ... ...
...
...
...
...
an, j 1
a1, j 1
...
a1n ... ai 1,n ; ai 1,n ... ann
Tehát azAij valós számot úgy kapjuk, hogy az A mátrixból elhagyjuk az i-edik sort és a j-edik oszlopot, a kapott (n–1)-ed rendű mátrixnak (amelyet szokás almátrixnak vagy minornak nevezni) kiszámítjuk a determinánsát, és azt megszorozzuk (–1) „annyiadik” hatványával amennyi a sorindex és oszlopindex összege. Az előjeles aldeterminánst szokás adjungáltaldeterminánsnak is nevezni. Ez utóbbi előjel meghatározását könnyíti meg a „sakktábla szabály”. Ha megjegyezzük az alábbi sémában az előjelek helyét, akkor az aldeterminánsok előjelezése egyszerűbb feladat.
...
...
...
... ... ... ...
A séma nyilván tetszőleges méretig általánosítható. A lényeg, hogy a bal felső sarokban + jel van, a többi pedig a sakktábla sötét és világos mezőinek megfelelően váltakozik.Ezek után következhet a determinánsok kiszámítására vonatkozó alaptétel. 1.17.Tétel: (Kifejtési tétel) Az A aij Rn×n négyzetes mátrix determinánsa kiszámítható az alábbi összeggel. n
kifejtés az i-edik sor szerint :
det A aij Aij ai1 Ai1 ai 2 Ai 2 ... ain Ain ; j 1 n
kifejtés a j -edik oszlop szerint : det A aij Aij a1 j A1 j a2 j A2 j ... anj Anj ; i 1
A bizonyítást későbbre halasztjuk, amikor már a kezünkben van a determináns, néhány kifejtési tételtől független tulajdonsága. A tétel a következőt jelenti. Egy mátrix determinánsát kiszámíthatjuk az alábbi módon. 1. Kifejtés az i-edik sor szerint: Kiválasztjuk a mátrix i-edik sorát, ennek a sornak minden komponensét megszorozzuk a hozzátartozó előjeles aldeterminánssal, és ezeket a szorzatokat összegezzük. 45
Óbudai Egyetem BGK
Fejezetek a matematikából
2. Kifejtés a j-edik oszlop szerint: Kiválasztunk egy tetszőleges oszlopot, ennek az oszlopnak minden komponensét megszorozzuk a hozzátartozó előjeles aldeterminánssal és ezeket a szorzatokat összegezzük. A tételben benne van, hogy a számítás eredménye független attól, hogy melyik sort illetve oszlopot választjuk, továbbá attól is, hogy sor vagy oszlop szerint fejtjük ki a determinánst. Mindig úgy választunk, hogy a számítás a legegyszerűbb legyen. 1.20.Példa: Igazoljuk, hogy a 2×2-es mátrix determinánsára a kifejtési tétellel ugyanazt az eredményt kapjuk mint a definíció alapján. Az első sor szerint kifejtve
a11 a12 a11 A11 a12 A12 a11a22 a12 a21 ; ugyanis a sakktábla a21 a22 Ez valóban ugyanaz az eredmény. 1.21.Példa: Fejtsük ki a 3×3-as mátrix determinánsát az első sor szerint és mutassuk meg, hogy a definícióval egyező eredményt kapunk.. Az előjelezésnél vegyük alapul a sakktábla szabályt.
a11 a12 a21 a22 a31
a32
a13 a a23 a11 22 a32 a33
a23 a a a a a12 21 23 a13 21 22 a33 a31 a33 a31 a32
a11 a22 a33 a23 a32 a12 a21 a33 a23 a31 a13 a21 a32 a22 a31 a11 a22 a33 a11 a23 a32 a12 a21 a33 a12 a23 a31 a13 a21 a32 a13 a22 a31 Látható, hogy valóban a korábbival egyező eredményt kapunk, ugyanaz a 6 tag jelenik meg az összegben csak esetleg más sorrendben. A 3×3-as determináns kifejtésénél tehát felhasználtuk a már ismert 2×2-es determinánst, és így tovább a 4×4-es determinánsnál fel kell használni, hogy ismerjük a 3×3-ast, hiszen egy 4×4-es kifejtésénél adódik 4 db 3×3-as aldetermináns. A módszer innen világos, azonban mégsem alkalmazzuk közvetlenül ezt a módszert. Ugyanis nagyon sok számítással jár, és különösen ha fejben számolunk, sok a hibalehetőség. Egy 4×4 –es determináns kifejtésénél ugyanis szükség van 4 db 3×3-as determninánsra, és mind a 4 db 3×3-as determinás esetén szükség van 3 db 2×2es determinánsra. Ennél „rosszabb” a helyzet, ha nagy méretű mátrixok determinánsát számítjuk ki. Ezen probléma megkerülésére igazolunk az alábbiakban néhány tételt, amely megkönnyíti a determinánsok kiszámítását. 1.18.Tétel: Az A mátrix determinánsa megegyezik AT transzponáltjának determinánsával.
det Α det AT
Bizonyítás:Azt kell igazolni, hogy
46
Óbudai Egyetem BGK det A 1
Fejezetek a matematikából
I P
P
a11 a22 ... ann 1
I Q
Q
a11 a2 2 ... ann det AT
ahol P és Q az {1, 2, ..., n} halmaz egy-egy permutációját jelöli. Az egyenlőség azért igaz, mert a bal oldali összeg minden tagjához hozzárendelhető a jobboldali összegnek pontosan egy tagja előjelhelyesen. ■ Ennek a tételnek a haszna a következő. A következőkben elég a determinánsok soraira vonatkozólag megfogalmazni a tételeket. Ezen tétel alapján következik, hogy az állítások oszlopokra is igazak. 1.19.Tétel: Ha az A mátrix egy sorának minden komponense zérus, akkor a determinánsa zérus. Bizonyítás: A determináns definíciója szerinti
det A A 1 a11 a22 ... ann I
P
összeg minden egyes tagjában pontosan egy tényező szerepel az adott sorból, és ez a tényező zérus, tehát az összeg zérus. ■ 1.20.Tétel: Ha egy determináns két sorát felcseréljük, akkor a determináns előjelet vált. Bizonyítás: Ha az i-edik és a j-edik sort felcseréljük (pl. i<j) akkor azt kell igazolnunk, hogy teljesül a
1 P
egyenlőség,
I P
a11 ... aii ... a j j ... ann 1 P'
ahol
P 1,..., i ,..., j ,..., n
és
I P '
a11 ... a j j ... aii ... ann
P ' 1,..., j ,..., i ,..., n .
Mindkét
összegben a szorzatokat tudjuk úgy párosítani, hogy a tényezői megegyeznek, de a szorzat ellentétes előjelű. Ugyanis csak azt kell meggondolni, hogy az inverziók száma mindig páratlan számmal változik, ugyanis a P-ből P'-t úgy kapjuk, hogy az i-edik és a j-edik elemeket megcseréljük, azaz I(P') = I(P) + egy páratlan szám. ■ 1.21.Tétel: Ha egy mátrixban két sor elemenként megegyezik, akkor a mátrix determinánsa zérus. Bizonyítás: Cseréljük fel a két sort. Ekkor az előző tétel szerint az előjelnek meg kell változni, ugyanakkor nem változik, mert két azonos sort cseréltünk fel. Eszerint a determináns értéke csak nulla lehet. ■ 1.22.Tétel: Ha egy mátrix egy sorának minden elemét megszorozzuk ugyanazzal az α valós számmal, akkor a mátrix determinánsa is α-val szorzódik. Azaz
47
Óbudai Egyetem BGK
Fejezetek a matematikából
a12 a11 ... ... det ai1 ai 2 ... ... an1 an 2
... ... ... ... ...
a1n a11 a12 ... ... ... ain det ai1 ai 2 ... ... ... an1 an 2 ann
... a1n ... ... ... ain ; ... ... ... ann
Bizonyítás: Fejtsük ki a determinánst az adott sor szerint, ekkor minden tagban szerepel az α szorzótényező, tehát a determináns valóban α-val szorzódik. ■ Ennek a tételnek egy következménye az alábbi állítás. 1.23.Tétel: Ha egy n-ed rendű A mátrixot szorzunk egy α skalárral, akkor a skalárszorzással kapott mátrix determinánsa az eredeti determinánsnak és az α n-edik hatványának a szorzata, azaz
Ha A R nn akkor det A n det A ; Bizonyítás: Alkalmazzuk az előző tételt minden sorra. Minden sor α-val történő szorzásakor a determináns szorzódik α-val. Mivel ezt elismételjük mind az n db sorra, valóban azt kapjuk, hogy a determináns αn-nel szorzódik. Az állítást a determináns definíciója alapján úgy is igazolhatjuk, hogy a determináns kiszámítása során az összeg minden tagját úgy kapjuk, hogy minden sorból és minden oszlopból veszünk pontosan egy elemet és ezeket összeszorozzuk. Világos, hogy ha minden sort szorzunk α-val, akkor a szorzatok αn-nel szorzódnak. ■ 1.24.Tétel: Ha egy mátrixban egy sor elemei úgy állnak elő, hogy egy másik sor elemeit szorozzuk ugyanazzal az α valós számmal, akkor a mátrix determinánsa zérus. Bizonyítás: Az előző tétel szerint egy ilyen mátrixnak a determinánsa α-szorosa azon mátrix determinánsának, amelyben két sor megegyezik, de ez utóbbiról tudjuk, hogy értéke zérus. ■ 1.25.Tétel: Ha egy mátrix i-edik sorának minden eleme két tag összegeként áll elő, aij = a’ij + a”ij akkor a mátrix determinánsa egyenlő két determináns összegével, melyek az i-edik sor kivételével megegyeznek az eredeti determinánssal, i-edik sorukban pedig rendre az a’ij illetve az a”ij elemek vannak. Azaz a12 a11 ... ... det a 'i1 a "i1 a 'i 2 a "i 2 ... ... an1 an 2
... ... ... ... ...
a11 a12 ... ... ... a 'in a "in det a 'i1 a 'i 2 ... ... ... an1 an 2 ann a1n
... ... ... ... ...
a1n a11 a12 ... ... ... a 'in det a "i1 a "i 2 ... ... ... an1 an 2 ann
... ... ... ... ...
a1n ... a "in ; ... ann
Bizonyítás: Fejtsük ki a determinánst az i-edik sora szerint, majd alkalmazzuk a valós számok halmazában érvényes disztributív és kommutatív törvényt. ■ 48
Óbudai Egyetem BGK
Fejezetek a matematikából
1.26.Tétel: A determináns, bármelyik rögzített sorának lineáris függvénye. Azaz ha a mátrixot úgy tekintjük mint n db sorvektorból álló „vektort”, akkor írhatjuk, hogy a1T a1T a1T ... ... ... T T T det ai bi det ai det bTi ; ... ... ... T T aTn a n a n
Bizonyítás: Az előző két tétel következménye. ■ 1.27.Tétel: Ha egy mátrix egyik sora a többi sorok lineáris kombinációja, akkor a mátrix determinánsa zérus. Bizonyítás: A linearitásból következik, hogy ebben az esetben a mátrix előáll annyi determináns lineáris kombinációjaként, ahány tagú az adott sorbeli lineáris kombináció, és ezekben a determinánsokban megegyezik két sor, tehát ezen determinánsok értéke külön-külön zérus. ■ 1.28.Tétel: Egy determináns értéke nem változik meg, ha egy sorának α-szorosát (αR) egy másik sorához adjuk. Tehát ha a j-edik sor α-szorosát az i-edik sorhoz adjuk, akkor
a1T a1T ... ... aT a T j j det det ... ; ... T ai aTj aiT ... ... aT a T n n Bizonyítás: Felhasználva a linearitást, valamint azt, hogy egy determináns zérus ha két sora megegyezik, írhatjuk, hogy
a1T a1T a1T a1T a1T ... ... ... ... ... aT a T a T a T a T j j j j j det det ... det ... det ... 0 det ... ; ... T T ai aTj a j aiT aiT aiT ... ... ... ... ... aT a T a T a T a T n n n n n 49
Óbudai Egyetem BGK
Fejezetek a matematikából
Ezt kellett igazolni. ■ A tétel tartalmára úgy hivatkozunk, hogy ún. sorekvivalens átalakításokat végzünk. Az elnevezés arra utal, hogy a sorokkal végzett műveletek következtében a determináns értéke nem változik meg. A determinánsok kiszámítása szempontjából talán ez tekinthető a legfontosabb tételnek. Ennek alkalmazása során úgy járunk el, hogy kiválasztunk egy sort, és ennek számszorosait úgy adjuk a többi sorhoz, hogy egy adott oszlopban egy elem kivételével minden elem zérus legyen. Ha ezt elértük, akkor az adott oszlop szerint kifejtve a determinánst nyilván könnyű dolgunk van, mert egy kivétellel minden aldetermináns zérussal szorzódik, tehát egy n-ed rendű mátrix esetében n–1 db aldeterminánst ki sem kell számolni. A determináns rendjének csökkentése ezzel a módszerrel folytatható. Egy másik eset az, hogy a mondott módszerrel olyan mátrixhoz jutunk, amely a fenti tételek egyikében szerepel, és ekkor determinánsa nulla. Az említett tételek birtokában már könnyen igazolhatjuk a kifejtési tételt. Hangsúlyozzuk, hogy a fenti tételek bizonyítása során nem használtuk a kifejtési tételt, hanem a detrmináns definíciójára támaszkidtunk. A Kifejtési tétel bizonyítása: A determináns sor szerinti linearitására támaszkodva, egy n-ed rendű determináns esetében nyilvánvaló a következő egyenlőség a11
a12
... a1n
a11
a12
... a1n
a11
a12
... a1n
a11
a12
... a1n
...
...
... ...
...
...
... ...
...
...
... ...
...
...
... ...
ai1
ai 2
... ain ai1
0
...
0 0
ai 2
...
0 ... 0
0
... ain ;
...
...
...
...
...
...
...
...
...
...
...
...
an1 an 2 ... ann
...
an1 an 2 ... ann
...
an1 an 2 ... ann
...
...
an1 an 2 ... ann
Ha itt figyelembe vesszük az előjeles aldetermináns fogalmának értelmezését akkor látjuk, hogy kifejtve az egyes determinánsokat majd ezeket összeadva éppen a n
det A aij Aij ai1 Ai1 ai 2 Ai 2 ... ain Ain j 1
egyenlőséget kapjuk, ezzel a kifejtési tételt igazoltuk. ■ 1.22.Példa: Számítsuk ki kifejtési tétellel két különböző módon az alábbi harmadrendű determinánst. 2 4
3 1 0 3 ?
2 3
Fejtsük ki a determinánst két különböző módon is.
50
6
Óbudai Egyetem BGK
Fejezetek a matematikából
Az első sor szerint kifejtve, figyelembe véve a sakktábla szabályt kapjuk, hogy 3 1 0 3 4 3 4 0 0 3 2 3 1 2 0 9 3 24 6 12 0 120; 3 6 2 6 2 3 2 3 6 2 4
A második oszlop szerint kifejtve, azt adódik, hogy 3 1 4 3 2 1 2 1 0 3 3 0 3 3 24 6 0 6 2 3 6 4 120; 2 6 2 6 4 3 2 3 6 2 4
A két eredmény természetesen egyenlő. A második példában, a teljesség kedvéért kiírtuk a zérus tagot is, de természetesen erre nincs szükség. A két kifejtés összehasonlításával azt szeretnénk hangsúlyozni, hogy ha a kifejtési tételt alkalmazzuk és a determinánsban vannak nulla komponensek, akkor célszerű olyan sor vagy oszlop szerint kifejteni a determinánst amelyben a legtöbb nulla komponens van. 1.23.Példa: Számítsuk ki sor ekvivalens átalakításokkal az alábbi negyedrendű determinánst.
1
2 1
3
1
2
3
4
2
1 2
3
1
3
4
7
1
3
0 1
6
8
0
4
2
4
5
0
1
7
4
13
12
26
20
13 20 12 26 52;
2
1 6 8 4 1
2
0
13
12
4 0 26
7 4
1
7
20 4
A számítások a következők voltak: az első lépésben az első sornak rendre a 2, (–1) és 3-szorosát levontuk a 2., 3. és 4. sorból. Ennek eredménye, hogy az első oszlopban egy kivétellel minden komponens zérus lett. Ezután kifejtettük a determinánst az első oszlop szerint. A kapott harmadrendű determinást is így alakítottuk tovább. A harmadik sort változatlanul hagyva, ezen sor rendre (–1) és 4-szeresét kivontuk rendre az 1. és 2. sorból, így ismét az első oszlopban, egy kivétellel minden komponens zérus lett. A kapott determinánst kifejtettük az első oszlop szerint. Ez már csak egy másodrendű determináns, amelyet közvetlenül kiszámítottunk. 1.24.Példa: Határozzuk meg az alábbi determináns értékét elemi sor- és oszlopátalakításokkal.
2 1 3 1 0 1 1 1 1 0 2 1 1 2 1 2
2 1 3 2 2 4 3 1 5 5 0 5 51
1 2 2 4 0 1 3 1 5 0 5 0 5 0
Óbudai Egyetem BGK
Fejezetek a matematikából
4 3
0 1
6 4 6 5 20 30 10 5 5 5 0 5
Ebben az esetben a műveletek „megfejtését” az Olvasóra bízzuk. A módszer hatékonysága azonban fokozható. Igaz ugyanis a következő állítás. 1.29.Tétel: Egy háromszög mátrix (alsó vagy felső háromszögmátrix) determinánsa a főátlóbeli komponensek szorzata. Tehát
a11 0 a a det 21 22 ... ... an1 an 2
... 0 a11 a12 0 a ... 0 22 det ... ... ... ... ... ann 0 0
... a1n ... a2 n a a ... ann ; ... ... 11 22 ... ann
Bizonyítás: A determináns értéke definíció szerint olyan szorzatok összege, amely szorzatok úgy adódnak, hogy minden sorból és oszlopból kiválasztunk pontosan egy komponenst, majd ezeket összeszorozzuk. Azt állítjuk, hogy egy háromszögmátrix determinánsának kifejtése során az n! szorzat közül n! – 1 db zérus, és csak egy tag különbözik 0-tól, mégpedig az a tag, amely a főátlóbeli komponenseket tartalmazza. Valóban, egy felső háromszögmátrix esetén induljunk az utolsó sorból. Ebben csak egy tag különbözik zérustól, az ann komponens, válasszuk tehát ki ezt. Ha ennek sorát és oszlopát elhagyjuk, akkor a maradék almátrixból ismét csak a jobb alsó sarokbeli elemet választhatjuk, mert csak ez különbözik zérustól, tehát szorzunk an–1,n–1 elemmel. Így folytatva tovább, valóban a főátló elemeinek szorzatát kapjuk. Ha alsó háromszögmátrixunk van ugyanezt az eljárást követjük de a bal felső sarokból indulva. ■ 1.25.Példa: Számítsuk ki az alábbi negyedrendű determináns átalakításokkal úgy, hogy háromszögmátrix alakra hozzuk.
1 2 1 0 1 2 2 5 3 4 0 1 1 1 5 1 0 3 2 3 1 2 0 1
1 0 1 2 1 4 0 1 6 1 0 0 1 2 0 0
értékét
sorekvivalens
1 0 1 4 11 3 (6) 18; 3 11 0 6
A műveletek a következők voltak. Először az első sor 2, (–1) és (–2)-szeresét levontuk rendre a 2., 3. és 4. sorból. Ezután a 2. sor 3 és 1-szeresét levontuk rendre a 3. és 4. sorból. A kapott mátrix felső háromszögmátrix. determinánsa a főátlóbeli komponensek szorzata. 1.30.Tétel: Determinánsok szorzástétele Ha A és B n-ed rendű mátrixok, akkor szorzatuk determinánsa egyenlő determinánsaik szorzatával det(AB) = detA∙detB. 52
Óbudai Egyetem BGK
Fejezetek a matematikából
Bizonyítás:legyen C = AB és jelölje cj a C mátrix j-edik oszlopvektorát. Ekkor nyilvánvalóan n
igaz, hogy c j bij ai , j = 1, 2, ..., n esetén. Ekkor a linearitás miatt aCmátrix determinánsa i 1
det C 1 Q
I Q
b11 b2 2 ... bnn det A det B det A
Ezt kellett igazolni. ■ A későbbiekben bevezetendő inverzmátrix kiszámításához van szükség az alábbi fogalomra és az azt követő állításra. 1.34.Definíció: Determináns „ferde kifejtése” Ha az A mátrix i-edik sorának komponenseit megszorozzuk a j-edik sorához tartozó előjeles aldeterminánsokkal, akkor a kapott összeget a determináns ferde kifejtésének nevezzük. n
aik Ajk ai1 Aj1 ai 2 Aj 2 ... ain Ajn ; i
j
k 1
A ferde kifejtéssel kapcsolatos alapvető eredmény a következő. 1.31.Tétel: A ferde kifejtés értéke zérus. Azaz n
aik Ajk ai1 Aj1 ai 2 Aj 2 ... ain Ajn 0; ha i
j
k 1
Bizonyítás: A ferde kifejtés definíciójában szereplő összeget akkor kapunk, ha egy olyan mátrix determinánsát fejtjük ki az i-edik sor szerint, amelyben az i-edik és a j-edik sor megegyezik. Valóban mivel két sor megegyezik a determináns értéke egyrészt nulla, másrészt ha kifejtjük a j-edik sor szerint írhatjuk, hogy ...
...
ai1 ai 2 0 ...
...
...
...
...
...
ai 3 ... ain
ai1
ai 2
ai 3
... ain
...
... n
n
ai 3
... ... ... ... ain a j1 a j 2
... ... ... a jk A jk aik A jk k 1 a j 3 ... a jn k 1
...
...
...
...
...
ai1 ai 2 ...
...
... ...
...
...
...
...
...
ugyanis a j-edik sor elemei rendre ugyanazok, mint az i-edik sor komponensei. Ha ennek a mátrixnak a determinánsát kifejtjük a j-edik sor szerint az éppen azt jelenti, hogy az i-edik sor komponenseivel szorozzuk a j-edik sorhoz tartozó aldeterminánsokat, ami azt jelenti, hogy valóban egy ferde kifejtést kapunk. ■
53
Óbudai Egyetem BGK
Fejezetek a matematikából
Mátrixok inverzének számításánál, lineáris egyenletrendszerek megoldásánál szükség van az alábbi különleges konstrukcióra. 1.35.Definíció: Az ARn×n mátrix adjungáltja az az adjA-val jelölt n-ed rendű mátrix, amely iedik sorának j-edik eleme megegyezik az A mátrix aji eleméhez, tehát j-edik sora i-edik eleméhez tartozó előjeles aldeterminánssal (tehát az adjungált aldeterminánssal) A11 A adjA 21 ... An1
A12 A22 ... An 2
T
A1n A11 A ... A2 n 12 ... ... ... ... Ann A1n ...
An1 ... An 2 ; ... ... ... Ann
A21 ... A22 ... A2 n
Az adjungálttal kapcsolatosan a következő alapvetően fontos tételt kell igazolnunk. 1.32.Tétel: Az adjungált mátrix determinánsa egyenlő az eredeti A mátrix determinánsának (n–1)-edik hatványával. det(adjA) = (detA)n–1 Bizonyítás: Képezzük az A mátrix és az adjungált mátrix szorzatának determinánsát. A determinánsok szorzástétele szerint, igaz, hogy det(A adjA) det A det adjA , másrészt viszont a kifejtési tétel és a ferde kifejtésre vonatkozó tétel szerint a11 a12 a a22 A adjA 21 ... ... an1 an 2
... a1n A11 ... a2 n A12 ... ... ... ... ann A1n
An1 A ... An 2 0 ... ... ... ... Ann 0
A21 ...
0
...
A22
A
...
...
...
0
...
... A2 n
0 0 n n A det A ... A
ugyanis, ha az i-edik sort szorozzuk a j-edik oszloppal úgy hogy i ≠ j akkor éppen egy ferde kifejtést kapunk, ami zérus, ha viszont az i-edik sort szorozzuk az i-edik oszloppal akkor a determináns kifejtését kapjuk. A kapott mátrix egy háromszögmátrix, melynek determinánsa a főátlóbeli komponensek szorzata. Ebből már következik az állítás, ugyanis
det(A adjA) det A det adjA det A ; ahonnan det adjA det A n
n1
;
ezt kellett igazolni. ■ Lineáris egyenletrendszerek megoldásának vizsgálatát és a szereplő tételek megfogalmazását könnyíti meg az alábbi fogalom.
54
Óbudai Egyetem BGK
Fejezetek a matematikából
1.36.Definíció: Az ARn×kmátrixdeterminánsrangja r, ha a mátrixban van olyan r-ed rendű kvadratikus almátrix, amelynek determinánsa nem zérus, de minden legalább (r +1)-ed rendű almátrix determinánsa zérus. A determinánsrang tehát a legnagyobb el nem tűnő aldetermináns rendje. 1.37.Definíció: Az ARn×kmátrixoszloprangja r, ha az oszlopvektor-rendszerből kiválasztható r db lineárisan független vektor, de minden legalább (r +1) elemű vektorrendszer lineárisan összefüggő. Az oszloprang tehát a lineárisan független oszlopvektorok maximális száma. 1.38.Definíció: Az ARn×kmátrixsorrangja r, ha a sorvektor-rendszerből kiválasztható r db lineárisan független vektor, de minden legalább (r +1) elemű vektorrendszer lineárisan összefüggő. A sorrang tehát a lineárisan független sorvektorok maximális száma. 1.33.Tétel: Bármely ARn×k mátrix determinánsrangja, oszloprangja és sorrangja egyenlő. Bizonyítás: Nem bizonyítjuk. ■ Ez a tétel lehetőséget ad arra, hogy bevezessünk egy jelölést a mátrix rangjára, hiszen mindegyik fogalom ugyanazt az értéket adja: Az A mátrix rangjátρ(A) jelöli. Az elemi bázistranszformáció kiváló lehetőséget biztosít egy mátrix rangjának meghatározására. A legegyszerűbb, ha az oszloprangot kérdezzük. A mátrix oszlopvektorai közül annyit, amennyit csak lehet, egyenként beviszünk a bázisba, a rang egyenlő azon vektorok számával, amelyeket bevittünk a bázisba. 1.39.Definíció: Az ARn×nn-ed rendű kvadratikus mátrixot szingulárisnak nevezzük, ha ρ(A)
55
Óbudai Egyetem BGK
Fejezetek a matematikából
1.8. Kvadratikus mátrix inverze A címben szereplő jelző hangsúlyozása arra utal, hogy létezik a vizsgálandó fogalom olyan mátrixok esetében is, amelyek nem négyzetesek, de ez mind az elmélet mind a gyakorlat számára elhanyagolható fontossággal bír, ezért mi csak a négyzetes mátrixokkal foglalkozunk. Induljunk ki a következő problémából. Oldjuk meg a valós számok halmazán az b a∙x = b (a, bR, a ≠ 0) egyenletet. A megoldás nyilván: x b a 1 a 1 b . A valós számok a halmazában értelmeztük az osztás műveletét, de a mátrixok halmazában ez nem lehetséges. Ezért írtuk fel a megoldást hatványalakban is, ahol a–1 az aR, a≠0 valós szám „inverz eleme”. Az egyenlőséglánc végén azt is hangsúlyoztuk, hogy a valós számok szorzása kommutatív, de tudjuk, hogy mátrixokra ez nem igaz. Általánosítsuk a problémát mátrixokra. Megoldandó az A∙X = B mátrixegyenlet, ahol tehát ARn×n,BRn×n adott mátrixok és XRn×n az a mátrix, amely kielégíti a felírt egyenletet, nyilván X-et keressük, X az egyenletben az ismeretlen. Tegyük fel, hogy létezik egy A–1 jelű, n-ed rendű négyzetes mátrix, amelyre igaz, hogy A–1∙A = E, ahol E az n-ed rendű egységmátrix. Szorozzuk meg ezzel az egyenletet balról. Azért „balról”, mert tudjuk, hogy a szorzás nem kommutatív. A∙X = B A–1∙A∙X = A–1∙B E∙X = A–1∙B X = A–1∙B A mátrixegyenletet megoldottuk. Felhasználtuk, hogy E∙X = X, tetszőleges Xmátrix esetén, hiszen E az egységmátrix. Aprobléma lényege a következő. Adott,n-ed rendű A mátrixhoz keressük azt a C mátrixot, amellyel C∙A = E.De megkérdezhetjük azt is, hogy létezik-e olyan D mátrix, amellyel AD = E. Ez utóbbi más kérdés, hiszen ismét hangsúlyozzuk, hogy a szorzás nem kommutatív. 1.41.Definíció: Adott az ARn×n négyzetes mátrix. Ha létezik olyan CRn×n mátrix amelyre CA = E teljesül, akkor C-t az A mátrix baloldali inverzének nevezzük. 1.42.Definíció:Adott az ARn×n négyzetes mátrix. Ha létezik olyan DRn×n mátrix amelyre AD = E teljesül, akkor D-t az A mátrix jobboldali inverzének nevezzük. Mivel a szorzás nem kommutatív, azt gondolhatnánk, hogy ha létezik ilyen C és D akkor azok különböznek. De a válasz nemleges. 1.34.Tétel: Ha az ARn×n mátrixnak létezik jobboldali (baloldali) inverze, akkor létezik baloldali (jobboldali) inverze is, és azok egyenlők: C = D. 56
Óbudai Egyetem BGK
Fejezetek a matematikából
Bizonyítás: Tegyük fel, hogy létezik C baloldali inverz és D jobboldali inverz, azaz teljesül, hogyCA = E és AD = E. Szorozzuk meg az első egyenlőséget jobbról a D mátrixszal a másodikat pedig balról a C mátrixszal. Azt kapjuk, hogy CAD = ED = D és CAD = CE = C Mivel a bal oldalak egyenlők, a jobb oldalaknak is egyenlőknek kell lenni, tehát C = D. Mivel egyenlők, ha az egyik létezik, nyilván létezik a másik is. ■ Ez a tétel lehetőséget ad arra, hogy bevezessünk egy jelölést és egy elnevezést. 1.43.Definíció: Az ARn×n négyzetes mátrix inverzének nevezzük, és A–1 szimbólummal jelöljük azt a mátrixot, amely eleget tesz az alábbi követelményeknek A–1A = AA–1 = E Az inverzmátrix létezésének feltételét adja meg az alábbi állítás. 1.35.Tétel: Az ARn×n mátrixnak pontosan akkor létezik inverze, ha az A mátrix nemszinguláris, tehát ha detA ≠ 0. Bizonyítás: A determinánsok szorzástétele szerint, mivel AA–1 = E, kapjuk, hogy det(AA–1) = detA·detA–1 = detE = 1; Ebből adódik, hogy detA = 0 nem lehetséges, tehát ha az A mátrixnak létezik inverze, akkor szükségképpen detA ≠ 0. Másképpen fogalmazva ha detA = 0, akkor nem létezik inverz, vagyis szinguláris mátrix nem invertálható. A detA ≠ 0 feltétel elégségessége pedig a későbbiek során derül ki, amikor ezen feltétel mellett konstruktív eljárást adunk az inverz meghatározására. ■ Az igazolt tétel fontos következménye az alábbi állítás. 1.36.Tétel: Ha A reguláris mátrix, akkor inverzének determinánsa az A determinánsának reciproka. Azaz
det A 1
1 ; det A
Bizonyítás: Az állítás az előző tétel bizonyítása során felírt detA·detA–1 = detE = 1 egyenlőség közvetlen következménye. ■ Egy fontos és alapvető műveleti tulajdonságra világít rá az alábbi tétel. 1.37.Tétel: Ha az ARn×n és BRn×n nemszinguláris mátrixok, akkor szorzatuknak is létezik inverze, és teljesül, hogy (AB)–1 = B–1A–1 57
Óbudai Egyetem BGK
Fejezetek a matematikából
Bizonyítás: Világos, hogy A és B regularitása miatt det(AB) = detA·detB ≠ 0, másrészt (AB)(AB)–1 = (AB)(B–1A–1) = A(BB–1)A–1= AEA–1= AA–1= E. Ezt kellett igazolni, ■ Ezek
után
rátérhetünk
az
inverzmátrix
meghatározására.
Több
módszert
mutatunk.
Mátrixinverzét kiszámíthatjuk például determinánsok segítségével. Legyen A aij Rn×nn-ed rendű mátrix és tegyük fel, hogy detA = │A│≠ 0. Idézzük fel az adjungált mátrix fogalmát. T
n×n , és használjuk fel, hogy a determináns kifejtéséről mondottak adjA Aij Aji R szerint egyrészt a determináns kifejtése
n
aij Aij ai1 Ai1 ai 2 Ai 2 ... ain Ain
A
j 1
másrészt a ferde kifejtése n
aij Akj ai1 Ak1 ai 2 Ak 2 ... ain Akn 0 j 1
Szorozzuk most az A mátrixot az adjungált mátrixszal. a11 a12 a a22 A adjA 21 ... ... an1 an 2
... a1n A11 ... a2 n A12 ... ... ... ... ann A1n
An1 A ... An 2 0 ... ... ... ... Ann 0
A21 ...
0
...
A22
A
...
...
...
0
....
... A2 n
0 0 ... A
Az eredmény a következőképpen magyarázható. Ha az i-edik sort az i-edik oszloppal szorozzuk, akkor az eredmény detA, mert kifejtjük a determinánst (”kifejtés”), ha viszont az i-edik sort a j-edik oszloppalszorozzuk, akkor az eredmény 0 („ferde kifejtés”). Innen világos, hogy haa második tényezőt elosztjuk detA-val, épp az inverz mátrixot kapjuk, mert ebben az esetben a szorzás eredménye az egységmátrix. 1.38.Tétel: Ha az ARn×n négyzetes mátrix nemszinguláris, tehát detA ≠ 0, akkor létezik inverze és az előállítható az alábbi alakban
A 1
1 1 adjA adjA det A A
58
Óbudai Egyetem BGK
Fejezetek a matematikából
Bizonyítás: Az előző gondolatmenet alapján tehát írhatjuk, hogy
a11 a12 1 1 a21 a22 A adjA det A det A ... ... an1 an 2 A 1 0 A ... 0
0 A ... 0
... a1n A11 ... a2 n A12 ... ... ... ... ann A1n
0 1 ... 0 0 ... ... ... .... A 0 ...
An1 ... An 2 ... ... ... Ann
A21 ... A22 ... A2 n
0 1 ... 0 E; ... ... ... 0 .... 1 0
...
Ezzel azt is bizonyítottuk, hogy a regularitás (detA ≠ 0) elégséges az inverz létezéséhez. ■ 1.26.Példa: Számítsuk ki a következő mátrix inverzét.
2 3 A ; 4 8 Először meg kell győződnünk a regularitásról. Mivel detA = 16 – 12 = 4 ≠ 0, a mátrix reguláris, létezik inverze. Az adjungált mátrix felírásához szükség van az előjeles aldeterminánsokra. Ezek a következők
A11 8
A12 4
A21 3
A22 2
;
ahonnan az adjungált mátrix a következő T
8 4 8 3 adjA ; 3 2 2 2
A kapott képlet alapján a mátrix inverze innen már adódik.
A 1
0, 75 1 1 8 3 2 adjA ; det A 4 2 2 0,5 0,5
Mivel 2×2 méretű mátrixok gyakran előfordulnak a gyakorlatban, célszerű általánosan is felírni egy másodrendű mátrix inverzét.
59
Óbudai Egyetem BGK
Fejezetek a matematikából
a b 1.27.Példa: Határozzuk meg általánosan az A mátrix inverzét. Tegyük fel, hogy a c d mátrix reguláris, azaz determinánsa det A ad bc 0 . Ekkor létezik inverz. Az adjungált mátrixhoz először előállítjuk az előjeles aldeterminánsokat. Ezek a következők A11 d
A12 c
A21 b
A22 a
;
innen az adjungált mátrix már felírható T
d c d b adjA ; b a c a
Ebből következően
a b 1 d b 1 Ha A akkor A , ha ad bc 0; ad bc c a c d 1.28.Példa: Határozzuk meg az alábbi harmadrendű mátrix inverzét. 1 2 1 A 0 3 2 ; 2 4 5
Először kiszámítjuk az A determinánsát a kifejtési tétellel. Az első oszlop szerint kifejtve 2 1 3 2 2 1 3 2 1 2 15 8 2 4 3 7; 4 5 3 2 2 4 5
1 det A 0
A mátrix tehát reguláris, létezik inverze. Az adjungált mátrixhoz szükség van kilenc darab előjeles aldeterminánsra. Ezek a következők A11 A21 A31
3 2 4 5 2 1 4
5
2 1 3
2
7 14 7
0
A12 A22
2
2 5 1
1
2
5
A32
1 1 0
60
2
4
A13
3
A23
2
A33
0
3
2 4 1
2
2 4 1 2 0 3
6 8 3
Óbudai Egyetem BGK
Fejezetek a matematikából
Az előjeles aldeterminánsokból kapjuk az adjungált mátrixot T
7 4 6 7 14 7 adjA 14 3 8 4 3 2 ; 7 2 3 6 8 3 Ebből pedig már következik, hogy az inverz mátrix az alábbi
A
1
7 14 7 1 4 3 2 ; 7 6 8 3
A következőkben, az egyenletrendszerek elméletében még mutatunk más módszert mátrix inverzének meghatározására.
61
Óbudai Egyetem BGK
Fejezetek a matematikából
1.9. Lineáris egyenletrendszerek Egy lineáris egyenletrendszer a legáltalánosabb alakban az alábbi formában írható.
a11 x1 a12 x2 ... a1k xk b1 a21 x1 a22 x2 ... a2 k xk b2 ... an1 x1 an 2 x2 ... ank xk bn ahol az aijR valós számok az „együtthatók”, a biR valós számok a „jobboldalak”, és xj-k pedig az ismeretlenek(i = 1,2,…n; j = 1,2,…k). Az általános esetben tehát van n db egyenlet és ebben szerepel k db ismeretlen. Vezessünk be néhány jelölést és elnevezést. Legyen
a11 a12 a a A 21 22 ... ... an1 an 2
... a1k x1 b1 x b ... a2 k ; x 2 ; b 2 ; ... ... ... ... ... ank xk bn
Az ARn×k mátrixot együtthatómátrixnak nevezzük, az xRk vektor tartalmazza az ismeretleneket, a bRn pedig a jobboldal. Mielőtt rátérünk az egyenletrendszer megoldására, írjuk fel a fenti egyenletrendszert mátrix- és vektorműveletek segítségével is. a mátrixok szorzásának értelmezésénél külön kitértünk arra az esetre, hogyan szorzunk mátrixot vektorral. Ezek alapján azonnal látható, hogy a lineáris egyenletrendszer klasszikus alakja pontosan megegyezik az alábbi mátrix szorzattal. Ax = b Ez a felírás azon túl, hogy egyszerűbb, mint az eredeti, ötletet ad a megoldás módjára is. De mielőtt ehhez hozzákezdünk, még egy elnevezés következik. 1.44.Definíció: Az Ax = b lineáris egyenletrendszert homogénnek nevezzük ha b = 0, azaz ha mindegyik egyenlet jobboldala 0, és inhomogén, ha b ≠ 0, azaz van legalább egy olyan egyenlet, amelynek a jobboldala nem 0. I. eset: Az együtthatómátrix kvadratikus Elsőként azzal az esettel foglalkozunk, amikor az egyenletrendszer együtthatómátrixa négyzetes mátrix, másképpen fogalmazva, az egyenletek száma megegyezik az ismeretlenek számával. Ebben az esetben több módszert is mutatunk a megoldásra. 1.39.Tétel: Tegyük fel, hogy az ARn×n együtthatómátrix nemszinguláris, azaz létezik A–1 inverze. Ekkor az Ax = b lineáris egyenletrendszer megoldása x = A–1b.
62
Óbudai Egyetem BGK
Fejezetek a matematikából
Bizonyítás: Ez az összefüggés a korábbiakban már vizsgált mátrixegyenlet speciális esete. Tehát Ax = b A–1Ax = A–1b Ex = A–1b x = A–1b Ezt kellett igazolni. ■ Felhívjuk azonban a figyelmet arra, hogy ez a módszer csak nagyon korlátozott körben, az alábbi feltételek teljesülése esetén alkalmazható: 1. Az egyenletrendszerben ugyanannyi az ismeretlenek száma, mint az egyenleteké. 2. Az együtthatómátrix nemszinguláris, tehát létezik inverze. Ezek a feltételek azonban biztosítják is a megoldhatóságot, és ekkor a megoldás egyértelmű. 1.29.Példa: Oldjuk meg az alábbi lineáris egyenletrendszert mátrix inverzének felhasználásával. 1 2 1 x1 7 0 3 2 x 14 ; 2 2 4 5 x3 7
Az együtthatómátirx inverzét éppen az előző példában számítottuk ki.
A
1
7 14 7 1 4 3 2 ; 7 6 8 3
Innen azonnal adódik a megoldás az x =A–1b megoldóképlet segítségével. x1 7 14 7 7 7 14 7 1 28 1 x x2 4 3 2 14 4 3 2 2 8 ; 7 x3 6 8 3 7 6 8 3 1 19
1.30.Példa: Oldjuk meg az alábbi lineáris egyenletrendszert mátrix inverzének felhasználásával.
x1 2 x2 3x3 x4 2 3x 2 x 2 x 3 1 2 4 x1 3x2 2 x3 x4 1 x1 x2 x4 0
63
Óbudai Egyetem BGK
Fejezetek a matematikából
Elsőként ellenőriznünk kell, hogy az együtthatómátrix reguláris-e. Kiszámítjuk a determinánsát.
1 3 1 1
2 2 3 1
3 1 1 1 0 2 3 1 2 1 1 4 0 1 1 0
3 0 2 0
0 1 1 3 5 1 3 5 1 4 2 5 50 0; 0 4 2 1 0 0 0
Tehát létezik inverz. Szorzással ellenőrizhető, hogy az inverzmátrix a következő
0 8 10 12 10 0 15 25 1 A 1 ; 5 25 50 20 0 25 2 10 3 Az egyenletrendszer megoldása az alábbi szorzattal adódik.
0 2 8 10 12 58 10 0 15 25 3 1 1 35 1 xA b ; 5 25 1 50 20 0 50 45 25 0 2 10 3 23 Mint korábban láttuk, ezzel a módszerrel mátrixegyenleteket is meg tudunk oldani. 1.31.Példa: Oldjuk meg az alábbi mátrixegyenletet mátrix inverzének felhasználásával. 0 1 1 2 19 AX B; ahol A 0 2 3 ; B 19 19 ; X ? 2 1 4 38 38
Elsőként kiszámítjuk az A mátrix determinánsát. 1 2 1 1 2 2 3 2 30 2 3 19 0; 1 8 2 1 4 0 1 8
1 det( A) 0
Az együtthatómátrix tehát reguláris, létezik inverze. Szorzással ellenőrizhető, hogy az inverzmátrix a következő.
64
Óbudai Egyetem BGK
Fejezetek a matematikából
A
1
5 6 7 1 6 8 3 ; 19 4 1 2
Ennek ismeretében, a korábbiak szerint, már adódik a mátrixegyenlet megoldása. 0 15 20 5 6 7 19 1 X A B 6 8 3 19 19 20 14 ; 19 4 1 2 38 38 7 3 1
Ugyanezen feltételek teljesülése esetén létezik még egy másik klasszikus módszer az egyenletrendszer megoldására. Ezt mondja ki a következő állítás. 1.40.Tétel: (Cramer-szabály) Tegyük fel, hogy az ARn×n együtthatómátrix nemszinguláris, azaz detA ≠ 0. Ekkor az Ax = b lineáris egyenletrendszer megoldható a következő módon.Jelöljük azA együtthatómátrix determinánsát D-vel, tehát detA = D, a feltevés szerintD ≠ 0, továbbá jelölje Dj annak a mátrixnak a determinánsát amelyet az A együtthatómátrixból úgy kapunk, hogy abban aj-edik oszlop helyére a jobboldal b vektorának komponenseit írjuk. Ekkor az egyenletrendszer egyértelmű megoldása a következő
xj
Dj D
; j 1, 2,...n
Bizonyítás: A Cramer szabály igazolása ugyancsak a determinánsok elméletén alapul, felhasználjuk a determinánsok kifejtését és a ferde kifejést. Az egyszerűség érdekében írjuk fel csak az egyenletrendszer i-edik egyenletét ai1x1 ai 2 x2 ... aij x j ... ain xn bi ; i 1, 2,..., n;
Szorozzuk meg az i-edik egyenletet minden i-re az Aij előjeles aldeterminánssal. Ekkor azt kapjuk, hogy ai1 Aij x1 ai 2 Aij x2 ... aij Aij x j ... ain Aij xn bi Aij ; i 1, 2,..., n;
Összegezzük most a kapott n db egyenletet. Összegzés és az xj ismeretlen kiemelése után adódó összeg éppen az együtthatómátrix determinánsa. Ha azonban k ≠ j esetén az xk ismeretlen kiemelése után adódó összeget vizsgáljuk, látható, hogy az éppen egy ferde kifejtés, ami zérus n
n
n
n
n
i 1
i 1
i 1
i 1
i 1
x1 ai1 Aij x2 ai 2 Aij ... x j aij Aij ... xn ain Aij bi Aij ;
tehát a mondottak szerint az adódik, hogy 65
Óbudai Egyetem BGK
Fejezetek a matematikából
n
0 x1 0 x2 ... det A x j ... 0 xn bi Aij ; i 1
A jobb oldal is emlékeztet bennünket egy determináns kifejtésére. Ez annak a mátrixnak az i-edik oszlop szerinti kifejtése, amely A-ból úgy adódik, hogy annak i-edik oszlopa helyére a jobboldalt írjuk. A bevezetett jelölésekkel tehát azt kapjuk, hogy Dx j D j ; j 1, 2,..., n. Éppen ezt kellett igazolni. ■ Ez a módszer – az előzőhöz hasonlóan – csak nagyon korlátozott körben, az alábbi feltételek teljesülése esetén alkalmazható: 1. Az egyenletrendszerben ugyanannyi az ismeretlenek száma, mint az egyenleteké. 2. Az együtthatómátrix reguláris, tehát D = detA ≠ 0. Ezek a feltételek – mint korábban – biztosítják is a megoldhatóságot, és ekkor a megoldás egyértelmű. 1.32.Példa: Oldjuk meg az alábbi lineáris egyenletrendszert Cramer-szabállyal. 3x1 2 x2 x3 5 2 x1 3x2 x3 1 2 x x 3x 11 3 1 2
Kiszámítjuk a szükséges determinánsokat. A bevezetett jelölésekkel 3 2 1 5 D 2 3 1 12; D1 1 2 1 3
2 1 3 3 1 24; D2 2
11 1 3
5 1
1 3 2 1 24; D 2 3
2 11 3
5 1 36;
2 1 11
Ahonnan az egyenletrendszer egyértelmű megoldása a következő.
x1
D 36 D1 24 D 24 2; x2 2 2; x3 3 3; D 12 D 12 D 12
Helyettesítéssel ellenőrizhetjük a megoldás helyességét. II.eset: Az egyenletrendszer megoldása az általános esetben, amikor az együtthatómátrix nem kvadratikus Ebben a pontban tehát választ adunk a legáltalánosabb kérdésre, nem korlátozzuk semmilyen módon az egyenletek és ismeretlenek számát. Először általánosan az inhomogén egyenletrendszer megoldásával foglalkozunk, majd külön kitérünk a homogén rendszer megoldására. A) Az inhomogén egyenletrendszer megoldása 66
Óbudai Egyetem BGK
Fejezetek a matematikából
Ehhez az egyenletrendszert olyan alakban írjuk fel, amely a jelen vizsgálatokhoz jobban megfelel. Ha felidézzük vektornak számmal való szorzásáról, valamint vektorok összeadásáról tanultakat akkor világos, hogy az Ax = blineáris egyenletrendszer a következő ekvivalens alakban is írható
a11 a12 a1k b1 a a a b 21 22 x1 x ... xk 2 k 2 ; ... 2 ... ... ... an1 an 2 ank bn Ha most az együtthatómátrix oszlopvektoraira bevezetjük az alábbi jelöléseket:
a11 a12 a1k a a a 21 22 a1 ;a ;........; a k 2 k ; ... 2 ... ... an1 an 2 ank Akkor az egyenletrendszer ekvivalens alakja a következő x1a1 + x2a2 + …xkak = b; Az egyenletrendszer megoldhatóságának problémája ezzel a jelölésselátfogalmazható az alábbi módon. 1. Létezik-e az együtthatómátrix a1, a2, …ak oszlopvektorainak olyan lineáris kombinációja, amely előállítja a b vektort? Tehát: Megoldható-e az egyenletrendszer? 2. Ha létezik, akkor csak egyértelműen állítható elő vagy többféle módon? Tehát: Egyértelmű a megoldás vagy létezik több megoldás? A megoldhatóság feltétele azonnal megfogalmazható a felírt egyenlőségből. 1.41.Tétel: Az Ax = b lineáris egyenletrendszer akkor és csak akkor oldható meg, ha a b vektor kompatíbilis az együtthatómátrix oszlopvektor rendszerével, azaz ha létezik az oszlopvektoroknak olyan lineáris kombinációja, amely előállítja a b vektort. Bizonyítás: Az állítás a kompatibilitás definíciójából következik. ■ Ezt a tételt most átfogalmazzuk egy szokásosabb formára. Tegyük fel hogy az együtthatómátrix rangja r, tehát ρ(A) = r. Ez azt jelenti, hogy az oszlopvektorok közül kiválasztható r db lineárisan független vektor. Ha a jobboldal előállítható az oszlopvektorok lineáris kombinációjával, akkor előállítható az r db lineárisan független vektor lineáris kombinációjával is. Ha ekkor az r db oszlopvektorhoz hozzávesszük a b vektort, a kapott (r + 1) elemű vektorrendszer lineárisan összefüggő lesz, tehát az r+ 1 elemű vektorrendszer rangja szintén r. Jelölje (A│b) azt a k + 1 67
Óbudai Egyetem BGK
Fejezetek a matematikából
oszlopú mátrixot, amelyet úgy kapunk, hogy az A mátrixhoz utolsó oszlopként hozzávesszük a b vektort. Ezt a mátrixot kibővített mátrixnak nevezzük. Igazoltuk a következő állítást. 1.42.Tétel: Az Ax = b lineáris egyenletrendszer akkor és csak akkor oldható meg, ha a kibővített mátrix rangja egyenlő az együtthatómátrix rangjával, azaz ha ρ(A│b) = ρ(A). ■ Nyilvánvalóan általában ρ(A│b) ≥ ρ(A) teljesül, hiszen ha egy mátrixnak, oszlopok hozzá vételével, tehát kibővítéssel több oszlopvektora lesz, az oszloprangja vagy nem változik, vagy növekszik. Aρ(A│b) > ρ(A) esetben az egyenletrendszernek nincs megoldása, ekkor a jobboldal b vektora nem kompatibilis a vektorrendszerrel. Térjünk most rá a megoldás előállításának módjára. Megoldandó tehát az
a11 a12 a1k b1 a a a b 21 22 x1 x2 ...xk 2 k 2 ; ... ... ... ... an1 an 2 ank bn inhomogén lineáris egyenletrendszer. Az egyenletek száma n, az ismeretlenek száma k, és az együtthatómátrix rangja legyen r. Nyilván teljesül, hogy r ≤ min{n, k}. Az általánosság megszorítása nélkül feltehetjük, hogy az együtthatómátrix első roszlopvektora lineárisan független, ezt oszlopcserékkel elérhetjük. Tegyük fel tehát, hogy ρ(A│b) = ρ(A) teljesül, azaz a jobb oldal kompatibilis az oszlopvektorok rendszerével. Ekkor az a1, a2, …ar oszlopvektorok segítségével mind az ar+1, …ak vektorok, mind a b vektor előállíthatók. Ha az első r db oszlopvektorból képezett n×r méretű mátrixot A1 jelöli akkor az A mátrix nyilván felírható az alábbi szorzat alakban A = A1∙[Er │ D] Ahol Er az r-ed rendű egységmátrix, a D pedig az ar+1, …ak vektorok előállításában szereplő együtthatókat tartalmazza. Hasonló logikával,b is felírható az a1, a2, …ar oszlopvektorok segítségével d1a1 + d2a2 + …drar = b alakban. Ha d vektor jelöli az iménti előállításban szereplő együtthatók vektorát, a b vektor előállítható az alábbi szorzással b = A1d Most már az egyenletrendszer megoldása nagyon egyszerű. Az Ax = begyenletrendszer egyenértékű az A1[Er │ D]x = A1d egyenletrendszerrel, amiből 68
Óbudai Egyetem BGK
Fejezetek a matematikából [Er │ D]x = d
következik. Bontsuk fel az x vektort két részre. Az első r komponens vektora legyen xr, a maradék s = k – r komponens vektora pedig xs. Ezzel a jelöléssel az előző egyenlet az Erxr+ Dxs = d alakot ölti. Mivel Erxr = xr, ezért átrendezéssel adódik az inhomogén egyenletrendszer megoldása, más szóval a megoldóképlet xr = d – Dxs Ez a képlet a következőt fejezi ki. Ha a mátrix r rangja kisebb, mint az ismeretlenek k száma akkor s = k – r db ismeretlen szabadon választható, tehát ebben az esetben az egyenletrendszernek végtelen sok megoldása van. Az s db ismeretlen, amely szabadon választható a szabad ismeretlenek, a többi r db ismeretlen pedig a kötött ismeretlenek. Az s egész számot az egyenletrendszer szabadságfokának nevezzük.Ha r = k, akkor s = 0, és ez azt jelenti, hogy az egyenletrendszer megoldása egyértelmű. A megoldás technikája a következő. Az egyenletrendszert legegyszerűbb elemi bázistranszformációval megoldani. Az együtthatómátrix oszlopvektoraiból és a jobboldalból készítünk egy induló transzformációs táblázatot, az oszlopvektorokat egyesével bevisszük a bázisba, annyi transzformációs lépést végzünk, amennyit csak lehet, amíg tudunk újabb oszlopvektort a bázisba vinni anélkül, hogy egy bázisban lévő oszlopvektor kilépjen a bázisból. A kötött ismeretlenek azoknak az oszlopvektoroknak a szorzói, amelyeket bevittünk a bázisba. A szabad ismeretlenek azoknak az oszlopvektoroknak a szorzói,amelyek nem léptek be a bázisba. A D mátrix oszlopvektorai az az s db vektor, amelyek nem léptek be a bázisba. Általános megoldásnak nevezzük az xr = d – Dxs alakot. Ha ebben az egyenletben a szabad ismeretleneknek értéket adunk és a kötött ismeretleneket ezekből az egyenletekből kiszámítjuk, akkor kapjuk a partikuláris megoldást, amelyből s>0 esetben végtelen sok van. 1.33.Példa: Oldjuk meg elemi bázistranszformációval az alábbi egyenletrendszert. x + y + z + t = 10 x – y + 2z – t = 1 x + 3y + 3z =19 3x + y + 4z + t = 21 Írjuk az együtthatókat és a jobb oldalt egy mátrixba, és végezzünk elemi bázistranszformációt.
69
Óbudai Egyetem BGK B x y x 1 1 z 1 1 t 1 3 3 1
Fejezetek a matematikából z 1 2 3 4
t b y 1 10 1 1 1 2 0 19 2 1 21 2
z 1
1 2 1
t b y t b y b 1 10 3 3 19 3 8 2 9 2 2 9 2 9 1 9 6 3 27 2 9 2 9 0 0 0 0 0
Az egyenletrendszernek létezik megoldása. Az utolsó egyenlet 0 = 0 alakban adódott, ami azt jelenti, hogy a 4. egyenlet következménye az első három egyenletnek, tehát elhagyható a rendszerből. Az utolsó mátrixból leolvasható a redukált egyenletrendszer x – 3y = –8; z + 2y = 9; t + 2y = 9; yR tetszőleges. Innen látható, hogy az egyenletrendszernek végtelen sok megoldása van, y a szabad ismeretlen x, z, t pedig a kötött ismeretlenek. Ha a redukált egyenletrendszert átrendezzük a kötött ismeretlenekre akkor kapjuk az általános megoldást x = 3y – 8; z = – 2y + 9; t = – 2y + 9; yR tetszőleges. Az általános megoldást gyakran írjuk vektori alakban.
x 3u 8 8 3 y u 0 u 1 ; uR z 2u 9 9 2 t 2u 9 9 2 Áttekintve a megoldást, látható, hogy az ismeretlenek száma k = 4, az együtthatómátrix rangja r = ρ(A) = 3, teljesül a ρ(A│b) = ρ(A) feltétel, azaz a jobboldal kompatibilis az oszlopvektorokkal, tehát létezik megoldás, továbbá a szabadságfok s = k – r = 4 – 3 = 1. Valóban egy ismeretlent választottunk szabadon. Ebből következik, hogy az egyenletrendszernek végtelen sok megoldása van. Adjunk meg egy partikuláris megoldást. Legyen most például y = 3. Ekkor kapjuk a következőpartikuláris megoldást: x=1, y=3, z=3, t=3. Könnyen azonosíthatjuk az előző általános gondolatmenetben szereplő vektorokat, mátrixokat is, ezek a következők xr = [x, z, t]T, d = [–8, 9, 9]T, D = [3, –2, –2]T, és xs = [y]. 70
Óbudai Egyetem BGK
Fejezetek a matematikából
1.34.Példa: Oldjuk meg elemi bázistranszformációval az alábbi egyenletrendszert.
x1 x2 4 x4 3 x x 3x 1 2 3 4 x1 2 x2 3x3 5 x4 0 3x1 x2 4 x3 5 Az elemi bázistranszformáció táblázata a következő. B x1 x2 x3 x4 b x2 x3 x4 b x3 x4 b x 1 1 0 4 3 1 0 4 3 1 1 2 1 x2 0 1 1 3 1 1 1 3 1 1 3 1 ; 1 2 3 5 0 3 3 9 3 0 0 0 3 1 4 0 5 4 4 12 4 0 0 0
Teljesül a ρ(A│b) = ρ(A) feltétel, azaz a jobboldal kompatibilis az oszlopvektorokkal, tehát létezik megoldás. Szemléletesen ez úgy látható, hogy a 3. és 4. egyenlet a 0 = 0 egyenletre redukálódott, ami azt jelenti, hogy az utolsó két egyenlet az első két egyenlet következménye, tehát a rendszerből elhagyható.Az eredetivel ekvivalens, legegyszerűbb alakú, tehát redukált rendszer a táblázat utolsó egysége alapján a következő.
x1 x3 x4 2 x2 x3 3x4 1 Ami a megoldás megadása előtt kijelenthető. Az együtthatómátrix rangja 2, azaz két lineárisan független oszlopvektora van, ezek például az a1 és a2 oszlopvektorok. Mivel az ismeretlenek száma k = 4, és a rang ρ = 2, a rendszer szabadságfoka s = 4 – 2 = 2, tehát két ismeretlent szabadon választhatunk. A fentiek szerint a szabad ismeretlenek ebben az esetben az x3 és x4 ismeretlenek, az x1 és x2 pedig a kötött ismeretlenek. Az általános megoldást akkor kapjuk, ha a redukált rendszerből kifejezzük a kötött ismeretleneket a szabad ismeretlenekkel. Eszerint az általános megoldás
x1 2 x3 x4 ; x3 , x4 R x 1 x 3 x 2 3 4 Adjuk meg az általános megoldást vektori alakban is.
2 u v 2 1 1 1 u 3v 1 1 3 x u v ; u, v R u 0 1 0 v 0 0 1 71
Óbudai Egyetem BGK
Fejezetek a matematikából
Adjunk meg egy partikuláris megoldást is. Legyen például u = 2, v = –1. Ekkor
2 1 1 1 1 1 3 6 xp 2 ; 0 1 0 2 0 0 1 1 Helyettesítéssel ellenőrizhető, hogy ez valóban kielégíti az egyenletrendszert. 1.35.Példa: Oldjuk meg elemi bázistranszformációval az alábbi egyenletrendszert. 5 x1 x2 2 x3 x4 7 2 x1 x2 4 x3 2 x4 1 x 3x 6 x 5 x 0 2 3 4 1
Az elemi bázistranszformáció táblázata a következő.
B x1 x2 x3 x4 b x1 x 5 1 2 1 7 7 4 x2 2 1 4 2 1 2 e3 1 3 6 5 0 7
x3 6 4 6
x4 b x1 x3 b 1 8 7 6 8 ; 2 1 12 8 15 1 3 0 0 5
Értékeljük a számítások eredményét. A táblázat utolsó egységéből látszik, hogy a jobboldal nem kompatibilis az együtthatómátrix oszlop vektorterével, tehát az egyenletrendszernek nem létezik megoldása. Szemléletesen azt látjuk, hogy a 3. egyenlet alakja 0 = –5, ami nyilván nem igaz. Konkrétabban az együtthatómátrix rangja 2, azaz r = ρ(A) = 2, azonban, ha a mátroxot kibővítjük a b vektorral, akkor a kibővített mátrix rangja 3, vagyis ρ(A│b) = 3, nem teljesül tehát a ρ(A│b) = ρ(A) feltétel. Az A együtthatómátrix a2 és a4 oszlopvektora lineárisan független, az a1 és a3 ezektől lineárisan függ, a kapcsolat a táblázat alapján az
a1 12a2 7a4 ; a3 8a2 6a4 ; összefüggésekkel adható meg. Azonban a jobboldal előállításához szükség van a standard bázis e3 egységvektorára is. A táblázat alapján
b 15a2 8a4 5e3 ;
72
Óbudai Egyetem BGK
Fejezetek a matematikából
B) A homogén lineáris egyenletrendszer megoldása Megoldandó az
a11 a12 a1k 0 a a a 0 x1 21 x2 22 ... xk 2 k ... ... ... ... an1 an 2 ank 0 lineáris egyenletrendszer. Az előző pont minden megállapítása érvényes erre az esetre is, így nincs más dolgunk, mint az általános eredményt megfogalmazni erre a speciális alakú egyenletrendszerre. Először is vegyük észre, hogy a homogén lineáris egyenletrendszernek mindig létezik megoldása az együtthatóktól függetlenül. Ez másképpen azt jelenti, hogy az ρ(A│0) > ρ(A) eset nem fordulhat elő.Látható, hogy x1 = x2 = … = xk = 0 megoldás. Ezt triviális megoldásnak nevezzük. 1. Hak = r akkor a megoldás egyértelmű, ezért ebben az esetben az egyenletrendszer megoldása a triviális megoldás. 2. Ha k>r akkor végtelen sok megoldás létezik, s = k – r db változó szabadon választható, és az általános megoldás alakja a következő xr = – Dxs A triviálistól eltérő partikuláris megoldást úgy kaphatunk, hogy a szabad ismeretlenek közül legalább egynek 0-tól különböző értéket adunk, és az általános megoldás egyenleteiből a kötött ismeretleneket kiszámítjuk. 1.36.Példa: Oldjuk egyenletrendszert.
meg
elemi
bázistranszformációval
az
alábbi
homogén
lineáris
3x1 4 x2 5 x3 7 x4 0 2 x 3x 3x 2 x 0 1 2 3 4 4 x1 11x2 13x3 16 x4 0 7 x1 2 x2 x3 3x4 0 Az elemi bázistranszformáció táblázatában a jobboldali zérusokat nem szokás feltüntetni, hiszen azok a transzformációk során nem változnak.
73
Óbudai Egyetem BGK
Fejezetek a matematikából
x3 B x1 x2 x3 x4 x2 3 4 5 7 17 2 19 2 x1 2 3 3 2 3 2 3 2 19 x2 4 11 13 16 17 7 2 1 3 17 2 19 2
x4 x3 x4 10 0 0 1 3 17 13 17 ; 20 19 17 20 17 10 0 0
A számítások eredménye a következő. Az együtthatómátrix rangja ρ = 2, például az első két oszlopvektora lineárisan független. Mivel az ismeretlenek száma k = 4, a szabadságfok s = k – ρ = 2, tehát a rendszernek végtelen sok megoldása van, vagyis a rendszernek létezik nemtriviális megoldása. Az 1. és 4. egyenlet (melyek 0 = 0 alakban adódtak) elhagyásával adódó redukált rendszer az alábbi. 3 13 x1 x3 x4 0 17 17 ; x3 , x4 R x 19 x 20 x 0 2 3 4 17 17
A két szabad ismeretlen az x3 és x4, a kötött ismeretlenek pedig az x1 és x2. Megoldva a felírt egyenleteket a kötött ismeretlenekre, kapjuk az általános megoldást. 3 13 x x x4 1 3 17 17 ; x3 , x4 R 19 20 x x x4 2 3 17 17
Ha a szokásosabb vektoros formában írjuk a megoldást, akkor a következő alak adódik.
13 3 3 13 17 u 17 v 17 17 19 20 19 20 x u v u v ; u, v R 17 17 17 17 u 1 0 0 1 v Egy nemtriviális partikuláris megoldást kapunk, ha a szabad ismeretleneknek értéket adunk. Legyen például u = 17, v = 34. Ekkor
74
Óbudai Egyetem BGK
Fejezetek a matematikából 3 13 17 17 23 19 20 21 x p 17 34 ; u, v R 17 17 17 1 0 34 0 1
Behelyettesítéssel igazolható, hogy ez a rendezett 4-es valóban kielégíti a rendszert. Az egyenletrendszerek elméletét felhasználhatjuk az mátrix inverzének előállítására. Az ARn×n négyzetes mátrix inverzét az AX = E mátrixegyenlet XRn×nmegoldásaként koordinátákkal. Ekkor az adódik, hogy
a11 a12 a 21 a22 ... ... an1 an 2
... a1n x11 ... a2 n x21 ... ... ... ... ann xn1
definiáljuk.
x12 x22 ... x2 n
Írjuk
... x1n 1 ... x2 n 0 ... ... ... ... xnn 0
fel
ezt
a
0 1 ... 0
... ... ... ....
0 0 ... 1
mátrixegyenletet
Ha az X mátrix i-edik oszlopát xi vektor jelöli, továbbá használjuk az i-edik egységvektorra a szokásos ei jelölést, akkor ez a mátrixegyenlet voltaképpen egyenértékű n db inhomogén lineáris egyenletrendszerrel: Axi = ei; i = 1, 2, …n Kérdés, hogy mi a megoldhatóság feltétele. Mivel minden n-re meg kell oldanunk Axi = ei egyenletrendszert, minden ei-nek kompatibilisnek kell lenni az A mátrix oszlopvektorrendszerével. Mivel az ei (i = 1, 2, …n) vektorok lineárisan függetlenek és n db van belőlük, pontosan akkor oldható meg mindegyik egyenletrendszer, ha az A mátrix rangja ρ(A) = n (a szabadságfok s = n – r = 0), tehát a mátrix nemszinguláris (detA ≠ 0). Ugyanazt a feltételt kaptuk tehát, mint korábban. Ekkor egyértelmű a megoldás, tehát pontosan egy inverzmátrix létezik. Ezt az n db lineáris egyenletrendszert egyszerre is megoldhatjuk elemi bázistranszformációval. Az n db jobboldalt egymás mellé írva a transzformációs táblázatba, tulajdonképpen az egységmátrixot írjuk az A mátrix mellé. Az A mátrix oszlopvektorait egymás után bevisszük a bázisba. Mivel a ρ(A) = n az összes oszlopvektort be lehet, és be is kell vinnünk. Ha ezzel készen vagyunk, sorcseréket alkalmazunk, hogy a bázisvektorok az indexek természetes növekvő sorrendjében kövessék egymást, és már elő is állt az inverz mátrix.
75
Óbudai Egyetem BGK
Fejezetek a matematikából
1.37.Példa: Határozzuk meg az alábbi A mátrix inverzét elemi bázistranszformációval.
1 2 1 A 1 1 5 ; A 1 ? 2 3 1 a1 a 2 a 1 2 1 a3 1 1 a 2 2 3
a1 1 1 0 0 1 5 0 1 0 0 1 0 0 1 0
a2
a3
2 1
1
a1 a 2 a 1 0 1 a3 0 0 a 2 0 1
a1 a 2 1 1 0 0 1 0 4 1 1 0 0 0 1 2 0 1 0 1
a3
0 14 5 1 5 9 5 1 15 1 5 1 5 0 9 5 1 5 4 5
a3
Innen a 2. és 3. sor cseréjével megkapjuk a keresett inverz mátrixot.
A
1
14 1 9 1 9 1 4 . 5 1 1 1
76
1 3 0 2 5 1 1 1 1 2 0 1 a3
Óbudai Egyetem BGK
Fejezetek a matematikából
1.10. Gauss elimináció, mátrixok LU-felbontása Mind gyakorlati, mind elméleti jelentősége miatt kitérünk egy klasszikus módszer tárgyalására, a Gauss-féle eliminációs eljárásra, amely numerikus szempontból és mátrixelméleti vonatkozásai miatt nagyon fontos. A legtöbb számítógépes szoftver, amely lineáris egyenletrendszer megoldására felhasználható, az alább ismertetett módszerrel oldja meg az egyenletrendszert, sőt ha egy mátrix determinánsának kiszámítását kérjük, akkor is ezt a módszert alkalmazza a relatíve kis számításigény miatt. Térjünk rá a módszer ismertetésére. I. Reguláris együtthatómátrixú egyenletrendszerek megoldása. Elsőként foglalkozzunk azzal az esettel, amikor az együtthatómátrix kvadratikus, és oszlopvektorai lineárisan független rendszert alkotnak. Megoldandó az Ax = b lineáris rendszer, ahol az A n-ed rendű mátrix, és a rendszer ugyancsak n db ismeretlent tartalmaz.
a11 a12 a a A 21 22 ... ... an1 an 2
... a1n x1 b1 b ... a2 n x2 ; x ; b 2 ; ... ... ... ... ... ann xn bn
Az elemi bázistranszformációs táblázathoz hasonlóan olyan sémát alkalmazunk, amely lényegében csak az együtthatókat tartalmazza, hiszen világos, hogy egy rendszer megoldása csak ezektől függ. Induljunk el az a11 a12 a21 a22 A b a31 a32 ... ... a n1 an 2
a13 ... a1n b1 a23 ... a2 n b2 a33 ... a3n b3 ; ... ... ... ... an3 ... ann bn
kibővített mátrixból. Az oszlopvektorok felett az ismeretlenek jelét nem tüntettük fel, világos, hogy ezek rendre x1, x2, …, xn. Ezek feltüntetésére csak akkor van szükség, ha úgy adódik, hogy oszlopcserére van szükség. Mivel azonban ez könnyen hibához vezethet, ha elfelejtjük az ismeretleneket átrendezni, nem javasoljuk. Sorcserére azonban bármikor sor kerülhet, hiszen ez csak annyit jelent, hogy megváltoztatjuk a rendszer egyenleteinek a sorrendjét, ami nyilvánvalóan nem változtatja meg a megoldást. Induljunk ki a mátrix főátlójának első eleméből, az a11 együtthatóból, ennek az elemnek a neve pivot elem. Tegyük fel, hogy ez nem zérus, ha igen akkor sorcserével elérhetjük, hogy a bal felső sarokban nem nulla együttható álljon. Ezt az együtthatót, és vele együtt az első sort, tehát az első egyenletet megtartjuk változatlan formában, esetleg megszorozhatjuk egy nullától különböző számmal ha szükség van rá, és ennek az egyenletnek, tehát az első lépésben az első sornak a többszöröseit levonjuk az összes többi egyenletből, úgy hogy az első oszlopban minden együttható nullává váljon. Ez lényegében az elimináció vagy más szóval kiküszöbölés. Ez ebben a lépésben annyit jelent, hogy az első 77
Óbudai Egyetem BGK
Fejezetek a matematikából
egyenletben megtartjuk az x1 ismeretlent és az összes többi egyenletből kiküszöböljük azt. Az eredmény tehát a következő.
a11 a12 1 0 a22 1 0 a32 ... ... 0 an12
... a1n b1 1 1 1 a23 ... a2 n b2 1 1 1 a33 ... a3 n b3 ; ... ... ... ... 1 1 1 an3 ... ann bn a13
Az alkalmazott jelölésben az (1) felső index azt jelenti, hogy az első lépésben kapott eredményt adtuk meg. Az első sorban nem alkalmaztunk jelölésmódosítást, hiszen az első egyenletet megtartottuk változatlanul. Kérdés, hogy hogyan juthatunk el ehhez a táblázathoz. Az ai1 a (i = 2, 3, …, n)együtthatóból úgy lesz zérus, ha első egyenlet hi1 i1 -szeresét kivonjuk az a11 i-edik (i = 2, 3, …, n) egyenletből. Ennek következménye az, hogy az együtthatók és természetesen a jobb oldal is, az első lépés után a következőképpen alakulnak. aij aij 1
ai1 1 a1 j aij hi1a1 j ; bi bi hi1b1; i 2,3,..., n; j 1, 2,..., n; a11
Folytassuk az eljárást. Lépjünk át a főátló következő elemére. Ha ez zérus, akkor sorcserével elérhetjük, hogy a 2.sor 2. komponense nem zérus. Ha a mátrix oszlopvektorai lineárisan
függetlenek, azaz rangja n, akkor ez mindig elérhető. Jelölje tehát a főátló második elemét a22 ,a második lépében ez az elem a pivot. Most azt fogjuk tenni, hogy a pivot alatt levő, tehát csak a 2-nél nagyobb indexű sorokból, tehát egyenletekből kiküszöböljük vagyis elimináljuk az x2 ismeretlent. Az eredmény a következő. 1
a11 a12 1 0 a22 0 0 ... ... 0 0
a13
...
a23
...
1
a33 ... 2
...
...
an 3 ... 2
a1n b1 1 1 a2 n b2 2 2 a3 n b3 ; ... ... 2 2 ann bn
Mint látható, ebben a lépésben sem az első sem a második sorban nem történt változás. A felső (2) index arra utal, hogy az eliminációs algoritmus második lépésében kapott eredményeket tartalmazza a mátrix. Hogyan érhető el ez az eredmény. Úgy, hogy képezzük a második egyenlet
ai2 1
hi 2 1 -szeresét (i = 3, 4, …, n) és ezt kivonjuk az i-edik (i = 3, 4, …, n) egyenletből. a22 Összefoglalva, a transzformáció a következő. 78
Óbudai Egyetem BGK
Fejezetek a matematikából
1
a 1 1 1 2 1 1 2 1 aij aij i21 a2 j aij h2i a2 j ; bi bi hi 2b2 ; i 3, 4,..., n; j 2,3,..., n; a22 Hasonlóan folytatjuk az eljárást. A következő pivot az a33 , ha ez nulla, akkor sorcserével 2
elérjük, hogy a főátló harmadik eleme zérustól különbözzön és azt tekintjük a33 -nak. Ezzel a pivottal elérjük, hogy az x3 ismeretlen ne szerepeljen a 3-nál nagyobb indexű sorokban, tehát elimináljuk az x3 ismeretlent a pivot alatti sorokból. És így tovább folytatjuk az eljárást addig, amíg a főátló alatt minden együttható zérus nem lesz. Az eleimináció az n-edik lépés után tehát a következő eredményt adja. 2
a11 a12 1 0 a22 0 0 ... ... 0 0
a13
...
a23
...
1
a33 ... ... ... 2
0
...
a1n b1 1 1 a2 n b2 2 2 a3 n b3 ; ... ... n n ann bn
Ezzel az eliminációs fázis végére is értünk. Ha az együtthatómátrix rangja n, akkor mindig elérhető egy olyan állapot, amikor az elimináció eredménye egy olyan felső háromszögmátrix, amelyben tehát a főátló alatt minden elem zérus, a főátlóban pedig éppen a pivotok állnak. Ezután következik a visszahelyettesítési fázis. Ez abból a felismerésből adódik, hogy az utolsó egyenlet csak egy ismeretlent tartalmaz, az xn ismeretlent. Ezt azonnal ki is számíthatjuk.
b n n ann xn bn ; ahonnan xn n n ; ann n
Ennek az osztásnak mindig van értelme, hiszen a pivot nulla nem lehet. Ha az xn ismeretlent megkaptuk, akkor felfelé haladva a kapott háromszögmátrixban, az utolsó előtti egyenletből megkapjuk az xn–1 ismeretlent. n1
n1
n 1 bn 1
n1
an 1,n n 1
an1,n1 xn1 an1,n xn bn1 ; ahonnan xn1 n1 n1 xn ; an1,n1 an1,n1 Folytatva az eljárást, megkaphatjuk az összes ismeretlent. Illusztráljuk a mondottakat példákkal.
79
Óbudai Egyetem BGK
Fejezetek a matematikából
1.38.Példa: Oldjuk meg az alábbi lineáris rendszert Gauss-eliminációval. 1 1 2 x1 1 2 1 2 x 4 ; 2 4 1 4 x3 2
A szokásos jelöléseket alkalmazva, a következőt írhatjuk.
1 1 2 1 1 2 1 2 4 ~ 0 4 1 4 2 0
1
3 3
2 1 1 1 2 2 ~ 0 3 4 2 0 0
2 1 2 2 ; 2 4
Az eliminációt elvégeztük, megkaptuk a felső háromszögmátrixot. Sorcserére nem volt szükség, mert a főátló aktuális eleme minden lépésben zérustól különbözött. A műveletek a következők voltak. A pivotokat minden lépésben szögletes zárójelbe tettük. Az első lépésben, amikor a pivot 1, a második illetve harmadik egyenletből kivontuk az első egyenlet rendre kétszeresét illetve négyszeresét. A következő lépésben, amikor a pivot –3, a harmadik egyenletből kivontuk a második egyenlet 1-szeresét. Ezután következhet a visszahelyettesítési fázis. A harmadik egyenletből indulunk, majd a második egyenletet használjuk fel, végül az elsőt. 2 x3 4; x3 2; 3x2 2 x3 2; azaz 3x2 4 2; x2 2; x1 x2 2 x3 1; azaz x1 2 4 1; x1 =1;
Megkaptuk tehát a rendszer megoldását. 1.39.Példa: Oldjuk meg az alábbi lineáris rendszert Gauss-eliminációval.
1 1 2 3 x1 1 3 1 1 2 x 4 2 ; 2 3 1 1 x3 6 1 2 3 1 x4 4 A megoldás a következő.
1 1 2 3 1 1 1 2 3 1 3 1 1 2 4 ~ 0 4 7 11 7 2. és 4. sorcsere 2 3 1 1 6 0 1 5 7 8 1 2 3 1 4 0 1 1 4 5
80
1 1 2 3 1 0 1 1 4 5 ~ 0 1 5 7 8 0 4 7 11 7
Óbudai Egyetem BGK 1 0 ~ 0 0
1 1 0 0
Fejezetek a matematikából 2 3 1 1 1 4 5 0 ~ 6 3 3 0 3 27 27 0
1 2 1 1 0 6 0 0
3 1 4 5 ; 3 3 25,5 25,5
Az eliminációs fázis véget ért, megkaptuk a felső háromszög mátrixot. A műveletek a következők voltak. Az első lépésben, az első egyenlet 3-szorosát, 2-szeresét és 1-szeresét rendre levontuk a 2., 3. és 4. sorokból. Ezután alkalmaztunk egy sorcserét, mert a –4 bár elvileg tökéletes, de kézi számításokhoz nem volt ideális pivot elem, egyszerűbb egyessel számolni. Ezután, a második lépésben az második egyenlet 1-szeresét és –4-szeresét kivontuk rendre a 3. és 4. egyenletből. Majd végül a 3. egyenlet 0,5-szeresét kivontuk a 4. egyenletből. Következhet a visszahelyettesítési fázis. Ismét az utolsó, tehát most a 4. egyenlettel kezdünk, fokozatosan haladunk felfelé és az 1. egyenletbe helyettesítünk utolsóként. 51 51 x4 ; x4 1; 2 2 6 x3 3x4 3; azaz 6 x3 3 3; x3 0;
x2 x3 4 x4 5; azaz x2 4 5; x2 1; x1 x2 2 x3 3x4 1; azaz x1 1 3 1; x1 1;
Megkaptuk tehát a rendszer megoldását. A Gauss elimináció módosított változata a Gauss-Jordan algoritmus. Ez a következőkben különbözik a klasszikus eliminációtól. 1. Minden lépésben a pivot elemek sorait elosztjuk a pivot elemmel, így a főátlóban egyesek lesznek. 2. Nem csak a pivot alatti, hanem a pivot fölött levő egyenletekből is kiküszöböljük az ismeretleneket. 3. Az 1. és 2. lépés következtében nincs szükség visszahelyettesítési fázisra. Mivel az elimináció eredménye abban az esetben, amikor a mátrix rangja megegyezik az ismeretlenek számával, egy egységmátrix, így a megoldás azonnal leolvasható, ugyanis a kapott jobboldal komponensei pontosan a megoldások. 1.40.Példa: Oldjuk meg az alábbi lineáris rendszert Gauss-Jordan algoritmussal.
1 3 5 7
3 5 7 1
5 7 1 3
7 x1 12 1 x2 0 ; 3 x3 4 5 x4 16
A megoldás a következő. 81
Óbudai Egyetem BGK 1 3 5 7
3 5 7 1
5 7 1 3
1 0 ~ 0 0
Fejezetek a matematikából
5 7 12 1 7 12 1 3 1 0 0 4 8 20 36 0 ~ ~ 3 4 0 8 24 32 56 0 5 16 0 20 32 44 68 0 0 1 0 0
0 9 17 1 0 7 13 0 ~ 1 1 2 0 0 16 32 0
3 1 1 5
0 9 17 1 0 7 13 0 ~ 1 1 2 0 0 1 2 0
0 1 0 0
5 7 12 1 0 1 8 15 2 5 9 0 1 2 5 9 ~ ~ 3 4 7 0 0 1 1 2 8 1117 0 0 2 14 28 0 0 0 1 x1 1 x 1 1 0 0 1 ; azaz 2 ; x3 0 0 1 0 0 0 0 1 2 x4 2
A megoldást ezzel megkaptuk. A műveletek a következők voltak. Az első lépésben az 1. egyenlet 3-szorosát, 5-szörösét és 7-szeresét kivontuk rendre a 2., 3. és 4. egyenletből. Ezután a 2., 3. és 4. egyenletet rendre elosztottuk –4-gyel, –8-cal és –4-gyel. A második lépésben a második egyenlet 3-szorosát, 1-szeresét és 5-szörösét rendre kivontuk az 1., 3. és 4. egyenletekből. A harmadik lépésben a 3. egyenlet –1-szeresét, 2-szeresét és –2-szeresét rendre kivontuk az 1., 2. és 4. egyenletekből. Ezután a 4. egyenletet osztottuk –16-tal, majd pedig a 4. egyenlet –9szeresét, 7-szeresét és –1-szeresét rendre kivontuk az 1., 2. és 3. egyenletekből. A pivotokat minden lépésben megjelöltük. II. Gauss-elimináció alkalmazása abban az esetben, amikor az együtthatómátrix kvadratikus de szinguláris, illetve amikor az együtthatómátrix nem kvadratikus. A címben említett két eset elvileg lényegében nem tér el egymástól, a lényeg abban áll, hogy a mátrix rangja kisebb, mint az ismeretlenek száma. Ezekre az esetekre alkalmazható a klasszikus Gauss-elimináció de használható a Gauss-Jordan eljárás is. A Gauss-elimináció alkalmazása esetén az eliminációs fázis végeredménye általában az alábbi mátrix. a11 a12 1 0 a22 0 0 ... ... 0 0 0 0 ... ... 0 0
a13
...
a1k
...
a1n
a23
...
a2 k
...
a2 n
a33 ...
a3 k 2
...
a3 n
...
...
...
1
2
1
1
2
...
...
0
k 1 k 1 ... akk ... akn
0
...
0
...
0
... 0
... ...
... 0
... 0
... 0
b1 1 b2 2 b3 ... k 1 bk 0 ... 0
A lényeges különbség, hogy bár n db ismeretlen van, csak k db pivotelemet tudunk választani, mindegy, hogy eredetileg hány egyenlet volt a rendszerben, az első k db marad meg – ezt persze megelőzhetik sorcserék, az utána következő egyenletek mind eltűnnek, következményei az első k db egyenletnek. Úgy is fogalmazhatunk, hogy a mátrix első k db sora lineárisan független, az utána következő sorok az első k db sortól viszont lineárisan függenek. Az együtthatómátrix fenti 82
Óbudai Egyetem BGK
Fejezetek a matematikából
alakját sorredukált alaknak nevezzük. Ebben az esetben a rendszernek végtelen sok megoldása van, k db kötött ismeretlen van, amelyek célszerűen a pivotok oszlopaihoz tartozó ismeretlenek, a többi pedig a szabad ismeretlen. Lássunk példákat a mondottakra. 1.41.Példa: Oldjuk meg az alábbi homogén lineáris egyenletrendszert Gauss-eliminációval. 3x1 2 x2 5 x3 4 x4 0; 3x1 x2 3x3 3x4 0; 3x 5 x 13x 11x 0; 2 3 4 1
A szokásos jelölésekkel kapjuk, a mátrix sorredukált alakját.
3 2 5 4 3 3 1 3 3 ~ 0 3 5 13 11 0
5
2
3 3
4 3 2 5 4 8 7 ~ 0 3 8 7 ; 8 7 0 0 0 0
A rendszerben 4 ismeretlen van, de csak két pivot választására volt lehetőségünk. Ez azt jelenti, hogy a mátrix rangja ρ = 2, és így a szabadságfok is s = 4 – 2 = 2.Mivel van szabad ismeretlen, az x3 és x4, az egyenletrendszernek végtelen sok megoldása van, tehát van nemtriviális megoldás is. A kötött ismeretlenek az x1 és x2 ismeretlenek, mivel a pivotok az 1. és 2. oszlopból lettek kiválasztva. Ismét alulról felfelé haladva, kapjuk a rendszer általános megoldását. A különbség, hogy a visszahelyettesítéses fázisban nem csak konstansokat helyettesítünk, hanem olyan kifejezéseket, amelyek függenek a szabad változóktól.
8 7 3x2 8 x3 7 x4 0; x2 x3 x4 ; 3 3 7 1 2 8 3x1 2 x2 5 x3 4 x4 0; azaz 3x1 2 x3 x4 5 x3 4 x4 0; x1 x3 x4 ; x3 , x4 R 3 9 9 3 Ezzel megkaptuk a rendszer általános megoldását. Ha a szabad ismeretlenek legalább egyikének 0-tól különböző értéket adunk, kapunk egy nemtriviális megoldást. Legyen például x3 = 9 és x4 = 0. Ekkor a nemtriviális megoldás, helyettesítéssel adódik: x1 = –1, x2 = 24, x3 = 9 x4 = 0. 1.42.Példa: Oldjuk meg az alábbi lineáris rendszert Gauss-Jordan algoritmussal.
1 2 3 4 x1 4 0 1 1 1 x 3 2 ; 1 3 0 3 x3 1 0 7 3 1 x4 3 A megoldás a következő. 83
Óbudai Egyetem BGK
Fejezetek a matematikából
1 2 3 4 4 1 2 3 4 4 1 0 1 1 1 3 ~ 0 1 1 1 3 ~ 0 1 3 0 3 1 0 5 3 1 3 0 0 7 3 1 3 0 7 3 1 3 0 1 0 ~ 0 0
2 2 1 1 1 1 3 0 ~ 0 1 2 6 0 0 4 8 24 0 0
1
2 2 1 1 1 3 ~ 0 2 4 12 0 4 8 24 0
1
0 8 1 0 1 3 ; 0 1 2 6 0 0 0 0 0 0
A rendszer négy ismeretlent tartalmaz, de csak három pivotot tudtunk választani, ami azt jelenti, hogy a mátrix rangja ρ = 3. Ebből következően a szabadságfok s = 4 – 3 = 1. Egy szabad ismeretlen van, ami célszerűen az x4, az első három oszlophoz tartozó ismeretlenek, tehát az x1, x2 és x3 a kötött ismeretlenek, mivel ezekből az oszlopokból választottuk a pivotokat. A kapott sorredukált alakból felírható az általános megoldás. x1 8;
x1 8;
x2 x4 3;
x2 3 x4 ; x4 R
x3 2 x4 6; x3 6 2 x4 ;
Ha a szabad ismeretlent rögzítjük kapunk egy partikuláris megoldást. Legyen például x4 = 2, ekkor a partikuláris megoldás x1 = –8, x2 = 5, x3 = 10, x4 = 0. III. Reguláris mátrixok LU-felbontása A továbbiakban a Gauss-elimináció módszerét alkalmazva, csak egy kvadratikus, sőt reguláris mátrixra koncentrálva, előállítjuk a mátrix olyan szorzat alakját, amelyben az első tényező egy aló-, a második tényező pedig egy felső háromszögmátrix. Ez mind az elmélet, mind a numerikus matematika szempontjából alapvető fontosságú faktorizáció. Mielőtt általánosan felírnánk a kérdéses alakot, egy konkrét példát vizsgáljunk meg. Alkalmazzuk a Gauss-elimináció algoritmusát az 1 2 3 A 2 5 2 ; 3 1 2
A fentiekben részletesen bemutatott módszert alkalmazva több elemi lépésre bontva, megkapjuk a sorredukált alakot, amely reguláris esetben felső háromszögmátrix.
84
Óbudai Egyetem BGK
Fejezetek a matematikából
1 2 3 1 2 3 1 2 5 2 ~ 0 1 4 ~ 0 3 1 2 3 1 2 0
2
1 7
3 1 2 4 ~ 0 1 11 0 0
3 4 ; 39
A számítás során a pivotokat megjelöltük, a főátló utolsó elemét is pivotnak tekintve. Ebben a pontban újdonságként kerül elő, hogy az eliminációs lépések mátrixszorzással is elvégezhetők. Megmutatjuk, hogy az imént részletezett három transzformációs lépés egyenértékű három egymást követő mátrixszorzással, természetesen megfelelő sorrendben. Ennek megértéséhez csak annyit kell felidézni a mátrixok szorzásával kapcsolatban, hogy ha egy sorvektorral balról szorzunk egy mátrixot, akkor eredményként a mátrix sorainak lineáris kombinációját kapjuk. Ezt a gondolatot felhasználva kapjuk az eliminációs lépéseknek megfelelő mátrixokat. Például, az első lépésben azt tettük, hogy az első egyenlet 2-szeresét levontuk a második egyenletből. Azt állítjuk, hogy ez egyenértékű az alábbi L21-jelű, elemi transzformációs mátrixszal történő szorzással. 1 0 0 L 21 2 1 0 ; 0 0 1
Ellenőrizzük, hogy a fenti sorban a második mátrixot kapjuk. Valóban igaz 1 0 0 1 2 3 1 2 3 L 21A 2 1 0 2 5 2 0 1 4 ; 0 0 1 3 1 2 3 1 2
Ugyanis könnyen látható, hogy ha a 2.sorvektornak és az A mátrixnak a szorzatát képezzük, akkor valóban az eliminációnak megfelelő műveletet kapjuk, azaz –2-szer az 1. sornak és a második sornak az összegét. Vegyük észre hogy ez az L21 elemi transzformációs mátrix invertálható, hiszen alsó háromszögmátrix lévén, determinánsa a főátlóbeli elemek szorzata, azaz 1. Inverzét pedig könnyen előállíthatjuk. Nem szükséges az adjungált mátrix, egyszerűen abból kell kiindulni, hogy milyen transzformációt végez az L21 mátrix. Ezt a műveletet kell fordítva elvégezni. Eszerint az L21 mátrix inverze nem lehet más, mint az
L211
1 0 0 2 1 0 ; 0 0 1
Erről könnyen meggyőződhetünk, ha összeszorozzuk a két mátrixot. A szorzat
85
Óbudai Egyetem BGK
Fejezetek a matematikából
L 21L211
1 0 0 1 0 0 1 0 0 2 1 0 2 1 0 0 1 0 ; 0 0 1 0 0 1 0 0 1
valóban az egységmátrix. Ebből a példából már kitalálhatjuk, hogy az A mátrix eliminációjának sorában a következő két transzformáció az alábbi elemi transzformációs mátrixokkal történő szorzással érhető el. 1 0 0 1 0 0 L31 0 1 0 ; L32 0 1 0 ; 3 0 1 0 7 1
A szorzás sorrendje pedig nyilvánvalóan a következő.
L32L31L21A U; Ahol U jelöli az elimináció eredményét, a felső (upper) háromszög mátrixot. Konkrétan a következőt írhatjuk 1 0 0 1 0 0 1 0 0 1 2 3 1 2 3 0 1 0 0 1 0 2 1 0 2 5 2 0 1 4 ; 0 7 1 3 0 1 0 0 1 3 1 2 0 0 39
Mielőtt tovább lépünk, vegyük észre, hogy ha például az L31 és L21 mátrixokat ebben a sorrendben szorozzuk, akkor azt kapjuk, hogy 1 0 0 1 0 0 1 0 0 L1 L31L 21 0 1 0 2 1 0 2 1 0 ; 3 0 1 0 0 1 3 0 1
Ebben a szorzatban benne vannak az elimináció során alkalmazott szorzók, a szorzás során nem jelent meg sehol egyetlen további komponens sem. Ez azt jelenti, hogy ezzel a szorzatmátrixszal leírható az egész első oszlopot érintő eliminációs lépéssorozat. Ennek a mátrixnak az inverzét ismét úgy kapjuk, hogy minden műveletet fordítva hajtunk végre, tehát minden főátló alatti komponens előjelét megváltoztatjuk. Valóban igaz, hogy
L1L11
1 0 0 1 0 0 1 0 0 2 1 0 2 1 0 0 1 0 ; 3 0 1 3 0 1 0 0 1
86
Óbudai Egyetem BGK
Fejezetek a matematikából
Térjünk rá ezután az LU-felbontásra. Induljunk ki az L32L31L21A U egyenlőségből, majd szorozzuk meg ezt balról rendre az L32, L31 és L21 mátrixok inverzével. A következőt kapjuk. A L211 L311 L321 U;
Végezzük el a jobboldali első három tényező szorzását.
L
L211 L311 L321
1 0 0 1 0 0 1 0 0 1 0 0 2 1 0 0 1 0 0 1 0 2 1 0 ; 0 0 1 3 0 1 0 7 1 3 7 1
A kapott mátrix egy alsó háromszögmátrix, amelynek főátlójában egyesek vannak, és amelyben a főátló alatti komponensek éppen a Gauss-eliminációnál alkalmazott hányadosok, pozícióhelyesen. Kapjuk tehát az A mátrix szorzat alakú előállítását, más szóval faktorizációját.
A LU; A fenti konkrét példában ez a felbontás a következő. 1 2 3 1 0 0 1 2 3 2 5 2 2 1 0 0 1 4 ; 3 1 2 3 7 1 0 0 39
Ismét hangsúlyozzuk a következőket, az LU-felbontás lényegét. A kvadratikus és reguláris A mátrixot felbonthatjuk egy alsó L (lower), és egy felső U (upper) háromszögmátrix szorzatára, ahol az alsó háromszögmátrix főátlójában egyesek állnak, azi-edik sor j-edik eleme i>j esetén éppen a gauss eliminációnál alkalmazott hányados ellentettje, a főátló felett minden komponens zérus. A felső háromszögmátrix pedig egy olyan mátrix melynek a főátlójában éppen a pivot elemek állnak, a főátló alatt pedig minden komponens zérus. 1.43.Példa: Végezzük el az 1 1 2 A 2 1 2 ; 4 1 4
mátrix LU felbontását. Ezzel az együtthatómátrixszal, az 1.38. példában már megoldottunk korábban egy lineáris egyenletrendszert a Gauss-elimináció alkalmazása során. A példában az eliminációs lépéseknek megfelelő elemi transzformációs mátrixok a következők voltak. 87
Óbudai Egyetem BGK
Fejezetek a matematikából
1 0 0 1 0 0 1 0 0 L 21 2 1 0 ; L31 0 1 0 ; L32 0 1 0 ; 0 0 1 4 0 1 0 1 1
Ebből következik, hogy a felbontásban szereplő alsó háromszögmátrix a következő. 1 0 0 L 2 1 0 ; 4 1 1
Felidézve a mátrix sorredukált alakját, kapjuk az LU-felbontást. 1 0 0 1 1 2 1 1 2 LU A; azaz 2 1 0 0 3 2 2 1 2 ; 4 1 1 0 0 2 4 1 4
1.44.Példa: Végezzük el az
1 1 2 3 3 1 1 2 ; A 2 3 1 1 1 2 3 1 mátrix LU-felbontását. Ezzel az együtthatómátrixszal már ugyancsak megoldottunk egy egyenletrendszert a Gauss-elimináció alkalmazása során. De egy apróságra oda kell figyelnünk, ha a korábbi eredményeinket szeretnénk használni. Végrehajtottunk ugyanis egy sorcserét. Tehát ha a megoldásban szereplő sorredukált alakot, azaz felső háromszögmátrixot szeretnénk használni, az A mátrix faktorizációjához, akkor a sorcserét figyelembe kell venni. A korábbiak szerint tudjuk, hogy a sorcserét egy permutáló mátrixszal való szorzással lehet figyelembe venni. Mivel a 2. és a 4. sort cseréltük fel, ezért nyilvánvalóan a
1 0 P 0 0
0 0 0 1
0 0 1 0
0 1 ; 0 0
permutációs mátrixszal kell először megszorozni az A mátrixot. Az idézett példa alapján voltaképpen a PA mátrixot tudjuk faktorizálni PA =LU alakban. Először előállítjuk a PA mátrixot.
88
Óbudai Egyetem BGK 1 0 PA 0 0
Fejezetek a matematikából 0 0 0 1
0 0 1 0
0 1 1 2 3 1 1 2 3 1 3 1 1 2 1 2 3 1 ; 0 2 3 1 1 2 3 1 1 0 1 2 3 1 3 1 1 2
Hajtsuk végre az eliminációt a PA mátrixon.
3 1 1 1 2 3 1 1 2 1 2 3 1 ~ 0 1 1 4 ~ 0 2 3 1 1 0 1 5 7 0 3 1 1 2 0 4 7 11 0
1 1 0 0
2 3 1 1 4 0 ~ 6 3 0 3 27 0
1 2 1 1 0 6 0 0
3 4 ; 3 25,5
Ha most figyelembe vesszük a sorcseréket az eliminációs lépéseknél alkalmazott hányadosok meghatározásánál, akkor kapjuk a PA mátrix LU-felbontását.
0 1 0 1 1 0 LU PA; azaz 2 1 1 3 4 0,5
0 1 0 0 0 0 1 0
1 2 3 1 1 2 3 1 1 4 1 2 3 1 ; 0 6 3 2 3 1 1 0 0 25,5 3 1 1 2
ha figyelembe vesszük, hogy a P permutációs mátrix ortogonális, akkor azonnal tudjuk, hogy inverze a transzponáltja. Így kapjuk az A mátrix előállítását
A PTLU alakban. Mivel természetesen PT is egy permutációs mátrix, természetesen írhatjuk a fenti előállítást A PLU alakban is, csak arra kell tekintettel lennünk, hogy nyilván ez a P egy másik permutációs mátrix. Ebben a példában önkényesen írtunk elő egy sorcserét, elvileg nem volt rá szükség, csak kényelmi szempontok miatt történt a sorcsere. Az eredeti A mátrix is faktorizálható lenne LU alakban, de az L és U mátrixok nyilván különböznének attól, amelyet itt állítottunk elő. Azonban vannak esetek, amikor elkerülhetetlen a sorcsere, mert a pivot elem helyén nulla áll, ami nem lehetséges. Ilyenkor sorcserével tudjuk csak folyatatni az eliminációt. Lássunk egy ilyen példát. 1.45.Példa: Végezzük el az 2 4 5 A 4 8 12 ; 6 13 18
89
Óbudai Egyetem BGK
Fejezetek a matematikából
mátrix LU felbontását. Először is hozzuk az A mátrixot felső háromszög alakra.
2 4 5 2 4 5 4 8 12 ~ 0 0 2 2. és 3. sorcseréje 6 13 18 0 1 3
2 0 0
4
1 0
5 3 ; 2
Mint látható, ebben az esetben elkerülhetetlen a jelzett sorcsere, mert az első lépés után a főátló második eleme zérus, ami nem lehet pivot, ezért kellett sort cserélni. Ezen csere után már meg is kaptuk a felső háromszögmátrixot. Ekkor szükségképpen alkalmazni kell tehát A soraira egy permutációt, amelynek mátrixa 1 0 0 P 0 0 1 ; 0 1 0
Előállítjuk elsőként a PA mátrixot. 1 0 0 2 4 5 2 4 5 PA 0 0 1 4 8 12 6 13 18 ; 0 1 0 6 13 18 4 8 12
Ezután jöhet a felső háromszögmátrix alakra történő transzformálás. 2 4 5 2 4 5 6 13 18 ~ 0 1 3 ; 4 8 12 0 0 2
Figyelembe véve az alkalmazott szorzótényezőket, a PA mátrix LU-felbontása a következő. 1 0 0 2 4 5 2 4 5 3 1 0 0 1 3 6 13 18 ; 2 0 1 0 0 2 4 8 12
Innen az A mátrix faktorizált alakja az alábbi. 1 0 0 1 0 0 2 4 5 2 4 5 P LU A;azaz 0 0 1 3 1 0 0 1 3 6 13 18 ; 0 1 0 2 0 1 0 0 2 4 8 12 T
90
Óbudai Egyetem BGK
Fejezetek a matematikából
Ebben az esetben azonban az A nem bontható fel közvetlenül LU alakra, csak a sorcserékkel kapott PAmátrix. Általánosan is felírhatjuk az LU-felbontás képletét. Ha a reguláris n-ed rendű A mátrixot felbontjuk egy alsó és egy felső háromszögmátirx szorzatára, akkor – az esetleges sorcserék figyelembe vételével –, a szorzat alak a következő.
a11 a12 a 21 a22 PA P a31 a32 ... ... an1 an 2
a13 a23 a33 ... an3
... ... ... ... ...
a1n 1 0 a2 n h21 1 a3n h31 h32 ... ... ... ann hn1 hn 2
0 0 1 ... hn3
... ... ... ... ...
0 a11 a12 1 0 0 a22 0 0 0 ... ... ... 1 0 0
a13
...
1 a23
...
a33 ... ... ... 2
0
...
a1n 1 a2 n 2 a3 n LU; ... n ann
Ahol P a sorcseréket tekintetbe vevő permutáló mátrix, a hij konstansok, pedig a Gausselimináció témakörében definiált hányadosok. A fentiekben bemutatott LU-felbontás általánosítható téglalap-alakú mátrixokra is, ebben a tekintetben a Tisztelt Olvasónak a szakirodalom tanulmányozását javasoljuk. Az LU-felbontás elméleti és gyakorlati fontossága például abban nyilvánul meg, hogy megkönnyíti lineáris egyenletrendszerek és mátrixegyenletek megoldását. a) Lineáris egyenletrendszerek megoldása LU-felbontással. Tekintsük például az Ax = b lineáris egyenletrendszert. Tegyük fel, hogy az A mátrix felbontható LU alakban. Ekkor az egyenletrendszer egyenértékű az LUx = b rendszerrel. Ez pedig két független rendszerre bontható. Ly = b,Ux = y és ezek a rendszerek egyszerűen megoldhatók, csupán visszahelyettesítéseket kell alkalmazni. b) Mátrixegyenlet megoldása LU-felbontással. Az a) ponthoz hasonlóan az AX = B mátrixegyenlet is egyszerűen megoldható, ha az A-nak létezik LU-felbontása. Ugyanis ekkor a mátrixegyenlet LUX = B alakkal egyenértékű, amely helyettesíthető az LY = B, UX = Y mátrixegyenletekkel. Ezek ugyancsak egyszerűen megoldhatók, mert az együtthatómátrixuk háromszögmátrix. Speciális esetként megemlítjük, az LU-felbontás inverz mátrix meghatározására is használható. Ekkor az előbbi mátrixegyenletben B az egységmátrix, tehát az inverz meghatározása egyenértékű az
91
Óbudai Egyetem BGK
Fejezetek a matematikából LY = E, UX = Y
egyenletrendszerek megoldásával. 1.46.Példa: Határozzuk meg az alábbi mátrix inverzét LU-felbontással. 1 1 2 A 2 1 2 ; 4 1 4
Egy korábbi példában már meghatároztuk ezen mátrix LU-felbontását. 1 0 0 1 1 2 1 1 2 2 1 0 0 3 2 2 1 2 ; 4 1 1 0 0 2 4 1 4
Az inverz előállításához egyrészt meg kell oldani az LY = E egyenletet. 1 0 0 y11 2 1 0 y 21 4 1 1 y31
y12 y22 y32
y13 1 0 0 y23 0 1 0 ; y33 0 0 1
y11 y 21 y31
y12 y22
x13 1 0 0 x11 x23 2 1 0 ; x21 x31 x33 2 1 1
x12 x22
y32
y13 1 0 0 y23 2 1 0 ; y33 2 1 1
másrészt pedig az UX = Y egyenletet. 1 1 2 x11 0 3 2 x 21 0 0 2 x31
x12 x22 x32
x32
x13 6 2 4 1 x23 0 4 2 ; 6 6 3 3 x33
Ezzel megkaptuk a mátrix inverzét. Mindkét rendszer megoldása egyszerűbb, mint a szokásos esetben, mert az együtthatómátrix háromszögmátrix. Az LU-felbontással kapcsolatosan ki kell emelnünk szimmetrikus a mátrixok LU-felbontását. Természetesen a faktorizáció ebben a speciális esetben is elvégezhető, de a szimmetriából adódóan a felbontás speciális módon végezhető el. Elsőként alakítsuk át az U felső háromszög mátrixot úgy, hogy a diagonálisában az L-hez hasonlósan szintén mindenütt 1-es álljon. Ez egy egyszerű mátrixszorzással elérhető. Könnyen látható, hogy az alábbi átalakítás helyes.
92
Óbudai Egyetem BGK
d1 u12 0 d 2 U ... ... 0 0
Fejezetek a matematikából
... u1n d1 0 ... u2 n 0 d 2 ... ... ... ... ... d n 0 0
... ... ... ...
u 1 12 d1 0 0 0 1 ... d n ... ... 0 0
u1n d1 u2 n ... DU; d 2 ... ... ... 1 ...
Amint látható, a második tényező az eredeti U mátrixból úgy adódik, hogy annak i-edik sorát elosztjuk az i-edik sorban álló pivot elemmel. Az egyszerűség kedvéért nem vezetünk be új jelölést, a kapott háromszögmátrixot ugyancsak U jelöli. Elértük tehát a következőt, az U felső háromszögmátrix faktorizálható úgy, hogy az első tényező egy diagonális mátrix, melynek főátlójában éppen a pivotok állnak, a második tényező pedig egy olyan felső háromszögmátrix, amelyben a főátlóban minden komponens 1-es. Ezzel az LU-felbontást a következő ekvivalens alakban írhatjuk fel. A = LDU; A továbbiakban fontos szerepe van annak, hogy ez a három tényezős felbontás egyértelmű a következő feltételek mellett. 1.43.Tétel: Ha L1D1U1 = L2D2U2 úgy teljesül, hogy a D1 és D2 olyan diagonális mátrixok, melyeknek főátlójában nem szerepel a zérus, továbbá Li és Ui olyan alsó illetve felső háromszögmátrixok, amelyek főátlójában minden elem 1-es, akkor L1 = L2, D1 = D2 és U1 = U2, tehát ez a faktorizáció egyértelmű. Bizonyítás: Mivel a feltétel szerint az Li és Ui olyan háromszög mátrixok, melyek determinánsa 1, ezért mindannyian invertálhatók. Szorozva a megfelelő inverzekkel a következő adódik. L2–1L1D1 = D2U2 U1–1; Mivel egy alsó háromszögmátrix inverze ugyancsak alsó háromszögmátrix – ennek megértéséhez utalunk a Gauss-elimináció mátrixos leírásánál tapasztaltakra –, és ugyanez igaz egy felső háromszög mátrixra adódik, hogy bal oldalon állóL2–1L1 tényező alsó háromszögmátrixok szorzata, ugyancsak olyan alsó háromszögmátrix, melynek főátlójában 1-esek állnak. Ha ezt szorozzuk egy diagonális mátrixszal ugyancsak alsó háromszögmátrixot kapunk. Hasonlóan igaz ez a jobb oldalra azzal a különbséggel, hogy ott felső háromszögmátrix áll. Ezek csak akkor lehetnek egyenlők, ha mindkét oldalon csak a diagonálisban állnak nullától különböző elemek, ez csak akkor következhet be ha a diagonális mátrixot egységmátrixszal szorozzuk, azaz teljesül, hogy L2–1L1 = U2 U1–1 = E, ebből pedig egyrészt az következik, L1 = L2 és U1 = U2, ezek következménye továbbá, hogy D1 = D2. ■ Ebből a tételből egy fontos állítást tudunk levezetni szimmetrikus mátrixok faktorizációjára vonatkozólag.
93
Óbudai Egyetem BGK
Fejezetek a matematikából
1.44.Tétel: (Szimmetrikus mátrixok LU felbontása) Ha szimmetrikus mátrix, akkor egyértelműen bontható fel A = LDLT; alakban, ahol L olyan alsó háromszög mátrix, amelynek főátlójában egyesek állnak, a D pedig egy diagonális mátrix, melynek főátlójában a pivotok állnak. Bizonyítás: Egyrészt világos, hogy ez a szorzat valóban szimmetrikus mátrixot értelmez. Ugyanis AT = (LDLT)T =(LT)TDTLT = LDTLT = LDLT = A; Ugyanis egy diagonális mátrix transzponáltja saját maga. Az előző tétel szerint ha létezik ilyen előállítás, akkor az egyértelmű. Már csak azt kell igazolni, hogy U = LT. Ha A szimmetrikus, akkor LDU felbontása is szimmetrikus mátrixot ad. Eszerint A = LDU = UTDLT = AT; A felbontás egyértelműségéből, következik, hogy U = LT, ezt kellett igazolni. ■ 1.47.Példa: Bontsuk fel az alábbi szimmetrikus mátrixot LDLT alakban. 2 4 2 A 4 6 8 ; 2 8 0
Először is végezzük el az szükséges eliminációs lépéseket.
2 4 2 2 4 6 8 ~ 0 2 8 0 0
4
2 12
2 2 4 12 ~ 0 2 2 0 0
2 12 ; 70
Tekintettel az eliminációs lépésekre – a 2. sorból kivontuk az 1. sor 2-szeresét, a 3. sorhoz hozzáadtuk az 1. sor 1-szeresét, majd a 3. sorhoz hozzáadtuk a 2. sor 6-szorosát –, az LDUfelbontás a kezünkben van. A pivotokat minden lépésben szokás szerint megjelöltük. 2 4 2 1 0 0 2 4 2 1 0 0 2 0 0 1 2 1 A 4 6 8 2 1 0 0 2 12 2 1 0 0 2 0 0 1 6 LDU; 2 8 0 1 6 1 0 0 70 1 6 1 0 0 70 0 0 1 Látható, hogy az alsó és felső háromszög mátrix valóban egymás transzponáltja, és a D diagonális mátrix főátlójában valóban a pivotok állnak.
94
Óbudai Egyetem BGK
Fejezetek a matematikából
1.11. Mátrix sajátértéke, sajátvektora 1.45.Definíció: Az ARn×n mátrix sajátvektorának nevezzük az sRn, s ≠ 0 vektort, ha létezik olyan λR valós vagy λC komplex szám, amelyre teljesül, hogy As = λs. A λ valós számot az s sajátvektorhoz tartozó sajátértéknek nevezzük. Szavakkal megfogalmazva ez annyit jelent, hogy s sajátvektora A-nak, ha az As szorzatvektor az s vektornak skalárszorosa. Szemléletesen ez azt jelenti, hogy az Asvektor párhuzamos az s vektorral,az A mátrixszal való szorzás tehát egy nyújtás vagy zsugorítás, vagy esetleg ezek egyike egy tükrözéssel együtt, ha λ < 0. A sajátvektor és a sajátérték meghatározása a következő módon történik. Induljunk ki a definícióban szereplő As = λs egyenletből. Rendezzük egy oldalra a tagokat kapjuk, hogy As – λs = 0. Itt most kiemelhetnénkaz s vektort, de a kiemelés után egy mátrixnak és egy valós számnak a különbsége állna, ami nyilván értelmetlen. Ezen segíthetünk, ha felhasználjuk az Es = s egyenlőséget, ahol E az n-ed rendű egységmátrix. Ennek helyettesítésével olyan egyenletet kapunk, amelybőls már valóban kiemelhető (A – λE)s= 0; Így kaptunk egy homogén lineáris egyenletrendszert az ismeretlen s sajátvektorra vonatkozólag. Hangsúlyoztuk, hogy a sajátvektor csak nullvektortól különböző vektor lehet. Ez annyit jelent, hogy keressük ennek a homogén lineáris egyenletrendszernek a nemtriviális megoldását. Mi a feltétele annak, hogy létezzen nemtriviális megoldás. Az, hogy az együtthatómátrix szinguláris legyen, tehát determinánsa nulla, azaz det(A – λE) = 0 Ez az egyenlet amely szolgáltatja azokat a valós λ értékeket, amelyekre az (A – λE) mátrix szinguláris. Ezek a valós számok a sajátértékek.Az (A – λE) mátrix a karakterisztikus mátrix.
a11 a12 a a A E 21 22 ... ... an1 an 2
... a1n 1 0 ... a2 n ... ... ... ... ann 0
0 1 ... 0
... ... ... ....
a12 0 a11 a22 0 a21 ... ... ... an 2 1 an1
... a1n ... a2 n ; ... ... ... ann
A det(A – λE) = 0 egyenletet az A mátrix karakterisztikus egyenletének nevezzük. Ha az A n-ed rendű mátrix, akkor ez az egyenlet egy n-ed fokú egyenlet a λ sajátértékre vonatkozólag. Az egyenlet bal oldala a λ határozatlan n-ed fokú polinomja. Ezt a k(λ) = det(A – λE) polinomot az A mátrix karakterisztikus polinomjának nevezzük.
95
Óbudai Egyetem BGK
Fejezetek a matematikából
Ezek után következzenek a számítások. A számítások az előbbi logikához képest fordított sorrendben követik egymást. 1. lépés: Megoldjuk a det(A – λE) = 0 sajátérték-egyenletet. Ez egy n-ed fokú algebrai egyenlet az ismeretlen λ-ra. A megoldások a sajátértékek. 2. lépés: A kapott λ sajátértékeket behelyettesítjük az (A – λE)s = 0egyenletrendszerbe – minden λ-ra egy egyenletrendszer –, és azokat megoldjuk az s ismeretlenekre. Ezek lesznek az adott λ sajátértékekhez tartozó sajátvektorok. Mielőtt hozzákezdenénk számítási feladatokhoz, a sajátértékekkel kapcsolatosan két egyszerű, de nagyon fontos állítást igazolunk. 1.45.Tétel: Ha s a λ sajátértékhez tartozó sajátvektora az A mátrixnak akkor tetszőleges α konstans esetén αs is a λ sajátértékhez tartozó sajátvektor. Bizonyítás: A definíció alapján, felhasználva hogy α egy skalár írhatjuk, hogy
mivel As s ezért As As s s; Ezt kellett igazolni. ■ Ez a tétel azért fontos, mert a számítások eredményeképpen mindig végtelen sok megoldást kapunk az s sajátvektorra vonatkozólag. Ezek egy konstans szorzóban különbözhetnek egymástól. A tétel alapján ezek közül kiválaszthatunk egy tetszőlegeset és azt tekinthetjük sajátvektornak az alkalmazások során. Az előző állításnál azonban több is igaz. 1.46.Tétel: Egy adott λ sajátértékhez tartozó sajátvektorok lineáris alteret alkotnak Rn-ben. Bizonyítás: Az 1.1. pont szerint azt kell igazolnunk, hogy sajátvektorok tetszőleges lineáris kombinációja is sajátvektor. Legyen tehát s1 és s2 a λ sajátértékhez tartozó sajátvektor, és legyenek α és β tetszőleges skalárok. Megmutatjuk, hogy ekkor s1 s2 is sajátvektor. Valóban, mivel As1 s1 és As2 s2 ezért a disztributív törvény szerint A s1 s2 As1 As2 As1 As2 s1 s2 s1 s2 ;
Ezt kellett igazolni. ■ 1.46.Definíció: Az A mátrix λ sajátértékhez tartozó sajátvektorai által kifeszített altér a λ sajátértékhez tartozó sajátaltér. A sajátaltér dimenziója, tehát a λ sajátértékhez tartozó lineárisan független sajátvektorok száma a λ sajátérték geometriai multiplicitása. Ha a multiplicitás fogalma előkerül, akkor ki kell térnünk a λ sajátérték algebrai multiplicitására.
96
Óbudai Egyetem BGK
Fejezetek a matematikából
1.47.Definíció: Ha a λ sajátérték a karakterisztikus polinomnak p-szeres gyöke, akkor a sajátérték algebrai multiplicitásap. Vizsgáljuk meg, milyen lehet az alakja a karakterisztikus polinomnak. Ha kifejtjük a karakterisztikus mátrix determinánsát, akkor formálisan a következőt kapjuk
a11 a12 a21 a22 det A E ... ... an1 an 2
... a1n ... a2 n p n p p 1 1 1 2 2 ... m m ; ... ... ... ann
ahol természetesen teljesül, hogy p1 p2 ... pm n . Ez a gyöktényezős alak tehát azt jelenti, hogy az A mátrixnak van m db különböző sajátértéke, és a λi sajátérték a karakterisztikus egyenletnek pi-szeres gyöke, más szóval a λi sajátérték algebrai multiplicitása pi. Az algebrai multiplicitások összege természetesen n, a polinom foka, ugyanis az algebra alaptétele szerint egy n-ed fokú polinomnak pontosan n db gyöke van a komplex számok halmazában. A gyökök, tehát a sajátértékek lehetnek komplexek is, de multiplicitással számolva pontosan n db sajátérték van. Több kérdés felmerül a vizsgált problémával kapcsolatban. Először is, az, hogy van-e valami kapcsolat az algebrai és a geometriai multiplicitás között. Bizonyítás nélkül megfogalmazzuk az ide vonatkozó alapvető eredményt. 1.47.Tétel: A λ sajátérték geometriai multiplicitása legfeljebb akkora lehet, mint az algebrai multiplicitása. Más szóval, ha a sajátérték a karakterisztikus polinomnak p-szeres gyöke, akkor a lineárisan független sajátvektorok száma kisebb vagy egyenlő, mint p, számuk p-nél nagyobb nem lehet. Ez a tétel valamelyes segít a probléma áttekintésében, de nem árt, ha összefoglaljuk a lehetőségeket. Hangsúlyozzuk, hogy vizsgálatainkban mindenütt valós komponensű mátrixok szerepelnek, azaz ARn×n. Mielőtt azonban a lehetőségeket felsorolnánk, néhány alapvetően fontos tételt igazolunk, elsőként azt, amely különböző sajátértékekhez tartozó sajátvektorokról szól. 1.48.Tétel: Az n-ed rendű A mátrix különböző sajátértékeihez tartozó sajátvektorok lineárisan függetlenek. Bizonyítás: Az állítást a sajátértékek száma szerinti teljes indukcióval bizonyítjuk. a) Ha egy sajátértéket tekintünk, akkor az állítás nyilvánvaló, ugyanis a sajátvektor nem lehet nullvektor, így lineárisan független rendszer. b) Tegyük fel, hogy van n db különböző sajátérték 1 , 2 ,..., n , amelyekhez tartozó sajátvektorok
s1, s2 ,..., sn
lineárisan
függetlenek.
Tehát
1s1 ... nsn 0 esetén
szükségképpen 1 ... n 0 . Vegyük hozzá ehhez a rendszerhez az eddigiektől különböző λn+1 sajátértéket és a hozzá tartozó sn+1 sajátvektort. Indirekt tegyük fel, hogy az n + 1 db sajátvektor lineárisan összefüggő rendszert alkot. Ekkor 1s1 ... nsn n1sn1 0 esetén 97
Óbudai Egyetem BGK
Fejezetek a matematikából
létezik nullától különböző együttható, legyen például β1 ≠ 0. Szorozzuk meg ezt a lineáris kombinációt az A mátrixszal balról. Az adódik, hogy A 1s1 ... nsn n1sn1 0;
Mivel sajátvektorokról van szó, a disztributív törvény szerint írhatjuk, hogy A1s1 ... Ans n An 1s n 1 1As1 ... n As n n1Asn1 11s1 ... n ns n n1 n1s n1 0;
Szorozzuk most meg az indirekt feltevést jelenő lineáris kombinációt a λn+1 sajátértékkel és vonjuk ki egymásból a kapott két egyenletet. Azt kapjuk, hogy
n1 1s1 ... nsn n1sn1 11s1 ... n nsn n1 n1sn1 1 n1 1 s1 ... n n1 n s n 0; A feltevés szerint a sajátértékek különbözők, és β1 ≠ 0, ami azt jelenti, hogy a nullvektort előállítja az s1, s2 ,..., sn sajátvektor rendszer egy nemtriviális lineáris kombinációja, ami ellentmond annak, hogy ez a rendszer a feltevés szerint lineárisan független. Ez pontosan azt jelenti, hogy az indirekt feltevés hamis. Az állítást igazoltuk. ■ Egy valós együtthatójú algebrai egyenletnek lehetnek komplex sajátértékei. Ekkor azonban tudjuk, mivel valós együtthatójú az egyenlet, hogy a komplex gyökök párosával lépnek fel, komplex gyök és konjugáltja. Ha tehát a C komplex sajátérték, akkor C is megoldás. Világos, hogy ha a sajátértékek komplexek, akkor a sajátvektor meghatározására vonatkozó egyenletrendszer komplex együtthatójú, tehát a sajátvektorok is komplexek. Kérdés, hogy van-e valami kapcsolat ekkor a sajátvektorok között is. A válasz pozitív. 1.49.Tétel: Ha C komplex sajátérték és s Cn a hozzá tartozó sajátvektor, akkor a C sajátértékhez tartozó sajátvektor az s vektor komplex konjugáltja azaz s Cn . Bizonyítás: Mivel az A mátrix valós komponensű, és s a λ sajátértékhez tartozó sajátvektor írhatjuk, hogy As = λs. Képezve ennek az egyenletnek a komplex konjugáltját, tekintettel arra, hogy szorzat konjugáltját tényezőnként képezhetjük kapjuk, hogy
As s; azaz As s ; tehát As s ; ami éppen az állítást igazolja. ■ Ez az állítás megkönnyíti a dolgunkat akkor, ha komplex sajátérték adódik, hiszen ha egy sajátvektort meghatároztunk, a konjugált sajátértékhez tartozó sajátvektor már adódik, mert nem más mint a már meghatározott komplex sajátvektor komplex konjugáltja.
98
Óbudai Egyetem BGK
Fejezetek a matematikából
Részletesen kifejtve a komplex sajátérték esetét a következőt mondhatjuk. Tegyük fel, hogy az A mátrixnak a λ = α + iβ komplex sajátértéke. Mivel a mátrix valós, azonnal következik, hogy a = α – iβ is sajátérték. Legyen s = u + iv a λ sajátértékhez tartozó komplex sajátvektor. A bizonyított tétel szerint ekkor a sajátértékhez tartozó sajátvektor az s = u – iv komplex vektor. A differenciálegyenlet rendszerek elméletében szükségünk van az alábbi eredményre. 1.50.Tétel: Ha s = u + ivaz A mátrix komplex sajátvektora, akkor azs komplex vektor valós és képzetes része, tehát azuRn és vRn vektorok lineárisan függetlenek. Bizonyítás: Mivel λ és különböző sajátértékek, ezért a hozzájuk tartozó s és s vektorok lineárisan függetlenek. Mivel s = u + ivtovábbá s = u – iv ezért igaz, hogy
u
s s s s ; és v ; 2 2i
Láttuk, hogy két vektor lineáris összefüggősége egyenértékű azzal, hogy az egyik vektor konstansszorosa a másiknak. Ebből már következik az állítás, hiszen látható, hogy az u és v vektorokra ez nem igaz, egyik nem számszorosa a másiknak, tehát függetlenek. ■ Foglaljuk tehát össze milyen lehetőségeink vannak a sajátértékek számát és algebrai illetve geometriai multiplicitását illetően. Tegyük fel, hogy ARn×n. 1. eset: Az A mátrixnak n db különböző sajátértéke van. Ekkor tudjuk, hogy minden egyes sajátértékhez tartozik egy sajátvektor, és ezek lineárisan függetlenek. Ebben az esetben tehát van n db lineárisan független sajátvektor. Minden sajátérték algebrai és geometriai multiplicitása egyaránt 1. 2. eset: Az A mátrixnak vannak olyan sajátértékei, amelyeknek az algebrai multiplicitása nagyobb mint 1, azaz van többszörös sajátérték, tehát a különböző sajátértékek száma kisebb, mint n. Ekkor két eset fordulhat elő. a) A sajátérték algebrai multiplicitása megegyezik a geometriai multiplicitásával. Ez azt jelenti, hogy ekkor egyetlen sajátértékhez több lineárisan független sajátvektort is rendelhetünk, és a többszörös sajátértékhez tartozó sajátaltér dimenziója megegyezik a sajátérték algebrai multiplicitásával. Ebben az esetben is meg tudunk adni n db lineárisan független sajátvektort. b)A sajátérték algebrai multiplicitása kisebb, mint a geometriai multiplicitás. Ez azt jelenti, hogy ekkor egyetlen sajátértékhez kevesebb lineárisan független sajátvektor tartozik, mint a sajátérték multiplicitása. A többszörös sajátértékhez tartozó sajátaltér dimenziója tehát kisebb a sajátérték algebrai multiplicitásánál. Ebben az esetben nem létezik n db lineárisan független sajátvektor. A képet színesíti, hogy a sajátértékek és sajátvektorok lehetnek komplexek is. A továbbiakban minden említett esetre mutatunk példát. 99
Óbudai Egyetem BGK
Fejezetek a matematikából
1.48.Példa: Határozzuk meg az alábbi mátrix sajátértékeit és sajátvektorait.
5 1 A ; 3 3 A karakterisztikus mátrix
1 5 1 1 0 5 A E ; 3 3 3 0 1 3 A karakterisztikus polinom a
1 5 k det A E det 5 3 3 2 8 12 3 3 másodfokú polinom. A karakterisztikus egyenlet tehát a következő
det(A E) 5 3 3 2 8 12 0 A megoldóképlettel kapjuk a megoldásokat: λ1 = 2, λ2 = 6 a két sajátérték. A sajátértékek ismeretében meghatározhatjuk a sajátvektorokat. Ehhez az
1 s1 0 5 ; 3 3 s2 0 egyenletrendszert kell megoldani mindkét λ esetén. 1.eset: λ1 = 2. Ekkor az egyenletrendszer a következő
1 s1 3 1 s1 0 5 2 ; 3 3 2 s2 3 1 s2 0 látszik, hogy a mátrix valóban szinguláris, a két sora megegyezik, tehát rangja 1. Koordinátánként írva mindkét egyenlet ugyanaz, 3s1 s2 0, azaz s2 3s1 .Tehát az s1 sajátvektor a következő
t 1 s1 , t R \ 0 ; például s1 ; 3t 3 2.eset: λ2 = 6. Ekkor az egyenletrendszer az alábbi
100
Óbudai Egyetem BGK
Fejezetek a matematikából 1 s1 1 1 s1 0 5 6 ; 3 3 6 s2 3 3 s2 0
Ismét látszik, hogy a kapott mátrix szinguláris, mert a második sor az első sor számszorosa, a sorvektorok lineárisan összefüggenek, tehát a reng 1. Koordinátánként írva, egy állandó szorzótól eltekintve, mindkét egyenlet ugyanaz, s1 s2 0, azaz s2 s1 .Tehát az s2 sajátvektor a következő
t 1 s2 , t R \ 0 ; például s 2 ; t 1 Ebben a példában kaptuk tehát, hogy a sajátértékek egyszeres algebrai multiplicitásúak, továbbá a geometriai multiplicitásuk is 1, a sajátalterek egy dimenziósak. Az s1 és s2 sajátvektorok lineárisan függetlenek. 1.49.Példa: Határozzuk meg az alábbi mátrix sajátértékeit és sajátvektorait.
5 3 A ; 3 1 A karakterisztikus mátrix
3 5 3 1 0 5 A E ; 3 1 0 1 3 1 A karakterisztikus polinom a
3 5 2 k det A E det 5 1 9 4 4 3 1 másodfokú polinom. A karakterisztikus egyenlet tehát a következő
det(A E) 2 4 4 2 0 2
Azt kapjuk hogy egyetlen kétszeres gyök van, λ = 2 az egyetlen sajátérték. Az algebrai multiplicitás tehát 2, kérdés, hogy mennyi a geometriai multiplicitás, mennyi a lineárisan független sajátvektorok száma, azaz a sajátaltér dimenziója. A sajátérték ismeretében meghatározhatjuk a sajátvektorokat. Ehhez az
3 s1 0 5 3 1 s 0 ; 2 101
Óbudai Egyetem BGK
Fejezetek a matematikából
egyenletrendszert kell megoldani a kapott egyetlen λ esetén. λ1 = 2 helyettesítésével az egyenletrendszer a következő
3 s1 3 3 s1 0 5 2 3 1 2 s 3 3 s 0 ; 2 2 látszik, hogy a mátrix valóban szinguláris, egyik sora a másik sor ellentettje, tehát rangja 1. Mivel két ismeretlen van és a rang 1, a szabadságfok is 1. Ez azt jelenti, hogy a sajátaltér egy dimenziós. Koordinátánként írva a rendszert, mindkét egyenlet ugyanazt az összefüggést adja, 3s1 3s2 0, azaz s2 s1 . Tehát az egyetlen lineárisan független s sajátvektor a következő
t 1 s , t R \ 0 ; például s ; t 1 és több független sajátvektor nem létezik. Ebben a példában kaptuk tehát, hogy a sajátérték algebrai multiplicitása 2, továbbá a geometriai multiplicitásacsak 1, a sajátaltér egy dimenziós. Az saz egyetlen lineárisan független sajátvektor. 1.50.Példa: Határozzuk meg az alábbi mátrix sajátértékeit és sajátvektorait.
1 2 A ; 1 3 A karakterisztikus mátrix
2 1 2 1 0 1 A E ; 1 3 0 1 1 3 A karakterisztikus polinom a
2 1 k det A E det 1 3 2 2 4 5; 1 3 másodfokú polinom. A karakterisztikus egyenlet tehát a következő det(A E) 2 4 5 0;
A megoldóképlettel kapjuk a megoldásokat: λ = λ1 = 2 + i, = λ2 = 2 – i a két konjugált komplex sajátérték. A sajátértékek ismeretében meghatározhatjuk a sajátvektorokat. A korábbiak szerint elég csak az egyik sajátvektort meghatározni, a másik sajátvektor ennek konjugáltja lesz. Ehhez az
102
Óbudai Egyetem BGK
Fejezetek a matematikából 2 s1 0 1 1 3 s 0 ; 2
egyenletrendszert kell megoldani λ = 2 + i esetén. Az egyenletrendszer konkrétan a következő
2 s1 1 i 2 s1 0 1 2 i ; 1 3 2 i s2 1 1 i s2 0 Látszik, hogy a mátrix valóban szinguláris, az első sor a második sor (1 + i)-szerese, tehát rangja 1, a rendszerből ezért például az első egyenlet elhagyható. A második egyenletetmegtartva azt kapjuk, hogy s1 1 i s2 0, azaz 1 i s2 s1 . Tehát az s sajátvektor a következő
1 i t 1 i 1 1 s1 s u iv i ; , t R \ 0 ; például s 1 1 0 t A másik, = λ2 = 2 – i sajátértékhez tartozó sajátvektor ebből azonnal felírható
1 i t 1 i 1 1 s2 s u iv i ; , t R \ 0 ; például s 1 1 0 t Kaptuk tehát a következőt. Az A mátrixnak két konjugált komplex sajátértéke van. Ehhez tartozik két konjugált komplex sajátvektor. Mindkét sajátérték algebrai és geometriai multiplicitása 1. A későbbiek kedvéért kiemeljük, hogy a komplex sajátvektorok valós és képzetes része, tehát az
1 1 u és v 1 0 vektorok lineárisan független vektorrendszert alkotnak, hiszen nem párhuzamosak. Ezt általánosan is igazoltuk, azonban ebben a konkrét esetben jól látható tulajdonság. A kidolgozott példák után célszerű 2×2-es mátrix esetében általánosan is megvizsgálni a sajátérték problémát. Legyen tehát
a b A ; c d és határozzuk meg ezen paraméterekkel a sajátértékeket. A karakterisztikus egyenlet a következő
b a det A E det a d bc 0; d c
103
Óbudai Egyetem BGK
Fejezetek a matematikából
Vizsgáljuk kicsit részletesebben a kapott másodfokú egyenletet. Rendezve a λ ismeretlen hatványai szerint, azt kapjuk, hogy
2 a d ad bc 0; Itt két dolgot kell észrevenni. Egyrészt a konstans tag az A mátrix determinánsa, másrészt az elsőfokú tag együtthatója a mátrix nyomának (a főátlóbeli elemek összege) ellentettje. Tehát a másodrendű esetben a karakterisztikus egyenlet a következő
k 2 trA det A 0; Idézzük most fel a másodfokú egyenlet gyökei és együtthatói közti összefüggéseket. Ha a karakterisztikus polinom gyöktényezős alakja k 1 2 ;
akkor az említett összefüggésekből adódik, hogy a gyökök összege illetve szorzatára igaz a következő. 1.51.Tétel: Másodrendű mátrix esetén a sajátértékek összege a mátrix nyoma, a sajátértékek szorzata a mátrix determinánsa. Azaz
1 2 trA a d ; 1 2 det A ad bc; Bizonyítás: Az idézett Viéte-formulák szerint az x2 px q 0 egyenlet x1 és x2 gyökére igaz, hogy x1 x2 p; x1 x2 q . A fenti jelöléseket figyelembe véve éppen ezt kellett igazolni. ■ 1.51.Példa: Gondoljuk át, hogy az előző három példában teljesül ez a két egyenlőség. Az 1.48. példában
5 1 A ; 3 3 és láttuk, hogy λ1 = 2, λ2 = 6. A sajátértékek összege λ1 + λ2 = 2 + 6 = 8 valóban a mátrix nyoma, mert trA = 5 + 3 = 8. Másrészt a sajátértékek szorzata λ1· λ2 = 2 · 6 = 12 valóban a mátrix determinánsa, mert detA = 5·3 – 3·1 = 15 – 3 = 12. A tisztelt Olvasóra bízzuk, hogy a másik két példában is ellenőrizze ezen összefüggéseket. Ez az állítás könnyen általánosítható n-ed rendű mátrixra.
104
Óbudai Egyetem BGK
Fejezetek a matematikából
1.52.Tétel: Ha az ARn×n mátrixsajátértékei λ1, λ2, …, λn, akkor a sajátértékek összege a mátrix nyoma, a sajátértékek szorzata pedig a mátrix determinánsa, azaz
1 2 ... n trA; 1 2 ... n detA; Bizonyítás: Az A mátrix karakterisztikus polinomjának gyöktényezős alakja
det A E 1 1 2 ... n ; n
Ha ebben az egyenletben λ = 0-t helyettesítünk, azt kapjuk, hogy
det A det A 0E 1 1 2 ... n 1 1 2 ... n 1 2 ... n ; n
2n
A determinánsra vonatkozó állítást ezzel igazoltuk. Mellesleg megjegyezzük, hogy a determináns nyilvánvalóan a karakterisztikus polinom konstans tagja. A nyomra vonatkozó állítás a következőképpen adódik. Egyrészt a gyöktényezős alakból adódik, hogy (–1)nλn–1 együtthatója éppen a sajátértékek összegének ellentettje. Másrészt, ha kifejtjük az
a12 a11 a a22 21 ... ... an 2 an1
... a1n ... a2 n ... ... ... ann
karakterisztikus mátrix determinánsát, más szóval meghatározzuk a k(λ) karakterisztikus polinomot, akkor a k a11 a22 ... ann kn2 ; alakot kapjuk, ahol a kn–2(λ) jelölés arra utal, hogy a determináns kifejtése során a főátló elemeinek szorzása után egy legfeljebb n – 2-ed fokú polinomot kaphatunk, azaz a fenti összeg második tagjában a λ legfeljebb n – 2 hatványkitevőn szerepelhet. Ez azért igaz, mert ha a főátlóban nem szereplő elemhez tartozó előjeles aldeterminást számítjuk, akkor ez utóbbi definíciója szerint el kell hagynunk a mátrixból az elem sorát és oszlopát. Mivel ez az elem nem szerepel a főátlóban, elhagyunk a mátrixból két olyan tagot, amely aii– λ alakú, egyet a sor egyet pedig az oszlop elhagyásával, tehát ezen aldeterminánsok kifejtésében valóban csak n – 2 db aii– λ alakú tényező szerepel. Ebből pedig az következik, hogy λn–1 alakú hatvány csak a k(λ) felírásában szereplő első tag, tehát az n-tényezős szorzat felbontásával adódik. Ebben pedig a λn–1 hatvány együtthatója nyilván (–1)n–1(a11 + a22 + … + ann). A két eredmény összevetéséből a
1 1 2 ... n 1 n
n1
a11 a22 ... ann ;
egyenlőség adódik, ez pedig éppen a bizonyítandó állítás. ■ 105
azaz 1 2 ... n tr A
Óbudai Egyetem BGK
Fejezetek a matematikából
Következményként adódik egy fontos kapcsolat a sajátértékek és a mátrix regularitása illetve szingularitása között. 1.53.Tétel: Az n-ed rendű A mátrix pontosan akkor szinguláris, ha a 0 valós szám sajátértéke. Bizonyítás: Egy mátrix pontosan akkor szinguláris, ha determinánsa zérus. Az előző állítás szerint a determináns egyenlő a sajátértékek szorzatával, azaz
1 2 ... n detA Ebből már következik, hogy a determináns pontosan akkor zérus, ha legalább egy sajátérték zérus. ■ 1.52.Példa: Határozzuk meg az alábbi harmadrendű mátrix sajátértékeit és sajátvektorait. 2 1 1 A 1 2 1 ; 1 1 2
Azonnal felírhatjuk a karakterisztikus egyenletet. 2 1 det A E 1 2 1
1
1 1 1 2 3 0; 2
Ennek gyökei, tehát a sajátértékek a következők 1 1, 2 2, 3 3 . Meghatározzuk mindhárom sajátértékhez tartozó sajátvektort. Ehhez az alábbi homogén lineáris egyenletrendszereket kell megoldani. 1 s1 0 2 1 1 1 1: 1 2 1 1 s2 0 ; azaz 1 1 2 1 s3 0
1 1 1 s1 0 1 1 1 s 0 ; 2 1 1 1 s3 0
Világos, hogy az együtthatómátrix szinguláris, hiszen a 3. sor ugyanaz mint az 1 sor. Az 1. és 2. sor viszont lineárisan független, hiszen ezek két sor nem egymás számszorosa, tehát az együtthatómátrix rangja 2. Ezért s = k – ρ = 3 – 2 = 1 a szabadságfok, egy ismeretlen választható szabadon. Legyen például s3 = t. Ekkor a harmadik egyenlet elhagyásával adódó redukált egyenletrendszer a következő
s1 s2 t 0; s 0; azaz 1 t R \ 0 ; s1 s2 t 0; s2 t ; tehát a megfelelő sajátvektor az alábbi 106
Óbudai Egyetem BGK
Fejezetek a matematikából 0 0 s1 t ; t R \ 0 ; például s1 1 ; t 1
Hasonlóan adódnak a többi sajátértékhez tarozó sajátvektorok. 1 s1 0 2 2 1 2 2 : 1 2 2 1 s2 0 ; azaz 1 1 2 2 s3 0
0 1 1 s1 0 1 0 1 s 0 ; 2 1 1 0 s3 0
Az együtthatómátrix ebben az esetben is szinguláris, hiszen a 3. sor az 1. és 2. sor összege, viszont az első két sor lineárisan független, tehát a rang ismét 2. A szabadságfok pedig ugyancsak 1. Legyen ismét s3 = t. Ekkor ugyancsak a harmadik egyenlet elhagyásával adódó redukált egyenletrendszer a következő
s2 t 0; s t; azaz 1 t R \ 0 ; s1 t 0; s2 t ; adódik tehát, hogy a sajátvektor t 1 s 2 t ; t R \ 0 ; például s 2 1 ; t 1
Végül a harmadik sajátérték esetében 1 s1 0 2 3 1 3 3 : 1 2 3 1 s2 0 ; azaz 1 1 2 3 s3 0
1 1 1 s1 0 1 1 1 s 0 ; 2 1 1 1 s3 0
A kapott mátrix szinguláris, mert a 2. és 3. sor megegyezik. Az első két sorvektor azonban független, hiszen egyik a másiknak nem konstans szorosa, így a mátrix rangja 2, tehát a szabadságfok 1. Válasszuk ismét az s3 ismeretlent szabad ismeretlennek, így kapjuk, hogy a független egyenletek a következők
s1 s2 t 0; s 0; azaz 2 t R \ 0 ; s1 s2 t 0; s1 t; amelyből a harmadik sajátvektor
107
Óbudai Egyetem BGK
Fejezetek a matematikából t 1 s3 0 ; t R \ 0 ; például s3 0 ; t 1
Bár általánosan bebizonyítottuk, ebben a speciális esetben is könnyen látható, hogy a kapott sajátvektorok lineárisan függetlenek, hiszen ezekből, mint oszlopvektorokból képezett mátrix determinánsa nem nulla. Valóban 0 1 1 0 0 1 1 1 0 1 1 0 1 0; 1 1 1
1 0 1
Ebben a példában tehát három egyszeres algebrai multiplicitású valós sajátértéket kaptunk, amely mindegyikéhez tartozik egy egydimenziós sajátaltér, tehát minden sajátérték geometriai multiplicitása is egy. Ellenőrizzük továbbá, hogy a sajátértékek összege valóban a mátrix nyoma valamint azt, hogy a sajátértékek szorzata valóban a mátrix determinánsa. Egyrészt
1 2 3 1 2 3 6 2 2 2 tr A ; másrészt 2 1 1 0 det A 1 2 1 3 1 1
2
0 1 3 1 1 1 3 3 6 1 2 3 1 2 3 ; 3 1 3 1 2
Valóban igaz. 1.53.Példa: Határozzuk meg az alábbi harmadrendű mátrix sajátértékeit és sajátvektorait. 2 1 0 A 1 3 1 ; 1 2 3
A karakterisztikus egyenletet a következő 2 1 det A E 1 3 1
2
0 1 2 2 6 10 0; 3
108
Óbudai Egyetem BGK
Fejezetek a matematikából
Itt a második tényező, tehát a másodfokú polinom nem bontható fel valós együtthatójú elsőfokú tényezők szorzatára, hiszen a diszkriminánsa negatív. Ezért az egyenlet gyökei, tehát a sajátértékek a következők 1 2, 2,3 3 i . Tehát egy valós és két konjugált komplex sajátérték adódott. Határozzuk meg a sajátvektorokat. A sajátérték egyenlet az első esetben 1 0 s1 0 2 2 1 2 : 1 3 2 1 s2 0 ; azaz 1 2 3 2 s3 0
0 1 0 s1 0 1 1 1 s 0 ; 2 1 2 1 s3 0
A kapott mátrix azért szinguláris, mert ha az első sor háromszorosából kivonjuk a 2. sort, éppen a 3. sort kapjuk, viszont az első két sor lineárisan független. Tehát a mátrix rangja 2 és elhagyhatjuk a 3. egyenletet. A szabadságfok k – ρ = 3 – 2 = 1. Ismét az s3 ismeretlent tekintve szabad változónak a redukált rendszer a következő
s2 0; s 0; azaz 2 t R \ 0 ; s1 s2 t 0; s1 t ; ahonnan a λ1 = 2 sajátértékhez tartozó sajátvektor a következő t 1 s1 0 ; t R \ 0 ; például s1 0 ; t 1
Következzenek a komplex sajátértékek. Tudjuk, hogy számolni csak az egyikkel szükséges. 1 0 s1 0 2 3 i 2 3 i : 1 33i 1 s2 0 ; azaz 1 2 3 3 i s3 0
1 i 1 0 s1 0 1 i 1 s2 0 ; 1 2 i s3 0
Könnyen látható, hogy ha az 1. sorhoz hozzáadjuk a 2. sor i-szeresét, a 3. sort kapjuk. A sorvektorok tehát lineárisan összefüggenek, a mátrix szinguláris. Az első két sor azonban független, mert egyik sor a másiknak nem konstansszorosa. A rang így ρ = 2, tehát a szabadságfok ismét s = k – ρ = 1, ami azt jelenti, hogy a sajátaltér egy dimenziós. A sajátvektort megkapjuk, ha például az 1. egyenlet elhagyásával adódó redukált rendszert megoldjuk. Legyen ismét s3 = t, ekkor kapjuk, hogy
s1 is2 t 0; 5s 2 i t ; azaz 1 t R \ 0 ; s1 2s2 it 0; 5s2 1 3i t; Tehát a λ2 = 3 + i sajátértékhez tartozó sajátvektor a következő
109
Óbudai Egyetem BGK
Fejezetek a matematikából
2i 5 t 2i 2 1 1 3i s2 t ; t R \ 0 ; például s 2 1 3i u iv 1 i 3 ; 5 5 5 0 t
Ennek a sajátvektornak a komplex konjugáltja a λ3 = 3 – i sajátértékhez tartozó sajátvektor 2i 5 t 2i 2 1 1 3i s3 t ; t R \ 0 ; például s3 1 3i u iv 1 i 3 ; 5 5 5 0 t
megkaptuk tehát a sajátértékeket és a sajátvektorokat. Ebben a példában tehát a mátrixnak három egyszeres algebrai multiplicitású sajátértéke van, amelyek között két sajátérték komplex, és mindegyik sajátérték geometriai multiplicitása is egy, minden sajátaltér egy dimenziós. Most rátérünk a többszörös gyökök vizsgálatára. 1.54.Példa: Határozzuk meg az alábbi harmadrendű mátrix sajátértékeit és sajátvektorait. 3 2 1 A 3 4 3 ; 2 4 0
A karakterisztikus egyenletet a következő 3 2 det A E 3 4 2
4
1 2 3 5 2 0;
A gyökök 1 5, 2,3 2 . Tehát két valós sajátérték van, a λ1 = –5 sajátérték algebrai multiplicitása 1, a λ2,3 = 2 sajátérték algebrai multiplicitása 2. Kérdés, hogy mennyi a sajátalterek dimenziója. Ehhez meghatározzuk a sajátvektorokat. A sajátérték egyenlet λ1 = –5 esetben 2 1 s1 0 3 5 1 5 : 3 4 5 3 s2 0 ; azaz 2 4 5 s3 0
110
8 2 1 s1 0 3 1 3 s 0 ; 2 2 4 5 s3 0
Óbudai Egyetem BGK
Fejezetek a matematikából
Könnyen ellenőrizhető, hogy a 2. sor kétszeresének és a 3. sornak az összege az 1. sor, de a 2. és 3. sor függetlenek, tehát, a mátrix szinguláris, rangja 2. Ebből következik, hogy az egyenletrendszer szabadságfoka ismét 1. Legyen s3 = t, ekkor az 1. egyenlet elhagyásával kapjuk, hogy
3s1 s2 3t 0; 2s t; azaz 1 t R \ 0 ; 2s1 4s2 5t 0; 2s2 3t; ahonnan λ1 = –5 sajátértékhez tartozó sajátvektor t 2 1 3t s1 ; t R \ 0 ; például s1 3 ; 2 t 2
Vizsgáljuk meg a kétszeres algebrai multiplicitású sajátérték esetét. A sajátérték egyenlet 2 1 s1 0 3 2 1 2 : 3 4 2 3 s2 0 ; azaz 2 4 2 s3 0
1 2 1 s1 0 3 6 3 s 0 ; 2 2 4 2 s3 0
Azt kaptuk, hogy a mátrix 2. sora az 1. sor 3-szorosa, a 3. sor pedig az 1. sor kétszerese. Tehát a mátrix rangja csak 1. Ebből következik, hogy a rendszer s szabadságfoka s = k – ρ = 3 – 1 = 2, tehát a sajátaltér két dimenziós, két lineárisan független sajátvektor feszíti ki az alteret. Ha a három egyenletből megtartjuk az 1. egyenletet, akkor azt kapjuk, hogy
s1 2s2 s3 0; Legyenek a szabad ismeretlenek s2 = u, s3 = v. Ekkor a kötött ismeretlen s1 2u v, u, v R , azaz a sajátvektorok a következő formulával adottak 2u v 2 1 2 1 s u u 1 v 0 ; u, v R \ 0 ; például s 2 1 ; s3 0 v 0 1 0 1
kaptunk tehát két lineárisan független sajátvektort, amelyek mindketten a λ = 2 sajátértékhez tartoznak. Ezt ellenőrizhetjük is
111
Óbudai Egyetem BGK
Fejezetek a matematikából
3 2 1 2 4 2 3 4 3 1 2 2 1 ; másrészt 2 4 0 0 0 0
3 2 1 1 2 1 3 4 3 0 0 2 0 ; 2 4 0 1 2 1
valóban sajátvektorok. a lineáris függetlenség pedig abból látszik, hogy a két vektor nem párhuzamos, egyik sem konstansszorosa a másiknak. Ebben a példában tehát azt láttuk, hogy a mátrixnak van egy egyszeres algebrai multiplicitású sajátértéke és ennek a geometriai multiplicitása is 1, tehát a hozzá tartozó sajátaltér egy dimenziós, ezen kívül van egy kétszeres algebrai multiplicitású sajátértéke és az ehhez tartozó sajátaltér is két dimenziós, tartozik hozzá két lineárisan független sajátvektor, tehát a sajátérték geometriai multiplicitása is kettő. A helyzet azonban általában nem olyan impozáns, mint ahogyan az, az eddigi példák alapján látszik. Előfordul, hogy nincs annyi független sajátérték, mint a mátrix rendje. 1.55.Példa: Határozzuk meg az alábbi harmadrendű mátrix sajátértékeit és sajátvektorait. 1 1 1 A 1 1 1 ; 0 1 2
A karakterisztikus egyenletet a következő 1 1 det A E 1 1 0
1
1 2 1 2 1 0; 2
A gyökök 1 2, 2,3 1 . Tehát két valós sajátérték van, a λ1 = 2 sajátérték algebrai multiplicitása 1, a λ2,3 = 1 sajátérték algebrai multiplicitása 2. Kérdés, hogy mennyi a sajátalterek dimenziója. Ehhez meghatározzuk a sajátvektorokat. A sajátvektort meghatározó egyenlet λ1 = 2 esetben 1 s1 0 1 2 1 1 2 : 1 1 2 1 s2 0 ; azaz 0 1 2 2 s3 0
1 1 1 s1 0 1 1 1 s 0 ; 2 0 1 0 s3 0
Világos, hogy az 1. és 2. sorvektorok összege a 3. sorvektor kétszerese, tehát a sorvektorok lineárisan összefüggenek, de az első két sor független, tehát a mátrix rangja 2. Ebből következően a szabadsági fok s = k – ρ = 3 – 2 = 1. Tartsuk meg az 1. és 3. egyenletet. Ekkor s3 = t választással adódik, hogy
112
Óbudai Egyetem BGK
Fejezetek a matematikából s1 s2 t 0; s 0; azaz 2 t R \ 0 ; s2 0; s1 t;
A λ1 = 2 sajátértékhez tartozó sajátvektor tehát t 1 s1 0 ; t R \ 0 ; például s1 0 ; t 1
Térjünk át a kétszeres sajátérték vizsgálatára. A sajátvektort meghatározó homogén lineáris rendszer a következő
2,3
1 s1 0 1 1 1 1: 1 1 1 1 s2 0 ; azaz 0 1 2 1 s3 0
0 1 1 s1 0 1 0 1 s 0 ; 2 0 1 1 s3 0
A mátrix 1. és 3. sora megegyezik, de az 1. és 2. sor lineárisan független, tehát a mátrix rangja 2. A szabadságfok tehát ismét csak s = k – ρ = 3 – 2 = 1. tehát annak ellenére, hogy a sajátérték algebrai multiplicitása 2, a sajátaltér dimenziója csak 1, tehát nem tudunk megadni egynél több lineárisan független sajátvektor. A 3. egyenlet elhagyásával és s3 = t választással adódik, hogy
s2 t 0; s t; azaz 1 t R \ 0 ; s1 t 0; s2 t ; A λ2,3 = 1 sajátértékhez tartozó sajátvektor tehát t 1 s 2 t ; t R \ 0 ; például s 2 1 ; t 1
Ebben a példában tehát azt láttuk, hogy a λ = 1 sajátérték algebrai multiplicitása szigorúan nagyobb, mint a geometriai multiplicitása, a lineárisan független sajátvektorok száma kisebb, mint a mátrix rendje. Mivel a geometriai multiplicitás nagyobb nem lehet, mint az algebrai multiplicitás, minden lehetséges esetre mutattunk példát. A sajátértékek elméletét a 2.3 fejezetben jelentős mértékben kiegészítjük, amikor differenciálegyenlet rendszerek megoldásának lehetőségeit vizsgáljuk. A jelzett pontban értelmezzük majd az általánosított sajátvektor fogalmát.
113
Óbudai Egyetem BGK
Fejezetek a matematikából
1.12. Kvadratikus mátrixok hatványozása Kvadratikus mátrixok esetén értelmezzük mátrix pozitív egész kitevőjű hatványait. 1.48.Definíció: Ha n ≥ 2, és ARn×nakkor legyen az A mátrix n-edik hatványa a következő.
An A A ... A ahol a jobb oldalon egy n-tényezős szorzat áll. Ha azt szeretnénk, hogy a hatványozás azonosságai érvényben maradjanak, akkor természetesen értelmezhetjük a 0 kitevőjű és az 1 kitevőjű mátrixhatványt is a következő módon: A0 E, A1 A , ahol E természetesen az n-ed rendű egységmátrix. Eszerint A2 = AA, A3 = A2A, … stb. Az világos, hogy ez a szorzás tetszőleges négyzetes mátrix és tetszőleges egész kitevő esetén értelmezett, hiszen minden szóba kerülő mátrix n-ed rendű négyzetes mátrix. 1.56.Példa: Számítsuk ki az alábbiA és B mátrix harmadik hatványát. 1 2 3 1 2 A ; B 3 0 4 ; 2 3 1 3 2
A mátrixok hatványai–az Olvasó ellenőrizheti a Falk-séma alkalmazásával – rendre a következők.
1 0 1 1 A0 ; A 2 0 1 3 A3 8 1 0 0 1 1 B 0 1 0 ; B 3 0 0 1 1 4 3 B 7 12 0
2 2 1 2 1 2 3 8 ;A ; 3 2 3 2 3 8 5 8 1 2 19 18 ; 5 2 3 18 1
2 3 1 2 0 4 ; B 3 1 3 2 7 1 1 2 18 1 3 0 8 13 1 3
2 3 1 2 3 4 7 1 0 4 3 0 4 7 18 1 ; 3 2 1 3 2 12 8 13 3 18 5 42 4 60 11 49 ; 2 49 63 22
Felhívjuk a figyelmet arra, hogy a 3. hatvány kiszámításához ismerni kell a 2. hatványt. Ezzel a példával egy esetleges súlyos hiba lehetőségét szeretnénk kiküszöbölni. Egy mátrix hatványa általában nem egyenlő a mátrix komponenseinek hatványozásával kapott mátrixszal. Ez 114
Óbudai Egyetem BGK
Fejezetek a matematikából
csak egy speciális esetben igaz, csak akkor ha a mátrix diagonális. Ezt megfogalmazzuk egy állítás formájában. 1.54.Tétel: Egy diagonális mátrix n-edik hatványát úgy kapjuk, hogy a diagonálisban álló elemeket n-edi hatványra emeljük, a nullák pedig változatlanul maradnak. Azaz n n a11 0 0 n .. 0 0 a22 .. .. .. .. .. akk 0 0
a11 0 0 a 22 .. .. 0 0
..
0 .. 0 ; .. .. n .. akk ..
Bizonyítás: A bizonyítás a mátrix szorzásának definíciójából azonnal adódik. Ha a második hatványt számítjuk, akkor sor-oszlop szorzással nyilvánvalóan adódik, hogy
a11 0 0 a 22 .. .. 0 0
2
0 a11 0 0 a .. 0 22 .. .. .. .. .. akk 0 0 ..
0 a11 0 .. 0 0 a22 .. .. .. .. .. akk 0 0 ..
2 0 a11 0 2 .. 0 0 a22 .. .. .. .. .. akk 0 0
..
0 .. 0 ; .. .. 2 .. akk ..
Ha harmadik hatványt számolunk, akkor felhasználhatjuk a kapott eredményt, és így tovább adódik a tétel minden n egész számra. ■ 1.57.Példa: Számítsuk ki a
1 0 0 2 D 0 0 0 0
0 0 3 0
0 0 ; 0 5
diagonális mátrix, második és ötödik hatványát. A tétel alapján adódik az eredmény.
1 0 D2 0 0
0 4 0 0
0 0 0 0 1 0 0 0 5 0 32 0 0 ;D ; 0 0 243 9 0 0 0 25 0 3125 0 0
Egy lényeges különbség szembeszökő. Ha diagonális mátrixot hatványozunk, az n-edik hatvány kiszámításához nincs szükség az n – 1-edik hatványismeretére, mint a korábbi példában, amikor nem diagonális mátrixot hatványoztunk. Levonhatjuk a következtetést, diagonális mátrixot „könnyű hatványozni”. A sajátértékek elméletének birtokában ezt a tényt 115
Óbudai Egyetem BGK
Fejezetek a matematikából
kihasználjuk majd arra, hogy egy egyszerű eljárást adjunk nem diagonális mátrixok hatványozására. Most vizsgáljuk meg, van-e valami kapcsolat egy négyzetes mátrix és hatványai sajátértékei és sajátvektorai között. 1.55.Tétel: Ha az An-ed rendű mátrix sajátértéke a λ, és a λ-hoz tartozó sajátvektor s, akkor tetszőleges nem negatív egész n esetén λn az An mátrix sajátértéke és ehhez ugyancsak az s sajátvektor tartozik. Bizonyítás: A feltétel szerint teljesül, hogy As = λs. Ebből következik, hogy A2s = Aλs = λAs = λλs= λ2s; Innen teljes indukcióval adódik, hogy ha n-re igaz az állítás, akkor An+1s = A Ans = Aλns =λnAs = λnλs= λn+1s; Az állítást igazoltuk. ■ Nem tekintjük az inverz mátrixot hatványnak, de formálisan ugyanolyan állítás igaz az inverzre mint az n-edik hatványra. 1.56.Tétel: Ha a reguláris A mátrix sajátértéke λ, és a λ-hoz tartozó sajátvektor s, akkor az A–1 1 inverz mátrix sajátértéke és ehhez ugyancsak az s sajátvektor tartozik. Bizonyítás: A feltétel szerint teljesül, hogy As = λs. Mivel A reguláris, létezik inverze. Szorozzuk meg ezt az egyenlőséget az inverz mátrixszal balról. Kapjuk, hogy A–1As = A–1λs, azazs =λA–1s; Mivel reguláris mátrixnak a 0 nem lehet sajátértéke, ezért a λ-val oszthatjuk az egyenletet. Ekkor az adódik, hogy
A 1s
1 s;
Ez pedig éppen a bizonyítandó összefüggés. ■ A hatványozás szempontjából különlegesen viselkednek azok a kvadratikus mátrixok, amelyek egy bizonyos kitevőjű hatvány a nullmátrix. 1.49.Definíció: Azt mondjuk, hogy az N mátrix nilpotens, ha létezik olyan n pozitív egész szám, melyre teljesül, hogyNn–1 ≠ 0és Nn = 0.
116
Óbudai Egyetem BGK
Fejezetek a matematikából
1.58.Példa: Mutassuk meg, hogy az alábbi mátrixok nilpotensek. 4 5 4 2 4 a) N ; b) M 3 3 3 ; 1 2 1 2 1
Valóban, számítással ellenőrizhető, hogy 3 3 3 0 0 0 0 0 2 3 N ; b) M 0 0 0 ; M 0 0 0 ; 0 0 3 3 3 0 0 0 2
Ez ugyanolyan meglepő tulajdonság, mint amit korábban már láttunk, hogy AB = 0 egyenlőségből nem következik az, hogy akár csak az egyik tényező a nullmátrix lenne. Ez hasonló, mert arról van szó, hogy egy nullától különböző mátrixot hatványozva előbb-utóbb a nullmátrixot kapjuk. Kérdés, hogy van-e valami kapcsolat a regularitás és ezen tulajdonság között. A választ a következő állítás jellemzi. 1.57.Tétel: Ha az N mátrix nilpotens, akkor minden sajátértéke zérus. Bizonyítás: Legyen s az N mátrix λ sajátértékhez tartozó sajátvektora. Ekkor igaz, hogy Ns = λs. Mivel az N nilpotens, létezik olyan n pozitív egész szám melyre teljesül, hogyNn–1 ≠ 0és Nn = 0. Szorozzuk meg az Ns = λs egyenlet mindkét oldalát balról az Nn–1 nem nulla mátrixszal. Ekkor a nilpotencia miatt 0 = 0s = Nns = Nn–1Ns =Nn–1 λs = λNn–1s; Mivel sajátvektor nem lehet nullvektor, továbbá a feltétel szerint Nn–1 ≠ 0, ezért a kapott szorzat csak akkor lehet nullvektor, ha λ = 0, azaz a sajátérték zérus. ■ A nilpotnes mátrixok ezen tulajdonsága lehetőséget ad egy további jellemzésre. Mivel a korábbiakból tudjuk, hogy a sajátértékek összege a mátrix nyoma, valamint a sajátértékek szorzata a mátrix determinánsa, ezért egy nilpotens mátrix determinánsa is zérus, továbbá a főátlóbeli elemek összeges is zérus. Igazoltuk korábban, hogy egy mátrix pontosan akkor szinguláris ha a 0 valós szám sajátértéke. Mivel a tétel szerint egy nilpotens mátrix minden sajátértéke zérus, egy nilpotens mátrix nem lehet reguláris, azaz reguláris mátrixszal nem fordulhat elő, hogy egy pozitív egész kitevőjű hatványa a nullmátrix. További érdekes kapcsolat van azonban a nilpotens mátrixok és a regularitás között. 1.58.Tétel: Ha N nilpotens, Nn–1 ≠ 0és Nn = 0, akkor E – N reguláris, és E– N inverze a következő formulával kapható. (E– N)–1 = E + N + N2 + … + Nn–1 ; 117
Óbudai Egyetem BGK
Fejezetek a matematikából
Bizonyítás: Végezzük el az alábbi szorzást. (E– N)(E + N + N2 + … + Nn–1) = E + N + N2 + … + Nn–1 – N2 – … – Nn–1 – Nn = E – Nn = E Ezzel az állítást igazoltuk. ■ Kvadratikus mátrixok hatványának értelmezése lehetőséget ad arra, hogy egy adott polinom esetén a helyettesítési értéket úgy számítsuk, hogy a határozatlan helyére egy kvadratikus mátrixot írunk. 1.50.Definíció: Legyen p( x) an xn an1x n1 ... a2 x 2 a1x a0 egy n-ed fokú polinom, és A egy kvadratikus mátrix. A p(x) polinom A mátrix-helyen vett helyettesítési értékén a következő mátrixot értjük.
p(A) an An an1An1 ... a2 A2 a1A a0E; ahol E az egységmátrix.
1 2 1.59.Példa: Számítsuk ki a p(x) = 3x2 – 5x + 2 polinom A mátrix helyen vett 3 4 5 10 helyettesítési értékét. Mivel A 2 ezért a helyettesítés a következő mátrixot adja. 15 10 5 10 1 2 1 0 18 20 p( A) a2 A2 a1A a0E 3 5 2 ; 15 10 3 4 0 1 30 12 Mátrixok és polinomok közötti kapcsolatra vonatkozó legalapvetőbb eredmény az alábbi tétel. 1.59.Tétel: (Cayley-Hamilton) Minden kvadratikus A mátrix kielégíti a karakterisztikus egyenletét, azaz a helyettesítési érték a nullmátrix. Tehát ha k(x) jelöli a karakterisztikus polinomot, akkor az állítás az, hogy k(A) = 0; Bizonyítás: Csak a másodrendű esetre végezzük el a bizonyítást, az általánosn-ed rendű eset iránt érdeklődőknek a szakirodalmat javasoljuk. a b Legyen tehát A a másodrendű mátrix. Már korábban felírtuk erre az általános c d másodrendű esetre a karakterisztikus polinom alakját. A határozatlant λ helyett x-szel jelölve ez a következő.
k x x2 a d x ad bc ; Végezzük el a mátrix helyettesítéséta polinomba. A 118
Óbudai Egyetem BGK
Fejezetek a matematikából
2
a b a b 1 0 k A a d ad bc c d c d 0 1 a 2 bc ab bd a 2 ad 2 ac cd bc d ac cd
ab bd ad bc 0 0 0 ; ad bc 0 0 ad d 2 0
egyenlőség nyilvánvalóan teljesül. ■ 1.60.Példa: Mutassuk meg, hogy az alábbi A mátrix kielégíti a karakterisztikus egyenletét. 1 1 1 A 1 1 1 ; 0 1 2
Egy korábbi példa szerint a karakterisztikus polinom a következő
k x det A xE x 2 x 1 x3 4 x 2 5x 2; 2
Helyettesítsük ebbe az A mátrixot. A következő adódik. 3
2
1 1 1 1 1 1 1 1 1 1 0 0 3 2 k A A 4A 5A 2E 1 1 1 4 1 1 1 5 1 1 1 2 0 1 0 ; 0 1 2 0 1 2 0 1 2 0 0 1 Ha elvégezzük a hatványozásokat akkor kapjuk az alábbi egyenlőséget. 3 7 11 0 3 4 1 1 1 1 0 0 0 0 0 k A 3 1 3 4 2 1 2 5 1 1 1 2 0 1 0 0 0 0 ; 4 7 12 1 3 5 0 1 2 0 0 1 0 0 0
Koordinátánként ellenőrizhető, hogy az egyenlőség valóban teljesül.
119
Óbudai Egyetem BGK
Fejezetek a matematikából
1.13. Speciális mátrixok tulajdonságai I. Háromszögmátrixok Nagyon egyszerű állítást fogalmazhatunk meg háromszögmátrixok sajátértékeire vonatkozólag. 1.60.Tétel: Egy háromszögmátrix sajátértékei megegyeznek a főátlóbeli komponensekkel, azaz λi = aii tetszőleges i = 1, 2, …, n esetén. Bizonyítás: Részletezzük a felső háromszögmátrix esetét, az alsó háromszögmátrixra vonatkozó bizonyítás nyilvánvaló módosítással ebből következik. Legyen tehát
a11 a12 0 a 22 U ... ... 0 0
... a1n ... a2 n ; ... ... ... ann
egy felső háromszögmátrix. Ennek a mátrixnak a karakterisztikus polinomja nyilván úgy adódik, hogy a karakterisztikus mátrix főátlóbeli elemeit összeszorozzuk, tehát a karakterisztikus egyenlet a következő
a12 a11 0 a22 det U E det ... ... 0 0
... a1n ... a2 n a11 a22 ... ann 0; ... ... ... ann
ugyanis a determináns kifejtésében szereplő n! számú tag között ez az egyetlen nullától különböző. Ebből az egyenletből pedig már következik az állítás, hiszen nyilvánvaló, hogy a gyökök éppen a főátló elemei. ■ 1.61.Példa: A bizonyított tétel szerint, az 1 1 1 A 0 3 1 ; 0 0 4
mátrix sajátértékei a következők: 1 1, 2 3, 3 4 . II. Szimmetrikus és ferdén szimmetrikus mátrixok Elsőként másodrendű mátrixokkal kapcsolatosan teszünk észrevételeket, amelyek általánosan is igazak, de a másodrendű esetben is célszerűnek tartjuk részletezni a bizonyítást.
120
Óbudai Egyetem BGK
Fejezetek a matematikából
1.61.Tétel: Egy másodrendű szimmetrikus mátrix sajátértékei valósak, egy másodrendű ferdén szimmetrikus mátrix sajátértékei tisztán imagináriusak. Bizonyítás: Mint láttuk, az
a b A ; c d mátrix karakterisztikus egyenlete a 2 a d ad bc 0 másodfokú egyenlet. Állítsuk elő ennek a gyökeit.
1,2
a d a d 2 4 ad bc a d 2
a d
a 2 2ad d 2 4ad 4bc 2
a 2 2ad d 2 4bc a d 2
a d 2 4bc 2
Ha a mátrix szimmetrikus, akkor értelmezés szerint b = c tehát a diszkrimináns
D a d 4b2 ; 2
nem negatív való szám, tehát az egyenletnek szükségképpen valós gyökei vannak. Ha a mátrix ferdén szimmetrikus, akkor definíció szerint a = d = 0 és c = –b, tehát a diszkrimináns D = –4b2, ahonnan a gyökök
1,2
4b2 ib 2
tisztán imagináriusak. ■ Természetesen a tétel csak elégséges feltétel és nem szükséges. A korábbiakban több olyan mátrixot is láttunk, amelyek nem szimmetrikusak, sajátértékeik mégis valósak. 1.62.Példa: Határozzuk meg az alábbi másodrendű szimmetrikus mátrix sajátértékeit és sajátvektorait.
4 2 A ; 2 1 Ellenőrizhető, hogy a két sajátérték, λ1 = 0 és λ2 = 5, tényleg valósak, a hozzájuk tartozó sajátvektorok pedig a következők.
121
Óbudai Egyetem BGK
Fejezetek a matematikából
t 1 2t 2 s1 , t R \ 0 ; például s1 ; s2 , t R \ 0 ; például s2 ; 2t 2 t 1 Két tényt kell hangsúlyoznunk. Egyrészt, hogy sajátérték lehet nulla. Sajátvektor definíció szerint nem lehet nullvektor, de sajátérték lehet zérus is. Másrészt pedig vegyük észre, hogy a kapott két sajátvektor ortogonális. Valóban
1 2 s1 , s2 , 2 2 0; 2 1 Ez abból adódik, hogy a mátrix szimmetrikus. Ez a szimmetrikus mátrixok általános tulajdonsága. Szimmetrikus mátrixok esetében az ortogonalitásra és a sajátértékek valós voltára vonatkozólag általános tételt igazolunk, de előtte bevezetünk néhány hasznos fogalmat. Igen gyümölcsöző következményei vannak, ha összekapcsoljuk a mátrixokat a skaláris szorzat fogalmával. Erre a kapcsolatra épülő vizsgálatok következnek az alábbiakban. Először megvilágítjuk a szimmetrikus mátrixok és a skaláris szorzat kapcsolatát. 1.62.Tétel: Az ARn×n mátrix pontosan akkor szimmetrikus, azaz pontosan akkor teljesül, hogy AT = A ha teljesül, hogy tetszőleges x, yRn esetén Ax, y x, Ay ;
Bizonyítás: Tegyük fel először, hogy AT = A. Ekkor a skaláris szorzat definíciója szerint igaz, hogy
egyrészt Ax, y Ax y xT AT y; másrészt x, Ay xT Ay xT Ay; T
innen az AT = A feltevésből az
Ax, y x, Ay egyenlőség már következik. Fordítva ha
feltesszük, hogy Ax, y x, Ay , akkor ebből az előbbi gondolatmenet megismétlésével az következik, hogy xT AT y xT Ay;
Kifejtve a bal és jobb oldalon álló háromtényezős szorzatokat, azt kapjuk, hogy egyrészt
xT Ay x1
x2
a11 a12 a a ... xn 21 22 ... ... an1 an 2
122
... a1n y1 ... a2 n y2 n n x a y ; ... ... ... i 1 j 1 i ij j ... ann yn
Óbudai Egyetem BGK
Fejezetek a matematikából
másrészt pedig
xT A T y x1
x2
a11 a ... xn 12 ... a1n
a21 a22 ... a2 n
... an1 y1 ... an 2 y2 n n x a y ; ... ... ... i 1 j 1 i ji j ... ann yn
A két szorzat pontosan akkor lehet egyenlő tetszőleges x, yRn esetén, ha minden i, j = 1, 2, …, n esetén teljesül, hogy aij = aji, azaz ha AT = A. ■ Felmerül a kérdés, hogy hogyan alakul a tételbeli egyenlőség az általános esetben, amikor nem szimmetrikus a mátrix. Erre ad választ az alábbi állítás. 1.63.Tétel: Tetszőleges n-ed rendű kvadratikus mátrix és tetszőleges x, yRn esetén teljesül, hogy Ax, y x, AT y ;
Bizonyítás: A skaláris szorzat definíciója szerint adódik, hogy egyrészt
Ax, y Ax y xT AT y; T
másrészt pedig a definíció alapján közvetlenül adódik, hogy x, AT y xT AT y;
A két skaláris szorzat valóban egyenlő. ■ A szimmetrikus mátrixokra igazolt tétellel analóg állítás fogalmazható meg ferdén szimmetrikus mátrixokra. 1.64.Tétel: Az ARn×n mátrix pontosan akkor ferdén szimmetrikus, azaz pontosan akkor teljesül, hogy AT = –A ha teljesül, hogy tetszőleges x, yRn esetén Ax, y x, Ay ;
Bizonyítás: Az állítás igazolása lényegében az előző gondolatmenet megismétlését igényli, azzal a különbséggel, hogy itt azaij = aji feltételt helyettesíteni kell az aij = – aji feltétellel, és máris kapjuk az állítást. ■ Ezek után igazolhatjuk a másodrendű esetre már bizonyított tételt az általános esetben.
123
Óbudai Egyetem BGK
Fejezetek a matematikából
1.65.Tétel: Egy szimmetrikus mátrix sajátértékei valós számok. Bizonyítás: Legyen tehát ARn×n szimmetrikus, azaz tegyük fel, hogy AT = A. Az előző tétel szerint ez ekvivalens az Ax, y x, Ay egyenlőség fennállásával, tetszőleges x és y esetén. Tegyük fel, hogy λ az A mátrix egy sajátértéke és s a hozzá tartozó sajátvektor. Ekkor egyrészt igaz, hogy As, s s, s s, s ;
másrészt a komplex skaláris szorzat tulajdonságai alapján az is igaz, hogy s, As s, s s, s ;
Mivel a feltétel szerint As, s s, As , a számításokból következik, hogy s, s s, s ; azaz ;
és éppen ezt kellett igazolni, mert egy komplex szám pontosan akkor egyezik meg a konjugáltjával, ha valós. ■ Az másodrendű esetben igazoltuk e tétel ferdén szimmetrikus mátrixokra vonatkozó párját. Ez is igaz általánosan. 1.66.Tétel: Egy ferdén szimmetrikus mátrix sajátértékei tiszta imaginárius számok. Bizonyítás: Az előző bizonyítás gondolatmenetén annyit kell változtatni, hogy figyelembe vesszük a (–1) szorzót, tehát adódik, hogy s, s s, s ; azaz s, s 0;
Mivel sajátvektor nem lehet nullvektor, s, s 0 tehát szükségképpen 0 azaz , ez pedig pontosan akkor igaz, ha λ tisztán imaginárius. ■ Egy korábbi példában láttuk, hogy egy szimmetrikus mátrix sajátvektorai ortogonálisak voltak. Ez a tulajdonság általánosan is igaz. 1.67.Tétel: Egy szimmetrikus mátrix különböző sajátértékeihez tartozó sajátvektorok ortogonálisak. Bizonyítás: Legyen A szimmetrikus azaz teljesüljön az Ax, y x, Ay egyenlőség, ezen kívül legyen λi és λj két különböző sajátérték és legyen si és sj rendre a két sajátértékhez tartozó sajátvektor. Ekkor, mivel a sajátértékek valósak, felhasználva a szimmetriát és a skaláris szorzás tulajdonságait írhatjuk, hogy i si , s j isi , s j Asi , s j si , As j si , j s j j si , s j ; i j;
124
Óbudai Egyetem BGK Ebből az következik, hogy
Fejezetek a matematikából
i j si , s j
0 . Mivel a feltétel szerint a sajátértékek
különbözőek, adódik, hogy si , s j 0 , ami egyenértékű az állítással. ■ Ellenőrizzük ezeket az eredményeket konkrét esetekben. 1.63.Példa: Határozzuk meg az alábbi szimmetrikus mátrix sajátértékeit és sajátvektorait. Igazoljuk a sajátvektorok ortogonalitását. 2 4 1 A 2 2 2 ; 4 2 1
A korábbiakban mutatott módszerekkel adódik, hogy a mátrix sajátértékei a következők: λ1 = 6 egyszeres sajátérték és λ2,3 = –3 kétszeres sajátérték. A kétszeres algebrai multiplicitású sajátérték geometriai multiplicitása is 2, így van három lineárisan független sajátvektor. Ezek rendre a következők. 2t 2 u 1 4v 4 s1 t , t 0, pl.: s1 1 ; s 2 2u , u 0, pl.: s 2 2 ; s3 2v , v 0, pl.: s3 2 ; 2t 2 0 0 5v 5
A sajátértékek valóban mind valós számok. A sajátvektorok pedig valóban páronként ortogonálisak, ugyanis könnyen látható, hogy teljesülnek az s1, s2 s1, s3 s2 , s3 0 egyenlőségek. 1.64.Példa: Határozzuk meg az alábbi ferdén szimmetrikus mátrix sajátértékeit és sajátvektorait.
0 2 A ; 2 0 Egyszerű számítással adódik, hogy a sajátértékek a λ1,2 = ± 2i konjugált komplex, ám valóban tisztán imaginárius számok. A sajátvektorok pedig rendre a következők.
it i iu i s1 , t 0, pl.: s1 ; s2 , u 0, pl.: s2 ; t 1 u 1
125
Óbudai Egyetem BGK
Fejezetek a matematikából
III. Ortogonális mátrixok A skaláris szorzat felhasználásával definiálhatjuk mátrixok egy nagyon fontos osztályát. Definíció: A QRn×n kvadratikus mátrixot ortogonálisnak nevezzük, ha oszlopvektorai páronként ortogonálisak és minden oszlopvektor saját magával képezett skaláris szorzata 1, azaz minden oszlopvektor egységvektor.Tehát haqiRn jelöli a Q mátrix i-edik oszlopvektorát, vagyis a Q mátrix a Q q1 q2 ... qn ;
alakban írható, ahol teljesül, hogy qi Tq j 0 ha i j és qi Tqi 1, i 1, 2,..., n . Ezt a tulajdonságot a következő módon is szokás írni.
1 ha i j; qi Tq j ij 0 ha i j; A δijszimbólum az ún. Kronecker-delta. Vizsgáljuk meg ezen definíció következményeit. Képezzük az ortogonális Q mátrix transzponáltját és szorozzuk meg Q-val. A páronkénti ortogonalitás és az oszlopvektorok egységvektor mivoltának következtében kapjuk, hogy
q1T 1 T 0 q 2 T Q Q q1 q 2 ... q n ... ... qTn 0
0 ... 0 1 ... 0 E R nn ; ... ... ... 0 ... 1
Adódik tehát, hogy QTQ E , amely egy nagyon fontos tulajdonsága az ortogonális mátrixoknak. 1.68.Tétel: Ortogonális mátrix inverze megegyezik a transzponáltjával, azaz
Q1 QT Bizonyítás: Az előző gondolatmenettel kaptuk, hogy QTQ E . Definíció szerint azonban Q1Q E . Mivel reguláris kvadratikus mátrix inverze egyértelműen létezik ezért valóban igaz, hogy Q1 QT . ■ A továbbiakban egy ortogonális mátrix determinánsára vonatkozólag fogalmazunk meg egy állítást. 126
Óbudai Egyetem BGK
Fejezetek a matematikából
1.69.Tétel: Egy ortogonális mátrix determinánsának abszolút értéke 1. Bizonyítás: A determinánsok szorzástétele szerint
det QTQ det QT det Q det E 1;
Másrészt viszont egy mátrix determinánsa egyenlő transzponáltjának determinánsával, tehát
det QT det Q . Et figyelembe véve az előző egyenlőség
det Q 2 1 alakba
írható, ami
igazolja az állítást. ■ Az ortogonális mátrixok és a skaláris szorzat kapcsolatát írja le az alábbi állítás. 1.70.Tétel: Ha Q ortogonális mátrix, akkor tetszőlegesx, yRn esetén teljesül, hogy x, y Qx, Qy ;
Bizonyítás: Használjuk fel a minden A mátrixra igaz, és a korábbiakban bizonyított összefüggést, mely szerint Ax, y x, AT y . Alkalmazzuk ezt egy ortogonális Q mátrixra. Felhasználva, hogy QTQ E , teljesül, hogy Qx, Qy x, QTQy x, Ey x, y ;
Ezt kellett igazolni. ■ Következményként megfogalmazhatjuk a tétel speciális esetét, amely a következő x, x Qx, Qx ;
ami azt jelenti, hogy az x és Qx vektorok hossza megegyezik. Tehát ha egy vektort egy ortogonális mátrixszal szorozzuk, akkor a hossza nem változik meg. Hasonlóan egyszerűen igazolható az ortogonális mátrixok sajátértékeire vonatkozó tétel. 1.71.Tétel: Egy ortogonális mátrix sajátértékeinek abszolút értéke 1. Bizonyítás: Legyen λ a Q mátrix sajátértéke és s a hozzá tartozó sajátvektor. Ekkor Qs = λs. Ebből következően s, s Qs, Qs s, s s, s ; 2
2
A komplex algebrából tudjuk, hogy , az adódik, hogy 1 , ezt kellett igazolni. ■
127
Óbudai Egyetem BGK
Fejezetek a matematikából
Egy ortogonális mátrix oszlopvektorainak rendszere nagyon különleges tulajdonságú. Ez a tulajdonság alapvetően fontos a lineáris algebrában ezért elnevezést vezetünk be erre vonatkozólag. 1.51.Definíció: A q1, q2, … , qn vektorrendszert ortogonális rendszernek nevezzük, ha teljesül, hogy qi Tq j 0 ha i j , azaz ha a vektorok páronként ortogonálisak. Ha még az is teljesül, hogy a vektorok mindannyian egységvektorok, tehát teljesülnek a qi Tqi 1, i 1, 2,..., n feltételek is, akkor a vektorrendszert ortonormált rendszernek nevezzük. Ezen definíció szerint egy ortogonális Q mátrix oszlopvektorai ortonormált rendszert alkotnak. De felmerülhet a kérdés, hogy ez a tulajdonság teljesül-e a sorvektorokra is. A válasz pozitív. 1.72.Tétel: Egy ortogonális Q mátrix sorvektorai is ortonormált rendszert alkotnak. Bizonyítás: A Q ortogonalitását úgy definiáltuk, hogy előírtuk, az oszlopvektorok skaláris szorzataira teljesüljön a qi Tq j 0 ha i j és qi Tqi 1, i 1, 2,..., n feltételrendszer. Ez egyenértékű a QTQ E egyenlőség fennállásával. Ha a sorvektorokra szeretnénk egy hasonló állítást igazolni, nem kell mást tennünk, mint megvizsgálni a QQT szorzatot. Ha ez is egyenlő az egységmátrixszal, akkor teljesül az állítás. Ez azonban igaz, ugyanis Q1 QT miatt QQT QQ1 E;
Ez pedig igazolja az állítást. ■ Mielőtt példákkal illusztrálnánk a mondottakat világítsunk rá az ortogonális vektorrendszer egy alapvetően fontos tulajdonságára amely különösen a szimmetrikus mátrixok témakörében nagyon fontos alkalmazásra talál. 1.73.Tétel: Egy ortonormált vektorrendszer vektorai lineárisan függetlenek. Bizonyítás: Tegyük fel, hogy a q1, q2, … , qn vektorrendszer ortonormált, azaz teljesül, hogy qi Tqi 1, i 1, 2,..., n valamint qi Tq j 0 ha i j . Állítsuk elő a nullvektort ezen vektorok lineáris kombinációjaként. 1q1 ... iqi ... nqn 0; Meg kell mutatnunk, hogy minden αi együttható zérus. Szorozzuk meg ennek érdekében az egyenletet skalárisan a qi vektorral. Az ortogonalitás miatt n – 1 db skaláris szorzat zérus, csak egy tag marad a bal oldalon i qiTqi qiT 0 0; i 1, 2,..., n; ebből pedig következik, hogy minden αi együttható zérus, mert qi Tqi 1, i 1, 2,..., n . ■ Az igazolt tételből következik, hogy egy n-ed rendű ortogonális mátrix oszlopvektorai szükségképpen lineárisan függetlenek, tehát egy n-ed rendű ortogonális mátrix rangja n. 128
Óbudai Egyetem BGK
Fejezetek a matematikából
Ezek után lássunk példákat ortogonális mátrixokra. Ellenőrizzük, hogy teljesülnek-e a fent igazolt tételekben szereplő tulajdonságok. 1.65.Példa: Mutassuk meg, hogy az alábbi mátrix ortogonális, határozzuk meg a sajátértékeket és sajátvektorokat.
Q
1 2 ; 1 2
1 2 1 2
Világos, hogy az oszlopvektorok és a sorvektorok is ortonormált rendszert alkotnak, hiszen 2
2
1 1 1 1 1 1 1 1 2 2 1; másrészt 0; 2 2 2 2 2 2
A Q mátrix tehát ortogonális. Egyszerű számítással ellenőrizhető, hogy det(Q) = –1, a sajátértékek λ1 = –1 és λ2 = 1, ezekben az esetekben az A – λE mátrix szinguláris, determinánsa zérus. Mivel ez a mátrix ráadásul szimmetrikus is Q QT , adódik, hogy Q1 QT Q , tehát ezen mátrix inverze saját maga. Teljesül, hogy QQ E . Mivel a mátrix szimmetrikus, a sajátvektorok ortogonális rendszert alkotnak. Ez valóban igaz, hiszen a sajátvektorok rendre az
t 1 2 t , t R \ 0 ; s 2 , t R \ 0 ; s1 1 2 t t
amelyek valóban ortogonálisak. Ennek a ténynek egyébként következménye, hogy ha kapott sajátvektorokban úgy választjuk meg a t értékét, hogy azok egységvektorok legyenek, akkor ezekből, mint oszlopvektorokból képezett mátrix ugyancsak ortogonális mátrix. Mivel
12 1 2
2
4 2 2 ezért a
1 42 2 Q1 1 2 4 2 2
mátrix is ortogonális.
129
1 2
42 2 ; 1 4 2 2
Óbudai Egyetem BGK
Fejezetek a matematikából
1.66.Példa: A szimmetrikus mátrixok tanulmányozása során meghatároztuk az 2 4 1 A 2 2 2 ; 4 2 1 mátrix sajátvektorait. Ezek a következők. 2 1 4 s1 1 ; s 2 2 ; s3 2 ; 2 0 5
Már ellenőriztük, hogy ezen vektorok páronként vett skaláris szorzata zérus. Ha minden vektort elosztunk az abszolút értékével, akkor ortonormált rendszert kapunk. Az abszolút értékek a következők.
s1 4 1 4 3; s2 1 4 5; s3 16 4 25 45 3 5; Ezen eredményekből, következik, hogy a
2 3 1 Q 3 2 3
1 5 2 5 0
4 3 5 2 ; 3 5 5 3 5
mátrix ortogonális. Ennek oszlopvektorai tehát lineárisan függetlenek, azaz a Q mátrix rangja 3. Számítsuk még ki a determinánsát.
2 3 1 det Q 3 2 3
1 5 2 5 0
4
2 3 3 5 2 5 3 3 5 5 2 3 3 5
1 5 0 0
4 3 5 5 10 1 3 3 5 5 2 5 3 3 5
2 5 1 5 5 4 5 3 1; 9 5 9 5 3
Ahogyan azt egy korábbi állításban igazoltuk. Speciális esetként megjegyezzük, hogy a permutáló mátrixok, és ezzel együtt az egységmátrix is, ortogonális mátrixok. Ennek oka, hogy egy permutáló mátrixban minden oszlopban pontosan egy 1-es van, de ez igaz minden sorra is, így ha két oszlop skaláris szorzatát képezzük, az 1-es 130
Óbudai Egyetem BGK
Fejezetek a matematikából
biztosan 0-val szorzódik, tehát a skaláris szorzat zérus. Másfelől világos, hogy az oszlopvektorok mind egységvektorok. Ebből következik, az alábbi egyszerű állítás. 1.74.Tétel: Egy permutáló mátrixok inverze egyenlő a transzponáltjával. Azaz ha P permutáló mátrix, akkor P–1 = PT. ■ Csak érdekességként jegyezzük meg, az alábbi nyilvánvaló további következményt. 1.75.Tétel: Ha egy ortogonális mátrix szimmetrikus akkor inverze saját maga. ■ 1.67.Példa: Az alábbi permutáló mátrix szimmetrikus, így inverze saját maga.
1 0 P 0 0
0 0 0 1
0 0 1 0
0 1 T ; P P; P 1 P; 0 0
131
Óbudai Egyetem BGK
Fejezetek a matematikából
1.14. Ortogonális projekciók. Lineáris egyenletrendszer legjobban közelítő megoldása, a legkisebb négyzetek módszere Az alábbiakban a merőleges vetítés általánosításával és érdekes következményeivel foglakozunk. Tegyük fel, hogy a P mátrix egy vektort vetít egy egyenesre, síkra, lineáris altérre. Ha a vetületre alkalmazzuk ismét a P mátrixot, akkor onnantól az már a helybenhagyást jelenti. Ha tehát a b vektort vetíti a P mátrix, akkor Pb a vetület. Ha azonban a vetületet vetítjük, akkor kapjuk, hogy PPb = Pb, azaz P2 = P. Ez természetesen magasabb kitevőjű hatványokra is igaz, tehát ha P vetít, akkor igaz, hogy Pn= P ha n> 1. Ez az oka az alábbi definíciónak. 1.52.Definíció: A kvadratikus P mátrixot projektor mátrixnak (projekció mátrixnak) nevezzük, ha teljesül, hogy P2 = P. Az alábbiakban néhány esetben előállítjuk a projektor mátrixot, de előtte egy két egyszerű tulajdonságot megvizsgálunk. Először is nyilvánvaló, hogy az E egységmátrix projektor mátrix, továbbá a nullmátrix is projektor mátrix, hiszen mindkettőre nyilván teljesül a P2 = Pegyenlőség, ugyanis nyilván igaz, hogy E2 = E és 02 = 0. Az első esetben az E projektor mátrix sajátértéke az 1, a nullmátrix sajátértéke pedig nyilván a nulla és mindkét sajátérték multiplicitása n. A helyzet az, hogy más eset nem fordulhat elő. 1.76.Tétel: Egy projektormátrix sajátértéke vagy 0 vagy 1. Bizonyítás: Legyen s a λ sajátértékhez tartozó sajátvektor. Ekkor teljesül, hogy Ps = λs. Szorozzuk meg az egyenlet mindkét oldalát P-vel balról.Mivel P2 = P ezért azt kapjuk, hogy P2s = Pλs = λPs = λλs = λ2s Másrészt ugyancsak a P2 = P egyenlőségből következik, hogy P2s = Ps, ahonnan azt kapjuk, hogy λ2s = λs. Azaz (λ2 – λ)s = 0. Mivel sajátvektor nem lehet nullvektor, kapjuk, hogy λ2 – λ = 0, ahonnan következik az állítás. ■ Korábban igazoltuk, hogy egy mátrix pontosan akkor szinguláris ha a 0sajátértéke. Eszerint a projektor mátrixok egy része szinguláris. Kérdés, melyek a reguláris projektorok. Erre válaszol az alábbi állítás. 1.77.Tétel: Az egyetlen reguláris projektor mátrix az egységmátrix. Bizonyítás: Legyen a P projektor mátrix. Ekkor P2 = P. Átrendezve azt kapjuk, hogy P2 – P = 0. Kiemelve P-t az adódik, hogy P(P – E) = 0. Tegyük fel, hogy P reguláris, azaz létezik P–1 inverze. Szorozzuk meg vele az egyenletet. Azt kapjuk, hogy P–1P(P – E) = 0;E(P – E) = 0; P – E = 0 tehátP = E.
132
Óbudai Egyetem BGK
Fejezetek a matematikából
Ezt kellett igazolni. ■ Ezek szerint, az alkalmazások szempontjából érdektelen egységmátrix kivételével, minden projektor mátrix szinguláris. Ezek után előállítjuk konkrét esetekben a projekciót megvalósító mátrixot. I. Merőleges vetítés egyenesre. Tűzzük ki a következő feladatot. Adott egy a vektor és egy vele nem párhuzamos b vektor. Állítsuk elő a b vektor a-val párhuzamos összetevőjét. A keresett vektor természetesen a b vektor a-irányú merőleges vetülete. b b – xa
b – xa ┴xa a
xa
A vetületet azzal a feltétellel határozzuk meg, hogy a b vektornak és vetületének különbsége a merőleges vetítés értelmezése szerint merőleges az a vektorra. Fejezzük ki b vetületét úgy, mint az a vektor konstansszorosa, azaz xa, alkalmas x valós szám esetén. Kérdés, mi az x értéke.Ennek meghatározásához a feltétel az, hogy b – xa ortogonális a-ra, tehát skaláris szorzatuk zérus.
b xa, a 0; azaz b xa a 0; tehát bTa xaTa 0; T
Ebből pedig adódik a keresett x skalár és a vetületvektor.
bT a bTa x T ; másrészt a vetületvektor xa T a; a a a a 1.68.Példa: Határozzuk meg a b = [1 2 –3]T vektor a = [–1 3 1]T irányú merőleges vetületét. Alkalmazzuk a kapott összefüggést. Kiszámítjuk a szükséges skaláris szorzatokat. bTa = –1 + 6 – 3 = 2; aTa = 1 + 9 + 1 = 11; Ebből adódóan a merőleges vetület a következő. T
xa
2 2 T 2 6 2 a 1 3 1 ; 11 11 11 11 11
„mellékeredményként” kiszámíthatjuk a b – xa vektort – a következő pontban erre is szükség lesz –. A vetület felhasználásával adódik, hogy 133
Óbudai Egyetem BGK
Fejezetek a matematikából
T
b xa b
2 T 2 6 2 13 16 a 1 2 3 11 11 11 11 11 11
T
35 ; 11
Ellenőrizhetjük, hogy a két vektor valóban ortogonális. 13 16 b xa, a 11 11
T
35 2 6 2 26 96 70 0; 11 11 11 11 121
A számítások eredménye a következő. Felbontottuk a b vektort a-irányú és a-ra ortogonális komponensek összegére. Általánosítsuk a problémát, de ne csak a két dimenziós síkra, hanem általánosan egy altérre. II. Merőleges vetítés lineáris altérre. Tegyük fel, hogy egy n-dimenziós L lineáris térben adva van egy L’ altér, amelynek egy bázisa az a1, a2, …, ar vektorrendszer. Foglaljuk össze ezeket a vektorokat egy A mátrixba úgy, hogy ezen vektorok legyenek az A mátrix oszlopvektorai. Az A mátrixról tehát az alábbiakat mondhatjuk, mérete n×r, mert r db n dimenziós oszlopvektor alkotja, és a feltételek szerint rangja ρ = r, hiszen az r db oszlopvektor lineárisan független. Tegyük fel, hogy az L-beli b vektor nincs benne az A mátrix oszlopvektorai által kifeszített altérben, tehát L’-ben. Határozzuk meg a b vektor ortogonális vetületét az L’ altérre vonatkozólag. Ehhez azonban szükség van egy definícióra. 1.53.Definíció: Azt mondjuk, hogy az y vektor ortogonális az L’ altérre, ha ortogonális az altér minden vektorára. Az ortogonalitás vizsgálatához azonban nem szükséges az összes vektort figyelembe venni. 1.78.Tétel: Egy y vektor ortogonális az L’ altérre, ha ortogonális az L’ valamely bázisának minden vektorára. Bizonyítás: Legyen L’ egy bázisa a b1, b2, …, br vektorrendszer. Mivel ez bázis, az altér minden x vektora előáll ezen vektorok lineáris kombinációjakét. Legyen ez az előállítás a következő
x 1b1 2b2 ... r br ; képezzük ennek a skaláris szorzatát az y vektorral A skaláris szorzat disztributivitása miatt írhatjuk, hogy
x, y 1 b1, y 2 b2 , y ... r br , y ; Ez az összeg valóban zérus, ha minden bázisvektorra teljesül, hogy bi , y 0; i 1, 2,..., r . ■ Ezek után a logika pontosan az, amit az egyenesre vonatkozó vetítésnél követtünk.
134
Óbudai Egyetem BGK
Fejezetek a matematikából b
b – Ax b – Ax ┴ Ax
ar
Ax a1
A b vektor vetülete egyrészt nyilván felírható a bázis, vagyis az A oszlopvektorainak lineáris kombinációjaként, tehát a vetület Ax alakú. A b vektornak és a vetületnek a különbsége definíció szerint ortogonális az altérre, így ortogonális az A oszlopvektoraira. Írjuk fel az ortogonalitás feltételeit. a1T b Ax 0; aT2 b Ax 0; ..., aTr b Ax 0;
Ez az r db egyenletrendszer egyetlen mátrixegyenletté foglalható össze. AT b Ax 0;
Ha elvégezzük a zárójel felbontását és rendezzük az egyenletet, azt kapjuk, hogy AT Ax ATb;
Ezt az egyenletet Gauss-féle normálegyenletnek nevezzük. Ennek a megoldása szolgáltatja azt az x vektort, amely a vetület lineáris kombinációjának együtthatóit tartalmazza. Ha az An×r méretű mátrix, akkor transzponáltja r×n méretű, így az ATA szorzatnak mindig van értelme, ráadásul mindig kvadratikus mátrix, mérete r×r. Kérdés, hogy megoldható-e a Gauss-féle normálegyenlet az x vektorra. Nyilvánvalóan igen, ha az ATA szorzat reguláris mátrix, azaz ha rangja r, mert ekkor invertálható. Ez azonban igaz, ha az A mátrix rangja r. A tétel megfogalmazása előtt bevezetünk egy elnevezést. 1.54.Definíció: Az ATAmátrixotGram-féle mátrix-nak nevezzük. Vegyük észre, hogy a Gram-féle mátrix komponensei a mátrix oszlopvektorainak skaláris szorzatai „az összes lehetséges módon párosítva” az oszlopvektorokat. Tehát, ha az A mátrix oszlopvektorait szokás szerint ai (i = 1, 2, …, r) jelöli, akkor a Gram-féle mátrix a következő.
a1T a1 , a1 T a ,a a 2 T A A a1 a 2 ... a r 2 1 ... ... aTr a r , a1
a1 , a 2
...
a2 , a2
...
...
...
ar , a2
...
A Gram-féle mátrix determinánsát Gram-determinánsnak nevezzük. 135
a1 , a r a2 , ar ; ... a r , a r
Óbudai Egyetem BGK
Fejezetek a matematikából
G a1 , a 2 ,..., a r
a1 , a1
a1 , a 2
...
a1 , a r
a 2 , a1
a2 , a2
...
a2 , ar
...
...
...
...
a r , a1
ar , a2
...
ar , ar
;
A Gram-determináns nagyon hasznos fogalom. Lehetővé teszi, hogy egyszerű módon eldöntsük, hogy egy vektorrendszer lineárisan összefüggő vagy lineárisan független. Igaz ugyanis az alábbi állítás. 1.79.Tétel: A G a1, a2 ,..., ar Gram-determináns értéke akkor és csak akkor zérus, ha az
a1, a2 ,..., ar vektorok lineárisan összefüggenek. Bizonyítás: Az a1, a2 ,..., ar vektorrendszer az értelmezés szerint akkor és csak akkor lineárisan összefüggő, ha teljesül, hogy x1a1 x2a2 ... xr ar 0 esetén legalább az egyik xj együttható nem nulla. Szorozzuk most meg ezt az egyenletet skalárisan az ai vektorral minden i = 1, 2, …, r esetén. Azt kapjuk, hogy
x1 a1, ai x2 a2 , ai ... xr ar , ai 0; i 1, 2,..., r; Amit kaptunk, egy r db egyenletből álló homogén lineáris egyenletrendszer, melynek determinánsa éppen a Gram-determináns. Az egyenletrendszerek elméletéből pedig tudjuk, hogy pontosan akkor létezik triviálistól eltérő megoldás, ha a determináns zérus. Éppen ezt kellett igazolni. ■ 1.80.Tétel: Ha az n×r méretű A mátrix rangja r, akkor az ATAGram-féle mátrix reguláris. Bizonyítás: Az előző tételből következik, hogy ha az A oszlopvektorai lineárisan függetlenek, akkor ATA determinánsa nem zérus. Ha nem zérus a determináns, akkor viszont létezik inverz, tehát a Gram-mátrix valóban reguláris. A lineáris függetlenség pedig a rang definíciójából következik, hiszen feltettük, hogy az A mátrix rangja r, tehát az r db oszlopa lineárisan független. ■ Tudjuk tehát, hogy az inverz mátrix létezik. Ekkor szorozzuk meg ezzel a Gauss-féle normálegyenletet balról. Azt kapjuk, hogy a megoldás
x AT A
1
ATb;
másrészt kapjuk a vetületvektort is. Ugyanis a vetületvektor nem más, mint Ax tehát
136
Óbudai Egyetem BGK
Fejezetek a matematikából
Ax A AT A
1
ATb;
Kaptuk tehát, hogy a b vektor vetülete az A mátrix oszlopvektor-terére az A AT A
1
A Tb
vektor. Eszerint a b vektort egy projektor mátrixszal szorozzuk. Igazoljuk ezt az állítást.
1.81.Tétel: A P A AT A
1
AT mátrix projektor mátrix.
Bizonyítás: Azt kell igazolnunk, hogy P2 = P. Ez valóban teljesül. Az asszociativitás miatt ugyanis
P 2 A AT A
1
2
AT A AT A
A A A A 1
T
T
1
AT A AT A
1
EAT A AT A
1
AT ;
Valóban projektor mátrix, tehát egy merőleges vetítést határoz meg. ■ Korábban igazoltuk, hogy az egyetlen reguláris projektor mátrix az egységmátrix. Ebből
következik, hogy az n×n méretű A AT A
1
AT mátrix szinguláris.
A Gauss-féle normálegyenlet segítségével egy további problémát is meg tudunk oldani.Tegyük fel, hogy feladat az Ax = b lineáris egyenletrendszer megoldása abban az esetben, amikor b nem kompatibilis az A mátrix oszlopvektoraival, azaz nincs benne az oszlopvektorok által kifeszített altérben. Ez a leggyakrabban akkor fordul elő, ha a rendszer „túlhatározott” azaz több az egyenlet, mint az ismeretlenek száma. Ebben az esetben természetesen nincs egzakt megoldás. Kérdés, hogy akkor ebben az esetben milyen módon definiáljuk a „megoldás”-t. Ebben a szituációban az ún. legjobban közelítő megoldást keressük. Mivel olyan x vektor nincs amelyre Ax = b teljesülne, keressük azt az x vektort, amelyre az Ax b eltérés minimális. 1.55.Definíció: Az Ax = b,ARn×k, bRn lineáris egyenletrendszer azon xRk megoldását, melyre teljesül, hogy az Ax b eltérés minimális, az egyenletrendszer legjobban közelítő megoldásának nevezzük. Ha áttérünk a vektorok koordinátáira, illetve figyelembe veszsük az A mátrix komponenseit, akkor a szokásos jelölésekkel azt kapjuk, hogy a legjobban közelítő megoldás az
Ax i bi n
i 1
2
2
2
n k k aij x j bi min aij x j bi min; i 1 j 1 i 1 j 1 n
formulával van definiálva. A legjobban közelítő megoldás tehát a legkisebb négyzetek feladatával egyenértékű. Világos, hogy ha b benne van az A oszlopvektor terében, akkor a rendszer megoldható, tehát létezik olyan x amelyre egzaktul teljesül, hogy Ax = b. Ekkor természetesen az Ax b eltérés 137
Óbudai Egyetem BGK
Fejezetek a matematikából
zérus. A felvetett probléma pontosan akkor „érdekes” amikor a rendszernek nem létezik egzakt megoldása. A legjobban közelítő megoldás előállítása a Gauss-féle normálegyenlet megoldásával állítható elő. 1.82.Tétel: Az Ax = b,ARn×k, bRn lineáris egyenletrendszer legjobban közelítő megoldását az AT Ax ATb;
Gauss-féle normálegyenlet megoldása szolgáltatja. Bizonyítás: A fentiekben megmutattuk, hogy a Gauss-féle normálegyenlet megoldása pontosan a b vektor merőleges vetülete az A mátrix oszlopterére. Ebből következik, hogy a b – Ax vektor ortogonális az oszloptérre, erről pedig nyilvánvaló, hogy a minimális távolságot jelenti a b vektor és az oszloptér között. ■ Összefoglalva, azt mondhatjuk tehát, hogy ha az Ax = b egyenletrendszernek nem létezik megoldása, akkor megoldjuk az AT Ax ATb Gauss-féle normálegyenletet, és megkapjuk a rendszer legjobban közelítő megoldását. A fentieket alkalmazzuk a legkisebb négyzetek feladatának lineáris algebrai apparátussal történő megoldására. A probléma a következő. Mérési adatpárok, megfigyeléssel kapott értékpárok esetén valamely függvénykapcsolatot keresünk az összetartozó értékek között. A függvénykapcsolat gyakran elsőfokú függvény, tehát egyenes, néha másodfokú polinom, esetleg magasabb fokú polinom. Tudjuk, hogy n + 1 db alappont esetén egyértelműn létezik egy n-ed fokú interpolációs polinom, amely illeszkedik az alappontokra. A gyakorlatban azonban nem két pontra illesztünk egyenest, és nem három pontra illesztünk másodfokú polinomot, stb, mert a megfigyelésből kapott adatok száma több, mint ami az egyértelműséghez szükséges. Azt mondhatjuk tehát, hogy egy túlhatározott probléma előtt állunk, több az egyenlet mint az ismeretlen. Ekkor keressük azt az, első, másod, stb. fokú polinomot, amely a „legjobban illeszkedik” a méréssel, megfigyeléssel kapott pontokra. Ez a legkisebb négyzetek feladata. Az alábbiakban konkrétan megvizsgálunk két problémát.
I. Egyenes illesztése a legkisebb négyzetek módszerével Tűzzünk ki egy konkrét problémát. 1.69.Példa: Keressük meg az (1,1), (2,2), (3,2) pontokra a legkisebb négyzetek feladata szerint legjobban illeszkedő egyenes egyenletét. Az egyszerű és áttekinthető számítások kedvéért választottunk ilyen kevés pontot. Azonban a pontok száma több, mint kettő, tehát egyértelműen nem illeszthető rájuk egyenes, és az is világos, hogy a három pont nem kollineáris. Keressük az egyenes egyenletét y = ax + b alakban. Keressük az a és b együtthatókat. A megoldandó egyenletrendszer a következő.
138
Óbudai Egyetem BGK
Fejezetek a matematikából
1a b 1; 1 1 1 1 1 1 a a 2a b 2; azaz 2 1 2 ; jelöléseink : A 2 1 ; b 2 ; x ; b b 3a b 2; 3 1 2 3 1 2
Világos, hogy a rendszer túlhatározott, mert csak két ismeretlen van de három egyenlet, és az is világos, hogy a rendszernek nincs egzakt megoldása, ami szemléletes azt jelenti, hogy a három pont nincs egy egyenesen. Keressük tehát a legjobban közelítő megoldást. Ehhez, mint azt fentebb igazoltuk, a Gauss féle normálegyenletet kell megoldani. Ehhez szükségesek az alábbi számítások. 1 1 1 2 3 T 14 6 A 2 1 ; A T ;A A ; 1 1 1 6 3 3 1
Világos, hogy az A rangja kettő, mert oszlopvektorai lineárisan függetlenek, és az is látható, hogy ATA reguláris, mert determinánsa 42 – 36 = 6 ≠ 0. Tehát a Gauss-féle normálegyenlet megoldható invertálással.
A A T
1
1 3 6 ; AT A 6 6 14
1
1 3 6 1 2 3 1 3 0 3 AT ; 6 6 14 1 1 1 6 8 2 4
Innen pedig már adódik a normálegyenlet megoldása. 1 1 1 a 1 3 0 3 2 x AT A ATb 2 ; 6 8 2 4 2 b 2 3 Azt kaptuk tehát, hogy a három pontra legjobban illeszkedő egyenes egyenlete a következő.
y
1 2 x ; 2 3
A problémát általánosan is megfogalmazzuk. Tegyük fel, hogy adottak az xi , yi , i 1, 2,..., n alappontok. Ezekre szeretnék egy y = ax + b alakú egyenest illeszteni úgy, hogy az eltérések négyzeteinek összege minimális legyen. Az egyenletrendszerek nyelvén fogalmazva, meghatározandó az Ax = b rendszer legjobban közelítő megoldása, ahol
x1 1 y1 x y 1 a A 2 R n2 ; b 2 R n ; x R 2 ; ... ... ... b xn 1 yn 139
Óbudai Egyetem BGK
Fejezetek a matematikából
Az egyenes két paraméterét az
a x AT A b
1
ATb;
formula szolgáltatja. II. Parabola illesztése a legkisebb négyzetek módszerével Tűzzük ki most azt a problémát, hogy méréssel kapott pontokra – melyek száma nagyobb, mint három – illesszünk parabolát a legkisebb négyzetek módszerével. 1.70.Példa: Ismét csak az egyszerűség kedvéért válasszunk 4 db pontot, legyenek ezek (0,1), (2,0), (3,0) és (4,1). Illesszük legjobban közelítő parabolát ezekre. Keressük az egyenletet y = ax2 + bx + c alakban. Meghatározandók az a, b és c együtthatók. A pontok száma nagyobb, mint három, tehát egyértelműen nem illeszthető parabola a pontokra. Az egyenletrendszer amelyet felírhatunk a következő.
a 02 b 0 c 1; 0 4 2 a 2 b 2 c 0; azaz 2 9 a 3 b 3 c 0; 2 16 a 4 b 4 c 1;
0 1 1 0 a 4 2 1 0 b ; jelöléseink : A 9 3 1 0 c 4 1 1 16
0 1 1 a 0 2 1 ;b ; x b ; 0 3 1 c 4 1 1
Oldjuk meg a Gauss-féle normálegyenletet.
0 4 A 9 16
1 0 4 9 16 353 99 29 1 T T ; A 0 2 3 4 ; A A 99 29 9 ; 1 1 1 1 1 29 9 4 1
0 2 3 4
Szükségünk van a Gram-féle mátrix inverzére.
A A T
1
0, 0795 0,3068 0,1136 0,3068 1, 2977 0, 6955 ; 0,1136 0, 6955 0,9909
A még elvégzendő műveletek az alábbiak.
140
Óbudai Egyetem BGK
A A T
1
Fejezetek a matematikából
0, 0795 0,3068 0,1136 0 4 9 16 A 0,3068 1, 2977 0, 6955 0 2 3 4 0,1136 0, 6955 0,9909 1 1 1 1 0,1136 0,1818 0, 0909 0,1591 0, 6955 0, 6727 0, 4364 0, 4136 ; 0,9909 0, 0545 0, 0727 0, 0273 T
Innen pedig már adódik a parabola három együtthatója.
a x b AT A c
1 0,1136 0,1818 0, 0909 0,1591 0, 2727 1 0 A Tb 0, 6955 0, 6727 0, 4364 0, 4136 1,1091 ; 0 0,9909 0, 0545 0, 0727 0, 0273 1, 0182 1
Kaptuk tehát, hogy az alappontokat négyzetesen legjobban közelítő parabola egyenlete a következő. y 0, 2727 x2 1,1091x 1,0182;
A parabola illesztés feladatát megfogalmazzuk általánosan is. Legyenek adottak az xi , yi , i 1, 2,..., n alappontok. Ezekre szeretnék egy y = ax2 + bx + c alakú parabolát illeszteni úgy, hogy az eltérések négyzeteinek összege minimális legyen. A kérdés az a, b és c együtthatók értéke. Az egyenletrendszerek nyelvén fogalmazva, meghatározandó az Ax = b rendszer legjobban közelítő megoldása, ahol
x12 2 x A 2 ... xn2
1 y1 a y x2 1 2 n3 n R ; b R ; x b R 3 ; ... ... ... c xn 1 yn x1
A parabola három paraméterét az a x b AT A c
formula szolgáltatja.
141
1
A Tb;
Óbudai Egyetem BGK
Fejezetek a matematikából
1.15. Gram-Schmidt-féle ortogonalizáció. Reguláris mátrixok QR-felbontása Gyakran van szükség ortogonális sőt ortonormált vektorrendszerre. Az alábbiakban azt vizsgáljuk, hogyan lehet egy lineárisan független vektorrendszerből, vagy még konkrétabban bázisból ortogonális bázist előállítani. Az eljárást Gram-Schmidt-féle ortogonalizációnak nevezzük. Felhasználjuk az előző pontban tárgyalt ortogonális projekció módszerét. Tegyük fel, hogy a b1, b2, …, bn vektorrendszer bázis, de a bázisvektorok nem ortogonálisak. Állítsunk elő ebből egy olyan q1, q2, …, qn bázist, amelyre teljesül, hogy qiTqj = 0 ha i ≠ j, tehát az új bázis vektorai páronként ortogonálisak. Az ortogonális bázis vektorait lépésenként határozzuk meg. 1. lépés: Legyen az első lépésben q1 = b1. 2. lépés: A második vektort úgy határozzuk meg, hogy képezzük a b2 vektor q1 = b1 irányú ortogonális vetületét, és q2 a b2 és a vetület különbsége lesz. Ez értelmezés szerint ortogonális a q1 = b1 vektorra. Legyen tehát a q2 = b2 – α12q1 vektor ortogonális a q1 vektorra. Ez lehetőséget ad az α12 kiszámítására. Ugyanis q 2 , q1 b 2 , q1 12 q1 , q1 0; ahonnan 12
b2 , q1
;
q1 , q1
Ezzel megkaptuk a q2 vektort, amely merőleges a q1 vektorra. 3. lépés: Folytatjuk az eljárást. Ebben a lépésben a b3 vektort cseréljük le egy olyan vektorra, amely ortogonális a q1 és q2 vektorok mindegyikére. Ennek érdekében vetítjük a b3 vektort a q1 és q2 vektorok által kifeszített altérre majd képezzük a b3 és a vetület különbségét, amely ortogonális az altérre. Legyen tehát a q3 = b3 – α13q1– α23q2 vektor ortogonális a q1 és q2 vektorokra, azaz megköveteljük, hogy teljesüljenek a q3 , q1 b3 , q1 13 q1 , q1 0; ahonnan 13 q3 , q 2 b3 , q 2 23 q 2 , q 2 0; ahonnan 23
142
b3 , q1 q1 , q1
;
b3 , q 2 q2 , q2
;
Óbudai Egyetem BGK
Fejezetek a matematikából
feltételek. A számítások során figyelembe vettük, hogy a q1 és q2 vektorok ortogonálisak, így skaláris szorzatuk zérus. Hasonlóan képezzük a további vektorokat. n. lépés: Ha az előző logika ismétlésével feltesszük, hogy már előállítottuk a q1, q2, …, qn–1 páronként ortogonális vektorokat, akkor a qn vektor előállítása a következőképpen történik. A bn vektort ortogonálisan vetítjük a q1, q2, …, qn–1 vektorok által kifeszített altérre, majd képezzük a vektor és a vetület különbségét. Megköveteljük tehát, hogy a qn = bn – α1nq1– α2nq2 –…–αn–1,nqn–1 vektor ortogonális legyen a q1, q2, …, qn–1 vektorok mindegyikére. Tekintettel arra, hogy ezek a vektorok már páronként ortogonálisak, a merőlegességi feltételek a következőre redukálódnak.
b n , q1
q n , q1 b n , q1 1n q1 , q1 0; ahonnan 1n
q1 , q1
q n , q 2 b n , q 2 2 n q 2 , q 2 0; ahonnan 2 n
;
bn , q2 q2 , q2
;
... q n , q n 1 b n , q n 1 n 1,n q n 1 , q n 1 0; ahonnan n 1,n
b n , q n 1 q n1 , q n1
;
Megkaptuk tehát a keresett együtthatókat, az ortogonális bázist előállítottuk. A korábbiak fényében könnyen látható, hogy a kapott vektorrendszer valóban bázis, ha a kiindulási vektorrendszer bázis volt. Egy n-dimenziós térben ugyanis bármely n-db lineárisan független vektorból álló vektorrendszer bázis. A vektorok száma n, csak azt kell megmutatni, hogy a vektorrendszer lineárisan független. Ehhez felírjuk a Gram-determinánst. Ennek értéke a páronkénti ortogonalitás miatt
G q1 , q 2 ,..., q n
q1 , q1
q1 , q 2
...
q1 , q n
q 2 , q1
q2 , q2
...
q2 , qn
...
...
...
...
q n , q1
qn , q2
...
qn , qn
q1 , q1
0
...
0
0
q2 , q2
...
0
...
...
...
...
0
0
...
qn , qn
n
qi , qi 0; i1
valóban nem nulla, tehát az ortogonalizációval kapott vektorrendszer lineárisan független, tehát ha bázisból indultunk ki, akkor bázist kapunk. Gyakran fontos, hogy az ortogonális bázis egyben ortonormált, tehát az ortogonális bázis minden vektora egységnyi hosszúságú legyen. Ez könnyen elérhető, ha tudjuk, hogy a bázis ortogonális. Nem kell mást tenni, minden egyes bázisvektort el kell osztani az abszolút értékével. 143
Óbudai Egyetem BGK
Fejezetek a matematikából
Tehát az ortonormált bázis vektorai a qi0
qi ; i 1, 2,..., n; vektorok. Ezekre teljesül, hogy qi
qi0 , q0j 0 ha i ≠ j és qi0 , q0j 1 ha i = j. Ebből következik, hogy egy ortonormált bázis
Gram-féle mátrixa az egységmátrix, a Gram-determináns értéke pedig 1.
G q10 , q02 ,..., q0n
q10 , q10
0
...
0
0
q02 , q02
...
0
... 0
... 0
...
...
...
q0n , q0n
1
0 ... 0
0
1 ... 0
... ... ... ... 0 0 ... 1
1;
1.71.Példa: Ortogonalizáljuk Gram-Schmidt ortogonalizációs eljárással az R3 alábbi bázisát. 1 1 0 b1 0 ; b 2 1 ; b3 1 ; 1 0 1
Könnyen látható, hogy ez a három vektor bázist alkot R3-ban. Képezzük ugyanis a Gramdeterminánst. Ehhez kellenek a következő skaláris szorzatok.
b1, b1 b2 , b2 b3 , b3 2; b1, b2 b1, b3 b2 , b3 1; Ezek alapján a determináns a következő. 2 1 1 G b1 , b 2 , b3 1 2 1 4 0; 1 1 2
Ez különbözik 0-tól tehát a vektorok lineárisan függetlenek, tehát a vektorrendszer valóban bázis. ortogonalizáljuk ezt a vektorrendszert. 1. lépés: Legyen q1 b1 1 0 1 ; T
2. lépés: Legyen q2 = b2 – α12q1 ahol 12 hogy 12
b 2 , q1 q1 , q1
b 2 , b1 b1 , b1
b 2 , q1 q1 , q1
. Figyelembe véve, hogy q1 b1 kapjuk,
1 . Ebből következően 2
144
Óbudai Egyetem BGK
Fejezetek a matematikából
1 1 T 1 1 1 1 q 2 b 2 q1 1 0 1 ; 2 2 2 2 0 1
3. lépés: Legyen q3 = b3 – α13q1– α23q2 ahol 13
b3 , q1 q1 , q1
, 23
b3 , q 2 q2 , q2
. Számítsuk ki a
szükséges skaláris szorzatokat.
q1 , q1 2; b3 , q1 1; q2 , q2
1 1 3 1 1 1 ; b3 , q 2 0 1 ; 4 4 2 2 2
Innen kapjuk az ortogonális bázis harmadik vektorát. 1 2 0 1 2 1 1 1 1 q3 b3 q1 q 2 1 0 1 2 3 2 3 3 1 1 1 2
2 3
T
2 ; 3
A számítások eredményei szerint az ortogonális bázis a következő. T
1 1 2 q1 1 0 1 ; q2 1 ; q3 2 2 3 T
2 3
T
2 ; 3
Jól látható, hogy a páronként vett skaláris szorzatok valóban zérussal egyenlők. A Gram-Schmidt-féle ortogonalizációs eljárás során kapott összefüggések lehetőséget adnak arra, hogy a reguláris és kvadratikus mátrixot, melynek tehát n-db lineárisan független oszlopvektora van felírjuk szorzat alakban. Ennek a szorzatnak az első komponense egy olyan mátrix melynek oszlopvektorai páronként ortogonálisak, a második tényező pedig egy felső háromszögmátrix. Ennek belátásához írjuk fel az ortogonalizációs eljárás során kapott egyenleteket a következő alakban. b1= q1 b2 = α12q1+q2 b3 = α13q1+ α23q2 +q3 … bn = α1nq1+ α2nq2 +…+αn–1,nqn–1+ qn Ezek az egyenletek mátrixalakban írva a következő mátrixszorzással egyenértékűek.
145
Óbudai Egyetem BGK
b1
b2
Fejezetek a matematikából
b3 ... b n q1 q 2
q3
1 12 0 1 ... q n 0 0 ... .... 0 0
13 ... 1n 23 ... 2 n 1 ... 3n ; ... ... ... 0 ... 1
Ebben a felbontásban az első tényező jele szokásosan Q, amely tehát olyan mátrix melynek oszlopvektorai páronként ortogonálisak, a második tényező jele R, melynek komponensei éppen az ortogonalizációs eljárás során kapott együtthatók. Ezt felbontást nevezzük QR-felbontásnak. 1.72.Példa: Az előbbi számítások eredményének figyelembe vételével előállíthatjuk a 1 1 0 B 0 1 1 ; 1 0 1
mátrix szorzat alakját. Figyelembe véve a kapott ortogonális vektorrendszert valamint a számított együtthatókat írhatjuk, hogy
1 1 2 QR 0 1 1 1 2
2 1 1 3 2 2 0 1 3 2 0 0 3
1 2 1 1 0 1 0 1 1 B; 3 1 0 1 1
A két mátrix szorzásával ellenőrizhető, hogy a szorzat valóban megadja a B mátrixot. Azonban mind elméleti, mind gyakorlati szempontból fontosabb az az eset, amikor a Q mátrix oszlopai ortonormált rendszert alkotnak, azaz a vektorok hossza egységnyi. Tulajdonképpen azt a felbontást nevezzük QR felbontásnak, ha a Q mátrix a definíció értelmében ortogonális mátrix, tehát oszlopvektorai a páronkénti ortogonalitás mellett még egységvektorok is. Ha megköveteljük, hogy a Q mátrix ortogonális legyen, azaz oszlopai egységvektorok legyenek, akkor a felbontás némileg különbözik az előző példa megoldása során kapott felbontástól. Erre a különbségre a következő példa megoldása során mutatunk rá. 1.73.Példa: Végezzük el az alábbiB mátrix QR-felbontását. 1 1 0 B 1 0 2 ; 0 2 1
146
Óbudai Egyetem BGK
Fejezetek a matematikából
Mivel det(B) = –1, ezért az oszlopvektorok lineárisan függetlenek, tehát bázist alkotnak R3-ban. Ortogonalizáljuk ezt a bázist úgy, hogy eredményként ortonormált bázist kapjunk, majd végezzük el a B mátrix QR-felbontását. 1. lépés: Legyen q1 b1 1 1 0 ; Most azonban ezzel nem elégedhetünk meg, a kapott vektort normálnunk is kell. Ezért elosztjuk a hosszával. T
q10
q 1 1 1 1 1 0T q1 2 2
T
1 2
0 ;
Megkaptuk tehát az ortonormált bázis első vektorát. 2. lépés: Legyen
q2 b2 12q10
b 2 , q10
ahol 12
q10 , q10
b 2 , q10 , mivel a nevezőben egy normált
vektor hosszának négyzete szerepel. Ennek az együtthatónak az értéke 1 12 b 2 , q10 1 0 2 2
T
1 2
1 0 ; 2
1 2
1 0 2
Innen adódik a q2 vektor. 1 1 2 2
q2 b2 12q10 1 0 2 T
T
1 2
T
2 ;
1 1 9 3 4 , ezért q 2 , tehát a második 4 4 2 2 normált vektor az ortonormált bázisban a következő. Ezt a vektort még normálni kell. Mivel q2 , q2
q02
3. lépés: Legyen
23
b3 , q02 q02 , q02
q 2 1 2 q2 3 2
q3 b3 13q10
T 2 2 6
1 2
23q02
2 6
T
2 2 ; 3
ahol egyrészt 13
b3 , q10 q10 , q10
b3 , q10 , másrészt
b3 , q02 , mert a nevezőkben egységvektorok hosszának négyzete áll.
Számítsuk ki a szükséges skaláris szorzatokat.
147
Óbudai Egyetem BGK
Fejezetek a matematikából
1 13 b3 , q10 0 2 1 2
23
b3 , q02
2 0 2 1 6
T
1 2
0 2;
2 6
2 2 2; 3
T
Innen kapjuk a q3 vektort.
2 2 1 2 6 3 0 2 2 1 0 0 q3 b3 13q1 23q 2 2 2 2 ; 6 3 2 1 2 2 1 0 3 3 Könnyen látható, hogy az eredményként kapott vektor „véletlenül” éppen egységvektor, tehát nem kell normálni, automatikusan teljesül, hogy q30 q3 . Felírhatjuk tehát a B mátrix oszlopvektoraiból ortogonalizációval kapott ortonormált bázist.
2 1 2 2 3 6 1 0 2 0 2 0 q1 ; q2 ; q3 ; 6 3 2 2 2 0 1 3 3 A páronkénti skaláris szorzatok kiszámítása mutatja, hogy a kapott vektorok valóban páronként ortogonálisak, a normáltság a képzésből pedig következik. A QR-felbontás ebből úgy következik, hogy megvizsgáljuk az eredeti bázisvektorok mely lineáris kombinációja szolgáltatja az ortonormált bázisvektorokat. Írjuk fel az egyenleteket.
q10
q1 b1 ;; q1 q1
q02
q2 b2 12q10 1 b 2 12 q10 ; q2 q2 q2 q2
q30
q3 b3 13q10 23q02 1 b3 13 q10 23 q02 ; q3 q3 q3 q3 q3
148
Óbudai Egyetem BGK
Fejezetek a matematikából
Fordítsuk meg most ezeket az egyenleteket, fejezzük ki ezekből az eredeti bázis vektorait. Azt kapjuk, hogy
b1 q1 q10 ; b2 12q10 q2 q02 ; b3 13q10 23q02 q3 q30 ; Az n-dimenziós esetre vonatkozó összefüggések innen már láthatók. Ha ezeket az egyenleteket egyetlen mátrixegyenlettel fejezzük ki, akkor a következő szorzatot írhatjuk fel.
b1 b 2
b3 q10
q02
q1 0 q3 0 0
12 q2 0
13 23 q10 q3
q 02
q1 0 q3 0 0
b 2 , q10 q2 0
b3 , q10 0 b3 , q 2 ; q3
Pontosan ez a szorzat alak a keresett QR-felbontás. Ez a felbontás annyiban különbözik a korábban tárgyalt esettől, amikor nem írtuk elő azt hogy a Q mátrix oszlopvektorai normáltak legyenek, hogy a felső háromszögmátrix főátlójában általában nem 1-esek állnak, hanem az ortogonalizáció során kapott vektorok abszolút értékei. Alkalmazzuk ezt a konkrét esetre. A B mátrix következő felbontását kapjuk. 1 2 1 QR 2 0
2 6 2 6 2 2 3
2 2 3 2 0 3 2 0 3
1 2 3 2 0
2 1 1 0 2 1 0 2 B; 0 2 1 1
A Gram-Schmidt-féle ortogonalizációs eljárás eredményeinek ismeretében, megfogalmazhatjuk az alábbi állítást. 1.83.Tétel: (QR-felbontás) Ha a BRn×n, kvadratikus mátrix reguláris, akkorfelbontható egy ortogonális mátrix (Q) és egy felső háromszögmátrix (R) szorzatára, ahol a Q oszlopai a B oszlopvektoraiból képzett ortonormált bázisvektorok, az R mátrix pedig az áttérés lineáris kombinációinak az együtthatót tartalmazza.
149
Óbudai Egyetem BGK
Fejezetek a matematikából
1.16. Hasonló mátrixok. Diagonalizáció A hasonló mátrixok a kvadratikus mátrixok halmazát osztályokra bontja, az egy osztályba tartozó mátrixok több lényeges szempontból egyező tulajdonságokat mutatnak. Lássuk az értelmezést. 1.56.Definíció: A kvadratikus n-ed rendű A és B mátrixokat hasonló mátrixoknak nevezzük, ha létezik olyan n-ed rendű reguláris S mátrix, mellyel teljesül a B S1AS;
egyenlőség. Mindenek előtt tisztázzuk, hogy ez a reláció szimmetrikus, ami azt jelenti, hogy ha A hasonló B-hez, akkor B is hasonló A-hoz. Ezért nem is kellett a definícióban ennyire szélsőségesen fogalmazni, egyszerűen mondhatjuk, hogy A és B hasonlóak. Valóban, ha teljesül, hogy B S1AS , akkor átrendezve azt kapjuk, hogy A SBS1 . Mivel S reguláris, az inverze is az. Legyen S1 S0 . Ekkor írhatjuk, hogy A S01BS0 , tehát valóban szimmetrikus reláció. Most vizsgáljuk meg, hogy milyen szempontból egyeznek meg a hasonló mátrixok. Két fontos állítást fogalmazhatunk meg determinánsokra és sajátértékekre. 1.84.Tétel: Hasonló mátrixok determinánsa egyenlő, azaz ha B S1AS akkor
det B det A; Bizonyítás: Felhasználva a determinánsok szorzástételét determinánsára vonatkozó összefüggést kapjuk, hogy
det B det S1AS det S1 det A det S
valamint
az
inverzmátrix
1 det A det S det A; det S
Ezt kellett igazolni. ■ A sajátértékekre hasonló tétel igaz. De előbb egy karakterisztikus polinomra vonatkozó tételt igazolunk. 1.85.Tétel: Hasonló mátrixok karakterisztikus polinomjai megegyeznek. Bizonyítás: Legyen B S1AS . Megmutatjuk, hogy B karakterisztikus polinomja megegyezik az A karakterisztikus polinomjával. Valóban
k B B E S 1AS E S 1AS S 1S S 1 AS S S 1 A E S
1 A E S A E k A S 150
Óbudai Egyetem BGK
Fejezetek a matematikából
Ezt kellett igazolni. ■ Ennek a tételnek egyenes következménye az alábbi állítás. 1.86.Tétel: Hasonló mátrixok sajátértékei megegyeznek. Bizonyítás: Mivel a sajátértékek a karakterisztikus polinom gyökei, és mivel a karakterisztikus polinomok megegyeznek, az állítást igazoltuk. ■ Természetes módon merül fel a kérdés, hogy mit mondhatunk a sajátvektorokról. Erre ad választ az alábbi állítás. 1.87.Tétel: Ha az A mátrix λ sajátértékhez tartozó sajátvektora s, akkor a B S1AS összefüggés szerint az A-hoz hasonló B mátrix λ sajátértékhez tartozó sajátvektora az S 1s vektor. Bizonyítás: A feltétel szerint teljesül, hogy As = λs. Tudjuk, hogy λ sajátértéke a B-nek is, ezért valamely s’-re teljsül, hogy Bs’ = λs’. Fejtsük ezt ki részletesen. Bs ' S1ASs ' s '; ahonnan SS1ASs ' Ss '; azaz ASs ' Ss ';
ami azt jelenti, hogy Ss’ az A mátrix λ sajátértékhez tartozó sajátvektora, azaz s = Ss’. Ez egyenértékű az állítással. ■ Az alábbi példába ellenőrizzük, hogy teljesülnek a fenti tételekben megfogalmazott tulajdonságok. 1.74.Példa: Legyen
4 7 A ; 2 5 Az A mátrix karakterisztikus polinomja a következő.
k A det A E
4
7
2
5
2 6;
Ennek gyökei a sajátértékek, λ1 = –3, λ2 = 2. A sajátvektorok pedig rendre a következők.
1 7 s1 ; s 2 ; 1 2 Legyen ezután
1 3 S ; 1 2 151
Óbudai Egyetem BGK
Fejezetek a matematikából
Ez az S mátrix valóban reguláris, hiszen determinánsa –1. Az inverze pedig
2 3 S 1 ; 1 1 Ezek után kapjuk a B S1AS mátrixot, amely hasonló A-hoz.
2 3 4 7 1 3 14 29 1 3 43 100 B S1AS ; 12 1 2 18 42 1 1 2 5 1 2 6 Azt kaptuk tehát, hogy a
43 100 B ; 42 18 mátrix és az A mátrix hasonlóak. Ellenőrizzük, hogy teljesülnek-e a fent bizonyított tételek.
43 100 egyrészt det B det 1806 1800 6; 42 18 4 7 másrészt det A det 20 14 6; 2 5 valóban egyenlők. A B mátrix karakterisztikus polinomja
kB det B E
43
100
18
42
43 42 1800 2 6;
ugyancsak megegyezik az A karakterisztikus polinomjával. Ebből következik, hogy a B mátrix sajátértékei szintén λ1 = –3, λ2 = 2. Végül határozzuk meg a B sajátvektorait. A tétel szerint a B mátrix s’ sajátvektoraira s ' S1s teljesül. Számítsuk ki ezeket és ellenőrizzük az eredményeket. Egyrészt
2 3 1 5 s1 ' S 1s1 ; és valóban 1 1 1 2 43 100 5 215 200 15 5 Bs1 ' 3 ; 42 2 90 84 6 18 2 másrészt
152
Óbudai Egyetem BGK
Fejezetek a matematikából
2 3 7 14 6 20 s 2 ' S 1s 2 ; és valóban 1 1 2 7 2 9 43 100 20 860 900 40 20 Bs 2 ' 2 ; 42 9 360 378 18 18 9 Az igazolt tételekben fogalmazott tulajdonságok tehát valóban teljesülnek. A továbbiakban a hasonlóságnak egy nagyon speciális, az elmélet és a gyakorlat számára egyaránt legfontosabb esetét vizsgáljuk, azt amikor egy mátrix egy diagonális mátrixhoz hasonló. Ugyanis, egy diagonális mátrixnak a determinánsa a főátlóbeli komponensek szorzata, a sajátértékei éppen a főátló elemei, könnyen hatványozható, könnyen invertálható, egy diagonális együtthatómátrixú egyenletrendszer megoldása azonnal leolvasható, stb. egyszóval egy diagonális mátrixszal könnyű dolgozni. Ezért keressük a módszert, hogy milyen módon kapunk egy adott A mátrixhoz hasonló diagonális mátrixot. A válasz a sajátértékek elméletén alapszik. A most megfogalmazott állítás a lineáris algebra egyik legfontosabb tétele. 1.88.Tétel: (Mátrix diagonalizálhatósága) Tegyük fel, hogy az n-ed rendű A mátrixnak létezik n-db lineárisan független sajátvektora. Ekkor hasonló ahhoz a diagonális mátrixhoz, melynek főátlójában a sajátértékek állnak. A hasonlóságot az a reguláris S mátrix adja, melynek oszlopvektorai a lineárisan független sajátvektorok. Bizonyítás: Mivel az S mátrix oszlopvektorai, a sajátvektorok, a feltétel szerint lineárisan függetlenek, ezért az S mátrix rangja n, valóban reguláris, létezik az inverze. Legyenek a – nem feltétlenül különböző – sajátértékek λi és a megfelelő – szükségképpen páronként különböző, hiszen lineárisan független – sajátvektorok si, i = 1, 2, …, n. Ekkor teljesül, hogy Asi = λisi , i = 1, 2, …, n. Vegyük észre, hogy ez az n db egyenlőség felírható mátrixszorzás segítségével is.
A s1 s 2 ... s n 1s1 2s 2 ... ns n s1 s 2
1 0 0 2 ... s n ... ... 0 0
... 0 ... 0 ; ... ... ... n
Ha a sajátértékeket tartalmazó diagonális mátrixot Λ jelöli, a sajátvektorokból, mint oszlopvektorokból képezett reguláris mátrixot pedig S, akkor ez az egyenlőség az egyszerűbb
AS SΛ; alakban írható. ha ezt megszorozzuk balról az S mátrix inverzével, akkor azt kapjuk, hogy
1 0 0 2 1 S AS Λ ... ... 0 0 153
... 0 ... 0 ; ... ... ... n
Óbudai Egyetem BGK
Fejezetek a matematikából
Az A mátrix tehát valóban hasonló egy diagonális mátrixhoz. ■ Az alkalmazások során fontos szerep jut a fordított kapcsolatnak is. A SΛS1;
Tehát az A mátrix előállítható egy reguláris mátrix és egy diagonális mátrix segítségével a fenti szorzat alakjában. A tételben szereplő S mátrix szerepének fontossága miatt nevet is kapott. 1.57.Definíció: Azt a kvadratikus mátrixot, melynek oszlopvektorai az A mátrix lineárisan független sajátvektorai modálmátrixnak nevezzük. A vizsgált eljárást is egyetlen szóval fejezzük ki. 1.58.Definíció: Az A mátrixot diagonalizálhatónak nevezzük, ha hasonló egy diagonális mátrixhoz. 1.75.Példa: Hozzuk az alábbi harmadrendű mátrixot diagonális alakra egy hasonlósági transzformációval. 3 2 1 A 3 4 3 ; 2 4 0
Egy korábbi példában már előállítottuk ezen mátrix sajátértékeit. Ezek a következők 1 5, 2,3 2 . Tehát két valós sajátérték van, a λ1 = –5 sajátérték algebrai multiplicitása 1, a λ2,3 = 2 sajátérték algebrai multiplicitása 2. Meghatároztuk a sajátértékekhez tartozó sajátvektorokat is. Ezek rendre a következők. 1 2 1 s1 3 ; s 2 1 ; s3 0 ; 2 0 1
Az A mátrixnak tehát van 3 db lineárisan független sajátvektora, tehát diagonalizálható. Az előbbiekből következik, hogy az A mátrixhoz tartozó modálmátrix és annak inverze az alábbi. 1 2 1 1 2 1 1 1 S 3 1 0 ; S 3 1 3 ; 7 2 0 1 2 4 5
Ezzel már fel is írhatjuk az A mátrix diagonális alakját magadó szorzatot. 154
Óbudai Egyetem BGK
Fejezetek a matematikából
1 2 1 3 2 1 1 2 1 5 0 0 1 S AS Λ; azaz ; 3 1 3 3 4 3 3 1 0 0 2 0 ; 7 2 4 5 2 4 0 2 0 1 0 0 2 1
Ez az összefüggés azonban megfordítva is nagyon fontos. 3 2 1 1 2 1 5 0 0 1 2 1 1 A SΛS ; azaz ; 3 4 3 3 1 0 0 2 0 3 1 3 ; 7 2 4 0 2 0 1 0 0 2 2 4 5 1
Annak ellenőrzését, hogy a felírt egyenlőségek valóban teljesülne, az Olvasóra bízzuk. A bemutatott példában az A mátrixnak csak két különböző sajátértéke van, de van három lineárisan független sajátvektora. Ha viszont a különböző sajátértékek száma megegyezik a mátrix rendjével sokkal egyszerűbb a helyzet. 1.89.Tétel: Ha az A mátrixnak létezik n db különböző sajátértéke, akkor diagonalizálható. Bizonyítás: Ha n db páronként független sajátérték van, akkor létezik n db lineárisan független sajátvektor, ugyanis korábban igazoltuk, hogy különböző sajátértékekhez lineárisan független sajátvektorok tartoznak. Ez pedig az előző tétel alapján már igazolja az állítást. ■ 1.76.Példa: Diagonalizáljuk az alábbi mátrixot. 2 1 1 A 1 2 1 ; 1 1 2
Korábban már meghatároztuk ezen mátrix sajátértékei és sajátvektorait. A sajátértékek a következők, 1 1, 2 2, 3 3 . Az A mátrix harmadrendű és létezik 3 db különböző sajátérték, tehát A diagonalizálható. a sajátvektorok rendre a következők. 0 1 1 s1 1 ; s 2 1 ; s3 0 ; 1 1 1
Innen következik, hogy a modálmátrix és inverze az alábbi. 0 1 1 1 0 1 1 S 1 1 0 ; S 1 1 1 ; 1 1 1 0 1 1
155
Óbudai Egyetem BGK
Fejezetek a matematikából
Ebből adódik az A mátrix diagonális alakjának előállítása. 1 0 1 2 1 1 0 1 1 1 0 0 S 1AS Λ; azaz ; 1 1 1 1 2 1 1 1 0 0 2 0 ; 0 1 1 1 1 2 1 1 1 0 0 3
valamint megfordítva 2 1 1 0 1 1 1 0 0 1 0 1 A SΛS ; azaz ; 1 2 1 1 1 0 0 2 0 1 1 1 ; 1 1 2 1 1 1 0 0 3 0 1 1 1
A szorzat kiszámítását és az ellenőrzést ismét az Olvasóra bízzuk. Kaptuk tehát, hogy ha egy n-ed rendű kvadratikus mátrixnak létezik n db különböző sajátértéke, vagy ha nem létezik n db különböző sajátérték, de létezik n db lineárisan független sajátvektor, akkor diagonalizálható. Ha azonban a sajátértékek száma kisebb, mint n és ezzel együtt nem létezik n db lineárisan független sajátvektor, akkor a mátrix nem diagonalizálható. Ebben az esetben az ún. Jordan-féle alakra lehet hozni, amely a lineáris algebra egyik legnehezebb tételén alapszik. Az érdeklődő olvasónak a szakirodalom tanulmányozását javasoljuk. 1.77.Példa: Vizsgáljuk meg, hogy az alábbi A mátrix diagonalizálható-e. 1 1 1 A 1 1 1 ; 0 1 2
Korábban láttuk, hogy a sajátértékek a következők, a λ1 = 2 sajátérték algebrai multiplicitása 1, a λ2,3 = 1 sajátérték algebrai multiplicitása 2. Meghatároztuk a sajátvektorokat is. Ezek rendre a következők. 1 1 s1 0 ; s 2 1 ; 1 1
A λ2,3 = 1 sajátérték algebrai multiplicitása 2, a sajátaltér dimenziója azonban csak 1, tehát nem tudunk megadni egynél több lineárisan független sajátvektort ehhez a sajátértékhez. Összesen tehát mindössze két lineárisan független sajátvektor létezik, tehát ez a mátrix nem diagonalizálható, nem hasonló egy diagonális mátrixhoz. A diagonalizáció mellékesen megkönnyíti egy diagonalizálható A mátrix pozitív egész kitevőjű hatványának a kiszámítását. 156
Óbudai Egyetem BGK
Fejezetek a matematikából
Határozzuk meg egyszerű számítással az A mátrix n-edik hatványát úgy, hogy felhasználjuk a diagonalizálhatóságot, vagyis az A SΛS1 összefüggést. Ekkor ugyanis
An SΛS1 SΛS1 ... SΛS1 SΛS1SΛS1...SΛS1 SΛnS1 ;
elég tehát egy diagonális mátrixot hatványozni. Arra az eredményre jutottunk tehát, hogy Ha A SΛS1; akkor An SΛnS1; ;
Mutassunk erre egy példát. 1.78.Példa: Számítsuk ki az alábbi mátrix ötödik hatványát.
4 8 A ; 2 6 Könnyen ellenőrizhető, hogy a sajátértékek 1 2, 2 4 , a hozzájuk tartozó sajátvektorok pedig rendre a következők.
4 1 s1 ; s 2 ; 1 1 Innen kapjuk a modálmátrixot és inverzét.
4 1 1 1 1 1 S ; S 3 1 4 ; 1 1 Ahonnan az A mátrix szorzat alakja az alábbi.
1 4 1 2 0 1 1 A SΛS 1; azaz ; A ; 3 1 1 0 4 1 4 Innen az ötödik hatvány könnyen adódik a diagonális mátrix ötödik hatványának kiszámításával. 5
0 1 1 384 1408 1 4 1 2 0 1 1 1 4 1 32 A ; 3 1 1 0 4 1 4 3 1 1 0 1024 1 4 352 1376 5
A formula alkalmazása magasabb kitevőjű hatványoknál még több művelet megtakarítását jelenti. A diagonalizálhatóságra vonatkozó tétel különleges módon teljesül szimmetrikus mátrixokra. Az alább megfogalmazott állítás a lineáris algebra egyik alaptétele. 157
Óbudai Egyetem BGK
Fejezetek a matematikából
1.90.Tétel: (Szimmetrikus mátrixok diagonalizásása) Ha A szimmetrikus mátrix, akkor ortogonális mátrixszal diagonalizálható, azaz mindig létezik olyan ortogonális Q mátrix, melyre igaz, hogy Q1AQ Λ;
ahol Λ az a diagonális mátrix melynek főátlójában az A mátrix sajátértékei állnak. Bizonyítás: Azt már igazoltuk, hogy egy szimmetrikus mátrix sajátértékei valósak, és a különböző sajátértékekhez tartozó sajátvektorok ortogonálisak. Ha a sajátvektorok ortogonálisak, akkor minden sajátvektort osztva az abszolút értékével, azaz lenormálva egy ortonormált sajátvektor rendszert kapunk. a) Ha az A mátrixnak van n db páronként különböző sajátértéke, akkor ez azt jelenti, hogy az ortonormált sajátvektor rendszer n-elemű. Ezekből a vektorokból, mint oszlopvektorokból képezhetünk egy S modálmátrixot. Mivel az oszlopvektorrendszer ortonormált a modálmátrix ortogonális mátrix. Alkalmazhatjuk tehát a szokásos Q = S jelölést. Ekkor a korábban igazolt általános tétel szerint igaz az
1 0 0 2 1 1 S AS Q AQ Λ ... ... 0 0
... 0 ... 0 ; ahol i j ha i j; ... ... ... n
összefüggés. b) Ha az A mátrixnak n-nél kevesebb különböző sajátértéke van, akkor ez azt jelenti, hogy vannak olyan sajátértékek, amelyeknek algebrai multiplicitása legalább 2. Itt nem részletezzük a bizonyítást, csak megjegyezzük, hogy ha az A mátrix szimmetrikus, akkor minden egyes sajátérték algebrai multiplicitása egyenlő a geometriai multiplicitással. Ez azt jelenti, hogy ha n-nél kevesebb sajátérték van, akkor is meg lehet adni n-db lineárisan független sajátvektort, azaz minden sajátaltér dimenziója megegyezik a megfelelő sajátérték algebrai multiplicitásával, azaz minden legalább két dimenziós sajátaltérben meg lehet adni annyi lineárisan független sajátvektort amennyi a sajátérték algebrai multiplicitása. Ha ezek nem ortogonálisak, akkor a Gram-Schmidt-féle ortogonalizációs eljárással elő lehet állítani ortonormált sajátvektorokat. A bizonyítás helyett inkább egy példán mutatjuk be az eljárást. Tehát ha a szimmetrikus A mátrixnak vannak többszörös sajátértékei, akkor is létezik n db ortonormált sajátvektora, tehát ugyancsak igaz az S1AS Q1AQ Λ összefüggés, annyi különbséggel, hogy most a diagonális mátrix főátlójában lehetnek azonos elemek is. ■ Mivel a Q mátrix ortogonális, egy korábbi tétel alapján tudjuk, hogy inverze megegyezik a transzponáltjával, azaz Q–1 = QT. Ebből következik, hogy szimmetrikus mátrixok diagonalizációja az alábbi egyszerűbb összefüggéssel is megadható. QT AQ Λ; vagy A QΛQT ;
158
Óbudai Egyetem BGK
Fejezetek a matematikából
Ahol tehát a Q modálmátrix ortogonális mátrix. Felmerülhet a kérdés, hogy van-e olyan mátrix amely nem szimmetrikus és ortogonális mátrixszal diagonalizálható. A válasz nemleges ez a tulajdonság a szimmetrikus mátrixok privilégiuma. 1.91.Tétel: Ha egy A mátrix ortogonális mátrixszal diagonalizálható, akkor az szimmetrikus. Bizonyítás: Tegyük fel, hogy egy A mátrixra teljesül, hogy QT AQ Λ; azaz A QΛQT . Meg kell mutatnunk, hogy ekkor AT = A. Felhasználva a faktorizációt és a szorzat transzponálására vonatkozó összefüggést, kapjuk, hogy
AT QΛQT
Q T
T
T
ΛTQT QΛTQT QΛQT A;
mivel egy diagonális mátrix transzponáltja saját maga. ■ 1.79.Példa: Diagonalizáljuk az alábbi szimmetrikus mátrixot.
4 2 A ; 2 1 Korábban már kiszámítottuk, hogy a két sajátérték, λ1 = 0 és λ2 = 5, tehát létezik két különböző sajátérték, a hozzájuk tartozó sajátvektorok pedig rendre a következők.
1 2 s1 ; s 2 ; 2 1 Azt is ellenőriztük már, hogy a sajátvektorok ortogonálisak. A diagonalizációhoz azonban ortonormált rendszerre van szükség, tehát a sajátvektorokat normálni kell.
1 2 5 5 s1 1 4 5; s10 ; s 2 4 1 5; s02 ; 2 1 5 5 Ebből az ortonormált rendszerből megszületik az ortogonális modálmátrix és inverze. 1 5 SQ 2 5
2 1 5 5 ; S 1 Q 1 QT 1 2 5 5
2 5 ; 1 5
Ezek alapján pedig felírhatjuk a szimmetrikus A mátrix diagonalizációját jelentő szorzatot. 159
Óbudai Egyetem BGK
Fejezetek a matematikából
QT AQ
1 5 2 5
2 1 5 4 2 5 1 2 1 2 5 5
2 5 0 0 Λ; 1 0 5 5
Valamint a fordított összefüggés. 1 4 2 5 A 2 1 2 5
2 1 5 0 0 5 1 0 5 2 5 5
2 5 QΛQT ; 1 5
Ebben a példában a diagonális Λ mátrix főátlójában is van zérus elem, de ez lehetséges, hiszen a sajátértékek egyike zérus. 1.80.Példa: Diagonalizáljuk az alábbi szimmetrikus mátrixot.
1 2 2 A 2 1 2 ; 2 2 1 A karakterisztikus egyenlet a következő. 1 2 det A E 2 1 2
2
2 2 2 5 1 0; 1
Kapjuk, hogy a sajátértékek a következők, λ1 = 5, egyszeres sajátérték, λ2,3 = –1 kétszeres sajátérték. Ellenőrizhető, hogy a λ1 = 5 sajátértékhez tartozó sajátvektor az t 1 s1 t ; t R \ 0 ; például s1 1 ; t 1
vektor. A kétszeres algebrai multiplicitású sajátértékhez tartozó sajátaltér viszont két dimenziós, a sajátvektorok a következő módon adhatók meg.
160
Óbudai Egyetem BGK
Fejezetek a matematikából
u v 1 1 1 1 s u u 1 v 0 ; u, v R \ 0 ; például s 2 1 ; s3 0 v 0 1 0 1
Ez utóbbi sajátaltérben kaptunk tehát két lineárisan független sajátvektort, amelyek láthatóan ortogonálisak s1-re, de mivel s2 , s3 1 ezek a sajátvektorok nem ortogonálisak egymásra. Tartsuk meg az q2 = s2 vektort változatlanul, s3 helyett pedig keressünk egy olyan második bázisvektort a sajátaltérben, amely ortogonális q2-re. Ezt a Gram-Schmidt-féle ortogonalizációval végezzük. Keressük a q3 vektort q3 = s3 – α23q2 alakban úgy, hogy q2 , q3 0 teljesüljön.
1 q2 , q3 q2 , s3 23 q2 , q2 0; azaz 1 223 0; ahonnan 23 ; 2 A kiszámított együttható felhasználásával kapjuk a q2-re ortogonális harmadik sajátvektort. 1 1 1 1 q3 s3 23q 2 0 1 2 2 1 0
T
1 1 ; 2
Kaptunk tehát egy ortogonális sajátvektor rendszert. T
1 1 q1 1 1 1 ; q2 1 1 0 ; q3 1 ; 2 2 T
T
Minden sajátvektort osztva az abszolút értékével, ortonormált sajátvektor rendszert kapunk.
q10
1 3
T
1 1 0 ; q2 3 2
1 3
1 2
T 1 0 ; q30 6
1 6
Ebből az ortonormált rendszerből előáll az ortogonális modálmátrix és inverze. SQ
1 3 1 3 1 3
1 2 1 2 0
1 1 6 3 1 1 1 1 T ; S Q Q 6 2 1 2 6 3
1
3 1 2
1 6
1 3 0 ; 2 3
A modálmátrix ismeretében pedig felírhatjuk a diagonalizációt jelentő faktorizációt
161
T
2 ; 3
Óbudai Egyetem BGK 1 3 1 T Q AQ 2 1 6
Fejezetek a matematikából 1 1 3 1 2 2 3 1 0 2 1 2 2 2 1 3 2 1 3 3
1 3 1 2 1
6
1 2 1 2 0
1 6 5 0 0 1 0 1 0 Λ; 6 0 0 1 2 3
valamint a fordított összefüggést 1 2 2 A 2 1 2 2 2 1
1 3 1 3 1 3
1 2 1 2 0
1 1 6 5 0 0 3 1 1 0 1 0 6 2 0 0 1 2 1 3 6
1
162
3 1 2
1 6
1 3 0 QΛQT ; 2 3
Óbudai Egyetem BGK
Fejezetek a matematikából
1.17. Kvadratikus alakok. Pozitív definit mátrixok Az alkalmazások szempontjából fontosak az olyan többhatározatlanú polinomok, amelyekben az ismeretlenek vagy második hatványai vagy kéttényezős szorzatai szerepelnek. Ezeket az algebra kvadratikus alakoknak nevezi, és tanulmányozásuk nagyon hatékonyan elvégezhető a lineáris algebra eszközeivel, különös tekintettel a sajátértékek és a determinánsok elméletére. 1.59.Definíció: Legyen az ARn×n szimmetrikus mátrixés xRn egy n-komponensű vektor. Ekkor a
Q x xT Ax x1
a11 a ... xn 12 ... a1n
x2
a12 a22 ... a2 n
... a1n x1 ... a2 n x2 n n a x x ; ... ... ... i 1 j 1 ij i j ... ann xn
szorzatot kvadratikus alaknak nevezzük. Nézzük meg konkrétan n = 2 és n = 3 esetben, hogyan is néz ki egy ilyen kvadratikus alak. Két dimenzióban az általános alakja a következő.
Q x xT Ax x1
a x2 11 a12
a12 x1 2 2 aij xi x j a11x12 2a12 x1x2 a22 x22 ; a22 x2 i 1 j 1
Három dimenzióban pedig az alábbi módon írható. Q x x Ax x1 T
x2
a11 x3 a12 a13
a12 a22 a23
a13 x1 3 3 a23 x2 aij xi x j i 1 j 1 a33 x3
a11 x12 a22 x22 a33 x32 2a12 x1 x2 2a13 x1 x3 2a23 x2 x3 ;
Hangsúlyozzuk, hogy a kvadratikus alakot szimmetrikus mátrix esetén értelmeztük. Elvileg értelmezhető lenne tetszőleges kvadratikus mátrix esetén is, azonban egy példa meggyőz arról, hogy elég a szimmetrikus mátrixok esetét vizsgálni.
5 2 5 3 1.81.Példa: Legyen A valamint B és írjuk fel mindkét mátrixhoz tartozó 2 3 1 1 kvadratikus alakot a fenti definíció szerint. Egyrészt Q x xT Ax x1
5 2 x1 2 2 2 2 x2 x 5 x1 2 x1 x2 2 x2 x1 3x2 5x1 4 x1 x2 3x2 ; 2 3 2 163
Óbudai Egyetem BGK
Fejezetek a matematikából
másrészt pedig
Q x xT Bx x1
5 3 x1 x2 5 x12 3x1 x2 x2 x1 3x22 5x12 4 x1x2 3x22 ; 1 3 x2
Tehát a két mátrix ugyanazt a kvadratikus alakot határozza meg. Mi a kapcsolat a szimmetrikus B BT A és a nem szimmetrikus B mátrix között? Nyilván az, hogy A . Ez általában is igaz. 2 1.92.Tétel: HaB nem szimmetrikus mátrix, akkor az A
B BT szimmetrikus mátrix ugyanazt 2
a kvadratikus alakot határozza meg, mint a B. Bizonyítás: Képezzük a B mátrixszal a kvadratikus alakot. Ha felhasználjuk a mátrixok szorzásának disztributív tulajdonságát, valamint azt a tényt, hogy a valós számok szorzásának kommutativitása miatt a BT nyilván ugyanazt a kvadratikus alakot határozza meg, mint B kapjuk, hogy Q x xT Bx
1 T 1 1 B BT x Bx xT BT x xT B BT x xT x xT Ax; 2 2 2 2
ami éppen a bizonyítandó állítás. ■ Elég tehát kizárólag szimmetrikus mátrixokhoz rendelni kvadratikus alakot. Ennek fő oka az, hogy a szimmetrikus mátrixok az előző pontokban igazolt tételek alapján a legelőnyösebb tulajdonságokkal rendelkeznek. A kvadratikus alakokat az alkalmazások szempontjából úgy érdemes jellemezni, hogy milyen előjelű valós értékeket vesznek fel. Alkalmazási területként megemlítjük az analitikus geometriát, ahola másodrendű görbék és másodrendű felületek osztályozásában van alapvető szerepe, valamint a többváltozós függvények analízisét ahol a szélsőérték vizsgálatában játszik nélkülözhetetlen szerepet. Erre vonatkozik az alábbi definíció. 1.60.Definíció: Legyen A szimmetrikus mátrix. Azt mondjuk, hogy az A mátrix a) Pozitív definit, ha tetszőleges nullvektortól különböző xRn esetén xT Ax 0 . b) Negatív definit, hatetszőleges nullvektortól különböző xRn esetén xT Ax 0 . c) Pozitív szemidefinit, ha tetszőleges xRn esetén xT Ax 0 . d) Negatív szemidefinit, ha tetszőleges xRn esetén xT Ax 0 . e) Indefinit, ha xT Ax pozitív és negatív előjelű értéket is felvesz. Megjegyezzük, hogy az a) és b) pontokban azért zártuk ki a definícióból a nullvektort, mert ha x = 0 akkor nyilván xT Ax 0 teljesül.
164
Óbudai Egyetem BGK
Fejezetek a matematikából
A szimmetrikus mátrixok „definitsége” kiválóan tanulmányozható a sajátértékek és a determinánsok elméletének alkalmazásával. Mielőtt az általános tételt megfogalmazzuk és bizonyítjuk, példákkal illusztráljuk a definiált fogalmakat. 1.82.Példa: A definícióban foglalt minden típusra mutatunk egy-egy példát.
4 2 a) Az A mátrix pozitív definit, ugyanis 2 3 4 2 x1 2 x2 4 x12 4 x1 x2 3x22 2 x1 x2 2 x22 0; 2 3 x2
xT Ax x1
és nyilván csak a nullvektor esetén lesz zérus.
1 1 b) A B mátrix negatív definit, ugyanis 1 3 xT Bx x1
1 1 x1 2 x2 x12 2 x1x2 3x22 x1 x2 2 x22 0; 1 3 x2
és nyilván csak a nullvektor esetén zérus.
8 4 c) A C mátrix pozitív szemidefinit, ugyanis 4 2 x Cx x1 T
2 8 4 x1 1 2 2 x2 8 x1 8 x1 x2 2 x2 8 x1 2 x2 0; 4 2 x2
de nyilván nem csak a nullvektorhoz rendel nulla értéket. Legyen például x 1 2 . Látható hogy a helyettesítési érték zérus. T
1 3 d) A D mátrix negatív szemidefinit, ugyanis 3 9 xT Dx x1
1 3 x1 2 x2 x12 6 x1 x2 9 x22 x1 3x2 0; 3 9 x2
és jól láthatóan nem csak a nulla vektorhoz rendel nulla értéket. Például az x 3 1 vektorhoz a nulla értéket rendeli.
T
165
Óbudai Egyetem BGK
Fejezetek a matematikából
2 1 e) Az F mátrix indefinit, ugyanis 1 4 xT Fx x1
2 1 x1 x2 2 x12 2 x1 x2 4 x22 ; 1 4 x2
és itt nincs szükség a további alakításra, ugyanis helyettesítéssel adódik, hogy például az
x 1 0 vektorhoz –2-t tehát negatív értéket, az x 0 1 pozitív értéket rendel. T
T
vektorhoz pedig +4-et, tehát
Vizsgáljuk meg elsőként egy speciális esetben, a másodrendű szimmetrikus mátrix esetében, mi a feltétele annak, hogy az pozitív illetve negatív definit legyen. Legyen tehát
a b A ; b c egy másodrendű szimmetrikus mátrix. Vizsgáljuk meg általánosan ezen mátrixhoz rendelt kvadratikus alak előjelviszonyait. Teljes négyzetté kiegészítéssel és azonos átalakítással a kvadratikus alak a következő formát ölti. Q x xT Ax x1
2 a b x1 b ad b2 2 2 2 x2 ax 2 bx x cx a x x x2 ; 1 1 2 2 2 1 a a b c x2
Első kérdés az, hogy milyen feltételek mellett teljesül, hogy A pozitív definit. Világos, hogy ha teljesül, hogy a> 0 és ad– b2> 0 akkor az A pozitív definit mátrix. Ez a feltétel fordítva is nyilván igaz, azaz ha A pozitív definit, akkor ennek a két egyenlőtlenségnek teljesülnie kell. Vegyük észre, hogy az első feltétel az, hogy a bal felső sarokaldeterminánsa pozitív, a második feltétel pedig az, hogy a determinánsa pozitív. E kettő tehát elégséges feltétel arra, hogy A pozitív definit legyen. További kérdésként megfogalmazódik, hogy van-e valami kapcsolat a definitség és a sajátértékek között. Hogy ezt kiderítsük, határozzuk meg a szimmetrikus másodrendű mátrix sajátértékeit is. A karakterisztikus egyenlete a következő.
A E
a
b
b
c
2 a d ad b2 0;
A sajátértékek elméletéből tudjuk, hogy 12 ad b2 valamint 1 2 a d . Ha feltesszük, hogy a mátrix pozitív definit, azaz teljesül, hogy a> 0 és ad– b2> 0, akkor ad>b2 miatt az is igaz, hogy d> 0, ebből pedig következik, hogy a + d > 0. Ha pedig teljesül, hogy 12 ad b2 0 és az is, hogy 1 2 a d 0 akkor ezekből következik, hogy mindkét sajátérték szükségképpen pozitív. A gondolatmenet fordított irányban is végigvezethető. Ha mindkét sajátérték pozitív, akkor teljesül, hogy ad b2 0 és az is hogy a d 0 . Ekkor a 166
Óbudai Egyetem BGK
Fejezetek a matematikából
szükségképpen pozitív, mert ha negatív lenne, akkor d-nek is negatívnak kellene lennie, hogy ad>b2 teljesülhessen, de ekkor a + d < 0 lenne. Igazoltuk tehát a következőt. 1.93.Tétel: A másodrendű szimmetrikus A mátrix akkor és csak akkor pozitív definit ha mindkét sajátértéke pozitív, továbbá akkor és csak akkor pozitív definit, ha a determinánsa és a bal felső sarokaldeterminánsa is pozitív. ■ Ez a tétel általánosan is igaz, ennek igazolása következik most. Azonban a rövidség érdekében egybefogalmazunk két tételt. 1.94.Tétel: A szimmetrikus A mátrix akkor és csak akkor pozitív (negatív) definit, ha minden sajátértéke pozitív (negatív). Bizonyítás: Először tegyük fel, hogy az A mátrix pozitív (negatív) definit. Ekkor tetszőleges nullvektortól különböző xRn esetén xT Ax 0 ( xT Ax 0 ). Ez természetesen igaz az ortonormált sajátvektorokra is. Azaz tetszőleges si , (i = 1, 2, ..., n) sajátvektorra igaz, hogy 2
siT Asi siT i si i siTsi i si i 0; i 1, 2,..., n; 2
( siT Asi siT i si i siTsi i si i 0; i 1, 2,..., n; ) amiből nyilvánvalóan következik, hogy minden sajátérték pozitív (negatív). Fordítva tegyük fel, hogy minden sajátérték pozitív (negatív). Mivel a sajátvektorok ortonormált rendszere bázis Rn-ben, ezért tetszőleges xRn előállítható, méghozzá egyértelműen a sajátvektorok lineáris kombinációjaként.
x 1s1 2s2 ... nsn ; Ebben az esetben, felhasználva a mátrixszorzás disztributív tulajdonságát, valamint azt, hogy a sajátvektorok ortonormált rendszert alkotnak adódik, hogy
xT Ax 1s1 2s 2 ... ns n A 1s1 2s 2 ... ns n T
1s1 2s 2 ... ns n
1As1 2 As2 ... n Asn T 1s1 2s 2 ... ns n 11s1 2 2s 2 ... n ns n T
121 22 2 ... n2 n amely összeg pozitív ha a sajátértékek pozitívok (negatív ha a sajátértékek negatívok). ■ Ebből az alaptételből már következik, hogy ha a sajátértékek között van negatív is és pozitív is akkor a mátrix indefinit, ha pedig a sajátértékek pozitívok és nullák akkor a mátrix pozitív szemidefinit, ha negatívok és nullák akkor negatív szemidefinit. A sajátértékekkel tehát kiválóan le lehet írni szimmetirkus mátrixok definit tulajdonságait.
167
Óbudai Egyetem BGK
Fejezetek a matematikából
1.83.Példa: Mutassuk meg, hogy az alábbi mátrix pozitív definit. 3 2 0 A 2 4 2 ; 0 2 5
Számítással ellenőrizhető, hogy a mátrix sajátértékei λ1 = 1, λ2 = 4 és λ3 = 7. Mindhárom sajátérték pozitív, ezzel igazoltuk, hogy a mátrix pozitív definit. A hozzájuk tartozó ortonormált sajátvektorok pedig rendre a következők.
2 2 1 3 3 3 2 1 2 s1 ;s ; s ; 3 2 3 3 3 1 2 2 3 3 3 Ezekre csak a későbbiekben lesz szükségünk. De ha már a kezünkben vannak a sajátértékek, és tudjuk, hogy A pozitív definit, mutassuk meg, hogy a kvadratikus alak valóban pozitív értéket vesz fel minden nullától különböző vektor esetén.Valóban, teljes négyzetté kiegészítéssel azt kapjuk, hogy x Ax x1 T
x2
3 2 0 x1 x3 2 4 2 x2 3x12 4 x22 5 x32 4 x1 x2 4 x2 x3 0 2 5 x3 2
2
2 8 3 7 3 x1 x2 x2 x3 x32 ; 3 3 4 2
ami közvetlenül is igazolja, hogy A pozitív definit. A pozitív definit tulajdonsággal kapcsolatban egy olyan állítást igazolunk, amely hasznos a Gauss-féle normálegyenlet szempontjából. Emlékeztetünk rá, ez az egyenlet az amely a legkisebb négyzetek módszere esetén oldandó meg. Ebben szerepel az ATA mátrix. Erre a mátrixra vonatkozik a következő állítás. 1.95.Tétel: Legyen ARn×k tetszőleges mátrix. Ekkor az ATA mátrix pozitív szemidefinit. Ha még az is teljesül, hogy az A rangja k, akkor az ATA mátrix pozitív definit. Bizonyítás: Azt már korábban igazoltuk, hogy az ATA mátrix kvadratikus és szimmetrikus. képezzünk ezzel a mátrixszal egy kvadratikus alakot. Legyen xRk tetszőleges. A mátrixszorzás asszociativitása valamint a szorzat transzponálására vonatkozó összefüggés szerint azt írhatjuk, hogy
168
Óbudai Egyetem BGK
Fejezetek a matematikából
xT AT A x xT AT Ax Ax
T
Ax Ax 2 0;
Ez pedig pontosan azt jelenti, hogy az ATA mátrix pozitív szemidefinit. Tegyük most fel, hogy ρ(A) = k. Ekkor az Ax = 0 homogén lineáris egyenletrendszernek csak a triviális megoldása létezik, hiszen a rang megegyezik az ismeretlenek számával, ρ(A) = k, ekkor a szabadságfok zérus, tehát egyértelmű a megoldás. Ezt azt jelenti, hogy a fenti kvadratikus alak csak a nullvektorhoz rendel 0 értéket. Ez pontosan azt jelenti, hogy az ATA mátrix ρ(A) = k esetben pozitívdefinit. ■ 1.84.Példa: Mutassuk meg, hogy az ATA mátrix pozitív definit, ha 1 2 A 2 1 ; 1 0
vegyük észre, hogy ρ(A) = 2, ugyanis az A oszlopvektorai lineárisan függetlenek. Számítsuk ki az ATA szorzatot. 1 2 1 2 1 6 0 ; A A 2 1 0 5 2 1 0 1 0 T
Mivel a szorzat diagonális mátrix, a főátlóban éppen a sajátértékek állnak, amelyek mind pozitívok, tehát az ATA szorzat valóban pozitív definit mátrix. A továbbiakban a determinánsok elméletével is kapcsolatba hozzuk a pozitív és negatív definit mátrixok vizsgálatát. Az egyszerűbb szóhasználat érdekében szükség van az alábbi elnevezés bevezetésére. 1.61.Definíció: A kvadratikus A mátrix főminormátrixainak nevezzük azokat a kvadratikus mátrixokat amelyeket úgy kapunk az A mátrixból, hogy annak utolsó n – k sorát és utolsó n – k oszlopát elhagyjuk A-ból. Ilyen módon k-ad rendű kvadratikus mátrixokat kapunk, amelyből van n db. Tehát a főminormátrixok a következők.
a A1 a11 ; A 2 11 a21
a11 a12 a12 ; A3 a21 a22 a22 a31 a32
a11 a12 a13 a a a23 ; ...; A n 21 22 ... ... a33 an1 an 2
... a1n ... a2 n ; ... ... ... ann
Ezen mátrixok determinánsát főminoroknak nevezzük, vagy kevésbé elegáns kifejezéssel "bal felső sarokaldeterminánsok"-nak.
169
Óbudai Egyetem BGK
Fejezetek a matematikából
A definitség leírható a főminorok segítségével is, ezt fogalmazzuk meg az alábbi állításban. 1.96.Tétel: A szimmetrikus A mátrix esetében az alábbi állítások ekvivalensek. 1. Az A pozitív definit. 2. Az A összes főminorja pozitív. 3. Ha Gauss eliminációval LU szorzat alakban írjuk fel az A-mátrixot, akkor az összes pivot pozitív. Bizonyítás: Már bizonyítottuk, hogy az A pontosan akkor pozitív definit, ha minden sajátértéke pozitív. Ezt most felhasználjuk. Legyen tehát A pozitív definit. Ekkor minden nullvektortól különböző vektorra teljesül, hogy xT Ax 0 . Válasszuk meg az xRn vektort úgy, hogy az utolsó n – k koordinátája zérus legyen. Mivel ezekre is igaz az egyenlőtlenség kapjuk, hogy
xT Ax xk
... xk xTk A k xk 0; ... 0nk
A 0n k k ...
Ahol az A mátrix bal felső sarkában, éppen a k-ad rendű főminormátrix kap csak szerepet a szorzásban. Ez az egyenlőtlenség azt jelenti, hogy az Akmátrix is pozitív definit. Mivel egy pozitív definit mátrix minden sajátértéke pozitív, így Ak minden sajátértéke is pozitív. A determináns pedig a sajátértékek szorzata. Pozitív számok szorzata pedig pozitív. Ez pontosan azt jelenti, hogy minden k-ra a k-ad rendű főminor pozitív. Most igazoljuk, hogy ha a főminorok pozitívok, akkor a pivotok is pozitívok. Az elimináció során az A mátrix a következő módon alakul.
a11 a 21 A a31 ... an1
a12 a22 a32 ... an 2
a13 a23 a33 ... an3
... ... ... ... ...
a1n a11 a2 n 0 a3n ~ 0 ... ... ann 0
a12
a13
...
a22 1
a23
...
0
a33 2
...
...
...
...
0
0
...
1
a1n 1 a2 n 2 a3 n ; ... n ann
Az elimináció során alkalmazott lépések nem változtatják meg sem az A mátrix sem az Akfőminormátrixok determinánsát. Ebből következik, hogy a főminorok a következő mátrixok determinánsai.
a11 a12 a11 a12 1 A1 a11 ; A 2 ; A3 0 a22 1 0 a22 0 0
a11 a12 1 a13 0 a22 1 a23 0 ; ...; A n 0 2 ... ... a33 0 0
170
a13
...
1 a23
...
a33 ... ... ... 2
0
...
a1n 1 a2 n 2 a3 n ; ... n ann
Óbudai Egyetem BGK
Fejezetek a matematikából
Mivel a kapott főminormátrixok háromszög mátrixok, ezek determinánsa, tehát a főminorok a főátlóbeli elemek szorzata. Ebből következik, hogy teljesül az k 1 det Ak det Ak 1 akk ; k 1, 2,..., n
összefüggés. Mivel a feltétel szerint a főminorok pozitívok, ebből nyilvánvalóan következik,
; k 1, 2,..., n komponensek mind pozitívok. hogy a pivotok, tehát a akk Már csak azt kell igazolnunk, hogy ha a pivotok pozitívok, akkor a mátrix pozitív definit. Ehhez pedig felhasználjuk a szimmetrikus mátrixok LDLT felbontását. Ha ezzel felírjuk a kvadratikus alakot, – voltaképpen ezzel elvégeztünk egy teljes négyzetté kiegészítést –, akkor az adódik, hogy k 1
D L x ;
xT Ax xT LDLT x LT x
T
T
Ezzel, ha bevezetjük az y = LTx jelet, akkor azt kapjuk, hogy a kvadratikus alak egy teljes négyzet, és az együtthatók éppen a pivotok. Ebből már következik az A mátrix pozitív definit tulajdonsága. Ezzel az állítást bizonyítottuk.■ Fontos tisztázni az előző tétel negatív definit mátrixokra vonatkozó megfelelőjét, mert van egy nem nyilvánvaló különbség a két tételben. 1.97.Tétel: A szimmetrikus A mátrix esetében az alábbi állítások ekvivalensek. 1. Az A negatív definit. 2. Az A főminorjai váltakozó előjelűek, a páratlan rendű főminorok negatívok, a páros rendű főminorok pozitívok. 3. Ha Gauss eliminációval LU szorzat alakban írjuk fel az A-mátrixot, akkor az összes pivot negatív. Bizonyítás: Az előző tétel bizonyítása értelemszerű módisítással átvihető erre az esetre. Egyedül a főminorok váltakozó előjelére mutatunk rá. Ha minden pivot negatív, akkor negatív az a11 pivot is. Mivel a másodrendű főminor értéke det A2 a11a22 és a feltétel szerint az összes pivot 1
0 is teljesül, tehát det A2 0 mert két negatív szám szorzata. a negatív, így az a22 1
a33 három negatív szám szorzata, ezért negatív. harmadrendű főminor értéke det A3 a11a22 Hasonlóan adódik az állítás minden páros és páratlan rendű főminorra. ■ 1
2
1.85.Példa: Mutassuk meg, hogy az A mátrix pozitív definit, és ellenőrizzük ennek összes, fenti tételekben leírt következményét. 2 1 1 A 1 2 1 ; 1 1 2
Vizsgáljuk meg először a főminorokat.
171
Óbudai Egyetem BGK
Fejezetek a matematikából
2 1 1 2 1 det A1 2; det A 2 3; det A3 1 2 1 4; 1 2 1 1 2
Tehát mindegyik főminor pozitív. A sajátértékek λ1 = 4, λ2,3 = 1, ugyancsak pozitívok. A továbbiak kedvéért megadjuk az ortonormált sajátvektorokat is. Ezek rendre a következők. 1 1 1 3 6 2 1 1 1 s1 ; s 2 ; s3 ; 2 6 3 1 2 0 3 6
Végezetül határozzuk meg a pivotokat. 2 1 1 2 1 1 2 1 1 3 1 3 1 ; 1 2 1 ~ 0 2 2 ~ 0 2 2 1 1 2 4 1 3 0 0 0 2 2 3
Tehát a pivotok is pozitívok. 1.86.Példa: Mutassuk meg, hogy az A mátrix negatív definit, és ellenőrizzük ennek összes, fenti tételekben leírt következményét. 2 2 2 A 2 5 4 ; 2 4 5
Vizsgáljuk meg először a főminorokat. 2 2 2 2 2 det A1 2; det A 2 6; det A3 2 5 4 10; 2 5 2 4 5
Ezek valóban váltakozó előjelűek, a páratlan rendűek negatívok a páros rendű pozitív. Határozzuk meg a sajátértékeket. Ezek a következők λ1 = –10, λ2,3 = –1, valóban mind negatívok. A későbbiek kedvéért megadjuk a hozzájuk tartozó ortonormált sajátvektorokat is. Ezek rendre a következők. 172
Óbudai Egyetem BGK
Fejezetek a matematikából 2 2 1 5 3 3 5 4 2 1 s1 ; s 2 ; ; s3 3 3 5 5 5 0 2 3 3 5
Végül határozzuk meg a pivotokat. 2 2 2 2 2 5 4 ~ 0 2 4 5 0
2
3 2
2 2 2 2 2 ~ 0 3 2 ; 3 0 0 2, 6
Ezek is mind negatívok. A továbbiakban a kvadratikus alakok elméletének és a szimmetrikus mátrixok ortogonális diagonalizálhatóságának együttes következményeit vizsgáljuk. Ez a témakör a kvadratikus alakok négyzetösszeggé alakítása, amelynek különösen az analitikus geometriában, a másodrendű görbék és másodrendű felöletek osztályozásában alapvető szerepe van. Induljunk ki abból, hogy a szimmetrikus A mátrix ortogonális Q mátrixszal diagonalizálható az A QΛQT formula szerint, ahol Q tehát ortogonális mátrix, Λ pedig diagonális mátrix, melynek főátlójában a sajátértékek vannak. Képezzünk az A mátrixszal egy kvadratikus alakot, és vegyük figyelembe a felírt faktorizációt. Azt kapjuk, hogy
xT Ax xTQΛQT x QT x
T
ΛQT x;
Alkalmazzunk egy koordinátatranszformációt. Vezessük be az yRn vektort az y QT x definícióval. Ekkor az előző egyenlőség egyenértékű a következővel.
xT Ax y T Λy y1
y2
1 0 0 2 ... yn ... ... 0 0
... 0 y1 ... 0 y2 n i yi2 ; ... ... ... i 1 ... n yn
Azt kaptuk tehát, hogy ha az ortogonális Q mátrix segítségével az y QT x transzformációval áttérünk az x vektorról az y vektorra, akkor a kvadratikus alak négyzetösszeggé alakul. Igazoltuk a következő állítást.
173
Óbudai Egyetem BGK
Fejezetek a matematikából
1.98.Tétel: Ha A szimmetrikus mátrix, és Q az A mátrix ortonormált sajátvektoraiból, mint oszlopvektorokból képezett ortogonális mátrix, akkor az y QT x transzformációval értelmezett vektorok
alkalmazásával
xT Ax
az
kvadratikus
alak
négyzetösszegként
írható
fel
n
y T Λy i yi2 alakban, ahol a másodfokú tagok együtthatói éppen a sajátértékek. ■ i 1
1.87.Példa: Alakítsuk négyzetösszeggé a Q x 2 x12 2 x1x2 2 x22 kvadratikus alakot. Világos a definíciók szerint, hogy ez egyenértékű az
Q x xT Ax x1
2 1 x1 x2 ; 1 2 x2
szimmetrikus A mátrixszal adott kvadratikus alakkal. Határozzuk meg az A sajátértékeit és sajátvektorait. Ellenőrizhető, hogy a sajátértékek λ1 = 1, λ2= 3, – pozitív számok, tehát az A mátrix pozitív definit – , valamint a hozzájuk tartozó ortonormált sajátvektorok rendre a következők.
1 1 2 2 ; s2 ; s1 1 1 2 2 Ebből következően az ortogonális Q modálmátrix és inverze – amely megegyezik a transzponáltjával – az alábbi.
Q
1 1 1 T 1 1 1 1 1 ; Q ; 2 2 1 1
Ebből egyrészt kapjuk az A mátrix diagionalizációját
QT AQ
1 1 1 2 1 1 1 1 1 0 Λ; 2 1 1 1 2 2 1 1 0 3
illetve az A faktorizációját
2 1 1 1 1 1 0 1 1 T A 2 1 1 0 3 1 1 QΛQ ; 1 2 Hajtsuk most végre a koordinátatranszformációt.
174
Óbudai Egyetem BGK
Fejezetek a matematikából
y QT x
1 1 1 x1 1 x1 x2 y1 ; 2 1 1 x2 2 x1 x2 y2
Ezek felhasználásával adódik a kvadratikus alak négyzetösszeggé alakított formája.
1 0 1 x1 x2 x x x x x1 x2 1 1 2 3 1 2 ; 2 2 0 3 2 x1 x2 2
1 x Ax y Λy x1 x2 2 T
T
2
Egyszerűbb alakban írva tehát a kvadratikus alak négyzetösszeg formában a következő.
Q x
1 3 x1 x2 2 x1 x2 2 ; 2 2
1.88.Példa: Alakítsuk négyzetösszeggé a Q x 2 x12 2 x22 2 x32 2 x1x2 2 x1x3 2 x2 x3 kvadratikus alakot. Világos, hogy ez a kvadratikus alak egyenértékű a Q x x Ax x1 T
x2
2 1 1 x1 x3 1 2 1 x2 ; 1 1 2 x3
szimmetrikus mátrixszal adott kvadratikus alakkal. Ennek a szimmetrikus mátrixnak már meghatároztuk a sajátértékeités az ortonormált sajátvektor rendszerétaz 1.85. példában. A sajátértékek λ1 = 4, λ2,3 = 1, – tehát a mátrix, mint korábban láttuk pozitív definit –. Az ortonormált sajátvektorok rendre a következők. 1 1 1 2 3 6 1 1 1 s1 ; s 2 ; s3 ; 3 2 6 1 2 0 3 6
Ebből adódik az ortogonális modálmátrix és inverze. 1 3 1 Q 3 1 3
1 1 6 2 3 1 1 T 1 ; Q 2 6 2 1 0 2 6 6 1
1 3 3 1 0 ; 2 2 1 6 6 1
Ezekből egyrészt következik a szimmetrikus A mátrix diagonalizációja. 175
Óbudai Egyetem BGK
Fejezetek a matematikából 1 1 3 3 3 2 1 1 1 1 0 1 2 1 2 3 2 1 1 2 1 1 6 6 3
1 3 1 T Q AQ 2 1 6
1 6 2 4 0 0 1 1 0 1 0 Λ; 2 6 0 0 1 0 2 6
1
1
Illetve az A faktorizációja. 1 3 2 1 1 1 A 1 2 1 3 1 1 2 1 3
1 1 6 4 0 0 3 2 1 1 1 0 1 0 2 2 6 0 0 1 1 0 2 6 6 1
1 3 0 QΛQT ; 2 2 1 6 6
1
3 1
végezzük most el a szükséges koordinátatranszformációt. 1 3 1 y QT x 2 1 6
1 3 x 3 1 1 0 x2 2 2 x3 1 6 6 1
1 3
x1 1 2
1 6
1 3
x1
x1
1 6
x3 3 y1 1 x2 y2 ; 2 y 3 2 x2 x3 6
x2
1
Ezekkel az új koordinátákkal a kvadratikus alak négyzetösszeggé válik a következő módon. x Ax y Λy y1 T
T
y2
4 0 0 y1 y3 0 1 0 y2 0 0 1 y3
2
2
2
1 1 1 1 2 1 1 1 4 x1 x2 x3 1 x1 x2 1 x1 x2 x3 ; 3 3 3 2 6 6 6 2
Ezzel a négyzetösszeggé alakítást elvégeztük. Lineáris algebrai vizsgálataink utolsó lépéseként a fentiek egy további fontos következményét említjük meg, amely spektráltétel néven ismeretes. A spektráltétel segítségével a szimmetrikusA mátrixot nem faktorizáljuk, azaz nem szorzatként állítjuk elő, hanem összegként, felbontjuk eleminek tekinthető, egyszerű szerkezetű mátrixok összegére. Induljunk ki a diagonalizáció során felírt alakból.
176
Óbudai Egyetem BGK
Fejezetek a matematikából A QΛQT ;
ahol Q a modálmátrix, amely a szimmetrikus A mátrix ortonormált sajátvektoraiból, mint oszlopvektorokból képezett mátrix, a Λ pedig az a diagonális mátrix, amely az A sajátértékeit tartalmazza a főátlóban. Tekintsünk most erre az egyenlőségre más szemüvegen keresztül. Végezzük el a jobb oldali QΛQT szorzat kiszámítását, tekintetbe véve, hogy a középső tényező egy diagonális mátrix. Áttekinthető módon írva a szorzatot azt kapjuk, hogy
A QΛQT s1 s 2
1 0 0 2 ... s n ... ... 0 0
T 0 s1 ... 0 sT2 ; ... ... ... ... n sT n
...
Elvégezve a szorzást azt kapjuk, hogy
A 1s1s1T 2s2sT2 ... nsnsTn ; Felhívjuk a figyelmet, hogy a jobb oldalon, nem skaláris szorzatok hanem diadikus szorzatok állnak. A diádok az ortonormált sajátvektorok saját magukkal képezett diadikus szorzatai, az együtthatók pedig a sajátértékek. Igazoltuk tehát a következő tételt. 1.99.Tétel: (Szimmetrikus mátrixok spektráltétele) Minden n-ed rendű szimmetrikus A mátrix előállítható n db diád lineáris kombinációjaként, ahol a lineáris kombináció együtthatói az A mátrix sajátértékei, a diádok pedig az A mátrix ortonormált sajátvektorainak saját magukkal képezett diadikus szorzatai. ■ Mielőtt példákon szemléltetjük a felbontást, vegyük észre a következőt. Az si siT diádok projektor mátrixokat definiálnak. Emlékeztetünk, hogy egy P mátrix projektor mátrix, ha négyzete saját maga, azaz ha P2 = P. Igazoljuk, hogy a Pi si siT diád minden i-re projektor mátrix. Valóban a sajátvektorok ortonormáltságának és a szorzás asszociativitásának következtében
Pi2 sisiT
2
sisiTsisiT si 1 siT sisiT Pi ;
A fenti tétel tehát a következő módon is fogalmazható. 1.100.Tétel: (Szimmetrikus mátrixok spektráltétele) Minden n-ed rendű szimmetrikus A mátrix előállítható n db projektor mátrix lineáris kombinációjaként, ahol a lineáris kombináció együtthatói az A mátrix sajátértékei, a projektorok pedig az A mátrix ortonormált sajátvektorainak saját magukkal képezett diadikus szorzatai. Azaz
A 1P1 2P2 ... n Pn ; 177
Óbudai Egyetem BGK
Fejezetek a matematikából
1.89.Példa: Határozzuk meg az alábbi mátrix spektrális előállítását.
2 1 A ; 1 2 Az 1.87.példában már maghatároztuk a sajátértékeket, λ1 = 1, λ2= 3, valamint a hozzájuk tartozó ortonormált sajátvektorokat, amelyek rendre a következők.
1 1 2 2 ; s2 ; s1 1 1 2 2 Innen már számíthatjuk a spektráltételbeli diádokat.
1 2 1 P1 s1s1T 1 2 2
1 1 2 2 1 2
1 1 2 ; P s sT 2 1 2 2 2 1 1 2 2 2
1 1 2 2 1 2
1 2; 1 2
Ahonnan a spektrális felbontás a következő. 1 2 A 1s1s1T 2s 2sT2 1 1 2
1 1 2 2 3 1 1 2 2
1 2 2 1 ; 1 1 2 2
1.90.Példa: A témakör utolsó példájaként határozzuk meg az alábbi mátrix spektrális felbontását. 2 2 2 A 2 5 4 ; 2 4 5
Az 1.86. példából már tudjuk, hogy a sajátértékeket a következők λ1 = –10, λ2,3 = –1. A hozzájuk tartozó ortonormált sajátvektorok pedig rendre az alábbiak. 2 2 1 5 3 3 5 4 2 1 s1 ; s 2 ; ; s3 3 5 3 5 5 0 2 3 3 5
178
Óbudai Egyetem BGK
Fejezetek a matematikából
Képezzük most a diadikus szorzatokat. 1 3 T 2 1 P1 s1s1 3 3 2 3
2 3
1 9 2 2 3 9 2 9
2 9 4 9 4 9
2 2 5 9 4 T 1 2 ; P2 s 2s 2 9 5 5 4 0 9
2 3 5 4 2 P3 s3s3T 3 5 3 5 5 3 5
4 3 5
4 45 5 8 3 5 45 10 45
8 45 16 45 20 45
1 5
4 5 2 0 5 0
2 0 5 1 0 ; 5 0 0
10 45 20 ; 45 25 45
Ezen részeredmények alapján az A mátrix spektrális felbontása a következő összeg. A 1s1s1T 2s2sT2 3s3s3T 1 9 2 10 9 2 9
2 9 4 9 4 9
2 4 5 9 4 2 1 5 9 4 0 9
2 4 0 45 5 1 8 0 1 45 5 0 0 10 45
8 45 16 45 20 45
10 45 2 2 2 20 2 5 4 ; 45 2 4 5 25 45
A lineáris algebra további tanulmányozásához valamint alkalmazásához további eredményes munkát kívánunk!
179
Óbudai Egyetem BGK
Fejezetek a matematikából
2. fejezet Differenciálegyenletek
180
Óbudai Egyetem BGK
Fejezetek a matematikából
181
Óbudai Egyetem BGK
Fejezetek a matematikából
2.1. Elsőrendű differenciálegyenletek 2.1.1. Bevezető példák Mielőtt az általános vizsgálatokba belekezdenénk, néhány olyan fizikai problémát ismertetünk, amely megoldása differenciálegyenletre vezet, és amely egy ilyen egyenletnek a megoldását igényli. 2.1.1.Példa: Tegyük fel, hogy egy pékműhelyben a pék T0 = 200°C-os hőmérsékletű kenyeret vesz ki a kemencéből. A műhely hőmérséklete legyen Tk = 35°C. Határozzuk meg, hogy a kenyér "milyen módon hűl ki", azaz határozzuk meg, hogy T(t) hőmérséklete hogyan függ a t időtől! A kihűlés folyamatát leíró fizikai törvény a Newton-féle kihűlési törvény, mely szerint
dT t k T t Tk dt A kihűlési sebesség tehát arányos a hőmérséklet különbséggel és természetesen negatív, mert a kenyér hőmérséklete csökken. A k arányossági tényező egy anyagi minőségtől függő állandó. A probléma tehát egy olyan egyenletre vezetett, amelyben az ismeretlen egy függvény, és az egyenletben szerepel ennek az ismeretlen függvénynek a deriváltja is. 2.1.2.Példa: Tegyük fel, hogy egy R ellenállást és egy C kapacitást tartalmazó, kezdetben nyitott áramkörünk van. Az áramkörbe, nyitott kapcsolóállásnál, beiktatunk egy egyenáramú áramforrást, melynek konstans elektromotoros ereje U0. Határozzuk meg, hogy az áramkör zárását követően hogyan változik a kondenzátor Q töltése az időben, azaz állítsuk elő a Q = Q(t) függvény analitikus alakját, feltéve, hogy az áramkör zárását megelőzően a kondenzátor töltése zérus, azaz Q(0) = 0. A problémát leíró fizikai törvény nyilván a huroktörvény, mely szerint az egyes áramköri elemeken eső feszültségek összege egyenlő az elektromotoros erővel. Eszerint az egyenlet a következő: Q t I (t ) R U 0 C Nyilvánvalóan a körben folyó I = I(t) áramerősség nem állandó, hanem függ a kondenzátor Q(t) dQ t töltésétől. Ha felhasználjuk azt a definíciót mely szerint I t , akkor kapjuk a problémát dt leíró egyenletet. dQ t 1 R Q t U0 dt C Ismét egy olyan egyenletet kaptunk, amelyben az ismeretlen egy függvény, és az egyenletben szerepel a függvény deriváltja is. A későbbiekben meghatározzuk ezen egyenletek megoldását, de előtte ezek kapcsán értelmezzük a differenciálegyenletek elméletének tárgyalásához szükséges alapvető fogalmakat. 182
Óbudai Egyetem BGK
Fejezetek a matematikából
2.1.2. A differenciálegyenlet fogalma Differenciálegyenleten olyan egyenletet értünk, amelyben az ismeretlen egy függvény, amely lehet egy- vagy többváltozós, az egyenlet tartalmazza a függvényt, ennek az ismeretlen függvénynek első és esetleg magasabb rendű deriváltjait esetleg parciális deriváltjait, valamint szerepelhet még az egyenletben a függvény változója, többváltozós esetben a változói. A differenciálegyenletet közönségesnek nevezzük, ha az ismeretlen függvény egyváltozós y(x) függvény. Ha az ismeretlen függvény többváltozós, akkor az egyenletet parciális differenciálegyenletnek nevezzük. Egy differenciálegyenlet n-ed rendű, ha a benne szereplő legmagasabb rendű derivált rendje n. Egy differenciálegyenlet explicit, ha az egyenletből kifejezhető a legmagasabb rendű derivált, és implicit, ha nem. Ez utóbbi esetben 0-ra redukált alakban szokás az egyenletet felírni. Ennek fényében egy implicit közönséges elsőrendű differenciálegyenlet általános alakja: F(x, y, y’) = 0 egy implicit közönséges másodrendű differenciálegyenlet általános alakja pedig: F(x, y, y’, y”) = 0 Ahol y = y(x) az ismeretlen függvény, x a „független változó”, y’ és y” pedig az ismeretlen függvény deriváltjai. Ha a fenti egyenletek megoldhatók y’-re illetve y”-re akkor kapjuk az expilcit közönséges elsőrendű y’ = f(x, y) illetve az expilcit közönséges másodrendű y” = f(x, y, y’) differenciálegyenletet. Ebben a jegyzetben, műszaki és természettudományos jelentőségénél fogva elsősorban az utóbbi két típus vizsgálatával foglalkozunk.
183
Óbudai Egyetem BGK
Fejezetek a matematikából
2.1.3. Explicit közönséges elsőrendű differenciálegyenlet A bevezetett fogalmak ismertetése után nyilvánvalóan merül fel a kérdés: Mit jelent az, hogy megoldunk egy differenciálegyenletet? Mit nevezünk megoldásnak? Hány megoldás van? Foglalkozzunk részletesen az y ' x f x, y x explicit, közönséges elsőrendű differenciálegyenlettel. Az egyenlet jobb oldalán egy kétváltozós f(x, y) függvény szerepel. Tegyük fel, hogy ennek a függvénynek az értelmezési tartománya a T R 2 síkbeli tartomány. Ezt tekinthetjük a differenciálegyenlet értelmezési tartományának abban az értelemben, hogy a megoldások szempontjából csak olyan x, y x rendezett párok jöhetnek szóba, amelyek ebben a T tartományban benne vannak. 2.1.1.Definíció: Azt mondjuk, hogy a valós számok halmazának I intervallumán értelmezett y(x) függvény megoldása a differenciálegyenletnek, ha elvégezve a deriválásokat és a helyettesítést az egyenlet tetszőleges xI esetén teljesül, tehát az egyenlet az I intervallumon azonosság! Szokás mondani ekkor, hogy az y(x) függvény kielégíti a differenciálegyenletet. Ha egy y(x) függvény megoldása a differenciálegyenletnek, akkor a függvény grafikonját a differenciálegyenlet integrálgörbéjének nevezzük. Az elnevezés abból adódik, hogy egy differenciálegyenlet megoldása integrálás útján adódik (még akkor is ez a helyzet, ha egyes speciális esetekben ténylegesen nem végzünk integrálást). A határozatlan integrál elméletéből ismeretes, hogy a primitív függvény meghatározása során születik egy C integrációs állandó, egy konstans. Egy elsőrendű differenciálegyenlet megoldása során tehát az integrálás következtében mindenképpen adódik egy C integrációs konstans, ami „benne van a megoldásban”, ha y-t kifejezzük, a „másik oldalon” szerepel a C. Így a megoldás sohasem egyetlen függvény y = y(x), hanem végtelen sok függvény y = y(x, C), azaz egy függvénysereg, szokás mondani ebben az esetben, hogy egyparaméteres függvénysereg. Ezt az egyparaméteres függvénysereget nevezzük a differenciálegyenlet általános megoldásának. Az általános megoldás tehát egy végtelen sok függvényt tartalmazó függvényhalmaz. Természetesen teljesülnie kell annak, hogy a függvénysereg bármely elemének grafikonja részhalmaza a fentiekben definiált T tartománynak, más szóval az integrálgörbék T-ben haladnak. Ennek minden egyes eleme kielégíti a differenciálegyenletet a fent említett értelemben. A megoldásokat, de magát a differenciálegyenletet is szemléltethetjük a következő módon. Tekintsük az y’ = f(x, y) egyenletet a derivált definíciójára való hivatkozással a következő módon. A T tartomány minden (x, y) pontjában az f függvény felvesz egy értéket, amely az egyenlet szerint éppen egyenlő a megoldásfüggvény adott x abszcisszához tartozó érintőjének a meredekségével. Ez azt jelenti, hogy olyan megoldásokat kell előállítanunk, amelyeknek minden pontjára igaz, hogy a meredekséget az f függvény adott pontbeli értéke adja. Ehhez elsőként vegyünk fel a T tartomány minden pontjában egy kis egyenes szakaszt az ún. vonalelemet, melynek meredeksége éppen f(x, y). Ha ezt elvégezzük a T tartomány minden pontjában, akkor ezzel kitüntetünk egy ún. iránymezőt. A megoldások, vagy más szóval az integrálgörbék pedig szükségképpen olyan görbék, amelyek minden pontban érintik ezeket az egyenes szakaszokat. A mondottak illusztrálására lássunk két egyszerű példát. 184
Óbudai Egyetem BGK
Fejezetek a matematikából
2.1.3. Példa: Szemléltessük az iránymezőt és az általános megoldás integrálgörbéit az alábbi két differenciálegyenlet esetén:
1 xy ' y 0; illetve 2
yy ' x 0
Explicitté téve az egyenleteket, ott ahol x 0 illetve y 0 az előzőekkel ekvivalens alakot kapjuk: y x 1 y ' ; illetve 2 y ' x y Helyettesítéssel könnyen igazolható, hogy az (1) egyenlet általános megoldása az y(x) = Cx függvénysereg, ahol C tetszőleges valós állandó. A (2) egyenlet általános megoldása pedig az
y x C x 2 egyparaméteres függvénysereg, ahol C tetszőleges nem negatív állandó. A 2.1.1. ábrán mindkét differenciálegyenlet iránymezőjét szemléltetjük a sík pontjaihoz rendelt vonalelemekkel, valamint megrajzoltunk néhány integrálgörbét, amelyek jól láthatóan illeszkednek az iránymezőhöz.
a) b) 2.1.1. Ábra. A2.1.3. példabeli (1) és (2) differenciálegyenletek iránymezője, és az egyenletek néhány integrálgörbéje
Szemléletesen is érzékelhető, hogy az (1) egyenlet integrálgörbéi origón áthaladó egyenesek, kivéve az y-tengely egyenesét. Az y-tengely mentén ugyanis x = 0, tehát az egyenletnek ezen egyenes mentén nincs értelme, ennek az egyenesnek a meredeksége végtelen lenne. Ha helyettesítjük azx = 0 feltételt az (1) egyenletbe, az adódik, hogy y = 0, ami ebben az esetben azt jelenti, hogy az origón végtelen sok integrálgörbe halad át. A sík többi pontjára azonban pontosan egy integrálgörbe illeszkedik. A (2) egyenlet iránymezőjének vizsgálata azt érzékelteti, hogy az integrálgörbék körök, pontosabban nyílt félkörök, az alsó és felső félsíkban, ugyanis ez az egyenlet y = 0 esetén értelmetlen. Ugyanis y = 0 esetén az egyenlet jobb oldala végtelen, vagyis az integrálgörbék függőleges irányú érintőkkel rendelkeznének az x-tengely pontjaiban.
185
Óbudai Egyetem BGK
Fejezetek a matematikából
Az (1) és (2) egyenletek megoldását egyelőre csak szemléltettük. Az alábbiakban megadjuk majd azokat az általános módszereket, amelyek segítségével ezen egyenletek megoldása konstruktív úton előállítható. Nyilvánvaló azonban, hogy egy konkrét fizikai, műszaki probléma megoldása sohasem végtelen sok függvény, hanem egyetlen pontosan meghatározott függvény, az általános megoldáshoz tartozó függvénysereg egy eleme. Ezt az egy függvényt valamilyen feltétellel ki kell választanunk a függvényseregből. Ezt a feltételt a hagyományok szerint kezdeti feltételnek nevezzük, még akkor is, ha az ismeretlen y(x) függvény változója nem a „t” idő! Ezt a kezdeti feltételt általában a következő módon adjuk meg: előírjuk, hogy az integrálgörbe haladjon át egy (x0, y0) T ponton, tehát, hogy teljesüljön az y(x0) = y0 feltétel. Egy konkrét probléma tehát tartalmaz egy differenciálegyenletet és a differenciálegyenlethez tartozó kezdeti feltételt. Ezt a két egyenletet együtt kezdeti érték problémának (k.é.p.) vagy Cauchy-féle feladatnak nevezzük. Tehát egy explicit közönséges elsőrendű differenciálegyenletre vonatkozó kezdeti érték probléma az alábbi: y’ = f(x, y), y(x0) = y0 Ennek a feladatnak a megoldása már egyértelmű, azaz egyetlenegy függvény, amennyiben létezik megoldás. Ezt a függvényt a differenciálegyenlet adott kezdeti feltételt kielégítő partikuláris megoldásának nevezzük.
186
Óbudai Egyetem BGK
Fejezetek a matematikából
2.1.4. Az y’= f(x, y) differenciálegyenlet megoldhatósága, a megoldás egyértelműsége (egzisztencia és unicitás) Mielőtt hozzákezdünk a differenciálegyenletek egyes osztályainak vizsgálatához, tisztáznunk kell, hogy mi a megoldás létezésének (egzisztencia) és egyértelműségének (unicitás) a feltétele. Egy olyan tételt fogalmazunk elégséges feltételként, amely a műszaki gyakorlat szempontjából teljességgel kielégítő, és amely feltétel teljesülése könnyen ellenőrizhető. 2.1.1.Tétel: (Egzisztencia és unicitási tétel) Tegyük fel, hogy az y’ = f(x, y) differenciálegyenlet jobb oldala a T R 2 síkbeli tartományon van értelmezve, legyen továbbá (x0, y0)T a tartomány egy tetszőleges belső pontja. a) Ha az f(x, y)függvény folytonos az (x0, y0) pont egy δ sugarú k x0 , y0 környezetében, tehát a T tartományhoz tartozó, (x0, y0) középpontú δ sugarú nyílt körlapon; b) továbbá az f(x, y) függvény második változó szerinti f ' y x, y parciális deriváltja korlátos
ebben a k x0 , y0 környezetben akkor az y’ = f(x, y) differenciálegyenletnek létezik olyan y(x) megoldása, amely kielégíti az y(x0) = y0 feltételt, és ez a megoldás a k x0 , y0 környezetben egyértelmű. Ha az a) és b) feltételek nem csak egy környezetben, hanem a teljes T tartományon teljesülnek, akkor az y(x0) = y0 feltételt kielégítő megoldás az egész T tartományon egyértelműen létezik, továbbá a megoldás (integrálgörbe) a T tartomány határától a T tartomány határáig halad. ■ A tétel elégséges feltétel, de nem szükséges. Ez annyit jelent, hogy előfordulhat, hogy az a) és b) feltételek egyike nem, vagy egyike sem teljesül, és ennek ellenére a differenciálegyenletnek egyértelműen létezik megoldása. 1 2.1.4.Példa: Vizsgáljuk meg az y ' 2 differenciálegyenletet. Ekkor a jobb oldal folytonos y 2 függvény, amely azonban y = 0 esetén nincs értelmezve, továbbá f ' y x, y 3 , így ez a y parciális derivált nem korlátos, ha y → 0, tehát az x-tengely pontjaiban. Az elégséges feltétel a folytonosságra vonatkozó a) része és a korlátosságra vonatkozó b) része nem teljesül az x-tengely mentén, azonban az egyenletnek mégis egyértelműen létezik megoldása bármely (x0, 0) kezdeti feltétel esetén. Helyettesítéssel könnyen ellenőrizhető, hogy az egyenlet ezen kezdeti feltételt kielégítő megoldása az y 3 3 x0 x függvény, és ezen a ponton áthaladó más megoldás nem létezik, tehát a megoldás annak ellenére egyértelmű, hogy a parciális derivált nem korlátos. (A Tisztelt Olvasó később konstruktívan is meg fogja tudni oldani ezt az egyenletet, mert ez egy szeparálható differenciálegyenlet, amelyet az alábbiakban részletesen tárgyalunk.) A sík x-tengelytől különböző bármely pontjára vonatkozólag teljesülnek a tétel feltételei, tehát minden más kezdeti feltétel esetén a megoldás létezése és egyértelműsége az elégséges feltételből következik. 2.1.5. Példa: Vizsgáljuk meg az y ' 3 3 y 2 differenciálegyenlet megoldásait az egyértelműség szempontjából. Az egyenletet nyilván kielégíti az y = 0 azonosan nulla függvény, továbbá az egyenlet általános megoldása az 187
Óbudai Egyetem BGK
Fejezetek a matematikából y x x C
3
függvénysereg,
tetszőleges
valós
C
konstans
esetén.
Erről
helyettesítéssel
azonnal
meggyőződhetünk, egyrészt deriválással kapjuk, hogy y ' x 3 x C , másrészt a jobb oldal 2
2
3 2 3 3 x C 3 x C , tehát valóban azonosságot kaptunk. A 2.1.2. ábrán szemléltetjük a differenciálegyenlet iránymezőjét, az általános megoldást és a konstans nulla megoldást is.
2.1.2. Ábra. A2.1.5. példabeli differenciálegyenlet iránymezője, ésaz egyenlet néhány integrálgörbéje és az azonosan nulla megoldás
Vizsgáljuk meg a megoldásokat az egzisztencia és unicitási tétel feltételeinek teljesülése szempontjából. Egyrészt világos, hogy az egyenlet jobb oldala folytonos függvény. Azonban a jobb oldal y-változó szerinti parciális deriváltja az y = 0 hely környezetében nem korlátos, hiszen 1
2 2 f ' y x, y 3 3 y 2 3 y 3 3y y 3 tehát valóban a végtelenhez tart, ha y → 0. Ami annyit jelent, hogy nem teljesül az unicitási tétel egyik feltétele, a parciális derivált korlátossága. Nézzük meg konkrétan ennek következményét. Válasszuk ki az y = 0 egyenes, tehát az x-tengely egy tetszőleges x0 pontját. Ezen a ponton át a differenciálegyenletnek végtelen sok integrálgörbéje halad át. Ugyanis ha x1 ≤ x0 akkor x ≤ x1 esetén megoldás az y x x x1 harmadfokú függvény – ennek a függvénynek az „alsó” 3
konkáv szakasza –, ha x2 ≥ x0 akkor az x ≥ x2 félegyenes mentén ugyancsak az y x x x2 harmadfokú függvény a megoldás – ennek a függvénynek a „felső” konvex szakasza –, és az [x1, x2] intervallumon pedig a konstans nulla függvény. Ezt a konstrukciót nyilván végtelen sokféle módon meg tudjuk valósítani, tehát az y(x0)=0 kezdeti feltételt végtelen sok megoldás kielégíti. Az y = 0 azonosan nulla megoldás tehát olyan, hogy minden egyes pontján át az egyenletnek végtelen sok integrálgörbéje halad át. Az ilyen megoldást szinguláris megoldásnak nevezzük. 3
188
Óbudai Egyetem BGK
Fejezetek a matematikából
2.1.5. Közvetlenül integrálható differenciálegyenletek Mielőtt az elsőrendű differenciálegyenletek általános osztályainak megoldását bemutatnánk, két nagyon egyszerű, közvetlenül integrálható egyenlettípussal kezdjük a tárgyalást. Tegyük fel, hogy a differenciálegyenlet alakja
I . y ' f x ;
illetve II . y ' k f y
alakú, ahol f(x) illetve f(y) folytonos függvények. Azt mondhatjuk, hogy az (I.) esetben az egyenletben explicit módon nem szerepel az y, a (II.) egyenletben pedig nem szerepel az x változó. Ekkor a megoldás egyetlen integrálással adódik. A (I.) esetben az integrálás eredménye közvetlenül adja a megoldásfüggvényt, míg a (II.) esetben az integrálást követően a kapott implicit függvényt meg kell oldani y(x)-re. A megoldások tehát:
I . y x f x dx;
illetve II .
y ' x 1 f y x dx kdx; vagy formálisan f y dy kx C
Illusztráljuk ezeket az egyenleteket néhány példával. 2.1.6. Példa: Határozzuk meg egy „lánchíd” tartókötelének az alakját azzal a feltételezéssel, hogy az útpálya vízszintes és homogén tömegeloszlású, valamint tegyük fel, hogy a tartókötél tömege az útpálya tömegéhez képest elhanyagolható. Készítsünk ábrát, amelynek alapján felállíthatjuk a probléma differenciálegyenletét. Helyezzük el a kérdéses görbét egy alkalmasan választott koordináta rendszerben, amelynek során kihasználjuk a szimmetriát. A 2.1.3. ábra jelöléseit alkalmazva tegyük fel, hogy a meghatározandó függvény analitikus alakja az y(x) függvény. A probléma egy statikai feladat, mely szerint a vízszintes és függőleges erők összege külön-külön zérus. A könnyebb összegzés érdekében az FB érintő irányú erőt felbontottuk vízszintes és függőleges erők összegére. Az erők egyensúlya a következő egyenletekkel adható meg: FA = F2= FBcosα, valamint mg = F1 = FBsinα, ahol m az útpálya tömegét jelenti a [0, x] szakaszon. A két egyenlet hányadosát képezve azt kapjuk, hogy tg
sin mg cos FA
Használjuk fel, hogy tgα éppen a keresett y(x) függvény x-pontbeli deriváltja, használjuk fel, továbbá, hogy az útpálya a feltételek szerint homogén tömegeloszlású. Eszerint az m tömeg arányos az x abszcisszával, m = βx. Mindezeket figyelembe véve kapjuk a görbe differenciálegyenletét. y ' x
g x FA
189
Óbudai Egyetem BGK
Fejezetek a matematikából
y y(x) F1
FB α F2
FA útpálya x mg
x
2.1.3. Ábra. Egy „lánchíd” tartókötele alakjának meghatározásához
A kapott egyenlet láthatóan a (I.) kategóriába tartozik. Megoldása a következő: y x
g g x 2 xdx C FA FA 2
A válasz tehát az, hogy a mondott feltételek mellett egy „lánchíd” tartókötelének alakja parabola. A 2.1.4. ábrán az egyenlet integrálgörbéit és az iránymezőtszemléltetjük
2.1.4. Ábra. Egy „lánchíd” tartókötelének alakját megadó parabolák
2.1.7.Példa: Itt visszatérünk a 2.1.1. példában szereplő differenciálegyenlet megoldásához, előállítjuk a megoldást, majd szemléltetjük az iránymezőt és néhány integrálgörbét. A megoldandó egyenlet a Tk = 35°C adat figyelembe vételével, ha feltesszük, hogy k = 0,01 a következő 190
Óbudai Egyetem BGK
Fejezetek a matematikából dT t 0, 01 T t 35 dt
Világos, hogy ez az egyenlet a (II.) kategóriába tartozik. Rendezzük át és integráljunk. 1 1 dT 0, 01dt; dT 0, 01dt; ln T 35 0, 01 t ln C T 35 T 35
Az implicit megoldást ezzel elő is állítottuk. Ha az implicit egyenletet rendezzük T(t)-re, kapjuk a hőmérséklet időfüggését. T (t ) 35 Ce0,01t
Ha most figyelembe vesszük a kezdeti feltételt, akkor kapjuk a C állandó értékét, valamint a kezdeti feltételt kielégítő partikuláris megoldást. T(0) = 200 °C adat alapján adódik, hogy C = 165. Tehát a partikuláris megoldás a következő. T (t ) 35 165e0,01t
A 2.1.5. ábrán szemléltetjük az iránymezőt, az általános megoldást néhány integrálgörbével, valamint a keresett partikuláris megoldást. A megoldások alapján azt mondhatjuk tehát, hogy a hőmérséklet exponenciális módon csökken, és a kenyér hőmérséklete csak határértékben t → ∞ esetén éri el a környezet hőmérsékletét.
2.1.5. Ábra. A 2.1.1. példabeli differenciálegyenlet iránymezője, az egyenlet néhány integrálgörbéje, valamint a kezdeti feltételt kielégítő partikuláris megoldás
Az ábrán jól látható, hogy az integrálgörbék valóban minden pontban illeszkednek az iránymezőhöz. Az ábrán szerepel az egyparaméteres függvényseregből négy különböző megoldás.
191
Óbudai Egyetem BGK
Fejezetek a matematikából
2.1.8.Példa: Megoldjuk a bevezető 2.1.2. példájában szereplő differenciálegyenletet. Ez az egyenlet is a (II.) kategóriába tartozik. Ha a jelöléseink egyszerűsítése érdekében alkalmazzuk az R = 1Ω, C = 1F, U0 = 10V adatokat – ezzel az integrálgörbék jellegét nem változtatjuk meg, csak a szereplő konstansokkal az egyenlet alakja egyszerűbb –, akkor az egyenlet átrendezéssel majd az integrál kijelölésével a következő.
Q ' t Q t 10; Q ' t 10 Q t ;
1 1 dQ 1dt ; dQ 1dt 10 Q 10 Q
Az integrálást elvégezve, majd a kapott egyenletet rendezve Q(t)-re a következőt kapjuk:
ln 10 Q t c; ln 10 Q t K ; 10 Q e K et ; Q(t ) 10 C et Az általános megoldást tehát előállítottuk. Ha figyelembe vesszük a Q(0) = 0 kezdeti feltételt, akkor ebből 0 = 10 – C adódik, ahonnan C = 10. Tehát a kezdeti feltételt kielégítő partikuláris megoldás a következő.
Q(t ) 10 10 et 10 1 et
Azt kaptuk tehát, hogy a kondenzátor töltése exponenciális függvény szerint növekszik, és t → ∞ esetén éri el a 10 egységnyi töltést. A 2.1.6 ábrán szemléltetjük az egyenlet iránymezőjét, néhány integrálgörbét és a partikuláris megoldást.
2.1.6. Ábra. A 2.1.2. példabeli differenciálegyenlet iránymezője, az egyenlet néhány integrálgörbéje, valamint a kezdeti feltételt kielégítő partikuláris megoldás
192
Óbudai Egyetem BGK
Fejezetek a matematikából
2.1.6. Szétválasztható változójú (szeparálható) differenciálegyenlet 2.1.2.Definíció: Az elsőrendű explicit közönséges differenciálegyenletet szétválasztható változójúnak vagy szeparálhatónak nevezzük, ha ekvivalens átalakításokkal az y’ = f(x)∙g(y) alakra hozható. (Ez annyit jelent, hogy az egyenletet y’-re rendezve a jobb oldal egy olyan szorzatként írható, melynek egyik tényezője csak x-től, a másik tényezője pedig csak y-tól függ. Ez utóbbi, implicit módon természetesen függ az x változótól is.) A megoldhatóságot biztosítja az alábbi állítás. 2.1.2.Tétel: Ha az f függvény az [a, b] intervallumon folytonos, a g függvény a [c, d] intervallumon folytonos, továbbá g sehol sem 0, akkor az ]a, b[ × ]c, d[ nyílt téglalap minden pontján áthalad a differenciálegyenletnek pontosan egy integrálgörbéje. ■ A differenciálegyenlet megoldása. A megoldási módszer („kvadratura”) abban áll, hogy az egyenletben szétválasztjuk a változókat. A felírt alakból kiindulva ez annyit jelent, hogy a bal oldalra rendezzük az y-t tartalmazó tényezőket, a jobb oldalra pedig az x változót tartalmazó tényezőket
y ' x
g y x
f x
Majd az egyenlet mindkét oldalát integráljuk az x változó szerint.
y ' x g y x dx f x dx Itt elvégezzük az integrálást, és a kapott egyenletből, ha lehet, kifejezzük az y(x) függvényt. Ezután pedig, ha partikuláris megoldásra van szükség, figyelembe vesszük a kezdeti feltételt. Egy formális megoldás. Az előzőekben ismertetett algoritmus helyett gyakran alkalmazzuk a dy következő eljárást. Az y’ helyébe -et írunk (ez tisztán formális átalakítás, mégis helyes dx eredményre vezet). Ez után átrendezzük az egyenletet úgy, hogy szorzunk dx-szel és osztunk g(y)-nal (g(y) ≠ 0). Ekkor az egyenlet ekvivalens alakjai a következők: dy 1 f ( x) g ( y); dy f x dx; dx g y
Ezekkel a műveletekkel a változókat szétválasztottuk, majd az egyenlet mindkét oldalát integráljuk:
193
Óbudai Egyetem BGK
Fejezetek a matematikából 1
g ( y) dy f ( x)dx A lényeges különbség a korábbihoz képest, hogy itt a bal oldalon az integrációs változó az y és nem az x. Az integrálásokat elvégezve, és ha lehetséges, az y(x) függvényt kifejezve, megkapjuk az egyenlet általános megoldását explicit alakban. Ha az y(x) függvény a kapott egyenletből nem fejezhető ki, akkor implicit alakú megoldás adódik. Az f(x) és g(y) konkrét ismerete nélkül az egyenlet megoldásáról többet nem mondunk. Ezért lássunk egy konkrét illusztráló példát. 2.1.9.Példa: Oldjuk meg a következő kezdeti érték problémát:
cos y 1 e x sin y y ' 0; y 0
4
A differenciálegyenlet valóban szeparálható, ugyanis, ha az egyenletet rendezzük y’-re, akkor azt kapjuk, hogy 1 cos y y' ; x sin y 1 e A jobb oldal valóban egy x-től és egy y-tól függő tényező szorzata. A formális átalakításokat elvégezve válasszuk szét a változókat és integráljunk
sin y
1
cos y dy 1 e x dx; A jobb oldal integrálása előtt célszerű az integrandust bővíteni ex-szel, így a következőt kapjuk
sin y ex dy x dx; cos y e 1
Elvégezve az integrálást, az integrációs állandót célszerűen logaritmusos alakban felvéve, a következő adódik ln cos y ln e x 1 ln C ahonnan az általános megoldás implicit illetve explicit alakja a következő
cos y C e x 1 ; azaz y x arccos C e x 1 ; Ha a kezdeti feltételt is figyelembe vesszük, akkor kapjuk a C konstans értékét.
194
Óbudai Egyetem BGK cos
Fejezetek a matematikából 2 2 C e0 1 ; C 1 1 ; ahonnan C 4 2 4
Tehát a kezdeti feltételt kielégítő partikuláris megoldás a következő:
2 y x arccos ex 1 4
A 2.1.7. ábrán szemléltetjük a differenciálegyenlet iránymezőjét, néhány integrálgörbét, valamint a kezdeti feltételt kielégítő partikuláris megoldást.
2.1.7. Ábra: A 2.1.9. példabeli szeparálható egyenlet iránymezője, néhány integrálgörbe és a kezdeti feltételt kielégítő partikuláris megoldás
A következő pontban egy olyan egyenlettípust vizsgálunk, amely közvetlenül nem szeparálható, de egy transzformáció segítségével szétválasztható változójú egyenletté alakítható.
195
Óbudai Egyetem BGK
Fejezetek a matematikából
2.1.7. Homogén differenciálegyenlet A homogén differenciálegyenlet egy olyan egyenlet, amely megfelelő átalakításokkal visszavezethető szétválasztható változójú egyenletre. Az ok, amiért ezzel az egyenlettípussal foglalkozunk az, hogy megoldása során látunk egy olyan módszert, amely általános módszer differenciálegyenletek megoldása esetén. Ez pedig az új ismeretlen függvény bevezetése. 2.1.3.Definíció:Az elsőrendű explicit közönséges differenciálegyenletet differenciálegyenletnek nevezzük, ha ekvivalens átalakításokkal az
homogén
y y f x
alakra hozható. (Ez annyit jelent, hogy az egyenletet y’-re rendezve a jobb oldalon az y ismeretlen függvény és az x változó hányadosa, ennek a hányadosnak hatványai illetve függvényei szerepelnek.) Az elnevezés okára világítunk rá az alábbi fogalommal: 2.1.4.Definíció: A kétváltozós f(x, y) függvényt k-ad fokú homogén függvénynek nevezzük, ha tetszőleges αR valós szám esetén teljesül, hogy f(αx, αy) = αk∙f(x, y). Homogén differenciálegyenlet esetén, ha az egyenletet y’ = f(x, y) alakra hozzuk akkor ez az y y összefüggés f(αx, αy) = f(x, y) alakban, hiszen nyilván f f tehát az egyenlet k = 0 x x esetén teljesül, azaz a homogén differenciálegyenletben f(x, y) egy 0-ad fokú homogén függvény. 2.1.10.Példa: Vizsgáljuk meg, hogy homogén függvény-e a következő
f x, y
x 4 3xy3 xy y 2
;
Azt állítjuk, hogy ez a függvény egy másodfokú homogén függvény. A definíció szerint ugyanis 4 3 x 3xy 2 x4 3xy3 2 f x, y x 3x y f x , y 2 xy y 2 2 xy y 2 xy y 4
4
3
y A differenciálegyenlet megoldása.Az y f egyenlet megoldásához vezessünk be egy új x ismeretlen függvényt az
196
Óbudai Egyetem BGK
Fejezetek a matematikából u x
y x x
definícióval. Transzformáljuk az eredeti egyenletet úgy, hogy abban az u(x) függvény legyen az ismeretlen. Ehhez átrendezzük ezt az egyenletet: y(x) = u(x) ∙ x, majd deriváljuk az x változó szerint y’(x) = u’(x) ∙x + u(x) Ezt behelyettesíthetjük az eredeti egyenletbe u’(x) ∙x + u(x) = f(u(x)) vagy egyszerűbb jelöléssel u’x + u = f(u) Ez pedig az u(x) ismeretlen függvényre vonatkozólag szétválasztható változójú egyenlet u
1 f u u x
Valóban, a jobb oldal egy x-től és egy u-tól függő tényező szorzata. Bevezetve u’ helyére a
du dx
formális hányadost, azt kapjuk, hogy du 1 f u u dx x
feltéve, hogy f u u 0 , a változókat szétválasztva és az integrálást kijelölve az alábbi egyenletet kapjuk
1
1
f (u) u du x dx Ha itt kiszámítjuk az integrálokat, már meg is kaptuk az u-ra vonatkozó egyenlet általános megoldását. Ha felidézzük az y(x) = u(x) ∙ x definíciót, és a kapott megoldásban u(x) helyére y x behelyettesítjük az hányadost, akkor előállt az eredeti differenciálegyenlet általános x megoldása implicit alakban. Ha ebből kifejezhető y(x) akkor az explicit megoldást kapjuk. 2.1.11.Példa: Határozzuk meg az y x xy ' xe y
197
Óbudai Egyetem BGK
Fejezetek a matematikából
elsőrendű közönséges differenciálegyenlet általános megoldását. Legyen például x> 0. Ha elosztjuk az egyenletet az x változóval látható, hogy az egyenlet homogén y y x y' e
x
Most vezessük be az u(x) függvényt az y(x) = u(x)∙x definícióval, ezután helyettesítsük az y’(x) = u’(x) ∙x + u(x) összefüggést, és rendezzük az egyenletet. Ekkor a következőt kapjuk
u ' x u eu u, tehát u ' x eu ez pedig szétválasztható változójú egyenlet. Szétválasztás után a következő egyenlet adódik eu du
1 dx x
Integrálás után kapjuk a megoldást u(x)-re
e
u
1 du dx; eu ln x C; u ln C ln x x
Mivel y(x) = u(x)∙x ezért az eredetileg kitűzött differenciálegyenlet általános megoldása:
y( x) x ln C ln x A 2.1.8. ábrán illusztráljuk a differenciálegyenlet iránymezőjét és ábrázoltunk néhány integrálgörbét.
2.1.8. Ábra: A 2.1.11. példabeli homogén differenciálegyenlet iránymezője és az egyenlet néhány integrálgörbéje
198
Óbudai Egyetem BGK
Fejezetek a matematikából
2.1.8. Elsőrendű lineáris differenciálegyenlet 2.1.5.Definíció: Az elsőrendű közönséges differenciálegyenletet differenciálegyenletnek nevezzük, ha ekvivalens átalakításokkal az
elsőrendű
lineáris
y ' x f x y x g x
alakra hozható, ahol f(x) és g(x) egy adott [a, b] intervallumon folytonos függvények. Ha g(x) = 0 tetszőleges x[a, b] esetén, tehát a differenciálegyenlet jobb oldala azonosan zérus, akkor az egyenletet homogén lineárisnak nevezzük, ellenkező esetben az egyenlet inhomogén lineáris. A továbbiak során kiderül, hogy az inhomogén lineáris differenciálegyenlet általános megoldásához külön-külön meg kell oldani a homogén és az inhomogén egyenletet. Az alábbiakban ennek megfelelően részletezzük a megoldás módszereit.
2.1.8.1.Homogén lineáris differenciálegyenlet Elsőként megfogalmazzuk az egzisztencia és unicitási tétel következményét az adott esetre vonatkozólag. 2.1.3.Tétel: Ha az f(x) függvény az [a, b] intervallumon folytonos, akkor tetszőleges x0[a, b] esetén az y ' x f x y x 0; y x0 y0 kezdeti érték probléma egyértelműen megoldható, és a megoldás értelmezve van a teljes [a, b] intervallumon. Először is vegyük észre, hogy a differenciálegyenletet kielégíti az y(x) = 0, x[a, b] azonosan nulla függvény. Ezt nevezzük triviális megoldásnak. A nemtriviális megoldás előállításához vegyük észre, hogy a homogén lineáris differenciálegyenlet egy speciális szétválasztható változójú egyenlet y ' f x y 0; y ' f x y;
dy f x y dx
A változókat szétválasztva, majd minkét oldalon integrálva a következőt kapjuk
1
y dy f ( x)dx a bal oldalon álló integrál kiszámítható, a primitív függvény ln│y│, a jobb oldal azonban csak akkor számítható ki, ha ismerjük az f(x) függvényt. A jobb oldalon az integrációs állandót célszerű logaritmusos alakban felírni, ahol C ≠ 0. 199
Óbudai Egyetem BGK
Fejezetek a matematikából
f ( x ) dx f ( x ) dx ln y f ( x)dx ln C ; ln y ln e ln C ; ln y ln Ce ;
A kapott egyenletből y kifejezhető: f ( x ) dx yhá ( x) C e
ez a homogén lineáris differenciálegyenlet általános megoldása. Ha figyelembe vesszük, hogy a konstans nulla függvény is megoldás, akkor itt írhatjuk, hogy C R . Az y(x0) = y0kezdeti feltételből a konstans értéke meghatározható. De azonnal felírhatjuk a kezdeti feltételt kielégítő partikuláris megoldást is: x
yhá ( x) y0 e
f t dt x0
A homogén lineáris differenciálegyenlet megoldásával kapcsolatosan az alábbi elméleti jelentőségű tételt említjük. 2.1.4.Tétel: Ha az y(x), x[a, b] függvény az y’ + f(x)∙y = 0 differenciálegyenlet egy nem triviális megoldása, akkor tetszőleges CR esetén a C∙y(x) függvény is megoldás, és az egyenlet tetszőleges megoldása előállítható C∙y(x), x[a, b] alakban. Bizonyítás: Egyrészt, hogy egy megoldás konstansszorosa is megoldás, egyszerűen következik a deriválási szabályokból:
Cy ' f x Cy Cy ' f x Cy C y ' f x y C 0 0 Másrészt az, hogy minden megoldás előáll C∙y(x) alakban abból, következik, hogy folytonos f(x) esetén a Cauchy-féle feladat egyértelműen megoldható, azaz alkalmazható az általános egzisztencia és unicitási tétel. ■ 2.1.12.Példa: Határozzuk meg az alábbi homogén lineáris differenciálegyenlet általános megoldását. y 'sin x y cos x 0 .
Az egyenlet valóban homogén lineáris, ugyanis, ott ahol sin x 0 a következő standard alakra hozható. cos x y ' y0 sin x Ha szétválasztjuk a változókat és integrálunk, a következő adódik
200
Óbudai Egyetem BGK
Fejezetek a matematikából
1 cos x 1 cos x dy dx; dy dx; ln y ln sin x ln C ln C sin x y sin x y sin x ahonnan a homogén egyenlet általános megoldása yhá x C sin x
A 2.1.9. ábrán szemléltetjük a differenciálegyenlet iránymezőjét és néhány integrálgörbét.
2.1.9. Ábra: A 2.1.12. példabeli homogén lineáris differenciálegyenlet iránymezője és az egyenlet néhány integrálgörbéje
2.1.8.2.Inhomogén lineáris differenciálegyenlet A megoldás létezésére és egyértelműségére vonatkozólag a következőképpen konkretizálhatjuk az általános tételt. 2.1.5.Tétel: Ha az f(x) és g(x) függvények az [a, b] intervallumon folytonosak, akkor tetszőleges x0[a, b] esetén az y ' x f x y x 0; y x0 y0 kezdeti érték probléma egyértelműen megoldható, és a megoldás értelmezve van a teljes [a, b] intervallumon. Az inhomogén egyenlet vizsgálatánál fontos szerepe van annak az egyenletnek, amelyet úgy kapunk, hogy az inhomogén egyenlet jobboldalán a g(x) függvény helyére az azonosan nulla függvényt írjuk. Így kapjuk az inhomogén lineáris egyenlethez tartozó homogén lineáris egyenletet. Az inhomogén lineáris differenciálegyenlet megoldásainak szerkezetét adja meg az alábbi tétel.
201
Óbudai Egyetem BGK
Fejezetek a matematikából
2.1.6.Tétel: Tegyük fel, hogy yhá(x) az inhomogén lineáris egyenlethez tartozó homogén lineáris egyenletet nem triviális megoldása, yip(x) pedig az inhomogén egyenlet egy tetszőleges partikuláris megoldása. Ekkor tetszőleges CR állandó esetén a
yiá x Cyhá x yip x függvény az inhomogén lineáris differenciálegyenlet megoldása, és minden megoldás előállítható ebben az alakban. Ezt a megoldást nevezzük az inhomogén lineáris egyenlet általános megoldásának. Bizonyítás: Egyrészt az, hogy a tételben szereplő függvény valóban megoldása az inhomogén egyenletnek egyszerűen következik a deriválási szabályokból:
Cyhá x yip x f x Cyhá x yip x C y 'há x f x yhá x y 'ip x f x yip x 0 g x g x '
tehát valóban kielégíti az inhomogén differenciálegyenletet. Másrészt pedig tegyük fel, hogy φ(x) az inhomogén egyenlet egy tetszőleges megoldása, és yip(x) az inhomogén egyenlet egy partikuláris megoldása. Ekkor megmutatjuk, hogy a φ(x) – yip(x) különbség a homogén lineáris egyenlet megoldása. Helyettesítve és deriválva, mivel mindkét függvény az inhomogén egyenlet megoldása, kapjuk, hogy
x yip x f x x yip x ' x f x x y 'ip x f x yip x g x g x 0 '
tehát valóban kielégíti a homogén lineáris egyenletet. A homogén lineáris differenciálegyenlet megoldása a tétel szerint pedig előáll Cyhá(x) alakban, ezzel az állítást igazoltuk. ■
2.1.8.3.Az állandó variálásának módszere Mivel a homogén lineáris egyenlet általános megoldását elő tudjuk állítani, arra a kérdésre kell csak válaszolnunk, hogy milyen módszerrel állítjuk elő az inhomogén egyenlet egy tetszőleges partikuláris megoldását? Erre szolgál az állandó variálásának módszere. Ennek lényege a következő: Az yip(x) partikuláris megoldást ugyanolyan alakban keressük, mint a homogén lineáris egyenlet általános megoldása, csak az abban szereplő C konstans helyére egy C(x) függvényt írunk. f ( x ) dx yip ( x) C x e
Kérdés az, hogy mi a C(x) függvény, ha ez az yip(x) kielégíti az inhomogén differenciálegyenletet. A C(x)-et úgy határozzuk meg, hogy ezt függvényt behelyettesítjük az inhomogén egyenletbe. Elvégezve a deriválást és a helyettesítést, az alábbi egyenletet kapjuk.
202
Óbudai Egyetem BGK
Fejezetek a matematikából
f ( x ) dx f ( x ) dx f ( x ) dx C x e C x e f x f x C x e g x
Mint látható az f(x) konkrét alakjától függetlenül ebből az egyenletből a középső két tag összege zérus, tehát az egyenlet bal oldalán csak az a tag marad meg, amelyik a C’(x) derivált függvényt tartalmazza: f ( x ) dx C x e g x Ebből átrendezéssel C’(x)-re az alábbi egyenlet adódik:
C x g x e
f ( x ) dx
Integrálással kapjuk C(x)-et: C x g x e
f ( x ) dx
dx
Ennél az integrálásnál is születik elvileg egy integrációs állandó! De most csak egyetlen partikuláris megoldás előállítása a feladat, ezért nem szükséges kitenni egy tetszőleges állandót, illetve az állandót úgy határozhatjuk meg, hogy az a leginkább megfeleljen a feladat kívánalmainak. Ha ezt a C(x)-et behelyettesítjük az yip(x)-et megadó összefüggésbe, akkor előállítottuk az inhomogén egyenlet egy partikuláris megoldását: yip x g x e
f ( x ) dx
f ( x ) dx dx e
Ha ezt a függvényt hozzáadjuk a homogén lineáris differenciálegyenlet általános megoldásához, akkor megkaptuk az inhomogén lineáris differenciálegyenlet általános megoldását. 2.1.13.Példa: Oldjuk meg az alábbi inhomogén lineáris differenciálegyenletre vonatkozó Cauchy-féle feladatot: 2 y 'sin x y cos x 1; y . 4 2 Ahol a szinusz függvény nem nulla, az egyenlet ekvivalens az alábbi standard alakú inhomogén lineáris egyenlettel. cos x 1 y ' y sin x sin x A megfelelő homogén lineáris differenciálegyenlet általános megoldását már előállítottuk a 2.1.12. példában, mely szerint yhá x C sin x . Eszerint egyetlen feladat maradt, elő kell állítani
203
Óbudai Egyetem BGK
Fejezetek a matematikából
az inhomogén lineáris differenciálegyenlet egy tetszőleges partikuláris megoldását. Ehhez alkalmazzuk az állandó variálásának módszerét. Keressük tehát a megoldást
yip x C x sin x alakban. Az ismeretlen C(x) függvényt az inhomogén egyenletbe történő helyettesítéssel határozzuk meg. Ehhez szükség van a deriváltra:
y 'ip x C ' x sin x C x cos x Ezt most helyettesítjük az inhomogén lineáris egyenletbe: C ' x sin x C x cos x
cos x 1 C x sin x sin x sin x
Látható ebben a konkrét esetben is, hogy a bal oldalon csak az ismeretlen C(x) függvény deriváltja marad meg. Összevonás, rendezés és integrálás után azt kapjuk, hogy: C ' x sin x
1 1 1 ; C ' x ; C x 2 dx ctg x 2 sin x sin x sin x
Helyettesítve a kapott primitív függvényt a partikuláris megoldás általános alakjába, adódik az inhomogén egyenlet egy megoldása yip x C x sin x ctg x sin x cos x
A részeredményekből pedig már összegzéssel adódik az inhomogén lineáris differenciálegyenlet általános megoldása.
yiá x yhá x yip x C sin x cos x Végül vegyük figyelembe a kezdeti feltételt. Eszerint 2 2 2 C sin cos C ; ahonnan C 2 2 4 4 2 2
Tehát a kezdeti feltételt kielégítő partikuláris megoldás a következő
y x 2sin x cos x A 2.1.10. ábrán szemléltetjük a példabeli inhomogén lineáris differenciálegyenlet iránymezőjét, néhány integrálgörbét, és a kezdeti feltételt kielégítő partikuláris megoldást.
204
Óbudai Egyetem BGK
Fejezetek a matematikából
2.1.10. Ábra: A 2.1.13. példabeli inhomogén lineáris differenciálegyenlet iránymezője, néhány integrálgörbe és a kezdeti feltételt kielégítő partikuláris megoldás
Az integrálgörbéket szemléltető ábráról kiderül, hogy a differenciálegyenlet az x k ; k Z helyeken, tehát a szinusz függvény zérus helyein szinguláris. Itt nem teljesül az unicitás, tehát a megoldás egyértelműségének feltétele. Ezeken a helyeken a differenciálegyenlet a k egész szám paritásától függően az y 1 egyenletre redukálódik, ami azt jelenti, hogy a (2n, 1) és a
2n 1 ,1 ; n Z koordinátájú pontokra végtelen sok integrálgörbe illeszkedik.
2.1.9. A Bernoulli-féle differenciálegyenlet Ebben a pontban egy olyan differenciálegyenletet vizsgálunk, amely egy alkalmas transzformációval elsőrendű lineáris differenciálegyenletté alakítható. 2.1.6.Definíció: Legyenek az f(x) és g(x) függvények az [a, b] intervallumon folytonosak, és legyen α R, α ≠ 0, 1 tetszőleges valós szám. Ekkor az
y ' x f x y x g x y x differenciálegyenletet Bernoulli-féle differenciálegyenletnek nevezzük. Ez a differenciálegyenlet egy alkalmas transzformációval visszavezethető elsőrendű lineáris differenciálegyenletre. Legyen ugyanis y(x) a Bernoulli-féle differenciálegyenlet egy megoldása és szorozzuk meg az egyenletet (1 – α)∙y–α –val. Ekkor az egyenlet a következő alakot ölti
1 y ' y 1 f x yy 1 g x y y 1 y ' y 1 f x y1 1 g x Vezessük be a következő jelöléseket. 205
Óbudai Egyetem BGK
Fejezetek a matematikából
u(x) = y1–α(x), F(x) = (1 – α)f(x) és G(x) = (1 – α)∙g(x) Könnyen ellenőrizhető, hogy ekkor u’(x) = (1 – α)∙y’(x)∙y–α(x). Ezzel az észrevétellel és a bevezetett jelölésekkel az egyenlet a következő alakban írható u’(x) + F(x) ∙ u(x) = G(x) ami az u(x) függvényre vonatkozólag egy elsőrendű inhomogén lineáris differenciálegyenlet. Az egyenlet megoldása tehát a következő módon történik: Meghatározzuk az u(x)-re vonatkozó inhomogén lineáris differenciálegyenlet általános megoldását, majd a fenti transzformációt visszafelé alkalmazzuk, vagyis ha
u x y1 x akkor u(x) ismeretében y(x) az alábbi alakban állítható elő:
y x
1 1 u
x
Ezzel a Bernoulli-féle differenciálegyenlet általános megoldását meghatároztuk. 2.1.14.Példa: Határozzuk meg a 2xy’ – 2y + x4y3 = 0 elsőrendű közönséges differenciálegyenlet általános megoldását! Ha az x 0 feltétel mellett az egyenletet átrendezzük, az alábbi differenciálegyenletet kapjuk 1 x3 y ' y y 3 x 2 Ez pedig α = 3 esetén egy Bernoulli-féle differenciálegyenlet. Végezzük el a szükséges transzformációt, szorozzunk (–2)∙y–3 tényezővel. Ekkor bevezetve az u(x) = y–2(x) jelölést, a következő egyenlet adódik. 2 u ' u x3 x Ez egy elsőrendű inhomogén lineáris egyenlet. Először megoldjuk az 2 u ' u 0 x
homogén egyenletet. Mint tudjuk, ez szeparálható egyenlet. Ha szétválasztjuk a változókat és az integrálokat kijelöljük azt kapjuk, hogy
206
Óbudai Egyetem BGK
Fejezetek a matematikából 1
2
u du x dx Ennek integrálásával a következőre jutunk.
ln u 2ln x ln C Ebből u-t kifejezve kapjuk a homogén általános megoldást. uh
C x2
A partikuláris megoldás előállításához az állandó variálásának módszerét alkalmazzuk. u p ( x) C ( x)
1 x2
Ezt most deriváljuk u p '( x) C '( x)
1 2 C ( x) 3 2 x x
ha ezt behelyettesítünk az inhomogén egyenletbe, rendezés után a következő adódik.
x6 C '( x) x ; C ( x) 6 5
Ezt felhasználva adódik a partikuláris megoldás
1 x6 1 x 4 u p ( x) C ( x) 2 2 6 x 6 x Az uh és up megoldások összege adja a lineáris egyenlet általános megoldását.
u ( x) C
1 x4 x2 6
A Bernoulli-féle differenciálegyenlet y(x) megoldása az u(x) = y–2(x) egyenlet átrendezésével adódik.
y ( x)
1 1 x4 C 2 6 x 207
Óbudai Egyetem BGK
Fejezetek a matematikából
2.1.11. Ábra: A 2.1.14. példabeli Bernoulli-féle differenciálegyenlet iránymezője, és néhány integrálgörbe
A 2.1.11. ábra alapján is világos, de már az első lépésben végrehajtott átalakításból is következik, hogy az x = 0 helyen a differenciálegyenlet szinguláris. Az x = 0 feltétel helyettesítésével az eredeti egyenletből is következik, hogy y = 0, tehát az origón végtelen sok integrálgörbe halad át. Ezen a helyen nem teljesülnek a megoldás egyértelműségének a feltételei.
2.1.10. Egzakt differenciálegyenlet Ebben a pontban egy bizonyos szempontból általánosabb szerkezetű elsőrendű egyenletet tanulmányozunk. Az általános jelző értelmére a pont végén visszatérünk. 2.1.7.Definíció: Legyen a T tartomány a síknak, tehát R2-nek egy részhalmaza, továbbá tegyük fel, hogy az F(x, y) kétváltozós függvény parciális deriváltjai folytonosak a T tartományon. Azt mondjuk, hogy az F(x, y) függvény, a T tartományon folytonos P(x, y) és Q(x, y) függvénypár primitív függvénye, ha F’x(x, y) = P(x, y) és F’y(x, y) = Q(x, y). Tehát az F primitív függvény, ha F első változó szerinti parciális deriváltja a P, a második változó szerinti parciális deriváltja a Q. Felmerül a kérdés, hogy egy P(x, y), Q(x, y) függvénypárnak milyen feltételek mellett létezik primitív függvénye? Erre ad választ az alábbi tétel: 2.1.7.Tétel: Tegyük fel, hogy a P(x, y), Q(x, y) kétváltozós függvények és aP’y(x, y), Q’x(x, y) parciális derivált függvények folytonosak. Ilyen feltételek mellett a P(x, y), Q(x, y) függvénypárnak a T tartományon akkor és csak akkor létezik primitív függvénye, ha P’y(x, y) = Q’x(x, y) Bizonyítás: Egyrészt tegyük fel, hogy létezik primitív függvény, azaz létezik F(x, y) függvény, a T tartományon olyan, hogy
208
Óbudai Egyetem BGK
Fejezetek a matematikából F F x, y P x, y ; x, y Q x, y ; x y
Ekkor a másodrendű vegyes parciális deriváltak a következők
2 F P 2F Q x , y x , y ; x, y x , y ; yx y xy x Mivel definíció szerint a másodrendű deriváltak folytonosak, a Young-tétel szerint a vegyes parciális deriváltak egyenlők, tehát teljesül P és Q elsőrendű deriváltjaira vonatkozó feltétel. Megfordítva tegyük fel, hogy teljesül a P’y(x, y) = Q’x(x, y) feltétel. Megmutatjuk, hogy ekkor létezik primitív függvény, sőt konstruktív úton elő is állítjuk azt. Tegyük fel tehát, hogy az F(x, y) a keresett primitív függvény. Ekkor a primitív függvény definíciója szerint teljesülnie kell a következőnek F x, y P x, y x Integráljuk most ezt az egyenletet az x-változó szerint. F ( x, y) P x, y dx h y
ahol h(y) az y-változó tetszőleges függvénye, ez ugyanis az x-szerinti deriváláskor eltűnik. Vegyük figyelembe, hogy teljesülnie kell a
F x, y Q x , y y feltételnek is. Az F(x, y) kapott előállításából az adódik, hogy F ( x, y) P x, y dx h ' y Q x, y y y
ahonnan a h(y) függvény meghatározható h ' y Q x, y
P x, y dx; azaz h y Q x, y P x, y dx dy y y
Innen pedig kapjuk a primitív függvény következő előállítását
F ( x, y) P x, y dx Q x, y P x, y dx dy y Könnyen ellenőrizhető az 209
Óbudai Egyetem BGK
Fejezetek a matematikából F 'x x, y P x, y , F ' y x, y Q x, y
Feltételek teljesülése. Ezzel a függvénypár primitív függvényét tehát előállítottuk. ■ 2.1.8.Definíció: Tegyük fel, hogy a P(x, y), Q(x, y) kétváltozós függvények a T tartományon folytonosak. A
P(x, y) + Q(x, y)∙y’(x) = 0 differenciálegyenletet egzaktnak nevezzük, ha a P(x, y) és Q(x, y) függvénypárnak a T tartományon létezik primitív függvénye. Az előző tétel szerint, ha az említett folytonossági feltételek teljesülnek, az egzaktság egyenértékű azzal, hogy teljesül a P’y(x, y) = Q’x(x, y) egyenlet. Az egzakt differenciálegyenlet alakja egy kissé szokatlan a korábbiakhoz képest, ezért más ekvivalens formában is felírjuk. Tegyük fel, hogy a T tartományban a Q(x, y) függvény sehol sem zérus. Ekkor az egzakt differenciálegyenlet felírható az alábbi megszokottabb alakban y x
P x, y Q x, y
Az egzakt differenciálegyenlet megoldásáról szól az alábbi tétel. 2.1.8.Tétel: Tegyük fel, hogy az F(x, y) függvény a T tartományon differenciálható és a parciális deriváltjai folytonosak, és tegyük fel továbbá, hogy F(x, y) a P(x, y), Q(x, y) függvénypár primitív függvénye, továbbá Q(x, y) ≠ 0 ha (x, y)T. Ekkor a P(x, y) + Q(x, y)∙y’(x) = 0 egzakt differenciálegyenlet megoldásai azonosak az F(x, y) = C implicit módon megadott függvénnyel, ahol C tetszőleges valós szám az F(x, y) függvény értékkészletéből. Bizonyítás: Tegyük fel, hogy az F(x, y) = C egyenlet által meghatározott implicit függvény az y= y(x) függvény. Képezzük az F(x, y) = C egyenlet x-változó szerinti deriváltját. Az összetett függvény deriválási szabályát felhasználva kapjuk, hogy F 'x x, y F ' y x, y y ' x 0
210
Óbudai Egyetem BGK
Fejezetek a matematikából
Ha alkalmazzuk az F’x(x, y) = P(x, y) és F’y(x, y) = Q(x, y) jelöléseket, akkor az adódik,, hogy az y(x) függvény kielégíti a P(x, y) + Q(x, y)∙y’(x) = 0 differenciálegyenletet. Éppen ezt kellett bizonyítani. ■ Egyetlen kérdés maradt tehát. Hogyan állítható elő egy P(x, y), Q(x, y) függvénypár primitív függvénye? A válasz a következő, meg kell oldani az
1 F 'x x, y P x, y 2 F ' y x, y Q x, y parciális differenciálegyenlet-rendszert. Ennek megoldása a tétel bizonyítása során követett gondolatmenet megismétlését igényli. Elsőként például integráljuk az (1) egyenletet az x változó szerint F ( x, y) P x, y dx h y
itt a primitív függvény tartalmaz egy „állandót” amely az x-változó szerinti deriváláskor eltűnik, ilyen módon ez lehet az y változónak egy tetszőleges függvénye: h(y). A kapott F(x, y) függvényt deriváljuk az y-változó szerint F ( x, y) P x, y dx h ' y y y
és behelyettesítjük a (2) egyenletbe. Q( x, y )
P x, y dx h ' y ; azaz h ' y Q( x, y ) P x, y dx; y y
Ebben szerepel h’(y), tehát ez egy egyszerűen integrálható differenciálegyenlet h(y)-ra vonatkozólag. Ha ennek megoldását előállítottuk, behelyettesítjük F(x, y) fenti előállításába és a primitív függvényt megkaptuk. Lássuk, hogyan történik ez egy konkrét esetben. 2.1.15.Példa: Határozzuk meg a
3x e
2 y
1 3sin x x3e y y ' 0 y
elsőrendű differenciálegyenlet általános megoldását. Vezessük be a
1 P( x, y) 3x 2e y 3sin x ; Q( x, y) x3e y y
jelöléseket. A parciális deriváltak kiszámításával eldől, hogy az egyenlet egzakt-e. 211
Óbudai Egyetem BGK
Fejezetek a matematikából
P ' y ( x, y) 3x2e y ; Q 'x ( x, y) 3x 2e y Ezek a deriváltak egyenlők, tehát az egyenlet egzakt. Létezik tehát egy F(x, y) függvény, amelyre teljesülnek az alábbi egyenletek 1 F 'x ( x, y) 3x 2e y 3sin x ; 3 y 1 2 F ' y ( x, y ) x e y
F(x, y) előállítható például az első egyenlet integrálásával:
F ( x, y) 3x 2e y 3sin x dx x3e y 3cos x h( y)
ahol h(y) az y változónak egyelőre tetszőleges függvénye, ugyanis x-változó szerinti deriváláskor valóban eltűnik. A h(y) meghatározásához deriváljuk F-et az y-változó szerint és vessük össze a (2) egyenlettel 1 F ' y ( x, y) x3e y h '( y) x3e y ; y 1 Ebből látszik, hogy h '( y ) , tehát h y ln y . Meghatároztuk tehát az F(x, y) primitív y függvényt. F ( x, y) x3e y 3cos x ln y Innen a differenciálegyenlet általános megoldása implicit alakban a következő.
x3e y 3cos x ln y C . A 2.1.12. ábrán szemléltetjük az egzakt differenciálegyenlet általános megoldását.
2.1.12. Ábra: A 2.1.15. példabeli egzakt differenciálegyenlet iránymezője, és néhány integrálgörbe
212
Óbudai Egyetem BGK
Fejezetek a matematikából
2.1.11. Integráló tényező Természetesen nem teljesül minden esetben, hogy a differenciálegyenlet egzakt, tehát nem teljesül a P’y(x, y) = Q’x(x, y) egyenlőség. Ekkor felmerül a kérdés, hogy nem lehet-e az egyenletet egzakttá tenni. A válasz az, hogy bizonyos esetekben igen. Szorozzuk meg a P(x, y) + Q(x, y)∙y’(x) = 0 egyenletet egy olyan m(x, y) függvénnyel, amely a T tartományban sehol sem 0. m(x, y)∙P(x, y) + m(x, y)∙Q(x, y)∙y’(x) = 0 2.1.9.Definíció: Ha az m(x, y) függvény olyan, hogy az m(x, y)∙P(x, y), m(x, y)∙Q(x, y) függvénypárnak létezik primitív függvénye, akkor az m(x, y) függvényt a differenciálegyenlet integráló tényezőjének vagy multiplikátorának nevezzük. Az általános esetben a multiplikátor meghatározása parciális differenciálegyenletek megoldását igényli, ezért nem szólunk róla általánosan, csak abban a két speciális esetben, amikor a multiplikátor egyváltozós függvény. Kitűzzük tehát feladatként, hogy keressünk csak x-től függő m(x) vagy csak y-tól függő m(y) integráló tényezőt. 2.1.10.Példa: Keressünk integráló tényezőt az
y 2 1 xy 1 y ' 0 differenciálegyenlethez. Elsőként vizsgáljuk meg, hogy az egyenlet egzakt-e. Legyen
P x, y y 2 1; Q x, y xy 1 Ekkor P ' y x, y 2 y; Q 'x x, y y . Ezek a parciális deriváltak nem egyenlők, tehát az egyenlet nem egzakt. a) Keressünk csak az x-változótól függő m(x) multiplikátort. Ekkor az egyenlet alakja a következő m x y 2 1 m x xy 1 y ' 0
az a kérdés, létezik-e olyan m(x) függvény, amely esetén teljesül az egzaktság feltétele. A szükséges parciális deriváltak a következők
m x y2 1 2 y m x ; m x xy 1 m ' x xy 1 y m x ; y x
213
Óbudai Egyetem BGK
Fejezetek a matematikából
ezek egyenlősége az egzaktság feltétele, tehát m x 2 y m ' x xy 1 m x y; azaz
m ' x y m x xy 1
Ez m(x)-re vonatkozólag egy szeparálható differenciálegyenlet. Látható azonban, hogy a megoldás nem független y-tól, tehát a differenciálegyenletnek nem létezik csak x-től függő multiplikátora. b) Próbálkozzunk csak y-tól függő integráló tényező keresésével. Ekkor az egyenlet alakja
m y y 2 1 m y xy 1 y ' 0
A parciális deriváltak a következők
m y y2 1 m ' y y2 1 2 y m y ; m y xy 1 y m y y x
Az egzaktság feltétele pedig a következő
m ' y y 2 1 2 y m y y m y ; azaz
m ' y y 2 m y y 1
Ez ismét egy szeparálható differenciálegyenlet az ismeretlen m(y) függvényre vonatkozólag, és ezúttal eredményes a próbálkozás, mert a megoldás valóban csak az y-tól függ. Az egyenlet megoldása az alábbi.
dm 1 2y 1 dy; ln m y ln y 2 1 ; ahonnan m y 2 m 2 y 1 2
1 y2 1
Ezzel tehát megkaptuk az integráló tényezőt. Ellenőrizzük, hogy valóban egzakt egyenletet kaptunk-e. Az egyenlet alakja most
y2 1
xy 1 y ' 0 y2 1
Ellenőrizzük az egzaktság feltételét.
y
y2 1
xy 1 y 2 1 x y 2 1 y
;
y y2 1
;
Az egyenlet tehát valóban egzakt. A megoldás a korábbiak szerint innen már meghatározható. 214
Óbudai Egyetem BGK
Fejezetek a matematikából
A példában követett gondolatmenetet megfogalmazhatjuk egy tétel formájában is.
könnyen
általánosíthatjuk,
és
az
eredményt
2.1.9.Tétel: Tegyük fel, hogy a P(x, y) + Q(x, y)∙y’(x) = 0 differenciálegyenletnek létezik csak x változótól függő m(x) multiplikátora. Ekkor teljesül az
ln m x
P ' y x, y Q 'x x, y Q x, y
dx
összefüggés. Hasonlóan, ha a differenciálegyenletnek létezik csak y változótól függő m(y) multiplikátora akkor teljesül az
ln m y
Q 'x x, y P ' y x, y P x, y
dy
összefüggés. A multiplikátor ezekből az egyenletekből az integrál kiszámítása útján meghatározható. Bizonyítás: Tegyük fel, hogy létezik csak x-től függő multiplikátor. Ekkor a differenciálegyenlet alakja a következő m x P x, y m x Q x, y y ' 0 Az egzaktság feltétele a
P x, y Q x, y ; m x P x, y m x m x Q x, y m ' x Q x, y m x y y x x parciális deriváltak egyenlősége, azaz teljesülnie kell, hogy
m x
P x, y Q x, y m ' x Q x, y m x y x
Ez m(x)-re vonatkozólag egy szeparálható differenciálegyenlet. Egyszerűbb jelölésekkel
m ' x Q x, y m x P ' y x, y Q 'x x, y ; azaz
m ' x P ' y x, y Q 'x x, y m x Q x, y
Ennek az egyenletnek a megoldása pedig a következő egyenlőséggel adható meg:
ln m x
P ' y x, y Q 'x x, y Q x, y
215
dx
Óbudai Egyetem BGK
Fejezetek a matematikából
Az állítást ezzel igazoltuk. Hasonlóan, értelemszerű módosításokkal adódik a csak y-tól függő multiplikátorra vonatkozó integrálképlet. ■ Az egzakt egyenletek és egyben az elsőrendű differenciálegyenletek témájának lezárásaként vizsgáljuk meg, hogy milyen szempontból általánosabb az egzakt differenciálegyenlet, mint a megelőző pontokban vizsgált egyenletek. Elsőként megmutatjuk, hogy a szeparálható differenciálegyenlet egzakt differenciálegyenlet, másképpen mondva tehát a szeparálható egyenlet egy speciális egzakt egyenlet. Ez könnyen látható, ha a szeparálható egyenletet átrendezzük a következő módon
y ' f x g y; f x
1 y' 0 g y
Az egzaktság feltétele pedig a következő parciális deriváltak egyenlősége. Mivel 1 f x 0; másrészt 0 , ezek valóban azonosan egyenlők, tehát a szeparálható y x g y differenciálegyenlet egzakt. Mivel a homogén lineáris differenciálegyenlet szeparálható, azonnal következik, hogy a homogén lineáris differenciálegyenlet is egzakt differenciálegyenlet. Vizsgáljuk meg végezetül, hogy az inhomogén lineáris differenciálegyenlet egzakt-e. Ehhez írjuk fel az egyenletet az ekvivalens f x y g x y ' 0
alakban. Innen azonnal látható, hogy az egyenlet nem egzakt. Kérdés, hogy létezik-e integráló tényező. Keressünk csak x-től függő multiplikátort m x f x y g x m x y ' 0
Az egzaktság feltétele a következő parciális deriváltak egyenlősége
m x f x y g x m x f x ; m x m ' x y x az inhomogén lineáris differenciálegyenlet tehát egzakttá tehető, ha teljesül az m x f x m ' x egyenlőség, amely szeparálható egyenlet m(x)-re. Innen integrálással kapjuk, hogy f x dx m x e Megkaptuk tehát az x-től függő integráló tényezőt. Az inhomogén lineáris differenciálegyenlet
216
Óbudai Egyetem BGK
Fejezetek a matematikából e
f x dx
f x y g x e
ekvivalens alakja tehát egzakt differenciálegyenlet.
217
f x dx
y' 0
Óbudai Egyetem BGK
Fejezetek a matematikából
2.2. Másodrendű differenciálegyenletek 2.2.1.Bevezető példák 2.2.1.Példa: Tekintsünk egy m tömegű anyagi pontot, melyet egy D rugóállandójú rugóhoz, a rugó másik végét pedig egy függőleges falhoz rögzítjük. A tömegpont vízszintes síkban súrlódásmentesen mozoghat. Határozzuk meg a rugó helyét az idő függvényében. Jelölje a helykoordinátát y, amelyet ebben az esetben kitérésnek nevezünk. Helyezzük el a koordinátatengelyt úgy, hogy a rugó nyújtatlan helyzetében, tehát az egyensúlyi helyzetben, az m tömegű tömegpont az y = 0 helykoordinátánál van. Ezek után tehát feladat az y = y(t) függvény analitikus alakjának meghatározása. Induljunk ki a dinamika alaptörvényéből, mely szerint ma = ΣF. A gyorsulást a mondott feltételek mellett csak az F = –Dyrugóerő határozza meg, így a mozgásegyenlet a következő: ma = –Dy. Ha a tömegpontot úgy hozzuk mozgásba, hogy egyszerűen csak kitérítjük, és utána magára hagyjuk, akkor a mozgás egyenes mentén történik, így az előbbi vektori egyenlet skaláris egyenletté redukálódik. Tehát a mozgásegyenlet ma = – Dy. Ha felhasználjuk, hogy a pillanatnyi gyorsulás a helykoordináta második deriváltja, akkor kapjuk a következő differenciálegyenletet.
my " t Dy t ; ahol m és D rögzített állandók. A probléma egy olyan differenciálegyenletre vezetett, amelyben az ismeretlen függvény második deriváltja is szerepel az ismeretlen függvény mellett. Ez tehát egy másodrendű differenciálegyenlet. A tömegpont adott feltételek mellett kialakuló mozgását harmonikus rezgőmozgásnak nevezzük. ha alkalmazzuk a fizikában szokásos jelölést, és D bevezetjük az 2 jelölést, akkor kapjuk a harmonikus rezgés differenciálegyenletét a m szokásos alakban y " 2 y 0
2.2.2.Példa: Egészítsük ki az előző példabeli problémát azzal, hogy az m tömegű tömegpont nem súrlódásmentesen mozog, hanem ellenálló közegben, és tegyük fel, hogy a közegellenállás arányos a pillanatnyi sebességgel. Tehát hangsúlyozzuk, hogy nem súrlódási erő hat a tömegpontra, hanem közegellenállási erő. Legyen a közegellenállási erő alakja F= –kv. Ekkor a tömegpont mozgására vonatkozólag a dinamika alaptörvénye a következő: ma = –Dy – kv. Ha kitérítés után magára hagyjuk a tömegpontot a mozgás egyenes pályán történik, így ismét skaláris egyenletet kapunk: ma = –Dy– kv. Ha felhasználjuk, hogy a pillanatnyi sebesség a helykoordináta első deriváltja, akkor a következő differenciálegyenletet kapjuk:
my " t Dy t ky ' t ;
218
Óbudai Egyetem BGK
Fejezetek a matematikából
Ebben az egyenletben az ismeretlen függvény mellett szerepel annak első és második deriváltja is, de ismételten másodrendű differenciálegyenletet kaptunk. A harmonikus és közegellenállási erő együttes hatására kialakuló mozgást csillapított rezgőmozgásnak nevezzük. Ha alkalmazzuk a D k fizikában megszokott jelöléseket, azaz bevezetjük az 2 , 2 jelöléseket, akkor kapjuk a m m csillapított rezgés differenciálegyenletét y " 2y ' 2 y 0
2.2.3.Példa: Tegyük fel, hogy a csillapított rezgő rendszerre egy periodikus gerjesztő erő is hat, amely egy harmonikus rezgést kényszerít a tömegpontra. Legyen ennek a gerjesztésnek a körfrekvenciája Ω, ekkor a gerjesztő erő az F = F0sinΩt analitikus formában adható meg. Ekkor a mozgásegyenlet alakja a következő: ma = –Dy– kv+ F0sinΩt. Használjuk fel az előző példában F bevezetett jelöléseket és vezessük be továbbá a fizikában megszokott f 0 0 jelölést. Ekkor m kapjuk gerjesztett vagy kényszerített (és csillapított) rezgés differenciálegyenletét
y " 2y ' 2 y f0 sin t Ismét olyan differenciálegyenletet kaptunk, amely az ismeretlen függvényen és annak első deriváltján kívül a második deriváltat is tartalmazza. A különbség az első két példa egyenletéhez képest az, hogy ebben szerepel egy y-tól független tag is. Az alábbiakban, az elmélet kifejtése után alkalmazásképpen megoldjuk majd ezeket a másodrendű differenciálegyenleteket.
2.2.2. Explicit közönséges másodrendű differenciálegyenlet Egy explicit közönséges másodrendű differenciálegyenlet általános alakja a következő:
y " x f x, y x , y ' x ahol a jobb oldal, az f függvény az R3, tehát a háromdimenziós tér egy T tartományában van értelmezve. A továbbiakban alkalmazni fogjuk az y = y(x) egyszerűsítő jelölést. Először is tisztázzuk mit értünk általában egy ilyen másodrendű differenciálegyenlet megoldásán. Egy másodrendű differenciálegyenlet megoldása során elvileg két alkalommal integrálunk, még akkor is, ha ezt konkrétan egyes esetekben nem kell elvégeznünk, tehát adódik a megoldás során két integrációs konstans: C1 és C2. Így az általános megoldás ugyancsak végtelen sok függvény, de ezek a függvények két szabad paramétertől függenek, y = y(x, C1, C2), tehát ebben az esetben az általános megoldás egy kétparaméteres függvénysereg. Egy konkrét probléma megoldásaként ennek a függvényseregnek csak egy eleme jöhet szóba, ezt úgy választjuk ki, hogy a C1 és C2 konstansokat bizonyos feltételekből meghatározzuk. Mivel itt két konstans szerepel nyilván két kezdeti feltételre van szükség. Ezek standard alakja a 219
Óbudai Egyetem BGK
Fejezetek a matematikából
következő: y(x0) = y0 és y’(x0) = y1. Ez annyit jelent, hogy előírjuk, hogy az integrálgörbe haladjon át az (x0, y0) ponton, és ebben a pontban az integrálgörbe meredeksége legyen y1. 2.2.1.Definíció: Egy explicit közönséges másodrendű egyenletre vonatkozó kezdetiérték probléma vagy Cauchy-feladat az alábbi. y” = f(x, y, y’), y(x0) = y0, y’(x0) = y1 Ennek a kezdeti érték problémának a megoldását a differenciálegyenlet adott kezdeti feltételeket kielégítő partikuláris megoldásának nevezzük. Természetesen felmerül a kérdés, hogy milyen feltételek mellett létezik megoldás, és milyen esetben egyértelmű ez a megoldás. Az elsőrendű differenciálegyenletek elméletében adott feltételt általánosítjuk, tehát ragaszkodunk egy egyszerűen ellenőrizhető, a mérnöki gyakorlatban kielégítő feltétel megadásához. 2.2.1.Tétel: (Egzisztencia és unicitási tétel) Tegyük fel, hogy az y” = f(x, y, y’ ) differenciálegyenlet jobb oldala a T R3 térbeli tartományon van értelmezve, legyen továbbá (x0, y0, y1) T a tartomány egy tetszőleges belső pontja. a) Ha az f(x, y, y’)függvény folytonos az (x0, y0, y1) pont egy δ sugarú k x0 , y0 , y1 környezetében, tehát a T tartományhoz tartozó, (x0, y0, y1) középpontú δ sugarú nyílt gömbben, f b) továbbá az f(x, y,y’) függvény második változó szerinti x, y, y ' és harmadik változó y f szerinti x, y, y ' parciális deriváltja korlátos ebben a k x0 , y0 , y1 környezetben akkor az y ' y” = f(x, y, y’) differenciálegyenletnek létezik olyan y(x) megoldása, amely kielégíti az y(x0) = y0 és y’(x0) = y1 kezdeti feltételeket, és ez a megoldás a k x0 , y0 , y1 környezetben egyértelmű. Ha az a) és b) feltételek nem csak egy környezetben, hanem a teljes T tartományon teljesülnek, akkor az y(x0) = y0, y’(x0) = y1 kezdeti feltételeket kielégítő megoldás az egész T tartományon egyértelműen létezik, továbbá a megoldás (integrálgörbe) a T tartomány határától a T tartomány határáig halad. A mondottak szerint tehát az integrálgörbék adott kezdeti feltételek mellett egyértelműen létező térbeli görbék. Ez a szemléltetést némileg megnehezíti, mert a megoldásokat térben kellene ábrázolni. Ezért, azt tesszük, hogy az integrálgörbék (x,y)-síkra vonatkozó vetületét ábrázoljuk, ezzel illusztrálva a megoldásokat. Ebben az esetben azonban már nem teljesül az egyértelműség abban az értelemben, hogy a T háromdimenziós térbeli tartomány (x, y)-síkra vonatkozó T’ vetületének egy (x0, y0) pontján át nem pontosan egy, hanem végtelen sok megoldás halad át. Ugyanis végtelen sok integrálgörbe vetülete illeszkedik erre a pontra, hiszen az y’(x0) = y1 feltétel végtelen sokféle módon megválasztható a rögzített y(x0) = y0 feltétel mellett. Ez szemléletesen a következőt jelenti: az y(x0) = y0 kezdeti feltétel azt jelenti, hogy az y(x) megoldás illeszkedik az (x0, y0) pontra, az y’(x0) = y1 pedig azt jelenti, hogy az adott pontra illeszkedő y = y(x) görbe adott pontbeli meredeksége y1, ami végtelen sokféle módon megválasztható. 220
Óbudai Egyetem BGK
Fejezetek a matematikából
A továbbiakban különböző típusú, kvadraturával megoldható differenciálegyenlet típusokat vizsgálunk. Két osztályt vizsgálunk részletesen. Az első kategória olyan egyenleteket tartalmaz, amelyek elsőrendű egyenletre visszavezethetők, ezek lesznek a hiányos egyenletek. A másik kategória a műszaki és természettudományos szempontból legfontosabb lineáris és ilyenre visszavezethető egyenleteket tárgyalja.
2.2.3. Hiányos másodrendű differenciálegyenletek y " x f x, y x , y ' x 2.2.2.Definíció: Az explicit közönséges másodrendű differenciálegyenletet hiányosnak nevezzük, ha az egyenletben nem szerepel explicit módon az x-változó, vagy az y ismeretlen függvény, vagy az ismeretlen függvény y’ első deriváltja, vagy ezek egyszerre hiányoznak valamilyen kombinációban. Természetesen az egyenletből nem hiányozhat az y” második derivált, hiszen akkor az egyenlet nem másodrendű, tehát nem tartozik ebbe a fejezetbe. Az elnevezést módosíthatnánk úgy, hogy hiányos egyenlet helyett, „a differenciálegyenlet rendjének csökkentését lehetővé tevő egyenletek”-ről beszélnénk, hiszen mint látjuk, minden esetben visszavezetjük a megoldást elsőrendű differenciálegyenletek megoldására. A hiányos egyenletek a megoldás szempontjából három osztályba sorolhatók. a) Az egyenletből hiányzik y és y’, tehát az egyenlet alakja y” = f(x). b) Az egyenletből hiányzik y, tehát az egyenlet alakja y” = f(x, y’). c) Az egyenletből hiányzik x, tehát az egyenlet alakja y” = f(y, y’). Az alábbiakban ezt a felsorolást követve tárgyaljuk az egyes egyenletek megoldását. a) Az egyenletből hiányzik y és y’, tehát az egyenlet alakja y” = f(x). Ez a legegyszerűbb eset, a megoldás lényegében abból áll, hogy a jobboldali f(x) függvényt egymás után kétszer integráljuk. Azaz y " f x ; y ' f x dx C1; y
f x dx dx C1x C2 ;
Ezzel az egyenlet megoldását meg is határoztuk. A megoldás módszeréből viléágos, hogy voltaképpen két elsőrendű egyenlet megoldását határoztuk meg. Ha előírunk kezdeti feltételeket, akkor a C1 és C2 állandók meghatározhatók. 2.2.4.Példa: Ebbe a kategóriába tartozó egyik legegyszerűbb ugyanakkor legfontosabb példa, egy tömegpont állandó erő hatására kialakuló mozgásállapotának meghatározása. Legyen tehát F ma = F = állandó, azaz a állandó . Ekkor a megoldandó differenciálegyenlet a következő m y " a; a R
221
Óbudai Egyetem BGK
Fejezetek a matematikából
Követve a bemutatott gondolatmenetet, azaz kétszer integrálva, kapjuk az általános megoldást t2 y ' t v t at C1; y t a C1t C2 . 2
megkaptuk tehát a pillanatnyi sebességet és a helykoordinátát, mint az idő függvényét. Ha előírunk kezdeti feltételeket, a tömegpont helyét és sebességét a kezdeti t = 0s időpontban, azaz megköveteljük, hogy y(0) = y0 és y’(0) = v0 teljesüljön, akkor adódik a két integrációs állandó értéke. Könnyen ellenőrizhetően a partikuláris megoldás a következő y ' t v t at v0 ; y t
a 2 t v0t y0 . 2
Megkaptuk tehát az egyenletesen gyorsuló tömegpont, fizikából ismert kinematikai egyenleteit. b) Az egyenletből hiányzik y, tehát az egyenlet alakja y” = f(x, y’). Ebben az esetben egy olyan módszer teszi lehetővé a megoldást, amely nagyon gyakran alkalmazható a differenciálegyenletek megoldása során, és amelyet már az elsőrendű egyenletek tárgyalása során is bemutattunk, ez pedig az új ismeretlen függvény bevezetése. Legyen u(x) = y’(x) az új ismeretlen függvény. Ekkor nyilvánvalóan teljesül, hogy u’(x) = y”(x), tehát az egyenlet alakja a következő:
1 u ' f x, u ; 2 y ' u azaz y u x dx Kaptunk tehát két elsőrendű differenciálegyenletből álló rendszert. A megoldás módja a következő: Elsőként maghatározzuk az (1) elsőrendű differenciálegyenlet megoldását, az u(x) függvényt, melynek során születik egy C1 integrációs állandó. Majd ezt követően megoldjuk a (2) egyenletet, tehát integráljuk az u(x) függvényt, melynek során születik egy C2 integrációs konstans, ezzel előáll y(x) mint egy kétparaméteres függvénysereg, tehát az általános megoldás. 2.2.5.Példa: Tegyük fel, hogy egy m tömegű motorcsónak egy tóban állandó v0 sebességgel egyenes pályán halad. t = 0s-kor kikapcsoljuk a motort. Tegyük fel továbbá, hogy a motorcsónakra a pillanatnyi sebességgel egyenesen arányos, és azzal ellentétes irányú közegellenállási erő hat a vízben. Határozzuk meg a motorcsónak helyét az idő függvényében a motor kikapcsolását követően, ha a kezdeti feltételek a következők: y(0) = 0, y’(0) = v(0) = v0. A csónak mozgásegyenlete a következő: ma = –kv. Ha a szokásos módon áttérünk a deriváltakra, akkor kapjuk az
my " ky '; y 0 0; y ' 0 v0 ; hiányos másodrendű differenciálegyenletre vonatkozó Cauchy-feladatot. Az egyenlet valóban hiányos, és ebbe a kategóriába tartozik, ugyanis az egyenletben nem szerepel az y(t) ismeretlen függvény explicit módon. 222
Óbudai Egyetem BGK
Fejezetek a matematikából
k 0 m egyszerűsítő jelölés bevezetésével a következő elsőrendű, szétválasztható változójú egyenletet kapjuk
Vezessük be az új ismeretlen függvényt az u(x) = y’(x) definícióval. Ekkor, az
u ' u A változókat szétválasztva és integrálva a következő adódik. 1 1 du dt; du dt; ln u t ln C1 ; ln u ln et ln C1 ; y ' t u t C1e t ; u u Ahol C1 tetszőleges 0-tól különböző valós szám. Ezzel meg is kaptuk az y’ derivált függvény, tehát a sebesség időfüggésének analitikus alakját: y ' t v t C1et . Ennek integrálásával kapjuk a hely időfüggését. y t C1et dt
C1 t C e C2 C2 1 et
Az általános megoldást ezzel előállítottuk. Vegyük most figyelembe a kezdeti feltételeket. Az y’(0) = v(0) = v0 feltételből következik, hogy C1 = v0. Az y(0) = 0 kezdeti feltételből pedig az C adódik, hogy C2 1 . ha figyelembe vesszük az α értelmezését, akkor kapjuk a kezdeti feltételeket kielégítő partikuláris megoldást, tehát a motorcsónak mozgását leíró kinematikai egyenleteket.
v t v0e
t
t v m ; y t 0 1 e m k k
Azt kaptuk tehát, hogy mind a sebesség, mind a hely az idő exponenciális függvénye szerint változik.
223
Óbudai Egyetem BGK
Fejezetek a matematikából
a)
b)
2.2.1.Ábra. A 2.2.5. példabeli Cauchy feladat megoldása. a) a sebesség, b) a hely időfüggése
A 2.2.1. ábrán szemléltettük a Cauchy-feladat megoldását α = 0,1 és v0 = 5m/s konstansok esetében. Helyettesítéssel látható, de a görbékről is leolvasható, hogy t → ∞ esetén, tehát határértékben a sebesség tart 0-hoz, a megtett út hossza pedig közelít az 50m-hez. 2.2.6.Példa: Határozzuk meg, hogy egy homogén tömegeloszlású lánc (kötél, zsinór, stb.) kizárólag a saját súlyának a hatására, a gravitációs térben milyen alakot vesz fel. Azaz feladatként tűzzük ki a „láncgörbe” analitikus alakjának meghatározását.
F2
FB
y(x) α
F1
FA mg
x
2.2.2.Ábra. A „láncgörbe” meghatározásához tartozó statikai probléma diagramja
Alkalmazzuk az ábra jelöléseit. A görbének nyilván van egy abszolút minimuma, ahol az érintője vízszintes. Helyezzük el úgy a görbét a koordináta rendszerben, hogy ennek a pontnak az abszcisszája a 0 pontba kerüljön, majd vizsgáljuk a görbét a [0, x] intervallumon. Az ábra a lapján világos, hogy egy olyan statikai problémával állunk szemben, melyben az FA erő az FB erő 224
Óbudai Egyetem BGK
Fejezetek a matematikából
vízszintes komponensével tart egyensúlyt, az FB erő függőleges komponense pedig egyenlő a lánc [0, x] intervallumba eső darabjának mg súlyával. Az egyensúlyi egyenletek tehát a következők: FA F1 FB cos , másrészt pedig mg F2 FB sin . Ha képezzük a két egyenlet F sin hányadosát, figyelembe véve, hogy 2 tg y ' x , kapjuk, hogy a statikai probléma F1 cos mg az y ' x egyenletre vezet. A jobb oldal ebben az esetben az m tömegen keresztül függ az x FA helykoordinátától. Mivel a feltevés szerint a lánc homogén tömegeloszlású, az m tömeg arányos az s ívhosszúsággal. Ez utóbbit az analízisből ismert módon, az alábbi formula szolgáltatja. x
s x 1 y ' t dt 2
0
ha az arányossági tényezőt β jelöli, azaz m = βs, akkor kapjuk a következő egyenletet az y(x) függvényre vonatkozólag x 2 2 g g x s x 1 y ' t dt K 1 y ' t dt FA FA 0 0 Ahol K egy állandó. Ez még nem „igazi differenciálegyenlet”, hiszen az ismeretlen függvény egy integrandusban is szerepel. Ez a probléma eltűnik, ha egyszer deriváljuk ezt az egyenletet.
y ' x
y " x K 1 y ' x
2
Ez pedig már valóban egy hiányos másodrendű differenciálegyenlet, amelyből hiányzik az y. Vezessük be az u(x) = y’(x) jelöléssel az új ismeretlen függvényt. Ekkor az egyenlet alakja
u ' K 1 u2 amely elsőrendű, szétválasztható változójú differenciálegyenlet. Válasszuk szét a változókat és integráljunk.
1 1 u
2
du Kdx;
1 1 u2
du Kdx; arsh u x Kx C1; u x sh Kx C1
Ha figyelembe vesszük, hogy milyen módon helyeztük el a görbét a koordinátarendszerben, akkor világos, hogy y’(0) = u(0) = 0, ahonnan C1 = 0 következik. Ismételt integrálással kapjuk az y(x) függvény analitikus alakját ebben a speciális illetve az általános esetben. y x u x dx sh Kx dx
1 1 ch Kx C2 ; általánosan y x ch Kx C1 C2 K K
225
Óbudai Egyetem BGK
Fejezetek a matematikából
Kaptuk tehát, hogy egy lánc alakja a saját súlyának hatására egy koszinusz hiperbolikusz függvény görbéje. Ezért nevezzük az említett függvény grafikonját láncgörbének.
a)
b)
2.2.3.Ábra. A láncgörbedifferenciálegyenletének megoldása különböző kezdeti feltételek esetén.
A 2.2.3. ábrán látható a láncgörbe differenciálegyenletének megoldása különböző kezdeti feltételek esetén. Az a) ábrán az y(0) = 0, y’(0) = 0, a b) ábrán pedig y(0) = 2, y’(0) = 1 feltételek mellett. Ez utóbbi eset szemléletesen azt is jelentheti, hogy a lánc két végét különböző magasságban rögzítjük. Ekkor a lánc alakja nem szimmetrikus, hanem a b) ábrán látható alakú. c) Az egyenletből hiányzik x, tehát az egyenlet alakja y” = f(y, y’). Ebben az esetben az y ismeretlen függvényt úgy tekintjük, mint „független változót”, az y’ és y” deriváltakat közvetlenül nem az x hanem az y függvényének tekintjük. Közvetett módon természetesen mindekét derivált az x-változó függvénye. Ezt a gondolatot azonban fel tudjuk használni arra, hogy csökkentsük az egyenlet rendjét. Itt is egy új ismeretlen függvény bevezetése vezet eredményre, csak kissé körültekintőbben kell eljárni, mint az a) és b) esetekben. Vezessük be az új ismeretlen függvényt az u y x y ' y x vagy egyszerűbben az
u y y '( y) definícióval. A kérdés az, hogyan írható fel ekkor az y” második derivált függvény
az u függvény segítségével. Az összetett függvény deriválási szabályát alkalmazva, írhatjuk, hogy
y" u '
du du dy du du y' u dx dy dx dy dy
ahol az u = u(y) ismeretlen függvényt hangsúlyozottan az y-változó függvényének tekintjük, és a fenti átalakításban a deriválást az y-változó szerint kell elvégezni. Ezért is alkalmaztuk a klasszikus jelölést az egyszerűbb „vessző” helyett, hogy ezt egyértelművé tegyük. A másodrendű differenciálegyenlet alakja az alkalmazott transzformációval a következő
226
Óbudai Egyetem BGK
Fejezetek a matematikából du y " f y, y ' helyett u ' f y, u dy
amely egyenlet elsőrendű differenciálegyenlet az u = u(y) függvényre vonatkozólag, és ismét hangsúlyozzuk, hogy az ismeretlen függvény az y-változótól függ. Ha ezt a megoldást előállítottuk, akkor második lépésben meghatározzuk az
y ' x u y x ugyancsak elsőrendű differenciálegyenlet megoldását, melyben már szokásos módon az x-et tekintjük változónak. 2.2.7.Példa: Határozzuk meg az yy " y ' 0; y 0 e; y ' 0 e kezdeti érték probléma megoldását. A differenciálegyenlet valóban másodrendű hiányos egyenlet, hiányzik az egyenletből az x változó. Kövessük a fentiekben leírt gondolatmenetet. du u helyettesítést. Ekkor a következő differenciálegyenlet Elvégezzük az u y y '; y " dy adódik. du y u u2 0 dy 2
Világos, hogy ennek az egyenletnek egyrészt megoldása az u = 0, azonosan nulla függvény. Innen visszatérve az eredeti ismeretlen függvényre, adódik, hogy y ' x 0; y x C , tehát a konstans függvények megoldásai a differenciálegyenletnek. Azonban a kitűzött Cauchyfeladatnak nem megoldása a konstans függvény, mert az nem tehet eleget a második kezdeti feltételnek. Tegyük fel tehát, hogy u ≠ 0, és osszuk az egyenletet u-val. Ekkor egy szeparálható differenciálegyenletet kapunk, melynek megoldása a következő
y
du 1 1 1 1 u; du dy; du dy; ln u ln y ln C1 ; u y C1 y dy u y u y
Most visszatérhetünk az eredeti ismeretlen függvényre és eredeti változóra.
u y C1 y; y ' C1 y;
dy 1 1 C1 y; dy C1dx; dy C1dx; ln y C1x C2 ; y x eC1x C2 dx y y
A differenciálegyenlet általános megoldását megkaptuk. Ha figyelembe vesszük a kezdeti feltételeket, adódik, hogy C1 = C2 = 1. A kezdeti feltételeket kielégítő partikuláris megoldás tehát az y x e x1 függvény.
227
Óbudai Egyetem BGK
Fejezetek a matematikából
2.2.8.Példa: Határozzuk meg az yy "ln y y ' 0 hiányos másodrendű differenciálegyenlet általános megoldását. Az egyenlet a c) kategóriába tartozik, hiányzik az egyenletből az x változó. du Ebben az esetben is végrehajtjuk az u y y ' transzformációt és elvégezzük az y " u dy helyettesítést. Ekkor a következő egyenletre jutunk: 2
y
du u ln y u 2 0 dy
Ezt az egyenletet is kielégíti az u = 0 azonosan nulla függvény, tehát minden y(x) = C konstans függvény megoldása az egyenletnek. Tegyük most fel, hogy u ≠ 0 és osszuk el vele az egyenletet. Ekkor kapunk egy szeparálható egyenletet, melynek megoldása a következő
y
C du 1 1 ln y u 0; du dy; ln u ln ln y ln C1 ; u 1 dy u y ln y ln y
Itt áttérünk az eredeti ismeretlen függvényre és x változóra. Így a következő ugyancsak szeparálható egyenletet kapjuk, melynek megoldása
y'
C1 ; ln ydy C1dx; ln ydy C1dx; y ln y y C1x C2 ; ln y
Ezzel előállítottuk a hiányos differenciálegyenlet általános megoldását implicit alakban. Ennek a megoldás függvénynek nem is létezik explicit alakja, tehát a megoldást ebben a formában kell elfogadnunk. A 2.2.4. ábrán, különböző kezdeti feltételek mellett számítógép segítségével ábrázoltunk az implicit alakban adott megoldást különböző kezdeti feltételek mellett.
2.2.4.Ábra. A 2.2.8. példabeli hiányos másodrendű differenciálegyenlet néhány megoldása különböző kezdeti feltételek esetén..
228
Óbudai Egyetem BGK
Fejezetek a matematikából
2.2.4. Másodrendű lineáris differenciálegyenletek Ebben a pontban általánosan megvizsgáljuk az elméleti és gyakorlati szempontból egyaránt legfontosabb lineáris differenciálegyenleteket. A tárgyalás és az alkalmazások során ragaszkodni fogunk a másodrendű lineáris egyenlet vizsgálatához, bár már most hangsúlyozzuk, hogy a tárgyalás során ismertetett tételek és módszerek értelemszerű módosítással átültethetők magasabb rendű lineáris differenciálegyenletekre. Ez utóbbi témakört itt nem részletezzük, hanem utalunk a 2.3 fejezetre, ahol lineáris differenciálegyenlet rendszereket vizsgálunk majd, mely témakörnek speciális eseteként adódnak az eredmények a magasabb rendű lineáris egyenletekre vonatkozólag is. Elsőként az általános, függvény együtthatójú lineáris egyenleteket tanulmányozzuk. Előre kell bocsátanunk már most, hogy az általános esetben nem létezik módszer az ilyen egyenletek megoldásának előállítására, mindössze azt mondhatjuk, hogy ha a birtokunkban van egy megoldás, akkor ennek ismeretében előállíthatunk további megoldásokat. Ezen negatív megállapítás ellenére vizsgáljuk ezeket az egyenleteket, mert fontos megállapításokat tehetünk a megoldások szerkezetére vonatkozólag. Később speciális esetként részletesen tanulmányozzuk az állandó együtthatójú lineáris differenciálegyenleteket, ugyanis ebben a különleges esetben létezik kvadratura a megoldások előállítására. 2.2.3.Definíció: Tegyük fel, hogy az f1(x), f2(x) és a g(x) függvények folytonosak a valós számok halmazának egy korlátos és zárt I = [a, b] intervallumán. Az explicit közönséges másodrendű differenciálegyenletet lineárisnak nevezzük, ha ekvivalens átalakítások útján az alábbi alakra hozható
y " f1 x y ' f 2 x y g x ; vagy y " f1 x y ' f 2 x y g x ; Az elsőrendű esethez hasonlóan az egyenlet homogén lineáris, ha g(x) = 0, xI, tehát ha a jobb oldal azonosan 0 az [a, b] intervallumon, ellenkező esetben az egyenlet inhomogén lineáris. Felmerül a megoldás létezésének és egyértelműségének a kérdése. Ennek a kérdésnek a vizsgálatához az általános érvényű 2.2.1. tételt alkalmazzuk. 2.2.2.Tétel: Ha az f1(x), f2(x) és a g(x) függvények folytonosak a valós számok halmazának egy korlátos és zárt I = [a, b] intervallumán, akkor tetszőleges x0 a, b , y0 R, y1 R esetén az
y " f1 x y ' f 2 x y g x ; y x0 y0 ; y ' x0 y1 Cauchy-féle feladatnak egyértelműen létezik megoldása a teljes [a, b] intervallumon. Bizonyítás: Megmutatjuk, hogy ilyen feltételek mellett teljesülnek az általános 2.2.1. tétel feltételei. Valóban az y " f x, y, y ' f1 x y ' f 2 x y g x jelölés alkalmazásával a jobboldal folytonos függvény az egész [a, b] intervallumon, továbbá az f függvény második és harmadik változó szerinti parciális deriváltjai is korlátosak ezen az intervallumon, hiszen
229
Óbudai Egyetem BGK
Fejezetek a matematikából
f f x, y, y ' f2 x ; x, y, y ' f1 x ; y y ' és a feltételek szerint ezek a függvények folytonosak a korlátos és zárt [a, b] intervallumon, ebből következően korlátosak is, tehát a parciális deriváltak korlátosak. Az egzisztenciát és unicitást biztosító elégséges feltételek tehát teljesülnek. ■ A továbbiakban külön-külön foglalkozunk differenciálegyenlet megoldásával.
a
homogén
és
az
inhomogén
lineáris
2.2.4.1. Másodrendű homogén lineáris differenciálegyenlet Mielőtt rátérnénk az egyenlet megoldhatóságára, megoldására, szükséges tisztáznunk néhány fogalmat. Mint látni fogjuk, a lineáris algebra fogalmait ültetjük át függvények bizonyos osztályára, és az is kiderül majd, hogy a lineáris algebra apparátusát fogjuk alkalmazni a megoldás során. 2.2.4.Definíció: Az I intervallumon értelmezett y1(x), y2(x),….yn(x) függvények lineáris kombinációjának nevezzük az α1∙y1(x) + α2∙y2(x) + …+ αn∙yn(x) összeget, ahol α1, α2,…αnR valós számok, de elvileg megengedhetjük azt is, hogy az együtthatók komplexek legyenek. A most következő értelmezéssel lényegében egy egyszerűsítő jelölést vezetünk be, amellyel a későbbiekben egyszerűbb jelölés- és tárgyalásmódra nyílik lehetőség. 2.2.5.Definíció: Legyen az L operátor – függvényhez függvényt rendelő leképezés – az [a, b] intervallumon értelmezett kétszer deriválható függvények osztályán értelmezve a következő definícióval
L y : y " f1 x y ' f 2 x y Ez az operátor tehát előállítja a homogén lineáris differenciálegyenlet bal oldalát egy adott y függvényre alkalmazva. Elsőként bizonyítjuk ezen operátor legfontosabb tulajdonságait. 2.2.3.Tétel: Az L operátor lineáris, azaz a) additív: L y1 y2 L y1 L y2 ;
b) homogén: L y L y ; R vagy C .
230
Óbudai Egyetem BGK
Fejezetek a matematikából
Bizonyítás: Mindkét állítás a deriválási szabályokon múlik. a) L y1 y2 : y1 y2 " f1 x y1 y2 ' f 2 x y1 y2
y1 " f1 x y1 ' f 2 x y1 y2 " f1 x y2 ' f 2 x y2 L y1 L y2
b)
L y : y " f1 x y ' f 2 x y y " f1 x y ' f 2 x y L y
Ezzel az operátor linearitását bizonyítottuk. ■ A bevezetett operátor egyik haszna, hogy segítségével a homogén lineáris differenciálegyenlet a nagyon egyszerű L[y] = 0, az inhomogén egyenlet pedig az L[y] = g(x) jelöléssel adható meg. A linearitás közvetlen következménye az alábbi állítás. 2.2.4.Tétel: Ha az y1(x), y2(x),….yn(x) függvények az I intervallumon megoldásai az L[y] = y” + f1(x)∙y’ + f2(x)∙y = 0 homogén lineáris differenciálegyenletnek, akkor ezen függvények tetszőleges α1∙y1(x) + α2∙y2(x) + …+ αn∙yn(x) lineáris kombinációja is megoldása ennek az egyenletnek, tetszőleges valós vagy komplex együtthatók esetén. Bizonyítás: A linearitás miatt írhatjuk, hogy
n n n L i yi i L yi i 0 0 i 1 i 1 i 1 Tehát a lineáris kombináció valóban kielégíti az egyenletet. Ezt kellett bizonyítani. ■ A linearitásnak van egy további fontos következménye, amelyet az állandó együtthatójú egyenletek témakörében fel fogunk használni. 2.2.5.Tétel: Ha a valós változójú, komplex értékű y x u x iv x függvény megoldása az L[y] = 0 egyenletnek, akkor a komplex értékű függvény u(x) valós része is és v(x) képzetes része is megoldása az egyenletnek. Bizonyítás: A linearitás miatt, felhasználva, hogy a konstans szorzók akár komplexek is lehetnek, kapjuk, hogy
L y L u iv L u iL v 0 i0 0
Mivel a 0 valós része is és képzetes része is 0, szükségképpen teljesül, hogy L[u] = 0 és L[v] = 0. Ezt kellett igazolni. ■ 231
Óbudai Egyetem BGK
Fejezetek a matematikából
A bizonyított tétel a lineáris algebra nyelvén a következő módon fogalmazható. Az L[y] = 0 homogén lineáris egyenlet megoldásai alteret alkotnak az [a, b] intervallumon értelmezett kétszer deriválható függvények lineáris terében. Felmerül a kérdés, hogy hány különböző függvényt kell meghatároznunk ahhoz, hogy előállíthassuk a homogén lineáris differenciálegyenlet összes megoldását, más szóval az a kérdés, hogy ez az altér hány dimenziós. Ennek a kérdésnek tisztázását segíti elő az alábbi értelmezés. 2.2.6.Definíció: Az I intervallumon értelmezett y1(x) és y2(x) függvényeket lineárisan függetlennek nevezzük, ha az α1∙y1(x) + α2∙y2(x) = 0, x[a, b] (α1, α2Rvagy C ) egyenlőség minden x[a, b] esetén csak akkor áll fenn, ha α1 = α2= 0. Ellenkező esetben azt mondjuk, hogy az y1(x) és y2(x) függvények az [a, b] intervallumon lineárisan összefüggő rendszert alkotnak. Hogyan dönthető el egy függvényrendszerről, hogy lineárisan összefüggő-e. Ennek a kérdésnek a vizsgálata újabb fogalom értelmezését követeli meg. 2.2.7.Definíció: Az [a, b] intervallumon értelmezett deriválható y1(x) és y2(x) függvények Wronski-determinánsán az alábbi determinánst értjük.
W y1 x , y2 x
y1 x y1 x
y2 x y2 x
Három függvény esetében az I intervallumon értelmezett, kétszer deriválhatóy1(x), y2(x)ésy3(x) (xI) függvények Wronski-determinánsán az alábbi determinánst értjük.
y1 y2 W y1 , y2 , y3 y1 y2 y1 y2
y3 y3 y3
A lineáris függetlenség és a Wronski-determináns kapcsolatát tisztázzák az alábbi állítások. 2.2.6.Tétel: Ha az y1(x) és y2(x) deriválható függvények az [a, b] intervallumon lineárisan összefüggenek, akkor a W(y1(x), y2(x)) Wronski-determináns az [a, b] intervallumon azonosan nulla. Bizonyítás: Tegyük fel, hogy az y1(x) és y2(x) függvények az [a, b] intervallumon lineárisan összefüggenek. Ez azt jelenti, hogy ha teljesül az α1∙y1(x) + α2∙y2(x) = 0, x[a, b]
232
Óbudai Egyetem BGK
Fejezetek a matematikából
azonosság, akkor legalább az egyik együttható különbözik zérustól, például α1 ≠ 0. Ezen feltétellel az y1 függvény kifejezhető az y2 függvény segítségével: y1 2 y2 . Ekkor a 1 Wronski-determináns a következő
y x W y1 x , y2 x 1 y1 x
y2 x y2 x
2 y2 1
y2
2 y2 1
y2
2 y2 1 y2
y2 0 y2
hiszen a determináns két oszlopa megegyezik. ■ A bizonyított tétel szó szerint igaz n> 2 számú függvény esetére is, a bizonyítás is átvihető erre az esetre értelemszerű módosítással. 2.2.9.Példa: Igazoljuk a bizonyított tétel alapján, hogy az 1, cos2x, cos2x függvények lineárisan összefüggenek. A három függvény Wronski-determinánsa
cos 2 x
cos 2 x
2sin 2 x
2 cos x sin x
1 W y1 , y2 , y3 0
0 4 cos 2 x 2sin x 2 cos x 2
2
2sin 2 x
sin 2 x
4 cos 2 x 2 cos 2 x
4sin 2 x cos 2 x 4 cos 2 x sin 2 x 0; valóban azonosan nulla a teljes számegyenesen, tehát a függvények lineárisan összefüggenek. Ezt a tényt egy ismert trigonometrikus azonosság alapján is tudjuk. Eszerint
cos2 x
1 cos 2 x 1 1 ; azaz cos 2 x cos 2 x 0; 2 2 2
valóban elő lehet állítani az azonosan nulla függvényt nem kizárólag zérus együtthatókkal. 2.2.10.Példa: Igazoljuk a bizonyított tétel alapján, hogy az ex, e–x, shx függvények lineárisan összefüggenek. A három függvény Wronski-determinánsa ex
e x
sh x
W y1 , y2 , y3 e x
e x
ch x 0
ex
e x
sh x
ex 0
e x 2e x 0
sh x ch x sh x 0 0
a teljes számegyenesen, tehát a három függvény valóban lineárisan összefügg. Ezt azonban már a hiperbolikus függvény definíciója alapján is tudjuk, mely szerint
233
Óbudai Egyetem BGK
Fejezetek a matematikából sh x
e x e x 1 1 ; azaz e x e x sh x 0; 2 2 2
és az együtthatók nem mind zérusok, sőt egy sem zérus. Az előbbi állításnak közvetlen következménye az alábbi tétel. 2.2.7.Tétel: Ha az y1(x) és y2(x) deriválható függvények W(y1(x), y2(x)) Wronski-determinánsa az [a, b] intervallumon nem azonosan nulla, akkor az y1(x) és y2(x) függvények az [a, b]-n lineárisan függetlenek. Bizonyítás: Indirekt tegyük fel, hogy az y1(x) és y2(x) függvények az [a, b]-n lineárisan összefüggenek. Ekkor az előző tétel szerint a Wronski-determinánsuk azonosan nulla. Ezzel ellentmondásra is jutottunk. ■ Ha feltesszük, hogy az y1(x) és y2(x) függvények megoldásai az L[y] = 0 differenciálegyenletnek, akkor a Wronski-determinánsról sokkal több is állítható. 2.2.8.Tétel: Ha az y1(x) és y2(x) kétszer deriválható függvények lineárisan független megoldásai az L[y] = 0 homogén lineáris differenciálegyenletnek, akkor a W(y1(x), y2(x)) Wronskidetermináns az [a, b] intervallumon sehol sem lehet nulla. Bizonyítás: Tegyük fel az állítással ellentétben, hogy a Wronski-determináns egy x0 pontban eltűnik. Vizsgáljuk az α1 és α2 ismeretlenekre vonatkozó alábbi homogén lineáris egyenletrendszert
1 y1 x0 2 y2 x0 0 1 y '1 x0 2 y '2 x0 0 Ennek az egyenletrendszernek a determinánsa éppen a W(y1(x0), y2(x0)) Wronski-determináns, amely a feltétel szerint zérus. Ekkor a homogén lineáris egyenletrendszerek elméletéből ismert, hogy van a rendszernek nemtriviális megoldása. Legyen α1 és α2 egy olyan megoldás, melyre legalább az egyik αi ≠ 0. A korábbiak szerint tudjuk, hogy ekkor az y(x) = α1∙y1(x) + α2∙y2(x) lineáris kombináció is megoldása az L[y] = 0 homogén lineáris differenciálegyenletnek, és a feltételek szerint ez a megoldás kielégíti az y(x0) = 0, y’(x0) = 0 kezdeti feltételeket. Ezeket a feltételeket azonban a triviális, azonosan nulla megoldás is kielégíti. Használjuk most fel, hogy a megoldás bármely kezdeti feltétel szerint egyértelműen létezik. Eszerint az y(x) csak az azonosan nulla megoldás lehet:
y x 1 y1 x 2 y2 x 0; ahol legalább az egyik αi ≠ 0, ami azt jelenti, hogy az y1(x) és y2(x) függvények lineárisan összefüggenek. Ez ellentmond a tétel azon feltételének, hogy ezek a függvények lineárisan függetlenek. ■ Ez a tétel is általánosítható kettő helyett több függvényre és a bizonyítás is átvihető erre az általános esetre értelemszerű módosítással. 234
Óbudai Egyetem BGK
Fejezetek a matematikából
A bizonyított tételek következménye, ha tetszik összefoglalása az alábbi tétel. 2.2.9.Tétel: Az L[y] = 0 homogén lineáris differenciálegyenlet y1, y2, …, yn megoldásai az [a, b] intervallumon akkor és csak akkor lineárisan függetlenek, ha a W(y1, y2, …, yn) Wronskidetermináns az [a, b] intervallumon sehol sem tűnik el. ■ A pont elején feltett kérdésre a következő alapvető tétel adja a választ. 2.2.10.Tétel: Az y” + f1(x)∙y’ + f2(x)∙y = 0 (x[a, b]) másodrendű, homogén lineáris differenciálegyenlet bármely három y1(x), y2(x)ésy3(x) (x[a, b]) megoldása az [a, b] intervallumon lineárisan összefüggő. Bizonyítás: Legyen x0[a, b] egy tetszőlegesen rögzített pont az intervallumban, és vizsgáljuk az L[y] = 0, y(x0) = 0, y’(x0) = 0 Cauchy-féle feladatot. Az egzisztencia tétel szerint ennek egyértelműen létezik megoldása, és ez a megoldás nyilván az azonosan nulla függvény. Vizsgáljuk ezután az α1, α2, α3 ismeretlenekre vonatkozó alábbi homogén lineáris algebrai egyenletrendszert: 1 y1 x0 2 y2 x0 3 y3 x0 0; 1 y '1 x0 2 y '2 x0 3 y '3 x0 0; Ebben a rendszerben az ismeretlenek száma nagyobb, mint az egyenletek száma, tehát végtelen sok megoldás van, azaz létezik olyan megoldás is, amelyben legalább az egyik αi ≠ 0. Mivel megoldások tetszőleges lineáris kombinációja is megoldás, tehát az 1 y1 x 2 y2 x 3 y3 x függvény is megoldás, a megoldás egyértelműsége miatt azonban
1 y1 x 2 y2 x 3 y3 x 0; x a, b ami pontosan azt jelenti, hogy a három megoldás lineárisan összefüggő. ■ Ezzel a tétellel analóg tétel igazolható n-ed rendű lineáris differenciálegyenletre, mely szerint egy n-ed rendű lineáris egyenlet bármely n + 1 db megoldása lineárisan összefüggő. Mint azt a lineáris algebrában is láttuk, ha egy rendszer lineárisan összefüggő, akkor a rendszerből egyenként elhagyhatók mindazok a függvények, amelyek előállíthatók a többi függvény lineáris kombinációjával, ekkor a rendszer által előállítható függvények lineáris tere nem változik, a maradék lineárisan független rendszer ugyanazt a lineáris teret generálja. Ebből következik, hogy a másodrendű homogén lineáris differenciálegyenlet megoldása során elég meghatároznunk két lineárisan független megoldást. 2.2.8.Definíció: Az y1(x), y2(x) (x[a, b]) függvénypárt az [a, b] intervallumon a homogén lineáris differenciálegyenlet egy alaprendszerének nevezzük, ha lineárisan függetlenek és mindkét függvény megoldása az y” + f1(x)∙y’ + f2(x)∙y = 0 (x[a, b]) differenciálegyenletnek. Felmerül a kérdés, létezik-e egyáltalán alaprendszer és ha igen, hogyan lehet előállítani. A létezést biztosítja az alábbi tétel.
235
Óbudai Egyetem BGK
Fejezetek a matematikából
2.2.11.Tétel: Az L[y] = 0 másodrendű lineáris differenciálegyenletnek létezik végtelen sok alaprendszere. Bizonyítás: Legyenek az a11, a12 , a21, a22 valós számok olyanok, hogy rájuk vonatkozólag teljesül az a11a22 a12a21 0 feltétel. Ezek után legyen x0[a, b] tetszőleges, és tegyük fel, hogy az y1(x), y2(x) függvények rendre megoldásai az
L y 0; y1 x0 a11; y1 ' x0 a21; L y 0; y2 x0 a12 ; y2 ' x0 a22 ; kezdeti érték problémának. Ennek a két megoldásnak a Wronski-determinánsa
W y1 x , y2 x
a11 a12 a11a22 a12 a21 0 a21 a22
nullától különbözik. Ez pontosan azt jelenti, hogy az y1(x), y2(x) függvények alaprendszert alkotnak. Mivel az aij konstansok végtelen sokféle módon megválaszthatók úgy, hogy a determináns nullától különbözzön, valóban végtelen sok alaprendszer létezik. ■ A másodrendű homogén lineáris differenciálegyenlet általános megoldásáról szól a következő állítás. 2.2.12.Tétel: Tegyük fel, hogy az y1(x) és y2(x) függvények az I intervallumon alaprendszerét képezik az y” + f1(x)∙y’ + f2(x)∙y = 0 (xI) differenciálegyenletnek. Ekkor tetszőleges C1, C2R állandók esetén a C1∙ y1(x) + C2∙ y2(x) függvény a differenciálegyenlet megoldása, és fordítva a differenciálegyenlet minden megoldása előállítható ilyen alakban. Bizonyítás: A tétel állításának azon része, hogy megoldások lineáris kombinációja is megoldás, következik a korábbiakból. Csak azt kell igazolnunk, hogy minden megoldás előállítható egy alaprendszer lineáris kombinációinak segítségével. Legyen h(x) egy tetszőleges megoldás. Tetszőleges x0[a, b] esetén a h(x) függvény nyilván egyértelmű megoldása az
L y 0; y x0 h x0 ; y ' x0 h ' x0 ; Cauchy-feladatnak. Vizsgáljuk most az
1 y1 x0 2 y2 x0 0; 1 y1 ' x0 2 y2 ' x0 0;
236
Óbudai Egyetem BGK
Fejezetek a matematikából
homogén lineáris egyenletrendszert. Ennek determinánsa éppen a W(y1(x0), y2(x0)) Wronskidetermináns, amely különbözik nullától, hiszen az y1(x) és y2(x) függvények alaprendszert alkotnak. Ezért ennek az egyenletrendszernek egyértelműen létezik megoldása, jelölje ezt α1, α2. Ekkor természetesen az 1 y1 x 2 y2 x függvény is megoldása a differenciálegyenletnek. Mivel azonban a megoldás egyértelmű, 1 y1 x 2 y2 x h x . Ezzel az állítást igazoltuk. ■ A tétel állítása azt jelenti tehát, hogy a differenciálegyenlet általános megoldásának előállításához meg kell határozni a differenciálegyenlet két lineárisan független megoldását. Egy probléma van azonban, az általános, függvény együtthatójú esetben erre nincs módszer. Azt tehetjük, hogy az f1(x) és f2(x) függvények konkrét alakjától függően próbafüggvényeket alkalmazunk, megpróbálunk az egyenletbe helyettesíteni egy polinom függvényt, exponenciális függvényt, racionális törtfüggvényt, trigonometrikus függvények lineáris kombinációját,…stb, és ha szerencsénk van, létezik ilyen alakú megoldás. 2.2.11.Példa: Határozzuk meg az alábbi másodrendű lineáris differenciálegyenlet általános megoldását.
2 x 1 y " 4 xy ' 4 y 0; Mivel az említettek szerint általános módszer nincs a megoldás előállítására, próbafüggvényekkel juthatunk célhoz. Egy megoldást próbáljunk keresni elsőfokú polinom formájában, azaz legyen y1 x Ax B . Helyettesítéssel a következőt kapjuk.
2 x 1 0 4 x A 4 Ax B 0; Ez az egyenlőség azonosan teljesül, ha B = 0, és A tetszőleges valós szám. Válasszuk ez utóbbit a legegyszerűbben, legyen A = 1. Kaptuk tehát, hogy y1 x megoldása a differenciálegyenletnek. A második, lineárisan független megoldást keressük exponenciális függvény alakjában, legyen tehát y2 x eax . Ismét helyettesítve az egyenletbe azt kapjuk, hogy
2 x 1 a2eax 4 xaeax 4eax 0; azaz 2 xa2 a2 4 xa 4 eax 0 Ez az egyenlőség azonosan teljesül, ha 2a2 + 4a = 0 és a2 – 4 = 0. Ez pedig akkor igaz, ha a = –2. kaptuk tehát, hogy a differenciálegyenlet egy második megoldása az y2 x e2 x függvény. Még meg kell vizsgálnunk, hogy a kapott két megoldás lineárisan független-e. Ehhez kiszámítjuk a Wronski-determinánsukat.
W x, e
2 x
1 x
e2 x 2e
2 x
2 xe2 x e2 x 2 x 1 e2 x
237
Óbudai Egyetem BGK
Fejezetek a matematikából
1 1 ez pedig különbözik nullától a , ; , intervallumon bármelyikén. Ezek szerint 2 2 megkaptuk a differenciálegyenlet alaprendszerét a megjelölt intervallumokon. Innen már következik, hogy a differenciálegyenlet általános megoldása a következő.
yhá x C1x C2e2 x ; C1, C2 R A megoldás előállításával kapcsolatban egy pozitív eredményt azonban tudunk említeni. Az alábbi tételből kiderül, hogy ha már ismert egy megoldás, akkor egy elsőrendű differenciálegyenlet megoldásával elő lehet állítani egy másik megoldást, ami az ismert megoldással együtt alaprendszert képez. Ezt biztosítja az alábbi állítás. 2.2.13.Tétel: (Liouville-tétele) Ha y1(x) és y2(x) függvények az I intervallumon megoldásai az y” + f1(x)∙y’ + f2(x)∙y = 0 (xI) differenciálegyenletnek, akkor a W(y1(x), y2(x)) Wronski-determináns az I intervallumon eleget tesz az y’ + f1(x)∙y = 0 elsőrendű homogén lineáris differenciálegyenletnek. Bizonyítás: Képezzük a Wronski-determináns deriváltját:
W ' y1 x , y2 x
y1 x y1 x
y2 x y x 1 y2 x y "1 x
y2 x
y "2 x
y1 x
y "1 x
y2 x
y "2 x
Hiszen az első determináns két sora megegyezik. Vegyük most figyelembe a homogén lineáris egyenlet explicit alakját. Ekkor kapjuk, hogy
W ' y1 , y2
f1 x
y1 y '1
y1 y "1
y1 y2 y2 y "2 f1 x y1 ' f 2 x y1 f1 x y2 ' f 2 x y2
y2 y f2 x 1 y '2 y1
y2 y f1 x 1 y2 y '1
y2 f1 x W y1 , y2 y '2
Tekintsük az egyenlőséglánc elejét és végét. Átrendezve éppen a bizonyítandó egyenlőséget kapjuk. ■ Az elsőrendű lineáris egyenletek témakörében elállítottuk ennek az egyenletnek az általános megoldását. f ( x ) dx y ( x) C e 1
238
Óbudai Egyetem BGK
Fejezetek a matematikából
Tehát ha az y(x) helyére a W(y1(x), y2(x)) Wronski-determinánst helyettesítjük, akkor a f ( x ) dx W y ( x), y x C e 1 1
2
egyenletet kapjuk. Ez az összefüggés lehetőséget biztosít egy ismert megoldás birtokában arra, hogy egy másik, lineárisan független megoldást is előállítsunk. Legyen ugyanis az ismert megoldás y1(x). Ekkor az
y1 x
y '1 x
y y'
f ( x ) dx f ( x ) dx C e 1 ; azaz y1 x y ' y '1 x y C e 1 ;C0
elsőrendű inhomogén lineáris differenciálegyenletből meghatározott y(x) a Liouville-féle tétel szerint C ≠ 0 esetén a differenciálegyenlet lineárisan független megoldása, hiszen ekkor a determináns nem lehet zérus, így a kapott y(x) megoldás az y1(x) függvénnyel együtt alaprendszert alkot. Ez a differenciálegyenlet egy elsőrendű inhomogén lineáris differenciálegyenlet, így az elsőrendű egyenletek elméletének ismeretében megoldható. Azonban van egyszerűbb módszer is. Osszuk el ezt az egyenletet az y1(x) függvény négyzetével. Ekkor az adódik, hogy
y1 x y ' y '1 x y y12
x
C y12
x
f ( x ) dx e 1
A kapott egyenlet bal oldalát vizsgálva vegyük észre, hogy az éppen az
y
y1 x
hányados
deriváltja. Ennek figyelembe vételével az egyenlet megoldása nagyon egyszerű
y C f ( x ) dx e 1 ; ahonnan y2 x y1 x 2 y x y x 1 1
C f ( x ) dx e 1 2 dx y x 1
Explicit módon előállítottuk tehát az egyenlet lineárisan független második megoldását. 2.2.12.Példa: Határozzuk meg az alábbi másodrendű lineáris differenciálegyenlet általános megoldását. x 2 ln xy " xy ' y 0; standard alakban y "
1 1 y ' 2 y0 x ln x x ln x
Könnyen látható, hogy az y1 x x függvény megoldása a differenciálegyenletnek. Azonban második megoldást nem találunk sem polinom, sem exponenciális függvény formájában. Ezért a Liouville-tételhez folyamodunk. Egy ismert megoldás birtokában előállítunk egy másik megoldást. A tétel szerint az
239
Óbudai Egyetem BGK
Fejezetek a matematikából
1 1 dx dx x y x ln x x ln x ; 1 e ; azaz xy ' y e 1 y' differenciálegyenlet megoldását kell meghatároznunk. A C konstanst, célszerűségi okokból –1-nek választottuk. Felhívjuk a figyelmet, hogy az f1(x) függvényt a differenciálegyenlet standard alakjáról olvassuk le, amikor is az y” második derivált függvény együtthatója 1. Ha nem így járunk el, természetesen hibát követünk el. Ez, mint említettük egy elsőrendű inhomogén lineáris differenciálegyenlet, ám némileg speciális. Megoldása során kihasználjuk azt az észrevételt, amelyet a Liouville-tétel bizonyítása utáni megjegyzésben tettünk. Eszerint az egyenlet felírható az alábbi ekvivalens alakban 1 1 x ln x dx 1 ln ln x 1 y 2 e 2 ln x 2 e x x x x
Ebből az egyenletből az y integrálással majd x-szel történő szorzással adódik. Parciálisan integrálva kapjuk, hogy y 1 ln x 1 ln x 1 2 ln xdx 2 dx ; ahonnan y2 x ln x 1 x x x x x x
Előállítottuk tehát a differenciálegyenlet egy második megoldását. Kérdés, hogy a két megoldás lineárisan független-e. Ennek eldöntéséhez kiszámítjuk a Wronski-determinánst.
W x, ln x 1
x ln x 1 1
1 x
1 ln x 1 ln x
Ez pedig különbözik nullától a 0,1; 1, intervallumok bármelyikén. Eszerint bármely említett intervallumon a differenciálegyenlet általános megoldása a következő yhá x C1x C2 ln x 1 ; C1, C2 R
2.2.13.Példa: Igazoljuk, hogy az
e x 1 y " 2 y ' e x y 0; standard alakban y "
2 ex y ' y0 ex 1 ex 1
másodrendű homogén lineáris differenciálegyenletnek megoldása az y1 x e x 1 függvény, majd állítsuk elő az általános megoldást. Helyettesítéssel meggyőződhetünk, hogy ez a függvény valóban megoldása az egyenletnek, ugyanis
240
Óbudai Egyetem BGK
e
x
Fejezetek a matematikából
1 y " 2 y ' e x y e x 1 e x 2e x e x e x 1 e2 x e x 2e x e 2 x e x 0
valóban azonosan teljesül. A második, lineárisan független megoldást keressük a Liouvilletétellel, mely szerint egy másik megoldás kielégíti az ex 1
y
ex
y'
C e
2 e x 1
dx
2
; tehát az e 1 y ' e y Ce x
x
e x 1dx
;
differenciálegyenletet. Vegyük figyelembe, hogy a bal oldal, az egyenlet (ex – 1)2-nel történő osztása után egy hányados deriváltja. Az integrandus célszerű átalakításával a következőt kapjuk. x
e 2 dx 2ln e x 1 C C C y e x 1 e e x 2 2 2 e 1 ex 1 ex 1 e x 1 e x 1
e 2
Ce2 x 2x
1
2
Ez az egyenlet könnyen integrálható, az integrálás eredménye a következő
y Ce2 x C 1 1 dx ; ahonnan y2 x x x 2 2x 2 e 1 e 1 e 1 e2 x 1
Itt a konstansnak a C = –2 értéket adtuk. Kaptunk tehát egy második megoldást. Az általános tételből következik, hogy a két megoldás lineárisan független, de azért megmutatjuk ebben a konkrét esetben is, hogy ez igaz. Kiszámítjuk a Wronski-determinánst
ex 1 1 W e x 1, x e 1
1 e 1 ex x
ex
e 1 x
2
2e2 x
ex 1
2
0
sehol sem zérus, így a kapott két függvény a differenciálegyenlet alaprendszerét képezi a teljes számegyenesen. Az általános megoldás ezért a következő
yhá x C1 e x 1 C2
1 ; C1 , C2 R e 1 x
A továbbiakban rátérünk az inhomogén lineáris differenciálegyenletek megoldásának vizsgálatára.
241
Óbudai Egyetem BGK
Fejezetek a matematikából
2.2.4.2. Másodrendű inhomogén lineáris differenciálegyenlet Idézzük fel, hogy a feltételek szerint f1(x), f2(x) és a g(x) függvények folytonosak a valós számok halmazának egy I intervallumán. Megoldandó az y” + f1(x)∙y’ + f2(x)∙y = g(x) másodrendű inhomogén lineáris differenciálegyenlet. A megoldások szerkezetét tisztázza az alábbi állítás. 2.2.14.Tétel: Tegyük fel, hogy az hogy az y1(x) és y2(x) függvények az I intervallumon alaprendszerét képezik az L y 0 (xI) homogén lineáris differenciálegyenletnek. Az yip(x) függvény pedig legyen az L y g x (xI) inhomogén lineáris differenciálegyenlet egy tetszőleges partikuláris megoldása. Ekkor tetszőleges C1, C2R állandók esetén a C1∙ y1(x) + C2∙ y2(x) + yip(x) függvény az inhomogén differenciálegyenlet megoldása, és fordítva a differenciálegyenlet minden megoldása előállítható ilyen alakban. Bizonyítás: Az L operátor linearitásából adódik, hogy ez a függvény megoldása az inhomogén egyenletnek. Valóban L C1 y1 C2 y2 yip C1L y1 C2 L y2 L yip 0 0 g x g x
Már csak azt kell megmutatni, hogy bármely megoldás előáll ilyen alakban. Legyen h(x) egy tetszőleges megoldása az inhomogén egyenletnek. Ekkor ugyancsak az L operátor linearitása miatt, kapjuk, hogy L h yip L h L yip g x g x 0
Ami azt jelenti, hogy a h(x) – yip(x) függvény megoldása a homogén lineáris egyenletnek. A homogén lineáris egyenlet általános megoldása pedig előáll az alaprendszer lineáris kombinációjaként, azaz teljesül, hogy alkalmas C1 és C2 állandókkal h yip C1 y1 C2 y2 ; azaz h C1 y1 C2 y2 yip
Éppen ezt kellett bizonyítani. ■ A tétel szerint, ha birtokunkban van a homogén lineáris egyenlet egy alaprendszere, akkor az általános megoldáshoz egyetlen partikuláris megoldás előállítására van csak szükség! Ha ismert az alaprendszer, akkor ez a probléma is megoldható. A megoldást ebben az esetben is az állandók variálásának módszere jelenti. Most többes számot használtunk, hiszen a homogén egyenlet általános megoldásában két állandó szerepel, C1 és C2. Keressük tehát az inhomogén egyenlet partikuláris megoldását az alábbi alakban. 242
Óbudai Egyetem BGK
Fejezetek a matematikából
yip(x) = C1(x)∙ y1(x) + C2(x)∙ y2(x) Meghatározandók a C1(x) és C2(x) függvények. Az állandók variálásának módszerét tisztázza a következő tétel. 2.2.15.Tétel: Tegyük fel, hogy az hogy az y1(x) és y2(x) függvények az I intervallumon alaprendszerét képezik L y 0 (xI) homogén lineáris differenciálegyenletnek. Ekkor az L y g x (xI) inhomogén lineáris differenciálegyenlet partikuláris megoldása előállítható
yip(x) = C1(x)∙ y1(x) + C2(x)∙ y2(x) alakban ahol a C1(x) és C2(x) függvényeket az alábbi formulák szolgáltatják.
C1 x
W1 x
W y1 x , y2 x
dx, C2 x
W2 x
W y1 x , y2 x
dx
Az integrandusokban szereplő W1(x) és W2(x) függvények pedig a Wronski-determinánsból származtathatók az alábbi módon.
W1 x
0 g x
y2 x y x 0 ; W2 x 1 y2 x y1 x g x
Bizonyítás: A formulában szereplő ismeretlen függvényeket az egyenletbe történő helyettesítéssel számítjuk. Ehhez szükség van a partikuláris megoldás első és második deriváltjára. Egyszerűsítő jelölésekkel
yip C1 y1 C2 y2 y 'ip C1 y '1 C2 y '2 C '1 y1 C '2 y2 y "ip C1 y "1 C2 y "2 C '1 y '1 C '2 y '2 C '1 y1 C '2 y2 ' A két ismeretlen függvény meghatározásához két feltételre van szükség. Legyenek ezek a következők.
C '1 x y1 x C '2 x y2 x 0 C '1 x y '1 x C '2 x y '2 x g x Ha ugyanis ezeket a feltételeket előírjuk, akkor az yip(x) függvény valóban megoldása az inhomogén lineáris differenciálegyenletnek. Szorozzuk meg ugyanis az előbbi egyenletrendszer első egyenletet f2(x)-szel, a másodikat f1(x)-szel, a harmadikat pedig 1-gyel, majd adjuk össze a három egyenletet. Ekkor azt kapjuk, hogy 243
Óbudai Egyetem BGK
Fejezetek a matematikából
L yip C1L y1 C2 L y2 g x 0 0 g x g x
tehát valóban megoldás. Ezek után az ismeretlen függvények az utóbbi egyenletrendszerből meghatározhatók például a Cramer-szabállyal. Először arra mutatunk rá, hogy az egyenletrendszer együtthatómátrixának determinánsa éppen az alaprendszer Wronskideterminánsa, amely nem zérus, tehát a Cramer-szabály alkalmazható. Eszerint a megoldás a következő
0 C '1 x
g x
y1 x y1 x
y2 x y2 x
y2 x y2 x
;
C '2 x
y1 x 0 y1 x g x
y1 x y1 x
y2 x y2 x
Ezek integrálásával kapjuk a keresett függvényeket. Éppen ezt kellett igazolni. ■ 2.2.14.Példa: Határozzuk meg az alábbi másodrendű inhomogén lineáris differenciálegyenlet általános megoldását.
2 x 1 y " 4 xy ' 4 y 2 x 12 ; standard alakban
y "
4x 4 y ' y 2 x 1 ; 2 x 1 2 x 1
Korábban már előállítottuk a megfelelő homogén lineáris differenciálegyenlet egy alaprendszerét. Ez a következő: y1 x x; y2 x e2 x . Ezek felhasználásával már elő lehet állítani az inhomogén egyenlet egy partikuláris megoldását. Alkalmazva a tétel jelöléseit
W x, e W1 x
0
2 x
e2 x
2 x 1 2e2 x
1 x
e2 x 2e
2 x
2 x 1 e2 x ;
2 x 1 e2 x ; W2 x
x
0
1 2x 1
2 x 1 x;
Ezek felhasználásával adódik, hogy
C1 x C2 x
W1 x
W y1 x , y2 x
dx
2 x 1 e2 x 2 x 1 e2 x
dx 1dx x;
2 x 1 x dx xe2 x dx e2 x 1 x ; 2 x 1 e2 x 4 2
Innen pedig már adódik az inhomogén egyenlet egy partikuláris megoldása. 244
Óbudai Egyetem BGK
Fejezetek a matematikából x 1 1 x yip x x x e2 x e2 x x 2 2 4 4 2
Végezetül adódik az inhomogén egyenlet általános megoldása
x 1 yiá x C1x C2e2 x x 2 ; 2 4
C1 , C2 R
2.2.15.Példa: Igazoljuk, hogy az
xy " ( x 1) y ' y x 2e x ; standard alakban az y "
( x 1) 1 y ' y xe x x x
másodrendű lineáris differenciálegyenletnek az y1 e x ; y2 ( x 1) függvények alaprendszerét képezik, majd határozzuk meg az inhomogén differenciálegyenlet általános megoldását! Egyszerűen helyettesítéssel meg lehet győződni arról, hogy mindkét függvény megoldása a homogén egyenletnek.
xe x x 1 e x e x 0; másrészt x 0 x 1 1 x 1 0; Valóban megoldások. Kérdés, hogy lineárisan függetlenek-e. Ehhez ki kell számítani Wronskideterminánsukat. W ( y1; y2 )
ex e
x
( x 1) 1
e x ( x 1)e x xe x
Ez a determináns nem nulla az R+ halmazon, de az R– halmazon is különbözik nullától. Az y1, y2 függvények mindkét intervallumon alaprendszerét képezik a homogén lineáris differenciálegyenletnek. A homogén egyenlet általános megoldása tehát yhá = C1∙ex + C2∙(x + 1) A partikuláris megoldást pedig az yip = C1(x)∙ex + C2(x)∙(–x – 1) alakban keressük. Az ismeretlen C1(x) és C2(x) kiszámításához szükség van az alábbi determinánsokra W1
( x 1)
0 xe
x
1
x( x 1)e x ;
245
W2
ex e
x
0 xe
x
xe2 x
Óbudai Egyetem BGK
Fejezetek a matematikából
Most már kiszámíthatjuk a C1(x) és C2(x) függvényeket
W1 x x( x 1)e x x2 C1 ( x) dx dx ( x 1)dx x W y1 , y2 2 xe x
C2 ( x)
W2 x xe2 x dx x dx e x dx e x W y1 , y2 xe
Ezeket a helyettesítve yip képletébe, kapjuk a partikuláris megoldást
x2 yip x e x x 1 e x 2 Végül yhá és yip összege adja az általános megoldást
x2 y C1e x C2 ( x 1) x e x x 1 e x 2
246
Óbudai Egyetem BGK
Fejezetek a matematikából
2.2.5.Másodrendű állandó együtthatójú lineáris differenciálegyenlet Lényegesen különböző eredmények adódnak abban az esetben, ha a másodrendű lineáris differenciálegyenletben az ismeretlen függvénynek és deriváltjainak az együtthatói valós számok, azaz állandó függvények. Innen ered az elnevezés is. Ebben az esetben ugyanis konstruktív módon elő tudjuk állítani a homogén egyenlet egy alaprendszerét. Feladatul tűzzük ki tehát az a∙y” + b∙y’ + c∙y = g(x) másodrendű állandó együtthatójú lineáris differenciálegyenlet megoldását, ahol a,b,cR, a ≠ 0, a g(x), xI pedig folytonos függvény. Mindenekelőtt hangsúlyozzuk, hogy az előző 2.2.4. pontban, az általános, „függvényegyütthatójú” esetben megfogalmazott tételek változtatás nélkül igazak. A 2.2.4. pontban igazolt tételekre fogunk hivatkozni, miközben előállítjuk a homogén egyenlet egy alaprendszerét, továbbá az inhomogén egyenlet egy partikuláris megoldását. Ennek megfelelően ezen egyenlet megoldását is két pontban tárgyaljuk.
2.2.5.1. Másodrendű állandó együtthatójú homogén lineáris differenciálegyenlet Megoldandó tehát az a∙y” + b∙y’ + c∙y = 0, a,b,cR, a ≠ 0 másodrendű homogén lineáris differenciálegyenlet. Az általános tétel szerint meg kell határozni az egyenlet egy alaprendszerét, vagyis két lineárisan független megoldást. Mint látni fogjuk az állandó együtthatójú esetben ez tetszőleges a, b, cR esetén nagyon könnyen megoldható feladat. A megoldás alapgondolata az, hogy elsőként megvizsgáljuk az állandó együtthatójú elsőrendű homogén lineáris egyenletet: y’ + a∙y = 0, aR Ezt abban az esetben is könnyen meg tudjuk oldani, amikor az a konstans helyén egy folytonos f(x) függvény áll. Mint láttuk a megoldás az állandó szorzótól eltekintve f ( x ) dx y ( x) e
helyettesítsünk itt az f(x) helyére konstans a-t, ekkor kapjuk, hogy y( x) e ax
247
Óbudai Egyetem BGK
Fejezetek a matematikából
Tehát a megoldás egy exponenciális függvény. Felmerül a kérdés, hogy vajon a másodrendű egyenletnek van-e ilyen alakú megoldása. Próbálkozzunk meg a másodrendű egyenletet kielégíteni egy y( x) ex
alakú „próbafüggvénnyel”. A kérdés nyilván az, hogy létezik-e olyan λ valós vagy komplex szám, amelyre ez a függvény megoldása a homogén egyenletnek. Ezt a legegyszerűbben úgy lehet eldönteni, hogy behelyettesítjük a függvényt az egyenletbe. Ehhez a próbafüggvényt kétszer kell deriválni: y( x) ex ; y '( x) ex ; y "( x) 2 ex
Ha ezeket a deriváltakat behelyettesítjük az a∙y” + b∙y’ + c∙y = 0, a,b,cR, a ≠ 0 differenciálegyenletbe, és az egyenletet elosztjuk a nullától különböző eλx tényezővel, akkor az alábbi algebrai másodfokú egyenletet kapjuk. a∙λ2 + b∙λ + c = 0 Ezt az egyenletet a homogén lineáris differenciálegyenlet karakterisztikus egyenletének nevezzük. A másodfokú egyenlet megoldásával kapcsolatban három esetet különböztetünk meg, aszerint, hogy a D = b2 – 4ac diszkrimináns pozitív, nulla illetve negatív. Ennek megfelelően a differenciálegyenlet megoldását is három esetre bontva tárgyaljuk. 1.eset: D> 0.Ekkor a karakterisztikus egyenletnek két különböző valós megoldása van: 1
b D b D ; 2 ; 2a 2a
Ez azt jelenti, hogy az y1 ( x) e1x ; y2 ( x) e2 x
függvények a homogén egyenlet megoldásai. Kérdés, hogy lineárisan függetlenek-e. Ehhez kiszámítjuk a Wronski-determinánst.
W y1 x , y2 x
e1x 1e
1x
e 2 x 2e
2 x
2 1 e1x e2 x
Mivel az exponenciális függvény sehol sem zérus, és a feltevés miatt a λ1 – λ2 különbség sem zérus a Wronski-determináns nem nulla. Ez pontosan azt jelenti, hogy az y1(x) és y2(x) 248
Óbudai Egyetem BGK
Fejezetek a matematikából
függvények lineárisan függetlenek, tehát alaprendszert képeznek. Ebből adódóan a homogén lineáris differenciálegyenlet általános megoldása: y( x) C1 e1x C2 e2 x ; C1, C2 R
2.2.16.Példa: Határozzuk meg az alábbi másodrendű, állandó együtthatójú, homogén lineáris differenciálegyenlet általános megoldását.
y " 5 y ' 6 y 0; A karakterisztikus egyenlet a következő 2 5 6 0 . Ennek diszkriminánsa D = 25–24 = 1 pozitív valós szám. A két valós megoldás: 1 2, 2 3 . Az egyenlet általános megoldása tehát y( x) C1 e2x C2 e3x ; C1, C2 R
2.eset: D = 0. Ekkor a karakterisztikus egyenletnek egyetlen valós – de úgy is fogalmazhatunk, hogy két egybeeső, vagyis kétszeres multiplicitású – megoldása van, λ.
b 2a
Ez azt jelenti, hogy ezzel a módszerrel a D = 0 esetben egyetlen megoldást találtunk. y1 ( x) ex
Ehhez még keresni kell egy olyan megoldást, ami ezzel együtt alaprendszert alkot. Ehhez felhasználhatjuk a Liouville-féle tételt, ami éppen ezt a célt szolgálja. Az említett tétel szerint a keresett másik megoldás kielégíti az
e x
y
e x
y'
b dx C e a
differenciálegyenletet. Itt hangsúlyozzuk, hogy az integrandust az egyenlet standard alakjából b c b kell helyettesíteni, vagyis az y " y ' y 0 alakból. Mivel 2 , ezért a megoldandó a a a egyenlet a korábbiak szerint így írható: C y 2dx C e2x C; azaz y C x; tehát y x C x ex 2 x 2 x e e 2 x e x e e
249
Óbudai Egyetem BGK
Fejezetek a matematikából
Megkaptuk tehát a differenciálegyenlet egy másik megoldását. Erről egyébként egyszerűen úgy is meggyőződhetünk, ha ezt a függvényt kétszer deriváljuk és a D = 0 feltételt felhasználva behelyettesítjük az egyenletbe.
a 2ex x 2ex b ex xex cxex xex a 2 b c 2aex bex b xex 0 ex 2a b 0 2a Valóban megoldás. Már csak azt kell igazolnunk, hogy az y2 ( x) x ex
függvény és az y1(x) függvény lineárisan független megoldások. A Wronski-determináns értéke igazolja, hogy a két függvény valóban alaprendszer
x
W e , xe
x
ex
e
x
xex x
e xe
x
e2x 1 x x e2x 0
Tehát a két függvény a teljes számegyenesen alaprendszerét képezi a homogén egyenletnek. Ebben az esetben tehát a homogén lineáris egyenlet általános megoldása:
y( x) C1 ex C2 x ex ex C1 C2 x ; C1, C2 R 2.2.17.Példa: Határozzuk meg az alábbi másodrendű, állandó együtthatójú, homogén lineáris differenciálegyenlet általános megoldását.
y " 4 y ' 4 y 0; A karakterisztikus egyenlet a következő 2 4 4 0 . Ennek diszkriminánsa D = 16 – 16 = 0. A két egybeeső valós megoldás: 2 . Az egyenlet általános megoldása tehát
y( x) C1 e2x C2 x e2x e2x C1 C2 x ; C1, C2 R 3.eset: D < 0. Ha a diszkrimináns negatív, akkor a másodfokú egyenletnek két konjugált komplex megoldása van. 12
b D b 1 D b i D i 2a 2a 2a
Itt felhasználtuk, hogy a │D│ pozitív valós szám, így van valós négyzetgyöke. Ekkor tehát komplex szám szerepel az exponenciális függvény kitevőjében 250
Óbudai Egyetem BGK
Fejezetek a matematikából
y ( x) ex e
i x
ex eix ex cos x i sin x
ex cos x i ex sin x Itt felhasználtuk az eiβx= cosβx + i∙sinβx Euler-féle összefüggést. Az ilyen módon előállított y(x) függvény valós változójú de komplex értékű. Mivel az egyenlet valós együtthatójú, ezért elvárjuk, hogy a megoldás is valós függvény legyen. Ehhez egyrészt azt kell észrevenni, hogy az y(x) komplex értékű függvény valós része is és képzetes része is valós-valós függvény.
y1 x Re y x ex cos x y2 x Im y x ex sin x Kérdés, hogy ezek a függvények megoldásai-e a homogén differenciálegyenletnek, és ha megoldások akkor lineárisan függetlenek-e. Az első kérdésre a választ már megadtuk egy korábbi tételben, melyet az L operátor linearitásának kapcsán igazoltunk. Eszerint, ha egy komplex függvény megoldása egy lineáris differenciálegyenletnek, akkor megoldás a valós rész és megoldás a képzetes rész is. A lineáris függetlenség pedig a Wronski-determináns kiszámításával adódik.
W ex cos x, ex sin x
ex cos x
ex sin x
ex cos x ex sin x ex sin x ex cos x
e2x cos x sin x cos 2 x cos x sin x sin 2 x e 2x 0
Ami azt jelenti, hogy az y1 és y2 függvények a teljes számegyenesen alaprendszerét képezik a differenciálegyenletnek. Ezzel előállítottuk a homogén lineáris egyenlet általános megoldását a D< 0 esetben is.
y x C1ex cos x C2ex sin x ex C1 cos x C2 sin x ; C1, C2 R 2.2.18.Példa: Határozzuk meg az alábbi másodrendű, állandó együtthatójú, homogén lineáris differenciálegyenlet általános megoldását.
y " 4 y ' 29 y 0; A karakterisztikus egyenlet a következő 2 4 29 0 . Ennek diszkriminánsa D = 16 – 116 = –100. A két konjugált komplex megoldás: 2 5i; azaz 2; 5 . Az egyenlet általános megoldása tehát
y x C1e2 x cos5x C2e2 x sin 5x e2 x C1 cos5x C2 sin 5x ; C1, C2 R
251
Óbudai Egyetem BGK
Fejezetek a matematikából
2.2.5.2. Másodrendű állandó együtthatójú inhomogén lineáris differenciálegyenlet Ebben a pontban keressük az a∙y” + b∙y’ + c∙y = g(x), a,b,cRa ≠ 0 (xI) inhomogén lineáris differenciálegyenlet általános megoldását. Ebben a speciális esetben is természetes módon érvényesek azok az általános tételek, amelyeket az inhomogén egyenletek megoldásával kapcsolatosan a 2.2.4.2. pontban megfogalmaztunk és alkalmaztunk. Ezek szerint az inhomogén egyenlet általános megoldása egyrészt a homogén egyenlet általános megoldásának és az inhomogén egyenlet egy partikuláris megoldásának összegeként adódik. A homogén egyenletet megoldottuk a 2.2.5.1. pontban, így nem marad más hátra, mint egy partikuláris megoldás előállítása. Ehhez elvileg minden esetben alkalmazhatjuk az állandók variálásának általános módszerét. Ismétlésképpen ismét felírjuk a szükséges összefüggéseket. A hivatkozott pont szerint az inhomogén lineáris differenciálegyenlet partikuláris megoldása előállítható yip(x) = C1(x)∙ y1(x) + C2(x)∙ y2(x) alakban ahol a C1(x) és C2(x) függvényeket az alábbi formulák szolgáltatják.
C1 x
W1 x
W y1 x , y2 x
dx, C2 x
W2 x
W y1 x , y2 x
dx
Az integrandusokban szereplő W1(x) és W2(x) függvények pedig a Wronski-determinánsból származtathatók az alábbi módon.
W1 x
0 g x
y2 x y x 0 ; W2 x 1 y2 x y1 x g x
2.2.19.Példa: Határozzuk meg az y " 2 y ' 8 y 3e2 x
inhomogén egyenlet általános megoldását. A homogén egyenlethez tartozó karakterisztikus egyenlet 2 2 8 0 , melynek megoldásai 1 2; 2 4 . A homogén egyenlet általános megoldása tehát
yhá x C1 y1 x C2 y2 x C1e2 x C2e4 x ; C1, C2 R Az állandó variálásához elő kell állítanunk a Wronski-determinánst és a W1(x) és W2(x) függvényeket. 252
Óbudai Egyetem BGK
Fejezetek a matematikából
W x W1 x W2 x
e2 x 2e
2x
0 g x
e4 x 4e
4 x
4e2 x 2e2 x 6e2 x ;
y2 x 0 y2 x 3e2 x
y1 x 0 e2 x y1 x g x 2e2 x
e4 x 4e
4 x
0 3e
2x
3e2 x ;
3e4 x ;
Ezek után a szükséges integrálok már kiszámíthatók.
C1 x C2 x
W1 x
W y1 x , y2 x W2 x
W y1 x , y2 x
dx
3e2 x 1 dx x; 2 x 2 6e
dx
3e4 x 1 6x e6 x dx e dx ; 2 12 6e2 x
Ezen eredmények felhasználásával már adódik a partikuláris megoldás yip x C1 x y1 x C2 x y2 x
1 2 x 1 6 x 4 x 1 1 xe e e x e 2 x 2 12 12 2
Az inhomogén egyenlet általános megoldása tehát 1 1 yiá x C1e2 x C2e4 x x e2 x ; C1 , C2 R 12 2
2.2.20.Példa: Határozzuk meg az
y " y
1 cos x
inhomogén lineáris egyenlet általános megoldását. A homogén egyenlethez tartozó karakterisztikus egyenlet 2 1 0 melynek megoldásai i 0 1 i , ahonnan a homogén egyenlet általános megoldása yhá x C1 y1 x C2 y2 x C1 cos x C2 sin x; C1, C2 R
A partikuláris megoldás előállításához kiszámítjuk a szükséges determinánsokat
253
Óbudai Egyetem BGK
Fejezetek a matematikából W x
cos x
sin x cos x
0 W1 x g x W2 x
sin x
y1 x y1 x
cos2 x sin 2 x 1;
0 sin x sin x ; 1 cos x cos x cos x cos x 0 0 1 1; g x sin x cos x
y2 x y2 x
Amely eredmények alapján a szükséges integrálok
C1 x C2 x
W1 x
W y1 x , y2 x
dx
sin x dx ln cos x ; 1 cos x
W2 x
1 dx dx 1dx x; 1 W y1 x , y2 x
A partikuláris megoldás tehát a következő
yip x C1 x y1 x C2 x y2 x cos x ln cos x x sin x Az inhomogén egyenlet általános megoldása ezek szerint tehát
yiá x C1 cos x C2 sin x cos x ln cos x x sin x; C1, C2 R Az előző példákban illusztrált módszer, tehát az állandók variálásának a módszere a legáltalánosabb, elvileg minden esetben alkalmazható eljárás. Némileg egyszerűbben – legalábbis integrálás nélkül – juthatunk el a partikuláris megoldáshoz bizonyos esetekben, amikor az inhomogén egyenlet jobb oldalán szereplő g(x) függvény meghatározott függvényosztályokhoz tartozik. Ezek a függvényosztályok a következők: hatvány illetve polinom függvények, exponenciális függvények, szinusz- és koszinusz függvények, valamint ezek összege és/vagy szorzata. Ezekben az esetekben előállíthatjuk a partikuláris megoldást az állandók variálása nélkül is, az úgynevezett kísérletező módszerrel, vagy más néven a próbafüggvény módszerével. Ezekben az esetekben a megoldást a g(x) függvény konkrét alakjától függően, bizonyos meghatározott általános, szabad konstans paramétereket tartalmazó alakban kereshetjük úgy, hogy a próbafüggvényt helyettesítjük a differenciálegyenletbe és annak feltételezésével, hogy a helyettesítés azonosságot szolgáltat, az ismeretlen konstansokat meghatározzuk. Az alábbiakban minden említett esetre vonatkozólag pontosan megadjuk a próbafüggvény alakját és a mondottakat példákkal illusztráljuk.
254
Óbudai Egyetem BGK
Fejezetek a matematikából
1. A jobb oldalon egy polinom függvény áll, azaz g(x) = pn(x) egy n-ed fokú polinom. Keressük tehát a partikuláris megoldását az
ay " by ' cy an xn an1xn1 ... a1x a0 ; a, an 0 inhomogén lineáris differenciálegyenletnek. A partikuláris megoldás alakja függ a bal oldal alakjától is. a) Tegyük fel, hogy c 0 , ami egyenértékű azzal a kijelentéssel, hogy a 0 valós szám nem gyöke a homogén egyenlet k a 2 b c karakterisztikus polinomjának. Ekkor létezik az egyenletnek n-ed fokú polinom alakú partikuláris megoldása, tehát kereshető a megoldás
yip x qn x An xn An1xn1 ... A1x A0 alakban, ahol az Ai valós számok az egyelőre határozatlan együtthatók. Könnyen látható, hogy valóban létezik ilyen alakú megoldás, ugyanis ha ezt az n-ed fokú polinomot helyettesítjük az egyenletbe, akkor először elő kell állítani az elsőrendű deriváltját, amely egy n – 1-ed fokú polinom, majd a második deriváltját, amely egy n – 2-ed fokú polinom. Ha ezeket helyettesítjük az inhomogén egyenletbe, akkor a bal oldalon egy n-ed fokú polinomot kapunk, a jobb oldal ugyanakkor szintén egy n-ed fokú polinom. Alkalmazzuk az együttható összehasonlítás módszerét, vagyis a polinomok megfelelő hatványainak együtthatóit rendre egyenlővé tesszük. Így kapunk egy n + 1 db egyenletből álló lineáris egyenletrendszert, hiszen a konstans tag, az első hatvány, a második hatvány, stb. az n-edik hatvány együtthatóinak száma éppen ennyi. Ha végül figyelembe vesszük, hogy a próbafüggvény is n + 1 db ismeretlen együtthatót tartalmaz, akkor világos, hogy a probléma egyértelműen megoldható. 2.2.21.Példa: Keressük meg az y " 3 y ' 4 y 3x2 5
differenciálegyenlet egy partikuláris megoldását. A 0 valóban nem gyöke a k 2 3 4 karakterisztikus polinomnak, tehát kereshetjük a partikuláris megoldást másodfokú polinom alakjában. A deriváltakkal együtt ez a következő
yip x q2 x Ax2 Bx C; y 'ip x 2 Ax B; y "ip x 2 A; Helyettesítve az inhomogén egyenletbe azt kapjuk, hogy
2 A 3 2 Ax B 4 Ax 2 Bx C 3x 2 5;
Rendezve az egyenletet az x csökkenő hatványai szerint 255
Óbudai Egyetem BGK
Fejezetek a matematikából
4 Ax2 6 A 4B x 2 A 3B 4C 3x 2 0 x 5 Az együtthatók összehasonlításával a következő lineáris egyenletrendszert kapjuk
4 A 3; 6 A 4B 0; 2 A 3B 4C 5; 3 9 25 melynek megoldása A ; B ; C , tehát a keresett partikuláris megoldás a következő 4 8 8 yip x
3 2 9 25 x x ; 4 8 8
b) Tegyük most fel, hogy a 0 valós szám gyöke a homogén egyenlet k a 2 b c karakterisztikus polinomjának. Az összes lehetséges esetet tárgyaljuk, ezért legyen r a 0 mint gyök multiplicitása, azaz lehet r = 1 és r = 2. Ebben az esetben már nem biztos, hogy létezik n-ed fokú polinom alakú megoldás, de a problémát visszavezetjük az a) pontban vizsgált esetre. Tegyük fel tehát hogy a 0 valós szám r multiplicitású gyök, ekkor az egyenlet alakja az r = 1 és r = 2 esetekben rendre a következő
ay " by ' an x n an1x n1 ... a1x a0 ; a, an 0 ay " an x n an1x n1 ... a1x a0 ; a, an 0 Tekintettel arra, hogy az együttható összehasonlítás módszere, az a) pont szerint akkor vezet egyértelmű eredményre, ha az egyenlet mindkét oldalán n-ed fokú polinom áll, ezt a helyzetet célszerű elérni a próbafüggvénnyel. Figyelembe véve, hogy egy k-ad fokú polinom első deriváltja k – 1-ed fokú, a második deriváltja pedig k – 2-ed fokú polinom, világos, hogy az r = 1 esetben próbafüggvényként egy n + 1-ed fokú, az r = 2 esetben pedig egy n + 2-ed fokú polinom alkalmazása vezet célra. Ha tehát a jobb oldalon egy n-ed fokú polinom áll, akkor az r = 1 illetve r = 2 esetben rendre az yip x An1 x n1 An x n An 1x n1 ... A1x A0 ; yip x An 2 x n 2 An1 x n1 An x n An 1x n1 ... A1x A0 ;
polinomok az alkalmas próbafüggvények. Vegyük azonban figyelembe, hogy az r = 1 esetben a polinom első és második deriváltja szerepel a bal oldalon, ami azt jelenti, hogy az A0 együttható nem szerepel az egyenletben, értéke tetszőleges, célszerű 0-nak választani. Az r = 2 esetben azonban a próbafüggvénynek csak a második deriváltja szerepel, ez pedig nem tartalmazza az A0 és A1 együtthatókat, ami azt jelenti, hogy ezek értéke ugyancsak tetszőleges, célszerű mindkettőt 0-nak választani. Ezek szerint a próbafüggvények legegyszerűbb alakja r = 1 esetben
yip x An1x n1 An xn An1x n1 ... A1x x An1x n An x n1 An1x n2 ... A1 xqn x ;
256
Óbudai Egyetem BGK
Fejezetek a matematikából
tehát egy n-ed fokú polinomnak és x-nek a szorzata, r = 2 esetben pedig yip x An 2 x n 2 An1 x n1 An x n An1x n1 ... A2 x 2
x 2 An 2 x n An1 x n1 An x n2 ... A2 x 2 qn x ;
tehát egy n-ed fokú polinomnak és x2-nek a szorzata. Ha ezeket helyettesítjük az inhomogén egyenletbe, az együttható összehasonlítással ismét egyértelmű eredményt kapunk, hiszen mindkét esetben ugyancsak n + 1 db határozatlan együttható van az egyenletben, amelyre felírható egy n + 1 db egyenletből álló lineáris rendszer. 2.2.22.Példa: Határozzuk meg az y " 2 y ' x2 3x
differenciálegyenlet egy partikuláris megoldását. A k 2 2 karakterisztikus egyenletnek a gyökei 1 0; 2 2 , a 0 tehát egyszeres multiplicitású gyök. Eszerint a partikuláris megoldást harmadfokú polinom alakjában kell keresnünk. Ez a deriváltakkal együtt a következő
yip x x q2 x x Ax 2 Bx C Ax3 Bx 2 Cx; y 'ip x 3 Ax 2 2 Bx C; y "ip x 6 Ax 2 B;
helyettesítéssel a következő egyenlet adódik
6 Ax 2B 2 3 Ax 2 2 Bx C x 2 3x;
Rendezve az egyenletet csökkenő hatványok szerint azt kapjuk, hogy
6 Ax2 6 A 4B x 2B 2C x 2 3x 0; Együttható összehasonlítást végezve az együtthatókra kapott lineáris rendszer a következő
6 A 1; 6 A 4B 3; 2B 2C 0; 1 1 1 melynek megoldása A ; B ; C , az egyenlet egy partikuláris megoldása tehát 6 2 2 yip x
1 3 1 2 1 x x x 6 2 2
257
Óbudai Egyetem BGK
Fejezetek a matematikából
2. A jobb oldalon egy polinom függvénynek és egy exponenciális függvénynek a szorzata áll, azaz g(x) = pn(x)eαx. Keressük tehát a partikuláris megoldását az
ay " by ' cy pn x ex an xn an1x n1 ... a1x a0 ex ; a, an 0
inhomogén lineáris differenciálegyenletnek. Tegyük fel, hogy létezik ugyanilyen alakú partikuláris megoldás, tehát a próbafüggvény egy polinomnak és a jobb oldalon szereplő exponenciális függvénynek a szorzata. Egyelőre nem határozzuk meg a próbafüggvényben szereplő polinom fokszámát, az majd a vizsgálat során kiderül. Legyen tehát
yip x q x ex ahol q(x) egy polinom függvény. Helyettesítsük ezt a próbafüggvényt az inhomogén egyenletbe. Ehhez szükségesek a deriváltak y 'ip x q ' x ex q x ex ; y "ip x q " x ex 2q ' x ex q x 2ex ;
Helyettesítéssel a következő adódik
a q " x ex 2q ' x ex q x 2ex b q ' x ex q x ex cq x ex pn x ex ;
Világos, hogy az egyenlet elosztható a sehol sem nulla exponenciális tényezővel. Rendezés után az adódik, hogy
aq " x 2a b q ' x a2 b c q x pn x ;
Az adott függvénnyel tehát akkor elégíthető ki az inhomogén egyenlet, ha ez a polinomok azonos egyenlőségét kifejező egyenlet teljesül. A jobb oldal a feltétel szerint egy n-ed fokú polinom. A kérdés, hogy mekkora legyen a q(x) polinom fokszáma, hogy ez az egyenlet valóban azonosság legyen. a) Az exponenciális függvény α kitevője nem gyöke a homogén egyenlet k a 2 b c karakterisztikus polinomjának, azaz k a2 b c 0 . Ekkor az azonosságot jelentő egyenlet mindkét oldalán akkor és csak akkor áll n-ed fokú polinom, ha a q(x) n-ed fokú polinom. Ezt a kérdést már részletesen tárgyaltuk az 1. pontban. Kaptuk tehát az eredményt, hogy abban az esetben ha az α kitevője nem gyöke a karakterisztikus polinomnak, akkor a partikuláris megoldás alakja a következő
258
Óbudai Egyetem BGK
Fejezetek a matematikából
yip x qn x ex An x n An1x n1 ... A1x A0 ex
2.2.23.Példa: Állítsuk elő az y " 5 y ' 4 y 2 xe6 x
differenciálegyenlet egy partikuláris megoldását. A
k 2 5 4
karakterisztikus
egyenletneka gyökei 1 1; 2 4 , az α = 6 valós szám tehát nem gyöke a karakterisztikus egyenletnek, ami azt jelenti, hogy a partikuláris megoldást az
yip x q1 x e6 x Ax B e6 x alakban kereshetjük. A próbafüggvény deriváltjai a következők y 'ip x Ae6 x Ax B 6e6 x ; y "ip x 6 Ae6 x A6e6 x Ax B 36e6 x ;
Helyettesítve az inhomogén egyenletbe, azt kapjuk, hogy
6 Ae
6x
6 Ae6 x Ax B 36e6 x 5 Ae6 x Ax B 6e6 x 4 Ax B e6 x 2 xe6 x
Osztva az exponenciális tényezővel majd rendezve az egyenletet az x csökkenő hatványai szerint, adódik, hogy
36 A 30 A 4 A x 6 A 6 A 36B 5 A 30B 4B 2 x 0; azaz 70 Ax 17 A 70B 2 x 0; Ez pontosan akkor azonosság, ha teljesül, hogy
az x együtthatói : 70 A 2; a konstans tagok : 17 A 70 B 0; 1 17 ; B ; , ami azt jelenti, hogy az inhomogén 35 2450 egyenlet egy partikuláris megoldása a következő Ennek megoldása a következő A
17 6 x 1 yip x x e 2450 35
259
Óbudai Egyetem BGK
Fejezetek a matematikából
b) Az exponenciális függvény α kitevője egyszeres vagy kétszeres gyöke a homogén egyenlet k a 2 b c karakterisztikus polinomjának. Ezt az esetet szokás exponenciális rezonanciaként emlegetni. Ha egyszeres gyök, akkor a karakterisztikus polinom szorzat alakja k a2 b c a 2 és 2 , és ebben az esetben teljesül, hogy
a2 b c 0 .
Ha
pedig
kétszeres
gyök,
akkor
a
karakterisztikus
polinom
a
k a2 b c a alakban írható. Ez utóbbi esetben a karakterisztikus polinom 2
deriváltja a k ' 2a b 2a alakot ölti. Mely szerint az α konstans a karakterisztikus polinom deriváltjának is gyöke, azaz teljesül, hogy 2a b 0 . Könnyen látható, hogy ha az α csak egyszeres gyök, akkor nem gyöke a derivált polinomnak, hiszen ekkor k ' 2a b a 2 a 0 ha 2 . Azt kaptuk tehát, hogy ha az exponenciális függvény α kitevője egyszeres illetve kétszeres gyöke a karakterisztikus polinomnak, akkor az yip x q x ex próbafüggvény alkalmazásával r = 1 illetve r = 2 multiplicitású gyök esetén rendre a következő azonosságokat kell kielégítenünk
aq " x 2a b q ' x a
b c q x aq " x p
aq " x 2a b q ' x a 2 b c q x aq " x 2a b q ' x pn x ; 2
n
x;
Ezt a kérdést részletesen megvizsgáltuk az 1.b) pontban. Azt mondhatjuk tehát, hogy az r = 1 illetve r = 2 multiplicitású esetben a q(x) polinom foka rendre n + 1 illetve n + 2, kiegészítve azzal, hogy az r = 1 esetben a polinom konstans tagja tetszőleges, így célszerűen 0-nak választjuk, míg az r = 2 esetben a polinom konstans és első fokú tagja tetszőleges így ezeket is 0-nak választjuk. Kaptuk tehát, hogy a vizsgált esetben az inhomogén egyenletnek rendre az r = 1 illetve r = 2 esetben létezik
yip x x qn x ex x An x n An1x n1 ... A1x A0 ex ;
yip x x 2 qn x ex x 2 An x n An1x n1 ... A1x A0 ex alakú partikuláris megoldása. 2.2.24.Példa: Állítsuk elő az y " 6 y ' 9 y e3 x
differenciálegyenlet
egy
partikuláris
megoldását.
A
k 2 6 9
karakterisztikusegyenletnekkét egybeeső, más szóval egy kétszeres multiplicitású gyöke a 3 valós szám. Az α = 3 valós szám tehát kétszeres gyöke a karakterisztikus polinomnak (kétszeres rezonancia), továbbá az általános esetbeli pn(x) polinom most konstans, azaz nulladfokú polinom, ami azt jelenti, hogy a partikuláris megoldást az
260
Óbudai Egyetem BGK
Fejezetek a matematikából yip x Ax 2e3x
alakban kereshetjük. A próbafüggvény deriváltjai a következők
y 'ip x 2 Axe3 x 3 Ax2e3 x ; y "ip x 2 Ae3 x 6 Axe3 x 6 Axe3 x 9 Ax 2e3 x ; Helyettesítve ezeket a deriváltakat az inhomogén egyenletbe, azt kapjuk, hogy
2 Ae
3x
12 Axe3 x 9 Ax 2e3 x 6 2 Axe3 x 3 Ax 2e3 x 9 Ax 2e3 x e3 x ;
1 következik. A partikuláris 2
Az összevonás eredménye a 2 Ae3 x e3 x egyenlet, amelyből A megoldás tehát a következő
yip x
1 2 3x xe 2
3. A jobb oldalon egy polinom függvénynek, egy exponenciális függvénynek és egy koszinusz függvénynek vagy egy szinusz függvénynek a szorzata áll, azaz g(x) = pn(x)eαxcosβx vagyg(x) = pn(x)eαxsinβx. Keressük tehát a partikuláris megoldását az
sin x a x
... a x a e
ay " by ' cy pn x ex cos x an x n an1x n1 ... a1x a0 ex cos x; a, an 0; ay " by ' cy pn x ex
n
n
an1x n1
1
0
x
sin x; a, an 0
inhomogén lineáris differenciálegyenleteknek. Speciális esetként ebben természetesen benne van az a lehetőség, hogy α = 0, amikor e0 = 1, tehát a jobb oldalon egy polinomnak és egy koszinusz vagy szinusz függvénynek a szorzata áll. Erre az esetre az eredmények egyszerűen következnek a 2. pont eredményeiből, ugyanis a hivatkozott pontban sehol sem használtuk fel azt, hogy az exponenciális függvény α kitevője valós szám, tehát a mondottak érvényesek komplex α kitevőre is. Alkalmazzuk az Euler-féle összefüggést, mely szerint a trigonometrikus függvények kifejezhetők exponenciális függvényekkel cos x
eix eix eix eix ; sin x 2 2i
Helyettesítsük ezeket a törteket az egyenletekben a trigonometrikus függvények helyére. A következő adódik
261
Óbudai Egyetem BGK
Fejezetek a matematikából
eix eix pn x i x pn x i x ay " by ' cy pn x e cos x pn x e e e ; 2 2 2 eix eix pn x i x pn x i x ay " by ' cy pn x ex sin x pn x ex e e ; 2i 2i 2i x
x
tehát a jobb oldal olyan függvények összege, melyek egy n-ed fokú polinomnak és egy exponenciális függvénynek a szorzataként írhatók fel. Vizsgálva a jobb oldalakat világos, hogy két esetet kell megkülönböztetni. a) Az i illetve i komplex szám nem gyöke a homogén egyenlet k a 2 b c karakterisztikus polinomjának. Ebben az esetben a 2. pontbeli vizsgálatok eredményére támaszkodva mondhatjuk, hogy létezik az egyenletnek
yip x qn x e
i x
sn x e
i x
ex qn x cos x i sin x sn x cos x i sin x ;
azaz yip x ex
q
x sn x cos x i qn x sn x sin x ex Qn x cos x iRn x sin x ; n
alakú partikuláris megoldása, ahol Qn(x) és Rn(x) szintén n-ed fokú polinomok. Ez a függvény formálisan komplex értékű. Ha azonban valós együtthatójú az egyenlet, elvárjuk, hogy valós megoldásai legyenek, ezért komplex értékű függvényt nem fogadunk el megoldásként. Azonban valós együtthatójú esetben ez a függvény valóban csak „formálisan” komplex, hiszen valós együtthatójú polinomot helyettesítve és az együtthatókat összehasonlítva sehol sem kerülnek elő komplex számok. Ez tehát azt jelenti, hogy a vizsgált esetben az inhomogén egyenlet partikuláris megoldása előáll yip x ex Qn x cos x Rn x sin x
alakban, ahol Qn(x) és Rn(x) n-ed fokú polinomok. 2.2.25.Példa: Állítsuk elő az y " 2 y ' y e2 x cos3x
differenciálegyenlet egy partikuláris megoldását. A k 2 2 1 karakterisztikus egyenlet megoldásai a 1,2 1 kétszeres multiplicitású való gyök. A 2 3 i komplex számok tehát nem gyökei a karakterisztikus egyenletnek, az általános vizsgálatban szereplő pn(x) polinom pedig konstans, azaz 0-ad fokú, tehát kereshetjük a megoldást
yip x e2 x A cos3x B sin 3x 262
Óbudai Egyetem BGK
Fejezetek a matematikából
alakban. A próbafüggvény deriváltjai a következők y 'ip x 2e2 x A cos 3x B sin 3x e2 x 3 A sin 3x 3B cos 3x ; y "ip x 4e2 x A cos 3x B sin 3x 2 2e2 x 3 A sin 3x 3B cos 3x e 2 x 9 A cos 3x 9 B sin 3 x ;
Helyettesítve az inhomogén egyenletbe a következő adódik 4e2 x A cos 3x B sin 3x 2 2e2 x 3 A sin 3x 3B cos 3x e2 x 9 A cos 3x 9 B sin 3 x
2 2e2 x A cos 3x B sin 3x e2 x 3 A sin 3x 3B cos 3x e2 x A cos 3x B sin 3 x e 2 x cos 3 x;
Az egyenletet eloszthatjuk a nem nulla exponenciális tényezővel. Az osztás után rendezve az egyenletet a koszinusz és szinusz függvények szerint, az adódik, hogy
4 A 12B 9 A 4 A 6B A cos3x 4B 12 A 9B 4B 6 A B sin 3x 1 cos3x 0 sin 3x Összehasonlítva a két oldalon a koszinusz és szinusz függvények együtthatóit, a következő lineáris egyenletrendszer adódik
cos3x együtthatói : 8 A 6 B 1; sin 3x együtthatói : 6 A 8B 0; Ennek megoldása A
4 3 ; B ahonnan a keresett partikuláris megoldás 50 50 3 4 yip x e2 x cos 3x sin 3x ; 50 50
b) Az i illetve i komplex szám gyöke a homogén egyenlet k a 2 b c karakterisztikus polinomjának. Tekintettel arra, hogy valós együtthatójú egyenleteket vizsgálunk elsősorban, ki kell hangsúlyoznunk, hogy egy komplex szám nem lehet kétszeres gyöke a karakterisztikus egyenletnek. Egy másodfokú polinomnak, ha diszkriminánsa negatív, akkor két konjugált komplex gyöke van, és ekkor mindkét komplex szám egyszeres komplex gyök. Ebben a vizsgált esetben tehát az i illetve i komplex számok egyszeres gyökei a karakterisztikus polinomnak. Ebben az esetben felhasználjuk mindazokat a megállapításokat, amelyeket az 1. és 2. eset vizsgálata kapcsán valamint a 3. eset bevezetésében és ennek a) pontjában tettünk. Eszerint ha az i illetve i komplex számok egyszeres gyökei a karakterisztikus polinomnak, akkor az inhomogén egyenletnek létezik yip x x ex Qn x cos x Rn x sin x
alakú partikuláris megoldása, ahol Qn(x) és Rn(x) n-ed fokú polinomok. 263
Óbudai Egyetem BGK
Fejezetek a matematikából
2.2.26.Példa: Állítsuk elő az y " 9 y 5sin 3x
differenciálegyenlet egy partikuláris megoldását. A k 2 9 karakterisztikus polinom gyökei a 1,2 3i konjugált komplex számok. A jobb oldalra tekintve látható, hogy ebben az esetben az i 0 3i konjugált komplex számok szerint kell vizsgálni a problémát. Ezek éppen gyökei a karakterisztikus polinomnak (szinuszos rezonancia). A fentiek szerint, mivel a jobb oldalon szereplő pn(x) polinom konstans, tehát 0-ad fokú, a partikuláris megoldást kereshetjük az
yip x x A cos3x B sin 3x alakban. Szükség van a próbafüggvény első és második deriváltjára is
y 'ip x 1 A cos3x B sin 3x x 3 A sin 3x 3B cos3x ; y "ip x 3 A sin 3x 3B cos3x 1 3 A sin 3x 3B cos3x x 9 A cos3x 9 B sin 3x ; Helyettesítve az egyenletbe következő adódik 2 3 A sin 3x 3B cos3x x 9 A cos3x 9B sin 3x 9 x A cos3x B sin 3x 5sin 3x;
Ha itt elvégezzük az összevonásokat, azt kapjuk, hogy
6 A sin 3x 6B cos3x 5sin 3x 0 cos3x; 5 Ebből következik, hogy A ; B 0 tehát a partikuláris megoldás a következő 6
5 yip x x cos3x 6
264
Óbudai Egyetem BGK
Fejezetek a matematikából
2.2.6.Rezgések elmélete Ebben a pontban a másodrendű lineáris differenciálegyenletek fizikai alkalmazásaként megoldjuk a bevezető 2.2.1., 2.2.2. és 2.2.3. példájában említett differenciálegyenleteket.
2.2.6.1. Harmonikus oszcillátor A 2.2.1. példában már felállítottuk a harmonikus rezgés differenciálegyenletét. Ez a szokásos jelölésekkel a következő y " 2 y 0;
D egyszerűsítő jelölést, D a rugóállandó, m az anyagi pont tömege. Ez m az egyenlet egy állandó együtthatójú másodrendű, homogén lineáris differenciálegyenlet. Megoldásához szükség van a karakterisztikus egyenletre. Ez az alábbi ahol alkalmaztuk az 2
2 2 0 Mivel ω valós szám, ennek az egyenletnek valós megoldása nincs. A komplex gyökök pedig a következők: 1,2 i , ahol i az imaginárius egység. Ha alkalmazzuk a 2.2.5.1. pontbeli 3. eset jelöléseit, akkor az írhatjuk, hogy 1,2 i i ahonnan adódik, hogy α = 0, β = ω. Így a hivatkozott pont alapján azonnal felírhatjuk az egyenlet általános megoldását
y t et C1 cos t C2 sin t e0 C1 cos t C2 sin t C1 cos t C2 sin t A harmonikus rezgőmozgás differenciálegyenletének általános megoldása tehát a következő: y t C1 cos t C2 sin t;; C1, C2 R
A C1 és C2 állandókat a kezdeti feltételekből határozzuk meg. Elsőként vegyük fel a legegyszerűbb és legszokásosabb kezdeti feltételt, vagyis legyen y 0 0; y ' 0 v0 , ami azt jelenti, hogy az időmérés kezdetén a tömegpont éppen az egyensúlyi helyzeten halad át és sebessége v0. Ha ezeket figyelembe vesszük, akkor azt kapjuk, hogy y 0 C1 cos 0 C2 sin 0 1 C1 0 C2 0; azaz C1 0
Ennek figyelembe vételével
265
Óbudai Egyetem BGK
Fejezetek a matematikából
y ' t C2 cos t; ahonnan y ' 0 C2 cos 0 C2 v0 ; azaz C2
v0
ami azt jelenti, hogy a kezdeti feltételeket kielégítő partikuláris megoldás a következő függvény.
y t
v0 sin t
Ha figyelembe vesszük, hogy a szinusz függvény értékkészlete a [–1, 1] intervallum, akkor azonnal adódik, hogy az y(t) kitérés idő függvénynek van maximuma és minimuma, éspedig v v v y t 0 , 0 . Ha bevezetjük a témakörben szokásos A 0 jelölést a maximális kitérésre és ezt elnevezzük amplitúdónak, akkor kapjuk a Cauchy-feladat megoldását még ismertebb alakban. y t A sin t
Ha szükséges a harmonikus rezgést végző tömegpont sebessége illetve gyorsulása akkor nincs más dolgunk, mint a kapott kitérés-idő függvény első és második deriváltját előállítani. Így a sebesség-idő és gyorsulás-idő függvény az alábbi.
v t A cos t; a t a2 sin t 2 y t Példaként a 2.2.5. ábrán illusztráljuk annak az egyenletnek a megoldását, amelyben ω = 2, és a kezdeti feltételek y 0 0; y ' 0 3 .
2.2.5. Ábra. A harmonikus rezgés differenciálegyenletének megoldása ω = 2 esetén y 0 0; y ' 0 3 kezdeti feltételekkel
266
Óbudai Egyetem BGK
Fejezetek a matematikából
Tűzzük ki most a Cauchy feladatot a lehető legáltalánosabb kezdeti feltételekkel.
y " 2 y 0; y 0 y0 ; y ' 0 v0 ; tehát az időmérés kezdetén a tömegpontnak már van 0-tól különböző y0 kitérése, ahol a pillanatnyi sebessége v0. Az általános megoldást alapul véve
y t C1 cos t C2 sin t ; y ' t C1 sin t C2 cos t ; ahonnan
y0 C1 cos 0 C2 sin 0 C1; azaz C1 y0 v0 C1 sin 0 C2 cos 0 C2; azaz C2
v0
Tehát a kezdeti feltételeket kielégítő partikuláris megoldás
y t y0 cos t
v0 sin t ;
Ez a megoldásfüggvény azonban jobban áttekinthető alakra hozható. Bővítsük a függvényt úgy, hogy a trigonometrikus tagok együtthatóinak négyzetösszege 1 legyen. Ezt elérjük a következő módon v0 2 v0 y0 2 y t y0 2 cos t sin t ; 2 2 v0 2 y02 v0 y0 2 2 Mivel az együtthatók négyzetösszege 1, ezért létezik olyan φ0 szög melynek a két együttható rendre szinusza és koszinusza, azaz teljesül, hogy
y0 v2 y02 02
sin 0 ;
v0 v2 y02 02
cos 0
Ilyen φ0 szög valóban létezik, hiszen a két definiáló egyenlőség hányadosából az következik, hogy
267
Óbudai Egyetem BGK
Fejezetek a matematikából tg 0
y y0 ; ahonnan 0 arctg 0 v0 v0
v02 jelölés bevezetésével a kezdeti feltételeket kielégítő 2 partikuláris megoldás alakja egy addíciós tétel felhasználásával Ezzel a szöggel és az A
y02
y t A sin 0 cos t cos 0 sin t A sin t 0
Tehát ismét egy szinusz függvény. A különbség a korábbi megoldáshoz képest csak annyi, hogy az argumentumban szerepel a φ0 konstans, ami egyrészt annyit jelent, hogy a korábban kapott megoldásból ez a megoldás egy időtengely mentén alkalmazott eltolással kapható, tehát lényegében ugyanaz a megoldás. Másrészt a φ0 konstans jelentése akkor látható, ha alkalmazzuk az argumentumban a t = 0 helyettesítést. Ez azt jelenti, hogy az időmérés kezdetén a tömegpont helyzetéhez már tartozik egy φ0 szög, amit kezdőfázisnak nevezünk. Ezt a fogalmat általánosan is használjuk. A megoldásban szereplő trigonometrikus függvény argumentumát, tehát az t 0 mennyiséget általánosan a rezgés fázisának nevezzük. A 2.2.6. ábrán illusztráljuk az egyenlet megoldását az általános kezdeti feltételek esetén. Az ábrán érzékelhető, hogy a megoldás lényegében valóban nem függ a kezdeti feltételektől, a 2.2.5. ábra megoldásfüggvényéhez képest a különbség valóban csak egy eltolás.
2.2.6. Ábra. A harmonikus rezgés differenciálegyenletének megoldása ω = 2 esetén y 0 1; y ' 0 2,5 kezdeti feltételekkel
Hangsúlyozzuk, hogy az utóbb bevezetett A konstans jelentése pontosan az, ami a korábbi esetben, a maximális kitérést, tehát az amplitúdót jelenti az általánosabb kezdeti feltételek esetén.
268
Óbudai Egyetem BGK
Fejezetek a matematikából
Az ω jelentését is könnyen megfejthetjük. A harmonikus rezgés periodikus mozgás, jelölje T a periódusidőt. Definíció szerint periódusidővel később a kitérések egyenlők, tehát A sin t 0 A sin t T 0
Ekkor nyilván igaz, hogy az argumentumok különbsége 2π, hiszen az időben és fázisban legközelebbi olyan pontot keressük, amikor a kitérések megegyeznek, tehát
t 2 t T ; ahonnan 2 T ; tehát
2 ; T
Az ω kvantitatív értelmezését tehát megadtuk. A mennyiség neve körfrekvencia, dimenziója 1 radián 1 1 . Ha felhasználjuk a frekvencia szokásos f pedig definícióját, akkor s s T adódik a frekvencia és körfrekvencia közötti szokásos összefüggés: 2f . Számításainkból mellékeredményként adódik a körfrekvencia függése a tömegtől és a rugóállandótól. Mivel D D 1 D 2 ezért kapjuk az , vagy áttérve a frekvenciára az f összefüggést. m 2 m m
2.2.6.2. Csillapított harmonikus oszcillátor A 2.2.2. példában felállítottuk a csillapított harmonikus rezgés differenciálegyenletét. Ez kiegészítve a szokásos kezdeti feltételekkel a következő Cauchy-féle feladatot jelenti
y " 2y ' 2 y 0; y (0) 0; y ' 0 v0 ;
D k , 2 jelöléseket. A D rugóállandó a rugó erősségére jellemző, a k m m konstans pedig a csillapítás erősségét méri. A felírt kezdeti érték probléma egy másodrendű, állandó együtthatójú, homogén lineáris differenciálegyenletre vonatkozó Cauchy-feladat. Megoldásához elő kell állítani a karakterisztikus egyenlet megoldásait. A karakterisztikus egyenlet a következő ahol alkalmaztuk az 2
2 2 2 0 .
Ennek megoldásait a diszkrimináns előjelének függvényében három különböző esetben kell előállítanunk. (A diszkriminánsra itt nem használjuk a D jelet, hogy ne tévesszük össze a rugóállandóval.)
269
Óbudai Egyetem BGK
Fejezetek a matematikából
a) A diszkrimináns pozitív, azaz 42 4 2 0 , tehát 2 2 0, 2 2 . A csillapítás
k2 D vagyis k 2 mD . Ekkor a 2 m 4m karakterisztikus egyenletnek két különböző valós gyöke van. Ezek a gyökök a következők eszerint meghalad egy bizonyos küszöbértéket,
1,2
2 2 2 2 2 2 2
Felírhatjuk tehát az egyenlet általános megoldását
y t C1e
1 t
C2e
2 t
C1e
2 2 t
C2e
2 2 t
; C1 , C2 R
A konstansokat ismét a kezdeti feltételekből kapjuk. y 0 C1e0 C2e0 C1 C2 0; y ' t C11e1 t C2 2e 2 t miatt y ' 0 C11e0 C2 2e0 C11 C2 2 v0
Ennek az egyenletrendszernek a megoldása a következő C2 C1; C11 C1 2 v0 ; C1
v0 v0 ; C2 1 2 1 2
Tehát a kezdeti feltételeket kielégítő partikuláris megoldás az alábbi függvény y t
v0 e1 t e2 t 1 2
Ha itt figyelembe vesszük a gyökök konkrét alakját, akkor a következő módon írható a megoldás e y t 2 2 2 v0
2 2 t
e
2 2 t
2 2 t
v0 t e e 2 2
2 2 t
e 2
.
Az utolsó törtben felismerhetjük a szinusz hiperbolikusz függvényt. A megoldás végső alakja így y t
v0 2
2
et sh
270
2 2 t
Óbudai Egyetem BGK
Fejezetek a matematikából
Elemezzük a kapott megoldást. Mivel az exponenciális függvény mindenütt pozitív, a hiperbolikus függvény pedig pozitív t időpontok esetén pozitív, adódik, hogy a kitérés minden t időpontban pozitív. A mozgás tehát nem periodikus, a kezdeti sebességnek köszönhetően a kitérés egy darabig növekszik, majd t → ∞ esetén tart a zérushoz, de negatív sosem lesz. Ez tehát egy aperiodikus mozgás. Így működik például egy ideális lengéscsillapító. A 2.2.7. ábrán látható a csillapított rezgőmozgás differenciálegyenletének megoldása y 0 0; y ' 0 3 kezdeti feltételek mellett abban az esetben, amikor ω = 2 és β = 3, amikor tehát ω < β, tehát viszonylag erős a csillapítás.
2.2.7. Ábra. A csillapított harmonikus rezgés differenciálegyenletének megoldása ω = 2,β = 3tehát ω < β esetén, y 0 0; y ' 0 3 kezdeti feltételekkel
b) Tegyük fel, hogy a diszkrimináns zérus, azaz 42 4 2 0 , tehát 2 2 0, 2 2 . A
k2 D vagyis k 2 mD . 2 m 4m Ekkor a karakterisztikus egyenletnek két egybeeső valós gyöke van. Ez a kétszeres valós gyök a következő csillapítás eszerint éppen egy bizonyos küszöbértékkel egyenlő,
1,2
2 0 2
Ekkor a 2.2.5. pont szerint az egyenlet általános megoldása a következő
y t C1e t C2te t C1 C2t e t C1 C2t e t ; C1 , C2 R Ha a kezdeti feltételeket figyelembe vesszük, adódnak a következő összefüggések 271
Óbudai Egyetem BGK
Fejezetek a matematikából y 0 C1e0 C2 0e0 C1 0;
y ' t C2te t
C e 2
t
C2t e t ; miatt
y ' 0 C2e0 C2 0e0 C2 v0
Innen a Cauchy-feladat megoldása az alábbi függvény.
y t v0te t Ez a megoldás sem periodikus, a kitérés minden pozitív t-re pozitív és t → ∞ esetén tart a zérushoz. Ezt a speciális esetet nevezzük aperiodikus határesetnek. A 2.2.8. ábra egy aperiodikus határesetnek megfelelő megoldást ábrázol y 0 0; y ' 0 3 kezdeti feltételek mellett abban az esetben, amikor ω = β = 2. Az ábrát összevetve a 2.2.10. ábrával, azt mondhatjuk, hogy lényeges különbség nincs a két aperiodikus mozgás lefolyása között.
2.2.8. Ábra. A csillapított harmonikus rezgés differenciálegyenletének megoldása az aperiodikus határesetben, amikor ω = β = 2, y 0 0; y ' 0 3 kezdeti feltételekkel
c)
Tegyük
fel
végül,
hogy a
diszkrimináns
negatív,
azaz
42 4 2 0 ,
tehát 2
k D 2 m 4m vagyis k 2 mD . Ekkor a karakterisztikus egyenletnek két különböző komplex gyöke van. Ezek a gyökök a következők 2 2 0, 2 2 . A csillapítás eszerint nem ér el egy bizonyos küszöbértéket,
272
Óbudai Egyetem BGK
Fejezetek a matematikából 1,2
2 2i 2 2 i 2 2 2
Ekkor a 2.2.5. pont szerint az általános megoldás a következő
y t et C1 cos
2 2 C2 cos
2 2 t C2 sin
2 2 t ; C1 , C2 R
Vegyük most tekintetbe a kezdeti feltételeket
y 0 e0 C1 cos 0 C2 sin 0 C1 0; y ' t et C2 sin
2 2 t e t
y ' 0 e0C2 sin 0 e0
2 2 t ; ahonnan
2 2 C2 cos 0 C2 2 2 v0 ; azaz C2
v0 2 2
A Cauchy-feladat megoldása eszerint y t et
v0 2
2
sin
2 2 t
A megoldás tehát egy szigorúan monoton csökkenő exponenciális függvény és egy periodikus függvény szorzata. Ha összehasonlítjuk ezt a megoldásfüggvényt a harmonikus rezgés kitérés-idő függvényével, akkor kvalitatíve azt mondhatjuk, hogy a rezgés, amelyet a periodikus tényező ír le, exponenciálisan csökkenő amplitúdójú csillapított rezgés.
2.2.9. Ábra. A csillapított harmonikus rezgés kitérés-idő függvénye relatíve gyenge csillapítás mellett, ω = 2,β = 0,15 konstansok esetén, y 0 0; y ' 0 3 kezdeti feltételekkel
273
Óbudai Egyetem BGK
Fejezetek a matematikából
A 2.2.9. ábrán látható függvény a csillapított rezgőmozgás egyenletének megoldása y 0 0; y ' 0 3 kezdeti feltételek mellett abban az esetben, amikor ω = 2 és β = 0,15, amikor tehát ω > β, tehát viszonylag gyenge a csillapítás. v0 Az amplitúdó függvény az A t et formulával adható meg. Ha csak a periodikus 2 2 tényezőt hasonlítjuk össze a harmonikus rezgés kitérés-idő függvényével, akkor azt látjuk, hogy a
2 2 mennyiség kisebb, mint a harmonikus
csillapított esetben a körfrekvencia, tehát a
2 2 , tehát egy kisebb frekvenciájú, azaz a csillapítatlan esethez képest egy 2 nagyobb periódusidejű rezgőmozgás adódik. A periódusidő a T formulával, a 2 2 esetben,
2 2 frekvencia pedig az f formulával számítható. Ha most tetszőleges t időponthoz 2 hozzáadjuk a T periódusidőt, és számítjuk a kitérések ezen időpontokban, majd tekintjük ezek arányát, akkor a következő adódik y t T e y t
t T
t T e sin t
sin
et
2
2
2
T
k T m e
2
A kapott hányados konstans, független az időtől, ami azt jelenti, hogy bármely t időpont esetén, majd T idővel később mérve a kitéréseket, a későbbi és korábbi kitérés hányadosa állandó. Ezt az állandót, amely a számítások szerint eT -vel egyenlő, csillapítási hányadosnak nevezzük. Ezt az eredményt úgy is fogalmazhatjuk, hogy a kitérések, T-időtartamonként, csökkenő mértani sor szerint követik egymást. Tovább vizsgálva a kapott partikuláris megoldást, mivel a szinusz függvény korlátos, az exponenciális függvény pedig zérushoz tart ha t → ∞, ezért a kitérés-idő függvény t → ∞ esetén ugyancsak tart a zérus kitéréshez, amint az a 2.2.12. ábrán is jól látható.
2.2.6.3. Gerjesztett és csillapított harmonikus oszcillátor A 2.2.3. példában felállítottuk a gerjesztett és csillapított rezgés differenciálegyenletét. Ebben az esetben általános megoldást keresünk, azaz keressük az y " 2y ' 2 y f0 sin t;
differenciálegyenlet általános megoldását. Ez egy másodrendű, állandó együtthatójú, inhomogén lineáris differenciálegyenlet. Ennek általános megoldásához egyrészt meg kell határozni a megfelelő homogén lineáris differenciálegyenlet általános megoldását, másrészt pedig elő kell állítani az inhomogén egyenlet egy partikuláris megoldását. A homogén egyenlet általános megoldását éppen az előző 2.2.6.2. pontban állítottuk elő. Így mindössze annyi a feladatunk, 274
Óbudai Egyetem BGK
Fejezetek a matematikából
hogy az inhomogén egyenlet egy partikuláris megoldását előállítjuk. Ehhez a 2.2.5.2. pontban tárgyalt próbafüggvény módszerét alkalmazzuk. Eszerint a partikuláris megoldást kereshetjük a következő alakban yip t A sin t B cos t
Az ismeretlen A és B együtthatók meghatározásához szükség van a próbafüggvény első és második deriváltjára. Átmenetileg egyszerűsítve a jelöléseket írhatjuk, hogy y ' A cos t B sin t; y " A2 sin t B2 cos t;
Ezeket a deriváltakat helyettesítjük az egyenletbe
y " 2y ' 2 y
A2 sin t B2 cos t 2 A cos t B sin t 2 A sin t B cos t f 0 sin t ;
Ha rendezzük a kapott egyenletet a trigonometrikus függvények szerint, adódik, hogy
A B2 sin t A2 B cos t f sin t 0 cos t 2
2
2
2
0
Az együttható összehasonlítás módszerét alkalmazva kapunk egy lineáris egyenletrendszert az ismeretlen A és B együtthatókra
A 2 2 B 2 f 0 2 2 A2 B 0
Ennek az egyenletrendszernek a megoldása a következő
A f0
2 2
2
2
2
422
; B f0
2
2
2
2
422
Tehát az inhomogén egyenlet egy partikuláris megoldása a következő
yip t f 0
2 2
2 2
2
422
sin t f 0
2
2 2
2
422
cos t ;
Ismét alkalmazzuk azt a fogást, amit a harmonikus rezgések esetén már bemutattunk. A trigonometrikus függvények együtthatóit úgy alakítjuk, hogy négyzetösszegük 1 legyen.
275
Óbudai Egyetem BGK
yip t
Fejezetek a matematikából
2 2 2 2 2 4
2 2
f0
2
2 2
sin t
4 2
2
cos t ; 2 2 2 42 2 2
Ha most bevezetjük a φ0 állandót a 2 2
2
2
2
4 2
definícióval, ahol tehát tg 0
2
cos 0 ;
2
2
2
2
4 2
sin 0 ; 2
2 , akkor egy addíciós tétel felhasználásával azt kapjuk, 2 2
hogy
yip t
f0
2
2
2
4 2
cos 0 sin t sin 0 cos t 2
tehát a partikuláris megoldás az egyszerűbb
yip t
f0
2
2
2
4 2
sin t 0 ; 2
alakban írható. Erről a megoldásról a következőt mondhatjuk. A partikuláris megoldás egy Ω körfrekvenciájú harmonikus rezgőmozgás. Ez azt jelenti, hogy a rezgő tömegpont felveszi a kényszerítő erő Ω körfrekvenciáját, de nincs azonos fázisban a gerjesztéssel, hanem azt φ0 fáziskéséssel követi. A létrejövő rezgés amplitúdóját az A=
f0
2
2
2
422
formulával adhatjuk meg, a fáziskésést pedig a 2 0 arctg 2 2
képlettel számíthatjuk. Ha ezek után felírjuk a gerjesztett rezgés differenciálegyenletének általános megoldását, akkor a gyakorlat szempontjából legfontosabb 2.2.6.2. c) esetnek megfelelő esetben az általános megoldás a következő
276
Óbudai Egyetem BGK
yhá t et C1 cos
Fejezetek a matematikából
2 2 t C2 sin
2 2 t
f0
2
2
2
4 2
sin t 0 ; 2
A homogén egyenlet megoldásáról az idézett pontban megmutattuk, hogy a végtelenben zérushoz tart, ami azt jelenti, hogy az általános megoldás azon része, amely a homogén egyenletet elégíti ki, tehát az első tag, t → ∞ esetén eltűnik, ezt nevezzük tranziens jelenségnek, és megmarad az inhomogén egyenlet partikuláris megoldása amely egy egzakt harmonikus rezgőmozgás. A mondottakat illusztrálja a 2.2.10. ábra. Mind az a) mind a b) ábrán egy gerjesztett rezgés kitérés-idő függvénye látható a már többször alkalmazott y 0 0; y ' 0 3 kezdeti feltételek mellett ω = 2, Ω = 2,5, f0 = 5 konstansok esetén. A két ábra között a különbség annyi, hogy az a) ábrán a csillapításra jellemző adat β = 0,15, a b) ábrán pedig β = 0,75. Az a) esetben tehát gyengébb csillapítást alkalmaztunk. Összehasonlítva a két kitérés-idő függvényt, az a legjobban szembetűnő különbség, hogy gyenge csillapítás esetén a tranziens jelenség nagyjából t = 25-30s elteltével tűnik el, erős csillapítás esetén pedig már t = 5-10s időintervallumon belül eltűnik az exponenciálisan csökkenő része a megoldásnak. Ezen tranziensek "lecsengése" után egy egzakt szinusz függvény marad kitérés-idő függvényként Ω körfrekvenciával.
a) "gyenge" csillapítás: β = 0,15
b) "erős" csillapítás: β = 0,75
2.2.10. Ábra. A gerjesztett és csillapított harmonikus rezgés kitérés-idő függvénye különböző csillapítások mellett, ω = 2,Ω = 2,5, f0 = 5 konstansok esetén, y 0 0; y ' 0 3 kezdeti feltételekkel
A témakör lezárásaképpen vizsgáljuk meg a tranziens jelenségek eltűnése után megmaradó harmonikus rezgés amplitúdóját. Számításaink szerint az amplitúdót az alábbi formula szolgáltatja
277
Óbudai Egyetem BGK
Fejezetek a matematikából f0
A0 A0
2
2
2
422
amely amplitúdót az Ω körfrekvencia függvényének tekintünk. Annak érdekében, hogy a gerjesztés Ω körfrekvenciáját megkülönböztessük a harmonikus rezgés ω körfrekvenciájától, ez utóbbit a rezgés sajátfrekvenciájának nevezünk. Azt a kérdést tesszük fel, hogy hogyan függ az A0 amplitúdó a gerjesztési frekvenciától. Keressük ennek maximumát adott ω sajátfrekvencia és β csillapítás esetén. Az egyszerűség kedvéért úgy tekintjük, hogy az A0 amplitúdó az Ω2 változónak a függvénye, mert ebben az esetben egyszerűbb meghatározni az amplitúdó függvény szélsőértékét. Ez utóbbi érdekében előállítjuk a kérdéses függvény deriváltját az Ω2 változó szerint és keressük ennem zérus helyét dA0 f0 d 2 Ennek az egyenletnek a megoldása
2 2 22
2
2
2
422
3
0
2 2 22 0; azaz 2 2 22 ; tehát 2 22 Adott csillapítás és sajátfrekvencia esetén a gerjesztett rezgés amplitúdója eszerint akkor maximális, ha a gerjesztési frekvenciára teljesül, hogy 2 22 . Tehát, a félreértések eloszlatása végett, a csillapított esetben a maximális amplitúdójú rezgést létrehozó gerjesztési frekvencia nem egyezik meg a sajátfrekvenciával, csak annak a közelében van. Ez a frekvencia a rezonanciafrekvencia. Ezen belül, abban a speciális esetben, amikor a rezgő rendszer nincs csillapítva, azaz β = 0, azt kapjuk, hogy az amplitúdó az
A0 A0
f0
2
2
2
f0 2 2
formula által adott módon függ a gerjesztés frekvenciájától. Ebben az esetben, a fenti számítások eredményének ismerete nélkül is azonnal látható, hogy az amplitúdó Ω → ω esetén nem korlátos, azaz A0 → ∞, a maximális kitérés tehát nem korlátos. Ezt az esetet nevezzük rezonancia katasztrófának. A csillapított esettel ellentétben tehát a csillapítatlan esetben, rezonancia akkor adódik, ha a gerjesztési frekvencia pontosan megegyezik a sajátfrekvenciával. A 2.2.11. ábrán az amplitúdó gerjesztési frekvenciától való függését ábrázoltuk különböző β csillapítások esetén.
278
Óbudai Egyetem BGK
Fejezetek a matematikából
2.2.11. Ábra. A gerjesztett harmonikus rezgés amplitúdójának függése a gerjesztési frekvenciától, ω = 20 és különböző csillapítások esetén. A görbék mentén fentről lefelé haladva a β értéke rendre 0,02; 0,03; 0,05; 0,07; 0,09.
279
Óbudai Egyetem BGK
Fejezetek a matematikából
280
Óbudai Egyetem BGK
Fejezetek a matematikából
2.3. Elsőrendű lineáris differenciálegyenlet rendszerek 2.3.1. Bevezető példák Bevezetőként lássunk példákat olyan fizikai problémákra, amelyek leírása olyan differenciálegyenletekkel történik, amelyekben több ismeretlen függvény szerepel, és ezek az egyenletek nem függetlenek egymástól. 2.3.1.Példa: Elsőként vizsgáljuk két induktív módon csatolt rezgőkört. Az egyik rezgőkörben legyen egy periodikusan változó U(t) = U0sinωt elektromotoros erő, egy R1 ohmikus ellenállás és egy L1 önindukciós együtthatójú tekercs. Ez a tekercs induktív módon csatolva van egy L2 önindukciós együtthatójú tekercshez, amely egy olyan áramkörben van, amelyben nincs áramforrás és amelynek eredő ohmikus ellenállása R2. Legyen a két tekercs együttesének kölcsönös indukciós együtthatója L12. Kérdés, hogy az első és második áramkörben folyó áramerősségek hogyan változnak az idő függvényében, tehát meghatározandók az I1(t) és I2(t) függvények. Az áramerősségek meghatározására a huroktörvényt tudjuk alkalmazni, amely a két áramkörre rendre a következő összefüggéseket adja dI t dI t I1 t R1 1 L1 2 L12 U 0 sin t ; dt dt I t R dI 2 t L dI1 t L 0; 2 2 2 12 dt dt
Világos, hogy az L12 kölcsönös indukciós együttható miatt a két egyenlet nem független egymástól, az I1(t) áramerősség pillanatnyi értéke függ az I2(t) függvény deriváltjának pillanatnyi értékétől és fordítva. Amit kaptunk, az tehát egy differenciálegyenlet rendszer. Mivel az ismeretlen függvényeknek csak első deriváltjai vannak az egyenletekben ez egy elsőrendű differenciálegyenlet rendszer. 2.3.2.Példa: Következőként vizsgáljunk egy mechanikai problémát, a csatolt rezgések problémáját. Tekintsünk két fonálingát, amelyek egy kényszerrel egymáshoz vannak kapcsolva (2.3.1. ábra). Ha y1(t)és y2(t) jelöli az egyes m tömegű tömegpontok kitérését, akkor a dinamika alaptörvényének felhasználásával, tekintettel arra, hogy mindkét fonálinga kitérése függ a másik fonálinga kitérésétől, hiszen a kitérések meghatározzák a fellépő erőhatásokat, ezáltal a gyorsulásokat, feltéve továbbá, hogy kis kitérések esetén az erők arányosak a kitéréssel, az alábbi mozgásegyenleteket írhatjuk fel a két tömegpontra vonatkozólag
281
Óbudai Egyetem BGK
Fejezetek a matematikából ma1 Dy1 k y2 y1 ; ma2 Dy2 k y2 y1 ;
m
m y1
y2
2.3.1. ábra. Csatolt mechanikai rezgések
Ha felhasználjuk, hogy a gyorsulás a hely-idő függvény második deriváltja, valamint bevezetünk egyszerűsítő jelöléseket, akkor az alábbi differenciálegyenleteket kapjuk az y1(t) és y2(t) kitérésidő függvények meghatározására.
y1" t 2 2 y1 t 2 y2 t ; " 2 2 2 y2 t y1 t y2 t ;
D 2 k , jelöléseket. Ez a két differenciálegyenlet sem független m m egymástól, az y1(t) és y2(t) függvények pillanatnyi értékek kölcsönösen befolyásolják egymást. Tehát a két egyenlet egy differenciálegyenlet rendszert képez. Mivel az ismeretlen függvények második deriváltja szerepel ezekben az egyenletekben, ez egy másodrendű differenciálegyenlet rendszer. ahol alkalmaztuk az 2
Ebben a fejezetben a 2.3.1. és 2.3.2. példákban említett és ezekhez hasonló matematikai problémák megoldásával foglalkozunk. Mint az a bevezető két példából kiderül, differenciálegyenlet rendszerek megoldásával foglalkozunk. Némileg speciálisabb alakú rendszerekkel mint a bevezető két példa rendszere, de megmutatjuk majd, hogy az említett két példa visszavezethető a következőkben vizsgált típusra.
282
Óbudai Egyetem BGK
Fejezetek a matematikából
2.3.2. Elsőrendű lineáris differenciálegyenlet rendszer fogalma Ebben a pontban általánosan definiáljuk a differenciálegyenlet rendszer fogalmát. A megoldási módszerek és igazolt illetve csak megfogalmazott tételek körét tekintve korlátozódunk az elsőrendű lineáris rendszer vizsgálatára. Azonban ez nem jelent olyan mértékű megszorítást, mint ahogyan első olvasatra tűnik. A 2.2. fejezetben másodrendű lineáris differenciálegyenletek vizsgálatával foglakoztunk. Ebben a fejezetben kiderül, hogy a magasabb rendű lineáris differenciálegyenletek visszavezethetők elsőrendű rendszerekre, így a rendszerek megoldási módszereinek és elméletének birtokában már megoldhatunk harmad, negyed, stb. n-ed rendű lineáris differenciálegyenleteket is. A kifejtett elmélet jelentős mértékben támaszkodik az 1. fejezetben tárgyalt lineáris algebrai ismeretekre, különös tekintettel a sajátértékek és sajátvektorok elméletére. 2.3.1.Definíció: Legyen adott egy I = ]a, b[ nyitott intervallum, továbbá tegyük fel, hogy az aij : I R; t aij t és a gi : I R; t gi t (i, j = 1, 2, 3, …, n) függvények mind folytonosak az I intervallumon. Ezen feltételekkel az xi(t), i = 1, 2, …, n ismeretlen függvényekre vonatkozó
x '1 a11 t x1 a12 t x2 ... a1n t xn g1 t x '2 a21 t x1 a22 t x2 ... a2 n t xn g 2 t ... x 'n an1 t x1 an 2 t x2 ... ann t xn g n t egyenletrendszert normál alakú, elsőrendű lineáris differenciálegyenlet rendszernek nevezzük (mostantól: d.e.r.). A felírásnál alkalmaztuk a szokásos xi= xi(t) egyszerűsítő jelölést. Már a bevezetőben említettük, hogy a lineáris algebra és a mátrixelmélet fogalmait fogjuk használni a megoldás és a vizsgálatok során. Célszerű ezért jelölésekben is áttérni a mátrixelmélet jelölésmódjára. Látni fogjuk, hogy ezzel jelentős mennyiségű helyet és energiát takarítunk meg, mert sokkal egyszerűbbé válnak a jelölések és a definíciók valamint a tételek is, a bizonyításokkal együtt. 2.3.2.Definíció: Vezessük be az előző definícióban szereplő d.e.r. függvényeinek összefoglaló jelölésére a következőket a11 t a12 t ... a1n t g1 t x1 t a21 t a22 t ... a2 n t g2 t x2 t A t ; g t ; x t ; ... ... ... an1 t an 2 t ... ann t g n t xn t
ahol az A(t) négyzetes mátrix az együtthatómátrix, ami ugyancsak az I intervallumon értelmezett mátrix értékű függvény, a g(t) vektor-skalár függvény szintén az I intervallumon van értelmezve. Az x(t) vektor-skalár függvény pedig az ismeretlen függvényeket tartalmazó vektor. 283
Óbudai Egyetem BGK
Fejezetek a matematikából
Ha a szokásos módon megállapodunk abban, hogy egy vektorfüggvény deriváltja értelmezés szerint a koordinátafüggvényeinek deriválását jelenti, és figyelembe vesszük a bevezetett jelöléseket, valamint felidézzük a mátrixok szorzásának definícióját, akkor az előző definícióban szereplő d.e.r. az alábbi módon is értelmezhető. 2.3.3.Definíció: Normál alakú elsőrendű lineáris differenciálegyenlet rendszernek nevezzük az
x ' t A t x t g t egyenletet. A rendszert homogén lineárisnak nevezzük, ha az I intervallumon a g(t) vektorskalár függvény azonosan nulla, tehát ha g(t) ≡ 0. Ellenkező esetben a rendszer inhomogén lineáris. A rendszert azért nevezzük normál alakúnak, mert minden egyenlet rendezve van az egyik ismeretlen függvény deriváltjára, és ennek együtthatója minden egyenletben 1. A továbbiakban, a lineáris egyenletek mintájára külön vizsgáljuk majd először a homogén, azután az inhomogén rendszer megoldhatóságát. A megoldások esetében különbséget teszünk általános és partikuláris megoldás között a megszokott értelemben. Ezeket pontosan megfogalmazzuk, de az világos, hogy a partikuláris megoldás előállításához szükség van kezdeti feltételre. Tisztázzuk, hogy ebben az esetben mit értünk kezdeti érték problémán. 2.3.4.Definíció: Az x ' t A t x t g t d.e.r-re vonatkozó kezdeti érték problémán a következőt értjük. A rendszerhez kapcsolunk kezdeti feltételeket, pontosabban, ha a vektoriális írásmódot alkalmazzuk, akkor egy kezdeti feltételt. Előírjuk, hogy az x(t) vektor skalár függvény az I intervallum valamely t0 pontjában áthaladjon az Rn tér egy x0 pontján. Azaz kezdeti feltételként az x(t0) = x0 egyenlőség teljesülését írjuk elő. Ezzel a kezdeti érték probléma a következő módon van értelmezve
x ' t A t x t g t x t0 x 0 Nyilvánvalóan merül fel a kérdés, hogy milyen feltételek esetén létezik megoldás. Ezt tisztázza az alapvető fontosságú, bizonyítás nélkül megfogalmazott alábbi tétel. 2.3.1.Tétel: (Egzisztencia és unicitás) aij t és a gi : I R; t Tegyük fel, hogy az aij : I R; t
gi t (i, j = 1, 2, 3, …, n)
függvények folytonosak az I = ]a, b[ intervallumon. Legyen továbbá t0 a, b és x0 R n tetszőleges. Ekkor az
x ' t A t x t g t x t0 x 0
284
Óbudai Egyetem BGK
Fejezetek a matematikából
kezdeti érték problémának egyértelműen létezikx(t) megoldása, és ez a megoldás a teljes I intervallumon értelmezve van. Bizonyítás: A tételt nem bizonyítjuk, de az alkalmazások szempontjából betöltött fontos szerepe miatt meg kellett fogalmaznunk. Az érdeklődő olvasónak a szakirodalmat ajánljuk. ■ A továbbiakban azt vizsgáljuk általánosan, milyen a szerkezete az x ' t A t x t g t lineáris rendszer megoldásainak. Elsőként a homogén, azután az inhomogén rendszer általános vizsgálatát végezzük el. Mielőtt belekezdünk az elmélet kifejtésébe, két példán keresztül megmutatjuk, hogy a vizsgált típusú, tehát elsőrendű, normál alakú rendszer nem annyira erős megszorítás, mint az esetleg gondolható. Ennek érdekében megmutatjuk, hogy a 2.3.1 és 2.3.2. példákban felállított rendszerek átalakíthatók elsőrendű normál alakú rendszerré. 2.3.3.Példa: Az induktív módon csatolt rezgőkörökre a 2.3.1. példában felírt d.e.r. elsőrendű de nem normál alakú. A két egyenlet rendezésével azonban elérhető, hogy az normál alakúvá váljon. Ehhez nem kell mást tenni, mint az I1(t) és I2(t) függvények deriváltjára meg kell oldani a felírt rendszert. Ez egy egyszerű algebrai feladat. Az említett deriváltakat ismeretlennek tekintve, a felírt rendszer lineáris, melynek megoldása a következő dI1 t U 0 L2 R1L2 R2 L12 I t I2 t sin t ; 2 1 2 2 L1L2 L12 L1L2 L12 L1L2 L12 dt dI 2 t R1L12 I t R2 L1 I t U 0 L12 sin t ; 2 2 1 2 2 dt L1L2 L12 L1L2 L12 L1L2 L12
Ez pedig valóban egy elsőrendű, normál alakú, inhomogén lineáris d.e.r. 2.3.4.Példa: A 2.3.2. példában a csatolt rezgésekre felállított d.e.r. nem elsőrendű, hanem másodrendű rendszer. Azonban egy általános módszer segítségével, amelyet később a magasabb rendű egyenletek megoldása kapcsán fogunk alkalmazni, a rendszert át lehet alakítani elsőrendű rendszerré. Ennek természetesen van ára, mégpedig az, hogy az ismeretlen függvények száma megszaporodik, kettőről négyre növekszik. Vezessünk be új ismeretlen függvényeket a következő definícióval. Legyen x1 = y1 és legyen x2 = x1’. Ekkor természetesen x2’ = y1”. Hasonlóan legyen x3 = y2 és legyen x4 = x3’. Ekkor természetesen x4’ = y2”. Ezzel a négy ismeretlen függvénnyel a 2.3.2. példában felírt rendszer a következő, négy egyenletből álló ekvivalens alakra hozható
x1 ' t x2 t ; 2 2 2 x2 ' t x1 t x3 t ; x3 ' t x4 t ; x ' t 2 x t 2 2 x t ; 1 3 4
285
Óbudai Egyetem BGK
Fejezetek a matematikából
ha alkalmazzuk a bevezetett mátrix jelöléseket is, akkor a differenciálegyenlet a sokkal áttekinthetőbb
0 x1 ' t 2 2 x2 ' t x3 ' t 0 2 x4 ' t
1
0
0
2
0
0
0 2 2
0 x1 t 0 x t 2 ; 1 x3 t 0 x4 t
alakban írható, amely már jól láthatóan egy elsőrendű, normál alakú, állandó együtthatójú homogén lineáris differenciálegyenlet rendszer.
286
Óbudai Egyetem BGK
Fejezetek a matematikából
2.3.3. Elsőrendű homogén lineáris differenciálegyenlet rendszer Foglalkozzunk tehát az x ' t A t x t
rendszer megoldásának általános vizsgálatával. A megoldások szerkezetének tanulmányozásához szükség van a Wronski-determináns fogalmára, amelyet a 2.2 pontban a másodrendű lineáris egyenletek témakörén belül már értelmeztünk. (A két fejezet között sok más hasonlóság is van. Javasoljuk a Tisztelt Olvasónak, hogy hasonlítsa össze az ismertetett tételeket a 2.2. és 2.3. fejezetekben, nagyon sok rokonságot talál majd a két elmélet között.) 2.3.5.Definíció: Az I intervallumon értelmezett x1(t), x2(t), … xn(t) vektor-skalár függvényeket az I intervallumon lineárisan függetleneknek nevezzük, ha az
1x1 t 2 x2 t ... n xn t 0 az I intervallum minden pontjában csak akkor állhat fenn, ha 1 2 ... n 0; (i R, i 1, 2,..., n) . A függvényrendszer lineárisan összefüggő, ha nem független, azaz létezik legalább egy olyan αk együttható, amely zérustól különbözik, de a fenti egyenlőség fennáll az I intervallum minden pontjában. 2.3.6.Definíció: Az I intervallumon értelmezett x1(t), x2(t), … xn(t) vektor-skalár függvények Wronski-determinánsának nevezzük a következő n-ed rendű determinánst x11 t
W x1 t , x 2 t ,..., x n t
x12 t ...
x21 t ... xn1 t
x22 t ... xn 2 t ...
...
x1n t x2 n t ... xnn t
A Wronski-determinánst tehát a következő módon kapjuk: az xi(t) vektor-skalár függvényekből úgy képezünk egy determinánst, hogy annak i-edik oszlopába írjuk az xi(t) vektorfüggvény koordinátafüggvényeit. A definícióban alkalmazott jelölésben tehát xij(t) nem más, mint az xi(t) vektor függvény j-edik koordináta függvénye. Szoros kapcsolat van a vektor-skalár függvények lineáris függetlensége és a Wronskidetermináns értéke között. Ezt a kapcsolatot tisztázzák az alábbi tételek. 2.3.2.Tétel: Ha az x1(t), x2(t), … xn(t) vektor-skalár függvények lineárisan összefüggők az I intervallumon, akkor Wronski-determinánsuk azonosan nulla I-n.
287
Óbudai Egyetem BGK
Fejezetek a matematikából
Bizonyítás: A függetlenség és összefüggőség definíciója szerint létezik egy olyan αk együttható, amely zérustól különbözik és az I intervallumon azonosan teljesül, hogy
1x1 t 2 x2 t ... n xn t 0; t I Vegyük észre, hogy ez egy algebrai, homogén lineáris egyenletrendszer az α1, α2, …, αn ismeretlenekre, mely rendszerben az együtthatók az x1(t), x2(t), … xn(t) vektor-skalár függvények koordinátafüggvényei, tehát a rendszer együtthatómátrixa éppen a W x1 t , x2 t ,..., xn t Wronski-determináns. A feltevés szerint a rendszernek minden t-re van nemtriviális megoldása, hiszen αk ≠ 0. Ez pedig csakis akkor lehetséges, ha a rendszer determinánsa az I intervallum minden pontjában zérus. ■ A mondottakat illusztráljuk egy példával. 2.3.5.Példa: Nevezetes azonosságok alapján tudjuk, hogy az et e t sh t t t x1 t e ; x2 t e ; x3 t ch t ; 2 2 0,5 sin t cos t
1 1 x1 t x2 t x3 t 0 . 2 2 Megmutatjuk, hogy a három függvény Wronski-determinánsa azonosan zérus. Valóban, egyszerű számításokkal adódik, hogy függvények lineárisan összefüggenek, ugyanis nyilván igaz, hogy
et W x1 t , x 2 t , x3 t
e
et sh t
t
e
t
ch t
sin 2 t cos 2 t 0,5
e t
et 0
2e
t
sin 2 t cos 2 t
sh t ch t sh t 0,5
et et cos 2 t ch t sh t sin 2 t e t ch t sh t 1 cos 2 t sin 2 t 0 A tétel közvetlen megfordítása nem igaz, tehát a Wronski-determináns nulla értékéből nem következik a függetlenség. Ezt igazolja a következő egyszerű példa. 2.3.6.Példa: Definiáljuk az x1(t), x2(t) vektor-skalár függvényeket az alábbi módon
t 3 t 2 x1 t ; x2 t ; t I R 2 t t
288
Óbudai Egyetem BGK
Fejezetek a matematikából
Világos, hogy ez a két vektorfüggvény lineárisan független, hiszen 1x1 t 2 x2 t 0 vektoregyenletből következik egyrészt, hogy 1t 2 2t 0; t I . Egy másodfokú polinom azonban csak abban az esetben lehet egy intervallumon azonosan zérus, ha az együtthatói mind nullák. Ezzel megmutattuk, hogy a két vektorfüggvény valóban lineárisan független. Másrészt viszont a Wronski-determinánsa
W x1 t , x2 t
t3
t2
2
t
t
t 4 t 4 0; t I
valóban eltűnik az I intervallumon mindenütt. Felmerül a kérdés, hogy milyen járulékos feltétellel lehet biztosítani azt, hogy a tétel megfordítható legyen. Ezen járulékos feltétel tételbeli megfogalmazása előtt igazolnunk kell egy állítást, amely szerint homogén lineáris rendszer megoldásainak tetszőleges lineáris kombinációja is megoldás. Erről szól az alábbi állítás. 2.3.3.Tétel: Tegyük fel, hogy az x1(t), x2(t), … xn(t) függvények megoldásai az x ' t A t x t homogén lineáris rendszernek, és legyenek α1, α2, …, αn tetszőleges valós (vagy akár komplex) állandók. Ekkor az n
x t i xi t i 1
függvény is megoldása a homogén rendszernek. Bizonyítás: Ellenőrizni kell, hogy ez a függvény kielégíti-e az x ' t A t x t rendszert. Mivel az xi(t) függvények megoldásai a homogén rendszernek, a mátrixszorzás disztributivitása valamint differenciálási szabályok szerint írhatjuk, hogy n n n x ' t i x 'i t i A t xi t A t i xi t A t x t i 1 i 1 i 1
Ezt kellett igazolni. ■ Ezek után megfogalmazhatjuk az előbbi tétel megfordítását. 2.3.4.Tétel: Tegyük fel, hogy az I intervallumon értelmezett x1(t), x2(t), … xn(t) vektor-skalár függvények megoldásai az x ' t A t x t homogén lineáris rendszernek, továbbá tegyük fel, hogy létezik olyan t0 I , hogy W x1 t0 , x2 t0 ,..., xn t0 0;
Ekkor az x1(t), x2(t), … xn(t) függvények lineárisan összefüggenek az I intervallumon. 289
Óbudai Egyetem BGK
Fejezetek a matematikából
Bizonyítás: Mivel a Wronski-determináns zérus, ezért az
1x1 t0 2 x2 t0 ... n xn t0 0 homogén lineáris algebrai egyenletrendszernek létezik nem triviális megoldása. Legyen ez a megoldás β1, β2, …, βn. Képezzük ezekkel a konstansokkal az n
x t i xi t i 1
lineáris kombinációt. Az előző tétel szerint ez a függvény megoldása a homogén rendszernek, továbbá a feltétel miatt kielégíti az x t0 0 kezdeti feltételt. Ilyen megoldás természetesen létezik, az azonosan nulla függvény, tehát az x t 0 függvény megoldása a kezdeti érték problémának. A megoldás egyértelműsége miatt azonban ez azt jelenti, hogy a fenti lineáris kombináció az azonosan nulla függvény, tehát n
i xi t 0 i 1
Ez pedig pontosan azt jelenti, hogy az x1(t), x2(t), … xn(t) függvények lineárisan összefüggenek az I intervallumon. ■ Az igazolt tételek nyilvánvaló következményeként megfogalmazhatunk egy tételt, amely az x ' t A t x t homogén lineáris rendszer megoldásainak a függetlenségét jellemzi. 2.3.5.Tétel: Az x ' t A t x t homogén lineáris rendszer x1(t), x2(t), … xn(t) megoldásai akkor és csak akkor lineárisan függetlenek, ha létezik olyan t0 I , amelyre teljesül, hogy W x1 t0 , x2 t0 ,..., xn t0 0
Bizonyítás: Az előző tételek nyilvánvaló következménye. ■ A bizonyított tételek birtokában már előállíthatjuk a homogén lineáris rendszer általános megoldását. Ezt alapozza meg a következő értelmezés. 2.3.7.Definíció: Az x ' t A t x t homogén lineáris rendszer x1(t), x2(t), … xn(t) megoldásainak halmazát alaprendszernek nevezzük az I intervallumon, ha az x1(t), x2(t), … xn(t) függvények az I intervallumon lineárisan függetlenek. Az első kérdés, ami felmerül, hogy létezik-e egyáltalán alaprendszer. A válasz pozitív.
290
Óbudai Egyetem BGK
Fejezetek a matematikából
2.3.6.Tétel: Az x ' t A t x t homogén lineáris rendszernek létezik végtelen sok alaprendszere. Bizonyítás: Legyen B R nn egy tetszőleges reguláris mátrix, amelyre tehát teljesül, hogy det(B) ≠ 0. Nyilván végtelen sok ilyen mátrix létezik. Legyen továbbá szokás szerint t0 I tetszőleges. Határozzuk meg a homogén rendszernek azokat a megoldásait, amelyek rendre kielégítik az
x1 t0 b1; x2 t0 b2 ; ... ; xn t0 bn ; kezdeti feltételeket. Azt állítjuk, hogy az így meghatározott x1(t), x2(t), … xn(t) megoldások alaprendszert alkotnak, ugyanis a lineáris függetlenségről szóló tétel szerint, ha létezik olyan t0 I , amelyre W x1 t0 , x2 t0 ,..., xn t0 0 akkor az x1(t), x2(t), … xn(t) megoldások lineárisan függetlenek. Márpedig W x1 t0 , x2 t0 ,..., xn t0 det(B) 0
tehát a Wronski-determináns az adott pontban valóban különbözik 0-tól. ■ Az alaprendszer fogalmának fontosságát tisztázza a következő állítás. 2.3.7.Tétel: Legyen x1(t), x2(t), … xn(t) az x ' t A t x t homogén lineáris rendszer egy alaprendszere. Legyen továbbá x(t) a rendszer egy tetszőleges megoldása. Ekkor egyértelműen léteznek α1, α2, …, αn konstansok úgy, hogy n
x t i xi t i 1
Tehát egy alaprendszer birtokában bármely megoldás előállítható, méghozzá egyértelműen, az alaprendszer függvényeinek lineáris kombinációjaként. Bizonyítás: Már igazoltuk, hogy a
n
i xi t lineáris
kombináció is megoldása a homogén
i 1
lineáris rendszernek. Legyen x(t) a rendszer egy tetszőleges megoldása, legyen továbbá t0 I és vizsgáljuk az
1x1 t0 2 x2 t0 ... n xn t0 x t0 inhomogén lineáris algebrai egyenletrendszert az αi ismeretlenekre vonatkozólag. Mivel ennek a rendszernek a determinánsa éppen a W x1 t0 , x2 t0 ,..., xn t0 0 Wronski-determináns, amely tehát különbözik 0-tól, ezért az egyenletrendszernek létezik egyértelmű megoldása. Jelölje
291
Óbudai Egyetem BGK
Fejezetek a matematikából
ezt a megoldást β1, β2, …, βn. Tekintsük most ezekkel a konstansokkal a
n
i xi t megoldást. i 1
n
Erre teljesül, hogy x t0 i xi t0 . A megoldás egyértelműsége miatt ez azt jelenti, hogy i 1
n
x t i xi t i 1
ami éppen azt jelenti, hogy a tetszőleges x(t) megoldás előáll az alaprendszer függvényeinek lineáris kombinációjaként. Már csak az egyértelműséget kell igazolnunk. Tegyük fel, hogy n
létezik két különböző előállítás. Azaz tegyük fel, hogy x(t) előáll x t i xi t alakban is. i 1
Ekkor képezve a két előállítás különbségét azt kapjuk, hogy n
i i xi t 0 i 1
Mivel az alaprendszer függvényei lineárisan függetlenek, az azonosan nulla függvény csak a triviális módon, csupa zérus együtthatóval állítható elő, ami azt jelenti, hogy i i ; i 1, 2,..., n. Ezzel az egyértelműséget is bizonyítottuk. ■ Az igazolt tétel alapján értelmezhetjük az általános megoldás fogalmát. 2.3.8.Definíció: Legyen x1(t), x2(t), … xn(t) az x ' t A t x t homogén lineáris rendszer egy alaprendszere. Ekkor a rendszer összes megoldásainak
n i xi t i R; i 1, 2,..., n i 1 halmazát, tehát ezt az n-paraméteres függvénysereget, a homogén lineáris rendszer általános megoldásának nevezzük. A bizonyított tételek és a most megfogalmazott definíció alapján tehát nyilvánvaló, hogy egy homogén lineáris rendszer megoldásához elő kell állítani egy alaprendszerét. Azonban az a helyzet, hogy az általános, „függvényegyütthatós” esetben az alaprendszer előállítására nincs általános módszer. Az alaprendszert csak akkor tudjuk konstruktív úton előállítani, ha a differenciálegyenlet rendszer együtthatói állandók. Erre a témára visszatérünk, de annak érdekében, hogy a jelzett esetben kimerítően le tudjuk írni a megoldásokat, szükség van egy praktikus definícióra amely megkönnyíti a kezdeti érték probléma megoldását. Ezután még megvizsgáljuk az inhomogén rendszer megoldhatóságának problémáját. A megoldások lineáris függetlensége könnyedén eldönthető egy egyszerű feltétel alapján, amely a kezdeti feltételekhez kötődik. Ezt fogalmazzuk meg az alábbi állításban.
292
Óbudai Egyetem BGK
Fejezetek a matematikából
2.3.8.Tétel: Legyenek az x1(t), x2(t), … xn(t) függvények olyan megoldásai az x ' t Ax t homogén lineáris rendszernek, amelyek az xi t0 yi ; i 1, 2,..., n kezdeti feltételekhez tartoznak. Ekkor az x1(t), x2(t), … xn(t) függvények pontosan akkor lineárisan függetlenek az I intervallumon, ha az y1, y2, …, yn vektorok lineárisan függetlenek. Bizonyítás: Képezzünk az yi vektorokból, mint oszlopvektorokból egy n-ed rendű determinánst. Vegyük észre, hogy ez a determináns éppen az megoldásfüggvények t0 helyen vett Wronskideterminánsa. Ez pedig a feltételként előírt lineáris függetlenség miatt det x1 t0 , x2 t0 ,..., xn t0 det y1, y 2 ,..., y n 0
különbözik nullától, ami pontosan azt jelenti, hogy az x1(t), x2(t), … xn(t) megoldások lineárisan független rendszert alkotnak. ■ 2.3.9.Definíció: Legyen x1(t), x2(t), … xn(t) az x ' t A t x t homogén lineáris rendszer egy alaprendszere. Ekkor azt a Φ t mátrix-függvényt, amelynek i-edik oszlopvektora az alaprendszer xi(t) megoldásfüggvénye, a homogén lineáris rendszer alapmátrixának nevezzük. Az alapmátrix tehát a következő x11 t x21 t ... xn1 t x12 t x22 t ... xn 2 t Φ t x1 t , x 2 t ,..., x n t ... ... ... x1n t x2 n t ... xnn t
Az alapmátrixnak a lineáris algebrai ismeretek alapján megfogalmazhatjuk néhány fontos tulajdonságát, amelyek a definícióból illetve a mátrixok elméletéből adódnak. 2.3.9.Tétel: Ha a Φ t mátrix alapmátrixa az x ' t A t x t homogén lineáris rendszernek, akkor a) Φ t oszlopvektorai lineárisan függetlenek; b) a Φ t mátrix rangja n; c) a Φ t mátrix reguláris, azaz det Φ t 0; t I ; d) tetszőleges t I esetén Φ t invertálható, azaz létezik a Φ1 t inverz mátrix; e) a Φ t kielégíti az X ' t A t X t mátrix differenciálegyenletet. Bizonyítás: Csak az e) pont szorul bizonyításra, a többi állítás nyilvánvaló. Ehhez bevezetőként csak annyit kell megjegyeznünk, hogy egy mátrix függvény deriváltját úgy értelmezzük, hogy minden komponensét deriváljuk. A Φ ' t A t Φ t pedig abból következik, hogy az alapmátrix i-edik oszlopvektora értelmezés szerint az xi(t) megoldásfüggvény, amelyre teljesül, hogy xi ' t A t xi t . A mátrixegyenlet pedig ezt az n db differenciálegyenlet rendszert 293
Óbudai Egyetem BGK
Fejezetek a matematikából
„foglalja össze” úgy, hogy a bal oldal i-edik oszlopa egyenlő a jobb oldal i-edik oszlopával. Ezzel az állítást igazoltuk. ■ Az alapmátrix segítségével egyszerűbb formában is kifejezhetjük azt a tényt, hogy megoldások tetszőleges lineáris kombinációja is megoldás. Már igazoltuk, hogy ha x1(t), x2(t), … xn(t) az n
x ' t A t x t homogén lineáris rendszer megoldásai, akkor az x t i xi t függvény is i 1
megoldás. Vezessük be a konstansok összefoglalására a c 1, 2 ,..., n R n konstans vektort. Ekkor a felírt lineáris kombináció, a mátrixok sor-oszlop szorzásának definíciója szerint egyenértékű az x t Φ t c művelet eredményével. Igazoltuk tehát a következőt. T
2.3.10.Tétel: Ha Φ t az x ' t A t x t homogén lineáris rendszer alapmátrixa, akkor tetszőleges c R n konstans vektor esetén az x t Φ t c függvény is megoldása a rendszernek. A homogén rendszer vizsgálatát tekintve hátra van még a kezdeti érték probléma megoldásának előállítása. ■ 2.3.11.Tétel: Legyen Φ t az x ' t A t x t homogén lineáris rendszer alapmátrixa, legyen továbbá t0 I és x0 R n tetszőleges. Ekkor a rendszer x t0 x0 kezdeti feltételt kielégítő partikuláris megoldása a következő
x t Φ t Φ1 t0 x0 Bizonyítás: Már igazoltuk, hogy az alapmátrix reguláris, tehát létezik inverze, a felírt kifejezésnek tehát minden esetben van értelme. Világos, hogy ez a függvény x t Φ t c alakú, ahol c Φ1 t0 x0 konstans vektor. Az előzőek szerint ez azt jelenti, hogy valóban megoldása a homogén lineáris rendszernek. Már csak azt kell igazolni, hogy kielégíti az x t0 x0 kezdeti feltételt. Ez egyszerű helyettesítéssel azonnal adódik
x t0 Φ t0 Φ1 t0 x0 Ex0 x0 ahol E R nn az n-ed rendű egységmátrix. Ezt kellett bizonyítani. ■ A homogén rendszer vizsgálatát ezzel befejeztük. Rátérhetünk az inhomogén rendszer megoldásának előállítására.
294
Óbudai Egyetem BGK
Fejezetek a matematikából
2.3.4. Elsőrendű inhomogén lineáris differenciálegyenlet rendszer Ebben a pontban leírjuk, milyen szerkezetű az x ' t A t x t g t
inhomogén lineáris rendszer általános megoldása. Továbbra is élünk a 2.3.2. pont feltevéseivel, mely szerint az egyenletben szereplő függvények folytonosak az I intervallumon. Elsőként kapcsolatot teremtünk az inhomogén és a homogén rendszer között az alábbi értelemben. 2.3.12.Tétel: Tegyük fel, hogy az x1(t), x2(t) függvények megoldásai az x ' t A t x t g t inhomogén lineáris rendszernek. Ekkor az x1(t) – x2(t) különbség megoldása az x ' t A t x t homogén lineáris rendszernek. Bizonyítás: A feltétel szerint teljesül, hogy x1 ' t A t x1 t g t
x2 ' t A t x2 t g t
Képezzük most a két egyenlet különbségét. Azt kapjuk, hogy x1 ' t x2 ' t A t x1 t A t x2 t ; azaz x1 t x2 t ' A t x1 t x2 t
Éppen ezt kellett igazolni. ■ Erre az egyszerű állításra alapozva már megfogalmazhatjuk azt a tételt, amely leírja az inhomogén rendszer általános megoldásának szerkezetét. 2.3.13.Tétel: Legyen az x1(t), x2(t), … xn(t) az x ' t A t x t homogén lineáris rendszer egy alaprendszere, és xip(t) az x ' t A t x t g t inhomogén rendszer egy tetszőleges partikuláris megoldása. Ekkor az inhomogén rendszer tetszőleges x(t) megoldása felírható n
x t i xi t xip t i 1
alakban. Bizonyítás: Az előző tétel szerint az x t xip t különbség a homogén lineáris rendszer egy megoldása. Azt már korábban igazoltuk, hogy ez utóbbi tetszőleges megoldása egyértelműen felírható
n
i xi t alakban
alkalmas α1, α2, …, αn konstansokkal. Eszerint egyértelműen
i 1
léteznek olyan konstansok, melyekkel teljesül, hogy
295
Óbudai Egyetem BGK
Fejezetek a matematikából n
x t xip t i xi t i 1
Ennek átrendezésével éppen a bizonyítandó állítást kapjuk. ■ Az igazolt tétel alapján értelmezhetjük az általános megoldás fogalmát. 2.3.10.Definíció: Legyen x1(t), x2(t), … xn(t) az x ' t A t x t homogén lineáris rendszer egy alaprendszere, xip(t) az x ' t A t x t g t inhomogén rendszer egy partikuláris megoldása. Ekkor az inhomogén rendszer összes megoldásainak
tetszőleges
n i xi t xip t i R; i 1, 2,..., n i 1 halmazát, tehát ezt az n-paraméteres függvénysereget, az inhomogén lineáris rendszer általános megoldásának nevezzük. Az igazolt tételek és a definíció alapján tehát azt kaptuk, hogy – az első és másodrendű inhomogén lineáris differenciálegyenletek megoldásához hasonlóan – az inhomogén lineáris rendszer általános megoldását úgy kapjuk, hogy a homogén rendszer általános megoldásához hozzáadjuk az inhomogén rendszer egy tetszőleges partikuláris megoldását. Nem maradt más hátra, mint az inhomogén rendszer egy partikuláris megoldásának előállítása. Erre egy jól bevált eljárást általánosítunk. Alkalmazzuk az állandó variálásának módszerét. Ennek lényege, hogy az inhomogén rendszer egy partikuláris megoldását olyan alakban keressük, mint a homogén rendszer általános megoldása, azaz x t Φ t c , csak az abban szereplő
c R n konstans vektor helyére egy t c t vektor skalár függvényt helyettesítünk, és megvizsgáljuk, hogy milyen c(t) függvény esetén megoldása az inhomogén rendszernek. Keressük tehát az inhomogén rendszer egy megoldását x t Φ t c t alakban. Ennek létezését biztosítja az alábbi tétel. 2.3.14.Tétel: (Az állandó variálásának módszere) Ha Φ t az x ' t A t x t homogén lineáris rendszer alapmátrixa, akkor létezik olyan
c : I R n differenciálható vektor-skalár függvény, amely esetén az xip t Φ t c t
függvény az x ' t A t x t g t inhomogén rendszer megoldása. Bizonyítás: A bizonyítás során nem csak ennek a c(t) függvénynek a létezését igazoljuk, hanem megadjuk a módszert a függvény konstruktív előállítására is. Helyettesítsük be ezt a függvényt az inhomogén egyenletbe. 296
Óbudai Egyetem BGK
Fejezetek a matematikából
Φ t c t ' A t Φ t c t g t a deriválási szabályok alkalmazásával kapjuk ebből, hogy Φ ' t c t Φ t c ' t A t Φ t c t g t
átrendezve adódik, hogy
Φ ' t A t Φ t c t Φ t c ' t g t Itt a bal oldal első tagja azonosan zérus, hiszen Φ t a homogén rendszer alapmátrixa, tehát azonosan teljesül, hogy Φ ' t A t Φ t . A kapott összefüggés az ismeretlen c(t)-re egy egyszerű szerkezetű differenciálegyenlet Φ t c ' t g t
amelyből az ismeretlen függvény két lépésben határozható meg. Elsőként szorozzuk az egyenlet mindkét oldalát balról az alapmátrix inverzével
Φ1 t Φ t c ' t Φ1 t g t ; azaz c ' t Φ1 t g t Innen a keresett függvény már egy integrálással a kezünkben van. Csak abban kell megállapodnunk, hogy egy mátrixfüggvényt úgy integrálunk, hogy minden komponensét különkülön integráljuk. A megoldás tehát
c t Φ1 t g t dt Megkaptuk tehát a c(t) függvényt. Ezzel az inhomogén egyenlet egy partikuláris megoldása a következő módon írható fel
xip t Φ t Φ1 t g t dt Az állítást ezzel igazoltuk. ■ Összefoglalva az eddigieket, megállapíthatjuk, hogy az inhomogén rendszer általános megoldása a következő alakban írható
xiá t Φ t c Φ t Φ1 t g t dt ahol c R n egy tetszőleges konstans vektor.
297
Óbudai Egyetem BGK
Fejezetek a matematikából
A témakör lezárásaképpen felírjuk az inhomogén lineáris rendszerre vonatkozó kezdeti érték probléma megoldását. Ehhez felhasználjuk a homogén rendszerre vonatkozó eredményt. 2.3.15.Tétel: Legyen Φ t az x ' t A t x t homogén lineáris rendszer alapmátrixa, legyen továbbá t0 I és x0 R n tetszőleges. Ekkor az x ' t A t x t g t inhomogén lineáris rendszer x t0 x0 kezdeti feltételt kielégítő partikuláris megoldása a következő t
x t Φ t Φ1 t0 x0 Φ t Φ1 g d t0
Bizonyítás: Ez a megoldás pontosan olyan alakú, mint az általános megoldás, abban különbözik, hogy a konstans vektort c Φ1 t0 x0 alakban vettük fel, a primitív függvényt pedig a t0 ponthoz tartozó integrálfüggvénnyel helyettesítettük. Ez utóbbiról az analízisből tudjuk, hogy ugyancsak primitív függvény. A felírt függvény tehát valóban megoldása az inhomogén rendszernek. Már csak azt kell megmutatni, hogy kielégíti a kezdeti feltételt. Ez helyettesítéssel ellenőrizhető
x t0 Φ t 0 Φ
1
t0
t0 x0 Φ t0 Φ1 g d Ex0 0 x0 t0
Ezt kellett igazolni. ■ A tétel tehát ad egy „megoldóképletet” a problémára. Ha azonban nem szeretnénk adott ponthoz tartozó integrálfüggvényt számolni akkor megoldhatjuk a kezdeti érték problémát úgy is, hogy a
x t0 Φ t0 c Φ t0 Φ1 t g t dt x0 egyenletrendszerben szereplő c R n ismeretlen konstans vektor komponenseit a kapott algebrai lineáris egyenletrendszerből kiszámítjuk. Az alábbiakban mutatunk példát mindkét módszer alkalmazására. Ezen viszonylag hosszú és kimerítő elméleti bevezető után rátérhetünk az elmélet alkalmazására. Mint már említettük alapvető kérdés a homogén lineáris rendszer Φ t alapmátrixának előállítása. Ennek birtokában tudjuk meghatározni mind a homogén, mind az inhomogén rendszer általános megoldását valamint mindkét rendszer esetében a kezdeti érték probléma megoldását. Azonban az általános esetben nem létezik konstruktív módszer az alapmátrix előállítására, csak akkor, ha a rendszer együtthatói állandók. Ennek a problémának a vizsgálatára térünk rá a következő pontban. A megoldások szerkezetével kapcsolatosan új tételeket megfogalmaznunk nem szükséges, hiszen minden tételt megfogalmaztunk és igazoltunk, amire szükség van, ezeket természetesen alkalmazhatjuk a speciális esetben is. Egyetlen feladatunk marad, az alaprendszer előállítása. 298
Óbudai Egyetem BGK
Fejezetek a matematikából
2.3.5. Elsőrendű állandó együtthatójú homogén lineáris differenciálegyenlet rendszer Alkalmazzuk a 2.3.2. és 2.3.3. pontokban leírtakat arra az esetre, amikor az A(t) együttható mátrix komponensei állandók. 2.3.11.Definíció: Legyenek, az aijR (i, j = 1, 2, …, n) együtthatók valós számok. Ekkor az alábbi n db egyenletből álló, n db ismeretlen függvényt tartalmazó
x '1 a11 x1 a12 x2 ... a1n xn x '2 a21 x1 a22 x2 ... a2 n xn ... x 'n an1 x1 an 2 x2 ... ann xn egyenletrendszert, normál alakú állandó együtthatójú homogén lineáris differenciálegyenletrendszernek nevezzük. Vezessünk be a szokásos egyszerűsítő jelöléseket. Legyen x1 t a11 a12 ... a1n a a22 ... a2 n x2 t 21 n A R ; x t ; ... ... ... xn t an1 an 2 ... ann
Az ARn×nkonstans mátrixot együtthatómátrixnak nevezzük, az x(t) vektor-skalár függvény szokás szerint az ismeretlen függvények vektora. Ezekkel a mátrixjelölésekkel az egyenletrendszer nagyon egyszerűen felírható: x ' t Ax t
Fogalmazzuk meg erre a rendszerre vonatkozólag a kezdeti érték problémát is. Az x ' t Ax t rendszerhez kapcsolunk egy kezdeti feltételt. Előírjuk, hogy az x(t) vektor-skalár függvény az I = R intervallum (ld. az egzisztencia és unicitási tétel adott esetre vonatkozó alkalmazását a következő bekezdésben) valamely t0 pontjában áthaladjon az Rn tér egy x0 pontján. Azaz kezdeti feltételként az x(t0) = x0 egyenlőség teljesülését írjuk elő. Ezzel a kezdeti érték probléma a következő módon van értelmezve
x ' t Ax t x t0 x0
299
Óbudai Egyetem BGK
Fejezetek a matematikából
Az egzisztencia és unicitási tétel szerint, mivel a konstans függvények az egész számegyenesen folytonosak, a fenti kezdeti érték problémának tetszőleges kezdeti feltételek esetén egyértelműen létezik megoldása a teljes számegyenesen. A 2.3.3. pont szerint egyetlen feladatunk az x ' t Ax t homogén lineáris rendszer egy alaprendszerének előállítása. Ebben a problémakörben felhasználjuk a lineáris algebrában (1. fejezet) tárgyalt sajátértékek és sajátvektorok elméletét. A sajátértéke multiplicitása és valós illetve komplex volta szerint különböző eseteket vizsgálunk. 1. eset: Az ARn×n együttható mátrixnak n db páronként különböző, tehát n db egyszeres multiplicitású valós sajátértéke van. Emlékeztetőül felidézzük, mit jelent az, hogy egy polinomnak csupa egyszeres multiplicitású valós gyöke van. Ez a k(λ) karakterisztikus polinom esetében azt jelenti, hogy a polinom felírható n db különböző (elsőfokú) gyöktényező szorzataként. Tehát a karakterisztikus polinom szorzat alakja k 1 1 2 ... n ; n
i R; i j ha i j
Ebben az esetben az alábbi tétel alapján könnyen megadható egy alaprendszer. 2.3.16.Tétel: Tegyük fel, hogy az ARn×negyütthatómátrixnak n db páronként különböző valós sajátértéke van, legyenek ezek: λ1, λ2, …λn. És legyenek s1, s2, …sn rendre ezen sajátértékekhez tartozó sajátvektorok. Tekintsük ezután az
xi t eit si ; i 1, 2,..., n függvényeket. Ekkor tetszőleges C1, C2, …CnR állandókkal az n
n
i 1
i 1
x t Ci xi t Ci eit si
vektorfüggvény a homogén differenciálegyenlet-rendszer megoldása és minden megoldás előáll ilyen alakban. Úgy is fogalmazhatunk, hogy az xi t eit si ; i 1, 2,..., n függvények a homogén lineáris differenciálegyenlet-rendszer egy alaprendszerét képezik. Az alapmátrix tehát az a mátrix, melynek i-edik oszlopvektora az xi t eit si függvény. Φ t e1t s1, e2t s2 ,..., ent sn
Bizonyítás: Két dolgot kell igazolnunk. Egyrészt azt, hogy az xi t eit si függvények a homogén lineáris rendszer megoldásai, másrészt azt, hogy ez az n db függvény lineárisan független rendszert alkot. 300
Óbudai Egyetem BGK
Fejezetek a matematikából
Legyen λ az A mátrix sajátértéke és s a hozzá tartozó sajátvektor, ekkor definíció szerint teljesül, hogy As = λs. Ha ezek után x t et s , akkor kapjuk, hogy
x ' t et s et s et s et As A et s Ax Az x t et s függvény tehát valóban megoldása a homogén lineáris rendszernek, ha λ egy tetszőleges sajátérték és s a hozzá tartozó sajátvektor. Már csak azt kell megmutatnunk, hogy az xi t eit si ; i 1, 2,..., n függvények lineárisan függetlenek. Itt egy a lineáris algebrában igazolt tételre tudunk hivatkozni. Az 1. fejezetben megmutattuk, hogy különböző sajátértékekhez tartozó sajátvektorok lineárisan függetlenek. Mivel feltevéseink szerint az A mátrixnak n db páronként különböző sajátértéke van, ez azt jelenti, hogy az s1, s2, …, sn vektorok lineárisan függetlenek. Mivel az eit ; i 1, 2,..., n értékek nullától különböző valós vagy komplex szorzótényezők, a sajátvektorokat ezekkel szorozva ugyancsak lineárisan független rendszert kapunk. Igazoltuk tehát, hogy az xi t eit si ; i 1, 2,..., n függvényrendszer az x ' t Ax t homogén lineáris rendszer egy alaprendszere. ■ 2.3.7.Példa: Oldjuk meg az alábbi homogén lineáris differenciálegyenlet rendszert.
x ' 5x y y ' 3x 3 y
5 1 Elsőként határozzuk meg az A együtthatómátrix sajátértékeit és sajátvektorait. Felírjuk 3 3 az A mátrix karakterisztikus egyenletét k det A E
5
1
3
3
2 8 12 0
Ennek az egyenletnek a megoldásai, tehát a sajátértékek λ1 = 2, λ2 = 6. A sajátvektorokat megkapjuk, ha megoldjuk az alábbi homogén lineáris rendszereket
1 s1 0 3 1 s1 0 5 2 1 2 : ; ; tehát 3s1 s2 0; 3 2 s2 0 3 1 s2 0 3 1 s1 0 1 1 s1 0 5 6 2 6 : ; ; tehát s1 s2 0; 3 6 s2 0 3 3 s2 0 3 Eszerint a sajátvektorok rendre például a következők
301
Óbudai Egyetem BGK
Fejezetek a matematikából 1 1 s1 ; s 2 ; 3 1
Az alapmátrix eszerint a következő
e 2t Φ t 2t 3e
e 6t e6t
Ezek alapján az általános megoldás az alábbi vektor-skalár függvény.
C1 x(t ) 2t 1 6t 1 y (t ) t C C1 e 3 C2 e 1 2 ahol C1 és C2 tetszőleges valós állandók. A megoldást koordinátánként írva az általános megoldás alakja
x(t ) C1e2t C2e6t y (t ) 3C1e2t C2e6t 2.3.8.Példa: Oldjuk meg az alábbi homogén lineáris differenciálegyenlet rendszerre vonatkozó kezdeti érték problémát.
x 0 1 x ' 5x y ; x 0 y ' 3x 3 y y 0 2 1. megoldás: A rendszer alapmátrixát már meghatároztuk az előző példában. A partikuláris megoldás előállításához alkalmazzuk a
x t Φ t Φ1 t0 x0 formulát. Ehhez tehát szükség van a Φ t mátrix inverzére a t0 helyen. Elsőként kiszámítjuk az alapmátrix helyettesítési értékét a t0 = 0 pontban.
e0 Φ t0 Φ 0 0 3e Ennek inverze
302
e0 1 1 e0 3 1
Óbudai Egyetem BGK
Fejezetek a matematikából Φ1 t0 Φ1 0
1 1 1 4 3 1
Ahonnan a kezdeti feltételt kielégítő partikuláris megoldás a következő
e 2t x t Φ t Φ t0 x 0 2t 3e 1
e6t 1 1 1 1 1 e2t e6t 4 3 1 2 4 3e2t
e6t 1 e6t 5
Koordinátánként írva
1 5 3 5 x(t ) e2t e6t ; y(t ) e2t e6t ; 4 4 4 4 2. megoldás: Az ismeretlen C1 és C2 konstansokat egy lineáris egyenletrendszerből is meghatározhatjuk. Az előírt kezdeti feltétel szerint teljesül, hogy
x(0) C1e0 C2e0 C1 C2 1 0 0 y (0) 3C1e C2e 3C1 C2 2 Ennek a rendszernek a megoldását megkapjuk, ha például az első egyenletből kivonjuk a 1 második egyenletet. Ebből 4C1 1; C1 adódik. Ezt helyettesítve az első egyenletbe, 4 5 azonnal kapjuk a C2 megoldást. Ez a két konstans természetesen pontosan megegyezik az 4 első megoldás során kapott állandókkal. 2.3.9.Példa: Határozzuk meg az alábbi homogén lineáris rendszerre vonatkozó kezdeti érték probléma megoldását. x1 0 4 x1 ' 3x1 4 x2 2 x3 x3 ; x 0 x2 0 2 x2 ' x1 x ' 6 x 6 x 5x x3 0 3 1 2 3 3
Elsőként meg kell határoznunk az együtthatómátrix sajátértékeit és sajátvektorait. Ehhez felírjuk a karakterisztikus egyenletet 3 4 k det A E 1 6
2 1 3 2 2 2 0
6 5
303
Óbudai Egyetem BGK
Fejezetek a matematikából
Keressük ennek a harmadfokú egyenletnek a megoldását. Ezt most kétféle módon tehetjük. Egyrészt próbálgatással kapjuk, hogy λ = 1 megoldás, tehát a polinomot eloszthatjuk a λ – 1 gyöktényezővel. (A próbálgatással kapcsolatban megjegyezzük, hogy egész megoldás csak a konstans tag osztói közül kerülhet ki.) Így kapunk egy másodfokú egyenletet. A megoldások, tehát a sajátértékek a következők: λ1 = 1, λ2 = 2, λ3 = –1. Egy másik módszer ebben az esetben az, hogy észrevesszük, az első két tagból kiemelhető – λ2 , így a karakterisztikus polinom szorzattá alakítható: 3 22 2 2 2 2 1 2 2 . Ebből a felsorolt
gyökök azonnal adódnak. Ezek után kiszámítjuk a sajátvektorokat. A megoldandó homogén lineáris rendszerek a következők 2 s1 0 3 1 4 1 1: 1 1 1 s2 0 ; 6 6 5 1 s3 0
4 4 2 s1 0 1 1 1 s 0 ; 2 6 6 4 s3 0
Itt a harmadik egyenlet az első két egyenlet következménye, az első egyenlet ellentettjének és a második egyenlet kétszeresének az összege, így elhagyható. Az első két egyenletből álló rendszer szabadságfoka 1, legyen ezért például s3 = u, u ≠ 0. Helyettesítéssel kapjuk, hogy
4s1 4s2 2u 4s1 4s2 2u ; ; ahonnan u 0; tehát s1 s2 ; s1 s2 u 4s1 4s2 4u A λ1 = 1 sajátértékhez tartozó sajátvektor eszerint t 1 s1 t ; t 0; például s1 1 ; 0 0
hasonlóan kapjuk a többi sajátvektort is. A számításokat nem részletezzük, csak az eredményeket közöljük. 0 0 t 1 2 2 : s 2 t ; t 0; például s 2 1 ; 3 1: s3 0 ; t 0; például s3 0 ; 2t 2 t 1
Ezen eredmények alapján az alaprendszer a következő 1 0 1 2t t x1 t e 1 ; x2 t e 1 ; x3 t e 0 ; 0 2 1 t
ahonnan azonnal kapjuk az alapmátrixot 304
Óbudai Egyetem BGK
Fejezetek a matematikából et Φ t et 0
0 e 2t 2e2t
e t 0 et
Az alaprendszer illetve mátrix birtokában az általános megoldás már felírható t x1 t C1 e C e t x t Φ t 2 2 x3 t C3 0
0 e 2t 2e2t
et C1 C1et C3et 0 C2 C1et C2e 2t ; C1 , C2 , C3 R et C3 2C2e2t C3et
Már csak a kezdeti feltételeket kell kielégítenünk alkalmas konstansokkal. 1. megoldás: Ehhez elsőként alkalmazzuk az x t Φ t Φ1 t0 x0 formulát. Kiszámítjuk az alapmátrixot a t0 = 0 helyen e0 Φ t0 Φ 0 e 0 0 a kapott mátrixot invertáljuk
0 e0 2e0
e0 1 0 1 0 1 1 0 e0 0 2 1
1 2 1 Φ t0 Φ 0 1 1 1 ; 2 2 1 1
1
Ennek birtokában pedig kapjuk a kezdeti feltételt kielégítő partikuláris megoldást et x t Φ t Φ1 t0 x0 et 0
0 e 2t 2e2t
et 1 2 1 4 et 0 1 1 1 2 et et 2 2 1 3 0
Azaz koordinátánként írva a partikuláris megoldás a következő t t x1 t 11e 15e t 2t x t 11 e 9 e 2 x3 t 18e2t 15et
305
0 e 2t 2e2t
et 11 0 9 et 15
Óbudai Egyetem BGK
Fejezetek a matematikából
2. megoldás: Az ismeretlen egyenletrendszer megoldásával is.
konstansokat
kiszámíthatjuk
közvetlenül
egy
lineáris
C1e0 C3e0 C C 4 3 1 0 0 C e C e C C 1 1 2 2 2 0 0 2C2e C3e 2C2 C3 3
ennek megoldása pedig könnyen ellenőrizhetően valóban a C1 = –11, C2 = 9, C3 = –15 számhármas. Ugyanazt kaptuk tehát mint az 1. megoldás során. 2. eset: Az ARn×n együttható mátrixnak van egyszeres komplex sajátértéke A karakterisztikus polinom szorzat alakja ebben az esetben formálisan ugyanaz, mint az első esetben, tehát k 1 1 2 ... n ; n
i j ha i j; és létezik p és q
hogy p q
a különbség csak annyi, hogy a gyökök között előfordulnak komplex értékek is. Mivel valós problémákat vizsgálunk, valós együtthatójú a karakterisztikus polinom. Ebben az esetben pedig a komplex gyökök csakis párosával léphetnek fel, minden komplex gyök mellett annak konjugáltja is gyöke a polinomnak. Tegyük fel tehát hogy a karakterisztikus egyenlet egyik komplex gyöke, tehát az egyik komplex sajátérték i , ahol i az imaginárius egység. Az ehhez tartozó komplex sajátvektor az
s u iv Cn vektor, ahol az u R n valós vektor tartalmazza a vektor valós komponenseit, a v R n valós vektor pedig a képzetes komponenseket. A gyökökről mondottak szerint ekkor sajátérték az előbbi sajátérték komplex konjugáltja is i . A lineáris algebrából tudjuk, hogy az ehhez tartozó sajátvektor a λ komplex sajátvektorhoz tartozó s vektor komplex konjugáltja s u iv Cn . A feladat ebben az esetben is egy alaprendszer, tehát n db lineárisan független megoldás előállítása. Abban a tételben, melyben igazoltuk, hogy az x t et s függvény megoldása az x ' t Ax t homogén lineáris rendszernek, nem használtuk ki, hogy a sajátérték vagy a
sajátvektor valós, a tétel tehát igaz komplex esetben is. Ebből adódik, hogy az x t et s e
i t
u iv
komplex értékű függvény megoldása a homogén rendszernek. Az Euler-formula alkalmazásával fejtsük ki ezt a szorzatot a következő módon
306
Óbudai Egyetem BGK
Fejezetek a matematikából
x t e
i t
u iv et cos t i sin t u iv et u cos t v sin t i v cos t u sin t
Ez a komplex értékű függvény tehát megoldása a homogén lineáris rendszernek. Ekkor azonban külön a valós rész és külön a képzetes rész is megoldása a homogén rendszernek, hiszen ha x t x1 t ix2 t komplex értékű megoldás, akkor írhatjuk, hogy Ax t A x1 t ix2 t Ax1 t iAx2 t x ' t x '1 t ix '2 t ; t R
ahonnan szükségképpen következik a valós és képzetes részek egyenlősége, tehát Ax1 t x '1 t ; Ax2 t x '2 t ami éppen az állításunk igazolását jelenti. Ebből következik, hogy egyszeres multiplicitású konjugált komplex sajátértékek esetén két megoldást kapunk, a komplex megoldás valós és képzetes részét
x1 t et cos tu sin tv ; x2 t et cos tv sin tu ; Ahhoz hogy ez a két függvény része lehessen egy alaprendszernek, már csak azt kell megmutatnunk, hogy lineárisan függetlenek. Ehhez egyrészt felidézzük azt a lineáris algebrában igazolt tételt, mely szerint ha s u iv Cn komplex sajátvektor, akkor az u és v valós vektorok lineárisan függetlenek. A komplex értékű megoldás valós és képzetes része rendre kielégíti az x1 0 u; x2 0 v; kezdeti feltételeket. A 2.3.8. tétel valamint u és v lineáris függetlensége már garantálja, hogy az x1(t), x2(t) valós és képzetes rész lineárisan függetlenek. Igazoltuk tehát az alábbi tételt. 2.3.17.Tétel: Tegyük fel hogy a valós együtthatójú karakterisztikus egyenlet egyik komplex sajátértéke i , a hozzá tartozó komplex sajátvektor pedig a s u iv Cn komplex vektor. Ekkor a valós együtthatójú x ' t Ax t homogén lineáris rendszer két lineárisan független megoldása a következő
x1 t et cos tu sin tv ; x2 t et cos tv sin tu ; 2.3.10.Példa: Határozzuk meg az x1 0 1 x1 ' x1 x2 x3 x2 ' x1 x2 ; x 0 x2 0 2 x ' 3x x x3 0 0 1 3 3
307
Óbudai Egyetem BGK
Fejezetek a matematikából
kezdeti érték probléma megoldását. Kiszámítjuk a sajátértékeket és a sajátvektorokat. A karakterisztikus egyenlet 1 1 k det A E 1 1 3
0
1 0 1 2 2 5 0 1
A sajátértékek innen a következők: λ1 = 1; λ2,3 = 1 ± 2i. A karakterisztikus egyenletnek tehát van két konjugált komplex, egyszeres sajátértéke. Határozzuk most meg a sajátvektorokat. Kezdjük az egyszerűbb valós esettel. A megoldandó lineáris rendszer a következő: 0 1 1 s1 0 1 1: 1 0 0 s2 0 ; ahonnan s1 0; s2 s3 0; 3 0 0 s3 0
Innen a λ1 = 1 sajátértékhez tartozó sajátvektor a következő 0 0 s1 t ; t 0; például s1 1 ; t 1
Térjünk rá a komplex sajátérték esetére. Világos, hogy elég az egyik esetben kiszámítani a sajátvektort, a másik esetben ennek a komplex konjugáltja az eredmény. A megoldandó rendszer a következő 2i 1 1 s1 0 2 1 2i : 1 2i 0 s2 0 ; 3 0 2i s3 0
Ha itt az első egyenletet megszorozzuk 2i-vel, akkor világos, hogy a kapott egyenlet a második és harmadik egyenlet összege. Ezért az első egyenletet elhagyhatjuk a rendszerből. A maradék rendszer a következő
s1 2is2 3s1 2is3 A rendszer egy szabadságfokú. Legyen például s1 = 2it. Ekkor nyilvánvalóan s2 = t, s3 = 3t. A sajátvektorok tehát a következők
308
Óbudai Egyetem BGK
Fejezetek a matematikából
2it 2i 2it 2i 2 1 2i : s2 t ; t 0; pl. s2 1 ; 3 1 2i : s3 s2 t ; t 0; pl. s3 1 ; 3t 3 3t 3
Alkalmazva a korábban bevezetett u és v jelet a sajátvektorok valós és képzetes részére, azt kapjuk, hogy a sajátvektorok a következőképpen írhatók
2,3 1 2i : s2,3
2it 0 2t 0 2 t u iv t i 0 ; t 0; pl. s 2 u iv 1 i 0 ; 3t 3t 0 3 0
Ezen eredmények birtokában már felírhatjuk az általános megoldást. Az alaprendszer a következő három függvényből áll
0 0 2 t t x1 t e 1 ; x 2 t e cos tu sin tv e cos 2t 1 sin 2t 0 ; 1 3 0 t
2 0 x3 t e cos tv sin tu e cos 2t 0 sin 2t 1 ; 0 3 t
t
Ahonnan az általános megoldás már felírható. 0 0 2 2 0 t t x t C1e 1 C2e cos 2t 1 sin 2t 0 C3e cos 2t 0 sin 2t 1 ; 1 3 0 0 3 t
Koordinátánként írva a szokásos alakban kapjuk az általános megoldást. x1 t et 2C2 sin 2t 2C3 cos 2t ; x2 t et C1 C2 cos 2t C3 sin 2t ; x3 t et C1 3C2 cos 2t 3C3 sin 2t ;
Befejezésképpen határozzuk meg a kezdeti feltételt kielégítő partikuláris megoldást. Most egyszerűbbnek tűnik a lineáris egyenletrendszer megoldása. A t0 = 0 helyettesítésével kapjuk, hogy
309
Óbudai Egyetem BGK
Fejezetek a matematikából x1 0 2C3 1 x 0 x2 0 C1 C2 2 ; x3 0 C1 3C2 0
3 1 1 aminek megoldása C1 ; C2 ; C3 . Innen a partikuláris megoldás a következő 2 2 2 1 3 1 x1 t et sin 2t cos 2t ; x2 t et cos 2t sin 2t ; 2 2 2 3 3 3 x3 t et cos 2t sin 2t ; 2 2 2 Ezzel a kitűzött Cauchy-feladatot megoldottuk. A továbbiakban rátérünk azon esetek vizsgálatára, amikor a karakterisztikus egyenletnek többszörös gyökei is vannak. 3. eset: Az ARn×n együttható mátrixnak van többszörös valós gyöke, és a többszörös valós gyök algebrai multiplicitása megegyezik a geometriai multiplicitással Tegyük fel, hogy a λi sajátérték a k(λ) karakterisztikus polinomnak pi-szeres gyöke. Ez a lineáris algebrában bevezetett szóhasználattal azt jelenti, hogy a λi sajátérték algebrai multiplicitása pi. Ebben a 3. esetben feltesszük, hogy ennek a sajátértéknek a geometriai multiplicitása ugyancsak pi, ami azt jelenti, hogy ehhez a λi sajátértékhez tartozik pi db lineárisan független sajátvektor, tehát a sajátaltér dimenziója pi. A karakterisztikus polinom szorzat alakja ebben az esetben a következő kn i i Qn pi ; p
ahol a karakterisztikus polinom kn(λ) jelölésében az n index arra utal, hogy egy n-ed fokú polinomról van szó. A szorzat alak második tényezőjével kapcsolatban a Qn–pi(λ) jelölés csak arra utal, hogy egy n – pi-ed fokú polinomról van szó. Ez utóbbit ugyancsak szorzattá kell bontanunk, amelyben lehetnek egyszeres és többszörös gyökök. Mi a továbbiakban egy adott ilyen többszörös gyök vizsgálatával foglalkozunk. Ha tehát a λi sajátérték algebrai és geometriai multiplicitása ugyancsak pi akkor a geometriai multiplicitás definíciója szerint létezik pi db lineárisan független sajátvektor, jelölje ezeket p 1 2 si , si ,..., si i , melyekre teljesül, hogy
p p 1 1 2 2 Asi isi , Asi isi ,..., Asi i isi i ;
hiszen mindannyian a λi sajátértékhez tartozó sajátvektorok. Ebben az esetben a λi sajátértékhez tartozó lineárisan független megoldások a következők
310
Óbudai Egyetem BGK
Fejezetek a matematikából
p p 1 1 2 2 xi t eit si , xi t eit si ,..., xi i t eit si i ;
Tegyük most fel, hogy van m db különböző sajátérték, amelyek algebrai multiplicitása rendre p1, p2, …, pm. Nyilván teljesül, hogy p1 + p2 + … + pm = n. Az előzőekben mutatott gondolatmenetet elismételve minden sajátértékre pontosan n db lineárisan független sajátvektort tudunk előállítani, hiszen különböző sajátértékekhez tartozó sajátvektorok többszörös multiplicitás esetén is lineárisan függetlenek, így kapunk n db lineárisan független megoldást, tehát egy alaprendszert. A mondottakat egy példán illusztráljuk. 2.3.11.Példa: Határozzuk meg az x1 ' 4 x1 x2 x3 x2 ' x1 2 x2 x3 ; x ' x x 2x 1 2 3 3
rendszer általános megoldását. Elsőként írjuk fel a karakterisztikus egyenletet. Ez a következő 4 1 k det A E 1 2 1
1
1 2 1 2 3 0 2
Ebből már látható, hogy λ1 = 2 egyszeres algebrai multiplicitású, λ2 = 3 kétszeres algebrai multiplicitású gyök. Keressük meg a sajátvektorokat. 1 s1 0 4 2 1 1 2 : 1 2 2 1 s2 0 ; 1 1 2 2 s3 0
2 1 1 s1 0 1 0 1 s 0 ; 2 1 1 0 s3 0
Erről látható, hogy a 2. és a 3. egyenlet összege az 1. egyenlet, így az 1. egyenlet elhagyható. kapjuk, hogy a megoldandó rendszer a következő
s1 s3 0 s1 s3 ; ; tehát s1 s2 s3 ; s1 s2 0 s1 s2 A λ1 = 2 sajátértékhez tartozó sajátvektor eszerint t 1 s1 t ; t 0; például s1 1 ; t 1
311
Óbudai Egyetem BGK
Fejezetek a matematikából
Folytassuk a számításokat a kétszeres algebrai multiplicitású λ2 = 3 sajátértékkel. Ebben az esetben elő kell állítanunk két lineárisan független sajátvektort. A megoldandó rendszer a következő 1 s1 0 4 3 1 1 3: 1 2 3 1 s2 0 ; 1 1 2 3 s3 0
1 1 1 s1 0 1 1 1 s 0 ; 2 1 1 1 s3 0
Azt látjuk, hogy a rendszer három egyenlete megegyezik. Ez azt jelenti, hogy egy egyenletet kaptunk a három ismeretlenre. Másképpen fogalmazva az együttható mátrix rangja ρ = 1, mert 1 db lineárisan független sorvektora van, az ismeretlenek száma viszont k = 3. Ez azt jelenti, hogy a rendszer szabadságfoka k – ρ = 2, tehát 2 ismeretlen szabadon választható. A megoldandó egyenlet
s1 s2 s3 0; A szabad változók legyenek például s2 és s3. Ezeket úgy kell megválasztani, hogy két lineárisan független megoldást kapjuk. Legyen ezért egyrészt s2 = 1 és s3 = 0, amikor s1 = 1 másrészt pedig, s2 = 0 és s3 = 1, amikor ugyancsak s1 = 1. Innen a λ2 = 3 sajátértékhez tartozó sajátvektorok a következők 1
s2
1 1 2 1 ; valamint s 2 0 ; 0 1
Mivel ezek a vektorok nem párhuzamosak, egyik nem konstans szorosa a másiknak, ezért lineárisan függetlenek. Ezzel megkaptuk a rendszer általános megoldását. Általános jelölésekkel ez a következő x t C1e1t s1 C2e2t s2 C3e2t s2 ; C1, C2 , C3 R 1
2
konkrétan pedig az alábbi vektor-skalár függvény 1 1 1 3t 3t x t C1e 1 C2e 1 C3e 0 ; C1 , C2 , C3 R; 1 0 1 2t
312
Óbudai Egyetem BGK
Fejezetek a matematikából
4. eset: Az ARn×n együttható mátrixnak van többszörös valós gyöke, és a többszörös valós gyök algebrai multiplicitása nagyobb, mint a geometriai multiplicitás Tegyük fel, hogy a λi sajátérték algebrai multiplicitása pi. A karakterisztikus polinom szorzat alakja így ugyanaz, mint a 3. esetben, tehát kn i i Qn pi ; p
A különbség a 3. esethez képest annyi, hogy ha a λi sajátérték a k(λ) karakterisztikus polinomnak pi-szeres gyöke akkor ehhez a λi sajátértékhez nem tartozik pi db lineárisan független sajátvektor, hanem a független sajátvektorok száma kevesebb, mint pi, tehát a sajátaltér dimenziója kisebb, mint pi. A megoldandó feladat ebben az esetben lényegében ugyanaz, mint a 3. pontban. A λi sajátértékhez elő kell állítani pi db lineárisan független vektort, amelyből a p1 + p2 + … + pm = n feltétel figyelembe vételével megszületik egy alaprendszer. Mielőtt általánosan megfogalmaznánk egy tételt erre az esetre, egy példán keresztül mutatjuk be milyen problémák merülnek fel, és azokat hogyan lehet megoldani. 2.3.12.Példa: Határozzuk meg az x1 ' x1 x2 2 x3 x2 ' 4 x1 x2 ; x ' 2x x x 1 2 3 3
homogén lineáris differenciálegyenlet rendszer általános megoldását. A rendszer karakterisztikus egyenlete a következő 1 1 k det A E 4 1 2
1
2 0
1 1 0 2
1
Ahonnan adódik, hogy λ1 = 1 egyszeres algebrai multiplicitású, λ2 = –1 kétszeres algebrai multiplicitású gyök. Ezután meghatározzuk a sajátvektorokat. λ1 = 1 esetén a megoldandó egyenletrendszer a következő 2 s1 0 1 1 1 1 1: 4 11 0 s2 0 ; 1 1 1 s3 0 2
2 1 2 s1 0 4 0 0 s 0 ; 2 2 1 2 s3 0
A 2. egyenletből azonnal következik, hogy s1 = 0. A megmaradó két egyenlet egybeesik
s2 2s3 0;azaz s2 2s3 ;
313
Óbudai Egyetem BGK
Fejezetek a matematikából
Innen kapjuk a λ1 = 1 sajátértékhez tartozó sajátvektort 0 0 s1 2t ; t 0; például s1 2 ; t 1
Térjünk át a kétszeres algebrai multiplicitású λ2 = –1 sajátérték esetére. Elő kell állítanunk két független megoldást. Ehhez először megoldjuk azt a lineáris egyenletrendszert, amely a sajátvektort adja meg 2 s1 0 1 1 1 1 1: 4 11 0 s2 0 ; 2 1 1 1 s3 0
0 1 2 s1 0 4 2 0 s 0 ; 2 2 1 0 s3 0
Világos, hogy a 2. egyenlet a 3. egyenlet kétszerese, tehát a rendszerből a 2. egyenlet elhagyható, azonban az 1. és 3. sora az együtthatómátrixnak lineárisan független, hiszen a 3. sor nem többszöröse az 1. sornak. Ez azt jelenti, hogy az együtthatómátrix rangja ρ = 2, az ismeretlenek száma k = 3, ami azt jelenti, hogy a szabadságfok k– ρ = 1. Tehát csak egy ismeretlen választható szabadon, a λ2 = –1 sajátértékhez tartozó sajátaltér csak 1 dimenziós. Ennek fényében megoldjuk a megmaradt egyenletrendszert.
s2 2s3 0 s2 2s3 ; ; tehát s1 s3 , s2 2s1; 2s1 s2 0 s2 2s1 A λ2 = –1 sajátértékhez tartozó egyetlen sajátvektor eszerint t 1 s 2 2t ; t 0; például s 2 2 ; t 1
A 3. esetben tapasztaltaktól ellentétben azonban most nem tudunk előállítani egy s2 vektortól lineárisan független sajátvektort. Azonban szükség van még egy lineárisan független megoldásra, hiszen egyelőre csak két lineárisan független megoldást, az 0 1 2t t x1 t e s1 e 2 ; x2 t e s 2 e 2 ; 1 1 1t
t
függvényeket kaptuk, az alaprendszer pedig három lineárisan független megoldásból áll. A probléma megoldásához az ötletet a másodrendű lineáris differenciálegyenletek elméletéből vesszük. Ott láttuk, hogy ha λ a karakterisztikus egyenlet kétszeres való gyöke, akkor a hozzá 314
Óbudai Egyetem BGK
Fejezetek a matematikából
tartozó általános megoldás et C1t C2 alakú. Ebből kiindulva megpróbáljuk az egyenletet kielégíteni egy ehhez hasonló szerkezetű függvénnyel, amely a vizsgált probléma természetéből
adódóan némileg általánosabb. Ha alkalmazzuk az s2 s2 jelölést, utalva arra, hogy a λ2 = –1 sajátértékhez tartozó „első” megoldást adó sajátvektorról van szó, keressünk megoldást 1
x t te2t s2 e2t s2 1
2
2 2 alakban, ahol s2 egyelőre ismeretlen vektor. Kérdés, hogy létezik-e olyan s2 vektor, amelyre
a felírt függvény megoldása az x ' t Ax t homogén lineáris rendszernek. Helyettesítéssel kapjuk, hogy pontosan akkor megoldás, ha azonosan teljesül, hogy x ' t e2t s2 2te2t s2 2e2t s2 Ate2t s2 Ae2t s2 Ax t 1
1
2
1
2
Ez az egyenlőség pontosan akkor azonosság, ha a jobb és bal oldalon az e2t és te2t függvények együtthatói rendre megegyeznek. Rendezve az egyenletet ezen szempontok szerint kapjuk, hogy
e2t s2 2s2 te2t 2s2 e2t As2 te2t As2 ; 1
2
1
2
1
Az egyenlőség eszerint azonosság, ha teljesül az alábbi két egyenlőség
As1 s1 2 2 2 ; 2 2 1 As s s 2 2 2 2 1 Azt kaptuk tehát, hogy az s2 vektor az A mátrix λ2 = –1 sajátértékhez tartozó sajátvektora,
ahogyan azt eddig is tudtuk, az 2 As2
2 2s2
1 s2
s2 2
vektor azonban nem sajátvektor, hanem az
egyenlet által van meghatározva. Az ilyen vektort általánosított sajátvektornak nevezzük. A fogalmat a későbbiekben pontosan definiáljuk. Feladatunk tehát egy
As2 2s2 s2 egyenletnek eleget tevő s2 vektor előállítása, ahol s2 már ismert sajátvektor. A megoldandó egyenlet egyenértékű az 2
2
1
2
A 2E s22 s21 egyenlettel. A konkrét esetben ez az egyenletrendszer a következő 0 1 2 s1 1 4 2 0 s 2 ; 2 2 1 0 s3 1
315
1
Óbudai Egyetem BGK
Fejezetek a matematikából
Itt szintén igaz, hogy a 2. egyenlet a 3. egyenlet kétszerese, így a 2. egyenlet elhagyható a rendszerből. Az 1. és 3. egyenletből álló rendszer pedig a következő
s2 2s3 1 ; azaz 2s1 s2 1
1 s2 2s3 ; 1 s2 2s1
Ennek a rendszernek a szabadságfoka 1, például az s2 szabadon választható. Legyen s2 = 1. Ekkor s1 = 0 és s3 = 1. Tehát a rendszer egy megoldása 2
s2
0 1 ; 1
Azonnal látható, hogy a kapott s2 és az s2 vektorok lineárisan függetlenek, hiszen egyik a másiknak nem konstans szorosa. A korábbiak szerint tehát azt kapjuk, hogy az 2
x3 t
1 te2t s2
1
2t
2
e s2
1 0 t te 2 e 1 ; 1 1 t
függvény megoldása az x ' t Ax t rendszernek, amelyről egyébként egyszerű helyettesítéssel is könnyen meggyőződhetünk. Azt állítjuk tehát, hogy a megoldandó homogén lineáris rendszer egy alaprendszere a következő három függvényből álló rendszer 0 1 1 0 1 1 2 x1 t e1t s1 et 2 ; x2 t e2t s 2 et 2 ; x3 t te2t s 2 e2t s 2 te t 2 e t 1 ; 1 1 1 1
Azt már tudjuk, hogy ezek a függvények valóban megoldások, már csak ezek függetlenségét kell igazolnunk. A függetlenség abból a tételből következik, amely szerint egy függvényrendszer pontosan akkor lineárisan független, ha lineárisan független kezdeti feltételekhez tartoznak. Márpedig világos, hogy t = 0-ban 0 1 0 1 2 x1 0 s1 2 ; x2 0 s 2 2 ; x3 0 s 2 1 ; 1 1 1
lineárisan független rendszert kapunk, ezt már megvizsgáltuk, de erről meggyőz bennünket az is, ha kiszámítjuk a három vektorból képezett mátrix determinánsát
316
Óbudai Egyetem BGK
Fejezetek a matematikából 0 1 0 2 2 1 1 0; 1
1
1
amely nem zérus, tehát a három vektor független. Összefoglalva az eddigieket, a rendszer általános megoldása 0 1 1 0 x t C1et 2 C2et 2 C3 te t 2 e t 1 ; C1 , C2 , C3 R; 1 1 1 1
Vonatkoztassunk most el a konkrét példától és fogalmazzuk meg általánosan, amit a megoldáshoz tudnunk kell. 2.3.18.Tétel: Tegyük fel, hogy az x ' t Ax t homogén lineáris rendszer A mátrixának λ sajátértéke kétszeres gyök, tehát algebrai multiplicitása 2, azonban a geometriai multiplicitása 2 1 1 1 csak 1. Ekkor létezik az As s egyenletet kielégítő s sajátvektor mellett egy olyan s vektor, amely a sajátvektorral együtt lineárisan független rendszert alkot, és amely esetén az 1 1 2 1 2 x t et s ; és x t tet s et s
függvények lineárisan független megoldásai a homogén lineáris rendszernek. Bizonyítás: Az állítás igazolása a konkrét feladatbeli gondolatmenet általános megismétlése. Tudjuk az elméletből, hogy a rendszernek egy megoldása az x t et s ; 1
1
Tegyük fel, hogy az x ' t Ax t homogén lineáris rendszernek létezik 2 1 2 x t tet s et s
2 alakú megoldása. Kérdés, hogy milyen feltételeket elégít ki az s vektor. Ennek a kérdésnek a megválaszolásához behelyettesítünk az x ' t Ax t egyenletbe. 1 1 2 1 2 et s tet s et s Atet s Aet s ;
Rendezve az egyenletet et és tet függvények szerint, kapjuk, hogy
1 1 2 1 2 tet s et s s tet As et As ;
317
Óbudai Egyetem BGK
Fejezetek a matematikából
Ez az egyenlőség pontosan akkor azonosság, ha a két oldalon az et és tet függvények együtthatói rendre megegyeznek, azaz teljesül, hogy
As1 s1 ; 2 1 2 As s s Az első egyenlet pontosan azt jelenti, amit már eddig is tudtunk, hogy az s az A mátrix λ sajátértékhez tartozó sajátvektora. A második egyenlet azonban arra szolgál, hogy abból ismert 1
2 1 s sajátvektor esetén az s vektort meghatározzuk. A fenti két egyenlet ekvivalens az alábbi két egyenlettel
A E s1 0 ; 2 1 A E s s 2 Igazoltuk tehát, hogy létezik a kívánalmaknak megfelelő s vektor. Már csak azt kell igazolni,
hogy s és s lineárisan függetlenek. Mivel két vektor esetén a lineáris összefüggőség pontosan azt jelenti, hogy egyik vektor a másik konstans szorosa, ha lineárisan összefüggenének, 1
2
2 1 akkor s Cs lenne. De ekkor
A E s 2 A E Cs1 C A E s1 0 1 lenne, de A E s s 0 ugyanis s sajátvektor. Ez pedig ellentmondás, tehát a két vektor független. Ebből már adódik a tételbeli x(1)(t) és x(2)(t) lineáris függetlensége, hiszen a 1 1 2 2 t = 0 pontban x 0 s ; és x 0 s , tehát lineárisan független kezdeti feltételekhez 2
1
tartozó megoldások. Ezt kellett igazolni. ■ A tételbeli gondolatmenet alapján bevezetünk egy új fogalmat. 2 1 2.3.12.Definíció: Legyen s az A mátrix λ sajátértékhez tartozó sajátvektora. Ekkor azt az s vektort amely kielégíti az 2 2 1 As s s ;
vagy az ezzel egyenértékű
A E s 2 s1 egyenletrendszert, az A mátrix λ sajátértékhez tartozó általánosított sajátvektorának nevezzük. 318
Óbudai Egyetem BGK
Fejezetek a matematikából
Mint azt a fenti példában láttuk, amikor a sajátérték algebrai multiplicitása nagyobb, mint a geometriai multiplicitás, a megoldás előállításához szükség van az általánosított sajátvektorok előállítására is. Azonban még nem tisztáztunk minden lehetséges esetet. A kérdés az, hogy ha például az algebrai és geometriai multiplicitás közötti különbség nem csak 1, mint az előbbi példában, hanem legalább 2, akkor hogyan kapunk megoldást. Ezt vizsgáljuk az alábbiakban. Kövessük az előző logikát. Tűzzünk ki egy feladatot, és annak kapcsán tisztázzuk az elméletet. 2.3.13.Példa: Határozzuk meg az x1 ' 4 x1 x2 x2 ' 3x1 x2 x3 ; x ' x x 3 1 3
homogén lineáris differenciálegyenlet rendszer általános megoldását. A rendszer karakterisztikus egyenlete a következő 4 1 k det A E 3 1 1
0
0 3 1 2 0; 1
Kapjuk tehát egyrészt, hogy λ = 2 az egyetlen sajátérték, valamint olyan sajátérték, amelynek algebrai multiplicitása 3. Elő kell tehát állítanunk 3 db lineárisan független megoldást. Kezdjük a sajátvektorok meghatározásával. A megoldandó rendszer a következő. 0 s1 0 4 2 1 2: 3 1 2 1 s2 0 ; 1 0 1 2 s3 0
2 1 0 s1 0 3 1 1 s 0 ; 2 1 0 1 s3 0
Látható, hogy az 1. sor és a 3. sor összege a 2. sor. Tehát a rendszerből a 2. egyenlet elhagyható. A maradék sorvektorok azonban lineárisan függetlenek, tehát az együtthatómátrix rangja ρ = 2. Az ismeretlenek száma k = 3, tehát a szabadságfok k – ρ = 3 – 2 = 1. A redukált rendszer
2s1 s2 0 s 2s1 ; azaz 2 ; s1 s3 0 s3 s1 Mivel a szabadságfok 1, ezért a sajátaltér 1 dimenziós. A λ= 2 sajátértékhez tartozó egyetlen sajátvektor eszerint
s
1
t 1 1 2t ; t 0; például s 2 ; t 1
319
Óbudai Egyetem BGK
Fejezetek a matematikából
Ennek alapján egy megoldás az
x
1
t e
t 1
s
1 e2t 2 ; 1
Szükségünk van azonban még két lineárisan független megoldásra. Egy második megoldás előállítására alkalmazhatjuk a az előző tételbeli eredményt illetve gondolatmenetet. Keresünk egy 2 1 2 2 2 1 s általánosított sajátvektort. Ez kielégíti az As s s tehát az A E s s lineáris egyenletrendszert. A konkrét esetben ez a következő 0 s1 1 4 2 1 3 1 2 1 s2 2 ; 1 0 1 2 s3 1
2 1 0 s1 1 3 1 1 s 2 ; 2 1 0 1 s3 1
A korábbi számításokhoz hasonlóan a 2. egyenlet ismét elhagyható a rendszerből, ezért a redukált rendszer az alábbi
2s1 s2 1 s 2s1 1 ; azaz 2 ; s1 s3 1 s3 s1 1 Mivel a rang 2, az ismeretlenek száma 3, a szabadságfok ismét 1. Célszerűen az s1 ismeretlent tekintjük szabad változónak. Legyen s1 = 1, ekkor s2 = 1 és s3 = 0. Egy általánosított sajátvektor tehát például a következő
s
2
1 1 ; 0
2 1 Jól látható, hogy s és s lineárisan függetlenek. A számítások eredményét felhasználva az előbbi tétel szerint az
x
1
t e
t 1
s
1 1 1 2 t 1 t 2 2t 2t e 2 ; x t te s e s te 2 e 1 ; 1 1 0 2t
függvények lineárisan független megoldások. Ez azonban még midig csak 2 db lineárisan független megoldás, szükség van egy harmadikra is. Ehhez általánosítjuk az előzőekben alkalmazott gondolatmenetet. Keresünk egy újabb, az előbbi két megoldástól független megoldást az 320
Óbudai Egyetem BGK
Fejezetek a matematikából
t 1 t 3 1 2 3 2 3 x t et s tet s et s et s ts s ; 2 2 2
2
alakban. Kérdés, hogy létezik-e ilyen s vektor. Ennek a kérdésnek az eldöntéséhez helyettesítsünk az x ' t Ax t homogén lineáris rendszerbe. Azt kapjuk, hogy 3
2 t 2 1 1 2 3 2 3 1 2 t t t e s ts s e ts s Ae s ts s ; 2 2 t
Ez az egyenlőség egy azonosság a t változót tekintve. Ez pontosan akkor teljesül, ha a két oldalon a megfelelő függvények együtthatói rendre megegyeznek. Rendezve ezen szempont szerint az egyenletet, az adódik, hogy
t 2 t 1 t2 2 1 3 2 1 2 3 e s tet s s et s s et As tet As et As ; 2 2 2 3 1 Ha itt együttható összehasonlítást végzünk, akkor azt kapjuk, hogy az s , s és s vektoroknak ki kell elégíteni az
As1 s1 2 2 1 As s s ; 3 3 2 As s s
illetve az ezekkel ekvivalens A E s1 0 2 1 A E s s ; 3 2 A E s s 1 egyenleteket. Itt az első egyenlet ismét azt jelenti, hogy az s vektor sajátvektora az A
mátrixnak. Ez tökéletes összhangban van a korábbiakkal. Az s vektor a már definiált értelemben általánosított sajátvektora az A mátrixnak. A harmadik egyenlet azonban új, de az 2
3 2 2 s vektor logikailag pontosan úgy kapcsolódik a már ismert s vektorhoz, ahogyan Az s 3 1 vektor előáll az s vektor felhasználásával. Ilyen módon az s vektort is általánosított 2 3 sajátvektornak fogjuk nevezni, de megkülönböztetésül, az s vektort elsőrendű, az s vektort pedig másodrendű sajátvektornak nevezzük.
321
Óbudai Egyetem BGK
Fejezetek a matematikából 3 s vektort. A mondottak szerint kielégíti az
Állítsuk elő a konkrét feladatban az A E s3 s 2 egyenletet, tehát az
0 s1 1 4 2 1 3 1 2 1 s2 1 ; 1 0 1 2 s3 0
2 1 0 s1 1 3 1 1 s 1 ; 2 1 0 1 s3 0
egyenletrendszert. Ismét teljesül, hogy az 1. és 3. egyenlet összege a 2. egyenlet, így a 2. egyenlet elhagyható a rendszerből. A maradék két sorvektor azonban lineárisan független, ezért az együttható mátrix rangja ρ = 2. Mivel k = 3 ismeretlen van, ismét 1 a szabadságfok. A redukált rendszer a következő
2s1 s2 1 s 2s1 1 ; azaz 2 ; s1 s3 0 s3 s1 Ha szabad változónak az s1 ismeretlent választjuk, akkor s1 = 1 választással kapjuk a másodrendű általánosított sajátvektort
s
3
1 1 ; 1
Ebből az eredményből adódik, hogy az
x
3
2 t 2 1 2 3 2t t t e s ts s e 2 2 t
1 1 1 2 t 1 1 ; 1 0 1
A három vektor lineáris függetlenségéről meggyőz bennünket a belőlük, mint oszlopvektorokból képezett determináns értéke is 1 1 1 1 1 1 0 1 1 2 1 1 1 0 0 1 0 0 1 0; 1 0 1
1 0 1
0 0 1
A kapott három megoldás lineárisan független, ugyanis a t = 0 kezdeti értékhez tartozó kezdeti feltételek rendre az s , s és s vektorok, amelyekről éppen most mutattuk meg, hogy lineárisan függetlenek. Ebből pedig egy korábbi tétel szerint már következik a megoldásfüggvények lineáris függetlensége. Ez azt jelenti, hogy a fentiekben valóban alaprendszert állítottunk elő. A rendszer általános megoldása tehát a következő 1
2
3
322
Óbudai Egyetem BGK
Fejezetek a matematikából
1 1 2 1 2t 2t t x t C1e 2 C2e t 2 1 C3e 1 0 2 1 2t
1 1 1 2 t 1 1 ; 1 0 1
A példában alkalmazott gondolatmenet általánosan is elvégezhető egy lineáris rendszer vizsgálatánál. A számítások során kiderült, hogy szükség van új fogalmak értelmezésére is. Elsőként ezt adjuk meg, utána pedig általánosan megfogalmazzuk az ide vonatkozó tételt. 1 2.3.13.Definíció: Induljunk ki abból, hogy s az A mátrix λ sajátértékhez tartozó sajátvektora, azaz teljesül, hogy
As s ; 1
1
A E s1 0;
2 Az s legyen általánosított, pontosabban elsőrendű általánosított sajátvektor. Ekkor teljesül, hogy 2 2 1 As s s ;
A E s 2 s1 ;
Ha a sajátérték algebrai és geometriai dimenziója közötti különbség kettő, akkor szükség van az 3 s másodrendű általánosított sajátvektorra is amely eleget tesz az 3 3 2 As s s ;
A E s3 s 2 ;
összefüggéseknek. Ha az algebrai és geometriai dimenzió különbsége nagyobb, mint 2 akkor szükséges a fogalom további általánosítása. Rendre kapjuk a harmad-, negyed-,…, p-ed rendű
4 5 p1 általánosított sajátvektorokat, jelük s , s ,…, s , amelyek rendre eleget tesznek a következő egyenleteknek 4 4 3 As s s ;
5 5 4 As s s ;
A E s 4 s3 ; A E s5 s 4 ;
…………………………………………….. p 1 p p 1 p As s s ; A E s s ; p 1
Érdekes összefüggéseket kapunk, ha az
A E s p1 s p egyenletet
A E p
megszorozzuk az
mátrixszal. Azt kapjuk, hogy a másod, harmad, negyed, …, p-ed rendű általánosított sajátvektorokra rendre teljesül, hogy
323
Óbudai Egyetem BGK
Fejezetek a matematikából
A E A E s 2 A E2 s 2 A E s1 0; A E2 A E s3 A E3 s3 A E2 s 2 0; A E3 A E s 4 A E4 s 4 A E3 s3 0; …
A E A E s p1 A E p1 s p1 A E p s p 0; p
Ha az utolsóként felírt általános alakú egyenletet úgy írjuk fel, hogy
A E A E p s p1 0;
A E p s p1
akkor azonnal látható, hogy az teljesül, hogy hogy A E
vektor sajátvektora az A mátrixnak, tehát
A E p s p1 0 , hiszen sajátvektor nem lehet nullvektor, azonban az is igaz, p 1
s
p 1
0 . A fentiek szerint szükség van az alábbi értelmezésre.
Az s vektort az A mátrix λ sajátértékhez tartozó p-ed rendű általánosított sajátvektorának nevezzük, ha teljesül, hogy p1
A E p1 s p1 0; azonban A E p s p1 0; Egy differenciálegyenlet rendszer megoldása során, amikor a karakterisztikus polinomnak vannak többszörös gyökei és ezek algebrai multiplicitása nagyobb, mint a geometriai multiplicitás, szükség van az általánosított sajátvektorokra. Az alábbi tétel összefoglalja ezek alkalmazásának módját az általános esetben. 1 2.3.18.Tétel: Legyen λ az A mátrix sajátértéke és s az A mátrix λ sajátértékhez tartozó sajátvektora. Ebben az esetben az
tp 1 t p 1 2 t p 2 3 t 2 p 1 p p 1 x t et s s s ... s ts s 2! p 1! p 2 ! p!
függvény pontosan akkor megoldása az x ' t Ax t lineáris rendszernek, ha teljesülnek az As s ; 1
1
2 2 1 As s s ; 3 3 2 As s s ;
A E s1 0; 2 1 A E s s ; 3 2 A E s s ;
…………………………………………….. p 1 p p 1 p As s s ; A E s s ; p 1
324
Óbudai Egyetem BGK
Fejezetek a matematikából
egyenlőségek. A felsorolt egyenleteknek eleget tevő s s , s ,…, s vektorokat az A mátrix λ sajátértékéhez tartozó sajátvektor szériának (sajátvektor sorozat, sajátvektor lánc) nevezzük. Bizonyítás: A tétel igazolása egyszerűen a rendszerbe történő behelyettesítéssel adódik. Egyrészt a linearitás miatt 1
2
3
p1
tp t p 1 t p 2 t2 1 2 3 p 1 p p 1 Ax t et As As As ... As tAs As ; 2! p 1! p 2 ! p!
másrészt, a deriválási szabályok szerint
tp 1 t p 1 2 t p 2 3 t 2 p 1 p p 1 x ' t et s s s ........ s ts s 2! p 1! p 2 ! p! t p 1 1 t p 2 2 t p 3 3 p 1 p et s s s ... ts s p 2 ! p 3! p 1! ha a kapott függvényeket egyenlővé tesszük és az exponenciális függvény és hatvány szorzója szerinti együttható összehasonlítást végzünk, éppen a tételbeli egyenleteket kapjuk. ■ Többé-kevésbé szemléletessé téve a tételbeli összefüggést a következőt mondhatjuk. Ha a karakterisztikus egyenlet egy λ gyökének multiplicitása r, akkor elő kell állítanunk egy r db lineárisan független függvényből álló megoldásrendszert. Tegyük fel, hogy a sajátaltér 1 dimenziós, tehát 1 db lineárisan független sajátvektor van. Ekkor szükség van még p = r – 1 db lineárisan független, első-, másod-, …, p-ed rendű általánosított sajátvektorra. Ezeket a tételbeli p db egyenletrendszer szolgáltatja. Ezek megoldása után a p + 1 db lineárisan független megoldás, tehát az alaprendszer a következő módon írható fel. Összefoglalva eddigi eredményeinket, az alábbi állítást fogalmazhatjuk meg. 2.3.19.Tétel: A karakterisztikus egyenlet többszörös gyökei esetén, ha a sajátértékek algebrai multiplicitása nagyobb, mint a geometriai multiplicitás, az x ' t Ax t homogén lineáris rendszer egy alaprendszere a következő függvényekből állítható össze x1 t et s 1
1 2 x2 t et ts s
t2 1 2 3 x 3 t e t s ts s 2! 3 2 t 1 t 2 3 4 x4 t et s s ts s 2! 3! … 325
Óbudai Egyetem BGK
Fejezetek a matematikából
t p 1 1 t p 2 2 t p 3 3 p 1 p x p t et s s s ... ts s p 2 ! p 3! p 1! tp 1 t p 1 2 t p 2 3 t 2 p 1 p p 1 x p 1 t et s s s ... s ts s 2! p 1! p 2 ! p!
Bizonyítás: Azt az előző tétel bizonyítja, hogy ezek a függvények valóban megoldások. Már csak a függetlenséget kell igazolnunk. Ez utóbbi abból következik, hogy ezek a megoldások az i xi 0 s ; i 1, 2,..., p 1 kezdeti feltételekhez tartoznak. Az si ; i 1, 2,..., p 1 vektorok azonban lineárisan független rendszert alkotnak. Ha ugyanis s lineárisan függ s -től, akkor 2 1 2 1 1 teljesül, hogy s C s . De ekkor A E s A E C s C A E s 0 ez 2
azonban ellentmond annak, hogy
A E s 2 s1
1
1 és s sajátvektor, tehát nem lehet
2 3 1 nullvektor. Kapjuk tehát, hogy s és s lineárisan független. Ha feltesszük, hogy s
3 1 2 2 1 lineárisan függ az s és s vektoroktól, akkor teljesül, hogy s C1s C2s . Ekkor
3 2 azonban egyrészt igaz, hogy A E s s másrészt pedig az, hogy
A E C1s1 C2s 2 C1 A E s1 C2 A E s 2 C2 A E s 2 s 2 De az is teljesül, hogy
A E s 2 s1 amiből
2 1 az következne, hogy s és s lineárisan
összefüggenek, de azt már igazoltuk, hogy s és s lineárisan függetlenek, ismét ellentmondásra jutottunk. A gondolatmenet folytatásával igazolhatjuk, hogy az i s ; i 1, 2,..., p 1 vektorok lineárisan független rendszert alkotnak. ■ 1
2
5. eset: Az ARn×n együttható mátrixnak léteziktöbbszörös komplex gyöke Ezzel az esettel részletesen nem foglalkozunk, csak utalunk rá, hogy a 2., 3. és 4. esetben részletesen bemutatott módszerek alapján egy alaprendszer ebben az esetben is előállítható. Ilyen szituáció csak akkor fordulhat elő, ha n legalább 4. Ilyen méretű rendszer megoldásával általában nem foglalkozunk, bár jelezzük, hogy a korábbiakhoz képest csak a számítások mennyisége szaporodik, az elvi háttér nem módosul. Egyedüli nehézséget az jelenthet, hogy a karakterisztikus egyenlet negyedfokú, amelynek a megoldásait esetleg probléma lehet előállítani. Egy ilyen esetet bemutatunk a 2.3.20. példában a fejezet végén.
326
Óbudai Egyetem BGK
Fejezetek a matematikából
2.3.6. Elsőrendű állandó együtthatójú inhomogén lineáris differenciálegyenlet rendszer Ebben a pontban csak a 2.3.4. pontban kifejtett elmélet eredményeit alkalmazzuk állandó együtthatójú rendszerekre. Új tételeket igazolnunk nem szükséges, hiszen az általános tételek változtatás nélkül alkalmazhatók az állandó együtthatójú esetre. A 2.3.4. pontbeli vizsgálatokhoz képest annyi az „előny” hogy a 2.3.5 pont eredményei szerint elő tudjuk állítani a homogén rendszer egy alaprendszerét, tehát a Φ(t) alapmátrixot, és így alkalmazni tudjuk az állandó variálásának módszerét. Megoldandó tehát az x ' t A t x t g t
inhomogén lineáris rendszer. Feladatul tűzzük ki ebben a pontban ezen rendszer általános megoldásának a meghatározását elsősorban az állandó variálásának módszerét alkalmazva. Ehhez felhasználjuk tehát a 2.3.4. pontban igazolt
xiá t Φ t c Φ t Φ1 t g t dt összefüggést az általános megoldás előállítására. 2.3.14.Példa: Határozzuk meg az 3t x1 ' 1 1 x1 e3t x1 ' x1 x2 e ; mátrix jelölésekkel: x ' 3 1 x x ' 3 x x t 2 t 2 2 1 2
inhomogén lineáris rendszer általános megoldását. Kezdjük a homogén rendszer alapmátrixának előállításával. A karakterisztikus egyenlet
k det A E
1
1
3
1
2 4 0
Ennek az egyenletnek a megoldásai, tehát a sajátértékek λ1 = 2, λ2 = –2. A sajátvektorokat megkapjuk, ha megoldjuk az alábbi homogén lineáris rendszereket
1 1 s1 0 1 2 : ; tehát s1 s2 0; s1 s2 ; 3 3 s2 0 3 1 s1 0 2 2 : ; tehát 3s1 s2 0; s2 3s1; 3 1 s2 0 Innek kapjuk a sajátvektorokat és az alapmátrixot
327
Óbudai Egyetem BGK
Fejezetek a matematikából e 2t 1 1 s1 ; s 2 ; Φ t 2t 1 3 e
e2t ; 3e2t
Ezek alapján a homogén rendszer általános megoldása az alábbi 2t x (t ) e xhá t Φ t c 1 2t x2 (t ) e
e2t C1 ; 3e2t C2
ahol C1 és C2 tetszőleges valós állandók. Ezek után rátérünk az inhomogén rendszer egy partikuláris megoldásának előállítására. 1. megoldás: Elsőként az általánosan alkalmazható, állandó variálásának módszerét alkalmazzuk. Ez a korábbiak szerint a következő
xip t Φ t Φ1 t g t dt Szükség van tehát az alapmátrix inverzére. Emlékeztetünk arra, hogy egy 2×2 méretű mátrix inverzét a következő módon számoljuk
a b 1 d b ha A ; akkor A 1 ha det A ad bc 0 ad bc c a c d Itt csak arra hívjuk fel a figyelmet, hogy az alapmátrix komponensei függvények és nem konstansok. Az alapmátrix determinánsa nem más, mint a Wronski-determináns det Φ t W x1 t , x2 t
e 2t
e2t
e 2t
3e2t
3 1 4;
ahonnan az alapmátrix inverze a következő 1 3e Φ t 4 e2t
2t
1
e2t ; e2t
Ezek alapján már számítható az integrandus 2t 1 3e Φ1 t g t 4 e2t
t 2t e2t e3t 1 3e te ; 4 e5t te2t e2t t
Megállapodás szerint, egy vektort úgy integrálunk, hogy minden koordinátafüggvényét integráljuk. 328
Óbudai Egyetem BGK
Fejezetek a matematikából
Eszerint t 2t 1 2t t 3 e e e 1 2 4 1 Φ t g t dt 4 1 5t t 2t 1 2t ; e e e 5 2 4
Végül szorzással kapjuk a partikuláris megoldást 2t 1 e 1 xip t Φ t Φ t g t dt 4 e2t
t 1 3et e2t e2t e 2 4 ; 3e2t 1 e5t t e2t 1 e2t 5 2 4 2t
Elvégezve a műveleteket adódik, hogy 4 3t t 5e 4 xip t ; 3 e3t t 1 4 4 5
A homogén rendszer általános és inhomogén rendszer partikuláris megoldásának összege adja az inhomogén rendszer általános megoldását 4 3t t e e 5e 4 xiá t C1 C2 ; C1 , C2 R 2t 2t e 3e 3 e3t t 1 5 4 4 2t
2t
2. megoldás: Az inhomogén rendszer egy partikuláris megoldását előállítjuk más módszerrel is. A másodrendű állandó együtthatójú differenciálegyenleteknél alkalmaztuk a próbafüggvény módszerét. Ez ebben az esetben is működik, ha a jobb oldalon egyszerű szerkezetű függvények állnak, tehát, hatvány, polinom, exponenciális illetve trigonometrikus, vagy ezek szorzata. A korábbiak szerint keressük a megoldást x1 p (t ) Ae3t Bt C ; 3t x2 p (t ) De Et F
alakban. Elvégezve a deriválást és a helyettesítést az inhomogén rendszerbe, a következő egyenletrendszert kapjuk
329
Óbudai Egyetem BGK
Fejezetek a matematikából
3t 3t 3t 3 Ae B A D e B E t C F e ; 3t 3t 3De E 3 A D e 3B E t 3C F t ;
Ha mindkét egyenletben együttható összehasonlítást végzünk, akkor kapjuk az együtthatókra az alábbi lineáris egyenletrendszert
3 A A D 1; B E 0; B C F; 3D 3 A D; 3B E 1 0; E 3C F ; Helyettesítéssel meggyőződhetünk róla, hogy ennek a rendszernek a megoldása a következő
4 1 3 1 1 A ; B ; C 0; D ; E ; F ; 5 4 5 4 4 Ez a megoldás pedig pontosan egybeesik az 1. módszerrel kapott megoldással. 2.3.15.Példa: Határozzuk meg az x1 ' 4 x1 3x2 sin t x ' 4 3 x1 sin t ; mátrix jelölésekkel: 1 ; x2 ' 2 x1 x2 2cos t x2 ' 2 1 x2 2cos t
inhomogén lineáris rendszer általános megoldását. Kezdjük a homogén rendszer alapmátrixának előállításával. A karakterisztikus egyenlet
k det A E
4
3
2
1
1 2 0;
Ennek az egyenletnek a megoldásai, tehát a sajátértékek λ1 = 1, λ2 = 2. A sajátvektorokat megkapjuk, ha megoldjuk az alábbi homogén lineáris rendszereket
3 1 1: 2 2 2 2 : 2
3 s1 0 ; tehát 3s1 3s2 0; s1 s2 ; 2 s2 0 3 s1 0 ; tehát 2s1 3s2 0;3s2 2s1; 3 s2 0
Innek kapjuk a sajátvektorokat és az alapmátrixot 330
Óbudai Egyetem BGK
Fejezetek a matematikából et 1 3 s1 ; s 2 ; Φ t t 1 2 e
3e2t ; 2e2t
Ezek alapján a homogén rendszer általános megoldása az alábbi t x (t ) e xhá t Φ t c 1 t x2 (t ) e
3e2t C1 ; 2e2t C2
Az inhomogén rendszer partikuláris megoldását most is két módszerrel állítjuk elő. 1. megoldás: Az állandó variálásával. Az alapmátrix determinánsa a Wronski-determináns det Φ t W x1 t , x2 t
et
3e2t
t
2t
e
2e
2e3t 3e3t e3t ;
ahonnan az alapmátrix inverze a következő 1 Φ t 3t e 1
2e2t t e
3e2t 2et et e2t
3et ; e2t
Ha ezt az inverz mátrixot szorozzuk a g(t) vektor-skalár függvénnyel kapjuk az integrandust 2et Φ t g t 2t e 1
3et sin t 2et sin t 6et cos t ; e2t 2cos t e2t sin t 2e2t cos t
Ezt a vektort koordinátánként integráljuk. A primitív függvény előállításához használjuk fel az alábbi két összefüggést, amelyek két-két parciális integrálással adódnak at e sin tdt
eat a sin t cos t ; 1 a2
at e cos tdt
eat sin t a cos t ; 1 a2
Ezek alapján adódik, hogy et 2sin t 4cos t ; Φ t g t dt e2t cos t 1
Végül elvégezve a szorzást az alapmátrixszal, kapjuk a partikuláris megoldást
331
Óbudai Egyetem BGK
Fejezetek a matematikából
et xip t Φ t Φ1 t g t dt t e
3e2t et 2sin t 4cos t cos t 2sin t ; 2e2t e2t cos t 2cos t 2sin t
Az eredményeink összegzésével adódik az inhomogén egyenlet általános megoldása et 3e2t cos t 2sin t xiá t Φ t c Φ t Φ1 t g t dt C1 C2 ; C1 , C2 R t 2t e 2e 2cos t 2sin t
2. megoldás: A partikuláris megoldást előállítjuk a próbafüggvény módszerével is. Keressük a megoldást x1 p (t ) A cos t B sin t ; x2 p (t ) C cos t D sin t
alakban. Elvégezve a deriválást és a helyettesítést az inhomogén rendszerbe, a következő egyenletrendszert kapjuk
A sin t B cos t 4 A cos t 4B sin t 3C cos t 3D sin t sin t ; C sin t D cos t 2 A cos t 2B sin t C cos t D sin t 2cos t ; A két egyenletben együttható összehasonlítást végezve, az alábbi lineáris egyenletrendszert kapjuk az ismeretlen együtthatókra B 4 A 3C ; A 4 B 3D 1; D 2 A C 2; C 2 B D; Ennek megoldása pedig A = 1, B = –2, C = 2, D = –2, mint arról helyettesítéssel könnyen meggyőződhetünk. Ez a megoldás azonban pontosan megegyezik az 1. módszerrel, tehát az állandó variálásával kapott megoldással. 2.3.16.Példa: Határozzuk meg az 2 x1 ' 0 1 x1 tg 2 t 1 x1 ' x2 tg t 1 ; mátrix jelölésekkel: ; x ' 1 0 x x ' x tg t tg t 2 2 2 1
inhomogén lineáris rendszer általános megoldását. Szokás szerint kezdjük a homogén rendszer alapmátrixának előállításával. A karakterisztikus egyenlet
332
Óbudai Egyetem BGK
Fejezetek a matematikából k det A E
1
1
2 1 0;
Ennek az egyenletnek is konjugált komplex megoldásai vannak, tehát a sajátértékek a következők: λ1 = i, λ2 = –i. Emlékeztetünk azonban arra, hogy ha konjugált komplex sajátértékek adódnak, akkor elég az egyik sajátértékhez tartozó sajátvektort előállítani, a konjugált komplex sajátértékhez a konjugált sajátvektor tartozik. A megoldandó homogén lineáris rendszer
i 1 s1 0 1 i : ; tehát is1 s2 0; s2 is1; 1 i s2 0 Ebben az esetben az első egyenlet –i-szerese a második egyenlet, így ez utóbbi a rendszerből valóban elhagyható.Kapjuk tehát a sajátvektorokat
1 1 0 1 1 0 s1 i ; s2 i ; i 0 1 i 1 1 A lineárisan független megoldásokat ismét az
1 0 1 x t eit cos t i sin t i ; i 0 1 komplex megoldás valós és képzetes része adja. Ezeket megkapjuk ha elvégezzük a szorzást
1 0 1 0 x t cos t sin t i sin t cos t ; 0 1 0 1 Az alapmátrix tehát a következő
cos t sin t Φ t ; sin t cos t Ahonnan adódik a homogén lineáris rendszer általános megoldása
cos t sin t xhá t Φ t c C1 C2 ; sin t cos t Tekintettel az inhomogenitást jelentő g(t) vektorfüggvény alakjára, az inhomogén rendszer partikuláris megoldásának előállítására ismét csak az állandó variálásának módszere marad. Ehhez számítjuk az alapmátrix determinánsát
333
Óbudai Egyetem BGK
Fejezetek a matematikából det Φ t
cos t
sin t
sin t cos t
cos2 t sin 2 t 1;
Ebből kapjuk az alapmátrix inverzét
1 cos t sin t cos t sin t Φ1 t ; 1 sin t cos t sin t cos t A kapott inverz és a g(t) vektor szorzata lesz az integrandus cos t Φ1 t g t sin t
cos t sin t tg 2 t 1 cos t ; 3 2 2 cos t tg t sin t cos t sin t cos t sin t
Koordinátafüggvényenként integrálva kapjuk, hogy
sin t Φ t g t dt 1 cos t ; cos t 1
Elvégezve az alapmátrixszal való szorzást, adódik a partikuláris megoldás
sin t cos t sin t tg t ; xip t Φ t Φ t g t dt 1 cos t 2 sin t cos t cos t 1
A homogén általános és inhomogén partikuláris megoldás összege adja a rendszer általános megoldását
cos t sin t tg t xiá t Φ t c Φ t Φ1 t g t dt C1 C2 ; C1 , C2 R sin t cos t 2 2.3.17.Példa: Határozzuk meg az 1 1 x1 ' 1 1 x1 x1 ' x1 x2 cos t ; mátrix jelölésekkel: x cos t ; x ' 2 1 2 2 0 x2 ' 2 x1 x2
inhomogén lineáris rendszer általános megoldását. Szokás szerint kezdjük a homogén rendszer alapmátrixának előállításával. A karakterisztikus egyenlet
334
Óbudai Egyetem BGK
Fejezetek a matematikából
k det A E
1
1
2
1
2 1 0;
Ennek az egyenletnek konjugált komplex megoldásai vannak, tehát a sajátértékek λ1 = i, λ2 = –i. Ismét elég csak az egyik sajátértékhez tartozó sajátvektort meghatározni. A sajátvektorokat megkapjuk, ha megoldjuk a következő homogén lineáris rendszert
1 s1 0 1 i 1 i : ; tehát 1 i s1 s2 0; s2 1 i s1; 2 1 i s2 0 Könnyen látható, hogy az első egyenlet (1 + i)-szerese a második egyenlet, tehát ez utóbbi valóban elhagyható a rendszerből. Innek kapjuk a sajátvektorokat
1 1 0 1 1 0 s1 i ; s2 i ; 1 i 1 1 1 i 1 1 Az alapmátrixban csak a valós megoldások lehetnek, ezt a kapott komplex megoldás valós és képzetes része szolgáltatja. A komplex megoldás egyrészt az
1 0 1 x t eit cos t i sin t i ; 1 i 1 1 függvény valamint ennek komplex konjugáltja. Szorzással kapjuk a valós és képzetes részt
1 0 1 0 x t cos t sin t i sin t cos t ; 1 1 1 1 Ahonnan az alapmátrix már felírható
sin t cos t Φ t ; cos t sin t sin t cos t A homogén lineáris rendszer általános megoldása ezzel a kezünkben van
cos t sin t xhá t Φ t c C1 C2 ; cos t sin t sin t cos t Az inhomogén egyenlet partikuláris megoldásának előállítására azonban most nem alkalmazható a próbafüggvény módszere, marad az állandó variálása. Ehhez elsőként az alapmátrix determinánsát számítjuk
335
Óbudai Egyetem BGK det Φ t
Fejezetek a matematikából
cos t
sin t
cos t sin t sin t cos t
cos t sin t cos 2 t cos t sin t sin 2 t 1;
Innen az inverz már egyszerűen adódik
Φ1 t
1 sin t cos t sin t cos t sin t sin t ; 1 cos t sin t cos t cos t sin t cos t
Ezt a mátrixot szorozva a g(t) vektorral adódik az integrandus
1 cos t sin t sin t 1 tg t Φ t g t cos t ; cos t sin t cos t 0 1 tg t 1
Ezek után koordinátánként integrálva adódik, hogy t ln cos t
1 Φ t g t dt t ln cos t ;
Az alapmátrixszal szorozva balról adódik a partikuláris megoldás sin t t ln cos t cos t xip t Φ t Φ1 t g t dt ; cos t sin t sin t cos t t ln cos t
Elvégezve a szükséges műveleteket adódik, hogy sin t t cos t sin t cos t sin t ln cos t t cos t xip t ; 2t sin t 2cos t ln cos t cos t sin t sin t cos t
Összegezve az általános és partikuláris megoldást, kapjuk az inhomogén rendszer általános megoldását cos t sin t t cos t sin t cos t sin t ln cos t xiá t C1 C2 ; C1 , C2 R 2t sin t 2cos t ln cos t cos t sin t sin t cos t
A rendszer megoldását tehát előállítottuk. Ha rátekintünk az inhomogén rendszer partikuláris megoldására valamint a g(t) vektor koordinátáira, látható miért nem alkalmazható a próbafüggvény módszere. Ezek a függvények még csak nem is hasonlítanak egymásra.
336
Óbudai Egyetem BGK
Fejezetek a matematikából
2.3.7. n-ed rendű állandó együtthatójú lineáris differenciálegyenlet, az átviteli elv Ebben a pontban, a lineáris rendszerek elméletének alkalmazásaképpen megmutatjuk, hogyan lehet megoldani az n-ed rendű állandó együtthatójú lineáris differenciálegyenletet. A 2.2. fejezetben kizárólag másodrendű egyenletekkel foglalkoztunk, itt általánosítjuk a problémakört, a lineáris rendszerek elméletének alkalmazásával lehetőség nyílik magasabb rendű egyenletek megoldására is. Kiderül, hogy egy n-ed rendű lineáris differenciálegyenlet átalakítható úgy, hogy egy elsőrendű, normál alakú, lineáris rendszer legyen belőle, amelyben n db ismeretlen függvény szerepel. Ezt a módszert nevezzük átviteli elvnek. Induljunk tehát ki egy n-ed rendű állandó együtthatójú lineáris differenciálegyenletből. Legyenek az an–1, an–2, …, a2, a1, a0 valós együtthatók, a g t , t I egy nyitott intervallumon folytonos függvény. A bevezetett jelölésekkel az n n1 n2 y an1 y an2 y ... a2 y " a1 y ' a0 y g t ;
differenciálegyenlet, illetve explicit alakban a n n1 n2 y an1 y an2 y ... a2 y " a1 y ' a0 y g t ;
megoldását keressük. Feltettük, hogy az n-ed rendű derivált együtthatója 1, ami nem jelent megszorítást, hiszen nyilván teljesül, hogy an ≠ 0, hiszen ha zérus lenne, az egyenlet nem lenne n-ed rendű. ha pedig nem nulla, akkor az egyenletet oszthatjuk vele. A felírt egyenlet legyen az, amelyet az an együtthatóval történő osztás után kapunk. Bebizonyítjuk, hogy ez az egyenlet egyenértékű egy elsőrendű lineáris rendszerrel. Ehhez a következőt kell tennünk. Bevezetünk új ismeretlen függvényeket, pontosan n db-ot, a következő definícióval. Legyen x1 t y t ; x2 t x1 ' t y ' t ; x3 t x2 ' t y " t ;...; xn t x 'n1 t y
Ha ezekből a definiáló egyenlőségekből differenciálegyenlet rendszer adódik
kifejezzük
x1 ' t x2 t y ' t ; x2 ' t x3 t y " t ; x3 ' t x4 t y "' t ; ... n 1 xn1 ' t xn t y t ; n xn ' t y t ;
337
a
deriváltakat,
a
n1
t ;
következő
Óbudai Egyetem BGK
Fejezetek a matematikából
Az utolsó egyenletet a korábbiak figyelembe vételével célszerűen az xn ' t a0 y a1 y ' a2 y " ...an2 y
n2
an1 y
n 1
g t
a0 x1 t a1 x2 t a2 x3 t ...an2 xn1 t an1xn t g t
alakban írva, a kapott rendszer, mátrixos jelölésekkel, a következő standard formára hozható. x1 ' t 0 x2 ' t 0 x3 ' t 0 ... ... x ' t 0 n 1 xn ' t a0
1
0
0
...
0
1
0
...
0
0
1
...
...
...
...
...
0
0
0
...
a1 a2
a3 ...
0 x1 t 0 0 x2 t 0 0 x3 t 0 ; ... ... ... 1 xn1 t 0 an 1 xn t g t
Ez a rendszer tehát egyenértékű az eredeti n-ed rendű egyenlettel abban az értelemben, hogy minden n-ed rendű, állandó együtthatójú differenciálegyenlethez, hozzárendelhető ez az elsőrendű, normál alakú rendszer, mely x(t) megoldásának, tehát a vektor-skalár függvénynek az első koordinátafüggvénye az n-ed rendű differenciálegyenlet megoldása, tehát x1 t y t . Ezt nevezzük átviteli elvnek. Fogalmazzuk meg konkrét esetekre az átviteli elvet. Másodrendű lineáris differenciálegyenlet esetében, ez a következőt jelenti. Az y " a1 y ' a0 y g t ;
differenciálegyenlet egyenértékű az
x1 ' 0 x ' a 2 0
1 x1 0 ; a1 x2 g t
rendszerrel. A harmadrendű y "' a2 y " a1 y ' a0 y g t ;
egyenlet egyenértékű az x1 ' 0 x ' 0 2 x3 ' a0
1 0 a1
0 x1 0 1 x2 0 ; a2 x3 g t
338
Óbudai Egyetem BGK
Fejezetek a matematikából
rendszerrel. A magasabb rendű differenciálegyenlet megoldása minden esetben az y t x1 t függvény. Az átviteli elvet illusztráljuk példákkal. 2.3.18.Példa: Határozzuk meg első példaként az
y " 4 y ' 5 y 0; homogén lineáris egyenlet általános megoldását az átviteli elv segítségével. Áttérünk az elsőrendű rendszerre. A mondottak szerint ez a következő
x1 ' 0 1 x1 x ' 5 4 x ; 2 2 Innen a szokásos módon következik a sajátértékek és sajátvektorok meghatározása. A karakterisztikus egyenlet a következő
k det A E
1
5 4
2 4 5 0;
Ennek az egyenletnek konjugált komplex megoldásai vannak, a sajátértékek λ1 = 2 + i, λ2 = 2 – i. Ismét elég csak az egyik sajátértékhez tartozó sajátvektort meghatározni. A sajátvektorokat megkapjuk, ha megoldjuk a következő homogén lineáris rendszert
1 s1 0 2 i 1 i : ; tehát 2 i s1 s2 0; s2 2 i s1; 5 2 i s2 0 Könnyen látható, hogy az együtthatómátrix szinguláris, mert az első egyenlet (2 – i)-szerese a második egyenlet, így ez utóbbi elhagyható. Innek kapjuk a konjugált sajátvektorokat
1 1 0 1 1 0 s1 i ; s2 i ; 2 i 2 1 2 i 2 1 Az alapmátrixban csak a valós megoldások lehetnek, ezt a kapott komplex megoldás valós és képzetes része szolgáltatja. A komplex megoldás egyrészt az
x t e
2i t
1 0 1 2t 2 i e cos t i sin t 2 i 1 ;
függvény valamint ennek komplex konjugáltja. Szorzással kapjuk a valós és képzetes részt
1 0 1 0 x t e2t cos t sin t ie2t sin t cos t ; 2 1 2 1 339
Óbudai Egyetem BGK
Fejezetek a matematikából
A két lineárisan független valós megoldás a következő
1 0 1 0 x1 t e2t cos t sin t ; x2 t e2t sin t cos t ; 2 1 2 1 A rendszer általános megoldása az x t C1x1 t C2 x2 t ; C1 , C2 R . Ennek a vektor-skalár függvénynek az első koordinátafüggvénye a másodrendű egyenlet általános megoldása. A keresett megoldás tehát az
y t C1e2t cos t C2e2t sin t; C1, C2 R függvény. Az egyenletet tehát megoldottuk az átviteli elv segítségével. 2.3.19.Példa: Határozzuk meg az
y "' 2 y " 4 y ' 8 y 0; harmadrendű lineáris differenciálegyenlet általános megoldását az átviteli elv segítségével. A fentiek szerint ez az egyenlet egyenértékű az 1 0 x1 x1 ' 0 x ' 0 0 1 x2 ; 2 x3 ' 8 4 2 x3
elsőrendű homogén lineáris rendszerrel. A karakterisztikus egyenlet a következő 1 k det A E 0 8
0 1
2 2 4 0;
4 2
Kapjuk tehát egyrészt, hogy λ1 = 2 az egyetlen valós sajátérték. Ezen kívül van még két konjugált komplex sajátérték, λ2,3 = ±2i. Elő kell állítanunk 3 db lineárisan független megoldást. Kezdjük a sajátvektorok meghatározásával. A megoldandó rendszer egyrészt a következő. 2 1 0 s1 0 1 2 : 0 2 1 s2 0 ; 8 4 0 s3 0
Látható, hogy az 1. sor –4-szerese a 3. sor, tehát ez utóbbi a rendszerből elhagyható. A maradék sorvektorok azonban lineárisan függetlenek, tehát az együtthatómátrix rangja ρ = 2. Az ismeretlenek száma k = 3, tehát a szabadságfok k – ρ = 3 – 2 = 1. A redukált rendszer 340
Óbudai Egyetem BGK
Fejezetek a matematikából 2s1 s2 0 ; azaz 2s2 s3 0
s2 2s1 ; s3 2s2
A λ1 = 2 sajátértékhez tartozó sajátvektor tehát például a következő s1 1 2 4 , az első T
megoldás tehát az x1 t e2t 1 2 4 függvény. A λ2,3 = ±2i konjugált sajátértékekhez tartozó konjugált sajátvektorok az alábbi homogén lineáris rendszer megoldásából adódnak T
0 s1 0 2i 1 1 2i : 0 2i 1 s2 0 ; 8 4 2 2i s3 0
Könnyen ellenőrizhető, hogy ez a mátrix is szinguláris, az 1. egyenlet 4i-szeresének és a 2. egyenlet (2 – 2i)-szeresének összege a 3. egyenlet, így ez utóbbit a rendszerből elhagyjuk. A redukált rendszer így a következő
2is1 s2 0 ; azaz 2 is s 0 2 3
s2 2is1 ; s 2 is 3 2
Innen adódnak a konjugált komplex sajátvektorok 1 1 0 1 1 0 s 2 2i 0 i 2 ; s3 2i 0 i 2 ; 4 4 0 4 4 0
Ezek ismeretében már megadható két lineárisan független valós megoldás, a kapott
x t e
2it
1 0 1 2i cos 2t i sin 2t 0 i 2 ; 4 0 4
konjugált komplex megoldások valós és képzetes része 1 0 1 0 x2 t cos 2t 0 sin 2t 2 ; x3 t sin 2t 0 cos 2t 2 ; 4 0 4 0
A lineáris rendszer általános megoldása az x t C1x1 t C2 x2 t C3x3 t ; C1 , C2 , C3 R . Az átviteli elv szerint ennek a vektor-skalár függvénynek az első koordinátafüggvénye a harmadrendű egyenlet megoldása, amely tehát a következő 341
Óbudai Egyetem BGK
Fejezetek a matematikából
y t C1e2t C2 cos 2t C3 sin 2t; C1, C2 , C3 R 2.3.20.Példa: Határozzuk meg az 4 y 8 y " 16 y 0;
negyedrendű lineáris differenciálegyenlet általános megoldását az átviteli elv segítségével. Az átviteli elv szerint ez az egyenlet egyenértékű az alábbi homogén lineáris rendszerrel
x1 ' 0 x ' 0 2 x3 ' 0 x4 ' 16
1 0 0 1 0 0 0 8
0 x1 0 x2 ; 1 x3 0 x4
Ennek megoldását a szokott módon végezzük el. Felírjuk a karakterisztikus egyenletet
1 0 0 0 1 0 k det A E 2 4 0 0 1 16 0 8
2
0;
Ennek az egyenletnek két db, kétszeres multiplicitású komplex megoldása van, λ1 = 2i és λ2 = –2i kétszeres komplex gyökök. Most megkeressük a sajátvektorokat. Kezdjük a λ1 = 2i komplex sajátértékhez tartozó sajátvektorral. Ehhez meg kell oldanunk az alábbi homogén lineáris rendszert
0 0 s1 0 2i 1 0 2i 1 0 s2 0 ; 0 0 2i 1 s3 0 8 2i s4 0 16 0 Ezen rendszer együtthatómátrixának rangja 3, ugyanis a bal felső 3×3-as almátrix determinánsa – tekintettel arra, hogy egy felső háromszögmátrixról van szó –, a főátlóbeli komponensek szorzata, azaz (–2i)3 ≠ 0. Azonban a négy sorvektor lineárisan összefügg, hiszen ellenőrizhető, hogy ha az első egyenletet szorozzuk –8i-vel, a másodikat –4-gyel, a harmadikat pedig –2i-vel, és ezeket összeadjuk, akkor a 4. egyenletet kapjuk. A mátrix rangja tehát ρ = 3, az ismeretlenek száma k = 4, tehát a rendszer szabadságfoka k – ρ = 1. A 4. egyenlet elhagyásával adódó redukált rendszer a következő
342
Óbudai Egyetem BGK
Fejezetek a matematikából 2is1 s2 0; 2is2 s3 0; azaz 2is s 0; 3 4
s2 2is1; s3 2is2 ; s 2is ; 3 4
és itt egy ismeretlen szabadon választható. Azt kaptuk tehát, hogy a λ1 = 2i komplex sajátérték algebrai multiplicitása 2, geometriai multiplicitása azonban csak 1, mert a hozzá tartozó sajátaltér 1 dimenziós. Ennek a sajátaltérnek egy bázisvektora tehát egy sajátvektor, és a konjugált λ2 = –2i sajátértékhez tartozó konjugált sajátvektor például a következő
1 1 0 1 1 0 2i 0 2 2i 0 2 s1 i ;s i ; 4 4 0 2 4 4 0 8i 0 8 8i 0 8 Ezek alapján megadhatunk két lineárisan független megoldást a szokott módon. Képezzük az
1 0 1 2i 2it cos 2t i sin 2t 0 i 2 ; x t e 4 4 0 0 8 8i komplex megoldás valós és képzetes részét, azaz kapjuk a lineárisan független
1 0 cos 2t 1 0 sin 2t 0 2 2sin 2t ; x 2 t sin 2t 0 cos 2t 2 2 cos 2t ; x1 t cos 2t sin 2t 4 0 4 cos 2t 4 0 4sin 2t 0 8 8sin 2t 0 8 8cos 2t megoldásokat. Ez azonban csak két lineárisan független megoldás. Szükség van további két olyan függvényre, amely ezzel a két megoldással együtt lineárisan független rendszert, tehát alaprendszert alkot. A megoldás keresése során a 2.3.5 pont 4.esetében alkalmazott gondolatmenetet ismételjük, amikor is a sajátérték algebrai multiplicitása nagyobb, mint a geometriai multiplicitás. A jelzett esetben, a már meglévő megoldástól lineárisan független megoldást a 1 2 x t te1t s e1t s
alakban kerestük, ahol s s1 a már előállított sajátvektor, s pedig az általánosított sajátvektor, ez utóbbit keressük. Ugyancsak a 2.3.5. pont 4. esetében megmutattuk, hogy ez az x(t) függvény pontosan akkor megoldás, ha teljesül, hogy 1
2
343
Óbudai Egyetem BGK
Fejezetek a matematikából
As1 s1 ; azaz 2 1 2 As s s
A E s1 0 ; 2 1 A E s s
Ez az összefüggés változtatás nélkül igaz, hiszen ott nem használtuk fel, hogy a sajátértékek és a sajátvektorok valósak, tehát ezek az összefüggések komplex esetre is igazak. Megoldandó tehát 2 1 az A E s s inhomogén lineáris egyenletrendszer.
0 0 s1 1 2i 1 0 2i 1 0 s2 2i ; 0 0 2i 1 s3 4 8 2i s4 8i 16 0 Itt pontosan azt tudjuk elmondani a rendszerről és annak együttható mátrixáról, mint korábban, tehát azt, hogy a 4. egyenlet következménye az első három egyenletnek, így a redukált rendszer a következő 2is1 s2 1; 2is2 s3 2i; azaz 2is s 4; 3 4
s2 1 2is1; s3 2i 2is2 ; s 4 2is ; 3 4
A rendszer szabadságfoka 1, élhetünk például az s4 = 0 választással. Ebben az esetben a megoldásvektor, más szóval az általánosított sajátvektor a következő
1,5i 0 1,5 0 2 2 2 s i ; 2i 0 2 0 0 0 t 1 t 2 helyettesítve az x t te 1 s e 1 s formulába, kapjuk a
1 1,5i 2i 2 x t te2it e2it ; 4 2i 8i 0 tehát az
344
Óbudai Egyetem BGK
Fejezetek a matematikából
1 0 0 1,5 0 0 2 2 x t t cos 2t i sin 2t i cos 2t i sin 2t i ; 4 0 0 2 0 8 0 0 komplex megoldást. Szétválasztva a valós és képzetes részeket adódik két újabb lineárisan független megoldás.
1 0 0 1,5 0 2 2 0 x t t cos 2t t sin 2t cos 2t sin 2t 4 0 0 2 0 8 0 0 1 0 0 1,5 0 2 2 0 i t sin 2t t cos 2t sin 2t cos 2t 4 0 0 2 0 8 0 0 Összevonás után a két valós megoldás a következő
t cos 2t 1,5sin 2t t sin 2t 1,5cos 2t 2t sin 2t 2 cos 2t ; x 4 t 2t cos 2t 2sin 2t ; x3 t 4t cos 2t 2sin 2t 4t sin 2t 2 cos 2t 8t sin 2t 8t cos 2t Figyelembe véve az x1(t) és x2(t) megoldásokat, kapjuk az átviteli elv alkalmazásával kapott lineáris rendszer általános megoldását
cos 2t sin 2t t cos 2t 1,5sin 2t t sin 2t 1,5cos 2t 2sin 2t 2 cos 2t 2t sin 2t 2 cos 2t C2 C3 C4 2t cos 2t 2sin 2t ; x há t C1 4 cos 2t 4sin 2t 4t cos 2t 2sin 2t 4t sin 2t 2 cos 2t 8t sin 2t 8t cos 2t 8sin 2t 8cos 2t ahol C1, C2 , C3 , C4 R tetszőleges konstansok. A rendszer megoldását tehát előállítottuk. Az átviteli elv alapján az eredetileg kitűzött negyedrendű differenciálegyenlet általános megoldása a kapott vaktor-skalár függvény első koordinátafüggvénye, tehát a megoldás az y t C1 cos 2t C2 sin 2t C3 t cos 2t 1,5sin 2t C4 t sin 2t 1,5cos 2t ; C1, C2 , C3 , C4 R
345
Óbudai Egyetem BGK
Fejezetek a matematikából
függvény. Az egynemű tagok összevonása után, figyelembe véve, hogy a C1, C2 , C3 , C4 R konstansok tetszőlegesek, a megoldás a némileg egyszerűbb y t K1 cos 2t K2 sin 2t K3t cos 2t K4t sin 2t; K1, K 2 , K3 , K 4 R
alakban is írható. Ezzel a kitűzött feladatot megoldottuk.
346
Óbudai Egyetem BGK
Fejezetek a matematikából
3. fejezet Sorelmélet
347
Óbudai Egyetem BGK
Fejezetek a matematikából
348
Óbudai Egyetem BGK
Fejezetek a matematikából
3.1. Numerikus sorok Az alábbiakban felhasználjuk azokat a fogalmakat, amelyek a Matematika I. tantárgy keretében a sorozatokkal kapcsolatosan már szerepeltek. Ezek a következők: a sorozat és a határérték fogalma, műveletek sorozatokkal, sorozatok tulajdonságai és a határérték tételek.
3.1.1. Numerikus sorok Induljunk ki a következő problémából. Adott egy (an), nN+ valós számsorozat. Képezzünk az alábbi módon ebből a sorozatból egy másik (sn), nN+ sorozatot. Legyen s1 = a1 s2 = a1 + a2 s3 = a1 + a2 + a3 … sn = a1 + a2 +…+ an (nN+) … Fogalmilag az ilyen módon értelmezett sorozat is egy ugyanolyan valós sorozat, mint amiből kiindultunk, csak a képzési szabály sajátos. Ezért a sorozatok témakörében megismert fogalmak (monotonitás, korlátosság, határérték, konvergencia,…,stb.) és tételek változtatás nélkül igazak ebben az esetben is. 3.1.1.Definíció: Az (an), nN+valós sorozatból az említett módon képzett (sn), nN+valós számsorozatot az (an), nN+sorozatból képzett végtelen numerikus sornak, vagy egyszerűen csak végtelen sornak nevezzük. Az (sn), nN+ sorozat n-edik tagját, sn-t – a képzési szabályra jobban utaló elnevezéssel – a sor n-edik részletösszegének nevezzük. A problémához jobban illeszkedő elnevezéseket és jelöléseket vezetünk be. – A végtelen sort gyakran jelöljük egyszerűen
ai -vel,
vagy pontosabban
ai -vel.
Ez
i i0
utóbbi esetben i0 a kezdőindex, amely tetszőleges pozitív egész lehet; n
– Az n-edik részletösszeg: sn ai ; i 1
– Az (sn), nN+ sorozat határértéke: lim sn ai . i 1
A határértéket ebben az esetben a végtelen numerikus sor összegének nevezzük. Egyetlen tételt emelünk csak ki a konvergenciával kapcsolatban, amelynek elsősorban elméleti jelentősége van, azonban a sorok elméletében kiemelkedő jelentőséggel bír. Ez a tétel a Cauchyféle konvergencia kritérium. A tételt először sorozatokra vonatkozólag fogalmazzuk meg és bizonyítjuk be, majd a bevezetett jelölésekkel átfogalmazzuk numerikus sorokra. 349
Óbudai Egyetem BGK
Fejezetek a matematikából
3.1.1Tétel: (Cauchy-féle konvergencia kritériumsorozatokra) Az (an), nN+ valós számsorozat akkor és csak akkor konvergens, ha tetszőleges ε > 0 hibakorláthoz létezik olyan n0 pozitív egész szám, ún. küszöbindex, hogy tetszőleges n, m>n0 esetén teljesül, hogy an am . Bizonyítás: Ezt a kritériumot sorelméleti fontossága miatt igazoljuk. a) szükségesség: Elsőként tegyük fel, hogy a sorozat konvergens és határértéke az A valós szám. Legyen ε tetszőleges pozitív szám. Ekkor a konvergencia miatt ε/2-höz létezik n0 küszöbindex olyan, hogy ha n>n0 akkor teljesül, hogy an A . Használjuk most fel a háromszög 2 egyenlőtlenséget a tételbeli különbség becsléséhez. Legyen n, m>n0 , ekkor an am an A A am an A am A
2
2
a szükségességet ezzel igazoltuk. b) elégségesség: Induljunk ki abból, hogy ha egy sorozatra teljesül a tételbeli feltétel (Cauchyféle sorozat), akkor az korlátos. Ha ugyanis n, m>n0 és az n-et rögzítjük, akkor az an am egyenlőtlenség azt jelenti, hogy a sorozatnak legfeljebb n0 tagja van az an valós szám ε sugarú környezetén kívül, vagyis véges sok tag, ezek között van legnagyobb és legkisebb. Alkalmazzuk most a Bolzano-Weierstass-féle kiválasztási tételt, mely szerint korlátos sorozatnak létezik konvergens részsorozata. Legyen ennek határértéke A. Eszerint tetszőleges ε esetén ε/2-höz létezik olyan n1 küszöbszám, hogy ha az ni index nagyobb, mint n1 akkor ani A . Másrészt 2 a feltétel szerint létezik n2 küszöbszám olyan, hogy ha n, ni > n2 akkor igaz, hogy an ani . 2 Innen ismét a háromszög egyenlőtlenség alkalmazásával, ha n0 max n1, n2 , akkor n, ni>n0 esetén már adódik az állítás: an A an ani ani A an ani ani A
2
2
ugyanis ez az egyenlőtlenség pontosan azt jelenti, hogy a sorozat konvergens és határértéke A. ■ Ha a 3.1.1. tételt a részletösszegek (sn), nN+sorozatára alkalmazzuk akkor változtatás nélkül igaz. A különbség csak a jelölésekben és a szóhasználatban van. Ezzel kapcsolatban vegyük észre, hogy ha n > m, akkor az sn – sm különbség éppen az (m + 1)-edik tagtól az n-edik tagig történő összegzést jelenti. 3.1.2. Tétel: (Cauchy-féle konvergencia kritériumnumerikus sorokra) A an numerikus sor akkor és csak akkor konvergens, ha tetszőleges ε > 0 (hibakorlát) esetén létezik olyan n0 pozitív egész szám (küszöbindex), hogy tetszőleges n, m > n0 (n > m) esetén n
teljesül, hogy
i m 1
ai . ■
350
Óbudai Egyetem BGK
Fejezetek a matematikából
Ezt a kritériumot az alábbiakban többször is alkalmazzuk majd a vizsgálatainkban. Két kérdést teszünk majd fel vizsgálataink során egy numerikus sorral kapcsolatban: 1. Létezik-e határértéke, tehát létezik-e a sornak összege? 2. Ha létezik a sornak összege, akkor mi az összeg? Mint látni fogjuk az 1. kérdésre nagyon sok esetben tudunk majd válaszolni, de a 2. kérdés az általános esetben akkor is bonyolult, ha tudjuk, hogy a sornak van összege. Ennek megállapítására csak különleges esetekben van módszer, általában ad-hoc módszereket alkalmazunk. Az egyetlen olyan numerikus sor, amelynek összegzésére általános érvényű összefüggéseket tudunk mondani, a mértani sor.
3.1.2. Mértani sor A legegyszerűbb sor vizsgálatával kezdjük. A „végtelen” mértani sort (a végtelen jelző elhagyható) a mértani sorozatból képezzük. Emlékeztetőül megjegyezzük, hogy a q kvóciensű mértani sorozatot az alábbi módon értelmezzük. an = qn–1, nN+ Írjuk fel a sorozat néhány tagját: 1, q, q2, q3, …, qn – 1,… Mint ismeretes, a mértani sorozat az alábbi konvergencia tulajdonságokkal rendelkezik.
, ha q 1 1, ha q 1 n 1 lim q 0, ha 1 q 1 divergens,ha q 1
3.1.2.Definíció: Az an = qn–1, nN+ mértani sorozatból képezett numerikus sort (végtelen) mértani sornak nevezzük. Ennek n-edik részletösszege n
sn qi 1 1 q q 2 ... q n 1 i 1
A mértani sorozat határérték tulajdonságai alapján meg tudjuk állapítani, hogy a mértani sor mely esetekben konvergens, sőt azt is, hogy mi az összege. Ehhez segítségül hívjuk a mértani sorozat első n db tagjának összegére vonatkozó összegképletet. sn 1 q q 2 ... q n 1
qn 1 ; ha q 1 q 1
Az előbbiek alapján világos, hogy a sor csak a –1 < q < 1 esetben konvergens, és ekkor határértéke 351
Óbudai Egyetem BGK
Fejezetek a matematikából
lim sn qi 1 i 1
1 1 ; ha q 1 q 1 1 q
Ha q> 1 akkor a sor összege +∞, ha q ≤ –1 akkor a sornak nem létezik összege. Ha q = 1 akkor ez az összegképlet nem használható, de ekkor sn = 1 + 1 + 1+… + 1 = n, a sorösszeg nyilván ekkor is végtelen. Általánosítsuk most a fenti sort. Legyen aR egy 0-tól különböző valós szám. Végtelen mértani sornak nevezzük az an = a∙qn–1 sorozatból képezett végtelen sort is, melynek n-edik részletösszege a következő. n
sn aqi 1 a aq aq 2 ... aq n 1 i 1
Világos, hogy ennek a sornak a konvergenciájáról pontosan azokat az állításokat mondhatjuk el, mint az előbbiekben. Az „általánosított” mértani sor pontosan akkor konvergens, ha –1 < q < 1, és ekkor a sor összege:
lim sn aqi 1 a aq aq 2 ... aq n 1 ... i 1
a ; ha 1 q 1 1 q
A mértani sor esetében tehát egyszerűen megállapítható a konvergencia ténye és a sor összege is könnyen kiszámítható. 3.1.1.Példa: Számítsuk ki az alábbi mértani sor összegét, ha létezik.
3k 1
k 1 2
2k 1
3 3k
3 21 4k 6 4 k 1 k 1
k
3 ]–1, 1[, tehát a sor konvergens. Összege 4 3 6 3k 1 22k 1 43 18 k 1 1 4
Az átalakítások mutatják, hogy a kvóciens, q =
3.1.2. Példa: Határozzuk meg az A = 0,12435353535… végtelen szakaszos tizedes tört közönséges tört alakját. Világos, hogy az A szám felírható egy végtelen numerikus sor alakjában a következő módon
A
124 35 35 35 124 35 1 1 ... 1 ... 1000 105 107 109 1000 105 102 104 352
Óbudai Egyetem BGK
Fejezetek a matematikából
Ebben felfedezhető egy mértani sor, melynek első tagja 1, kvóciense pedig q = 0,01. Mivel a kvóciens kisebb, mint 1 és nagyobb, mint –1 a mértani sor konvergens. Az összegképlet alapján az összegzés könnyedén végrehajtható.
A
124 35 1 124 35 100 124 35 12311 5 1000 10 1 1 1000 100000 99 1000 99000 99000 100
Egy paradoxon feloldásáról. Mielőtt folytatnánk a szigorúan matematikai vizsgálatokat a témakörben, megemlítünk egy filozófiai problémát, a Zénón által leírt paradoxont (Zénón, görög filozófus, i.e. 3-4. sz.), amely a leggyorsabb görög futó, Akhilleusz és a teknős futóversenyéről szól. Mivel Akhilleusz a leggyorsabb futó, x1 = 100 lépés kezdeti előnyt ad a teknősnek, majd kezdődik a „verseny”. a) Elsőként fizikai, vagy ha tetszik, tapasztalati oldalról közelítjük a kérdést. Ekkor világos, hogy Akhilleusz utoléri a teknőst. Egyszerű kinematikai problémaként kezelve, ha Akhilleusz v sebességgel fut a teknős pedig u (u < v) sebességgel halad, és a teknős előnye kezdetben x1, akkor a találkozásig eltelt t időre vonatkozólag felírható a következő egyenlet: vt ut x1 . Ezt a t időre megoldva kapjuk azt az időtartamot, amely ahhoz szükséges, hogy Akhilleusz utolérje a teknőst.
t
x1 v u
b) Filozófiai oldalról megközelítve a kérdést, Zénón arra a következtetésre jutott, hogy Akhilleusz nem érheti utol a teknőst. A következő módon gondolkodott: Ahhoz, hogy Akhilleusz odaérjen ahol a teknős volt az indulás pillanatában, szükség volt t1 időtartamra. Világos, hogy x vt1 x1 , ahonnan t1 1 . Ez egy pozitív mennyiség. Ennyi idő alatt a teknős megtett v u x2 ut1 x1 utat. Ahhoz, hogy Akhilleusz is megtegye ezt az utat, szükséges t2 időtartam. v x Világos, hogy vt2 x2 ahonnan t2 2 . Ha itt felhasználjuk az előző eredményt, a t2 időtartamra v 1u u x1 2 x1 . Ez ismét egy pozitív mennyiség. Ennyi idő alatt a teknős a következő adódik: t2 vv v u2 ismét távolodott, megtett x3 ut2 2 x1 utat. Akhilleusznak t3 időtartamra van szüksége, hogy v x ezt lefussa. Erre felírható, hogy vt3 x3 , ahonnan t3 3 . Helyettesítve ismét a legutóbbi v 2 u eredményt az adódik, hogy t3 3 x1 . Ismét egy pozitív mennyiség. A gondolatmenet v u n1 folytatható, könnyen látható, hogy az n-edik szakaszon az időtartam tn n x1 . Ugyancsak v
353
Óbudai Egyetem BGK
Fejezetek a matematikából
pozitív mennyiség. Zénón azt állította ezek alapján, hogy Akhilleusz nem érheti utol a teknőst, mert végtelen sokszor ismétlődik az a folyamat, hogy Akhilleusznak egy pozitív időtartamra van szüksége egy adott útszakasz megtételéhez. Vagyis egy olyan végtelen tagú összeg a keresett időtartam, melynek minden tagja pozitív. Ez az összeg Zénón szerint, csak a végtelen lehet. Az ókori görög filozófusoktól nem lehet elvárni, hogy a határérték és a végtelen sorok fogalmát megfelelő módon alkalmazzák. Gondolatmenetében nyilván az a hibás, hogy azt hitte, végtelen sok pozitív mennyiség összege szükségképpen végtelen. Mi már tudjuk, hogy ez nem igaz, ezáltal feloldjuk a paradoxont. Adjuk össze a kiszámított időtartamokat és összegezzük azokat.
x1 u x1 u 2 x1 u n1 x1 t t1 t2 t3 ... tn ... ... n1 .. v v v v2 v v v
u . Mivel a feltétel szerint v u
0, tehát a mértani sor konvergens. Az összegző képlet alkalmazásával azt kapjuk, hogy x1 x1 n 1 x u x t n1 1 v v 1 u v u v 1 v u n 1 v v v Vegyük észre, hogy ez éppen egy mértani sor, melynek kvóciense q
Amely megegyezik az elemi számítás eredményével.
3.1.3. A parciális törtekre bontás módszere Létezik egy viszonylag általános módszer, a parciális törtekre bontás vagy elemi résztörtekre bontás módszere, amellyel bizonyos típusú sorok összegét meg lehet határozni. A módszer ismert a racionális törtfüggvények integrálásának témaköréből, és a későbbiekben látjuk, hogy többek között még hasznos lesz a Taylor-sorfejtés és az inverz Laplace-transzformáció témakörében is. Numerikus sorok esetében a módszer akkor alkalmazható, ha a sorozat általános tagja – amelyből a numerikus sort képeztük – egy racionális törtfüggvény. Konkrét példákon mutatjuk be a módszer alkalmazását. 1 3.1.3. Példa: Vizsgáljuk a végtelen numerikus sort. A módszer lényege, hogy az n n 1 n 1 általános tagot, a racionális törtfüggvényt, elemi résztörtek összegére bontjuk. Ebben az esetben ez az alábbi összegre bontást jelenti:
1 A B n n 1 n n 1 Kérdés az A és B valós számok értéke. Hozzuk a törteket közös nevezőre:
354
Óbudai Egyetem BGK
Fejezetek a matematikából A n 1 Bn 1 n n 1 n n 1
Mivel itt a nevezők egyenlők a számlálóknak is azonosan egyenlőknek kell lennie tetszőleges természetes n-re. Ha a nevezőnek egyszeres gyökei vannak, mint ebben a példában, akkor célszerű a nevező gyökeit helyettesíteni. Ha n = 0 akkor adódik, hogy A = 1, ha n = –1 akkor pedig B = –1. Tehát a parciális törtekre bontott alak a következő:
1 1 1 n n 1 n n 1 Alkalmazzuk ezt a felbontást első lépésben az n-edik részletösszeg meghatározásánál: n
n 1 1 1 sn i i 1 i 1 i i 1 i 1
1 1 1 1 1 1 1 1 1 1 ... 2 2 3 3 4 n 1 n n n 1
Innen jól látható, hogy az összeg tagjai páronként eltűnnek, hiszen összegük zérus, megmarad az első és utolsó tag. 1 sn 1 n 1 Ezzel meg tudtuk határozni az n-edik részletösszeget „zárt alakban”. Ebből következik a sor összege. 1 1 lim sn lim 1 1 i i 1 n 1 i 1 A határérték tehát 1, vagyis a sor összege 1. A módszerrel tehát ki tudtuk számítani a sor összegét. A példán keresztül látható a módszer alkalmazhatósága. 3.1.4. Példa: Vizsgáljuk meg konvergencia szempontjából a
8
n3 4 n
numerikus sort. Az
n 3
előző példabeli eljárás mintájára elvégezzük a tört elemi résztörtekre bontását:
8 n3 4n
8 A B C 1 2 1 n n 2 n 2 n 2 n n 2 n 2 n n 2
Ezek után vizsgáljuk meg a sor n-edik részletösszegét:
355
Óbudai Egyetem BGK
Fejezetek a matematikából n
n 8 2 1 1 i i 2 i 2 i 2 i i 2 i 3 i 3
sn
2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 2 1 1 ... 1 3 5 2 4 6 3 5 7 4 6 8 n 3 n 1 n 1 n 2 n n 2
Ebben az összegben számos tagot hármasával tudunk csoportosítani úgy, hogy az összeg zérus. Az összevonást elvégezve, a megmaradó tagokat feltüntetve kapjuk az n-edik részletösszeget "zárt alakban": n 2 1 2 1 2 1 1 1 2 1 2 1 1 1 sn 1 i2 i i2 3 2 4 3 4 n 1 n 1 n n n 1 n 2 i 3
ennek az összegnek a határértéke a sor összege. Mivel az utolsó 6 tag mindegyike 0-hoz tart, a sor összege az első 5 tag összegével egyezik meg:
8
2
1
2
1
1
11
n3 4n 1 3 2 4 3 4 12
n 3
3.1.4. Konvergencia kritériumok Az alábbiakban olyan tételeket ismertetünk, amelyekkel eldönthető egy numerikus sorról, hogy létezik-e határértéke vagy nem. Ezeket a módszereket nevezik konvergencia-kritériumoknak. A konvergencia kritériumok azonban nyitva hagyják azt a kérdést, hogy amennyiben a kérdéses sornak van összege, mi az összeg, és nem adnak programot a sorösszeg meghatározására sem. Erre nem is léteznek általános módszerek. Néhány összegzést azonban a példákban bemutatunk. Kezdjük egy egyszerű szükséges feltétellel. 3.1.3. Tétel: (A konvergenciaszükséges feltétele). Ha a ∑an sor konvergens, akkor lim(an) = 0. Bizonyítás: A tétel állítása egyszerűen következik a 3.1.2. tételből. Ha a sor konvergens, akkor tetszőleges ε-hoz létezik a tételnek megfelelő n0 küszöbindex. Alkalmazzuk a Cauchy-kritériumot tetszőleges m > n0 és n = m + 1 esetére. Ekkor azonnal következik, hogy ha m > n0 akkor am 0 am 0 , és éppen azt jelenti, hogy a sorozat 0-hoz tart. ■ Ez azt jelenti, hogy ha egy sorozatból végtelen sort képezünk, csak abban az esetben lehet konvergens a sor, ha a sorozat a 0-hoz konvergál. Az alkalmazás fordított logikával működhet. Ha egy sorozatról igazoljuk, hogy nem tart nullához, akkor a belőle képezett sor biztosan divergens. Kihangsúlyozzuk, hogy a feltétel nem elégséges, tehát létezik olyan sor, amelyre igaz a lim(an) = 0 feltétel és divergens. A későbbiekben látunk példát ilyen sorokra.
356
Óbudai Egyetem BGK 3.1.5.Példa: Konvergens-e a
Fejezetek a matematikából 3n 1
2n 5 numerikus
n 1
3n 1 3 sor? Mivel lim 0 , a sor 2n 5 2
biztosan divergens. Az alábbiakban elégséges feltételeket adunk a konvergenciára vonatkozólag. A tételeket a sorok két osztályára fogalmazzuk meg. Először pozitív tagú majd váltakozó előjelű sorokat vizsgálunk.
3.1.4.1. Pozitív tagú sorokra vonatkozó kritériumok A szakirodalomban találkozhatunk a „nemnegatív tagú sor” elnevezéssel is. Ez abban különbözik a címben szereplő sortól, hogy a sorozat tagjai között, amelyből a sort képezzük, előfordulhat a nulla. Ez azonban nyilván semmilyen szempontból nem befolyásolja a sor konvergenciáját, ezért a vizsgálatainkból kihagyjuk. A an sor értelem szerűen pozitív tagú, ha an > 0 minden nN+ esetén. Kihangsúlyozzuk, hogy pozitív tagú sorok esetén két eset fordulhat elő. Ha a sor konvergens, akkor az összeg nyilvánvalóan véges érték, egy valós szám és az is nyilvánvaló, hogy az összeg csak pozitív szám lehet. Ha azonban a sor divergens, akkor az összeg szükségképpen +∞. 3.1.4.Tétel: ( Összehasonlító kritérium vagy Majoráns/Minoráns kritérium). Legyenek ∑an és ∑bn pozitív tagú sorok. Ha létezik olyan n0 index, hogy n>n0 esetén an ≤ bn és a) ∑bn sor konvergens, akkor ∑an sor is konvergens (Majoráns-kritérium). b) ∑an sor divergens, akkor ∑bn sor is divergens (Minoráns-kritérium). Az a) esetben a ∑bn sort a ∑ansor konvergens majoránsának nevezzük, a b) esetben pedig azt mondjuk, hogy a ∑an sor a ∑bnsor divergens minoránsa. Bizonyítás: A tétel triviálisan igaz. Hiszen ha pl. az a) pontban a majoráns sor konvergens, akkor az összege véges, valós szám. Ekkor a ∑an sor összege szükségképpen véges, hiszen a ∑bnsor összegénél kisebb vagy egyenlő pozitív való szám lehet csak, ami éppen azt jelenti, hogy a majorált sor konvergens. ■ A tétel alkalmazásaképpen vizsgáljunk meg két nevezetes sort. 3.1.6.Példa: Vizsgáljuk meg konvergencia szempontjából a
1
n ún. harmonikus sort. Írjuk fel a
n 1
sort „kibontva”, majd becsüljük az egyes tagokat megfelelően csoportosítva.
357
Óbudai Egyetem BGK
Fejezetek a matematikából 1 1
1
1 1
1 1
1
n 1 2 3 4 5 ... 8 9 ... 16 ...
n 1
1 1 1 1 1 1 1 1 ... ... ... 2 4 4 8 8 16 16 1 1 1 1 1 ... 2 2 2 2 Tehát alulról tudtuk becsülni a harmonikus sort egy numerikus sorral, azaz minoráltuk. Az 1 1 sor pedig nyilvánvalóan divergens, összege végtelen, ez a sor tehát egy divergens 2 n 1 minoráns sor. Ebből következik, hogy a harmonikus sor divergens. Megjegyezzük, hogy 1 lim 0 , tehát a szükséges feltétel teljesül (3.1.3.tétel), a sor azonban divergens. n A sor elnevezésével kapcsolatban megjegyezzük, hogy a sort azért nevezzük harmonikusnak, mert arra a sorozatra, amelyből képezzük, igaz a következő: minden tagja a hozzá képest szimmetrikusan elhelyezkedő tagok harmonikus közepe. Valóban H a, b
1 2 2 1 1 ; Eszerint : H , 1 1 n k n k n k n k 2 n n a b 2
3.1.7.Példa: Vizsgáljuk meg konvergencia szempontjából a
1
n2 numerikus sort. Alkalmazzuk
n 1
az alábbi nyilvánvaló becslést. 1 n2
Vegyük észre, hogy a
1
n 1 n
1 ; ha n 2 n 1 n
sor az első tagtól eltekintve ugyanaz a sor, mint amit a 3.1.3.
n2
példában vizsgáltunk. Ott kiderült, hogy ez a sor konvergens. Tehát találtunk egy olyan 1 konvergens numerikus sort, amely a sort n ≥ 2 esetén majorálja. Tehát ez a sor a vizsgált 2 n 1 n 1 sor konvergens majoránsa, azaz a sor konvergens. 2 n n 1 Megjegyezzük ezzel a sorral kapcsolatban azt az Euler által bizonyított érdekes tényt, hogy a sor összege
1
n2
n 1
2 6
. Ezt az egyenlőséget jelen pillanatban nem tudjuk igazolni, mert nincs a
kezünkben a szükséges apparátus, azonban később a Fourier-sorok elméletében, a 3.3 fejezetben 358
Óbudai Egyetem BGK
Fejezetek a matematikából
bizonyítani fogjuk. Hangsúlyozzuk azonban ennek a ténynek a fényében azt, hogy a végtelen tagú összegek sokszor másképpen viselkednek, mint a véges összegek. Erre a későbbiekben is rámutatunk majd más szempontból. Ebben a példában az látszik, hogy az összeg tagjai mind racionális számok, az összeg azonban irracionális. Végtelen sok racionális szám összege tehát nem szükségképpen racionális. Véges összeg esetében ilyen természetesen nem fordulhat elő. 3.1.5.Tétel:( Cauchy-féle gyök-kritérium) Tegyük fel, hogy a ∑an sor pozitív tagú, és tegyük fel, hogy az
n an ,
nN+ sorozat
konvergens. Legyen lim n an q . Ezen feltételek és jelölés esetén, ha q< 1 akkor a sor konvergens, ha q> 1 akkor a sor divergens, és ha q = 1 akkor mindkét eset lehetséges, ebben az utóbbi esetben tehát a gyökkritériummal nem dönthető el a konvergencia. Bizonyítás: A tétel a majoráns kritériummal igazolható. A konvergencia esetét tekintve ha q< 1, akkor 1 – q> 0. Legyen ε = (1 – q)/2. Ekkor ε > 0 továbbá q + ε < 1 is teljesül. Mivel az n an , nN+
sorozat konvergens és határértéke q, ezért ehhez az ε-hoz létezik olyan n0 küszöbindex, hogy ha n n>n0, akkor n an q azaz an q . Mivel q + ε< 1 a
q
i
sor egy konvergens
i 1
mértani sor, amely majorálja a ∑an sort, tehát a 3.1.4. tétel szerint a ∑an sor konvergens. A divergencia hasonló módon igazolható. ■ 3.1.8. Példa: Vizsgáljuk meg, hogy konvergens-e a 2n n2 2n n 1
n
numerikus sor. A képletre tekintve azonnal látszik, hogy célszerű alkalmazni a gyök-kritériumot. n
2n 2n lim n lim 2 0 1 2 n n n n Tehát a sor konvergens. A sor összegének meghatározására azonban nincs általános módszer. 3.1.9. Példa: Vizsgáljuk meg, hogy konvergens-e a 3n 2 3n 5 n 1
n2
numerikus sor. A képlet alapján ismét látszik, hogy célszerű alkalmazni a gyök-kritériumot.
359
Óbudai Egyetem BGK
Fejezetek a matematikából n
3n 2 lim n 3n 5
n2
2 2 7 1 e3 3n 2 3 n lim e3 1. lim 5 5 3n 5 1 e3 3n n
Mivel a határérték nagyobb, mint 1, a sor divergens. 3.1.10. Példa: Illusztráljuk azt az esetet, amikor q = 1. A 3.1.6. és 3.1.7. példák eredményére támaszkodunk. A 3.1.6. példa alapján tudjuk, hogy a harmonikus sor divergens, másrészt 1 1 1 lim n lim 1 . A 3.1.7. példabeli sor azonban konvergens, de ebben az esetben is igaz, n n n 1 hogy lim n
1 n
2
lim
1
nn
2
1 12
1 . Megmutattuk tehát, hogy a q = 1 esetben nem
következtethetünk sem a konvergenciára sem a divergenciára. Ha egy vizsgálat során q = 1 eredmény adódik, akkor egy másik kritériumot kell alkalmazni a konvergencia eldöntésére. A 3.1.5. tétellel szoros rokonságban áll az alábbi kritérium. 3.1.6.Tétel:( d’Alembert-féle hányados-kritérium)
a Tegyük fel, hogy a ∑an sor pozitív tagú, és tegyük fel, hogy az n 1 , nN+ sorozat an a konvergens. Vezessük be a lim n 1 q jelölést. Az említett feltételekkel és a bevezetett an jelölés mellett, ha q< 1 akkor a sor konvergens, ha q > 1 akkor a sor divergens, és ha q = 1 akkor mindkét eset lehetséges, ebben az utóbbi esetben tehát a hányados kritériummal nem dönthető el a konvergencia. Bizonyítás: A 3.1.5. tétel bizonyításához hasonlóan ismét a majoráns kritériumot használjuk. A konvergencia esetét tekintve ha q < 1, akkor 1 – q > 0. Legyen ε = (1 – q)/2. Ekkor ε > 0 továbbá a q + ε < 1 is teljesül. Mivel az n 1 , nN+ sorozat konvergens és határértéke q, ezért ehhez az an a ε-hoz létezik olyan n0 küszöbindex, hogy ha n>n0, akkor n 1 q azaz an 1 q an . an Hasonlóan
adódik,
hogy
an 2 q an ; an 3 q an ;...; an k q an ;... 2
3
k
Ebból az következik, hogy az q an ; k Z sorozat egy 1-nél kisebb kvóciensű mértani k
sorozat, a belőle képezett mértani sor konvergens. Tehát a
q
k
an egy konvergens
k
mértani sor, az említett okok miatt a ∑an sor egy konvergens majoránsa. Ebből következik, hogy a ∑an sor konvergens. A divergencia hasonlóan igazolható. ■
360
Óbudai Egyetem BGK
Fejezetek a matematikából
3.1.11. Példa: Vizsgáljuk meg, hogy konvergens-e a 3n 2 n! n 1
numerikus sor. Mivel a képletben hatványozás és faktoriális szerepelnek, világos, hogy könnyen oszthatjuk a szomszédos tagokat. Alkalmazzuk tehát a hányados-kritériumot. 3n 3 a n! 3 lim n 1 lim 0 1 lim n 2 an n 1 ! n 1 3
tehát a numerikus sor konvergens. Ebben az esetben „véletlenül” meg tudjuk majd mondani a sor összegét a Taylor-sorok elméletének tárgyalása során. Ez ugyanis egy nevezetes függvény Taylor-sorának adott pontbeli helyettesítési értéke. A válaszra még visszatérünk később a 3.2. fejezetben. 3.1.12. Példa: Vizsgáljuk meg hogy konvergens-e a nn n! n 1
numerikus sor. Ismét a hányados kritérium alkalmazása látszik célszerűnek. n n n 1n 1 n ! an 1 n 1 1 lim lim lim lim 1 e 1 n 1! nn an n n
Tehát ez a sor divergens, az összeg ∞. 3.1.13. Példa: Ismét illusztráljuk azt az esetet, amikor q = 1. Ugyancsak a 3.1.6. és 3.1.7. példák eredményére támaszkodunk. A 3.1.6. példa alapján tudjuk, hogy a harmonikus sor divergens, 1 n n 1 lim 1 . A 3.1.7. példabeli sor azonban konvergens, de ebben az másrészt lim n 1 1 n esetben is igaz, hogy 1 2 n 12 lim n 1 . lim 1 n 1 2 n
361
Óbudai Egyetem BGK
Fejezetek a matematikából
Megmutattuk tehát, hogy a q = 1 esetben nem következtethetünk sem a konvergenciára sem a divergenciára. Ha egy vizsgálat során q = 1 eredmény adódik, akkor egy másik kritériumot kell alkalmazni a konvergencia eldöntésére. Bizonyos esetekben improprius integrálok kiszámításával is eldönthető a konvergencia ténye. 3.1.7.Tétel:( Integrálkritérium) Tegyük fel, hogy létezik olyan n0N+pozitív egész szám, hogy az f valós függvény az [n0, +∞[ intervallumon monoton csökkenő pozitív függvény. Ekkor a
f (i )
i n0
numerikus sor és az
f ( x)dx
n0
improprius integrál egyszerre konvergens illetve divergens. Másképpen fogalmazva, ha az integrál konvergens akkor a sor is konvergens, és fordítva, továbbá ha az integrál divergens akkor a sor is divergens és fordítva. Bizonyítás: (vázlat) A bizonyítást inkább csak szemléltetjük. Ha összehasonlítjuk a végtelen összeget az improprius integrállal, akkor világos, hogy az összeg az integrálnak éppen egy olyan integrál közelítő összege, amelyben a részintervallumok mind egységnyi hosszúak, és a függvényértéket minden részintervallumban a bal oldali végpontban számoljuk. Ha tekintetbe vesszük, hogy a függvény monoton csökkenő, akkor az is látható, hogy ez egy felső összeg. Nem meglepő tehát a tétel állítása, hiszen arról szól, hogy az integrál és a közelítő összege egyszerre konvergens illetve divergens. ■ 3.1.14. Példa: Vizsgáljuk meg hogy konvergens-e a
1
n2 1
n 1
numerikus sor. Definiáljuk az f függvényt a következő módon: f x
1
. Világos, hogy a x 1 függvény pozitív és az is, hogy a pozitív valós számok halmazán a függvény szigorúan monoton csökkenő, hiszen a nevező szigorúan monoton növekszik. Ez azt jelenti, hogy most n0 = 1 választással alkalmazhatjuk az integrál kritériumot.
1
x2 1 dx arctg x1
1
lim arctg x arctg1 x
362
2
4
2
4
Óbudai Egyetem BGK
Fejezetek a matematikából
Az improprius integrál konvergens, tehát az integrál értéke véges. Ez a kritérium szerint azt jelenti, hogy a numerikus sor konvergens. Hangsúlyozzuk azonban, hogy arról nincs szó, hogy a sor összege megegyezne az integrál értékével. Csak annyit állíthatunk, hogy a sor összege véges. 3.1.15. Példa: Vizsgáljuk meg hogy konvergens-e a
n
n2 1
n 1
numerikus sor. Definiáljuk az f függvényt a következő módon: f x
x
. Az világos, hogy a x 1 függvény pozitív a pozitív valós számok halmazán. A függvény monotonitása azonban nem nyilvánvaló. Ehhez képezzük a derivált függvényt:
2
x 2 1 x 2 x 1 x2 . Ebből f ' x 2 2 2 2 x 1 x 1
már következik, hogy ha x ≥ 1 akkor a függvény monoton csökkenő, tehát az integrál kritérium ismét alkalmazható n0 = 1 választással.
x
2 1 x 1
dx
1 2x 1 dx ln x 2 1 2 x2 1 2 1
lim ln x 2 1 ln 2 ln 2 1 x
Az improprius integrál divergens, amiből a kritérium szerint az következik, hogy a numerikus sor divergens, az összege ∞.
3.1.4.2. Váltakozó előjelű sorokra vonatkozó konvergenciakritérium Az előzőekben hangsúlyozottan pozitív tagú sorokra vonatkozó kritériumokat vizsgáltunk. Ebben a pontban olyan sorokat vizsgálunk, amelyekben a szomszédos tagok előjele eltérő, egy pozitív tagot negatív követ és fordítva. Az ilyen sorokat nevezzük váltakozó előjelű vagy másképpen alternáló soroknak. A pontos definíció a következő: 3.1.3.Definíció:A∑an sort váltakozó előjelűnek nevezünk, ha teljesül, hogy an∙an+1< 0, ha nN+. Váltakozó előjelű sorokra vonatkozik Leibniz tétele. 3.1.8.Tétel: ( Leibniz-kritérium) Legyen a ∑an egy váltakozó előjelű sor, és tegyük fel, hogy az abszolút értékek
an , nN+
sorozata monoton csökkenő módon a 0-hoz tart. Ekkor a sor konvergens. Bizonyítás: A bizonyításhoz a Cauchy-féle konvergencia kritériumot használjuk. Felhasználjuk, hogy az abszolút értékek sorozata monoton csökkenő, azaz ak ak 1 minden pozitív egész
363
Óbudai Egyetem BGK
Fejezetek a matematikából
k-ra. Ekkor egy bizonyos n0 küszöbindexnél nagyobb n, m egészekre, amelyekre m < n, páratlan számú tag esetén teljesül, hogy n
i m 1
ai am 1 am 2 am 3 ... an 1 an am 1 am 2 am 3 ... an 1 an
Legyen most ε > 0 tetszőleges, és legyen n0 olyan egész, amelyre m > n0 esetén igaz, hogy am . Ilyen n0 és ε létezik, hiszen a feltétel szerint az abszolút értékek sorozata 0-hoz tart. Ha az előbbi egyenlőtlenségben figyelembe vesszük a monoton csökkenést, akkor azt kapjuk, hogy n > m > n0 esetén n
i m 1
ai am 1 am 2 am 3 ... an 1 an am 1 am
ugyanis a zárójelezett különbségek mind nem negatívok a monoton csökkenés miatt. Ha páros számú tagot veszünk figyelembe az összegben, akkor az egyenlőtlenség ugyancsak igaz, hiszen az utolsó tag előjele az összegben negatív, tehát az összeghez egy nem pozitív számot veszünk hozzá. A kapott egyenlőtlenség a Cauchy kritérium szerint éppen azt jelenti, hogy a váltakozó előjelű sor konvergens. ■ 3.1.16. Példa: Későbbi vizsgálatok érdekében tűzzük ki az alábbi, nagyon egyszerű példát. Vizsgáljuk meg, hogy konvergens-e a
1
n 1 1
n 1
n
numerikus sor. Ezt az alternáló sort „hiperharmonikus” sornak nevezzük. Az abszolút értékekből képezett sor a harmonikus sor (3.1.6. példa), amelyről tudjuk, hogy divergens. 1 Számítások nélkül azonnal nyilvánvaló, hogy az an ; n N sorozat szigorúan monoton n csökkenő és a 0-hoz tart. Ez azt jelenti, hogy a hiperharmonikus sor Leibniz típusú, tehát konvergens. Ebben az esetben kiszámítjuk a sor összegét is. Ennek egyik oka, hogy az eredmény nevezetes, másrészt illusztrálja a számítás azt is, hogy az összegzés módszere mennyire specifikus. Vizsgáljuk meg elsőként a sor egy páros indexű részletösszegét. Azonos átalakításokkal a következőt kapjuk. 1 1 1 1 1 1 1 1 1 1 s2n 1 ... 1 ... 2 ... 2 3 2n 2 3 2n 1 2n 2n 2 4 1 1 1 1 1 1 1 1 ... 1 ... 2 3 2 n 1 2n 2 3 n
364
Óbudai Egyetem BGK
Fejezetek a matematikából
1 1 1 1 1 1 1 1 1 ... ... n 1 n n 1 n 2 2n 1 2n n 1 1 1 2 1 1 n n n n
A kapott összegen azt kell észrevenni, hogy nem más, mint egy integrál közelítő összeg, 1 pontosan az f x függvény integrál közelítő összege az [1, 2] intervallumra vonatkozólag, x mely összegben az [1, 2] intervallumot n egyenlő hosszúságú részre osztottuk, és minden részintervallumban a jobb oldali végpontban számítottuk a függvényértéket. Ebből következően a 2
1 páros indexű részletösszegek határértéke a következő: lim s2n dx ln 2 . A páratlan x n 1
1 1 0 , ezért . Mivel lim 2n 1 2n 1 a páratlan indexű részletösszegek sorozata is ln2-höz tart. Kaptuk tehát a nevezetes eredményt, miszerint indexű részletösszeg a következő módon írható: s2n 1 s2n
1
n 1 1
n
n 1
ln 2
3.1.17. Példa: Vizsgáljuk meg hogy konvergens-e a
1
n 1
n
n 1 n
2
numerikus sor. Az világos, hogy a sor váltakozó előjelű. A 3.1.15. példabeli számítás eredménye n n n alapján az is következik, hogy az abszolút értékek an 1 sorozata monoton n2 1 n2 1 1 n csökkenő. Továbbá az is igaz, hogy lim an lim lim n 0 , tehát a sor Leibniz 2 1 n 1 1 2 n típusú, azaz konvergens. Ha egy numerikus sorra teljesülnek a tétel feltételei, akkor azt szokás Leibniz típusú sornak nevezni. Ezzel a terminológiával azt mondhatjuk, hogy ha egy sor Leibniz típusú akkor konvergens. Azonban a tétel nem alkalmazható fordítva, másképpen fogalmazva, a tétel elégséges feltétel, de nem szükséges. Előfordulhat olyan eset, hogy egy váltakozó előjelű sor nem Leibniz típusú és mégis konvergens. Erre vonatkozik a következő példa.
365
Óbudai Egyetem BGK
Fejezetek a matematikából
3.1.18. Példa: Vizsgáljuk meg hogy konvergens-e a módon definiáljuk.
an sor, ha az an sorozatot a következő
1 ; ha n 2k 1 (n ptl) 3n an 1 ; ha n 2k (n ps) 2n
Az világos, hogy a sor váltakozó előjelű. Azonban a sor nem Leibniz típusú, ugyanis az abszolút 1 1 értékek sorozata nem monoton csökkenő, mert egyrészt nyilvánvalóan igaz, hogy , 22k 32k 1 1 1 másrészt viszont az egyenlőtlenség is fennáll, hiszen azonos átalakításokkal a 2k 1 2k 2 3 2 k
4 9 formára hozható, amely minden pozitív egész kitevőre teljesül. Ami azt jelenti, hogy 3 4 a2k a2k 1 viszont a2k 1 a2k 2 . Tehát a sorozat valóban nem monoton csökkenő. Ennek ellenére a sor konvergens, ugyanis összege két konvergens mértani sor összegeként áll elő.
1 1 1 1 1 1 1 9 1 4 1 1 a n 3 9 4 3 1 4 1 3 8 4 3 24 n 1 k 0 k 1 1 1 9 4 k
k
366
Óbudai Egyetem BGK
Fejezetek a matematikából
3.1.5. Abszolút és feltételes konvergencia A numerikus sorok, mint végtelen tagú összegek gyakran meglepően viselkednek. Egy példát már mutattunk – egyelőre bizonyítás nélkül –, a 3.1.7. példában, mely szerint végtelen sok racionális szám összege irracionális. Ez bizonyítással együtt előfordult a hiperharmonikus sor esetében is a 3.1.16. példában. Ez azonban nem az egyetlen meglepő tulajdonsága a végtelen összegeknek. Felmerül a kérdés, hogy egy végtelen összeg esetében fel lehet-e cserélni a tagok sorrendjét anélkül, hogy az összeg megváltozna. Véges összeg esetén tudjuk a választ, természetesen igen és az is nyilvánvaló, hogy ha egy végtelen sorban véges sok tag sorrendjét változtatjuk meg, akkor az összeg nyilván nem változik meg. Azonban megváltoztatható egy sor tagjainak sorrendje úgy, hogy végtelen sok tagot érint a csere. A válasz a kérdésre ebben az esetben nem nyilvánvaló. A numerikus sorok két osztályba sorolhatók ebből a szempontból. Az egyik osztályra nincs hatással a sorrendcsere a másikra lehet hatással. Ezt tisztázzuk az alábbiakban elsősorban fogalmak ismertetésével és egy példával. 3.1.4. Definíció:A∑an sortabszolút konvergensnek nevezzük, ha az abszolút értékekből képezett sor, tehát a an sor is konvergens. Feltételesen konvergensnek nevezzük a ∑ansort ha nem abszolút konvergens. A fogalomkörrel kapcsolatban világos, hogy a kérdésfeltevésnek akkor van igazán értelme, ha a sor amit vizsgálunk, nem pozitív tagú. Egy pozitív tagú sor esetében ugyanis az abszolút konvergencia egybeesik a konvergenciával, hiszen a sor és az abszolút értékekből képezett sor egy és ugyanaz a sor. Az alábbi illusztráló példáinkban tehát olyan sorokat vizsgálunk, amelyek nem pozitív tagúak. 3.1.19. Példa: A 3.1.16. példában láttuk, hogy a hiperharmonikus sor konvergens. Ezen sor abszolút értékeiből képezett sor azonban a harmonikus sor, amely divergens (3.1.6. példa). Kijelenthetjük tehát, hogy a
1
n 1 1
n
n 1
hiperharmonikus sor feltételesen konvergens. 3.1.20. Példa: A 3.1.15. és a 3.1.17. példák eredményeiből következik, hogy a
1
n 1
n
n2 1 n
numerikus sor is feltételesen konvergens. 3.1.21. Példa: A 3.1.18. példában szereplő váltakozó előjelű sor abszolút konvergens, hiszen az abszolút értékekből képezett sor két konvergens mértani sorra bontható.
367
Óbudai Egyetem BGK
Fejezetek a matematikából
Igen könnyen igazolhatunk egy pozitív tényt az abszolút konvergens sorokkal kapcsolatban. 3.1.9. Tétel: Ha a ∑an sor abszolút konvergens akkor konvergens. Bizonyítás: Ez a tény a Cauchy-kritériumon és a háromszög egyenlőtlenségen múlik. Legyen ε > 0 tetszőleges. Ekkor az abszolút konvergencia miatt létezik n0 küszöbindex, hogy tetszőleges n
n, m >n0 (n > m) esetén teljesül, hogy n
i m 1
ai . Ekkor
i m 1 n
ai
i m 1
ai
n
i m 1
ai
tehát a ∑an sor konvergens.■ A tagok sorrendjének megváltoztatása szempontjából az abszolút és feltételesen konvergens sorok lényegesen különböző módon viselkednek. Ennek megvilágítását segíti elő az alábbi fogalom. 3.1.5. Definíció: Legyen az i: N+ → N+ a pozitív egészek halmazának egy kölcsönösen egyértelmű leképezése a pozitív egész számok halmazára ("bijekció"). Ez másképpen azt jelenti, hogy az in számok halmaza megegyezik a pozitív egészek halmazával, de ha növekvő indexek szerint sorba rendezzük a halmaz elemeit, akkor a sorrend eltér a természetes sorrendtől. Ezzel az értelmezéssel és jelöléssel a ain numerikus sort a an sor egy átrendezésének nevezzük. Ez tehát annyit jelent, hogy a sor tagjait eltérő sorrendben adjuk össze, és ismét hangsúlyozzuk, hogy kérdés az összegek egyenlősége tekintetében csak akkor merül fel, ha végtelen sok tag sorrendjét megváltoztatjuk. Az átrendezéssel kapcsolatban két nevezetes tételt említünk bizonyítás nélkül. 3.1.10. Tétel: Ha a ∑an sor abszolút konvergens akkor tetszőleges
ain átrendezése is abszolút
konvergens, és az átrendezett sor összege megegyezik az eredeti sor összegével. ■ Ez a tétel lényegében azt mutatja, hogy az abszolút konvergens sorok azok, amelyek a jelzett szempont szerint úgy viselkednek mint a véges összegek. A feltételesen konvergens sorok azonban lényegesen különböznek ettől az osztálytól. Erre vonatkozik Riemann híres tétele feltételesen konvergens sorok átrendezéséről. 3.1.11. Tétel: (Riemann) Ha a ∑an sor feltételesen konvergens, akkor tetszőleges valós A szám esetén létezik a sornak olyan átrendezése amelynek összege A, továbbá létezik a sornak olyan átrendezése is amelynek összege végtelen és létezik a sornak olyan átrendezése is amely átrendezésnek nem létezik összege. ■
368
Óbudai Egyetem BGK
Fejezetek a matematikából
A tételt nem bizonyítjuk, ehelyett illusztrációképpen egy példát hozunk olyan átrendezésre, melynek összege különbözik az eredeti, átrendezetlen sor összegétől. n 1 1 3.1.22. Példa: Vizsgáljuk a 1 hiperharmonikus sort. Erről a 3.1.16. példában n n 1 bebizonyítottuk, hogy konvergens és összege ln2, a 3.1.19. példában pedig megmutattuk, hogy feltételesen konvergens. A hiperharmonikus sor n-edik részletösszegét jelölje ebben a példában sn. Rendezzük át ezt a sort két különböző módon. a) Elsőként rendezzük át úgy, hogy egy pozitív tagot két negatív előjelű tag kövessen. Vizsgáljuk * meg ennek az átrendezett sornak egy 3n elemű részletösszegét, jelölje ezt a részletösszeget s3n . 1 1 1 1 1 1 1 1 1 1 1 s3*n 1 ... 2 4 3 6 8 5 10 12 2n 1 2 2n 1 4n
Minden egyes zárójelben vonjuk össze az első két tagot, majd a kapott összeg nevezőjéből emeljünk ki 2-t. Ekkor a következő adódik: 1 1 1 1 1 1 1 1 1 1 1 s3*n 1 ... 2 n 1 2 2 n 1 4 n 2 4 3 6 8 5 10 12
1 1 1 1 1 1 1 1 ... 2 4 6 8 10 12 2 2n 1 2 2n 1 1 1 1 1 1 1 1 1 ... 2 2 3 4 5 6 2n 1 2n
Vegyük észre, hogy a zárójeles összeg az átrendezetlen hiperharmonikus sor 2n-edik * részletösszege. Ennek ismert a határértéke, ln2. Eszerint az átrendezett sor s3n részletösszegének 1 határértéke ln 2 , ugyanis 2 1 1 lim s3*n lim s2n ln 2 2 2
1 valamint azt, hogy 2n 1 1 1 1 s3*n 2 s3*n , akkor tekintetbe véve, hogy lim 0 , azt kapjuk, hogy az 2n 1 2 2n 1 2n 1 1 ln 2 , tehát a fele a említett módon átrendezve a hiperharmonikus sort, annak összege 2 hiperharmonikus sor összegének. Ha
most
még
figyelembe
vesszük,
hogy
369
s3*n1 s3*n
Óbudai Egyetem BGK
Fejezetek a matematikából
b) Rendezzük most át olyan módon, hogy két pozitív előjelű tagot kövessen egy negatív előjelű tag. A tagokat célszerű hármasával csoportosítani. Az átrendezett sor 3n indexű részletösszege így a következő. 1 1 1 1 1 1 1 1 1 1 1 s3**n 1 ... 3 2 5 7 4 9 11 6 4n 3 4n 1 2n
Ezt az összeget egészítsük ki úgy, hogy szerepeljen benne az átrendezetlen hiperharmonikus sor s4n részletösszege. 1 1 1 1 1 1 1 1 1 1 1 s3**n 1 ... 3 2 5 7 4 9 11 6 4n 3 4n 1 2n 1 1 1 1 1 ... 4n 2 4n 2n 2 2n 4 2n 6 1 1 1 1 1 ... 4n 2 4n 2n 2 2n 4 2n 6
Megjelent tehát az összegben az s4n részletösszeg. Az utolsó zárójeles összeg minden tagjának nevezőjéből emeljünk ki 2-t. Ekkor a következő adódik. 1 1 1 1 1 1 s3**n s4n ... 2 n 1 n 2 n 3 2n 1 2 n
Ha visszatekintünk a 3.1.16. példa megoldására, akkor észrevehetjük, hogy a kapott zárójelben éppen az s2n áll. Így az átrendezett sor 3n indexű részletösszegének határértéke:
1 1 3 lim s3**n lim s4n lim s2n ln 2 ln 2 ln 2 2 2 2 Ha végül figyelembe vesszük, hogy s3**n 1 s3**n
1 1 1 , továbbá s3**n 2 s3**n , 4n 1 4n 1 4 n 3
1 1 valamint azt, hogy lim lim 0 , akkor kapjuk, hogy az átrendezett sor összege 4n 1 4n 3
3 lim sn** ln 2 2 tehát a hiperharmonikus sor összegének a
3 -szerese. 2
370
Óbudai Egyetem BGK
Fejezetek a matematikából
Mutattunk tehát két különböző átrendezést, amely esetén a sorösszeg különbözik az eredeti összegtől is és egymástól is. Ezzel azonban még nem merítettük ki az összes lehetőséget, amely a hiperharmonikus sorban rejlik. c) Igazolható a következő: Ha a hiperharmonikus sort úgy rendezzük át, hogy a sorban p db pozitív előjelű tagot q db negatív előjelű tag követ, akkor az átrendezett sor összege
1 p lim sn ln 2 ln 2 q Javasoljuk a tisztelt Olvasónak, hogy ellenőrizze, az a) és b) pontbeli eredmények összhangban vannak ezzel az általános eredménnyel.
371
Óbudai Egyetem BGK
Fejezetek a matematikából
3.2. Függvénysorok, Taylor-sorok 3.2.1. Függvénysorozatok általános fogalma, konvergenciája A végtelen numerikus sorfogalmát könnyen általánosíthatjuk úgy, hogy a sorozat tagjai, amelyből a sort képezzük nem valós számok, hanem függvények. 3.2.1.Definíció: Legyen I a valós számok R halmazának rögzített intervalluma és tegyük fel, hogy az fn(x) (nN+) függvények mindannyian értelmezve vannak az I intervallumon. Azt a függvényt amely minden n pozitív egész számhoz hozzárendeli az fn(x) függvényt, függvénysorozatnak nevezzük. Az I intervallumot úgy is tekinthetjük, mint az fn(x) (nN+) függvények értelmezési tartományának közös részét. Ha ez a közös rész üres halmaz, nem létezik I-n függvénysorozat. Az alábbi jegyzetben, a műszaki alkalmazások szempontjából a legfontosabb fogalom a konvergencia. Megvilágítjuk ezt a problémakört két példán keresztül. Előtte azonban szükség van néhány új fogalom értelmezésére. 3.2.2.Definíció: Legyen az xI tetszőlegesen rögzített valós szám. Ekkor az fn(x) (nN+) helyettesítési értékek egy valós számsorozatot alkotnak. Tekintsük azokat az x helyeket az I intervallumban, ahol az fn(x) (nN+) valós sorozat konvergens. Ezen pontok halmazát a függvénysorozat konvergencia halmazának (konvergencia tartomány) nevezzük és KH-val jelöljük. Ezen a konvergencia halmazon a függvénysorozat értelmez egy új függvényt, amit a függvénysorozat határfüggvény-ének nevezünk. Jelölje ezt f(x), x KH. A konvergencia szokásos értelmezése szerint a következőt mondhatjuk. Az f(x), x KH függvény az fn(x) (nN+) x I függvénysorozat határfüggvénye, ha tetszőleges ε > 0 hibakorláthoz létezik n0(ε, x) ε-tól és általában x-től is függő küszöbindex olyan, hogy ha n>n0(ε, x), akkor teljesül, hogy fn x f x ha x KH . 3.2.1.Példa: Illusztráljuk ezt a fogalmat az alábbi igen egyszerű, ám a későbbiek szempontjából nagyon fontos példán keresztül. Legyen fn(x) = xn–1 (nN+), xR. Ebben az esetben tehát – a definícióbeli jelölést alkalmazva – I = R. Ez a függvénysorozat minden valós x-re egy mértani sorozatot ad. Erről ismeretes, hogy a ]–1, 1] intervallumon konvergens, és minden x ]–1, 1[ esetén a határérték zérus, x = 1-ben pedig 1. Minden más valós helyen a sorozat divergens. Ez azt jelenti, hogy a függvénysorozat konvergencia halmaza a KH = ]–1, 1] intervallum és a határfüggvény pedig f(x) = 0 ha x ]–1, 1[ és pedig f(x) = 1 ha x = 1. Vizsgáljuk most meg, hogy a 3.2.2. definíció szerint hogyan adhatunk meg egy ε > 0 hibakorláthoz küszöbindexet. Az x = 1 pontot nem szükséges vizsgálni, hiszen ebben a pontban a sorozat a konstans 1 sorozat, ha azonban x ]–1, 1[, akkor az n 1 f n x f x x n 1 0 x n 1 x
372
Óbudai Egyetem BGK
Fejezetek a matematikából
egyenlőtlenség egyenértékű az n 1
ln ln ln ; n 1 n0 , x 1 ; ln x ln x ln x
egyenlőtlenséggel. Az egyenlőtlenség azért fordult meg, mert x 1 esetén ln x 0 . Megadtuk tehát az ε hibakorláthoz tartozó küszöbindexet, [x] jelöli az x valós szám egész részét. Mint látható ez valóban függ mind az ε-tól (ez természetes) és függ az x-től is. Igazoltuk tehát a 3.2.2. definíció alapján is, hogy a határfüggvény valóban az az f(x) függvény, amelyet az előbbiekben leírtunk. Mielőtt egy második példát is hozunk a fogalmak illusztrálására, megfogalmazzuk a numerikus sorok esetében igazolt, és igen nagy jelentőségű Cauchy-féle konvergencia kritériumot. 3.2.1. Tétel: (Cauchy-féle konvergencia kritérium függvénysorozatokra) Az fn(x) (nN+) x I függvénysorozat akkor és csak akkor konvergens, vagyis pontosan akkor létezik határfüggvénye a KH I halmazon, ha tetszőleges ε > 0 hibakorláthoz létezik n0(ε, x), ε-tól és x-től függő küszöbindex olyan, hogy ha n, m > n0(ε, x), akkor teljesül, hogy f n x f m x ha x KH .■ 3.2.2.Példa: A következő példa, túl azon, hogy ismét nagyon egyszerű, nagyon fontos szerepet kap majd a Fourier-sorok elméletében, és rávilágít arra, hogy létezik egy másfajta, az előbbiekben illusztráltnál erősebb konvergencia fogalom, amely teljesülése maga után von számos hasznos tulajdonságot függvénysorokra vonatkozólag. sin nx fn x ; n N , x R Vizsgáljuk meg konvergencia szempontjából az n függvénysorozatot. Mivel a szinusz függvény értékkészlete a [–1, 1] intervallum, ezért minden valós x-re igaz a következő egyenlőtlenséglánc:
0
sin nx 1 n n
1 Figyelembe véve azt, hogy az sorozat határértéke 0, a közrefogási elv alkalmazásával az n adódik, hogy a függvénysorozat minden valós x-re a nullához tart. Tehát most a konvergencia halmaz KH = R, és a határfüggvény a teljes számegyenesen az azonosan nulla függvény. Keressünk ismét tetszőleges ε > 0 hibakorláthoz küszöbindexet. fn x f x
sin nx sin nx 1 1 1 0 ; ha n n0 ; n n n
megkaptuk a küszöbindexet. A 3.2.1. példabeli függvénysorozathoz képest azonban van egy jelentős különbség. Ebben a példában a küszöbindex nem függ az x-től, csak az ε hibakorláttól. Más szavakkal egy helytől független küszöbindexet tudunk rendelni minden ε-hoz. Mint az
373
Óbudai Egyetem BGK
Fejezetek a matematikából
alábbiakban kiderül, ez egy minőségileg más formája a konvergenciának. Ennek okán más elnevezést alkalmazunk a fogalom megjelölésére. 3.2.3.Definíció: Azt mondjuk, hogy az fn(x) (nN+) xI valós függvénysorozat egyenletesen konvergens a KH halmazon, és határfüggvénye azf(x), x KH függvény ha tetszőleges ε > 0 hibakorláthoz létezik n0(ε) kizárólag ε-tól függő – tehát az x KH helytől független – küszöbindex olyan, hogy ha n > n0(ε), akkor teljesül, hogy fn x f x ha x KH . Összevetve a 3.2.1. és 3.2.2. példákban szereplő függvénysorozatokat és a példabeli számítások sin nx ; n N , x R függvénysorozat eredményét, azt mondhatjuk, hogy az f n x n egyenletesen konvergens az egész számegyenesen és határfüggvénye az azonosan nulla függvény. Míg az fn(x) = xn–1 (nN+), xR függvénysorozat konvergens a KH = ]–1, 1] intervallumon, de nem egyenletesen konvergens. Ez utóbbi konvergenciát, megkülönböztetésül, lehet pontonkénti konvergenciának nevezni.
Mielőtt alkalmazzuk ezeket a fogalmakat függvénysorokra és rávilágítunk az egyenletes konvergencia előnyeire, megfogalmazzuk a Cauchy-kritériumot egyenletes konvergenciára. 3.2.2. Tétel: (Cauchy-féle konvergencia kritérium egyenletes konvergenciára) Az fn(x) (nN+) x I függvénysorozat akkor és csak akkor egyenletesen konvergens a KH I halmazon, ha tetszőleges ε > 0 hibakorláthoz létezik n0(ε), kizárólag ε-tól függő – tehát az x KH helytől független – küszöbindex olyan, hogy ha n, m > n0(ε), akkor teljesül, hogy f n x f m x , ha x KH . ■
3.2.2. Függvénysorok általános fogalma, konvergenciája Az fn(x) (nN+) x I függvénysorozatból az alábbi értelmezés szerint képezzünk egy "új" függvénysorozatot az alábbi definícióval: s1(x) = f1(x) s2(x) = f1(x) + f2(x) s3(x) = f1(x) + f2(x) + f3(x) … sn(x) = f1(x) + f2(x) +…+ fn(x); nN+; xI … Az (sn(x)), nN+; xI függvénysorozatot az (fn(x)), nN+; xI függvénysorozatból képezett végtelen függvénysornak, vagy egyszerűen csak függvénysornak nevezzük. Az n
sn x fi x ; x I i 1
összeget a függvénysor n-edik részletösszegének nevezzük. A függvénysort egyszerűen csak a
374
Óbudai Egyetem BGK
Fejezetek a matematikából
fn ; fn x ;
vagy a
fn x
n 1
formulával jelöljük. Felmerül a kérdés, hogy mit értünk egy függvénysor konvergenciáján, határértékén? A választ a numerikus sorok konvergenciájának a fogalmára építjük. Legyen x0 I az I intervallum tetszőleges pontja. Helyettesítsük a ∑fn(x) függvénysorban x helyére mindenütt x0-t. Mivel az fn(x0) helyettesítési értékek valós számok, az ilyen módon kapott ∑fn(x0) sor egy végtelen numerikus sor. Erre vonatkozólag a konvergencia fogalma ismert, és az említett kritériumokkal meg is tudjuk vizsgálni a konvergencia tényét! Ez azt jelenti, hogy az I intervallum minden egyes x pontjában megvizsgálhatjuk, hogy a ∑fn(x) végtelen numerikus sor konvergens-e. Azokban a pontokban ahol konvergens, értelmezhetünk egy új függvényt az alábbi módon. 3.2.4.Definíció: JelöljeKH(∑fn) az I intervallumnak azokat a pontjait, amelyekre a ∑fn(x) végtelen numerikus sor konvergens. Ezt a halmazt a függvénysor konvergencia-halmazának vagy konvergencia-tartományának nevezzük. Ezen a halmazon értelmezhetünk egy függvényt. Legyen ez a függvény a következő.
f n : KH f n R ;
n 1
x
f n x
n 1
Tehát az I intervallum minden olyan pontjához, ahol a ∑fn(x) numerikus sor konvergens, tehát a konvergencia-halmaz minden x pontjához, hozzárendeljük a ∑fn(x) numerikus sor összegét. Ezt a függvényt a függvénysor összegfüggvényének nevezzük. A definícióban említett módon beszélhetünk egy függvénysor konvergenciájáról. Egy függvénysor konvergens, ha a konvergencia-halmaza nem üres halmaz, és a határértéke az összegfüggvény, amit a definícióban leírtunk. A numerikus sorok tárgyalásának mintájára megfogalmazzuk a Cauchy-kritériumot függvénysorokra is. A függvénysorozatoknál követett gondolatmenet szerint itt is megkülönböztetjük a pontonkénti és az egyenletes konvergenciát. 3.2.3. Tétel: (Cauchy-féle konvergencia kritérium függvénysorokra) A ∑fn(x) (nN+) x I függvénysor akkor és csak akkor konvergens tehát akkor és csak akkor létezik összegfüggvénye a KH I halmazon, ha tetszőleges ε > 0 hibakorláthoz létezik olyan n0(ε, x), ε-tól és x-től függő küszöbindex, hogy ha n, m > n0(ε, x), és n > m akkor teljesül, hogy n
i m 1
fi x ha x KH f n .
375
Óbudai Egyetem BGK
Fejezetek a matematikából
3.2.4. Tétel: (Cauchy-féle konvergencia kritérium egyenletes konvergenciára) A ∑fn(x) (nN+) x I függvénysor akkor és csak akkor egyenletesen konvergens a KH I halmazon, ha tetszőleges ε > 0 hibakorláthoz létezik olyan n0(ε), kizárólag ε-tól függő – tehát az x KH helytől független – küszöbindex, hogy ha n, m > n0(ε), és n > m akkor teljesül, hogy n
i m 1
fi x ha x KH f n .
Függvénysorok konvergenciáját is illusztráljuk az alábbi két példával. 3.2.3. Példa: Vizsgáljuk meg, hogy a
x n 1 függvénysornak mi a konvergenciatartománya, és
n 1
a konvergenciahalmazon adjuk meg az összegfüggvényt. A megoldás során hivatkozhatunk a 3.1.1.definícióra. Vegyük észre, hogy ez a függvénysor rögzített x-re egy q = x kvóciensű végtelen mértani sor. Tudjuk, hogy ez –1 < x < 1 esetén konvergens és adott x-re a sor összegét is ismerjük, a numerikus sor összegképletében q helyére x-et kell írnunk. A függvénysor konvergencia-halmaza tehát a ] –1, 1[ intervallum és az összegfüggvény a következő.
1
x n 1 1 x x 2 x3 x 4 ... 1 x ;
x 1, 1
n 1
A] –1, 1[ intervallumon kívül a függvénysor nem határoz meg függvényt, a függvénysor ezen intervallumon kívül divergens. A konvergenciát grafikusan szemlélteti a 3.2.1. ábra.
3.2.1. ábra. A mértani sor összegfüggvénye (kék színű görbe) és az azt közelítő ötödfokú polinom (piros színű görbe). A pontozott egyenesek a konvergencia halmaz határait jelölik.
376
Óbudai Egyetem BGK
Fejezetek a matematikából n
x x 1 függvénysornak mi a konvergencia tartománya n 0 és ezen a halmazon mi a sor összegfüggvénye. Az előzőnél némileg bonyolultabb szerkezetű függvénysorral van dolgunk, de abban megegyeznek, hogy adott x-re ez is egy mértani sor. Vizsgáljuk meg, hogy a mértani sor konvergenciájának mi a feltétele. Akkor konvergens a sor, ha x x 1, tehát ha igaz, hogy 1 1 . Ennek az egyenlőtlenség láncnak a teljesül, hogy x 1 x 1 1 megoldáshalmaza az x félegyenes. Az egyenlőtlenség megoldásához ábrázoljuk az 2 x x 1 1 1 1 lineáris törtfüggvényt. A grafikon alapján a megoldáshalmaz azonnal x 1 x 1 x 1 leolvasható a 3.2.2. ábráról.
3.2.4.Példa: Vizsgáljuk meg, hogy a
3.2.2. ábra. A 3.2.4. példabeli függvénysor konvergencia halmazának grafikus meghatározása. A ]–1, 1[ intervallum határait jelölik a pontozott egyenesek.
1 Kaptuk tehát, hogy a függvénysor konvergencia halmaza a KH ; intervallum. Az 2 összegfüggvény ugyancsak a mértani sor összegképlete alapján kapható.
n
1 x 1 x 1 x x 1; x 2 ; n 0 1 x 1
Az f(x) = x + 1 függvény természetesen értelmezve van az egész számegyenesen, de csak a megjelölt intervallumra vonatkozó leszűkítése az amelynek "köze van" a függvénysorhoz, 1 ugyanis a függvénysornak a KH ; intervallumon kívül nem létezik összegfüggvénye. 2 A 3.2.3. ábrán grafikusan szemléltetjük, hogy hogyan közelíti a függvénysor a határfüggvényt, ha a sorból az első hét tagot vesszük figyelembe.
377
Óbudai Egyetem BGK
Fejezetek a matematikából
3.2.3. ábra. A 3.2.4. példabeli függvénysor összegfüggvénye (kék színű görbe) és a sor hetedik részletösszege (piros színű görbe). A pontozott egyenes a konvergencia halmaz bal oldali határát jelöli.
Az általános esetben egy függvénysor konvergenciájának vizsgálata bonyolult feladat, és a konvergencia halmaz valamint az összegfüggvény meghatározására sincsenek általános módszerek. Ebből a szempontból bizonyos értelemben szabályosan viselkednek azok a "különleges" típusú, a gyakorlat számára is nagyon fontos függvénysorok, amelyekben hatványfüggvényekből képezett függvénysorozatból állítjuk elő a függvénysort. Ezeket tárgyaljuk a következő pontban. Szeretnénk még rámutatni arra, hogy az előző két példában miért nem vizsgáltuk az egyenletes konvergenciát. Ennek oka a következő. A 3.2.3. példabeli függvénysor egy általános kategóriának a képviselője, amelyekre általános eredményeket fogunk megfogalmazni elméleti és műszaki gyakorlati jelentősége miatt. A 3.2.4. példabeli sor pedig csak az illusztrációt szolgálta, a későbbiekben nem vizsgáljuk. A kérdés azonban természetesen fennáll és általánosan válaszolunk is a kérdésre. Tudunk-e olyan feltételt mondani, amelynek teljesülése maga után vonja az egyenletes konvergenciát. A választ egy olyan tétel adja meg, amely igen szoros kapcsolatot teremt a függvénysorok és a numerikus sorok fogalomköre között. A jelzett elégséges feltétel kimondása és bizonyítása előtt egy fogalom értelmezésére van szükség. 3.2.5.Definíció: Azt mondjuk, hogy a ∑fn(x) (nN+) x I függvénysornak a J I intervallumon a an numerikus sor konvergens majoránsa, ha a numerikus sor konvergens és létezik olyan n0 küszöbszám, hogy ha n > n0 akkor tetszőleges x J esetén teljesül, hogy f n x an .
Ennek a fogalomnak a felhasználásával adható egy elégséges feltétel az egyenletes konvergenciára vonatkozólag.
378
Óbudai Egyetem BGK
Fejezetek a matematikából
3.2.5. Tétel: (Weierstrass-féle majoráns kritérium) Ha a ∑fn(x) (nN+) x I függvénysornak a J I intervallumon létezik konvergens majoránsa, akkor a J intervallumon a függvénysor egyenletesen konvergens. Bizonyítás: Alkalmazzuk a 3.2.4. tételt. Legyen ε > 0 tetszőleges és tegyük fel, hogy létezik konvergens majoráns. Ekkor, mivel a numerikus sor konvergens, teljesül rá a Cauchy-féle konvergencia kritérium, azaz létezik n0 küszöbszám olyan, hogy ha n, m > n0, és n > m akkor teljesül, hogy
n
i m 1
ai . Ha most alkalmazzuk a háromszög egyenlőtlenséget, azt kapjuk, hogy n
i m 1
fi x
n
i m 1
fi x
n
i m 1
ai
tehát teljesül a Cauchy-féle kritérium az egyenletes konvergenciára vonatkozólag.■ 3.2.5.Példa: Megmutatjuk, hogy a 3.2.3. példabeli függvénysor tetszőleges x1 < 1 esetén egyenletesen konvergens a [–x1, x1] intervallumon. A bizonyításhoz nem a Cauchy-kritériumot használjuk, hanem a Weierstrass-féle majoráns kritériumot. Ehhez meg kell mutatni, hogy a megjelölt intervallumon a függvénysornak van konvergens majoráns sora. Ez azonban nagyon egyszerű, hiszen a mondott feltételek mellett létezik x2 valós szám olyan, hogy x1 < x2 < 1 teljesül. Ezt az x2-t választva egy mértani sor kvócienseként, a mértani sor konvergens. Ebből n
következően, ha még figyelembe vesszük az x1 x2n egyenlőtlenséget, akkor éppen a 3.2.5. tétel érvényessége következik. A
x2
n
intervallumon, tehát ezen az intervallumon a
numerikus sor konvergens majoráns sor a [–x1, x1]
x n 1 függvénysor egyenletesen konvergens.
n 1
Ez a tény egyébként egy alábbiakban tárgyalt általános tétel speciális esete. 3.2.6.Példa: Megmutatjuk, hogy a 3.2.4. példabeli függvénysor tetszőleges x1 R esetén ' x 1 x egyenletesen konvergens a [0, x1] intervallumon. Mivel 0 , ezért az 2 x 1 x 1 x 1 hányados a teljes konvergencia halmazon szigorúan monoton növekedő függvény. Foglalkozzunk elsőként a nem negatív valós számok halmazával. A monotonitásból következően tetszőleges x x 2 1 x2 R ; x2 x 1 esetén igaz, hogy ha x 0, x 1 akkor fennáll az 0 x 1 x2 1 n
x egyenlőtlenséglánc. Ebből az következik, hogy [0, x1] intervallumon a 2 numerikus x 1 n 0 2 n
x sor konvergens majoránsa a függvénysornak, hiszen előbbi egy 1-nél kisebb x 1 n 0
379
Óbudai Egyetem BGK
Fejezetek a matematikából n
x x 1 függvénysor n 0 egyenletes konvergenciája a megadott intervallumon. Ehhez hasonló gondolatmenettel 1 igazolható, hogy tetszőleges x 3 0 esetén egyenletesen konvergens az x3 , 0 2 intervallumon is.
kvóciensű mértani sor. Ebből pedig a 3.2.5. tétel szerint következik a
A pont lezárásaképpen bizonyítás nélkül rámutatunk arra az okra, amiért ennyire hangsúlyoztuk az egyenletes konvergencia fontosságát. 3.2.6. Tétel: Ha a ∑fn(x) (nN+) x I függvénysor az I intervallumon egyenletesen konvergens, akkor a tagonkénti deriválással illetve a tagonkénti integrálással kapott sor összege az eredeti sor összegfüggvényének deriváltja illetve primitív függvénye. Azaz, ha
fn x F x , x I
n 1
akkor
n 1
f 'n x F ' x , x I illetve f n x dx F x dx, x I . n 1
A tételt úgy is fogalmazhatjuk, hogy ha egy függvénysor egyenletesen konvergens, akkor a deriválás és az összegzés illetve az integrálás és az összegzés sorrendje (végtelen összeg esetén is) felcserélhető. A tétel nagyon fontos a következő pontban tanulmányozott hatványsorok témakörében. ■
3.2.3. Hatványsorok Ebben a pontban olyan függvénysorokat vizsgálunk, amelyekben az fn(x) függvények a legegyszerűbb típusú függvények, azaz hatványfüggvények. Az általánosságot nem csorbítjuk azáltal, ha az összegzést ezután nem 1 hanem 0 indexszel kezdjük. Legyen tehát fn(x) = cn∙(x–x0)n, n = 0, 1, 2,…, ahol x0 I és a cn R együtthatók valós számok. 3.2.6.Definíció:
Rögzítsük
az
x0R
valós
számot.
A
cn x x0
n
függvénysort
n 0
x0-középpontú hatványsornak nevezzük. A cnR valós számok a hatványsor együtthatói. Az elnevezésnek az az oka, hogy a hatványsorok konvergencia-halmaza nagyon egyszerű szerkezetű. Mint az alábbi alapvető fontosságú tételből kiderül, mindig egy x = x0 pontra szimmetrikus intervallum. Innen ered az „x0-középpontú” elnevezés.
380
Óbudai Egyetem BGK
Fejezetek a matematikából
3.2.7.Tétel: (Cauchy-Hadamard) A
cn x x0
n
hatványsor az x = x0 pontban mindig konvergens, ezen kívül létezik egy nem
n 0
negatív R valós szám olyan, hogy ha x x0 R akkor a hatványsor divergens, ha x x0 R akkor a hatványsor konvergens. Az x x0 R feltételeknek eleget tevő pontokban a hatványsor lehet konvergens is és divergens is, ezt minden konkrét esetben meg kell vizsgálni. Az R valós számot a hatványsor konvergencia-sugarának nevezzük. A konvergencia-sugár meghatározására több lehetőség is van, használhatjuk a gyökkritériumot is és a hányadoskritériumot is az alábbi formulák szerint:
c 1 lim n 1 ; vagy R cn
1 lim n cn R
Ha valamelyik határérték +∞ akkor az R konvergencia sugár 0, ekkor a hatványsor csak az x = x0 pontban konvergál, ha pedig valamelyik határérték 0, akkor az R konvergencia sugár +∞, ekkor a hatványsor a teljes számegyenesen konvergens, tehát a konvergencia-halmaz R. Bizonyítás: Mindenek előtt kihangsúlyozzuk, hogy az együtthatóktól függetlenül minden hatványsor konvergens az x = x0 helyen, ugyanis itt az összeg a sor első tagja, hiszen minden további tag zérus. A továbbiakhoz alkalmazzuk például a hányados kritériumot (3.1.6. tétel) annak eldöntésére, hogy a hatványsor egy adott x helyen konvergens vagy divergens. Képezzük két szomszédos tag hányadosát és vizsgáljuk a hányados sorozat határértékét rögzített x-re.
lim
n
cn 1 x x0 cn x x0
n 1 n
cn 1 x x0
lim
n
cn
cn 1 n cn
x x0 lim
Az említett kritérium szerint, ha ez a szorzat kisebb, mint 1, akkor a sor konvergens, ha nagyobb, mint 1, akkor pedig divergens, ha éppen 1 akkor pedig mindkét eset előfordulhat. Vizsgáljunk most meg három esetet. c a) Tegyük fel, hogy lim n 1 R , tehát az idézett határérték pozitív valós érték. Ekkor a n cn
1 . Ha ez utóbbi hányadosra cn 1 lim n cn bevezetjük az R jelölést, éppen a tételben megfogalmazott állítást kapjuk, az említett hányados pedig definiálja a konvergencia sugarat. Az intervallum két végpontjában egymástól függetlenül előfordulhat konvergencia és divergencia, ezt a hányados kritérium tárgyalásánál megmutattuk. konvergencia elégséges feltétele a következő:
x x0
cn 1 c . Ekkor az x x0 lim n 1 1 feltétel egyetlen x0-tól n cn n cn különböző valós x számra sem igaz. Ez azt jelenti, hogy ebben az esetben a konvergencia halmaz b) Tegyük fel, hogy lim
381
Óbudai Egyetem BGK
Fejezetek a matematikából
a bevezetőben említett KH = {x0} halmaz. Ez egyben azt is jelenti, hogy a konvergencia sugár R = 0. c c c) Tegyük fel, hogy lim n 1 0 . Ekkor az x x0 lim n 1 1 feltétel minden valós x n cn n cn számra igaz, ami azt jelenti, hogy a sor mindenütt konvergens, vagyis R = ∞. ■ Ha a bizonyításnál nem a hányados kritériumot, hanem a gyök kritériumot használjuk, akkor a tételben megfogalmazott másik formulát kapjuk a konvergencia sugárra vonatkozólag, illetve a tétel értelemszerűen átfogalmazható a gyökös formula alkalmazásával. A bizonyított tétellel tehát könnyedén leírhatjuk hatványsorok konvergencia halmazát. Ha visszatekintünk a 3.2.3. példára, akkor látható, hogy a vizsgált sor egy 0-középpontú hatványsor, ennek megfelelően a konvergencia halmaz egy 0-ra szimmetrikus intervallum. A 3.2.4 példabeli függvénysor azonban nem hatványsor, ennek megfelelően a konvergencia halmaza nem ilyen szerkezetű, nem szimmetrikus egyetlen valós számra sem. 3.2.7.Példa: Határozzuk meg a
x 2 n
1
2n (n 1) 22 1 x 2
n2
2
1 3
2 2
x 2 3
1 4
2 3
x 2 4 ...
hatványsor konvergencia-halmazát. Első megállapításunk, hogy ez egy x0 = –2 középpontú 1 hatványsor. Számítsuk ki a konvergencia-sugarat. Az együtthatókra tekintve, cn , n 2 (n 1) látható, hogy a hányados kritérium alkalmazása célszerű. cn 1 1 2n (n 1) n 1 1 lim lim lim n 1 R cn 2n 2 2 n
A konvergencia sugár tehát R = 2. Az x0 középponttól tehát 2 egység távolságra levő pontokban még meg kell vizsgálni a konvergenciát. x = –4:
2 n
n n 2 2 (n 1)
1n
(n 1)
n2
Ez Leibniz-típusú sor, tehát konvergens. A hatványsor tehát konvergál a – 4 helyen. x = 0:
2n
1
2n (n 1) (n 1)
n2
n2
382
Óbudai Egyetem BGK
Fejezetek a matematikából
Ez pedig a harmonikus sor, amelyről tudjuk, hogy divergens. Itt tehát a hatványsor is divergens. Összefoglalva, a hatványsor konvergencia tartománya a [–4, 0 [ félig zárt intervallum. 3.2.8.Példa: Határozzuk meg a
n!
2n x 3
n 1
n
1 2! 3! x 3 2 x 32 3 x 33 ... 2 2 2
hatványsor konvergencia-halmazát. Első megállapításunk, hogy ez egy x0 = +3 középpontú n! hatványsor. Számítsuk ki a konvergencia-sugarat. Az együtthatókra tekintve, cn , ismét 2n látható, hogy a hányados kritérium alkalmazása célszerű: c 2n (n 1)! n 1 lim n 1 lim lim n 1 cn 2 2 n!
A Cauchy-Hadamard tétel b) pontja szerint ez azt jelenti, hogy a konvergencia sugár R = 0, tehát a hatványsor konvergencia halmaza egyelemű, KH = {3}. 3.2.9.Példa: Határozzuk meg a 3n 2 n 34 2 35 3 2 3 x 3 3 x x x ... n! 2! 3! n 0
Ebben az esetben az együtthatók a következők: cn
3n 2 , ismét a hányados kritériumot n!
alkalmazzuk. c 3n 3 n ! 3 lim n 1 lim lim 0 n 2 cn n 1 3 n 1!
Ez az eredmény pedig pontosan azt jelenti a tétel szerint, hogy a konvergencia sugár R = ∞, tehát a konvergencia tartomány a valós számok halmaza, KH = R. A differenciálszámításban és az integrálszámításban ismert tény, hogy összeg tagonként deriválható és integrálható, de ott véges összegekről van szó! Ha egy összegben végtelen sok tag van, akkor ez a tény koránt sem magától értetődő dolog, sőt az általános esetben egy függvénysorra vonatkozólag nem is igaz. A 3.2.6. tétel fogalmazza meg általánosan a tagonkénti deriválhatóság illetve tagonkénti integrálhatóság feltételét. Az, hogy ez a tétel alkalmazható hatványsorokra, Abel nevezetes tételén múlik.
383
Óbudai Egyetem BGK
Fejezetek a matematikából
3.2.8.Tétel: (Abel tétele) Ha a
cn x x0
n
hatványsor konvergens egy x1 pontban, és x2 egy tetszőleges olyan valós
n 0
x2 x0 x1 x0 teljesül, akkor a hatványsor abszolút és egyenletesen
szám amelyre
konvergens az x0 x2 ; x0 x2 zárt intervallumon. Bizonyítás: Az állítás igazolásához a Weierstrass-féle majoráns kritériumot használjuk. Tetszőleges x x0 x2 ; x0 x2 esetén igaz, hogy x x0 x2 x0 x1 x0 . Mivel a
cn x1 x0
n 0
n
numerikus sor konvergens, a 3.1.1. tétel szerint lim cn x1 x0 0 , ezért a n
sorozat korlátos, azaz létezik K R olyan, hogy cn x1 x0 K . Ebből következik, hogy n
cn x x0 cn x2 x0 cn x1 x0 n
n
n
n x2
x2 x0 x0 K x1 x0 x1 x0
n
n
A feltételek szerint
x2 x0 x x 1 ami azt jelenti, hogy a K 2 0 numerikus sor 1-nél x1 x0 x x0 n 0 1
kisebb kvóciensű mértani sor, tehát konvergens majoránsa a
cn x x0
n
hatványsornak az
n 0
x0 x2 ; x0 x2 zárt intervallumon. A 3.2.5. tétel szerint ezzel az állítást bizonyítottuk. ■ Az Abel-tétel szerint tehát bármely hatványsor a konvergencia halmazhoz tartozó bármely zárt intervallumon egyenletesen konvergens. Ennek számunkra legfontosabb következménye az, hogy a 3.2.6. tétel alkalmazható hatványsorokra. A két tétel együttesen az alábbi állításban foglalható össze. 3.2.9.Tétel: Ha a ∑cn∙(x – x0)n hatványsor egy nyílt intervallumon vagy az egész valós számegyenesen konvergens, és ott az összegfüggvénye s x
cn x a
n
n 0
akkor a tagonkénti deriválással illetve a tagonkénti integrálással nyert
n cn x a n 1; illetve
n 1
c
n n 1 x a n 1
n0
hatványsorok ugyanazon a nyílt intervallumon illetve az egész számegyenesen konvergálnak, és a tagonkénti deriválással nyert sor összegfüggvénye az eredeti összegfüggvény deriváltja, illetve a
384
Óbudai Egyetem BGK
Fejezetek a matematikából
tagonkénti integrálással nyert hatványsor összegfüggvénye az eredeti összegfüggvény egy alkalmas primitív függvénye:
n cn x a n 1 sx ; illetve
n 0
c
n n 1 x a n 1 S x S a
n 0
ahol S(x) az s(x) összegfüggvény egy primitív függvénye. A tagonkénti deriválás és integrálás nem változtatja meg a konvergencia sugarat, továbbá ezen a halmazon az összegzés és a deriválás, illetve az összegzés és az integrálás műveletének a sorrendje felcserélhető. ■ Azt az alapvetően fontos tényt, hogy a tagonkénti deriválás illetve tagonkénti integrálás során a konvergencia sugár nem változik meg, igen egyszerűen igazolhatjuk. Induljunk ki abból, hogy definíció szerint a kiindulásként alapul vett hatványsor konvergencia sugara
R
1 c lim n 1 cn
cn re módosul. Ha ezekre az n 1 együtthatókra alkalmazzuk a konvergencia sugár kiszámítására vonatkozó formulát, akkor azt kapjuk, hogy deriválás esetén Ha a sort deriváljuk, akkor a cn együttható n cn re illetve
1 1 1 R n 1 cn 1 cn 1 cn 1 n 1 lim lim 1 lim lim n cn cn cn n tehát a sugár valóban nem változik. Integrálás esetén pedig 1 1 1 R n 1 cn 1 cn 1 cn 1 n 1 lim 1 lim lim lim cn cn n2 n 2 cn
tehát a konvergencia sugár ebben az esetben sem változik. Hangsúlyozzuk azonban, hogy bár a konvergencia sugár nem változik meg a vizsgált műveletek során, a konvergencia halmaz megváltozhat, ami azt jelenti, hogy a végpontokban megváltozhat a konvergencia ténye. Erre vonatkozólag látunk példát az alábbiakban. Az előbbiekben hatványsorok esetében megoldottuk azt a problémát, hogy a hatványsor mely esetben konvergens illetve divergens. Egy valós sorozat határértékének kiszámításával a konvergencia-halmaz meghatározható. Nem foglalkoztunk azonban azzal a problémával az általános esetben, hogy ezen a halmazon mi a hatványsor összegfüggvénye. Nos azért nem, mert
385
Óbudai Egyetem BGK
Fejezetek a matematikából
ilyen jellegű általános tétel nincs. Egyes esetekben a 3.2.9. tétel segíthet, illetve különböző adhoc módszereket alkalmazhatunk, de általános eredmény erre vonatkozólag nem létezik. A következőkben speciális szerkezetű hatványsorokkal foglalkozunk.
3.2.3. Taylor-sorok Az előző pontban felvetettük azt a problémát, hogy egy hatványsor konvergens-e és ha igen akkor mi az összegfüggvény. Most tegyük fel a kérdést fordítva. Legyen adott egy függvény, amely tetszőlegesen sokszor deriválható. Kérdés melyik az a hatványsor, amelynek egy adott intervallumon éppen ez a függvény az összegfüggvénye. Ez a problémakör vezet el bennünket a Taylor-sor és a MacLaurin-sor fogalmához. Legyen adott egy f(x) függvény és tegyük fel, hogy egy I intervallumon a f(x)-et „előállítja” egy hatványsor. f(x) = c0 + c1(x – x0) + c2(x – x0)2 + c3(x – x0)3 +…+ cn(x – x0)n +… (xI) Kérdés, hogyan határozhatók meg ennek a hatványsornak a cn együtthatói? Ezek kiszámításához helyettesítsük a sorba x0-t, majd deriváljuk a sort – a 3.2.9. tétel szerint ezt lehet – és helyettesítsük x0-t a deriválással kapott sorba, majd újra deriválunk …stb. f(x0) = c0 f ’(x) = c1+ 2c2(x – x0) +3c3(x – x0)2 +…+ ncn(x – x0)n–1 +…; innen f’(x0) = 1∙c1 f ”(x) = 2c2 + 2∙3c3(x – x0) +…+ n(n – 1)cn(x – x0)n–2 +…; innen f ”(x0) = 1∙2∙c2 f ’”(x) = 2∙3c3 +…+ n(n – 1)(n – 2)cn(x – x0)n–3 +…; innen f ’”(x0) = 1∙2∙3∙c3 … f(n)(x) = n(n – 1)(n – 2)…2∙1cn + …; innen f(n)(x0) = n(n – 1)(n – 2)…2∙1∙cn = n!∙cn … Ezzel el is jutottunk a keresett együtthatókhoz. Az f (n)(x0) = n!∙cn egyenletekből látszik, hogy ha az f(x) függvényt előállítja a fenti hatványsor, akkor az együtthatókat csak az alábbi formulák szolgáltathatják
cn
f ( n) ( x0 ) ; n = 0, 1, 2, … n!
ahol n! = 1∙2∙3∙4∙…∙n, „n-faktoriális”.
386
Óbudai Egyetem BGK
Fejezetek a matematikából
Bevezetünk egy elnevezést. Ha egy f(x) függvényhez a fenti eljárással hozzárendelünk egy hatványsort, akkor azt mondjuk, hogy a függvényt hatványsorba fejtjük. 3.2.7. Definíció: Tegyük fel, hogy az f(x) függvény az x = x0 pontot tartalmazó nyílt intervallumban tetszőlegesen sokszor differenciálható. Ekkor a f (n) ( x0 ) f "( x0 ) f ( n) ( x0 ) n n 2 n! x x0 f ( x0 ) f ( x0 )( x x0 ) 2! ( x x0 ) ... n! x x0 ... n 0
hatványsort az f(x) függvény az x = x0 körüli Taylor-sorának nevezzük. Speciális esetben, ha x0 = 0, akkor a f ( n) (0) n f "(0) 2 f ( n) (0) n x f (0) f (0) x x ... x ... n! 2! n ! n 0
sort kapjuk. Ezt MacLaurin-sornak nevezzük. Ez a sorfejtés minden olyan esetben elvégezhető, amikor az f(x) függvény tetszőlegesen sokszor deriválható. De kérdés, hogy a sor konvergens-e egyáltalán és ha igen előállítja-e a függvényt. Ez a probléma azt jelenti a gyakorlatban, hogy minden Taylor-sorfejtés esetében meg kell vizsgálni a konvergencia kérdését. 3.2.10.Tétel: (Taylor-tétel) Ha az f(x) függvény az x = x0 pont valamely környezetében legalább n + 1-szer differenciálható és x hozzátartozik ehhez a környezethez, akkor létezik x és x0 között egy olyan ξ hely, hogy fennáll az alábbi egyenlőség. f ( x) f ( x0 ) f ( x0 )( x x0 )
f "( x0 ) f (n) ( x0 ) f (n 1) () ( x x0 ) 2 ... x x0 n x x0 n 1 2! n! n 1!
3.2.8.Definíció: Az előző tételben szereplő Txn ( x) f ( x0 ) f ( x0 )( x x0 ) 0
f "( x0 ) f (n) ( x0 ) ( x x0 )2 ... x x0 n 2! n!
polinomot n-edfokú Taylor-féle polinomnak nevezzük, az összeg (n + 1)-edik tagját pedig Lagrange-féle maradéktagnak. Ez utóbbit Rn(x)-el jelöljük. Rn ( x)
f (n 1) () x x0 n 1 n 1!
Összefésülve az előző két formulát, a következőt kapjuk.
387
Óbudai Egyetem BGK
Fejezetek a matematikából
f ( x) Txn ( x) 0
f (n 1) () x x0 n 1 Txn0 ( x) Rn x n 1!
Ezt az egyenlőséget úgy interpretálhatjuk, hogy egy f(x) függvényértéke előállítható egy polinom, a Taylor-polinom helyettesítési értéke és a maradéktag helyettesítési értékének összegeként. Ez utóbbi tagot az alkalmazások során gyakran hibatagnak tekintjük, illetve nevezzük, ugyanis ezzel lehet becsülni a függvény polinommal történő közelítésének hibáját. Ezek a fogalmak a Taylorsorok alkalmazásánál illetve a konvergencia vizsgálatánál játszanak szerepet. Mire használhatjuk a Taylor-polinomot? Nagyon sok lehetőség van erre, a lényeg minden esetben az, hogy az f(x) függvényt egy alkalmasan választott x0 pont egy környezetében a megfelelően magas fokú Taylor-polinomjával helyettesítünk. Alkalmazhatjuk például: - Függvényértékek közelítő kiszámítására, - Egyenletek (különösen transzcendens egyenletek) közelítő megoldására, - Olyan függvények integrálására, amelyeknek nem létezik primitív függvénye, vagy amelyek integrálása nagyon bonyolult, - Differenciálegyenletek soralakú megoldásának előállítására, - Határértékek kiszámítására,…stb Az alkalmazás előnye, hogy a Taylor-polinom alkalmazása során csak könnyen kezelhető hatványfüggvényekkel dolgozunk, és csak a négy alapművelet elvégzésére van szükség! A Lagrange-féle maradéktag vizsgálata pedig arra ad lehetőséget, hogy megvizsgáljuk a fenti esetekben, amikor a függvényt a polinommal helyettesítjük, mekkora hibát követünk el. De van még egy fontos szerepe. Segítségével eldönthető, hogy a Taylor-sor valóban előállítja-e a függvényt. A Taylor-tétel alapján ugyanis nyilvánvaló az alábbi tétel állítása. 3.2.11.Tétel: Legyen az f(x) függvény az x = x0 pont egy I környezetében tetszőlegesen sokszor differenciálható. Akkor és csak akkor teljesül az f ( x)
f ( n) ( x0 ) n n! x x0 ; xI n 0
egyenlőség, tehát pontosan akkor állítja elő a Taylor-sor az f(x) függvényt, ha minden xI esetén teljesül, hogy lim Rn(x) = 0, tehát ha a Lagrange-féle maradéktag határértéke zérus. ■ A témakör alkalmazásaképpen elsőként arra mutatunk példákat, hogyan lehet egy függvény Taylor sorát előállítani. Erre a következő módszerek alkalmazhatók. 1. A 3.2.7. definíció alapján. 2. Ismert Taylor-sor felhasználásával. Ezen belül: a) Összetett függvény képzésével. b) Deriválással vagy integrálással a 3.2.9. tétel alapján. c) Elemi résztörtekre bontással. d) stb. 388
Óbudai Egyetem BGK
Fejezetek a matematikából
Az alábbiakban mindegyik módszerre mutatunk példát. 3.2.10.Példa: Kezdjük az egyik legfontosabb Taylor-sorral, az exponenciális függvény x0 = 0-körüli Taylor-sorával. A definíció alkalmazásaképpen először minden n-re elő kell állítani az f(x) = ex függvény n-edik deriváltját. Ez nagyon egyszerű, hiszen minden n-re igaz, hogy n n n f x e x . Ebből következően f x0 f 0 e0 1 . Ebből már következik, hogy az exponenciális függvény 0-körüli Taylor-sora a következő:
T0 exp( x)
f (n) (0) n 1 2 1 n xn x 1 x x ... x ... n! n! 2! n! n 0 n 0
Hátra van még a konvergencia vizsgálata. Elsőként meg kell határoznunk a konvergencia sugarat. 1 Az együtthatók a következők: cn n N . Ebből következően a Cauchy-Hadamard tétel n! szerint c 1 n! 1 lim n 1 lim lim 0 R cn n 1 n 1! Ez az idézett tétel szerint azt jelenti, hogy a konvergencia sugár R = ∞, tehát a konvergencia xn halmaz az egész R halmaz: KH R . Hátra van még annak kimutatása, hogy a sor n ! n 0 valóban az exponenciális függvényt állítja elő. Ehhez a 3.2.11. tétel szerint igazolnunk kell, hogy a Lagrange-féle maradéktag a nullához tart. Legyen x tetszőleges valós szám. Ekkor a Taylortétel szerint létezik ξ ] 0, x [ vagy ξ ] x, 0 [ olyan, hogy Rn ( x)
f (n 1) () n 1 e x n 1 x n 1! n 1!
Ebben a hányadosban az exponenciális faktor egy konstans szorzó, elég az n-től függő hányados konvergenciáját vizsgálni. Az egyszerűség érdekében vezessük be az m = n + 1 jelölést, és legyen m0 > x pozitív egész. Ekkor igaz a következő becslés:
m m0 x m m m0 x xm x m0 x m m0 x m0 x m m0 0 0 0 m! m0 ! m0 1 ... m m0 ! m0m m0 m0 ! m0m m0 ! m0
m
x 1, 1 kvóciensű mértani sorozat m-edik m0 tagja áll. Erről tudjuk, hogy a 0-hoz konvergál. Ha most alkalmazzuk a közrefogási elvet – a kérdéses hányadost alulról is és felülről is becsüljük egy 0-hoz tartó sorozattal –, akkor látjuk, hogy az állítást igazoltuk, a Lagrange-féle maradéktag valóban nullához tart.
Az utolsó tagban az m0 választása miatt egy q
389
Óbudai Egyetem BGK
Fejezetek a matematikából
Ez más szavakkal azt jelenti, hogy a fenti Taylor-sor előállítja az exponenciális függvényt, tehát a Taylor-sort egyenlővé tehetjük az exponenciális függvénnyel exp( x) e x
xn 1 1 n! 1 x 2! x2 ... n! xn ...; x R n 0
Az exponenciális függvény Taylor-sorral történő közelítését szemlélteti a 3.2.4. ábra.
3.2.4. ábra. Az exponenciális függvény grafikonja (kék színű görbe) és a függvény közelítése a Taylor-sor első hat tagjával, tehát az ötödfokú Taylor-polinommal (piros színű görbe).
3n 2 n! n 1 numerikus sort. Ott megmutattuk a hányados kritériummal, hogy a sor konvergens, de nem tudtuk megállapítani, hogy mi az összeg. Az exponenciális függvény Taylor-sorának birtokában 3n azonban már meg tudjuk határozni a sor összegét. Vegyük észre, hogy a sor felírható 9 n! n 1 alakban is, erről pedig már látható – a 9-es szorzótól eltekintve –, hogy éppen az exponenciális függvény hatványsorának a helyettesítési értéke az x = 3 helyen. Eszerint a sor összege:
3.2.11.Példa: A numerikus sorok témakörében a 3.1.11. példában vizsgáltuk a
n2 3
9 e3 n ! n 0
390
Óbudai Egyetem BGK
Fejezetek a matematikából
Mondhatjuk, hogy "szerencsénk" volt, nem általános dolog, hogy egy numerikus sor esetében ráismerünk egy nevezetes Taylor-sorra. 3.2.12.Példa: Határozzuk meg az f(x) = cosx függvény 0-körüli Taylor-sorát! Ehhez elő kell állítanunk tetszőleges n esetén a függvény n-edik deriváltját, f (0)(x) = cosx; f ’(x) = –sinx; f ”(x) = –cosx; f (3)(x) = sinx; f (4)(x) = cosx; … látható, hogy a negyedrendű deriválttól kezdődően a deriváltak ismétlődnek. Számítsuk ki a deriváltakat a 0-helyen: f (0)(0) = 1; f ’(0) = 0; f ”(0) = –1; f (3)(0) = 0; f (4)(0) = 1; … Már nincs más feladatunk, mint behelyettesíteni a MacLaurin-sor képletébe. f (n) (0) n 1 0 1 0 1 0 x 1 0 x x 2 x3 x 4 x5 x6 x7 ... n! 2! 3! 4! 5! 6! 7! n 0
ha itt elhagyjuk azokat a tagokat, amelyek zérussal egyenlők, megkapjuk a cosx függvény MacLaurin-sorát. T0 cos( x) 1
1n x2n x 2 x 4 x6 x8 ... 2! 4! 6! 8! 2n ! n 0
Kérdés, hogy a sor elállítja-e a függvényt. Ehhez elsőként a konvergencia sugarat kell meghatározni. Ezt most a következő módon számítjuk. Rögzítünk egy valós x-et, és megvizsgáljuk a hányados kritériummal, hogy az adott x helyen abszolút konvergens-e, tehát konvergens-e a sor. n 1 2n 2 2n ! 1 x lim 1n x2n 2n 2 !
lim
x2 0 2n 1 2n 2
A határérték tetszőlegesen rögzített x valós szám esetén zérus, ami a hányados kritérium szerint azt jelenti, hogy a sor minden valós x esetén konvergens, tehát a konvergencia sugár R = ∞, ami azt jelenti, hogy a koszinusz függvény hatványsorának konvergencia halmaza is az egész R 1n x2n R . Annak kimutatását, hogy a Lagrange-féle maradéktag halmaz: KH n 0 2n ! nullához tart minden x-re a 3.2.8. példabeli gondolatmenet megismétlésével az Olvasóra bízzuk. Ezek az eredmények pedig pontosan azt jelentik, hogy a felírt MacLaurin-sor előállítja a koszinusz függvényt a teljes számegyenesen.
391
Óbudai Egyetem BGK
Fejezetek a matematikából
Írhatjuk tehát, hogy cos( x)
1n x2n 1 x2 x4 x6 x8 ...; 2n ! 2! 4! 6! 8! n 0
xR
A koszinusz függvény, különböző fokszámú Taylor-polinomokkal való közelítését illusztrálja a 3.2.5. ábra.
3.2.5. ábra. Az koszinusz függvény grafikonja (kék színű görbe) és a függvény közelítése különböző fokszámú Taylor-polinomokkal (piros színű görbék). Az ábrán a koszinusz görbe feletti görbék az egyre pontosabb közelítés szerint rendre az n = 4, 8, 12 fokszámú polinomok grafikonjai, a koszinusz függvény grafikonja alatt levő görbék, az egyre pontosabb közelítésnek megfelelően rendre az n = 6, 10, 14 fokszámú Taylor-polinomok grafikonjai.
Megemlítjük még ebben az esetben azt a tényt, hogy a koszinusz függvény Taylor-sorában csak páros kitevőjű hatványok szerepelnek. Ez, annak fényében, hogy a koszinusz függvény páros, magától értetődőnek tűnik. Ezt az észrevételt mindenesetre felhasználhatjuk arra, hogy könnyebben megjegyezzük a Taylor-sort. A későbbiek előrevetítéseként megjegyezzük, hogy a paritás sokkal többet jelentő tény például akkor, ha egy páros vagy páratlan periodikus függvényt Fourier-sorba fejtünk. Ehhez utalunk a Fourier-sorok című fejezetre ahol ezt a kérdést részletesen megvizsgáljuk. A 3.2.8. és 3.2.10. példák alapján egyszerűen felírható például egy tetszőleges pozitív valós alapú exponenciális függvény, a szinusz függvény a szinusz-hiperbolikusz valamint a koszinuszhiperbolikusz függvény Taylor sora is. Javasoljuk, hogy ezeket a számításokat az Olvasó végezze el.
392
Óbudai Egyetem BGK
Fejezetek a matematikából
Ha a definíció szerint néhány sort felírunk, akkor ezekből a 3.2.9. tétel felhasználásával további Taylor-sorok adódnak, ha egy ismert sort deriválunk vagy integrálunk. Vegyük észre azt is, hogy 1 a 3.2.3. példában szereplő hatványsor is egy Taylor-sor, méghozzá az f ( x) függvény 1 x Taylor-sora, melynek konvergencia tartománya a ]–1, 1[ intervallum. Ezt a sort nem a definíció alapján kaptuk, hanem a mértani sorra való hivatkozással. Ha itt kvóciensként nem x-et, hanem –x-et, x2-et,…stb. választunk, számos újabb Taylor-sort kaphatunk. Ezeket is lehet integrálni, deriválni. Ezek után már csak fantázia kérdése, hogy újabb és újabb sorokat állítsunk elő. 3.2.13. Példa: Határozzuk meg az f(x) = sin2x függvény 0-körüli Taylor-sorát. Ebben az esetben nem a definíció alapján dolgozunk, hanem felhasználjuk az alábbi trigonometrikus azonosságot, amelyet leggyakrabban linearizáló formulaként emlegetünk:
sin 2 x
1 cos 2 x 2
Itt használjuk fel, hogy ismerjük a koszinusz függvény mindenütt konvergens Taylor-sorát (3.2.10. példa). Nem kell más tennünk, mint abban x helyére 2x-et írni és készen is vagyunk. Mivel a konvergencia halmaz R, ez a helyettesítés nem változtat a konvergencia tényén, a kapott sor tehát ugyancsak mindenütt konvergens.
1 1 1 1 1 sin x cos(2 x) 2 x 2 n 2 2 2 2 n 0 2n ! n
2
1 2 x 2 23 x 4 25 x6 27 x8 ...; x R 2 2! 4! 6! 8! 3.2.14. Példa: Határozzuk meg az f(x) = ln(1 + x), (x > –1) függvény 0-körüli Taylor-sorát. Alkalmazzuk a hatványsorok deriválására-integrálására vonatkozó 3.2.9. tételt. Ezért először deriváljuk f(x)-et.
f ' x
1 1 x
Itt vegyük észre, hogy ez a függvény tekinthető egy q = –x kvóciensű mértani sor összegének is.
1 1 n 1 x x 2 x3 x 4 ... 1 x n ; x 1,1 1 x 1 ( x) n 0 Az f(x) = ln(1 + x) függvény sora ennek a hatványsornak az integrálásával születik.
393
Óbudai Egyetem BGK
Fejezetek a matematikából
n 1 n n n x ln(1 x) 1 x n dx 1 x n dx 1 C n 1 n 0 n 0 n 0
x
x 2 x3 x 4 x5 ... C; x 1,1 2 3 4 5
Az egyenlőség mindkét oldalán, így egyelőre a Taylor-sorban is szerepel egy C integrációs állandó. Ennek értékét megkapjuk, ha helyettesítünk egy alkalmas x-et a konvergencia tartományból, legyen ez most a 0. Mivel ln(1 + 0) = 0 és a jobb oldalon a hatványsor minden tagja 0, ezért a konstans is 0, tehát keresett Taylor-sor a következő. ln(1 x)
n 1 1
n 1
xn x 2 x3 x 4 x5 x ...; x 1,1 n 2 3 4 5
A konvergencia feltétele az, hogy a kvóciens abszolút értékben kisebb legyen, mint 1. Mivel most q = –x, akkor konvergens a sor, ha teljesül, hogy –x ] –1, 1[, ez azonban nyilván pontosan akkor teljesül ha x ] –1, 1[, ezért írhattuk, hogy KH = ] –1, 1[. A 3.2.6. ábrán látható az ln(1 + x) függvény és a közelítése hatod fokú Taylor-polinommal.
3.2.6. ábra. Az ln(1 + x) függvény grafikonja (kék színű görbe) és közelítése hatod fokú Taylor-polinommal (piros színű görbe). A pontozott egyenesek a konvergencia tartomány határait jelölik.
Az eredményünket némileg tudjuk pontosítani, ugyanis vegyük észre, hogy az x = 1 helyen, a helyettesítési értékek sora éppen a hiperharmonikus sor, amelyről igazoltuk, hogy konvergens és összege ln2. A bal oldali végpontban viszont a divergens harmonikus sor ellentettjét kapjuk. Ez azt jelenti, hogy a konvergencia tartomány pontosabban a ] –1, 1] jobbról zárt intervallum. 394
Óbudai Egyetem BGK
Fejezetek a matematikából
Azonban a Taylor-sorok alkalmazása szempontjából ez ritkán fontos, mert a sorfejtésnél elsősorban a belső pontokban használjuk ki a konvergenciát, gondoljunk ehhez Abel tételére. 3.2.15. Példa: Határozzuk meg az f x
2x
1 x
2 2
függvény 0-körüli Taylor-sorát. Vegyük
észre, hogy ha integráljuk az f(x) függvényt, akkor egy olyan függvénysort kapunk, amelynek 1 már ismerjük a Taylor-sorát. Az f(x) egy primitív függvénye ugyanis az F x 1 x2 2 függvény. Ez pedig – az előjeltől eltekintve –, egy q = – x kvóciensű mértani sor összege.
1 1 x
2
1 2
1 ( x )
1 x 2 x 4 x6 x8 ... 1 x 2n n
n 0
1
n 1 2n
x
n 0
Ennek a sornak a konvergencia halmaza ugyancsak a ] –1, 1[ intervallum, hiszen x 2 1,1 akkor teljesül, ha x 1,1 . Ebből a sorból az f(x) függvény sora tagonkénti deriválással adódik.
f x
2x
1 x2
3
2
5
7
2 x 4 x 6 x 8 x ...
1
n 1
n 1
3.2.16. Példa: Fejtsük 0-körüli Taylor-sorba az f x
2n x 2n 1; x 1,1
6x 8
; x R \ 2,3 valós függvényt. x x6 Tekintettel arra, hogy ez a függvény egy valódi racionális törtfüggvény, megpróbálkozhatunk az elemi résztörtekre bontás módszerével. 6x 8 x2 x 6
2
6x 8 A B 2 4 x 3 x 2 x 3 x 2 x 3 x 2
Így olyan tagokhoz jutottunk, amelyeket a korábbiak alapján már Taylor-sorba fejthetünk. Az összeg mindkét tagja emlékeztet egy mértani sor összegére. Végezzük el a szükséges átalakításokat, hogy pontosan úgy nézzen ki, mint egy mértani sor összegfüggvénye. Az alábbi x átalakítások mutatják, hogy első tag egy q kvóciensű mértani sor összege. 3 2 2 1 2 1 2 x 2 1 xn x 3 3 x 1 3 1 x 3 n 0 3 3 n 0 3 3 3 x a második tag pedig egy q kvóciensű mértani sor összege. 2 n
395
n
Óbudai Egyetem BGK
Fejezetek a matematikából
4 4 1 1 x 1 2 2 2 xn x 2 2 x 1 2 2 x n 0 n 0 1 2 2 n
n
Az f(x) függvény hatványsora ezen két sor összege.
T0 f x
n n n n 2 1 n 21 1 n 1 n x 2 x 2 2 3 3 2 x 3 n 0 3 n 0 n 0
Már csak az a kérdés, hogy mi a hatványsor konvergencia halmaza. Az első tag sora konvergens, x 1, azaz 3 x 3 , a második tag sora pedig akkor konvergens, ha ha 3 x 1, azaz 2 x 2 . Ebből következően az f(x) függvény hatványsora a ]–2, 2[ 2 intervallumon konvergens és ott a sor előállítja a függvényt. A 3.3.7. ábrán láthatjuk a függvényt és közelítését harmadfokú Taylor-polinommal.
3.2.7. ábra. A 3.2.16. példabeli racionális törtfüggvény grafikonja (kék színű görbe) és közelítése harmad fokú Taylor-polinommal (piros színű görbe). A pontozott egyenesek a konvergencia tartomány határait jelölik.
396
Óbudai Egyetem BGK
Fejezetek a matematikából
3.2.4. A binomiális sor A Taylor-sorok alkalmazásaképpen ebben a pontban általánosítjuk a valószínűség számítás témakörében megismert binomiális tételt. Emlékeztetőként felidézzük a tételt, mely szerint, ha n nem negatív egész, akkor az (a + b) binom n-edik hatványát a következő összeg szolgáltatja.
a b n
n
n
k a n k bk
k 0
ahol az együtthatók az ún. binomiális együtthatók, melyeknek definíciója a következő. n n 1 n 2 ... n k 1 n n! k! k k ! n k !
hangsúlyozzuk azonban, hogy ezek a formulák csak akkor értelmesek, ha n és k nem negatív egészek továbbá k ≤ n. Alakítsuk át a binomiális tételt úgy, hogy alkalmazzuk az a = 1, b = x jelöléseket. Ekkor a következőt kapjuk. n n n nk k k n 2 n n 1 x x 1 nx x ... x k k 2 n k 0 k 0 n
1 x n
Kaptunk tehát egy n-ed fokú polinomot, a várakozásnak megfelelően. Felvetjük azt a problémát, hogy lehet-e ezt a formulát általánosítani arra az esetre, amikor a kitevő tetszőleges valós szám. A válasz bizonyos korlátozásokkal az, hogy igen. Természetesen arról van szó, hogy a kérdéses függvényt Taylor-sorba fejtjük és a sor konvergencia halmazában a fenti előállítás általánosítható.
Induljunk ki az f x 1 x ; R függvényből, és fejtsük Taylor-sorba a 0-pont körül. Ehhez szükség van a függvény k-ad rendű deriváltjára, illetve ezeknek a 0-helyen vett helyettesítési értékére tetszőleges nem negatív egész k-ra
f x 1 x
f ' x 1 x
f 0 1
1
f '' x 11 x
f ''' x 1 2 1 x ...
f ' 0
2
f '' 0 1
3
f ''' 0 1 2 ...
k k k f x 1 2 ... k 11 x f 0 1 2 ... k 1
...
...
397
Óbudai Egyetem BGK
Fejezetek a matematikából
ahonnan azonnal adódik a függvény Taylor-sora. 1 1 2 2 1 2 ... k 1 k f (k ) (0) k x ... x ... k ! x 1 x 2! x2 3! k! k 0
Ha a binomiális együttható értelmezését felidézzük, akkor magától értetődőnek tűnik egy jelölés bevezetése az alábbi definíció által. 3.2.9. Definíció: Tetszőleges R valós és k nem negatív egész szám esetén legyen a binomiális együttható általánosítása az alábbi szimbólum:
1 2 ... k 1 ; R, k N k! k Ezzel az egyszerűsítő jelöléssel sokkal kompaktabb módon írható fel a kapott hatványsor, melyre a binomiális tétellel való rokonsága miatt az alábbi elnevezést használjuk.
3.2.10.Definíció: Az f x 1 x ; R függvény 0-körüli Taylor-sorát binomiális sornak nevezzük. Az előzőek szerint a binomiális sor a következő:
k xk 1 x
k 0
1 2 1 2 3 1 2 ... k 1 k x x ... x ... 2! 3! k!
Kérdés még a binomiális sor konvergenciája. A konvergencia sugarat a Cauchy-Hadamard tétel alapján számítjuk. Mivel ck , ezért a hányados kritérium szerint írhatjuk, hogy k 1 2 ... k 1 k k ! c 1 k lim k 1 lim lim 1 R ck 1 2 ... k 1 k 1 k 1!
A konvergencia sugár tehát R = 1. Az alkalmazások tekintetében legtöbbször nem érdekes, hogy a határpontokban konvergens-e a sor, ezért megelégszünk azzal az eredménnyel, hogy a sor konvergencia tartománya a ] –1, 1[ intervallum. Tehát, a következőre jutottunk. 1 2 ... k 1 k xk ; x 1,1 x k k ! k 0 k 0
1 x
398
Óbudai Egyetem BGK
Fejezetek a matematikából
3.2.17.Példa: Írjuk fel az f x 3 1 x függvény 0-körüli Taylor-sorát, azaz írjuk fel a binomiális sort
1 esetén. 3
1 1 1 1 1 2 ... k 1 3 3 3 3 x k ; x 1,1 3 1 x 3 xk k ! k 0 k k 0 1
szemléletesebb a sorfejtés eredménye, ha felírjuk a Taylor-sor első néhány tagját.
11 1 1 1 1 1 2 1 3 3 3 3 3 x2 x3... 1 1 x 1 x 2 5 x3 ...; x 1,1 3 1 x 1 x 3 2! 3! 3 9 81 A sorfejtést grafikusan szemlélteti a 3.2.8. ábra, amelyen harmadfokú polinommal közelítünk.
3.2.8. ábra. A 3.2.17. példabeli irracionális függvény grafikonja (kék színű görbe) és közelítése harmad fokú Taylorpolinommal (piros színű görbe). A pontozott egyenesek a konvergencia tartomány határait jelölik.
A Taylor-sorok alkalmazásának lezárásaképpen bizonyítsuk be azt az összefüggést amelyet a komplex számok algebrájában és a differenciálegyenletek megoldása során számos alkalommal használunk az analízisben. Ez pedig az Euler-féle formula. A bizonyítást Taylor-sorfejtéssel végezzük, utalva arra a továbblépési lehetőségre, hogy a fentiekben vázolt elmélet kiterjeszthető a komplex számsíkra. Bizonyítás nélkül megjegyezzük, hogy az elemi függvények komplex Taylor-sora pontosan ugyanúgy fest, mint a valós Taylor-sor, csak a változók komplexek. Az igényes Olvasó természetesen nem elégszik meg ezzel a megjegyzéssel, számára a komplex analízist tárgyaló szakirodalom tanulmányozását javasoljuk.
399
Óbudai Egyetem BGK
Fejezetek a matematikából
3.2.12.Tétel: (Euler-féle formula) Tetszőleges valós x estén fennáll a következő egyenlőség. eix cos x i sin x
Bizonyítás: A bizonyítást úgy végezzük el, hogy felírjuk az egyenlőségben szereplő mindhárom függvény 0-körüli Taylor-sorát, és az eredményeket összehasonlítjuk. A 3.2.12. példában előállítottuk a koszinusz függvény Taylor-sorát. n 1 2n x 2 x 4 x6 x8 cos( x) x 1 ...; 2 n ! 2! 4! 6! 8! n 0
xR
Ennek tagonkénti deriválásával adódik a szinusz függvény ellentettjének hatványsora, tehát. n 1 x3 x5 x 7 x9 sin( x) x 2n 1 x ...; 2n 1! 3! 5! 7! 9! n 0
xR
A 3.2.12. példabeli gondolatmenetet követve megmutatható, hogy a szinusz függvény Taylorsora ugyancsak az egész számegyenesen konvergens. Most felírhatjuk az Euler egyenlőség jobb oldalát hatványsor alakban. n n 1 2n 1 cos x i sin x x i x 2n 1 2n ! 2n 1! n 0 n 0
x 2 x 4 x6 x8 x3 x5 x 7 x9 1 ... i x ... 2! 4! 6! 8! 3! 5! 7! 9! x2 x3 x 4 x5 x 6 x 7 x8 x9 1 ix i i i i ...; x R 2! 3! 4! 5! 6! 7! 8! 9!
Ezek után nem kell mást tennünk, mint felírni a bal oldali függvény Taylor-sorát. Ehhez felhasználjuk a 3.2.10. példa eredményét. ix
e
ix n
n 0
n!
2 3 4 n ix ix ix ix 1 ix ... ...;
2!
3!
4!
n!
x R
Ha felhasználjuk, hogy i 4k 1; i 4k 1 i; i 4k 2 1 és i 4k 3 i , akkor azt kapjuk, hogy a jobboldal és baloldal Taylor-sora tagonként, rendre megegyezik. Ehhez már csak annyit kell hozzátenni – bizonyítás nélkül –, hogy az idézett sorok a teljes komplex számsíkon is konvergensek. ■
400
Óbudai Egyetem BGK
Fejezetek a matematikából
3.2.5. A Taylor-polinom és a Taylor-sor alkalmazásai Ebben a pontban néhány példán keresztül bemutatjuk a Taylor-polinom és a Taylor-sor alkalmazási lehetőségeit. Annak hangsúlyozása, hogy néha a polinomot használjuk, azért fontos, mert a gyakorlatban egy hatványsorból mindig csak véges sok tagot tudunk figyelembe venni, tehát minden ilyen alkalommal lényegében egy Taylor-polinommal dolgozunk és nem az egész sorral. Ha viszont a hibát is becsülni akarjuk, természetesen a sor összes többi tagjára vonatkozó becslést kell adnunk. Függvényértékek közelítő számítása.Az első két példa az egyik legfontosabb alkalmazást mutatja be, a közelítő függvényértékek kiszámítását és a kapcsolódó hibabecslést. Ehhez felidézzük Taylor-tételét, amely formulákkal a következő módon írható: f (n 1) ( ) n f ( x) Tx ( x) x x0 n 1 Txn0 ( x) Rn x ; azaz f x Txn0 ( x) Rn x 0 n 1!
Ez annyit jelent, hogy a közelítő függvényérték nem más, mint a Taylor-polinom helyettesítési értéke, a hiba pedig a Lagrange féle maradéktag abszolút értékével becsülhető. Mielőtt általános jellegű közelítéseket végeznénk a soron következő feladatokon belül, először a két leggyakrabban alkalmazott közelítést emeljük ki. a) Lineáris közelítés Ha a Taylor-polinomból csak az első fokú tagot tartjuk meg, akkor beszélünk elsőfokú vagy lineáris közelítésről. Ebben az esetben a közelítő formula az alábbi. f x f x0 f ' x0 x x0
Mivel a jobboldal az x változóban elsőfokú függvény, ezért a jobboldali függvény képe egyenes. Ezért is nevezzük ezt a közelítést lineárisnak. A lineáris közelítést akkor szokás alkalmazni, ha az x hely, ahol a közelítő függvényértéket számítjuk „elég közel van” az x0 helyhez. Itt emlékeztetnénk a derivált definíciójára:
f ' x0 lim
f x f x0
x x0
x x0
Ha ezzel a definícióval, és a derivált szemléletes tartalmával összevetjük az elsőfokú közelítés formuláját látható, hogy a lineáris közelítés azt jelenti, hogy a függvényt az x0-pontbeli érintőjével közelítjük. Példaként illusztráljuk a lineáris közelítést az f(x) = lnx függvény közelítését az x0 = 1 pontbeli elsőfokú Taylor-polinomjával. Ehhez szükség van az x0 = 1 pont körüli Taylor-sor első két
401
Óbudai Egyetem BGK
Fejezetek a matematikából
tagjára. Egyrészt f 1 ln1 0 , másrészt f ' x
1 miatt f ' 1 1 tehát a lineáris közelítést adó x
elsőfokú Taylor-polinom T11 f x 0 1 x 1 x 1 . Ezt szemlélteti a 3.2.9. ábra.
3.2.9. ábra. A logaritmus függvény grafikonja (kék színű görbe) és lineáris közelítése az x0 = 1 pont körül (piros színű egyenes).
b) Másodfokú vagy parabolikus közelítés Ha a Taylor-polinomból megtartjuk a konstans tagot az elsőfokú tagot és a másodfokú tagot is, akkor beszélünk parabolikus vagy másodfokú közelítésről. Ezt akkor szokás alkalmazni, ha a lineáris közelítés nem kielégítő pontosságú. Parabolikus közelítés esetén a közelítő formula az alábbi:
f x f x0 f ' x0 x x0
f " x0 2
x x0 2
Parabolikus közelítésre példaként lássuk a koszinusz hiperbolikusz függvény x0 = 0 pontbeli közelítését a másodfokú Taylor-polinomjával. Ehhez szükségesek a következő számítások: ch(0) 1;ch ' x sh x így ch ' 0 sh 0 0 végül ch" x ch x tehát ch " 0 1 .
Innen már következik, hogy a keresett másodfokú Taylor polinom:
T02 ch x 1 0 x
1 2 x2 x 1 2 2
A koszinusz hiperbolikusz függvényx0 = 0 pontbeli másodfokú közelítését illusztrálja a 3.2.10. ábra.
402
Óbudai Egyetem BGK
Fejezetek a matematikából
3.2.10. ábra. A koszinusz hiperbolikusz függvény grafikonja (kék színű görbe) és parabolikus közelítése az x0 = 0 pont körül (piros színű parabola).
3.2.18.Példa: Határozzuk meg ln2 közelítő értékét úgy, hogy a hatod-fokú Taylor-polinommal közelítünk és becsüljük meg a közelítés hibáját. A számításhoz felhasználjuk a 3.2.14. példa eredményét, az f(x) = ln(1+x) függvény Taylor-sorát. A feladat azt kívánja, hogy a hatod fokú Taylor-polinommal közelítsünk, ezért a sorból megtartjuk az első 6 tagot. T06 f x
6
1
x 2 x3 x 4 x5 x 6 x n 2 3 4 5 6
n 1 x
n 1
n
Mivel ln2 = f(1) ezért a közelítő érték a polinom x = 1 helyen vett helyettesítési értéke. Tehát írhatjuk, hogy ln 2 T06 f 1
6
n 1 1
n 1
1n 1 1 1 1 1 37 1 0, 616666... n 2 3 4 5 6 60
Ez azonban csak akkor használható eredmény, ha meghatározzuk, hogy mekkora a közelítés hibája. A hibát a maradéktaggal becsülhetjük. Mivel a sor 0-körüli Taylor-sor, és a helyettesítési értéket az x = 1 pontban számítjuk, Taylor-tétele szerint létezik olyan 0,1 valós szám, hogy teljesül az f ( x) T06 ( x)
f (7) ( ) 7 f (7) ( ) 7 x x 7! 5040
egyenlőség. Mivel a 0,1 valós számnak csak a létezését biztosítja a tétel, de nem ad módszert annak konkrét meghatározására, a maradéktagot csak becsülni tudjuk, célszerűen 403
Óbudai Egyetem BGK
Fejezetek a matematikából
természetesen felülről. Ehhez szükség van az f(x) = ln(1+x) függvény hetedik deriváltjára. Könnyen előállítható a függvény n-ed rendű deriváltja tetszőleges pozitív egész n-re. n 1 n 1 ! n f x 1 1 x n
Ebből a hetedik derivált is azonnal adódik. Kérdés, hogy hogyan lehet ennek az abszolút értékét a [0, 1] intervallumon felülről becsülni. Mivel a nevező x növekedésével szigorúan növekszik, a tört szigorúan csökken, így az x = 0 helyen veszi fel a legnagyobb értékét. Innen a közelítő érték hibája a következő.
f ( x) T06 ( x)
7 1! 17 6! 1 0,1428... f (7) ( ) 7 1 x 17 1 5040 5040 7! 7 1 0 n
Amelynek a felhasználásával írhatjuk, hogy ln2 a következő intervallumban van. 37 1 37 1 ln 2 ; 0, 4738;0, 7595 60 7 60 7
Látható, hogy a hiba még relatíve nagy, ami annak az oka, hogy a sor lassan konvergál, sokkal több tagot kellene figyelembe vennünk egy olyan eredmény meghatározásához, amelynél ln2-nek már vannak értékes jegyei. Pontosítva ezt, a számításból látható, hogy az n-ed fokú Taylor n 1! 1 hányadossal becsülhető. Ez polinommal történő közelítés esetén a közelítés hibája az n! n –2 azt jelenti, hogy ha pl. 10 pontosságú becslést szeretnénk, akkor n=100 tagot figyelembe kell venni a sorból, 10–3 pontossághoz pedig 1000 tagot, stb. Ezt jelenti a lassú konvergencia. Egy illusztráló feladatban ennyi tagot nyilván nem tudunk figyelembe venni. 3.2.19.Példa: Határozzuk meg 3 30 közelítő értékét úgy, hogy a negyedfokú Taylor-polinommal közelítünk és becsüljük meg a közelítés hibáját. A Taylor-polinom ebben az esetben a 3.2.17. példában szereplő f x 3 1 x függvény binomiális sorából adódik, ha az első öt tagot megtartjuk. Öt tagot kell figyelembe vennünk, mert a sor konstans taggal kezdődik. A negyedfokú Taylor-polinom tehát a következő.
1 1 1 1 1 2 ... k 1 3 3 3 3 x k 1 1 x 1 x 2 5 x3 10 x 4 T04 f x k! 3 9 81 243 k 0 4
A kérdéses függvényértéket nem úgy számítjuk, hogy a polinomba az x = 29 értéket helyettesítjük, hiszen a Binomiális sor csak a ]–1, 1[ intervallumban konvergens. Ezért először azonos átalakításokat végzünk.
404
Óbudai Egyetem BGK
Fejezetek a matematikából 3
30 3 27 3 3 33 3 3 3 1
1 9
1 értéket 9 helyettesítjük, ugyanis ezen a helyen a Binomiális sor konvergál. Ezek szerint a közelítő függvényérték: Ebben az esetben már helyesen járunk el, ha a felírt Taylor-polinomba az x
3 30 3 T 4 f 1 3 1 1 1 1 1 5 1 10 1 3,10723107 0 3 9 9 2 81 3 243 4 9 9 9 9
Megkaptuk tehát a közelítő értéket, de meg kell becsülni a közelítés hibáját is. Ezt ismét a Lagrange-féle maradéktaggal végezzük el. A negyedfokú polinomhoz tartozó maradéktag a következő: R4 x
f (5) ( ) 5 x . Ehhez tehát szükséges az f(x) függvény ötödik deriváltja. 5!
1 1 1 1 1 1 1 5 880 5 f x 1 2 3 4 1 x 3 3 3 3 243 3 1 x 14 3 3
Innen a hiba, a derivált függvény szigorú monoton csökkenésének figyelembe vételével a 1 következő módon becsülhető. 0, esetén. 9
f ( x) T04 ( x)
f (5) ( ) 5 1 880 1 x x5 5! 120 243 3 1 14
880 1 1 28160 1 0, 0000163 5 29160 3 1 0 14 9 29160 59049
A közelítés hibája tehát 10–5 nagyságrendű. 3.2.20.Példa: Fordítsuk most meg a kérdésfeltevés logikáját. Előírunk egy hibakorlátot, és annak megfelelően közelítünk Taylor-polinommal. Példaképpen számítsuk ki az Euler-féle e szám közelítő értékét 10–5 pontossággal! Ehhez nyilván az exponenciális függvény Taylor-sorát használjuk fel. Ha az n-ed fokú Taylor-polinommal közelítünk, akkor figyelembe véve, hogy az exponenciális függvény szigorúan monoton növekedő, hogy e = f(1), tehát x = 1, továbbá azt, hogy 0 1 valamint azt az analízisből ismert becslést, hogy e < 3, a Lagrange-féle maradéktagot a következő módon becsülhetjük.
405
Óbudai Egyetem BGK Rn x
Fejezetek a matematikából
f ( n 1) ( ) exp( n 1) ( ) n 1 e 3 x x x0 n 1 n 1! n 1! n 1! n 1!
Ha az előírás az, hogy a hiba legyen kisebb, mint 10–5, akkor a feltétel n-re az, hogy 3 105 , azaz 300000 n 1! teljesüljön. Ez igaz n = 8 esetén, ugyanis n 1! (8 + 1)! = 362880. Tehát ha a 3.2.10. példa eredményét felhasználva a nyolcad fokú Taylorpolinommal közelítünk az x = 1 helyen, akkor e értékét a kívánt pontossággal kapjuk. e T08 exp(1)
8
f (n) (0) n 1 1 1 1 1 1 1 n! 1 1 1 2! 3! 4! 5! 6! 7! 8! 2, 71827876... n 0
Ismerve az e szám több tizedesre pontos értékét, e = 2,71828182..., látható, hogy a becslés hibája valóban a kívánt nagyságrendbe esik. Mivel ebben az esetben, egy n-ed fokú polinommal 1 közelítve, a hiba lényegében nagyságrendjébe esik, mondhatjuk, hogy a Taylor-sor n 1! ebben az esetben gyorsan konvergál, viszonylag kis számú tag figyelembe vételével pontos közelítést adhatunk a függvényértékre. Integrálás A továbbiakban a Taylor-sor illetve a Taylor-polinom integrálszámításbeli alkalmazását mutatjuk be. Az alkalmazás azért fontos, mert számos olyan függvény létezik, amely a műszaki gyakorlatban és elméleti szempontból is fontos, de a függvénynek nem létezik primitív
sin x cos x e x 1 ; ; ;sin x 2 ;cos x 2 ;...;stb. x x x függvények. Ha nem létezik primitív függvény, akkor a függvény analitikusan nem integrálható. Ha azonban a függvényt egy alkalmas pont körül Taylor-sorba fejtjük és a megfelelő fokú Taylor-polinomot integráljuk a megadott intervallumon, akkor tetszőleges pontossággal közelíthetjük a határozott integrál értékét. A mondottak szerint a probléma vizsgálatát kétféle módon folytatjuk. Megvizsgáljuk a határozatlan és a határozott integrálás lehetőségét. függvénye.
Ilyen
függvények
például
az
e x ; 2
Ha határozatlan integrált számítunk, akkor gyakorlatilag a függvény primitív függvényének analitikus alakját közelítjük egy Taylor-sorral. Ebben az esetben egy speciális primitív függvényt választunk, az integrálfüggvényt. Az integrálfüggvény voltaképpen egy [a, x] intervallumra vonatkozó határozott integrál, ahol az alsó határ rögzített a felső határ azonban változó. Ezért szokás erről úgy beszélni, hogy az integrál a felső határ függvénye. Ebben az esetben tehát egy x
f t dt a
406
Óbudai Egyetem BGK
Fejezetek a matematikából
alakú integrált számítunk ki, ha az integrandusnak nem létezik primitív függvénye, de Taylorsorba fejthető. Ha az integrandusnak létezik hatványsora, akkor a hatványsorokról elmondott általános tételek szerint, a hatványsort a konvergencia halmaz bármely zárt részintervallumán tudjuk tagonként integrálni, mert ott egyenletesen konvergens, és a tagonkénti integrálással kapott hatványsor ugyanabban a nyílt intervallumban konvergens ahol az integrandus. Ha ezt alkalmazni akarjuk határozott integrál kiszámítására, akkor nem kell mást tennünk, mint az integrálással kapott sorban az x változó helyére helyettesíteni a konkrét felső határt. Az integrál hibájának becslésére pontosan azok a módszerek használhatóak, amelyeket a közelítő függvényértékek hibabecslésénél alkalmaztunk, tehát a Taylor-tétel illetve a maradéktag, de gyakran ennél sokkal egyszerűbben is célhoz érünk. Ha általánosabb határozott integrálokat számolunk, a közelítés logikája illetve az integrál hibájának becslése elvileg pontosan azon az egyenlőségen múlik, mint a függvényértékek közelítése, vagyis az f ( x) Txn ( x) 0
f (n 1) ( ) x x0 n 1 Txn0 ( x) Rn x n 1!
Taylor-tételen. Innen egy adott [a, b] intervallumra vonatkozó határozott integrál közelítő értéke és a közelítés hibája a következő módon becsülhető. b
b
f ( x)dx
a
a
b
Txn ( x)dx 0
b
b
Rn x dx; f ( x)dx
a
a
a
b
Txn ( x)dx 0
Rn x dx Rn x b a max a
Az integrál hibája tehát nem más, mint a maradéktag abszolút értékének maximuma szorozva az integrációs intervallum hosszával. Ez az általános elv azonban nem minden esetben gyümölcsöző, gyakran sokkal jobb becslést kapunk a hibára, ha a később tárgyalt 3.2.22. és 23. példákban követett gondolatmenetet követjük. Ezt illusztráljuk is az alábbiakban. 3.2.21. Példa:Számítsuk ki negyed-fokú polinommal közelítveaz f x e x függvény határozott integrálját a [0, 1] intervallumon és becsüljük meg az integrál hibáját. Ehhez először felhasználjuk a 3.2.10. példa eredményét, vagyis az exp(x) függvény Taylor-sorát, amelyről 2
2 tudjuk, hogy mindenütt konvergens. Ebből következik, hogy egyszerűen az x x helyettesítéssel kapjuk az exp(x) függvény sorából az f(x) függvény sorát, és a kapott sor ugyancsak mindenütt konvergens lesz. A negyedfokú Taylor-polinom a következő:
T04 f ( x) 1 x 2 Ennek integrálásával kapjuk az integrál közelítő értékét.
407
x4 2!
Óbudai Egyetem BGK 1
e
x2
0
Fejezetek a matematikából
1 1 4 x3 x5 4 2 x dx T0 f ( x)dx 1 x dx x 0, 766666... 2! 3 10 0 0 0 1
Kérdés, hogy milyen pontossággal kaptuk az integrál értékét. A hibabecsléshez szükség van a Lagrange-féle maradéktagra. Ebben szerepel az f(x) függvény ötödik deriváltja, ez a következő:
2 5 f x e x 32 x5 16 x3 48x 2 72 x 24 . A hibabecsléshez ezt a deriváltat kell felülről
becsülni a [0, 1] intervallumon. Itt elkel némi grafikus segítség.Az ötödik derivált-függvény görbéje látható a 3.2.11. ábrán.
3.2.11. ábra. Az ötödik derivált grafikonja a [0, 1] intervallumban és környezetében
5 A derivált felső becslése az adott intervallumon a következő: f x 40 . Eszerint a határozott
integrál hibája a Lagrange-féle maradéktag becslésével a következő. 1
0
1
f ( x)dx T04 ( x)dx 0
f (5) ( ) 5 40 1 1 0 1 0 0,33 5! 120
Ez a pontosság, figyelembe véve a közelítő értéket, messzemenően nem kielégítő. Ez abból adódik, hogy a Taylor-tételnem mond semmit arról, hogy a 0,1 valós szám az intervallumban pontosan hol van. Mint az ábráról kiderül, a kérdéses polinom ezen az intervallumon felvesz a 0 és durván a 40 valós szám között minden értéket, de nem tudjuk pontosan, hogy melyiket kell figyelembe venni a becsléshez. Ezért a maradéktag ebben az esetben csak egy nagyon durva felső becslést ad a hibára. Sokkal pontosabb becslést kaphatunk, és ráadásul egyszerűbben, ha ehelyett a következő 3.2.22-24. példák logikáját követjük. 3.2.22.Példa: Tűzzük ki ismét az előző feladatbeli problémát kis módosítással. Határozzuk meg x
az
2
t e dt integrálfüggvényt hatványsor alakban. A sorfejtéshez felhasználjuk a 3.2.10. példa 0
408
Óbudai Egyetem BGK
Fejezetek a matematikából
eredményét, vagyis az exp(x) függvény Taylor-sorát, amelyről tudjuk, hogy mindenütt konvergens. Ebből következik, hogy az x x2 helyettesítéssel kapjuk az exp(x) függvény sorából az integrandus sorát, és a kapott sor ugyancsak mindenütt konvergens lesz.
et 1 t 2 2
t 4 t 6 t 8 t10 ...; t R 2! 3! 4! 5!
A sorfejtést szemlélteti a 3.2.12. ábra.
3.2.12. ábra. Az exp(–x2) függvény grafikonja (kék színű görbe) és közelítése nyolcad fokú Taylor-polinommal (piros színű görbe)
A keresett integrálfüggvény ezen sor tagonkénti integrálásával születik. x
t e dt x 0
2
x3 x5 x7 x9 x11 ...; x R 3 5 2! 7 3! 9 4! 11 5! 1
Ezzel a primitív függvény közelítését megkaptuk. Alkalmazzuk most ezt a sort az
e
t 2
0
dt
határozott integrál közelítésére. Írjunk elő 10–4 pontosságot. Az x helyére tehát írjunk 1-et, és számoljunk: 1
1 1 1 1 1 1 1 1 1 1 1 1 t 2 e dt 1 3 5 2! 7 3! 9 4! 11 5! 13 6! 1 3 10 42 216 1320 9360
0
1 0,333333 0,100000 0, 023809 0, 004629 0, 000757 0, 000106 0, 746836
409
Óbudai Egyetem BGK
Fejezetek a matematikából
A közelítés hibáját azonban nem a Lagrange-féle maradéktaggal becsüljük, hanem felhasználjuk, hogy a becslést jelentő numerikus sor váltakozó előjelű, és nyilvánvalóan abszolút értékben monoton csökkenő sorozatból van képezve. Egy ilyen sor esetében pedig tudjuk – 3.1. fejezet, 3.1.8. tétel –, hogy az elhagyott tagok összege kisebb, mint az elhagyott tagok között az első tag 1 1 1,322 105 . A hiba ennél kisebb, kijelenthetjük abszolút értéke. Ez esetünkben 15 7! 75600 tehát, hogy az integrál értékét 4 tizedes pontossággal kaptuk. Az integrálást szemléltetni is lehet, ha az integrálfüggvényt numerikus módon, tehát például Simpson-módszerrel kiszámítjuk az x = 0 ponttól jobbra. A 3.2.13. ábrán az integrálfüggvény ilyen numerikus módon történő meghatározásával született görbe és az integrálfüggvény heted fokú Taylor-polinomja látható.
3.2.13. ábra. Az exp(–x2) függvény numerikus módszerrel kapott integrálfüggvényének grafikonja (kék színű görbe) és az integrálfüggvény közelítése heted fokú Taylor-polinommal (piros színű görbe). A pontozott egyenes az integrálás felső határát jelöli a példabeli konkrét esetben.
et 1 dt integrálfüggvényt hatványsor alakban. Az 3.2.23.Példa: Határozzuk meg az Ei x : t 0 integrandus hatványsorát ugyancsak a 3.2.10. példa eredménye alapján tudjuk meghatározni. x
et 1 1 t n t n 1 t t 2 t3 t n 1 1 1 ... ...; t R t t n 0 n ! n 1 n ! 2! 3! 4! n!
Ez a sor ugyancsak a teljes számegyenesen konvergens, mert ugyanazok az együtthatói, mint az exponenciális függvény Taylor-sorának, tehát tagonként integrálható az egész számegyenesen. A tagonkénti integrálással kapjuk a primitív függvény Taylor-sorát.
410
Óbudai Egyetem BGK
Fejezetek a matematikából
e 1 t n 1 xn x2 x3 x4 xn t dt n! dt n n! x 2 2! 3 3! 4 4! ... n n! ...; x R n 1 n 1 x t
x
0
0
ezzel megkaptuk a primitív függvényt hatványsor alakban. Könnyen ellenőrizhető a CauchyHadamard tétel alapján, hogy ez a sor ugyancsak mindenütt konvergens. Számítsuk ki ennek 1 t e 1 dt határozott integrált 4 tizedes pontossággal. Helyettesítsünk a sorban felhasználásával az t 0 az x helyére 1-et. 1 t
0
e 1 1 1 1 1 1 1 1 1 1 1 dt 1 1 t 2 2! 3 3! 4 4! 5 5! 6 6! 4 18 96 600 4320 1 0, 250000 0, 055555 0, 010416 0, 001666 0, 000231 1,317868
A határozott integrál hibájának a becslésére ismét nem a maradéktagot használjuk, hanem ehelyett becsüljük a sorból elhagyott tagok összegét.
1 1 1 1 1 1 1 1 ... ... 7 7! 8 8! 9 9! 10 10! 7 7! 7 8! 7 9! 7 10! 1 1 1 1 1 1 1 1 1 ... 1 ... 2 3 7 7! 1 8 8 9 8 9 10 7 7! 8 8 8
1 1 1 8 3, 239 105 7 7! 1 1 7 7! 7 8
Ez a közelítés hibájának felülről becsült értéke. Ebből látható, hogy a határozott integrál értékét valóban négy tizedes pontossággal kaptuk. 0,5
3.2.24.Példa: Számítsuk ki az
cos x
2
dx határozott integrál közelítő értékét hét tizedes
0
pontossággal. Ehhez felhasználjuk a koszinusz függvény Taylor-sorát, amelyet a 3.2.12. példában 2 meghatároztunk. Ez a sor mindenütt konvergens, így az x x helyettesítéssel ugyancsak mindenütt konvergens sort kapunk. Ez utóbbi az integrandus Taylor-sora:
cos t 2 1
t 4 t 8 t12 t16 t 4n ... ; t R 2! 4! 6! 8! 2 n ! n 0
Ez a sor Abel tétele miatt a számegyenes bármely részintervallumán egyenletesen konvergens, így tagonként integrálható. A tagonkénti integrálással kapott sor, tehát a keresett integrálfüggvény hatványsor alakja a következő.
411
Óbudai Egyetem BGK
Fejezetek a matematikából
x5 x9 x13 x17 x 4n 1 cos t dt x 5 2! 9 4! 13 6! 17 8! ... 4n 1 2n !; x R n 0 x
2
0
Ebben a sorban kell az x helyére 0,5-et helyettesíteni és kellő számú tagot figyelembe venni a kívánt pontosság eléréséhez. 0,5
cos t
0
2
dt
1 1 1 1 1 1 2 9 2 2 5 2! 2 9 4! 2 40 18432
0,50000000 0, 02500000 0, 00005425 0, 47505425 A közelítő érték hibájának becsléséhez azt kell figyelembe venni, hogy az integrálfüggvényt adó sor olyan sorozatból van képezve, amely az x = 0,5 helyen váltakozó előjelű és abszolút értékben szigorúan monoton csökkenő sorozatból van képezve. Eszerint, felhasználva a 3.1.8. tétel bizonyításának gondolatmenetét, az elhagyott végtelen sok tag összege biztosan kisebb, mint az elhagyott tagok között az első tag abszolút értéke. Ez pedig a következő.
1 213 13 6!
1 1,304 108 76677120
A hiba ennél kisebb. Eszerint, a kapott közelítő érték hét tizedes pontossággal adja a kérdéses határozott integrál értékét. Lineáris differenciálegyenletek soralakú megoldása Lineáris differenciálegyenletek esetében nem minden esetben tudunk előállítani analitikus megoldást zárt alakban. Ugyanis ha a differenciálegyenlet együtthatói nem konstansok, akkor nincs általános módszer az analitikus megoldás előállítására. Ebben az esetben egy lehetséges módszer a soralakú megoldás előállítása. Induljunk ki a lineáris differenciálegyenlet általános alakjából. n n 1 an x y x an 1 x y x ... a2 x y" x a1 x y ' x a0 x y x b x
Tegyük fel az általános esetben, hogy az együtthatófüggvények és a jobboldal Taylor-sorba fejthető. Ebben az esetben kereshetjük a megoldást Taylor-sor alakjában. Az eljárás abban áll, hogy miután az együtthatókat, a jobboldalt, és a megoldásfüggvényt sorba fejtjük, behelyettesítünk az egyenletbe, elvégezzük a kijelölt műveleteket, és az egyenlet két oldalán együttható összehasonlítást végzünk. Ez a módszer általában a differenciálegyenlet rendjétől függően csak egy vagy több állandó szorzó erejéig határozza meg az ismeretlen együtthatókat, ezért megfelelő számú kezdeti feltételt is csatolni kell a differenciálegyenlethez, tehát egy kezdeti érték probléma megoldását tudjuk hatványsor alakban előállítani. A módszer akkor is használható, ha az együtthatók konstansok, tehát az egyenlet állandó együtthatójú. Ebben az esetben nem kell az együtthatók sorfejtésével foglakoznunk.
412
Óbudai Egyetem BGK
Fejezetek a matematikából
3.2.25. Példa: Első illusztráló példaként oldjuk meg az y ' y x; y 0 0 állandó együtthatójú egyenletre vonatkozó kezdeti érték problémát. Keressük a megoldást y x cn x n alakban. A n 0
kezdeti feltételből máris következik, hogy c0 0 . Az egyenletbe történő helyettesítéshez szükség van az y deriváltjára: y ' x ncn x n1 . Ezek után helyettesíthetünk az egyenletbe, vagy n 1
célszerűbben annak y ' y x átrendezett alakjába:
c1 2c2 x 3c3 x 2 4c4 x3 ... ncn x n1 ... x c0 c1x c2 x 2 c3 x3 c4 x 4 ... cn x n ... Figyelembe véve a kezdeti feltételt és kissé több tagot, némi rendezés után azt kapjuk, hogy: c1 2c2 x 3c3 x 2 4c4 x3 5c5 x 4 ... ncn x n1 n 1 cn1x n ... 1 c1 x c2 x 2 c3 x3 c4 x 4 ... cn1 x n1 cn x n ...
Most összehasonlítjuk az egyenlet két oldalát, egyenlővé tesszük az azonos hatványok együtthatóit: c1 0
1 1 ; 2 2! c 1 c3 2 ; 3 3! c 1 c4 3 ; 4 4!
2c2 c1 1; c2 3c3 c2 ; 4c4 c3 ; ... ncn cn 1;
cn
cn 1 1 ; n n!
...
1 ha n 2 . Ebből pedig a 3.2.10. n! példa alapján ráismerhetünk az exponenciális függvény Taylor-sorára, csak azt kell tekintetbe vennünk, hogy a sor az n = 2 indexszel kezdődik. Tehát a kezdeti érték probléma megoldása: Innen már világos, hogy az együtthatók: c0 c1 0; cn
xn y x ex x 1 n2 n ! Ebben az esetben tehát zárt alakban is meg tudtuk adni a megoldást. 3.2.26. Példa: Második illusztráló példaként oldjuk meg a y " x2 y 0; y 0 y ' 0 1 másodrendű differenciálegyenletre vonatkozó kezdeti érték problémát. Lényeges különbség az
413
Óbudai Egyetem BGK
Fejezetek a matematikából
előző példához képest, hogy ez a másodrendű lineáris differenciálegyenlet nem állandó együtthatójú. Ilyen egyenletek megoldására nem létezik általános módszer. Keressük a megoldást y x cn x n alakban. A helyettesítéshez szükség van az y második deriváltjára. n 0
y ' x ncn x n1; y " x n n 1 cn x n2 . n 1
n2
Helyettesítsünk az egyenletbe.
n n 1 cn xn2 x2 cn xn 0
n2
azaz
n 0
n n 1 cn x n2 cn x n2 ;
n2
n 0
Az együtthatók összehasonlításhoz célszerű mindkét oldalon néhány tagot felírni. 2c2 3 2c3 x 4 3c4 x 2 5 4c5 x3 6 5c6 x 4 ... n n 1 cn x n2 ...
c0 x 2 c1 x3 c2 x 4 c3 x5 c4 x6 ... cn4 x n2 ...
Mielőtt az együtthatókat összevetjük, vegyük figyelembe a kezdeti feltételeket. Az y 0 1 feltételből következik, hogy c0 1 , az y ' 0 1 feltételből pedig az következik, hogy c1 1 . Ezek után írhatjuk, hogy 2c2 0; c2 0; 6c3 0; c3 0; 1 ; 12 1 20c5 c1 1; c5 ; 20 30c6 c2 0; c6 0; ...stb.
12c4 c0 1; c4
Az eredmény alapján fel tudjuk írni a megoldásfüggvény Taylor-sorának első néhány tagját.
y x 1 x
1 4 1 5 x x ... 12 20
Ebben az esetben nem kaptunk nevezetes Taylor-sort, a zárt alak – amennyiben létezik – ebből még nem határozható meg. Ettől eltekintve a megoldásfüggvény polinommal történő közelítését megadtuk olyan esetben, amikor a megoldáshoz nem létezik kvadratura, azaz olyan algoritmus, amellyel az egyenlet megoldható lenne. Amennyiben pontosabb megoldásra van szükség, természetesen több tagot veszünk figyelembe a sorból.
414
Óbudai Egyetem BGK
Fejezetek a matematikából
Transzcendens egyenletek közelítő megoldása Transzcendens egyenletnek nevezünk egy algebrai egyenletet akkor, ha a megoldás a négy alapművelet és a gyökvonás véges sokszori alkalmazásával nem állítható elő. Ebben az esetben azt a függvényt, amely az egyenletben a transzcendenciát okozza, helyettesítjük egy alkalmas fokú Taylor-polinommal, és ebben az esetben oldjuk meg az egyenletet, amely megoldás közelítő megoldásnak elfogadható, amely közelítés például numerikus módszerek kezdőértékének tekinthető. 3 2 3.2.27. Példa: Határozzuk meg a 6sin x x 2 x transzcendens egyenlet közelítő megoldását. Világos, hogy ez az egyenlet valóban transzcendens, az x ismeretlent véges sok lépésben nem lehet kifejezni. Ennek az oka, hogy az egyenletben szerepel a sinx függvényérték. Helyettesítsük ezért a szinusz függvényt egy alkalmas fokszámú Taylor-polinomjával. Annak érekében, hogy megoldható algebrai egyenletet kapjunk, válasszuk a harmadfokú Taylor-polinomot. Ekkor a következő egyenlet adódik.
x3 x3 6 x x3 2 x 2 ; azaz 6 x x3 2 x 2 ; tehát 6 x x3 x3 2 x 2 3! 6 2 Összevonás után tehát a feladat arra redukálódik, hogy megoldjuk a 6 x 2 x másodfokú egyenletet. Ennek megoldása, amely tehát az eredeti transzcendens egyenlet közelítő megoldása: x1 0; x2 3 . A példa lezárásaként megjegyezzük, hogy az x1 = 0 gyök nem csak közelítő, hanem pontos megoldása az eredeti transzcendens egyenletnek, amiről helyettesítéssel könnyen meggyőződhetünk.
Határértékek kiszámítása Bizonyos esetekben, amikor a határérték "kritikus", célravezető a határérték formulában szereplő függvényeket a Taylor-sorukkal helyettesíteni, mert így más módszerek, például a L'Hospital szabály alkalmazása nélkül is kiszámítható a határérték. 3.2.28. Példa: Számítsuk ki a következő határértéket.
1 cos t lim t 0
t2 2
t4
0 típusú kritikus határérték. Ahelyett azonban, hogy az 0 ilyenkor szokásos L'Hospital szabályt alkalmaznánk, sorfejtést végzünk. A 3.2.12. példa eredményét, tehát a koszinusz függvény Taylor sorát felhasználva, azt írhatjuk, hogy Helyettesítéssel látható, hogy a határérték
415
Óbudai Egyetem BGK
Fejezetek a matematikából
1 t2 t2 t4 t6 1 t4 t6 1 t2 t4 1 1 1 ... lim ... lim ... 4 4 t 0 t 2 2 4! 6! 24 t 0 t 4! 6! t 0 4! 6! 8!
lim
3.2.29. Példa: Számítsuk ki a következő határértéket.
x arctgx x 0 x3
lim
0 típusú kritikus határérték. A kiszámításához elsőként sorba kell fejteni az 0 arkusztangens függvényt. Induljunk ki a függvény deriváltjából. Ez ugyancsak
f ' x arctgx '
1 1 x2
Azonos átalakításokkal látható, hogy a derivált függvény egy mértani sornak az összegfüggvénye, pontosan a q x 2 kvóciensű mértani sor összegfüggvénye. f ' x arctgx '
1 1 1 x 2 x 4 x6 ...; x 1,1 2 2 1 x 1 x
Innen az arkusztangens függvény sora tagonkénti integrálással adódik. arctg x x
x3 x5 x 7 ...; x 1,1 3 5 7
Ebből pedig a keresett határérték már könnyen adódik.
x arctgx 1 1 x3 x5 x 7 lim x arctg x lim x x ... 3 3 3 x 0 x 0 x x 0 x 3 5 7 x
lim
1 x2 x4 1 lim ... x 0 3 5 7 3 Befejezésül szemléltetjük a példában szereplő sorfejtést. A 3.2.14. ábrán látható az arkusztangens függvény és a függvényt közelítő heted fokú Taylor polinom.
416
Óbudai Egyetem BGK
Fejezetek a matematikából
3.2.14. ábra. Az arkusztangens függvény grafikonja (kék színű görbe) és a közelítő heted fokú Taylor-polinom (piros színű görbe). A pontozott egyenesek a konvergencia halmaz határait jelölik.
417
Óbudai Egyetem BGK
Fejezetek a matematikából
3.3. Fourier-sorok 3.3.1. Problémafelvetés A probléma nagyban hasonlít ahhoz a kérdéskörhöz, amelyet a hatványsorok témakörében vizsgáltunk. Az alapvető különbség az, hogy ebben az esetben periodikus függvények sorfejtésének a lehetőségét vizsgáljuk. Mivel a függvény, amelyet függvénysor összegeként állítunk elő periodikus, nem meglepő, hogy a függvénysor tagjai is periodikus függvények. Konkrétan azt tűzzük ki feladatként, hogy egy periodikus függvényt szinusz és koszinusz függvények végtelen összegeként állítsunk elő. Induljunk ki az alábbi R2-beli problémából. Adott R2-ben a standard {e1, e2} bázis, amelyről tudjuk, hogy egységnyi hosszúságú vektorok és merőlegesek. Adott egy tetszőleges x R2 vektor az alábbi lineáris kombinációval. x = α1∙e1 + α2∙e2 Kérdés, hogyan határozhatjuk meg az elállításban szereplő α1 és α2 R együtthatókat? Mielőtt erre válaszolunk, világítsuk meg a problémát egy egyszerű síkbeli ábrával.
x
α2e2 e2 e1
α1e1
Nyilvánvaló, hogy az előállítás egyértelmű, tehát az α1 és α2 Regyütthatók egyértelműek. Az együtthatók meghatározásához idézzük fel a skaláris szorzat fogalmát. 3.3.1.Definíció: AzR2-beli x és y vektorok <x, y>-nal jelölt skaláris szorzatán értjük az alábbi háromtényezős szorzatot: <x, y> = │x│∙│y│çosα ahol α az x és y vektorok szöge, │x│jelöli az x vektor hosszúságát. Könnyen ellenőrizhető, hogy ez a művelet rendelkezik az alábbi tulajdonságokkal: 1. <x, y> = 2. <λx, y> =λ; λ R 3. <x+z, y> =<x, y> + 4. <x, x> ≥ 0 és <x, x> = 0 akkor és csak akkor, ha x = 0.
418
Óbudai Egyetem BGK
Fejezetek a matematikából
A továbbiakban skaláris szorzatnak nevezünk majd minden olyan leképezést, amely két általános értelemben vett vektorhoz olyan módon rendel valós számot, hogy teljesülnek az 1-4. tulajdonságok. Így innentől kezdve a 3.3.1. definíció értelmezi a skaláris szorzat fogalmát. A definícióból adódóan, ha egy vektort saját magával szorzunk skalárisan, akkor abszolút értékének négyzetét kapjuk, hiszen ekkor α = 0, tehát cos0 = 1 miatt <x, x> = │x│2. Azért alkalmazunk itt a lineáris algebrában megszokott xTy jelöléstől eltérő jelölést a skaláris szorzatra, mert az ott megismert fogalmat itt általánosabb értelemben használjuk majd, olyan „vektorok” esetében is, amelyeknél nincs értelme a transzponálás műveletének, de a skaláris szorzat fogalma, általánosabb értelemben, érvényben marad. Van még egy nagyon fontos tulajdonsága a skaláris szorzatnak, amely használatát nagyon praktikussá teszi: <x, y> = 0 akkor és csak akkor, ha x merőleges y-ra. Ez utóbbi tétel felhasználásával meghatározhatjuk a fenti előállításban szereplő α1 és α2 együtthatókat. Sorozzuk meg az x = α1∙e1 + α2∙e2 egyenlet mindkét oldalát skalárisan először az e1majd az e2vektorral. A szorzások eredménye <x, e1> = α1, és <x, e2> = α2. Megkaptuk tehát az együtthatókat a fenti előállításban. x = <x, e1> ∙e1 + <x, e2> ∙e2 A kétdimenziós probléma vizsgálatából az is nyilvánvalóan következik, hogy felírható az együtthatókra a Pitagorasz-tétel, amely szerint. 2
x 12 22 x, e1
2
x, e2
2
2
x, ei
2
i1
Ez a gondolatmenet általánosítható olyan többdimenziós vektorterekben, ahol definiálva van egy skaláris szorzat. Ehhez értelmeznünk kell a skaláris szorzat fogalmát függetlenül annak geometriai tartalmától, hiszen 3-nál több dimenziós terekben, amelyekben a „vektor” nem a klasszikus értelemben vett vektort jelenti, a geometriai fogalmaknak nincs értelme. Azonban nyilvánvaló, hogy ha a konkrét geometriai tartalom el is veszik, a műveleti tulajdonságok fennmaradhatnak. Az alábbiakban, a Fourier-sorok elméletének kifejtése során, általánosítani fogjuk nem csak a skaláris szorzat fogalmát, hanem a bevezetőben említett vektor felbontási problémát végtelen dimenziós függvényterekben. Érdekes módon, bár a geometriai szemléltetési lehetőség elvész, az alapvető fontosságú összefüggések érvényben maradnak. Felhívjuk az Olvasó figyelmét a későbbiekben igazolt Parseval-egyenlőségre, amely a Pitagorasz-tétel végtelen dimenziós általánosításának tekinthető. 3.3.2.Definíció: Legyen L egy lineáris tér. Értelmezzünk egy <∙, ∙> szimbólummal jelölt leképezést az L × L térben az alábbi módon: <∙, ∙>: L × L → R, tehát a leképezés két L-beli elemhez (vektorhoz) egy valós számot rendel, és tegyük fel, hogy teljesülnek az alábbi tulajdonságok.
419
Óbudai Egyetem BGK
Fejezetek a matematikából
1. <x, y> = 2. <λx, y> =λ,λ R 3. <x+z, y> =<x, y> + 4. <x, x> ≥ 0 és <x, x> = 0 akkor és csak akkor, ha x = 0. Ebben az esetben a <∙, ∙>: L × L → R leképezést L-beli skaláris szorzatnak nevezzük. A pont elején felvetet problémában szerepelt a merőlegesség fogalma. Általánosítsuk ezt is. 3.3.3.Definíció: Legyen adva egy x és egy y „vektor” egy L lineáris térben. Az x és y vektorokat ortogonálisaknak nevezzük, ha <x, y> = 0. A fentiekben használtuk még a vektor abszolút értékének fogalmát. Ezt a fogalmat is általánosítjuk megtartva az abszolút érték legfontosabb tulajdonságait, illetve pontosabban felhasználjuk ezeket a fogalom általánosításának definíciójában. Azért kell az abszolút értéket általánosítanunk, mert olyan fogalmakkal dolgozunk majd, például függvényekkel, amelyeknek létezik abszolút értéke a hagyományos értelemben, de ez az abszolút érték nem tekinthető a vektor abszolút értéke azaz a vektor hossza általánosításának. 3.3.4.Definíció: Legyen adva egy L lineáris tér, és értelmezzünk egy ║∙║ szimbólummal jelölt ║∙║: L → R leképezést az alábbi tulajdonságokkal. 1. ║x║≥ 0 és║x║= 0 pontosan akkor, ha x = 0, 2. ║λx║=│λ│∙║x║,λ R 3. ║x + y║≤║x║+ ║y║. Ebben az esetben a║∙║: L → R leképezést L-beli normának nevezzük. A klasszikus esetben egy vektort egységnyi abszolút értékűnek neveztünk. Most azt mondjuk, hogy egy vektor normája egységnyi, és azt írjuk, hogy ║x║= 1. Nem meglepő, ha azt állítjuk, hogy a fent értelmezett két művelet között van kapcsolat. Vegyük észre a műveleti tulajdonságokat vizsgálva, hogy a x x, x definícióval meghatározott művelet teljesíti a normára vonatkozó definíció követelményeit, tehát ez a művelet norma. Általánosítani fogjuk a bevezetőben említett problémát. Ehhez a bázis fogalmát kell kiegészítenünk olyan lineáris terekben, amelyekben értelmezve van egy skaláris szorzás. 3.3.5.Definíció: Legyen L egy lineáris tér, és legyen <∙, ∙>: L × L → R leképezés egy L-beli skaláris szorzat. Legyen továbbá B = {b1, b2, b3, …, bn,…} az L tér egy bázisa. A B bázist ortonormált bázisnak nevezzük, ha a bázisvektorok páronként ortogonálisak és minden bázisvektor normája egységnyi. Tehát = 0 ha i ≠ j, és ║bi║= 1, ha i = 1,2,3,…n,… .
420
Óbudai Egyetem BGK
Fejezetek a matematikából
A definícióban nem szükséges feltételezni, hogy a bázis elemszáma véges, tehát az említett fogalmak végtelen dimenziós vektorterekben is érvényesek, sőt az alábbi vizsgálatok szempontjából még fontosabbak. A jegyzetben tárgyalt alkalmazások, a Fourier-sorok végtelen dimenziós lineáris terekben értelmezett sorfejtések. 3.3.6.Definíció: Legyen L egy lineáris tér, és legyen B = {b1, b2, b3, …, bn,…} az L tér egy ortonormált bázisa. Tetszőleges xL vektort felírhatunk a báziselemek egyértelmű lineáris kombinációjaként. x = α1∙b1 + α2∙b2 +α3∙b3 +…+αn∙bn +… Az αi együtthatókat a fenti gondolatmenettel kapjuk: <x, bi> = αi, i = 1,2,3,…n,… tehát ekkor az x vektor előállítása. x = <x, b1> ∙b1 + <x, b2> ∙b2 +<x, b3> ∙b3 +…+<x, bn> ∙bn +… Ezt az összeget (végtelen sort) az x vektor B ortonormált bázis szerint általános Fouriersorának nevezzük.
3.3.2. Általános értelemben vett Fourier-sor Tegyük egy kissé konkrétabbá az előző pontban értelmezett fogalmakat. Legyen az L2 lineáris tér az [a, b] intervallumon értelmezett, négyzetesen integrálható valós függvények halmaza („függvénytér”). A négyzetes integrálhatóság azt jelenti, hogy a függvény négyzete integrálható, és a jelölésben a 2-es felső index is erre a tulajdonságra utal. Könnyen látható, hogy ez valóban egy lineáris tér a szokásos függvények közötti összeadásra és függvény számmal való szorzására vonatkozó műveletekkel. (Gondoljuk át, hogy valóban minden vektortér-axióma teljesül.) Értelmezzünk most egy skaláris szorzatot ebben az L2 függvénytérben. 3.3.1.Tétel: Legyen adott egy [a, b] intervallum. Az f(x) és g(x) legyen értelmezve ezen az intervallumon, és tegyük fel, hogy az f(x)∙g(x) szorzat integrálható ezen az intervallumon. Az b
f ( x), g ( x) f ( x) g ( x)dx a
összefüggéssel értelmezett <∙, ∙>: L2 × L2 → Rleképezés, egy L2-n értelmezett skaláris szorzat. Ha átgondoljuk a határozott integrál tulajdonságait, akkor könnyen látható, hogy az állításban szereplő művelet valóban teljesíti a skaláris szorzás 4 db műveleti tulajdonságát. 3.3.2.Tétel: Legyen adott egy [a, b] intervallum. Az f(x) legyen értelmezve ezen az intervallumon, és tegyük fel, hogy az f2(x) függvény integrálható („négyzetesen integrálható”) ezen az intervallumon. Az
421
Óbudai Egyetem BGK
Fejezetek a matematikából b
f ( x)
f
2
( x)dx
a
összefüggéssel értelmezett ║∙║: L2 → Rleképezés, egy L2-n értelmezett norma. Ha ismét végiggondoljuk a határozott integrál és a négyzetgyökfüggvény tulajdonságait, akkor látható, hogy ez a művelet teljesíti a normától megkövetelt 3 db műveleti tulajdonságot. A fentiekben értelmezett skaláris szorzatnak és normának a birtokában még tovább általánosíthatjuk a Fourier-sor fogalmát. 3.3.7.Definíció: Legyen az L2négyzetesen integrálható függvények terében B = {g1, g2, g3, …, gn,…} egy ortonormált függvényrendszer. Ekkor tetszőleges fL2 négyzetesen integrálható függvényt felírhatunk a báziselemek lineáris kombinációjaként. f = α1∙ g1 + α2∙ g2 +α3∙ g3 +…+αn∙ gn +… Az αi együtthatókat ugyancsak a fenti gondolatmenettel kapjuk: < f, gi> = αi, i = 1,2,3,…n,… ahol a skaláris szorzatot és a normát a 3.3.1. és 3.3.2. tételek értelmezik. Ekkor az f(x) függvény előállítása. f = < f, g1> ∙ g1 + < f, g2> ∙ g2 +< f, g3> ∙ g3 +…+< f, gn> ∙ gn +… Ezt a függvénysort az f négyzetesen integrálható függvény Bortonormált függvényrendszer szerinti általános Fourier-sorának nevezzük αi = < f, gi> valós (esetleg komplex) együtthatókat az f(x) függvény Fourier-együtthatóinak nevezzük. Az alábbiakban bemutatunk néhány konkrét Fourier-sort. Ezek a sorok az által vannak meghatározva, hogy hogyan választunk ortonormált függvényrendszert az L2 térben. A műszaki alkalmazások szempontjából az egyik legfontosabb a trigonometrikus rendszer és az exponenciális függvényrendszer, amelyeket az alábbiakban részletesen kifejtünk, de ortogonális függvényrendszer állhat akár polinomokból is. Ez utóbbiakat nem tárgyaljuk, a szakirodalom tanulmányozását javasoljuk az Olvasónak. A lineáris algebrában megismert bázis fogalmát az L2 függvénytérben a teljesség fogalmával helyettesítjük. 3.3.8.Definíció:Az L2négyzetesen integrálható függvények terében a B = {g1, g2, g3, …, gn,…} ortonormált függvényrendszert teljes ortonormált rendszernek nevezzük, ha teljesül a következő: Ha egy gL2 függvény ortogonális a rendszer minden elemére, akkor g = 0. Tehát csak az azonosan nulla függvény lehet ortogonális egy teljes rendszer minden elemére.
422
Óbudai Egyetem BGK
Fejezetek a matematikából
A teljesség fogalma alapvető a Fourier-sorok konvergenciájának elméletében, és alapvetően fontos jelentőségű a trigonometrikus és exponenciális Fourier-sorok elméletében, amelyet az alábbiakban részletesen tanulmányozunk.
3.3.3. Általános Fourier-sorok konvergenciája, a Fourier együtthatók szélsőérték tulajdonsága, a Parseval-képlet A teljesség egzakt figyelembe vételéhez, a fogalom pontos megvilágításához nincs elegendő matematikai apparátus a kezünkben. Az érdeklődő Olvasó számára a Funkcionálanalízis tanulmányozását javasoljuk. Azonban a fogalomnak a konvergenciára vonatkozólag van egy nagyon fontos következménye, amelyet mindenképpen meg kell fogalmaznunk. A tétel megfogalmazása előtt azonban felmerül a konvergencia természetének kérdése. Az előző két pontban bevezetett fogalmakból nem a 3.2. fejezetben megismert pontonkénti illetve egyenletes konvergencia következik – bár természetesen az ott megismert fogalmak változtatás nélkül érvényesek a Fourier-sorok elméletében is, ha a Fourier-sor részletösszegeit tanulmányozzuk –, hanem a bevezetett normában értendő a konvergencia. Ez pontosabban azt jelenti, hogy az általános Fourier-sor abban az értelemben tart az összegfüggvényéhez, hogy az összegfüggvény és a sor részletösszege különbségének a normája tart a nullához. Ezt pontosítja az alábbi tétel. A pontonkénti konvergenciára vonatkozó tételt a trigonometrikus sorok tárgyalásánál majd megadjuk. 3.3.3.Tétel: Ha a B = {g1, g2, g3, …, gn,…} egy teljes ortonormált rendszer, akkor az fL2 négyzetesen integrálható függvény f , gi gi általános értelemben vett Fourier-sora az L2-beli i 1
normában tart az f függvényhez, azaz teljesül, hogy n
lim f f , gi gi 0
n
továbbá
f
2
az
f , gi i 1
együtthatókra 2
i
2
teljesül
i 1
a
Parseval-féle
képlet,
mely
szerint
, tehát az f függvény normájának négyzete egyenlő a Fourier
i 1
együtthatók abszolút értékének négyzetösszegével. Bizonyítás: Amint a bevezetőben említettük, a teljesség kérdésének vizsgálatával ebben a jegyzetben nem foglalkozunk. Ellenben a Parseval-képletet igazolni tudjuk, és ezt annál is inkább megtesszük, mert a trigonometrikus és komplex Fourier-sorok alkalmazása során használni fogjuk és nagyon fontos összefüggésekre vezet. Induljunk ki tehát abból, hogy a sor négyzetintegrálra tart az összegfüggvényhez. Használjuk ki, hogy a normát skaláris szorzatból származtattuk. Ha figyelembe vesszük a skaláris szorzat tulajdonságait, valamint azt, hogy a rendszer elemei páronként ortogonálisak, akkor teljes négyzetté kiegészítés és azonos átalakítások után a következőket írhatjuk.
423
Óbudai Egyetem BGK
f i gi i 1
2
Fejezetek a matematikából
i 1
j 1
i 1
i 1 j 1
f i gi , f j g j f , f 2 i f , gi i j gi , g j f f
2
2
f , gi
2
f , gi
2
i 1 i 1
f , gi i 1
2
i 1
i 1
2 i f , gi i2
f , gi i 0 2
i 1
Ebben az összegben az utolsó tag definíció szerint zérus, hiszen a szummában minden különbség zérus a Fourier-együtthatók értelmezése miatt. Az egyenlőséglánc végén azért áll zérus, mert a feltétel szerint a Fourier-sor L2-beli normában tart a függvényhez. Ha ezeket figyelembe vesszük, akkor azt kapjuk, hogy f
2
f , gi
2
0 , és éppen ezt kellett igazolni. ■
i 1
Megjegyezzük, hogy ha a négyzetek helyére az abszolút érték négyzetét írjuk – amely valós esetben ugyanazt jelenti –, olyan összefüggéseket kapunk, amelyek komplex együtthatók és komplex függvények esetén is érvényesek. Kiemeljük a bizonyítás egyik érdekes következményét, mégpedig a Fourier-együtthatók
bizonyos szélsőértéket adó tulajdonságát. Azt, hogy az
f i gi 0 eltérés norma i 1
pontosan akkor a legkisebb, teljes rendszer esetén zérus, ha az αi, i = 1,2,3,…n,… együtthatók éppen a Fourier-együtthatók. Tetszőleges más valós vagy komplex együtthatók esetén az eltérés normája szigorúan pozitív érték.
424
Óbudai Egyetem BGK
Fejezetek a matematikából
3.3.4. Trigonometrikus Fourier-sorok Az említett fogalmak és tételek birtokában már rátérhetünk a trigonometrikus Fourier-sorok tárgyalására. 3.3.9.Definíció: Legyen a R tetszőleges és [a, a + 2π] egy 2π hosszúságú intervallum. Ezen az intervallumon értelmezett 1, cosx, sinx, cos2x, sin2x, cos3x, sin3x, cos4x, sin4x, …, cosnx, sinnx,… függvényrendszert trigonometrikus rendszernek nevezzük. 3.3.4.Tétel: A trigonometrikus függvényrendszer az [a, a + 2π] intervallumon ortogonális függvényrendszer, azaz a rendszer elemei páronként ortogonálisak. A tétel állítása azt jelenti, hogy bármely 2π hosszúságú intervallumon teljesülnek az
1. <1, cosnx> = 0 2. <1, sinnx> = 0 3. <sinnx, coskx> = 0 4. <sinnx, sinkx> = 0 5. = 0 egyenlőségek, minden n-re és minden k-ra, a 3., 4. és 5. esetben n ≠ k esetén. Bizonyítás: A 3.3.1. tételben értelmeztük a skaláris szorzatot. Ennek megfelelően a felsorolt skaláris szorzatok 0 értéke azt jelenti, hogy a függvények szorzatának határozott integrálja bármely 2π-hosszúságú intervallumon zérus. Ez mind az öt esetben könnyen ellenőrizhető. Példaképpen az első és harmadik összefüggést igazoljuk: a 2
1, cos nx
a 2
sin nx 1 cos nxdx n a a
sin n a 2 sin na 0 n n
ugyanis a szinusz függvény periódusa 2π. A 3. összefüggés igazolásához szükségünk van a 1 trigonometriából ismert alábbi azonosságra: sin cos sin sin . Ennek 2 felhasználásával, ha n ≠ kakkor kapjuk, hogy a 2
sin nx, cos kx
a
1 sin nx cos kxdx 2
a 2
sin n k x sin n k x dx
a a 2
1 cos n k x cos n k x 2 nk nk a
425
Óbudai Egyetem BGK
Fejezetek a matematikából
1 cos n k a 2 cos n k a 1 cos n k a 2 cos n k a 0 2 nk nk 2 n k n k ugyanis a koszinusz függvény periódusa ugyancsak 2π, ezért a zárójeles kifejezések különkülön egyenlők nullával. Hasonlóan adódik a 4. és 5. egyenlőség is, ha felhasználjuk a cos cos
1 1 cos cos ; sin sin cos cos 2 2
trigonometrikus azonosságokat. ■ Kérdés, hogy mennyi a trigonometrikus függvényrendszer egyes függvényeinek normája. 3.3.5.Tétel: A trigonometrikus függvényrendszer tagjainak normája az [a, a + 2π] intervallumon a következő: 1 2 , cos nx ; és sin nx ; n 1, 2,3,... Bizonyítás: A 3.3.2. tételben értelmezett norma fogalmával. a 2
1
12 dx
x aa 2
a 2 a 2
a
a 2
cos nx
a
a 2 2
cos nxdx
a
1 cos 2nx dx 2
a 2
x sin 2nx 2 4n a
a 2 sin 2n a 2 a sin 2na 2 4 n 2 4 n
Itt ismét felhasználtuk, hogy a szinusz függvény periódusa 2π. Hasonlóan adódik sinnx normája is. sin nx Ezt kellett bizonyítani. ■ Ha egy „vektor” normája nem 1, akkor könnyen „lenormálhatjuk” úgy, hogy a vektort elosztjuk a normájával. A 3.3.4. tétel alapján tudjuk, hogy a trigonometrikus függvényrendszer ortogonális rendszer. Az előbbiekben kiszámítottuk a függvényrendszer minden egyes tagjának a normáját. Osszuk most el a függvényrendszer tagjait a normájukkal, így ortonormált függvényrendszerhez jutunk. Bebizonyítottuk tehát az alábbi állítást.
426
Óbudai Egyetem BGK
Fejezetek a matematikából
3.3.6.Tétel: Az [a, a + 2π] intervallumon értelmezett
1 cos x sin x cos 2 x sin 2 x cos3x sin 3x cos nx sin nx ; ; ; ; ; ; ;...; ; ;... 2 függvényrendszer ortonormált rendszer a megadott intervallumon. 3.3.10.Definíció: Legyen f(x) egy [a, a + 2π] intervallumon értelmezett négyzetesen integrálható függvény. Az f(x) függvény ortonormált trigonometrikus rendszer szerinti
1 1 cos x cos x sin x sin x f ( x), f ( x), ... 2 2 cos nx cos nx sin nx sin nx ... f ( x), f ( x), ...
f ( x) ~ f ( x),
Fourier-sorát trigonometrikus Fourier-sornak nevezzük.Az alkalmazott ~ jelölés egyelőre annyit jelent, hogy az f(x) függvényhez hozzárendeltünk egy függvénysort a fent részletezett módon. Egyenlőséget nem írhatunk addig, amíg a konvergencia kérdését nem vizsgáljuk. Nyilvánvaló, hogy egyenlőség csak abban az esetben írható, ha tudjuk, hogy a függvénysor konvergens és előállítja a függvényt. Az alábbiakban egy kissé egyszerűsítjük ennek a sornak az alakját. A sor „szummás alakja”
f ( x) ~ f ( x),
1 1 cos nx cos nx sin nx sin nx f ( x), f ( x), 2 2 n 1
ha ebben az összegben a konstansokat kiemeljük a skaláris szorzatokból és az utánuk következő tényezőkből, akkor a következő alakot kapjuk.
f ( x) ~
1 1 1 f ( x),11 f ( x), cos nx cos nx f ( x),sin nx sin nx 2 n 1
Vezessük most be a Fourier-együtthatókra az alábbi jelöléseket.
1 1 a0 f ( x),1 2 2 an bn
a 2
f ( x)dx
a a 2
1 1 f ( x), cos nx
1 1 f ( x),sin nx
f ( x) cos nx dx; n 1, 2,3,...
a a 2
f ( x) sin nx dx; n 1, 2,3,...
a
427
Óbudai Egyetem BGK
Fejezetek a matematikából
ezekkel a jelölésekkel a trigonometrikus Fourier-sor szokásos alakja a következő.
f ( x) ~ a0 an cos nx bn sin nx n 1
az a0, an, bn együtthatók kiszámítására vonatkozó formulákat pedig épp az előzőekben adtuk meg. A Fourier-sorba fejtés tehát más jellegű, mit a 3.2. fejezetekben vizsgált Taylor-sor. Az együtthatókat nem deriválással, hanem integrálással számítjuk. Egy sorfejtés általában 3 db integrál kiszámítását igényli. Az an-re és bn-re vonatkozó formulákat úgy számítjuk, hogy az n-et paraméternek tekintjük, tehát egy integrálás végtelen sok együtthatót szolgáltat. A 3.3.3. pont bevezetőjében említettük a teljesség fogalmát és a következményeit egy tétel formájában fogalmaztuk meg. Bizonyítható, hogy a trigonometrikus függvényrendszer teljes az [a, a + 2π] intervallumon, azaz ha egy függvény ortogonális a függvényrendszer minden elemére, akkor az csak a nulla függvény lehet. A teljességre támaszkodva átfogalmazhatjuk a 3.3.3. tételt trigonometrikus sorokra. A Parseval-féle összefüggés felírásáhozcsak azt kell figyelembe venni, hogy a korábbiak szerint
f ( x),
1 cos nx sin nx 2 a0 ; f ( x), an ; f ( x), bn 2
Innen a Parseval-képlet már egyszerű helyettesítéssel adódik. 3.3.7.Tétel: Az [a, a + 2π] intervallumon értelmezett, négyzetesen integrálható f függvény trigonometrikus Fourier-sora az L2-térbeli normában tart az f függvényhez mint összegfüggvényhez, azaz n
lim f ( x) a0 ak cos kx bk sin kx 0
n
k 1
és igaz a Parseval-féle összefüggés
f
2
a 2
f 2 x dx 2 a0 an bn 2
n 1
a
2
2
;
A Parseval-féle összefüggés egyik jelentősége, hogy segítségével numerikus sorokat lehet összegezni. Ezt az alábbiakban példákon keresztül megmutatjuk. A 3.3.3. illetve 3.3.7. tétel szerint a Fourier-sor négyzetintegrálra, tehát normában tart az összegfüggvényhez. Ez nem egyenértékű a pontonkénti konvergenciával. Ez utóbbira vonatkozólag egyetlen olyan elégséges feltételt fogalmazunk meg, amely a műszaki alkalmazások szempontjából teljes mértékben kielégítő, és amelynek feltételei könnyedén ellenőrizhetők.
428
Óbudai Egyetem BGK
Fejezetek a matematikából
3.3.8. Tétel: (Dirichlet-Jordan) Tegyük fel, hogy az f(x) függvény periódusa 2π, továbbá tegyük fel, hogy bármely 2π hosszúságú szakasz felosztható legfeljebb véges sok olyan részintervallumra, amelyeken az f(x) függvény monoton. Ekkor azokon a helyeken, ahol az f(x) függvény folytonos, a trigonometrikus sor konvergál a függvényértékhez, minden olyan x0helyen, ahol az f(x) függvénynek szakadása van, akkor a trigonometrikus sor az adott pontbeli jobb és baloldali határérték számtani közepéhez konvergál, feltéve, hogy az egyoldali határértékek léteznek és végesek, azaz teljesül, hogy a sor összege a szakadási helyeken.
f x0 0 f x0 0 1 lim f x lim f x 2 x x0 0 2 x x0 0 ahol alkalmaztuk az egyoldali határértékre a témakörben szokásos egyszerűbb jelölést. Végül pedig az is igaz, hogy ha az f(x) függvény egy zárt intervallumon folytonos, akkor a trigonometrikus Fourier-sora ezen a zárt intervallumon egyenletesen konvergens. A tételt nem bizonyítjuk, de minden egyes Fourier-sorfejtésnél ellenőrizzük a tétel feltételeinek teljesülését, és eldöntjük, hogy a kapott sor előállítja-e a függvényt.
429
Óbudai Egyetem BGK
Fejezetek a matematikából
3.3.5. Trigonometrikus Fourier-sorok formális bevezetése Ha a tisztelt Olvasó túlságosan hosszúnak tartja az előző pontokban vázlatosan kifejtett lineáris algebrai illetve funkcionálanalízisbeli hátteret a klasszikus értelemben vett trigonometrikus Fourier-sor előállításához, akkor eljuthatunk a sorfejtés „mechanikájához” a következő egyszerűsített módon. Tegyük fel, hogy a 2πszerint periodikusf(x) függvényt előállítja egy trigonometrikus Fourier-sor egy 2π -hosszúságú intervallumon, azaz teljesül, hogy
f ( x) a0 an cos nx bn sin nx n 1
A kérdés ekkor a következő: Hogyan határozhatók meg az a0, an és bn együtthatók, ha teljesül az egyenlőség? Formális gondolkodással a következőt tehetjük. Feltesszük, hogy a sor konvergens, sőt egyenletesen konvergens, amiből az következik, hogy a sor tagonként integrálható, és alkalmas integrálok kiszámításával meghatározzuk az együtthatókat. a) Az a0 együttható meghatározása érdekében integráljuk a fenti egyenlőség mindkét oldalát az [a, a + 2π] intervallumon. Ekkor a következő adódik a 2
a 2
a cos nx b sin nx dx n n a a n 1 a 2 a 2 a 2 a0 dx an cos nxdx bn sin nxdx n 1 a a a
f ( x)dx
a
a 2
a0 dx
Az egyenlőség jobb oldalán szereplő integrálokat ki kell számítani. Ez három integrál kiértékelését jelenti. a 2
a a 2
a 2
a0 dx a0 x a
a0 a 2 a0 a 2a0 a 2
sin nx cos nxdx n a a
a 2
a 2
cos nx sin nxdx n a a
sin n a 2 sin na 0 n
cos n a 2 cos na 0 n
Az utóbbi két integrál értéke azért zérus, mert mind a szinusz függvény, mind a koszinusz függvény periódusa 2π, tehát a függvényértékek a számlálókban rendre egyenlők, akármi is az a konkrét értéke. Ha az első egyenlőséget figyelembe vesszük, megkapjuk az a0 együtthatót:
430
Óbudai Egyetem BGK
Fejezetek a matematikából
a 2
a
1 f ( x)dx 2 a0 ; azaz: a0 2
a 2
f x dx
a
b) Az an együtthatók meghatározásához szorozzuk meg a fenti egyenlőséget coskx-szel, ahol k egy rögzített pozitív egész és integráljunk egy 2π hosszúságú intervallumra. Ekkor a következő adódik a 2
a 2
f ( x) cos kx dx
a
a 2 a 2 a cos kx dx a cos nx cos kx dx b sin nx cos kx dx n n 0 n 1 a a a
Ebben az esetben a jobb oldalon öt integrált kell kiszámítanunk, ugyanis külön kell foglalkoznunk a k = n és a k ≠ n esettel. Az integrálok kiszámításához fel kell használnunk az alábbi trigonometrikus azonosságokat. 1 sin sin ; 2 1 cos cos cos cos ; 2 1 sin sin cos cos ; 2 1 cos 2 1 cos 2 cos2 ; sin 2 ; sin 2 2sin cos 2 2 sin cos
Ezek figyelembe vételével az adódik, hogy a 2
a 2
sin kx a0 cos kx dx a0 k a a
a0
sin k a 2 sin ka 0 k
a szinusz függvény 2π szerinti periodicitása miatt. Folytassuk most az an együtthatók mellett álló integrálok kiszámításával. Ha egyrészt feltesszük, hogy k ≠ n, akkor az idézett azonosságok szerint a 2
a
cos nx cos kx dx
1 2
a 2
cos n k x cos n k x dx
a a 2
1 sin n k x sin n k x 2 nk nk a
1 sin n k a 2 sin n k a sin n k a 2 sin n k a 0 2 nk nk
431
Óbudai Egyetem BGK
Fejezetek a matematikából
ugyancsak a szinusz függvény 2π-szerinti periodicitása miatt. Másrészt viszont, ha n = k, akkor világos, hogy az előző formulák nem alkalmazhatóak, mert 0-val kellene osztanunk, ezért ebben az esetben a linearizáló formulát használjuk. a 2
a 2
cos kx cos kx dx
a
a 2
cos2 kx dx
a a 2
x sin 2kx 4k a 2
a
1 cos 2kx dx 2
a 2 a sin 2k a 2 sin 2ka 2 4k
A számításokból kiderül, hogy az an együtthatók között mindössze egy van olyan, a k indexű, amelynek szorzója különbözik 0-tól. Folytassuk most a számításokat a bn együtthatók szorzóinak kiszámításával. Ehhez ismét alkalmaznunk kell trigonometrikus azonosságokat. Itt elsőként ugyancsak feltesszük, hogy k ≠ n. Ekkor a következő adódik. a 2
a
1 sin nx cos kx dx 2
a 2
sin n k x sin n k x dx
a a 2
1 cos n k x cos n k x 2 nk nk a
1 cos n k a 2 cos n k a cos n k a 2 cos n k a 0 2 nk nk a koszinusz függvény 2π-szerinti periodicitása miatt. ha viszont n = k, akkor a 2
sin kx cos kx dx
a
1 2
a 2
a
sin 2kx dx
a 2
1 cos 2kx 2 2k a
1 cos 2k a 2 cos 2ka 0 2 2k
az idézett periodicitás miatt. Kaptuk tehát, hogy a bn együtthatók szorzói minden n-re zérussal egyenlők. Ha figyelembe vesszük az eddigi eredményeket, akkor azt kapjuk, hogy a 2
f ( x) cos kx dx ak ; azaz: ak
a
1
a 2
f ( x) cos kx dx
a
c) A bn együtthatók meghatározásához szorozzuk meg a fenti egyenlőséget sinkx-szel, ahol k egy rögzített pozitív egész és integráljunk egy 2π hosszúságú intervallumra.Ekkor a következő adódik.
432
Óbudai Egyetem BGK a 2
a
Fejezetek a matematikából
a 2
a 2 a 2 f ( x)sin kx dx a0 sin kx dx an cos nx sin kx dx bn sin nx sin kx dx n 1 a a a
Ezeket a számításokat már nem részletezzük. A Tisztelt Olvasóra bízzuk annak ellenőrzését, hogy a b) pontbeli azonosságok alkalmazásával, a fenti számítások mintájára az adódik, hogy mindössze egyetlen együttható, konkrétan a bk együttható az, amelynek szorzója különbözik 0-tól. A jelzett integrál értéke ugyancsak π, tehát fennáll a következő egyenlőség. a 2
a
1 f ( x)sin kx dx bk ; azaz: bk
a 2
f ( x)sin kx dx
a
Ezzel meghatároztuk a Fourier-együtthatókat, amelyeket a 3.3.4. pontban más elvi alapokon megkaptunk. Fontos szerepe miatt a Parseval-képletet is levezetjük ezen formális gondolatmenet segítségével. Ehhez tegyük fel, hogy a sor előállítja a függvényt, amikor is pontonként teljesül az alábbi összefüggés. n lim a0 ak cos kx bk sin kx f x n k 1
Ha ez igaz, akkor az f(x) függvény négyzetéhez normában konvergál az f-et közelítő trigonometrikus polinom négyzete. Így a norma definíciója miatt egy 2π hosszúságú intervallumra vonatkozó integrálra vonatkozólag igaz a következő: a 2
2
a 2 lim a0 ak cos kx bk sin kx dx f 2 x dx n k 1 a a n
feladatunk kiszámítani a bal oldalon álló, trigonometrikus polinom négyzetének integrálját. Mielőtt ehhez hozzálátnánk, gondoljuk át, hogy a négyzetre emelés során milyen tagok keletkeznek. Ezek egy esetleges 2-es szorzótól eltekintve a következők.
a0ak cos kx; a0bk sin kx; ak bn cos kx sin nx; ak an cos kx cos nx; bk bn sin kx sin nx; a02 ; an2 cos2 nx; bn2 sin 2 nx. Ezeket a függvényeket kell integrálni egy 2π hosszúságú intervallumon. Nem szeretnénk részletezni a számításokat, ugyanis a szükséges integrálokat már mind kiszámítottuk a szakasz b) pontjában. Az ott részletezett számítások alapján azt mondhatjuk, hogy a felsorolt függvények közül az első hat integrálja zérus, csak az utolsó három integrál különbözik zérustól. Ezek értéke pedig a következőnek adódik.
433
Óbudai Egyetem BGK
Fejezetek a matematikából
a 2
a
a 2
a02dx a02 x a
a02 a 2 a02a 2a02
továbbá a 2
ak2
a 2 2
cos kx dx ak2
a a 2
x sin 2kx ak2 4k a 2
a
1 cos 2kx dx 2
a 2 a sin 2k a 2 sin 2ka 2 ak2 ak 2 4 k
végül pedig a 2
bk2
a 2 2
sin kx dx bk2
a a 2
x sin 2kx bk2 4k a 2
a
1 cos 2kx dx 2
a 2 a sin 2k a 2 sin 2ka 2 bk2 bk 2 4 k
Az eredményeket behelyettesítve adódik a Parseval-képlet néven ismert összefüggés. n lim 2a02 ak2 bk2 n k 1
a 2 2 f x dx a
tehát a szokásos alakban írva. a 2
f 2 x dx 2a02 an2 bn2 n 1
a
3.3.1. Példa: Határozzuk meg a következő függvény Fourier-sorát.
0, ha x 0 f ( x) x, ha 0 x f ( x 2), különben A Fourier-sor meghatározásához az általános esetben tehát három integrált kell kiszámítani, a levezetett együttható formulák alapján. Válasszuk integrációs intervallumnak a [–π, π] intervallumot, és integráljunk. Vegyük figyelembe, hogy a [–π, 0] intervallumon a függvény zérus. Így a következőt kapjuk.
434
Óbudai Egyetem BGK
Fejezetek a matematikából
1 1 x2 1 2 f ( x)dx 2 x dx 2 2 2 2 4 0 0 1 1 1 sin nx sin nx an f ( x) cos nx dx x cos nx dx x dx n 0 n 0 0
1 a0 2
n 1 1 sin n cos nx 1 cos n 1 1 1 0 2 2 2 2 2 n n n n n n 0 1 1 1 cos nx cos nx bn f ( x) sin nx dx x sin nx dx x dx n 0 n 0 0 1 cos n sin nx 1 cos n n 1 1 0 0 0 1 n n n n2 0
Meghatároztuk az együtthatókat, tehát a Fourier-sor felírható. Előbb azonban még kiemeljük az an együttható formula eredményére tekintve, hogy ez az együttható minden páros n-re zérus és minden páratlan n-re különbözik zérustól. Így a sor a következő alakot ölti.
f ( x)
2 cos(2n 1) x n 1 sin nx 1 4 n 1 2n 12 n n 1
2 cos 3 x cos 5 x cos 7 x sin 2 x sin 3 x sin 4 x cos x ... sin x ... 2 2 2 4 2 3 4 3 5 7
A sorfejtést grafikusan szemléltetjük a 3.3.1. ábrán.
3.3.1. ábra. A 3.3.1. példabeli f(x) függvény (kék színű görbe) közelítése a Fourier-sor „első kilenc” tagjával (piros színű görbe), a konstans tag mellett 4 db koszinuszos és 4 db szinuszos tag figyelembe vételével
435
Óbudai Egyetem BGK
Fejezetek a matematikából
3.3.2. Példa: Határozzuk meg a következő függvény („négyszögrezgés”) Fourier-sorát.
3, ha x 0 3, ha 0 x f ( x) 0, ha x k , k Z f ( x 2), különben Ismét az együttható formulákba helyettesítünk. Elsőként azonban vegyük észre, hogy az f(x) függvény páratlan. Ezért a [–π, π] intervallumra vonatkozó integrálja zérus, tehát a0 = 0. Továbbá, mivel f(x) páratlan cosnx pedig páros, szorzatuk ugyancsak páratlan, tehát kapjuk, hogy a szorzatuk origóra szimmetrikus intervallumra vonatkozó integrálja minden n-re zérus. Ezért
an
1
f ( x) cos nx dx 0
Végül a bn együtthatókat kell kiszámítanunk. Ehhez használjuk fel, hogy az f(x) függvény páratlan, de a sinnx függvény is páratlan, ezért szorzatuk páros, elég tehát a [0, π] intervallumon integrálni:
1 bn
2 6 cos nx 6 6 n f ( x) sin nx dx 3 sin nx dx n 0 n cos n cos 0 n 1 1 0
Ezen együtthatók közül minden páros indexű szintén zérus, a páratlan indexűek értéke pedig 12 ha n páratlan. Ezek felhasználásával a Fourier-sor a következő. bn n
f ( x)
12 sin 2k 1 x 12 sin 3x sin 5 x sin 7 x ... sin x k 1 2k 1 3 5 7
Mivel az f(x) függvény teljesíti a 3.3.8. tétel feltételeit, hiszen a szakadási helyeken, tehát az x = kπ helyeken a függvényérték az egyoldali határértékek (3 illetve –3) számtani közepe (zérus), ezért jogosan írtuk az egyenlőséget a függvény és a sor közé, a sor előállítja a függvényt. A feladat megoldása során több egyszerűsítő észrevételt is tettünk, amelyek a paritással voltak kapcsolatosak. A 3.3.6. pontban szisztematikusan vizsgáljuk majd ezt a kérdést. A sorfejtést grafikusan szemlélteti a 3.3.2. ábra.
436
Óbudai Egyetem BGK
Fejezetek a matematikából
3.3.2. ábra. A 3.3.2. példabeli f(x) függvény (kék színű görbe) közelítése a Fourier-sor első négy tagjával (piros színű görbe), azaz 4 db szinuszos tag figyelembe vételével
3.3.3. Példa: Az előző, 3.3.2. példabeli Fourier-sorfejtés eredményeit figyelembe véve alkalmazzuk a Parseval-képletet. Ehhez szükség van az f(x) függvény négyzetének határozott integráljára.
f
2
x dx 9dx 9 x 9 9 18
A Parseval-formula szerint, ez az integrál egyenlő adott esetben a bn együtthatók négyzetösszegének π-szeresével. Azaz 18 bn n
2
2
12 144 1 2k 1 k 0 2k 12 k 0
Ha ezt átrendezzük, akkor kapjuk a következő nevezetes összefüggést, a páratlan számok reciprokainak négyzetösszegét.
1
k 0 2k 1
2
2 8
A Parseval-formulával tehát numerikus sorokat tudunk összegezni.
437
Óbudai Egyetem BGK
Fejezetek a matematikából
3.3.6. Páros és páratlan függvények Fourier-sora Különleges esetekben, amikor a sorba fejtendő függvény páros vagy páratlan, a feladat egyszerűsödik, egy vagy akár két integrál kiszámításától is eltekinthetünk. Az együtthatók kiszámításánál segít néhány ötlet. Először is, ha egy páratlan függvényt integrálunk egy origóra szimmetrikus intervallumon, akkor az integrál zérus, ha pedig egy páros függvényt integrálunk origóra szimmetrikus intervallumon, akkor az integrál kiszámítása egyszerűbb, ha megfelezzük az intervallumot úgy, hogy pl. az alsó határ zérus legyen és a megfelezett intervallumon vett integrált szorozzuk 2-vel, ugyanis a 0-t mindig egyszerűbb helyettesíteni a primitív függvénybe, mint egy negatív számot. Összefoglalva
Ha f x páratlan :
a
f x dx 0; Ha f x páros :
a
a
a
a
f x dx 2 f x dx. 0
Végül fogalmazzunk meg néhány nyilvánvaló tényt páros illetve páratlan függvények szorzatára vonatkozólag: két páros függvény szorzata páros, azonban két páratlan függvény szorzata is páros. Ha azonban egy páros és egy páratlan függvényt szorzunk, akkor a szorzat páratlan. Ezeket az egyszerű észrevételeket mind használni fogjuk az együttható formulák kiértékelése során. Páros függvény Fourier-sora Legyen az f(x) függvény a [–π, π] intervallumon értelmezett páros függvény2π-periódusú kiterjesztése a teljes számegyenesre. Ekkor, mivel sinnx páratlan függvény, az f(x)∙sinnx szorzat páratlan, ezért a [–π, π] origóra szimmetrikus intervallumra vonatkozó integrálja zérus. Ezért ebben az esetben bn = 0, n = 1,2,3,… Ekkor tehát csak az a0 és an együtthatókat kell kiszámítanunk. A Fourier-sor ekkor a következőre redukálódik:
f ( x) a0 an cos nx n 1
3.3.4. Példa: Határozzuk meg a következő 2π-szerint periodikus függvény („háromszögrezgés”) Fourier-sorát.
x, ha x 0 f ( x) x, ha 0 x f ( x 2), különben A függvény páros, így azonnal adódik, hogy bn = 0, n = 1,2,3,… Tehát csak két integrált kell kiszámítanunk. 1 a0 2
2 1 x2 f ( x ) dx x dx 2 2 2 0 0
438
Óbudai Egyetem BGK 1 an
Fejezetek a matematikából
2 2 sin nx sin nx f ( x ) cos nx dx x cos nx dx x dx n 0 n 0 0
n 2 1 sin n cos nx 2 cos n 1 2 1 0 2 2 2 2 2 n n n n n n 0
4 Ennek a kifejezésnek az értéke páros n esetén zérus, páratlan n esetén pedig an 2 . Az n integrálok kiszámításánál felhasználtuk azt az egyszerű tényt, hogy ha egy origóra szimmetrikus intervallumra integrálunk egy páros függvényt, akkor az intervallumot megfelezhetjük, és az integrál értékét szorozzuk 2-vel. 4 Ezzel előállítottuk a Fourier-sor együtthatóit. Innen a sorfejtés, ha a közös szorzó-tényezőt kiemeljük, az alábbi. f ( x)
4 cos(2n 1) x 4 cos 3x cos 5 x cos 7 x cos x ... 2 32 52 72 2 n 1 2n 12
A Fourier sorfejtést grafikusan szemlélteti a 3.3.3. ábra.
3.3.3. ábra. A 3.3.4. példabeli f(x) függvény (kék színű görbe) közelítése a Fourier-sor első öt tagjával (piros színű görbe), azaz a konstans taggal és az azt követő 4 db koszinuszos tag figyelembe vételével
439
Óbudai Egyetem BGK
Fejezetek a matematikából
3.3.5.Példa: Függvénysorokkal, speciálisan Fourier-sorokkal, numerikus sorok összegét is meg tudjuk határozni, de nem kizárólag a Parseval-képlet felhasználásával. Helyettesítsünk az előbbi sorban az x helyére 0-t, és számítsuk ki a helyettesítési értékeket: f (0)
4 cos 0 4 cos 0 cos 0 cos 0 ... 2 32 52 2 n 1 2n 12
Mivel az f(x) definíciója szerint f(0) = 0, továbbá cos0 = 1, ezért azt kapjuk, hogy: 4 4 1 1 1 0 1 ... 2 2 2 3 5 2 n 1 2n 12
Ha ezt az egyenletet átrendezzük a páratlan számok reciprokának négyzetösszegét kapjuk:
2 1 ... 2 8 32 52 n 1 2n 1 1
1
1
Ezt az eredményt már megkaptuk a 3.3.3. példában más módszerrel. Páratlan függvényFourier-sora Legyen az f(x) függvény a [–π, π] intervallumon értelmezett páratlanfüggvény 2π-periódusú kiterjesztése a teljes számegyenesre. Ekkor mivel cosnx páros függvény, az f(x)∙cosnx szorzatfüggvény is páratlan, ezért a [–π, π] origóra szimmetrikus intervallumra vonatkozó integráljuk zérus. Ezért ebben az esetben a0 = an = 0, n = 1,2,3,… Ekkor tehát csak a bn együtthatót kell kiszámítanunk A Fourier-sor így a következőre redukálódik.
f ( x)
bn sin nx
n 1
3.3.6. Példa: Határozzuk meg a következő 2π-szerint periodikus függvény („fűrészfogrezgés”) Fourier-sorát.
x, ha x f ( x) 0, ha x 2k f ( x 2), különben A függvény páratlan, így azonnal adódik, hogy a0 = an = 0, n = 1, 2, 3, … Tehát csak egyetlen integrált kell kiszámítani. Használjuk fel, hogy két páratlan függvény szorzata páros, így egyszerűsödik az integrál kiszámítása.
440
Óbudai Egyetem BGK 1 bn
1 f ( x) sin nx dx
Fejezetek a matematikából
2 2 cos nx cos nx x sin nx dx x sin nx dx x dx n 0 n 0 0
2 cos n sin nx 2 cos n n 1 2 0 0 0 1 n n n n2 0
Az együtthatók ismeretében felírhatjuk a Fourier-sort.
f ( x) bn sin nx n 1
1
n 1 2sin nx
sin 2 x sin 3x sin 4 x ... 2 sin x 2 3 4
n
n 1
A sorfejtést grafikusan szemlélteti a 3.3.4. ábra.
3.3.4. ábra. A 3.3.6. példabeli f(x) függvény (kék színű görbe) közelítése a Fourier-sor első négy tagjával (piros színű görbe), azaz 4 db szinuszos tag figyelembe vételével
3.3.7. Példa: Az előző, 3.3.6. példa eredményeire támaszkodva alkalmazzuk a Parseval-féle képletet. Ehhez szükség van az f(x) függvény négyzetének határozott integráljára.
x3 3 3 2 3 f x dx x dx 3 3 3 3 2
2
A Parseval-formula szerint, tekintettel arra, hogy a0 = an = 0, n = 1,2,3,…, teljesül, hogy 1 2n 2 4 2 3 1 2 bn 4 2 2 3 n n 1 n 1 n 1 n
441
Óbudai Egyetem BGK
Fejezetek a matematikából
Átrendezéssel kapjuk az egész számok reciprokainak négyzetösszegét.
1
n 1 n
1
1
2
22
1
32
...
1 n2
...
2 6
Ezt a sorösszeget a numerikus sorok elméletének tárgyalása során (3.1. fejezet) már bizonyítás nélkül említettük, most érkeztünk el oda, hogy igazolni is tudjuk. Ennek az eredménynek a birtokában, figyelembe véve a 3.3.3. illetve 3.3.5. példákban kapott eredményt, kiszámítható a páros számok reciprokainak négyzetösszegét is. Induljunk ki a következő nyilvánvaló összefüggésből.
1
n2
n 1
1
k 1 2k
2
1
k 0 2k 1
2
ahonnan a kiszámított sorösszegek alapján adódik, hogy. 2 1 2 1 2 2 2 ; átrendezve ; 2 6 k 1 2k 2 8 6 8 24 2 k k 1
Tehát a páros számok reciprokának négyzetösszege.
1
k 1 2k
2
1 22
1 42
1 62
...
442
1
2k 2
...
2 ; 24
Óbudai Egyetem BGK
Fejezetek a matematikából
3.3.7. Nem 2π-szerint periodikus függvények Fourier-sora A probléma könnyen általánosítható olyan esetekre, amikor a periódus nem 2π. Legyen az f(x) függvény periódusa T = 2p. A Fourier-sor egy egyszerű lineáris transzformációval felírható erre az esetre is, azonban végigkövethetjük a 3.3.4. vagy a 3.3.5. pont logikáját. A számításokat nem végezzük el olyan részletességgel, mint az említett pontokban, csak nagy vonalakban vázoljuk az eljárást, a számítások részletes kivitelezését az Olvasóra bízzuk. 2 2 jelölést, akkor elsőként a következőt Ha bevezetjük a rezgéstanban szokásos T 2p p állítjuk. Tetszőleges valós a esetén az [a, a + T] intervallumon a 1, cosωx, sinωx, cos2ωx, sin2ωx, cos3ωx, sin3ωx, …, cosnωx, sinnωx,… függvényrendszer ortogonális rendszer. Ezt pontosan úgy igazolhatjuk, mint a 3.3.4. tételben. Ahhoz hogy ortonormált függvényrendszert tudjuk képezni, szükség van minden egyes függvény normájára. a T
1
12 dx
xaa T
a T a T 2p
a
a T
cos nx
a
a T
cos 2 nxdx
a
1 cos 2nx dx 2
a T
x sin 2nx 2 4n a
a T sin 2n a T a sin 2na 4n 4n 2 2
T a T a sin 2n a 2 sin 2na 2 4n 4n 2 2
p
Az utolsó lépésben kihasználtuk, hogy a szinusz függvény periódusa 2π. Hasonló módon T p. igazolható, hogy sin nx 2 Ezen számítások eredményének birtokában kijelenthetjük, hogy az
1 cos x sin x cos 2x sin 2x cos 3x sin 3x cos nx sin nx ; ; ; ; ; ; ;...; ; ;... 2p p p p p p p p p függvényrendszer ortonormált rendszer az [a, a + T] = [a, a + 2p] intervallumon. Legyen adott ezek után egy T = 2p-szerint periodikus f(x) függvény. Az f(x) függvény Fourier-sora a következő.
443
Óbudai Egyetem BGK f ( x) ~ f ( x),
Fejezetek a matematikából
1 1 cos nx cos nx sin nx sin nx f ( x), f ( x), 2 p 2 p n 1 p p p p
Ha alkalmazzuk a megszokott egyszerűbb jelölésrendszert, akkor a T = 2p-szerint periodikus függvény Fourier-sora a következő, hagyományos formába írható.
f ( x) ~ a0 an cos nx bn sin nx n 1
Ahol a Fourier-együtthatókat ebben az általánosabb esetben az alábbi formulák szolgáltatják.
1 1 a0 f ( x),1 2p 2p
a2 p
a
1 1 an f ( x), cos nx p p bn
1 1 f ( x),sin nx p p
Könnyen általánosíthatjuk az
f
1 f ( x)dx T
a2 p
f ( x) dx
a
2 f ( x) cos nx dx T
a a2 p
a T
f ( x) sin nx dx
a
2
f , gi
2
2 T
a T
f ( x) sin nx dx; n 1, 2,3,...
a a T
f ( x) sin nx dx; n 1, 2,3,...
a
Parseval-képletet is, csak azt kell figyelembe
i 1
venni, hogy az együttható formulák átrendezésével a következő adódik.
f ( x),
1 cos nx 2 p a0 ; f ( x), 2p p
p an ; f ( x),
sin nx p
p bn
Innen a keresett összefüggés a következő két ekvivalens alakban írható. a2 p
a a T
f 2 x dx 2 p a0 p an bn 2
n 1
f 2 x dx T a0 2
a
2
2
T 2 2 an bn 2 n 1
A T = 2p szerint periodikus függvények pontonkénti illetve egyenletes konvergenciájára vonatkozó Dirichlet-Jordan tétel értelemszerű módosításokkal átvihető.
444
Óbudai Egyetem BGK
Fejezetek a matematikából
3.3.8. Példa: Határozzuk meg az alábbi függvény Fourier-sorát. 2 4 x ; ha 2 x 2 f x f x 4 ; különben
Világos, hogy a függvény periódusa T = 2p = 4, azaz p = 2. Innen következik, hogy 2 2 . Az is világos továbbá, hogy a függvény páros. A páros és páratlan T 4 2 függvényekre vonatkozólag pontosan ugyanazokat a megállapításokat tehetjük, mint a 3.3.6. pontban. Így ebben az esetben is igaz, hogy bn = 0, n = 1,2,3,… Tehát csak két integrált kell kiszámítanunk. Figyelembe véve azt, hogy mind az f(x) függvény mind pedig a cosnωx függvény páros, írhatjuk, hogy: 1 a0 2p
an
1 p
2
2
1 f ( x)dx 4
2
f ( x) cos nx dx
2
2
4 x 2
2
1 2
2
2
2 2 1 x3 8 dx 4 x 2 dx 4 x 4 2 3 3
0
4 x 2
2 2
0
cos nx dx 22 4 x2 cos nx dx 2
2
0
2
sin nx sin nx sin nx 4 x2 2 x dx 0 2 x dx n 0 n n 0 0 2
2
2
sin nx cos nx cos nx 4 2 x 2 dx cos n 2 0 2 2 n 22 0 0 n 22 n 22 n33 0 n 1
2 4 n 4 1 cos n sin n 2 sin 0 1 2 0 n 22 n22 n22 n33 2
4
16 1
n 1
n 2 2
Kaptuk tehát az f(x) függvény Fourier-sorát. A Dirichlet-Jordan féle konvergencia tétel alapján tudjuk, hogy a sor előállítja a függvényt, hiszen ez a függvény folytonos, tehát írhatjuk az egyenlőséget: n 1
8 4 1 f x 3 n 1 n22
n 1
8 16 1 cos nx 3 2 n 1 n2
cos n
x 2
8 16 1 1 3 1 cos x cos x cos x cos 2x ... 3 2 9 2 4 2 16 A sorfejtést a 3.3.5. ábrán szemléltetjük.
445
Óbudai Egyetem BGK
Fejezetek a matematikából
3.3.5. ábra. A 3.3.8. példabeli f(x) függvény (kék színű görbe) közelítése a Fourier-sor első öt tagjával (piros színű görbe), azaz a konstans taggal és az azt követő 4 db koszinuszos tag figyelembe vételével
Végül alkalmazzuk a Parseval-képletet. Ehhez ki kell számítanunk az f(x) függvény négyzetének az integrálját. 2
4 x 2
2
2
2
x3 x5 64 32 512 dx 2 16 8 x x dx 2 16 x 8 2 32 3 5 0 3 5 15 0 2
2
4
Ha ezt az adatot, valamint az előző bekezdésben kapott Fourier-együtthatókat helyettesítjük a Parseval-képletbe, azt kapjuk, hogy: 2
2 16 1 n 1 512 512 256 512 1 8 4 2 ; azaz 2 2 4 4 15 15 9 3 n 1 n n 1 n
Rendezve a kapott egyenletet, ismét egy nevezetes végtelen numerikus sor összegét nyerjük.
1
n 1 n
4
446
4 90
Óbudai Egyetem BGK
Fejezetek a matematikából
3.3.8. Komplex Fourier-sor Mielőtt a komplex Fourier-sor tárgyalásába belekezdenénk némileg módosítani, pontosabban kiterjeszteni kell a skaláris szorzat fogalmát, mert komplex számok esetén a valós esetre adott definíció nem megfelelő. Ennek oka a következő. Valós esetben teljesül, hogy egy vektor önmagával képezett skaláris szorzata egyenlő a vektor abszolút értékének négyzetével, azaz 2
xT x x, x x . Ha komplex számokra alkalmazzuk ezt a definíciót, akkor ezt az összefüggést
nem kapjuk meg, pedig megköveteljük a skaláris szorzattól, hogy ez minden komplex vektorra is teljesüljön. Legyen ugyanis z = a + ib = (a, b) egy komplex szám, ha tetszik vektor. Ha erre alkalmazzuk az előző összefüggést változtatás nélkül, akkor a komplex számok szorzásának szabálya szerint azt kapjuk, hogy z z a ib a ib a 2 2abi b2 ez pedig nyilván nem egyenlő a komplex z szám abszolút értékének a négyzetével. Ha azonban az értelmezést úgy módosítjuk, hogy az önmagával képezett skaláris szorzatban a második tényező a konjugált legyen, akkor helyes eredményt kapunk: z z a ib a ib a 2 b2 z 2 . Ebből adódóan, komplex számok, vektorok, függvények esetén a skaláris szorzást a következő módon értelmezzük. 3.3.11.Definíció: Legyenek z, w Cn n-komponensű, komplex elemű vektorok. Ekkor a z és w vektorok skaláris szorzatán a z T w szorzatot értjük, ahol a második tényező a w komplex vektor konjugáltja, ami azt jelenti, hogy minden komponensének a konjugáltját kell képezni. Legyenek f(x) és g(x) valós változójú, komplex értékű függvények, amelyek az [a, b] intervallumon négyzetesen integrálhatóak. Az f és g komplex értékű függvények skaláris szorzatán az b
f , g f x g x dx a
határozott integrált értjük. Most is könnyen ellenőrizhető, hogy a 3.3.2. definícióban szereplő feltételek mind teljesülnek. A komplex skaláris szorzat lehetőséget teremt arra, hogy a trigonometrikus függvényrendszerhez hasonlóan ismét értelmezzünk egy nevezetes ortogonális rendszert. Ehhez mindössze annyit kell bevezetésként megjegyeznünk, hogy hogyan értelmezzük egy komplex értékű függvény konjugáltját. Ha f(x) egy valós változós komplex értékű függvény – a fogalom értelmezhető komplex változóra is, de ebben a jegyzetben csak valós változókkal foglalkozunk –, azaz felírható f x u x i v( x) alakban, ahol u(x) és v(x) valós változójú, valós értékű függvények az f(x) függvény valós és képzetes része, akkor az f(x) komplex konjugáltját a következő módon értelmezzük: f x u x i v( x) .
447
Óbudai Egyetem BGK
Fejezetek a matematikából
Tekintsük konkrét példaként az f x eix valós változójú komplex függvényt. A konjugált értelmezése alapján, valamint a 3.2. fejezetben igazolt Euler-féle összefüggés felhasználásával kapjuk a következő alapvető fontosságú összefüggéseket. f x eix cos x i sin x, f x eix cos x i sin x
Ha ezt a két összefüggést, mint egyenletrendszert tekintjük, akkor látható, hogy a sinx és cosx trigonometrikus függvények kifejezhetők komplex exponenciális függvényekkel. A későbbiekben szükségünk lesz ezekre az összefüggésekre ezért felírjuk őket:
cos x
eix eix eix eix ; illetve sin x 2 2i
A mondottak birtokában készen állunk a jelzett definíció megfogalmazására. 3.3.12.Definíció: Az
einx n Z; x a, a 2 függvényrendszert – figyelembe véve, hogy
n = 0 esetén ei 0 x e0 1 –, elemenként írva az
...; e3ix ; e2ix ; eix ; 1; eix ; e2ix ; e3ix ;... függvényrendszert, ahol i az imaginárius egység, komplex exponenciális rendszernek nevezzük. A 3.3.11. definícióval értelmezett skaláris szorzat birtokában könnyedén igazolhatjuk, hogy az exponenciális rendszer ortogonális rendszer. 3.3.9. Tétel: Az exponenciális rendszer ortogonális függvényrendszer az [a, a+2π] intervallumon, tetszőleges valós a esetén. Bizonyítás: Meg kell mutatnunk, hogy tetszőleges n és k egészekre az einx ; eikx ; n k függvények ortogonálisak. A 3.3.11. definíció alapján ez könnyen igazolható, ha figyelembe vesszük az Euler-összefüggést valamint a skaláris szorzat értelmezését komplex függvények esetére. a 2
einx , eikx
a
einx eikx dx
a 2
a
i nk x
e
a 2
ei n k x dx i n k a
a 2
cos n k x i sin n k x i n k a
448
Óbudai Egyetem BGK
Fejezetek a matematikából
cos n k a 2 cos n k a i sin n k a 2 i sin n k a 0 i n k i n k
Az eredmény azért zérus, mert a szinusz függvény és a koszinusz függvény periódusa 2π, tehát a zárójelben szereplő törtek értéke külön-külön zérus. Éppen ezt kellett igazolni. ■ Szeretnénk átalakítani az exponenciális rendszert úgy, hogy ortonormált rendszer legyen. Ehhez meg kell határozni a rendszer elemeinek normáit. 3.3.10. Tétel: Az exponenciális függvényrendszer minden elemének normája Bizonyítás: Legyen n tetszőleges egész szám, ekkor einx
2
a 2
einx , einx
2 .
einx einx dx
a a 2
a 2
ei 0 x dx
a
1dx x aa 2 a 2 a 2
a
Ezzel az állítást igazoltuk. ■ A 3.3.9. és 3.3.10. tételek következménye az alábbi tétel. inx e n Z ; x a, a 2 függvényrendszer, vagy elemenként írva az 3.3.11. Tétel: Az 2
...;
e3ix e2ix eix ; ; ; 2 2 2
1 eix e2ix e3ix ; ; ; ;... 2 2 2 2
függvényrendszer ortonormált rendszer az [a, a + 2π] intervallumon. ■ Ha adott egy ortonormált rendszer, továbbá egy négyzetesen integrálható f(x) függvény – amely komplex esetben azt jelenti, hogy az abszolút érték négyzete integrálható –, akkor a 3.3.7. definíció szerint az f(x) függvény ezen ortonormált rendszer szerint Fourier-sorba fejthető. 3.3.13.Definíció: A négyzetesen integrálható f(x) függvény ortonormált komplex exponenciális rendszer szerinti kifejtését komplex Fourier sornak nevezzük. Ennek alakja
f ( x)
einx f ( x), 2 n
449
einx 2
Óbudai Egyetem BGK ... f ( x),
Fejezetek a matematikából
e3ix e3ix e2ix e2ix eix eix 1 f ( x), f ( x), f ( x), 2 2 2 2 2 2 2
f ( x),
eix 2
eix e2ix f ( x), 2 2
e2ix e3ix f ( x), 2 2
1 2
e3ix ... 2
Ha itt a szokásos módon bevezetjük az együtthatókra a cn
1 2
f ( x),
einx 1 f ( x), einx ; n Z 2 2
jelölést, akkor megkapjuk a komplex Fourier-sor szokásos alakját.
f ( x) ~
n
cneinx ... c3e3ix c2e2ix c1eix c0 c1eix c2e 2ix c3e3ix ...
Ha figyelembe vesszük a skaláris szorzat értelmezését, akkor kapjuk az együttható formulák szokásos alakját is.
1 cn 2
a 2
f x einx dx; n Z
a
Ebben az esetben tehát nem kell három együttható formulát megjegyezni és három integrált kiszámítani egy sorfejtésnél, hanem elég egy formula és egy integrál. A számítás annyiban szokatlanabb, hogy általában komplex mennyiségekkel kell számolnunk. További lényeges eltérés, hogy ez a függvénysor mindkét irányban végtelen sor. Pontosan úgy, ahogyan a trigonometrikus rendszer tanulmányozásánál tettük, nem vizsgáljuk a rendszer teljességét, mert nincs a kezünkben a szükséges apparátus, azonban a tényt egy nagyon fontos következményével együtt egy tétel formájában megfogalmazzuk. inx e n Z ; x a, a 2 függvényrendszer teljes ortonormált rendszer a 3.3.12. Tétel: Az 2 megadott intervallumon. Tetszőleges négyzetesen integrálható f(x) függvény esetén a komplex Fourier-sor négyzetintegrál normában tart az f(x) függvényhez, azaz teljesül, hogy
lim f ( x)
n
n
k n
ezen kívül teljesül a Parseval-összefüggés
450
ck eikx 0
Óbudai Egyetem BGK
Fejezetek a matematikából f
2
2
cn
n
2
Bizonyítás: A teljességet és a normában való konvergenciát nem vizsgáljuk, de a Parsevalképletet igazoljuk. Használjuk fel az általános Fourier-sorok elméletében levezetett általános Parseval-képletet. A 3.3.3. tétel szerint igaz, hogy
f
2
f , gn
n
2
ahol gn jelöli az
ortonormált rendszer egy tagját. A 3.3.13. definícióban foglaltak szerint cn
1 2
f ( x),
einx 1 f ( x), g n x ; n Z; ahonnan f ( x), g n x 2 cn 2 2
Ebből pedig már azonnal következik, hogy
f , gn
n
2
2
2
n
cn , és éppen ezt kellett
igazolni. ■ 3.3.9. Példa: Határozzuk meg az alábbi függvény exponenciális Fourier-sorát. e x , ha x e e f x , ha x 2k ; k Z 2 f x 2 különben
A sorfejtés trigonometrikus rendszeren belül is elvégezhető természetesen, de a függvény exponenciális jellegéből adódóan egy kissé hosszadalmas, kétszer kell parciálisan integrálni, ráadásul két alkalommal is. Ez természetesen elvi problémát nem okoz, de jobban illeszkedik a feladat az exponenciális sorfejtés témaköréhez. Itt mindössze egyetlen integrált kell kiszámítani az n paraméter függvényében és már kezünkben is a Fourier-sor. Válasszuk integrációs intervallumnak a természetesen adódó [–π, π] intervallumot. Ekkor kapjuk, hogy
1 cn 2
1 e 2 1 in
1in x
f x e
inx
1 dx 2
e
x
e
inx
1 dx 2
1in x dx
e
1 1 e1in e1in eein eein 2 1 in 2 1 in
Ezeknek a függvényértékeknek a kiszámításához szükségünk van az Euler-összefüggésre. Eszerint sinnπ = 0 és cosnπ = (–1)n miatt
451
Óbudai Egyetem BGK cn
Fejezetek a matematikából
1 e cos n sin n e cos n sin n 2 1 in n n n 1 1 e e sh 1 sh 1 in 2 1 in 1 in
Ezzel a komplex Fourier-sort elő is állítottuk. 1 n 1n einx inx sh f x sh e 1 in n 1 in n
A kapott sor jelentős mértékben különbözik attól, amelyet trigonometrikus sorfejtés esetén kaptunk volna. A legfontosabb különbség az, hogy a periodikus f(x) függvény valós függvény, ennek ellenére egy komplex együtthatós függvénysort kaptunk, amelyben a sor függvényei is komplex függvények. Természetesen van kapcsolat a valós sorfejtés és a komplex sorfejtés között. Ennek a kérdésnek a részletes vizsgálatára visszatérünk a 3.3.11. pontban. Azt azonban már most is hangsúlyozzuk, hogy tekintettel az Euler formulára, lényegében a kapott sor is szinusz és koszinusz függvények szerint haladó sor, így a Dirichlet-Jordan tétel alkalmazható erre az esetre is. Így megállapíthatjuk, hogy a kapott sor előállítja a függvényt, hiszen a szakadási helyeken, tehát az x = π + k2π helyeken éppen úgy definiáltuk a függvényt, hogy a helyettesítési érték az egyoldali határértékek számtani közepe legyen. A sorfejtést közvetlenül szemléltetni nem tudjuk, hiszen valós változós komplex értékű függvényeket kellene ábrázolnunk. Azt megtehetnénk, hogy ábrázoljuk külön a valós és a képzetes részeket, de inkább más utat választunk. Először áttranszformáljuk a komplex sort trigonometrikus sorrá, és azt szemléltetjük majd a 3.3.12. példában. A problémakört részletesen vizsgáljuk majd a 3.3.11. pontban. 3.3.10. Példa: Induljunk ki a 3.3.9. példa eredményeiből, és alkalmazzuk a komplex Fouriersorokra vonatkozó Parseval-formulát. Ehhez először is szükség van az f(x) függvény négyzetének az integráljára.
e2 x e2 e2 f x dx e dx sh 2 2 2 2
2x
Az idézett formula szerint ez egyenlő a Fourier-együtthatók abszolút értékei négyzetösszegének 2π-szeresével. A négyzetösszeg a következő.
2
n
cn
2
2
1n 1 in n
sh 2 2
2
452
2
1 in 2sh 2 n 1 in 1 in
Óbudai Egyetem BGK
Fejezetek a matematikából
2sh 2 1 in n 1 n2
2
2sh 2 1 in 1 in 2sh 2 1 2 2 n 1 n 1 n n 1 n2
Tegyük most egyenlővé a két eredményt, és azonnal vegyükfigyelembe az ismert hiperbolikus trigonometriai összefüggést, mely szerint sh2x = 2shxchx. Így a következőt kapjuk.
2sh 2 1 sh 2 2sh ch n 1 n2 Ha rendezzük a kapott egyenlőséget, ismét kaptuk egy végtelen numerikus sor összegét.
1
n 1 n
2
ch cth sh
ahol cthx a kotangens hiperbolikusz függvényt jelöli.
3.3.9. Páros és páratlan függvények komplex Fourier-sora A trigonometrikus esetben is tettünk észrevételeket páros és páratlan függvények sorfejtésével kapcsolatban. A komplex esetben is léteznek ide vágó törvényszerűségek, azonban a komplex jellegből adódóan az összefüggések természete más jellegűek. Páros függvény komplex Fourier-sora Induljunk ki tehát abból, hogy az f(x) függvény páros a [–π, π] intervallumon és ezt terjesztjük ki 2π-szerint periodikus módon a számegyenesre. Írjuk fel az együttható formulát. Ha figyelembe vesszük az Euler-összefüggést, azt kapjuk, hogy cn
1 2
1 2
f x einx dx
f x cos nx dx
i 2
1 2
f x cos nx i sin nx dx
f x sin nx dx
1 2
f x cos nx dx
ugyanis a második integrál zérus, hiszen egy páros és páratlan függvény szorzatának, vagyis egy páratlan függvénynek origóra szimmetrikus intervallumra vonatkozó integrálja. Ebben az esetben tehát egyrészt azt kaptuk, hogy az együttható a kapott egyszerűbb összefüggéssel számítható, aminek közvetlen következménye, hogy az együtthatók mind valós számok. Páros függvény komplex Fourier-sorában tehát – a trigonometrikus esettel ellentétben – minden tag megtalálható, de minden együttható valós szám.
453
Óbudai Egyetem BGK
Fejezetek a matematikából
Ha még figyelembe vesszük, hogy a nem nulla integrál két páros függvény szorzatának, tehát egy páros függvénynek origóra szimmetrikus intervallumra vonatkozó integrálja, akkor az együttható formula az alábbi legegyszerűbb alakot ölti.
cn
1 2
f x cos nx dx
0
0
2 1 f x cos nx dx f x cos nx dx 2
3.3.11. Példa: Határozzuk meg az alábbi függvény („egyenirányított harmonikus jel”) komplex Fourier-sorát. x cos , ha x f x 2 f x 2 különben
A függvény páros, tehát az egyszerűség kedvéért alkalmazzuk a sorfejtéshez a páros függvényekre levezetett együttható formulát.
cn
0
0
1 1 x f x cos nx dx cos cos nx dx 2
Az integrál kiszámításához ismét használjuk a
cos cos
1 cos cos 2
trigonometrikus azonosságot.
1 1 sin 0,5 n x sin 0,5 n x 1 1 cn cos n x cos n x dx 2 2 2 2 0,5 n 0,5 n 0 0
sin 0,5 n 1 sin 2n 1 2 sin 2n 1 2 1 sin 0,5 n 0 0 2 0,5 n 0,5 n 2n 1 2n 1 n n 1 n n 1 1 1 1 1 1 1 2 1 2n 1 2n 1 2n 1 2n 1 4n2 1
Az együtthatók birtokában írhatjuk az exponenciális függvények szerint haladó Fourier-sort: n 1
2 1 f x einx n 4n2 1
454
Óbudai Egyetem BGK
Fejezetek a matematikából
Az általános megállapításoknak megfelelően valós együtthatójú sort kaptunk. Ismét a DirichletJordan tételre hivatkozva írható az egyenlőség, a sor előállítja a függvényt mindenütt, mert a függvény mindenütt folytonos. Az ábrázolásra majd visszatérünk a 3.3.11. pontban a 3.3.13. példán belül. Páratlan függvény komplex Fourier-sora Induljunk ki most abból, hogy az f(x) függvény páratlan a [–π, π] intervallumon és ezt terjesztjük ki 2π-szerint periodikus módon a számegyenesre. Írjuk fel az együttható formulát. Ha figyelembe vesszük az Euler-összefüggést, azt kapjuk, hogy 1 cn 2 1 2
f x e
inx
1 dx 2
i f x cos nx dx 2
f x cos nx i sin nx dx
i f x sin nx dx 2
f x sin nx dx
ugyanis ebben az esetben az első integrál zérus, hiszen egy páratlan és páros függvény szorzatának, vagyis egy páratlan függvénynek origóra szimmetrikus intervallumra vonatkozó integrálja. Ebben az esetben tehát egyrészt azt kaptuk, hogy az együttható a kapott egyszerűbb összefüggéssel számítható, aminek közvetlen következménye, hogy az együtthatók mind imaginárius számok. Páratlan függvény komplex Fourier-sorában tehát – a trigonometrikus esettel ellentétben – minden tag megtalálható, de minden együttható imaginárius szám. Ha még figyelembe vesszük, hogy a nem nulla integrál két páratlan függvény szorzatának, tehát egy páros függvénynek origóra szimmetrikus intervallumra vonatkozó integrálja, akkor az együttható formula az alábbi legegyszerűbb alakot ölti.
cn
i 2
f x sin nx dx
0
0
2i i f x sin nx dx f x sin nx dx 2
3.3.10. Kapcsolat a trigonometrikus és komplex Fourier-sor között Az Euler-összefüggés kapcsolatot teremt a trigonometrikus függvények és a komplex exponenciális függvény között. Nem meglepő tehát, ha felfedezünk kapcsolatot a trigonometrikus Fourier-sor és a komplex Fourier-sor között. Alkalmazzuk az Euler-összefüggést a komplex Fourier-sor két 0-indexre szimmetrikus indexű tagjára:
cneinx cn cos nx i cn sin nx, cneinx cn cos nx i cn sin nx
455
Óbudai Egyetem BGK
Fejezetek a matematikából
Ha ezt a két egyenletet összeadjuk, azonnal látszik, hogy a két irányban végtelen sor, trigonometrikus függvények szerint rendezve egy hagyományos trigonometrikus függvénysorrá alakítható, mely cosnx és sinnx szerint van rendezve. Ha a c0 konstans tagot első tagnak tekintjük, akkor a komplex Fourier-sor az alábbi ekvivalens alakban írható.
f x ~ c0 cneinx cneinx c0 cn cn cos nx i cn cn sin nx n 1
n 1
Innen pedig következik a trigonometrikus és komplex sor együttható közötti alábbi összefüggés.
a0 c0 ; an cn cn ; és bn i cn cn illetve megfordítva a ibn a ibn c0 a0 ; cn n ; és cn n 2 2
Ezek az összefüggések felhasználhatók arra, hogy ha ismerünk egy trigonometrikus sorfejtést, akkor segítségükkel áttérhetünk a komplex sorra illetve fordítva, attól függően, hogy az alkalmazások mit követelnek meg, illetve az is lehet az ok, hogy az egyik típusú együttható formula alkalmazásával az együttható kiszámítása egyszerűbb. 3.3.12. Példa: Határozzuk meg a 3.3.9. példában szereplő függvény trigonometrikus Fouriersorát. A hivatkozott példában megkaptuk a komplex Fourier-sort. A komplex Fourier együtthatók ismeretében az
a0 c0 ; an cn cn ; és bn i cn cn formulák felhasználásával adódnak a trigonometrikus sor együtthatói.
sh 1 sh a0 c0 1 i 0 0
n n n 1 sh 1 n sh 1 in 1 in 2sh 1 an cn cn 1 2 1 in 1 in 1 n2 1 n n n n 1 1 sh 1 sh 1 in 1 in 2sh 1 n n i 1 bn i cn cn i 2 1 in 1 in 1 n 1 n2
Az együtthatók ismeretében felírható a trigonometrikus Fourier-sor.
456
Óbudai Egyetem BGK
Fejezetek a matematikából
n n 1 1 n sh 2sh 1 f ( x) cos nx sin nx n 1 1 n2 1 n2
Az ábrázolás érdekében felírjuk a sor első néhány tagját: f ( x)
sh 1 1 2 1 3 1 4 1 1 2 cos x sin x cos 2 x sin 2 x cos3x sin 3x cos 4 x sin 4 x... 2 2 5 5 10 10 17 17
A sorfejtést szemlélteti a 3.3.6. ábra.
3.3.6. ábra. A 3.3.9. példabeli f(x) függvény (kék színű görbe) közelítése a Fourier-sor „első kilenc” tagjával (piros színű görbe), azaz a konstans tagot követően 4 db koszinuszos és 4 db szinuszos tag figyelembe vételével
3.3.13. Példa: Határozzuk meg a 3.3.11. példában szereplő függvény trigonometrikus Fouriersorát a komplex Fourier-sor együtthatóinak felhasználásával. Az előző példa megoldásához hasonlóan járunk el. 0 1
2 1 2 a0 c0 2 4 0 1
an cn cn
n 1 1n 1 2 1n 1 1n 1 4 1n 1 2 1 4n 2 1 4 n 2 1 4n 2 1 4 n 2 1 4 n 2 1
457
Óbudai Egyetem BGK
Fejezetek a matematikából
n 1 n 1 n 1 n 1 1 1 2 1 2 1 0 bn i cn cn i i 4n 2 1 4 n 2 1 4n 2 1 4 n 2 1
A legutóbbi eredmény a várakozásnak megfelelően azt jelenti, hogy egy páros függvény Fourier sorában nincsenek szinuszos tagok. Mint látjuk ez természetesen a „komplex irányból megközelítve” is adódik. A számítások eredményeire támaszkodva adódik a trigonometrikus Fourier-sor. n 1 2 4 1 f ( x) cos nx n 1 4n2 1 Az ábrázolás érdekében felírjuk a sor néhány tagját.
f ( x)
2 1 1 1 1 2 cos x cos 2 x cos 3x ... 15 35 3
Mint már említettük, a Fourier-sor mindenütt előállítja a függvényt, tehát valóban írhatunk egyenlőséget. A sorfejtést szemlélteti a 3.3.7. ábra.
3.3.7. ábra. A 3.3.11. példabeli f(x) függvény (kék színű görbe) közelítése a Fourier-sor első négy tagjával (piros színű görbe), azaz a konstans tagot követően 3 db koszinuszos tag figyelembe vételével
458
Óbudai Egyetem BGK
Fejezetek a matematikából
Irodalomjegyzék Bronstejn-Szemengyajev: Matematikai zsebkönyv. Typotex. 2006. Fagyejev-Szominszkij: Felsőfokú algebrai feladatok. Műszaki Kiadó, Budapest, 1973 Fuksz-Sabat: Komplex függvénytan. Műszaki Kiadó, 1978. Freud Róbert: Lineáris algebra, ELTE Eötvös kiadó, 2006 Fried Ervin: Klasszikus és lineáris algebra. Tankönyvkiadó, Budapest, 1995. Halmos Pál: Véges dimenziós vektorterek. Műszaki Kiadó. Bp. 1984. Hajós György: Bevezetés a geometriába. Tankönyvkiadó, Budapest, 1993. Járai Antal: Modern alkalmazott analízis. Typotex, Budapest, 2008. Kiss Emil: Bevezetés az algebrába, Typotex Kiadó, Budapest, 2007. Kovács – Takács - Takács: Analízis. Nemzeti Tankönyvkiadó, 2005. Krekó Béla: Lineáris Algebra. Közgazdasági és Jogi Könyvkiadó. Budapest, 1976 Laczkovich Miklós – T. Sós Vera: Analízis I-II., Nemzeti Tankönyvkiadó, 2007. Pontrjagin: Közönséges differenciálegyenletek. Akadémiai Kiadó. Bp. 1976. Obádovics J. Gyula: Mátrixok és differenciálegyenlet-rendszerek. Scolar. Bp. 2005. Obádovics J. Gyula: Lineáris algebra, Példákkal. Scolar. Bp. 2001. Ponomarjov: Differenciálegyenletek felállítása és megoldása. Tankönyvkiadó, Bp. 1969. Prasolov: Lineáris algebra. Typotex. Bp. 2006. Rózsa Pál: Bevezetés a mátrixelméletbe. Typotex, Budapest, 2009. Rózsa Pál: Lineáris algebra és alkalmazásai. Műszaki Kiadó, Budapest, 1984. Scharnitzky viktor: Differenciálegyenletek. Műszaki Kiadó, Budapest, 2008. Scharnitzky Viktor: Mátrixszámítás. Műszaki Kiadó, Budapest, 2008. Scharnitzky Viktor: Matematikai feladatok, Nemzeti Tankönyvkiadó 1996 Simon Péter - Tóth János: Differenciálegyenletek. Typotex. Bp. 2006. Stoyan Gisbert: MATLAB. Typotex. Bp. 2010. Szász Gábor: Matematika I-II-III. Nemzeti Tankönyvkiadó, 2007. Szász Pál: A differenciál és integrálszámítás elemei I-II. Typotex, Budapest, 2008 Thomas-féle kalkulus I-II-III: Typotex, Budapest, 2008.
459
Óbudai Egyetem BGK
Fejezetek a matematikából
Tartalomjegyzék Előszó ............................................................................................................................................... 5 1. fejezet Mátrixelmélet, Lineáris algebra ....................................................................................... 7 1. Lineáris algebra ............................................................................................................................ 9 1.1. A lineáris tér. Alapfogalmak .................................................................................................... 9 1.2. Vektorrendszerek és tulajdonságaik ........................................................................................ 13 1.3. Elemi bázistranszformáció ...................................................................................................... 20 1.4. Az elemi bázistranszformáció alkalmazásai ........................................................................... 24 1.5. Mátrixok .................................................................................................................................. 27 1.6. Műveletek mátrixokkal ........................................................................................................... 30 1.7. Kvadratikus mátrix determinánsa............................................................................................ 43 1.8. Kvadratikus mátrix inverze ..................................................................................................... 56 1.9. Lineáris egyenletrendszerek .................................................................................................... 62 1.10. Gauss elimináció, mátrixok LU-felbontása ........................................................................... 77 1.11. Mátrix sajátértéke, sajátvektora............................................................................................. 95 1.12. Kvadratikus mátrixok hatványozása ................................................................................... 114 1.13. Speciális mátrixok tulajdonságai ......................................................................................... 120 1.14. Ortogonális projekciók. Lineáris egyenletrendszer legjobban közelítő megoldása, a legkisebb négyzetek módszere ..................................................................................................... 132 1.15. Gram-Schmidt-féle ortogonalizáció. Reguláris mátrixok QR-felbontása .......................... 142 1.16. Hasonló mátrixok. Diagonalizáció ...................................................................................... 150 1.17. Kvadratikus alakok. Pozitív definit mátrixok ..................................................................... 163 2. fejezet Differenciálegyenletek................................................................................................. 180 2.1. Elsőrendű differenciálegyenletek .......................................................................................... 182 2.1.1. Bevezető példák ................................................................................................................. 182 2.1.2. A differenciálegyenlet fogalma .......................................................................................... 183 2.1.3. Explicit közönséges elsőrendű differenciálegyenlet .......................................................... 184 2.1.4. Az y’= f(x, y) differenciálegyenlet megoldhatósága, a megoldás egyértelműsége (egzisztencia és unicitás) .............................................................................................................. 187 2.1.5. Közvetlenül integrálható differenciálegyenletek ............................................................... 189 2.1.6. Szétválasztható változójú (szeparálható) differenciálegyenlet .......................................... 193 2.1.7. Homogén differenciálegyenlet ........................................................................................... 196 2.1.8. Elsőrendű lineáris differenciálegyenlet ............................................................................. 199 2.1.8.1. Homogén lineáris differenciálegyenlet ........................................................................... 199
460
Óbudai Egyetem BGK
Fejezetek a matematikából
2.1.8.2. Inhomogén lineáris differenciálegyenlet ......................................................................... 201 2.1.8.3. Az állandó variálásának módszere .................................................................................. 202 2.1.9. A Bernoulli-féle differenciálegyenlet................................................................................. 205 2.1.10. Egzakt differenciálegyenlet .............................................................................................. 208 2.1.11. Integráló tényező .............................................................................................................. 213 2.2. Másodrendű differenciálegyenletek ...................................................................................... 218 2.2.1.Bevezető példák .................................................................................................................. 218 2.2.2. Explicit közönséges másodrendű differenciálegyenlet ...................................................... 219 2.2.3. Hiányos másodrendű differenciálegyenletek ..................................................................... 221 2.2.4. Másodrendű lineáris differenciálegyenletek ...................................................................... 229 2.2.4.1. Másodrendű homogén lineáris differenciálegyenlet ....................................................... 230 2.2.4.2. Másodrendű inhomogén lineáris differenciálegyenlet .................................................... 242 2.2.5. Másodrendű állandó együtthatójú lineáris differenciálegyenlet ........................................ 247 2.2.5.1. Másodrendű állandó együtthatójú homogén lineáris differenciálegyenlet ..................... 247 2.2.5.2. Másodrendű állandó együtthatójú inhomogén lineáris differenciálegyenlet .................. 252 2.2.6. Rezgések elmélete .............................................................................................................. 265 2.2.6.1. Harmonikus oszcillátor ................................................................................................... 265 2.2.6.2. Csillapított harmonikus oszcillátor.................................................................................. 269 2.2.6.3. Gerjesztett és csillapított harmonikus oszcillátor ............................................................ 274 2.3. Elsőrendű lineáris differenciálegyenlet rendszerek............................................................... 281 2.3.1. Bevezető példák ................................................................................................................ 281 2.3.2. Elsőrendű lineáris differenciálegyenlet rendszer fogalma ................................................. 283 2.3.3. Elsőrendű homogén lineáris differenciálegyenlet rendszer ............................................... 287 2.3.4. Elsőrendű inhomogén lineáris differenciálegyenlet rendszer ............................................ 295 2.3.5. Elsőrendű állandó együtthatójú homogén lineáris differenciálegyenlet rendszer .............. 299 2.3.6. Elsőrendű állandó együtthatójú inhomogén lineáris differenciálegyenlet rendszer........... 327 2.3.7. n-ed rendű állandó együtthatójú lineáris differenciálegyenlet, az átviteli elv.................... 337 3. fejezet Sorelmélet .................................................................................................................... 347 3.1. Numerikus sorok ................................................................................................................... 349 3.1.1. Numerikus sorok ................................................................................................................ 349 3.1.2. Végtelen mértani sor .......................................................................................................... 351 3.1.3. A parciális törtekre bontás módszere ................................................................................. 354 3.1.4. Konvergencia kritériumok................................................................................................. 356 3.1.4.1. Pozitív tagú sorokra vonatkozó kritériumok .................................................................. 357
461
Óbudai Egyetem BGK
Fejezetek a matematikából
3.1.4.2. Váltakozó előjelű sorokra vonatkozó konvergencia kritérium ....................................... 363 3.1.5. Abszolút és feltételes konvergencia ................................................................................... 367 3.2. Függvénysorok, Taylor-sorok ............................................................................................... 372 3.2.1. Függvénysorozatok általános fogalma, konvergenciája ..................................................... 372 3.2.2. Függvénysorok általános fogalma, konvergenciája ........................................................... 374 3.2.3. Hatványsorok ..................................................................................................................... 380 3.2.3. Taylor-sorok ....................................................................................................................... 386 3.2.4. A binomiális sor ................................................................................................................. 397 3.2.5. A Taylor-polinom és a Taylor-sor alkalmazásai ................................................................ 401 3.3. Fourier-sorok ......................................................................................................................... 418 3.3.1. Problémafelvetés ................................................................................................................ 418 3.3.2. Általános értelemben vett Fourier-sor ................................................................................ 421 3.3.3. Általános Fourier-sorok konvergenciája, a Fourier együtthatók szélsőérték tulajdonsága, a Parseval-képlet ............................................................................................................................. 423 3.3.4. Trigonometrikus Fourier-sorok .......................................................................................... 425 3.3.5. Trigonometrikus Fourier-sorok formális bevezetése ......................................................... 430 3.3.6. Páros és páratlan függvények Fourier-sora ........................................................................ 438 3.3.7. Nem 2π-szerint periodikus függvények Fourier-sora......................................................... 443 3.3.8. Komplex Fourier-sor .......................................................................................................... 447 3.3.9. Páros és páratlan függvények komplex Fourier-sora ......................................................... 453 3.3.10. Kapcsolat a trigonometrikus és komplex Fourier-sor között ........................................... 455 Irodalomjegyzék ........................................................................................................................... 459
462