TARTALOMJEGYZÉK KÖNYVINDÍTÓ ..........................................................................................................4 1. Bevezető rendszerekről és jelekről .........................................................................7 1.1. Bevezető rendszerekről ......................................................................................7 1.2. Bevezető jelekről..............................................................................................15 1.3. Vezérlés, szabályozás.......................................................................................22 2. Jelek rendszerelméleti megközelítésben .............................................................25 2.1. A jelek modelljei ..............................................................................................26 2.2. A jelek osztályozása.........................................................................................28 2.3. Alapműveletek jelekkel....................................................................................35 2.4. A jelek értelmezési tartományát módosító műveletek ....................................38 2.5. Elemi jelek .......................................................................................................52 3. Rendszermodellek ..................................................................................................60 3.1. Példák modellekre...........................................................................................61 4. Rendszerelméleti alapfogalmak............................................................................71 4.1. Fogalmak rendszerekről ...................................................................................71 4.2. LTI rendszerek .................................................................................................73 4.3. Rendszerek tulajdonságai.................................................................................76 5. Rendszerek állapotteres leírása ............................................................................80 5.1. Folytonos rendszerek leírása az állapottérben..................................................82 5.2. Fázistér .............................................................................................................85 5.3. LTI rendszerek állapotteres leírása szimulációs diagramok alapján................90 5.4. Lineáris rendszerek állapotteres modelljei.......................................................96 5.5. Állapotteres diagramok módszertana...............................................................98 5.5.1. Szekvenciális differenciálás módszere ............................................................... 98 5.5.2. Összekapcsolt integrálási módszer ................................................................... 101 5.5.3. Állapotegyenletek résztörtek alapján ................................................................ 104 5.5.4. Faktorizált átviteli függvény módszer ............................................................... 107
5.6. Állapottér egyenletei és az átviteli függvény .................................................109 5.7. Az állapotegyenletek megoldása....................................................................110 6. A mátrixalgebra és analízis alapfogalmai..........................................................119 6.1. Állapotváltozók transzformációja ..................................................................120 6.2. Sajátérték, Sajátvektor....................................................................................122 6.2.1. Lineáris, nemhomogén egyenletrendszer egyszeri sajátértékekkel .................. 127 6.2.2 Lineáris, nemhomogén egyenletrendszer többszörös sajátértékekkel................ 129
1
7. Transzformációk a rendszerelméletben.............................................................145 7.1. Fourier sorbafejtés és transzformáció ...........................................................145 7.2. Laplace transzformáció ..................................................................................151 7.2.1. Átviteli függvény (összefoglaló) ........................................................................ 156 7.2.2. Dirac-jel Laplace transzformációja.................................................................. 158
7.3. Z-transzformáció ............................................................................................161 8. Frekvenciafüggvények.........................................................................................170 8.1. Az amplítúdó-fázis jelleggörbe (Nyquist-diagram) .......................................171 8.2. Bode jelleggörbe ............................................................................................172 8.3. Rendszerek stabilitása ...................................................................................173 8.3.1. BIBO stabilitás................................................................................................. 179 8.3.2. Routh-féle stabilitási kritérium ......................................................................... 180 8.3.3. Hurwitz-féle stabilitási kritérium ...................................................................... 181 8.3.4. Routh és Hurwitz kritériumok diszkrét rendszer esetében ............................... 182 8.3.5. Jury-féle stabilitási kritérium........................................................................... 183 8.3.6. Ljapunov közvetlen módszere............................................................................ 185 8.3.7. Nyquist stabilitási kritérium............................................................................. 187 8.3.8. Stabilitásvizsgálat BODE-diagramokkal .......................................................... 191 8.3.9. Gyökhely módszer ............................................................................................. 192
8.4 Szabályzó körök alaptagjainak jelátviteli tulajdonságai .................................200 8.4.1. Arányos tag (P-elem) ....................................................................................... 202 8.4.2. Integráló tag (I-elem) és egy energiatátárolós integráló tag (IT0) ................. 202 8.4.3. Deriváló (differenciáló) tag (D-elem).............................................................. 203 8.4.4. Egy energiatárolós arányos időkésleltető tag (PT1) ....................................... 204 8.4.5. Két energiatárolós arányos időkésleltetésű tag (PT2)..................................... 206 8.4.6. A holtidős tag ................................................................................................... 209 8.4.7. Jelátviteli tagok kapcsolási módozatai............................................................. 211
9. Mátrix-függvények...............................................................................................217 9.1. Cayley-Hamilton törvény...............................................................................219 9.2. Sylvester tétele ...............................................................................................221 9.3. Cayley-Hamilton módszer .............................................................................223 10. Mintavételezés, diszkrét rendszerek.................................................................227 10.1. Mintavételezés ............................................................................................227 10.2. Differencia egyenletek ................................................................................235 10.2.1. Diszkrét átviteli függvény............................................................................... 236 10.2.2. A differencia egyenlet és diszkrét átviteli függvény ........................................ 238
2
10.3. Folytonos rendszerből diszkrét rendszerre való transzformáció..................240 10.3.1. Bilineáris (Tustin) módszer ............................................................................ 240 10.3.2. Az impulzus átviteli invariancia módszere ..................................................... 242 10.3.3. Egységugrás invariancia módszere(ZOH) ..................................................... 243 10.3.4. Előrecsatolt differencia módszere.................................................................. 244 10.3.5 Visszacsatolt differencia módszere ................................................................. 244 10.3.6. Megközelítő deriváló módszer ....................................................................... 247 10.3.7. Mintavételek közötti állandó bemenet módszere............................................ 250
10.4. Diszkrét állapotegyenletek ..........................................................................252 10.5. A diszkrét állapotegyenlet rendszer megoldása .........................................256 10.5.1. Diszkrét állapotegyenletek általános megoldása ........................................... 258 10.5.2. Állapotteres transzformációk ......................................................................... 262
11. Rendszerek minőségi követelményei ................................................................266 11.1. Megfigyelhetőség, szabályozhatóság...........................................................266 11.1.1. Megfigyelhetőség ........................................................................................... 267 11.1.2. Szabályozhatóság ........................................................................................... 270
11.2. Érzékenység, Tűrőképesség (robusztusság).................................................275 12. Összefoglaló rendszerelméleti feladatokhoz ....................................................278 Befejező gondolatok .................................................................................................301 IRODALOMJEGYZÉK .........................................................................................302
3
KÖNYVINDÍTÓ A könyv szándéka, hogy egy a rendszerelméletbe bevezető tankönyv legyen mérnökjelöltek számára. A fontos fogalmak végig a szövegben dőltbetűs formában szerepelnek. A bevezető fejezetben vázlatosan ismertetem a rendszerelméletben, rendszertechnikában használatos fogalmakat. Ennek a könyvnek nem célja, hogy ezeket a fogalmakat elméleti meggondolások alapján elmélyítsük. Egyszerűen csak figyelemfelkeltő célja van. A könyv végigtanulmányozása után, újraolvasva a bevezető fejezetet, legyen mindez továbbgondolásra késztető vázlat. A könyvben szereplő képletek megszámozásának logikája azt tükrözi (és minden alfejezetnek megfelelően számoztam ezeket, akárcsak az ábrákat), hogy az illető képletre hivatkozni fogok, vagy az illető képlet egy fontos összefüggés függetlenül attól, hogy még hivatkozok rá vagy sem. Lehetséges, hogy a Bevezető rendszerekről és jelekről fejezetben egyes fogalommagyarázatok ismétlődnek, de ez annyira összetett tudományterület, hogy egy nem átfedő fogalomrendszer kevésbé áttekinthetővé, túlzottan absztrakttá tenné az egész megközelítést. Ez nem tudománytörténeti fejezet, inkább egyfajta fogalomtár. A jelek mint fogalom, ismertetése magába foglalja a jel osztályozását a jel mint információhordozó, zajos jel fogalmait is. A fejezet végén a vezérlést és szabályzást fogalmát tisztázom. A második fejezet a Jelek rendszerelméleti megközelítésben az elméleti meghatározásokon, osztályozásokon túl gyakorlati példák segítenek a módszertani eljárások megértésében. A jelek esetében a cél nem az, hogy kimerítő matematikai elemzésekbe bonyolódjunk. Feltételezem, hogy mindenki rendelkezik a matematikai analízis alapvető ismereteivel (mint a függvény fogalma, topológia, folytonosság, deriválhatóság, integrálhatóság, stb.) és nem kell kitérni ezekre minden esetben. Fontos elsajátítani a jelekkel kapcsolatos alapműveleteket amelyek vonatkozhatnak a jelek értelmezési tartományára akár az értékkészletére. Figyeljünk arra oda arra, hogy a fejezetben úgy a folytonos mint diszkrét jelekről szó van, de a diszkrét jelek esetében minden meghatározás szintjén marad és nem itt térek ki a mintavételezés problematikájára. A fejezet végén tárgyalt Dirac-jel alapvető fontosságú a mintavételezési eljárás megértésére. A mintavételezési eljárást egy elkövetkező fejezetben ismertetem. Fontos, hogy egy pár, didaktikai szempontból is hasznos példán keresztül bemutassam a modellkészítés művelet sorát. Ezt találhatjuk a Rendszermodellek fejezetben. Ez egy tovább bővíthető fejezet. Az LTI alapvető fogalmát a Rendszerelméleti alapfogalmak fejezetben gyűjtöttem össze. A szuperpozició és homogenitás fogalmának a megértése és újabb példákon való elmélyítése elengedhetetlen a többi rendszerelméleti fogalom megértésében. Az ötödik fejezet egy alapvető fogalmat, az állapotteres leírás módszertanát tárgyalja. Az állapottér, állapotváltozó, fázistér meghatározásait példákkal illusztráltam. A fázismodellezés szimulációs diagramok segítségével központi helyett foglal el a tárgyalásban, mert ez áttekinthetővé teszi a matematikai modellezést vagyis 4
az állapotegyenletek felírását. Több példán keresztül mutatom be a szimulációs diagram elkészítési módozatait. Külön paragrafus tárgyalja a különböző típusú állapotegyenletformák felírásának menetét. Nagyon fontos megjegyezni azokat az összefüggéseket amelyek a rendszer bemeneteinek, kimeneteinek és állapotainak száma, valamint a rendszer mátrixainak dimenziója között fennáll. Ez a fejezet tartalmazza az állapotegyenlet megoldásának tárgyalását is. Itt ismertetem a rendszer fundamentális (állapot átviteli) mátrixának, valamint az állapotegyenlet és a teljes megoldás fogalmát. Az közismert, hogy az állapot egyenletrendszer alapján a rendszereket akkor tanulmányozhatjuk, ha tisztában vagyunk a mátrixanalízis és algebra törvényeivel. Erről szól a hatodik A mátrixalgebra és analízis alapfogalmai című fejezet. Az első fontos fogalom a modális mátrix és ennek tulajdonságai a sajátvektor, sajátértékre építve. A jobb megértés érdekében a null-mező, rang-mező fogalmakat is ismertetem. Ennek a fejezetnek a végén szó esik az időben nem invariáns és nemlineáris rendszerekről is egy meghatározás erejéig. A rendszerek viselkedését nem mindig célszerű időtartományban tárgyalni. Sokszor előnyös ha egy adott transzformációval átírjuk az egyenletrendszert egy komplex síkba ahol a műveleti szabályok könnyebbé válnak és végül is ezért végezzük el ezeket a transzformációkat. Bemutatom a Fourier-, a Laplace- és a Ztranszformációkat. A Laplace transzformáció következménye az átviteli függvény fogalma. Mindezek a Transzformációk a rendszerelméletben fejezetben találhatók. Az átviteli függvény alapján rendelkezésünkre áll a rendszer Nyquist jelleggörbéje, a Bode jelleggörbéje amelyek klasszikus elemei a rendszerek stabilitásának vizsgálatában. A Frekvenciafüggvények fejezetben meghatározzuk ezeket az elemeket. A fejezet központi témája a rendszerek stabilitásának vizsgálta. Több ismert stabilitási kritériumot mutatok be meghatározás és alkalmazás szinten. A pólusok elhelyezkedése a komplex síkban és a stabilitás milyensége fontos téma ebben a fejezetben. Ugyanitt tárgyalom az alap jelátviteli tagok tulajdonságait. Ezek az elemek fontosak a szabályzástechnikában is. A jelátviteli tagok kapcsolásának algebrája az alapismeretek közé tartozik. Ebben a fejezetben ismertetem a kapcsolások törvényeit. Amint azt már az előbb is említettem, ez a fejezet képezi a klasszikus rendszerelmélet témakörét. Az állapotteres leírás (modellezés) megköveteli az olyan egyenletek és függvények tanulmányozását amelyeknél a változó egy mátrix. Minden esetben szem előtt kell tartsuk, hogy a négyzetes mátrixok halmazán a multiplikatív művelet nem kommutatív. Ez is egy ok arra, hogy a mátrixfüggvényeket meg kell ismerjük. A kilencedik fejezet erről szól. A fejezet címe Mátrixfüggvények. Az alapelemek ismertetésének a célja a Cayley-Hamilton törvény és módszer megismertetése úgy elméletileg mint alkalmazásokon keresztül. A számítógépes lehetőségek következtében a diszkrét rendszerek tanulmányozása egyre fontosabb. Első lépésként a mintavételezés fogalmának a tisztázása alapvető. Az egész eljárás alapproblémája a mintavételezési periódus megválasztása. Mivel ez a választás ilyen fontos, ezért részleteiben leírom, hogy miért és hogyan kell ezt értelmezni és megválasztani. Mindez a Mintavételezés, diszkrét rendszerek fejezetben található. A differencia egyenletek meghatározása és a Z-transzformáció elvezet a diszkrét átviteli függvény a diszkrét pólus és zérós fogalmához is. Ebben a fejezetben 5
ismertetem a folytonos rendszerből diszkrét rendszerre való transzformáció több módszerét. Így eljutunk a diszkrét állapotegyenletekhez fogalmához is. A diszkrét állapotegyenletek felírásának ismertetése után következhet ezek megoldási eljárásai. Mindenekelőtt bevezetem a diszkrét fundamentális mátrix fogalmát majd a diszkrét modális mátrixot. Ha rendszerelméleti problémákkal foglalkozunk, akkor szükségünk van objektív minőségi kritériumokra, amelyekkel elbírálhatjuk a rendszerek milyenségét. A Rendszerek minőségi követelményei fejezet bevezeti a megfigyelhetőség, szabályozhatóság fogalmait úgy folytonos mint diszkrét rendszerek esetében. A fejezet végén csak megemlítem az érzékenység és tűrőképesség fogalmát. Az utolsó fejezet címe Összefoglaló rendszerelméleti feladatokhoz, amelyben megpróbáltam az előző 11 fejezetben bevezetett, meghatározott fogalmakat összefüggésbe hozni. Mindezt gyakorlati eljárások segítségével teszem. Fontosnak tartottam ezt a fejezetet, hogy elsajátítsuk az egyik rendszerelméleti fogalom szerint felírt formát átalakíthassuk egy vele ekvivalens, de más fogalom szerinti formába. Ebben a könyvben, többek között, nem érintem a rendszerelméletre épülő tudományterületek (rendszer-identifikáció, vezérléselmélet, optimális rendszerek, robusztus rendszerek, adaptív rendszerek, stb.) alapfogalmait. A könyv végén található Irodalomjegyzék minden egyes könyvet valamilyen szinten felhasználtam de nem tartottam fontosnak, hogy mindenikre hivatkozzam a fejezetekben, mert szinte mindenik könyv struktúrájában másképpen de végül is ugyanazt fogalmazza meg. Köszönet mindenkinek akiknek volt elég türelme hozzám míg megírtam a könyvet és köszönet mindazoknak is akiknek nem volt türelme. Remélem, hogy a megírásába fektetett energia és idő nem vész kárba. Ez azt jelenti, hogy a könyv azok jobbulására szolgál akik megpróbálják okulásukra használni. 2006. év nyara
Márton László Ferenc
6
1. Bevezető rendszerekről és jelekről 1.1. Bevezető rendszerekről A rendszerelméletek feladata az hogy mindenfajta rendszerre érvényes általános elméleteket, elveket, törvényeket tárjon fel. Egy elméletnek magába kell foglalnia a rendszerek összességének felépítési, viselkedési, működési és fejlődési törvényszerűségeit, tudományos, ellentmondásmentes leírását. Mondhatjuk, hogy a rendszerelmélet a jelenségek rendszerképként való megjelenítésével, a rendszerek struktúráinak és viselkedésmódjainak egyeztetéseivel, mindezek modellezésével foglalkozik. A rendszertechnika, az ember alkotó képességének egyik jellemzője és az összefüggések és kölcsönhatások szemelőtt tartása hozta létre. Mindezek mögött módszerességre, tudatosságra való törekvés is áll. Ezek alapján a rendszertechnika létrejöttének okai között említhetjük: • • • • • • •
urbanizáció terjedését, anyag- és energiafogyasztás növekedését, a korábbinál hatékonyabb erőforrások, termelékenyebb technológiák megjelenését, a műszaki fejlődés gyórsulását, a termékek bonyolultabbá válását, gépesítést, automatizálást, elektronikát mint a mindennapi élet részeit, heterogén műszaki komponensekből kialakított nagy rendszerek különböző problémáit (tervezés, működtetés, irányítás, stb.), ökológiai-műszaki, társadalmi-műszaki kölcsönhatások jelentőségének növekedését, a tudományterületek elkülönülését amiért szükségessé válik az interdiszciplináris együttműködés.
Ezek szerint a rendszertechnika egy definiciója lehet: A műszaki alkotások tudatosságra törekvő kifejlesztésének, megvalósításának, működtetésének és továbbfejlesztésének tudománya. Objektív összefüggések, szabályszerűségek, törvényszerűségek, a belső és külső kölcsönhatások, következmények, a tapasztalatok gyors kiértékelésének és visszacsatolásának lehetőségeit, módszereit és eszközeit vizsgáló tudományterület. A tudományterület gyakorlati részét képezi a műszaki objektumok létrehozásával, beillesztésével, felhasználásával, átalakításával vagy lebontásával való törődés is. Fontos eszközei a modellezés és a rendszerszimuláció. Legáltalánosabban egy rendszer az egymással kölcsönhatásban álló elemek együttese. A rendszer és környezet egységet képező fogalmak. A rendszer határvonalának kijelölése a feladattól függ. A rendszer főbb jellemzői között említhetjük a rendszer rendeltetését, funkcióit és viselkedésmódját, a határvonalán megfigyelhető anyag-, energia-, információcseréjét, struktúráját, állapotterét, teljesítőképességét, a rendszer és környezete közötti kölcsönhatásokat, elemek, alrendszerek és részrendszerek együttműködését, ezek viszonyait.
7
A rendszer környezete a rendszeren kívüli, de annak muködését befolyásoló elemek és relációk. Miben segít a rendszerelmélet? •
A rendszer megközelítés legcélszerűbb módjának felismerésében
•
Annak tisztázásában, hogy mi mivel és hogyan függ össze
•
Ezen tényezők tudatos és előrelátható módon történő alakításában
Láthatjuk, hogy egy rendszer meghatározása csakis egy tisztázott nézőpont szerinti szemlélet révén lehetséges. Ezért ismerkedjünk meg egy pár, a tudományterület fejlődése során megfogalmazott rendszer-fogalommal. Ezek lehetnek a rendszerkutatás meta elméletei és ezek nem másak mint valamennyi, egy specifikus nézőpont szerinti, a rendszerkutatásban fellelhető, közös vonásokból álló elmélet. 1. Rendszer-fogalom: (Ludwig von Bertalanffy) a rendszer kölcsönhatásban lévő elemek együtteseként értelmezhető [Bertalanffy,1968] •
Elem: fizikai vagy fogalmi entitás, mely kölcsönhatásai révén részt vesz a rendszerhez tartozó új minőségek létrehozásában
•
Elem és rendszer: általános rendszerelméleti fogalom, mely jellemzi, hogy az elemek kölcsönhatása új, a rendszerhez tartozó minőségeket hoz létre
•
Rendszer: kölcsönösen összefüggő, kölcsönhatásban lévő elemek összessége [Bertalanffy,1975]
2. Rendszer-fogalom: (Russell L. Ackoff) [Ackoff,1968] a rendszer kölcsönösen kapcsolatban álló elemek halmaza, a rendszer olyan entitás, mely legalább két elemből áll és egy olyan reláció értelmezett, mely az entitást képező halmaz minden egyes eleme esetében, egy elem és legalább az entitás egy másik eleme között fennáll, azaz a rendszer minden egyes eleme közvetlenül vagy közvetve kapcsolatban áll a rendszer összes többi elemével. (Entitás: valamely dolog tulajdonságainak összessége [Ackoff,1972]) 3. Rendszer-fogalom: a. (Mihajlo D. Mesarovic) a rendszer halmazelméleti értelmezésben egy reláció. Halmaz: bizonyos szempontból összetartozó dolgok összessége [Mesarovic, 1968] Reláció: kapcsolat, viszony, összefüggés, vonatkozás az elemek között [Mesarovic, 1971] b. (V. N. Szadovszkij) rendszernek elemek meghatározott módon rendezett halmazát nevezzük, melyek kölcsönösen összefüggnek egymással és valamilyen totális egységet képeznek [Szadovszkij, 1976] Mindaz ami szükséges a rendszerek feltárásához: •
meg kell határozni a rendszer elemeit és tulajdonságaikat
•
fel kell tárni az elemek közötti kapcsolatokat
•
le kell írni, hogy az elemek és a közöttük fennálló kapcsolatok halmazából hogyan válik rendszer 8
Más meghatározásban (C. West Churchman) a rendszerek olyan alkotóelemek halmazából épülnek fel, amelyek a rendszeren belül a fő célért működnek együtt. A rendszerszemléletű gondolkodás nem más, mint csupán ezekről a teljes rendszerekről és alkotóelemeikről való gondolkodási módszer [Churchman , 1971]. A rendszer a célkitűzések elérésére koordinált elemek halmaza. Mesterséges elemek azok amelyeket emberkéz alkotott egy megvalósítása, működtetése érdekében. Mesterséges elemek (rendszerek) tulajdonságai:
jól
meghatározott
•
Környezetüktől jól elhatárolhatóak
•
Környezetükkel kölcsönhatásban állnak
•
A mesterséges elem meghatározását a rendszer célja adja
Kijelenthetjük: -
rendszer
Természetes rendszerek azok amelyek a funkcióik által definiált, nem célra szervezett rendszerek. Mesterséges rendszerek azok amelyek alapvető jellemzőjük a célra szervezettség. Zárt rendszerek azok amelyek a környezetükkel kifejezetten csak energia kapcsolatot tartanak fenn.
A mesterséges rendszert nem önmagában, hanem a környezetéhez illeszkedő, abban fellelhető és cél szerint determinált elemek halmazaként is értelmezzük. A mesterséges rendszer leírását szolgáló tényezők: A rendszer célja: egyrészt a rendszer teljesítmény késztetője, másrészt a rendszer teljesítményének értékmérője •
A rendszer környezete: az a jelenséghalmaz, amelyre a rendszernek befolyása már nincs, de hatása determinisztikus a rendszer céljaira (minden, ami a rendszeren kívül van)
•
A rendszer vonásai: azon eszközök, melyek a rendszeren belül helyezkednek el és amelyeket a rendszer működése során felhasznál (azon tényezők, melyeket a rendszer környezetétől függetlenül, szabadon válogathat és változtathat meg)
•
A rendszer alkotóelemei: a rendszert jellemző és a rendszer érdekében létrejövő műveletek halmaza, melyek értelmezve vannak a rendszer erőforrásainak működtetésére és a környezettel való együttműködésre egyaránt
Általános rendszerek lehetséges osztályai A struktúráltság és a mozgás típusa szerint állítunk össze egy osztályozást, mely jól mutatja az egyes rendszertípusok viselkedésének lényeges vonásait.
9
• • • •
• • • •
•
Statikus rendszerek - vázak, struktúrák. A vizsgálat számára csak az elemek geometriai elrendeződése érdekes. Dinamikus rendszerek - van anyag- és energiaáramlás. Ide tartoznak a technikai rendszerek - gépek szintje. Szabályzott rendszerek (automaták) - anyag-, energia- és információáramlás (itt már nincs szükség állandó emberi felügyeletre). Adaptív rendszerek (tanuló automaták) - az ilyen rendszerek nemcsak választ adnak a környezet hatásaira, hanem struktúrájuk megváltoztatásával alkalmazkodnak hozzá (adaptív szabályozású szerszámgépek, robotszerkezetek). Regeneratív rendszerek - képesek önmaguk reprodukálására (növények). Reflektív rendszerek - reagálnak a környezetre, az befolyásolja a viselkedésüket (a válasz nem ismétlődések után, hanem azonnal létrejön). Magasabb rendű szervezetek - megjelenik az öntudat - „egyedi ember” szintje. Társadalmi (gazdasági) rendszerek - nagy szervezettségű rendszerek szintje, melyben az egyedi ember társadalmi-gazdasági kapcsolatrendszerben mozog. (Ez már annyira bonyolult, hogy rendszerelméleti eszközökkel nem lehet leírni). Transzcendens rendszerek - földieken túli viszonylatok - még nem ismert rendszerek.
Más, összegező szemlélet szerint, beszélhetünk: • •
Hierarchikus rendszerekről: Alrendszereket, felettes rendszereket, valamint ezek energia- anyag- és információcseréjét foglalja magába. Heterarchikus rendszerekről: Osztott intelligenciájú, hálózatos struktúrájú rendszerek. Ezek mellérendelt viszonylatok jelentenek, amelyben az egyes egységek önálló működésre is képesek.
A technikai rendszerek osztályozása szűkebb körű. Az osztályozás alapját a modellezés során felmerülő megfontolások és korlátozások képezik. A rendszertechnika interdiszciplináris jellegéből következik, hogy sok különféle tudományterületet hoz kapcsolatba egymással (matematika, fizika, kémia, biológia, társadalomtudományok, informatika, muszaki tudományok, stb). A technikai rendszerek térbeli kiterjedésűek, mozgásukat az idő- és helykoordináták határozzák meg (elsődleges az időkoordináta). • •
koncentrált paraméterű rendszerek – viselkedésüket időkoordinátával írjuk le. osztott paraméterű rendszerek - viselkedésüket mind az idő, mind a helykoordináták segítségével le kell írni.
Másik megkülönböztetési szempont a rendszer jelleggörbéje: • •
lineáris karakterisztikájú elemekbol álló rendszerek, nemlineáris karakterisztikájú elemekből álló rendszerek. 10
A lineáris rendszer jellegzetessége a hatások szuperpozíciójának lehetősége (a hatások külön-külön vehetők figyelembe és összegezhetők az elem kimenetén). A reális rendszerek többnyire nemlineárisak, de a modellezés során linearizálhatók a munkapont környezetében. Koncentrált paraméterű rendszerek változói jellemzőjük hogy az elemeinek tulajdonságát fizikai kiterjedés nélküli módon értelmezik. A rendszerelemek viselkedésének leírásakor kétféle változótípussal találkozunk. Az egyik típusú változót az jellemzi, hogy az elemek végződésein mindig azonos értéket mutat, „átfolyik” az elemen anélkül, hogy mérőszámát változtatná (pl. erő, nyomaték, térfogatáram, stb.). Ezeket átmenő változóknak nevezzük. A másik változó jellemzője ezzel ellentétben épp az, hogy az elemek végződésein különböző értékeket vehet fel. Mindig különbségként (relatív referencia) értelmezve rendelhetjük az idealizált elemhez (pl. sebesség, feszültség, nyomás, hőmérséklet, stb.). Ezek a kapocsváltozók, vagy keresztváltozók. A leggyakrabban használt modellek egyik jellemzője, hogy csak időben változó paraméterekkel irjuk le ezeket. Tehát koncentrált paraméterű rendszer modellekről beszélhetünk. Ez egy elfogadott egyszerűsítő eljárás a rendszertechnikában. Egy egyszerűsítő eljárással elemet idealizált elemnek is nevezünk. A reális rendszerek modellezéséhez kialakítható egy általánosítható elemrendszer. Ezek az elemek a modellezés alapelvének megfelelően egy kiemelt, lényeges tulajdonságot tükröznek. Komplex feladatot ellátó alrendszer (alkatrész) esetén gyakori, hogy egy testet több idealizált elem együttese modellez. A rendszerelemek lehetnek aktív vagy passzív elemek. • •
Aktív elemek: segítségükkel - meghatározott módon – energiát lehet a rendszerbe vezetni v. elvezetni. Passzív elemek: tárolhatják, átalakíthatják vagy a rendszer számára elhasználhatatlanná emészthetik az energiát.
Mechanikai rendszerelemek (passzív elemek) tanulmányozásában mint vizsgálati módszer, ki kell jelölni egy referenciapontot vagy referenciafelületet, amihez képest értelmezzük a mozgást vagy erőt. Általánosítva, mondhatjuk, hogy egy referencia rendszert (vonatkoztatási rendszert) rendelünk a rendszerhez a modellezés során. Az egyszer meghatározott vonatkoztatási rendszer szerves resze a létrehozott modellnek, attól elválaszthatatlan. A rendszerek csoportosítása: •
Alkotóelemek száma szerint: o egyszerű rendszer (viszonylag kevés, de legalább két elem, viszonylag kisszámú állapot); o összetett rendszer (több egyszerű rendszer alkotja, kapcsolataik áttekinthetők) o bonyolult rendszer (alkotóelemeik száma és állapota jelentős, kapcsolataik sokrétűek és dinamikusak)
•
Kapcsolat feltárhatósága szerint 11
o determinisztikus (kényszerpályás) o sztochasztikus (valószínűségi) •
Objektíve létezés alapján: o materiális (objektíve , akaratunktól függetlenül léteznek) o absztrakt (az anyagi világ jelenségeinek tükröződései tudatunkban)
•
Működésük szerint: o dinamikus rendszer(működő = elemei a mozgás során hatnak egymásra) o célszerűen vagy nem célszerűen működő rendszerek o statikus rendszer (állapotváltozások sorozata nem valósul meg, nem képesek célok kitűzésére)
Rendszer és környezet kapcsolata szerint: •
zárt (legfeljebb energiakapcsolat)
•
nyílt (soktényezős kapcsolat a külvilággal)
Fejlettségi szint szerint beszélhetünk: •
Statikus kultúrákról (vázak szintje)
•
Egyszerű dinamikus kultúrákról
•
Kibernetikus rendszerekről
•
Önfenntartó struktúrákról
•
Genetikai társadalmakról
•
Állatvilágról
•
Emberekről
•
Társadalomról
•
Transzcendentális rendszerekről
A rendszerek működési vázlatához elengedhetetlenül szükséges: •
Bemenet (I) - a környezet hat a rendszerre. Bemeneti érték: a környezeti hatás jellemző értéke
•
Kimenet (O) - a rendszer hat a környezetére. Kimeneti érték: a környezetre való hatás jellemző értéke
•
Működésmód - az a mód, ahogyan a kimenet a bemenetek alapján létrejön. A transzformáció determinálja. A működéshez legalább egy bemenet és egy kimenet szükséges, de ezek száma elvileg végtelen lehet.
•
Transzformáció: a rendszer elemeinek együttműködési szabályait írja le (a bemeneti értékek hogyan alakulnak kimeneti értékekké) Transzformáció típusai: az algoritmus egyértelmű eljárásai adják, aszerint, hogy a rendszer elemei egy:
Meghatározott rendezettségben működnek együtt. A rendszer 12
működtetője tudatosan szerkeszti meg az algoritmus lépéseit.
Sztochasztikus az elemek egymáshoz való viszonya vagyis működés közben nem teljesen ismert lépéssorozat, de közelítéssel leírható.
Fekete doboz a rendszerben folyó transzformációk ismeretlenek, de a bementei és kimeneti értékek között átviteli függvénykapcsolat írható le (rendszer-identifikáció).
•
Cél: a rendszer működtetése és értékmérője amint már ezt említettem
•
Környezet: egyrészt a rendszer korlátja (felhasználható erőforrás), másrészt a rendszer határait jelöli ki (kimenet iránti kereslet mennyisége és szerkezete).
•
Bemeneti erőforrások: a rendszer adottságaihoz képest dönti el, hogy melyikből mennyit használ fel
•
Alkotóelemek: a rendszer tevékenységei és ezekkel kapcsolatos fogalmak (anyagi részek, céloknak alárendelt mozgásjelenségek oszthatatlan egysége, térbeli és időbeli integrációja)
Mindezek alapján rendszermodellezésről lesz szó a továbbiakban. Amint azt már láttuk, a rendszermodellezés a rendszertechnika egyik alapvető módszere. A következő, erre vonatkozó általános fogalmak ismertetése alapján, majd a jelek fogalmának tisztázása után bemutatok egy pár modell elkészítésének menetét, és akkor megfigyelhető lesz az elvi meghatározások gyakorlati alkalmazása. Rendszerképzés útja: •
egyrészt elméleti, tapasztalati ismeretek segítségével leírásra kerülnek a valóságot jellemző tulajdonságok és viszonyaik
•
másrészt, a tulajdonságok mögött álló fogalmakat úgy alkalmazzuk, hogy közben az általános rendszerelmélet által megjelölt tulajdonságok minden elem azonosításakor érvényt szereznek
Bármely jelenség amelyet vizsgálunk, az objektív valóság része és mint olyan az egészet tételezi fel. Tehát tőlünk függetlenül létezik. Amikor modellezünk, elvonatkoztatunk a rajta kívül lévőktől és így az már csak tőlünk függően létezik. •
A rendszer alkotója valamiféle szakmai ismeret rendezőelve szerint információkat gyűjt, megállapítja a jelenséget leíró tulajdonságok teljes körét
•
Meghatározza a rendszer elemeinek halmazát
•
A rendszer minden eleméhez hozzárendeli összes tulajdonságait
•
A modellben egyesíti a jelenség tulajdonságait a rendszer elemeivel és a tulajdonságok és elemek közötti megfeleltetéssel
Rendszerképző tulajdonságok a következők: Totalizálás (teljesség, összesség) Olyan tulajdonságok megállapítása, melyek alapján leképezhetők a rendszer elemei, ugyanakkor képesek a rendszer általános tulajdonságait is megjeleníteni. 13
Hierarchizálás A rendszer elemei potenciálisan oszthatók, azaz a rendszerelemek maguk is tekinthetők rendszernek és maguk a rendszerek is válhatnak elemekké egy tágabb rendszer feltételezése szerint. Hierarchia Jelentése, hogy a rendszermodell elemei tulajdonságaik szerint egy szigorúan betartott rangsor szerint helyezkednek el Rendezés A modellben érvényesíteni kell, hogy az egyes rendszerelemek számunkra eltérő jelentőséggel bírnak és figyelembe kell venni az időparamétert is. Az elemek kvantitatív és kvalifikatív tulajdonságokat vesznek fel (időben), ezáltal rendezhetővé és strukturálhatóvá válnak. Kvantitatív tulajdonság nem más mint a rendszerelemek mennyiségi meghatározottsága és mérhetősége. Kvalifikatív tulajdonságok azok amelyek rendezési relációt képezhetnek a rendszerelemek halmazán Rendezés lépései: •
Relációértelmezés a rendszerelemek összefüggéseiről
•
Rendezettség megállapítása
•
Rendezőreláció megkeresése
•
Mérőszámok kialakítása
Strukturálás a rendszer elemeinek kapcsolódásokkal érintett tulajdonságainak meghatározása. struktúra (vagyis szerkezet), felépítés, az egymást kölcsönösen meghatározó elemek rendszert alkotó összefüggő egysége amikor ezek a kapcsolódások lehetnek, egy adott pillanatban, aktívak akár inaktívak. Komplexitás a rendszer minőségét, általános viselkedését jellemző fogalom. A komplexitást befolyásoló tényezők: •
a szerkezetet alkotó rendszerelemek száma
•
a rendszerkifejtés
•
a rendszer környezete
•
a kapcsolódások sokasága
•
a kapcsolódás változékonysága
Modellezés fázisai: •
(O) Osztályozási struktúra modellje: megkülönbözteti az alkotóelemeket, azonosítja a rendszer határait és környezetét, definiálja az elemek tulajdon14
ságait és ismereteit •
(S) Statikus viszonystruktúra modellje: rendszerelemek kapcsolatainak összefoglalása
•
(D)Dinamikus viszonystruktúra modellje: időben változó kapcsolatok és azok okozati és hatásösszefüggései
•
Integrált struktúra modellje: az előbbi három {O, S, D} struktúra integrálódása
1.2. Bevezető jelekről A rendszerekkel szorosan összefüggő fogalom a jel fogalma. A rendszerelemek közötti kommunikációhoz kapcsolódó fogalom. A jel általános fogalmáról lesz szó a következőkben. A mindenféle fajta kommunikációban a jeleknek jut a fő szerep. Beszédjeleket továbbítanak a telefonhálózatok vezetékein, míg a mobil telefónia digitális üzeneteit a rádióhullámok térerőssége vezérelt változása közvetíti. Ugyanakkor szélessávú bitfolyamok áramlanak a számítógépek közötti optikai hálózatokon. Az információ közlése, függetlenül az információ valódi természetétől (hang,kép, vagy adat) egy kommunikációs rendszer alapvető feladata, ennek része a jelek átvitele, átalakítása és feldolgozása a megkövetelt szolgáltatásminőség biztosítása végett. Szolgáltatásminőség jelöli azokat a követelményeket (pl. jel-zaj viszony, bit-hibaarány, késleltetés ...stb.), amelyeknek a megbízható információ átvitelnek meg kell felelnie. Az információ fogalma központi szerepet játszik az egyes ember és a társadalom életében, és tudományos kutatásban. Mindennapi életünk minden pillanatában az információ megszerzés, továbbadás, tárolás problémájával vagyunk elfoglalva. Természetesen más és más a jelentése ugyanannak az információnak a különböző felhasználók számára. Hasonlókat mondhatunk az észlelés, tárolás, érték stb. esetében is. Az adott helyzettől függően szubjektíven döntünk, használjuk fel stb. Ezért nem foglalkozunk az információ fogalmával. Az információelmélet szempontjából csak az információ mennyisége az érdekes, mint ahogy adattároláskor is mellékes, hogy honnan jöttek és mit jelentenek az adatok. Csak a célszerű elhelyezésükről kell gondoskodni. Napjainkban már eléggé világos, hogy konkrét tartalmától, megjelenési formájától és felhasználásától elvonatkoztatva beszélhetünk az információ számszerű mennyiségéről, ami éppen olyan pontosan definiálható és mérhető, mint bármely más fizikai mennyiség. Persze mindenkinek van valamilyen többé-kevésbé szubjektív elképzelése az információ mennyiségének fogalmáról, de a köznapi szóhasználatban ez általában az információ konkrét megjelenési formájának terjedelmességéhez, másrészt a hasznosságához és egyéb tulajdonságaihoz kapcsolódik. Ahhoz, hogy jól használható mérőszámot kapjunk minden esetleges vagy szubjektív tényezőtől el kell vonatkoztatni. Ezek közé soroljuk az információ konkrét tartalmát, formáját és mindent, ami a köznyelvben az információ fogalmához kötődik. Ezt a könyörtelen absztrakciót az indokolja, hogy az információ megszerzésével, feldolgozásával, felhasználásával (tárolás, átalakítás, továbbítás) kapcsolatos gyakorlati problémák között nagyon sok olyan is akad, melynek megoldásához (pl. a kívánt berendezés vagy eljárás megtervezéséhez) az információ számos jellemzője közül kizárólag csak a mennyiséget kell figyelembe venni. Az információ fogalma olyan univerzális, annyira áthatja a mindennapi életünket és a tudomány minden ágát, hogy e tekintetben csak az energiafogalommal hasonlítható össze. A két fogalom között több szempontból is érdekes párhuzamot vonhatunk. Ha 15
végigtekintünk a kultúra, a tudomány nagy eredményein, a legnagyobb felfedezéseken, azoknak jelentős részét két világosan elkülöníthető osztályba sorolhatjuk. Az egyik csoportba az energia átalakításával, tárolásával, továbbításával kapcsolatos felfedezések tartoznak. Pl. a tűz felfedezése, a víz és szélenergia felhasználása, egyszerű gépek kostruálása, az elektromos energia hasznosítása stb. Az egyik csoportba az információ átalakításával, tárolásával, továbbításával kapcsolatos felfedezések tartoznak. Pl. az írás, a könyvnyomtatás, a távíró, a fényképezés, a telefon, a rádió, a televízió és a számítógép stb. Számos, az első csoportba tartozó felfedezésnek megvan a párja a második csoportban. Még egy szempontból tanulságos párhuzamot vonni az energia- és az információfogalom között. Hosszú időbe telt, amíg kialakult az energiamennyiség elvont fogalma, amelynek alapján a különböző megjelenési formáit, mint pl. a mechanikai energiát, a hőenergiát, a kémiai energiát, az elektromos energiát stb. össze lehetett hasonlítani, közös egységgel lehetett mérni. Erre a felismerésre és egyben az energiamegmaradás elvének a meghatározására a XIX. század közepén jutott el a tudomány. Az információ fogalmával kapcsolatban a megfelelő lépés csak a XX. század közepén történt meg. Mielőtt rátérnénk az információmennyiség mértékének kialakulására, történetére meghatározzuk, hogy mit is jelent az információ absztrakt formában. Információn általában valamely véges számú és előre ismert lehetőség valamelyikének a megnevezését értjük. Nagyon fontos, hogy információmennyiségről csak akkor beszélhetünk, ha a lehetséges alternatívák halmaza adott. De ebben az esetben is csak akkor beszélhetünk az információmennyiség definiálásáról, ha tömegjelenségről van szó, vagyis ha nagyon sok esetben kapunk vagy szerzünk információt arról, hogy az adott lehetőségek közül melyik következett be. Mindig ez a helyzet a híradástechnikában és az adatfeldolgozásban, de számos más területen is. Az információmennyiség kialakulásához a kezdeteket a statisztikus fizika kutatói adták meg. Ebből adódík a fizikában használatos elnevezés(pl. entrópia). L.Boltzmann (1896), Szilárd L. (1929), Neumann J. (1932). Továbbá, a kommunikációelmélettel foglalkozók: H. Nyquist (1924), R,V.L. Hartley (1928). A hírközlés matematikai elméletét C.E. Shannon (1948) foglalta össze. Már nemcsak az elmélet alapproblémáit fejti ki, hanem úgyszólván valamennyi alapvető módszerét és eredményét tartalmazza. Párhuzamosan fejlesztette ki elméletét N. Wiener (1948), amely erősen támaszkodott a matematikai statisztikára és elvezetett a kibernetikai tudományok kifejlődéséhez. Shannon a következőképpen adta meg az (egyirányú) hírközlési rendszer általános modelljét: forrás ⇒ kódoló ⇒ csatorna ⇒ dekódoló ⇒ felhasználó Látható, hogy meg kell oldanunk a következő problémákat: Az üzenet lefordítása továbbítható formára. Az érkező jel alapján az üzenet biztonságos visszaállítása. A fordítás(kódolás) legyen gazdaságos (a dekódolás is) a biztonság megtartása mellett. Használjuk ki a csatorna lehetőségeit (sebesség, kapacitás). Természetesen ezek a problémák már a tervezési szakaszban felmerülnek. Viszont gyakran kerülünk szembe azzal, hogy a már meglévő rendszer jellegzetességeit, kapacitásait kell optimálisan kihasználni. Számos számítástechnikai példa van arra, hogy a biztonságos átvitel mennyire lelassítja az adatáramlást. Továbbá egy ,,jó" kódolás hogyan változtatja az üzenet terjedelmét, a felhasználás gyorsaságát. Az információelméletet két nagy
16
területre bonthatjuk: az algebrai kódoláselmélet és a Shannon-féle valószínűségszámításon alapuló elmélet. Az információelmélettel foglalkozók a következő három kérdés ‘mennyiségi’ vizsgálatával foglalkoznak: •
Mi az információ?
•
Melyek az információátvitel pontosságának a korlátjai?
•
Melyek azok a módszertani és kiszámítási algoritmusok, amelyek a gyakorlati rendszerek esetén a hírközlés és az információtárolás a megvalósítás során megközelíti az előbb említett pontossági, hatékonysági korlátokat?
Az első próbálkozás egy feladat megoldásához szükséges információmennyiség meghatározásához 1928-ból származik. Ekkor fogalmazta meg Hartley, hogy egy n elemű halmaz elemeinek azonosításához I = log 2 n
mennyiségű információra van szükség. Shannon(1948) a valószínűség és az információ fogalmának összekapcsolásával oldotta meg az események információtartalmának mérését. Shannon szerint egy P(A) valószínűségű A esemény bekövetkezése: 1 I = log 2 P( A ) mennyiségű információt szolgáltat. Meghatározzuk az I(ξ = x ) = log 2
1 P (ξ = x )
(1.2.1)
mennyiséget amelyet a ξ valószínűségi változó x értéke által tartalmazott egyedi információ mennyiségnek nevezzük. A P = {p1 , p 2 , L , p n } eloszlású ξ valószínűségi változó Shannon-féle entrópiájának (1.2.2.) nevezzük a n
H{ξ} = −∑ p i ⋅ log 2 (p i )
(1.2.2)
i =1
mennyiséget. Megjegyzés: A valószínűségi értékek között a 0 is előfordulhat, így problémát okozhat hiszen a logaritmus függvény csak pozitív számokra értelmezett. Ezt azonban megoldja az, hogy az x ⋅ log 2 ( x ) függvény folytonosan kiterjeszthető a nullára, mert lim x ⋅ log 2 ( x ) = 0
x →0 +
lehet defníció szerint. 17
Egy véletlentől függő kimenetelű kísérlet eredménye több-kevesebb mértékben bizonytalan. A kísérlet elvégzésével ez a bizonytalanság megszűnik. A kísérlet eredményére vonatkoző, erdetileg fennálló bizonytalanságot mérhetjük azzal az információmennyiséggel, amit a kísérlet elvégzésével (átlagban) nyerünk. A bizonytalanságot tehát felfoghatjuk, mint információ hiányt, vagy megfordítva: az információt úgy, mint a bizonytalanság megszüntetését. Az információ betöltése ekvivalens a bizontalanság megszüntetésével, azaz: információ betöltés = a-priori bizonytalanság – a-poszteriori bizonytalanság. A fenti gondolatok alapján, az információra a továbbiakban úgy tekintünk, mint egy analóg, vagy digitális adatstruktúrára (pl. analóg beszédjel, vagy digitalizált képjel). A kommunikációs rendszerekben ezen adatstruktúrákat egymásba átalakítják a következő elvek szerint: •
meg kell találni a jelek azon formáját, amelyek inkább alkalmasak az előírt minőségű szolgáltatás megvalósítására
•
ki kell dolgozni azokat a transzformációs algoritmusokat, amelyekkel a jeleket hatékonyan (nagy megbízhatósággal és gazdaságosan) lehet egyik reprezentációból a másikba átalakítani.
Általában a ’megbízható’ átvitel és kezelés megfelelést a kritériumoknak, míg ‘gazdaságosság’ a lehető legkisebb erőforrásigényt (sávszélesség-, vagy processzorigény) jelenti. A jelfeldolgozás, mint tudományos diszciplína a jelek leírásával, és azon absztrakt tulajdonságainak a feltárásával foglalkozik, amelyek megadják, hogy egy adott reprezentáció milyen szempontból optimális. Az anyag tárgyalása során feltételezzük, hogy az olvasó ismeretekkel rendelkezik a matematikai analízis, valószínűségelmélet és lineáris algebra területén. A jelelekkel kapcsolatban a következő területeket probaljuk áttekinteni •
jelek reprezentációja;
•
jelfeldolgozási architektúrák;
•
a jelek legfontosabb tulajdonságai egy kommunikációs rendszer számára (például sávszélesség, redundancia ...stb.)
A jeleket a továbbiakban mint időfüggvényeket kezeljük, feltételezve, hogy az információs folyamatok valamilyen fizikai jellemző időfüggését tükrözik. Fizikailag a jel lehet egy időben változó feszültség egy mikrofon kimenetén, vagy diszkrét feszültségszintek időbeli egymásutánja valamilyen digitális áramkörben. (Még a térbeli állóképi információ is lefordítható időtől függő jellé a kép letapogatásával.) A jelenlegi tárgyalás során azonban ezeket a jelenségeket, a konkrét fizikai tartalomtól független időfüggvények írják le. Úgy a folytonos mint a diszkrét időtartománybeli tárgyalásra gyakran visszatérünk még a jelek tárgyalása során. Az időfüggvény értelmezési tartományának és értékkészletének megfelelően a következő táblázat tartalmazza azokat az elnevezéseket és jelöléseket amelyeket a továbbiakban alkalmazni fogunk:
18
A jel típusa
Jelölés
Analóg jel Mintavételezett analóg jel Digitális jel Analóg véletlen jel (sztochasztikus) Mintavételezett véletlen jel Digitális véletlen jel
x ( t ), x[n ], x[n ], ξ( t ),
0≤t<∞ n = 1,2,L n = 1,2,L 0≤t<∞
ξ[n ], n = 1,2,L ξ[n ], n = 1,2,L
Értelmezési tartomány (idő) folytonos diszkrét diszkrét folytonos
Értékkészlet (amplitúdó)
diszkrét diszkrét
folytonos diszkrét
folytonos folytonos diszkrét folytonos
Az időfüggvénynek meg értelmezési tartománya és értékkészlete ugyanolyan fontossággal bír mint magát a jel matematikai formája. A rendszerek tanulmányozása során a véletlen jelek leírása is fontos, hiszen az információ alapvetően az átvitt üzenetekben szereplő "véletlenség" mértékével azonosítható . Mivel például a modern kommunikációs rendszerekben az információt bináris sorozatokban (gyakran csomagokba szabdalva) továbbítjuk, az ilyen rendszerek vizsgálatánál a következő kérdések merülnek fel: •
Hogyan lehet az eredendően analóg információt (pl. kép, zene, beszéd) digitálissá alakítani?
•
Mekkora információveszteség lép fel egy ilyen átalakítás során?
•
Milyen tartományban érdemes a jeleket leírni egy kommunikációs rendszerben, azaz milyen matematikai leírás "illeszkedik" az átvitel fizikai természetéhez (pl. az idő-, vagy frekvencia-tartománybeli leírás...stb.)?
•
Mi a jelek optimális (legrövidebb) reprezentációja (pl. hogyan lehet multimédiás adatfolyamokat keskenysávú csatornákhoz illeszteni, a legtömörebb reprezentáció kiválasztásával)?
Egy jelfeldolgozási feladat a bemeneti jelnek - egy meghatározott algoritmus szerint végrehajtott - transzformációját jelenti a kimeneti jelbe. hogy mind az analóg, mind a digitális jelfeldolgozás fontos szerepet tölt be a modern kommunikációs technológiákban. Annak ellenére, hogy CPU alapú eszközök (PC-k, vagy Work Station-ok), valamint DSP-k széleskörűen elterjedtek az információ digitális feldolgozására, ezen eszközök sebessége néha kritikus ponttá válhat a gyors rendszerkommunikáció során. Ezért a jelfeldolgozás újszerű megközelítései (analóg számítási trajektóriák), amelyek analogikus chip-en implementálhatók, vonzó alternatívái lehetnek a hagyományos digitális rendszereknek, ha a sebesség további növelése a cél. A jelek használata esetében ismerni kell bizonyos fogalmakat amelyek elengedhetetlenek az elkövetkezők megértésében. Itt felsorolunk néhányat ezek közül a fogalmak közül. A. Csillapítási tényező
Ha valamely elektronikus alkatrész, vagy adatátviteli összeköttetés kimenetén a jel amplitúdója kisebb, mint a bemenetére adott jelé, azt mondjuk, hogy csillapítás lépett 19
fel. Definíció szerint a csillapítás a kimenő és a bemenő teljesítmény hányadosa. A csillapítást az áramkörök belsejében levő veszteségek okozzák. B. Decibel-skála
A csillapítást decibel-ben szokás megadni. A decibel-skála két teljesítmény arányának (P1/P2) logaritmikus skálán való kifejezése (Cs-csillapítás, P1 -kimenő teljesítmény, P2 -bemenő teljesítmény). Ezzel a csillapítás: Cs [dB] = 10 ⋅ lg(
P1 ) P2
(1.2.3)
vagy, mivel a teljesítmény a feszültség négyzetével arányos:
Cs [dB] = 20 ⋅ lg(
P1 ) P2
(1.2.4)
A két teljesítmény hányadosával kifejezett mennyiségnek nincs mértékegysége, vagy más szóval dimenziója. A decibel (dB) definíció szerint ezen hányados logaritmusa. Ha a mért teljesítményt az 1mW-hoz viszonyítjuk (kimenő teljesítmény =1mW), az eredményt dBm-mel jelöljük. A kommunikációs rendszerekben az erősítést és a csillapítást decibelben adják meg. Ha a P1/P2 teljesítmény arányának logaritmusa pozitív (P1/P2>1), akkor a rendszer erősít, ha negatív (P1/P2<1), akkor csillapít. A következő táblázat tartalmaz néhány teljesítmény arányt dB-ben és százalékban kifejezve.
dB
P1 P2 5
dB
P1 P2
%
0 −1 −3
1 0.79 0.5
100 79.4 50
1.99 199 − 10 0.1 1.26 126 − 50 10 −5
10 0.001
%
50 10 10 7 10 10 10 3 6 3.98 398 3 1
C. Zaj és a jel/zaj viszonyszám
Minden olyan jelet, ami nem része az információnak, a kommunikációs összeköttetésben zajnak tekintünk. A zaj forrása lehet természetes eredetű, vagy lehet mesterséges, valamilyen emberi tevékenység. A természetes zajforrások lehetnek a rendszeren kívüliek, mint pl. a Nap, a kozmikus sugárzás, de keletkezhet zaj magában a rendszerben is, pl. az ellenállások, vagy a félvezetők termikus zaja. Mivel a zaj erősen befolyásolja a kommunikációs rendszer információátvivő képességét, nem csoda, hogy az adatátviteli technikában ez a leggyakrabban tárgyalt témakör.
20
A jel/zaj viszonyszám A kommunikációs rendszerekben nem a zaj abszolut értéke, hanem annak a hasznos jel teljesítményéhez való viszonya a döntő tényező. Ezért hasznos definiálni a jel/zaj viszonyszámot, ami a jel és a zaj teljesítményének a hányadosa. A jel/zaj viszonyszámot, vagy jel-zaj viszonyt szintén decibelben fejezzük ki. Valamely áramkör, vagy berendezés kimenetén és bemenetén mérhető jel/zaj hányados a rendszer zajosságára jellemző. Az angol terminológiában ezt noise figure-nek (NF) nevezik. jel zaj NF = jel bemeneti zaj kimeneti
(1.2.5)
Ha az NF értéke 1, azt jelenti, hogy a rendszer nem termel zajt. Ha egynél kisebb, a rendszer zajos. Ezek alapján úgy tekintjük a jeleket mint információhordozókat.Tágabb értelmezésben tekinthetjük úgy is mint valós változójú valós függvényt vagy akár más általánosabb relációt. Egy rendszer egyes elemei között, vagy különböző rendszerek között olyan kapcsolatok vannak, amelyeken keresztül kölcsönhatásban állnak egymással. Ezek a kapcsolatok az energia vagy az anyag átadásást jelenthetik az egymásra ható elemek vagy rendszerek között. A kapcsolatok azonban olyanok is lehetnek, hogy információtartalmuk lesz lényeges, azaz azok az ismeretek, amelyeket az elem vagy a rendszer más rendszerek vagy elemek állapotáról kap, vagy a saját állapotáról közöl. Ekkor az ismereteket hordozó anyagi forma csak másodrangú jelentőségű lesz. A most következő 1.2.1 ábra valós időben mért jeleket jeleket ábrázol. Az ECG és EEG jelek biológiai jelek és látható, hogy az ideálizált jelektől eltérően sok zajt is tartalmaznak. Ezek a biológiai jelek nagyon komplex jelek, és legtöbbször az információtartalmára csak empirikus módon következtethetünk.
1.2.1 ábra 21
Az 1.2.2 ábrán két, a szakirodalomból vett, áttekinthetőbb jelet látunk. Az első egy nagyon egyszerű és lassú szabályzást (éjjel/nappal- ciklussal) míg a második a hálózati 50Hz-és 220V-s jelet (effektív érték) mutatja.
1.2.2 ábra A mindennapi életben még nagyon sokféle jellel találkozhatunk. Az újabb méréstechnikai eljárások megjelenése egyre összetettebb jelek mérését, rögzítését is jelenti. Gondoljunk itt a világűrből kapott (természetes mesterséges) jelekre, a repülőgépek fekete dobozának adathalmazára, 3D képfeldolgozást igénylő jelekre. Az információ kinyerése alapvető dolog bármely jel esetében. A jelfeldolgozó eljárások is hasonló ütemben fejlődnek. Olyan újabb tudományterületek fejlődtek ki mint Térfrekvencia analízis, olyan alfejezetekkel mint Wavelet transzformáció vagy Chirpslet transzformáció. 1.3. Vezérlés, szabályozás
A rendszer nem más mint egy olyan térben elhatárolt rész, ahol anyag és energiaformák elemeit kölcsönhatások és kölcsönös összefüggések kapcsolják egységes egészbe. A rendszer tanulmányozása során figyelembe kell vegyük a környezet hatását a rendszerre. Egy dinamikus rendszer (állapotváltozásai nem egy pillanat alatt zajlanak le, hanem egy átmeneti folyamat eredménye) működésének három alapvető módja van: egyensúlyi vagy állandósult, átmeneti és periodikus. Az egyensúlyi üzemmódban van, ha állapota nem változik időben. A rendszeranalízis azt vizsgálja, hogy ha a rendszer felépítése és paraméterei előre adottak, akkor ezekből kiindulva, hogyan állapítható meg a rendszer viselkedése és tulajdonságai. A rendszer tulajdonságait meghatározhatjuk akár kísérleti úton nyert adatok feldolgozásával (identifikáció), akár a rendszer működésének számítógépen végzett lejátszása és feldolgozása során (szimuláció). A rendszer egyes elemei között, vagy különböző rendszerek között olyan kapcsolatok vannak, amelyek biztosítják ezek kölcsönhatását. Ezek a kapcsolatok az energia vagy az anyag vagy akár információ átadását jelentik az egymásra ható elemek vagy rendszerek között. A kapcsolatokban az információtartalom is lényeges lehet, azaz azok az ismeretek amelyeket a rendszer vagy elem a más elemek vagy rendszerek állapotáról kap, vagy a saját állapotáról közöl. Ekkor az információhordózó jel csak másodrangú jelentőségű lesz. A rendszerben áthaladó hatásokat, amelyek információs kapcsolatokat valósítanak meg jeleknek nevezzük. A jelek legfontosabb tulajdonsága az információtartalom, az energiaszint nagysága csak másodlagos jelentőségű. Jelhordozó lehet minden mérhető állapothordozó (fizikai, kémiai stb.) Egy rendszer szervezett és érdekeinknek 22
megfelelő működését és változásait irányító hatások alkalmazásával lehet fenntartani és megvalósítani. Azokat a rendszereket amelyekben az irányító hatások kialakításához nem használjuk a rendszer állapotváltozásainak az irányítás folyamán felvett és az érzékelők által mért értékeire vonatkozó információt, nyíltláncú irányító rendszernek nevezzük.
1.2.3. ábra Az irányító berendezés (szabályzó) és irányított rendszer kölcsönhatása egy beavatkozó szerven keresztül történik. Ez látható az 1.2.3. ábrán. Azokat a rendszereket, amelyek esetében az irányító hatások kialakításához felhasználjuk az irányított rendszert jellemző értékekre vonatkozó információt, zártláncú irányítási rendszernek nevezzük. A zártláncú irányítási rendszereket szabályzónak is nevezzük. A szabályzás leggyakrabban alkalmazott típusa a hibajelre alapozott szabályzás. A szabályozás működési vázlatát az 1.2.4. ábrán láthatjuk. A szabályzásban az alapvető ítéletalkotási művelet a különbségképzés. Az irányítani kívánt mennyiséget olyan mértékben befolyásoljuk, amilyen mértékben eltér az előírt értéktől. A szabályozási folyamatra a szabályozott jellemző visszahat a zárt láncon keresztül (a negatív visszacsatolás a szabályozott szakasz egyensúlyának visszaállítására szolgál, ha külső hatásra elmozdul onnan). A zaj hatását és a modellkészítésben itt most nem tárgyaljuk. A zaj mindig mint sztochasztikus jel vesz részt egy modell elkészítésében.
1.2.4. ábra A szabályozási feladatoknál két típusról beszélhetünk (a zavaró hatások ellenére): • értéktartó (stabilizáló) szabályozás és • követő (szervó) szabályozásról A szabályzó rendszerek elmélete és ezek tervezési eljárási nem tartoznak 23
ennek a könyvnek a tematikájához. Irányítástechnikai problémák ritkábban fordulnak elő mint szabályozástechnikai eljárások. A modern rendszerelmélet, rendszertechnika fontos fejezete az intelligens rendszerek, alrendszerek használata. Itt a mesterséges intelligencia rendszer fogalma alatt azon rendszert értjük amelyet nem a klasszikus matematikai eszközökkel modelleznek, képesek tanulni és ezáltal önállóan, bizonyos fajta intelligens döntéseket hozni. Nagy jövő áll a hibrid (klasszikus megközelítés és a mesterséges intelligenciára épülő) szabályzó rendszerek előtt. A mesterséges intelligencia fogalma, fajtái, alkalmazása nem tartozik ennek a könyvnek a témái közé.
24
2. Jelek rendszerelméleti megközelítésben A jelek és rendszerek fizikai természete a legkülönbözőbb lehet. A jelek egy vagy több független változójú függvények (relációk, disztribúciók), információt hordoznak a jelenségek működéséről és természetéről. A rendszerek specifikus bemenő jelekre adott módon, egy kimenő jellel válaszolnak. Egy elektromos áramkörben az időfüggő áramerősség vagy feszültség jelek, míg maga az áramkör a rendszer. Egy autó esetében amely a rendszer, a bemenő jel (gerjesztő jel) lehet a gázpedálra kifejtett nyomás míg a válaszjel az autó gyorsulása. Egy elektrokardiogramot, mint bemenő jelet feldolgozó számítógépes program a rendszer míg a kimenet a szív működését jellemző diagnózis. Egy fényképezőgép mint rendszer, előállítja a kimenő jelet ami a fénykép a bemenő jelből ami ebben az esetben a rendszerbe bejutó fény. Ezekből a példákból láthatjuk, hogy egy általános rendszert a 2.1. ábrán látható módon ábrázolhatjuk [I –bemenő jelé O -kimenő jel]:
2.1. ábra Sokféle probléma vár megválaszolásra a rendszerekkel kapcsolatban. Sok esetben elemezni kell a rendszert, hogy megállapíthassuk, hogy miként fog viselkedni különböző bemenő jelekre. A rendszerekre vonatkozó általános meggondolásokról a könyv bevezető fejezetében olvashatunk. Máskor elemzés helyett, tervezni akarunk egy olyan rendszert amely egy elvárt módon fogja átalakítani a bemenő jelet. Erre példa a különböző szűrők (mint például a képjavító műveletek). Egy nagyon fontos fejezet a jelek és rendszerek esetében az amikor a rendszer paramétereit akarjuk módosítani akár a bemenő jelek segítségével akár egy megtervezett és hozzákapcsolt szabályzó (rendszer) segítségével. Itt bevezetjük a szabályozó rendszer felépítését. A 2.2. ábrán használt jelölések: • • • • • •
t – idő mint független változó u(t) – előírt bemenő érték (jel) e(t) – hiba (e(t)=u(t)-y(t)), néha ε (t ) jelölésben is y(t) – kimenő érték (jel) ν(t) – zaj v(t) – a szabályzó kimenő értéke
2.2. ábra 25
Különféle szabályzó rendszerek elengedhetetlen kellékei a mindennapi életünknek. Ebben a könyvben a jelek és rendszerek leírásával, jellemzésével, tanulmányozásával fogunk foglalkozni és nem a szabályzók osztályozásával, tervezésével. A kommunikációs rendszer egy másik fontos példa a rendszer fogalmára. Egy ilyen összetett rendszer üzenetet továbbít. Üzenet alatt információt értünk. Egy ilyen rendszer bemenő jelére (JEL1) rátelepítjük az információt amelyet továbbítani akarunk. Az így kapott, az információval modulált jelet a kommunikációs rendszer adója a kommunikációs csatornán (CSATORNA) át eljuttatja a vevőhöz amely leválasztja az információt a hordozó jelről és ez lesz a kimenő jel (JEL2). A továbbító csatorna módosíthatja is a hordozó jelet. A 2.3. ábra ezt az elvet szemlélteti. Ha valamelyik eleme ennek a rendszernek nem működik akkor az információt nem lehet továbbítani. A zaj ismerete fontos minden rendszerben mert jelen van és majdnem minden esetben információvesztést eredményezhet A rendszer optimális működése nem módosíthatja a továbbított információmennyiséget.
2.3. ábra Az időt mint változót független változónak tekintjük. Minden jel időben változó mennyiség. A jel lehet időben folytonosan változó, vagy csak diszkrét időpillanatokban létező mennyiség. Az elkövetkezőkben a következő jelöléseket fogjuk használni x(t): R → R
egy valós változójú (idejű) valós jel
x [n ] : Z → R diszkrét idejű jel • • • • •
Egy jelet diszkrét idejű jelnek nevezünk, ha az csak diszkrét időpillanatokban vesz fel értéket. A diszkrét idejű jelek megadhatók véges vagy megszámlálhatatlanul végtelen sok jel sorozataként. Egy jelet folytonos idejű jelnek nevezünk, ha az minden t időpillanatban felvesz egy értéket. Egy jel determinisztikus ha minden kívánt időpontban pontosan, vagy kellő pontossággal ismert. Egy jel sztochasztikus ha a jel nem határozható meg pontosan minden időpillanatban, hanem csak stasztikus tulajdonságai ismertek (átlagérték, szórás, stb.) Egy jel bemenő jel ha értéke, t illetve n negatív értékeire azonosan nulla.
2.1. A jelek modelljei
A. Sztochasztikus jelmodell
26
A kísérletet közel azonos körülmények mellett megismételve látszólag véletlenszerű eredményt kapunk. Valójában nem tudunk, vagy nem akarunk minden lényeges körülményt számba venni. A jelmodell = {x; x(t , ξ ), t ∈ T , ξ ∈ Ω} . Ennek alábbi két értelmezését adhatjuk: •
Véletlenszerű eseménytér elemei generálják a folyamat egy-egy realizációját. Maguk a (a stochasztikus folyamatok) realizációi konkrét időfüggvények (determinisztikus jelek).
•
A sztochasztikus folyamat felfogható úgy is, mint egy olyan jel, amelynek időbeni mintái valószínűségi változók. A minták időpontról időpontra változó sűrűségfüggvényűek lehetnek, valamint vizsgálható együttes sűrűségfüggvényük, mint a mintavételi időpontok függvénye.
Két valószínűségi változó korrelációját felírhatjuk mint: E{x , y} = ∫∫ f xy ( x , y) ⋅ x ⋅ y ⋅ dx ⋅ dy , ha x és y korrelálatlan, akkor
E{x , y} = E{x} ⋅ E{y} . •
Stacionárius szochasztikus folyamat autokorreláció függvénye R (τ) = E{x ( t ), x ( t + τ)} ami azt mutatja, hogy a jel az időbeni eltolással szemben invariáns (R nem függ t-től)
•
Ergodikus az a jel ha az időbeli átlag felcserélhető a sokaság szerinti átlaggal (példa: tökéletes dobókockák közül választok és dobok egy sorozatot, ellenpélda: tökéletlen dobókockákkal teszem ugyanezt).
: 2.1.1. ábra
B. Determinisztikus jelmodell Egy kísérletet azonos körülmények mellett megismételve azonos eredményt kapunk. (közelítés) és egy konkrét függvény írja le a (mért) jelet. •
periodikus jel vagyis x ( t ) = x ( t + T) ∀t -re, létezik a Fourier sora (lásd később); időben végtelen jel, nem véges energiájú.
27
•
kvázi periodikus: szinuszos összetevőkre bontható, de a frekvenciák aránya nem racionális szám, nincs véges T ; időben végtelen, nem véges energiájú jel
•
tranziens: nem periodikus, véges jelenergia, ("általában" bizonyos időtartón kívül eltűnik a jel)
Mindezeket összefoglalhatjuk a 2.1.1. ábrán Az elkövetkezőkben a determinisztikus jelekről lesz szó. Úgy tekinthetjük a jeleket mint információhordozókat. Tágabb értelemben tekinthetjük mint egy valós változójú valós függvényt de ez az értelmezés változhat a különböző osztályzási esetekben. Az elkövetkezőkben a következő jelölést használjuk: • C – a komplex számok halmaza • R – a valós számok halmaza • Q - a racionális számok halmaza • Z – az egész számok halmaza • N - a természetes számok halmaza Ezek alapján felírhatunk egy pár fontosabb jelet:
•
x(t): R → R egy folytonos valós jel (folytonosság nem a pontos matematikai értelemben) x [n ] : Z → R egy diszkrét jel
•
x [n ] : Z → Z egy diszkrét jel kalibrálás után
•
2.2. A jelek osztályozása
A. Folytonos és diszkrét idejű jelek:
vagyis
x(t): R → R
2.2.1. ábra A 2.2.1. ábrán egy valós idejű (változójú) valós jel grafikus ábrázolása látható.
vagyis x [n ] : Z → R 2.2.2. ábra 28
A 2.2.2. ábrán egy diszkrét idejű (változójú) valós jel grafikus ábrázolása látható. Itt a diszkrét jel x[n ] = x[n ⋅ Ts ]; n = 0,±1, ± 2, L Megjegyzés:
• •
( ) zárójelek egy folytonos jelet jelent [ ] zárójelek egy diszkrét jelre utal a továbbiakban
B. Páros és páratlan jelek Egy x(t): R → R folytonos jel esetében: • •
A jel páros, ha x (− t ) = x ( t ) ∀t esetében az értelmezési tartományból A jel páratlan ha x (− t ) = − x ( t ) ∀t esetében az értelmezési tartományból
Példa ⎧⎪sin( π⋅t ) ha − T ≤ t ≤ T T egy páratlan x(t) = ⎨ ⎪⎩0 ha máshol Bármely x(t): R → R jel felbontható egy páros és páratlan összetevő összegére, vagyis x ( t ) = x páros ( t ) + x páratlan ( t )
ahol x páros ( t ) = 12 ⋅ ( x ( t ) + x (− t )) = x e x páratlan ( t ) = 12 ⋅ ( x ( t ) − x (− t )) = x σ
Példa Adott x ( t ) = e −2⋅t ⋅ cos( t ) ⇒ x e ( t ) = ch (2 ⋅ t ) ⋅ cos( t ) x σ ( t ) = −sh (2 ⋅ t ) ⋅ cos( t ) Ha x(t): C → C akkor a jel konjugált szimmetrikus ha: x (− t ) = x ∗ ( t ) ahol az ∗ szimbólum a komplex konjugált operátor. Ha a komplex jel valós része a(t) és a képzetes része b(t) akkor ezeket a 2.2.3. ábrán látjuk:
2.2.3. ábra Ez egy konjugált szimmetrikus jel.
29
C. Periodikus jel Egy x(t): R → R folytonos jel periodikus ha x ( t ) = x ( t + T); ∀t ∈ R esetében ∃! T > 0 ahol T véges, konstans érték. A ∃! logikai kvantifikátor jelentése ’létezik egy és csakis egy’. Ezt a T értéket alap periódusnak nevezzük. Ebben az esetben
• •
1 az alapfrekvencia és a mértékegysége [Hz] és T rad 2⋅π ω = 2⋅π⋅ν = a körfrekvencia és a mértékegysége [ ] s T ν=
2.2.4. ábra A 2.2.4. ábrán látható folytonos jel egy nem periodikus jel, míg
2.2.5. ábra A 2.2.5. ábrán látható folytonos jel periodikus és T = 0.2 s ν = 5Hz ω = 10π rad . s
Minden esetben figyelembe kell venni, úgy a negatív, mint a pozitív végtelenbe tartó irányba, az ábrán alkalmazott • • • jeleket amelyek jelentése a folytatólagosság azokba az irányokba (akár periodikus is). De ugyanezt a jelölést használom a két végtelen fele való kiterjesztés érzékeltetésére is. Egy x [n ] : Z → R diszkrét jel periodikus ha ∀n ∈ Z esetében létezik egy legkisebb 2 ⋅π [rad ] a pozitív, véges N egész szám amelyre x[n ] = x[n + N] . Ekkor Ω = N körfrekvencia.
30
Példa Tanulmányozzuk a következő diszkrét jel periodikus voltát.
2.2.6. ábra a 2.2.6. ábrán látható jel periodikus és N = 8 és Ω =
π
. Ez egy diszkrét változójú 4 diszkrét jel ha a jel amplitúdója eleme a {-1,1} halmaznak és egy diszkrét változójú valós jel ha az amplitúdója eleme az R halmaznak.
D. Determinisztikus jel Egy jel determinisztikus, ha leírásához nem szükséges valószínűségi változót is figyelembe venni. A rendszerek leírása során általában a zaj modellezésére használnunk kell egy nem determinisztikus leírási módszert tekintve a zaj természetét. E. Valószínűségi jel (sztochasztikus jel) A valószínűségi (sztochasztikus) folyamatokat a rendszerelméletben véletlenszerű zavarok, zajok modellezésére használjuk. Egy x:T x Ω → R reláció a valószínűségi történést leíró leképezés. Itt x(.,.) egy valószínűségi változó. T egy időhalmaz és ha részhalmaza a valós számok halmazának, ekkor folytonos valószínűségi rendszerről van szó. Ha T eleme az egész számok halmazának akkor diszkrét valószínűségi rendszert értelmeztünk. Értelmezések: • • • •
x (., ω0 ) egy determinisztikus függvény, ahol ω0 egy rögzített érték, realizációnak nevezzük. x ( t 0 ,.) egy rögzített t 0 -val egy valószínűségi változó x ( t 1 ,.) jelöljük x(t)-vel és ez az x sztochasztikus folyamat által t rögzítésével generált valószínűségi változó. Egy valószínűségi folyamat egyértelműen megadható valamennyi véges dimenziós eloszlásfüggvényével. Egy sztochasztikus folyamat véges dimenziós eloszlásfüggvénye a következő ahol P a valószínűségfüggvény:
31
• •
F(ς1 , L , ς n ; t 1 , L, t n ) = P{x ( t 1 ) ≤ ς1 , L , x ( t n ) ≤ ς n } Gauss vagy normális a folyamat ha a folyamat valamennyi véges dimenziós eloszlásfüggvénye normális eloszlásfüggvény. Az x folyamat várható érték függvénye a ∞
m x ( t ) = E{x ( t )} =
∫ y ⋅ f x ( y, t ) ⋅ dt
−∞
•
• •
ahol az f x ( y, t ) x folyamat által generált valószínűségi változó sűrűségfüggvénye (az eloszlásfüggvény deriváltja) Egy valószínűségi folyamat (autó)kovariancia függvénye rxx (s, t ) = Cov{x (s), x ( t )} = E{( x (s) − m(s)) ⋅ ( x ( t ) − m( t )) τ } ahol m(s) az x(t) a valószínűségi változó várható értéke, míg a τ a transzponálás művelete Megjegyzés: m x egy determinisztikus időfüggvény, míg rxx egy determinisztikus kétváltozós függvény Az x valószínűségi folyamat stacionárius, ha valamennyi x(t1 ), x(t 2 ),L, x(t n ) eseménysornak megfelelő véges dimenziós eloszlásfüggvénye bármely T esetén megegyezik az x(t1 + T ), x(t 2 + T ),L, x(t n + T ) eloszlásfüggvényével. A folyamat gyengén stacionárius, ha csak az eloszlásfüggvények első két momentuma ( m x , rxx ) bármely T-re megegyezik, azaz m( t ) = 0; rxx (s, t ) = rxx ( t − s)
•
Az
•
Legyen e = {e[k ], k = L,−1,0,1,2,L} diszkrét fehér zaj. Akkor az ebből képzett y = {y[k ]} k ∈ Z folyamat amelyre igaz a következő egyenlet
e = {e(θ)} | θ ∈ R valószínűségi folyamat fehér zaj folyamat, ha azonos eloszlásfüggvényű, független valószínűségi változók sorozata A fehér zaj teljesítményspektruma egyenletes oszlik meg egy adott frekvenciasávban, csak az elméleti (ideális) fehér zaj esetében igaz, hogy a teljes frekvenciatartomány azonos energiamennyiséget hordoz. Tulajdonságaik: - stacionárius folyamat (általában m(t) = 0 feltételezésével) - kovarianciafüggvénye a valós változó esetében ⎧⎪σ 2 t = 0 ree ( t ) = Cov{e(s), e(s − t )} = ⎨ ⎪⎩0 t = ±1, ± 2,L - nem feltétlenül normál (Gauss) folyamat
y[k ] = e[k ] + b1 ⋅ e[k − 1] + b 2 ⋅ e[k − 1] + L + b n ⋅ e[k − n ] = B* (z −1 ){e[k ]} egy MA mozgóátlag folyamatnak nevezzük. Az MA folyamat várható értéke m y ( t ) = 0 és
ryy (0) = 1 + b12 + b 22 + L + b 2n ryy (1) = b1 + b1 ⋅ b 2 + b 2 ⋅ b 3 + L + b n −1 ⋅ b n
32
•
Az e = {e[θ]} | θ ∈ Z valószínűségi folyamattal az AR autoregressziós folyamat a következőképpen irható le: y[k ] + a 1 ⋅ y[k − 1] + L + a n ⋅ y[k − n ] = A * (z −1 ){y[k ]} = e[k ] A külső bemenettel rendelkező autoregressziós mozgóátlag folyamat (ARMAX) egy AR és egy MA folyamat lineáris kombinációja egy külső u = {u[k ])} | k ∈ Z jellel A * (z −1 ){y[k ]} = B* (z −1 ){u[k ]} + C* (z −1 ){e[k ]} (2.2.1) ahol A * (z −1 ) = 1 + a 1 ⋅ z −1 + L + a n ⋅ z − n B* (z −1 ) = 1 + b1 ⋅ z −1 + L + a m ⋅ z −m C* (z −1 ) = 1 + c1 ⋅ z −1 + L + c n ⋅ z −n
•
Itt a z −1 egy transzláció operátor és visszatérek rá a Z-transzformáció tárgyalása során. Reprezentációs tétel: Minden véges első és második momentummal ( m x , rxx ) rendelkező x = {x[k ]} | k ∈ Z diszkrét sztochasztikus folyamat felírható ARMA formában a következőképpen: A * (z −1 ){x[k ]} = B* (z −1 ){e[k ]} ahol {e[k ]} | k ∈ Z fehér zaj folyamat (nem feltétlenül Gauss) és A * (z −1 ) stabil míg B* (z −1 ) pedig nem instabil operátor. Innen következik, hogy minden stacionárius, diszkrét idejű x = {x[k ]} | k ∈ Z sztochasztikus folyamat tekinthető úgy, mint egy H(z) =
B* ( z )
átviteli függvénnyel (operátorral) rendelkező, fehér A * (z) zaj bemenetű LTI rendszer kimenete. • Egy diszkrét idejű LTI SISO sztochasztikus ki-bemeneti modellek általános alakja a következő ARMAX folyamat: A(z){y[k ]} = B(z){u[k ]} + C(z){e[k ]} (2.2.2) ahol A(z) = z n + a 1 ⋅ z n −1 + L + a n B(z) = b 0 ⋅ z m + b1 ⋅ z m−1 + L + b m A(z) = z n + c1 ⋅ z n −1 + L + c n E. Energiajel, teljesítményjel
Legyen x(t): R → R egy folytonos jel. A jel teljes energiáját kiszámíthatjuk mint: T 2
∫x T →∞
E = lim
2
∞
( t ) ⋅ dt =
− T2
∫x
2
( t ) ⋅ dt
(2.2.3)
−∞
A jel átlagteljesítményét kiszámíthatjuk mint: 1 P = lim T →∞ T
T 2
∫x
2
( t ) ⋅ dt
(2.2.4)
− T2
33
Ha az x(t) jel periodikus akkor 1 P= T
T 2
∫x
2
( t ) ⋅ dt
(2.2.5)
− T2
A folytonos jel esetében meghatározzuk az RMS operátort, vagyis RMS( x ( t )) = P (root mean square). Ez pedig nem más mint a négyzetes középértéke a teljesítménynek (effektív értéke). Egy x [n ] : Z → R egy diszkrét jel esetében a jel teljes energiáját az E=
∞
∑ x 2 [n ]
(2.2.6)
n = −∞
összefüggés adja. Az átlagteljesítménye pedig: N 1 P = lim ⋅ ∑ x 2 [n ] N →∞ 2 ⋅ N n =− N
Ha a jel periodikus és alapperiódusa N, akkor az átlagteljesítmény: N 1 P= ⋅ ∑ x 2 [n ] 2 ⋅ N n =− N • •
(2.2.7)
(2.2.8)
Egy jel energiajel ha a teljes energiájára igaz, hogy: 0 < E < ∞ Egy jel teljesítményjel ha átlagteljesítményére igaz: 0 < P < ∞
Az energiajel és teljesítményjel kölcsönösen kizárják egymást (tehát egy energiajel nem lehet teljesítményjel és fordítva). Egy energiajel átlagteljesítménye zéró, míg egy teljesítményjel energiája végtelen. Megjegyzendő, hogy a periodikus és sztochasztikus jelek általában teljesítményjelek, míg a nem periodikus determinisztikus jelek lehetnek energiajelek. Minden jelnek, amelynek véges a teljes energiája, annak zéró az átlagteljesítménye. Minden jelnek amelynek véges az átlagteljesítménye annak végtelen a teljes energiája. A legtöbb jel se nem energiajel, se nem teljesítményjel (x(t)=t, t ∈ [0, ∞) ). Példa
Számítsuk ki a következő folytonos jel átlagteljesítményét.
2.2.7. ábra A 2.2.7. ábrán látható, hogy a jel egy folytonos periodikus jel, a periódusa pedig T = 0.2s Az átlagteljesítményt kiszámítjuk mint: 34
0.1
P=
0.1
0
1 1 1 ⋅ ∫ x 2 ( t ) ⋅ dt = ⋅ ∫ 12 ⋅ dt + ⋅ ∫ (−1) 2 ⋅ dt = 1 0.2 −0.1 0.2 −0.1 0.2 0
Példa
Számítsuk ki a következő folytonos jel teljes energiáját.
. 2.2.8. ábra A 2.2.8. ábrán látható folytonos, nem periodikus jel teljes energiája: ∞
E=
∫A
2
⋅ dt =
T 2
∫A
2
⋅ dt = A 2 T
− T2
−∞
Példa
Számítsuk ki a 2.2.9. ábrán látható nem periodikus diszkrét jel teljes energiáját ha tudjuk, hogy a nem zéró diszkrét komponensek amplitúdója egységnyi.
2.2.9. ábra A jel teljes energiája E=
∞
∑ x[n ] = 1 + 1 + 1 = 3
n = −∞
2.3. Alapműveletek jelekkel
A. Amplitúdó módosítás skálázással
Adott egy folytonos jel, x(t): R → R . Ha egy amplitúdó skálázást alkalmazunk akkor egy újabb valós változójú, valós függvényt kapunk vagyis y( t ) = c ⋅ x ( t ) jelet. Az alkalmazott c együttható eleme a valós számoknak. Egy függvény valós számmal való szorzása minden tulajdonsága igaz ebben az esetben is. Egy példa látható a következő 2.3.1. ábrán. Itt a c együttható pozitív, egynél kisebb valós szám.
35
2.3.1. ábra Ha most egy diszkrét x [n ] : Z → R jel esetében alkalmazzuk, egy y[n ] = c ⋅ x[n ] jelet kapunk. Ha c egy valós szám akkor a 2.3.2. ábrán láthatunk egy esetet diszkrét amplitúdó skálázásra.
2.3.2. ábra Itt a c együttható pozitív, egynél nagyobb valós szám. Az amplitúdó skálázással a keletkező jelek (folytonos akár diszkrét) értelmezési tartománya nem változik. B. Jelek összeadása, szorzása
A 2.3.3. ábra két folytonos jel összeadását és szorzását mutatja.
2.3.3. ábra Amint látjuk, adottak a következő folytonos jelek: x 1 ( t ) : A → R és x 2 ( t ) : B → R . Ha a Dom operátor a jel értelmezési tartományát adja akkor, hogy az összeadás és szorzás a két folytonos jel között értelmezhető legyen, szükséges, hogy:
36
Dom( x 1 ( t )) ≡ Dom( x 2 ( t )) vagyis A ≡ B . Ha most a jelek összeadását, szorzását diszkrét jelekre alkalmazzuk, akkor legyen a két diszkrét jel x 1[n ⋅ Ts1 ] : A1 → R és x 2 [n ⋅ Ts 2 ] : B1 → R. Ahhoz, hogy az összeadás és szorzás a két jel között értelmezhető legyen szükséges, hogy: Dom( x 1 ( t )) ≡ Dom( x 2 ( t )) vagyis A1 ≡ B 2 és Ts1 = Ts 2 . C. A jel differenciálása, integrálása
Legyen adott x(t): R → R egy folytonos, deriválható jel. A jel esetében alkalmazzuk a következő operátort. d y (t ) = {x(t )} (2.3.1) dt Így kapjuk a jel deriváltját. Egy fontos gyakorlati példa erre a 2.3.4. ábrán látható áramkör:
2.3.4. ábra d i( t ) . dt Legyen most x(t): R → R egy folytonos, integráló jel. A jel esetében alkalmazzuk a következő operátort. Az ennek megfelelő differenciálegyenlet: u ( t ) = L ⋅
t
y( t ) =
∫ x (τ) ⋅ dτ
(2.3.2)
−∞
Ez adja a jel integrálját. Egy fontos gyakorlati példa erre a 2.3.5. ábrán látható áramkör:
2.3.5. ábra Az ennek megfelelő differenciálegyenletet felírhatjuk mint t
u(t) =
1 ⋅ i ( τ ) ⋅ dτ C −∫∞
37
Az eddig bemutatott műveletek mint a jel értékkészletét módosították. 2.4. A jelek értelmezési tartományát módosító műveletek
A. Időintervallum-skálázás
Legyen most x(t): R → R folytonos jel, akkor az időintervallum-skálázással kapott y(t) jel felírható )mint a > 0 ) : y( t ) = x (a ⋅ t ) (2.4.1) ahol • ha a > 1 akkor időintervallum kompresszióról beszélünk • ha 0 < a < 1 időintervallum dilatációról beszélünk Erre a két esetre láthatunk példát a 2.4.1. ábrán:
2.4.1. ábra Mindkét esetben láthatjuk, hogy a transzformáció során nem változik meg a jel amplitúdója. Kiindulunk az adott y( t ) = x (a ⋅ t ) transzformációból, amelynek segítségével meghatározzuk az adott jel (a 2.4.1. ábra bal oldalán) értelmezési tartománya meghatározó pontjainak megfelelő új koordinátákat amelyek az új értelmezési tartomány elemei lesznek. Az időintervallum-skálázás során a műveletet a jel értelmezési tartományának minden pontjára értem még ha nem is jelentem ki ezt tételesen minden alkalommal. Hasonlóan járunk el a következő, diszkrét jelek esetében is. Legyen most a 2.4.2. ábrán látható x [n ] : Z → R egy diszkrét jel. A diszkrét időintervallum-skálázás meghatározás szerint legyen y[n ] = x[k ⋅ n ]
(2.4.2)
ahol k egy egész paraméter vagyis k ∈ {±1, ± 2, ± 3, }
38
2.4.2. ábra Láthatjuk, hogy ez a művelet a diszkrét jelek esetében információvesztéssel jár. Most ugyanazt a skálázási műveletet figyeljük meg egy másik diszkrét jel esetében. Legyen ez a jel ⎧n ha n páratlan x[n ] = ⎨ ⎩0 ha n páros és ez látható a 2.4.3. ábra bal oldalán.
2.4.3. ábra A 2.4.3. ábrán látható skálázás k = 2 esetben információvesztéssel jár. Ennek a jelnek az esetében ha k nem 2 vagy ennek többszöröse akkor a transzformált jel nem veszít információt (a mindenhol zéró jel nem hordoz információt). B. Időtükrözés (reflexió)
Legyen x(t): R → R egy folytonos jel. Ekkor az időtükrözés (az idő-tengely tükrözése a vonatkoztatási rendszer origójára nézve) felírható mint:
y( t ) = x ( − t )
(2.4.3)
Ha a jel páros, akkor az időtükröző művelet nem változtatja meg a jelet, mert x (− t ) = x ( t ) , míg egy páratlan jel esetében mikor x (− t ) = − x ( t ) , a transzformált az Oy tengelyre nézve szimmetrikus jel lesz. Ebben az esetben is a műveletet a jel értelmezési tartományának minden pontjára értem. A 2.4.4. ábra az időtükrözést mutatja. Itt is, mint minden esetben az x(t) az eredeti jel míg y(t) a transzformált jel.
39
2.4.4. ábra x ( t ) = 0 ha t < −T1 és t > T2 y( t ) = 0 ha t < −T2 és t > T1 Legyen egy x [n ] : Z → R egy diszkrét jel. A diszkrét jel időtükrözés művelete meghatározása: y[n ] = x[−n ] (2.4.4) Példa
⎧ 1 ha n = 1 ⎪ Adott a diszkrét jel mint x[n ] = ⎨− 1 ha n = −1 és számítsuk ki ⎪ 0 ha n = 0 és n > 1 ⎩
y[n ] = x[n ] + x[−n ] értékét. A 2.4.5. ábrán láthatjuk az y[n ] jel két komponensét:
2.4.5. ábra Innen már nem nehéz kiszámítani, hogy a két jel összege: y[n ] = 0 . C. Idő-eltolás
Adott egy x(t): R → R folytonos jel. Az idő-eltolás műveletet y( t ) = x ( t − t 0 ); t 0 ≠ 0;
(2.4.5)
és t 0 egy véges valós szám. Ha t 0 > 0 akkor az időtengelyen jobbra toljuk (transzláció) az x(t) grafikonját, ha meg t 0 < 0 akkor meg az eltolás (transzláció) balra történik. Példa: a 2.4.6. ábrán 40
2.4.6. ábra Legyen egy x [n ] : Z → R egy diszkrét jel. Az idő-eltolást y[n ] = x[n − M]
(2.4.6)
alakban írhatjuk fel, ahol M∈ Z. Példa.
Legyen adott a 2.4.7. ábrán is látható diszkrét jel. Számítsuk ki a y[n ] = x[n + 3] eltolást. Itt M = -3. Mivel ez egy negatív szám, az eltolás balra ( − ∞ ) történik. ⎧ 1 ha n = 1,2 ⎧ 1 ha n = −1,−2 ⎪ ⎪ x[n ] = ⎨− 1 ha n = −1,−2 akkor x[n + 3] = ⎨− 1 ha n = −4,−5 ⎪ 0 ha n = 0 és n > 2 ⎪ 0 ha n = −3 és n > −1 ⎩ ⎩ Grafikus ábrázolásban:
2.4.7. ábra Vegyük most a következő, nagyon fontos transzformációt: y ( t ) = x (a ⋅ t − b)
(2.4.7)
ahol x,y : R → R , vagyis valós függvények és a,b szigorúan pozitív valós számok. Alapvető az idő-eltolás és az időtükrözés műveletének a sorrendje. Ez a következő: • Első lépés: elvégezzük az idő-eltolás műveletét ( t → t − b ⇒ x ( t ) → v( t ) ) • Második lépés: ezután elvégezzük az időtükrözés műveletét ( v( t ) → y( t ) )
2.4.8. ábra 41
A 2.4.8. ábra a helyes és a helytelen sorrendben végrehajtott műveleteket mutatja. Látható, hogy ez a transzformáció műveleti sorrendfüggő. Ez érvényes a diszkrét műveleti sorrend esetében is. Egy diszkrét jel esetében következik a helyes sorrendben végrehajtott műveletsor az y[n ] = x[2 ⋅ n + 3] kiszámítására ha a jel: ⎧ 1 ha n = 1,2 ⎪ x[n ] = ⎨− 1 ha n = −1,−2 ⎪ 0 ha n = 0 és n > 2 ⎩ Ezt a 2.4.9. ábrán láthatjuk.
2.4.9. ábra D. Konvolúciós összeg
A konvolúciós integrál alapvető a rendszerelméletben. • Ha egy diszkrét rendszert az időtartományban a súlyfüggvénye (h [n ] -a diszkrét Dirac jelre adott válasz) jellemzi, és ha a bemenő jelet x [n ] -vel jelöljük, akkor a rendszer válaszát felírhatjuk, mint a bemenő jel és a súlyfüggvény konvolúciós szorzatát:
y[n ] = x[n ] ∗ h[n ]
(2.4.8)
Az ‘ ∗ ’ művelet jelenti a konvolúciós szorzatot. Ez a konvolúció egy konvolúciós összeg. Diszkrét rendszerről van szó, ezért x [n ] : Z → R és h [n ] : Z → R . •
Ha egy folytonos rendszert időtartományban a súlyfüggvénye (h(t)-a Dirac jelre adott válasz) jellemzi, és ha a bemenő jelet x(t)-vel jelöljük, akkor a rendszer válaszát felírhatjuk, mint a bemenő jel és a súlyfüggvény konvolúciós szorzatát: y( t ) = x ( t ) ∗ h ( t )
(2.4.9)
Ez a konvolúció egy konvolúciós integrál. Folytonos rendszerről van szó, ezért x(t): R → R és h(t): R → R . 42
Az elkövetkezőkben, először a diszkrét konvolúciós összegről lesz szó. Adott x [n ] : Z → R h [n ] : Z → R Ekkor a konvolúciós összeg: y[n ] =
∞
∑ x[k ] ⋅ h[n − k ] = x[n ] ∗ h[n ]
k = −∞
(2.4.10)
Kövessük lépésről lépésre az összeg kiszámítását a következő példában: ⎧ −1 ⎪ 1 ⎪ 2 ⎪ x[n ] = ⎨ 1 ⎪ 1 ⎪− 2 ⎪ 0 ⎩
ha n = −1 ha n = 0 ha n = 1 ha n = 2 ha n < −1 és n > 2
⎧ 12 ha n = 0; n = 3 ⎪ ⎪ 1 ha n = 1 h[n ] = ⎨ 1 ⎪− 2 ha n = 2 ⎪ ⎩ 0 máshol
Ez a két jel diszkrét és véges. A 2.4.10. ábrán láthatjuk az x[n ] és h[n ] grafikonját.
2.4.10. ábra A y[n ] =
∞
∑ x[k ] ⋅ h[n − k ] képlet alapján kiszámítjuk az y kimenő jel értékeit az
k = −∞
egész számok(Z) halmazán.
y[0] = 0 + x[−1] ⋅ h[0 − (−1)] + x[0] ⋅ h[0 − (0)] + x[1] ⋅ h[0 − (1)] + x[2] ⋅ h[0 − (2)] + 0 Csak ennyi tagot írtunk fel, mert a többi k értékre x[k ] = 0 , tehát nem járul hozzá valós nem zéró értékkel az y[0] -hoz. Innen következik y[0] = 0 + ( −1) ⋅ h[1] + ( 12 ) ⋅ h[0] + (1) ⋅ h[ −1] + ( − 12 ) ⋅ h[ −2] =
= −1 ⋅ 1 + 12 ⋅ 12 + 1 ⋅ 0 + ( − 12 ) ⋅ 0 = −1 + 14 = − 34
y[−1] = 0 + x[−1] ⋅ h[−1 − (−1)] + x[0] ⋅ h[−1 − (0)] + x[1] ⋅ h[−1 − (1)] + x[2] ⋅ h[−1 − (2)] + 0 y[−1] = 0 + (−1) ⋅ h[0] + ( 12 ) ⋅ h[−1] + (1) ⋅ h[−2] + (− 12 ) ⋅ h[−3] = = − 12 + 0 + 0 + 0 = − 12
43
y[ −2] = 0 + x[ −1] ⋅ h[ −2 − ( −1)] + x[0] ⋅ h[ −2 − (0)] + x[1] ⋅ h[−2 − (1)] + x[2] ⋅ h[−2 − (2)] + 0 y[ −2] = 0 + ( −1) ⋅ h[ −1] + ( 12 ) ⋅ h[ −2] + (1) ⋅ h[ −3] + ( − 12 ) ⋅ h[−4] =
= 0+0+0+0 = 0
Könnyen beláthatjuk, hogy y[−3] = 0; y[−4] = 0, LL Ezért most ki kell számítanunk az y értékét a n > 0 egész számokra.
y[1] = 0 + x[−1] ⋅ h[1 − (−1)] + x[0] ⋅ h[1 − (0)] + x[1] ⋅ h[1 − (1)] + x[2] ⋅ h[1 − (2)] + 0 y[1] = ( −1) ⋅ h[2] + ( 12 ) ⋅ h[1] + (1) ⋅ h[0] + ( − 12 ) ⋅ h[ −1] =
=
1 2
+ 12 + 12 + 0 =
3 2
y[2] = x[−1] ⋅ h[2 − (−1)] + x[0] ⋅ h[2 − (0)] + x[1] ⋅ h[2 − (1)] + x[2] ⋅ h[2 − (2)] y[2] = (−1) ⋅ h[3] + ( 12 ) ⋅ h[2] + (1) ⋅ h[1] + (− 12 ) ⋅ h[0] = = − 12 + 12 (− 12 ) + 1 ⋅ 1 + (− 12 ) ⋅ 12 = 0 y[3] = x[ −1] ⋅ h[3 − ( −1)] + x[0] ⋅ h[3 − (0)] + x[1] ⋅ h[3 − (1)] + x[2] ⋅ h[3 − (2)] y[3] = (−1) ⋅ h[4] + ( 12 ) ⋅ h[3] + (1) ⋅ h[2] + ( − 12 ) ⋅ h[1] = = −1 ⋅ 0 + 12 ⋅ 12 + 1 ⋅ ( − 12 ) + ( − 12 ) ⋅ 1 = 0 + 14 − 12 − 12 = − 32
y[4] = x[ −1] ⋅ h[4 − ( −1)] + x[0] ⋅ h[4 − (0)] + x[1] ⋅ h[4 − (1)] + x[2] ⋅ h[4 − (2)] y[4] = (−1) ⋅ h[5] + ( 12 ) ⋅ h[4] + (1) ⋅ h[3] + ( − 12 ) ⋅ h[2] = = −1 ⋅ 0 + 12 ⋅ 0 + 1 ⋅ ( 12 ) + ( − 12 ) ⋅ ( − 12 ) =
1 4
+ 12 =
3 4
y[5] = x[ −1] ⋅ h[5 − (−1)] + x[0] ⋅ h[5 − (0)] + x[1] ⋅ h[5 − (1)] + x[2] ⋅ h[5 − (2)] y[5] = (−1) ⋅ h[6] + ( 12 ) ⋅ h[5] + (1) ⋅ h[4] + (− 12 ) ⋅ h[3] = = −1 ⋅ 0 + 12 ⋅ 0 + 1 ⋅ 0 + (− 12 ) ⋅ ( 12 ) = − 14 y[6] = x[−1] ⋅ h[6 − ( −1)] + x[0] ⋅ h[6 − (0)] + x[1] ⋅ h[6 − (1)] + x[2] ⋅ h[6 − (2)] = 0 Összegezésként, a kapott kimenő jel (a konvolúciós szorzat eredménye) felírható mint: ⎧− 12 ha n = −1 ⎪ ⎪− 34 ha n = 0; n = 3 ⎪ ⎪ 3 ha n = 1 x[n ] = ⎨ 2 ⎪ 34 ha n = 4 ⎪ 1 ⎪− 4 ha n = 5 ⎪ ⎩ 0 ha n = 2; n < −1 és n > 5
44
Kövessünk egy más módszert a konvolúciós értékek kiszámítására Ez egy grafikus ábrázolásra épülő módszer). Legyen itt példának a 2.4.10 alapján a y[1] =
∞
∑ x[k ] ⋅ h[1 − k ]
k = −∞
meghatározása vagyis. Grafikusan ábrázoljuk a 2.4.11. ábrán az x és h formákat a k valamint 1-k diszkrét időpillanatokban.
2.4.11. ábra Figyelembe kell venni, hogy h[1 − k ] = h[− k + 1] . A 2.4.11. ábrán a két diszkrét grafikont az adott bemenő jelből és a súlyfüggvényből kiindulva, transzlációval és skálázással kaptuk. Most az azonos időpillanatbeli jeleket összeszorozzuk és az így kapott részeredményeket összeadjuk amint azt az y[1] -re felírt képlet adja. A fenti ábra alapján láthatjuk, hogy: y[1] = 0 ⋅ 12 + (−1) ⋅ (− 12 ) + 12 ⋅ 1 + 1 ⋅ 12 + (− 12 ) ⋅ 0 =
3 2
Hasonlóan járunk el hogy kiszámítsuk y[−1], y[0], y[2],L értékeket. Így kiszámítjuk a konvolúciós szorzatot. Egy újabb példa a grafikus megoldási módszerre amikor a két diszkrét jel nem véges jel. Legyen a két jel: • •
A diszkrét egységugrás jel a bemenő jel ( x[n ] : Z → R) 3 A súlyfüggvényt a h[n ] = ( ) n ; n ≥ 0 ( h[n ] : Z+ → R) 4
45
Ki kell számítani a súlyfüggvénnyel jellemzett rendszer válaszát a bemenő jelre. Ez a y[n ] =
∞
∑ x[k ] ⋅ h[n − k ] konvolúciós szorzat kiszámítását jelenti. A két adott diszkrét
k = −∞
forma grafikus képe a 2.4.12. ábrán látható:
2.4.12. ábra Példaként két pontban számítjuk ki a konvolúciós szorzatot 2.4.10 alapján. Az első lépésben legyen n = -5. Ekkor y[−5] =
∞
∑ x[k ] ⋅ h[−5 − k ]
k = −∞
Szükségünk van az x[k ] és h[− k − 5] jelek ábrázolására. Látható, hogy h[−5 − k ] = h[−1 ⋅ k + (−5)] ami azt jelenti, hogy első lépésként egy 5 egységgel jobbra transzláció majd egy második lépés az időtükrözés (reflexió) következik. Tehát az első lépés a transzláció és ennek eredménye a 2.4.13. ábrán látható.
2.4.13. ábra Második lépés a reflexió és ennek eredménye a 2.4.14. ábrán látható.
2.4.14. ábra és ha bemenő jel a 2.4.15. ábrán található, akkor
46
2.4.15. ábra innen kiszámítható (megfigyelve, hogy az összegezendő minden szorzat értéke zéró, mert az azonos k pillanatokban valamelyik szorzótényező mindég zéró, nincs zérótól különböző közös része az azonos k pillanatban vett jelösszetevőknek) y[−5] =
∞
∑ x[k ] ⋅ h[−5 − k ] = 0 .
k = −∞
Most oldjuk meg ugyanezt a feladatot n = 5 diszkrét időre a 2.4.10 alapján. y[5] =
∞
∑ x[k ] ⋅ h[5 − k ]
k = −∞
Az előzőekhez hasonló módon elvégezzük a transzláció és időskálázás műveletét, akkor kapjuk a 2.4.16. ábra szerinti ábrázolásokat:
2.4.16. ábra Innen következik, ha elvégezzük az identikus k-ra a szorzást, hogy: 5
k
5 3 3 4 y[5] = ∑ ( ) 5−k = ( ) 5 ⋅ ∑ ( ) = 3.288 4 k =0 4 k =0 3
Hasonló módon folytatva, ki tudjuk számítani a konvolúció minden elemét.
E. Konvolúciós integrál 47
Ez a művelet folytonos jelekre vonatkozik. Ezért adott két folytonos jel: x(t): R → R és h(t): R → R A konvolúciós integrált felírjuk mint: ∞
y( t ) = x ( t ) ∗ h ( t ) =
∫ x ( τ ) ⋅ h ( t − τ ) ⋅ dτ
(2.4.11)
−∞
Ha a h(t) egy lineáris, időben nem változó paraméterű rendszer súlyfüggvénye és az x(t) a rendszer bemenő jele, akkor az y(t) a rendszer válasza, kimenő jele. Ez azt jelenti, hogy ha pontosan ismerjük a rendszer Dirac jelre adott válaszát, akkor elvileg ismerjük a rendszer válaszát bármely folytonos jelre, ha ki tudjuk számítani a fentebb említett konvolúciós integrált.
Példa Adott a rendszer bemeneti jele x ( t ) és súlyfüggvénye h ( t ) (habár ez a rendszert jelentő összefüggés és függvénynek nevezzük, valójában egy relációként értelmezzük és úgy ábrázoljuk mint egy jel) amint azt a 2.4.17. ábrán láthatjuk:
2.4.17. ábra Ahhoz, hogy a konvolúciós integrált kiszámíthassuk, a t változó felvesz minden értéket az R valós intervallumban és ugyanakkor szükségünk van az x (τ) és a h ( t − τ) függvényekre. Az utóbbit megkapjuk a h(t) súlyfüggvényből. Amint azt a diszkrét konvulúció esetében is láttunk, egy időintervallum eltolásra (t értékkel) és egy idő-tükrözésre van szükségünk. Az új változó a τ míg a t egy független paraméter. Az így transzformált h(t) formát nem rögzítettük egy vonatkoztatási rendszerhez, mert az integrálás során, mint azt látni fogjuk, amint a τ integálás változó növekvő értékeket vesz fel, az x (τ) és h ( t − τ) relatív pozíciója változni fog.
2.4.18. ábra 48
Az előző, 2.4.18. ábra az x(t) és h(t) egy relatív pozíciót mutatja. Ebben a példában a konvolúciós integrál kiszámítását négy lépésben mutatjuk be. Figyeljük meg, hogy a 2.4.18. ábrán a 2.4.17. ábrához viszonyítva, más az értelmezési tartomány változójának jelölése.
1. ha t < 1 akkor x (τ) ⋅ h ( t − τ) ≡ 0 és ez látható a következő 2.4.19. ábrán látjuk. Nincs átfedés a két jel között.
2.4.19. ábra
2. a 2.4.20. ábrán érzékeltetem azt ha 1 ≤ t < 3 akkor (az integrálás csak az átfedő, közös értelmezési tartományon (1,t) nem nulla) ∞
t
−∞
1
∫ 1 ⋅ 1 ⋅ dτ = ∫ dτ = τ |1 = t − 1 t
2.4.20. ábra
3. ha 1 ≤ t − 2 ≤ 3 akkor
∞
3
−∞
t −2
∫ 1 ⋅ 1 ⋅ dτ = ∫ dτ = τ | t −2 = 5 − t . Ezt érzékelteti a 2.4.21. 3
ábra
2.4.21. ábra
4. ha t − 2 > 3 akkor x (τ) ⋅ h ( t − τ) ≡ 0 és ez látható a 2.4.22. ábrán.
49
2.4.22. ábra Így a kapott konvolúciós szorzat eredményét felírhatjuk mint intervallumon értelmezett függvényformát: ⎧0 ha t < 1 ⎪t − 1 ha t ∈ [1, 3) ⇐ 1 ≤ t < 3 ⎪ x ( t ) ∗ y( t ) = ⎨ ⎪5 − t ha t ∈ [3, 5] ⇐ 1 ≤ t − 2 ≤ 3 ⎪⎩0 ha t > 5 ⇐ t − 2 > 3 Az eredményt grafikus formában a 2.4.23 ábra mutatja.
2.4.22. ábra Fontos megjegyezni, hogy t = 3 pontban kapott maximális érték azt jelenti, hogy akkor van az x (τ) és a h ( t − τ) függvényeknek maximális átfedése (konvolúció maximuma). Ezt a megfigyelést alkalmazzuk akkor is mikor a konvolúciós szorzatot mint ‘hasonlóságdetektort’ használjuk. Ennek a példának alapján a konvolúciós integrált a következő algoritmus alapján számítjuk ki: •
1. Ábrázoljuk az x (τ) és h ( t − τ) jeleket amikor a τ a független változó, és figyelembe vesszük a h ( t − τ) = h (−1 ⋅ τ + t ) egyenlőséget amely a transzláció és reflexió elvégzésében segít.
•
2. A h ( t − τ) -t ’végigcsúsztatjuk’ − ∞ -től ∞ -fele (t-paraméter változtatva) figyelve a súlyfüggvény és a bemenő jel relatív pozícióját.
•
3. Minden esetben felírjuk a konvolúciós szorzatot a képlet alapján, és az integrálási határokat az adott helyzet szerint választjuk.
•
4. A két utóbbi lépést addig ismételjük míg t felvesz minden valós értéket és míg van új relatív pozíciója a bemenő jelnek és a súlyfüggvénynek.
Példa Számítsuk ki az ⎧1 ha t ∈ [0, 2] x(t) = ⎨ ⎩0 ha t ∉ [0, 2]
és
h(t) = e −t ; t ≥ 0
50
jelek konvolúciós szorzatát. ∞
y( t ) = x ( t ) ∗ h ( t ) =
∫ x ( τ ) ⋅ h ( t − τ ) ⋅ dτ
−∞
⎧⎪e −( t −τ) τ < t és h ( t − τ) = ⎨ máshol ⎪⎩0 máshol jelek grafikus képét a 2.4.23. ábrán láthatjuk. A súlyfüggvény esetében a t egy paraméter.
⎧1; 1. lépés A x (τ) = ⎨ ⎩0;
0<τ<2
2.4.23. ábra 2. lépés Láthatjuk, hogy x (τ) és h ( t − τ) egymáshoz való viszonyában 3 esetet különböztetünk meg. Mégpedig: • •
t < 0 ⇒ a konvolúciós szorzat zéró, mert nincs relatív átfedés a két jel között t ∈ [0, 2] ⇒ ekkor részleges átfedés van amint az a 2.4.24. ábrán látható
2.4.24. ábra Ekkor a konvolúciós szorzat t
y( t ) = ∫ 1 ⋅ e −( t −τ) ⋅ dτ = 1 − e − t 0
•
t ≥ 2 ⇒ teljes, de változó területű az átfedés, vagyis a 2.4.25. látható eset
2.4.25. ábra 51
Ekkor kiszámítjuk a konvolúciós szorzatot, mint: 2
y( t ) = ∫ 1 ⋅ e −( t −τ) ⋅ dτ = (e 2 − 1) ⋅ e − t 0
Az integrálás után kapott megoldás t<0 ⎧0 ⎪ y( t ) = ⎨1 − e − t 0≤t<2 ⎪ 2 −t t≥2 ⎩(e − 1) ⋅ e
Ennek grafikus ábrázolása látható a 2.4.26. ábrán.
2.4.26. ábra 2.5. Elemi jelek
Az elemi jeleket leíró függvények ismertek az elemi matematikából. Ezért nem térünk ki ezekre. Az elkövetkezőkben csak kiemelünk néhány alapvető tulajdonságot mindenekről. A matematikából ismert konvergencia, monotonitás, folytonosság, deriválhatóság, integrálhatóság fogalmak ismerete elengedhetetlen a továbbiakban.
A. Exponenciális jel
• Az x(t): R → R egy valós exponenciális jel: x ( t ) = B ⋅ e a ⋅t
•
(2.5.1)
Az x[n ] : Z → R egy diszkrét exponenciális jel:
x[n ] = B ⋅ r n Egy exponenciális jelet szimulálhatunk a 2.5.1. ábrán látható áramkörrel
(2.5.2)
2.5.1. ábra
52
Ha a kondenzátoron a kezdeti t = 0 pillanatban a feszültség U 0 és t ≥ 0 esetben a rendszert leíró differenciálegyenlet d d i( t ) = C ⋅ u ( t ) R ⋅ C ⋅ u ( t ) + u ( t ) = 0; dt dt ennek megoldása ( t ≥ 0 ) u(t) = U 0 ⋅ e
−
t R ⋅C
egy exponenciális jel.
B. Szinuszjel Az x(t): R → R egy valós szinuszjel: x ( t ) = A ⋅ cos(ω ⋅ t + φ)
(2.5.3)
2⋅π -periódus. Egy szinuszω jelet szimulálhatunk a következő, a 2.5.2. ábrán látható áramkörrel. Ahol A-amplitúdó, ω -körfrekvencia, φ -fázisszög, T =
2.5.2. ábra Ha a kondenzátoron a kezdeti t = 0 pillanatban a feszültség U 0 és t ≥ 0 esetben a rendszert leíró differenciálegyenlet d2 L ⋅ C ⋅ 2 u(t) + u(t) = 0 dt ennek megoldása ( t ≥ 0 ) 1 u ( t ) = U 0 ⋅ cos(ω0 ⋅ t ); ω0 = L⋅C egy szinuszjel. Legyen x[n ] : Z → R egy diszkrét szinuszjel: x[n ] = A ⋅ cos[Ω ⋅ n + φ)
(2.5.3)
A diszkrét szinuszjel lehet periodikus vagy nem. Hogy periodikus legyen N darab diszkrét jelen keresztül, akkor a jelnek eleget kell tegyen az
∃! N x[n ] = x[n + N] ∀n
53
összefüggésnek amikor létezik egyetlen egy legkisebb N természetes szám úgy, hogy igaz legyen az egyenlőség. Így x[n + N] = A ⋅ cos(Ω ⋅ n + Ω ⋅ N + φ) ⇒ Ω ⋅ N = 2 ⋅ k ⋅ π ⇒ Ω=
2⋅k⋅π [rad] N
(2.5.3a)
(k,N eleme a természetes számok halmazának) Innen látható, hogy tetszőleges Ω esetében nem biztos, hogy a diszkrét szinuszjel periodikus. Ha periodicitásról beszélünk akkor Ω szükségszerűen 2 ⋅ π racionális többszöröse kell legyen. Meg kell jegyezzük, hogy a szinuszjel egy oszcilláció (időben változó jel) és nem egy hullám amely úgy térben mint időben változó mennyiség.
Példa Adott a következő jel:
x[n ] = sin[5 ⋅ π ⋅ n ]
Innen Ω = 5 ⋅ π . Innen következik, hogy N=
2⋅π⋅k 2⋅π⋅k 2 = = ⋅k Ω 5⋅π 5
Annak szükséges és elégséges feltétele, hogy a jel periodikus az, hogy N természetes szám legyen. Ez csak akkor lehetséges, ha: k = 5, 10, 15, L Ebből következik, hogy N = 2, 4, 6,L Ezekből a legkisebb a főperiódus.
Példa Adott a következő jel: x[n ] = 10 ⋅ cos[ Innen Ω= Felírhatjuk N=
π 4⋅π ⋅n + ] 31 5
4⋅π [rad] 41
2 ⋅ π ⋅ k 2 ⋅ π ⋅ k 31 ⋅ k = = 4⋅π Ω 2 31
A lehetséges k értékek: 2, 4, 6 , L ⇒ N = 31, 62, 93,L . Ebből az alapperiódus N = 31. Fontos ismeretek: • Euler összefüggés e j⋅θ = cos(θ) + j ⋅ sin(θ)
(2.5.4) 54
•
Csillapított rezgőmozgás x ( t ) = A ⋅ e −α⋅t ⋅ sin(ω ⋅ t + φ); α > 0
(2.5.5)
Erre a csillapított rezgőmozgásra példa a 2.5.3. ábrán látható áramkör:
2.5.3. ábra Erre az áramkörre felírható összefüggések (az elektrotechnikából ismert törvényeket is alkalmazva) a következők: t
iL =
1 du ( t ) u(t) ⋅ ∫ u (τ) ⋅ dτ ; i C = C ⋅ ; iR = L −∞ dt R
A rendszer differenciálegyenlete: t
1 du ( t ) u ( t ) ⋅ ∫ u ( τ) ⋅ d τ + C ⋅ + =0 L −∞ dt R
A differenciálegyenlet megoldása u(t) = U 0 ⋅ e
−
t 2⋅R ⋅C
⋅ cos(ω0 ⋅ t ); t ≥ 0
ahol U 0 a kondenzátor kezdeti töltése, és
1 1 − 2 L⋅C 4⋅C ⋅R2 Látható, hogy a 2.5.5 alapján ez egy csillapított rezgőmozgás. ω0 =
C. Egységugrás jel Folytonos egységugrás (x(t): R → R) jelet felírhatjuk mint: ⎧1 t ≥ 0 1(t) = ⎨ ⎩0 t < 0
(2.5.6)
2.5.4. ábra 55
Diszkrét egységugrás ( x[n ] : Z → R) jelet felírhatjuk mint: ⎧1 n ≥ 0 ⎩0 n < 0
1 [n ] = ⎨
(2.5.7)
2.5.5. ábra A 2.5.4. ábra a folytonos egységugrás, míg a 2.5.5. ábra a diszkrét egységugrás grafikus ábrázolása. Alapvetően fontos, hogy a matematikai analízis szempontjából a folytonos egységugrás egységugrás jelnek nincs értelme az origóban de jelelméleti szempontból egy elsőrendű szakadási ponttal rendelkező folytonos jel. A következőben meglátjuk, hogy ennek a folytonos jelnek (nem függvénynek) a deriváltja az origóban nem más mint a Dirac-jel. Könnyű belátni, hogy egy impulzusjel, amely a 2.5.6. ábrán látható, felírható mint x(t) = 1(t) - 1(t - 2)
2.5.6. ábra tehát két egységugrás jel algebrai összegeként miután a második egységugrásra alkalmaztuk az időeltolás műveletét.
D. Lineáris változású jel Folytonos lineáris változású jel (x(t): R → R) jelet felírhatjuk mint: ⎧t t ≥ 0 r(t) = ⎨ ⎩0 t < 0
(2.5.8)
2.5.7. ábra 56
Diszkrét lineáris változású jel ( x[n ] : Z → R) jelet felírhatjuk mint: ⎧n n ≥ 0 r [n ] = ⎨ ⎩0 n < 0
(2.5.9)
2.5.8. ábra A 2.5.7. ábra a folytonos lineáris változású jel, míg a 2.5.8. ábra a diszkrét lineáris változású jel grafikus ábrázolása.
E. Dirac- jel Dirac jel a folytonos változás esetében (x(t): R → R) jelet (nem függvény), és felírhatjuk mint: ⎧δ( t ) = 0 t ≠ 0 ⎪ δ (t) = ⎨ ∞ ⎪ ∫ δ( t ) ⋅ dt = 1 ⎩−∞
(2.5.10)
Ennek értelmezéséhez, és a következő meghatározást vesszük figyelembe δ( t ) = lim x Δ ( t ) Δ →0
ahol az x Δ ( t ) -t grafikusan ábrázoljuk. Ez a x Δ ( t ) egy impulzusjel. A 2.5.10 meghatározás akkor igaz, ha a kapcsos jelben szereplő mindkét feltétel egyszerre teljesül. Mindenik x Δ ( t ) impulzusjel forma területe egységnyi, ez azt jelenti, hogy ha az időtartományban a ha jel szélessége Δ2 − (− Δ2 ) = Δ akkor a magassága Δ1 és ez látható
a fenti ábrán. Ekkor ha Δ → ∞ akkor a kapott jel a Dirac-jel, és ennek egyfajta ábrázolását lásd 2.5.9. ábrán. Hogy a Dirac-jelet még jobban érzékeltethessem, 1 szükség lett volna a további ‘keskenyebb mint Δ 1 ’ és ezáltal ’magasabb mint ’ Δ1 téglalapok berajzolására, de ez túlzsúfolttá és áttekinthetetlenné tette volna a 2.5.9. ábrát.
57
2.5.9. ábra Azonban logikailag könnyen követhető, hogy miként juthatnánk el egy folytonos Dirac-jel vizualizálásához, de a ennek a fogalomnak megértése sokkal fontosabb mint az ábrázolására való törekvés. (’ha a jel végtelen amplitúdójú, akkor végtelen keskeny, hogy a területe egységnyi legyen’ de ezt klasszikus matematikai szemlélettel nem írhatom le) Mindenképpen újra leírom, hogy a Dirac-jel nem egy függvény matematikai analízis szempontjából. Dirac-jel fontos tulajdonságai: d 1(t) dt
•
δ( t ) =
•
1(t) = ∫ δ(τ) ⋅ dτ
vagyis az előző tulajdonság más megfogalmazása
δ( t ) = δ( − t )
vagyis páros jel
vagyis az egységugrás jel deriváltja egy Dirac-jel
t
−∞
•
∞
•
∫ x ( t ) ⋅ δ( t − t 0 ) = x ( t 0 )
ez is lehet a Dirac-jel meghatározása (fontos a
−∞
mintavételezés megértéséhez!) •
(2.5.11)
1 a
δ( a ⋅ t ) = ⋅ δ( t ) a > 0
Diszkrét Dirac ( x[n ] : Z → R) jelet felírhatjuk mint: ⎧1 n = 0 δ [n ] = ⎨ ⎩0 máshol
(2.5.12)
Ennek grafikus képe a 2.5.9. ábrán láthatjuk és megjegyezzük, hogy itt a jel az n = 0 pillanatban vett értéke egységnyi, s nem végtelen mint a folytonos Dirac-jel esetében.
58
2.5.9. ábra A Dirac-jel elméleti jelentősége nagyon nagy a rendszerelméletben mert az a fontos matematikai fogalom amely lehetővé teszi, hogy pontos matematikai megfogalmazást adhatunk sok rendszerelméleti fogalomnak (súlyfüggvény, mintavételezés, stb.)
59
3. Rendszermodellek Egy rendszert, hogy szabályozni tudjuk, szükségünk van a rendszer működésének leírására. Minderről szóltam már a bevezető fejezetben. Ez a leírás tartalmaznia kell a rendszer felépítéséből adódó jellegzetességeiket, az időben változó jellemzőket és a zavaró tényezők hatását a szabályzó kör minden elemére. A modellezés a különböző rendszerek hasonló vonásain alapszik. A rendszer és a hasonlóság fogalmát itt nagyon tág értelemben használjuk. Ha két rendszer között bármilyen de legalább egy vonatkoztatásban megállapítható a hasonlóság, akkor köztük fennáll az eredeti és a modell viszonya. Modellnek tekinthetjük a bonyolult valóságos rendszer egyszerűsített, áttekinthető megvalósított mását vagyis a fizikai modellt, és az elképzelt, matematikailag leírható, idealizált, elvi másolatát, a matematikai modellt is. A matematikai modell a rendszer teljes vagy részletes viselkedésének matematikai leírása, a rendszer bemenő-kimenő jellemzőinek matematikai összefüggéssel (összefüggésrendszerrel) leírt ábrázolása. Minden matematikai modell egyszerűsítéseket tartalmaz, sokkal több paraméter befolyásolja a működést mint amennyit számításba tudunk venni. Jelentőségük abban áll, hogy valóságos viszonyok között meg sem valósítható, vagy csak nagy költségek árán felépíthető rendszerek vizsgálatát teszi lehetővé.
3.1. ábra A statikus és dinamikus rendszermodellek közül a rendszerelmélet az időfüggő dinamikus rendszereket részesíti előnyben. Mivel minden modell megközelítő a valódi rendszerhez képest, ezért nagyon fontos az a cél amiért egy modell elkészül.
60
Mivel szabályozástechnika a ki-bemenő rendszerviszonyokat tárgyalja, ezért fontos a modellben szereplő változók meghatározása. Az adott rendszerre jellemző sok, közvetett vagy közvetlen módon mérhető vagy becsülhető jellemzők közül azokat választjuk ki amelyek a rendszer adott célú leírása és működése szempontjából fontosak. A modellek nem lehetnek pontosabbak, mint a bennük felhasznált leíró elvek és azok paramétereinek pontossága. Minden modell megközelítő, ezért minden modellalkotásnál szükséges a fejlesztés és kísérleti igazolás (például szimuláció útján). Az alkalmazást megelőző modellfejlesztés lépéseit mutatja be a 3.1. ábra. A matematikai modell általában lehet egy differenciálegyenlet mint dinamikus állapotegyenletek leírója, algebrai egyenlet mint statikus modellek, logikai egyenlet vagy akár heurisztikus alapon felállított reláció. Minden dinamikus modell esetében az idő a független változó. A modellek leírását olyan ellentétes párokba tudjuk sorolni mint lineáris-nemlineáris, állandósult állapotú-dinamikus, osztott paraméterűkoncentrált paraméterű, folytonos-diszkrét vagy determinisztikus-sztochasztikus. Mindezen rendszerjellemzők meghatározását az elkövetkező fejezetekben adjuk meg. 3.1. Példák modellekre
A. Víztartály A 3.1.1. ábrán látható tartály szintváltozását a következő differenciálegyenlet írja le: dh ( t ) = q1 ( t ) − q 2 ( t ) dt ahol A tartály alapterülete, h a tartályban levő folyadék szintje, a q1 a tartályba beáramló folyadék hozama míg q 2 a kiáramló hozam. A kiáramló folyadék hozama a gravitációs hatás miatt a következő egyenlettel határozható meg: A⋅
q 2 (t) = c ⋅ 2 ⋅ g ⋅ h(t) = k ⋅ h(t)
ahol c valamint k konstans együtthatók és a fizikai rendszert (modell) jellemző mennyiségei.
3.1.1. ábra Így a rendszermodellnek a A⋅
dh ( t ) + k ⋅ h ( t ) = q1 ( t ) dt
nemlineáris differenciálegyenletet kapjuk. 61
Ha egy beáramló q10 hozam értékénél elérjük azt, hogy a q 20 kifolyásra a folyadékszint többet ne változzon, akkor a rendszerben egyensúlyi állapot jön létre. A hozam és a szint között ekkor a következő összefüggés igaz: ⎛q ⎞ h 0 = ⎜ 10 ⎟ ⎝ k ⎠
2
Végezzük el a következő változócserét (lineárizálás): q1 ( t ) = q10 + Δq1 ( t ) h ( t ) = h 0 + Δh ( t )
.
Ekkor kapjuk: dΔh ( t ) + k ⋅ h 0 + Δh ( t ) = q10 + Δq1 ( t ) dt Ha ezt a modellt kis folyadékszint változásra írjuk fel, vagyis arra az esetre mikor Δh ( t ) kicsi értékeket vesz fel akkor érvényesek a következő összefüggések: A⋅
h 0 + Δh ( t ) = k ⋅ h 0 ⋅ 1 +
Δh ( t ) Δh ( t ) Δh ( t ) ) = q10 + k ⋅ ≈ k ⋅ h 0 ⋅ (1 + 12 h0 h0 2 ⋅ h0
Ezt behelyettesítve az egyenletbe kapjuk, hogy: dΔh ( t ) k + ⋅ Δh ( t ) = Δq1 ( t ) (3.1.1) dt 2 ⋅ h0 és ez egy lineáris differenciálegyenlet. A munkapontok beállítását egy járulékos kézi beállítású szeleppel érhetjük el. A⋅
B. RLC áramkör Vegyünk egy másik példát modell készítésére. Ez egy két energiatárolós áramkör, amelynek felépítését a 3.1.2. ábra adja. A rendszert mint irányított rendszert tekintjük, amikor a bemenet az u(t) feszültség, míg a kimenet az R ellenálláson mérhető u R feszültség. A két energiatároló a kondenzátor és a tekercs a hálózatból.
3.1.2. ábra 62
Az ismert, hurkokra és csomópontokra vonatkozó törvények alapján felírhatjuk a következő egyenleteket: di( t ) u R (t) = L ⋅ + 3 ⋅ R ⋅ i( t ) (3.3.2) dt majd du ( t ) di( t ) (3.3.3) 2⋅R ⋅C⋅ + u + L⋅ + 3 ⋅ R ⋅ i( t ) = u G ( t ) dt dt és a csomópontra meg di( t ) du ( t ) 1 −C⋅ + i( t ) + ⋅ (L ⋅ + 3 ⋅ R ⋅ i( t )) = 0 (3.3.4) dt dt R di( t ) du ( t ) + 3 ⋅ R ⋅ i( t ) pedig a kimenő a kondenzátoron átfolyó áram és L ⋅ ahol C ⋅ dt dt ellenálláson levő feszültség (ugyanaz mint a tekercs meg a vele sorba kötött ellenálláson eső feszültség. A második egyenletből kapjuk: du ( t ) L di( t ) 4 = ⋅ + ⋅ i( t ) = 0 dt R ⋅ C dt C
(3.3.5)
A (3.3.3) egyenletet deriváljuk és behelyettesítjük a (3.3.5) egyenletet és ennek deriváltját, akkor a következő formát kapjuk: 2⋅R ⋅C⋅(
L d 2 i( t ) 4 di( t ) L di( t ) 4 ⋅ + ⋅ ⋅ + ⋅ i( t )) + )+( 2 R ⋅ C dt C dt R ⋅ C dt C di( t ) di( t ) du G ( t ) + L⋅ + 3⋅ R ⋅ = dt dt dt
Ha ezt az egyenletet rendezzük akkor kapjuk, hogy: 3⋅ L ⋅
di 2 dt
2
+ (11 ⋅ R +
du L di 4 )⋅ + ⋅i = G R ⋅ C dt C dt
(3.3.6)
Az (3.3.2) egyenletet megszorozzuk 3-al majd deriváljuk és kivonjuk az (3.3.6) egyenletből s következik: du du di 4 L ) ⋅ + ⋅i = G − 3⋅ R (2 ⋅ R + (3.3.7) dt R ⋅ C dt C dt Most ebből kiküszöböljük az i(t) első deriváltját az 1. egyenlet segítségével. Ekkor következik: du G du R 2 ⋅ R 2 ⋅ C + L L − 6⋅R2 ⋅C ⋅ uR ⋅ i( t ) = − 3⋅ − L⋅C dt dt L⋅R ⋅C és akkor
3⋅ L ⋅C ⋅
d2u R dt 2
+ (2 ⋅ R +
d2u G du G L du R + 4 ⋅ uG = L ⋅ C ⋅ + ⋅ ⋅ ⋅ )⋅ 3 R C R dt dt dt 2
(3.3.8)
63
A differenciálegyenletet meghatározása hosszadalmas munka ha több energiatárolós a rendszer. C. Mechanikai mozgás
Súrlódásmentes egyenes vonalú mechanikai mozgás (a 3.1.3 ábra egy ilyen rendszert mutat) mozgásegyenlete (modellje) felírása a cél. :
3.1.3. ábra A rendszer bemenő jele az m tömegű testre ható erők eredője, és ezt u(t)-vel jelöljük. A modell egy egyenes vonalú, súrlódásmentes mozgást szemléltet, ezért eltekinthetünk a vektoriális felírásmódtól. A dinamika második törvényét alkalmazva kapjuk: m⋅
d 2 y( t ) = u(t) dt 2
(3.3.9)
Mivel az m anyagi pont sebességét, meghatározás szerint felírhatjuk mint: t
v( t ) =
dy( t ) u (τ) =∫ ⋅ dτ + v( t 0 ) dt m t
(3.3.10)
0
itt pedig a t 0 a kezdeti pillanat, míg v( t 0 ) a kezdősebesség és itt úgy szerepel mint integrálási konstans, a kezdeti feltételekből meghatározott értéke. Ezek alapján felírhatjuk, hogy: t
y( t ) = ∫ v(τ) ⋅ dτ + y( t 0 ) t0
Innen láthatjuk, hogy y(t) függ az y( t 0 ) , az ábrán látható vonatkoztatási rendszerhez viszonyított kezdeti pozíciótól s ugyanakkor, ismerve a sebességváltozót, függ a sebesség kezdeti értékétől ( v( t 0 ) ) is. Tehát, ha ismerjük a rendszer kezdeti pozícióját és a kezdősebességét, akkor könnyen megkapjuk ennek a rendszernek a mozgásegyenletének (a differenciálegyenlettel leírt modellnek) egy megoldását ha ismerjük a bemenő u(t) t ≥ t 0 változását. A rendszer mozgása ismert t 0 pillanattól kezdve és a két kezdeti értékbe belefoglaltuk mindazt ami a rendszerrel történt a t 0 momentum előtt. Ha most ezek ismeretében meghatározunk egy vektort, 64
⎛ y( t ) ⎞ ⎟⎟ x ( t ) = ⎜⎜ ⎝ v( t ) ⎠ akkor ezt elnevezhetjük a rendszer állapotvektorának és a vektor komponensei pedig a rendszer állapotváltozói. Ezekre a fogalmakra többször visszatérünk még az elkövetkezőkben. D. Kerékfelfüggesztés
Írjuk fel egy autó kerekének felfüggesztése matematikai modelljét. Ez egy egyszerűsített modell de sok esetben elégséges, hogy a rendszer dinamikáját megismerhessük. A mechanikai rendszert a leegyszerűsített formában (többek között nem vettük figyelembe, hogy a rendszer három dimenziós rendszer) a 3.1.4. ábrán láthatjuk. Itt az m az autó tömegét jelenti.
3.1.4. ábra Ha az autó kereke egy kis gödörbe hajt, vagy kődarabra szalad, akkor megjelenik a függőleges u(t) erő amely hatására az autó rezgőmozgást végezhet. A felfüggesztési rendszer tartalmaz egy rugót amelynek rugalmassági együtthatója k és egy sokkelnyelő mechanizmust (súrlódási erő formájában). A súrlódási együtthatót f-el jelöljük. Rugó által létrehozott erő arányos a rugó megnyúlásával, vagy összenyomásával és ezt jelöljük k ⋅ y( t ) -vel, míg az csillapító (sokkelnyelő) súrlódási erő arányos az elmozduló tömeg pillanatnyi sebességével és ezt jelöljük mint f ⋅ y& ( t ) vel. Akkor ennek a felfüggesztés dinamikájának megfelelő differenciálegyenletet felírhatunk mint: dy( t ) d 2 y( t ) + ⋅ + k ⋅ y( t ) = u 1 ( t ) f m⋅ dt dt 2 Ezt a differenciálegyenletet még felírhatjuk, mint d 2 y( t ) f dy( t ) k + ⋅ + ⋅ y( t ) = u ( t ) m dt m dt 2
Bevezetjük a következő jelöléseket:
65
•
ωn =
k amelyet a rendszer saját körfrekvenciájának m
k⋅m amelyet a rendszer jósági tényezőjének f nevezzük. Ekkor a másodrendű rendszert (a differenciálegyenlet másodrendű) a következő egyenlettel modellezhetünk: •
Q=
d 2 y( t ) ω n dy( t ) + ⋅ + ω 2n ⋅ y( t ) = u ( t ) 2 f dt dt
(3.1.11)
Ez az autó kerekének felfüggesztésén kívül, több hasonló dinamikájú rendszert is modellez, és minden esetben beszélünk saját körfrekvenciáról és minőségi faktorról, még akkor is ha a rendszer nem tartalmaz az autóéhoz hasonló rugózatot vagy amortizáló mechanizmust. Így rendszerelméleti szempontból teljesen azonosan tanulmányozható teljesen eltérő fizikai megvalósítású rendszer, de amelyek matematikai modellje identikus. E. Egyenáramú motor
Ez a példa egy nagyon gyakran használt egyenáramú (DC) motor modelljét adja. Legyen a következő ábra egy egyszerűsített bemutatása ennek a DC motornak. Ilyen elektromotorok teljesítménye változhat a watt törtrészétől több százezer wattig. A 3.1.5. ábrán láthatjuk, hogy két áramkört tartalmaz ez a DC motor. Egy egyenáramú áramkört, amely a konstans mágneses teret hivatott előállítani. Ennek a modellje az R f , L f ideális passzív ellenállásból és tekercsből és egy egyenáramot szolgáltató áramforrásból áll.
3.1.5. ábra A 3.1.5. ábrán egy külső gerjesztésű egyenáramú motorral felépített elektromechanikai rendszer – úgynevezett villamos hajtás modelljét adja. Az ábrán két galvanikusan független áramkör látható. Az egyiket, a gerjesztő kört az R f ellenállású és L f induktivitású tekercs modellezi. Ezt u f feszültségforrásról táplálva, az i f állandósult gerjesztő áram a motor légrésében mágneses teret hoz létre. Állandó mágneses teret létrehozhatunk állandó mágnesekkel is, a mágneses pólusok mindkét esetben az állórészen, sztatoron helyezkednek el. 66
A motor fordulatszámát az u ( t ) , armatúrafeszültség segítségével vezéreljük, amely a mechanikai egyenirányító szerepét játszó kommutátoron keresztül, a forgórész (rotor) tekercselését táplálja. Ez a második áramkör az armatúrakör, áramköri modelljét az R a és L a armaturaellenállás és induktivitás és az u b forgási elektromotoros feszültséget képviselő feszültségforrás soros kapcsolásával kapjuk. A gerjesztő mágneses tér és az i a armatúraáram kölcsönhatása Te elektromágneses forgatónyomatékot generál. A forgó mechanikai rendszerre ható forgató nyomatékok összege és a rendszer tehetetlenségét képviselő J tehetetlenségi nyomaték ismeretében felírható a forgó rendszer mozgásegyenlete. Megjegyzendő, hogy úgy a hajtás lineáris mozgást végző tömegei, mint a különböző áttételeken keresztül forgó mozgást végző tehetetlenségi nyomatékok visszavezethetők (redukálhatók) a motor tengelyére közvetlenül kapcsolt tehetetlenségi nyomatékra. A meghajtott munkagép terhelési nyomatékai lehetnek aktív, előjeltartó (pl. súly) illetve reaktív, a mozgást mindig fékező (pl. súrlódás) nyomatékok. Példánkban tekintsünk egy olyan reaktív terhelést, amelynek súrlódási nyomatéka lineárisan függ a forgómozgás szögsebességétől (viszkózus súrlódás). Így a terhelési nyomaték: Tt = f ⋅ ω = f ⋅ θ& A mozgásegyenlet erre:
& = J ⋅ &θ& ⇒ Te = f ⋅ θ& + J ⋅ &θ& Te − Tt = J ⋅ ω Ismert tény, hogy az elektromágneses nyomaték és az armatúra áram közötti Te ( t ) = K T ⋅ i a ( t ) , valamint az indukált forgási elektromotoros feszültség és a szögsebesség közötti u b ( t ) = K b ⋅ ω( t ) összefüggésben K T = K b . Tehát a mozgásegyenlet most J ⋅ &θ&( t ) + f ⋅ θ& ( t ) = K T ⋅ i a ( t ) Az armatúra feszültségegyenlet pedig: u(t) = R a ⋅ i a (t) + L a ⋅
di a ( t ) di ( t ) + u b ( t ) = R a ⋅ i a ( t ) + L a ⋅ a + k b ⋅ θ& ( t ) dt dt
Ha most az előző két differenciálegyenletből kiejtjük az i a ( t ) függvényt, akkor a következő differenciálegyenletet kapjuk: J ⋅ L a ⋅ &θ&&( t ) + (R a ⋅ J + L a ⋅ f ) ⋅ &θ&( t ) + (R a ⋅ f + k b ⋅ k T ) ⋅ θ& ( t ) = k T ⋅ u ( t )
(3.1.12)
Ez egy harmadrendű differenciálegyenlet. Az itt bemutatott modellek mindegyike betekintést enged az adott rendszer működésébe. Ez az időben, mint független változó (t), történő működés (dinamika) nem jellemzi a teljes rendszert, mert hogy ezeket a modelleket megkapjuk, több, a leírást egyszerűsítő elemet vettünk figyelembe. 67
F. Összekapcsolt rugós rendszer
Tekintsünk két, m1 és m 2 tömegű testet, amelyeket a 3.1.6 ábrán látható módon három rugó fog közre. A két szélső rugó falhoz rögzített. A három rugó rugóállandója rendre k 1 , k 2 és k 3 .
3.1.6 ábra A testek nyugalmi pozíciójukhoz képesti elmozdulását jelölje x 1 és x 2 , ahol a pozitív irányt jobbra választjuk. Tegyük fel, hogy az eredeti hosszukhoz képest L1 , L 2 illetve L 3 egységgel vannak megnyújtva (összenyomva) a rugók a nyugalmi helyzetben. Ekkor a rugóerők egyenlősége miatt k 1 ⋅ L1 = k 2 ⋅ L 2 = k 3 ⋅ L 3 teljesül. Ha a nyugalmi helyzetükből kimozdítjuk a rugókat, és esetleg valamilyen kezdő sebességet is adunk a testeknek, akkor a testek mozogni kezdenek az egyes testekre ható rugóerők hatására. Ha az első test x 1 egységgel mozdult el a nyugalmi helyzethez képest, akkor a rugó teljes megnyúlása x 1 + L1 . Ekkor ha x 1 + L1 > 0, akkor az első rugó balra visszahúzza az első testet, így a testre az első rugó által ható erő - k 1 ⋅ ( x 1 + L1 ). Ha viszont x 1 + L1 < 0, akkor az első rugó jobbra, azaz pozitív irányba tolja a testet, így ebben az esetben is - k 1 ⋅ ( x 1 + L1 ) adja a rugóerő irányát és nagyságát. A második rugó az eddigi állapotához képest x 2 - x 1 egységgel, azaz az eredeti hosszához képest x 2 - x 1 + L 2 egységgel lesz megnyújtva vagy összenyomva. Mint az előbb, most is ellenőrizhető, hogy mindkét esetben a második rugó k 2 ⋅ ( x 2 - x 1 + L 2 ) erővel hat az első testre. Tegyük fel, hogy az első test és az alap közötti súrlódási együttható c1 . Ekkor a mozgás közben - c1 x& 1 súrlódási erő hat a testre. Ezért Newton I. törvénye szerint teljesül az m1 ⋅ &x&1 = −k 1 ⋅ ( x 1 + L1 ) + k 2 ⋅ ( x 2 − x 1 + L 2 ) − c1 ⋅ x& 1 egyenlet. Ezt az k 1 ⋅ L1 = k 2 ⋅ L 2 összefüggést felhasználva egyszerűsíthetjük: m1 ⋅ &x&1 = −k 1 ⋅ x 1 + k 2 ⋅ ( x 2 − x 1 ) − c1 ⋅ x& 1 Ugyanígy indokolható, hogy a második testre teljesül az
(3.1.13)
m 2 ⋅ &x& 2 = −k 3 ⋅ (− x 2 + L 3 ) − k 2 ⋅ ( x 2 − x 1 + L 2 ) − c 2 ⋅ x& 2 egyenlet, ahol c 2 a második test és az alap közötti súrlódási együttható, és így egyszerűsítés után m 2 ⋅ &x& 2 = −k 3 ⋅ x 2 − k 2 ⋅ ( x 2 − x 1 ) − c 2 ⋅ x& 2 (3.1.14) 68
adódik. Fejezzük x 1 -et a (3.1.14) egyenletből: m 2 ⋅ &x& 2 + c 2 ⋅ x& 2 + (k 2 + k 3 ) ⋅ x 2 k2 és ezt visszahelyettesítjük a (3.1.13) egyenletbe: x1 =
(3.1.15)
m1 k + k2 ⋅ (m 2 ⋅ x (24) + c 2 ⋅ &x&&2 + (k 2 + k 3 ) ⋅ &x& 2 ) = − 1 ⋅ (m 2 ⋅ &x& 2 + c 2 ⋅ x& 2 + (k 2 + k 3 ) ⋅ x 2 ) − k2 k2 −
c1 ⋅ (m 2 ⋅ &x&&2 + c 2 ⋅ &x& 2 + (k 2 + k 3 ) ⋅ x& 2 ) + k 2 ⋅ x 2 k2
Ez egy a 4 ⋅ x (24) + a 3 ⋅ &x&&2 + a 2 ⋅ &x& 2 + a 1 ⋅ x& 2 + a 0 ⋅ x = 0
alakú negyedrendű homogén lineáris egyenlet x 2 -ben, ahol a 4 = m1 ⋅ m 2 a 3 = m 1 ⋅ c 2 + m 2 ⋅ c1
a 2 = m 1 ⋅ ( k 2 + k 3 ) + m 2 ⋅ ( k 1 + k 2 ) + c1 ⋅ c 2 a 1 = c 1 ⋅ ( k 2 + k 3 ) + c 2 ⋅ ( k 1 + k 2 ) + c1 ⋅ c 2 a 0 = k1 ⋅ k 2 + k1 ⋅ k 3 + k 2 ⋅ k 3 Tegyük fel most, hogy a súrlódási erő mindkét testnél elhanyagolható, azaz c1 = c 2 = 0 Feltesszük továbbá, hogy k 1 = k 3 = 2, k 2 = 1, az első testet jobbra egy egységgel, a másodikat pedig balra egy egységgel elmozdítjuk, majd elengedjük a testeket (azaz kezdősebességet nem adunk nekik). Ekkor az x (24) + 6 ⋅ &x& 2 + 8 ⋅ x 2 = 0
egyenletet kapjuk. Ennek karakterisztikus egyenlete: λ4 + 6 ⋅ λ2 + 8 = 0
amiből λ2 = −2 λ2 = −4 azaz λ = ± 2 ⋅ j, ± 2 ⋅ j . Ismerve a karakterisztikus egyenlet gyökeit, felírjuk, hogy x 2 = l1 ⋅ cos( 2 ⋅ t + l 2 ⋅ sin( 2 ⋅ t ) + l 3 ⋅ cos(2 ⋅ t ) + l 4 ⋅ sin( 2 ⋅ t ) Ebből x& 2 = − 2 ⋅ l1 ⋅ sin( 2 ⋅ t ) + 2 ⋅ l 2 ⋅ cos( 2 ⋅ t ) − 2 ⋅ l 3 ⋅ cos(2 ⋅ t ) + 2 ⋅ l 4 ⋅ sin( 2 ⋅ t ) &x& 2 = −2 ⋅ l1 ⋅ cos( 2 ⋅ t ) − 2 ⋅ l 2 ⋅ sin( 2 ⋅ t ) + l 3 ⋅ cos(2 ⋅ t ) + l 4 ⋅ sin( 2 ⋅ t )
Ezért a (3.1.15) képlet szerint x 1 = &x& 2 + 3 ⋅ x 2 = l1 ⋅ cos( 2 ⋅ t ) + ⋅l 2 ⋅ sin( 2 ⋅ t ) − l 3 ⋅ cos(2 ⋅ t ) − l 4 ⋅ sin( 2 ⋅ t )
69
Kiszámítjuk: x& 1 = − 2 ⋅ l1 ⋅ sin( 2 ⋅ t ) + 2 ⋅ l 2 ⋅ cos( 2 ⋅ t ) + 2 ⋅ l 3 ⋅ sin( 2 ⋅ t ) − 2 ⋅ l 4 ⋅ cos(2 ⋅ t ) Az x 1 (0) = 1, x& 1 (0) = 0, x 2 (0) = −1, x& 2 (0) = 0 kezdeti feltételeket felhasználva kiszámítjuk az integrálási együtthatók értékét, és azt kapjuk, hogy: l1 − l 3 = 1 2 ⋅ l2 − 2 ⋅ l4 = 0 l1 + l 3 = −1 2 ⋅ l2 + 2 ⋅ l4 = 0 amiből kiszámíthatjuk, hogy l1 = 0, l 2 = 0, l 3 = −1, l 4 = 0 , azaz a két megoldás: x 1 = cos(2t) és x 2 = -cos(2t)
Harmonikus rezgőmozgást végez mindkét test. A megoldások szimmetriája nyilvánvaló, hiszen a feltételek szerint a rendszer paraméterei is szimmetrikusak voltak. Egy másik lehetőség a (3.1.13)-(3.1.14) rendszer átalakítására az, ha bevezetjük az y1 = x 1 , y 2 = x& 1 , y 3 = x 2 , y 4 = x& 2 új, úgynevezett állapotváltozókat. Ekkor a (3.1.13)-(3.1.14) rendszer ekvivalens alakja: y& 1 = y 2 y& 2 = −
k1 k c ⋅ y1 + 2 ⋅ ( y 3 − y1 ) − 1 ⋅ y 2 m1 m1 m1
y& 3 = y 4 y& 4 = −
k3 k c ⋅ y 3 + 2 ⋅ ( y 3 − y1 ) − 2 ⋅ y 4 m2 m2 m2
Az y = ( y1 , y 2 , y 3 , y 4 ) τ vektor változó tehát teljesíti az y& = A ⋅ y elsőrendű homogén lineáris négydimenziós egyenletrendszert, ahol az A rendszermátrix 0 1 0 0 ⎞ ⎛ ⎟ ⎜ k1 + k 2 c1 k2 0 ⎟ − ⎜− m1 m1 m1 ⎟ A=⎜ 0 0 0 1 ⎟ ⎜ k + k3 k2 c ⎟ ⎜ 0 − 2 − 2 ⎟ ⎜ m m2 m2 ⎠ 2 ⎝ Ilyen lineáris rendszerek megoldásával a következő fejezetekben foglalkozunk.
70
4. Rendszerelméleti alapfogalmak Az alapvető figyelem a rendszerek tanulmányozásában a bemenetek (források) és kimenetek (válaszok) közötti kapcsolatra irányul. Fizikai rendszerek mint az elektromos, hidraulikus, mechanikai, pneumatikus, termikus vagy ezek kombinációja normális esetben mindig integro-differenciál egyenletekkel, valós változójú, valós függvényekkel modellezhetők. A leggyakrabban a valós, független változó az idő. Ugyanakkor beszélhetünk gazdasági, biológiai, társadalmi rendszerekről is de ezek modellezése nem minden esetben oldható meg tisztán matematikai eljárásokkal. Jelölje ezután u1(t), u2(t), ...,um(t) egy folytonos rendszer bemeneteit és y1(t), y2(t), ... , yp(t) a rendszer kimeneteit. Ezek a bemenetek és a kimenetek valós változójú valós függvények. Itt m a bemenetek száma és p a kimenetek számát jelenti. Ezeket a mennyiségeket vektorjelöléssel felírhatjuk mint: ⎛ u 1 (t) ⎞ ⎛ y1 ( t ) ⎞ ⎜ ⎜ ⎟ ⎟ ⎜ u 2 (t) ⎟ ⎜ y 2 (t) ⎟ ; y( t ) = ⎜ u(t) = ⎜ M ⎟ M ⎟ ⎜ ⎜ ⎟ ⎟ ⎜ u (t) ⎟ ⎜ y (t) ⎟ ⎝ m ⎠ ⎝ m ⎠
(4.0.1)
Ebben a jelölési formában az aláhúzott változót vektorként értelmezzük és használjuk az elkövetkezőkben. Fekete dobozként a rendszert ábrázolhatjuk a 4.1. ábrán látható módon.
4.1. ábra 4.1. Fogalmak rendszerekről
Jelöljük az elkövetkezőkben • •
SISO-val az egy bemenet egy kimenetű rendszereket (single input single output = SISO) MIMO-val a több bemenet több kimenetű rendszereket (multiple input, multiple output = MIMO).
Tételezzük fel, hogy ez a rendszer nem rendelkezik olyan bemenettel amely ne lenne direkt kapcsolatban a rendszerrel és nyugalmi állapotban van a bemenő jelek alkalmazása pillanatában (nem rendelkezik kezdeti belső energiával). Ekkor felírhatjuk 71
y( t ) = L ∗ u ( t )
(4.1.1)
Itt az L egy operátor amely a rendszer egy leírását (modelljét) jelenti, a rendszert jellemzi és ténylegesen egy a kimenetek és bemenetek között lehetséges matematikai összefüggéseket jelenti. A * művelet jelenti a rendszer és a bemenő jel kölcsönhatását (vagyis az L hatását a bemenő jelekre). A rendszer determinisztikus, ha minden adott u ( t ) bemenő jelre ugyanazt az y( t ) kimenő jelet kapjuk. Nem determinisztikus vagy más szóval, sztochasztikus a rendszer ha egy adott bemenő jelre egy adott kimenet egy adott valószínűséggel jelenik meg míg egy másik kimenet megjelenése más valószínűséggel rendelkezhet. Ha egy determinisztikus rendszer bemenetén valószínűségi jelet alkalmazunk akkor a rendszer kimente nem lesz determinisztikus. A rendszer nem anticipativ ha a pillanatnyi kimeneti érték nem függ egy ezután következő bemenő értéktől. Ez alapján felírhatjuk, hogy y( t 0 ) értékét u ( t ); t ≤ t 0 bemenő jel és a rendszer tulajdonságai határozzák meg. Ha u ( t ) ≡ 0 minden t ≤ t 0 esetben akkor y( t ) ≡ 0 ha t ≤ t 0 . Egy anticipativ rendszer megsérti az ok-kozati elvet. A rendszer megvalósítható ha nem anticipativ és ha y(t) egy valós függvénye u(t)-nek. Ez nem azt jelenti, hogy meg is lehet valósítani. A megvalósíthatóság általában elvi meggondolás. A rendszer lineáris ha adottak az u 1 ( t ) és u 2 ( t ) bemenő jelek az L rendszermodell, a bemenő jelekre, a rendszer által adott y1 ( t ) és y 2 ( t ) válaszok. Ha létezik C1 és C2 két valós mennyiség úgy, hogy igaz a következő összefüggés: L * (C1 ⋅ u 1 ( t ) + C2 ⋅ u 2 ( t )) = C1 ⋅ L * u 1 ( t ) + C2 ⋅ L * u 2 ( t )
(4.1.2)
akkor lineáris rendszerről beszélünk. Matematikai értelemben a fenti meghatározás magába foglalja a lineáritás két alapvető tulajdonságát: • •
homogenitást szuperpoziciót
A két fogalom matematikai értelmezése a lineáris algebra tárgykörbe tartozik. A rendszer lineáritása az egész rendszer jellemzője, tehát minden bemenetre és kimenetre igaz. A rendszer időben invariáns ha a kimenetek és bemenetek közötti összefüggés nem időben változó operátor. Ezt felírhatjuk mint L * u ( t − λ ) = y( t − λ )
(4.1.3)
ahol λ egy tetszőleges valós érték. Ez azt jelenti, hogy a kimenő jel nagysága és formája nem függ attól a pillanattól amikor a bemenő jelet alkalmazzuk. A jel folytonos jel ha L időben (t ) folytonos függvénnyel írható le és megszámlálható, elsőrendű szakadási pontot tartalmazhat. Ezek szerint a folytonos jel fogalma tágabban értelmezett mint a folytonos függvény fogalma. 72
4.1.1. ábra A 4.1.1. ábrán látható egy jel amely tartalmaz egy elsőrendű szakadási pontot. Az y(t) egy időben változó mennyiség, és az idő a független változó. A jel diszkrét hogy ha az idő mint független változó, csak a valós diszkrét sorozatán vesz fel értékeket. A jel értéke lehet zéró bárhol de a független változó sorozatán vehet fel zérótól eltérő értékeket. Alapvető az amiképpen a független változó diszkrét sorozatát meghatározzuk. Fontos eset az amikor a diszkrét időpillanatokat t = t 0 + k ⋅ T ahol k egy egész szám, módon adjuk meg. Itt T jelenti diszkrét sorozat egymás utáni tagjai közötti időintervallumot (a jel periódusa). Ebben a meghatározásban k a jel független változója. A jel kvantált ha a jel csak egy véges számú (vagy megszámlálható számosságú) értéket vehet fel. A kvantált jel lehet akár folytonos akár diszkrét jel is. Külön osztályt képeznek a digitális jelek. Ezek diszkrét kvantált jelek és az információt egy előre meghatározott kódrendszer hordozza és nem a jelsor amplitúdója vagy/és frekvenciája. Ezekről a jelfajtákról láthatunk egy összefoglalót a 4.1.2 ábrán.
4.1.2. ábra A 4.1.2. ábrán a következő jelöléseket használjuk: f1 időben folytonos jel, f 2 folytonos kvantált jel, f 3 diszkrét jel, f 4 diszkrét kvantált jel, f 5 a kvantálás szintjei, f 6 digitális jel. 4.2. LTI rendszerek
73
Az LTI (Linear, Time-Invariant) rendszerek alapvetően fontos rendszerek. Adott egy y( t ) = L * u ( t ) rendszer. Ha erre a rendszerre érvényes a fentebb megadott két meghatározás amelyek a lineáritás és időbeni invariánciát illetik, akkor az adott rendszert LTI rendszernek nevezzük. Figyeljük meg a két tulajdonságot a következő példák esetében. Példa −t
Legyen y( t ) = e ⋅ u ( t ) az adott rendszer modellje [ y( t ) = L * u ( t ) forma] és
vizsgáljuk meg a linerítását. Ha
−t
u 1 ( t ) ⇒ y1 ( t ) = e ⋅ u 1 ( t ) [ vagyis y1 ( t ) = L ∗ u 1 ( t ) ]
és −t u 2 ( t ) ⇒ y 2 ( t ) = e ⋅ u 2 ( t ) [ vagyis y 2 ( t ) = L ∗ u 2 ( t ) ] Akkor
képezzük u 3 ( t ) = C1 ⋅ u 1 ( t ) + C1 ⋅ u 2 ( t ) a bemenő jelek lineáris kombinációját. Legyen ugyanakkor y 3 ( t ) = L ∗ u 3 ( t ) ahonnan y 3 ( t ) = L * (C1 ⋅ u 1 ( t ) + C 2 ⋅ u 2 ( t )) . Ha igazoljuk, hogy y 3 ( t ) = C1 * y1 ( t ) + C 2 * y 2 ( t ) ≡ L * (C1 ⋅ u 1 ( t ) + C 2 ⋅ u 2 ( t )) akkor a rendszer lineáris. −t y 3 ( t ) = L * u 3 ( t ) = e ⋅ u 3 ( t ) = L * (C1 ⋅ u 1 ( t ) + C 2 ⋅ u 2 ( t )) = −t
−t
−t
= e ⋅ (C1 ⋅ u 1 ( t ) + C 2 ⋅ u 2 ( t )) = C1 ⋅ e ⋅ u 1 ( t ) + C 2 ⋅ e ⋅ u 2 ( t ) =
= C1 ⋅ y1 ( t ) + C 2 ⋅ y 2 ( t ) Tehát a rendszer lineáris.
Vizsgáljuk meg most a rendszer idő szerinti invariánciáját. Egy előző részben bemutatott meghatározás alapján legyen −t −t u 1 ( t ) = u 1 ( t − λ) ⇒ y 2 ( t ) = e ⋅ u 2 ( t ) = e ⋅ u 1 ( t − λ )
Kérdés az, hogy y 2 ( t ) ≡ y1 ( t − λ ) ? − ( t −λ )
De y1 ( t − λ) = e
⋅ u 1 ( t − λ) ≠ y 2 ( t ) .
Tehát a rendszer nem invariáns időben ⊗ Példa
Vegyünk most y( t ) = L * u ( t ) = 4 ⋅ u ( t ) ⋅ u ( t − 1) egy másik rendszermodellt. Azt, hogy a rendszer nem lineáris azt könnyen beláthatjuk, mert a kimenet a benő jel másodfokú formájának függvénye. Ugyanerre az eredményre jutunk ha az előző feladatnál alkalmazott módszert alkalmazzuk. Vizsgáljuk meg most az időbeni invariánciáját. Legyen u 1 ( t ) ⇒ y1 ( t ) = 4 ⋅ u 1 ( t ) ⋅ u 1 ( t − 1) Felírhatjuk 74
u 2 ( t ) = u 1 ( t − λ ) ⇒ y 2 ( t ) = 4 ⋅ u 2 ( t ) ⋅ u 2 ( t − 1) = 4 ⋅ u 1 ( t − λ) ⋅ u 1 ( t − λ − 1) ≡ u 1 ( t − λ) Tehát ez a rendszer időben invariáns. ⊗ Példa
Legyen y( t ) = L ∗ u ( t ) egy LTI rendszer. Mikor igaz az, hogy a rendszer Re{u ( t )} bemenő jelre adott válasza Re{y( t )} (itt Re{} egy komplex változó valós részét jelenti)? u ( t ) + u ( t )* ahol u ∗ ( t ) a bemenő jel komplex konjugáltja. Tudjuk, hogy Re{u ( t )} = 2 Ekkor ⎛ u ( t ) + u 1* ( t ) ⎞ ⎟ = 1 ⋅ L ∗ u ( t ) + 1 ⋅ L ∗ (u * ( t )) = 1 ⋅y ( t ) + 1 ⋅ L ∗ (u * ( t )) és a L∗⎜ 1 1 1 1 ⎟ 2 ⎜ 2 2 2 1 2 ⎠ ⎝ kérdésre adott válasz igen, ha L ∗ (u * ( t )) ≡ L ∗ (u ( t ))* ⊗ 1
1
Példa
Vizsgáljuk meg az y( t ) =
d {u ( t )} = L ∗ u ( t ) rendszert. dt
Lineáritás: Ha u 1 ( t ) ⇒ y1 ( t ); u 2 ( t ) ⇒ y 2 ( t ); u 3 ( t ) = C1 ⋅ u 1 ( t ) + C 2 ⋅ u 2 ( t ) d d d d {u 3 ( t )} = {(C1 ⋅ u 1 ( t ) + C 2 ⋅ u 2 ( t ))} = C1 ⋅ {u 1 ( t )} + C 2 ⋅ {u 2 ( t )} = dt dt dt dt = C1 ⋅ y 1 ( t ) + C 2 ⋅ y 2 ( t ) u 3 (t) ⇒ y 3 (t) =
Tehát a rendszer lineáris. Időbeni invariancia: Ha u 2 ( t ) = u 1 ( t − λ ) akkor y 2 ( t ) = Tehát a rendszer időben invariáns. ⊗
d d u 2 ( t ) = u 1 ( t − λ ) = y1 ( t − λ ) dt dt
Példa
t Legyen y( t ) = u ( ) a rendszer és vizsgáljuk meg az invariánciáját. Lineáris 3
tulajdonsága magától értetődik. Legyen: u 1 ( t ) ⇒ y1 ( t );
t t−λ u 2 ( t ) = u 1 ( t − λ) ⇒ y 2 ( t ) = u 1 ( − λ) ≠ u 1 ( ) = y1 ( t − λ )
Tehát nem időben invariáns rendszer. ⊗
3
3
Megjegyzés: A bizonyítási eljárás azonos diszkrét rendszerek esetében is. 75
4.3. Rendszerek tulajdonságai
Egy rendszert úgy is tekinthetjük mint összekapcsolt operátorokat (elemeket), amely szerepe a bemenő jel átalakítása kimenő jellé. Ha most H-val jelöljük az összekapcsolással keletkező eredő operátort, akkor bármely rendszer felírható mint: • •
y( t ) = H{u ( t )} folytonos rendszer esetében y[n ] = H{u[n ]} diszkrét rendszer esetében
1. Memória: Egy rendszer memóriával rendelkezik, ha a kimenő jel függ a bemenő jel előző vagy elkövetkező értékétől. Az előző vagy elkövetkező értékek a független idő-változó vonatkozásában értendők. (egy ellenállás memórianélküli, míg egy L induktivitású tekercs vagy egy C kapacitású kondenzátor memóriával rendelkező rendszer) 2. Kauzalitás: Egy rendszer kauzális ha a kimenő jel csak a bemenő jeltől és esetleg a bemenő jel előző értékeitől függ és nem egy elkövetkező bemenő jeltől. Példa • y[n ] = 13 ⋅ (u[n ] + u[n − 1]) kauzális •
y[n ] = 13 ⋅ (u[n + 1] + u[n ]) pedig egy nem kauzális rendszer
3. Megfordíthatóság: Egy rendszer megfordítható, hogy ha a rendszer bemenete visszaállítható ha rendelkezésünkre áll a rendszer kimenete. Legyen H operátor amely egy folytonos idejű rendszert jellemez, bemenete u(t), kimenete y(t). A rendszer megfordítható, ha létezik egy H inv operátor amely eleget tesz a következő összefüggésnek ha: y( t ) = H{u ( t )} akkor u ( t ) = H inv {y( t )}
(4.3.1)
Ekkor felírhatjuk H inv {y( t )} = H inv {H{u ( t )}} = H inv o H{u ( t )} ⇒ H inv o H = I Itt I az identitás operátort jelenti. Példa t
• •
1 d y( t ) = ⋅ ∫ u (τ) ⋅ dτ ⇒ u ( t ) = L ⋅ y( t ) megfordítható rendszer L −∞ dt y( t ) = u 2 ( t ) nem megfordítható mert a kimenő jelből nem lehet egyértelműen meghatározni a bemenő jelet.
76
4. Időbeni invariáncia: Bevezetjük a következő jelölést: y( t ) = u ( t − t 0 ) = S t 0 {u ( t )}
(4.3.2)
Itt S t 0 egy eltolási operátor míg S − t 0 egy inverz operátor. Egy rendszer időben invariáns ha időbeli eltolás a bemenő jelen ugyanolyan eltolást eredményez a kimenő jelen is. Ez azt jelenti, hogy a rendszer válasza ugyanaz, függetlenül, hogy mikor alkalmaztuk a bemenő jelet (a rendszer nem változik időben). Legyen H egy folytonos rendszert jellemző operátor. Figyeljük meg a 4.3.1. ábrán látható két történést:
4.3.1. ábra Ha a rendszer időben invariáns, akkor a két fenti történés ekvivalens. Ez azt jelenti, hogy y 2 ( t ) = y1 ( t − t 0 ) , vagyis mindegy, hogy mit végzünk el előbb, az időeltolást, vagy a H operátor adta műveletét mert egy időben invariáns rendszer esetében ez nem számít. Ezt felírhatjuk, mint: H o St0 = St0 o H
(4.3.3)
Ez azt jelenti, hogy a 4.3.3 esetben két (jobb és baloldali) operátor kommutál. 5. Lineáris rendszer: Legyenek u 1 ( t ), u 2 ( t ),L , u n ( t ), u ( t ) bemenő jelek, y1 ( t ), y 2 ( t ),L , y n ( t ), y( t ) kimenő jelek
és itt t a független változó. A rendszer lineáris a be- és kimenő jelekre nézve ha eleget tesz két feltételnek: a. Szuperpozició u 1 → y1 u 2 → y2
⇒ u 1 + u 2 → y1 + y 2
(4.3.4)
77
b. Homogenitás u → y ⇒ a ⋅ u → a ⋅ y ahol a egy valós szám.
(4.3.5)
Általános esetben, vegyük a bemenő jelek lineáris kombinációját, vagyis n
u(t) = ∑ a i ⋅ ui (t) i =1
ekkor n
n
i =1
i =1
y( t ) = H{u ( t )} = H{∑ a i ⋅ u i ( t )} = ∑ a i ⋅ y i ( t ) ahol y i ( t ) = H{u i ( t )} vagyis a kimenet (y(t)) az n kimenő jel lineáris kombinációja. Ezt az elvet így ábrázolhatjuk:
4.3.2. ábra Ha a H rendszer lineáris, akkor a 4.3.2. ábrán a jobb és baloldali diagram ugyanazt a rendszert jelenti. Példa
Adott a következő ki/bemenő összefüggés y( t ) = u ( t ) ⋅ u ( t − 1) . Válasszuk most n
u(t) = ∑ a i ⋅ ui (t) . i =1
Ekkor felírjuk, hogy: n
n
i =1
j=1
n
n
y( t ) = ∑ a i ⋅ u i ( t ) ⋅ ∑ a j ⋅ u j ( t − 1) = ∑∑ a i ⋅ a j ⋅u i ( t ) ⋅ u j ( t − 1) i =1 j=1
és innen következik, hogy ez a rendszer nem lineáris (ez előrelátható volt, mert a rendszert leíró y(t) egy másodfokú kifejezés és ez nem lineáris forma). Példa
78
Adott y[n ] = n ⋅ u[n ] Tanulmányozzuk a rendszer a lineáritását. Legyen n
u[n ] = ∑ a i ⋅ u i [n ] i =1
ekkor következik, hogy n
y[n ] = n ⋅ ∑ a i ⋅ u i [n ] i =1
majd innen n
n
i =1
i =1
y[n ] = ∑ a i ⋅ n ⋅ u i [n ] = ∑ a i ⋅ y i [n ] és ez azt jelenti, hogy a rendszer lineáris.
79
5. Rendszerek állapotteres leírása Legyen adott egy SISO, lineáris, ismert felépítésű áramkör. Legyen az áramkör ismert bemenete u ( t ) valamint kimenő jele y( t ) . Mivel az áramkör ismert, ezért elégséges a bemenő jel teljes ismerete − ∞→ t intervallumban ahhoz, hogy meghatározhassuk a kimenő jelet ugyanabban a t időpillanatban. Ellenben, ha u ( t ) csak t 0 → t időtartományban ismert, akkor szükségünk van kezdeti feltételekre (a tekercsen t1 pillanatban átfolyó áram erőssége, valamint a
kondenzátoron található töltésmennyiség ugyancsak a t1 pillanatban amikor t 0 ≤ t1 ≤ t
és általában
t1 = t 0 ), ahhoz, hogy a rendszer y( t ) kimenetét
meghatározhassuk. Ekkor a tekercsen átfolyó áram és a kondenzátoron levő feszültségesés a t1 pillanatban jelentik a rendszer állapotait (a rendszer memoráló elemei). Ha az áramkör csak egy ellenállást tartalmaz akkor a kimenet a t1 pillanatban meghatározható tisztán csak a t1 pillanati bemenetből. Általánosabban tekintve és figyelembe véve, hogy az előbb felvázolt áramkör modellje egy konstans együtthatós differenciálegyenlet, az egyenletet megoldva a t1 pillanati kezdeti feltételeket felhasználva, megkapjuk a rendszer kimenő jelének időbeni változását. Elvileg ez nem más mint a rendszer jövőbeli viselkedése felírva a rendszer t1 időpontbeli állapota függvényében. A t1 pillanat elválasztja a rendszer t1 előtti és t1 utáni viselkedését. Egy rendszer állapota alapfogalom, így nem igényel más meghatározást, elégséges megértéséhez a tulajdonságai felsorolása. Az elkövetkezőkben az állapotteres leírás módszerét csak determinisztikus, folytonos és diszkrét rendszerek esetében alkalmazzuk. Egy determinisztikus rendszer a következő tulajdonságokkal rendelkezik : •
u(t) időfüggvények a rendszer elfogadható bemeneti jelei [vektorfüggvények]
•
minden t pillanatra meghatározható az X t vektorhalmaz úgy, hogy ennek elemei x ( t ) [vektor függvények], a rendszer lehetséges állapotai t pillanatban.
•
minden u ( t ), x ( t ) párhoz hozzárendelhető legalább egy, időben változó függvény amelyet kimenő jelnek [jeleknek] nevezünk, úgy, hogy minden t 1 > t esetében egyetlen egy x ( t 1 ) található X t1 halmazban.
Ha a második tulajdonság biztosítja az állapottér időbeni változását, addig a harmadik tulajdonság a végső [terminális] vagy kimenő állapot fogalmát rögzíti. Ahhoz, hogy az így meghatározott X t állapotteret a rendszer leírására használhassunk, szükséges, hogy eleget tegyen a következő három konzisztencia feltételeknek. 1. Egy u 3 (t ) elfogadható bemenet, ha u1 ( t ) , u 2 ( t ) elfogadható bemenetek és u 3 ( t ) = u1 ( t ) t ≤ t 0 és u 3 ( t ) = u 2 ( t ) t > t 0 (lásd 5.0.1. ábrát)
80
5.0.1. ábra 2. Az a történés ahogy a rendszer elérte a t 0 pillanatbeli állapotait nem befolyásolja az elkövetkező kimeneteit. A pillanatnyi és jövőbeli bemenetek egyértelműen meghatározzák a rendszer pillanatnyi és jövőbeli kimeneteit. Ezért minden x ( t 0 ) ∈ X t 0 és elfogadható u1 ( t ) és u 2 ( t ) bemenő jelek esetében amikor u 2 ( t ) = u1 ( t ) t > t 0 , akkor bármely ( x ( t 0 ), u1 ( t )) párhoz tartozó kimenő jel identikusan azonos az ( x ( t 0 ), u 2 ( t )) párhoz asszociálható kimenő jellel ha t > t 0 . Hasonlóan értelmezzük más időbeni lefutású jelek esetében is. ( v1 ( t ), v 2 ( t ) bemenő jelek) Ezt érzékelteti az 5.0.2. ábra.
5.0.2. ábra 3. Ha a rendszernek adott a kezdeti állapota t 0 pillanatban és a bemenő u ( t ) függvény akkor a kimenő y( t ) függvény egyértelműen meghatározott. A felsorolt három konzisztencia kritériumot egy egyenlet pár formájában foglalhatunk össze és ezek képezik az állapotegyenleteket. 81
y( t 0 , t ) = g ( x ( t 0 ), u ( t 0 , t )) x ( t ) = f ( x ( t 0 ), u ( t 0 , t ))
(5.0.1)
Az x ( t ) állapotvektor n dimenziós és egy X t állapottér eleme. Az x ( t ) vektor komponensei (koordinátái) egy adott t pillanatban felírhatók mint x 1 ( t ), x 2 ( t ),K, x n ( t ) .
Az állapotvektor által időben az X t állapottérben felvett állapotok összességet állapotváltozásnak nevezzük (ha az állapottér minden vektorát egy pontként értelmezzük akkor ebben az állapottérben az állapotváltozás neve pálya). Formális szempontból a következő jelöléseket használjuk: x ( t ) ∈ X t a rendszer állapota a t időpillanatban ahol az n dimenziós állapotvektor felírható mint: ⎛ x1 ( t ) ⎞ ⎟ ⎜ ⎜ x 2 (t) ⎟ x(t) = ⎜ ahol x 1 ( t ), x 2 ( t ),K, x n ( t ) az állapotváltozók. M ⎟ ⎟ ⎜ ⎜ x (t) ⎟ ⎝ n ⎠ Egy rendszer állapotát t = t 0 pillanatban n darab állapotváltozó írja le, úgy hogy ha adott az u ( t ), t ≥ t 0 bemenő vektor akkor a rendszer y( t ) kimenetelei meghatározottak t ≥ t 0 esetében. 5.1. Folytonos rendszerek leírása az állapottérben
Számos tudományos és mérnöki terület használja dinamikus rendszerek leírására az úgynevezett állapotegyenleteket. Az állapotteres leírás szükségességét többféle módon származtatják. Talán a legegyszerűbb annak a felismerése, hogy bonyolult dinamikus rendszerek igen széles osztályának működését viszonylag nagy pontossággal modellezhetjük elsőrendű vektor differenciálegyenlettel amely ebben az esetben, egyszerűbb formában felírva d x(t) = x& ( t ) = f ( x , u ) (5.1.1) dt y = g( x, u ) Az állapotváltozónak nevezett x vektor a skaláris x i komponenseket (állapotokat) rendezi vektorba. Az u a rendszer bemenő, az y pedig a kimenő jele. Az x állapotvektor dimenzióját a rendszer rendjének nevezzük. Az f ( x , u ) függvény az állapotvektor "sebességét" adja az állapot és a bemenőjel függvényében. A g ( x , u ) függvényt érzékelési illetve mérési függvénynek nevezzük, mivel a rendszer kimenőjelét szolgáltatja. Vegyük észre, hogy itt f ( x , u ) és g ( x , u ) nem függ explicit módon az időtől. (Ezt a tulajdonságot ne tévesszük össze azzal, hogy az állapotegyenlet be és kimenő jelei függnek időtől) Az ilyen rendszereket idő-invariánsnak nevezzük. Az állapotváltozókat olyan változóknak is szokták hívni, amelyek összefoglalják a
82
rendszer múltjára vonatkozó információkat, hogy a jelek jövőbeli értékeit jósolni tudjuk, ezért az állapotvektor a rendszer memóriáját is jelentheti. Mérnöki rendszerekben az állapotváltozók igen sokszor kapcsolódnak olyan alapvető fizikai folyamatokhoz, ahol tömeg, áram, impulzus, energia, stb. tárolásához szükséges összefüggéseket kell kiszámítanunk. (Felhívjuk a figyelmet, hogy egyes szakterületeken - például kémiában - az állapotváltozó megnevezés nem egyezik meg a fenti általános rendszerelméleti fogalommal, sokkal inkább a vizsgálat tárgyát képező anyag, elegy, oldat, stb. fizikai-kémiai állapotára utaló változókat jelenti) Az állapotváltozók, mint koordináták egy teret - az állapotteret (state space) definiálnak. Ebben a térben helyezkedik el az x(t ) állapotvektor. Az állapotvektor végpontjának elmozdulása jelenti a rendszer állapottérben való mozgását. Az állapotvektor végpont-ja által leírt görbe az állapot trajektória. Az általános állapotegyenletekhez viszonyítva 5.1.1 egyenlet párral adott rendszer a nemlineáris dinamikus rendszerek egy speciális osztályát jelenti, amelynek lehetséges ( x 0 , u 0 ) egyensúlyi állapota (ahol x& ( t 0 ) = 0 azaz a változás sebessége nulla), amely az f (x 0 , u 0 ) = 0
(5.1.2)
egyenletből adódik. (Jegyezzük meg, hogy általános esetben több egyensúlyi állapot is adódhat. Az egyensúlyi állapotok különböző jellegű stabilitási állapotokat jelenthetnek. Ezek minőségi vizsgálatához az f ( x , u ) másodrendű deriváltjainak vizsgálata is szükséges.) Statikus rendszerek elfajult állapotegyenlettel írhatók le, hiszen nincs memóriájuk, illetve az ennek megfelelő állapotuk, tehát leírásukhoz a 5.1.1 egyenletrendszer második egyenlete is elegendő, vagyis: y = g(u ) Taylor sorbafejtve a most skaláris egyenletet az u 0 pontban az dg (u 0 ) y = g(u 0 ) + (u − u 0 ) + L du alakra jutunk, amelynek elsőrendű tagjából az dg (u 0 ) dg (u 0 ) y − y 0 = Δy = y − g (u 0 ) = (u − u 0 ) = Δu du du lineárizált modelljét kapjuk. A linearizált modell az u 0 munkapontban az eredeti görbét az érintőjével helyettesíti és a munkapont körüli (Δy, Δu ) változások között teremt statikus lineáris kapcsolatot. Lényegében hasonló gondolatmenet alapján végezhetjük el a 5.1.1 állapotegyenlet linearizálását is. Az egyensúlyi állapot ( x 0 , u 0 ) körüli kis változásokra érvényes x = x 0 + Δ x; u = u 0 ; y = y 0 + Δy jelölésekkel számítsuk ki a 5.1.1 elsőrendű linearizált közelítését df ( x 0 , u 0 ) df ( x 0 , u 0 ) dx = f ( x 0 + Δ x , u 0 + Δu ) ≈ f ( x 0 , u 0 ) + ⋅ Δx + ⋅ Δu τ dt du dx y = g ( x 0 + Δ x, u 0 + Δu ) ≈ g ( x 0 , u 0 ) +
dg ( x 0 , u 0 ) dg ( x 0 , u 0 ) ⋅ Δx + ⋅ Δu τ du dx
83
Használjuk fel, hogy az egyensúlyi pontban f ( x 0 , u 0 ) = 0 és vezessük be az y 0 = g ( x 0 , u 0 ) jelölést, így a kis változásokra érvényes linearizált modellünk az alábbi formájú lesz d ( x − x 0 ) dΔ x = = A ⋅ ( x − x 0 ) + B ⋅ (u − u 0 ) = A ⋅ Δ x + B ⋅ Δu dt dt y − y 0 = C τ ⋅ ( x − x 0 ) + D ⋅ (u − u 0 ) = C τ ⋅ Δ x + D ⋅ Δu ahol bevezettük az A= τ
df ( x 0 , u 0 )
C =
dx τ dg( x 0 , u 0 )
B=
df ( x 0 , u 0 ) du
dg( x 0 , u 0 ) D= du
dx τ
(5.1.3)
jelöléseket. A kapott modell egy lineáris idő invariáns (Linear Time-Invariant = LTI), azaz időben nem változó rendszer modellje. Eléggé elterjedt gyakorlat, hogy az egyszerűség kedvéért a jelölt változások Δ x , Δu , Δy helyett az eredeti x , u , y változókat használjuk és mindig munkapont körüli változásokra gondolunk. Így kapjuk a rendszer- és irányításelmélet általánosan használt lineáris (LTI) állapotegyenletét
dx = A ⋅ x + B⋅u dt
(5.1.4)
τ
y = C + D⋅u Itt A, B, C τ , D a rendszer paraméter mátrixai. Mivel itt egybemenetű - egy kimenetű (Single Input - Single Output = SISO) rendszerekkel foglalkozunk, ezért nedrendű esetben az A egy n x n -és négyzetes mátrix, az állapotmátrix, a B egy n x 1-és oszlopvektor, a C τ egy 1 x n-és sorvektor és D skaláris mennyiság. Az elkövetkezőkben C τ -t mint C fogjuk jelölni, ha ez nem okoz félreértelmezést. A 5.1.4 állapotegyenletnek megfelelő blokkvázlat az 5.1.1. ábrán látható.
5.1.1 ábra Lináris idő invariáns rendszer állapotegyenletének megfelelő blokkvázlat 84
A blokkvázlat fogalmára és elkészítési módjára későbbiekben még visszatérünk. 5.2. Fázistér
Adott egy n-ed rendű differenciálegyenlet, amely egy LTI rendszer modellje (SISO) dy( t ) d 2 y( t ) d n −1 y( t ) d n y( t ) + ⋅ + K ⋅ + a1 ⋅ + a 0 ⋅ y( t ) = u ( t ) (5.2.1) a a n −1 2 n n −1 2 dt dt dt dt Ez az egyenlet egyértelműen felírható n darab elsőrendű differenciálegyenletrendszerrel. Bevezetjük az 5.2.2 jelöléseket: x 1 ( t ) = y( t ) x 2 ( t ) = y& ( t ) = x& 1 ( t ) x 3 ( t ) = &y&( t ) = x& 2 ( t ) LLLLLLLL
(5.2.2)
x n −1 ( t ) = y ( n − 2) ( t ) = x& n −2 ( t ) d n y( t )
x& n ( t ) =
dt n
dy( t ) vagyis a kimenő jel a független t időváltozó szerinti deriváltja. dt Ekkor a differenciálegyenlet felírható mint ahol y& ( t ) ≡
x& n ( t ) = u ( t ) − a n −1 ⋅
d n −1y( t ) d 2 y( t ) dy( t ) −L− a2 ⋅ − a1 ⋅ − a 0 ⋅ y( t ) n − 1 2 dt dt dt
Ha ebbe behelyettesítjük az előzőleg meghatározott xi (t ) állapotváltozókat (5.2.2) és így a következő egyenletet kapjuk x& n ( t ) = u ( t ) − a n −1 ⋅ x n −2 ( t ) − a n −2 ⋅ x n −1 ( t ) − L − a1 ⋅ x 2 ( t ) − a 0 ⋅ x1 ( t ) (5.2.3) amely egy elsőrendű differenciálegyenlet xn (t ) állapotváltozóban. Nem homogén az egyenlet és a bemenetet és az összes előző állapotváltozót tartalmazza. Mátrixegyenlet formájában is felírható az 5.2.2 egyenletrendszer ha felhasználjuk az 5.2.3 egyenletet is, vagyis
⎛ 0 ⎛ x& 1 ( t ) ⎞ ⎜ ⎟ ⎜ 0 ⎜ ⎜ x& 2 ( t ) ⎟ = ⎜ ⎜ x& ( t ) ⎟ ⎜ 0 ⎝ n ⎠ ⎜− a ⎝ 0
1 0 0 − a1
0 1 0 − a2
0 0 1 − a3
0 ⎞ ⎟ ⎛ x 1 (t) ⎞ ⎛ 0 ⎞ ⎟ ⎜ ⎟ 0 ⎟ ⎜ ⋅ ⎜ x 2 (t) ⎟ + ⎜ 0 ⎟ ⋅ u(t) ⎟ 0 ⎟ ⎜⎝ x n ( t ) ⎟⎠ ⎜⎝ 1 ⎟⎠ − a n −1 ⎟⎠
⎛ x1 (t) ⎞ ⎟ ⎜ y( t ) = (1 0 0) ⋅ ⎜ x 2 ( t ) ⎟ ⎜ x (t) ⎟ ⎝ n ⎠ 85
Ugyanezt vektorjelöléssel felírhatjuk mint ⎧x& ( t ) = A ⋅ x ( t ) + B ⋅ u ( t ) ⎨ y( t ) = C ⋅ x ( t ) ⎩
(5.2.4)
Ahol ⎛ x& 1 ( t ) ⎞ ⎟ ⎜ x& ( t ) = ⎜ x& 2 ( t ) ⎟; ⎜ x& ( t ) ⎟ ⎝ n ⎠
⎛ x1 ( t ) ⎞ ⎟ ⎜ x ( t ) = ⎜ x 2 ( t ) ⎟; ⎜ x (t) ⎟ ⎝ n ⎠
dim( x ) → n x 1
Mivel a fenti egyenleteket egy SISO rendszerre írtuk fel, tehát y(t) és u(t) skaláris függvények. Ebben az esetben az A , B , C mátrixokról felírhatjuk. dim(A ) → n x n dim(B) → n x 1 dim(C ) → 1 x n
(5.2.5)
Egy több bemenet több kimenetű (MIMO) rendszer esetében, amikor m a bemenetek száma míg p a kimenetek száma akkor dim(B) → n x m dim(C) → p x n
(5.2.5a)
Ennek a mátrix differenciálegyenlet rendszernek a megoldása az A , B , C mátrixok tulajdonságaitól függ. Az így kapott állapotváltozókat fázisváltozóknak is nevezzük és a megfelelő állapotteret fázistérnek nevezzük.
Példa Adott az 5.2.1. ábrán látható RLC áramkör (rendszer)
5.2.1. ábra Ennek a rendszernek a bemenete az u(t) feszültség míg a kimenete a kondenzátoron a feszültségesés, vagyis y(t). 86
A feszültségegyenlet az áramkörben u ( t ) = R ⋅ i( t ) + L ⋅
di( t ) 1 + ∫ i( t )dt dt C
vagy másképpen felírva di( t ) R 1 1 = − ⋅ i( t ) − ⋅ ∫ i( t )dt + ⋅ u ( t ) dt L L⋅C L legyenek az állapotváltozók x1 és x2 amelyek a tekercsen (a kondenzátoron) átfolyó áramerősséget és a kondenzátoron levő feszültséggel arányos mennyiségek jelentik tehát x 1 = i( t ) és x 2 = ∫ i( t )dt . Így dx 1 (t ) R 1 1 = − ⋅ x 1 (t ) − ⋅ x 2 (t ) + ⋅ u (t ) dt L L⋅C L dx 2 (t ) = x 1 (t ) dt 1 y (t ) = ⋅ x 2 (t ) C Ennek mátrixok alkalmazásával felírt alakja: ⎛ x& 1 ⎞ ⎛⎜ − R ⎜⎜ ⎟⎟ = ⎜ L ⎝ x& 2 ⎠ ⎝ 1 ⎛ y = ⎜0 ⎝
−
1 ⎞ ⎛x ⎞ ⎛ 1⎞ 1 ⎟ ⎜ ⎟ L ⋅ C ⎟ ⋅ ⎜⎜ ⎟⎟ + ⎜ L ⎟ ⋅ u x 0 ⎠ ⎝ 2⎠ ⎝0⎠
(5.2.6)
1 ⎞ ⎛ x1 ⎞ ⎟ ⋅ ⎜ ⎟ + (0 ) ⋅ u C ⎠ ⎜⎝ x 2 ⎟⎠
RLC rendszer állapotegyenletei, vagy állapotegyenlet rendszere, x 1 és x 2 az állapotváltozók. Ez egy másodrendű rendszer mert az áramkör két energiatárolót tartalmaz (tekercs és kondenzátor). Rendszer mátrixait felírtuk mint: ⎛ R − A=⎜ L ⎜ ⎝ 1
−
⎛1⎞ 1 ⎞ ⎟ ; B = ⎜ ⎟ ; C = ⎛ 0 1 ⎞ ; D = (0 ) ; ⊗ ⎜ ⎟ L⋅C⎟ L⎟ ⎜ C ⎝ ⎠ 0 ⎠ ⎝0⎠
Példa
Az 5.2.2. ábrán látható hidraulikus rendszer két A1 és A 2 keresztmetszetű (alapterületű) tartályból áll. A két tartályban a folyadék szintmagassága h 1 ( t ) valamint h 2 ( t ) . A csővezeték hidraulikus ellenállása lineáris közelítéssel legyen R 1 és R 2 . A q( t ) , q 1 ( t ) és q 2 ( t ) folyadékhozamot jelentenek. Legyen a rendszer bemenete a q(t) hozzáfolyás, míg a kimenet a q 2 ( t ) áramlás. 87
5.2.2. ábra A tartályokban a folyadéktömeg változását a következő egyenletek írják le: dh 1 ( t ) = q ( t ) − q1 ( t ) dt dh ( t ) = q1 ( t ) − q 2 ( t ) A2 ⋅ 2 dt A1 ⋅
A hozzáfolyást és a kimeneti áramlást a következő egyenletek adják: h (t) − h 2 (t) q1 (t ) = 1 R1 h 2 (t) R2 Így a következő állapotegyenleteket kapjuk: q 2 (t) =
A1 ⋅
dh 1 ( t ) h 1 ( t ) − h 2 ( t ) = + q( t ) dt R1
A2 ⋅
dh 2 ( t ) h 1 ( t ) − h 2 ( t ) h 2 ( t ) = − dt R1 R2
Ha ⎛ x (t) ⎞ ⎛ h (t) ⎞ x ( t ) = ⎜⎜ 1 ⎟⎟ = ⎜⎜ 1 ⎟⎟; u ( t ) = q ( t ); y( t ) = q1 ( t ) ⎝ x 2 (t) ⎠ ⎝ h 2 (t) ⎠
akkor x& 1 = −
1 1 ( x1 − x 2 ) + ⋅u R 1 ⋅ A1 A1
x& 2 = −
1 1 ( x1 − x 2 ) + ⋅ x2 R1 ⋅ A 2 R 2 ⋅ A2
y=
1 ( x1 − x 2 ) R1
88
Innen felírhatjuk az állapotteres egyenleteket: 1 ⎛ − ⎜ ⎛ x&1 ⎞ ⎜ R1 ⋅ A1 ⎜⎜ ⎟⎟ = ⎝ x& 2 ⎠ ⎜ − 1 ⎜ R ⋅A 1 2 ⎝
⎞ ⎟ ⎛ 1 ⎞ ⎟ ⋅ ⎛⎜ x1 ⎞⎟ + ⎜ A ⎟ ⋅ u 1 1 ⎟ ⎜⎝ x 2 ⎟⎠ ⎜⎜ 1 ⎟⎟ + ⎝ 0 ⎠ (5.2.7) R1 ⋅ A2 R2 ⋅ A2 ⎟⎠ ⎛ 1 1 ⎞ ⎛x ⎞ y = ⎜⎜ − ⎟⎟ ⋅ ⎜⎜ 1 ⎟⎟ + (0) ⋅ u R1 ⎠ ⎝ x 2 ⎠ ⎝ R1 Ez is egy másodrendű rendszer. Látható, hogy modell szinten a két egyenletrendszer, az 5.2.6 és 5.2.7 azonos struktúrájú és csak a rendszer mátrixai felépítése szempontjából különbözne. Ezt fontos figyelemmel követni az elkövetkezőkben is mert ez biztosítja a rendszerek állapotteres leírásának egységes tárgyalási lehetőségét. 1 R1 ⋅ A1
Példa Legyen egy fizikai inga ahol egy 1m hosszú nyújthatatlan cérnára egy 1kg tömeg van felfüggesztve (5.2.3. ábra). A súrlódást elhanyagolva és egy T kimozdító nyomaték figyelembevételével, az inga mozgását a következő differenciálegyenlet írja le: d 2θ dt 2
= −g ⋅ sin(θ) + T
5.2.3. ábra Legyen az inga modelljének állapotváltozói x 1 = θ; x 2 = θ& . A bemenet u(t)=T míg a kimenet y= θ. Az inga állapotegyenletei felírhatók mint x2 ⎛ x& ⎞ ⎛ f ( x , u, t ) ⎞ ⎛ ⎞ ⎟⎟ = ⎜⎜ ⎟⎟ x& = ⎜⎜ 1 ⎟⎟ = ⎜⎜ 1 ⎝ x& 2 ⎠ ⎝ f 2 ( x , u , t ) ⎠ ⎝ − g ⋅ sin( x1 ) + u ⎠ y = g( x, u, t ) = x1 Az inga egyensúlyi állapotát
89
⎛ d 2θ ⎞ dθ ⎜ ⎟ a θ = arcsin( T ) és a = 0 ; = 0 ⎜ dt 2 ⎟ dt g ⎝ ⎠ ⎛ x ⎞ ⎛θ ⎞ x(0) = ⎜⎜ 10 ⎟⎟ = ⎜⎜ d ⎟⎟ ⎝ x 20 ⎠ ⎝ 0 ⎠ kezdeti állapotvektor adja. Lineárizáljuk a munkapont körül az előbbi állapotegyenleteket ha az elsőrendű differenciálokat kiszámítjuk a következő módon: ∂x 2 ⎛ ⎜ ∂f ∂x 1 | x 0 ,u 0 = ⎜ ⎜ ∂ ( −g ⋅ sin( x 1 ) + u ) ∂x ⎜ ∂x 1 ⎝
∂x 2 ⎞ ⎟ 0 1⎞ ⎛ ∂x 2 ⎟| ⎟⎟ = ⎜⎜ x , u 0 0 ∂ ( −g ⋅ sin( x 1 ) + u ) ⎟ ⎝ − g ⋅ cos( x 10 ) 0 ⎠ ⎟ ∂x 2 ⎠
∂x 2 ⎞ ⎛ ⎟ ⎜ ⎛0⎞ f ∂ ∂u ⎟ | x ,u = ⎜⎜ ⎟⎟ | x 0 ,u 0 = ⎜ ∂u ⎜ ∂ (−g ⋅ sin( x 1 ) + u ) ⎟ 0 0 ⎝ 1 ⎠ ⎟ ⎜ ∂u ⎠ ⎝ ∂x ∂g | x 0 ,u 0 = 1 = 1 ∂x 1 ∂x 1 ∂x ∂g | x 0 ,u 0 = 1 = 0 ∂u ∂u Így a nemlineáris egyenletrendszer lineárizált állapotegyenletei: 0 1⎞ 0 1⎞ ⎛ ⎛ ⎛ 0⎞ ⎛ 0⎞ ⎟⎟ ⋅ Δ x + ⎜⎜ ⎟⎟ ⋅ Δu = ⎜⎜ ⎟⎟ ⋅ Δ x + ⎜⎜ ⎟⎟ ⋅ Δu Δ x& = ⎜⎜ ⊗ ⎝1⎠ ⎝1⎠ ⎝ − g ⋅ cos( x10 ) 0 ⎠ ⎝ − g ⋅ cos(θ d ) 0 ⎠ Δy = (1 0) ⋅ Δ x
5.3. LTI rendszerek állapotteres leírása szimulációs diagramok alapján
Rendszerek állapotteres leírásának egyik módszere a szimulációs diagramok használata. A módszer előnye abban mutatkozik, hogy könnyen alkalmazható és a megfelelő diagram megválasztásával a keresett állapotteres formát egyértelműen felírhatjuk.
5.3.1. ábra 90
Az 5.3.1. ábrán látható ideális művelet végrehajtó elemeket használjuk, hogy egy lineáris differenciálegyenletet úgynevezett szimulációs blokkdiagram alakra hozzunk (analóg számítógépek programozásában alkalmazott módszer alapján került bevezetésre és ideális, zajmentes elemek).A szimulációs blokkdiagram alapján felírjuk a differenciálegyenlettel modellezett dinamikus rendszer állapotteres egyenleteit. A különböző diagramok különböző állapotteres felírást eredményeznek. Így a rendszer tanulmányozása (szabályzás, különböző stabilitási módszerek, megfigyelhetőség stb.) különböző állapotteres felírást kér. Egy n-ed rendű rendszer, vagyis egy n-ed rendű differenciálegyenlet esetében, az egymás utáni n-szeres integrálás (nulla kezdeti feltételeket használva) az út a diagram elkészítéséhez. Így a legmagasabb rendű deriváltan végzett integrálás sor vezet a diagram elkészítéséhez. Lássunk néhány példát a diagramok elkészítésére (az elkövetkezőkben y( t ) ≡ y, u ( t ) ≡ u jelölést használjuk és ha az összegező esetében nem szerepel bemeneti ‘+’ vagy ‘-‘ előjel akkor azt pozitívnak tekintjük ) 1. Ha adott a következő differenciálegyenlet &y& + a ⋅ y& + b ⋅ y = u ⇒
&y& = − a ⋅ y& − b ⋅ y + u
(5.3.1)
Az 5.3.1 egyenlet kettős integrálásával kapjuk a következő, 5.3.2. ábrán látható diagramot.
5.3.2. ábra 2. Ha adott a következő differenciálegyenlet
&y& + a ⋅ y& + b ⋅ y = u + u& akkor az előző esethez képest a változás az u& tag jelenléte az egyenlőség jobb oldalán. Az u& + u tagot előállíthatnánk a bemenő u jelből, ha a rendszer bemenetéhez egy deriváló blokkot adunk amint azt az 5.3.4. ábrán láthatunk.
5.3.4. ábra
91
De egy deriváló elem általában erős zajforrás ezért kerüljük ennek használatát. Ezért a differenciálegyenletet a következő képen módosítjuk: &y& − u& = −a ⋅ y& − b ⋅ y + u Így az első integrátor bemenete nem &y& , hanem &y& − u& és ennek megfelelően az 5.3.5. ábrán látható szimulációs diagramot kapjuk:
5.3.5. ábra 3. Legyen most adott a következő differenciálegyenlet &y& + a ⋅ y& + b ⋅ y = c ⋅ u + d ⋅ u& + e ⋅ &u& (a,b,c,d,e konstans mennyiségek) Első lépésként ezt
&y& − e ⋅ &u& − d ⋅ u& = c ⋅ u − b ⋅ y − a ⋅ y&
(5.3.2)
alakra hozzuk. Ha az 5.3.2 egyenlet bal oldalát egyszer integráljuk akkor kapjuk, hogy (5.3.6. ábra)
5.3.6. ábra Második lépésként felrajzoljuk az 5.3.7. ábrán látható diagramot az 5.3.2 egyenlet bal oldalát véve figyelembe.
5.3.7. ábra Harmadik lépésként az 5.3.7. ábrán látható diagramot úgy egészítjük ki, hogy megkapjuk a kimenő y(t) jelet. Ezt a diagramot az 5.3.8. ábrán láthatjuk.
92
5.3.8. ábra Negyedik Lépésnél figyelembe vesszük az 5.3.2 egyenlet jobb oldalát és így kapjuk az 5.3.9. ábrán látható diagramot.
5.3.9. ábra A harmadik lépés után azt láthatjuk, hogy ha a kérdőjeltől jobbra lévő pont értéke &y& − e ⋅ &u& − d ⋅ u& akkor a kimenet y lesz. De ha az 5.3.9. ábrán a kérdőjeltől balra levő értékeket használnánk, akkor a kör nem zárható mert a kérdőjeltől balra lévő pont értéke most c ⋅ u − b ⋅ y − a ⋅ ( y& − e ⋅ u& ) . A probléma megoldható ha a konstans szorzótényezős faktorok (erősítő elemek) értékeit módosítjuk. Ezért induljunk ki az 5.3.10. ábrán látható zárt diagramból amely esetében úgy kell az erősítési tagok együtthatóit megválasztani, hogy ez a szimulációs diagram ekvivalens legyen a 2.3.9. ábrán látható szimulációval. Láthatjuk, hogy bevezettünk három új erősítési tényezőt (b 0 , b1 , b 2 ) és ezek meghatározása a cél.
5.3.10. ábra A diagram alapján leolvashatjuk, hogy ez a &q& = −a ⋅ q& − b ⋅ q + (b 0 − a ⋅ b1 − b ⋅ b 2 ) ⋅ u − b ⋅ b1 ⋅ ∫ u ⋅ dt differenciálegyenlet szimulációja és ha az y kimenetet is figyelembe vesszük, akkor felírhatjuk: q = y − b1 ⋅ ∫ u ⋅ dt − b 2 ⋅ u ⇒ q& = y& − b1 ⋅ u − b 2 ⋅ u& &q& = &y& − b1 ⋅ u& − b 2 ⋅ &u&
⇒
93
Az előbbi egyenlőségeket használva következik, hogy
&y& − b 2 ⋅ &u& − (b1 + b 2 ⋅ a ) ⋅ u& = b 0 ⋅ u − a ⋅ y& − b ⋅ y Ennek az egyenletnek valamint az 5.3.2 egyenletek az összehasonlításából (ekvivalencia) következik, hogy b0 = c b1 = d − a ⋅ c
(5.3.3)
b2 = e Így zárható az adott differenciálegyenlet 5.3.9. ábrán látható blokk diagram. Látható, hogy a 2.3.9. ábrán található d erősítési együttható helyett a b1 = d − a ⋅ c együttható alkalmazása zárja a diagramot. Ennek a hasznosságát akkor fogjuk látni amikor a lineáris rendszerek mátrixos állapotteres felírásának általános tulajdonságait tárgyaljuk. MIMO rendszerek szimulációs diagramja A következő példa esetében láthatjuk, hogy a MIMO a több kimenet több bemenetű rendszerek esetében az állapotteres egyenletrendszer felírására hasonló az eljárás mint a SISO rendszerek esetében. Itt több differenciálegyenlet kell kezelnünk. A modell differerenciálegyenleteinek megfelelő szimulációs diagramok nem függetlenek egymástól (csak egészen kivételes esetben). A diagramok elkészítése az első lépés majd következik a kapott diagramok közötti kapcsolat megteremtése. Általános elvként, a diagramok bal oldalán megrajzoljuk a bemenő jeleket és a jobb oldalán a kimenő jeleket majd következik a diagramok felépítése amint ezt a következő példa menetében láthatunk (5.3.11. ábra). Példa Adott a következő MIMO (Multiple Input – Multiple Output) rendszer. ⎧&y&1 + 3 ⋅ y& 1 + 2 ⋅ y 2 = u 1 ⎨ ⎩ &y&1 + y& 1 + y 2 = u 2 Ez a rendszer két bemenettel két kimenettel rendelkező rendszer. Az 5.3.11. ábrán a bal oldalon láthatjuk az u 1 , u 2 bemenő jeleket és a jobb oldalon meg az y1 , y 2 kimenő jeleket. A megfelelő szimulációs diagram a következőképpen néz ki:
5.3.11. ábra 94
Mivel az integrátorok kimenetét jelöljük mint állapotváltozó, ezért a következő összefüggéseket kapjuk: x& 1 = &y&1 = −2 ⋅ x 4 − 3 ⋅ x 1 + u 1 x& 2 = y& 1 = x 1 y1 = x 2 x& 3 = &y& 2 = −1 ⋅ x 4 − x 1 + u 2 x& 4 = y& 2 = x 3 y2 = x 4 Az állapotegyenletek pedig a következők: ⎛ x& 1 ⎞ ⎛ − 3 ⎜ ⎟ ⎜ ⎜ x& 2 ⎟ ⎜ 1 ⎜ x& ⎟ = ⎜ − 1 ⎜ 3⎟ ⎜ ⎜ x& ⎟ ⎜ 0 ⎝ 4⎠ ⎝
0 0 − 2 ⎞ ⎛ x1 ⎞ ⎛ 1 ⎟ ⎜ ⎟ ⎜ 0 0 0 ⎟ ⎜ x2 ⎟ ⎜0 ⋅ + 0 0 −1⎟ ⎜ x3 ⎟ ⎜0 ⎟ ⎜ ⎟ ⎜ 0 1 0 ⎟⎠ ⎜⎝ x 4 ⎟⎠ ⎜⎝ 0
0⎞ ⎟ 0 ⎟ ⎛ u1 ⎞ ⋅⎜ ⎟ 1 ⎟ ⎜⎝ u 2 ⎟⎠ ⎟ 0 ⎟⎠
⎛ x1 ⎞ ⎜ ⎟ ⎛ y1 ⎞ ⎛ 0 1 0 0 ⎞ ⎜ x 2 ⎟ ⎛u ⎞ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ ⋅ ⎜ ⎟ + (0) ⋅ ⎜⎜ 1 ⎟⎟ ⎝ y2 ⎠ ⎝0 0 0 1⎠ ⎜ x3 ⎟ ⎝u2 ⎠ ⎜x ⎟ ⎝ 4⎠ Innen már könnyen felírhatjuk az A, B, C, D rendszermátrixokat. Az elkövetkezőkben még visszatérünk erre a példára.
Példa Legyen adott a következő MIMO rendszer modell: y& 1 + y1 = u 1 + 2 ⋅ u 2 &y& 2 + 3 ⋅ y& 2 + 2 ⋅y 2 = u 1 + u 2 + u& 2 Az előző példánál is említett eljárásokat alkalmazva megkapjuk a 5.3.12. ábrán látható szimulációs diagramot. Ennek alapján már nem nehéz felírni az állapotegyenleteket, ha az integrátorok kimenetét jelöljük mint állapotváltozók, majd a megfelelő A, B, C, D rendszermátrixokat.
5.3.12. ábra
95
5.4. Lineáris rendszerek állapotteres modelljei
Az állapotegyenletek egy lineáris, folytonos, determinisztikus rendszer esetében, amint azt már láttuk, leírhatók egy lineáris elsőrendű differenciálegyenlet rendszerrel. Az 5.4.1 egyenletek SISO rendszert ⎧x& ( t ) = A ⋅ x ( t ) + B ⋅ u ( t ) ⎨ ⎩ y( t ) = C ⋅ x ( t ) + D ⋅ u ( t )
(5.4.1)
míg 5.4.2 egyenletek egy MIMO rendszert ⎧x& ( t ) = A ⋅ x ( t ) + B ⋅ u ( t ) ⎨ ⎩ y( t ) = C ⋅ x ( t ) + B ⋅ u ( t )
(5.4.2)
írnak le állapotteres formában. Itt az A, B, C, D a rendszer állapotteres lírását adó mátrixok. Itt is a következő jelöléseket használtuk:
⎛ y1 ( t ) ⎞ ⎛ x1 (t) ⎞ ⎛ u1 (t) ⎞ ⎜ ⎟ ⎟ ⎟ ⎜ ⎜ x ( t ) = ⎜ x 2 ( t ) ⎟ u ( t ) = ⎜ u 2 ( t ) ⎟ y( t ) = ⎜ y 2 ( t ) ⎟ ⎜ y (t) ⎟ ⎜ x (t) ⎟ ⎜ u (t ) ⎟ ⎝ n ⎠ ⎝ m ⎠ ⎝ p ⎠ Jegyezzük meg, hogy • • •
n az állapotok száma m a bemenetek száma p a kimenetek száma
Ezek alapján az állapotmátrixok dimenziója egy MIMO rendszer esetében felírható mint: dim(A) = n x n dim(B) = n x m dim(C) = p x n dim(D) = p x m
(5.4.3)
A szimulációs diagramok nagy előnye, s haszna ugyanakkor, hogy könnyen felírhatóvá teszi az állapotegyenleteket. A diagram felrajzolása után, jelöljük az integrátorok kimenetét mint a rendszer állapotát. Ha ez megtörtént, akkor felírjuk az integrátorok bemenetétnek (amelyek az állapotváltozók deriváltját jelentik) egyenletét amelyek képezik az állapotegyenleteket. Példának álljon itt és az egyik előző példában (5.3.11. ábra) már ismertetett feladat esetében a szimulációs diagram (ez az 5.4.1. ábrán látható), amely azonban most tartalmazza a beírt állapotváltozókat is. 96
5.4.1. ábra A diagram alapján felírhatjuk, hogy: x& 1 = −2 ⋅ x 4 − 3 ⋅ x 1 + u 1 = −3 ⋅ x 1 + 0 ⋅ x 2 + 0 ⋅ x 3 − 2 ⋅ x 4 + 1 ⋅ u 1 + 0 ⋅ u 2 x& 2 = x 1 = 1 ⋅ x1 + 0 ⋅ x 2 + 0 ⋅ x 3 + 0 ⋅ x 4 + 0 ⋅ u1 + 0 ⋅ u 2 x& 3 = − x 4 − x 1 + u 2 x& 4 = x 3
= − 1 ⋅ x1 + 0 ⋅ x 2 + 0 ⋅ x 3 − 1 ⋅ x 4 + 1 ⋅ u1 + 0 ⋅ u 2
y1 = x 2
= 0 ⋅ x1 + 1⋅ x 2 + 0 ⋅ x 3 + 0 ⋅ x 4 + 0 ⋅ u1 + 0 ⋅ u 2
y2 = x 4
= 0 ⋅ x1 + 0 ⋅ x 2 + 0 ⋅ x 3 + 1⋅ x 4 + 0 ⋅ u1 + 0 ⋅ u 2
= 0 ⋅ x1 + 0 ⋅ x 2 + 1⋅ x 3 + 0 ⋅ x 4 + 0 ⋅ u1 + 0 ⋅ u 2
vagyis ⎛ x& 1 ⎞ ⎛ − 3 ⎜ ⎟ ⎜ ⎜ x& 2 ⎟ ⎜ 1 ⎜ x& ⎟ = ⎜ − 1 ⎜ 3⎟ ⎜ ⎜ x& ⎟ ⎜ 0 ⎝ 4⎠ ⎝
0 0 − 2 ⎞ ⎛ x1 ⎞ ⎛ 1 ⎟ ⎜ ⎟ ⎜ 0 0 0 ⎟ ⎜ x2 ⎟ ⎜0 ⋅ + 0 0 −1⎟ ⎜ x3 ⎟ ⎜0 ⎟ ⎜ ⎟ ⎜ 0 1 0 ⎟⎠ ⎜⎝ x 4 ⎟⎠ ⎜⎝ 0
0⎞ ⎟ 0 ⎟ ⎛ u1 ⎞ ⋅⎜ ⎟ 1 ⎟ ⎜⎝ u 2 ⎟⎠ ⎟ 0 ⎟⎠
⎛ x1 ⎞ ⎜ ⎟ ⎛ y1 ⎞ ⎛ 0 1 0 0 ⎞ ⎜ x 2 ⎟ ⎛ 0 0 ⎞ ⎛ u 1 ⎞ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ ⋅ ⎜⎜ ⎟⎟ ⎟⎟ ⋅ ⎜ ⎟ + ⎜⎜ ⎝ y2 ⎠ ⎝ 0 0 0 1⎠ ⎜ x3 ⎟ ⎝0 0⎠ ⎝ u 2 ⎠ ⎜x ⎟ ⎝ 4⎠ ahonnan az állapotegyenlet mátrixai (lásd az 5.4.2 egyenletrendszert): ⎛− 3 ⎜ ⎜ 1 A=⎜ −1 ⎜ ⎜ 0 ⎝
0 0 0 0
0 − 2⎞ ⎛1 ⎟ ⎜ 0 0 ⎟ ⎜0 = ; B ⎜0 0 −1⎟ ⎟ ⎜ ⎜0 1 0 ⎟⎠ ⎝
0⎞ ⎟ 0⎟ ⎛0 1 0 0⎞ ⎛0 0⎞ ⎜ ⎟ ⎜⎜ ⎟ ; D ; C = = ⎜ ⎟ 0 0 ⎟⎠ 0 0 0 1⎠ 1⎟ ⎝ ⎝ ⎟ 0 ⎟⎠ 97
Mint egy levonható következtetés, jegyezzük meg a következő gondolatmenetet: ha adott a rendszert leíró differenciálegyenlet rendszer, akkor ennek alapján felrajzolhatjuk a rendszer szimulációs diagramját majd az integrátorok kimeneteit állapotváltozóként jelölve (a bemeneteik meg a megfelelő állapotváltozók deriváltja), felírjuk deriváltakra vonatkozó egyenleteket és innen az állapotteres egyenletek mátrixait. Az elkövetkező paragrafusban ismertetem a különböző állapotteres leírási formákat. A különböző formák elősegítik az rendszerek állapotteres tanulmányozhatóságát megkönnyítve a matematikai módszerek alkalmazását. 5.5. Állapotteres diagramok módszertana
5.5.1. Szekvenciális differenciálás módszere (successive differentiation)
Adott egy n-ed rendű SISO rendszert modellező alap általános diffenciálegyenlet (5.5.1.1). dn d n −1 d n −2 d + α ⋅ + α ⋅ y ( t ) y ( t ) y( t ) + L + α 1 ⋅ y( t ) + α 0 ⋅ y ( t ) = n −1 n −2 n n −1 n −2 dt dt dt dt (5.5.1.1) n n −1 n −2 d d d d = β n n u ( t ) + β n −1 ⋅ n −1 u ( t ) + β n − 2 ⋅ n − 2 u ( t ) + L + β1 ⋅ u ( t ) + β 0 ⋅ u ( t ) dt dt dt dt
Figyeljük meg, hogy az egyenletünk normalizált, vagyis az n-ed rendű derivált együtthatója egyenlő egyel. Jelölje r a deriválási operátort, s ekkor a következő formális operácionális leírási alakot kapjuk az alapegyenletre: (r n + α n −1 ⋅ r n −1 + α n − 2 ⋅ r n − 2 + L + α1 ⋅ r + α 0 ) y( t ) = (5.5.1.1a) = (β n r n + β n −1 ⋅ r n −1 + β n − 2 ⋅ r n − 2 + L + β1 ⋅ r + β 0 )u ( t ) A modellnek megfelelő szimulációs diagram az 5.5.1.1. ábrán látható. Ezt az 5.3 paragrafusban bemutatott módszer általánosítása alapján kaptunk.
5.5.1.1 ábra Az integrátorok kimenetét választjuk mint állapotváltozók. 98
A cél meghatározni az a i , ( i = 1,K , n ) és b i , ( i = 1,K , n ) értékeit az adott modell α i és β i együtthatók függvényében. A diagram alapján felírhatjuk: y = x1 + b 0 ⋅ u x& k = x k +1 + b k ⋅ u
∀k < n
n, k ∈ N *
KKK x& n = −(a 0 ⋅ x 1 + a 1 ⋅ x 2 + L + a n −1 ⋅ x n ) + b n ⋅ u
(5.5.1.2)
Deriválva az 5.5.1.2-ből az y egyenletét azt kapjuk, hogy d y = x& 1 + b 0 ⋅ u& dt Ebbe behelyettesítve x& 1 értéket a 5.5.1.2 egyenletrendszerből, kapjuk: ry =
ry = x 2 + b1 ⋅ u + b 0 ⋅ u& Az előbbi lépéseket megismételve kapjuk, hogy: r 2 y = x& 2 + b1 ⋅ u& + b 0 ⋅ &u& = x 3 + b 2 ⋅ u + b1 ⋅ u& + b 0 ⋅ &u&
KKK r n −1 y = x n + b n −1 ⋅ u + b n − 2 ⋅ ru + L + b 0 ⋅ r n −1 u r n y = −(a 0 ⋅ x 1 + a 1 ⋅ x 2 + L + a n −1 ⋅ x n ) + b n ⋅ u + + b n −1 ⋅ ru + b n − 2 ⋅ r 2 u + L + b 0 ⋅ r n u Ezt az összefüggést behelyettesítve az 5.5.1.1a egyenletbe és identifikálva az r k y együtthatóit azt kapjuk, hogy: a i = αi
i ∈ {0,1,2, L, n − 1}
b0 = βn b1 = β n −1 − α n −1 ⋅ b 0 b 2 = β n − 2 − α n −1 ⋅ b1 − α n − 2 ⋅ b 0
LLL b n = β 0 − α n −1 ⋅ b n −1 − α n − 2 ⋅ b n − 2 − L − α 0 b 0 Ez egy egyenletrendszer amelyben az ismeretlenek a b i i = 0,1,L n tehát a szimulációs diagram ismeretlen erősítési tényezői. Az egyenletrendszer felírható mátrix formában mint: ⎛ βn ⎞ ⎛ 1 ⎟ ⎜ ⎜ ⎜ β n −1 ⎟ ⎜ α n −1 ⎜β ⎟ = ⎜ α ⎜ n −2 ⎟ ⎜ n −2 ⎜ β ⎟ ⎜ α ⎝ 0 ⎠ ⎝ 0
0 1 α n −1
0 0 1
α1
α2
0⎞ ⎛ b0 ⎞ ⎟ ⎜ ⎟ 0 ⎟ ⎜ b1 ⎟ ⋅ 0⎟ ⎜ b2 ⎟ ⎟ ⎜ ⎟ 1 ⎟⎠ ⎜⎝ b n ⎟⎠
(5.5.1.3)
99
Ebben az egyenletrendszerben az ismeretlenek a b i i = 0,1,L , n értékek. Ha megoldjuk az 5.5.1.3 egyenletrendszert akkor a szimulációs diagram ismert és így akkor már könnyen felírhatjuk az állapotegyenleteket. Így a rendszert leíró állapotteres egyenletek A, B, C, D mátrixai az 5.5.1.4 mátrixai lesznek. ⎛ 0 ⎜ ⎜ 0 A=⎜ 0 ⎜ ⎜− α 0 ⎝
1
0
0 0 − α1
1 0 − α2
⎞ ⎟ 0 ⎟ ; C = (1 0 0 0 ) 0 ⎟ ⎟ − α n −1 ⎟⎠ 0
D = b0 = βn
és
⎛ b0 ⎞ ⎛ 1 ⎜ ⎟ ⎜ ⎛ D ⎞ ⎜ b1 ⎟ ⎜ α n −1 ⎜⎜ ⎟⎟ = ⎜ ⎟ = ⎜ ⎝ B ⎠ ⎜ b 2 ⎟ ⎜ α n −2 ⎜b ⎟ ⎜ α ⎝ n⎠ ⎝ 0
(5.5.1.4)
0
0
1 α n −1 α1
0 1 α2
−1
0⎞ ⎛ βn ⎞ ⎟ ⎜ ⎟ 0 ⎟ ⎜ β n −1 ⎟ ⋅ 0 ⎟ ⎜ β n −2 ⎟ ⎟ ⎜ ⎟ 1 ⎟⎠ ⎜⎝ β 0 ⎟⎠
A fenti állapotegyenleteket a rendszer úgynevezett standard formájának nevezzük Láthatjuk, hogy az A rendszermátrix és a C kimenő mátrix egyszerű formák ha a mátrixműveleteket vesszük alapul. Ez hasznos megfigyelés ha a rendszerek megfigyelhetőségét kell tanulmányoznunk, mert amint látni fogjuk, a megfigyelhetőség meghatározása az A és C mátrixokkal végzett műveletekre épít. A módszer nehézségét csak az 5.5.1.4 egyenletekben a B mátrix kiszámítása okozhat (az inverz mátrix számítása). Példa
Adott
&y&& + 3 ⋅ &y& + 4 ⋅ y& + y = 2 ⋅ &u&& + 3 ⋅ &u& + u& + 2 ⋅ u rendszermodell. Írjuk fel a standard állapotteres reprezentáció mátrixait. Az 5.5.1.4 egyenletek alapján felírhatjuk, hogy: 1 0 ⎞ ⎛0 ⎟ ⎜ A=⎜ 0 0 1 ⎟; C = (1 0 0); ⎜ − 1 − 4 − 3⎟ ⎠ ⎝ és a B, D kiszámítására felírjuk a következő mátrixegyenletet ⎛ b0 ⎞ ⎛ 1 ⎜ ⎟ ⎜ ⎜ b1 ⎟ ⎜ 3 ⎜b ⎟ = ⎜4 ⎜ 2⎟ ⎜ ⎜ b ⎟ ⎜1 ⎝ 3⎠ ⎝
−1
0 0 0⎞ ⎛ 2⎞ ⎛ 1 0 0 ⎟ ⎜ ⎟ ⎜ 1 0 0⎟ ⎜ 3⎟ ⎜ − 3 1 0 ⋅ = 3 1 0⎟ ⎜ 1⎟ ⎜ 5 − 3 1 ⎟ ⎜ ⎟ ⎜ 4 3 1 ⎟⎠ ⎜⎝ 2 ⎟⎠ ⎜⎝ − 4 5 − 3
0⎞ ⎛ 2⎞ ⎛ 2 ⎞ ⎟ ⎜ ⎟ ⎜ ⎟ 0 ⎟ ⎜ 3 ⎟ ⎜ − 3⎟ ⎛ D ⎞ ⋅ = =⎜ ⎟ 0 ⎟ ⎜ 1 ⎟ ⎜ 2 ⎟ ⎜⎝ B ⎟⎠ ⎟ ⎜ ⎟ ⎜ ⎟ 1 ⎟⎠ ⎜⎝ 2 ⎟⎠ ⎜⎝ 6 ⎟⎠
100
Ahonnan következik: ⎛ − 3⎞ ⎜ ⎟ B = ⎜ 2 ⎟; és D = (2 ) ⎜ 6 ⎟ ⎝ ⎠
És így a szimulációs diagram az 5.5.1.2 ábrán látható.
⊗
5.5.1.2. ábra
5.5.2. Összekapcsolt integrálási módszer (Nested Integral method)
Adott a következő modell: dn d n −1 d n −2 d y ( t ) + α ⋅ y ( t ) + α ⋅ y( t ) + L + α 1 ⋅ y( t ) + α 0 ⋅ y ( t ) = n −1 n −2 n n −1 n −2 dt dt dt dt m m −1 m−2 d d d d = β m m u ( t ) + β m −1 ⋅ m −1 u ( t ) + β n − 2 ⋅ m − 2 u ( t ) + L + β1 ⋅ u ( t ) + β 0 ⋅ u ( t ) dt dt dt dt (5.5.2.1) Ha m < n akkor egy pár β i ≡ 0 ha meg m > n akkor a rendszer nem megvalósítható. Most kifejezzük a legnagyobb rendű deriváltat az 5.5.2.1 egyenletből: dn d n −1 d n −2 d y ( t ) = − α ⋅ y ( t ) − α ⋅ y( t ) − L − α 1 ⋅ y ( t ) − α 0 ⋅ y( t ) + n −1 n −2 n n −1 n −2 dt dt dt dt m m −1 m−2 d d d d + β m m u ( t ) + β m −1 ⋅ m −1 u ( t ) + β n − 2 ⋅ m − 2 u ( t ) + L + β1 ⋅ u ( t ) + β 0 ⋅ u ( t ) dt dt dt dt
Feltételezzük, hogy m = n. Csoportosítjuk az azonos rendű deriváltakat és kapjuk:
101
dn dn d n −1 d n −1 y( t ) = β n n u ( t ) + (β n −1 ⋅ n −1 u ( t ) − α n −1 ⋅ n −1 y( t )) + dt n dt dt dt n −2 n −2 d d + (β n − 2 ⋅ n − 2 u ( t ) − α n − 2 ⋅ n − 2 y( t )) + dt dt d d + L + (β1 ⋅ u ( t ) − α1 ⋅ y( t )) + (β 0 ⋅ u ( t ) − α 0 ⋅ y( t )) dt dt
(5.5.2.2)
Ha az 5.5.2.2 egyenletet egymásután n-szer integráljuk kapjuk: ⎧ d n −1 d n −1 y( t ) = β n ⋅ u ( t ) + ⎨(β n −1 ⋅ n −1 u ( t ) − α n −1 ⋅ n −1 y( t )) + dt dt ⎩ ⎡ d n −2 d n −2 + ⎢(β n − 2 ⋅ n −2 u ( t ) − α n − 2 ⋅ n − 2 y( t )) + dt dt ⎣
∫
∫
+L+
∫
(β1 ⋅
d d u ( t ) − α1 ⋅ y( t )) + dt dt
∫
(β 0 ⋅ u ( t ) − α 0 ⋅ y( t )) dt dt L ]dt }dt
Ennek alapján felépíthető a rendszer szimulációs diagramja. Mindég a ‘legmélyebben’ levő integráljával kezdjük (az a mélyebben levő integrál, amelyet ha nem számítunk ki, akkor a következő integrálás már nem végezhető el). Ez jelenti az összekapcsolt integrálás fogalmát:
5.5.2.1. ábra Az 5.5.2.1. ábrán látható diagram alapján felírhatók a következő állapotegyenletek: ⎛ x& 1 ⎞ ⎛ 0 0 0 − α 0 ⎞ ⎛ x 1 ⎞ ⎛ β 0 − α 0 ⋅ β n ⎞ ⎟ ⎟ ⎜ ⎟ ⎜ ⎜ ⎟ ⎜ ⎜ x& 2 ⎟ ⎜ 1 0 0 − α1 ⎟ ⎜ x 2 ⎟ ⎜ β1 − α 1 ⋅ β n ⎟ ⎜ x& ⎟ = ⎜ 0 1 0 − α ⎟ ⋅ ⎜ x ⎟ + ⎜ β − α ⋅ β ⎟ 2 n 2 ⎟ ⎟ ⎜ 3⎟ ⎜ 2 ⎜ 3⎟ ⎜ ⎜ x& ⎟ ⎜ 0 0 0 − α ⎟ ⎜ x ⎟ ⎜ β − α ⋅ β ⎟ n −1 n ⎠ n −1 ⎠ ⎝ n ⎠ ⎝ n −1 ⎝ n⎠ ⎝ ⎛ x1 ⎞ ⎜ ⎟ ⎜x ⎟ y = (0 0 0 1) ⋅ ⎜ 2 ⎟ + β n ⋅ u x ⎜ 3⎟ ⎜x ⎟ ⎝ n⎠
(5.5.2.3)
102
Az összekapcsolt integrálási módszert használva az 5.4.2 egyenletrendszernek megfelelően a kapott A rendszermátrix és a C kimenőmátrix segítségével tanulmányozhatjuk a rendszerek megfigyelhetőségét figyelembe véve ezeknek a mátrixoknak a matematikai kezelhetőségét. Ugyanakkor a B bemenő mátrix komplexitása adhat bizonyos információt a rendszer bemenete és állapotváltozói közötti összefüggésekre. Példa
Adott következő rendszermodell:
&y& + 2 ⋅ y& + y = u& + 2 ⋅ u Akkor az összekapcsolt integrálási módszert használva felírhatjuk: y=
∫ {u − 2 ⋅ y + ∫ (2 ⋅ u − y)dt}dt
Ennek megfelelően kapjuk az 5.5.2.2. ábrán látható szimulációs diagramot.
5.5.2.2. ábra Ennek alapján a felírjuk a következő állapotegyenleteket: ⎛ x& 1 ⎞ ⎛ 0 − 1 ⎞ ⎛ x 1 ⎞ ⎛ 2 ⎞ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ ⋅ ⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟ ⋅ u ⎝ x& 2 ⎠ ⎝ 1 − 2 ⎠ ⎝ x 2 ⎠ ⎝ 1 ⎠ ⎛x ⎞ y = (0 1) ⋅ ⎜⎜ 1 ⎟⎟ + (0 ) ⋅ u ⊗ ⎝x2 ⎠ Az elkövetkezőkben használt átviteli függvény fogalmára még visszatérek. Addig is az átviteli függvény fogalmat úgy értelmezhetjük mint a komplex s-síkban meghatározott racionális függvényt és nem más mint a kimenet és bemenet közötti egyfajta összefüggés egy komplex síkban. 103
5.5.3. Állapotegyenletek résztörtek alapján (Partial Fractions expantion-simple roots) A. Egyszeres gyökök esetében
Legyen adott H(s) egy SISO rendszer átviteli függvénye. Legyen az átviteli függvény nevezője D(s) (a rendszer karakterisztikus egyenlete). Tételezzük fel, hogy a nevezőnek megfelelő egyenletnek csak valós egyszeres gyökei vannak. Így felírhatjuk, hogy: D(s) = d n ⋅ (s − λ 1 ) ⋅ (s − λ 2 ) ⋅ K ⋅ (s − λ n )
Az átviteli függvényt, amely egy racionális forma (és a számláló fokszáma mindig kisebb vagy egyenlő a nevező fokszámánál), felírható egyszerű törtek összegeként. c c c N(s) Y(s) = H(s) = d + 1 + 2 + L + n = D(s) s −λ 1 s − λ 2 s −λ n U(s)
ahol d = lim H(s) és c i = (s − λ i ) ⋅ s →∞
N(s) | D(s) s=λi
(5.5.3.1)
Az rendszer kimenete, az 5.5.3.1 alapján: Y(s) = H(s) ⋅ U(s) ⇒ Y(s) = d ⋅ U(s) + U(s) ⋅
n
ci
∑ s −λ i =1
i
A párhuzamosan kötött alrendszerek átviteli függvényei mint összegek szerepelnek a rendszer átviteli függvényében. Ezt tudni kell az átviteli függvények algebrájáról. Amint látjuk az 5.5.3.1 egyenletekből, az elemi törtek összegére bontott H(s) mindenik összetevője a rendszer szimulációs diagramjában mint egy párhuzamosan kötött egység jelenik meg. Vegyük most az alrendszereket. Ha figyelembe vesszük, hogy ezek x& i − λ i ⋅ x i = u és elsőrendű differenciálegyenletek amelyek Laplace transzformáltja s ⋅ X i (s) − λ i ⋅ X i (s) = U(s) formában írható fel, ahonnan következik, hogy U(s) X i (s) = s − λi Könnyen belátható, hogy a X i (s) mennyiségeknek az 5.5.3.1 egyenlőségből kiszámított c i értékekkel vett súlyozott összege adja a rendszer átviteli függvényét. Ha az x& i − λ i ⋅ x i = u differenciálegyenlet megoldása x i ( t ) függvény, akkor felírhatjuk y=
n
∑c
i
⋅ xi + d ⋅ u x
i =1
Az 5.5.3.1. ábrán láthatjuk ezeket a párhuzamosan kötött alrendszereket.
104
5.5.3.1. ábra A szimulációs diagram alapján az állapotegyenleteket a következő formában kapjuk: ⎛ x& 1 ⎞ ⎛ λ 1 ⎜ ⎟ ⎜ ⎜ x& 2 ⎟ = ⎜ 0 ⎜ x& ⎟ ⎜ 0 ⎝ n⎠ ⎝
0 λ2 0
y = (c1
⎛ x1 ⎞ ⎜ ⎟ cn )⋅ ⎜ x 2 ⎟ + d ⋅ u ⎜x ⎟ ⎝ n⎠
c2
0 ⎞ ⎛ x 1 ⎞ ⎛1⎞ ⎟ ⎜ ⎟ ⎜ ⎟ 0 ⎟ ⋅ ⎜ x 2 ⎟ + ⎜1⎟ ⋅ u λ n ⎟⎠ ⎜⎝ x n ⎟⎠ ⎜⎝1⎟⎠
(5.5.3.2)
Ez még felírható mint: ⎛1⎞ ⎜ ⎟ x& ( t ) = Λ ⋅ x + B ⋅ u ahol B = ⎜1⎟ míg d egy skaláris mennyiség. y = C⋅x + d⋅u ⎜1⎟ ⎝ ⎠
Egy nagyon fontos megjegyzés az, hogy a kapott rendszermátrix a Λ egy átlós mátrix. Ezért is jelöltük ezt itt másképpen. Ennek az a jelentősége, hogy ez egy alapvető forma a rendszeregyenletek megoldásában. Ha átlós a rendszermátrix, akkor az állapotegyenlet rendszer könnyen megoldhatóvá válik. Tehát az állapotegyenletek résztörtek alapján eljárás egy nagyon fontos módszer ha az állapotegyenletek megoldása a feladat. Ugyanakkor a bemenő B mátrix speciális felépítése miatt előnyös ezt a módszert alkalmazni, ha a rendszer szabályozhatóságát akarjuk tanulmányozni. A szabályozhatóság fogalmáról egy későbbi fejezetben lesz szó. B. Többszörös gyökök esetében (Partial Fractions expantion-repeated roots)
Legyen a karakterisztikus egyenletnek λ 1 egy k-szoros gyöke. Ekkor, ha k + n 1 = n akkor felírhatjuk
105
D(s) = d ⋅ (s − λ 1 ) k ⋅ (s − λ 2 ) ⋅ (s − λ 3 ) ⋅ L ⋅ (s − λ n ) 1
Ebből következik: cn c11 c12 c1k c2 Y(s) N(s) 1 = H(s) = d + + + L + + + L + = k k −1 1 s − λn U(s) D(s) (s − λ1 ) (s − λ1 ) (s − λ1 ) s − λ 2 1
Ahol
d = lim H(s) és s →∞
1 d j−1 ⎛ k N (s) ⎞ ⎟| ⋅ j−1 ⎜⎜ (s − λ 1 ) ⋅ c ij = ( j − 1)! ds ⎝ D(s) ⎟⎠ s=λ1
(5.5.3.3a)
valamint c i = (s − λ i ) ⋅
N(s) | D(s) s=λ1
(5.5.3.3b)
5.5.3.2. ábra A kimenet Y(s) = H(s) ⋅ U(s) alapján ⇒ Y(s) = d ⋅ U(s) +
k
∑c j=1
1j
⋅ X j (s) +
n1
∑c
i
⋅ X i (s)
i=2
(5.5.3.4)
ahol X j (s) =
1 U(s) X j+1 (s) vagy iterációs formában X j (s) = k − j+1 s − λ1 (s − λ 1 ) U(s) és X i (s) = s − λi
j = 1,2,L, k − 1
Így az 5.5.3.2. ábrán látható szimulációs diagramot kapjuk ahol az erősítési együtthatókat az 5.5.3.3a és 5.5.3.3b képletek segítségével számítjuk ki: Az 5.5.3.5 egyenletek az 5.5.3.2. ábrán látható diagram alapján felírt állapotegyenletek 106
⎛ λ1 ⎜ ⎛ x& 1 ⎞ ⎜ 0 ⎜ ⎟ ⎜ ⎜ x& 2 ⎟ ⎜ 0 ⎜ x& ⎟ = ⎜ 0 ⎜ k ⎟ ⎜ ⎜ x& k +1 ⎟ ⎜ ⎜ x& ⎟ ⎝ n ⎠ ⎜ ⎜ ⎝
y = (c11
c12
1 λ1 0
0 1 λ1
0
0
(0)
c1k
c2
0 0 1 λ1
(0) λ2 0
0 λ3
0
0
⎞ ⎟ ⎟ ⎛ x1 ⎞ ⎛ 0 ⎞ ⎟ ⎜ x ⎟ ⎜0⎟ ⎟ ⎜ 2 ⎟ ⎜ ⎟ ⎟ ⋅ ⎜ x k ⎟ + ⎜1⎟ ⎜ ⎟ ⎜ ⎟ 0 ⎟ ⎜ x k +1 ⎟ ⎜ 1 ⎟ ⎟ 0 ⎟ ⎜⎝ x n ⎟⎠ ⎜⎝ 1 ⎟⎠ λ n ⎟⎠
(5.5.3.5)
⎛ x1 ⎞ ⎜ ⎟ ⎜ x2 ⎟ cn )⋅ ⎜ x k ⎟ + d ⋅ u ⎜ ⎟ ⎜ x k +1 ⎟ ⎜ x ⎟ ⎝ n ⎠
Ha az 5.4.2 általános állapotegyenleteket vesszük, akkor látható, hogy mivel a rendszer karakterisztikus egyenletének a λ 1 többszörös gyöke, ezért az A rendszermátrix egy Jordan forma, vagyis a mátrix főátlója mentén elhelyezkedő többszörös gyökökkel párhuzamosan egy 1-es helyezkedik el. Az állapotegyenletek résztörtek alapján való alkalmazása ebben az esetben is hozzásegít az állapotegyenletek megoldásához. Ebben a tankönyvben nem foglalkozunk azzal az esettel amikor a rendszer karakterisztikus egyenletének komplex egyszeri vagy többszörös gyökei vannak. 5.5.4. Faktorizált átviteli függvény módszer (Factored Transfer Function Method)
Egy LTI rendszer átviteli függvényt felírjuk a következő formában: H(s) =
N(s) K ⋅ (s − z1 ) ⋅ (s − z 2 ) ⋅ L ⋅ (s − z m ) Y(s) = = D(s) (s − λ 1 ) ⋅ (s − λ 2 ) ⋅ L ⋅ (s − λ n ) U(s)
(5.5.4.1)
ahol z i a rendszer zérósai, vagyis az N(s) = 0 gyökei, míg λ i a pólusok vagyis D(s) = 0 egyenlet gyökei. Tételezzük fel, hogy m = n , és akkor az 5.5.4.1 modell felírható mint: U(s) →
s − z1 s − z 2 s − zn ⋅ K → Y(s) ⋅L⋅ ⋅ s − λ1 s − λ 2 s − λn
amely n darab sorba kötött elsőrendű rendszert jelent. Megjegyezzük, hogy ha a rendszer átviteli függvénye az alrendszerek átviteli függvényeinek a szorzata akkor az alrendszerek sorba vannak kötve. Mindezt majd bebizonyítjuk az átviteli függvények algebrája fejezetben. Adjuk meg most az i.-ik tagnak megfelelő szimulációs diagramot. Legyen Yi (s) a tag kimenete és U i (s) a bemenete. 107
⇒
du ( t ) Yi (s) s − z i dy ( t ) ⇒ i − λ i ⋅ y i (t) = i − z i ⋅ u i (t) ⇒ = dt U i (s) s − λ i dt dy i ( t ) du i ( t ) = + [ λ i ⋅ y i ( t ) − z i ⋅ u i ( t )] dt dt
∫ ⎯⎯→
∫
y i ( t ) = u i + [λ i ⋅ y i ( t ) − z i ⋅ u i ( t )] ⋅ dt
Ezek alapján kapjuk az 5.5.4.1. ábrán látható szimulációs diagramot.
5.5.4.1. ábra Ha sorba kötjük az n darab diagramot (a rendszer átviteli függvénye a előbb tárgyalt elsőrendű rendszer átviteli függvényeinek szorzata), amikor is az előző kimenet a következő bemenethez kapcsolódik, akkor megkapjuk a rendszer szimulációs diagramját. Ennek alapján felírjuk az állapotegyenleteket. Ezzel a módszerrel kapott állapotegyenletek jellegzetessége, hogy az A rendszermátrix felső háromszögmátrix (a karakterisztikus egyenlet gyökeinek valós volta miatt). Példa
Legyen adott H(s) =
s2 + 3⋅ s + 2 s +1 s + 2 1 = ⋅ ⋅ 3 2 s + 10 ⋅ s + 33 ⋅ s + 36 s + 3 s + 3 s + 4
Az előzőekben ismertetett módszer alapján felrajzoljuk a rendszer diagramját. Ez az 5.5.4.2. ábrán látható.
5.5.4.2. ábra A szimulációs diagram alapján felírt állapotegyenletek:
108
x& 1 = −4 ⋅ x 1 + x 2 + x 3 + u x& 2 = −3 ⋅ x 2 − x 3 − u x& 3 = −3 ⋅ x 3 − 2 ⋅ u y = x1 Innen meg következik, hogy: 1 ⎞ ⎛ x1 ⎞ ⎛ 1 ⎞ ⎛ x& 1 ⎞ ⎛ − 4 1 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ x& 2 ⎟ = ⎜ 0 − 3 − 1 ⎟ ⋅ ⎜ x 2 ⎟ + ⎜ − 1 ⎟ ⋅ u ⎜ x& ⎟ ⎜ 0 0 − 3 ⎟⎠ ⎜⎝ x 3 ⎟⎠ ⎜⎝ − 2 ⎟⎠ ⎝ 3⎠ ⎝ ⎛ x1 ⎞ ⎜ ⎟ y = (1 0 0 ) ⋅ ⎜ x 2 ⎟ ⎜x ⎟ ⎝ 3⎠
5.6. Állapottér egyenletei és az átviteli függvény
Komplex frekvencia tartományba az állapotegyenletek (időfüggvények) a Laplace transzformációjával vihetők át. Az elkövetkezőkben SISO LTI rendszerek jöhetnek számításba. Jelölje az x , u, y időfüggvények Laplace transzformáltját X(s), U(s), Y(s) . Adott egy n-ed rendű MIMO rendszer állapotteres leírása (5.4.2 egyenlet): ⎧x& ( t ) = A ⋅ x ( t ) + B ⋅ u ( t ) ⎨ ⎩ y( t ) = C ⋅ x ( t ) + D ⋅ u ( t ) A cél hogy meghatározzuk az H(s) függvényét az A, B, C, D rendszermátrixok függvényében. A megoldás általánosságát nem érinti ha D ≡ 0 . Az állapotegyenletek Laplace transzformációját alkalmazva kapjuk: s ⋅ X(s) − x 0 = A ⋅ X(s) + B ⋅ U(s) Y(s) = C ⋅ X(s)
ahol x 0 a kezdeti állapotok vektora. A kezdeti feltételek x 0 vektora olyan bemenőjelnek tekinthető, amely egy egységmátrixon keresztül hat a rendszerre ⇒ s ⋅ X(s) − A ⋅ X(s) = x 0 + B ⋅ U(s) ⇒ s ⋅ I ⋅ X(s) − A ⋅ X(s) = x 0 + B ⋅ U(s) ⇒ (s ⋅ I − A) ⋅ X(s) = x 0 + B ⋅ U(s)
109
Itt I a megfelelő dimenziójú egységmátrixot jelöli. Ha létezik a (s ⋅ I − A) mátrix inverz mátrixa akkor az előbbi egyenletet beszorozzuk (s ⋅ I − A) −1 -el balról és a következő összefüggést kapjuk: X(s) = (s ⋅ I − A) −1 ⋅ x 0 + (s ⋅ I − A) −1 ⋅ B ⋅ U(s) ⇒ X(s) = (s ⋅ I − A) −1 ⋅ [ x 0 + B ⋅ U(s)] ⇒ Y(s) = C ⋅ (s ⋅ I − A) −1 ⋅ [ x 0 + B ⋅ U(s)] Innen gyakorlati meggondolásokból az az eset fontos amikor a kezdeti állapotokra igaz, hogy x 0 = 0 és egy SISO rendszer esetében felírhatjuk, hogy: Y(s) = C ⋅(s ⋅ I − A) −1 ⋅ B = H(s) U(s)
(5.6.1)
Azért tekintjük az x 0 = 0 kezdeti állapotvektort, mert bármikor bevezethető egy transzformáció az adott állapottérben, hogy a kezdeti állapot az állapottér origójába kerüljön. A kérdés most az, hogy mikor létezik (s ⋅ I − A) −1 mert erre épül az átviteli függvény kiszámítása? Ennek feltétele, hogy legyen igaz, hogy det(s ⋅ I − A) ≠ 0. Ez azt jelenti, hogy az átviteli függvény értelmezési tartománya az a komplex sík amely nem tartalmazza a rendszer pólusait. Tudjuk, hogy egy átviteli függvény (amely egy racionális függvény SISO rendszer esetében), nevezőjének gyökei nem mások mint a rendszer pólusai. Vagyis a pólusok a rendszer szinguláris pontjai. De a det(s ⋅ I − A) = 0 egyenlet gyökei, a rendszer pólusai, és ezek nem másak mint az A mátrix sajátértékei, ugyanakkor a det(s ⋅ I − A) = D(s) = 0 az adott rendszer karakterisztikus egyenlete is. Ezek alapján megelőlegezhetjük, hogy a rendszer tulajdonságai (stabilitás, vezérelhetőség, megfigyelhetőség, érzékenység) és a rendszermátrixok milyensége között szoros kapcsolat van. 5.7. Az állapotegyenletek megoldása
Keressünk megoldást egy
x& = A ⋅ x + B ⋅ u
(5.7.1)
elsőrendű mátrix differenciálegyenletnek. Többféle megoldási módszer létezik. A lineáris algebra és az elsőrendű algebrai egyenletek megoldási módszerei alkalmazása elsőrendű fontossággal bír az állapotegyenletek megoldásában. Tekintsük a következő x& = A ⋅ x (5.7.2) elsőrendű homogén egyenletet. Tudjuk, hogy dim( x ) =nx1 és dim( A )=nxn. Ha n=1 akkor a megoldás:
110
x = e A⋅t ⋅ x (0)
(5.7.3)
amely az x(0) kezdeti értékből induló magára hagyott rendszer mozgása (megoldása). Most feltételezzük, hogy ha n ≠ 1 a homogén egyenlet megoldása x = e A⋅t ⋅ x (0)
(5.7.4)
Ebben a megoldásban dim(e A⋅t ) = n x n . Az alapkérdés az, hogy miként értelmezzük a e A⋅t mátrixot? Újból azzal az esettel kezdjük amikor n = 1 s ekkor felírhatjuk, hogy: ea ⋅ t = 1 +
a ⋅ t a 2 ⋅t 2 a 3 ⋅t 3 a k ⋅t k + + +L+ +L k! 1! 2! 3!
(5.7.5)
vagyis y = e a ⋅t valós változójú valós függvény Taylor sorba fejtése. A ⋅ t lehet: Ennek alapján egy logikus (és matematikailag helyes) meghatározása e A ⋅ t A 2 ⋅t 2 A3 ⋅t 3 A k ⋅t k ⋅ + + +L+ +L eA t = I + k! 1! 2! 3!
(5.7.6)
ahol I az n x n –es egységmátrix. Ha 5.7.4 egy helyes megoldás, akkor behelyettesítve ezt az 5.7.6 egyenletbe és akkor egy identitást ( ≡ ) kell kapjunk. Ennek érdekében ki kell számítsuk az e A⋅t deriváltjait az idő (független változó) függvényében. d A⋅t A 2 ⋅ t A 3 ⋅t 2 A 4 ⋅t 3 A k ⋅ t k −1 e =A+ + + +L+ +L 1! 2! 3! (k − 1)! dt ahonnan következik (konvergens sorok tulajdonsága), hogy A ⋅ eA ⋅ t =
d A⋅t e dt
(5.7.7)
Hasonló módszer alapjan igazolhatjuk, hogy e
A⋅t
⋅A =
d A⋅t e dt
Ez egy fontos eredmény ha figyelembe vesszük, hogy a mátrix szorzat nem kommutatív. Tehát ha az 5.7.7 derivált formát visszahelyettesítjük az eredeti 5.7.2 homogén egyenletbe akkor azt kapjuk, hogy:
111
d A⋅t e ⋅ x (0) = A ⋅ e A ⋅ t ⋅ x (0) = A ⋅ x ( t ) ⇒ x& ( t ) = A ⋅ x dt igaz és így igazoltuk, hogy x = e A⋅t ⋅ x (0) egy megoldása a homogén x& ( t ) = A ⋅ x egyenletnek. x& ( t ) =
Keressük most a nemhomogén egyenlet egy megoldását. Ez az egyenlet az 5.7.1 egyenlet. Ennek a megoldását keressük az integrálási faktor módszerrel. Az integrálási faktor e − A ⋅ t és ezzel balról beszorozva az 5.7.1 nemhomogén egyenletet kapjuk, hogy: e
−A⋅t & −A⋅t −A⋅t ⋅ x(t) = e ⋅ A ⋅ x(t) + e ⋅ B ⋅ u(t) ⇒ e − A ⋅ t ⋅ x& ( t ) − e − A ⋅ t ⋅ A ⋅ x ( t ) = e − A ⋅ t ⋅ B ⋅ u ( t )
− ⋅ Az így kapott egyenlőség bal oldalán az e A t ⋅ x ( t ) teljes deriváltja található s így felírhatjuk, hogy
d −A⋅t (e ⋅ x ( t )) = e − A ⋅ t ⋅ B ⋅ u ( t ) ⇒ ha mindkét oldalt integráljuk ⇒ dt t
e − A ⋅ t ⋅ x ( t ) − e − A ⋅ 0 ⋅ x (0) = e − A ⋅ τ ⋅ B ⋅ u (τ)
∫ 0
De a Taylor sorbafejtés eredményeként e − A ⋅ 0 = I ⇒ t
e − A ⋅ t ⋅ x ( t ) = I ⋅ x (0) + e − A ⋅ τ ⋅ B ⋅ u (τ) ⋅ dτ
∫ 0
Ha balról beszorozzuk az Φ ( t ) = e A ⋅ t taggal, akkor ⇒ t
x ( t ) = e A ⋅ t ⋅ x (0) + e A ⋅ t ⋅ e − A ⋅ τ ⋅ B ⋅ u (τ) ⋅ dτ
∫ 0
t
x ( t ) = e A ⋅ t ⋅ x (0) + e
∫
A ⋅ ( t − τ)
⋅ B ⋅ u (τ) ⋅ dτ
(5.7.8)
0
Ezt a
Φ(t ) = e A ⋅ t
(5.7.9)
mátrixot nevezzük a rendszer fundamentális mátrixának vagy másnéven állapottranziciós mátrixnak és ennek kiszámítása adja majd az állapotegyenletek megoldását. Itt a fundamentális mátrix a zéró kezdeti értékek esetében van felírva. Ez a nemhomogén mátrix differeniálegyenlet általános megoldása. A megoldásnak (jobb oldala az egyenlőségnek) két összetevője van. A már említett x(0) kezdeti értékből induló magára hagyott rendszer mozgása az állapottérben (a homokén egyenlet megoldása) a második tag - a konvolúciós integrál – az x(0) kezdeti értékből induló gerjesztett mozgás (nem más mint a nemhomogén egyenlet egy megoldása). Az LTI rendszer teljes megoldása
112
Az előbbiekben láttuk, hogy egy LTI rendszer állapotteres leírása az ismert (5.4.2) ⎧x& ( t ) = A ⋅ x ( t ) + B ⋅ u ( t ) ⎨ ⎩ y( t ) = C ⋅ x ( t ) + D ⋅ u ( t ) differenciálegyenletrendszer. Az A rendszermátrix adja az előbbiekben meghatározott 5.7.9 fundamentális mátrixot. Legyen most a kezdeti állapotvektor x ( t 0 ) és t 0 ≠ 0 . Az előbbi gondolatmenetet követve az 5.7.8 alapján azt kapjuk, hogy az állapotegyenletek megoldása most: t
x ( t ) = Φ ( t − t 0 ) ⋅ x ( t 0 ) + ∫ Φ ( t − τ) ⋅ B ⋅ u (τ) ⋅ dτ t0
(5.7.10)
t
y( t ) = C ⋅ Φ ( t − t 0 ) ⋅ x (ϑ) + ∫ C ⋅ Φ ( t − τ) ⋅ B ⋅ u (τ) ⋅ dτ + D ⋅ u ( t ) t0
Itt a fundamentális (állapotranziciós) mátrix Φ( t − t 0 ) = e A( t −t 0 ) (5.7.11) Legyen most egy időben változó rendszer amikor a rendszermátrix nem egy konstans elemekből felépített mátrix. Legyen A = A ( t ). Innen a rendszer nem gerjesztett (homogén) állapotegyenlete x& ( t ) = A ( t ) ⋅ x ( t ) . Ekkor az t
∫ A ( τ)⋅dτ
x(t) = e t0
⋅ x(t 0 )
t
(jelöljük az ∫ A ( τ)⋅dτ = G ( t ) ) akkor és csakis akkor megoldás ha az t0
d G ( t ) dG ( t ) G ( t ) e = ⋅e dt dt egyenlőség igaz. Ez a megoldás feltétele. Csakhogy mátrixfüggvények esetében ez nem mindig igaz. Két ismert eset van mikor ez igaz. Mégpedig ha a rendszermátrix A egy konstans mátrix, vagy egy átlós mátrix. Az első esetben a teljes megoldást az előzőekben (5.7.10) számítottuk ki, míg a második esetben az állapotegyenletek egymástól függetlenek, tehát kapunk megoldást. Igazolható, hogy az előbbi feltétel igaz abban az esetben ha minden t 1 és t 2 esetében ( t 1 > 0; t 2 > 0 ) igaz, hogy: A( t1 ) ⋅ A( t 2 ) = A( t 2 ) ⋅ A( t1 ) ami azt jelenti, hogy a mátixok komutálnak. Ha ez igaz akkor a rendszer fundamentális mátrixa: t
Φ( t, t 0 ) = e
∫ A ( τ)⋅dτ
t0
(5.7.12)
113
Ha a megoldhatósági feltétel nem igaz, akkor az állapottranziciós mátrixot speciális integrálási (Peano-Baker) módszerrel kell kiszámítani (legtöbbször lehet, hogy akár egy vektoriális Volterra integrálegyenlethez jutunk). Az állapottranziciós (fundamentális) mátrix tulajdonságai 1. Φ ( t 0 , t 0 ) = I n ha a rendszer n-ed rendű. 2. Φ ( t 2 , t 0 ) = Φ ( t 2 , t 1 ) ⋅ Φ ( t 1 , t 0 ) x ( t 2 ) = Φ( t 2 , t 1 ) ⋅ x ( t 1 ) = Φ( t 2 , t 0 ) ⋅ x ( t 0 ) legyen x ( t1 ) = Φ( t1 , t 0 ) ⋅ x ( t 0 ) és ekkor x ( t 2 ) = Φ( t 2 , t1 ) ⋅ Φ( t 1 , t 0 ) ⋅ x ( t 0 ) ⇒ Φ( t 2 , t 0 ) = Φ( t 2 , t1 ) ⋅ Φ( t 1 , t 0 ) 3. Φ ( t 1 , t 2 ) = Φ −1 ( t 2 , t 1 ) Φ −1 ( t 2 , t 1 ) ⋅ Φ ( t 2 , t 1 ) = I n = Φ ( t 1 , t 1 ) de Φ ( t 1 , t 2 ) ⋅ Φ ( t 2 , t 1 ) = Φ ( t 1 , t 1 ) ⇒ Φ ( t 1 , t 2 ) ⋅ Φ ( t 2 , t 1 ) = Φ −1 ( t 2 , t 1 ) ⋅ Φ ( t 2 , t 1 ) majd jobbról szorozva Φ −1 ( t 2 , t 1 ) mátrixszal, kapjuk a 3. tulajdonságot 4. Ha a megoldhatósági feltétel igaz, akkor Φ ( t + t 0 ) = Φ ( t ) ⋅ Φ ( t 0 ) Ez egyből következik az felírható fundamentális mátrixból, vagyis Φ ( t ) = e A⋅t ⇒ Φ ( t + t 0 ) = e A⋅( t + t 0 ) = Φ ( t ) ⋅ Φ ( t 0 ) 5. Φ −1 ( t ) = Φ (− t ) . Ez a 4. pontnál leírt esetben igaz és ugyancsak az ott felírt összefüggésből következik ha t 0 = 0 . Példa
Ha az ⎛ λ1 ⎜ A=⎜ 0 ⎜0 ⎝
0⎞ ⎟ 0⎟ λ 3 ⎟⎠
0 λ2 0
akkor ⎛ λ ⋅t ⎜e 1 ⎜ A⋅t ⎜ 0 e = ⎜ ⎜ 0 ⎜ ⎝
0
λ ⋅t e 2 0
⎞ ⎟ ⎟ 0 ⎟ λ ⋅t ⎟ e 3 ⎟ ⎟ ⎠ 0
114
Később bizonyítjuk be, hogy ez az összefüggés csak akkor igaz ha a A rendszermátrix átlós forma. Ezt most felhasználjuk a következő állapotegyenlet megoldásában. Példa
Legyen: ⎛1⎞ ⎛− 3 0 ⎞ ⎛ 2⎞ ⎟⎟ ⋅ x + ⎜⎜ ⎟⎟ ⋅ u és x (0) = ⎜⎜ ⎟⎟ a kezdeti feltétel, x& = ⎜⎜ ⎝ 2⎠ ⎝ 0 − 5⎠ ⎝ 3⎠ és ha u(t) =
t≥0 1 (t) egységugrás jel azaz 1 = ⎧⎨10 ha , ha t < 0
a bemenő jel
⎩
⎛ x (t) ⎞ akkor keressük meg az x ( t ) = ⎜⎜ 1 ⎟⎟ megoldást. ⎝ x 2 (t) ⎠
A differenciálegyenlet általános megoldása (5.7.10) alapján írjuk fel, vagyis:
⎛ e −3⋅t x ( t ) = ⎜⎜ ⎝ 0
0 ⎞⎟ ⎛ 1 ⎞ ⎛⎜ e −3⋅t ⋅ ⎜⎜ ⎟⎟ + e −5⋅t ⎟⎠ ⎝ 2 ⎠ ⎜⎝ 0
⇒
⎛t ⎜ e 3⋅τ ⋅ dτ 0 ⎞⎟ ⎜⎜ 0 ⋅ e −5⋅t ⎟⎠ ⎜ t ⎜ 0 ⋅ dτ ⎜ ⎝ 0
∫
∫
⎞ 0 ⋅ dτ ⎟ ⎟ ⎛ 2⎞ 0 ⎟ ⋅ ⎜⎜ ⎟⎟ ⋅ 1 ⋅ dτ t ⎟ ⎝ 3⎠ e 5⋅τ ⋅ dτ ⎟ ⎟ 0 ⎠ t
∫
∫
t ⎞ ⎛ ⎜ e −3⋅t ⋅ 2 ⋅ e 3⋅τ ⋅ dτ ⎟ ⎟ ⎛ x 1 ( t ) ⎞ ⎛ e −3⋅t ⎞ ⎜ 0 ⎟+⎜ ⎟ ha t ≥ 0 ⎜⎜ ⎟⎟ = ⎜ t −5⋅t ⎟ ⎜ ⎟ ⎝ x 2 ( t ) ⎠ ⎝ 2 ⋅ e ⎠ ⎜ −5⋅t ⋅ 3 ⋅ e 5⋅τ ⋅ dτ ⎟ ⎜e ⎟ ⎜ 0 ⎠ ⎝
∫
∫
⇒
⎛ e −3⋅t 2 ⎞ ⎟ ⎜ ⎛ x1 ( t ) ⎞ ⎜ 3 + 3 ⎟ ⎟⎟ = x ( t ) = ⎜⎜ −5⋅t 3⎟ ⎝ x 2 (t) ⎠ ⎜ 7 ⋅ e + ⎟ ⎜ 5⎠ ⎝ 5
Vegyük észre, hogy ez a megoldás azonos két független elsőrendű lineáris differenciálegyenlet megoldásával, ahol a két egyenlet: ⎧ x& 1 = −3 ⋅ x1 + 2 ⋅ u és ⎨ ⎩x& 2 = −5 ⋅ x 2 + 3 ⋅ u
⎧ x1 (0) = 1 és ⎨ ⎩x 2 (0) = 2
1
u(t) = (t) t ≥ 0
Ez annak a következménye, hogy az A rendszermátrix tiszta átlós forma. Mindezt még megemlítem, mikor a rendszermátrix sajátérékeit tárgyaljuk.
115
Példa
Adott a következő mátrixegyenlet: ⎛ 3⎞ ⎛− 4 1 ⎞ ⎟⎟ ⋅ x és x (0) = ⎜⎜ ⎟⎟ . x& = ⎜⎜ ⎝ 4⎠ ⎝ 0 − 1⎠ Ebben az esetben a rendszermátrix nem átlós mint az előző példa esetében ezért sokkal nehezebb a megoldási eljárás. Most a Taylor sorbafejtés módszerét alkalmazzuk, vagyis felírjuk, hogy: ⎛16 − 5 ⎞ 3 ⎛ − 64 21 ⎞ 4 ⎛ 256 − 85 ⎞ ⎟⎟; A = ⎜⎜ ⎟; A = ⎜⎜ ⎟; stb. , A 2 = ⎜⎜ − 1⎟⎠ 1 ⎟⎠ ⎝0 1 ⎠ ⎝ 0 ⎝ 0 így meg:
e A⋅t
⎛ ⎜ 16 ⋅ t 2 64 ⋅ t 3 256 ⋅ t 4 1 4 t − ⋅ + − + −L ⎜ 2! 3! 3! ⎜ = ⎜ ⎜ 0 ⎜ ⎝
t−
⎞ 5 ⋅ t 2 21 ⋅ t 3 85 ⋅ t 4 + − − L⎟ 2! 3! 3! ⎟ ⎟. ⎟ t2 t3 t4 1 − t + − + − L ⎟⎟ 2! 3! 3! ⎠
Innen tovább folytatni azt jelenti, hogy meg kell állapítsuk, hogy az előbbi mátrix elemeit alkotó sorok konvergensek-e, s ha igen akkor meg kell találnunk a határértékeiket. Ez általában nehéz, vagy néha megoldhatatlan feladat. Ebben az esetben megadom a megoldást (határértékeket), hogy:
e
A⋅ t
⎛ −4⋅t ⎜e =⎜ ⎜ 0 ⎝
e − t − e −4⋅t 3 e −t
⎞ ⎟ ⎟ ⎟ ⎠
Az is látható, hogy a következő egyenlőtlenséghez jutunk: ⎛ e −4⋅t e A⋅t ≠ ⎜⎜ ⎝ 0
e t ⎞⎟ -vel e − t ⎟⎠
( mintha az exponenciális operátort „lineárisan” alkalmaztuk volna a példánkban szereplő A mátrix esetében) és ezt nagyon fontos dolog megjegyezni. Az elkövetkezőkben a mátrixalgebra és mátrixanalízis eredményeit követve próbálunk megoldásokat keresni azokban az esetekben is amikor az adott A nem egy átlós forma, vagyis amint ezt látni fogjuk később, amikor a rendszer pólusai nem valós és egyszeri gyökei a karakterisztikus egyenletnek.
116
Példa
Adottak a következő állapotegyenletek: ⎛x ⎞ ⎛ x (t) ⎞ ⎛− 2 1 ⎞ ⎛ 0⎞ ⎟⎟ ⋅ x + ⎜⎜ ⎟⎟ ⋅ u x = ⎜⎜ 1 ⎟⎟ x (0) = ⎜⎜ 10 ⎟⎟ x& = ⎜⎜ ⎝ 0 − 1⎠ ⎝1⎠ ⎝ x 2 (t) ⎠ ⎝ x 20 ⎠ y = (1 0) ⋅ x + (1) ⋅ u a további számításokhoz szükség lesz a következő részeredményekre.
⎛ 4 − 3⎞ ⎛− 8 7 ⎞ ⎟⎟ ; A 3 = ⎜⎜ ⎟⎟ A 2 = ⎜⎜ ⎝0 1 ⎠ ⎝ 0 − 1⎠ Kiszámítjuk az e A⋅t mátrixot vagyis A ⋅ t A 2 ⋅t 2 A3 ⋅t 3 A k ⋅t k ⋅ + + +L+ +L = eA t = I + k! 1! 2! 3! ⎛ 1 0 ⎞ ⎛ − 2 1 ⎞ t ⎛ 4 − 3⎞ t 2 ⎛ − 8 7 ⎞ t 3 ⎟⎟ + ⎜⎜ ⎟⎟ ⋅ + ⎜⎜ ⎟⎟ ⋅ + ⎜⎜ ⎟⎟ ⋅ + L = = ⎜⎜ ⎝ 0 1 ⎠ ⎝ 0 − 1⎠ 1! ⎝ 0 1 ⎠ 2! ⎝ 0 − 1⎠ 3! 2 3 2 3 ⎛ ⎞ ⎜1 − 2 ⋅ t + 4 ⋅ t − 8 ⋅ t + L 0 + 1 ⋅ t − 3 ⋅ t + 7 ⋅ t + L ⎟ 1! 2! 3! 1! 2! 3! ⎟= =⎜ 2 3 ⎜ ⎟ t t t 0 1− + − +L ⎟ ⎜ 1! 2! 3! ⎝ ⎠ ⎛ e − 2⋅ t = ⎜⎜ ⎝ 0
e − t − e − 2⋅ t ⎞⎟ ⎟ e− t ⎠
A magára hagyott rendszer mozgását (vagyis a homogén differenciálegyenlet megoldását) ⎛ x ( t ) ⎞ ⎛ e −2⋅t x ( t ) = ⎜⎜ 1 ⎟⎟ = ⎜⎜ ⎝ x 2 (t) ⎠ ⎝ 0
e − t − e −2⋅t ⎞ ⎛ x 10 ⎞ ⎟ ⋅ ⎜⎜ ⎟ x ⎟⎟ e −t ⎠ ⎝ 20 ⎠
Most felírjuk a teljes megoldást mint: t
x ( t ) = e A ⋅ t ⋅ x (0) + ∫ e A ⋅ ( t − τ) ⋅ B ⋅ u (τ) ⋅ dτ = 0
⎛ e −2⋅t = ⎜⎜ ⎝ 0 t
t ⎛ e −2⋅( t −τ) e − t − e −2⋅t ⎞⎟ ⎛ x 10 ⎞ ⎜ ⎜ ⎟ ⋅ + ⎜x ⎟ ∫⎜ −t ⎟ e ⎠ ⎝ 20 ⎠ 0 ⎝ 0
e −( t −τ) − e −2⋅( t −τ) ⎞⎟ ⎛ 0 ⎞ ⎜ ⎟ ⎟ ⋅ ⎜ 1 ⎟ ⋅ u (τ) ⋅ dτ = e −( t − τ) ⎠ ⎝ ⎠
− 2⋅t ⎛ ⎛ e −( t −τ) − e −2⋅( t −τ) ⎞ + x 20 ⋅ e − t + x 20 ⋅ e −2⋅t ⎜ ⎟ ⋅ u (τ) ⋅ dτ + ⎜ x 10 ⋅ e ∫ ⎜ e −( t − τ) ⎟ ⎜ x 20 ⋅ e − t ⎠ ⎝ 0⎝
⋅ ⎞⎟ ⎟ ⎠
117
t
⇒ x 1 ( t ) = ∫ (e −( t −τ) − e −2⋅( t −τ) ) ⋅ u ( τ) ⋅ dτ + x 10 ⋅ e −2⋅t + x 20 ⋅ (e − t + e −2⋅t ) 0 t
x 2 ( t ) = ∫ e −( t −τ) ⋅ u (τ) ⋅ dτ + x 20 ⋅ e − t 0
A kimenetet felírjuk mint: ⎛ x (t ) ⎞ y( t ) = (1 0) ⋅ ⎜⎜ 1 ⎟⎟ + (1) ⋅ u ( t ) = x 1 ( t ) + u ( t ) = ⎝ x 2 (t) ⎠ = x 10 ⋅ e
− 2⋅t
−t
+ x 20 ⋅ (e + e
− 2⋅t
t
) + u ( t ) + ∫ (e −( t − τ) − e − 2⋅( t − τ) ) ⋅ u (τ) ⋅ dτ 0
Az u(t) bemenő jel ismeretében, így meghatározhatjuk a rendszer kimenő jelének analitikus formáját ha elvégezzük a kijelölt integrált. ⊗
118
6. A mátrixalgebra és analízis alapfogalmai Legyen adott az x& = A ⋅ x , lineáris rendszert leíró homogén állapotegyenlet. Ennek az egyenletnek az összes megoldásából képzett halmaz egy lineáris tér, a valós számok (R) halmazára nézve. Az A és B mátrixokat ekvivalensnek nevezzük ha az egyik a másikból megkapható elemi mátrix transzformációkat alkalmazva. Elemi transzformáción értjük azt ha az adott mátrixot balról megszorozzuk egy P i (i = 1,2,3, L) nem szinguláris mátrixxal vagy/és jobbról egy másik nem szinguláris Q i (i = 1,2,3, L) mátrixxal. Jelölje a baloldali mátrixszorzatokat P valamint a jobboldali mátrixszorzatokat Q . Akkor azt mondjuk, hogy A és B mátrixok ekvivalensek ha létezik P és Q nem szinguláris mátrix úgy, hogy B = P⋅A⋅Q Két ekvivalens mátrixnak ugyanakkora a rangja. Bármely A mátrix, melynek rangja r > 0 transzformálható egy ekvivalens mátrixba amely lehet : ⎛ I 0⎞ ⎛I ⎞ ⎟⎟ vagy (I r 0 ) vagy ⎜⎜ r ⎟⎟ I r vagy ⎜⎜ r ⎝ 0 0⎠ ⎝0⎠ forma ahol I r nem más mint az r x r dimenziójú egységmátrix. Ezeket a formákat normált vagy kanonikus formáknak nevezzük. Ha A egy nem szinguláris mátrix akkor P = A −1 és Q = I ahol I az A dimenziójú egységmátrix, kiszámítható az A mátrixnak megfelelő normált forma. Ha most olyan transzformációkat ( P, Q ) alkalmazunk, hogy az A mátrixot egységmátrix formára hozzuk, vagyis: I = P⋅A⋅Q akkor felírhatjuk, hogy: −1
A = A ⇒ A = P ⋅P⋅A⋅Q⋅Q
−1
−1
⇒ A = P ⋅I⋅Q
−1
−1
⇒ A = P ⋅Q
−1
amely azt jelenti, hogy bármely nem szinguláris mátrix felírható két elemi mátrix szorzataként. Ha az általános B = P ⋅ A ⋅ Q transzformációt tekintjük és ha •
P = Q −1 akkor szimilaritás transzformációról beszélünk
•
P = Q τ = Q −1 akkor ortogonális transzformációról
•
P = Q τ akkor kongruens transzformációról beszélünk.
119
•
abban az esetben ha A egy a ij = a *ij tulajdonsággal (Hamilton) rendelkező mátrix, akkor P = (Q* ) τ akkor egység transzformációról beszélünk. ( az ∗ komplex konjugálás, míg τ a mátrixtranszponálás művelete).
6.1. Állapotváltozók transzformációja
A követett cél, hogy hozzuk az A mátrixot úgy egy átlós (normált vagy kanonikus ) formára, hogy az így kapott állapotegyenletek ekvivalensek legyenek az eredetivel. Ezért meg kell határozzuk a bevezetőben leírt P, Q mátrixokat. Ha ezeket sikerült megtalálni akkor azt mondjuk, hogy az állapotváltozók nem csatoltak (függetlenek) egymástól és az így kapott differenciálegyenlet rendszer egymástól független n darab elsőrendű differenciálegyenletre bontható ami azt jelenti, hogy könnyen megoldható állapotegyenlet rendszert kapunk. Legyenek adottak az 5.4.2 egyenletek ⎧x& ( t ) = A ⋅ x ( t ) + B ⋅ u ( t ) ⎨ ⎩ y( t ) = C ⋅ x ( t ) + D ⋅ u ( t )
(6.1.1)
x = M⋅q
(6.1.2)
az állapotegyenletek. Tekintsük az
transzformációt és számítsuk ki az új állapotegyenleteket az új, q állapotváltozók függvényében. A 6.1.2 transzformációt alkalmazva a 6.1.1 rendszerben kapjuk, hogy: ⎧x& ( t ) = M ⋅ q& = A ⋅ M ⋅ q( t ) + B ⋅ u ( t ) ⎨ y( t ) = C ⋅ M ⋅ q ( t ) + D ⋅ u ( t ) ⎩ Ha most az első egyenletet, balról M −1 mátrixxal megszorozzuk, akkor a q& = M −1 ⋅ A ⋅ M ⋅ q( t ) + M −1 ⋅ B ⋅ u ( t ) egyenletet kapjuk. Ezt nevezzük az állapotegyenletek normált formájának. Ha az állapotváltozók nem csatoltak (tehát függetlenek) akkor ⇒ M −1 ⋅ A ⋅ M = Λ jelölés arra utal, hogy Λ egy átlós n x n-és mátrix amelyben a főátló elemei (λ1 , λ 2 , L , λ n ) .
A feladat az, hogy megtaláljuk ezeket a λ i (i = 1,2,L n ) értékeket, vagyis azt az M mátrixot amely mint operátor, a rendszert x állapottérből q állapottérbe transzformálja úgy, hogy az új rendszermátrix az átlós Λ forma lesz. 120
Ha M −1 ⋅ A ⋅ M = Λ ⇒ A ⋅ M = M ⋅ Λ , tehát egy szimilaritás transzformáció, és jelöljük az M oszlopait mint x i és a mátrixszorzás szabályait alkalmazzuk, akkor a következő kifejezést kapjuk:
(i = 1,2,L, n ) λ i ⋅ I ⋅ x i − A ⋅ x i ≡ 0; (i = 1,2, L, n ) (λ i ⋅ I − A ) ⋅ x i ≡ 0; (i = 1,2,L, n ) A ⋅ x i = x i ⋅ λi
vagy vagy
(6.1.3)
egyenletekhez jutunk. Ha M −1 ⋅ A ⋅ M = Λ egy szimilaritás transzformáció akkor ez −1
az M , M létezését is feltételezi. A 6.1.3 összefüggéseiből következik, hogy az M oszlopvektorai nem mások mint az A rendszermátrix sajátvektorai és λ i az ezeknek megfelelő sajátértékek. Tehát ha meghatározzuk a rendszermátrix sajátvektorait akkor ezekből mint oszlopvektorok képezzük az M mátrixot amelyet modális mátrixnak nevezünk és ennek, mint transzformáció operátornak a segítségével megkaphatjuk a normál állapotegyenleteket. Ez egy partikuláris esete a sajátértékek létezésének. Eddig arról volt szó, hogyha az állapotegyenletek normált formáját akarjuk akkor szükségünk van a rendszer sajátértékeire. Mostantól azt is tárgyalnunk kell, hogy különböző típusú sajátértékek segítségével kaphatunk normált alakot minden esetben? Tekintsük most a következő homogén, lineáris egyenletrendszert: (λ i ⋅ I − A) ⋅ x i ≡ 0;
Általános
formában
felírhatjuk
mint
(i = 1,2,L , n )
U⋅x = y
vagyis
(6.1.4) mint
egy
lineáris
egyenletrendszert. Ha y = 0 akkor az egyenletrendszerünk homogén. Tehát a célunk az U⋅x = 0
lineáris, homogén egyenletrendszerek megoldhatóságainak tanulmányozása. Fontos dolog a zérótól különböző (nem triviális) megoldások megtalálása. Tudjuk hogy annak feltétele, hogy a fenti homogén, lineáris egyenletrendszernek legyen a triviális megoldástól különböző megoldása az, hogy det( U) = 0 vagyis det(λ ⋅ I − A) = 0 legyen. Ebben az egyenletben az ismeretlen a λ . Az egyenlet rangja n vagyis annyi mint a rendszer állapotainak száma. Az n darab λ i , (i = 1,2,L , n ) a rendszernek megfelelő sajátértékek és ezek segítségével meghatározzuk a rendszer sajátvektorait. Jelöljük a sajátértékeknek megfelelő sajátvektorokat mint λi → xi ,
(i = 1,2, L , n ) .
Az x i értékekből, mint oszlopvektorok, képzett mátrix az M = ( x 1 , x 2 , L , x n ) a modális mátrix. A következőkben tárgyalom a sajátérték, sajátvektorok meghatározásának egyes módszereit, eseteit.
121
6.2. Sajátérték, Sajátvektor
Adott a következő lineáris egyenletrendszer: V⋅x = y ahol V egy n x n –es mátrix. A megoldandó feladat alapkérdése az, hogy mikor létezik egy x vektor úgy, hogy ha a V transzformációs mátrixot (operátort) alkalmazzuk, akkor azt az y vektort kapjuk, amelynek a vektortérben ugyanaz az iránya mint az x vektornak. Ha ez az x létezik ( y adott) akkor az arányos kell legyen az adott y vektorral, vagyis: V ⋅ x = y = λ ⋅ x ; λ ∈ C. Itt C a komplex számok halmazát jelenti. Azok a λ i komplex számok melyekre létezik x i ≠ 0 azok a V sajátértékei valamint x i ≠ 0 sajátvektorai. A megoldandó alapegyenlet V ⋅ x = λ ⋅ x amely felírható mint (V − λ I) ⋅ x = 0 valamint egy homogén lineáris egyenletrendszerként a következő módon: ⎛ v11 ⎜ Ha V = ⎜ v 21 ⎜v ⎝ n1
v12 v 22 vn2
v1n ⎞ ⎛ x1 ⎞ ⎟ ⎜ ⎟ v 2n ⎟ és x = ⎜ x 2 ⎟ akkor az egyenletrendszer a következő: ⎜x ⎟ v nn ⎟⎠ ⎝ n⎠ ⎧ ( v11 − λ ) ⋅ x1 + v12 ⋅ x 2 + L + v1n ⋅ x n = 0 ⎪ ⎨ v 21 ⋅ x1 + ( v 22 − λ) ⋅ x 2 + L + v 2n ⋅ x n = 0 ⎪v ⋅ x + v ⋅ x + L + ( v − λ ) ⋅ x = 0 n2 2 nn n ⎩ n1 1
egy minden esetben összeférhető egyenletrendszer. A rendszernek van triviálistól eltérő megoldása ha teljesül a következő reláció: det(λ ⋅ I − V) = 0
(6.2.0.1)
Ezt nevezzük a V operátornak megfelelő karakterisztikus egyenletnek, tehát ha a V operátor most egy rendszert leíró A rendszer mátrixxal azonos akkor 6.2.1 –ről mint a rendszer karakterisztikus egyenletéről beszélünk. Ez a karakterisztikus egyenlet ugyanaz mint a rendszert modellező differenciálegyenlet megoldása során felírandó karakterisztikus egyenlet és ugyanakkor ekvivalens a SISO rendszert modellező N(s) ) nevezője D(s) polinomjának megfelelő egyenlettel. átviteli függvény (H(s) = D(s) Ez fontos kijelentés, hogy egységesen láthassuk az állapotteres leírás valamint a Laplace transzformáció segítségével felírt átviteli függvényre épülő eljárásokat. A karakterisztikus egyenlet polinom egyenletét felírhatjuk mint: P(λ) = λn + a 1 ⋅ λn −1 + a 2 ⋅ λn −2 + L + a n −1 ⋅ λ + a n = det(λ ⋅ I − V) = 0
(6.2.0.2)
Ennek az egyenletnek a gyökei lehetnek:
122
• • • • •
Valós, egyszeri gyökök Valós, többszörös gyökök Komplex (konjugált), egyszeri gyökök Komplex (konjugált), többszörös gyökök A fenti esetek különböző, bármely lehetséges kombinációja
Látható 6.2.2 alapján, hogy P(0) = det(− V) = a n ⇒ a n = (−1) n ⋅ det(V) Ha tudjuk, hogy: P (λ ) = (λ − λ1 ) ⋅ (λ − λ 2 ) ⋅ L ⋅ (λ − λ n ) akkor Viète összefüggések alapján felírható, hogy: P(0) = (−1) n ⋅ det(V) = (−1) n ⋅ λ1 ⋅ λ 2 ⋅ λ 3 ⋅ L ⋅ λ n tehát det(V) = λ1 ⋅ λ 2 ⋅ λ 3 ⋅ L ⋅ λ n ⇒ , hogy ha csak egy sajátérték is zéró, akkor V egy szinguláris mátrix.
Ugyancsak a Viète összefüggések alapján felírható, hogy: a 1 = −(λ1 + λ 2 + λ 3 + L + λ n ) = −( v11 + v 22 + L + v nn ) ⇒ a V mátrix főátlója elemeinek összege amelyet a mátrix nyomvonalának is nevezzünk, tehát: trace(V) = Tr (a ij ) = (λ1 + λ 2 + λ 3 + L + λ n ) = ( v11 + v 22 + L + v nn ) . Legyen V k a mátrix k-ik hatványa. Ha ennek nyomvonalát Tk -val jelöljük, akkor felírhatjuk a következő rekurzív összefüggéseket: a 1 = −T1 ⎧ ⎪ a 2 = − 12 ⋅ (a 1 ⋅ T1 + T2 ) ⎪ ⎨ a 3 = − 13 ⋅ (a 2 ⋅ T1 + a 1 ⋅ T2 + T3 ) ⎪ ⎪⎩a n = − n1 ⋅ (a n −1 ⋅ T1 + a n −2 ⋅ T2 + L + a 1 ⋅ Tn −1 + Tn ) Ez egy hasznos forma, ha számítógépes módszereket használunk a rendszertanulmányozásra. Ha a rendszert n sajátérték jellemzi, azaz λ i , (i = 1,2,L , n ) , akkor minden sajátértékéhez a (V − λ I) ⋅ x = 0 egyenlet egy x i sajátvektor megoldása tartozik.
Mivel az egyenletrendszer homogén, ezért a k i ⋅ x i is szintén sajátvektor és k i egy valós szám. Azt a mátrixot amelyet a k i ⋅ x i oszlopvektorokból képezünk, modális mátrixnak nevezünk. Most azt a fontos esetet tárgyaljuk amikor n darab egyszeri sajátértéke van a rendszernek. A későbbiekben visszatérünk még a komplex és/vagy többszörös gyökök esetére is. Ha a sajátértékek egyszeri gyökei a karakterisztikus egyenletnek, akkor a modális mátrix oszlopai lehetnek bármely nem zéró oszlopa (vagy ezzel arányos vektor) az adj(λ i ⋅ I − A) mátrixnak. Tekintsük az általános négyzetes V mátrix helyett, az A rendszermátrixot. Mivel az adj(λ i ⋅ I − A) mátrix oszlopai, egy adott λ i sajátértékre 123
egymással lineárisan összefüggnek (nem függetlenek), ezért az adott sajátértékre a mátrix csak egy oszlopvektorát vehetjük mint sajátvektor és ez lesz a modális mátrix egy oszlopa. Példa ⎛2 − 2 3 ⎞ ⎟ ⎜ Adott A = ⎜ 1 1 1⎟ ⎜ 1 3 − 1⎟ ⎠ ⎝
Az ennek megfelelő karakterisztikus egyenlet λ−2 det(λ I − A) = − 1 −1 ⇒ λ1 = 1;
λ1 = −2;
2
−3
λ − 1 − 1 = 0 = λ3 − 2 ⋅ λ2 − 5 ⋅ λ + 6 = (λ − 1) ⋅ (λ + 2) ⋅ (λ − 3) ⇒ − 3 λ +1 λ1 = 3;
Most felírjuk az adj(λ i ⋅ I − A) formát ⎛ λ2 − 4 − 2 ⋅ λ + 7 3 ⋅ λ − 5 ⎞⎟ ⎜ ⎟ adj(λ i ⋅ I − A) = ⎜ λ + 2 λ2 − λ − 5 λ +1 ⎟ ⎜ 2 ⎜ λ+2 3 ⋅ λ − 8 λ − 3 ⋅ λ + 4⎟ ⎠ ⎝
Most minden sajátértékre válasszunk ki egy nem zéró sajátvektort a legegyszerűbb formában, tehát úgy, hogy eltekintünk az arányossági tényezőtől. Így felírjuk, hogy: ⎛ − 3 5 − 2⎞ ⎜ ⎟ Ha λ = 1 ⇒ adj(1 ⋅ I − A) = ⎜ 3 − 5 2 ⎟ ⎜ 3 −5 2 ⎟ ⎝ ⎠ ⎛ 0 11 − 11⎞ ⎟ ⎜ Ha λ = −2 ⇒ adj( −2 ⋅ I − A) = ⎜ 0 1 −1 ⎟ ⎜ 0 − 14 14 ⎟ ⎠ ⎝ Ha λ = 3 ⇒
⎛5 1 4⎞ ⎜ ⎟ adj(3 ⋅ I − A) = ⎜ 5 1 4 ⎟ ⎜5 1 4⎟ ⎝ ⎠
Ha λ = 1 sajátértékre az adjungált mátrixból az első oszlopot választjuk és eltekintünk a 3 mint arányossági tényezőtől, a λ = −2 sajátértéknek megfelelően az adjungált mátrixból a második oszlopot választjuk, míg a λ = 3 sajátértékre szintén a második oszlopot választjuk akkor a következő modális mátrixot kapjuk:
124
⎛ − 1 11 1⎞ ⎟ ⎜ M=⎜ 1 1 1⎟ ⎜ 1 − 14 1⎟ ⎠ ⎝
A modális mátrix oszlopai egy három dimenziós vektortér bázisvektorait alkotják. Ezt a teret nevezzük állapottérnek ha meg az állapotváltozók nem mások mint fázisváltozók akkor fázistérről beszélünk. Ha (A − λ I) ⋅ x = 0 sajátértékei egyszeri gyökök akkor létezik a következő reláció: M⋅Λ = A⋅M
ahol Λ egy olyan átlós mátrix ahol a főátló mentén a sajátértékek helyezkednek el. Innen következik, egy szimilaritás transzformációt alkalmazva (ha M −1 létezik), hogy: Λ = M −1 ⋅A ⋅ M Innen meg következik, hogy: Λ 2 = (M −1 ⋅A ⋅ M ) ⋅ (M −1 ⋅A ⋅ M ) = M −1 ⋅A 2 ⋅ M Ezeket ismerve, írjuk fel újra a következő összefüggéseket: y = A ⋅ x és egy x = M ⋅ q transzformációt alkalmazunk akkor ⇒ y = A ⋅ M ⋅ q , és ha most ha az M nem más mint az A rendszermátrix modális mátrixa, és ez nem szinguláris akkor a következő transzformációkat írhatjuk fel: M −1 ⋅ y = M −1 ⋅ A ⋅ M ⋅ q = Λ ⋅ q ⇒ z = Λ ⋅ q ha z = M −1 ⋅ y jelölést használjuk. Ezt a formát még felírhatjuk mint: ⎧ z1 = λ1 ⋅ q 1 ⎪ ⎨z 2 = λ 2 ⋅ q 2 ⎪z = λ ⋅ q n n ⎩ n
Ez egy összeférhető, határozott egyenletrendszer és a q i , (i = 1,2,L , n ) koordináták a sajátvektorok irányába mutatnak. Ezek a rendszer normálkoordinátái s ez a rendszer normált alakja. Az M modális mátrix oszlopvektorai egy bázist, míg M −1 sorvektorai egy reciprok bázist képeznek az eredeti állapottérben ( x ). Jelöljük most a modális mátrix oszlopvektorait {v1 , v 2 ,L , v n } -nek nevezzük míg a reciprok bázis vektorait jelöljük mint {r 1 , r 2 ,L , r n } . Bármely y vektor felírható mint: y = r 1 , y ⋅ v1 + r 2 , y ⋅ v 2 + L + r n , y ⋅ v n
125
ahol r1 , y ⋅ v1 azt jelenti, hogy az r1 bázisvektor és az y vektor skaláris szorzatát (amely nem más mint az y vektor r1 bázisvektornak megfelelő komponense) tekintjük az y vektornak az új v1 bázisvektor szerinti komponensének. De y = M ⋅ M −1 ⋅ y = ( v1 v 2 L v n ) ⋅ M -1 ⋅ y = ( v1 v 2 L v n ) ⋅ z ahol a z = M −1 ⋅ y egy előbbi összefüggést használtuk. Így írhatjuk, hogy: ⎛ z1 ⎞ n ⎜ ⎟ y = ( v1 v 2 L v n ) ⋅ ⎜ z 2 ⎟ = z1 .v1 + z1.v1 + L + z1.v1 = ∑ z i ⋅ v i i =1 ⎜z ⎟ ⎝ n⎠ n
Ha ezt összevetjük az előző y = ∑ r i , y ⋅ v i felírással, akkor evidens, hogy i =1
zi = ri , y
⇒ M
−1
sorai képezik a reciprok bázist, amelyre érvényes:
r i , v j = δ ij
∀i, j = 1,2, L, n
a Kronnecker féle összefüggés. Példa ⎛−1 ⎛2 − 2 3 ⎞ ⎟ ⎜ ⎜ Legyen A = ⎜ 1 1 1 ⎟⇒M=⎜ 1 ⎜1 ⎜ 1 3 − 1⎟ ⎠ ⎝ ⎝ ⇒ ⎛1 0 ⎜ −1 M ⋅ A ⋅ M = ⎜0 − 2 ⎜0 0 ⎝
1⎞ ⎟ 1 1⎟ ⇒ M −1 = − 14 1⎟⎠ 11
0 ⎞ ⎛ λ1 ⎟ ⎜ 0⎟ = ⎜ 0 3 ⎟⎠ ⎜⎝ 0
0 λ2 0
1 30
⎛ − 15 25 − 10 ⎞ ⎟ ⎜ 2 −2 ⎟ ⋅⎜ 0 ⎜ 15 3 12 ⎟⎠ ⎝
0⎞ ⎟ 0 ⎟=Λ λ 3 ⎟⎠
Példa
Adott a következő egyenletrendszer: 1 ⎞ ⎛ 0 ⎟⎟ ⋅ x y = ⎜⎜ ⎝ − 2 − 3⎠ Ekkor ⎛λ −1 ⎞ ⎛λ + 3 1 ⎞ ⎟⎟ = ⎜⎜ ⎟⎟ ⇒ ⇒ adj⎜⎜ ⎝ 2 λ + 3⎠ ⎝ − 2 λ ⎠ ⎛1⎞ ⎛ 1 ⎞ v1 = x 1 = ⎜⎜ ⎟⎟ és v 2= x 2 = ⎜⎜ ⎟⎟ a két sajátvektor. ⎝ − 1⎠ ⎝ − 2⎠ 126
Most normalizáljuk a két sajátvektort, vagyis elosztjuk mindkét vektort a vektor ⎛x ⎞ moduluszával. Ha x i = ⎜⎜ 1 ⎟⎟ akkor a vektor modulusza x i = x 12 + x 22 . Így a ⎝x2 ⎠
⎛ 1 ⎞ sajátvektorok normalizált alakja: v1 = x1 = ⎜ 21 ⎟ és ⎜− ⎟ ⎝ 2⎠ 1 ⎞ ⎛ 1 ⎞ ⎛ 1 ⎜ 5 ⎟ ⎜ 2 5 ⎟ ⇒ M −1 = ⎛⎜ 2 ⋅ 2 v2 = x 2 = ⎜ ⎟ ⇒M=⎜ 1 ⎟ ⎜− 5 2 − 2 ⎟ ⎜− ⎜− ⎟ ⎝ 5⎠ 5⎠ 2 ⎝ ⎝
2 ⎞ ⎟ − 5 ⎟⎠
a reciprok bázisvektorok az inverz M −1 mátrix sorai és ezek transzponáltjai: ⎛2⋅ 2 ⎞ ⎛− 5⎞ ⎟ és r τ2 = ⎜ ⎟ r1τ = ⎜⎜ ⎜− 5⎟ ⎟ ⎝ 2 ⎠ ⎝ ⎠ Látható, hogy: r1 , v1 = (2 ⋅ 2
⎛1⎞ 2 ) ⋅ ⎜⎜ ⎟⎟ = 1 ⎝ − 1⎠
és hasonlóképpen kiszámíthatjuk, hogy r 2 , v1 = 0 r1 , v 2 = 0 r 2 , v2 = 1
(Kronnecker összefüggések) 6.2.1. Lineáris, nemhomogén egyenletrendszer egyszeri sajátértékekkel
Adott a következő állapotegyenlet rendszer (lásd 5.4.2): ⎧x& ( t ) = A ⋅ x ( t ) + B ⋅ u ( t ) ⎨ y( t ) = C ⋅ x ( t ) ⎩ Egy példa segítségével mutatom be a modális mátrix ( M ) kiszámítását és az ennek segítségével elvégzett rendszer transzformációt. Abból indulunk ki, hogy az A rendszermátrixnak csak egyszeri sajátértékei vannak és ezek ismertek Példa
Adottak a következő rendszeregyenletek és határozzuk meg a sajátvektorait. ⎧ ⎛ 0⎞ ⎛ 2 − 2 3⎞ ⎟ ⎜ ⎟ ⎜ ⎪ ⎪x& = ⎜ 1 1 1 ⎟ ⋅ x + ⎜ 0 ⎟ ⋅ u ⎨ ⎜1⎟ ⎜ 1 3 1⎟ ⎠ ⎝ ⎠ ⎝ ⎪ ⎪⎩ y = (1 0 0) ⋅ x 127
Legyen u = 1(t) ha t ≥ 0 . Ismertek λ1 = 1; λ 2 = −2; λ 3 = 3; A sajátvektorok meghatározása •
λ 1 = 1; most oldjuk meg a (1 ⋅ I − A) ⋅ x 1 = 0 egyenletrendszert ⎧− x11 + 2 ⋅ x 12 − 3 ⋅ x13 = 0 ⎛ − 1 2 − 3 ⎞ ⎛ x11 ⎞ ⎛ 0 ⎞ ⎟ ⎜ ⎟ ⎟ ⎜ ⎜ ⎪ ⇒ ⎜ − 1 0 − 1 ⎟ ⋅ ⎜ x12 ⎟ = ⎜ 0 ⎟ ⇒ ⎨ − x11 + 0 ⋅ x12 − x13 = 0 ⎪− x − 3 ⋅ x + 2 ⋅ x = 0 ⎜ −1 − 3 2 ⎟ ⎜ x ⎟ ⎜0⎟ 12 13 ⎩ 11 ⎠ ⎝ 13 ⎠ ⎝ ⎠ ⎝ ez egy összeférhető, egyszeresen határozatlan egyenletrendszer akkor választhatjuk x 12 = 1 (tetszőleges). ⎛ − 1⎞ ⎜ ⎟ Ekkor következik, hogy x 1 = ⎜ 1 ⎟ egy a λ 1 = 1 -nek megfelelő sajátvektor. ⎜1⎟ ⎝ ⎠
•
λ 2 = −2; most oldjuk meg a (−2 ⋅ I − A) ⋅ x 2 = 0 egyenletrendszert és ha a keletkező egyszeresen határozatlan egyenletrendszernél x 22 = 1 értéket ⎛ 11 ⎞ ⎟ ⎜ választjuk akkor a kapott sajátvektor x 3 = ⎜ 1 ⎟ . ⎜ − 14 ⎟ ⎠ ⎝
•
λ 3 = 3; most oldjuk meg a (3 ⋅ I − A) ⋅ x 3 = 0 egyenletrendszert és a fenti ⎛1⎞ ⎜ ⎟ módszer alapján következik, hogy x 1 = ⎜1⎟ ⎜1⎟ ⎝ ⎠
⎛ − 1 11 1⎞ ⎟ ⎜ Tehát a kapott modális mátrix M = ⎜ 1 1 1⎟ . ⎜ 1 − 14 1⎟ ⎠ ⎝
Jó ha ellenőrizzük, hogy igaz az M
−1
⋅ A ⋅ M = Λ összefüggés.
Elvégezzük az x = M ⋅ q változócserét és ⇒ ⎧⎪q& = M −1 ⋅ A ⋅ M ⋅ q + M −1 ⋅ B ⋅ u ⎨ y = C⋅M⋅q ⎪⎩
(6.2.1.1)
Számítsuk ki most ezeket a transzformációkat. Így megkapjuk az új q vektoroknak megfelelő állapotteret. Ebben az állapottérben van felírva a 6.2.1.1 állapotegyenlet. A számítási részletektől eltekintünk, és kapjuk a 6.2.1.2 állapotegyenleteket most már az új állapottérben. 128
⎧ ⎛ − 15 25 ⎛1 0 0⎞ ⎟ ⎜ ⎪& ⎜ 1 q ⋅ + ⋅ = − 0 2 0 q 0 2 ⎟ ⎜ ⎪ 30 ⎜ ⎜ 15 ⎜ 0 0 3⎟ 3 ⎪⎪ ⎠ ⎝ ⎝ ⎨ ⎛ − 1 11 ⎪ ⎜ ⎪ y = (1 0 0) ⋅ ⎜ 1 1 ⎪ ⎜ ⎪⎩ ⎝ 1 − 14
− 10 ⎞ ⎛ 0 ⎞ ⎟ ⎜ ⎟ − 2 ⎟ ⋅ ⎜ 0⎟ ⋅ u 12 ⎟⎠ ⎜⎝ 1 ⎟⎠ 1⎞ ⎟ 1⎟ ⋅ q 1⎟⎠
⎧ ⎛ − 13 ⎞ ⎛1 0 0⎞ ⎟ ⎜ ⎟ ⎜ ⎪ ⎪q& = ⎜ 0 − 2 0 ⎟ ⋅ q + ⎜ − 151 ⎟ ⋅ u ⎨ ⎜ 2 ⎟ ⎜ 0 0 3⎟ ⎠ ⎝ ⎪ ⎝ 5 ⎠ ⎪⎩ y = (− 1 11 1) ⋅ q
(6.2.1.2)
Ennek alapján, három, nem csatolt állapotegyenlethez jutunk q& 1 ( t ) = q 1 ( t ) − 13 ⋅ u ( t ) q& 2 ( t ) = −2 ⋅ q 2 ( t ) − 151 ⋅ u ( t ) q& 3 ( t ) = 3 ⋅ q 3 ( t ) + 52 ⋅ u ( t )
Ha ezeket az egyenleteket megoldjuk akkor a következőket kapjuk: t
q1 ( t ) = e t ⋅ q1 (0) + e t ⋅ ∫ e − τ ⋅ (− 13 )dτ = e t ⋅ q 1 (0) + 0
q 2 (t) = e
− 2⋅t
e t −τ t ⋅ e | 0 = e t ⋅ (q 1 (0) − 13 ) + 13 3
⋅ (q 2 (0) + 301 ) − 301
q 3 ( t ) = e 3⋅t ⋅ (q 3 (0) + 152 ) + 152
ha t ≥ 0
Ugyanakkor y = −q1 ( t ) + 11 ⋅ q 2 ( t ) + q 3 ( t ) A kezdeti állapotokat kiszámítjuk a következő formákból: x (0) = M ⋅ q (0)
vagy
q (0) = M −1 ⋅ x (0) .
6.2.2 Lineáris, nemhomogén egyenletrendszer többszörös sajátértékekkel
Ugyancsak egy példán keresztül mutatom be ezt az esetet. Az eset általános tárgyalása a mátrixalgebra tárgykörébe tartozik. Példa
Legyen adott a következő állapotegyenlet
129
⎛ x& 1 ( t ) ⎞ ⎛ 1 1⎞ ⎛ x1 ( t ) ⎞ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ ⎟⎟ ⋅ ⎜⎜ ⎝ x& 2 ( t ) ⎠ ⎝ 0 1⎠ ⎝ x 2 ( t ) ⎠
és ebből kiszámítható a λ1 = λ 2 = 1 sajátértékek, tehát itt egy kétszeres sajátértékről van szó. ⎛ 0 1 ⎞ ⎛ x11 ⎞ ⎛ 0 ⎞ ⎟⎟ = ⎜⎜ ⎟⎟ ⇒ x 12 = 0 és x 11 = k 1 ⎟⎟ ⋅ ⎜⎜ • λ1 = 1 ⇒ (I − A) ⋅ x1 = 0 ⇒ ⎜⎜ ⎝ 0 0 ⎠ ⎝ x 12 ⎠ ⎝ 0 ⎠ •
λ1 = 1 ⇒ de csak ugyanazt írhatnánk fel mint az előbb ⇒ ∃! k 1 és így csak egy lineárisan független sajátvektor lenne de ez nem elégséges bázisnak egy 2D vektortérben ⇒ ezt a rendszermátrixot ( A ) nem lehet átlós formára hozni. Ennek ellenére található egy bázis 2D-ben amelyben az állapotegyenletek kezelhetőbb formát vesznek fel.
Példa
Határozzuk meg a rendszeregyenletnek megfelelő sajátvektorokat. 0 ⎞ ⎛ x1 ⎞ ⎛ x& 1 ⎞ ⎛ − 10 0 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ − 1 − 25 ⎟ ⋅ ⎜ x 2 ⎟ ⇒ és a sajátértékeket kiszámítjuk a det(λ I − A) = 0 ⎜ x& 2 ⎟ = ⎜ 0 ⎜ x& ⎟ ⎜ 0 9 − 35 ⎟⎠ ⎜⎝ x 3 ⎟⎠ ⎝ 3⎠ ⎝
egyenletből ⇒ λ1 = λ 2 = −10, λ 3 − 26 •
•
0 ⎞ ⎛ x 11 ⎞ ⎛ 0 ⎞ ⎛0 0 ⎟ ⎜ ⎟ ⎟ ⎜ ⎜ λ1 = −10 ⇒ (−10 ⋅ I − A) ⋅ x1 = −⎜ 0 9 − 25 ⎟ ⋅ ⎜ x12 ⎟ = ⎜ 0 ⎟ ⎜ 0 9 − 25 ⎟ ⎜ x ⎟ ⎜ 0 ⎟ ⎠ ⎝ 13 ⎠ ⎝ ⎠ ⎝ 0 ⎞ ⎛ x 21 ⎞ ⎛ 0 ⎞ ⎛0 0 ⎟ ⎜ ⎟ ⎟ ⎜ ⎜ λ 2 = −10 ⇒ (−10 ⋅ I − A) ⋅ x1 = −⎜ 0 9 − 25 ⎟ ⋅ ⎜ x 22 ⎟ = ⎜ 0 ⎟ ⎜ 0 9 − 25 ⎟ ⎜ x ⎟ ⎜ 0 ⎟ ⎠ ⎝ 23 ⎠ ⎝ ⎠ ⎝
Innen következnek a következő egyenletrendszerek: ⎧ 0 ⋅ x11 + 0 ⋅ x12 + 0 ⋅ x13 = 0 ⎪ ⎨0 ⋅ x11 + 9 ⋅ x12 − 25 ⋅ x13 = 0 és ⎪0 ⋅ x + 9 ⋅ x − 25 ⋅ x = 0 11 12 13 ⎩ ⎧ 0 ⋅ x 21 + 0 ⋅ x 22 + 0 ⋅ x 23 = 0 ⎪ ⎨0 ⋅ x 21 + 9 ⋅ x 22 − 25 ⋅ x 23 = 0 ⎪0 ⋅ x + 9 ⋅ x − 25 ⋅ x = 0 21 22 23 ⎩
de a lineáris egyenletrendszerek rangja 1, tehát két mellék ismeretlenünk van s mivel az egyenletrendszer összeférhető így két szabadon választható paraméter két
130
független sajátvektort eredményez. Az előző egyenletből látható, hogy x 11 és x 21 szabadon választhatók, míg a 9 ⋅ x12 − 25 ⋅ x13 = 0 9 ⋅ x 22 − 25 ⋅ x 33 = 0 megmaradt egyenletekből egy-egy változó még szabadon választható. Válasszuk az x 12 = 25 és x 22 = 25 értékeket és akkor x 13 = 9; x 23 = 9 így a kapott két sajátvektor: ⎛0⎞ ⎛1⎞ ⎜ ⎟ ⎜ ⎟ x 1 = ⎜ 25 ⎟ és x 2 = ⎜ 25 ⎟ . ⎜9⎟ ⎜9⎟ ⎝ ⎠ ⎝ ⎠ ⎛ 0⎞ ⎜ ⎟ • λ 3 = −26 ⇒ x 3 = ⎜ 1 ⎟ , így ⎜1⎟ ⎝ ⎠ ⎛ 0 1 0⎞ ⎟ ⎜ a modális mátrix M = ⎜ 25 25 1 ⎟ és det(M ) = −16 ≠ 0 ⇒ a modális mátrix ⎜ 9 9 1⎟ ⎠ ⎝ oszlopai lineárisan függetlenek.
A. Null-mező és Rang-mező
Legyen adott a következő leképezés: (λ i ⋅ I − A ) ⋅ x i = y amelyet a következő módon tudunk szemléltetni:
Legyen a N(λ i ⋅ I − A) a (λ i ⋅ I − A) operátor (leképezés) null-mezője és az összes olyan x i alkotja amelynek képe ha az előbbi leképezést használjuk, egyenlő y = 0 val. A null-mező az operátor értelmezési tartományának egy résztartománya (mag – kernel). Ennek a null-mezőnek a dimenzióját nevezzük NULL-nak. Ha NULL=2 akkor két sajátvektor létezik amelyre y = 0 és ez a két sajátvektor lineárisan független 131
egymástól. Ha NULL= 0 akkor a null-mező egyetlen elemet tartalmaz, a zéró vektort, vagyis az x i = 0 vektort. Az (λ i ⋅ I − A) ⋅ x i = 0 azt mondja, hogy (λ i ⋅ I − A) operátor és x i sajátvektor skaláris szorzata zéró és ez azt jelenti, hogy az operátor sorai és a sajátvektorok merőlegesek egymásra. Legyen a (λ i ⋅ I − A) operátornak megfelelő R (λ i ⋅ I − A) rang-mező ami nem más mint azon y ≠ 0 -ok halmaza amely azzal a tulajdonsággal rendelkezik, hogy léteznek azok az x i vektorok amelyekre (λ i ⋅ I − A) ⋅ x i = y ≠ 0 . A rang-mező dimenziója RANG egyenlő az (λ i ⋅ I − A) operátor rangjával (mátrix rangja). Az alapkérdés az, hogy megtaláljuk a NULL értékét. Az A operátor egy n x n –és mátrix, akkor n = NULL + RANG
(6.2.2.1)
Legyen (λ i ⋅ I − A) = (a 1 a 2 L a n ) ahol a i oszlopvektorok. Ekkor felírhatjuk, hogy y = a 1 ⋅ x i1 + a 2 ⋅ x i 2 + L + a n ⋅ x in vagyis az operátor rangja nem más mint a maximális lineárisan független oszlopvektorok száma vagyis az A mátrix rangja. Ezek alapján: • •
ha az (λ i ⋅ I − A) rangja n akkor a sajátvektor problémának csak triviális megoldása létezik (NULL=0 csak 0 vektor a sajátvektor) ha NULL >0 (ami ugyanazt jelent, hogy (λ i ⋅ I − A) < n ) ⇒ (λ i ⋅ I − A) ⋅ x i = 0 rendszernek van nem triviális megoldása és a lineárisan független sajátvektorainak száma egyenlő n − rang(λ i ⋅ I − A ) értékével.
Példa
Adott a következő állapotegyenlet, keressük meg a sajátvektorait. ⎛ x& 1 ⎞ ⎛ 1 0 2 ⎞ ⎛ x 1 ⎞ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎜ x& 2 ⎟ = ⎜ 0 1 4 ⎟ ⋅ ⎜ x 2 ⎟ ⎜ x& ⎟ ⎜ 0 0 2 ⎟ ⎜ x ⎟ ⎠ ⎝ 3⎠ ⎝ 3⎠ ⎝
Ebből következnek a következő sajátértékek: λ1 = λ 2 = 1 és λ 3 = 2 Most felírjuk ⎛ 0 0 2⎞ ⎟ ⎜ (1 ⋅ I − A ) = −⎜ 0 0 4 ⎟ és ennek a mátrixnak a rangja 1. ⎜0 0 1⎟ ⎠ ⎝ Tehát NULL = 3 − RANG = 3 − 1 = 2 ⇒ két lineárisan sajátvektort kaphatunk ha megoldjuk az (λ i ⋅ I − A) ⋅ x i = 0 egyenletet.
132
⎛ 0 0 2 ⎞ ⎛ x1 ⎞ ⎛ 0 ⎞ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ (1 ⋅ I − A) ⋅ x i = 0 ⇒ −⎜ 0 0 4 ⎟ ⋅ ⎜ x 2 ⎟ = ⎜ 0 ⎟ ⇒ ⎜ 0 0 1⎟ ⎜ x ⎟ ⎜ 0⎟ ⎠ ⎝ 3⎠ ⎝ ⎠ ⎝ 2 ⋅ x 3 = 0; 4 ⋅ x 3 = 0; 1 ⋅ x 3 = 0; Innen az következik, hogy x 3 = 0 , de mivel x 1 és x 2 nem jelenik meg ebben a három egyenletben azt eredményezi, hogy tetszőlegesen megválaszthatók. Egy lehetséges választás lehet: ⎛0⎞ ⎛1⎞ ⎜ ⎟ ⎜ ⎟ x 1 = ⎜ 0 ⎟; x 2 = ⎜ 1 ⎟ ⎜0⎟ ⎜0⎟ ⎝ ⎠ ⎝ ⎠
A harmadik sajátvektort amely a λ 3 = 2 sajátértéknek felel meg, kiszámíthatjuk a (2 ⋅ I − A) ⋅ x 3 = 0 ⇒ ⎛ 1 0 − 2 ⎞ ⎛ x 31 ⎞ ⎛ 0 ⎞ ⎟ ⎜ ⎟ ⎟ ⎜ ⎜ ⎜ 0 1 − 4 ⎟ ⋅ ⎜ x 32 ⎟ = ⎜ 0 ⎟ ⇒ ⎜0 0 0 ⎟ ⎜ x ⎟ ⎜0⎟ ⎠ ⎝ 33 ⎠ ⎝ ⎠ ⎝
x 31 − 2 ⋅ x 33 = 0 x 32 − 4 ⋅ x 33 = 0 Mivel a rendszer rangja 2 ezért szabadon választjuk x 33 = 1 értéket, így kapjuk, hogy x 31 = 2; x 32 = 4 . Így a harmadik független sajátvektor ⎛ 2⎞ ⎜ ⎟ x3 = ⎜ 4⎟ ⎜1⎟ ⎝ ⎠
és az így kapott modális mátrix: ⎛1 0 2⎞ ⎛1 0 0⎞ ⎟ ⎟ ⎜ ⎜ −1 M = ⎜ 0 1 4 ⎟ és M ⋅ A ⋅ M = ⎜ 0 1 0 ⎟ . ⎜0 0 1⎟ ⎜ 0 0 2⎟ ⎠ ⎠ ⎝ ⎝ A sajátvektorokat megkaphatjuk az Adj(λ ⋅ I − A) formából. Abban az esetben ha az operátornak megfelelő NULL=1, egy sajátvektort úgy választhatunk, hogy arányos legyen bármely nem zéró oszlopvektorral az adjungált formából. Ez az egyedüli sajátvektor amelyet ezen az úton kaphatunk meg. Példa
Adott a következő rendszermátrix
133
⎛0 1 0⎞ ⎟ ⎜ A = ⎜ 0 0 1 ⎟ ⇒ det(λ ⋅ I − A) = 0 ⇒ λ1 = λ 2 = λ 3 = 1 ⎜1 − 3 3⎟ ⎠ ⎝ ⎛ 1 −1 0 ⎞ ⎟ ⎜ most felírhatjuk, hogy (1 ⋅ I − A) = ⎜ 0 1 − 1 ⎟ ⇒ NULL = 1 ⎜ −1 3 − 2⎟ ⎠ ⎝
(mert a mátrix rangja kettő és n = 3 ), így csak egy sajátvektor határozható meg az adjungált formából, vagyis ⎛1 − 2 1⎞ ⎛1⎞ ⎟ ⎜ ⎜ ⎟ adj(1 ⋅ I − A) = ⎜1 − 2 1⎟ és innen x 1 = ⎜1⎟ . ⎜1 − 2 1⎟ ⎜1⎟ ⎠ ⎝ ⎝ ⎠
Szükség van még két független vektorra, hogy leírhassuk a három dimenziós teret. Ha Null > 1 akkor adj(λ ⋅ I − A) és ennek minden deriváltja egészen d q −2 dλq −2
{adj(λ ⋅ I − A)}
ahol q = NULL zéró mátrix a λ = λ i többszörös sajátértékre. A q darab lineárisan független sajátvektort megkaphatjuk a nem zéró derivált adjungált mátrix nem zéró oszlop vektoraiként. Ha q egyenlő a sajátérték multiplicitásával, akkor q darab lineárisan független sajátvektort kapunk a d q −1 dλq −1
{adj(λ ⋅ I − A)} |λ=λi
mátrixból.
Példa ⎛ 2 1 1⎞ ⎟ ⎜ Keressük meg az A = ⎜ 1 2 1⎟ rendszermátrixnak megfelelő modális mátrixot. ⎜ 0 0 1⎟ ⎠ ⎝ ⎛ λ − 2 − 1 − 1⎞ ⎟ ⎜ (λ ⋅ I − A) = ⎜ − 1 λ − 2 − 1⎟ és innen det(λ ⋅ I − A) = 0 ⇒ λ1 = λ 2 = 1; λ 3 = 3 ⎜ 0 0 1 ⎟⎠ ⎝ Ha λ i = 1 akkor NULL = 2 és a megfelelő adjungált mátrix λ −1 λ −1 ⎞ ⎛ (λ − 2) ⋅ (λ − 1) ⎟ ⎜ adj(λ ⋅ I − A) = ⎜ λ −1 (λ − 2) ⋅ (λ − 1) λ −1 ⎟ ⎜ 0 0 (λ − 1) ⋅ (λ − 3) ⎟⎠ ⎝
134
Látható, hogy λ i = 1 esetében az adjungált mátrix nulla mátrix. Számítsuk ki 1 1 ⎞ ⎛2⋅λ − 3 ⎟ ⎜ d {adj(λ ⋅ I − A)} = ⎜ 1 2⋅λ −3 1 ⎟ dλ ⎜ 0 0 2 ⋅ λ − 4 ⎟⎠ ⎝ és ha λ = 1 ⇒ a derivált adjungált forma: 1 ⎞ ⎛−1 1 ⎟ ⎜ ⎜ 1 − 1 1 ⎟ ⇒ a két sajátvektor ⎜0 0 − 2 ⎟⎠ ⎝ ⎛ 1 ⎞ ⎛ − 1⎞ ⎜ ⎟ ⎜ ⎟ x 1 = ⎜ 1 ⎟; x 2 = ⎜ 1 ⎟ ⎜ − 2⎟ ⎜0⎟ ⎝ ⎠ ⎝ ⎠
Ha λ i = 3 akkor az adjungált mátrixból kapjuk a harmadik sajátvektort: ⎛1⎞ ⎜ ⎟ x3 = ⎜1⎟ ⎜ 0⎟ ⎝ ⎠
Így a modális mátrix: ⎛ −1 1 1⎞ ⎟ ⎜ M=⎜ 1 1 1⎟ ⊗ ⎜ 0 − 2 0⎟ ⎠ ⎝
B. Szimmetrikus mátrixok
Valós és szimmetrikus A mátrixok gyakran előfordulnak a gyakorlatban. A szimmetrikus tulajdonságot az a ij = a ji ha i, j = 1,2,L, n formában írhatjuk le, ahol az a ij az A mátrix eleme. Ezeknek a mátrixoknak alapvető tulajdonsági hogy: • • •
minden sajátértékük valós szám sajátvektorai egy ortogonális bázis alkotnak ha egy sajátvektor algebrai multiplicitása p, akkor ehhez a sajátértékhez p lineárisan független sajátvektor tartozik
Példa Legyen ⎛ − 3 2⎞ ⎟⎟ egy szimmetrikus rendszermátrix. A = ⎜⎜ 2 0 ⎠ ⎝ 2 ⇒ p(λ) = λ + 3 ⋅ λ − 4 = 0 ⇒ λ1 = 1; λ 2 = −4; a sajátértékek. 2 ⎞ ⎛λ ⎟⎟ ⇒ a sajátvektorok, ⇒ adj(λ ⋅ I − A) = ⎜⎜ ⎝ 2 λ + 3⎠ 135
⎛ 2⎞ ⎛1⎞ x 1 = ⎜⎜ ⎟⎟; x 2 = ⎜⎜ ⎟⎟ ⎝ − 1⎠ ⎝ 2⎠ és látható innen, hogy ez a két sajátvektor ortogonális, vagyis a skaláris szorzatuk zéró, vagyis: ⇒ x1 , x 2 = x1τ ⋅ x 2 = 2 − 2 = 0 Az eddigieket összefoglalva megállapíthatjuk: 1. Minden n x n mátrixnak ha n sajátértéke van akkor nem szükségszerű, hogy ezek egyedi értékek legyenek 2. Minden n x n mátrix amelynek n darab egyedi sajátértéke van, mindig átlós formára hozhatók 3. Ha egy n x n mátrixnak van egy többszörös sajátértéke amely multiplicitása m, akkor és csakis akkor hozható átlós formára, ha NULL = m. C. Jordan formák
Legyen A egy mátrix amelynek az λ i egy m multiplicitású sajátérték és az ennek megfelelő NULL < m ! Ekkor nem lehetséges találni egy szimilaritás transzformációt, hogy egy átlós rendszermátrixot kapjunk, kivéve ha A egy valós, szimmetrikus mátrix. Példa 1 ⎞ ⎛λ ⎟⎟. Ez nem hozható átlós alakra ha λ1 = λ 2 . Legyen A = ⎜⎜ 1 ⎝ 0 λ2 ⎠ Építsünk fel egy szimilaritás transzformációt úgy, hogy:
⎛q Q = ⎜⎜ 11 ⎝ q 21
q12 ⎞ ⎟⎟ és Q −1 q 22 ⎠
⎛ q11 q12 ⎞ ⎜⎜ ⎟ q 21 q 22 ⎟⎠ ⎝ ; det(Q) = q11 ⋅ q 22 − q12 ⋅ q 21 = det(Q)
Ha most felírjuk a Q −1 ⋅ A ⋅ Q transzformációt és feltételezzük, hogy a kapott mátrix átlós forma ami azt jelenti, hogy a mellékátló elemei egyenlők zéróval. Ha ezeket az elemeket felírjuk akkor kapjuk, hogy: q 22 ⋅ q12 ⋅ (λ1 − λ 2 ) + q 222 = 0 q11 ⋅ q 21 ⋅ (λ1 − λ 2 ) + q 221 = 0 De ha a két sajátérték egyenlő, akkor ⇒ q 21 = q 22 = 0 kell legyen mert hanem a fenti összefüggéseknek nincs értelme De ekkor det(Q) = 0 ⇒ nem létezik szimilaritás transzformáció, tehát A -nak nincs átlós alakja. ⊗ Igazolhatjuk, hogy bármely négyzetes A mátrix, egy szimilaritás transzformációval Jordan kanonikus formára hozhatjuk, amelynek a következő tulajdonságai vannak: a.) a mátrix átlós elemei az A mátrix sajátértékei b.) a főátló alatti elemek mind zéró értékűek 136
c.) a főátló feletti elemek egy része egyenlő 1–el. (az egyenlő sajátértékeknek megfelelően) Példa ilyen Jordan formákra ⎛ λ1 1 0 ⎞ ⎟ ⎜ J = ⎜ 0 λ1 1 ⎟ vagy ⎜0 0 λ ⎟ 1⎠ ⎝ ⎛ λ1 ⎜ ⎜0 ⎜0 J=⎜ ⎜0 ⎜0 ⎜ ⎜0 ⎝
1 λ1
0
0
0
1 λ1
0
0
0
0 λ2
0
0
0
0 0 λ3
0
0
0
0
0 0
0 ⎞ ⎛ λ1 ⎟ ⎜ 0⎟ ⎜0 0⎟ ⎜0 ⎟ =⎜ 0⎟ ⎜ 0 1 ⎟⎟ ⎜ 0 ⎜⎜ λ 3 ⎟⎠ ⎝ 0
1 λ1 0 0 0 0
0 0 0 1 λ1 0 λ2 0 0 0 0 0
0 0 ⎞ ⎟ 0 0 ⎟ 0 0 ⎟ ⎟ 0 0⎟ λ3 1 ⎟ ⎟ 0 λ 3 ⎟⎠
Az utóbbi mátrix érzékelteti az úgynevezett Jordan blokkokat a Jordan forma esetében. A λ i − hez tartozó blokkok száma a Jordan formában egyenlő a sajátértékhez tartozó sajátvektorok számával, vagyis a (λ i ⋅ I − A) NULL értékével. Egy adott λ i sajátértékhez tartozó 1-ek száma egyenlő a λ i multiplicitása a karakterisztikus egyenletben, kivonva a megfelelő NULL érték. A Jordán forma segítségével felírhatjuk a következő összefüggést A ⋅ M = M ⋅ J amely segítségével kiszámíthatjuk a rendszermátrix sajátvektorait, vagyis az M oszlopvektorait. Jelöljük a sajátvektorokat mint x 1 , x 2 , x 3 ,L, x n . A λ i hez tartozó m-ed rendű (sajátérték multiplicitása) Jordan blokk akkor és csakis akkor létezik ha m lineárisan független x 1 , x 2 , x 3 ,L, x m oszlopvektor kielégíti a következő (λ i ⋅ I − A ) ⋅ x 1 = 0 (λ i ⋅ I − A ) ⋅ x 2 = − x 1
LLLLLLLLL (λ i ⋅ I − A) ⋅ x m = − x m −1 egyenletrendszert. Ezt az egyenletrendszert használjuk a modális mátrix meghatározására. Példa
Legyen λ1 háromszoros, λ 2 egyszeres sajátértékei A rendszermátrixnak. Keressük meg ennek a mátrixnak megfelelő Jordán formát. A (λ i ⋅ I − A) NULL értéke meghatározza a Jordán formát. o 1.eset: ha NULL=3 ⇒ akkor három Jordán blokk étezik. A λ1 -hez rendelt egyesek száma egyenlő a λ1 multiplicitása kivonva a NULL értéke és ez egyenlő 3-3=0. Tehát az A átlós formára hozható.
137
o 2.eset: ha NULL=2 ⇒ akkor két Jordan blokkunk van és az egyesek száma egyenlő 1-el de nem lehet eldönteni melyik blokkhoz tartozik. o 3.eset: ha NULL=1 ⇒ akkor egy Jordan blokkunk van és két 1-es a főátlóval párhuzamosan
Példa ⎛ 0 1 0⎞ ⎜ ⎟ Adott A = ⎜ 0 0 1 ⎟ rendszermátrix, határozzuk meg az ehhez tartozó Jordan ⎜1 − 3 3⎟ ⎝ ⎠ formát, majd a rendszer modális mátrixát.
A mátrixnak λ1 = 1 háromszoros sajátértéke. A mátrix RANG=2 s így NULL=1, tehát egy Jordan blokk alkotja a Jordan formát és az 1-ek száma egyenlő 2-vel (multiplicitás - NULL=2). Így a Jordan formát felírjuk mint: ⎛1 1 0⎞ ⎜ ⎟ J = ⎜0 1 1⎟ ⎜0 0 1⎟ ⎝ ⎠
Most meghatározzuk a rendszermátrix sajátvektorait. Erre az A ⋅ M = M ⋅ J mátrixegyenletet használjuk tudva, hogy az M oszlopvektorai a rendszer sajátvektorai és ekkor felírjuk: (1 ⋅ I − A) ⋅ x 1 = 0 (1 ⋅ I − A) ⋅ x 2 = − x 1
(6.2.2.2)
(1 ⋅ I − A) ⋅ x 3 = − x 2 Itt ⎛ x11 ⎞ ⎛ x 12 ⎞ ⎛ x 13 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ x 1 = ⎜ x 21 ⎟; x 2 = ⎜ x 22 ⎟; x 1 = ⎜ x 23 ⎟; ⎜x ⎟ ⎜x ⎟ ⎜x ⎟ ⎝ 31 ⎠ ⎝ 32 ⎠ ⎝ 33 ⎠
A 6.2.2.2 első egyenletből következik, hogy x 21 = x 11 x 31 = x 21 x 11 − 3 ⋅ x 21 + 2 ⋅ x 31 = 0 Innen következik, hogy x 11 = x 21 = x 31 A választott sajátvektor ⎛ 1⎞ ⎜ ⎟ x 1 = ⎜ 1⎟ ⎜ 1⎟ ⎝ ⎠
138
A 6.2.2.2 második egyenletből következik, hogy x 22 = x 12 + 1 x 32 = x 22 + 1 x 12 − 3 ⋅ x 22 + 2 ⋅ x 32 = 1 Innen következik, hogy x 12 nem meghatározott, ezért ennek választjuk x 12 = 1 A választott sajátvektor ⎛1⎞ ⎜ ⎟ x 2 = ⎜ 2⎟ ⎜ 3⎟ ⎝ ⎠ A 6.2.2.2 harmadik egyenletből következik, hogy x 23 = x 13 + 1 x 33 = x 23 + 2 x 13 − 3 ⋅ x 23 + 2 ⋅ x 33 = 3 Innen következik, hogy x 13 nem meghatározott, ezért ennek választjuk x 13 = −1 A választott sajátvektor ⎛ − 1⎞ ⎜ ⎟ x2 = ⎜ 0 ⎟ ⎜2⎟ ⎝ ⎠ Innen ⎛ 1 1 − 1⎞ ⎛ 4 −5 2 ⎞ ⎜ ⎟ ⎟ −1 ⎜ M = ⎜1 2 0 ⎟; ⇒ M = ⎜ − 2 3 − 1⎟ ⎜1 3 2 ⎟ ⎜ 1 −2 1 ⎟ ⎝ ⎠ ⎝ ⎠
Láthatjuk, hogy ⎛1 1 0⎞ ⎜ ⎟ J = M −1 ⋅ A ⋅ M = ⎜ 0 1 1 ⎟ ⎜0 0 1⎟ ⎝ ⎠
Példa ⎛1 1 0⎞ ⎜ ⎟ Adott A = ⎜ 1 1 0 ⎟ rendszermátrix, határozzuk meg az ehhez tartozó Jordan ⎜ 2 3 2⎟ ⎝ ⎠
formát, majd a rendszer modális mátrixát. A rendszer sajátértékei λ1 = 1 kétszeres míg λ 2 = 2 egyszeres érték. A λ1 = 1 értékre NULL=1 akkor ennek a sajátértéknek egy Jordan blokk felel meg egy egyessel a főátlóval párhuzamosan. Kapjuk: 139
⎛ 2 0 0⎞ ⎜ ⎟ J = ⎜0 1 1⎟ ⎜0 0 1⎟ ⎝ ⎠
A modális mátrixot az előző példában is használt módszer szerint határozzuk meg. A λ 2 = 2 értékre a következő egyenleteket kapjuk: 2 ⋅ x11 = x11 2 ⋅ x 21 = x11 + x 21 Az x 31
2 ⋅ x 31 = 2 ⋅ x11 + 3 ⋅ x 21 + 2 ⋅ x 31 = 1 értéket tetszőlegesen választhatjuk és kapjuk a sajátvektort ⎛ 0⎞ ⎜ ⎟ x1 = ⎜ 0 ⎟ ⎜1⎟ ⎝ ⎠
A λ1 = 1 értékre a következő egyenleteket kapjuk: x 12 = x12 x 22 = x12 + x 22 x 32 = 2 ⋅ x12 + 3 ⋅ x 22 + 2 ⋅ x 32 Az x 22 = 1 értéket tetszőlegesen választhatjuk és kapjuk a sajátvektort ⎛ 0 ⎞ ⎜ ⎟ x1 = ⎜ 1 ⎟ ⎜ − 3⎟ ⎝ ⎠
A λ1 = 1 értékre a következő egyenleteket kapjuk: x 13 = x13 x 23 + 1 = x 13 + x 23 x 33 − 3 = 2 ⋅ x13 + 3 ⋅ x 23 + 2 ⋅ x 33 Az x 23 = 0 értéket tetszőlegesen választhatjuk és kapjuk a sajátvektort ⎛ 1 ⎞ ⎜ ⎟ x1 = ⎜ 0 ⎟ ⎜ − 5⎟ ⎝ ⎠
Innen 1 ⎞ 1 ⎞ ⎛0 0 ⎛5 3 ⎜ ⎟ ⎟ −1 ⎜ M = ⎜0 1 0 ⎟; ⇒ M = ⎜ 0 1 0 ⎟ ⎜ 1 − 3 − 5⎟ ⎜ 1 − 3 − 5⎟ ⎝ ⎠ ⎝ ⎠
Láthatjuk, hogy 140
J=M
−1
⎛ 2 0 0⎞ ⎜ ⎟ ⋅ A ⋅ M = ⎜0 1 1⎟ ⎜0 0 1⎟ ⎝ ⎠
Példa
Adott a következő rendszer mátrix ⎛0 ⎜ ⎜0 A=⎜ 0 ⎜ ⎜0 ⎝
0 0 0 0
0⎞ ⎟ 1⎟ 0⎟ ⎟ 0 ⎟⎠
1 0 0 0
A karakterisztikus egyenlet λ4 = 0 és a ennek megfelelő NULL=2. Így két Jordan blokkunk van és 2 darab egyes van az főátlóval párhuzamosan. Két Jordán forma írható fel. ⎛ 0 1 0 0⎞ ⎛ 0 0 0 0⎞ ⎜ ⎟ ⎜ 0 0 1 0⎟ 0 0 0 0 ⎜ ⎟ ⎟; vagy J = J=⎜ ⎜ ⎜ 0 0 0 1⎟ 0 0 0 1⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 0 0 0 0⎟ ⎝ 0 0 0 0⎠ ⎝ ⎠ Ha a módszert folytatjuk akkor a következő modális mátrixot kapjuk: ⎛ x 11 ⎜ ⎜x M = ⎜ 21 0 ⎜ ⎜ 0 ⎝
x 12
x 13
x 22 x11
x 23 0
x 21
0
x 14 ⎞ ⎟ x 24 ⎟ x13 ⎟ ⎟ x 23 ⎟⎠
és innen a paramétereket úgy válasszuk, hogy az oszlopvektorok lineárisan függetlenek legyenek. A próba-szerencse módszer elkerülése végett bevezetjük az általánosított sajátvektor fogalmát. Azt az x k vektort amely eleget tesz a következő összefüggéseknek (A − λ i ⋅ I) k −1 ⋅ x k ≠ 0 ( A − λ i ⋅ I) k ⋅ x k = 0 λ i -nek megfelelő általánosított sajátvektornak nevezzük.
Ez azt jelenti, hogy x k vektor eleme (A − λ i ⋅ I) k NULL-mezőjének de nem eleme (A − λ i ⋅ I) k −1 NULL-mezőjének. Az általánosított sajátvektornak az az előnye, hogy ha egyszer egy x k vektort megtaláltunk, akkor a többi sajátvektort megtalálhatjuk a következő összefüggések alapján:
141
x k −1 = (A − λ i ⋅ I) ⋅ x k x k −2 = (A − λ i ⋅ I) ⋅ x k −1 LLLLLLLLLL Példa
Adott a következő rendszer mátrix ⎛0 1 0⎞ ⎜ ⎟ A = ⎜0 0 1⎟ ⎜ 1 − 3 3⎟ ⎝ ⎠
Innen λ3 − 3 ⋅ λ2 + 3 ⋅ λ − 1 = 0 ⇒ λ1 = λ 2 = λ 3 = 1 . Ekkor ⎛ 1 −1 0 ⎞ ⎜ ⎟ (I − A) = ⎜ 0 1 − 1 ⎟; RANG = 2; NULL = 1 ⎜ −1 3 − 2⎟ ⎝ ⎠
Így csak egy lineárisan független sajátvektort határozhatunk meg. ⎛ 1 − 1 0 ⎞ ⎛ x 11 ⎞ ⎛ 0 ⎞ ⎛ 1⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 0 1 − 1 ⎟ ⋅ ⎜ x 12 ⎟ = ⎜ 0 ⎟; ⇒ x 1 = ⎜1⎟ ⎜ −1 3 − 2⎟ ⎜ x ⎟ ⎜0⎟ ⎜ 1⎟ ⎝ ⎠ ⎝ 13 ⎠ ⎝ ⎠ ⎝ ⎠ Még két sajátvektort kell meghatározzunk az általánosított sajátvektor módszerrel. Ekkor ⎛1 − 2 1⎞ ⎜ ⎟ 2 (I − A) = ⎜1 − 2 1⎟; ⇒ RANG = 1 ⎜1 − 2 1⎟ ⎝ ⎠ ⎛ 0 0 0⎞ ⎜ ⎟ (I − A) = ⎜ 0 0 0 ⎟ ⎜0 0 0⎟ ⎝ ⎠ 3
(I − A) 3 ⋅ x 3 = 0 de (I − A) 2 ⋅ x 3 ≠ 0 ⇒ ⇒ x 31 − 2 ⋅ x 32 + x 33 ≠ 0 akkor egy lehetőség ⎛ − 1⎞ ⎜ ⎟ x3 = ⎜ 0 ⎟ ⎜2⎟ ⎝ ⎠
Az x 2 sajátvektort generálhatjuk az x 3 sajátvektorból ha felírjuk:
x 2 = (I − A) ⋅ x 3
⎛1⎞ ⎜ ⎟ ⇒ x 2 = ⎜ 2⎟ ⎜ 3⎟ ⎝ ⎠
142
Ezek alapján ⎛ 1 1 − 1⎞ ⎛ 4 ⎜ ⎟ −1 ⎜ M = ⎜1 2 0 ⎟; M = ⎜ − 2 ⎜1 3 2 ⎟ ⎜ 1 ⎝ ⎠ ⎝ ⎛1 1 ⎜ −1 J = M ⋅ A ⋅ M = ⎜0 1 ⎜0 0 ⎝
−5
2⎞ ⎟ 3 − 1⎟ − 2 1 ⎟⎠ 0⎞ ⎟ 1⎟ 0 ⎟⎠
Összefoglaló
•
Minden n x n-és mátrixnak n sajátértéke van, nem mindig egyszeri gyökök.
•
Minden n x n-és mátrix amelynek n egyszeri gyöke van, mindig átlós formára hozhatók
•
Egy n x n –és mátrixnak amelynek λ i egy m-szeres sajátértéke, csak akkor hozható átlós formára, ha NULL=m
•
Az n x n –és mátrixnak amelynek λ i egy m-szeres sajátértéke, Jordan formára hozható ha NULL < m.
Megjegyzések a fejezetekhez A. Időben változó (variáns) rendszerek
Az időben változó rendszerek leírása az eddig használt módszerekhez képest sokkal nehezebb folyamat. Legyen a következő rendszermodell:
&y& = a ( t ) ⋅ y& + b( t ) ⋅ y = u Látható, hogy az erősítési tényezők (a(t),b(t)) időben változó mennyiségek és nem konstans tényezők mint az eddig tárgyalt esetekben. Mindenekelőtt a differenciálegyenlet nem egy lineáris egyenlet. A rendszerelmélet külön fejezetei foglalkoznak az időben változó rendszerekre vonatkozó fogalmakkal és itt nem térünk ki ezekre. B.Nemlineáris rendszerek Nemlineáris rendszerek blokkdiagramjahoz be kell vezetni speciális funkciójú blokkokat. Így például legyen:
Ahol M egy nemlineáris operátor, míg f( ) egy nemlineáris függvény. Példának vegyük xMy = x ⋅ y tehát egy multiplikációt jelentő operátor, míg f ( y) = y 3 nem linearitást jelenti és legyen a nemlineáris rendszerünk modellje:
143
&y& + a ⋅ y ⋅ y& + b ⋅ y 3 = u Ennek megfelelő blokk diagram látható a következő ábrán. Ezek tárgyalása sem képezi ennek a könyvnek az anyagát.
Látható, hogy a szimulációs diagram tartalmazza a nemlineáris operátort mint átviteli elem, de egy ilyen rendszerre nem írhatunk fel egy az eddigiekben ismertetett állapotegyenlet rendszert.
144
7. Transzformációk a rendszerelméletben A folytonos jeleket és a rendszereket leíró függvények és egyenletek tanulmányozásában használt hatásos eszközök a Fourier transzformáció a Laplace transzformáció. A diszkrét jelek és rendszerek esetében a diszkrét Fourier transzformációt valamint Z-transzformációt használjuk. A transzformációk eredménye egy jel (modell) a frekvencia tartományban. Az így kapott matematikai forma ekvivalens az eredeti kiindulási formájával és ez az ekvivalencia egyértelműen meghatározott vagyis az időtartománybeli módszerekkel ekvivalens reprezentációs eszközöket (módszereket) biztosít valós vagy komplex frekvencia tartományban. A transzformációk előnye, hogy az így kapott új matematikai eszközök esetében általában egyszerűbb matematikai eljárások állnak rendelkezésünkre a rendszerek és jelek tanulmányozására. Hasonló a helyzet a diszkrét rendszerek esetében is. Mindezek a módszerek lineáris, időben invariáns rendszerek esetében alkalmazhatók. Nem célja ennek a fejezetnek, hogy teljes részletességében mutassa be a transzformációkat. Itt a hatásos alkalmazhatóságon van a hangsúly. Nem térünk ki a számítógép támogatta gyors számítási algoritmusokra sem. A hangsúly az elkövetkezőkben a transzformáció eredményének értelmezésére és alkalmazására irányul. 7.1. Fourier sorbafejtés és transzformáció
Legyen f(t,T) egy szakaszonként folytonos (megszámlálhatóan végtelen) és differenciál-ható, korlátos változású függvény, akkor felírható Fourier sor alakban. Egy periodikus időfüggvényt a jel amplitúdója, körfrekvenciája (periódusa), és kezdőfázisa határozza meg. Tudjuk, hogy a körfrekvencia és periódus közötti összefüggés: 2⋅π ω= T Bizonyítás nélkül egy f(t,T) periodikus jel Fourier sorát a következőképpen írjuk fel: ∞
f ( t , T) = ∑ (A i ⋅ cos(i ⋅ ω ⋅ t ) + B i ⋅ sin(i ⋅ ω ⋅ t ))
(7.1.1)
i =0
Az együtthatókat a következő összefüggésekkel számítjuk ki:
A0 =
Ai =
Bi =
1 T
2 T
2 T
T 2
⋅ ∫ f ( t , T) ⋅ dt − T2 T 2
⋅ ∫ f ( t , T) ⋅ cos(i ⋅ ω ⋅ t ) ⋅ dt
(7.1.2)
− T2 T 2
⋅ ∫ f ( t , T) ⋅ sin(i ⋅ ω ⋅ t ) ⋅ dt − T2
Ha a Fourier sor komplex alakját keressük, akkor a következő helyettesítéseket alkalmazzuk: 145
cos(i ⋅ ω ⋅ t ) =
e j⋅(i⋅ω⋅ t ) + e − j⋅(i⋅ω⋅ t ) 2
e j⋅(i⋅ω⋅ t ) − e − j⋅(i⋅ω⋅ t ) cos(i ⋅ ω ⋅ t ) = 2
(7.1.3)
∞ ⎡ e j⋅(i⋅ω⋅t ) + e − j⋅(i⋅ω⋅t ) e j⋅(i⋅ω⋅t ) − e − j⋅(i⋅ω⋅t ) ⎤ + Bi ⋅ f ( t , T ) = ∑ ⎢A i ⋅ ⎥= 2 2 ⎢ i =0 ⎣ ⎦⎥ ∞
A i − j ⋅ B i j⋅(i⋅ω⋅t ) ∞ A i + j ⋅ B i − j⋅(i⋅ω⋅t ) ⋅e +∑ ⋅e = 2 2 i =0 i =0
=∑ =
∞
A i − j ⋅ B i j⋅(i⋅ω⋅t ) ⋅e 2 i = −∞
∑
A i − j ⋅ Bi 2 a komplex együtthatót és így a Fourier sor a következő formában írható: Ci =
Jelöljük:
f ( t, T) =
∞
∑ C i ⋅ e j⋅(i⋅ω⋅t ) ;
i = −∞
ahol C i =
1 T
T 2
⋅ ∫ f ( t , T) ⋅ e − j⋅(i⋅ω⋅t )
(7.1.4)
− T2
A 7.1.1. ábra a négyszögfüggvény Fourier sorának első öt komponensét mutatja, vagyis a következő komponenseket. f ( t ) = π4 ⋅ f 0 ⋅ (sin(ω0 ⋅ t ) + 13 ⋅ sin(3 ⋅ ω0 ⋅ t ) + 15 ⋅ sin(5 ⋅ ω0 ⋅ t ) + 17 ⋅ sin(7 ⋅ ω0 ⋅ t ))
7.1.1. ábra A. Fourier transzformáció
Ha a függvény nem periodikus, akkor nem alkalmazhatjuk a Fourier sorbafejtés műveleteit. Anélkül, hogy részletekbe bocsátkoznánk, mondjuk, hogy egy nem
146
periodikus függvényt tekinthetjük, úgy mint a periodikus függvények olyan határesetét amelynél T → ∞ . Ekkor felírhatjuk ∞
1 f (t) = ⋅ ∫ F( j ⋅ ω) ⋅ e j⋅ω⋅t ⋅ dω 2 ⋅ π −∞
(7.1.5)
ahol ∞
F( j ⋅ ω) =
∫ f ( t )e
− j⋅ω⋅t
⋅ dt
(7.1.6)
−∞
Az F( j ⋅ ω) komplex spektrum az f(t) függvény Fourier transzformáltjának nevezzük. A Fourier transzformáció konvergenciájának a feltétele, hogy ∞
∫ f (t ) ⋅ dt < ∞ 0
legyen, vagyis az f(t) abszolút integrálható legyen a pozitív valós számok halmazán. A nem periodikus függvények esetében F( j ⋅ ω) az amplitúdó sűrűség spektruma és ez egy folytonos függvény, míg periodikus jel esetében ez egy diszkrét (vonalas) 2
függvény. A F( j ⋅ ω) ⋅ Δω mennyiség a jelösszetevők energiájával arányos. B. Diszkrét jelek Fourier-sorbafejtése
Adott az f [n ] diszkrét jel. A jel mintavételezési periódusa Ts . Az f [n ] jel periodikus ha létezik egy legkisebb N > 0 természetes szám úgy, hogy f [n ] = f [n + N] minden n egész számra. A periódus másodpercben kifejezett értéke N ⋅ Ts . Ebben az esetben a jel körfrekvenciája 2⋅π ω= (7.1.7) N ⋅ Ts Vezessünk be egy jelölést: Φ m [n ] = e
j⋅m⋅ω⋅n⋅Ts
=
j⋅2⋅π⋅m⋅n e N ;
m = 0,±1,±2,L
ahol m egy frekvencia index, n pedig a diszkrét idő index. Könnyen igazolható, hogy a Φ m [n ] periodikus és a periódusa N vagyis Φ m [n ] = Φ m [n + N] . Igazolhatjuk, hogy N −1
N −1 j⋅2⋅π⋅m⋅n e N
n =0
n =0
∑ Φ m [n ] = ∑
=
j⋅2⋅π⋅m n (e N )
N −1
∑
n =0
=
1− e
(
j⋅2⋅π⋅m )⋅ N N
1− e
j⋅2⋅π⋅m N
⎧N =⎨ ⎩0
m = 0,± N,±2 ⋅ N,L m ≠ 0,± N,±2 ⋅ N, L
Ennek alapján láthatjuk, hogy: N −1 j⋅2⋅π⋅m⋅n e N
∑
n =0
− j⋅2⋅π⋅k⋅n ⋅e N
=
N −1 j⋅2⋅n⋅π⋅( m − k ) N e
∑
n =0
⎧N =⎨ ⎩0
m = k , k ± N, k ± 2 ⋅ N, L . m ≠ k , k ± N , k ± 2 ⋅ N, L
Ez meg nem más mint az ortogonalítás feltétele. 147
Ezek alapján egy f diszkrét periodikus jel egyértelműen felírható mint Φ m [n ] lineáris kombinációja, vagyis f [n ] =
N −1
∑ cm
j⋅2⋅π⋅m⋅n ⋅e N
(7.1.8)
n =0
A cél, meghatározni a c m Fourier együtthatókat. −
j⋅2⋅π⋅m⋅n N
Ha beszorozzuk az előbbi egyenletet e ortogonalitás tulajdonságot, akkor kapjuk: cm
kifejezéssel, és használva az
− 1 N −1 = ⋅ ∑ f [n ] ⋅ e N n =0
j⋅2⋅π⋅m⋅n N
(7.1.9)
Egy periodikus diszkrét f [n ] függvény esetében, ha kiszámítjuk a c m együtthatókat, akkor ezek segítségével tanulmányozhatjuk a függvény frekvencia tartományban való viselkedését. Ezek a c m együtthatók komplex mennyiségek, felírhatjuk úgy az amplitúdóját, mint a fázisszög összefüggéseit. Könnyen igazolható, hogy c m + N = c m , vagyis a c m komplex együttható periodikus. Ha a f [n ] egy valós jel akkor a diszkrét Fourier sor együtthatói modulusza páros szimmetriájú (páros függvény), míg a fázisok páratlan szimmetriájú (páratlan függvény) formák. Példa
Adott a következő, 7.1.1. ábrán látható diszkrét periodikus függvény: f [n ] = L + δ[0] + δ[1] + δ[2] + L
7.1.1. ábra és a mintavételezési periódus Ts . Láthatjuk, hogy N=3. Ezek alapján kiszámíthatjuk a jel Fourier együtthatóit, vagyis: c0 =
c1 = c2 =
1 3
2
∑
− j⋅2⋅π⋅0⋅n f [n ] ⋅ e 3
= 13 (f [0] + f [1] + f [2]) =
n =0 j 2 1 − ⋅ ⋅ π ⋅ ⋅n − j⋅2⋅π 2 1 1 3 f [n ] ⋅ e = 3 (f [0] + f [1] ⋅ e 3 3 n =0 − j⋅2⋅π⋅2⋅n − j⋅4⋅π 2 1 1 f [n ] ⋅ e 3 = 3 (f [0] + f [1] ⋅ e 3 3 n =0
2 3
∑
− j⋅4⋅π + f [ 2] ⋅ e 3 )
= 13 (0.5 + j ⋅ 0.886)
∑
− j⋅8⋅π + f [ 2] ⋅ e 3 )
= 13 (0.5 − j ⋅ 0.886)
Ezek a jel frekvencia komponensei amelyek a frekvencia tartomány abszcisszáján az 148
2 ⋅ π rad [ ]; m = 0, 1, 2 helyet foglalják el. N ⋅ Ts s 20 ⋅ π 40π rad Ezek az értékek 0, [ s ]. , 3 3 m⋅ω = m⋅
C. Diszkrét Fourier-transzformáció
Jelölje X(ω) az x[n ] diszkrét jel Fourier transzformáltja és ezt felírhatjuk mint: X(ω) =
∞
∑ x[n] ⋅ e − j⋅ω⋅n
(7.1.10)
n = −∞
Hogy ez létezzen ez a sor konvergens kell legyen. Ennek szükséges feltétele: ∞
∑ x[n ] < ∞
n = −∞
Az inverz transzformáció képlete x[n ] =
1 ⋅ ∫ X(ω)e j⋅ω⋅n ⋅ dω 2 ⋅ π 2⋅π
(7.1.11)
Példa
Számítsuk ki a x[n ] = ( 12 ) n ⋅ 1[n] diszkrét jel Fourier transzformáltját: Felírjuk X(ω) =
∞
∑ x[n] ⋅ e − j⋅ω⋅n =
n = −∞
∞
∑ ( 12 ) n ⋅ e − j⋅ω⋅n =
n =0
Felhasználtuk a geometriai sor összegképletét (
∞
∞
1
∑ ( 12 ⋅ e − j⋅ω ) n = 1 − 1 ⋅ e − j⋅ω
n =0
2
1
∑an = 1− a ; a < 1 ) ⊗.
n =0
Példa
Számítsuk ki a x[n ] = A ⋅ δ[n ] diszkrét jel Fourier transzformáltját: Felírjuk X(ω) =
∞
∑ A ⋅ δ[n ] ⋅ e − j⋅ω⋅n = A ⋅ δ[0] ⋅ e − j⋅ω⋅0 = A ⊗
n = −∞
Bizonyítás nélkül felsoroljuk a diszkrét Fourier transzformáció néhány, fontosabb tulajdonságát. o Periodicitás
149
X(ω + 2 ⋅ π) = X(ω) o Lineárítás. Ha x[n ] = a 1 ⋅ x1[n ] + a 2 ⋅ x 2 [n ] egy diszkrét jel, akkor X(ω) = a 1 ⋅ X1 (ω) + a 2 ⋅ X 2 (ω) . o Diszkrét idejű eltolás. Az x[n − n 0 ] jel Fourier transzformáltja e − j⋅ω⋅n 0 ⋅ X(ω) o Frekvencia eltolás Az x[n ] ⋅ e j⋅ω0 ⋅n jel transzformáltja X (ω − ω0 ) o Reflexív tulajdonság. Az x[−n ] jel Fourier transzformáltja X(−ω0 ) o Konvolútív szorzat. Az y[k ] = x[n ] ∗ h[n ] konvolútiv szorzat Fourier transzformáltja Y(ω) = X(ω) ⋅ H(ω)
Példa
Adott egy diszkrét rendszer amelyet a h[n ] = δ[n ] + δ[n − 1] diszkrét súlyfüggvény jellemez és a bemenő jel pedig x[n ] = ( 12 ) n ⋅ 1[n]. Számítsuk ki a rendszer kimenő jelét Fourier transzformációt használva. A súlyfüggvény Fourier transzformáltja H(ω) = 1 + e -j⋅ω míg a bemenő jelé 1 X(ω) = . 1 − 12 ⋅ e − j⋅ω A tulajdonságok alapján felírhatjuk: Y(ω) = (1 + e
- j⋅ω
)⋅(
1 1 − 12 ⋅ e − j⋅ω
)=
1 1 − 12 ⋅ e − j⋅ω
+
e − j⋅ω 1 − 12 ⋅ e − j⋅ω
Inverz Fourier transzformációt alkalmazva a következő diszkrét kimenetet kapjuk: y[n ] = ( 12 ) n 1[n]+ ( 12 ) n −1 1[n-1] ha n ≥ 0 . ⊗ D. Parseval reláció
Tudjuk, hogy egy x[n ] diszkrét jel teljes energiája: E[n ] =
∞
∑ x[n ]
2
(7.1.12)
n = −∞
A Parceval összefüggést felírhatjuk mint: 150
∞
∑ x[n ]
E[n ] =
2
π
=
n = −∞
1 2⋅π
⋅
∫ X(ω)
2
⋅ dω
(7.1.13)
−π
Ebből kiolvasható, hogy egy jel energiája kiszámítható úgy is, hogy kiszámítjuk a jel Fourier transzformáltját. Példa
Számítsuk ki a következő x[n ] = δ[n ] + δ[n − 1] jel energiáját E[n ] =
∞
∑ x[n ]
2
= (1) 2 + (1) 2 = 2
n = −∞
Az előbbiekben láttuk, hogy X(ω) = 1 + e -j⋅ω ,
így a Parceval összefüggés alapján felírhatjuk, hogy: π
E[n ] =
1 2⋅π
2
⋅ ∫ 1 + e − jω ⋅ dω = −π
π
1 2⋅π
⋅ ∫ 1 + cos(ω) − j ⋅ sin(ω) ⋅ dω 2
−π
π
E[n ] =
1 2⋅π
⋅ ∫ ((1 + cos(ω)) 2 + sin 2 (ω)) ⋅ dω = L = 2 −π
7.2. Laplace transzformáció
A Laplace transzformáció egy valós változójú (általában ez a független változó, a t vagyis az időtartomány változója) valós függvényhez hozzárendel egy komplex változójú komplex függvényt. Az f(t) Laplace transzformáltját jelöljük F(s)-el. Az itt bevezetett s komplex változót még komplex frekvenciának is nevezzük. Amint azt a 7.2.1. ábra szemlélteti, az idő tartományból a komplex S tartományba visz a Laplace megfeleltetés.
7.2.1. ábra 151
A Laplace transzformáció meghatározása: ∞
F(s) = L{f ( t )} = ∫ f ( t ) ⋅ e −s⋅t ⋅ dt
(7.2.1)
0
Az s változót felírjuk mit a valós és a képzetes részek összegét: s = σ + j ⋅ ω; σ = Re{s}; ω = Im{s}
(7.2.2)
Ha a σ = 0 akkor a Laplace transzformáció a Fourier integrált adja. A Laplace transzformáció konvergenciájának feltétele:
∫ f (t) ⋅ e
σ⋅t
⋅ dt < ∞ (abszolút konvergencia kritérium).
Alaptulajdonságok L
L
Az elkövetkezőkben f1 ( t ) ←⎯→ F1 (s); f 2 ( t ) ←⎯→ F2 (s); k 1 , k 2 valós számok 1. Lineáritási elv Ha k 1 , k 2 állandó vagy t-től vagy s-től független mennyiségek, akkor: L{k1 ⋅ f1 ( t ) + k 2 ⋅ f 2 ( t )} = k 1 ⋅ L{f1 ( t )} + k 2 ⋅ L{f 2 ( t )} = k 1 ⋅ F1 ( t ) + k 2 ⋅ F2 ( t ) 2. Eltolási elv Ha f(t) a t = 0 helyett az esemény t = t 0 pillanatban indul akkor: L{f ( t − t 0 )} = e − t 0 ⋅s ⋅ F(s) 3. Differenciálhányados transzformáltja df ( t ) } = s ⋅ F(s) − f (0) dt d 2f (t) } = s 2 ⋅ F(s) − s ⋅ f (0) − f ' (0) L{ 2 dt LLL , L{
L{
d n f (t) dt
n
} = s n ⋅ F(s) − s n −1 ⋅ f (0) − s n −2 ⋅ f '' (0) − L − f n −1 (0) = n
= ∑ s n −i
d (i −1) f ( t )
| t =0 (i −1) dt i =1 ahol t = 0 pillanatban a kezdeti feltételek szerepelnek a fenti képletekben. 4. Az integrál transzformáltja f −1 (0) 1 L{∫ f ( t ) ⋅ dt} = ⋅ F(s) − s s 152
5. Frekvenciatartományi eltolás L{e a⋅t ⋅ f ( t )} = F(s − a )
Példa
Határozzuk meg az egységugrás Laplace transzformáltját ∞
F(s) = L{ 1(t) } = ∫ 1 ⋅ e
−s⋅t
0
∞
⋅ dt = ∫ e −s⋅t ⋅ dt = 0
1 s
6. Konvolúció transzformáltja t
Legyen f ( t ) = f1 ( t ) ∗ f 2 ( t ) ≡ ∫ f1 (τ) ⋅ f1 ( t − τ) ⋅ dτ meghatározás szerint, két 0
valós függvény konvolúciós szorzata (az f1 ( t ) súlyfüggvénnyel rendelkező rendszernek az f 2 ( t ) bemenő jelre adott válasza). A Laplce transzformáció eredménye: F(s)= F(s) = L{= f1 ( t ) ∗ f 2 ( t )} = F1 (s) ⋅ F2 (s) 7. Konvolúció komplex frekvencia tartományban c+ j⋅∞
1 L{f1 ( t ) ⋅ f 2 ( t )} = ⋅ F1 (s1 ) ⋅ F2 (s − s1 ) ⋅ ds1 2 ⋅ π ⋅ j c−∫j⋅∞
8. Állandósult állapot Az F(s) Laplace transzformáltból közvetlenül meghatározható valamely f(t) időfüggvénynek a t = 0 + -hoz és t = ∞ -hez értékei. f (0 + ) = lim s ⋅ F(s) valamint p →∞
f (∞) = lim s ⋅ F(s) . p →0
9. Komplex differenciálás törvénye L{t k ⋅ f ( t )} = (−1) k ⋅
d k F(s) ds k
Példa
20 jelnek s ⋅ (1 + 0.1 ⋅ s) megfelelő, az időtartományban a kezdeti és végsőértékeket. Határozzuk meg a frekvenciatartományban adott F(s) =
153
20 20 = lim =0 p →∞ p →∞ s ⋅ (1 + 0.1 ⋅ s) p→∞ (1 + 0.1 ⋅ s) 20 20 f (∞) = lim s ⋅ F(s) = lim s ⋅ = lim = 20 p →0 p→0 s ⋅ (1 + 0.1 ⋅ s) p→0 (1 + 0.1 ⋅ s) f (0 + ) = lim s ⋅ F(s) = lim s ⋅
Az inverz transzformációt az f ( t ) = L−1{F(s)} =
σ+ j⋅s
1 F(s) ⋅ e s⋅t ⋅ ds ∫ 2 ⋅ π ⋅ j σ− j⋅s
(7.2.3)
összefüggés adja. A σ értékét úgy kell megválasztani, hogy F(s) szinguláris pontjai a Re{s} = σ egyenes bal oldalán helyezkedjenek el majd a komplex integrálást a rezidiuum-tétel segítségével kiértékeljük. A fontosabb függvények Laplace transzformáltját a következő táblázat tartalmazza: Nr. f(t); és f(t)=0 t<0 1. δ( t ) − Dirac jel 2. 1(t) – egységugrás
3.
t
4.
tn n! − a ⋅t
4.
e
F(s) 1 1 s 1 s2 1 s n +1 1 s+a 1 (s + a ) 2
5.
t ⋅ e − a ⋅t
6.
t n ⋅ e − a ⋅t
7.
sin( ω0 t )
8.
cos( ω0 t )
s s 2 + ω02
9.
1- e −a⋅t
a s⋅(s + a ) 1 s 2 ⋅(s + a )
10.
1 a2
⋅ ( e − a ⋅t − 1 + a ⋅ t )
n! (s + a ) n +1
ω0
2
s + ω02
Általában az inverz transzformáció kiszámítására a fenti táblázat adta átalakítási formákat használjuk. Adott F(s) és keressük a L−1{F(s)} = f ( t ) időtartománybeli függvényt. Ha az F(s) nem szerepel a táblázatban, akkor első lépésként az F(s)-t felbontjuk elemi függvényformákra, olyanokra amelyek szerepelnek a táblázatban. Így F(s) = F1 (s) + F1 (s) + L + F1 (s) ahonnan L−1{F(s)} = L−1{F1 (s)} + L−1{F2 (s)} + L + L−1{Fn (s)} =
= f1 ( t ) + f 2 ( t ) + L + f n ( t ) A legtöbb szabályzási feladatban:
154
F(s) =
n 0 + n1 ⋅ s + L + n m ⋅ s m
=
N(s) D(s)
d 0 + d1 ⋅ s + L + s n Ha m > n akkor polinom osztással eljutunk az m < n esethez, ezért az elkövetkezőkben csak ezt az esetet tárgyaljuk. Az F(s) most felírható mint: N(s) F(s) = (s − s1 ) ⋅ (s − s 2 ) ⋅ L ⋅ (s − s n ) ahol az s i i = 1,2, L az átviteli függvénynek megfelelő pólusok. A következő eseteket különböztetjük meg: •
n
ck = H(s) és c k ∈ C és innen k =1 s − s k
A pólusok egyszeri gyökök. F(s) = ∑ n
felírhatjuk, hogy f ( t ) = ∑ c k ⋅ e sk ⋅t
ha t > 0 . Az együttható értékét
k =1
meghatározhatjuk a reziduum számítás módszerével: N(s k ) N(s) dD = (s − s k ) ⋅ |s=s k k = 1, L , n D1 (s k ) = | s =s k ck = D1 (s k ) D(s) ds •
A pólusok többszörös gyökök. Legyenek az F(s) pólusai rk , k = 1, L , o multiplicitású pólusok. Ekkor felírhatjuk, hogy o rk
o
c kj
F(s) = ∑∑
k =1 j=1 (s − s k )
; n = ∑ rk .Innen felírhatjuk, hogy j j=1
0
f (t) = ∑ e k =1
s k ⋅t
rk
∑ j=1
c kj ⋅ t j−1 ( j − 1)!
; t>0
ahonnan c kj •
d ( rk − j) 1 = ⋅ { ( r − j) [F(s) ⋅ (s − s k ) rk ]} |s=sk (rk − j)! ds k
A pólusok konjugált komplex gyökök. Legyenek ezek s1, 2 = σ1 ± j ⋅ ω1 , ekkor F(s) = F1, 2 (s) + F3 (s) + L + Fn (s) Itt pedig
F1,2 =
c1 c1 + s − (σ1 + j ⋅ ω1 ) s − (σ1 + j ⋅ ω1 )
és
c1, 2 = δ1 ± j ⋅ ε1
De
F1,2
⎧α 0 = σ12 + ω12 ⎪ β 0 + β1 ⋅ s ⎪β = −2 ⋅ (σ1 ⋅ β1 + ω1 ⋅ ε1 ) ⇒⎨ 0 = 2 α 0 + α1 ⋅ s + s ⎪α1 = −2 ⋅ σ1 ⎪β = 2 ⋅ δ 1 ⎩ 1
155
A β 0 és β1 együtthatók meghatározása a reziduum számítás alapján történhet, N(s) vagyis (β 0 + β1 ⋅ s) |s=s1 = (s − s1 ) ⋅ (s − s 2 ) ⋅ |s=s1 és felhasználjuk a két D(s) komplex szám egyenlőségére vonatkozó tételt. Példa Határozzuk meg a következő F(s) függvény inverz transzformációját: F(s) =
A pólusok
1 (s 2 + 2 ⋅ s + 2) ⋅ (s + 2)
s1, 2 = −1 ± 1 ⋅ j s 3 = −2
⇒ (β 0 + β1 ⋅ s) |s=s1 =
1 1 = |s=s1 ⇒ (β 0 − β1 ) + j ⋅ β1 = −1+ j + 2 s +1
1 2
− 12 ⋅ j
Innen (komplex számok egyenlősége) β 0 − β1 = β1 = −2
1 2 ⇒ β0 = 0
Felhasználva c 3 = (s + 2) ⋅
1 2
(s + 2 ⋅ s + 2) ⋅ (s + 2)
| s =s 3 =
1 2
Következik, hogy 1 s 1 1 1 s +1 1 1 1 F(s) = − ⋅ 2 )+ ⋅ + ⋅ = − ⋅( − 2 2 2 s + 2⋅s + 2 2 s + 2 2 (s + 1) + 1 (s + 1) + 1 2 s + 2 A táblázat alapján kapjuk, hogy f ( t ) = − 12 ⋅ (e − t ⋅ cos( t ) − e − t ⋅ sin( t ) − e −2⋅t ); t > 0 Láthatjuk, hogy lim f ( t ) = 0 és ez várható volt a pólusok ismeretében. t →∞
• A komplex többszörös gyököket itt nem tárgyaljuk. A Laplace transzformáció és inverz transzformáció használható a differenciálegyenletek megoldásában. 7.2.1. Átviteli függvény (összefoglaló)
Adott egy koncentrált paraméterű, folytonos LTI rendszer amelyet a következő differenciálegyenlet modellez: n
∑ai ⋅
d i y( t )
m
= ∑bj ⋅
d ju(t)
(7.2.1.1) i j dt dt i =0 j=0 Itt az u(t) jelenti a bemenő, az y(t) a kimenő jelet. Minden kezdeti feltételt nullának vesszük. Ha most kiszámítjuk az előző differenciálegyenlet Laplace transzformáltját, akkor a következő összefüggést kapjuk: 156
n
m
i =0
j=0
Y(s) ⋅ ∑ a i ⋅ s i = U(s) ⋅ ∑ b j ⋅ s j
(7.2.1.2)
Innen következik, meghatározás szerint, az átviteli függvény zéró kezdeti feltételek mellett, vagyis : Y(s) b 0 + b1 ⋅ s + b 2 ⋅ s 2 + L + b m ⋅ s m N(s) = (7.2.1.3) H(s) = = U(s) a 0 + a 1 ⋅ s + a 2 ⋅ s 2 + L + a n ⋅ s n D(s) vagy H(s) =
• • • • •
b m ⋅ (s − q1 ) ⋅ (s − q 2 ) ⋅ L ⋅ (s − q m ) a n ⋅ (s − p1 ) ⋅ (s − p 2 ) ⋅ L ⋅ (s − p m )
K0 =
bm an
(7.2.1.4)
n – a differenciálegyenlet rendje és a D(s) = 0 az n-ed rangú karakterisztikus egyenlet m – a kimenet rendje (kimenetek száma) H(s) a rendszer átviteli függvénye – egy racionális függvény ahol az s-sík ( s = σ + j ⋅ ω ) az értelmezési tartomány Egy SISO rendszer esetében amikor egy bemenet egy kimenete van a rendszernek, az átviteli függvény teljesen jellemzi a rendszert. A D(s) = 0 a rendszer karakterisztikus egyenlete, ennek gyökei a rendszer pólusai és ezek p i i =1, 2,L,n -el jelöltük.
• •
Az N(s) = 0 gyökei a rendszer zérósai Az s-tartományban a ki/bemeneti reláció Y(s) = H(s) ⋅ U(s)
•
Időtartományban y( t ) = h ( t ) ∗ u ( t ) = ∫ h ( t − τ) ⋅ u (τ) ⋅ dτ és ezt konvolutív
t
0
• •
szorzatnak nevezzük. Itt a h(t) a súlyfüggvény és definició szerint h ( t ) = L−1{H( t )} A súlyfüggvényt még meghatározhatjuk mint a rendszer válaszát a Dirac-jelre. Ezt felírhatjuk mint Y(s) = H(s) ⋅ L{δ( t )} ⇒ Y(s) = H(s) ⇒ y( t ) = h ( t ) Legyen u ( t ) = u ⋅ e σ⋅t ⋅ sin(ω ⋅ t ) egy szinuszjel. Stabil kimeneti állapotban a rendszer válasza: y( t ) = H(σ + j ⋅ ω) ⋅ u ⋅ e σ⋅t ⋅ sin(ω ⋅ t + φ(σ + j ⋅ ω)) ahol φ(σ + j ⋅ ω) = arg{(σ + j ⋅ ω)} . Itt H(σ + j ⋅ ω) a rendszer válaszának
•
•
•
modulusza (erősítési tényező, gain) és φ(σ + j ⋅ ω) a válasz fáziseltolódása. Úgy a modulusz mint a fáziseltolás frekvenciafüggő. Ha m > n akkor a rendszer fizikailag nem létezik, nem realizálható. A megvalósíthatóság feltétele m ≤ n . Ellenkező esetben ha s → ∞ akkor H(s) → ∞ . A megvalósítható átviteli függvény tulajdonsága, hogy lim H(s) = K 0 . Az s→∞
ilyen rendszert nevezzük valódi rendszernek. Ha K 0 = 0 akkor a rendszer szigorúan valódi rendszer. Ha egy várakozási idő jellemzi a rendszer, amit még holtidőnek is nevezünk, a holtidő hossza legyen Td ). A rendszer differenciálegyenlete
157
n
d i y( t )
i =0
dt i
∑ai ⋅
m
d j u ( t − Td )
j=0
dt j
= ∑bj ⋅
és ekkor a rendszer átviteli függvénye H(s) =
N(s) −s⋅Td ⋅e D(s)
7.2.2. Dirac-jel Laplace transzformációja
A Dirac-jel, vagy δ( t ) disztribúció (pszeudó-függvény, disztribúció) Laplace transzformációját kezeljük úgy is mint a jel meghatározását. Legyen ∞
L{δ( t )} = ∫ δ( t ) ⋅ e −s⋅t ⋅ dt forma NEM létezik mivel δ( t ) nem függvény és 0
szingularitása egybeesik az alsó integrálási határral. A δ( t ) –t megközelítőleg leírhatjuk mint ⎧1 0≤t≤ε ⎪ δ( t ) = lim rε ( t ); ahol rε = ⎨ ε ε →0 ⎪⎩0 máshol rε NEM differenciálható forma Így az rε függvény használata nem járható matematikai eljárás a Laplace transzformáció kiszámítására. Vegyük most 1 rε ( t ) = ( 1(t)- 1(t- ε )) ε de az integrálás nem függ ε -tól, így ∞
1 −s⋅t ∫ ( 1(t)- 1(t- ε )) ⋅ e ⋅ dt = ε→0 ε 0
L{δ( t )} = lim
1 1 L{δ( t )} = lim{ ⋅ (1 − e −ε⋅s )} ε →0 ε s Most L' Hospital eljárását alkalmazva a határozatlanság eltüntetésére, kapjuk, hogy s ⋅ e −ε⋅s =1 L{δ( t )} = lim ε →0 s Példa
Oldjuk meg a következő differenciálegyenletet: dy( t ) = δ( t ) dt Az előbbiekben ismertetett eljárás eredményét alkalmazzuk és így a következő lépésekben írhatjuk fel a megoldást (zérós kezdeti feltételek mellett). 158
I. II. III.
A Laplace transzformációt alkalmazva kapjuk s ⋅ Y(s) − y(0 − ) = 1 ( y(0 − ) = 0) 1 Y(s) = s y(t)=1(t)
Innen azt következtetjük, hogy az egységugrás függvény időbeni deriváltja egyenlő a Dirac-jellel Példa
Használjuk a Laplace transzformációt, hogy kiszámítsuk e A⋅t mátrixfüggvény ⎛ 1 1⎞ ⎟⎟ . értékét, ha A = ⎜⎜ ⎝ 0 1⎠ Tudjuk, hogy egy LTI rendszer homogén állapotegyenletének ( x& ( t ) = A ⋅ x ) megoldása, az x (0) kezdeti állapotokat figyelembe véve x ( t ) = e A⋅t ⋅ x (0) . Tehát e A⋅t kiszámítása ténylegesen a rendszer állapotegyenleteinek megoldását szolgálja. A rendszermátrix sajátértékei λ1 = λ 2 = 1 . Kiszámítjuk az állapotegyenlet Laplace transzformációját. L{x& ( t ) = A ⋅ x} ⇒ s ⋅ X(s) − x (0) = A ⋅ X(s) ⇒ (s ⋅ I − A) ⋅ X(s) = x (0)
És innen következik, hogy X(s) = (s ⋅ I − A) −1 ⋅ x (0) ⇒ x ( t ) = L−1{(s ⋅ I − A) −1} ⋅ x (0)
Így a megoldás e A⋅t = L−1{(s ⋅ I − A) −1} Felírjuk: ⎛s −1 −1 ⎞ ⎟⎟ ⇒ (s ⋅ I − A) −1 (s ⋅ I − A) = ⎜⎜ − 0 s 1 ⎝ ⎠
⎛s −1 −1 ⎞ ⎛ 1 ⎜⎜ ⎟ 0 s − 1⎟⎠ ⎜⎜ s − 1 ⎝ = = ⎜ (s − 1) 2 ⎜ 0 ⎝
⎞ ⎟ (s − 1) ⎟ 1 ⎟ ⎟ s −1 ⎠ 1
2
Ha most egyenként kiszámítjuk az előbbi mátrix minden elemének inverz Laplace transzformáltját, akkor kapjuk, hogy: ⎛et e A⋅t = ⎜⎜ ⎝0
t ⋅ e t ⎞⎟ e t ⎟⎠
Példa
Adott a következő átviteli függvény 159
H(s) =
Y(s) 1 = 2 U(s) s + 2 ⋅ s + 1
Írjuk fel az ennek megfelelő állapotteres egyenleteteket.
⇒ s 2 ⋅ Y(s) + 2 ⋅ s ⋅ Y(s) + Y(s) = U(s) ⇒ ⇒
dy( t ) d 2 y( t ) + 2⋅ + y( t ) = u ( t ) ⇒ 2 dt dt x 1 ( t ) = y( t ) ⇒ x 2 ( t ) = x& 1 ( t ) = y& ( t )
Legyen
A differenciálegyenlet felírható mint &y&( t ) + 2 ⋅ y& ( t ) + y( t ) = u ( t ) ⇒ x& 2 ( t ) = &y&( t ) = u ( t ) − 2 ⋅ y& ( t ) − y( t ) ⇒ x& 2 ( t ) = − x 1 ( t ) − 2 ⋅ x 2 ( t ) + u ( t )
Ekkor felírhatjuk az állapotteres egyenleteket 1 ⎞ ⎛ x1 ⎞ ⎛ 0 ⎞ ⎛ x& 1 ⎞ ⎛ 0 ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ ⋅ ⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟ ⋅ u ( t ) ⎝ x& 2 ⎠ ⎝ − 1 − 2 ⎠ ⎝ x 2 ⎠ ⎝ 1 ⎠ ⎛x ⎞ y = (1 0) ⋅ ⎜⎜ 1 ⎟⎟ ⎝x2 ⎠ Induljunk ki most az átviteli függvény egy átalakított formájából. H(s) =
1 s2 + 2 ⋅ s + 1
=
1 1 ⋅ = H1 (s) ⋅ H1 (s) s +1 s +1
tehát sorba kötött, két H 1 ( s ) átviteli függvénnyel rendelkező rendszer. Ekkor az állapotteres egyenleteket felírhatjuk mint (erre a későbbiek során még visszatérünk) x& 1 ( t ) = x 2 ( t ) − x 1 ( t ) x& 2 ( t ) = − x 2 ( t ) + u ( t ) és ezek alapján felírhatjuk, hogy y = x1 ⎛ x& 1 ⎞ ⎛ − 1 1 ⎞ ⎛ x 1 ⎞ ⎛ 0 ⎞ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ ⋅ ⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟ ⋅ u ( t ) ⎝ x& 2 ⎠ ⎝ 0 − 1⎠ ⎝ x 2 ⎠ ⎝ 1 ⎠ ⎛x ⎞ y = (1 0 ) ⋅ ⎜⎜ 1 ⎟⎟ ⎝ x2 ⎠ Láthatjuk, hogy formailag a két módszer más A mátrixot eredményez. Ez látszólagos különbség csupán. A rendszer dinamikája szempontjából ez a két leírása ekvivalens. Fontos megfigyelés, hogy az u(t) bemenet nincs hatással mindkét állapotra. ⊗ 160
7.3. Z-transzformáció
A Z-transzformáció egy diszkrét jel frekvencia tartományba való transzformációja. Adott az x[n ] diszkrét jel, akkor ennek a bilaterális transzformáltját a következő képlet adja: X(z) =
∞
∑ x[n ] ⋅ z −n = L + x[−2] ⋅ z 2 + x[−1] ⋅ z1 + x[0] ⋅ z 0 + x[1] ⋅ z −1 + x[2] ⋅ z −2 + L
n = −∞
(7.3.1) ahol a z egy komplex változó. Példa
Írjuk fel a következő diszkrét jel x[n ] = 2 ⋅ δ[n + 2] − 1 ⋅ δ[n + 1] + 2 ⋅ δ[n ] − 1 ⋅ δ[n − 1] + 2 ⋅ δ[n − 2] Z-transzformáltját. A meghatározás alapján: X(z) = 2 ⋅ z 2 − 1 ⋅ z1 + 2 ⋅ z 0 − 1 ⋅ z −1 + 2 ⋅ z −2 = 2 ⋅ z 2 − z1 + 2 − z −1 + 2 ⋅ z −2 Látható, hogy a z −2 tag egy 2 ⋅ Ts időegység késleltetést és egy z 3 pedig egy 3 ⋅ Ts anticipatív időintervallumot jelent. Az x[n ] diszkrét jel unilaterális transzformáltját (ha n ≥ n 0 ; n 0 = 0 ) X(z) =
∞
∑ x[n ] ⋅ z −n
(7.3.2)
n =0
képlettel írjuk fel. Példa
Írjuk fel az x[n ] = k ⋅ 1 [n ] jel Z-transzformáltját. A megoldás: X(z) =
∞
∑k ⋅z
n =0
−n
∞
= k ⋅ ∑ (z −1 ) n = n =0
k 1 − z −1
Példa
Írjuk fel az x[n ] = k ⋅ a n ⋅ e j⋅ω⋅n 1 [n ] jel Z-transzformáltját. A megoldás: ∞
∞
n =0
n =0
X(z) = ∑ k ⋅ a n ⋅ e j⋅ω⋅n ⋅ z −n = k ⋅ ∑ (a ⋅ e j⋅ω z −1 ) n =
k 1 − a ⋅ e j⋅ω ⋅ z −1 161
A. Konvergencia feltételek
A Z-transzformáció esetében a komplex z változót felírhatjuk mint z = r ⋅ e j⋅ω vagyis ez a komplex szám poláris koordinátákban való ábrázolása. Így a 7.3.1 felírható mint: X(r ⋅ e j⋅ω ) =
∞
∞
n = −∞
n = −∞
∑ x[n ] ⋅ (r ⋅ e j⋅ω ) −n = ∑ x[n ] ⋅ r −n ⋅ e − j⋅ω⋅n
(7.3.3)
Innen egy nagyon fontos dolgot vehetünk észre, vagyis az x[n ] jel Z-transzformáltja nem más mint x[n ] ⋅ r − n jel Fourier transzformáltja. Ha r = 1 akkor z = e j⋅ω és z = e j⋅ω = 1 az egységsugarú kör. ∞
Az x[n ] jel unilaterális transzformáltja (7.3.2), X(z) = ∑ x[n ] ⋅ z −n konvergens sor n =0
kell legyen, hogy a transzformáció létezzen. Ennek feltétele, hogy x[n ] ⋅ r − n abszolút értékben összegezhető legyen, vagyis ∞
∑ x[n] ⋅ r −n
< ∞.
(7.3.4)
n =0
Így eljutottunk a konvergencia tartomány (ROC) fogalmához, amely azon értékek halmaza amelyre teljesül a 7.4.3 feltétel. Fontos megjegyezni, hogy: •
a ROC nem tartalmazhat egyetlen pólust sem! Tudjuk, hogy ROC a transzformáció konvergencia tartománya, tehát ott a sor véges határértékkel rendelkezik. Ezzel szemben a pólusokban a Z-transzformáció végtelen értékű.
•
az ROC egy véges jel esetében az egész z-sík, kivétel esetleg z = 0 és/vagy z = ∞ . Legyen X(z) =
n2
∑ x[n ] ⋅ z −n egy véges jel Z-transzformációja. Ez a
n = n1
sor konvergens, feltéve ha sor minden tagja véges. Ha n 2 > 0 (nem zéró kauzális tagok) akkor az X(z) tartalmazza z −1 tagot, s ezért ROC nem tartalmazhatja z = 0 értéket. Ha n 1 < 0 (nem zéró nem kauzális tagok) akkor X(z) tartalmazza a z hatványait, ekkor ROC nem tartalmazhatja z = ∞ . Ha n 2 ≤ 0 akkor ROC tartalmazhatja z = 0 értéket. Ha n 1 ≥ 0 akkor ROC tartalmazza z = ∞ értéket. Az egyedüli jel amely esetében a ROC az egész z-
•
sík az x[n ] = k ⋅ δ[n ] . A végtelen jelek esetében a konvergencia feltétele ∞
∑
x[n ] ⋅ r −n < ∞ .
n = −∞
A végtelen jel transzformáltja felbontható a következő módon: 162
I − (z) =
−1
∑ x[n ] ⋅ z
n = −∞
−n
; I + (z) =
∞
∑ x[n ] ⋅ z
n =0
−n
és X(z) ≤ I − (z) + I + (z) .
Ha a két jobboldali komponens véges, akkor a konvergencia magától érthető. Ehhez elegendő ha x[n ] korlátos. Vezessük be a következő jelöléseket: x[n ] ≤ k − ⋅ (r− ) n , n < 0 x[n ] ≤ k + ⋅ (r+ ) n , n ≥ 0
Ezek alapján felírhatjuk és láthatjuk, hogy 1. Kauzális jelek esetében ROC ⇐ z > r+ 2. Nem kauzális jelek esetében ROC ⇐ z < r− 3. Kauzális + Nem kauzális esetben ROC ⇐ r+ < z < r− A három eset grafikus megjelenítése a 7.3.1. ábrán látható.
7.3.1. ábra Példa
Határozzuk meg a ROC-t a következő három jel esetében. x[n ] = (− 12 ) n ⋅ 1 [− n ] + 2 ⋅ ( 14 ) n ⋅ 1 [n ]
(7.3.5)
163
y[n ] = (− 12 ) n ⋅ 1 [n ] + 2 ⋅ ( 14 ) n ⋅ 1 [n ]
(7.3.6)
x[n ] = (− 12 ) n ⋅ 1 [− n ] + 2 ⋅ ( 14 ) n ⋅ 1 [−n ]
(7.3.7)
Felírhatjuk az 7.3.5 jel Z-transzformációját: 0
∑
X(z) =
n = −∞
Az első tag z <
1 2
∞
∞
∞
n =0
k =0
n =0
(− 21⋅z ) n + 2 ⋅ ∑ ( 41⋅z ) n = ∑ (−2 ⋅ z) k + 2 ⋅ ∑ ( 41⋅z ) n
esetben konvergens, a második pedig z > 1 4
konvergencia tartománya a ROC
1 4
és ezért X(z)
< z < 12 . Ha ez teljesül akkor a transzformációt
felírhatjuk mint: X(z) =
1 2⋅z + 1 + 2 ⋅ z z − 14
A 7.3.6 jelre a Z-transzformációt felírhatjuk mint: ∞
∞
n =0
n =0
Y(z) =
Az első tag z >
1 2
∑ (− 21⋅z ) n + 2 ⋅ ∑ ( 41⋅z ) n
esetben konvergens, a második pedig z >
konvergencia tartománya a ROC
1 4
és ezért X(z)
z > 12 . Ha ez teljesül akkor a transzformációt
felírhatjuk mint: X(z) =
z 2⋅z + 1 z + 2 z − 14
A 7.3.7 jelre a Z-transzformációt felírhatjuk mint: W (z) =
0
∑
n = −∞
Az első tag z <
1 2
(− 21⋅z ) n + 2 ⋅
0
∞
∞
n = −∞
k =0
k =0
∑ ( 41⋅z ) n = ∑ (−2 ⋅ z) k + 2 ⋅ ∑ (4 ⋅ z) k
esetben konvergens, a második pedig z <
konvergencia tartománya a ROC
1 4
és ezért X(z)
z < 14 . Ha ez teljesül akkor a transzformációt
felírhatjuk mint: W (z) =
1 2 + 1+ 2⋅ z z − 4⋅ z
Példa
Számítsuk ki a következő jel Z-transzformáltját: x[n ] = (n ⋅ (− 12 ) n ⋅ 1 [n ]) ∗ (( 14 ) − n ⋅ 1 [−n ])
164
Lépésenként felírhatjuk: z ahol ROC : z > z + 12
Z
a.) (− 12 ) n ⋅ 1 [n ] ←⎯→
1 2
Z b.) w[n ] = n ⋅ (− 12 ) n ⋅ 1 [n ] ←⎯→ Z W (z) = −z ⋅ ←⎯→
z + 12 − z − 12 ⋅ z z d ) ) z ( ( = = − ⋅ dz z + 12 (z + 12 ) 2 (z + 12 ) 2 ahol ROC : z >
z ahol ROC : z > z − 14
Z
c.) y[n ] = ( 14 ) n ⋅ 1 [n ] ←⎯→ 1 z
Z
d.) y[−n ] ←⎯→ Y(z) =
1 z
1 2
1 4
−
=
1 4
−4 ahol ROC : z < 4 z−4 2⋅z
Z
Ezek szerint x[n ] = w[n ] ∗ y[n ] ←⎯→ X(z) = W (z) ⋅ Y(z) = ahol
1 2
(z − 4) ⋅ (z + 12 ) 2
;
< z <4⊗
B1. Z-transzformáció tulajdonságai Legyen Z{x[n ]} = X(z); Z{x1[n ]} = X1 (z); Z{x 2 [n ]} = X 2 (z);
A Z-transzformáció alaptulajdonságait a következő táblázatban foglaljuk össze: Nr. 1 2
3
Tulajdonság Lineáritás Időbeni eltolás
Jel a ⋅ x 1[ n ] + b ⋅ x 2 [ n ] x[n − n 0 ]
Z-transzformáció a ⋅ X1 ( z ) + b ⋅ X 2 ( z )
Kalibrálás z-síkban
e j⋅ω0 ⋅n ⋅ x[n ]
X(e − j⋅ω0 ⋅ z)
Megjegyzés ROC1 ∩ ROC 2 ROC; ha z ≠ 0; z ≠ ∞ ROC
z 0n ⋅ x[n ]
X( zz )
z 0 ⋅ ROC
a n ⋅ x[n ] x[− n ]
X(a −1 ⋅ z)
Kalibrált ROC
X(z −1 )
KomplementROC
X(z k )
ROC k
X1 ( z ) ⋅ X 2 ( z )
ROC1 ∩ ROC 2
4
Időinverzió
5
Idő dilatáció
6 7
Konvolúció Differencia
8
Összegezés
⎧x[r ] n = r ⋅ x (k ) [n ] = ⎨ ⎩0 n ≠ r ⋅ x 1[ n ] ∗ x 2 [ n ] x[n ] − x[n − 1] n
∑ x[k ]
k = −∞
9 10
z-síkban differenciálás Kezdeti feltétel
n ⋅ x[n ] x[n ] = 0; n < 0
z − n 0 ⋅ X (z)
0
−1
1
(1 − z ) ⋅ X(z) 1 ⋅ X (z) 1 − z −1
ROC1 ∩ z > 0
dX(z) dz x[0] = lim X(z)
ROC
−z⋅
ROC1 ∩ z > 0
z→∞
165
Példa
Számítsuk ki a következő jel Z-transzformáltját: x[n ] = a n ⋅ cos[ω0 ⋅ n ] ⋅ 1 [n ] Lépésenként felírhatjuk: Tudjuk, hogy a n ⋅ x[n ] ←⎯→ X(a −1 ⋅ z) és hogy az egységugrás transzformáltja Z
1 1 − z −1 Így ha y[n ] = a n ⋅ 1 [n ] , akkor Y(z) =
1
ahol ROC : z > a
1 − a ⋅ z −1
Ha most a cos[ω0 ⋅ n ] jelet felírjuk exponenciális formában így X(z) = 12 ⋅ Y(e − j⋅ω0 ⋅ z) + 12 ⋅ Y(e j⋅ω0 ⋅ z) =
1 − a ⋅ cos(ω0 ) ⋅ z −1 és z > a ⊗ 1 − 2 ⋅ a ⋅ sin(ω0 ) ⋅ z −1 + a 2 ⋅ z − 2
B2. Néhány alapjel Z-transzformációját: Nr. 1 2
Jel δ[n ] 1 [n ]
3
-1 [−n − 1]
4 5
δ[n − m]
6
- α n 1 [− n − 1]
7
Z-transzformáció 1
ROC z-sík
1 1− z −1 1 1− z −1 −m
z >1
z
z <1
z-sík {/ 0 m > 0; }vagy{/ ∞ m < 0}
1 1−α⋅z −1 1 1−α⋅z −1
z >α
n ⋅ α n 1 [n ]
α⋅z −1 (1−α⋅z −1 ) 2
z >α
8
- n ⋅ α n 1 [− n − 1]
α⋅z −1 (1−α⋅z −1 ) 2
z <α
9
sin[ω0 ⋅ n ] ⋅ 1 [n ]
sin( ω0 )⋅z −1
z >1
1−cos(ω0 )⋅z −1
z >1
r⋅sin( ω0 )⋅z −1
z >r
1− r⋅cos(ω0 )⋅z −1
z >r
10 11 12
α n 1 [n ]
cos[ω0 ⋅ n ] ⋅ 1 [n ] r n ⋅ sin[ω0 ⋅ n ] ⋅ 1 [n ] r n ⋅ cos[ω0 ⋅ n ] ⋅ 1 [n ]
1− 2⋅sin( ω0 )⋅z −1 + z − 2 1− 2⋅sin( ω0 )⋅z −1 + z − 2 1− 2⋅r⋅sin( ω0 )⋅z −1 + r 2 ⋅z − 2 1− 2⋅r⋅sin( ω0 )⋅z −1 + r 2 ⋅z − 2
z <α
166
C. Inverz Z-transzformáció
Az inverz transzformációt felírhatjuk mint 1 ⋅ X(z) ⋅ z n −1 ⋅ dz 2 ⋅ π ⋅ j ∫C
x[n ] =
(7.3.8)
ahol C egy trigonometriai irányban körbejárt út a z-síkban. Az integrál kiszámítása nehézkes és ezért általában praktikus algebrai módszereket alkalmazunk. Induljunk ki egy diszkrét racionális függvényből: X(z) =
N(z) b 0 + b1 ⋅ z −1 + L + b M ⋅ z − M = D(z) a 0 + a 1 ⋅ z −1 + L + a N ⋅ z − N
és M < N és ha M ≥ N akkor egy osztás eredményeként felírhatjuk mint: X(z) =
M−N
∑
k =0
f k ⋅ z −k +
N ′(z) D( z )
Ha az X(z) polinom formákban a változó a z és nem z −1 . Ha kiemeljük úgy a számlálóból és nevezőből a z legnagyobb hatványát akkor átalakíthatjuk z −1 függvényében. Ezt egy példán keresztül mutatjuk be. Legyen X(z) =
2 ⋅ z 2 − 2 ⋅ z + 10 3 ⋅ z3 − 6 ⋅ z + 9
=
z2 3 ⋅ z3
⋅
2 − 2 ⋅ z −1 + 10 ⋅ z −2 1 − 2 ⋅ z − 2 + 3 ⋅ z −3
= 13 ⋅ z −1 ⋅
2 − 2 ⋅ z −1 + 10 ⋅ z −2 1 − 2 ⋅ z −2 + 3 ⋅ z −3
Nagyon fontos, hogy megoldjuk a D(z)=0 egyenletet, hogy megtaláljuk az X(z) pólusait, majd ezekkel a komplex számok halmazán ireduktibilis résztörtekre bontjuk, hogy kiszámíthassuk az inverz transzformációt. Így X(z) =
b 0 + b1 ⋅ z −1 + L + b M ⋅ z − M N
a 0 ⋅ ∏ (1 − d k ⋅z −1 ) k =1
ahol d k nem más mint az X(z) pólusai. A résztörtre bontás után felírhatjuk, hogy : N
X(z) = ∑
Ak
k =1 1 − d k
⋅ z −1
Az ROC függvényében minden elemi törtnek, megfelel egy inverz transzformáció. Az alap transzformációkat felírjuk mint: Ak Z ; ha ROC : z > d k A k ⋅ (d k ) n 1 [n ] ←⎯→ 1 − d k ⋅ z −1 167
Ak
Z
− A k ⋅ (d k ) n 1 [− n − 1] ←⎯→
; ha ROC : z < d k 1 − d k ⋅ z −1 Ha a d i egy r-szeres pólus, akkor az elemi résztörteket ezekre a következő módon írjuk fel: A i1 1 − di ⋅ z
; −1
A i1 (1 − d i ⋅ z −1 )
A i1
; L; 2
(1 − d i ⋅ z −1 ) r
;
és ebben az esetben a következő transzformációkat használjuk: A⋅ −A⋅
(n + 1) ⋅ L ⋅ (n + m − 1) A Z ; ha ROC : z > d i ⋅ (d i ) n 1 [n ] ←⎯→ (m − 1)! (1 − d i ⋅ z −1 ) m
(n + 1) ⋅ L ⋅ (n + m − 1) A Z ; ha ROC : z < d i ⋅ (d i ) n 1 [− n − 1] ←⎯→ (m − 1)! (1 − d i ⋅ z −1 ) m
Mivel a Z-transzformáció lineáris, ezért a keletkező ROC nem más mint a résztörteknek megfelelő ROC-k keresztmetszete. Az inverz forma megválasztása az X(z)–nek megfelelő ROC és a pólusnak az ehhez való helyzete dönti el. Ha ROC-nak van kisebb rádiusza mint a pólus akkor az nem kauzális formát használjuk, ellenkező esetben pedig a kauzális formát. Példa
Keressük meg a következő X(z) függvény inverz transzformáltját: X(z) =
1 − z −1 + z −2 (1 − 12 ⋅ z −1 ) ⋅ (1 − 2 ⋅ z −1 ) ⋅ (1 − z −1 )
; ha ROC : 1 < z < 2
Elemi törtekre bontjuk és kapjuk: X (z) =
1 1 − 12 ⋅ z
−1
+
2 1− 2⋅ z
−1
−
2 1 − z −1
Az első tag esetében a pólus z = 12 , tehát az inverz transzformációt a kauzális forma adja, vagyis 1
Z
( 12 ) n ⋅ 1 [n ] ←⎯→
1 − 12 ⋅ z −1
A második tag esetében a pólus z =2 és a ROC alapján felírhatjuk, hogy 2
Z
− 2 ⋅ (2) n ⋅ 1 [−n − 1] ←⎯→
1 − 2 ⋅ z −1
A harmadik tag pólusa z =1 így Z
− 2 ⋅ 1 [n ] ←⎯→
2 1 − z −1 168
A teljes megoldás pedig: x[n ] = ( 12 ) n 1 [n ] − 2 ⋅ (2) n ⋅ 1 [−n − 1] − 2 ⋅ 1 [n ] Egyoldalú transzformáció esetében ( z < a; vagy z > a; ) az inverz transzformáció kiszámításának egyik módszere a sorbafejtés. Ha z > a akkor X(z)-t hatványsorba fejtjük z −1 hatványaiként, ha meg z < a akkor a sorbafejtés a z hatványai szerint történik. Sorbafejtés után felírjuk az időtartománybeli függvényt Példa I. Keressük meg az X(z) =
ját. Ekkor felírjuk, hogy
2 + z −1 1 − 12 ⋅ z −1 −1
2+z 1 2
1− ⋅ z
−1
; amikor ROC : z >
1 2
inverz Z-transzformált-
= 2 + 2 ⋅ z −1 + z −2 + 12 ⋅ z −3 + LL és az osztást a
polinomok osztási szabályai szerint végeztük. Így az eredmény: x[n ] = 2 ⋅ δ[n ] + 2 ⋅ δ[n − 1] + δ[n − 2] + 12 ⋅ δ[n − 3] + LL
II. Keressük meg az X(z) =
2 + z −1 1 2
1− ⋅ z
−1
; amikor ROC : z <
1 2
inverz Z-
transzformáltját. Ekkor felírjuk, hogy z −1 + 2 1 2
− ⋅z
−1
+1
= −2 − 8 ⋅ z − 16 ⋅ z 2 − 32 ⋅ z 3 + LL
Az eredmény ebben az esetben:
x[n ] = −2 ⋅ δ[n ] − 8 ⋅ δ[n + 1] − 16 ⋅ δ[n + 2] − 32 ⋅ δ[n + 3] + LL Ezt az eljárást akkor alkalmazzuk, ha a kapott sor véges számú tagja elégséges a továbbiakban.
169
8. Frekvenciafüggvények Adott egy lineáris, dinamikus, koncentrált és állandó paraméterű rendszer (LTI) és a következő differenciálegyenlettel írjuk le: an ⋅
d n y( t ) dt
n
+ a n −1 ⋅
d n −1 y( t ) dt
n −1
+ L + a1 ⋅
= bm ⋅
dy( t ) + a0 ⋅ y = dt
d m u(t) dt m
+ b m −1 ⋅
d m −1u ( t ) dt m −1
(8.0.1) + L + b 0 ⋅ u;
Alkalmazzuk a Fourier transzformációt a 8.0.1 egyenletre: a n ⋅ ( j ⋅ ω) n ⋅ Y( j ⋅ ω) + a n −1 ⋅ ( j ⋅ ω) n −1 ⋅ Y( j ⋅ ω) + L + a 0 ⋅ Y( j ⋅ ω) = = b m ⋅ ( j ⋅ ω) m ⋅ U( j ⋅ ω) + b m−1 ⋅ ( j ⋅ ω) m−1 ⋅ U( j ⋅ ω) + L + b 0 ⋅ U( j ⋅ ω) Ebből meghatározzuk a rendszer frekvenciafüggvényét: Y( j ⋅ ω) b m ⋅ ( j ⋅ ω) m + b m −1 ⋅ ( j ⋅ ω) m−1 + L + b 0 H( j ⋅ ω) = = U( j ⋅ ω) a n ⋅ ( j ⋅ ω) n + a n −1 ⋅ ( j ⋅ ω) n −1 + L + a 0
(8.0.2)
Ennek a komplex függvénynek abszolút értéke és fázisa is frekvenciafüggő. Ha ismerjük a rendszer bemenő illetve kimenő jelének frekvenciafüggvényét, akkor az időtartományba való visszatérés nélkül is következtethetünk a rendszer időbeli viselkedésére. Azt már tudjuk, hogy ha egy rendszer bemenetére egy ω körfrekvenciájú szinusz jelet adunk, akkor az állandósult állapot beállta után a kimeneten ugyancsak egy szinusz jel jelenik meg amely a bemenőtől általában amplitúdóban és fázisban is különbözik. A frekvencia-függvény az átviteli függvényből s = j ⋅ ω változócserével érhető el. H( j ⋅ ω) = H(s) |s= j⋅ω
(8.0.3)
A frekvenciafüggvény abszolút értéke (A(ω)) a kimeneti és bemeneti jelek amplitúdójának hányadosa, a fázisszög (ϕ(ω)) pedig a fázisszögek a kimeneti és bemeneti fázisszögek szorzata. Legyen: H( j ⋅ ω) = P(ω) + j ⋅ Q(ω)
(8.0.4)
Innen
A(ω) = P 2 (ω) + Q 2 (ω) ϕ(ω) = arctg(
P(ω) ) Q(ω)
(8.0.5)
A frekvencia függvényből egyértelműen meghatározható a rendszer viselkedése a kezdeti időpontban ( t → 0 ) és az állandósúlt állapotban ( t → ∞ ). 170
lim H( j ⋅ ω) = lim A(ω) = lim h ( t )
ω→∞
ω→∞
t →0
lim H( j ⋅ ω) = lim A(ω) = lim h ( t )
ω→0
ω→0
t →∞
8.1. Az amplítúdó-fázis jelleggörbe (Nyquist-diagram)
Ha a H( j ⋅ ω) = A(ω) ⋅ e j⋅ϕ( ω) = Re(H( j ⋅ ω)) + j ⋅ Im(H( j ⋅ ω))
frekvenciafüggvényt a komplex síkban ábrázoljuk, a 0 < ω < ∞ frekvenciatartománynak megfelelően, akkor kapjuk a rendszer amplitúdó-fázis jelleggörbéjét. Minden egyes frekvenciára a kimenő jelnek a bemenő jelhez viszonyított fáziseltolási szöge és az amplitúdó a komplex sík egy pontját határozzák meg. A pontokat összekötő görbe az amplitúdó-fázis jelleggörbe. Ez egy irányított görbe és a frekvencia növekedésének irányát mutatja. A rendszer állandósúlt állapotának a görbe egy pontja felel meg. A következő, 8.1.1. ábra ezt mutatja.
8.1.1. ábra Fontos megjegyezni, hogy a Nyquist jelgörbe felhúzható tisztán kísérleti alapon is, mikor mint bemenő jelként egy változó frekvenciájú jelcsomagot alkalmazunk és mérjük a kimenő választ. Ehhez tudnunk kell a következőket. Egy LTI rendszer bemenő jelét jelöljünk mint u ( t ) = u ⋅ sin(ω ⋅ t ) és a kimenetet mint y( t ) = y ⋅ sin(ω ⋅ t − ϕ) . Fontos megfigyelés, hogy az LTI rendszer nem módosítja a bemenő jel frekvenciáját, hanem csak az amplitúdóját és fázisát. Az amplitúdó és fázis változásának mértéke függ a jel frekvenciájától. Igazolni lehet, hogy a komplex átviteli függvény frekvenciafüggvényének akár valós akár képzetes része akár amplitúdója akár fázisa (mindezek a frekvencia függvénye) elégséges a rendszer dinamikájának jellemzésére. A frekvencia tartománybéli eljárások könnyebben alkalmazható módszereket biztosítanak mint az időtartománybeli eljárások. 171
8.2. Bode jelleggörbe
Az átviteli függvény felírható mint H( j ⋅ ω) = H( j ⋅ ω) ⋅ e j⋅ϕ(ω) = A(ω) ⋅ e j⋅ϕ(ω) Kiszámítjuk a frekvenciafüggvény tízes alapú logaritmusát (lg) és kapjuk lg( H( j ⋅ ω) ⋅ e j⋅ϕ(ω) ) = log( H( j ⋅ ω) ) + j ⋅ (ϕ(ω)) ⋅ lg e Ha a H( j ⋅ ω) amplitúdó decibelben kifejezett mértékét és a fáziseltolási szöget az ω körfrekvencia függvényében ábrázoljuk, kapjuk a Bode-diagramokat amely az amplitúdó-jelleggörbéből és fázis-jelleggörbéből áll. A decibelben kifejezett érték egyenlő a mennyiség tízes alapú logaritmusának 20-al való szorzása adja.
8.2.1. ábra Az ω körfrekvencia nagy frekvenciatartomány esetében fontos logaritmikus léptékben ábrázolni. Ekkor a körfrekvencia változás mértékeként a dekád egységet alkalmazzuk. Egy diszkrét rendszert jellemző H(z) átviteli függvény esetében az eljárás ugyanaz mint folytonos rendszer esetében, de itt approximatív frekvenciafüggvénnyel van dolgunk. Egy Ts mintavételezési periódus esetében a
z=
1+ 1−
Ts 2 Ts 2
⋅ω ⋅ω
bilineáris transzformációt alkalmazunk, hogy megkapjuk a megközelítő frekvenciafüggvényt, de erre a későbbiekben még visszatérünk.
172
8.3. Rendszerek stabilitása
Egy folytonos LTI rendszer vagy stabil, vagy nem. Ezt a karakterisztikus egyenlete gyökeinek (pólusok) az s-síkban való elhelyezkedése határozza meg. Ha a rendszer egy diszkrét LTI rendszer akkor a stabilitást a pólusainak az z-síkban való elhelyezkedése jelenti. A rendszer stabilitása nem függ a rendszer kezdeti feltételeitől. Mindez nem igaz a nemlineáris rendszerekre. Fontos a rendszer viselkedését állapotterekben (fázisterekben) tanulmányozni. Az állapottér nem más mint az állapotváltozók által kifeszített tér.
8.3.1. ábra Az LTI rendszerek esetében az állapottér origója az O(0, 0) pont a rendszer egyedüli egyensúlyi pontja (szinguláris megoldási pontja) az egyedüli stabil (aszimptotikus stabilitás) pontja a rendszernek (lásd a 8.3.1. ábrát). A szinguláris pontok dinamikus egyensúlyi pontok, és a rendszer ezekben a pontokban stabil állapotban maradhat. Ez az egyensúlyi pont lehet stabilitási pont, akkor hogy ha egy minimális perturbáció után a rendszer kimozdul egyensúlyi állapotából de bizonyos idő elteltével visszatér ugyanoda (biztos egyensúly) Az egyensúlyi pont lehet instabilitási pont (bizonytalan egyensúly) ha egy tetszőlegesen kis, minimális, perturbáció hatására a rendszer végleg eltávolodik ettől az egyensúlyi ponttól. Ha egy minimális perturbáció hatására a stabilitás nem változik, akkor közömbös stabilitásról beszélünk. Alapvető tulajdonsága a szinguláris (egyensúlyi) pontnak, az, hogy a rendszert jellemző állapotváltozók deriváltja itt zéróvá válik ( x& 1 = 0; x& 2 = 0) vagyis dinamikai szempontból „mozdulatlan”. Itt a t-idő egy paraméter s ha az állapotteres rendszermodellt (5.4.2) megoldjuk, akkor megkapjuk az állapotváltozókat idő függvényében vagyis (két állapotváltozó esetében): x 1 ( t ) = f1 ( t; x (0)) (8.3.1) x 2 ( t ) = f 2 ( t; x (0)) Ezek nem egymástól független mennyiségek és ha a t független változót kiküszöböljük, akkor kapunk egy G ( x 1 , x 2 ) = 0 implicit függvényt amelyet a 173
rendszer állapottérbeli pályájának nevezünk. A fenti összefüggéseket egy másodrendű rendszer esetében írtuk fel. Egy magasabb rendű rendszer esetében is igazak az eddigi megállapítások, de az állapottér a rendszer rangjával egyenértékű dimenziójú s ezért nehéz a szemléletes bemutatása. A rendszer stabil ha bármely kezdeti állapotából eljut az egyedüli egyensúlyi, stabilítási (origó) pontjába. Az is nagyon fontos, hogy a kezdeti állapotból milyen módon jut el a stabilitási pontba. Ez a pályát adó, görbe formájából következik. Ha pedig nem jut el az egyedüli egyensúlyi pontba akkor a rendszer instabil (ha végleg eltávolodik a pálya az origótól) vagy a stabilitás határán van ha a pálya zárt pályán körbejárja az origót. A szinguláris pontok természete (osztályozása) meghatározása érdekében induljunk ki egy másodrendű rendszerből, amelynek differenciálegyenlete a következő: d2y dy + 2 ⋅ ξ ⋅ ω0 ⋅ + ω02 ⋅ y = 0 (8.3.2) 2 dt dt A 8.3.2 rendszer karakterisztikus egyenlete az s 2 + 2 ⋅ ξ ⋅ ω0 ⋅ s + ω02 = 0 egyenlet gyökei adják a rendszer két sajátértékét: s1 = − ξ ⋅ ω − ω ⋅ ξ 2 − 1 s 2 = −ξ ⋅ ω + ω ⋅ ξ 2 − 1
(8.3.3)
Ha a pályák egyenes vonalak, akkor átmennek az origón. Könnyen igazolható, hogy az egyenes pályák meredeksége egyenlő a rendszer valós sajátértékeivel. Tudjuk, hogy a sajátértékek invariánsak az állapotvektorok megválasztására nézve. Az LTI másodrendű rendszer szinguláris pontjainak osztályozása a 8.3.3 sajátértékek alapján ( ω, ξ az osztályozás paraméterei)
1. Központ. Az állapottér origója egy központ és a pályák ellipszisek ha ξ = 0 és ω 2 > 0 . Nincs egyenes pálya, mert a rendszernek nincs valós sajátértéke. 2. Fókusz Ha a rendszer paraméterei eleget tesznek a ξ < 1 és ω 2 > 0 feltételeknek akkor az origó egy fókuszpont. Nincs egyenes pálya mert nincs valós sajátértéke a rendszernek. Ha az állapotváltozók parametrikus (t-paraméter) formájából felírjuk az implicit formát akkor ezek egy logaritmikus spirálgörbét jelentenek. Ha ekkor: • 1 > ξ > 0 akkor stabil fókuszról beszélünk, mert a logaritmikus spirál az origó fele csökkenő görbe • 0 > ξ > −1 akkor nem stabil fókuszról beszélünk, mert a logaritmikus spirál az origótól indulva egy növekvő görbe 3. Csomópont. Ha a rendszer paraméterei eleget tesznek a ξ > 1 és ω 2 > 0 feltételeknek akkor az origó egy csomópont. Ebben az esetben létezik két egyenes pálya amelyek 174
meredeksége a rendszer két valós sajátértéke. A többi pályatípus meghatározása nélkül a következőket kapjuk • Ha ξ > 1 ( s1 < s 2 < 0 ) akkor az origó stabil csomópont • Ha ξ < −1 ( s1 > s 2 > 0 ) akkor az origó instabil csomópont 4. Nyeregpont. Ha a rendszer paramétere eleget tesz a ω 2 < 0 feltételeknek akkor az origó egy csomópont. A rendszernek ekkor van két egyenes pályája és egy nyeregfelületen futó pályák.
Ezek ismertetésére itt nem térünk ki, ezek megtalálhatók a szakirodalomban. Ez az ismertetés arra szolgál, hogy bevezessünk új fogalmakat. Egy nemlineáris rendszernek több szinguláris pontja van. A nemlineáris rendszer szinguláris pontjai közvetlen környezetében lineárizálhatjuk a rendszeregyenleteket, így az előbbi, másodrendű rendszereknél használt osztályba sorolás módszere itt is alkalmazható lesz. A lineárizálás, a szinguláris pont körüli Taylor sorbafejtéssel és csak a lineáris tagok megtartásával történik. Nemlineáris rendszerek állapotterében léteznek partikuláris pályák amelyeket határciklusoknak nevezünk. Ezek olyan izolált, zárt pályák amelyek az állapotváltozás periodikus mozgását jelentik az állapottérben. A határciklusra jellemző periodikus mozgás függ a kezdeti feltételektől és végtelen sok ilyen pálya létezhet. Egy nemlineáris rendszer minden határciklusa felosztja az állapotteret két részre amelyekben az állapotváltozások karakterisztikája más és más lehet. Egy határciklus lehet stabil, instabil, félig-stabil. Stabil határciklusról beszélünk ha minden pálya a határciklus fele tart mikor t tart a végtelenhez (periodikus jel a valós fizikai rendszerben). Ha a pályák eltávolodnak (t függvényében) a zárt görbétől akkor instabil határciklustól beszélünk. Ha az előbbi két eset egyszerre fordul elő egy határciklussal kapcsolatban akkor félig stabil esetről beszélünk. A határciklus létezése vagy hiánya alapvető egy rendszer viselkedésének megértésében. Egy szabályzás általában határciklus nélküli rendszereket kér, de kis amplitúdójú oszcillációkat még el lehet fogadni. Innen azt is megérthetjük, hogy míg egy lineáris rendszer stabilitása a rendszer tulajdonsága, addig egy nemlineáris rendszer stabilitása lokális tulajdonság, mert csak egy infinitezimális térben a szinguláris pontok környezetében igaz. Egy nemlineáris rendszer lehet stabil egy szingularitás környezetében de instabil egy másik szingularitás környezetében. Így egy nemlineáris rendszer perturbáció hatására visszatérhet egy adott egyensúlyi pontba (ahonnan indult), de ugyanolyan eséllyel találhat egy másik stabil egyensúlyi állapotot, oszcillálhat ha egy határciklus pályájára jut vagy akár instabillá is válhat. A három hatásciklus esetet a 8.3.2. ábrán láthatjuk:
8.3.2. ábra 175
LTI rendszerek esetében az aszimptotikus stabilitás a legfontosabb rendszertulajdonság s nem függ a ki/bemenő jelek korlátos tulajdonságától, sem a kezdeti feltételektől. A stabilitás a rendszer viselkedése, vagyis valamely vonásának állandósága jelenti. Az a rendszer stabil, amely energiamentes kiindulási állapotából kimozdítva, majd magára hagyva végül visszatér energiamentes kiindulási állapotába. Minden más esetben nem stabil a rendszer (labilis). Fizikailag nyilvánvaló, hogy energiatárolót nem tartalmazó veszteséges rendszer csak stabil lehet. A stabilitás tehát az energiatárolót tartalmazó rendszerek sajátossága. A stabilitás leggyakrabban visszacsatolt rendszerekkel kapcsolatos. Ezekre jellemző, hogy a kimenőjel, vagy annak átalakított formája megjelenik a bemeneten. A visszacsatolás következtében akkor is van bemenőjel, ha a külső bemenőjel időközben meg is szűnik. És ez ismétlődő jelenség. Ez a folyamat lehet konvergens, úgy, hogy a kimenő jel nullához tart. Konvergálhat azonban egy véges határértékhez, felléphetnek állandósult rezgések vagy minden határon túl növekedhet. Ezek a stabilitás különböző esetei. Általános esetben a stabilitás a bemenő jeltől és a munkaponttól is függ, tehát a rendszer egy állapotának, semmint az egész rendszernek a jellemzője. A rendszer stabil, ha a bemenő jel állandóan hat a rendszerre és ha korlátos bemenetre mindig korlátos választ ad. A különböző stabilitási eseteket mutatja a 8.3.3 ábra.
8.3.3. ábra A stabil viselkedés megítélése különböző eljárásokat (stabilitási kritériumokat) dolgoztak ki. A stabilitás pontos meghatározását elsőként A.M. Ljapunov adta meg. Ha ismert a rendszer h(t) súlyfüggvénye akkor egy LTI rendszerek stabilitásának feltétele 8.3.4. ∞
∫
h ( t ) ⋅ dt < M
(8.3.4)
0
ahol M egy véges korlát. Ennek szükséges feltétele 8.3.5 lim h ( t ) = 0
(8.3.5)
lim h ( t ) < M
(8.3.6)
t →∞
Ha t →∞
ahol M véges, akkor a rendszer kritikus stabilitási állapotban van (lásd 8.3.6 relációt). Akár folytonos akár diszkrét rendszerről van szó, a súlyfüggvény olyan exponenciális összetevők kombinációja , amelynek kitevői a rendszernek megfelelő karakterisztikus egyenlet gyökei (és megegyeznek a rendszermátrix sajátértékével). Hogy a rendszerek 176
ezeknek a fenti feltételeknek eleget tegyenek szükséges, hogy a pólusok valós részei negatívak, vagy diszkrét rendszer esetében ezek amplitúdója abszolút értéke kisebb legyen mint egy egység (< 1) . Ha nem adott a súlyfüggvény, de ismert a rendszer átviteli függvénye, akkor tudjuk, N(s) pólusainak (n-ed rangú karakterisztikus egyenlet D(s) = 0 ) az shogy a H(s) = D(s) síkban való elhelyezkedéséből tudunk a rendszer stabilitására következtetni. A pólusok poziciójából adódó, a kimenő jelek időben való változását mutatja a 8.3.4. ábra. A rendszer dinamikáját, mint az egységugrás mint bemenő jelre adott válaszát láthatjuk.
8.3.4. ábra Jelöljük a rendszer karakterisztikus egyenletének gyökeit s i , (i = 1,2, L , n ) -vel. Ekkor szükséges és elégséges stabilitási kritériumok a következők: •
Az LTI rendszer aszimptotikusan stabil ha ∀s i esetében igaz, hogy Re{s i } < 0 (bal félsík)
•
Az LTI rendszer instabil, ha legalább egy pólus az s-sík jobb félsíkjában helyezkedik el vagy legalább egy komplex konjugált póluspár az s-sík képzetes tengelyén van.
•
Az LTI rendszer kritikus stabilitási állapotban van, ha egy pólus van a képzetes tengelyen (origó) és nincsenek konjugált komplex (dupla) pólusok az s-sík képzetes tengelyén. 177
Diszkrét rendszerek leírását szolgálja a H(z) diszkrét impulzusátviteli függvény. Ezek pólusainak elrendezése az egységsugarú körhöz viszonyítva adja a diszkrét rendszer stabilitásának mértékét. Ha a diszkrét rendszer pólusai mind szigorúan az egységsugarú körön belül vannak akkor a rendszer aszimptotikusan stabil. Ennek összefoglalóját láthatjuk a 8.3.5. ábrákon mind a valós mind a komplex pólusok esetében.(Ez analóg azzal amit a folytonos rendszerek esetében mondtunk az s-sík bal félsíkja esetében a 8.3.4. ábrán.)
8.3.5. ábra A 8.3.5. és 8.3.6. ábrákon látható, hogy a valós pólusok viszonya az egységsugarú körhöz miként határozza meg a bemenő diszkrét egységugrás jel és a megfelelő kimenő jel viszonyát egy diszkrét rendszer esetében.
8.3.6. ábra 178
A 8.3.5. ábra esetében a diszkrét rendszer pólusai valósak, míg a 8.3.6. ábra esetében konjugált komplex pólusokról van szó. Egy kauzális LTI rendszert leíró egyenletek zéró értéket vesz fel ha n < 0 ha n = 0 a kezdeti pillanat. Kiszámítjuk a rendszer átviteli függvénynek megfelelő pólusokat. Ha egy pólus az egységnyi sugarú körön belül helyezkedik el ( d k < 1 ) akkor ez a pólus, mint egy exponenciális tag alapja, időben csökkenő tagokat szolgáltat a rendszer megoldásában (stabilitás). Ha a pólus az egységnyi körön kívül helyezkedik el ( d k > 1 ), akkor a megoldásban az ennek megfelelő exponenciális tag időben növekvő tagot szolgáltat s ez instabilitást jelent. Ha a pólus az egységnyi körön helyezkedik el akkor az egy oszcilláló taggal járul hozzá a homogén rendszer viselkedéséhez. Ha egy rendszer stabil és kauzális akkor minden pólusa az egységnyi sugarú körön belül helyezkedik el. 8.3.1. BIBO stabilitás
Ez nem aszimptotikus stabilitás, hanem ki / bemeneti stabilitás. Legyen egy rendszer bemenete u(t) (vagy diszkrét esetben u[n ]) és a kimente y(t) (vagy diszkrét esetben y[n ]) . A rendszer BIBO stabilitása azt jelenti, hogy a rendszer korlátos bemenő jelre korlátos kimenő jelet ad. Ezt felírhatjuk mint (itt diszkrét rendszer esetében írjuk fel az összefüggéseket): ha u[n ] ≤ M u < ∞
(8.3.1.1)
y[n ] ≤ M y < ∞
(8.3.1.2)
akkor
A BIBO feltétel megértése érdekében figyelembe kell vegyünk két alapvető algebrai összefüggést: a + b ≤ a + b és a ⋅ b = a ⋅ b . Ezeket felhasználva, felírhatjuk: y[n ] = h[n ] ∗ u[n ] =
∞
∑ h[k] ⋅ u[n − k] ≤
k = −∞
∞
∑ h[k] ⋅ u[n − k] ≤ M u
k = −∞
∞
∑ h[k]
(8.3.1.3)
k = −∞
Most figyelembe véve 8.3.1.2 egyenlőtlenséget akkor az előbbi (8.3.1.3) logikai sorból következik, hogy annak feltétele, egy rendszer BIBO stabil legyen az, hogy ∞
∑ h[k ] < ∞
(8.3.1.4)
k = −∞
Ez egy abszolút értékekből képezett számtani sor konvergenciáját jelenti (vagyis a diszkrét súlyfüggvény, a mintavételezési pillanatokban vett értékeiből képzett sor abszolút konvergens). Tehát a rendszer BIBO stabil ha ez a sor abszolút konvergens. Hasonló módon bizonyítható, hogy egy folytonos rendszer súlyfüggvénye h(t), a BIBO stabilitás érdekében eleget kell tegyen az
179
∞
∫ h(τ) ⋅ dτ < ∞
(8.3.1.5)
−∞
tehát a súlyfüggvény abszolút értékben integrálható kell legyen. Visszatérünk most az aszimptotikus stabilitáshoz, amely rendszertulajdonság és nem a bemenő jel természetétől függ. A rendszer stabilitását akkor is tanulmányozhatjuk ha a pólusokat nem számítsuk ki. Ilyenkor stabilitási kritériumokat használunk. Ezek lehetnek algebrai algoritmusok de frekvencia tartományi kritériumokat is megismerhetünk a következőkben. 8.3.2. Routh-féle stabilitási kritérium
Adott egy LTI rendszer polinom alakban felírt karakterisztikus egyenlet: D(r ) = a n ⋅ r n + a n −1 ⋅ r n −1 + L + a 1 ⋅ r + a 0 ⋅ r 0 A polinom együtthatóiból egy, úgynevezett Routh táblázat (séma) állítható fel. Egy n-ed fokszámú karakterisztikus egyenletnek megfelelő séma n + 1 sorból áll. A karakterisztikus egyenletből hiányzó együtthatók helyére zérót írunk. A Routh szabály szerint a rendszer akkor és csakis akkor stabil, ha a karakterisztikus polinom minden együtthatója pozitív (szükséges feltétel) és a Routh-séma első oszlopának minden egyes eleme is pozitív (elégséges feltétel). Ha az első oszlopban negatív elemek is előfordulnak, akkor az előjelváltozások száma megadja a rendszer s-sík jobb félsíkjában lévő pólusok számát. Látható, hogy a sorok hosszúsága egyre csökken. rn
an
a n −2
a n −4
r r n −2 r n −3
a n −1 b1 c1
a n −3 b2 c2
a n −5 b3 c3
M r3
M e1
M e2
M
f1 g1 h1
f2
n −1
r2 r1 r0
a n −6 L a n −7 L b4 L L
L
Ahol, b1 =
− a n ⋅ a n −5 a ⋅a a n −1 ⋅ a n −2 − a n ⋅ a n −3 ; LL ; b 2 = n −1 n −4 a n −1 a n −1
c1 =
b ⋅a b1 ⋅ a n −3 − b 2 ⋅ a n −1 − b 3 ⋅ a n −1 ; LL ; c 2 = 1 n −5 b1 b1
M
g1 =
f1 ⋅ e 2 − e1 ⋅ f 2 f1
h1 = f 2 180
A nulla megjelenése az első oszlopban a képzetes tengelyre eső gyököt jelent. Ha nulla jelenik meg az első oszlopban, akkor rendszerint helyettesítjük ezt egy tetszőleges ε értékkel, majd tanulmányozzuk a stabilitást a lim{L} határértékε →0
számítással a Routh-séma első oszlopában. Példa
Határozzuk meg a K paraméter értéktartományát a 8.3.2.1 karakterisztikus egyenlettel jellemzett rendszer esetében úgy, hogy ez a rendszer stabil legyen. r3 + 4 ⋅ r2 + 3⋅ r + K = 0 A Routh-séma az adott rendszer esetében r3 r2 r1 r0
1 4 3 − K4
(8.3.2.1)
3 K
K
Az adott rendszer stabil, ha az első oszlopban igaz, hogy 3 − K4 > 0 és K > 0 , amelyekből következik a stabilitási feltétel 0 < K < 12
⊗
8.3.3. Hurwitz-féle stabilitási kritérium
A rendszer n-ed rendű karakterisztikus egyenletnek megfelelően felírjuk az n-ed rendű Hurwitz mátrixot. Legyen D(r ) = a n ⋅ r n + a n −1 ⋅ r n −1 + L + a 1 ⋅ r + a 0 ⋅ r 0 = 0 és ennek megfelelő Hurwitz mátrix, meghatározás szerint: ⎛ a n −1 a n −3 a n −5 L 0 0 ⎞ ⎟ ⎜ ⎜ a n a n −2 a n −4 L 0 0 ⎟ ⎜ 0 a n −1 a n −3 L 0 0 ⎟ ⎟ ⎜ (8.3.3.1) an a n −2 L 0 0 ⎟ ΔH = ⎜ 0 ⎟ ⎜ M M M M M M ⎟ ⎜ ⎟ ⎜ 0 0 0 L a1 ⎟ ⎜ 0 0 L a2 a0 ⎠ ⎝ 0 és ennek alapján felírhatjuk ⎛a Δ1 = (a n −1 ); Δ 2 = ⎜⎜ n −1 ⎝ an
⎛ a n −1 ⎜ a n −3 ⎞ ⎟⎟; Δ 3 = ⎜ a n a n −2 ⎠ ⎜ 0 ⎝
a n −3 a n −2 a n −1
a n −3 ⎞ ⎟ a n −4 ⎟; L a n −3 ⎟⎠
181
A stabilitás szükséges és elégséges feltétele, hogy a karakterisztikus egyenlet valamennyi együtthatója (szükséges feltétel) legyen pozitív, és valamennyi, a főátlóra támaszkodó Δ i ( i = 1,2,3,L) mátrixoknak megfelelő determináns legyen pozitív definit (elégséges feltétel). Tehát az elégséges feltételeket felírjuk mint: det(Δ1 ) > 0, det(Δ 2 ) > 0, det(Δ 3 ) > 0, L
(8.3.3.2)
Példa
Adott a következő karakterisztikus egyenlet: T1 ⋅ T2 ⋅ p 3 + (T1 + T2 ) ⋅ p 2 + p + K = 0 A Hurwitz-mátrix pedig K 0⎞ ⎛ T1 + T2 ⎜ ⎟ Δ H = ⎜ T1 ⋅ T2 1 0⎟ ⎜ 0 T1 + T2 K ⎟⎠ ⎝ Ahonnan következnek a feltételek: det(Δ1 ) = T1 + T2 > 0 det(Δ 2 ) = T1 + T2 − K ⋅ T1 ⋅ T2 > 0 det(Δ 2 ) = K ⋅ det(Δ 2 ) > 0 Innen K > 0 . Ha T1 > 0 és T2 > 0 akkor a rendszer stabilitásának feltétele: 1 1 K< + T1 T2 (Minél nagyobbak az időállandók, annál kisebb lehet az erősítés. ⊗ 8.3.4. Routh és Hurwitz kritériumok diszkrét rendszer esetében
A diszkrét rendszerek esetében a stabilitási feltétel az, hogy a karakterisztikus egyenlet gyökeinek abszolút értéke legyen kisebb mint egy. Legyen adott a következő diszkrét karakterisztikus egyenlettel rendelkező n-ed rendű rendszer: D(z) = a n ⋅ z n + a n −1 ⋅ z n −1 + L + a 1 ⋅ z + a 0 ⋅ z 0 Hogy a folytonos rendszerek esetében ismertetett kritériumokat használhassuk alkalmazzuk a 1+ w (8.3.4.1) z= 1− w bilineáris transzformációt. Ekkor azt kapjuk, hogy:
182
D(
1+ w 0 1+ w 1 + w n −1 1+ w n 1+ w ) =0 ) + a0 ⋅( ) + L + a1 ⋅ ( ) + a n −1 ⋅ ( ) = an ⋅( 1− w 1− w 1− w 1− w 1− w
Az így kapott polinomra már alkalmazhatjuk a 8.3.3 al paragrafusban kijelentett kritériumokat. Példa
Adott egy diszkrét rendszer átviteli függvénye mint: D(z) = z 2 + a 1 ⋅ z + a 0 , ahol a 0 > 0, a 1 > 0 Ekkor 8.3.4.1 relációt alkalmazva azt kapuk, hogy 1+ w 1+ w 2 1+ w ) + a0 = 0 ) + a1 ⋅ ( )=( D( 1− w 1− w 1− w Innen következik, hogy: (1 + w ) 2 + a1 ⋅ (1 + w ) ⋅ (1 − w ) + a 0 ⋅ (1 − w ) 2 = = (1 − a1 − a 0 ) ⋅ w 2 + 2 ⋅ (1 − a 0 ) ⋅ w + (1 + a1 + a 0 ) = 0 Ha felírjuk a Hurwitz mátrixot (8.3.3.1), azt kapjuk, hogy: 0 ⎛ 2 ⋅ (1 − a 0 ) ⎞ ⎟⎟ Δ = ⎜⎜ ⎝ (1 − a 1 − a 0 ) (1 + a 1 + a 0 ) ⎠
A stabilitás feltételei a 8.3.3.2 relációk alapján feltétel, hogy: a 0 < 1 és (1 − a 1 − a 0 ) > 0 Magasabb fokszámú karakterisztikus egyenletek esetében nagyszámú számítást kell elvégezzünk amíg eredményhez juthatunk. Ezért rendszerint kevésbé alkalmazott módszer. 8.3.5. Jury-féle stabilitási kritérium
Adott egy diszkrét n-ed rendű rendszer 8.3.5.1 karakterisztikus egyenlete: D(z) = a n ⋅ z n + a n −1 ⋅ z n −1 + L + a 1 ⋅ z + a 0 ⋅ z 0
(8.3.5.1)
Ekkor a stabilitás szükséges feltételei: D(1) > 0 (−1) n ⋅ D(−1) > 0
Most felírjuk a két következő mátrixot: 183
⎛an ⎜ ⎜ 0 m1 = ⎜ 0 ⎜ ⎜ M ⎜ 0 ⎝
a n −1 L an L 0 L M M 0 L
a2 ⎞ ⎛ a n −2 ⎜ ⎟ a3 ⎟ ⎜ a n −3 a 4 ⎟; m 2 = ⎜ M ⎜ ⎟ M ⎟ ⎜ M ⎜ a ⎟ an ⎠ ⎝ 0
a n −3 L a 1 a n −4 L a 0 M M M M L M 0 L 0
a0 ⎞ ⎟ 0⎟ M ⎟ ⎟ 0⎟ 0 ⎟⎠
Ekkor a stabilitás elégséges feltétele, hogy M 1 , M 2 ahol, M1 = m1 + m 2 és M 2 = m1 − m 2
pozitív definit mátrixok legyenek. Mindezt a következő példa mutatja be. Példa
Adott a következő diszkrét karakterisztikus egyenlet: D (z) = z 5 + 2 ⋅ z 4 + 4 ⋅ z 3 + z 2 + 1 = 0
A stabilitás szükséges feltételei: D(1) = 1 + 2 + 4 + 1 + 1 = 9 > 0 (−1) 5 ⋅ D(−1) = (−1) 5 ⋅ ((−1) 5 + 2 ⋅ (−1) 4 + 4 ⋅ (−1) 3 + (−1) 2 + 1) = 1 > 0
Ekkor
⎛a5 ⎜ ⎜0 m1 = ⎜ 0 ⎜ ⎜0 ⎝
a4 a5 0 0
a3 a4 a5 0
⎛a3 ⎜ ⎜a2 m2 = ⎜ a ⎜ 1 ⎜a ⎝ 0
a2 a1 a0 0
a1 a0 0 0
a 2 ⎞ ⎛1 ⎟ ⎜ a3 ⎟ ⎜0 = a4 ⎟ ⎜0 ⎟ ⎜ a 5 ⎟⎠ ⎜⎝ 0 a0 ⎞ ⎛4 ⎟ ⎜ 0 ⎟ ⎜1 = 0 ⎟ ⎜0 ⎟ ⎜ 0 ⎟⎠ ⎜⎝ 1
⎛5 3 4 ⎜ ⎜1 1 3 M 1 = m1 + m 2 = ⎜ 0 1 1 ⎜ ⎜1 0 0 ⎝ ⎛1 3 ⎞ ⎟⎟) = 1 − 3 < 0; D1 = det(⎜⎜ ⎝1 1 ⎠ ⎛ 5 3 4 2⎞ ⎟ ⎜ ⎜1 1 3 4⎟ ) D2 = det(⎜ 0 1 1 2⎟ ⎟ ⎜ ⎜1 0 0 1⎟ ⎠ ⎝
2 4 1⎞ ⎟ 1 2 4⎟ 0 1 2⎟ ⎟ 0 0 1 ⎟⎠ 1 0 1⎞ ⎟ 0 1 0⎟ 1 0 0⎟ ⎟ 0 0 0 ⎟⎠
2⎞ ⎟ 4⎟ ;⇒ 2⎟ ⎟ 1 ⎟⎠
184
⎛ − 3 1 4 0⎞ ⎟ ⎜ ⎜ −1 1 1 1⎟ ;⇒ M 2 = m1 − m 2 = ⎜ 0 −1 1 2⎟ ⎟ ⎜ ⎜ −1 0 0 1⎟ ⎠ ⎝ ⎛ 1 1⎞ ⎟⎟) = 1 + 1 = 2 > 0; D3 = det(⎜⎜ ⎝ − 1 1⎠ ⎛ − 3 1 4 0⎞ ⎟ ⎜ ⎜ −1 1 1 1⎟ ) D4 = det(⎜ 0 −1 1 2⎟ ⎟ ⎜ ⎜ −1 0 0 1⎟ ⎠ ⎝ Mivel D1 < 0 ezért a rendszer instabil, s ezért a továbbiakban nincs értelme kiszámítani a D2, D3, D4 determinánsok értékét, hogy a pozitív definit tulajdonságot tanulmányozzuk. 8.3.6. Ljapunov közvetlen módszere
Legyen U ⊂ R n egy nyílt halmaz, amelyre 0 ∈ U . Egy V : U → R függvényt pozitív (negatív) definitnek nevezzük, ha V (0) = 0 és V( x ) > 0; (V( x ) < 0) x ≠ 0, x ∈ U . A V függvényt pozitív (negatív) szemidefinitnek nevezzük, ha V(0) = 0 és V( x ) ≥ 0; (V( x ) ≤ 0) x ≠ 0, x ∈ U . Alkalmazásokban általában V értelmezési tartománya R n . Ljapunov tétel
Tekintsük az x& ( t ) = f ( x ) nemlineáris elsőrendű differenciálegyenlet rendszert. Ez egy nemlineáris egyenlet. Ha x& ( t ) = A ⋅ x ( t ) differenciálegyenlet rendszert tekintjük, akkor ez egy lineáris egyenlet. A nemlineáris formára feltételezzük, hogy f (0) = 0 , azaz 0 a rendszer egyensúlyi helyzete. A lineáris rendszerre ezek igaz állítások. Tétel: Tegyük fel, hogy f (0) = 0 , U ⊂ R n nyílt halmaz és 0 ∈ U . Legyen V : U → R folytonosan parciálisan differenciálható.
& negatív szemidefinit, akkor x& ( t ) = f ( x ) (vagy Ha V pozitív definit és V x& ( t ) = A ⋅ x ( t ) ) egyenlet 0 egyensúlyi helyzete stabil. & negatív definit, akkor x& ( t ) = f ( x ) ( x& ( t ) = A ⋅ x ( t ) ) • Ha V pozitív definit és V egyenlet 0 egyensúlyi helyzete aszimptotikusan stabil. & pozitív • Ha 0 bármely környezetében létezik olyan x , hogy V( x ) > 0 , és V definit, akkor a 0 egyensúlyi helyzet instabil. & egyenletre vonatkozó Egy olyan V függvényt, amely pozitív definit és amelynek V deriváltja negatív szemidefinit, Ljapunov függvénynek nevezünk. •
185
Legyen most V( x ) egy vektorváltozójú skaláris függvény (8.3.6.1) V( x ) = x τ ⋅ P ⋅ x
(8.3.6.1)
és valós, szimmetrikus kvadratikus alak pozitív definit, ha a P mátrix valamennyi főátló menti aldeterminánsa pozitív. Egy lineáris, 8.3.6.2 állapotegyenletekkel leírt, magára hagyott (homogén) rendszer x& ( t ) = A ⋅ x ( t )
(8.3.6.2)
akkor stabil, ha a vele kapcsolatos Ljapunov függvényre ( V( x ) = x τ ⋅ P ⋅ x ) érvényes, hogy létezik egy Q pozitív definit mátrix úgy, hogy
& (x) = −x τ ⋅ Q ⋅ x V Ezt az egyenlőséget felírjuk most mint:
& ( x ) = d ( x τ ⋅ P ⋅ x ) = x& τ ⋅ P ⋅ x + x τ ⋅ P ⋅ x& = (A ⋅ x ) τ ⋅ P ⋅ x + x τ ⋅ P ⋅ (A ⋅ x ) = V dt = x τ ⋅ A τ ⋅ P ⋅ x + x τ ⋅ P ⋅ A ⋅ x = x τ ⋅ (A τ ⋅ P + P ⋅ A) ⋅ x = − x τ ⋅ Q ⋅ x Ezek alapján, a A τ ⋅ P + P ⋅ A = −Q
(8.3.6.2)
Ljapunov mátrixegyenletet kapjuk és ha a 8.3.6.2. mátrixegyenlet P megoldása pozitív definit mátrix akkor a 8.3.6.2 rendszer Ljapunov stabil. Példa
Adott a következő állapotegyenlettel leírt rendszer: ⎛−1 1 ⎞ ⎟⎟ ⋅ x x& ( t ) = ⎜⎜ ⎝ − 1 − 1⎠ Vizsgáljuk meg a rendszer stabilitását a Ljapunov direkt módszerrel. ⎛1 0⎞ ⎟⎟ mátrixot mint pozitív definit mátrix. Ekkor a Ljapunov Válasszuk a Q = ⎜⎜ ⎝0 1⎠ mátrix egyenletet 8.3.6.2 felírható mint: ⎛ − 1 − 1⎞ ⎛ p11 p12 ⎞ ⎛ p11 p12 ⎞ ⎛ − 1 1 ⎞ ⎛ − 1 0 ⎞ ⎟⎟ + ⎜⎜ ⎟⎟ ⋅ ⎜⎜ ⎜⎜ ⎟⎟ ⋅ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ ⎝ 1 − 1⎠ ⎝ p 21 p 22 ⎠ ⎝ p 21 p 22 ⎠ ⎝ − 1 − 1⎠ ⎝ 0 − 1⎠ mivel a P mátrix szimmetrikus ( p12 = p 21 ). Innen a következő egyenletrendszert kapjuk:
186
2 ⋅ p11 + 2 ⋅ p12 = 1 p11 − 2 ⋅ p12 − p 22 = 0 2 ⋅ p12 + 2 ⋅ p 22 = 1 A rendszer megoldása alapján a P mátrix ⎛ 1 0⎞ P =⎜2 1⎟ ⎜0 ⎟ 2⎠ ⎝ pozitív definit, tehát a rendszer Ljapunov stabil. Ezt még bizonyíthatjuk ha felírjuk, hogy V ( x ) = x τ ⋅ P ⋅ x = ( x1
⎛ 1 0⎞ ⎛ x ⎞ x 2 ) ⋅ ⎜ 2 1 ⎟ ⋅ ⎜⎜ 1 ⎟⎟ = 12 ( x12 + x 22 ) ≥ 0 ⎜0 ⎟ x 2⎠ ⎝ 2⎠ ⎝
& = d ( 1 ( x 2 + x 2 )) = x ⋅ x& + x ⋅ x& = x ⋅ (− x + x ) + x ⋅ (− x − x ) = −( x 2 + x 2 ) ≤ 0 V 1 2 1 1 2 2 1 1 2 2 1 2 1 2 dt 2 Ennél az utóbbi összefüggésnél felhasználtuk az állapotegyenletből felírt x& 1 = − x1 + x 2 x& 2 = − x1 − x 2 összefüggéseket. 8.3.7. Nyquist stabilitási kritérium
A Nyquist stabilitási kritérium segítségével, a visszacsatolás felbontásával létrehozott rendszer (felnyitott rendszer) Nyquist görbéje segítségével következtetünk a zárt rendszer stabilitására. A gyakorlatban a legtöbb esetben a felnyitott rendszer önmagában stabil. Ha a felnyitott rendszer átviteli függvényének a jobb félsíkban nincs pólusa, a zárt rendszer akkor és csakis akkor stabil, ha a felnyitott rendszer frekvenciafüggvénye a (−1, j ⋅ 0) ponton nem megy át, vagy azt nem veszi körül, miközben ω változik a (−∞,+∞) intervallumban. Ez azt jelenti, hogy van-e a zárt rendszernek csillapítatlan szinuszos rezgésű állandósult megoldása, vagyis van-e egy (vagy több) olyan ω0 körfrekvenciája, amelyre a frekvenciafüggvény -1 értéket vesz fel. Ha egy ilyen zárt rendszer bemenetére egységugrás jel hat, amelyben minden frekvenciájú összetevő megtalálható, ezek közül az ω0 frekvenciájú fennmarad, a többi tart zéróhoz az átmeneti fázis alatt. A 8.3.7.1 ábrán láthatjuk a stabilitás meghatározását szolgáló elemeket a Nyquist diagramon. A bal oldali ábra egy stabil rendszert míg a jobb oldali egy instabil rendszert határoz meg. Az ábrán az A P a rendszer amplitúdó tartalékát míg a ϕ p a fázistartalékát jelenti. Ezek meghatározásáról lesz még szó a későbbiekben. Az ábrán szerepel a -1 pont amely jelöli a kritikus pontot. A H f a felnyitott rendszer átviteli függvényének frekvenciaválaszát látjuk a komplex síkban. (Akár kísérleti mérésekkel is meghatározható ez a görbe.)
187
8.3.7.1. ábra A 8.3.7.1 ábrán az ω R körfrekvencia jelenti a diagramnak a valós tengellyel való metszéspontját. Ez a metszéspont a baloldali ábrán a -1 (−1, j ⋅ 0) ponttól jobbra helyezkedik el, míg a jobboldali ábra esetében a -1 (−1, j ⋅ 0) ponttól balra. A Nyquist diagram alkalmazásával értelmezni lehet az úgynevezett relatív stabilitást vagyis ez számszerűleg megadja, hogy a rendszer milyen messze van a stabilitás határától. Kössük össze a Nyquist görbe és az egységsugarú kör metszéspontját a komplex számsík kezdőpontjával. Ennek a sugárnak a negatív valós tengellyel alkotott szöge adja meg a fázistartalékot. A 8.3.7.2. ábrán láthatjuk ezeket a szögeket. Mind a három görbe (L, H, S) egy-egy felnyitott rendszer Nyquist görbéje.
8.3.7.2. ábra Jelöljük itt ϕ = π + ϕt ⇒ ϕt = ϕ − π A ϕ -t most az óramutató járásával ellentétes, pozitív irányba mérjük. Kijelenthetjük a következő kritériumokat: • Ha ϕ > π, akkor ϕ t > 0 és a rendszer stabil (S) •
Ha ϕ = π, akkor ϕ t = 0 és a rendszer stabilitás határán van (H)
• Ha ϕ < π, akkor ϕ t < 0 és a rendszer instabil (L) A rendszer stabilitási viszonyaira következtethetünk a rendszer erősítési tartalékából is. Az erősítési tartalék a Nyquist görbe és a negatív valós tengely metszéspontjának a 188
távolsága az origótól. A 8.3.7.3. ábrán három, különböző felnyitott rendszer (L, H, S) Nyquist görbéje esetében ábrázoljuk az erősítési tartalékokat(d = D L ,d = D H d = D S ).
8.3.7.3. ábra A következő törvényeket jelenthetjük ki: Ha d < 1 akkor a zárt rendszer stabil ( D S ) Ha d = 1 akkor a zárt rendszer a stabilitás határán van ( D H ) Ha d > 1 akkor a zárt rendszer instabil ( D L ) A Nyquist kritérium általánosított formája Legyen H f (s) =
N f (s) D f (s)
a felnyitott kör átviteli függvénye. Legyen a számláló fokszáma szigorúan kisebb mint a nevező fokszáma és a számlálónak és nevezőnek ne legyen közös osztója. A rendszer stabilitása szempontjából fontos a zárt rendszer pólusainak helyzete az ssíkban, vagyis az 1 + H f (s) = 0 =
N f + Df =0 Df
racionális függvény gyökei. Ezek a gyökök a zárt rendszer pólusai. A kifejezés nevezőjének gyökei pedig a zárt rendszer zérósai. Ha k 0 egy konstans, α i a zárt rendszer pólusai és β i a felnyitott rendszer pólusai és mindkettő multiplicitása n akkor felírjuk a következő összefüggést: n
N + Df H1 (s) = 1 + H f (s) = f = k0 ⋅ Df
∏ (s − α i ) i =1 n
.
∏ (s − β i ) i =1
189
Legyen az n darab α i valamint az n darab β i számának eloszlása a komplex s-síkban a 8.3.7.4. ábrán látható.
8.3.7.4. ábra Legyen M a felnyitott rendszer pólusainak száma a jobb félsíkból, és a w a pólusok száma a képzetes tengelyen ugyancsak a felnyitott rendszer esetében. Legyen N a zárt rendszer pólusainak száma a jobb félsíkból, és a v a pólusok száma a képzetes tengelyen ugyancsak a zárt rendszer esetében. Ha ismerjük M és w értékét és a felnyitott rendszer Nyquist diagramját, akkor N és v kiszámítható, tehát meghatározható a zárt rendszer stabilitása. Tudjuk, hogy felírható a következő fázisváltozást leíró összefüggés: Ha Ng N + Df H1 (s) = 1 + H f (s) = f = Df Df akkor ϕ(ω) = arg(H1 ( j ⋅ w )) = arg( N g ( j ⋅ w )) − arg(D f ( j ⋅ w )) és ha 0 ≤ ω < ∞ akkor a Δϕ = ϕ(∞) − ϕ(0) fázisváltozást az N g és D f fázisváltozásai adják, vagyis Δϕ = Δϕ Ng − Δϕ Df Az N g és D f fázisváltozásait az ezen polinomoknak megfelelő gyökök adják, mégpedig:
π fázisváltozást 2 π • ha a gyök a jobb félsíkban van akkor mindenik − fázisváltozást 2 eredményez. A fázisváltozás folytonos függvénye ω -nak kivéve azt az esetet mikor a gyök a képzetes tengelyen van, ilyenkor π -ugrás történik. A következő magyarázat során azt az esetet tárgyaljuk mikor nincs gyök a képzetes tengelyen. Ezek alapján felírhatjuk, hogy Δϕ = Δϕ Ng − Δϕ Df = [(n − N − v) ⋅ π2 + N ⋅ (− π2 )] − [(n − M − w ) ⋅ π2 + M ⋅ (− π2 )] = •
ha a gyök a bal félsíkban van akkor mindenik +
= (n − 2 ⋅ N − v) ⋅ π2 − (n − 2 ⋅ M − w ) ⋅ π2 ⇒ Δϕ = [2 ⋅ (M − N) + w − v] ⋅ π2 190
8.3.7.5. ábra Tehát ha M és w ismert (a felnyitott rendszerből) és meghatározzuk a Δϕ értékét a Nyquist diagram segítségével, akkor meghatározhatjuk az N > 0 és/vagy v > 0 értékét, tehát a zárt rendszer stabilitását. A 8.3.7.5 ábra szemléltet egy zérós fázisváltozású diagramot. Látható, hogy a (-1, j0) kritikus pontból a H f ( j ⋅ ω) Nyquist diagramjához húzott vektor Δϕ = 0 fázisváltozást szenved, mikor a H f ( j ⋅ ω) vektor csúcsa az ω = 0 értéknek megfelelő pontból indulva az ω növekedési irányába haladva eljut az ω = ∞ értéknek megfelelő pontba. Ha a Nyquist görbe körbejárná a kritikus pontot akkor a fázisváltozás nem nulla (például -2 ⋅ π ). Mindezeket figyelembe véve a Nyquist kritérium kijelenthető mint: •
A zárt rendszer aszimptotikusan stabil ha a kritikus pontból, a H f ( j ⋅ ω) -t leíró, ω függő (0 ≤ ω < ∞) , mozgó ponthoz húzott vektor folytonos változású Δϕ fázisvektor változásra igaz, hogy: w Δϕ = (M + ) ⋅ π 2 Nyquist egyszerűsített kritériuma •
Ha M = 0 és w = 0 ⇒ Δϕ = 0 ⇒ Ha a felnyitott rendszer aszimptotikusan stabil, akkor a zárt rendszer is aszimptotikusan stabil ha H f ( j ⋅ ω) Nyquist diagramja nem járja körbe és nem megy át a kritikus (-1, j0) ponton.
•
Ha H f ( j ⋅ ω) -nek a pólusai mind a bal félsíkban vannak, egy s = 0 pólus kivételével, akkor a zárt rendszer csak akkor stabil, ha a (-1, j0) kritikus pont a H f ( j ⋅ ω) Nyquist diagram bal oldalán van az ω növekvő irányába tekintve.
Nagyon sok esetben ez egy elégséges kritérium. 8.3.8. Stabilitásvizsgálat BODE-diagramokkal
A felnyitott rendszer BODE diagramjáról leolvasható a rendszer fázistartaléka illetve az erősítési tartaléka. A fázistartalék a Nyquist-diagram és az egységnyi sugarú
191
kör metszéspontját az origóval összekötő sugár és a negatív valós tengely által bezárt szög. Az egységsugarú körnek a BODE-diagramon a 0 dB tengely felel meg. Az egységsugarú kör és a Nyquist-diagram metszéspontjának a 0 dB tengely és a logaritmikus amplitúdó-diagram metszéspontja felel meg. Ha ehhez a metszésponthoz a fázis körfrekvencia jelleggörbén éppen a − 180 o szög tartozik, a rendszer stabilitás határán van. Ha a metszésponthoz 180 o -nál kisebb szög tartozik, a fázistartalék negatív, a rendszer működése instabil. A stabilitást az erősítési tartalék alapján is vizsgálhatjuk. Ha a − 180 o -os szöghöz tartozó amplitúdó éppen egységnyi, vagyis d [dB] = 0 akkor a rendszer a stabilitás határán van, ha d [dB] < 0 akkor a rendszer stabil, ha meg d [dB] > 0 akkor a rendszer instabil. (Lásd a 8.3.8.1. ábrát).
8.3.8.1. ábra Minimál-fázisúnak nevezzük azt a rendszert, amelynek nincsenek jobb oldali zérós helyei. A minimál-fázisú rendszerek esetében a stabilitás megállapítható az amplitudó-körfrekvencia jelleggörbéből is. Ha az amplitudó-körfrekvencia görbe − 20 dB / dekád meredekségű szakaszon metszi a 0 dB tengelyt, a rendszer biztosan stabil, ha a metszés − 40 dB / dekád meredekségű szakaszon következik be, akkor a stabilitás csak további vizsgálatok alapján dönthető el, ha pedig a metszés − 60 dB / dekád meredekségű szakaszon következik be akkor a rendszer biztosan instabil. 8.3.9. Gyökhely módszer
Egy LTI szabályzó rendszer milyenségét a szabályzott változó időbeni viselkedése alapján dönthetjük el. Általában az időtartománybeli válaszok kiszámítása nagyon nehézkes összetett rendszerek esetében. Egy szabályzó rendszert tervezőnek fontos, hogy minél hatékonyabb módszerekkel megbecsülhesse a szabályzás milyenségét. Ennek a milyenségnek egyik legfontosabb ismérve a stabilitás. Egy szabályzó körre felírjuk az átviteli függvényt és a felnyitott kör átviteli függvényét. 192
Legyen adott a 8.3.9.1. ábrán látható szabályzó kör:
8.3.9.1. ábra Ennek a zárt rendszernek az átviteli függvénye H(s) =
H1 (s) ⋅ H 2 (s) 1 + H1 (s) ⋅ H 2 (s)
míg a felnyitott szakasz átviteli függvénye H f (s) = H1 (s) ⋅ H 2 (s)
Most legyen a 8.3.9.2. ábrán látható szabályzó kör:
8.3.9.2. ábra H1 (s) 1 + H1 (s) ⋅ H 2 (s) míg a felnyitott szakasz átviteli függvénye H(s) =
H f (s) = H1 (s) ⋅ H 2 (s)
Látható, hogy az átviteli függvény más de a felnyitott kör átviteli függvénye ugyanaz. A stabilitásról az 1 + H f (s) = 0 karakterisztikus egyenlet gyökeinek (pólusok) tanulmányozása során kaphatunk információt. A stabilitás léte, vagy nemléte néha nem elegendő, kell ismerjük a stabilitás fokát is. A gyökhely módszer nemcsak a stabil-instabil kérdésre ad választ, hanem egy stabil szabályzó kör esetében a stabilitás fokára is tudunk következtetni. A gyökhely nem más mint a zárt rendszer karakterisztikus egyenlete gyökeinek mértani helye, az s-síkban, a rendszer nyeresége (erősítési tényezője), mint paraméter, függvényében. A gyökhely görbe felrajzolásában a felnyitott rendszer zérósainak és pólusainak eloszlásából indulunk ki. Ha a karakterisztikus egyenlet alapján kapott gyökhelyen, a választott paraméter 193
függvényébe megkapjuk a zárt rendszer gyökeinek eloszlását. A gyökeloszlás segítségével meghatározzuk a rendszer működése szempontjából elvárt gyököket (pólusokat) és a választott pólusokból megkapjuk a paraméter értékét (a rendszer erősítési tényezője) amelyet ha betartunk (alkalmazunk a zárt szabályzó körben) akkor a kívánt dinamikájú szabályzott rendszert kapjuk. A. A gyökhelygörbe felrajzolása
A felnyitott rendszer átviteli függvényét általános esetben felírhatjuk mint: 1 + b1 ⋅ s + b 2 ⋅ s 2 + L + b m ⋅ s m H f (s) = k f ⋅ ; m ≤ n; 1 + a1 ⋅ s + a 2 ⋅ s 2 + L + a n ⋅ s n Itt k f a felnyitott rendszer erősítési tényezője és nem függ a pólusoktól és zérósoktól. Most s z és s p -vel jelöljük a felnyitott kör zérósait és pólusait, és ezeket ismertnek tekintjük. Ekkor felírhatjuk, ha s z és s p -vel jelöljük a felnyitott kör zérósait és pólusait, hogy m
∏ (s − s z
i1
∏ (s − s p
i2
H f (s) = k f ⋅ ni1−=k1
i 2=1 m
m
H f (s) = k f ⋅
∏ (−s zi1 ) i1=1 n
∏ (−s p
i 2=1
i2
)
∏ (1 − ⋅
i1=1 n
s s zi1
∏ (1 − s
i 2=1
s
) = K⋅
) ; s pi 2 ≠ 0 )
m
s
i1=1 n
zi1
i 2=1
pi 2
∏ (1 − s ∏ (1 − s
)
pi 2
s
) ; k f > 0; s pi 2 ≠ s zi1 )
m
∏ ( −s z
i1
∏ (−s p
i2
i1=1 n
K = kf ⋅
i 2=1
) )
A K a felnyitott rendszer erősítési tényezője. Gyakorlatilag a gyökhely arra az esetre vonatkozik mikor 0 ≤ K < ∞ , tehát csak a nem negatív erősítési tényezőket vesszük figyelembe. Meghatározzuk a következő polinomokat: m
s
i1=1
s z i1
P(s) = ∏ (1 − Q(s) =
)
n
s
i 2 =1
pi 2
∏ (1 − s
)
A zárt rendszer karakterisztikus egyenletét felírhatjuk mint: 194
D(s) = Q(s) + K ⋅ P(s) = 0 Ennek alapján, a felnyitott rendszer karakterisztikus egyenlete H f (s) = K ⋅
P(s) = −1 Q(s)
Tudjuk, hogy s = σ + j ⋅ ω és így felírhatjuk P(s) = P(s) ⋅ e j⋅arg{P (s )} ;
m
s
i1=1
s zi1
n
s
i 2=1
s pi 2
P(s) = ∏ (1 −
); arg{P(s)} =
m
s
i1=1
zi1
n
s
i 2=1
pi 2
∑ arg{1 − s
}
Hasonló módon felírjuk, hogy Q(s) = Q(s) ⋅ e j⋅arg{Q(s )} ;
Q(s) = ∏ (1 −
); arg{Q(s)} =
Ha az így felírt összefüggéseket behelyettesítjük a K ⋅
∑ arg{1 − s
}
P(s) = −1 egyenletbe akkor két Q(s)
alapvető kritériumot határozunk meg: •
Fázisszög kritérium: Ahhoz, hogy egy s i pont a gyökhely eleme legyen eleget kell tegyen a következő összefüggésnek arg{P(s i )} − arg{Q(s i )} = (2 ⋅ k + 1) ⋅ π; k = 0, ± 1, ± 2, L
•
Amplitúdó kritérium: A K erősítési tényezőt a következőt a Q(s i ) összefüggés alapján számítsuk ki. K= P(s i )
B. Gyökhelygörbe tulajdonságai
Kiszámítjuk a felnyitott rendszer pólusait és zérós pontjait. Felhasználjuk a gyökhelygörbe tulajdonságait, s ezek alapján lehetséges egy megközelítő módszer kidolgozása hogy felépíthessük ezt a görbét. Most felsoroljuk a tulajdonságokat: •
T1 a gyökhelygörbe elágazásainak száma egyenlő max{n , m} -el H f (s) -ből, figyelembe véve a gyökök multiplicitását is.
•
T2 a gyökhelygörbe a felnyitott rendszer pólusaiból indul
•
T3 a gyökhelygörbe a felnyitott rendszer zérósaiban végződik, ide számítva a végtelenbe kitolt zérósokat
•
T4 a gyökhelygörbe szimmetrikus az s-sík valós tengelyére nézve
195
•
T5 ha a felnyitott rendszer K erősítési tényezője végtelenhez tart , akkor a gyökhelygörbe elágazásai olyan aszimptóta felé tartanak amelyek dőlésszögét a (2 ⋅ k + 1) ⋅ π ; k = 0,1,2,L, n − m − 1 θk = n−m és ezek az aszimptóták az s-sík valós tengelyét, a n
m
∑sp − ∑ sz σ0 =
j=1
j
j=1
n−m
j
=
( véges pólusok összege) − ( véges zérósok összege) ( véges pólusok száma) − ( véges zérósok száma)
•
T6 A gyökhelygörbe és az s-sík képzetes tengely metszéspontjainak megfelelő K paraméter értékét Routh-Hurwitz kritériummal határozhatjuk meg
•
T7 A gyökhelygörbe elágazási pontjai eleget kell tegyenek a d 1 ( ) = 0 összefüggésnek (szükséges feltétel) ds H f (s)
Az itt felsorolt hét tulajdonság alapján felrajzolhatjuk a gyökhely görbét. Példa
Adott a következő felnyitott rendszer átviteli függvénye: H f (s) =
6⋅K (s + 1) ⋅ (s + 2) ⋅ (s + 3)
Vázoljuk fel a rendszer gyökhelygörbéjét Pólusok: s = −1; s = −2; s = −3; Zérósok: három zérós a végtelenben A gyökhelygörbének három ága van és a pólusokból indulnak ki és a végtelenbe mennek. Az aszimptóták dőlésszögei 60 o ; 180 o ; 300 o σ0 =
−1− 2 − 3 = −2 3
A képzetes tengellyel való metszéspontok meghatározás érdekében felírjuk a H(s) karakterisztikus egyenletét, vagyis D(s) = (s + 1) ⋅ (s + 2) ⋅ (s + 3) + 6 ⋅ K = s 3 + 6 ⋅ s 2 + 11 ⋅ s + 6 ⋅ (K + 1)
Ennek alapján a Routh táblázat:
196
r3 r2 r1 r0
1 6 66 − 6 ⋅ (K + 1) 6 6 ⋅ (K + 1)
11 6 ⋅ (K + 1) 0 0
Az r1. sor és a T6 alapján felírjuk, hogy 66 − 6 ⋅ (K + 1) = 0 K=10, innen K = 10 vagyis megkaptuk az erősítési tényező értékét amely segítségével kiszámítjuk a görbe képzetes tengellyel való metszéspontját. A táblázat r2 sora alapján és tudva, hogy K=10, kapjuk, hogy 6 ⋅ s 2 + 66 = 0 és innen a gyökök s12 = ± j ⋅ 11 . d 1 ( ) = 0 összefüggést, hogy az elágazási pontok helyét ds H f (s) megtaláljuk. Megoldjuk a Most felhasználjuk a
d [(s + 1) ⋅ (s + 2) ⋅ (s + 3)] = 0 ⇒ 3 ⋅ s 2 + 12 ⋅ s + 11 = 0 ds egyenletet és kapjuk az s1 = −1.423; s 2 = −2.577 gyököket. Ebből a két gyökből csak az első eleme a gyökhelynek, tehát csak ez lehet elágazási pont. A Q(s) + K ⋅ P(s) = 0 alapján az s = s1 értékre megkapjuk a megfelelő K értékét (K=0.0641). Ezek alapján felrajzolhatjuk a 8.3.9.3. ábrán látható gyökhelygörbét.
8.3.9.3. ábra Innen látható, hogy ha K > 10 akkor a két konjugált komplex pólus az s-sík jobb félsíkjába kerül és a rendszer instabillá válik.
197
A fontosabb átviteli függvényeknek megfelelő gyökhelygörbék láthatók a következő táblázatban.
Példa
Adott a 8.3.9.4. ábrán látható egy zárt rendszer amelyben SZ-szabályzó az átviteli függvényével és a R-rendszer az ott megadott átviteli függvényével.
198
8.3.9.4. ábra Kiszámítjuk a felnyitott kör átviteli függvényét. H f (s) =
(s + 2) ⋅ (s + 5) 0.5 ⋅ K 0.5 ⋅ K ⋅ (s + 2) ⋅ = s ⋅ (s + 12) (s + 5) ⋅ (s − 4) s ⋅ (s + 12) ⋅ (s − 4)
A felnyitott rendszer pólusai s p1 = 0; s p 2 = −12; s p3 = 4; és véges zérósa meg s z1 = −2 . A gyökhelynek három ága van. Az egyik ág az s p 2 = −12 pólusból indul és
az s z1 = −2 zérósban végződik. A másik két ág az s p1 = 0; s p3 = 4; pólusokban kezdődnek és a végtelenben végződnek. Mivel van elágazás a végtelenbe ezért léteznek aszimptóták. Kiszámítva a dőlésszögeiket kapjuk, hogy ezek θ = 90 o ; θ = 270 o és a kiindulási pontjukat kiszámítjuk mint (−12 + 0 + 4) − (−2) σ0 = = −3 3 −1 A zárt rendszer karakterisztikus egyenletét felírhatjuk mint D(s) = s 3 + 8 ⋅ s 2 + (0.5 ⋅ K − 48) ⋅ s + K = 0 A Routh-táblázat meg: r3 r2
1 8 8 ⋅ (0.5 ⋅ K − 48) − K r1 8 r0 K
0.5 ⋅ K − 48 K 0 0
Az r1. sor és a T6 alapján 8 ⋅ (0.5 ⋅ K − 48) − K = 0 és innen K=128, vagyis megkaptuk az erősítési tényező értékét amely segítségével kiszámítjuk a görbe képzetes tengellyel való metszéspontját. A táblázat r2 sora alapján és mivel K=128 kapjuk, hogy 8 ⋅ s 2 + 128 = 0 és innen a gyökök s12 = ± j ⋅ 4 . Ezek a képzetes tengellyel való metszéspont koordinátái Most kiszámítjuk az elágazási pontok koordinátáit. Felírjuk, hogy d s ⋅ (s + 12) ⋅ (s − 4) ) = 0 ⇒ s 3 + 7 ⋅ s 2 + 16 ⋅ s − 48 = 0 ( ds 0.5 ⋅ K ⋅ (s + 2) Ennek az egyetlen valós gyöke s = 1.6083 és az előbbi példa szerint a megfelelő erősítési tényező értéke pedig K=29.01
199
8.3.9.5. ábra Az így kapott gyökhelygörbe az előző 8.3.9.5. ábrán látható. Láthatjuk, hogy a zárt rendszer instabil 0 ≤ K ≤ 128 esetében. Ha K > 128 akkor a zárt rendszer karakterisztikus egyenlet gyökei (pólusai) a bal félsíkba lesznek tehát a szabályzó stabillá teszi a rendszert ha a felnyitott rendszer erősítési tényezőjét megfelelően nagynak választjuk. 8.4 Szabályzó körök alaptagjainak jelátviteli tulajdonságai
Az alaptagok átviteli függvényeinek, súlyfüggvényeinek frekvenciafüggvényeinek tanulmányozását írjuk le a következőkben. A szabályzó körben különböző feladatot ellátó elemek találhatók, de sok közös tulajdonságuk van. A szabályzó rendszer működésének megértéséhez szükséges a jelátviteli rendszer állandósult állapotainak és dinamikus tulajdonságainak együttes megismerése. A jelátviteli tagok jellemzésére szükségünk van: • • • • •
Súlyfüggvényre (h(t)) mint a Dirac bemenő jelre adott válasz Átmeneti függvényre (g(t)) mint az egységugrás bemenő jelre adott válasz Átviteli függvény (H(s)) mint a súlyfüggvény Laplace transzformáltja Diszkrét (impulzus) átviteli függvény (H(z)) Frekvenciafüggvények (H( j ⋅ w )) ahol ω a jel körfrekvenciája.
Egy jelátvivő tag viselkedését az azt leíró differenciálegyenlet határozza meg. Az általános differenciálegyenlet a tag struktúráját (felépítését) az egyenlet bal oldalán álló kifejezéssel és az alkalmazott bemenetet (gerjesztést) az egyenlet jobb oldala tartalmazza. Egy lineáris rendszer általános differenciálegyenletét felírhatjuk mint: Tnn
⋅
d n y( t ) dt n
m du ( t − τ) dy( t ) m d u ( t − τ) + L + T1 ⋅ + y( t ) = K ⋅ (Tdm ⋅ + L + Td1 ⋅ + u ( t − τ)) m dt dt dt
Ez mindenképpen csak egy megközelítő modellje a valós történésnek mert csak korlátozott pontossággal, és korlátozott idő és jeltartományban használható. Ezek a 200
differenciálegyenletek a nem lineáritásokat a jellemzők térbeli felosztottságát és a paraméterek időbeli változásait elhanyagolva vagy módosítva születtek. A rendszer energiatárolóit a differenciálegyenletben a T időállandóikkal jellemezzük. Minden matematikailag különválasztható és leírható energiatároló eggyel növeli a differenciálegyenlet rendszámát. •
•
A jelátvivő tag a jel átvitelét két ok miatt késleltetheti: A jelátvivő tag energiatárolói a bemenő jel hatására véges idő alatt érik el egyensúlyi állapotukat, és ezzel késleltetik az állandósult állapotbeli kimenőjel megjelenését. A jelátvivő tag belső felépítéséből adódóan, a véges idejű τ késleltető hatású, mert a jel átvitelét τ ideig zárolja. Ezt a hatást holtidőnek nevezzük. A holtidő hatása (érvényre jutása) az általános differenciálegyenlet felírásakor a bement argumentumában ( t − τ) módon kerül be.
A jelátviteli jelenség állandósúlt állapota akkor következik be, ha az általános differenciálegyenlet bal oldalán szereplő rész deriváltjai időben nullává válnak, azaz: lim
t →∞
d n y( t ) dt n
dy( t ) = 0; t →∞ dt
= 0; L lim
Állandósult állapotban a K átviteli tényező ad összefüggést a kimenő ( y(∞)) és a bemenőjel (u (∞)) állandósult értéke között. A K mértékegysége megegyezik a kimenő és a bemenőjel mértékegységeinek hányadosával. Ha az átviteli tényezőnek nincs mértékegysége akkor erősítésnek nevezzük. Az átviteli tagok még felírhatóak állapotteres rendszerként, és itt az állapotváltozók megválasztása számtalan leírási formát eredményezhet. Ha egy megválasztott Ts időintervallumban (mintavételező periódus) mintavételezünk akkor a tagot egy differencia egyenlettel írjuk le. A Laplace (mintavételezett rendszereknél a Z) transzformáció alkalmazásával meghatározható a rendszer átviteli mátrixa (függvénye), vagy impulzus átviteli mátrixa (függvénye) és frekvenciafüggvénye. Az átviteli függvény általános alakja a következő alapvető dinamikus tagokat tartalmazhatja: 1 H(s) = K; H(s) = Ti ⋅ s ± 1; H(s) = Ti2 ⋅ s 2 ± 2 ⋅ ξ i ⋅ Ti ⋅ s ± 1; H(s) = i s 1 1 H(s) = ; H(s) = 2 2 Tj ⋅ s ± 1 Tj ⋅ s ± 2 ⋅ ξ j ⋅ Tj ⋅ s ± 1 Az alaptagok típusát és paramétereit szerkezeti felépítésük határozza meg. Az állandósult állapotot leíró összefüggésekből a jelátvivő tagok következő altípusai származnak: • Arányos tag amikor a kimenőjel arányos a bemenőjellel, vagyis y (∞ ) = K ⋅ u (∞ ) • Integráló tag amikor a kimenőjel arányos a bemenőjel idő szerinti integráljával lim T ⋅ t →∞
dy( t ) = K ⋅ u ( t ) → y (∞ ) = dt
t
K T
⋅ ∫ u ( t ) ⋅ dt + C 0
201
•
Differenciáló tag amikor y(∞) = A D ⋅
•
Holtidős tag amikor y( t ) = u ( t − τ)
du ( t ) dt
Az alaptípusoknak számtalan változata létezik annak függvényében, hogy a rendszer hány jelkésleltető energiatárolót tartalmaz. Az elkövetkező három jelátvivő tag esetében nem mutatjuk be a tag Nyquist, Bode jelleggörbéket. 8.4.1. Arányos tag (P-elem)
Az ideális arányos tagnak nincs energia tátolája. A 8.4.1.1. ábra ilyen jelátvivő tagot mutat. Az ideális arányos tagot leíró matematikai formák a következők: • •
Differenciál egyenlet Differencia egyenlet
•
Átviteli függvénye
•
Diszkrét átviteli függvény
• • •
Átmeneti függvény Súlyfüggvény Frekvenciafüggvény
y( t ) = K ⋅ u ( t ) y[n ] = K ⋅ u[n ] Y(s) H(s) = =K U(s) Y(z) H(z) = =K U(z) g( t ) = K ⋅ 1 ( t ) h ( t ) = K ⋅ δ( t ) H( j ⋅ ω) = K ⇒ A( w ) = 20 ⋅ log H( j ⋅ ω); Im{H( j ⋅ ω)} )=0 ϕ(ω) = arctk ( Re{H( j ⋅ ω)}
8.4.1.1. ábra 8.4.2. Integráló tag (I-elem) és egy energiatátárolós integráló tag (IT0)
Az integráló tagot az jellemzi, hogy állandósult állapotban a kimenőjel a bemenőjel integráljával arányos. Véges bemenőjel esetén, a kimenőjel nyugalmi állapota nem jöhet létre. Állandósult bemenőjelhez csak állandó változási sebességű kimenőjel 202
tartozhat. A változás állandó, és a kimenet minden határon túl egészen a szaturáció-ig növekszik. •
Differenciálegyenlet t
K ⋅ u (ζ ) ⋅ dζ + y(0) y( t ) = TI ∫0 vagy TI ⋅ •
dy = K ⋅ u(t) dt
Átviteli függvény K TI ⋅ s Diszkrét átviteli függvény (Tustin-megközelítés) Ts 1 + z −1 H(z) = ⋅ 2 ⋅ TI 1 − z −1 vagy egy másik K z H(z) = ⋅ TI (z − 1) 2 H(s) =
•
•
•
Differencia egyenlet Ts ⋅ ( y[n ] − y[n − 1]) = u[n ] + u[n − 1] 2 ⋅ TI vagy K u[n − 1] y[n ] − 2 ⋅ y[n − 1] + y[n − 2] = TI Frekvenciafüggvény π
− j⋅ K K = ⋅e 2 ⇒ H( j ⋅ ω) = j ⋅ ω ⋅ TI ω ⋅ TI
⇒ A(ω) =
π K ; ϕ(ω) = − ω ⋅ TI 2
A(ω) = 20 ⋅ lg(
K ) = 20 ⋅ lg(K ) − 20 ⋅ lg(ω ⋅ TI ) ω ⋅ TI
8.4.3. Deriváló (differenciáló) tag (D-elem)
A differenciáló tagokat az jellemzi, hogy állandósult állapotban a kimenőjel a bemenőjel deriváltjával arányos. Ha a bemenőjel zérus értékű, akkor a differenciáló tag kimenőjele állandósult állapotban szintén zérós értékű. Ha egy ilyen tagot sorba iktatunk egy szabályzó körbe, akkor ez azt eredményezi, hogy a rendszer állandósult állapotban (hatásvonala), szakadási pontot mutat. Egy ideális deriváló tagnak nincs energiatárolója. Egyes elemek a működési tartományuk egy adott tartományában ideális differenciáló tagnak tekinthető. •
Differenciálegyenlet 203
y( t ) = TD ⋅
du ( t ) dt
•
Átviteli függvény
•
H(s) = s ⋅ TD Diszkrét átviteli függvény nem írható fel egy tiszta differenciáló tag esetében de egy adott változási tartományban létezik egy megközelítő modell.
2 ⋅ TD 1 − z −1 ⋅ TI 1 + z −1 Differencia egyenlet nem írható fel egy tiszta differenciáló tag esetében de egy adott változási tartományban létezik egy megközelítő modell. 2 ⋅ TD ( y[n ] + y[n − 1]) = u[n ] − u[n − 1] TI Átmeneti és súlyfüggvény g( t ) = TD ⋅1( t ) H(z) =
•
•
h ( t ) = −TD ⋅ δ( t )
•
Frekvenciafüggvény H( j ⋅ ω) = j ⋅ ω ⋅ TD = ω ⋅ TD ⋅ e
j⋅
π 2
⇒
π 2 Egy ideális differenciáló tagnak egységugrás bemenő jel esetén, végtelen nagy kimenőjelet kell adnia a belépés pillanatban. A gyakorlatban a tagok csak bizonyos tartományban lineárisak, de ezt a tartományt is a szaturáció korlátozza, így a kimenőjel a végtelen nagy értéket nem érheti el. A tagban levő, esetleg igen kis értékű de mégis csak létező energiatároló az elérhető legnagyobb értéket is csak időkéséssel engedi létrejönni. ⇒ A(ω) = 20 ⋅ lg(ω ⋅ TD ); ϕ(ω) =
8.4.4. Egy energiatárolós arányos időkésleltető tag (PT1)
Az egy energiatárolós arányos időkésleltető tag sokszor előfordul a szabályzó rendszerek szerkezeti felépítésében. Az egy energiatárolós arányos időkésleltető tag viselkedését leíró és jellemző összefüggések a következők: • Differenciálegyenlet dy( t ) T⋅ + y( t ) = K ⋅ u ( t ) dt • Differenciaegyenlet T T + 1; a 1 = − ; k 0 = K a 0 ⋅ y[n ] + a 1 ⋅ y[n − 1] = k 0 ⋅ u[n ] ahol a 0 = Ts Ts K • Átviteli függvény H(s) = T ⋅s +1 • Impulzusátviteli függvény K z H(z) = ⋅ T T − s z−e T 204
•
Átmeneti függvény g( t ) = K ⋅ (1 − e
•
−
t T)
Súlyfüggvény t
•
K − h(t) = e T T
Frekvenciafüggvény H( j ⋅ ω) =
K 1+ j⋅ ω⋅ T
⇒
⇒ A(ω) = 20 ⋅ lg(K ) − 20 ⋅ lg 1 − (ω ⋅ T) 2 ϕ(ω) = −arctg(ω ⋅ T) Ts
− 1 A folytonos rendszer pólusa s = − míg a diszkrét rendszer pólusa z = e T . T A 8.4.4.1. ábra a PT1-elem diagramjait ábrázolja
8.4.4.1. ábra Az átmeneti függvény időállandója az az időtartam, amely alatt a tag a végértékének a 63.2%-át éri el. Az időállandó négyszeres értéke alatt az átmeneti függvény már 98.2%-át éri el a végértéknek. A gyakorlatban előforduló időállandók széles határok között, egy ezredmásodperc és néhány óra között változnak.
205
8.4.5. Két energiatárolós arányos időkésleltetésű tag (PT2)
Pár példa következik PT2 tagokra a 8.4.5.1. ábrán:
8.4.5.1. ábra •
Differenciálegyenlet T22
⋅
d 2 y( t ) 2
+ T1 ⋅
dy( t ) + y( t ) = K ⋅ u ( t ) , Behelyettesítve T2 = T és dt
dt T ξ = 1 ahol ξ a lengési tényező, ekkor a differenciálegyenlet 2 ⋅ T2 d 2 y( t )
1 dy( t ) + y ( t ) = K ⋅ u ( t ) formájú, ha még az ω = 0 T dt dt 2 ( ω0 a rendszer saját frekvenciája) akkor a differenciálegyenlet T2 ⋅
d 2 y( t ) dt
2
+ 2⋅ξ⋅T⋅
+ 2 ⋅ ξ ⋅ ω0 ⋅
dy( t ) + ω02 ⋅ y( t ) = K ⋅ ω02 ⋅ u ( t ) dt
•
Differenciaegyenlet a 0 ⋅ y[n ] + a 1 ⋅ y[n − 1] + a 2 ⋅ y[n − 2] = k 0 ⋅ u[n ] ahol 2⋅ξ⋅T 2⋅T T 2⋅ξ⋅T T + 1; a 1 = − − 2 ; a 2 = ( )2; a 0 = ( )2 + Ts Ts Ts Ts T0
•
Átviteli függvény H(s) =
• •
K
K
=
=
K ⋅ ω02
T2 ⋅ s 2 + T1 ⋅ s + 1 T 2 ⋅ s 2 + 2 ⋅ ξ ⋅ T ⋅ s + 1 s 2 + 2 ⋅ ξ ⋅ ω0 ⋅ s + ω02 A diszkrét átviteli függvény formája ξ értékétől függ és különböző felépítésű lehet. Átmeneti és súlyfüggvény Az időfüggvényeknél figyelembe kell venni, hogy a ξ értékétől függően a karakterisztikus egyenlet gyökei három esetet jelentenek: a. ξ > 1 és a gyökök negatív valósak ξ2 − 1 1 ξ s1 = − + =− T T Ta s2 = −
ξ2 −1 1 ξ − =− T T Tb
206
Ekkor: 1
1
− − Ta Tb g( t ) = K ⋅ (1 − ⋅ e Ta + ⋅ e Tb ) Ta − Tb Ta − Tb
1
1
− − 1 Ta h(t) = K ⋅ (e − e Tb ) Ta − Tb
A kimenőjel nem periódikus módon éri el állandósult állapotát b. ξ < 1 és a gyökök konjugált komplex gyök párok 1 − ξ2 ξ s1 = − + = −α + j ⋅ ω p T T s2 = −
1 − ξ2 ξ − = −α − j ⋅ ω p T T
ahol α a csillapítási tényező, ω p a lengési körfrekvencia vagy a csillapított sajátfrekvencia. Ekkor g( t ) = K ⋅ [1 − e −α⋅t (cos(ω p ⋅ t ) + h(t) =
K ωp ⋅ T
2
α ⋅ sin(ω p ⋅ t ))] ωp
⋅ e −α⋅t ⋅ sin(ω p ⋅ t )
A tag kimenőjele csillapodó lengésekkel éri el állandósult állapotát. c. ξ = 1 és a gyökök egybevágóak 1 s1 = s 2 = − Ekkor T g( t ) = K ⋅ [1 − e h(t) =
K T2
⋅t ⋅e
−
t T
−
t T
⋅ (1 +
t )] T
A tag kimenőjele nem periódikus határjelleggel éri el állandósúlt állapotát. T A tag viselkedése a ξ = 1 értékétől, vagyis két időállandótól függ. 2 ⋅ T2 A súlyfüggvény és az átmeneti függvény látható a 8.4.5.1. ábrán a ξ paraméter különböző értékeire. 207
8.4.5.1. ábra •
Frekvenciafüggvények A 8.4.5.2., 8.4.5.3. 8.4.5.4 ábrákon a frekvenciafüggvényeket ábrázoljuk.
8.4.5.2. ábra A paraméterekkel jellemzett Nyquist-diagram 208
8.4.5.3. ábra a BODE-jelleggörbe fázis diagramja
8.4.5.4. ábra a BODE-jelleggörbe amplitúdó diagramja 8.4.6. A holtidős tag
Azokat a tagokat, amelyek a bemenő jel átalakítását torzítás nélkül adja tovább a bemenetre a továbbadás azonban csak meghatározott idő múlva következik be holtidős tagnak nevezünk. Ezt a holtidőt jelöljük mint ( τ ). A holtidő oka az, hogy a
209
jeltovábbadás a tag belsejében véges sebességgel terjed, ezért általában akkor jelentkezik, ha a hatás terjedése anyagáramláshoz van kötve.
8.4.6.1 ábra Példa egy holtidős rendszerre a 8.4.6.1. ábrán látható szállító szalag, mivel a bemenő anyagmennyiség, csak egy meghatározott idő elteltével jelenik meg a kimeneten, vagyis a szalag végén. Holtidős tag lehet egy hosszú csővezeték is, amelyben adott hőmérsékletű folyadék áramlik. Ha a csővezeték elején a hőmérséklet ugrásszerűen változik, akkor a kimeneten is megközelítőleg ugrásszerű lesz a változás de csak egy holtidőnyi időintervallum elteltével. •
Differenciálegyenlet
•
Differenciaegyenlet
y ( t ) = K ⋅ u ( t − τ)
y[n ] = K ⋅ u[n − d); ahol d a •
τ egészszámú hányadosa. Ts
Átviteli függvény H(s) = K ⋅ z −s⋅τ
•
Diszkrét átviteli függvény H [ z] = z −d
•
Átmeneti és súlyfüggvény
•
Frekvenciafüggvény H( j ⋅ ω) = K ⋅ e j⋅ω⋅τ ; ⇒ A(ω) = 20 ⋅ lg(K ); ϕ(ω) = −ω ⋅ τ
g ( t ) = K ⋅ ( t − τ) h ( t ) = K ⋅ δ( t − τ)
Megjegyzés: 1 . Osszuk a tagot n T ⋅s +1 azonos sorba kapcsolt részre úgy, hogy a T időállandót is n részre osztjuk. A soros kapcsolás eredménye, ha a tagot és időállandót is n részre osztjuk: 1 . H(s) = T ⋅s n (1 + ) n Egy egytárolós arányos tag átviteli függvénye H(s) =
210
Tudjuk, hogy 1 1 = T⋅s = e −s⋅τ . T ⋅s n e n →∞ (1 + ) n Ezért a holtidős tagot tekinthetjük mint végtelen tároló számú arányos tagként tekinthető. lim
8.4.7. Jelátviteli tagok kapcsolási módozatai
A rendszerek egymáshoz kapcsolt elemekből, jelátviteli tagokból épülnek fel. A hatáslánc az a szabályzási lánc amelyek a mért jellemzőkről szerzett információkat és a szabályzóhatást közvetítik. A hatáslánc szemléletes formában fejezi ki a lánc jeleit, jellemzői között differenciál vagy differenciaegyenlettel, átvitel, diszkrét átviteli vagy frekvenciafüggvényekkel megadható összefüggéseit. Tehát a szabályzási rendszerek a jelátviteli tagok alapkapcsolásaiból épülnek fel. Az alapkapcsolásokat egyetlen eredendő taggal helyettesíthetők, így bonyolult hatásláncok (hatásvázlatok) is felépíthetők. Három alapkapcsolás ismeretes. A soros, párhuzamos kapcsolás és visszacsatolás. A. Soros kapcsolás
Két tag soros kapcsolású, ha az egyik tag kimenőjele egyben a hatásirányban utána következő tag bemenőjele is.
8.4.7.1. ábra Keressük a 8.4.7.1. ábrán látható rendszer átviteli függvényét, vagyis Y(s) H(s) = kifejezését. Látható, hogy U(s) Y(s) = H 2 (s) ⋅ U 2 (s); U 2 (s) = Y1 (s) = H1 (s) ⋅ U(s) ⇒ Y(s) = H 2 (s) ⋅ H1 (s) ⋅ U(s) ⇒ H(s) = H1 (s) ⋅ H 2 (s) Amint azt a következő ábrán láthatjuk, most több sorba kötött tagot veszünk a hatásláncban.
8.4.7.2. ábra Ekkor az előbbi gondolatsort ismételve a 8.4.7.2. ábrán látható sorba kötött tagokra kapjuk, hogy Y(s) H(s) = = H1 (s) ⋅ H 2 (s) ⋅ L ⋅ H n (s) (8.4.7.1) U(s) 211
Mintavételező rendszerek esetében két tag sorba kapcsolása mintavételezőn keresztül vagy mintavételező nélkül történhet. Ha a két tag sorba kapcsolása mintavételezőn keresztül történik, akkor az eredő diszkrét átviteli függvény a két impulzusátviteli függvény szorzata akár a folytonos tagok esetében ( H(z) = H1 (z) ⋅ H 2 (z) ). Ha a két tag sorba kapcsolása mintavételező nélkül történik, akkor az eredő diszkrét átviteli függvény a két átviteli függvény szorzata transzformáltjából adódó impulzusátviteli függvény ( H(z) = H1H 2 (z) ). Fontos észrevenni, hogy: H1 ( z ) ⋅ H 2 ( z ) ≠ H1 H 2 ( z ) .
Példa
Határozzuk meg két tag eredő diszkrét átviteli függvényét ha: a. a soros kapcsolás mintavételező nélkül történik b. a soros kapcsolás mintavételezőn keresztül történik A tagok átviteli függvényei 1 a H1 (s) = ; H 2 (s) = és a mintavételezési periódus Ts . s s+a Felírjuk, hogy 1 z H1 (z) = Z{ } = s z −1 a a⋅z H 2 (z) = Z{ }= s+a z − e −a⋅Ts 1 a z ⋅ (1 − e −a⋅Ts ) }= a. H1H 2 (z) = Z{ ⋅ s s+a (z − 1) ⋅ (1 − e −a⋅Ts ) z a⋅z a ⋅ z2 ⋅ = z − 1 (1 − e −a⋅Ts ) (z − 1) ⋅ (1 − e −a⋅Ts ) B. A párhuzamos kapcsolás
b. H1 (z) ⋅ H 2 (z) =
Két tag akkor tekinthető párhuzamosan kapcsoltnak ha a bemenőjelük közös, kimenőjeleik pedig összeadódnak, vagy kivonódnak. Párhuzamosan csak olyan tagokat lehet kapcsolni, amelyeknek a bemeneti és kimeneti oldalon is közös a jelhordozójuk.
8.4.7.4. ábra Y1 (s) = H1 (s) ⋅ U(s) Y2 (s) = H 2 (s) ⋅ U(s) 212
Y(s) = Y1 (s) + Y2 (s) Y(s) = (H1 (s) + H 2 (s)) ⋅ U(s)
Így párhuzamosan kapcsolt tagok eredője az átviteli függvényeknek összege, vagyis Y(s) H(s) = = H1 (s) + H 2 (s) U(s) Ha több párhuzamosan kötött tagunk van akkor
8.4.7.5. ábra és H(s) =
Y(s) = H1 (s) + H 2 (s) + L + H n (s) U(s)
(8.4.7.2)
A 8.4.7.6. ábrákon követhetjük, miként tudjuk felrajzolni egy sorba vagy párhuzamosan kapcsolt tagokból álló rendszer eredő Nyquist diagramját. Úgy a soros mint a párhuzamos rendszer esetében két ávitelifüggvény adott és az ezekhez tartozó H1 (s) és H 2 (s) átviteli függvényeikhez tartozó Nyquist diagramok láthatók. .
8.4.7.6. ábra
213
A sorba kötött tagok esetében egy tetszőleges ω1 körfrekvenciához tartozó s-síkban kapott pozicióvektorok (amplitúdó, fázis) összeadódnak (paralelogramma szabály szerint), míg a párhuzamosan kötött tagok esetében a megfelelő pozicióvektorok szorzódnak (Additív szabály az amplitúdók esetében és multiplikatív szabály a fázisok esetében) C. Visszacsatolás
A tagok visszacsatolásáról akkor beszélünk, ha a tagok egy része a hatásirányba mutat más része azzal ellentett irányba van kapcsolva, úgy hogy a kimenő jellemzőjük kölcsönösen hat a másik bemenő jellemzőjére. Az ellentetten kapcsolt tagok közül azt, amelynek a hatás iránya az egész rendszer hatásirányával azonos, főirányú tagnak, a másikat ellenirányú tagnak nevezzük. A főirányú ág bemenő jellemzője a rendszer bemenő kivonva a kimenő jellemzőjének. Fő és ellenirányba kapcsolni csak olyan tagokat lehet amelyeknek legalább egyike visszahatástól mentes. Ha ugyanis mindkét tagban lehetséges két hatásirány, akkor a párhuzamos vagy ellentett kapcsolás különbségének és ezáltal a visszacsatolásnak, nincsen értelme.
8.4.7.7. ábra Felírhatjuk, hogy Y(s) = ( U(s) ± Y(s)) ⋅ (H1 (s) ⋅ H 2 (s))
innen meg következik, hogy Y(s) ⋅ (1 m H1 (s) ⋅ H 2 (s)) = U(s) ⋅ (H1 (s) ⋅ H 2 (s))
és akkor a rendszer átviteli függvénye H(s) =
H1 (s) ⋅ H 2 (s) Y(s) = U(s) 1 m H1 (s) ⋅ H 2 (s)
(8.4.7.3)
Nagyon fontos megjegyezni a különbséget a hatásvázlat visszacsatolás előjele és a kapott átviteli függvény nevezőjében levő, az előbbivel ellentétes előjel között. Ha most a visszacsatolt rendszer
8.4.7.8. ábra 214
Felírhatjuk, hogy Y(s) = ( U(s) ± Y1 (s)) ⋅ H 2 (s) Y1 (s) = H1 (s) ⋅ Y(s) innen meg következik, hogy Y(s) ⋅ (1 m H1 (s) ⋅ H 2 (s)) = U(s) ⋅ H 2 (s) és akkor a rendszer átviteli függvénye H(s) =
H 2 (s) Y(s) = U(s) 1 m H1 (s) ⋅ H 2 (s)
(8.4.7.4)
Itt is nagyon fontos megjegyezni a különbséget a hatásvázlat visszacsatolás előjele és a kapott átviteli függvény nevezőjében levő, az előbbivel ellentétes előjel között. A rendszer negatív visszacsatolását az átviteli függvényben pozitív előjel jelenti. D. Átviteli függvény koncentrált zajbemenet esetén
A 8.4.7.9. ábrán a Z(s) bemenet jelenti a koncentrált zaj bemenő jelének Laplace transzformáltját.
8.4.7.9. ábra Ennek alapján felírhatjuk a következő összefüggést: Y(s) = Z(s) + ( U(s) ± Y(s)) ⋅ H1 (s) ⋅ H 2 (s)
innen meg kifejezzük az Y(s) értékét, és kapjuk: Y(s) =
H1 (s) ⋅ H 2 (s) 1 ⋅ Z(s) + ⋅ U(s) 1 m H1 (s) ⋅ H 2 (s) 1 m H1 (s) ⋅ H 2 (s)
Ha U(s) = 0 akkor megkapjuk a rendszer zajátviteli függvényét. Ezt felírjuk mint: H z (s) =
Y(s) 1 = Z(s) 1 m H1 (s) ⋅ H 2 (s)
(8.4.7.5)
Ha Z(s) egyenlő zéróval, vagyis a külső koncentrált bemenő zaj nulla, akkor megkapjuk a 8.4.7.4 összefüggést.
215
E. Felnyitott kör átviteli függvénye
Ha a 8.4.7.9. ábrán látható zárt szabályzó kört felnyitjuk ( U(s) = 0; Z(s) = 0 ), akkor a felnyitott kör átviteli függvénye (8.4.7.6) H 0 (s) = H1 (s) ⋅ H 2 (s) Az így meghatározott átviteli függvénynek nagy jelentősége van a stabilitási kritériumok tárgyalásánál. F. Súlyfüggvények összekapcsolása
•
Párhuzamos kapcsolás Legyen adott két rendszer súlyfüggvénye (Dirac jelre adott válasza) a h 1 ( t ) és h 2 ( t ) . Az átviteli függvények esetében is használt párhuzamos kapcsolás azt jelenti, hogy a bemenet ugyanaz minden tagra nézve, míg a tagok kimenete összegeződik. Ennek megfelelően felírhatjuk: h ( t ) = h1 ( t ) + h 2 ( t )
(8.4.7.7a)
A párhuzamos kapcsolás diszkrét súlyfüggvények esetében, hasonlóan a folytonos esethez felírhatjuk: h[n ] = h1[n ] + h 2 [n ] (8.4.7.7a) •
Sorba kapcsolt súlyfüggvények Ugyanúgy legyen adott két rendszer súlyfüggvénye (Dirac jelre adott válasza) a h 1 ( t ) és h 2 ( t ) . Az átviteli függvények esetében is használt soros kapcsolás azt jelenti, hogy a bemenet az első tag bemenete, majd a sorban következő tagok esetében igaz, hogy az előző tag kimenete a következő tag bemenete. A sorban utolsó tag kimenete a sorba kötött tagokból álló rendszer kimenete. Ennek megfelelően felírhatjuk: h (t ) = h1 (t ) ∗ h 2 (t )
(8.4.7.8a)
A sorba kapcsolás diszkrét súlyfüggvények esetében, hasonlóan a folytonos esethez felírhatjuk: h[n ] = h1[n ] ∗ h 2 [n ] (8.4.7.8a) Eltérően az átviteli függvényekkel leírt rendszerekhez viszonyítva, itt a sorba kötött tagok között nem szorzás művelet van hanem ∗ amely itt a konvolúciós szorzatot jelenti.
216
9. Mátrix-függvények Az elkövetkezőkben használt mátrixok, a négyzetes mátrixok halmazának elemei. Jelöljük ezt mint I n , A, B, K ∈ M n . Ezen a halmazon értelmezett műveletek közül fontos megemlíteni a következőket (értelmezésük ismert a valós számok halmazán bevezetett meghatározásukból): A k = A ⋅ A ⋅L ⋅ A A k ⋅ A m = A k+m (A k ) m = A k⋅m A0 = In (A −1 ) m = A −m Ha A m = B ⇒ A a B m-ik gyöke de nincs általános módszer annak megállapítására, hogy hány gyöke van egy ilyen mátrixegyenletnek, mert az ( Mn ,+,*) algebrai struktúra nem képez algebrai testet struktúrát (Itt a + és * a négyzetes mátrixok halmazán értelmezett additív és multiplikatív művelet). Márix-polinomok
Egy nagyon fontos függvényforma a mátrix-polinom. Rendszerek állapotteres tanulmányozása szempontjából alapvető fogalom. Ezek ismerete elengedhetetlen. Nem törekszem átfogó ismertetésükre, csak egy a gyakorlatilag használt megközelítés a cél. Legyen adott a következő valós polinom, ahol (p 0 , p1 ,L , p n ) a valós együtthatók vektora, míg x a valós változó. D( x ) = p n ⋅ x n + p n −1 ⋅ x n −1 + L + p1 ⋅ x + p 0 ⋅ x 0
(9.0.1)
Az x változót a 9.0.1 valós polinomban most egy A négyzetes mátrixxal helyettesítjük. Ekkor a következő mátrixot kapjuk: D(A) = p n ⋅ A n + p n −1 ⋅ A n −1 + L + p1 ⋅ A + p 0 ⋅ I n
(9.0.2)
Ha most kiszámítjuk az A mátrix hatványait, akkor megkapjuk az D( A ) értékét. Legyen most ugyanaz a 9.0.1 polinom ireduktibilis tagok szorzatára bontva. D( x ) = p n ⋅ ( x − λ 1 ) ⋅ ( x − λ 2 ) ⋅ ( x − λ 3 ) ⋅ L ⋅ ( x − λ n )
(9.0.3)
Most az A mátrixot behelyettesítjük a 9.0.3 polinomba kapjuk, hogy D( A ) = p n ⋅ ( A − λ 1 ⋅ I n ) ⋅ ( A − λ 2 ⋅ I n ) ⋅ L ⋅ ( A − λ n ⋅ I n )
(9.0.4)
217
A 9.0.4 mátrix-polinom esetében I n az n-ed rendű egységmátrix. Mátrixsorok
Legyen adott a 9.0.5 matematikai sor. S( x ) = a 0 + a 1 ⋅ x + a 2 ⋅ x 2 + L + a k ⋅ x k + L =
∞
∑ak ⋅ xk
(9.0.5)
k =0
egy négyzetes A mátrixot helyettesítve az x változó helyére kapjuk, hogy: S(A) = a 0 ⋅ I n + a 1 ⋅ A + a 2 ⋅ A 2 + L + a k ⋅ A k + L =
∞
∑ak ⋅ Ak
(9.0.6)
k =0
Bizonyítás nélkül kijelentjük, hogy a 9.0.6 sor konvergens k → ∞ határesetben ha az összes skaláris S(λ i ), i = 1,2,L , n sor konvergens amikor λ i az A mátrix sajátértékei. Speciális mátrixsorok
•
Mértani mátrixsor G (A) = I + a ⋅ A + a 2 ⋅ A 2 + L =
•
∞
∑ak ⋅ Ak
(9.0.7)
k =0
Exponenciális mátrixsor e A = exp(A) = I +
A A2 A3 Ak + + +L+ +L 1! 2! 3! k!
e − A = exp(− A) = I −
A A2 A3 (−1) k ⋅ A k + − +L+ +L 1! 2! 3! k!
(9.0.8a) (9.0.8b)
Ezen sorok határértéke egy mátrixokat jelent, ezért érvényes ezekre a mátrixok minden tulajdonsága. Tudjuk, hogy a mátrixszorzat nem kommutatív művelet, s ez érvényes minden mátrixfüggvényekre is. A trigonometriai függvényeket a 9.0.9 módon írjuk fel. A A3 A5 exp( j ⋅ A) − exp(− j ⋅ A) sin(A) = − + −L = 1! 3! 5! 2⋅ j I A2 A4 exp( j ⋅ A) + exp(− j ⋅ A) + −L = cos(A) = − 1! 2! 4! 2 A A3 A5 exp(A) − exp(− A) + +L = sh (A) = + 1! 3! 5! 2 ch (A) =
(9.0.9)
I A2 A4 exp(A) + exp(− A) + + +L = 1! 2! 4! 2
218
A mátrixváltozós trigonometriai formákra érvényesek a trigonometriából ismert összefüggések de minden esetben figyelembe kell venni, hogy a velük végzett multiplikatív művelet nem kommutatív. Vigyázzunk arra, hogy a fentebb ismertetett mátrixsorok végtelen sorok és konvergenciájuk következtében határozzák meg az elemi mátrixfüggvényeket. Megjegyzés:
Legyen adott a következő négyzetes mátrix: ⎛ 0 − 1⎞ ⎟⎟ J 0 = ⎜⎜ ⎝1 0 ⎠ Ekkor, a kijelölt mátrix müveleteket elvégezve kapjuk, hogy: J 0 2 = −I; J 0 3 = − J 0 ; J 0 4 = I; Ezért ez a J 0 2 x 2-és mátrix ugyanazt a szerepet játszhatja mint a j = − 1 a komplex számok esetében. 9.1. Cayley-Hamilton törvény
Legyen adott, 9.0.1 alapján D(λ) = p n ⋅ λn + p n −1 ⋅ λn −1 + L + p1 ⋅ λ + p 0 ⋅ λ0 Ez egy rendszer karakterisztikus polinomja. Ennek a rendszernek az állapotteres leírásban a rendszermátrixa A . Ismert, hogy ha adott az A rendszermátrix és az ennek megfelelő M modális mátrix, akkor igaz, hogy: A k = M ⋅ Λ k ⋅ M −1
(9.1.1)
Itt a Λ egy olyan, A -nak megfelelő, átlós mátrix amely a főátlója mentén az A mátrixnak megfelelő sajátértékek találhatók (a bizonyításban a jobb megértésért itt feltételezem, hogy az A mátrixnak csak valós, egyszeri gyökei vannak) A 9.1.1 összefüggést felhasználva, felírjuk a 9.1.2 mátrix-polinomot, vagyis n
D ( A ) = A + c1 ⋅ A
n −1
+ L + c n −1 ⋅ A + c n ⋅ I = M ⋅ D(Λ ) ⋅ M
−1
(9.1.2)
ahol 0 0 ⎞ L ⎛ D (λ 1 ) ⎜ ⎟ D (λ 2 ) L 0 ⎟ ⎜ 0 −1 D( A ) = M ⋅ ⎜ ⋅M ⎟ 0 M M O ⎜ ⎟ ⎜ 0 0 0 D(λ n ) ⎟⎠ ⎝
(9.1.3)
219
és λ1 , λ 2 ,L , λ n az A mátrix sajátértékei, és mivel a sajátértékek a karakterisztikus egyenlet gyökei, ezért D(λ1 ) = 0; D(λ 2 ) = 0; L D(λ n ) = 0; és innen következik, hogy: D( A ) = 0 (9.1.4) ahol D(λ) = det(λ ⋅ I − A) . Itt 0 egy n x n –es nullmátrix. A 9.1.4 egyenlőség a Cayley-Hamilton törvény, vagyis ez kimondja, hogy: Az A rendszermátrix gyöke a saját karakterisztikus egyenletének. Példa
1 ⎞ ⎛ 0 ⎟⎟ és az ennek megfelelő karakterisztikus egyenlet. Ellenőrizzük Adott A = ⎜⎜ ⎝ − 2 − 3⎠ a 9.1.4 egyenlőséget. D(λ ) = λ2 + 3 ⋅ λ + 2 az A mátrixnak megfelelő karakterisztikus egyenlet. Ha elvégezzük a kijelölt műveleteket, akkor 1 ⎞ ⎛ − 2 − 3⎞ ⎛ 0 ⎛1 0⎞ ⎛ 0 0⎞ 2 ⎟⎟ + 3 ⋅ ⎜⎜ ⎟⎟ + 2 ⋅ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ D(A) = A + 3 ⋅ A + 2 ⋅ I 2 = ⎜⎜ 7 ⎠ ⎝ 6 ⎝ − 2 − 3⎠ ⎝ 0 1⎠ ⎝ 0 0⎠ kapjuk. Tehát igaz a Cayley-Hamilton törvény. Példa
1 ⎞ ⎛ 0 ⎟⎟ esetében (módszer az A mátrix inverz Számítsuk ki A −1 mátrixot az A = ⎜⎜ ⎝ − 2 − 3⎠ mátrixának kiszámítására). Láttuk az előző példában, hogy ⎛0 0⎞ ⎟⎟ = 0 A 2 + 3 ⋅ A + 2 ⋅ I 2 = ⎜⎜ ⎝0 0⎠ Ha most a 9.1.5 egyenlőséget balról beszorozzuk az A
−1
(9.1.5) mátrixxal, kapjuk, hogy:
A1 + 3 ⋅ I 2 + 2 ⋅ A −1 = 0 innen meg, algebrai átalakítással következik, hogy ⎛− 3 A −1 = − 12 ⋅ A − 32 ⋅ I = ⎜⎜ 2 ⎝ 1
− 12 ⎞ ⎟ 0 ⎟⎠
220
Példa
Mátrix-polinom fokszámának csökkentésére is használhatjuk a Cayley-Hamilton törvényt. Egy n-ed rangú mátrix karakterisztikus polinomja felírható az I , A , A 2 , L , A n −1 mátrixok lineáris kombinációjaként. Példának legyen 1 ⎞ ⎛ 0 4 3 2 ⎟⎟ (9.1.6) D(A) = A + A + A + A + I ahol A = ⎜⎜ ⎝ − 2 − 3⎠ Ennek kiszámítása nehézkes művelet az A különböző hatványra emelése miatt. Legyen most az A mátrixnak megfelelő karakterisztikus polinom P(λ) = λ2 + 3 ⋅ λ + 2 és 9.1.4 alapján pedig felírhatjuk, hogy 2
2
A + 3 ⋅ A + 2 ⋅ I = 0 ⇒ A = −3 ⋅ A − 2 ⋅ I ⇒ 4
2
A = 9 ⋅ A + 12 ⋅ A + 4 ⋅ I = 9 ⋅ (−3 ⋅ A − 2 ⋅ I) + 12 ⋅ A + 4 ⋅ I = −15 ⋅ A − 14 ⋅ I Ebben a művelet sorban fontos volt arra figyelni, hogy a mátrixszorzat nem kommutatív. Az ismert (a + b) 2 bináris relációt mátrixok esetében mint a 2 + a ⋅ b + b ⋅ a + b 2 formát kell használni a kommutativitás hiánya miatt. Hasonló módon kiszámítjuk, hogy A 3 = −3 ⋅ A 2 − 2 ⋅ A = −3 ⋅ (−3 ⋅ A − 2 ⋅ I) − 2 ⋅ A = 7 ⋅ A + 6 ⋅ I
Ezek alapján 9.1.6 felírható mint: 4 3 2 D(A) = A + A + A + A + I = (−15 ⋅ A − 14 ⋅ I) + (7 ⋅ A + 6 ⋅ I) + (−3 ⋅ A − 2 ⋅ I) + A + I
Vagyis ⎛ − 9 − 10 ⎞ ⎟⎟ D(A) = −10 ⋅ A − 9 ⋅ I = ⎜⎜ ⎝ 20 21 ⎠ és látható, hogy egy 4-ed rangú mátrix-polinom kiszámítása egy első rangú polinom formára redukálódott. 9.2. Sylvester tétele
Ez a tétel egy módszer mátrixfüggvény értékének kiszámítására, ha a függvényt kifejezhetjük egy megközelítő polinommal vagy a függvény maga egy polinom. Az itt következő Sylvester módszert akkor használjuk, ha A -nak megfelelő karakterisztikus egyenletnek n darab egyszeri gyöke van. Ha D(A) egy mátrix változójú polinom és ha a négyzetes A mátrixnak n különböző sajátértéke van, akkor D(A) felírható mint:
221
n
D( A ) = ∑ D(λ i ) ⋅ Z 0 (λ i )
(9.2.1)
i =1
ahol n
∏ ( A − λ j ⋅ I) Z 0 (λ i ) =
j=1 j≠ i n
∏ (λ i − λ j ) j=1 j≠ i
(9.2.2)
Példa 1 ⎞ ⎛ 0 ⎟⎟ . Számítsuk ki Sylvester módszerrel e A értékét ha A = ⎜⎜ ⎝ − 2 − 3⎠ A 9.2.1 szerint felírhatjuk, hogy e
A
2
= ∑ e λ i ⋅ Z 0 (λ i ) i =1
(9.2.3)
és itt 9.2.2 alapján 1⎞ A − λ2 ⋅ I ⎛ 2 ⎟⎟ = ⎜⎜ λ1 − λ 2 ⎝ − 2 − 1⎠ A − λ 1 ⋅ I ⎛ − 1 − 1⎞ ⎟ Z 0 (λ 2 ) = =⎜ 2 ⎟⎠ λ 2 − λ1 ⎜⎝ 2 Z 0 (λ1 ) =
(9.2.4)
Most figyelembe vesszük, hogy az A mátrix sajátértékei λ1 = −1; λ 2 = −2 , és így 9.2.3 és 9.2.4 alapján azt kapjuk, hogy ⎛ 2 ⋅ e −1 − e −2 e −1 − e −2 ⎞⎟ e A = ⎜⎜ −1 −2 −1 −2 ⎟ ⎝ − 2 ⋅ (e − e ) − (e − 2 ⋅ e ) ⎠ Példa
1 ⎞ ⎛ 0 ⎟⎟ . Számítsuk ki A k formát a Sylvester módszer segítségével ha A = ⎜⎜ ⎝ − 2 − 3⎠ Felírhatjuk ha 2
A k = ∑ (λ i ) k ⋅ Z 0 (λ i ) i =1
A Z 0 formákat a 9.2.4 adja (ugyanaz az A mátrix),és így a műveleteket elvégezve:
222
⎛ 2 ⋅ ( −1) k − ( −2) k A k = ⎜⎜ k k ⎝ − 2 ⋅ (−1) + 2 ⋅ (−2)
( −1) k − (−2) k ⎞⎟ − (−1) k + 2 ⋅ (−2) k ⎟⎠
Ha most A -nak többszörös sajátértékei is vannak akkor a megfelelő Sylvester összefüggések megtalálhatóak a szakirodalomban és itt nem térünk ki rájuk. 9.3. Cayley-Hamilton módszer
A Cayley-Hamilton törvényre (9.1.4) építve a mátrixfüggvények felírására használt ez a Cayley-Hamilton módszer. Legyen P(λ) az A mátrix karakterisztikus egyenlete, és ki akarjuk számítani az N(A) mátrix-polinom értékét. Itt N(x) egy akármilyen polinom. Legyen a polinom fokszáma nagyobb mint az A karakterisztikus polinomjának rangja. Felírjuk a maradékosztás tételét az N(x) polinomnak P(x)-el való osztása esetében. Ez az összefüggés látható a 9.3.1 egyenlőségben. N (λ ) R (λ ) = Q(λ ) + P (λ ) P (λ )
(9.3.1)
. Ebből a 9.3.1 egyenlőségből következik, hogy N (λ ) = Q(λ ) ⋅ P (λ ) + R (λ ) Tudjuk, hogy az A egy λ sajátértékre P(λ) = 0 és így 9.3.1 alapján N (λ ) = R (λ ) Ennek megfelelően , ha P(A) = 0 (9.1.4), akkor következik, hogy N(A) = R (A)
(9.3.2) Itt R (λ ) polinom nem más mint a 9.3.1-ben felírt osztás maradék polinomja. Tudjuk, hogy a maradékosztás egyik következménye, hogy a maradék polinom fokszáma mindég kisebb mint az osztó polinom fokszáma. Az osztó polinom az A mátrixnak megfelelő rendszer karakterisztikus egyenlete. Példa
1 ⎞ ⎛ 0 ⎟⎟ . Számítsuk ki N(A) = A 4 + A 3 + A 2 + A + I értékét ha A = ⎜⎜ ⎝ − 2 − 3⎠ Az A mátrixnak megfelelő karakterisztikus polinom P(λ ) = λ2 + 3 ⋅ λ + 2 . Felírjuk, hogy λ4 + λ3 + λ2 + λ + 1 − 10 ⋅ λ − 9 = λ2 − 2 ⋅ λ + 5 + 2 2 λ + 3⋅λ + 2 λ + 3⋅λ + 2 Innen következik, hogy R (λ) = −10 ⋅ λ − 9 és így
223
⎛ − 9 − 10 ⎞ ⎟⎟ N (A) = R (A) = −10 ⋅ A − 9 ⋅ I = ⎜⎜ ⎝ 20 21 ⎠ Láthatjuk, hogy mennyivel egyszerűbb a maradék polinomból kiszámítani a mátrixpolinom értékét mint az eredetileg adott N(x) polinomból. Ez mindég könnyen alkalmazható mikor N(λ ) egy polinom-függvény. Ha most az F(λ) egy analitikus függvénye λ -nak az origó egy adott környezetében és nem polinom-függvény, akkor az Cayley-Hamilton módszer kiterjesztett változatát használjuk. Az F(λ) -t felírjuk mint egy végtelen, az analitikai tartományhoz tartozó λ -ban konvergens hatványsort (végtelen polinom). Ha az A rendszermátrix egy n x n-es mátrix akkor a megfelelő P(λ) karakterisztikus polinom rangja n. Így a maradékosztás tétele alapján felírjuk, hogy: F(λ ) = Q(λ) ⋅ P(λ) + R (λ )
(9.3.3)
Ezek alapján a maradék polinomot felírhatjuk mint: R (λ ) = α 0 + α1 ⋅ λ + α 2 ⋅ λ2 + L + α n −1 ⋅ λn −1
(9.3.4)
A maradék α i i = 0,1,L , n − 1 együtthatói ismeretlenek, mert végtelen polinomot gyakorlatilag nem tudjuk elosztani a karakterisztikus polinommal de azt tudjuk, hogy a maradék polinom rangja n-1. De a maradék polinom együtthatói kiszámíthatók ha a rendszermátrix sajátértékeit egyenként behelyettesítjük a 9.3.3 egyenlőségbe. Mivel a sajátértékek a karakterisztikus egyenlet gyökei így a 9.3.2 alapján a következő egyenletrendszert kapjuk: F(λ1 ) = R (λ1 ) F(λ 2 ) = R (λ 2 )
(9.3.5)
LLL F(λ n ) = R (λ n )
Ez egy lineáris, n-egyenlet n-ismeretlen egyenletrendszer és a megoldás pedig α i i = 0,1,L , n − 1 együtthatók és ezzel meghatározzuk az R( λ ) maradék polinomot. Ha többszörös sajátértékekkel találkozunk ( λ i egy s multiplicitású sajátérték), akkor a fenti egyenletrendszer úgy módosul, hogy a többszörös sajátértékek esetében a 9.3.6 összefüggéseket használjuk a 9.3.5 egyenletrendszerben. d k F(λ) dλk
| λ =λ i =
d k R (λ ) dλk
| λ =λ i
k = 0,1,2, L, s − 1
(9.3.6)
Ha meghatároztuk a maradék polinomot, akkor F(A) = R (A)
(9.3.7)
Egyenlőség alapján meghatározható bármely mátrixfüggvény. Példa
224
⎛ −1 0⎞ ⎟⎟ Számítsuk ki N(A) = A 3 + A 2 + A + I ha A = ⎜⎜ ⎝ 1 0⎠ A rendszermátrixnak megfelelő sajátértékek: λ1 = 0; λ 2 = −1 . Mivel a karakterisztikus polinom rangja kettő, ezért az ezzel való osztás maradéka, (vagyis R(x) a maradék) egyenlő eggyel. A maradék polinomot felírjuk mint R (λ) = α 0 + α1 ⋅ λ Ha λ1 = −1 N(−1) = 0 = R (−1) = α 0 − α1 ⇒ α 0 = α1 Ha λ1 = 0 N(0) = 1 = R (0) = α 0 ⇒ α 0 = 1 Tehát R (λ ) = 1 + λ És innen ⎛0 0⎞ ⎟⎟ R (A) = I + A = N(A) = ⎜⎜ ⎝1 1⎠ Példa
Határozzuk meg a H(A) = A12 − A10
⎛ 1 3⎞ ⎟⎟ értékét ha A = ⎜⎜ 0 2 ⎝ ⎠ A maradékot az R (λ) = α 0 + α1 ⋅ λ formában keressük. A rendszermátrix sajátértékei λ1 = 1; λ 2 = 2
λ = λ1
R (λ) = λ12 − λ10 = α 0 + α1 ⋅ λ ⇒ α 0 + α1 = 0
λ = λ2
R (λ) = λ12 − λ10 = α 0 + α1 ⋅ λ ⇒ α 0 + 2 ⋅ α1 = 212 − 210 = 3072
Így az egyenletrendszer a maradék meghatározására: α 0 + α1 = 0 α 0 + 2 ⋅ α1 = 3072 Innen következik, hogy α 0 = −3072 α1 = 3072 Tehát ⎛ 0 3⎞ ⎟⎟ H(A) = A12 − A10 = −3072 ⋅ I + 3072 ⋅ A = 3072 ⋅ ⎜⎜ ⎝ 0 1⎠ 225
Példa
Cayley-Hamilton módszer az x& ( t ) = A ⋅ x ( t ) + B ⋅ u ( t ) egyenlet megoldásában ha ⎛0 1 ⎞ ⎛ 0⎞ ⎟⎟; B = ⎜⎜ ⎟⎟ A = ⎜⎜ ⎝ 0 − 1⎠ ⎝1⎠ Tudjuk, hogy az 5.4.2 egyenlet megoldása rendszeregyenletének megoldása t
x ( t ) = e A⋅t ⋅ x (0) + ∫ e A⋅( t −τ) ⋅ B ⋅ u (τ) ⋅ dτ 0
Innen a Φ ( t ) = e A⋅t a fundamentális mátrix meghatározásában használjuk a CayleyHamilton módszert. N(A) = e A⋅t = R (A) = α 0 ⋅ I + α1 ⋅ A A rendszer két sajátértéke: λ1 = 0; λ 2 = −1 N ( 0) = e 0 = α 0 = 1 N (−1) = e − t = 1 − α1 ⇒ α1 = 1 − e − t Így ⎛1 0⎞ ⎛ 0 1 − e − t ⎞⎟ ⎛⎜ 1 1 − e − t ⎞⎟ ⎟⎟ + ⎜ e A ⋅ t = α 0 ⋅ I + α1 ⋅ A = 1⋅ ⎜⎜ = −t ⎟ ⎜ −t ⎟ ⎜ ⎝ 0 1 ⎠ ⎝ 0 − (1 − e ) ⎠ ⎝ 0 e ⎠ A teljes megoldás képletét alkalmazva, kapjuk ⎞ ⎛t ⎜ (1 − e −( t −τ) ) ⋅ u (τ) ⋅ dτ ⎟ ⎟ ⎛ 1 1 − e − t ⎞ ⎛ x1 (0) ⎞ ⎜ ∫0 ⎟⋅⎜ ⎟ x ( t ) = ⎜⎜ + ⎟ ⎜ ⎜ ⎟ e − t ⎟⎠ ⎝ x 2 (0) ⎠ ⎜ t −( t −τ) ⎟ ⎝0 ⋅ u (τ) ⋅ dτ ⎟ ⎜ ∫e ⎠ ⎝ 0 Az ebben a fejezetben tárgyalt Cayley-Hamilton módszer egy nagyon fontos eszköz úgy a folytonos mint a diszkrét állapotteres egyenletek megoldásában.
226
10. Mintavételezés, diszkrét rendszerek Napjainkban digitális számítógépeket használunk mint a jelfeldolgozás fő eszköze. A számítógép az szakaszos működésű, számértékkel kifejezett mennyiségek feldolgozására alkalmas. A különböző típusú folytonos információkat speciális eszközökkel olyan számszerű formára hozzuk, amelyet a számítógép már fel tud dolgozni. Egy ilyen eszköz például az analog/digitalis konverter (A/D). A szabályzó számítógép a feladat elvégzése céljából a különböző beavatkozó szervhez küld jeleket, de mivel ezek a jelek a számító-gépen belül számszerű formában állnak rendelkezésünkre, ahhoz, hogy az inkább folyto-nos jelekkel dolgozó szervek müködéséhez megfeleljenek, számszerű jelből analog jellé kell átalakítani. Ezt egy digitalis/analog (D/A) konverter alkalmazásával megoldható. A szükséges (A/D) és (D/A) átalakítás csak az úgynevezett mintavételezési időpontokban ( Ts ) történik. Általános gyakorlat, hogy a Ts egy konstans érték, habár elméletileg lehetséges, hogy minden pillanatban szabadon választható legyen. A digitalis számítógépek használata a szabályzási folyamatokban megköveteli, hogy a szabályzási rendszer szintén számszerű adatokból felépített model formára kell hozni. Ezt a diszkrét matematika szabályai szerint végezzük el. Így nyerhetjük a diszkrét jel valamint a diszkrét rendszer modelleket. Egy időben folytonos jel diszkrétizálása bármely folytonos összetevője (amplitudó, idő) szerint végezhető. Diszkrét időfüggvényt úgy kapunk, hogy egy f(t) folytonos idejű jelet egy megszámlálható sokaságú (a természetes számok halmazával bijektív megfeleltetésben levő) időpontokhoz képest (mintavételezési pillanatok) tartozó {f ( t 1 ), f ( t 2 ), f ( t 3 ),L, f ( t n ),L} megszámlálhatóan végtelen számsorrá alakítunk át. Ha a mintavételezési időpontok között állandó Ts időintervallum telik el, akkor a mintavételezési időpontok a {0 ⋅ Ts , 1 ⋅ Ts , 2 ⋅ Ts ,L, n ⋅ Ts ,L} halmaz és az ezekhez tartozó számszerű függvényértékeket {f [0 ⋅ Ts ], f [1 ⋅ Ts ], f [2 ⋅ Ts ], L f [n ⋅ Ts ], L} s
Ts
módon irhatjuk le és ha Ts egy végig állandó mennyiség akkor használni fogjuk az
{f [0], f [1], f [2],L, f [n ],L} jelölést is. Ezt még felírhatjuk mint: jelölés
f ( t ) = f [k ⋅ Ts ] ⎯⎯ ⎯→ f [k ]
ha t = k ⋅ Ts
f (t) = 0
ha k ⋅ Ts < t < [k + 1] ⋅ Ts
10.1. Mintavételezés
A mintavételezés alapproblémája a mintavételezési periódus, a Ts megválasztása. A számítógépek elterjedésével fontossá vált rendszerek diszkrét formában való tanulmányozása. Ha számítógépet használunk akkor egy rendszer a folytonos bemenő jelet egy digitális jellé alakítja, majd egy másik rendszer a digitális processzor által szolgáltatott jelet, a kimeneten, folytonos jellé alakítja, lásd, 10.1.1. ábra.
227
10.1.1 ábra Első lépésként a jelet mintavételezzük, majd digitizálás következik, amely abból áll, hogy minden mintát kvantálunk és egy bináris (digitális) jellé alakítunk. Ezt az eljárást nevezzük analóg-digitál átalakításnak (A/D konverzió). A számítógép feldolgozza a bináris jeleket és ez egy bináris kimenetet eredményez. Ezt a jelet, bizonyos tartó függvények alkalmazásával egy folytonos jellé lehet alakítani. Ezt az eljárást nevezzük digitál-analóg átalakításnak (D/A konverzió). A mintavételezés Ts másodpercenként történik, tehát egyenlő időközönként történő művelet. Mintavételező eljárásnak nevezzük azt a folyamatot, amelyben egy folytonos jel diszkrét jelsorrá alakul. Gyakorlatilag a mintavételező szervet egy állandó Ts időközönként egy rövid h időtartamra záró érintkező és egy (A/D) átalakító képezi.
10.1.2. ábra A mintavételezés kvantálás eljárás eredményeként az f(t) folytonos jelből kapjuk az f * ( t ) szakaszos függvény keletkezik amelyeket mint területmentes impulzus sorozatnak tekintünk. Tehát rendelkezünk az amplitúdó digitizált értékével valamint a digitizált érték megjelenésének időpontjával. Ezt a minavételezési eljárást mint az impulzussorozat amplítúdó modulációjaként is tekinthetjük (lásd 10.1.2.ábrát) A modulátor bemenőjele a folytonos f(t) míg a modulálandó jel a 228
m* (t) =
∞
∑ δ(t − k ⋅ Ts )
(10.1.1)
k =0
ahol δ( t ) az úgynevezett Dirac-jel. Ekkor a kimenő jelet felírjuk mint ∞
f * ( t ) = f ( t ) o m * ( t ) = f ( t ) o ∑ δ( t − k ⋅ Ts ) = k =0
∞
∑ f [k ⋅ Ts ] ⋅ δ(t − k ⋅ Ts )
k =0
Ezt még felírhatjuk mint f * ( t ) = f (0 ⋅ Ts ) ⋅ δ( t − 0 ⋅ Ts ) + f (1 ⋅ Ts ) ⋅ δ( t − 1 ⋅ Ts ) + f (2 ⋅ Ts ) ⋅ δ( t − 2 ⋅ Ts ) + L * A mintavételezés információveszteséggel. Az f ( t ) jel az f(t) jelről csak a mintavételi időpontban mond, közbeeső viselkedéséről semmit nem mond. Az f(t)-ből * egyértelműen képezhető az f ( t ) , de ez az állítás fordítva nem igaz mert egy adott mintavételezett formából a mintavételezési pontokban megegyező de más pontokban különböző értékeket vehet fel. A folytonos jellé átalakítást a (D/A) konverter végzi amely két alapműveletre bontható:
• •
dekódolásra tartásra. *
A tartás során a tartószerv az f ( t ) impulzussorozatból folytonos idejű jelet állít elő. Ez nem egyértelmű művelet, mert a függvény két mintavétel közötti értéke szabadon választható. A tartószerv lehet n darab mintavételi értéket használó extrapolarizációs polinom amely adja a két mintavételi pont közötti értékeket. A legegyszerűbb a zérusrendű tartószerv az impulzussorozatot lépcsős formává alakítja át. Egy elsőrendű tartószerv két mintavétel között folytonos kimenőjelet szolgáltat és meredekségét az időköz elején levő és a megelőző mintavételezési érték együttesen szabja meg (LOH). Gyakorlatban általában a zérusrendű tartószerv (ZOH) használata a gyakori. Az előbbi leírás alapproblémája a Ts mintavételezési periódus megválasztása. Általánosságban, egy jel mintavételezése mindig információvesztést eredményez, és így az eredeti jelet már nem tudjuk visszaállítani.A mintavételezési tétel elegáns matematikai keretet ad a folytonos jel és a mintái közötti kapcsolat leírásához. A következő ábrákat tekinthetjük ennek egyfajta szemléletes bizonyításaként.
10.1.3. ábra Vegyük egy jel legmagasabb, W frekvenciájú komponensét. Ez a komponens egy szinuszgörbe, ahogyan a 10.1.3. ábrán látható. Ennek következtében legalább 2W 229
mintára van szükség, hogy megragadjuk a jel legmagasabb frekvenciakomponenseinek teljes alakját. Meg kell jegyeznünk, hogy a 2W minta valójában csak egy speciális eset amely csak akkor eredményes, ha a mintákat pontosan a maximum és a minimumhelyeken vesszük.
10.1.4. ábra Ha bárhová máshová kerülnek, akkor az amplitúdók nem lesznek pontosan ábrázolva. Lásd 10.1.4. ábrát. Így lehet akár nulla is, ha a mintákat éppen az x tengellyel való metszéspontokban vesszük ).
10.1.5. ábra Egyszerű gyakorlati értelmezésben a tétel azt jelenti, hogy a mintavételezési intervallumot legalább olyan méretűre, vagy kisebbnek kell választani, mint a legkisebb számunkra érdekes részlet fele. A minimális mintavételezési gyakoriság végtelen lesz sokfajta jel számára, ami minket érdekel, így a teljesen tökéletes helyreállítás gyakran lehetetlen. Van azonban néhány olyan függvényosztály, amely teljesen visszaállítható a mintáiból, ilyenek például a polinomok. Felmerülhet a kérdés, hogy milyen sűrű mintavé-telezés szükséges egy adott függvényhez? A benne előforduló legmagasabb frekvencia határozza meg. Ebben lesz segítségünkre a Fourier-transzformált. Tekintsük ezt a függ-vényosztályt, vagyis a különböző függvények Fourier-transzformáltjait. Egy függvény Fourier-transzformációja a benne előforduló frekvenciákat mutatja meg, a fontosságuk arányában (10.1.6. ábra).
. 10.1.6. ábra Azokat a függvényeket, amelyek nem tartalmaznak egy küszöbfrekvenciánál nagyobb frekvenciát, sávhatárolt függvényeknek nevezzük. A tapasztalat szerint a jelek Fourier-transzformáltjai gyorsan csökkenő függvények, tehát a magasabb frekvenciák 230
egyre kisebb szerepet játszanak, így találhatunk egy olyan határt, aminél ha nagyobb frekvenciákat már nem veszünk figyelembe, még egészen jó eredményt, az eredeti jel elfogadható közelítését kapjuk. Az itt vázolt f(x) függvényt valós időbeli koordinátája szerint mint a megfelelő Fourier transzformáció frekvenciatartományában ábrázoltuk. Shannon-mintavételezési tétel (1949 Claude Shannon)
Ha f(x) nem tartalmaz W-nél nagyobb frekvenciát, akkor (visszaállítási törvény): f (x) =
∞
∑
f(
n = −∞
n sin(π ⋅ (2 ⋅ W ⋅ x − n )) )⋅ 2⋅ W π ⋅ (2 ⋅ W ⋅ x − n )
(10.1.2)
A mintavételezési tétel azt mondja, hogy egy jel megfelelően visszaállítható a mintáiból, ha az eredeti jel a spektrumának a W, legmagasabb frekvencia komponensénél legalább kétszerakkora frekvencián van mintavételezve. Ezt az alsó mintavételezési határt Nyquist-frekvenciának hívjuk. A Fourier-transzformáció segít nekünk meghatározni ezt a számot, ebből már ki tudjuk számolni a megfelelő mintavételezési gyakoriságot. (A gyakoriság reciproka a mintavételezési periódus).
10.1.7. ábra A 10.1.7. ábrán láthatjuk, hogy ha a Nyquist-frekvencia alatt veszünk mintákat, a minták amelyeket kapunk, megegyezhetnek egy olyan mintával, amelyet egy alacsonyabb frekvenciájú jel mintavételezésekor kapnánk. Tekintsük most át a mintavételezési törvényt egy grafikus reprezentációt használva. Párhuzamosan ábrázoljuk azt ami történik a valós tartományban és a frekvencia tartományban a különböző átalakítási fázisok során. Adott az f(x), egy valós változójú valós függvény (x lehet akár tér akár időváltozó). Ennek a Fourier transzformáltját jelöljük mint F(w). Az s(x) a mintavételezés sűrűségét mutató, fésű függvény, amelyet a grafikus képe miatt neveztek el így. Értéke mindenhol nulla, kivéve azokat a szabályos távolságonkénti helyeket, amelyek épp a mintavételi Ts pontoknak felelnek meg, itt az s(x) értéke 1 és Dirac-féle delta függvényekből áll és felírhatjuk, hogy s( x ) =
∞
∑ δ(x − i ⋅ Δx )
(10.1.3)
i = −∞
A valóságban a digitalizálókban a mintavételező függvények nem ilyen deltafüggvények, hanem keskeny, korlátozott/meghatározott amplitúdójú/nagyságú impulzusok használatosak ehelyett. Ennek eredményeként a valóságban egy jeldigitalizálón a mintavételezési intervallumok körülbelül tized akkorák, mint 231
amekkorát a mintavételezési tétel szerint elegendő lenne használniuk, mert a jelrekonstrukció során használt algoritmus csak egy lépcsős függvény. Az s(x) Fourier-transzformáltja az S(w). Egy fésű függvény Fourier-transzformáltja éppen egy másik fésű függvénnyé változik (10.1.8. ábra), 1/Δx-szeres távolságra lévő fogakkal. Az S(X) képlete: S(X) =
∞
i
∑ δ(X − ΔX )
(10.1.4)
i = −∞
10.1.8. ábra Az f-ből kiválasztjuk a pontokat, Az eredmény az ismétlődő spektrum. Szemléletesebben (lásd 10.1.9. ábrát) olyan, mintha mindegyik nyílhoz odamásolnánk az F(x)-et (ezt fejezi ki a 10.1.5 összefüggés). A nagyon ritka minták miatt ezek képei átfedik egymást.
10.1.9. ábra A képtérben egy jel mintavételezése egy fésű függvénnyel való szorzásának felel meg. N
N
i =1
i =1
s( x ) ⋅ f ( x ) = ∑ f ( x ) ⋅ δ( x − i ⋅ Δx ) = f ( x ) ⋅ ∑ δ( x − i ⋅ Δx )
(10.1.5)
Emlékezhetünk arra, hogy a konvolúció a képtérben megfelel a szorzásnak a frekvenciatartományban. Ez fordítva is igaz, egy képtérbeli szorzás ugyanaz, mintha a neki megfelelő Fourier-térben konvolúciót végeznénk. A mintavételezést pedig úgy definiáltuk, mint delta-függvények sorozatának szorzatát a folytonos képpel, tehát az ottani szorzásnak itt a konvolúció felel meg (10.1.6. összefüggés). A konvolúciós tétel szerint következik, hogy:
232
F(s( x ) ⋅ f ( x )) = F(s( x )) ∗ F(f ( x )) = S(X) ⋅ F(X)
(10.1.6)
Megkaphatjuk a mintavételezett jel Fourier-transzformáltját, ha a fésű függvény és az eredeti jel Fourier-transzformációjának konvolútív szorzatát kiszámítjuk.
10.1.10. ábra A kapott eredmények lesznek a diszkrét (digitális) jelünk értékei. A mintavételezett jel Fourier-transzformációja az eredeti folytonos jel periodikusan ismételt Fouriertranszformációinak összege. Mivel a túl ritka minták miatt a képek átfedik egymást (10.1.10. ábra), és összeadódnak.
10.1.10. ábra Sűrűbb mintavételezés esetén (lásd 10.1.12. ábrát) követjük most ugyanolyan logika szerint a mintavételezés lépéseit. A ‘nyílak’ távolabb leszek a Fourier térben.
10.1.12. ábra Így nincs átfedés (lásd a 10.1.13. ábrát) amikor a most nagyobb frekvenciával mintavételezett jel Fourier-transzformáltját használva, a fésű függvény és az eredeti jel Fourier-transzformáltjának konvolútív szorzatát kiszámítjuk. 233
10.1.13. ábra sin(π ⋅ x ) ) való konvolútív szorzattal a jeltérben helyre π⋅x tudjuk állítani az eredeti jelet. Ez ekvivalens a frekvenciatartományban a G négyszögimpulzussal (lásd 10.1.14. ábrát) való szorzással, és inkább ezt fogjuk elvégezni, mivel egyszerűbb művelet.
A sinc függvénnyel ( sin c =
11.1.14.ábra A G (mint a sinc függvény Fourier transzformáltja) segítségével kiküszöböljük az ismétlődő spektrumot, így csak egyetlen másolat marad az eredeti tartományból, és megkapjuk az f(x) Fourier-transzformáltját.
10.1.15. ábra A 10.1.15. ábra érzékelteti, hogy nem mindegy, hogy a G(w) transzformálttal az 10.1.13. ábrán látható frekvencia tartományból különítünk el egy transzformáltat (itt nem volt átfedés), vagy a 10.1.11 frekvencia tartományából.(az ábra jobb oldali grafikonja). A jól megválasztott mintavételezési frekvencia miatt, a 10.1.13. ábrán látható okok miatt az elkülönített Fourier transzformáltból visszaállítható az eredeti 234
folytonos f(x) jel (10.1.15. ábra), mit ha ugyanezt az eljárást a 10.1.10. ábrán látható Fourier transzformálttal tesszük meg, akkor az átfedések miatt az elkülönített Fourier transzformáltból nem állítható vissza az eredeti jel teljes pontossággal. Az elkülönítés alatt a frekvenciatartományban a G(w)-el való szorzási műveletet értjük. 10.2. Differencia egyenletek
Egy diszkrét lineáris, időben invariáns rendszer (dLTI) bemenet-kimenet kapcsolatát egy általános differenciaegyenlet írja le, vagyis: N
y[n ] − ∑ a k ⋅ y[n − k ] = k =1
M
∑ b k ⋅ u[n − k ]
(10.2.1)
k =0
és legyenek y[−1], y[2],L, y[− N] értékei a kezdeti feltételek. Itt az u[n ] a diszkrét bemenő jel, míg y[n ] a diszkrét kimenő jel. A differencia egyenlet rendje N. Az egyenlet megoldása y[n ] ha adottak a kezdeti feltételek és a bemenő diszkrét jel. Egy nem homogén differencia egyenlet megoldása a homogén egyenlet általános megoldása és a nem homogén egyenlet egy partikuláris megoldásának az összegéből áll. A homogén egyenlet megoldását a rendszer karakterisztikus egyenletének felírásával kezdjük. Ha a homogén egyenlet N
y[n ] − ∑ a k ⋅ y[n − k ] = 0
(10.2.2)
k =1
akkor a megoldást
c ⋅ (p) n c, p ∈ C (10.2.3) formában keressük. Itt c az integrálási konstans, míg p egy komplex változó. Ezt a formát visszahelyezve a homogén differencia egyenletbe (10.2.2), kapjuk: N
c ⋅ ( p) n − ∑ a k ⋅ c ⋅ ( p ) n − k = 0 k =1
Ebből következik a diszkrét karakterisztikus egyenlet: 1 − a 1 ⋅ p −1 − a 2 ⋅ p −2 − a 3 ⋅ p −3 − L − a N ⋅ p − N = 0 . Beszorozzuk ezt p N -el, kapjuk: p N − a 1 ⋅ p N −1 − a 2 ⋅ p N −2 − L − a N −1 ⋅ p − a N = 0
(10.2.4)
A homogén egyenletrendszer általános megoldása y[n ] = c1 ⋅ (p1 ) n + c 2 ⋅ (p 2 ) n + L + c N ⋅ (p N ) n
235
ahol p1 , p 2 , L , p N a karakterisztikus egyenlet gyökei, míg az ismeretlen, ( c i , i = 1,2,K , n ), integrálási együtthatókat a kezdeti feltételek segítségével határozzuk meg. Ha a diszkrét karakterisztikus egyenlet (10.2.4) gyökei többszörösek és/vagy komplex mennyiségek, akkor a megoldás matematikai formáját akárcsak a nem homogén megoldás (általános) megtalálását itt nem tárgyaljuk. 10.2.1. Diszkrét átviteli függvény
Legyen y[n ] egy diszkrét LTI rendszer kimenete, míg a bemenete u[n ] . Ha h[n ] a diszkrét rendszer súlyfüggvénye (a rendszer Dirac bemenő jelre adott válasza) akkor felírható y[n ] = h[n ] ∗ u[n ] (10.2.1.1) Ha a Z-transzformációt alkalmazunk, akkor a 10.2.1.1-ből Y(z) = H(z) ⋅ U(z)
(10.2.1.2)
összefüggést kapjuk, ahonnan H(z) =
Y(z) U(z)
(10.2.1.3)
és ezt diszkrét átviteli függvénynek nevezzük. Ez a meghatározás érvényes az Y(z) és U(z) közös ROC tartományában, kevésbé azokat a z értékeket amelyben U(z) zéróvá válik. Ha kiszámítjuk az átviteli függvény inverz transzformáltját akkor megkapjuk a rendszer súlyfüggvényét. Legyen most adott a következő általános differencia egyenlet: N
M
k =1
j=0
y[n ] + ∑ a k ⋅ y[n − k ] = ∑ b j ⋅ u[n − j]
(10.2.1.4)
Alkalmazzuk erre a Z-transzformációt, és kapjuk: M
N
Y ( z ) ⋅ ∑ z − p ⋅ a p = U ( z ) ⋅ ∑ z −q ⋅ b q ; a 0 = 1 p =0
(10.2.1.5)
q =0
Ebből a diszkrét átviteli függvényt felírhatjuk mint (10.2.1.6): M
Y(z) H(z) = = U(z)
∑ z −q ⋅ b q
q =0 N
∑z
p =0
= −p
⋅ap
b 0 + z −1 ⋅ b1 + z −2 ⋅ b 2 + L + z −M ⋅ b M 1 + z −1 ⋅ a 1 + z −2 ⋅ a 2 + L + z − N ⋅ a N
vagy 236
H(z) =
Y(z) (1 + q 1 ⋅ z −1 ) ⋅ (1 + q 2 ⋅ z −2 ) ⋅ L ⋅ (1 + q M ⋅ z − M ) N(z) = = −1 −2 −N U(z) (1 + p1 ⋅ z ) ⋅ (1 + p 2 ⋅ z ) ⋅ L ⋅ (1 + p N ⋅ z ) D( z )
(10.2.1.6)
Ebben a formában felírva megkapjuk a diszkrét rendszer zérósait ( q k a k-ik zérós) valamint a diszkrét rendszer pólusait ( p k a k-ik pólus). A pólusok poziciója az egységsugarú körhöz képest a z-síkban adja meg a rendszer aszimptotikus stabilitásának mennyiségi és minőségi jellemzőit. Ha a diszkrét átviteli függvényt elemi törtekre bontjuk és kiszámítjuk az inverz Ztranszformációját akkor kiszámítottuk a rendszer diszkrét súlyfüggvényét. Ez általában nem egyszerű művelet. Fordított eljárásként a rendszer átviteli függvényt felírhatjuk a zérós és pólusok ismeretében mint: M
H(z) =
k ⋅ ∏ (1 − c k ⋅ z −1 ) k =1 N
(10.2.1.7)
∏ (1 − d k ⋅ z
−1
)
k =1
ahol c k a zérósok a d k a diszkrét pólusok és k pedig az erősítési tényező ( k =
b0 a0
).
Ez a forma feltételezi, hogy a rendsernek nincsen sem pólusa sem zérósa a z = 0 pontban. Ha a rendszernek z = 0 egy p-szeres pólusa (amikor b 0 = b1 = b 2 = L = b p−1 = 0 ) és z = 0 r-szeres pólus (amikor a 0 = a 1 = a 2 = L = a r −1 = 0 ) akkor az átviteli függvényt felírjuk mint: M −p
H(z) =
k ⋅ z −p ⋅ ∏ (1 − c k ⋅ z −1 ) z
−r
k =1 N −r
(10.2.1.7a)
⋅ ∏ (1 − d k ⋅ z ) −1
k =1
és k =
b0 erősítési tényező. a0
Példa
Egy LTI rendszer esetében adottak u[n ] = (− 13 ) n 1 [n ] mint bemenő jel és y[n ] = 3 ⋅ (−1) n 1 [n ] + ( 13 ) n 1 [n ] mint kimenő jel.
Határozzuk meg a rendszer súlyfüggvényét. 237
Felírhatjuk u[n ] Z-transzformációját: U(z) =
1 1 + ( 13 ) ⋅ z −1
; ROC z >
1 3
majd y[n ] Z-transzformációját: 3 1 4 ROC: x > 1 + = Y(z) = −1 − 1 − 1 1+ z 1 − 13 ⋅ z (1 + z ) ⋅ (1 − 13 ⋅ z −1 ) Most kiszámítjuk az átviteli függvényt: 4 ⋅ (1 + 13 ⋅ z −1 ) Y(z) ROC: x > 1 H(z) = = U(z) (1 + z −1 ) ⋅ (1 − 1 ⋅ z −1 ) 3
Ha most ezt elemi törtekre bontjuk, akkor H(z) =
2 1+ z
−1
+
2 1−
ROC: x > 1
1 ⋅ z −1 3
Ennek inverz transzformáltja pedig adja: h[n ] = 2 ⋅ (−1) n 1 [n ] + 2 ⋅ ( 13 ) n 1 [n ]
amely a rendszer súlyfüggvénye. 10.2.2. A differencia egyenlet és diszkrét átviteli függvény
Egy LTI diszkrét rendszer N-ed rendű differencia egyenletét felírjuk mint: N
M
k =0
k =0
∑ a k ⋅ y[n − k] = ∑ b k ⋅ u[n − k ] Meghatározás szerint y[n ] = h[n ] ∗ u[n ] =
(10.2.2.1)
∞
∑ h[k ] ⋅ u[n − k ]
k = −∞
Ha u[n ] = z n , akkor y[n ] =
∞
∑ h[k ] ⋅ z
k = −∞
n −k
n
= z ⋅(
∞
∑ h[k ] ⋅ z −k )
k = −∞
Meghatározás szerint: ∞
∑ h[k ] ⋅ z −k = H(z)
(10.2.2.2)
k = −∞
a diszkrét rendszer átviteli függvénye. Ezek alapján felírhatjuk, hogy H{z n } = H(z) ⋅ z n
238
és ezt úgy értelmezzük mint z n a sajátvektor és H(z) a sajátértéke, vagyis az LTI rendszernek az z n jelre adott válasza nem más mint a bemenő jel megszorozva a komplex H(z) értékkel. Ezek ismeretében felírhatjuk, hogy ha u[n − k ] = z n −k ⇒ y[n − k ] = z n −k ⋅ H(z)
és a differenciaegyenletet felírjuk mint: M
N
M
k =0
k =0
z n ⋅ ( ∑ a k ⋅ z −k ) ⋅ H(z) = z n ⋅ ∑ b k ⋅ z −k ] ⇒ H(z) =
∑ b k ⋅ z −k
k =0 N
∑ a k ⋅ z −k
k =0 −k
A z együtthatója az u[n − k ] valamint a y[n − k ] együtthatói. Ezek alapján könnyen felírhatjuk a 10.2.2.1 differenciaegyenlettel felírt rendszer diszkrét átviteli függvényét. Példa
Adott a következő differencia egyenlet y[n ] − 14 ⋅ y[n − 1] − 83 ⋅ y[n − 2] = − x[n ] + 2 ⋅ x[n − 1] Írjuk fel a rendszer átviteli függvényét és a súlyfüggvényét. Az átviteli függvény H(z) =
− 1 + 2 ⋅ z −1 1 4
1− ⋅ z
−1
−
3 ⋅ z −2 8
⇒
1 3 4
1− ⋅ z
−1
+
−2
1 + 12 ⋅ z −1
A súlyfüggvény pedig h[n ] = −2 ⋅ (− 12 ) n ⋅ 1 [n ] + ( 34 ) n ⋅ 1 [n ] . Megjegyzés: Ha egy H(z) =
5⋅z + 2
diszkrét átviteli függvényből kell a differencia egyenletet z2 + 3⋅ z + 2 felírni, akkor a H(z)-t először z 2 való osztással H(z) =
5 ⋅ z −1 + 2 ⋅ z −2 1 + 3 ⋅ z −1 + 2 ⋅ z −2
alakra hozzuk. Innen már felírhatjuk, hogy 239
y[n ] + 3 ⋅ y[n − 1] + 2 ⋅ y[n − 2] = 5 ⋅ u[n − 1] + 2 ⋅ u[n − 2] 10.3. Folytonos rendszerből diszkrét rendszerre való transzformáció
Tekintsük most az előbbi eszmefuttatást időtartományban meghatározott függvények esetében. Így most s(t) a „fésű-függvény”, vagyis egy Dirac-jel-sor függvény. Legyen a folytonos rendszer bemenete u ( t ) az átviteli függvénye H(s) míg a kimenete y( t ). A diszkrét rendszert a diszkrét u[n ] bemenet a z tartományból a H(z ) diszkrét átviteli függvény, valamint a diszkrét y[n ] kimenet jellemzi. A diszkrét kimenet értékei egybeesnek a folytonos kimenettel a t = n ⋅ Ts pillanatokban, és itt Ts a rendszer mintavételezési periódusa. Feltételezzük, hogy a diszkrét rendszer a folytonos rendszer mintavételezett formája. Az alábbi alakban gyakorlati összefüggéseket adunk, hogy miképpen tudunk a folytonos modellből felírni a megfelelő diszkrét rendszer modelljét. Az elméleti meggondolásokat, amelyek a módszerek mögött állnak, nem tárgyaljuk itt. A következő megközelítő módszerekről lesz szó a következőkben: •
Bilineáris vagy Tustin módszer
•
Impulzus invariancia módszere
•
Egységugrás invariancia módszere
•
Előrecsatolt differencia módszer
•
Visszacsatolt differencia módszer
10.3.1. Bilineáris (Tustin) módszer
A bilineáris folytonos / diszkrét átalakítási módszer elméleti levezetése nyomán azt kapjuk, hogy az s-sík és z-sík közötti átalakítási összefüggést a 10.3.1.1 reláció adja, vagyis 1 s= ⋅ ln(z) (10.3.1.1) Ts Ez egy elméleti transzformáció és biztosítja a folytonos és diszkrét rendszerek azonosságát a mintavételezési pontokban, vagyis H(z) = H(s)
|s =
1 ⋅ln( z ) Ts
Gyakorlati alkalmazhatóság érdekében a ln(z) egy megközelítő formáját használjuk. Ez pedig z −1 ln(z) = 2 ⋅ z +1 Az így kapott z és s közötti összefüggés ekkor 240
s=
2 z −1 ⋅ Ts z + 1
(10.3.1.2)
és ezt nevezzük Tustin-összefüggésnek. Ezt a megközelítő eljárást jobban megérthetjük ha tudjuk, hogy a módszer alapja egy gyakran használt numerikus integrálási módszer, a trapéz szabály szerinti integrálás alkalmazása. Egy folytonos függvény menetét két mintavételi pont között egy egyenes szakasszal helyettesítve a görbe alatti területet egy trapézzal közelíthetjük: k ⋅Ts
∫
f ( t ) ⋅ dt ≅
( k −1) ⋅ Ts
Ts 2
(f (k ⋅ Ts ) + f ((k − 1) ⋅ Ts )
Ha most ez a közelítés az i(k ⋅ Ts ) =
k⋅Ts
∫ f (t ) ⋅ dt 0
integrál növekményére az i(k ⋅ Ts ) − i((k − 1) ⋅ Ts ) =
k⋅Ts
∫
f ( t ) ⋅ dt ≅
( k −1)⋅Ts
Ts 2
(f (k ⋅ Ts ) + f ((k − 1) ⋅ Ts )
értéket adja. Figyelembe véve a z −1 operátor idõben való egylépéses késleltetését (az eddigi ábráinkon mint D eltolási operátorként is szerepel), írhatjuk, hogy (1 − z −1 )i(k ⋅ Ts ) ≅
Ts 2
(1 + z −1 )f (k ⋅ Ts )
tehát a diszkrét idejű integrátor átviteli függvénye Z{i(k ⋅ Ts )} = Z{f (k ⋅ Ts )}
Ts 2
⋅
(1 + z −1 ) (1 − z −1 )
amely átviteli függvénynek a Laplace operátoros tartományban az s-sel való osztás felel meg: 1 Ts (1 + z −1 ) = ⋅ s 2 (1 − z −1 ) avagy (1 − z −1 ) s = T2 ⋅ s (1 + z −1 ) Ezt az összefüggést bilineáris vagy Tustin transzformációnak hívják, fordított irányban a 241
z=
1+ 1−
s⋅Ts 2 s⋅Ts 2
(10.3.1.3)
összefüggést jelenti. Példa
Adott a következő folytonos átviteli függvény: 1 H(z) = s+3 Írjuk fel a Tustin transzformációval a H(z) diszkrét átviteli függvényt ha Ts = 0.1 (z − 1) és így kapjuk, hogy Tudjuk, hogy s = T2 ⋅ s ( z + 1) 1 H(z) = = 2 ⋅ ( z − 1) + 3 0.1 ( z + 1)
1 ⋅ ( z + 1) 23 z − 17 23
10.3.2. Az impulzus átviteli invariancia módszere
Az impulzus invariancia módszerét akkor alkalmazzuk ha a H(s) átviteli függvény esetében a számláló fokszáma szigorúan kisebb mint a nevező fokszáma. A H(z)-t megkapjuk ha a következő transzformáció lépéseket alkalmazzuk:
H(s) → h ( t ) súlyfüggvény, majd felírjuk h (n ⋅ Ts ) alakot, kiszámítjuk Z{h (n ⋅ Ts )} és akkor kapjuk, hogy H(z) = Ts ⋅ Z{h (n ⋅ Ts )}
(10.3.2.1)
Példa
Adott a következő folytonos átviteli függvény: 1 H(z) = s+3 Legyen Ts = 0.1 . Ennek az átviteli függvénynek inverz Laplace transzformációja adja a rendszer súlyfüggvényét és ez: h ( t ) = e −3⋅t Most felírjuk, 10.3.2.1 alapján, hogy h ( n ⋅ T s ) = e − 3 ⋅ n ⋅T s = ( e − 3 ⋅T s ) n Az így kapott kifejezés Z-transzformációját kiszámítjuk és kapjuk, hogy 242
Z{(e −3⋅Ts ) n } =
z z − e −3⋅Ts
Így a kapott diszkrét átviteli függvény H(z) = Ts ⋅ (
z z−e
−3⋅Ts
)=
(0.1) ⋅ z z − e −0.3
10.3.3. Egységugrás invariancia módszere(ZOH)
Egységugrás invariancia módszerét (ZOH-zérósrendű tartószerv) a következő lépésekben tudjuk leírni. H(s) H(s) inverz transzformációját használva), } transzformációt (a Kiszámítjuk a Z{ s s z −1 majd az így kapott kifejezést 1 − z −1 = -el szorzott formája az a H(z), vagyis: z H(s) H(z) = (1 − z −1 ) ⋅ Z{L−1{ }} (10.3.3.1) s Megjegyzés: A ZOH módszerhez hasonló a Lineáris Invariancia módszere (LOH-elsőrendű tartószerv) amelyet a következő módon határozunk meg: H(z) = (
(1 − z −1 ) 2 Ts ⋅ z
−1
) ⋅ Z{L−1{
H(s) s2
}}
(10.3.3.2)
Példa
Adott a következő folytonos átviteli függvény és Ts = 0.1 : 1 H(z) = s+3 Ekkor H(s) 1 1 1 = = 13 ⋅ − 13 ⋅ s s ⋅ (s + 3) s s+3 Ennek az inverz Laplace transzformációja ( t ≥ 0 ) 1 1 −3⋅t − ⋅e 3 3 Ha most a t = n ⋅ Ts behelyettesítést elvégezzük, majd a Z-transzformációt alkalmazzuk, akkor kapjuk, hogy 1 1 1 1 z z z 1⋅ z −1⋅ Z{ − ⋅ e −3⋅n⋅Ts } = Z{ − ⋅ (e −3⋅Ts ) n } = 13 ⋅ − 13 ⋅ = 3 z −1 3 3 3 3 3 z −1 z − e −3⋅( 0.1) z − e −3⋅Ts Ha most az algoritmus szerinti szorzást elvégezzük, akkor kapjuk, hogy 243
H(z) =
z −1 1 z z 1 1 z −1 1 1 − e −0.3 (3 ⋅ ) − 13 ⋅ = − ⋅ = ⋅( ) z z −1 3 3 z − e −3⋅(0.1) 3 z − e −0.3 z − e −3⋅(0.1)
10.3.4. Előrecsatolt differencia módszere z −1 Előrecsatolt differencia módszere az s = változócserét alkalmazzuk. Ts Példa
Adott a következő folytonos átviteli függvény és Ts = 0.1 : 1 H(z) = s+3 Ekkor kapjuk Ts 1 0.1 H(z) = = = z −1 z − 1 + 3 ⋅ Ts z − 0.7 +3 Ts 10.3.5 Visszacsatolt differencia módszere
Visszacsatolt differencia módszere az s =
z −1 változócserét alkalmazzuk. Ts ⋅ z
Példa
Adott a következő folytonos átviteli függvény és Ts = 0.1 : H(z) =
1 s+3
Ekkor kapjuk 1 ⋅z z ⋅ Ts 1 0.1 ⋅ z 13 = = = H(z) = z −1 z − 1 + 3 ⋅ z ⋅ Ts 1.3 ⋅ z − 1 z − 10 13 +3 Ts ⋅ z
Az előbbiekben ismertetett öt módszerrel kapott eredmény összehasonlítható, ha összehasonlítjuk a folytonos tartomány H(s) átviteli függvény moduluszát a diszkrét tartományban kapott ötféle H(z) átviteli függvénnyel moduluszával. Megjegyzendő, hogy a módszer megválasztása egy adott feladat típusától is függ. Az Impulzus invariancia módszere nagyon jó megközelítés lehet ha elég kicsi a mintavételezési periódus, míg a Tustin módszer és az Egységugrás invariancia módszere jó egyezést mutat a folytonos rendszer karakterisztikáival. Tudjuk, hogy a mintavételezési 1 törvény alapján, az f s = mintavételezési frekvenciára igaz kell legyen, hogy Ts f s > 2 ⋅ f m ahol az f m a mintavételezendő jel legnagyobb frekvenciájú összetevőjének frekvenciája a Fourier sorbafejtésben. A gyakorlatban nem választhatunk akármilyen nagy mintavételezési frekvenciát mert figyelembe kell vegyük a számítási kapacitásokat (gyorsaság, tároló képesség). Ha a H(s)-nek komplex pólusai is vannak 244
akkor, a mintavételezett rendszer dinamikája módosul ha a komplex a ± j ⋅ b pólus imaginárius része és a mintavételezési periódus között fennáll a következő összefüggés: π 1 = ⋅b Ts 2 Ha H(s) zérusainak és pólusainak különbsége nulla, akkor bármely mintavételezési periódust választunk, akkor a diszkrét rendszer esetében is a különbség nulla. Ha a H(s) pólusainak és zérósainak különbsége nem nulla akkor a diszkrét rendszernek új zérósai lesznek és ezeknek a száma egyenlő a nem nulla különbséggel. Megjegyzés: Ha z = e s⋅Ts transzformációt alkalmazzuk, akkor az s-síkbeli pólusokat ugyanolyan dinamikát biztosító diszkrét pólusokba transzformálja a z-sikban. Példa
Adott a következő folytonos rendszer: ⎛− 2 0 ⎞ ⎛ 0⎞ ⎟⎟ x ( t ) + ⎜⎜ ⎟⎟ ⋅ u ( t ) x& ( t ) = ⎜⎜ ⎝ 0 − 1⎠ ⎝1⎠ y( t ) = (0 1) ⋅ x ( t ) ⎛ 0⎞ a. Határozzuk meg a rendszer kimenetét ha u(t)=0 és x (0) = ⎜⎜ ⎟⎟ ⎝1⎠ b. Határozzuk meg az előző pontban adott feltételek mellett a diszkrét rendszer y[n ] kimentét c. Hasonlítsuk össze a folytonos és diszkrét kimenetet
a. A Laplace transzformációt használva felírhatjuk, hogy X(s) = (s ⋅ I − A) −1 ⋅ x (0)
Kiszámítjuk a rendszer fundamentális mátrixát:
(s ⋅ I − A) −1
⎛ 1 ⎜ = ⎜s+ 2 ⎜ 0 ⎜ ⎝
⎞ 0 ⎟ ⎟ 1 ⎟ ⎟ s +1⎠
Így az állapotvektor felírható mint ⎛ 1 ⎜ X(s) = ⎜ s + 2 ⎜ 0 ⎜ ⎝
⎛ e − 2⋅t tr . ⎯inverz ⎯ ⎯Laplace ⎯⎯ ⎯ → e A⋅t = ⎜⎜ ⎝ 0
0 ⎞ ⎟ e − t ⎟⎠
⎞ 0 ⎟ ⎛ 0⎞ ⎛ 0 ⎞ ⎟⋅⎜ ⎟ = ⎜ 1 ⎟ 1 ⎟ ⎜⎝ 1 ⎟⎠ ⎜ ⎟ ⎝ s +1⎠ ⎟ s +1⎠
245
⎛ 0 ⎞ ⎛ 0 ⎞ x ( t ) = ⎜⎜ − t ⎟⎟ ⇒ y( t ) = (0 1) ⋅ ⎜⎜ − t ⎟⎟ = e − t ; ⎝e ⎠ ⎝e ⎠
t>0
b. Az ismert összefüggések alapján, amelyeket úgy kaptunk, hogy a bemenet két egymás utáni mintavétel között állandó marad, felírhatjuk, hogy Φ=e
Ts
⎛ e − 2⋅ t Ψ = ∫ ⎜⎜ 0⎝ 0
A⋅Ts
⎛ e −2⋅Ts = ⎜⎜ ⎝ 0
0 ⎞⎟ e −Ts ⎟⎠
Ts 0 ⎛ 0 ⎞ ⎛ ⎞ 0 ⎞⎟ ⎛ 0 ⎞ ⎟⎟ ⋅ ⎜ ⎟ ⋅ dt = ∫ ⎜⎜ − t ⎟⎟ ⋅ dt = ⎜⎜ − Ts −t ⎟ ⎜ 1 ⎟ − + e e 1 e ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ 0
ekkor a következő diszkrét állapotegyenleteket kapjuk x[(n + 1) ⋅ Ts ] = Φ ⋅ x[n ⋅ Ts ] + Ψ ⋅ u[n ⋅ Ts ] y[n ⋅ Ts ] = (0 1) ⋅ x[n ⋅ Ts ] + (0) ⋅ u[n ⋅ Ts ] Vagyis ⎛ e −2⋅Ts 0 ⎛ ⎞ 0 ⎞⎟ ⎜ x[(n + 1) ⋅ Ts ] = ⎜ ⋅ ⋅ + x [ n T ] s − T ⎜ − e s + 1⎟⎟ ⋅ u[n ⋅ Ts ] −Ts ⎟ ⎜ 0 e ⎝ ⎠ ⎠ ⎝ y[n ⋅ Ts ] = (0 1) ⋅ x[n ⋅ Ts ] + (0) ⋅ u[n ⋅ Ts ] és a megfelelő kezdeti feltételek x 1[n ⋅ Ts ] = x 1 ( t ) |t =n⋅Ts x 2 [n ⋅ Ts ] = x 2 ( t ) |t =n⋅Ts
c. A folytonos és diszkrét kimenet közötti eltérés az, hogy a diszkrét kimenet a mintavételezési periódus ( Ts ) függvénye. Példa
Adott a következő átviteli függvény H(s) =
4 ⋅ s + 11 2
s + 7 ⋅ s + 10
Határozzunk meg két diszkrét H(z) átviteli függvényt amelyek a folytonos rendszert írják le. Először az impulzus invariancia módszerét használjuk az átviteli függvény felírására. Ekkor 246
H(s) =
4 ⋅ s + 11 s 2 + 7 ⋅ s + 10
=
1 3 + s+2 s+5
Innen a súlyfüggvény h ( t ) = e −2⋅t + 3 ⋅ e −5⋅t
és a t = n ⋅ Ts behelyettesítés után kapjuk, hogy h (n ⋅ Ts ) = e −2⋅n⋅Ts + 3 ⋅ e −5⋅n⋅Ts = (e −2⋅Ts ) n + 3 ⋅ (e −5⋅Ts ) n majd ebből Z{h (n ⋅ Ts )} = H(z) =
Ts ⋅ z
z − e −2⋅Ts
+
3 ⋅ Ts ⋅ z
z − e −5⋅Ts
Másodszor az egységugrás invariancia módszerét használjuk az átviteli függvény felírására. Ekkor H(s) 4 ⋅ s + 11 0.5 0.6 1.1 = = − − + s s+2 s+5 s s ⋅ (s 2 + 7 ⋅ s + 10) Ennek inverz Laplace transzformációja h ( t ) = (−0.6) ⋅ e −5⋅t − (0.5) ⋅ e −2⋅t + 1.1
és a t = n ⋅ Ts behelyettesítés után kapjuk, hogy h (n ⋅ Ts ) = ( −0.6) ⋅ e −5⋅n⋅Ts − (0.5) ⋅ e −2⋅n⋅Ts + 1.1 = (−0.6) ⋅ (e −5⋅Ts ) n − (0.5) ⋅ (e −2⋅Ts ) n + 1.1 majd ebből Z{h (n ⋅ Ts )} = H1 (z) = Innen H(z) =
(−0.6) ⋅ z z − e −5⋅Ts
+
(−0.5) ⋅ z z − e −2⋅Ts
+
(1.1) ⋅ z z −1
z − 1 (−0.6) ⋅ z (−0.5) ⋅ z (1.1) ⋅ z ⋅( + + ) z z −1 z − e −5⋅Ts z − e −2⋅Ts
A mintavételezési periódus megválasztásával elérhető hogy a folytonos és diszkrét modellek ugyanazon a dinamikájú rendszert írják le. 10.3.6. Megközelítő deriváló módszer
Kiszámítjuk egy folytonos y( t ) jel deriváltját a t = n ⋅ Ts pontban. Itt Ts a mintavételezési periódus. Ekkor
247
y((n + 1) ⋅ Ts ) − y(n ⋅ Ts ) d y( t ) |t =n⋅Ts ≈ dt Ts kifejezést kapjuk. Ez egy megközelítés csupán s a megközelítés egyszerűsége miatt könnyen használható, de a pontossága nem minden esetben elfogadható.
Példa
Egy rendszert a következő egyenletrendszer ír le: d y ( t ) + a ⋅ y( t ) = b ⋅ u ( t ) dt ahol y(t) a kimenő, míg u(t) a bemenő jel. 1. A homogén egyenlet megoldása y( t ) = e − a⋅t ⋅ y(0) ha t ≥ 0 ahol y(0) a kezdeti feltétel. 2. Most a derivált helyett egy megközelítő kifejezést használunk. Ekkor a homogén egyenletet felírjuk mint: y((n + 1) ⋅ Ts ) − y(n ⋅ Ts ) + a ⋅ y(n ⋅ Ts ) = 0 Ts vagyis egyszerűsítve y(n + 1) − y(n ) + a ⋅ y(n ) = 0 vagy az ekvivalens forma Ts y[n ] − y[n − 1] + a ⋅ y[n − 1] = 0 Ts Ezt a formát felírjuk: y[n ] = (1 − a ⋅ Ts ) ⋅ y[n − 1] Ez egy rekurzív egyenlet amelynek megoldása y[n ] = (1 − a ⋅ Ts ) n ⋅ y[0] ha n ≥ 0 3. Ha most felírjuk az 1. pontban kapott folytonos megoldást Taylor sorba fejtve kapjuk: Ha t = n ⋅ Ts és y(n ⋅ Ts ) -t mint y(n) jelöljük és figyelembe véve az exponenciális függvény Taylor sorbafejtését akkor felírjuk: y(n ) = e −a⋅n⋅Ts ⋅ y(0) = (1 −
a ⋅ Ts a 2 ⋅ Ts2 + − L) n ⋅ y(0) 1! 2!
Ha Ts sokkal kisebb mint 1 akkor a Ts egynél nagyobb hatványai elhanyagolható mennyiségek lesznek. Így a kapott megoldás formája 248
y(n ) = (1 − a ⋅ Ts ) n ⋅ y(0) ha n ≥ 0 Tehát az előbbi megjegyzéseket figyelembe véve a folytonos és a mintavételezett forma megoldása azonos. Ez egy elsőrendű rendszer esetében levont következtetés. Példa
Egy rendszert a következő egyenletrendszer ír le: d2 dt 2 és a kezdeti értékek y(0);
Tudjuk, hogy
y( t ) + a ⋅
d y( t ) + b ⋅ y( t ) = c ⋅ u ( t ) dt
d y(0) . dt
y((n + 1) ⋅ Ts ) − y(n ⋅ Ts ) d és y( t ) |t =n⋅Ts ≈ dt Ts d d y( t ) |t =( n +1)⋅Ts − y( t )|t =n⋅Ts 2 d dt y( t ) |t =n⋅Ts = dt 2 Ts dt
d2 dt 2
y( t ) |t =n⋅Ts =
y((n + 2) ⋅ Ts ) − 2 ⋅ y((n + 1) ⋅ Ts ) + y(n ⋅ Ts ) Ts2
A kapott megközelítő egyenlet: y((n + 2) ⋅ Ts ) − 2 ⋅ y((n + 1) ⋅ Ts ) + y(n ⋅ Ts ) Ts2
+a⋅
y((n + 1) ⋅ Ts ) − y(n ⋅ Ts ) + b ⋅ y( n ) = c ⋅ u ( n ) Ts
Ezt az egyenletet átírhatjuk, ha n → n − 2 időbeni transzlációt alkalmazunk. A kapott egyenlet: y(n ) + (a ⋅ Ts − 2) ⋅ y(n − 1) + (1 − a ⋅ Ts + b ⋅ Ts2 ) ⋅ y(n − 2) = c ⋅ Ts2 ⋅ u (n − 2) Ami a kezdeti feltételeket illeti: Szükségük van az y(0) és y(1) értékekre vagyis y(0) mellett y(Ts ) értékére. Ezt kiszámíthatjuk az y(Ts ) − y(0) d y ( 0) = dt Ts
egyenletből ahol
d y(0) adott érték. Innen következik dt d y(Ts ) = Ts ⋅ y(0) + y(0) = y(1) dt
249
Ez a megoldás mutatja, hogy ez az út járható de az eszközölt megközelítések, a kezelhetőség érdekében a hiba nagyságát növelik. Amint láthattuk, ez nem más mint a Tustin módszer időtartományban való értelmezése. 10.3.7. Mintavételek közötti állandó bemenet módszere
Induljunk ki a következő MIMO folytonos állapotegyenletekből: x& ( t ) = A ⋅ x ( t ) + B ⋅ u ( t ) y( t ) = C ⋅ x ( t ) + D ⋅ u ( t )
Ha t = t 0 pillanati kezdeti értéket figyelembe vesszük, akkor t > t 0 -ra az egyenletrendszer megoldását a következő függvény adja: x(t) = e
A⋅( t − t 0 )
t
⋅ x ( t 0 ) + ∫ e A⋅( t −τ) ⋅ B ⋅ x (τ) ⋅ dτ t > t 0 t0
Legyen most t 0 = n ⋅ Ts és t = n ⋅ Ts + Ts . Mivel az állapotvektort figyelembe véve, a kimenet minden Ts után változik ezért a k értékét mintavétel között úgy vehetjük, hogy a kimenet konstans értékű. Ezt úgy is értelmezhetjük, hogy u ( t ) = u[n ⋅ Ts ] ha n ⋅ Ts ≤ t < [n + 1] ⋅ Ts és így eljutunk egy módszerhez amellyel egy folytonos rendszerből egy ekvivalens diszkrét modellhez jutunk. Az előbbi egyenletből kapjuk, hogy: x (n ⋅ Ts + Ts ) = e A⋅Ts ⋅ x (n ⋅ Ts ) +
n⋅Ts + Ts A⋅( n⋅Ts + Ts − τ)
∫e
⋅ B ⋅ x (τ) ⋅ dτ t > t 0
n⋅Ts
Bevezetjük a következő jelöléseket (figyelembe véve, hogy az integrálási intervallumban a bemenet állandó): n⋅Ts + Ts A⋅( n⋅Ts + Ts − τ)
∫e
⋅ B ⋅ dτ = Ψ;
n⋅Ts
e A⋅Ts = Φ; n ⋅ Ts + Ts − τ = λ akkor kapjuk, hogy: 0
Ψ = −∫e Ts
A⋅λ
Ts
⋅ B ⋅ dλ = ∫ e A⋅λ ⋅ B ⋅ dλ 0
250
Így az állapotegyenleteink a következő formát vesznek fel: x (n ⋅ Ts + Ts ) = Φ ⋅ x (n ⋅ Ts ) + Ψ ⋅ u (n ⋅ Ts ) y(n ⋅ Ts ) = C ⋅ x (n ⋅ Ts ) + D ⋅ u (n ⋅ Ts )
vagy egyszerűsített formában: x[n + 1] = Φ ⋅ x[n ] + Ψ ⋅ u[n ]
(10.3.7.1)
y[n ] = C ⋅ x[n ] + D ⋅ u[n ]
Példa
Adott a következő folytonos állapot egyenletrendszer: ⎛0 1 ⎞ ⎛ 0⎞ d ⎟⎟ ⋅ x ( t ) + ⎜⎜ ⎟⎟ ⋅ u ( t ) x ( t ) = ⎜⎜ dt ⎝ 0 − 1⎠ ⎝1⎠ y( t ) = (1 0) ⋅ x ( t ) Írjuk fel a rendszer diszkrét átviteli függvényét a mintavételek közötti konstans bemenet módszerével. Hogy felírhassuk a Ψ és a Φ mátrixokat szükségünk van az e A⋅t mátrixra, amelyet itt az inverz Laplace módszerrel számítunk ki. −1 ⎛1 ⎛ s −1 ⎞ ⎟⎟ } = L−1{⎜ s e A⋅t = L−1{(s ⋅ I − A) −1} = L−1{⎜⎜ ⎜0 ⎝ 0 s + 1⎠ ⎝ Innen következik, hogy ⎛ t 1 − e −t ⎞ ⎟ e A⋅t = ⎜⎜ −t ⎟ 0 e ⎝ ⎠
1 ⎞ s⋅(s +1) ⎟ } 1 ⎟ s +1 ⎠
Ekkor kiszámíthatjuk: Ts
⎛ λ 1 − e −λ ⎞ ⎛ 0 ⎞ ⎟ ⋅ ⎜ ⎟ ⋅ dλ Ψ = ∫ ⎜⎜ −λ ⎟ ⎜ 1 ⎟ 0 e ⎠ ⎝ ⎠ 0⎝ Ha Ts = 1 akkor ⎛ e −1 ⎞ ⎟ Ψ = ⎜⎜ −1 ⎟ 1 e − ⎝ ⎠ ⎛ 1 1 − e −1 ⎞ ⎟ Φ = ⎜⎜ −1 ⎟ e ⎝0 ⎠
251
ahol Φ a diszkrét rendszer mátrix, míg Ψ pedig a bemeneti mátrix. A diszkrét rendszer modell felírható mint: ⎛ x 1[n + 1] ⎞ ⎛ 1 1 − e −1 ⎞ ⎛ x 1[n ] ⎞ ⎛ e −1 ⎞ ⎟⋅⎜ ⎟ ⋅ u[n ] ⎜⎜ ⎟⎟ = ⎜ ⎟⎟ + ⎜ ⎜ ⎜ e −1 ⎟⎠ ⎝ x 2 [n ] ⎠ ⎜⎝1 − e −1 ⎟⎠ ⎝ x 2 [n + 1] ⎠ ⎝ 0 ⎛ x [n ] ⎞ y[n ] = (1 0) ⋅ ⎜⎜ 1 ⎟⎟ ⎝ x 2 [n ] ⎠ 10.4. Diszkrét állapotegyenletek
Adott egy mintavételezett (diszkrét) rendszermodell. A diszkrét állapotváltozót úgy tekinthetjük, mint olyan változót amely szükséges és elégséges ahhoz, hogy meghatározzuk a rendszer kimenetét valamint a következő állapotát egy ismert bemenőjel függvényében. Ha x[k ⋅ Ts ] a rendszer állapotvektora tehát a diszkrét rendszer állapotvektorának értéke a t = k ⋅ Ts időpillanatban, akkor a k egy egész szám, valamint a Ts a mintavételezési periódus. A diszkrét rendszer állapotegyenleteit felírjuk mint: x[(k + 1) ⋅ Ts ] = f ( x[k ⋅ Ts ], u[k ⋅ Ts ]) y[(k ) ⋅ Ts ] = g ( x[k ⋅ Ts ], u[k ⋅ Ts ])
(10.4.1)
A legtöbb esetben az állapot mint egy késleltető elem kimenete jelenik meg, hasonló módon mint az integrátor kimenete mint állapot a folytonos rendszerek esetében. Ha a diszkrét rendszer lineáris, akkor állapotegyenleti felírhatók mint: x[(k + 1) ⋅ Ts ] = A[k ⋅ Ts ] ⋅ x[k ⋅ Ts ] + + B[k ⋅ Ts ] ⋅ u[k ⋅ Ts ] y[(k ) ⋅ Ts ] = C[k ⋅ Ts ] ⋅ x[k ⋅ Ts ] + + D[k ⋅ Ts ] ⋅ u[k ⋅ Ts ]
(10.4.2)
Ebben az esetben az A , B , C , D rendszermátrixok időben változó mátrixok. Ha a rendszer időben invariáns akkor az A , B , C , D mátrixok állandó mátrixok. Hasonlóan a folytonos rendszerekhez itt is felrajzolhatjuk a rendszer szimuláló diagramját és ez a 10.4.1. ábrán látható.
10.4.1. ábra 252
A K itt az úgynevezett késleltető operátor. Ez ugyanazt a szerepet játssza mint az integráló elem a folytonos rendszerek állapotteres szimuláló diagramjában. Máshol a K operátor helyett D (delay) operátort használok a szimulációs diagramokban. Példa
Adott a következő differencia egyenlet. y[k + 2] + a ⋅ y[k + 1] + b ⋅ y[k ] = u[k ] A mintavételezési periódust, mivel nincs gyakorlati jelentősége ebben az esetben, tekintjük mint Ts = 1 ezáltal egyszerűsítjük a leírási módszereket. Bevezetjük a fázistérnek megfelelő következő fázisváltozó jelöléseket:
y[k ] = x 1[k ] y[k + 1] = x1[k + 1] = x 2 [k ] Így a következő állapotegyenleteket kapjuk: 1 ⎞ ⎛ x 1[k ] ⎞ ⎛ 0 ⎞ ⎛ x 1[k + 1] ⎞ ⎛ 0 ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟ ⋅ u[k ] ⎟⎟ ⋅ ⎜⎜ ⎝ x 2 [k + 1] ⎠ ⎝ − b − a ⎠ ⎝ x 2 [k ] ⎠ ⎝ 1 ⎠ ⎛ x [k ] ⎞ y[k ] = (1 0) ⋅ ⎜⎜ 1 ⎟⎟ ⎝ x 2 [k ] ⎠ Itt x 1[k ] és x 2 [ k ] a rendszer állapotváltozói amit a szimulációs diagramok késleltető kimeneti elemei adják.
Példa
Induljunk ki egy diszkrét SISO rendszer diszkrét átviteli függvényéből és írjuk fel a diszkrét állapotegyenleteket. Legyen az átviteli függvény egy résztörtekre bontott forma: n c Y(z) n c i H(z) = =∑ ⇒ Y (z) = (∑ i ) ⋅ U (z) U(z) i =1 z − λ i i =1 z − λ i Ha Z −1 transzformációt alkalmazunk akkor kapjuk, hogy: n
y[k ] = ∑ c i ⋅ x i [k ] i =1
ahol x i [k ] eleget kell tegyen az x i [k + 1] = λ i ⋅ x i [k ] + u[k ]
differencia egyenletnek (lásd egyenként a résztörteket). Ebben az esetben az állapotegyenleteket felírhatjuk mint:
253
⎛ x 1 [k + 1] ⎞ ⎛ λ 1 ⎜ ⎟ ⎜ ⎜ x 2 [k + 1] ⎟ ⎜ 0 ⎜ L ⎟=⎜ M ⎜ ⎟ ⎜ ⎜ x [k + 1] ⎟ ⎜ 0 ⎝ n ⎠ ⎝
0 ⎞ ⎛ x 1 [ k ] ⎞ ⎛ 1⎞ ⎟ ⎜ ⎟ ⎟ ⎜ L 0 ⎟ ⎜ x 2 [ k ] ⎟ ⎜ 1⎟ + ⋅ u[k ] ⋅ O M ⎟ ⎜ L ⎟ ⎜M⎟ ⎟ ⎜ ⎟ ⎟ ⎜ L λ n ⎟⎠ ⎜⎝ x n [k ] ⎟⎠ ⎜⎝1⎟⎠
0
L
λ2 M 0
y[k ] = (c1 c 2
⎛ x 1[ k ] ⎞ ⎜ ⎟ ⎜ x 2 [k ] ⎟ L cn ) ⋅ ⎜ L ⎟ ⎜ ⎟ ⎜ x [k ] ⎟ ⎝ n ⎠
vagy vektorjelölést használva: x[k + 1] = Λ ⋅ x[k ] + B ⋅ u[k ] y[k ] = C ⋅ x[k ] Ha a diszkrét átviteli függvény számlálójának és nevezőjének ugyanaz a fokszáma, akkor a D nem zérós mátrix. A Λ egy átlós mátrix és a főátló elemei a diszkrét átviteli függvény nevezőjének (diszkrét karakterisztikus egyenlet) gyökei és ezeket diszkrét sajátértékeknek nevezzük. A C mátrix elemeit kiszámíthatjuk a c i = (z − λ i ) ⋅ H(z) | z =λi módszerrel. Mindezek igazak, ha a rendszer sajátértékei egyedi gyökei a diszkrét karakterisztikus egyenletnek. Azt már észrevehettük, hogy az átviteli függvényt mint n darab elsőrendű tag segítségével írtuk fel, ezért, akárcsak a folytonos rendszerek esetében, a szimulációs diagram n elsőrendű diagramok párhuzamos kapcsolásából áll. Példa
Keressük meg az A , B , C , D mátrixokat egy olyan diszkrét rendszer esetében amelynek az átviteli függvénye 4 ⋅ z 3 − 12 ⋅ z 2 + 13 ⋅ z − 7 H(z) = (z − 1) 2 ⋅ (z − 2) A diszkrét átviteli függvényt felírhatjuk mint: H(z) =
c1 (z − 1)
2
+
c3 c2 + + d0 (z − 1) (z − 2)
ahol d 0 = lim H(z) = 4 z→∞
c1 = (z − 1) 2 ⋅ H(z) | z =1 = 2 d [(z − 1) 2 ⋅ H(z)] | z =1 = 1 dz c 3 = (z − 2) ⋅ H(z) | z =1 = 3 c2 =
Ekkor felírhatjuk, hogy: 254
Y(z) =
2 ⋅ U(z) (z − 1)
2
+
U (z) 3 ⋅ U (z) + + 4 ⋅ U ( z) = 2 ⋅ X1 (z ) + X 2 ( z ) + 3 ⋅ X 3 ( z ) + 4 ⋅ U ( z) (z − 1) (z − 2)
Mivel látjuk, hogy X 2 (z) ⇒ x 1[k + 1] − x 1[k ] = x 2 [k ] . z −1 Ezek alapján az állapotegyenleteket felírjuk mint: X1 ( z) =
⎛0⎞ ⎛1 1 0⎞ ⎜ ⎟ ⎜ ⎟ x[k + 1] = J ⋅ x[k ] + B ⋅ u[k ] ⇔ J = ⎜ 0 1 0 ⎟; B = ⎜ 1 ⎟; C = (2 1 3); d 0 = 4 y[k ] = C ⋅ x[k ] + d 0 ⋅ u[k ] ⎜1⎟ ⎜ 0 0 2⎟ ⎝ ⎠ ⎝ ⎠
Ennek a rendszernek megfelelő szimulálási diagram a 10.4.2. ábrán látható:
10.4.2. ábra Ehhez hasonló példákra még visszatérünk. A MIMO rendszerek esetében a H(z) mátrixot használhatjuk az állapotteres leírásra . Itt ez a módszer nem annyira előnyös mint a SISO rendszerek esetében. Példa
Határozzuk meg az állapotegyenleteket ( A , B , C , D mátrixokat) a 10.4.3. ábrán látható diagram segítségével leírt MIMO rendszer esetében.
10.4.3. ábra 255
Láthatjuk, hogy a MIMO rendszer ténylegesen egy két bement két kimenetű rendszer. Innen felírhatjuk, az átvitel függvényekre ismert szabályok szerint, hogy: Y1 (z) =
z 1 ⋅ U1 ( z ) + ⋅ U 2 (z) (z + 1) ⋅ (z + 2) z+2
Y1 (z) =
z2 ⋅ U1 ( z ) + 4 ⋅ U 2 ( z ) (z + 1) ⋅ (z + 3)
Ha ezt a z ⎛ ⎜ ⎛ Y1 (z) ⎞ ⎜ (z + 1) ⋅ (z + 2) ⎜⎜ ⎟⎟ = z2 ⎝ Y1 (z) ⎠ ⎜⎜ ⎝ (z + 1) ⋅ (z + 3)
1 ⎞ ⎟ z + 2 ⎟ ⎛ U1 ( z ) ⎞ ⎛H ⎟⎟ = H(z) ⋅ U(z) = ⎜⎜ 11 ⋅ ⎜⎜ ⎟ U (z) ⎝ H 21 4 ⎟ ⎝ 2 ⎠ ⎠
H12 ⎞ ⎟ ⋅ U(z) H 22 ⎟⎠
formában írjuk fel, akkor a H(z) a MIMO rendszer átviteli mátrixa. Innen következik, hogy: Y1 (z) = − Y1 (z) =
1 2 1 ⋅ U1 (z) + ⋅ U1 (z) + ⋅ U 2 (z) z +1 z+2 z+2 1 2
z +1
⋅ U1 ( z) −
9 2
z+3
⋅ U1 ( z ) + U1 ( z ) + 4 ⋅ U 2 ( z )
Innen meg : 0 ⎞ ⎛ x 1[k ] ⎞ ⎛ 1 ⎛ x 1 [k + 1] ⎞ ⎛ − 1 0 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎜ x 2 [k + 1] ⎟ = ⎜ 0 − 2 0 ⎟ ⋅ ⎜ x 2 [k ] ⎟ + ⎜ 2 ⎜ x [k + 1] ⎟ ⎜ 0 0 − 3 ⎟⎠ ⎜⎝ x 3 [k ] ⎟⎠ ⎜⎝ − 92 ⎝ 3 ⎠ ⎝
0⎞ ⎟ ⎛ u [k ] ⎞ 1 ⎟ ⋅ ⎜⎜ 1 ⎟⎟ u [k ] 0 ⎟⎠ ⎝ 2 ⎠
⎛ x1[k ] ⎞ ⎟ ⎛ 0 0 ⎞ ⎛ u 1[ k ] ⎞ ⎛ y1[k ] ⎞ ⎛ − 1 1 0 ⎞ ⎜ ⎟⎟ ⋅ ⎜ x 2 [k ] ⎟ + ⎜⎜ ⎜⎜ ⎟⎟ = ⎜⎜ 1 ⎟⎟ ⎟⎟ ⋅ ⎜⎜ ⎝ y 2 [k ] ⎠ ⎝ 2 0 1 ⎠ ⎜ x [k ] ⎟ ⎝ 1 4 ⎠ ⎝ u 2 [k ] ⎠ ⎝ 3 ⎠
10.5. A diszkrét állapotegyenlet rendszer megoldása
Adott a következő diszkrét állapotegyenlet rendszer: x[n + 1] = A ⋅ x[n ] + B ⋅ u[n ] y[n ] = C ⋅ x[n ] + D ⋅ u[n ]
(10.5.1)
Most a Z-transzformációt alkalmazva a következő mátrixformát kapjuk:
256
z ⋅ X(z) − z ⋅ x[0] = A ⋅ X(z) + B ⋅ U(z)
és innen (z ⋅ I − A) ⋅ X(z) = z ⋅ x[0] + B ⋅ U(z)
ahol I a rendszermátrixnak dimenzionálisan megfelelő egységmátrix míg x[0] a kezdeti állapotvektor. Ebből az egyenletből következik, hogy: X (z ) = z ⋅ (z ⋅ I − A ) −1 ⋅ x[0 ] + (z ⋅ I − A ) −1 ⋅ B ⋅ U (z )
(10.5.1.a)
A kimenetre kapott Z-transzformáció pedig: Y(z) = C ⋅ X(z) + D ⋅ U(z) = C ⋅ (z ⋅ (z ⋅ I − A) −1 ⋅ x[0] + (z ⋅ I − A) −1 ⋅ B ⋅ U(z) + D ⋅ U(z)
Ha most x[0] = 0, akkor következik, hogy Y(z) = C ⋅ X(z) + D ⋅ U(z) = (C ⋅(z ⋅ I − A) −1 ⋅ B + D ⋅ U(z)
Innen felírjuk a diszkrét átviteli függvény és a diszkrét állapotegyenletek mátrixai közötti összefüggést akkor ha a rendszer SISO: H(z) =
Y(z) = C ⋅ (z ⋅ I − A) −1 ⋅ B + D U(z)
(10.5.2)
Ha a rendszer egy MIMO rendszer akkor a be/kimenetek kapcsolatára felírhatjuk a következő átviteli függvényeket H ij (z) =
Yi (z) ; és igaz, hogy U k (z) = 0 ha k ≠ j. Ezek alapján a H ij racionális U j (z)
függvényeket egy mátrixba szervezzük, és H(z) =
Y(z) U(z)
formában írjuk fel hol Y(z) a kimenő jelek Z-transzformáltjainak oszlopmátrixa, míg U(z) a bemenő jelek Z-transzformáltjainak oszlopmátrixa. Erre egy példa 1 ⎛ ⎜ (z + 2) ⋅ (z + 3) H(z) = ⎜ ⎜ 0 ⎜ ⎝
1 ⎞ ⎟ (z + 1) ⋅ (z + 2) ⋅ (z + 3) ⎟ . z +1 ⎟ ⎟ (z + 2) ⋅ (z + 3) ⎠
Ez egy két bemenetű és két kimenetű diszkrét rendszer átviteli függvénye.
257
10.5.1. Diszkrét állapotegyenletek általános megoldása
Kiindulunk az x[n + 1] = A ⋅ x[n ] + B ⋅ u[n ]
(10.5.1.1)
vektor differencia egyenletből. Ha ismerjük a kezdeti állapotokat, vagyis x[0] értékeit, n = 0 diszkrét pillanatban, akkor a következő összefüggést kapjuk: x[1] = A ⋅ x[0] + B ⋅ u[0]
Hasonlóan járunk el és felírjuk n = 1 pillanatban, hogy x[2] = A ⋅ x[1] + B ⋅ u[1]
Ha most kiejtjük az x[1] -et akkor kapjuk, hogy x[2] = A ⋅ (A ⋅ x[0] + B ⋅ u[0]) + B ⋅ u[1] = A 2 ⋅ x[0] + A ⋅ B ⋅ u[0] + B ⋅ u[1] .
Most pedig, n = 2 esettel folytatva kapjuk, hogy x[3] = A ⋅ x[2] + B ⋅ u[2] = A ⋅ (A 2 ⋅ x[0] + A ⋅ B ⋅ u[0] + B ⋅ u[1]) + B ⋅ u[2] = = A 3 ⋅ x[0] + A 2 ⋅ B ⋅ u[0] + A ⋅B ⋅ u[1] + B ⋅ u[2] A fenti gondolatmenetet követve a következő általános megoldást kapjuk: n −1
x[n ] = A ⋅ x[0] + ∑ A n −1−k ⋅ B ⋅ u[k ] n
k =0
Ebben az összefüggésben jelöljük: Φ[n ] = A n
(10.5.1.2)
(10.5.1.3)
mátrix az állapot-tranziciós mátrix vagy más néven a rendszer fundamentális mátrixa. Ennek kiszámítása alapvető, ha a diszkrét rendszer megoldását keressük. A fundamentális mátrix segítségével most felírjuk a következő általános megoldási formákat. n −1
x[n ] = Φ[n ] ⋅ x[0] + ∑ Φ[n − 1 − k ] ⋅ B ⋅ u[k ] k =0
n −1
(10.5.1.4)
y[n ] = C ⋅ Φ[n ] ⋅ x[0] + ∑ C ⋅ Φ[n − 1 − k ] ⋅ B ⋅ u[k ] + D ⋅ u[n ] k =0
Ez a diszkrét állapotegyenletek teljes megoldása. Összehasonlítva a folytonos rendszerek állapotegyenleteinek megoldásával láthatjuk, hogy míg a folytonos 258
esetben a fundamentális (állapot-tranziciós) mátrixot a Φ ( t ) = e A⋅t kifejezés adja, addig a diszkrét rendszerek esetében mindez Φ[n ] = A n a diszkrét állapot-tranziciós mátrix. Úgy folytonos mint diszkrét rendszer esetében a Fundamentális mátrix kiszámítása egy alapvető feladat. Hasonlítsuk össze most a Z-transzformációval kapott 10.5.1.a összefüggéssel, vagyis az X (z ) = z ⋅ (z ⋅ I − A ) −1 ⋅ x[0 ] + (z ⋅ I − A ) −1 ⋅ B ⋅ U (z )
megoldást az előbbi, időtartománybeli megoldással, vagyis: n −1
x[n ] = A n ⋅ x[0] + ∑ A n −1−k ⋅ B ⋅ u[k ] k =0
kifejezéssel. Megállapíthatjuk, hogy a Fundamentális mátrixot felírhatjuk mint: Φ[n ] = Z −1{z ⋅ (z ⋅ I − A) −1}
(10.5.1.5)
A Fundamentális mátrix tulajdonságai
•
Egy bemenet nélküli diszkrét rendszer esetében felírhatjuk, hogy x[n ] = Φ[n ] ⋅ x[0] . Ha meg a kezdeti feltétel zéró, akkor a x[0] = Φ[0] ⋅ x[0] összefüggésből következik, hogy Φ[0] = I.
•
A Φ[n ] = A n és ha n = n 1 + n 2 akkor felírjuk, hogy Φ[n 1 + n 2 ] = Φ[n 1 ] ⋅ Φ[n 2 ]
•
A Φ[n ] = A n és ha n = −m akkor felírjuk, hogy Φ[−m] = Φ −1[m] .
Ha most nem x[0] a kezdeti állapotvektor, hanem x[n 0 ⋅ Ts ] és a rendszermátrix időfüggő, akkor keressük az állapot-tranziciós mátrixot (és ennek a kiszámítási módozatait) amelyre érvényes, hogy: Φ[n 0 , n 0 ] = I n . Adott a következő homogén diszkrét állapotegyenlet rendszer (differenciaegyenlet rendszer): x[(n + 1) ⋅ Ts ] = A[n ⋅ Ts ] ⋅ x[n ⋅ Ts ] és a kezdeti feltétel x[n 0 ⋅ Ts ] akkor első lépésként felírhatjuk, hogy 259
x[(n 0 + 1) ⋅ Ts ] = A[n 0 ⋅ Ts ] ⋅ x[n 0 ⋅ Ts ] és hasonló módon x[(n 0 + 2) ⋅ Ts ] = A[(n 0 + 1) ⋅ Ts ] ⋅ A[n 0 ⋅ Ts ] ⋅ x[n 0 ⋅ Ts ] Így folytatva kapjuk, hogy x[n ⋅ Ts ] =
n −1
∏ A[n ⋅ Ts ] ⋅ x[n 0 ⋅ Ts ];
k =n 0
n > n0
Tudjuk, hogy x[n ⋅ Ts ] = Φ[(n , n 0 )] ⋅ Ts ] ⋅ x[n 0 ⋅ Ts ] és ebből következik, hogy: Φ[(n, n 0 )] ⋅ Ts ] =
n −1
∏ A[n ⋅ Ts ];
k =n 0
n > n0
(10.5.1.6)
Abban az esetben ha A egy időben nem változó mátrix (konstans mátrix) akkor igaz, hogy Φ[(n , n 0 )] ⋅ Ts ] = A ( n −n 0 ) ;
n > n0
(10.5.1.7)
Ez az eredmény egyezik az előzőekben felírt megoldással. Ez egyezik a folytonos rendszerek esetében felírt összefüggésekkel, vagyis a konstans rendszerek esetében a megoldás a kezdeti időpillanattól eltelt időintervallumtól függ, míg időben változó rendszerek esetében emellett a megoldás még függ a megfigyelés pillanatától is. Így időben variáns rendszerek (változó) esetében a rendszermátrix felírható, mint A[n ⋅ Ts ] = A 0 + A1[n ⋅ Ts ]
(10.5.1.8)
ahol A 0 egy konstans mátrix, és többféle módszer létezik ezek meghatározására. Hasonlóan a folytonos időben változó rendszerekhez, itt is felírhatjuk az állapotátviteli mátrix hasonló tulajdonságait. •
1. Φ[(n 0 , n 0 ) ⋅ Ts ] = I
•
2. Φ[(n 2 , n 1 ) ⋅ Ts ] ⋅ Φ[(n1 , n 0 ) ⋅ Ts ] = Φ[(n 2 , n 0 ) ⋅ Ts ]
•
3. Φ[(n1 , n 2) ⋅ Ts ] = Φ −1[(n 2 , n1 ) ⋅ Ts ]
Konstans rendszermátrix esetében meg igaz, hogy: •
4. Φ[(n + n 0 ) ⋅ Ts ] = Φ[n ⋅ Ts ] ⋅ Φ[n 0 ⋅ Ts ]
•
5. Φ[n ⋅ Ts ] = Φ −1[− n ⋅ Ts ] 260
Példa
Adott a következő diszkrét rendszer: ⎛−1 0 ⎞ ⎛ 0⎞ ⎟⎟ ⋅ x[n ] + ⎜⎜ ⎟⎟ ⋅ u[n ] x[n + 1] = ⎜⎜ ⎝ 0 − 2⎠ ⎝1⎠ y[n ] = (0 1) ⋅ x[n ] ⎛0⎞ Számítsuk k a rendszer állapotváltozóit és a kimenetét, ha x[0] = ⎜⎜ ⎟⎟ és u[n ] = 0 . ⎝1⎠ Tudjuk, hogy a rendszer általános megoldását felírhatjuk mint: n −1
x[n ] = A n ⋅ x[0] + ∑ A n −1−k ⋅ B ⋅ u[k ] . k =0
n
Az adott bemenetre x[n ] = A ⋅ x[0] összefüggést kapjuk. Iteratív módszerrel kezdjük a megoldást felírni: ⎛ −1 0 ⎞ ⎛0⎞ ⎛ 0 ⎞ ⎟⎟ ⋅ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ x[1] = A ⋅ x[0] = ⎜⎜ ⎝ 0 − 2⎠ ⎝1⎠ ⎝ − 2⎠ ⎛ −1 0 ⎞ ⎛ 0 ⎞ ⎛0⎞ ⎟⎟ ⋅ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ x[2] = A ⋅ x[1] = ⎜⎜ ⎝ 0 − 2⎠ ⎝ − 2⎠ ⎝ 4⎠ ⎛ −1 0 ⎞ ⎛0⎞ ⎛ 0 ⎞ ⎟⎟ ⋅ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ x[3] = A ⋅ x[2] = ⎜⎜ − 0 2 ⎝ ⎠ ⎝ 4⎠ ⎝ − 8⎠ LLLLL Azért mert a rendszermátrix átlós forma, ezért ⎛ (−1) n 0 ⎞⎟ A n = ⎜⎜ (−2) n ⎟⎠ ⎝ 0 és így az állapotegyenlet megoldása ⎛ (−1) n x[n ] = ⎜⎜ ⎝ 0 Ellenőrzésképpen kiszámítjuk a
0 ⎞⎟ ⎛ 0 ⎞ ⋅ ⎜⎜ ⎟⎟; n ≥ 0 (−2) n ⎟⎠ ⎝ 1 ⎠
⎛0⎞ ⎛1 x[0] = A 0 ⋅ ⎜⎜ ⎟⎟ = ⎜⎜ ⎝1⎠ ⎝0 ⎛ −1 x[1] = A1 ⋅ x[0] = ⎜⎜ ⎝0 ⎛1 x[2] = A 2 ⋅ x[0] = ⎜⎜ ⎝0
⎛0⎞ = ⎜⎜ ⎟⎟ ⎝1⎠ 0 ⎞ ⎛0⎞ ⎛ 0 ⎞ ⎟⋅⎜ ⎟ = ⎜ ⎟ − 2 ⎟⎠ ⎜⎝ 1 ⎟⎠ ⎜⎝ − 2 ⎟⎠
0⎞ ⎛0⎞ ⎟⋅⎜ ⎟ 1 ⎟⎠ ⎜⎝ 1 ⎟⎠
0⎞ ⎛0⎞ ⎟⋅⎜ ⎟ 4 ⎟⎠ ⎜⎝ 1 ⎟⎠
⎛0⎞ = ⎜⎜ ⎟⎟ ⎝ 4⎠ ⎛ − 1 0 ⎞ ⎛ 0⎞ ⎛ 0 ⎞ ⎟⎟ ⋅ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ x[3] = A 3 ⋅ x[0] = ⎜⎜ ⎝ 0 − 8⎠ ⎝ 1 ⎠ ⎝ − 8⎠ 261
Az előbbiekben meghatározott Z-transzformációt használva, a következő összefüggést kaptuk: X (z ) = z ⋅ (z ⋅ I − A ) −1 ⋅ x[0 ] + (z ⋅ I − A ) −1 ⋅ B ⋅ U (z ) és ha u[n ] = 0 , akkor: 0 ⎞ ⎛ z 0⎞ ⎛ −1 0 ⎞ ⎛ z + 1 ⎟⎟ − ⎜⎜ ⎟⎟ = ⎜⎜ ⎟ (z ⋅ I − A) = ⎜⎜ z + 2 ⎟⎠ ⎝ 0 z ⎠ ⎝ 0 − 2⎠ ⎝ 0
(z ⋅ I − A) −1
z+2 ⎛ ⎜ (z + 1) ⋅ (z + 2) =⎜ 0 ⎜ ⎜ (z + 1) ⋅ (z + 2) ⎝
⎛ 1 ⎜ X(z) = z ⋅ ⎜ z + 1 ⎜⎜ 0 ⎝
0 ⎞ ⎛ 1 ⎟ (z + 1) ⋅ (z + 2) ⎟ ⎜⎜ z + 1 = z +1 ⎟ ⎜ ⎜ 0 (z + 1) ⋅ (z + 2) ⎟⎠ ⎝
⎞ 0 ⎟ ⎟ 1 ⎟ ⎟ z + 2⎠
⎞ 0 ⎟ ⎛0⎞ ⎛ 0 ⎞ ⎟⋅⎜ ⎟ = ⎜ z ⎟ 1 ⎟ ⎜⎝ 1 ⎟⎠ ⎜ ⎟ ⎝z + 2⎠ ⎟ z + 2⎠
Ennek az inverz transzformációja pedig: ⎛ 0 ⎞ x[n ] = ⎜⎜ n⎟ ⎟; n ≥ 0 ⎝ (−2) ⎠ Innen ⎛ 0⎞ ⎛ 0 ⎞ ⎛ 0⎞ ⎛ 0 ⎞ x[0] = ⎜⎜ ⎟⎟; x[1] = ⎜⎜ ⎟⎟; x[2] = ⎜⎜ ⎟⎟; x[3] = ⎜⎜ ⎟⎟; ⎝1⎠ ⎝ − 2⎠ ⎝ 4⎠ ⎝ − 8⎠
z ⋅ (z ⋅ I − A) −1
⎛ z ⎜ = ⎜ z +1 ⎜⎜ 0 ⎝
⎞ 0 ⎟ ⎟ z ⎟ ⎟ z + 2⎠
Innen meg: ⎛ (−1) n Φ[n ] = ⎜⎜ ⎝ 0
0 ⎞⎟ ; n≥0 (−2) n ⎟⎠
és ez a rendszer fundamentális mátrixa. 10.5.2. Állapotteres transzformációk
Vezessük be a következő transzformációt: q[n ] = M ⋅ x[n ]
(10.5.2.1)
Ebben az összefüggésben M a transzformációs mátrix. Innen felírhatjuk, hogy: x[n ] = M −1 ⋅ q[n ] 262
Ha az eredeti egyenletrendszer x[n + 1] = A ⋅ x[n ] + B ⋅ u[n ] y[n ] = C ⋅ x[n ] + D ⋅ u[n ]
akkor a transzformációt alkalmazva kapjuk, hogy M −1 ⋅ q[n + 1] = A ⋅ M −1 ⋅ q[n ] + B ⋅ u[n ] vagyis q[n + 1] = M ⋅ A ⋅ M −1 ⋅ q[n ] + M ⋅ B ⋅ u[n ] . Hasonló módon kapjuk a kimenő jel transzformációját, vagyis y[n ] = C ⋅ M −1 ⋅ q[n ] + D ⋅ u[n ] Ezek alapján ha H
régi
(z ) = C ⋅ (z ⋅ I − A ) −1 ⋅ B + D
akkor az új átviteli függvény H új (z) = C ⋅ M −1 ⋅ (z ⋅ I − M ⋅ A ⋅ M −1 ) −1 ⋅ M ⋅ B + D H új (z) = C ⋅ M −1 ⋅ (z ⋅ M ⋅ M −1 − M ⋅ A ⋅ M −1 ) −1 ⋅ M ⋅ B + D = = C ⋅ M −1 ⋅ (M ⋅ (z ⋅ I − A) ⋅ M −1 ) −1 ⋅ M ⋅ B + D Hogy ezt felírjuk, figyelembe vettük, a mátrixoperációk következő összefüggéseit: I = M ⋅ M −1 ;
(E ⋅ F ⋅ G ) −1 = G −1 ⋅ F −1 ⋅ E −1
Azt kapjuk, hogy H új (z) = C ⋅ M −1 ⋅ (M ⋅ (z ⋅ I − A) ⋅ M −1 ) −1 ⋅ M ⋅ B + D = = C ⋅ M −1 ⋅ M ⋅ (z ⋅ I − A) −1 ⋅ M −1 ⋅ M ⋅ B + D = = C ⋅ (z ⋅ I − A) −1 ⋅ B + D Ebből meg következik, hogy H új (z) = H régi (z) és ennek a nagyon fontos következménye, hogy a rendszer sajátértékei (pólusai) és a transzformált rendszer sajátértékei (pólusai) azonosak. Ha a rendszer kezdeti feltételei z[0] akkor a transzformált rendszer kezdeti feltételeit felírhatjuk mint
263
q[0] = M ⋅ x[0] ahonnan M −1 ⋅ q[0] = x[0] . Ha az eredeti rendszer teljes megoldását felírjuk mint: X (z ) = z ⋅ (z ⋅ I − A ) −1 ⋅ x[0 ] + (z ⋅ I − A ) −1 ⋅ B ⋅ U (z ) Y(z) = C ⋅ X(z) + D ⋅ U(z)
akkor a transzformált rendszer teljes megoldása a z-tartományban: Q(z) = z ⋅ (z ⋅ I − M ⋅ A ⋅ M −1 ) −1 ⋅ q[0] + (z ⋅ I − M ⋅ A ⋅ M −1 ) −1 ⋅ M ⋅ B ⋅ U(z) Y(z) = C ⋅ M −1 ⋅ Q(z) + D ⋅ U(z) Ha az M mátrix az A sajátvektoraiból képzett mátrix, akkor M ⋅ A ⋅ M −1 egy átlós mátrix és ekkor M -t modális mátrixnak nevezünk. Példa
Adott az y[n] − 2 ⋅ y[n − 1] + 3 ⋅ y[n − 3] = 4 ⋅ u[n]
differenciaegyenlet. Írjuk fel az ennek megfelelő diszkrét állapotteres egyenleteket. Jelöljük:
x 1[n ] = y[n − 3] x 2 [n ] = y[n − 2] x 3 [n ] = y[n − 1]
ekkor felírjuk x 1[n + 1] = y[n − 2] = x 2 [n ] x 2 [n + 1] = y[n − 1] = x 3 [n ] x 3 [n + 1] = 2 ⋅ y[n − 1] − 3 ⋅ y[n − 3] + 4 ⋅ u[n ] = 2 ⋅ x 3 [n ] − 3 ⋅ x 1[n ] + 4 ⋅ u[n ] A kimenet pedig y[n ] = 2 ⋅ x 3 [n ] − 3 ⋅ x 1[n ] + 4 ⋅ u[n ] Ekkor a következő állapotegyenleteket kapjuk: ⎛ 0 ⎜ x[n + 1] = ⎜ 0 ⎜− 3 ⎝ y[n ] = ( − 3
1 0⎞ ⎛ 0⎞ ⎜ ⎟ ⎟ 0 1 ⎟ ⋅ x[n ] + ⎜ 0 ⎟ ⋅ u[n ] ⎜ 4⎟ 0 2 ⎟⎠ ⎝ ⎠
0 2) ⋅ x[n ] + (4) ⋅ u[n ]
264
Példa
Adott a H(z) =
2 ⋅ z +1 3
z + 3⋅ z2 + 2 ⋅ z +1
átviteli függvény. Írjuk fel az ennek megfelelő állapotegyenleteket. Felírjuk, hogy Y(z) ⋅ (z 3 + 3 ⋅ z 2 + 2 ⋅ z + 8) = (2 ⋅ z + 1) ⋅ U(z) Innen következik az y[n ] + 2 ⋅ y[n + 1] + 3 ⋅ y[n + 2] + y[n + 3] = 2 ⋅ u[n + 1] + u[n ] Az előző feladatnak megfelelően kapjuk, hogy 1 0 ⎞ ⎛0 ⎛ 0⎞ ⎜ ⎟ ⎜ ⎟ x[n + 1] = ⎜ 0 0 1 ⎟ ⋅ x[n ] + ⎜ 0 ⎟ ⋅ u[n ] ⎜ − 1 − 2 − 3⎟ ⎜1⎟ ⎝ ⎠ ⎝ ⎠ y[n ] = (1 2 0) ⋅ x[n ] + (0) ⋅ u[n ]
Modális mátrix
Akárcsak a folytonos rendszerek esetében, egy adott diszkrét állapottérből áttérhetünk egy új állapottérbe. Az itt használt transzformációt leírhatjuk mint: x[k ⋅ Ts ] = M ⋅ q[k ⋅ Ts ] Így felírhatjuk, hogy: M ⋅ q[(k + 1) ⋅ Ts ] = A ⋅ M ⋅ q[k ⋅ Ts ] + B ⋅ u[k ⋅ Ts ] y[k ⋅ Ts ] = C ⋅ M ⋅ q[k ⋅ Ts ] + D ⋅ u[k ⋅ Ts ] Innen q[(k + 1) ⋅ Ts ] = M −1 ⋅ A ⋅ M ⋅ q[k ⋅ Ts ] + M −1 ⋅ B ⋅ u[k ⋅ Ts ] y[k ⋅ Ts ] = C ⋅ M ⋅ q[k ⋅ Ts ] + D ⋅ u[k ⋅ Ts ] és ha M −1 ⋅ A ⋅ M = Λ , ahol az Λ mátrix egy átlós forma, a főátlón a rendszer sajátértékei, akkor ezt nevezzük normál formának a diszkrét rendszerek esetében. Az előbb felírt x[k ⋅ Ts ] = M ⋅ q[k ⋅ Ts ] transzformációt használjuk a kezdeti feltételek transzformációjának kiszámítására is.
265
11. Rendszerek minőségi követelményei Minden szabályozási rendszer legalább két részből áll, a szabályzó és a szabályozott rendszerből. A szabályzási rendszerekben különböző szabályzó körök mentén információ áramlik. A szabályzási rendszerek vizsgálatának, tervezésének az a célja , hogy a szabályzórendszer olyan információfeldolgozást és szabályzó információalkotást tudjunk szervezni, amely a szabályzási rendszert a céljainak megfelelő állapotok megtartása és az állapotváltozások véghezvitelének irányába vezeti. Tehát a szabályzási rendszer vizsgálta és tervezése minden gyakorlati esetben a szabályzási cél meghatározásával kezdődik. Ez sokszor nem egyértelműen meghatározott feladat. A szabályzási rendszert a külső zavarok, a belső konstrukció, a megvalósítás, az időbeli változásokból adódó eltérések miatt bizonyos mértékig mindig ismeretlennek kell tekintenünk. A szabályzási cél elérése érdekében szükséges a rendszer minden bemenete {u ( t )} állapotváltozója {x ( t )} és kimenete {y( t )} , megismerése, hogy az előre meghatározott követelményeket el lehessen érni. A meghatározott cél elérése érdekében meg kell határozni az szabályzás minőségének értékelési mértékeit. Egy kiértékelhetőség magába foglalja a rendszer működésével kapcsolatos valamennyi érdeket. A szabályzási cél elérésének alapvető követelménye a megfigyelhetőség és a szabályozhatóság .Ezek a fogalmak arra vonatkoznak, hogy a rendszer egy adott kezdőállapotból elirányítható a kívánt végállapotba és ez alatt a változás alatt a rendszer állapota megfigyelhető. Ha rendszer legalább egy állapotváltozója, az idő növekedésével minden határon túl nő, akkor a rendszert instabilnak nevezzük. Ha a magára hagyott rendszer állapotváltozásai az idő növekedésével elenyésznek, vagy nem növekednek egy előre megadott értéken túl, akkor a rendszert stabilnak nevezzük. A rendszerek működésének célja a stabilitás biztosítása a megfigyelhetőség és szabályozhatóság eldöntése. Ha most a rendszer működése stabil, akkor ha megfigyelhető és szabályozható akkor a szabályzás tervezésének feladata a legmegfelelőbb, optimális szabályozási útvonal megkeresése. Mivel a valós fizikai, mechanikai, kémiai stb. folyamatok matematikai leírása sohasem lehet tökéletes, így a modellek hiányossága miatt, az eredményeket mindig objektív bizonytalanságok kísérik. Azt is tudjuk, hogy mérni is csak adott pontossággal lehet és ez is hozzájárul a bizonytalansági mértékéhez. Egy szabályozható és megfigyelhető rendszer eszményi optimális szabályzási algoritmusa olyan szabályzási rendszert kell eredményezzen amelynek érzékenysége elenyészően kicsi a tűrőképessége pedig megfelelően nagy a kiindulási ismeretek és paraméterek mérési bizonytalanságaival és a rendszer egyes elemeinek meghibásodásaival szemben. 11.1. Megfigyelhetőség, szabályozhatóság
A megfigyelhetőséget és irányíthatóságot R.E. Kalman vezette be. Egy szabályzási rendszer átviteli függvénye, vagy átviteli mátrixa csak akkor adja meg teljesen és helyesen a rendszer viselkedését akkor, és csakis akkor ha a rendszer szabályozható és megfigyelhető. •
Egy rendszer állapota az X állapottartományban akkor teljesen állapotszabályozható ha egy adott t 0 időponthoz tartozó x ( t 0 ) állapot átvihető 266
bármely x ( t1 ) állapotba, valamely véges t1 − t 0 idő alatt. Hasonló meghatározása van az úgynevezett kimeneti szabályozhatóságnak amikor az elérendő érték a y( t1 ) . •
Egy külső kényszer nélküli rendszer teljesen megfigyelhető egy [ t 0 , t1 ] intervallumban, ha t 0 és t1 között, az X tartományban lévő valamennyi x ( t ) állapot meghatározható az y(t) kimenetek valamennyi, a [ t 0 , t 1 ] intervallumban elért és ismert (mért) értékekből.
A szabályozhatósággal és megfigyelhetőséggel kapcsolatban két kérdés fontos: 1. Hogyan állapítható meg a rendszer megfigyelhetősége, szabályozhatósága? 2. Hogyan kell meghatározni azt a szabályzó hatást amely alkalmazásával a rendszer x ( t 0 ) állapotból x ( t1 ) állapotba kerül véges t1 − t 0 idő alatt? A gyakorlati rendszerek többsége eleve szabályozható és megfigyelhető de a külső zavaró hatások, a belső konstrukció, a kivitel az időbeli változásokból adódó eltérések miatt, bizonyos mértékig mindég ismeretlennek kell tekintsük a rendszerben lejátszódó folyamatokat. A megfigyelhetőség kérdése bizonyos megfontolások mellett általánosítható az identifikálhatóság fogalmával (minden megfigyelhető rendszer identifikálható). 11.1.1. Megfigyelhetőség
Legyen egy LTI, folytonos és dinamikus rendszer modellje (5.4.2) x& ( t ) = A ⋅ x ( t ) + B ⋅ u ( t ) y( t ) = C ⋅ x ( t ) + D ⋅ u ( t )
Az x ( t ) valós, nem zéró állapot megfigyelhető, ha a bemeneti u ( t ) vektor ismerete, és a kimeneti y( t ) vektor egy időtartamig történő mérése alapján meghatározható az állapotvektor x ( t 0 ) kezdő értéke. A megfigyelhetőség szükséges és elégséges feltétele, hogy a
QO
⎛ C ⎞ ⎜ ⎟ ⎜ C⋅A ⎟ =⎜ L ⎟ ⎜ ⎟ ⎜ C ⋅ A n −1 ⎟ ⎝ ⎠
(11.1.1.1)
megfigyelhetőségi mátrix rangja n-el egyenlő (n rendszer rangja, vagyis állapotainak száma) Ez azt jelenti, hogy a 11.1.1.1 Q O mátrixának van n darab egymástól
független oszlopvektora. Ha a rendszer megfigyelhető, akkor a kimeneti y( t ) vektor változásaiban
egymást
nem
megsemmisítő
viszonyban
megjelenik
az 267
x ( t ) állapotvektor minden elemének a hatása. A megfigyelhetőségi mátrix (11.1.1.1) k
felépítésében a C ⋅ A sorok egy 1 x n dimenziójú vektor. Példa
Adott a következő rendszer:
x& 1 = −2 ⋅ x1 + u x& 2 = −2 ⋅ x 2 + u y = x1 + x 2
Innen ⎛− 2 0 ⎞ ⎟⎟ és C ⋅ A = (− 2 − 2) C = (1 1) és A = ⎜⎜ 0 − 2 ⎝ ⎠ Így a megfigyelhetőségi mátrix 1 ⎞ ⎛ C ⎞ ⎛ 1 ⎟⎟ = ⎜⎜ ⎟⎟ Q O = ⎜⎜ ⎝ C ⋅ A ⎠ ⎝ − 2 − 2⎠ Ennek a mátrixnak a rangja egy. Így a rendszer nem megfigyelhető. Mivelhogy a két állapotváltozó változásának törvényszerűsége azonos és a kimenet meghatározásában azonos mértékben vesznek részt, így a kimenet megfigyelése alapján nem lehet meghatározni az állapotváltozók kezdőértékét, vagyis a rendszer nem megfigyelhető. A megfigyelhetőség kapcsolatot jelent az állapotváltozók és a kimenet között. A bemenet nem befolyásolja ezt a fajta kapcsolatot. Így a megfigyelhetőség fenti tesztje megfogalmazásához kiindulunk a következő SISO állapotteres egyenletből: x& ( t ) = A ⋅ x ( t ) y( t ) = C ⋅ x ( t ) és ennek van megoldása az x ( t 0 ) kezdeti feltételek mellett. Most a megfigyelhetőség meghatározását ismerve lássuk miként és mikor tudjuk az állapotvektorokat meghatározni ha ismerjük a kimeneteket. Egy rendszer teljesen megfigyelhető csak és csakis akkor ha x ( t 0 ) állapotvektor meg-határozható ha ismerjük a rendszer y(t) kimenetét minden t-re ha t 0 ≤ t ≤ t 1 . Az állapotegyenlet megoldása: x ( t 1 ) = e A⋅t1 ⋅ x ( t 0 ) y( t 1 ) = C ⋅ x ( t 1 )
vagy y( t 1 ) = C ⋅ e A⋅t1 ⋅ x ( t 0 ) és ha alkalmazzuk a Cayley-Hamilton tételt, amikor ismerjük a rendszer karakterisztikus polinomját, akkor kapjuk, hogy, 268
y( t 1 ) = (C ⋅ α 0 ⋅ I + C ⋅ α1 ⋅ A + C ⋅ α 2 ⋅ A 2 + L + C ⋅ α n −1 ⋅ A n −1 ) ⋅ x ( t 0 ) vagy n −1
y( t 1 ) = ∑ C ⋅ α j ⋅ A j ⋅ x ( t 0 ) j=0
vagy ⎛ C ⎞ ⎜ ⎟ ⎜ C⋅A ⎟ y( t 1 ) = (α 0 α1 α 2 L α n −1 ) ⋅ ⎜ C ⋅ A 2 ⎟ ⋅ x ( t 0 ) = ⎜ ⎟ M ⎜ ⎟ ⎜ C ⋅ A n −1 ⎟ ⎝ ⎠ = (α 0 α1 α 2 L α n −1 ) ⋅ Q O ⋅ x ( t 0 )
(11.1.1.2)
Itt az ismeretlen x ( t 0 ) . Ez egy n dimenziós vektor és a 11.1.1.2 egyenletrendszernek van megoldása ha a megfigyelhetőségi mátrix ( Q O ) fokszáma egyenlő a rendszer rendjével (most n-ed rendű a rendszer). •
A megfigyelhetőség invariáns a szimilarítás transzformációra nézve, mert a megfigyelhetőség rendszertulajdonság.
•
Ha a rendszer teljesen megfigyelhető, akkor a Q O mátrixnak n lineárisan független oszlopa van és ezek egy bázist képeznek (lehet az oszlopvektorok egy kombinációja is a bázis). Ennek a bázisnak segítségével kapjuk az új állapotteret amelyet megfigyelhető kanonikus formának nevezünk.
Példa
Határozd meg az összefüggést c1 és c 2 valós paraméterek között, hogy a következő LTI rendszer teljesen megfigyelhető legyen. ⎛ 1 − 2⎞ ⎛1⎞ ⎟⎟ ⋅ x ( t ) + ⎜⎜ ⎟⎟ ⋅ u ( t ) x& ( t ) = ⎜⎜ ⎝2 3 ⎠ ⎝ 0⎠ y = (c1 c 2 ) ⋅ x ( t )
Innen c1 ⎛ Q O = ⎜⎜ ⎝ c1 + 2 ⋅ c 2
⎞ ⎟ − 2 ⋅ c1 + 3 ⋅ c 2 ⎟⎠ c2
Hogy ennek rangja legyen kettő, szükséges, hogy c12 − c1 ⋅ c 2 + c 22 ≠ 0
vagyis ha
269
c1 =
c 2 ± c 22 − 4 ⋅ c 22
2 akkor a rendszer nem teljesen megfigyelhető.
Ennek az egyedüli valós megoldása. c1 = c 2 = 0 . A levonható következtetés az, hogy a rendszer nagyon kivételes esetben nem megfigyelhető. 11.1.2. Szabályozhatóság
Legyen egy LTI folytonos dinamikus rendszer modellje x& ( t ) = A ⋅ x ( t ) + B ⋅ u ( t ) y( t ) = C ⋅ x ( t ) + D ⋅ u ( t )
Az x ( t ) valós, nem zéró állapot szabályozható, ha a rendszer az x ( t 0 ) kezdeti állapotból az x ( t 1 ) végállapotba (legyen ez 0) hozható u ( t ) korlátozatlan bemenő jel segítségével véges t 1 − t 0 idő alatt. Egy SISO LTI rendszer megoldását fel tudjuk írni mint: x(t) = e
A⋅t
t
⋅ x ( t 0 ) + ∫ e A⋅( t −τ) ⋅ B ⋅ u (τ) ⋅ dτ t0
ez alapján a t = t 1 esetben felírhatjuk, hogy: x (t1 ) = 0 = e
A⋅t1
t1
⋅ x ( t 0 ) + ∫ e A⋅( t1 −τ) ⋅ B ⋅ u (τ) ⋅ dτ t0
Ha ezt a mátrixegyenletet balról megszorozzuk e − A⋅t1 mátrixxal, akkor kapjuk, hogy: t1
− x ( t 0 ) = ∫ e − A⋅τ ⋅ B ⋅ u (τ) ⋅ dτ t0
A Cayley-Hamilton módszert alkalmazva azt kapjuk, hogy t1
− x ( t 0 ) = ∫ ⋅ (α 0 (τ) ⋅ I + α1 (τ) ⋅ A + α 2 (τ) ⋅ A 2 + L + α n −1 (τ) ⋅ A n −1 )B ⋅ u (τ) ⋅ dτ t0
vagy − x(t 0 ) =
t1 n −1
n −1
t1
t 0 j=0
j=0
t0
n −1 j ∫ ∑ A α j (τ) ⋅ B ⋅ u (τ) ⋅ dτ = ∑ A ⋅ B ⋅ ∫ α j (τ) ⋅u (τ) ⋅ dτ
270
t1
Ha bevezetjük a következő jelölést: v j ( t 1 ) = ∫ α j (τ) ⋅ u (τ) ⋅ dτ;
j = 0,1, L , n − 1
t0
(skaláris mennyiség), és így kapjuk ⎛ v1 ⎞ ⎟ ⎜ ⎜ v2 ⎟ (11.1.2.1) − x ( t 0 ) = (B A ⋅ B A 2 ⋅ B L A n −1 ⋅ B) ⋅ ⎜ v 3 ⎟ ⎟ ⎜ ⎜ M ⎟ ⎜v ⎟ ⎝ n −1 ⎠ A teljes szabályozhatóság azt jelenti, hogy létezik-e olyan u (τ) bemenő vektor (implicit bennefoglaltatnak a v j értékekben), hogy kiindulva a kezdeti állapotból, a
rendszert az állapottér origójába vezesse. A 11.1.2.1 vektoregyenleteket kifejtve arra a következtetésre jutunk (lévén az előbbi egyenletrendszer lineáris), hogy az LTI rendszer megfigyelhetőség szükséges és elégséges feltétele, hogy a Q C = (B A ⋅ B A 2 ⋅ B L A n −1 ⋅ B)
(11.1.2.2)
a szabályozhatósági 11.1.2.2 mátrix rangja legyen n, vagyis található legyen n egymástól lineárisan független oszlopvektor amely a Q C oszlopai. Ha a rendszernek csak egy bemenete van, akkor a rendszer szabályozhatóságának szükséges és elégséges feltétele, hogy a Q C mátrix ne legyen szinguláris. A szabályozható rendszerekben, minden állapotváltozó befolyásolható a bemeneteleken keresztül. Példa
Adott a következő rendszer állapotegyenletei x& 1 = − x 1 + u x& 2 = x1 − 2 ⋅ x 2 + u A szabályozhatósági mátrix felírásához szükségesek: ⎛ − 1 0 ⎞ ⎛ 1⎞ ⎛ − 1⎞ ⎛1⎞ ⎟⎟ ⋅ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ vektorok. B = ⎜⎜ ⎟⎟; és a A ⋅ B = ⎜⎜ ⎝ 1 − 2 ⎠ ⎝ 1⎠ ⎝ − 1⎠ ⎝1⎠ Így ⎛1 − 1⎞ ⎟⎟ Q C = ⎜⎜ ⎝1 − 1⎠ Mivel ennek a Q C mátrixnak a rangja egy, ezért a rendszer nem szabályozható. MIMO rendszerek esetében is alkalmazható a teljes megfigyelhetőség és teljes szabályozhatóság elmélete. Ha több mint egy bemenet van, akkor beszélünk teljes szabályozhatóságról ha az összes állapot befolyásolható legalább egy bemenettel. Ha több mint egy kimenete van, akkor a rendszer teljesen megfigyelhető ha minden 271
állapot megfigyelhető legalább egy kimeneten keresztül. A Q O és Q C mátrixokat ugyanúgy képezzük mint SISO rendszerek esetében. 11.1.3. Diszkrét rendszerek minőségi követelményei
Diszkrét rendszerek esetében is meghatározzuk ezeket a fogalmakat. Egy diszkrét rendszer teljesen szabályozható akkor és csakis akkor, ha minden lehetséges x[k 1 ] állapotvektorra létezik egy u[k ] bemenő vektor, 0 ≤ k ≤ k 1 , úgy, hogy egy rendszer amely zéró kezdeti feltételek mellett elvezethető x[k 1 ] állapotba. Ezt úgy is értelmezhetjük, hogy egy szabályozható rendszer elvezethető az állapottér origójába. Felépíthetjük a következő egyenletsort: x[k + 1] = A ⋅ x[k ] + B ⋅ u[k ] L x[1] = A ⋅ x[0] + B ⋅ u[0] x[2] = A ⋅ x[1] + B ⋅ u[1] = A 2 ⋅ x[0] + A ⋅ B ⋅ u[0] + B ⋅ u[1] x[3] = A ⋅ x[2] + B ⋅ u[2] = A 3 ⋅ x[0] + A 2 ⋅ B ⋅ u[0] + + A ⋅ B ⋅ u[1] + B ⋅ u[2] LL x[k ] = A k ⋅ x[0] + A k −1 B ⋅ u[0] + A k −2 ⋅ x[1] + L + B ⋅ u[k − 1] Legyen 0 a végső állapotvektor (origó). Innen következik, hogy ⎛ u[0] ⎞ ⎜ ⎟ ⎜ u[1] ⎟ 0 = A k ⋅ x[0] + [A k −1 ⋅ B A k −2 ⋅ B L A ⋅ B B] ⋅ ⎜ u[2] ⎟ ⎜ ⎟ ⎜ L ⎟ ⎜ u[k − 1] ⎟ ⎝ ⎠
(11.1.3.1)
Ez egy egyenletrendszer amelyben az ismeretlen az u[0], u[1], ..., u[k-1] vagyis a vezérlési szekvencia amely az origóba viszi a rendszert. Ha a rendszer teljesen szabályozható akkor 11.1.3.1 rendszernek van egyértelmű megoldása. A rendszert felírhatjuk a következő formában ⎛ u[0] ⎞ ⎜ ⎟ ⎜ u[1] ⎟ − A k ⋅ x[0] = Q C ⋅ ⎜ u[2] ⎟ ahol ⎜ ⎟ ⎜ L ⎟ ⎜ u[k − 1] ⎟ ⎝ ⎠ Q C = [A k −1 ⋅ B A k −2 ⋅ B L A ⋅ B B]
(11.1.3.2) 272
Ennek a rendszernek van megoldása ha a Q C szabályozhatósági mátrix (11.1.3.2) rangja k. Teljes szabályozhatóságról beszélünk, ha k = n .
Egy diszkrét rendszer teljesen megfigyelhető akkor és csakis akkor ha y[k ] mikor 0 ≤ k ≤ K felhasználható, hogy meghatározzuk x[0] állapotot. Az u[k ] ismert szekvencia. Egy SISO rendszer esetében felírjuk x[k + 1] = A ⋅ x[k ] + B ⋅ u[k ] y[k ] = C ⋅ x[k ] y[0] = C ⋅ x[0] y[1] = C ⋅ x[1] = C ⋅ A ⋅ x[0] y[2] = C ⋅ x[2] = C ⋅ A 2 ⋅ x[0] LL y[k ] = C ⋅ A k ⋅ x[0] Innen felírjuk, hogy ⎛ y[0] ⎞ ⎛ C ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ y[1] ⎟ ⎜ C ⋅ A ⎟ ⎜ y[2] ⎟ = ⎜ C ⋅ A 2 ⎟ ⋅ x[0] ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ y[k ] ⎟ ⎜ ⋅ k ⎟ ⎝ ⎠ ⎝C A ⎠
(11.1.3.3)
A meghatározás szerint a teljes megfigyelhetőség azt jelenti, hogy a 11.1.3.3 egyenletrendszernek van megoldása és ez lehetséges ha a
QO
⎛ C ⎞ ⎜ ⎟ ⎜ C⋅A ⎟ = ⎜C ⋅ A2 ⎟ ⎜ ⎟ ⎜ L ⎟ ⎜C ⋅ Ak ⎟ ⎝ ⎠
(11.1.3.4)
diszkrét megfigyelhetőségi mátrix (11.1.3.4) rangja egyenlő n-el. Példa
Állapítsuk meg a következő diszkrét rendszer szabályozhatóságát és megfigyelhetőségét. A rendszer: x1[k + 1] = −2 ⋅ x1[k ] + 3 ⋅ u1[k ] + 2 ⋅ u 2 [k ] x 2 [k + 1] = −2 ⋅ x 2 [k ] + u 2 [k ] y1[k ] = x1[k ] y 2 [ k ] = 3 ⋅ x 1[ k ] − 2 ⋅ x 2 [ k ] 273
A rendszer egy diszkrét MIMO rendszer. Felírjuk, mindenek előtt, a rendszer állapotteres egyenleteit: ⎛− 2 0 ⎞ ⎛ 3 2⎞ ⎟⎟ ⋅ x[k ] + ⎜⎜ ⎟⎟ ⋅ u[k ] x (k + 1) = ⎜⎜ ⎝ 0 − 2⎠ ⎝0 1⎠ ⎛1 0 ⎞ ⎟⎟ ⋅ x[k ] y[k ] = ⎜⎜ ⎝3 − 2⎠
Ezek alapján felírjuk a Q O és Q C mátrixokat. ⎛⎛ 3 2⎞ ⎛ − 2 0 ⎞ ⎛ 3 2⎞⎞ ⎛ 3 2 − 6 − 4⎞ ⎟⎟ ⎜⎜ ⎟⎟ ⋅ ⎜⎜ ⎟⎟ ⎟⎟ = ⎜⎜ ⎟⎟ Q C = (B A ⋅ B) = ⎜⎜ ⎜⎜ 0 1 0 2 0 1 0 1 0 2 − − ⎝ ⎠ ⎝ ⎠ ⎝ ⎝ ⎠ ⎠ ⎠ ⎝
Ennek a mátrixnak a rangja kettő tehát a rendszer szabályozható Most felírjuk a megfigyelhetőségi mátrixot. 0 ⎞ ⎛ ⎞ ⎛ 1 ⎛1 0 ⎞ ⎟ ⎜ ⎟ ⎜ ⎜⎜ ⎟⎟ 3 2 − ⎛ C ⎞ ⎜ 3 2 − ⎜ ⎟ ⎟ ⎝ ⎠ ⎟⎟ = ⎜ Q O = ⎜⎜ =⎜ ⎟ ⎟ ⎝ C ⋅ A ⎠ ⎜ ⎛⎜ 1 0 ⎞⎟ ⋅ ⎛⎜ − 2 0 ⎞⎟ ⎟ ⎜ − 2 0 ⎟ ⎜⎜3 − 2⎟ ⎜ 0 − 2⎟⎟ ⎜ − 6 4 ⎟ ⎠ ⎝ ⎠⎠ ⎝ ⎝⎝ ⎠ Ennek a mátrixnak a rangja kettő tehát a rendszer megfigyelhető. A rendszer Kalman-féle felbontása
Mint egy összefoglaló a 11.1.1 ábrán láthatjuk egy általános rendszer egy felbontást a fentebb említett minőségi kritériumok alapján.
11.1.1 ábra 274
A rendszer szabályozhatóságának és megfigyelhetőségének szempontjából felvetődik a kérdés, hogy felosztható-e a rendszer oly módon, hogy a szabályozás csupán csak egy részére terjedjen ki vagy olyan módon, hogy csupán néhány , de nem minden állapotváltozó legyen megfigyelhető. Az eddigiekből következik, hogy minden rendszer négy rész-rendszerre osztható. Az első rendszer szabályozható de megfigyelhetetlen. A második rendszer szabályozható és megfigyelhető. A harmadik szabályozhatatlan és megfigyelhetetlen. A negyedik pedig szabályozhatatlan de megfigyelhető. Egy rendszer felbontása a fentebb leírt rendszertípusokra, különböző algoritmusok alkalmazásával valósítható meg. Ha a rendszermátrix átlós akkor az alrendszer szabályozhatósága és megfigyelhetősége eldönthető. Példa
Adott egy rendszer a következő állapotteres leírással: ⎛ x& 1 ⎞ ⎛ S1 0 0 ⎜ ⎟ ⎜ ⎜ x& 2 ⎟ ⎜ 0 S2 0 ⎜ x& ⎟ = ⎜ 0 0 S 3 ⎜ 3⎟ ⎜ ⎜ x& ⎟ ⎜ 0 0 0 ⎝ 4⎠ ⎝ y = (0 C 2 0 C 4 )
0 ⎞ ⎛ x1 ⎞ ⎛ b1 ⎞ ⎟ ⎜ ⎟ ⎜ ⎟ 0 ⎟ ⎜ x 2 ⎟ ⎜ b2 ⎟ ⋅ + ⋅ u(t) 0 ⎟ ⎜ x3 ⎟ ⎜ 0 ⎟ ⎟ ⎜ ⎟ ⎜ ⎟ S4 ⎟⎠ ⎜⎝ x 4 ⎟⎠ ⎜⎝ 0 ⎟⎠
ahol igaz, hogy S1 ≠ S2 ≠ S3 ≠ S4 . A rendszer állapotegyenleteiből az látható, hogy az első részrendszer szabályozható de nem megfigyelhető, a második részrendszer szabályozható és megfigyelhető, a harmadik részrendszer nem szabályozható és nem megfigyelhető s a negyedik megfigyelhető és nem szabályozható. Egy SISO rendszer akkor teljesen szabályozható és megfigyelhető, ha a rendszer pólusainak száma egyenlő a rendszer rendszámával. Ha a pólusok és zérósok közül egyesek semlegesítik egymást, akkor a rendszer nem szabályozható és nem teljesen megfigyelhető. A szabályozhatóság és megfigyelhetőség fogalma olyan eseteket próbál értelmezni amikor a szabályzó rendszerben létrejöhetnek olyan változások is amelyek külsőleg nem befolyásolhatóak vagy külsőleg nem észlelhetőek. 11.2. Érzékenység, Tűrőképesség (robusztusság)
A. Érzékenység
A rendszerek érzékenységi vizsgálatának az a feladata, hogy megbecsülje a rendszer paraméteri változásának hatását a szabályzásra. A szabályzás annál jobbnak tekinthető, minél kisebb az érzékenysége, vagyis minél kevésbé befolyásolja valamelyik paraméter vagy szerkezeti struktúra relatív változása a rendszer eredeti állapotát. A szabályzási rendszerekben a paramétereket az átviteli tényezőket és időállandókat általában állandónak vesszük. A környezeti és belső változások (melegedés, öregedés) következtében a paraméterek többé kevésbé változnak. Ezért meg kell állapítani, milyen módon reagál a szabályzási kör a paraméter vagy szerkezeti felépítés változásaira.
275
Az érzékenységet mint mennyiségileg meghatározható értéke 11.1.2 STk ( k ) =
k dT(k ) ⋅ T(k ) dk
(11.2.1)
ahol T(k) a legáltalánosabb esetben egy átviteli függvény, vagy egy rendszerállandó is lehet. Példa
Legyen egy szabályzó rendszer állandósult állapoti erősítése T=
K1 ⋅ K 1 + K2 ⋅ K
ahol, K1 = 10 ± 1; K 2 = 8 ± 1; K = 5; Határozzuk meg az állandósult állapoti erősítés érzékenységét a K1 és K 2 paraméterekre. Kiszámítjuk:
STK( K1 ) = 1
K1 dT(K1 ) ⋅ = T (K1 ) dK1
K1 K1 ⋅ K 1 + K2 ⋅ K
K1 ⋅ K d( ) 1 + K2 ⋅ K K 1 + K2 ⋅ K ⋅ = ⋅ =1 dK1 K 1 + K2 ⋅ K
Ez azt jelenti, hogy az állandósult állapoti erősítés arányosan változik a K1 erősítés változásával. K1 ⋅ K d( ) K 2 dT(K 2 ) K2 1 + K2 ⋅ K T(K 2 ) = ⋅ = SK ⋅ = 2 K1 ⋅ K T (K 2 ) dK 2 dK 2 1 + K2 ⋅ K =
K 2 ⋅ (1 + K 2 ⋅ K ) K2 ⋅ K − K12 ⋅ K 2 =− ⋅ 2 K1 ⋅ K 1 + K2 ⋅ K K1 ⋅ (1 + K 2 ⋅ K )
− 5 ⋅ K2 értéket. 1 + 5 ⋅ K2 Ekkor K 2 adott értékeire {7, 8, 9} ez az együttható a következő értékeket veszi fel:
A K = 5 értékre a STK( K 2 ) felveszi a − 2
5⋅7 = 0.972 1+ 5⋅7 5⋅8 = = 0.975 1+ 5⋅8 5⋅9 = 0.978 = 1+ 5⋅9
S TK( K=27) = 2
S TK( K=82 ) 2
S TK( K=29) 2
276
Ez azt jelenti, hogy az állandósult állapoti erősítés nem változik arányosan a K 2 erősítés változásával. B. Tűrőképesség (robusztus)
Egy szabályzási rendszer alapfeladata, hogy stabilan és időben végezze el a tervezett szabályzási eljárásokat. A tervezett és a valós állapotok között azonban rendszerint eltérések vannak mégpedig a •
A tervezésben alkalmazott matematikai modell pontatlanságai miatt
•
A paraméterek a rendszer elemeiben észlelhető pontatlanságok és időbeli változások miatt
•
A mérési pontatlanságok miatt
Az említett eltérések mértéke a probléma természetétől függ és csak hozzávetőlegesen becsülhető, de nem mérhető. Ezért tervezéskor nem lehet olyan eljárásokat tervezni, amelyek a minőségileg és mennyiségileg határozatlan változások hatásait az irányítási rendszerben semlegesítik. Egy megoldás a szabályzási rendszerben megjelenő változások iránti robusztusság növelése. A tűrőképesség növelésének leghatásosabb eszköze a negatív visszacsatolás. A robusztus tulajdonság részletes tanulmányozása nem tartozik ennek a könyvnek a témakörébe.
277
12. Összefoglaló rendszerelméleti feladatokhoz Ezt a fejezetet nem osztom alfejezetekre, mert ide eljutva, a fejezetben az előző fejezetekre épülő összegező példákat feladatokat találunk. Úgy is tekinthetjük mint egy a tananyagot átismétlő fejezet. A. Egy LTI diszkrét rendszer súlyfüggvényét felírhatjuk többféleképpen is, ezek közül a legjelentősebbeket ismertetem. 1. Súlyfüggvény lineáris, konstans együtthatós differencia egyenletből
Vegyünk egy differencia egyenletet. y[n ] + 3 ⋅ y[n − 1] + 2 ⋅ y[n − 2] = u[n ] y[−1] = y[−2] = 0 u[n ] = 1 [n ] Az egyenlet karakterisztikus egyenlete: r2 + 3⋅ r + 2 = 0 Ennek két gyöke a rendszer pólusai. Ezek r1 = −2; r2 = −1. Az egyenlet teljes megoldása tartalmazza a homogén egyenlet általános megoldását, plusz a nem homogén egyenlet egy partikuláris megoldását. A homogén egyenlet megoldása: y h [n ] = c1 ⋅ (−2) n + c 2 ⋅ (−1) n
A partikuláris megoldás: y p [n ] = c 3 és erre a differenciaegyenletből következik, hogy c3 + 3 ⋅ c3 + 2 ⋅ c3 = 1 ⇒ c3 =
1 6
A teljes megoldás y[n ] = c1 ⋅ (−2) n + c 2 ⋅ (−1) n + 16
a kezdeti feltételeket felhasználva, kapjuk: y[−1] = 0 = −c1 / 2 − c 2 + 16 y[−2] = 0 = c1 / 4 + c 2 +
1 6
⇒ c1 = 43 ; c 2 = − 12
Így a teljes megoldás y[n ] = 43 ⋅ (−2) n − 12 ⋅ (−1) n + 16
2. A diszkrét rendszerek súlyfüggvénye mint a Dirac jelre adott válasz
Ugyanabból a diszkrét egyenletből indulunk ki. Legyen 278
y[n ] + 3 ⋅ y[n − 1] + 2 ⋅ y[n − 2] = δ[n ] Mivel a partikuláris megoldás zéró, így a rendszer teljes megoldását felírjuk a diszkrét karakterisztikus egyenlet megoldásai alapján, hogy: h[n ] = c1 ⋅ (−2) n + c 2 ⋅ (−1) n
A differenciaegyenletből kapjuk a kezdeti feltételeket ismerve a diszkrét Dirac jel tulajdonságait. Így h[0] = 1 és h[1] = 0 − 3 ⋅ 1 − 2 ⋅ 0 = −3 . Ekkor h[0] = c1 + c 2 = 1
⇒ c1 = −1
h[1] = −c1 − 2 ⋅ c 2 = −3
c2 = 2
A teljes megoldás: h[n ] = −1 ⋅ (−2) n + 2 ⋅ (−1) n
Ha ez a rendszer súlyfüggvénye, akkor az egységugrásra adott választ felírhatjuk mint ennek a súlyfüggvény és az egységugrás diszkrét konvolutív szorzatát. y[n ] =
∞
∑ h[m] ⋅ 1 [n − m] =
m = −∞
∞
∑ ((−1) ⋅ (−2) m + 2 ⋅ (−1) m )
m =0
n
1 − ( −1) 1 − (−2) n y[n ] = ( −1) ⋅ ( ) + 2⋅( ); n ≥ 0 1 − (−1) 1 − (−2)
(12.1)
3. Diszkrét átviteli függvénnyel való leírás
y[n ] + 3 ⋅ y[n − 1] + 2 ⋅ y[n − 2] = u[n ] y[−1] = y[−2] = 0 Ennek a differencia egyenletnek megfelelő Z-transzformációt alkalmazva kapjuk: Y(z) + 3 ⋅ z −1 ⋅ Y(z) + 2 ⋅ z −2 ⋅ Y(z) = U(z)
Innen következik, hogy: H(z) =
z2 z2 + 3⋅ z + 2
=
z2 (z + 1) ⋅ (z + 2)
Ha most az egységugrásra adott választ akarjuk kiszámítani, akkor a z-síkban elemi törtekre bontjuk az átviteli függvényt, ismerve az egységugrás Z-transzformációját és ekkor kapjuk, hogy: z z ⋅ z2 Y (z) A B C Y(z) = H(z) ⋅ = ⇒ = + + z − 1 (z − 1) ⋅ (z + 2) ⋅ (z + 1) z z −1 z +1 z + 2 Innen kiszámítjuk az A,B,C együtthatókat, 279
A = 16 ; B = − 12 ; C =
4 3
És így az elemi törtek formájában kapjuk meg a kimenő jel-transzformáltját. Y(z) = 16 ⋅
z z z − 12 ⋅ + 64 ⋅ z −1 z +1 z+2
majd inverz Z-transzformációt alkalmazva, következik, hogy y[n ] = 43 ⋅ (−2) n − 12 ⋅ (−1) n + 16
3. Súlyfüggvény állapotteres leírásból
Adott
y[n ] + 3 ⋅ y[n − 1] + 2 ⋅ y[n − 2] = u[n ] y[−1] = y[−2] = 0
Jelöljük: x 1[n ] = y[n − 2] x 2 [n ] = y[n − 1] Ekkor fázisteres jelölést alkalmazunk x 1[n + 1] = y[n − 1] = x 2 [n ] x 2 [n + 1] = y[n ] = u[n ] − 3 ⋅ y[n − 1] − 2 ⋅ y[n − 2] = u[n ] − 3 ⋅ x 2 [n ] − 2 ⋅ x 1[n ] Innen felírjuk az állapotegyenleteket: 1 ⎞ ⎛ 0 ⎛0⎞ ⎟⎟ ⋅ x + ⎜⎜ ⎟⎟ ⋅ u[n ] x[n + 1] = ⎜⎜ ⎝ − 2 − 3⎠ ⎝1⎠ y[n ] = (− 2 − 3) ⋅ x[n ] + (1) ⋅ u[n ] Ennek a rendszernek a sajátértékei λ 1 = -1 és λ 2 = -2, tehát a rendszer instabil. A rendszer válaszát az egységugrás jelre a következő módon határozzuk meg: Az állapotegyenletek Z-transzformáltjait használva (11.5.1.a), felírjuk, hogy X(z) = z ⋅ (z ⋅ I − A) −1 ⋅ x (0) + (z ⋅ I − A) −1 ⋅ B ⋅ U(z) = −1
⎛ z −1 ⎞ ⎛ 0⎞ z ⎟⎟ ⋅ ⎜⎜ ⎟⎟ ⋅ = ⎜⎜ ⎝ 2 z + 3⎠ ⎝ 1 ⎠ z − 1 Itt a kezdeti állapotvektor x (0) = 0 . A kijelölt műveleteket elvégezve kapjuk, hogy:
280
z ⎞ ⎛ ⎟ ⎜ 2 ⎛ z + 3 1⎞ ⎛0⎞ z (z − 1) ⋅ (z + 3 ⋅ z + 2) ⎟ ⎜ ⎟⎟ ⋅ ⎜⎜ ⎟⎟ X(z) = ⎜⎜ = 2 ⎟ z2 ⎝ − 2 z ⎠ ⎝ 1 ⎠ (z − 1) ⋅ (z + 3 ⋅ z + 2) ⎜ ⎟ ⎜ 2 ⎝ (z − 1) ⋅ (z + 3 ⋅ z + 2) ⎠ A kimenő jelet kiszámíthatjuk mint:
z ⎛ ⎞ ⎜ ⎟ 2 z z2 ⎜ (z − 1) ⋅ (z + 3 ⋅ z + 2) ⎟ + = Y(z) = ( − 2 − 3) ⋅ ⎜ ⎟ z −1 z2 (z − 1) ⋅ (z 2 + 3 ⋅ z + 2) ⎜ ⎟ ⎜ (z − 1) ⋅ (z 2 + 3 ⋅ z + 2) ⎟ ⎝ ⎠ Innen pedig inverz Z-transzformációt alkalmazva, következik a diszkrét időtartományban a megoldás, vagyis y[n ] = 43 ⋅ (−2) n − 12 ⋅ (−1) n + 16
ha n ≥ 0
B. A súlyfüggvényből kiinduló rendszermodellek Adott a következő súlyfüggvény: h[n ] = ((−1) ⋅ (−2) n + 2 ⋅ (−1) n ) ⋅ 1 [n ]
Azt már láttuk (12.1), hogy a rendszer egységugrásra adott válasza 1 − ( −1) n 1 − (−2) n y[n ] = ( −1) ⋅ ( ) + 2⋅( ); n ≥ 0 1 − (−1) 1 − (−2) A diszkrét átviteli függvényt felírjuk, ha Z-transzformációt alkalmazunk és akkor H(z) =
−z 2⋅z z2 + = 2 z +1 z + 2 z + 3⋅ z + 2
Ha a bemenet az egységugrás akkor a rendszer kimenetét felírjuk, mint z2 z Y(z) = 2 ⋅ z + 3⋅ z + 2 z −1 és a megoldás y[n ] = 43 ⋅ (−2) n − 12 ⋅ (−1) n + 16 A rendszernek megfelelő differenciaegyenletet megkapjuk, kiindulva a rendszer diszkrét átviteli függvényéből mint: H(z) =
z2 z2 + 3⋅ z + 2
=
Y(z) ⇒ Y(z) ⋅ (z 2 + 3 ⋅ z + 2) = z 2 ⋅ U(z) U (z) 281
Innen y[n + 2] + 3 ⋅ y[n + 1] + 2 ⋅ y[n ] = u[n + 2] és
y[n ] + 3 ⋅ y[n − 1] + 2 ⋅ y[n − 2] = u[n ]
A súlyfüggvényt felírhatjuk az átviteli függvényből a ha résztörtekre bontjuk és inverz Z-transzformációt alkalmazunk: z2 − 1⋅ z 2 ⋅ z H(z) = 2 = + ⇒ h[n ] = ((−1) ⋅ (−2) n + 2 ⋅ (−1) n ) ⋅ z + 3⋅ z + 2 z +1 z + 2 C. Rekurzív rendszerek
Adott a következő negyed rendű differenciaegyenlet: y[n ] − a 1 ⋅ y[n − 1] − a 2 ⋅ y[n − 2] − a 3 ⋅ y[n − 3] − a 4 ⋅ y[n − 4] = b 0 ⋅ u[n ] Mivel negyedrendű a rendszer ezért négy állapotváltozót határozunk meg. Ezek: x 1[n ] = y[n − 4] x 2 [n ] = y[n − 3] x 3 [n ] = y[n − 2] x 4 [n ] = y[n − 1] Ezeknek a jelöléseknek alapján következnek: x 1[n + 1] = y[n − 4 + 1] = y[n − 3] = x 2 [n ] x 2 [n + 1] = y[n − 3 + 1] = y[n − 2] = x 3 [n ] x 3 [n + 1] = y[n − 2 + 1] = y[n − 1] = x 4 [n ] és a kimenő jel felírható a differenciálegyenlet alapján, hogy: y[n ] = a 1 ⋅ y[n − 1] + a 2 ⋅ y[n − 2] + a 3 ⋅ y[n − 3] + a 4 ⋅ y[n − 4] + b 0 ⋅ u[n ] = a 1 ⋅ x 4 + a 2 ⋅ x 3 + a 3 ⋅ x 2 + a 4 ⋅ x1 + b 0 ⋅ u[n ] Ezek alapján most már felírható, hogy x 1[n + 1] = x 2 [n ] x 2 [n + 1] = x 3 [n ] x 3 [n + 1] = x 4 [n ] x 4 [n + 1] = a 1 ⋅ x 4 + a 2 ⋅ x 3 + a 3 ⋅ x 2 + a 4 ⋅ x1 + b 0 ⋅ u[n ] Így az állapotegyenleteket felírhatjuk mint:
282
⎛ x 1 [ n + 1] ⎞ ⎛ 0 ⎜ ⎟ ⎜ ⎜ x 2 [ n + 1] ⎟ ⎜ 0 ⎜ x [ n + 1] ⎟ = ⎜ 0 ⎜ 3 ⎟ ⎜ ⎜ x [ n + 1] ⎟ ⎜ a ⎝ 4 ⎠ ⎝ 4 y[ n ] = ( a 4
a3
a2
1 0
0 1
0 a3
0 a2
0 ⎞ ⎛ x 1[n ] ⎞ ⎛ 0 ⎞ ⎟ ⎜ ⎟ ⎜ ⎟ 0 ⎟ ⎜ x 2 [n ]⎟ ⎜ 0 ⎟ ⋅ + ⋅ u[ n ] 1 ⎟ ⎜ x 3 [n ] ⎟ ⎜ 0 ⎟ ⎟ ⎜ ⎟ ⎜ ⎟ a 1 ⎟⎠ ⎜⎝ x 4 [ n ] ⎟⎠ ⎜⎝ b 0 ⎟⎠
⎛ x 1[n ] ⎞ ⎜ ⎟ ⎜ x 2 [n ]⎟ + b 0 ⋅ u[ n ] a1) ⋅ ⎜ x 3 [n ] ⎟ ⎜ ⎟ ⎜ x [n ]⎟ ⎝ 4 ⎠
Innen a rendszermátrixok a következők lesznek: ⎛0 ⎜ ⎜0 A=⎜ 0 ⎜ ⎜a ⎝ 4
1
0
0 0
1 0
a3
a2
0⎞ ⎛ 0⎞ ⎟ ⎜ ⎟ 0⎟ ⎜ 0⎟ ; B = ⎜ ⎟; C = (a 4 ⎟ 1 0 ⎟ ⎜ ⎟ ⎜b ⎟ a 1 ⎟⎠ ⎝ 0⎠
a3
a2
a 1 ); D = (b 0 )
a következő állapotegyenleteknek megfelelően. x[n + 1] = A ⋅ x[n ] + B ⋅ u[n ] y[n ] = C ⋅ x[n ] + D ⋅ u[n ]
D. Nem rekurzív rendszerek Adott a következő differencia egyenlet: y[n ] = a 0 ⋅ u[n ] + a 1 ⋅ u[n − 1] + a 2 ⋅ u[n − 2] + a 3 ⋅ u[n − 3] Jelöljük:
x 1[n ] = u[n − 3] x 2 [n ] = u[n − 2] x 3 [n ] = u[n − 1]
Ekkor
x 1[n + 1] = u[n − 3 + 1] = u[n − 2] = x 2 [n ] x 2 [n + 1] = u[n − 2 + 1] = y[n − 1] = x 3 [n ] x 3 [n + 1] = u[n ]
és a kimenetet felírjuk mint y[n ] = a 0 ⋅ u[n ] + a 1 ⋅ x 3 [n ] + a 2 ⋅ x 2 [n ] + a 3 ⋅ x 1[n ] Ekkor az állapotegyenleteket felírhatjuk mint:
283
⎛ x 1[n + 1] ⎞ ⎛ 0 1 0 ⎞ ⎛ x 1[n ] ⎞ ⎛ 0 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ x 2 [n + 1] ⎟ = ⎜ 0 0 1 ⎟ ⋅ ⎜ x 2 [n ] ⎟ + ⎜ 0 ⎟ ⋅ u[n ] ⎜ x [n + 1] ⎟ ⎜ 0 0 0 ⎟ ⎜ x [n ] ⎟ ⎜ 1 ⎟ ⎝ 3 ⎠ ⎝ ⎠ ⎝ 3 ⎠ ⎝ ⎠ ⎛ x 1[ n ] ⎞ ⎜ ⎟ y[n ] = (a 3 a 2 a 1 ) ⋅ ⎜ x 2 [n ] ⎟ + a 0 ⋅ u[n ] ⎜ x [n ] ⎟ ⎝ 3 ⎠ Innen a következő mátrixokat kapjuk: ⎛0⎞ ⎛0 1 0⎞ ⎜ ⎟ ⎜ ⎟ A = ⎜ 0 0 1 ⎟; B = ⎜ 0 ⎟; C = (a 3 ⎜1⎟ ⎜0 0 0⎟ ⎝ ⎠ ⎝ ⎠
a2
a 1 ); D = (a 0 )
E. Szimulációs diagramból állapotteres leírás Adott a 12.1. ábrán látható szimulációs diagram:
12.1. ábra A rendszer másodrendű mert két késleltető elemet tartalmaz. Ennek megfelelően két állapotváltozót határozunk meg és ezek a késleltetők kimenete lesz amint az a 12.1. ábrán is látható. Az első késleltető elem kimenete az első állapotfüggvény (állapotváltozó), a második kimenete meg a második állapotváltozó lesz. Felírhatjuk, hogy: x 1[n + 1] = u[n ] + a 0 ⋅ y[n ] = u[n ] + a 0 ⋅ (b 0 ⋅ u[n ] + x 2 [n ]) ⇒ x 1[n + 1] = u[n ] ⋅ (1 + a 0 ⋅ b 0 ) + a 0 ⋅ x 2 [n ] A második késleltető elem adja a második állapotváltozót. x 2[n + 1] = x1[n ] + a1 ⋅ y[n ] = x1[n ] + a1 ⋅ (b 0 ⋅ u[n ] + x 2[n ]) ⇒ x 2[n + 1] = x1[n ] + a1 ⋅ b 0 ⋅ u[n ] + a1 ⋅ x 2 [n ] A 12.1 ábra alapján kimenetet pedig felírjuk mint: 284
y[n ] = b 0 ⋅ u[n ] + x 2 [n ] Ezek alapján az állapotegyenleteket a következőképpen írhatjuk fel: ⎛ x 1[n + 1] ⎞ ⎛ 0 a 0 ⎞ ⎛ x 1[n ] ⎞ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ ⋅ ⎜⎜ ⎟⎟ + b 0 ⋅ u[n ] ⎝ x 2 [n + 1] ⎠ ⎝ 1 a 1 ⎠ ⎝ x 2 [n ] ⎠ ⎛ x [n ] ⎞ y[n ] = (0 1) ⋅ ⎜⎜ 1 ⎟⎟ + b 0 ⋅ u[n ] ⎝ x 2 [n ] ⎠ Kövessük ezt az eljárást a 12.2. ábrán látható szimulációs diagram esetében.
12.2. ábra Mivel három késleltető elem található, ezért három diszkrét állapotváltozónk van amelyeket 12.2. ábrán láthatunk. Felírhatjuk, hogy:
x 1[n + 1] = u[n ] + a 0 ⋅ x 1[n ] x 2 [n + 1] = x 1[n ] + a 1 ⋅ x 2 [n ] x 3 [n + 1] = x 2 [n ] + a 2 ⋅ x 3 [n ]
A kimenetet felírhatjuk mint y[n ] = x 3 [n ] Így a következő állapotegyenleteket kapjuk. ⎛ x 1[n + 1] ⎞ ⎛ a 0 ⎜ ⎟ ⎜ ⎜ x 2 [n + 1] ⎟ = ⎜ 1 ⎜ x [n + 1] ⎟ ⎜ 0 ⎝ 3 ⎠ ⎝
0 0 ⎞ ⎛ x 1[ n ] ⎞ ⎛ 1 ⎞ ⎟ ⎜ ⎟ ⎜ ⎟ a 1 0 ⎟ ⋅ ⎜ x 2 [n ] ⎟ + ⎜ 0 ⎟ ⋅ u[n ] 1 a 2 ⎟⎠ ⎜⎝ x 3 [n ] ⎟⎠ ⎜⎝ 0 ⎟⎠ ⎛ x 1[ n ] ⎞ ⎜ ⎟ y[n ] = (0 0 1) ⋅ ⎜ x 2 [n ] ⎟ + (0) ⋅ u[n ] ⎜ x [n ] ⎟ ⎝ 3 ⎠
F. Az átviteli függvényből állapotegyenletek Az átviteli függvényből több módszerrel lehet az állapotegyenleteket felírni. Példákon keresztül mutatom be ezeket a módszereket.
285
Példa
Adott a következő diszkrét átviteli függvény: H(z) =
z2 − 4 z2 + 5 ⋅ z + 6
A függvénynek megfelelő differenciaegyenletet y[n + 2] + 5 ⋅ y[n + 1] + 6 ⋅ y[n ] = u[n + 2] − 4 ⋅ u[n ] vagy y[n ] + 5 ⋅ y[n − 1] + 6 ⋅ y[n − 2] = u[n ] − 4 ⋅ [n − 2] A rendszer szimulációs diagramja a 12.3. ábrán látható:
12.3. ábra Az első késleltető elem kimenete az x 1[n ] állapotváltozó. Ezt felírjuk mint x 1[n + 1] = −4 ⋅ u[n ] − 6 ⋅ y[n ] = −4 ⋅ u[n ] − 6 ⋅ (u[n ] + x 2 [n ]) = −6 ⋅ x 2 [n ] − 10 ⋅ u[n ] x 2 [n + 1] = x 1[n ] − 5 ⋅ y[n ] = x 1[n ] − 5 ⋅ (u[n ] + x 2 [n ]) = x 1[n ] − 5 ⋅ x 2 [n ] − 5 ⋅ u[n ]
A kimenet pedig y[n ] = u[n ] + x 2 [n ]
Az állapotegyenletek pedig ⎛ x 1[n + 1] ⎞ ⎛ 0 − 6 ⎞ ⎛ x 1[n ] ⎞ ⎛ − 10 ⎞ ⎟⎟ + ⎜⎜ ⎟⎟ = ⎜⎜ ⎜⎜ ⎟⎟ ⋅ u[n ] ⎟⎟ ⋅ ⎜⎜ ⎝ x 2 [n + 1] ⎠ ⎝ 1 − 5 ⎠ ⎝ x 2 [n ] ⎠ ⎝ − 5 ⎠ ⎛ x [n ] ⎞ y[n ] = (0 1) ⋅ ⎜⎜ 1 ⎟⎟ + (1) ⋅ u[n ] ⎝ x 2 [n ] ⎠ Példa
Legyen az átviteli függvény: H(z) =
z −1 z +1 ⋅ z+2 z+3
286
Az átviteli tagok szorzata azt jelenti, hogy az ezeket reprezentáló szimuláló diagram sorba van kötve és ezt a 12.4. ábra mutatja.
12.4. ábra Ebben a másodrendű rendszerben, a két késleltető elem kimenetét jelöljük mint állapotváltozó és ekkor az ezeknek megfelelő egyenleteket felírhatjuk mint: x 1[n + 1] = −u[n ] − 2 ⋅ u[n ] − 2 ⋅ x 1[n ] x 2 [n + 1] = u[n ] + x 1[n ] − 3 ⋅ y[n ] Innen következik, hogy x 2 [n + 1] = u[n ] + x 1[n ] − 3 ⋅ (u[n ] + x 1[n ] + x 2 [n ])
és a kimenet pedig y[n ] = u[n ] + x1[n ] + x 2 [n ]
Ezekből felírhatjuk a következő állapotegyenleteket: x 1[n + 1] = −2 ⋅ x 1[n ] − 3 ⋅ u[n ] x 1[n + 1] = −2 ⋅ x 1[n ] − 3 ⋅ x 2 [n ] − 3 ⋅ u[n ] y[n ] = u[n ] + x 1[n ] + x 2 [n ] vagy mátrixos formában: ⎛ x 1[n + 1] ⎞ ⎛ − 2 0 ⎞ ⎛ x 1[n ] ⎞ ⎛ − 3 ⎞ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟ ⋅ u[n ] ⎟⎟ ⋅ ⎜⎜ ⎝ x 2 [n + 1] ⎠ ⎝ − 2 − 3 ⎠ ⎝ x 2 [n ] ⎠ ⎝ − 2 ⎠ ⎛ x [n ] ⎞ y[n ] = (1 1)⎜⎜ 1 ⎟⎟ + (1) ⋅ x[n ] ⎝ x 2 [n ] ⎠ Példa
Adott a következő formában felírt átviteli függvény: H(z) =
3 8 − z+2 z+3
287
Az összeadás az fenti átviteli függvényben azt jelenti, hogy az ezeket a tagokat reprezentáló szimulációs diagramok párhuzamosan vannak kötve és ezt a 12.5. ábrán láthatjuk.
12.5. ábra Az 12.5. ábrán bejelölt állapotváltozókat felírjuk mint: x 1[n + 1] = 3 ⋅ u[n ] − 2 ⋅ x 1[n ] x 2 [n + 1] = −8 ⋅ u[n ] − 3 ⋅ x 2 [n ] y[n ] = x 1[n ] + x 2 [n ] Az ebből felírt állapotegyenletek pedig a következők: ⎛ x 1[n + 1] ⎞ ⎛ − 2 0 ⎞ ⎛ x 1[n ] ⎞ ⎛ 3 ⎞ ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟ ⋅ u[n ] ⎟⎟ ⋅ ⎜⎜ ⎝ x 2 [n + 1] ⎠ ⎝ 0 − 3 ⎠ ⎝ x 2 [n ] ⎠ ⎝ − 8 ⎠ ⎛ x [n ] ⎞ y = (1 1) ⋅ ⎜⎜ 1 ⎟⎟ + (0) ⋅ u[n ] ⎝ x 2 [n ] ⎠ Példa
Adott a következő diszkrét átviteli függvény:
H ( z) =
z2 −1 Y ( z) = ⇒ 2 z + 5 ⋅ z + 6 U ( z)
⇒ Y ( z ) ⋅ ( z 2 + 5 ⋅ z + 6) = U ( z ) ⋅ ( z 2 − 1) Innen következik az alábbi differencia egyenlet:
6 ⋅ y[n ] + 5 ⋅ y[n + 1] + y[n + 2] = −u[n ] + u[n + 2] Az ennek megfelelő szimulációs diagramot a 12.6. ábrán láthatjuk. Az állapotváltozókat felírjuk mint:
288
x 2 [n + 1] = u[n ] − 5 ⋅ x 2 [n ] − 6 ⋅ x 1[n ] x 1[n + 1] = x 2 [n ] y[n ] = u[n ] − 5 ⋅ x 2 [n ] − 6 ⋅ x 1[n ]
12.6. ábra Majd az állapotegyenleteket kapjuk, amelyek: 1 ⎞ ⎛ x 1[ n ] ⎞ ⎛ 0 ⎞ ⎛ x 1[n + 1] ⎞ ⎛ 0 ⎟⎟ + ⎜⎜ ⎟⎟ ⋅ u[n ] ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ ⋅ ⎜⎜ ⎝ x 2 [n + 1] ⎠ ⎝ − 6 − 5 ⎠ ⎝ x 2 [n ] ⎠ ⎝ 1 ⎠ ⎛ x [n ] ⎞ y = ( − 6 − 5) ⋅ ⎜⎜ 1 ⎟⎟ + (1) ⋅ u[n ] ⎝ x 2 [n ] ⎠ .Az átviteli függvényből állapotegyenletek módszerek esetében figyeljük meg a szimulációs diagram és az A rendszermátrix struktúrája közötti összefüggést. G. Összetett feladatok Adottak a következő diszkrét állapotegyenletek ⎛1 0 ⎞ ⎛ 0⎞ ⎟⎟ ⋅ x[n ] + ⎜⎜ ⎟⎟ ⋅ u[n ] x[n + 1] = ⎜⎜ ⎝1 k ⎠ ⎝1⎠ y[n ] = (0 1) ⋅ x[n ] 1. A k paraméter milyen értékére lesz stabil a rendszer? 2. Egy k értékre amelyre stabil a rendszer, írjuk fel a H(z) átviteli függvényt 3. A rekurzív eljárást használva, határozzuk meg az x[0], x[1], x[2], x[3], x[4] ⎛0⎞ értékeit ha a bemenő jel az egységugrás jel és a kezdeti állapot x[0] = ⎜⎜ ⎟⎟ . ⎝1⎠ 4. A Z-transzformációt használva keressük az x[n ] megoldást, ha n ≥ 0 . 289
5. Írjuk fel a fundamentális (állapotátviteli mátrixot). 1. Első lépésként kiszámítjuk a rendszer sajátértékeit. 0 ⎞ ⎛ λ 0 ⎞ ⎛1 0 ⎞ ⎛ λ − 1 ⎟⎟ − ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ (λ ⋅ I − A) = ⎜⎜ 0 λ 1 k − 1 λ − k ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ Tehát det(λ ⋅ I − A) = (λ − 1) ⋅ (λ − k ) A rendszer stabil, ha minden sajátvektora az egységnyi körön belül van. Tehát a stabilitás feltétele, hogy k az egységsugarú körön belül legyen.
⎛1 0 ⎞ ⎛ 0⎞ ⎟; B = ⎜⎜ ⎟⎟; C = (0 1); D = (0); 2. Vegyük most k = − 12 és ekkor A = ⎜⎜ 1 ⎟ ⎝1⎠ ⎝1 − 2 ⎠ A diszkrét átviteli függvény H(z) = C ⋅ (z ⋅ I − A) −1 ⋅ B + D és ez a példánk esetében felírható mint −1
0 ⎞ ⎛0⎞ ⎛ z −1 ⎛z + 1 0 ⎞ ⎛ 0⎞ 1 2 ⎟ ⎟ ⋅ ⎜⎜ ⎟⎟ ⎜ ⎜ ⎟ ⋅ H(z) = (0 1) ⋅ ⎜⎜ ( 0 1 ) = ⋅ ⋅ 1⎟ ⎜1⎟ ⎟ 1 1 ) ⋅ ( z − 1) ⎜ 1 1 z − + z 1 − ( z + ⎝ ⎠ ⎠ ⎝ ⎠ ⎝ 2⎠ ⎝ 2 Vagyis ⎛0⎞ 1 z −1 z −1 H(z) = ( ) ⋅ ⎜⎜ ⎟⎟ = 1 1 1 (z + 2 ) ⋅ (z − 1) (z + 2 ) ⋅ (z − 1) ⎝ 1 ⎠ (z + 2 ) ⋅ (z − 1)
3. A rekurzív diszkrét állapotegyenletek x[n + 1] = A ⋅ x[n ] + B ⋅ u[n ] y[n ] = C ⋅ x[n ] + D ⋅ u[n ]
⎛ 0⎞ ⎛ 0⎞ és ha a kezdeti állapotok x[0] = ⎜⎜ ⎟⎟; y[0] = (0 1) ⋅ ⎜⎜ ⎟⎟ = 1 ⎝1⎠ ⎝1⎠ akkor írhatjuk, hogy ⎛ 0 ⎞ ⎛0⎞ ⎛ 0⎞ ⎛1 0 ⎞ ⎛ 0 ⎞ ⎛ 0 ⎞ ⎟ ⋅ ⎜ ⎟ + ⎜ ⎟ ⋅1 = ⎜⎜ 1 ⎟⎟ + ⎜⎜ ⎟⎟ = ⎜⎜ 1 ⎟⎟ x[1] = ⎜⎜ 1⎟ ⎜ ⎟ ⎜ ⎟ ⎝ − 2 ⎠ ⎝1⎠ ⎝ 2 ⎠ ⎝1 − 2 ⎠ ⎝ 1 ⎠ ⎝ 1 ⎠ ⎛ 0⎞ 1 y[1] = (0 1) ⋅ ⎜⎜ ⎟⎟ = ⎝1⎠ 2 ⎛ 0 ⎞ ⎛ 0⎞ ⎛ 0⎞ ⎛1 0 ⎞ ⎛ 0 ⎞ ⎛ 0 ⎞ ⎟ ⋅ ⎜ ⎟ + ⎜ ⎟ ⋅1 = ⎜⎜ 1 ⎟⎟ + ⎜⎜ ⎟⎟ = ⎜⎜ 3 ⎟⎟ x[2] = ⎜⎜ 1⎟ ⎜1⎟ ⎜ ⎟ ⎝ − 4 ⎠ ⎝1⎠ ⎝ 4 ⎠ ⎝1 − 2 ⎠ ⎝ 2 ⎠ ⎝ 1 ⎠ ⎛ 0⎞ 3 y[1] = (0 1) ⋅ ⎜⎜ 3 ⎟⎟ = ⎝4⎠ 4 290
és így tovább kiszámítjuk a következő diszkrét lépések állapotainak és kimeneteinek értékeit. 4. Kiszámítjuk most az állapotegyenletek z tartományban kapott megoldását. Az előzőekben (11.5.1.a) láttuk, hogy: X (z ) = z ⋅ (z ⋅ I − A ) −1 ⋅ x[0 ] + (z ⋅ I − A ) −1 ⋅ B ⋅ U (z )
és Y(z) = C ⋅ X(z) + D ⋅ U(z) = (C ⋅(z ⋅ I − A) −1 ⋅ B + D ⋅ U(z)
és az egységugrás bemenő jel Z-transzformáltja figyelembe véve ⎛ z + 12 z ⎜ X(z) = ⋅ (z + 12 ) ⋅ (z − 1) ⎜⎝ 1 =
z és D(0) = (0) értéket z −1
⎛ z + 12 0 ⎞ ⎛0⎞ 1 ⎟⎟ ⋅ ⎜⎜ ⎟⎟ + ⎜ ⋅ z − 1⎠ ⎝ 1 ⎠ (z + 12 ) ⋅ (z − 1) ⎜⎝ 1
0 ⎞ ⎛0⎞ z ⎟⋅⎜ ⎟⋅ = z − 1⎟⎠ ⎜⎝ 1 ⎟⎠ z − 1
⎛ 0 ⎞ ⎛ 0 ⎞ z z 1 ⎜ ⎟ ⎜ ⎟⋅ ⋅ + ⋅ (z + 12 ) ⋅ (z − 1) ⎜⎝ z − 1⎟⎠ (z + 12 ) ⋅ (z − 1) ⎜⎝ z − 1⎟⎠ z − 1
Ahonnan 0 0 0 ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎟ ⎜ ⎟ 2 = ⎜ z⋅( z −1) ⎟ + ⎜ = z z ⎜ ( z + 1 )⋅( z −1) ⎟ ⎜ ( z + 1 )⋅( z −1) ⎟ ⎜ ( z + 1 )⋅( z −1) ⎟ ⎝ 2 ⎠ ⎝ 2 ⎠ ⎝ 2 ⎠ Ugyanakkor a kimenő jel transzformáltjának kapjuk, hogy Y(z) = C ⋅ X(z) = (0 1) ⋅ X(z) =
z2 (z + 12 ) ⋅ (z − 1)
= 23 ⋅
z z + 13 ⋅ . z −1 z+ 1 2
Ha ennek kiszámítjuk az inverz Z-transzformációját, akkor y [ n ] = x 2 [ n ] = ( 23 ⋅ (1) n +
1 3
⋅ ( − 12 ) n ) ⋅ 1 [n ]
5. Láttuk (11.5.1.5), hogy a diszkrét rendszer fundamentális mátrixa felírható mint Φ[n ] = Z −1{z ⋅ (z ⋅ I − A) −1} . A diszkrét lineáris rendszer esetében pedig Φ[n ] = A n . A feladatnak megfelelően felírjuk, hogy
z ⋅ (z ⋅ I − A) −1 =
⎛z + z ⎜ ⋅ (z + 12 ) ⋅ (z − 1) ⎜⎝ 1
1 2
z ⎛ ⎜ (z − 1) 0 ⎞ ⎜ ⎟= ⎟ z z − 1⎠ ⎜ ⎜ (z + 1 ) ⋅ (z − 1) 2 ⎝
⎞ ⎟ ⎟ z ⎟ (z + 12 ) ⎟⎠ 0
291
z ⎛ ⎜ (z − 1) =⎜ z ⎜2 1⋅ z ⋅ + ⎜ 3 z −1 3 z + 1 2 ⎝
⎞ ⎟ −1 ⎟ z ⋅ (z ⋅ I − A) z ⎟ ⇒ (z + 12 ) ⎟⎠ ⎛ (1) n 0 ⎞⎟ An = ⎜ 2 ⋅ 1 [n ] ⎜ ( ⋅ (1) n + 1 ⋅ (− 1 ) n ) (− 1 ) n ⎟ 3 2 2 ⎠ ⎝ 3 ⎛1 0⎞ ⎟⎟ ezért láthatjuk, hogy az állapotátviteli (fundamentális) mátrix Mivel A 0 = ⎜⎜ ⎝0 1⎠ helyes. 0
Példa
Adott a 12.7. ábrán látható szimulációs diagrammal leírt rendszer
12.7. ábra 1. Írjuk fel a megfelelő állapotegyenleteket. 2. Írjuk fel a fundamentális mátrixot ⎛1⎞ 3. Ha a bemenő jel az u[n ] = 0 és a kezdeti állapotvektor x[0] = ⎜⎜ ⎟⎟ , akkor ⎝0⎠ írjuk fel az állapotvektort és a kimenetet az n-ik pillanatban. 4. Stabil ez a rendszer ? 5. Számítsuk ki a rendszer diszkrét átviteli függvényét. 1. A szimulációs diagram alapján felírhatjuk a következő állapotegyenleteket x 1[n + 1] = u[n ] − x 1[n ] x 2 [n + 1] = u[n ] − 2 ⋅ x 1[n ] ⇒ y[n ] = x 1[n ] + x 2 [n ]
292
⎛−1 0 ⎞ ⎛1⎞ ⎟⎟ ⋅ x[n ] + ⎜⎜ ⎟⎟ ⋅ u[n ] x[n + 1] = ⎜⎜ ⎝ 0 − 2⎠ ⎝1⎠ y[n ] = (1 1) ⋅ x[n ] + (0) ⋅ u[n ] 2. A fundamentális mátrixot a diszkrét rendszermátrix alapján (11.5.1.5) számítjuk ki, vagyis Φ[n ] = Z −1{z ⋅ (z ⋅ I − A) −1} .
Így (z ⋅ I − A)
−1
0 ⎞ ⎛z +1 ⎟ = ⎜⎜ z + 2 ⎟⎠ ⎝ 0
−1
=
0 ⎞ ⎛z + 2 1 ⎟ ⋅ ⎜⎜ z + 1⎟⎠ (z + 1) ⋅ (z + 2) ⎝ 0
Ahonnan z ⋅ (z ⋅ I − A) −1
⎛ z 0 ⎞ ⎜ z +1 ⎛z + 2 z ⎟=⎜ = ⋅⎜ z + 1⎟⎠ ⎜ 0 (z + 1) ⋅ (z + 2) ⎜⎝ 0 ⎜ ⎝
⎞ 0 ⎟ ⎟ z ⎟ ⎟ z+ 2⎠
Ha kiszámítjuk ennek az inverz Z-transzformáltját, akkor kapjuk: ⎛ (−1) n Φ[n ] = A n = ⎜⎜ ⎝ 0
0 ⎞⎟ ; n≥0 (−2) n ⎟⎠
3. Ha u[n ] = 0 akkor az állapotvektort felírhatjuk mint x[n + 1] = A ⋅ x[n ] . Ez alapján n =0⇒
n =1⇒
⎛1⎞ x[0] = ⎜⎜ ⎟⎟ ⎝0⎠ y[0] = x 1[0] + x 2 [0] = 1 + 0 = 1 ⎛ − 1 0 ⎞⎛ 1 ⎞ ⎛ − 1⎞ ⎟⎟⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ x[1] = ⎜⎜ ⎝ 0 − 2 ⎠⎝ 0 ⎠ ⎝ 0 ⎠ y[1] = x 1[1] + x 2 [1] = −1 + 0 = −1
n =2⇒ ⎛ − 1 0 ⎞⎛ − 1⎞ ⎛ 1 ⎞ ⎟⎟⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ x[2] = ⎜⎜ ⎝ 0 − 2 ⎠⎝ 0 ⎠ ⎝ 0 ⎠ y[2] = x 1[2] + x 2 [2] = 1 + 0 = 1
293
n =3⇒ ⎛ − 1 0 ⎞⎛ 1 ⎞ ⎛ − 1⎞ ⎟⎟⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ x[3] = ⎜⎜ ⎝ 0 − 2 ⎠⎝ 0 ⎠ ⎝ 0 ⎠ y[3] = x 1[3] + x 2 [3] = −1 + 0 = −1
Ezek alapján, általánosítva kapjuk, hogy ⎛ (−1) n ⎞ ⎟; ha n ≥ 0 x[n ] = ⎜⎜ ⎟ 0 ⎠ ⎝ y[n ] = (−1) n ; ha n ≥ 0
4. A rendszer nem stabil, mert az egyik pólusa (-2) az egységsugarú körön kívül helyezkedik el. Y(z) = (C ⋅ (z ⋅ I − A) −1 ⋅ B + D) képlet alapján 5. Az átviteli függvényt a H(z) = U(z) számítjuk ki. ⎛ 1 ⎞ 0 ⎟ ⎛1 ⎞ ⎜ ⎛ 1⎞ 1 1 ⎟ ⋅ ⎜⎜ ⎟⎟ + (0) = ( H(z) = (1 1) ⋅ ⎜ z + 1 ) ⋅ ⎜⎜ ⎟⎟ 1 ⎟ ⎝1 ⎠ z + 1 z + 2 ⎝ 1⎠ ⎜⎜ 0 ⎟ z + 2⎠ ⎝ 1 1 z + 2 + z +1 2⋅z + 3 H(z) = + = = 2 z + 1 z + 2 (z + 1) ⋅ (z + 2) z + 3 ⋅ z + 2 Példa
⎛1⎞ Az adott, a kezdeti állapotok x[0] = ⎜⎜ ⎟⎟ és ⎝0⎠ ⎛ 2 0⎞ ⎛ 0⎞ ⎟⎟ ⋅ x[n ] + ⎜⎜ ⎟⎟ ⋅ u[n ] x[n + 1] = ⎜⎜ ⎝ 0 3⎠ ⎝1⎠ y[n ] = (0 1) ⋅ x[n ] + (0) ⋅ u[n ] ⎛1 0⎞ ⎟⎟ ⋅ x[n ] állapotváltozó cserét. állapotegyenletekre végezzük el a q[n ] = ⎜⎜ ⎝0 2⎠ Láttuk, hogy q[n + 1] = M ⋅ A ⋅ M −1 ⋅ q[n ] + M ⋅ B ⋅ u[n ] . y[n ] = C ⋅ M −1 ⋅ q[n ] + D ⋅ u[n ] akkor a transzformáció megoldását a z tartományban a következő összefüggések adják
294
Q ( z ) = z ⋅ ( z ⋅ I − M ⋅ A ⋅ M − 1 ) − 1 ⋅ q[ 0 ] + ( z ⋅ I − M ⋅ A ⋅ M − 1 ) − 1 ⋅ M ⋅ B ⋅ U ( z )
Y(z) = C ⋅ M −1 ⋅ Q(z) + D ⋅ U(z) ⎛1 0⎞ ⎟⎟ . Ekkor kiszámítjuk a következő kifejezéseket: Az adott feladatban az M = ⎜⎜ ⎝0 2⎠ ⎛1 0 ⎞ ⎛0⎞ ⎛ 2 0⎞ ⎟; M ⋅ A ⋅ M −1 = ⎜⎜ ⎟⎟; M ⋅ B = ⎜⎜ ⎟⎟; C ⋅ M −1 = (0 M −1 = ⎜⎜ 1 ⎟ ⎝ 2⎠ ⎝ 0 3⎠ ⎝0 2 ⎠
1) 2
Ha ezeket a kifejezéseket behelyettesítjük a transzformált állapotegyenletekbe, akkor megkapjuk az állapotegyenleteket a q állapottérben. Példa
Adott a következő rendszer y[n ] + y[n − 1] + y[n − 2] = u 1[n ] + u 2 [n ] 1. Stabil ez a rendszer? 2. Számítsuk ki y[n ] kimenetet ha u 1[n ] = (0.1) n ; u 2 [n ] = (0.1) n ; ha n ≥ 0 ha a kezdeti feltételek zéró értéket vesznek fel. 3. Számítsuk ki a rendszer diszkrét átviteli függvényét. 1. Felírjuk, hogy x 1[n ] = y[n − 2] x 2 [n ] = y[n − 1] Innen x 1[n + 1] = y[n − 1] = x 2 [n ] x 2 [n + 1] = y[n ] = − y[n − 1] − y[n − 2] + u 1[n ] + u 2 [n ] = − x 2 [n ] − x 1[n ] + u 1[n ] + u 2 [n ] Az állapotegyenletek: ⎛0 1⎞ ⎛ 0 0 ⎞ ⎛ u 1[ n ] ⎞ ⎟⎟ ⎟⎟ ⋅ x[n ] + ⎜⎜ ⎟⎟ ⋅ ⎜⎜ x[n + 1] = ⎜⎜ u [ n ] − 1 − 1 1 1 ⎝ ⎠ ⎝ ⎠ ⎝ 2 ⎠ ⎛ u [n ] ⎞ y[n ] = ( − 1 − 1) ⋅ x[n ] + (1 1) ⋅ ⎜⎜ 1 ⎟⎟ ⎝ u 2 [n ] ⎠ Innen következik, hogy ⎛z −1 ⎞ ⎟⎟) = z 2 + z + 1 . det(z ⋅ I − A) = det(⎜⎜ ⎝ 1 z + 1⎠ Ebből kiszámítjuk a rendszer sajátértékeit, vagyis det(z ⋅ I − A) = z 2 + z + 1 = 0 ⇒ z 12 = − 12 ± j ⋅
3 2 295
s mivel ezeknek a modulusza az egységnyi sugarú körön helyezkedik el, ezért a rendszer a stabilitás határán van vagy mondhatjuk, hogy instabil. 2. A zéró kezdeti feltételek alapján felírjuk, hogy X(z) = (z ⋅ I − A) −1 ⋅ B ⋅ U(z) Y (z) = C ⋅ X(z) + D ⋅ U(z)
Behelyettesítve a rendszernek megfelelő mátrixokat, kapjuk, hogy ⎛ z +1 ⎜ 2 X(z) = ⎜ z + z + 1 −1 ⎜ ⎜ 2 ⎝ z + z +1 ⎛ ⎜ 2 =⎜z ⎜ ⎜ 2 ⎝z
z ⎞ ⎛ ⎞ ⎟ ⎟ 0 0 ⎜ ⎞ ⎜ z − (0.1) ⎟ z + z + 1 ⎟ ⋅ ⎛⎜ ⎟⋅ = z z ⎟ ⎟ ⎜⎝ 1 1 ⎟⎠ ⎜ ⎟ ⎜ z + (0.1) ⎟ z2 + z +1⎠ ⎠ ⎝ z z ⎞ z 1 ⎞ ⎛⎜ ⎞ ⎛ + 2 ⎟ ⎟ ⎜ ⎟ 2 z 2 + z + 1 ⎟ ⋅ ⎜ z − (0.1) ⎟ = ⎜ (z + z + 1) ⋅ (z − (0.1)) (z + z + 1) ⋅ (z + (0.1)) ⎟ ⎟ z z ⎟ ⎜ z2 z ⎟ ⎜ + ⎜ ⎟ ⎟ ⎜ ⎟ z 2 + z + 1 ⎠ ⎝ z + (0.1) ⎠ ⎜⎝ (z 2 + z + 1) ⋅ (z − (0.1)) (z 2 + z + 1) ⋅ (z + (0.1)) ⎟⎠
1 + z +1 z + z +1
1
2
z ⎛ ⎞ ⎜ ⎟ z − (0.1) ⎟ ⎜ Y(z) = (− 1 − 1) ⋅ X(z) + (1 1) ⋅ z ⎜ ⎟ ⎜ z + (0.1) ⎟ ⎝ ⎠ Y(z) = +
−z 2
(z + z + 1) ⋅ (z − (0.1)) − z2
(z 2 + z + 1) ⋅ (z − (0.1))
+
+
−z 2
(z + z + 1) ⋅ (z + (0.1)) −z
(z 2 + z + 1) ⋅ (z + (0.1))
+
+
z z + (z + (0.1)) (z − (0.1))
Ha kiszámítjuk ennek a kifejezésnek az inverz transzformációját, akkor megkapjuk a keresett y[n ] időtartománybeli rendszer válaszát a két bemenő jelre. 3. A diszkrét átviteli függvényt megkapjuk ha kiszámítjuk ⎛ z +1 ⎜ 2 2 H(z) = C ⋅ (z ⋅ I − A) −1 ⋅ B + D = (− 1 − 1) ⋅ ⎜ z + z + 1 z −1 ⎜ ⎜ 2 ⎝ z + z +1 z2 kifejezést, vagyis H(z) = ( H(z) = (
− (z + 1) z2 + z +1 −1 z2 + z +1
+ +
1 z2 + z +1 −z z2 + z +1
⎞ ⎟ + z + 1 ⎟ ⋅ ⎛⎜ 0 0 ⎞⎟ + (1 1) z ⎟ ⎜⎝ 1 1 ⎟⎠ ⎟ + z +1⎠ 1
⎛0 0⎞ ⎟⎟ + (1 1) ⎜⎜ ) ⋅ z2 + z +1 z2 + z +1 ⎝1 1⎠ −1 −z ) + (1 1) + 2 2 z + z +1 z + z +1 −1
+
−z
296
H(z) = (H11 (z) H12 (z))
H11 (z) = H12 (z) =
−1 z2 + z +1 −1 2
z + z +1
+ +
−z z2 + z +1 −z 2
z + z +1
+1 = +1 =
z2 z2 + z +1 z2 2
z + z +1
=
Y(z) U1 ( z )
=
Y (z) U 2 (z)
H. Fundamentális mátrix kiszámítása diszkrét frekvenciatartományban Az állapotátviteli (fundamentális) mátrix meghatározása bizonyos esetekben lehetséges a Z-transzformáció alkalmazásával. Legyen x[k + 1] = A ⋅ x[k ] a diszkrét rendszer homogén állapotegyenlete. HA most a Z-transzformációt alkalmazzuk, akkor kapjuk: z ⋅ X ( z ) − z ⋅ x ( 0) = A ⋅ X ( z ) Innen következik, hogy X(z) = (z ⋅ I − A) −1 ⋅ z ⋅ x (0) . Figyelembe véve, hogy X ( z ) = Φ ( z ) ⋅ x ( 0) következik, hogy Φ(z) = (z ⋅ I − A) −1 ⋅ z Ha most ennek kiszámítjuk az inverz Z-transzformációját, akkor megkapjuk a diszkrét időtartományban a fundamentális mátrixot, vagyis: Φ[k ] = Z −1{(z ⋅ I − A) −1 ⋅ z}
Példa
1 ⎞ ⎛ 0 ⎟⎟ egy diszkrét rendszer mátrixa. Számítsuk ki a fundamentális Legyen A = ⎜⎜ ⎝ − 6 − 5⎠ mátrixát frekvenciatartományban transzformálva. Felírjuk, hogy ⎛ z −1 ⎞ ⎟⎟ (z ⋅ I − A) = ⎜⎜ ⎝ 6 z + 5⎠ Innen következik, hogy:
297
⎛ z + 2 1⎞ z ⎛ ⎜⎜ ⎟⎟ ⎜ − 6 z⎠ z+3 ⋅z = ⎜ (z ⋅ I − A) −1 ⋅ z = ⎝ ⎜ − 6⋅z (z + 2) ⋅ (z + 3) ⎜ ⎝ (z + 2) ⋅ (z + 3)
z ⎞ ⎟ (z + 2) ⋅ (z + 3) ⎟ ⎟ z2 ⎟ (z + 2) ⋅ (z + 3) ⎠
Ha most inverz Z-transzformációt számítunk, akkor kapjuk a fundamentális mátrixot, vagyis: ⎛1 − k − k ⎞ ⎟⎟ Φ[k ] = (−1) k ⋅ ⎜⎜ ⎝ k 1+ k⎠ Példa
Ez a példa azt illusztrálja, hogy a Z-transzformáció segítségével könnyebben ⎛0 1⎞ ⎟⎟ és számítsuk ki A k megoldhatunk bizonyos típusú feladatokat. Legyen A = ⎜⎜ ⎝ 0 0⎠ értékét. Az előbbiek alapján tudjuk, hogy A k nem más mint az (z ⋅ I − A) −1 ⋅ z inverz Ztranszformációja. Ez alapján kapjuk, hogy: ⎛ z − 1⎞ ⎜⎜ ⎟⎟ ⎝0 z ⎠
−1
⎛ z −1 ⋅ z = ⎜⎜ ⎝ 0
⎛ 1 z −1 ⎞ ⎛ z 0 z −2 ⎞⎟ ⎟ ⎜ ⎜ z ⋅ = ⎜0 1 ⎟ = ⎜ 0 z −1 ⎟⎠ ⎠ ⎝ ⎝
z −1 ⎞⎟ z 0 ⎟⎠
Ha most kiszámítjuk ennek a mátrixnak az inverz Z-transzformáltját akkor azt kapjuk, hogy: ⎛ δ[k ] δ[k − 1] ⎞ ⎟ ahol δ[k ] a diszkrét Dirac-jel. A k = ⎜⎜ δ[k ] ⎟⎠ ⎝ 0 I. A diszkrét fundamentális mátrix kiszámítása Cayley-Hamilton módszerrel A diszkrét rendszerek esetében is alkalmazhatjuk a Cayley-Hamilton módszert hogy kiszámítsuk az A k fundamentális mátrixot konstans rendszermátrix esetén. Ha a folytonos LTI rendszerek esetében az állapotegyenletek megoldása exponenciális függvényformák ( e λ⋅t ) kombinációjából adódik, addig a diszkrét LTI rendszerek esetében ez hatványfüggvények ( λn ) kombinációjából adódik. A módszert egy példán keresztül ismerhetjük meg. Példa
Adott a következő homogén differencia egyenlet:
298
y[k + 2] + 5 ⋅ y[k + 1] + 6 ⋅ y[k ] = 0 Ha a következő, fázisteres jelöléseket alkalmazzuk: x 1[k ] = y[k ] x 2 [k ] = y[k + 1] akkor a rendszermátrix felírható mint: 1 ⎞ ⎛ 0 ⎟⎟ A = ⎜⎜ ⎝ − 6 − 5⎠ A karakterisztikus egyenlet ( det(λ ⋅ I − A) = 0 ) gyökei, a rendszer sajátértékei: λ1 = −2; λ 2 = −3 Most a Cayley-Hamilton módszer alapján felírhatjuk, hogy
λk1 = (−2) k = α 0 + α1 ⋅ λ1 = α 0 − 2 ⋅ α1 λk1 = (−3) k = α 0 + α1 ⋅ λ 2 = α 0 − 3 ⋅ α1 Ezt az egyenletrendszert megoldva kapjuk, hogy: α 0 = 3 ⋅ (−2) k − 2 ⋅ (−3) k α 0 = (−2) k − (−3) k Tudva, hogy R ( A ) = A k = α 0 ⋅ I 2 + α1 ⋅ A következik, hogy: ⎛ 3 ⋅ (−2) k − 2 ⋅ (−3) k Φ[k ] = ⎜⎜ k k ⎝ − 6 ⋅ (−2) − (−3)
⎞ (−2) k − (−3) k ⎟ − 2 ⋅ (−2) k + 3 ⋅ (−3) k ⎟⎠
Példa
Számítsuk ki annak a diszkrét rendszernek a fundamentális mátrixát, amelynek adott a 1 ⎞ ⎛0 ⎟⎟ rendszermátrixa. A = ⎜⎜ ⎝ −1 − 2⎠ A det(λ ⋅ I − A) = 0 karakterisztikus egyenletből következik a két sajátérték, vagyis: λ1 = λ 2 = −1
299
Mivel két egybeeső sajátértéke van , ezért használjuk az ismert (ha most általános esetben az i.-ik sajátérték multiplicitása p i ) ds dλs
ds
n −1
[ α ⋅ λi ] | λ =λi s ∑ i dλ i = 0 s = 0,1,2,L , p i − 1;
R (λ ) | λ =λ i =
d [α 0 + α1 ⋅ λ ] |λ =λi formára redukálódik. Így dλ a követező egyenletrendszerhez jutunk: összefüggést, amely ebben az esetben
(−1) k = α 0 + α1 ⋅ λ1 = α 0 − α1 − k ⋅ (−1) k = α1
.
Ennek megoldása α1 = −k ⋅ ( −1) k α 0 = ( −1) k ⋅ (1 − k ) Így a diszkrét rendszernek megfelelő fundamentális mátrix: ⎛ α Φ[k ] = α 0 ⋅ I + α1 ⋅ A = ⎜⎜ 0 ⎝ − α1
α1 ⎞ ⎟⎟ = (−1) k α0 − 2 ⋅ α0 ⎠
⎛1 − k − k ⎞ ⎟ ⋅ ⎜⎜ 1 + k ⎟⎠ ⎝ k
Az itt bemutatott feladatoknak az alapos megértése nagy előrelépés a bonyolultabb rendszerelméleti problémák tárgyalásában.
300
Befejező gondolatok A könyv célja a rendszerekkel és jelekkel kapcsolatos alapfogalmak és alapeljárások megismerése és elsajátítása. Ezek alapos ismeretében foghatunk neki az ezekre épülő, rendszerekkel kapcsolatos tudományterületek tanulmányozásához, gyakorlati alkalmazásokhoz. A rendszer-identifikáció, szabályzáselméletek, nemlineáris rendszerek, optimális szabályzás, adaptív szabályzás, robusztus szabályzás és megannyi más fejezete a rendszer tanulmányozásának mind felhasználja e könyvben ismertetett alapfogalmakat. A könyv a hangsúlyt nem a teljes körű matematikai, absztrakt tárgyalásmódra helyezi, hanem inkább a fogalmaknak példák segítségével való megismerésére, elsajátítására. Minden építő szellemű észrevételt örömmel fogadok. 2006. év nyara
Márton László Ferenc
301
IRODALOMJEGYZÉK
•
[Bertalanffy,1968] Ludwig von Bertalanffy, General System theory: Foundations, Development, Applications, 1968, George Braziller New York.
•
[Bertalanffy,1975] Ludwig von Bertalanffy, Perspectives on General Systems Theory, Scientific-Philosophical Studies, 1975, E. Taschdjian (eds.), George Braziller New York.
•
[Ackoff,1968] Russell L. Ackoff, M. Sasieni Fundamentals of Operations Research, 1968.
•
[Ackoff,1972] Russell L. Ackoff, Frederick Edmund Emery On Purposeful Systems, 1972,
•
[Szadovszkij, 1076] Szadovszkij V.N Az általános rendszerelmélet alapjai. 1976 Statisztikai Kiadó, Budapest.
•
[Mesarovic, 1971] Mihajlo D. Mesarovic: Controllability of General Systems. 1971 Mathematical Systems Theory 2(5)
•
[Mesarovic, 1968] Mihajlo D. Mesarovic: On Some Metamathematical Results As Properties of General Systems. 1968 Mathematical Systems Theory 2(4)
•
[Churchman , 1971] C. West Churchman The Design of Inquiring Systems, Basic Concepts of Systems and Organizations, 1971 Basic Books, New York.
•
[Churchman , 1960] C. West Churchman Prediction and Optimal Decision, 1960, Prentice-Hall Englewood Cliffs, New Jersy
•
[Csáki , 1973] Csáki F. Fejezetek a szabályzástehnikából, Állapot egyenletek, Műszaki Kiadó, 1973
•
[Csáki , 1976] Csáki F. Lineáris szabályzási rendszerek analízise, Műszaki Kiadó, 1976
•
[Pollock , 1999] DSG Pollock , A Handbook of Time-Series Analysis, Signal Processing and Dynamics Copyright 1999 by Academic Press
•
[DeRusso , 2003] Paul M. DeRusso & all, State variables for Engineers, John Wiley & Sons Inc second edition 2003
•
[Chatfield , 2001] C. Chatfield, The Analysis of Time Series, Chapman and Hall, 2001
302
•
[ElAli , 2004] Taan S. ElAli, Discrete Systems and Digital Signal Processing with Matlab,CRC Press,2004
•
[Haykin , 2003] Simon Haykin, Barry Van Veen, Signals and Systems, John Wiley & Sons Inc 2003
•
[Jackson , 2002] Leland B. Jackson, Signal, System and Transforms, AddisonWesley Publishing Company, 2002
•
[Oppenheim , 1977] Alan V. Oppenheim, Alan S. Willsky, Signals & Systems, Prentice Hall International, second edition 1997
•
[Chen , 2004] Chi-Tsong Chen Signal and Systems, Oxford University Press, Third edition, 2004
•
[Boashash ,2003] Boualem Boashash, Time Frequency Signal Analysis and Processing, Elsevier Press 2003
•
[Jeges , 2001] Jeges Zoltán, Írányítástehnika, Műszaki Főiskola, Szabadka, 2001
•
[Astrom , 1994] Astrom K.J, Wittenmark B., Adaptive Control, Addison Wesly Publishing Company, 1994, Second edition
•
[Internet ] A világhálón található, rendszerekre vonatkozó információ
303