VYSOKÁ ŠKOLA BAŇSKÁ - TECHNICKÁ UNIVERZITA OSTRAVA Fakulta strojní
Složité systémy řízení I. Díl: Regulace soustav s náhodnými poruchami ing. Jiří Tůma, CSc.
Prosinec 1997
Lektoroval: Doc. RNDr. Jaroslav Markl
© Ing. Jiří Tůma, CSc. ISBN 80 – 7078 – 534 - 9
Obsah Náhodné procesy a jejich charakteristiky 1. Úvod...............................................................................................................................1 2. Základy teorie pravděpodobnosti...................................................................................2 2.1 Operace s jevy...............................................................................................................2 2.2 Pravděpodobnost ...............................................................................................................3 2.2.1 Relativní četnost a pravděpodobnost ........................................................................3 2.2.2 Axiomatická definice pravděpodobnosti ..................................................................3 2.2.3 Podmíněná pravděpodobnost ....................................................................................4 2.3 Náhodné veličiny a jejich základní charakteristiky.......................................................... 4 2.3.1 Distribuční funkce a hustota pravděpodobnosti........................................................4 2.3.2 Číselné charakteristiky náhodných veličin ...............................................................6 2.4 Příklady typů rozdělení pravděpodobnosti....................................................................... 7 2.4.1 Rovnoměrné rozdělení pravděpodobnosti ................................................................7 2.4.2 Normální rozdělení pravděpodobnosti......................................................................8 2.4.3 Odhady parametrů náhodných veličin ......................................................................9 2.5 Transformace náhodných veličin................................................................................... 11 2.5.1 Lineární transformace .............................................................................................11 2.5.2 Nelineární transformace ..........................................................................................12 2.6 Dvojrozměrné a vícerozměrné náhodné veličiny...........................................................12 2.6.1 Distribuční funkce a hustota vícerozměrné náhodné veličiny ................................12 2.6.2 Marginální rozdělení ...............................................................................................13 2.6.3 Číselné charakteristiky vícerozměrných náhodných veličin...................................14 2.6.4 Charakteristiky součtu náhodných veličin ..............................................................16 2.6.5 Centrální limitní věta ..............................................................................................18 3. Charakteristiky náhodných procesů ............................................................................ 19 3.1 Typy náhodných procesů ................................................................................................19 3.2 Střední hodnota a rozptyl stacionárních a ergodických procesů....................................21 3.2.1 Centrované náhodné procesy ..................................................................................21 3.3 Autokorelační funkce ......................................................................................................21 3.4 Vzájemná korelační funkce.............................................................................................24 3.4.1 Vzájemná korelační funkce nezávislých náhodných procesů.................................25 3.4.2 Autokorelační funkce součtu dvou nezávislých náhodných procesů......................25 3.5 Autokorelační funkce speciálních náhodných procesů ................................................. 26 3.5.1 Bílý šum ..................................................................................................................26 3.5.2 Obecný telegrafní signál .........................................................................................27 3.5.3 Harmonická funkce .................................................................................................28 3.6 Použití Markovových řetězců k popisu náhodných procesů......................................... 30 3.6.1 Nástroje popisu náhodných procesů Markovovými řetězci....................................30 3.6.2 Autokorelační funkce Markovova řetězce ..............................................................32 3.7 Charakteristiky náhodných procesů ve frekvenční oblasti............................................ 36 3.7.1 Fourierova transformace .........................................................................................36 3.7.2 Výkonová spektrální hustota ..................................................................................37 3.7.3 Rozptyl náhodného procesu ....................................................................................38 3.7.4 Výkonová spektrální hustota bílého šumu ..............................................................38 3.7.5 Křížové spektrum ...................................................................................................40 3.8 Nepřímý výpočet korelačních funkcí ............................................................................ 42 3.8.1 Výpočet spekter ......................................................................................................42 i
3.8.2 Výpočet korelačních funkcí ....................................................................................43 3.8.3 Příklad hodnocení časového průběhu náhodné veličiny .........................................45 3.9 Průchod náhodného procesu lineární dynamickou soustavou ...................................... 48 3.9.1 Základní vlastnosti lineárního dynamické soustavy ...............................................48 3.9.2 Autokorelační funkce výstupu a vzájemná korelační funkce vstupu a výstupu soustavy .................................................................................................................48 3.9.3 Výkonová spektrální hustota výstupu soustavy a křížové spektrum vstupu a výstupu soustavy .....................................................................................49 3.9.4 Rozptyl náhodného procesu na výstupu lineární dynamické soustavy ..................50 Identifikace 4. Parametrické modely náhodných procesů a regulovaných soustav ............................ 52 4.1 Modely stacionárních náhodných procesů .....................................................................52 4.1.1 Model typu AR (autoregresní model) .....................................................................52 4.1.2 Model typu MA (model s klouzavým průměrem) ..................................................55 4.1.3 Model typu ARMA ................................................................................................56 4.1.4 Spektrum náhodného procesu typu ARMA ...........................................................57 4.2 Modely nestacionárních náhodných procesů .................................................................57 4.3 Parametrické modely regulovaných soustav ................................................................. 60 4.3.1 Model typu ARX (autoregresní model s dalším vstupem)......................................60 4.3.2 Model typu ARMAX (autoregresní model s klouzavým průměrem model a s dalším vstupem)...................................................................................................................60 4.3.3 Ostatní modely .......................................................................................................61 4.3.4 Přehled modelů náhodných procesů a regulovaných soustav.................................61 5. Identifikace modelů náhodných procesů a soustav..................................................... 63 5.1 Jednorázová identifikace parametrů modelu ..................................................................63 5.1.1 Metody odhadu parametrů ......................................................................................64 5.1.2 Simulace a základní charakteristiky pro neparametrickou identifikaci ..................66 5.1.3 Parametrické metody identifikace...........................................................................68 5.1.4 Výběr struktury modelu a hodnocení výsledku identifikace ..................................69 5.2 Průběžná identifikace parametrů modelu ...................................................................... 71 5.2.1 Průběžné odhadování parametrů regresního modelu ..............................................72 5.2.2 Rekurzivní výpočet parametrů regulované soustavy metodou nejmenších čtverců73 5.2.3 Rekurzivní výpočet rozptylu chyby modelu regulované soustavy .........................75 5.2.4 Směrové zapomínání...............................................................................................76 5.2.5 Odmocninový filtr a U-D filtr .................................................................................77 5.2.6 Vlastnosti algoritmů průběžné identifikace v prostředí MATLABu ......................78 5.2.7 Popis algoritmů průběžné identifikace v MATLABu.............................................79 Optimální řízení 6. Kvadratické kriterium řízení ....................................................................................... 82 6.1 Jednokrokové a vícekrokové kvadratické kriterium ..................................................... 85 6.2 Účinnost řízení ............................................................................................................... 86 7. Optimální predikce diskrétních stacionárních náhodných procesů............................. 87 7.1 Jednokroková predikce, model ARMA prvého řádu .....................................................87 7.2 Dvoukroková predikce, model ARMA prvého řádu......................................................89 7.3 Predikce na obecný počet kroků, model ARMA obecného řádu...................................89 8. Strukturálně optimální řízení ...................................................................................... 94 8.1 Řízení soustavy s modelem typu ARMAX prvního řádu .............................................96 ii
8.2 8.3 8.4 8.5 8.6 8.7 8.8
Řízení soustavy s modelem typu ARX prvního řádu ....................................................99 Řízení soustavy s modelem typu ARMAX obecného řádu ..........................................99 Řízení soustavy s modelem typu ARX a jedním krokem dopravního zpoždění.........102 Řízení integrační soustavy s poruchou působící na vstupu..........................................103 Příklad návrhu statisticky optimální regulace ..............................................................105 Citlivost statisticky optimálního řízení na změnu parametrů soustavy .......................111 Suboptimální řízení fázově neminimálních regulovaných soustav .............................112
9. Parametricky optimální řízení ................................................................................... 118 9.1 Diskrétní regulační obvody...........................................................................................119 9.1.1 Analytický výpočet integrálu ...............................................................................120 9.1.2 Numerický výpočet integrálu................................................................................128 9.1.3 Výpočetní aspekty.................................................................................................133 9.1.4 Porovnání statisticky optimální a suboptimální regulace .....................................135 9.2 Spojité regulační obvody ..............................................................................................137 9.2.1 Analytický výpočet integrálu ...............................................................................137 9.2.2 Numerický výpočet integrálu................................................................................142 9.2.3 Výpočtové aspekty ................................................................................................143 Přílohy: A: Výpočet integrálů komplexních funkcí B: Matice, vektory a řešení soustavy přeurčených a nedourčených rovnic C: Metoda maximální věrohodnosti pro odhad parametrů
iii
145 146 149
Předmluva Tato skripta se systematicky zabývají regulačními obvody, na které působí náhodné poruchy. Matematický aparát je možné označit za klasický. Východiskem analýzy jsou poznatky teorie pravděpodobnosti a zvláště pak teorie náhodných procesů. Nástrojem k popisu vlastností regulovaných soustav jsou matematické modely ve formě diferenciální nebo diferenční rovnice. Kritériem pro návrh regulátoru a jeho seřízení je kvadratické kriterium řízení. Výsledkem analýzy a syntézy je výpočet účinku regulace s přímými ekonomickými efekty. Teorie se omezuje jen na lineární regulační obvody. Její předností je to, že uvažuje přítomnost náhodných poruch a dokáže predikovat statistické charakteristiky účinku regulace ve vztahu ke struktuře a parametrům regulátoru. Takovými výsostně praktickými výsledky se zatím jiné přístupy k analýze a syntéze, založené například na fuzzy množinách, vykázat nemohou. Přes snahu rozvíjet další přístupy k analýze a syntéze regulačních obvodů, prezentované módně jako moderní, lze tvrdit, že klasická teorie regulace, která je založena na lineárních modelech a kvadratickém kriteriu řízení, se dosud nevyčerpala. Ostatně skripta FE ČVUT tuto oblast nazývají Moderní teorie řízení [20]. Její další rozvoj je podmíněn teoretickou přípravou uživatelů a jejich ochotou seznámit se důkladně s regulovanou soustavou a všemi faktory, které její stav a chování ovlivňují. Pokud to není předem racionálně vyloučeno, je vhodnější spoléhat se na významný informační obsah měřených veličin oproti umělé kalkulaci s jejich fuzzy významem a degradaci aproximativního dynamického modelu regulované soustavy na soubor několika pravidel sestavených na základě kusých informací od provozních expertů. Je rovněž krátkozraké zakládat regulaci pouze na výpočetní mohutnosti a kapacitě paměti počítačů. Čtení odborných článků z oblasti klasické teorie řízení je velmi obtížné, protože matematický aparát je přehledný často jen specialistům matematikům. Učební text obsahuje poznatky, které nelze vtěsnat do výuky jednoho semestru. Je však koncipován tak, aby představoval příručku pro zájemce v situacích, kdy se setkají s prostředím, ve kterém budou všechny dále popsané předpoklady o regulované soustavě a cílech řízení aktuální. Kniha předpokládá znalosti základů teorie řízení a identifikace, které se přednášejí na strojní fakultě, [5,15,26,33,40-43,46]. Kapitoly o teorii pravděpodobnosti a náhodných procesech se opírají především o dříve vydané vysokoškolské učebnice [1,2,16,17,19,23,30,31]. Hlavním zdrojem pro tento učební text v kapitolách, které se zabývají parametrickou a strukturální optimalizací regulačních obvodů s náhodnými poruchami podle kvadratického kriteria je Aströmova kniha [4]. Množství poznatků lze čerpat z prací pracovníků ÚTIA Akademie věd České republiky, např. J. Kárný, J. Böhm a jiní, vedených dříve V. Peterkou [11,13,14,27-29] nebo z dalších prací, které jsou uvedeny v literatuře. Vlastní publikace autora se zabývají řešením praktických úloh regulace [36-39], z nichž některé jsou použity jako příklady. K řešení příkladů jsou používány toolboxy SIMULINK a System Identification programového systému MATLAB. Tento dotisk skript obsahuje řadu oprav vzorců, které byly bohužel v prvním vydání uvedeny chybně. Většina chyb v prvním vydání skript vznikla z mylného úsporného zápisu sloupcových vektorů ve tvaru transponovaného řádkového vektoru, ve kterém byla navíc vyznačena transpozice také na levé straně vzorce. V tomto vydání jsou tyto chyby odstraněny.
1
Náhodné procesy a jejich charakteristiky 1. Úvod Při vysvětlení pojmu náhodné (cizím slovem stochastické) procesy lze vycházet z poznatelnosti jejich budoucího vývoje v daném časovém okamžiku, tj. obvykle v přítomnosti. Protikladem k náhodným procesům jsou procesy deterministické (česky předurčené), které probíhají v analyzovaných dynamických systémech. Společnou vlastností deterministických procesů je to, že jejich časový průběh je dán matematickými funkcemi, které jsou řešením soustavy diferenciálních nebo diferenčních rovnic popisujících analyzovaný dynamický systém a vycházejících z daných počátečních podmínek, což je velmi dobře známo z předmětu matematické analýzy. Jen naivní pozorovatel může tvrdit, že za všech okolností lze vždy výchozí údaje, tj. počáteční podmínky, podrobně určit a všechny vztahy popsat ve formě diferenciálních rovnic se známými parametry. Často z důvodů technických omezení nelze zmíněné počáteční podmínky přesně a vyčerpávajícím způsobem určit nebo přes stále rostoucí výkon počítačů nelze numericky řešit rozsáhlý soubor diferenciálních rovnic. Výsledný časový průběh sledovaného procesu je proto tak složitou matematickou funkcí, že se jeví vnějšímu pozorovateli jako náhodný. Jeho konkrétní vývoj nelze přesně, tj. bez chyb, předvídat. Tyto úvahy lze dokumentovat nejen na hrací kostce, ale také na vývoji mnoha poruchových veličin, které vstupují do regulačních obvodů. Rozumný pozorovatel nemusí trvat na absolutní přesnosti (tj. nulové chybě) předpovědi vývoje sledovaného procesu, ale spokojí se s jeho extrapolací do budoucnosti s přípustnou přesností, která plyne z praktických potřeb nebo jen málo převyšuje chybu měření. K této extrapolaci je zapotřebí znalosti některých základních charakteristik náhodných procesů. V této kapitole budou některé z těchto charakteristik blíže popsány. Nejprve budou zopakovány základy teorie pravděpodobnosti.
2. Základy teorie pravděpodobnosti V této kapitole jsou stručně zopakovány podle [17] základy teorie pravděpodobnosti. Pro podrobnější seznámení lze doporučit některou příručku, např. [1,2,16,19,30,31].
2.1 Operace s jevy Teorie pravděpodobnosti se zabývá náhodnými jevy. Jevy se označují velkými písmeny latinské abecedy, např. A, B, ... Jev A implikuje jev B (nebo A má za následek jev B), jestliže jev B nastane vždy, když nastane jev A. Zápis tohoto vztahu je A ⊂ B . Dva jevy jsou si rovny, jestliže A ⊂ B a současně B ⊂ A . Jev, který nastane po každé realizaci náhodného pokusu se nazývá jistým jevem a značí se Ω . Jev, který nenastane nikdy, je nemožný jev. Tento jev se označuje ∅ . Sjednocení jevů. Sjednocení (nebo součet) jevů A i , i = 1, ... je jev, který nastane právě tehdy, když nastane aspoň jede z jevů A i , i = 1, ... Tento jev se označuje A = ∪ A i . i
Průnik jevů. Průnik jevů A i , i = 1, ... je jev, který nastane, právě tehdy, když nastanou současně všechny jevy A i , i = 1, ... Tento jev se označuje A = ∩ A i . i
Disjunktní jevy. Jestliže průnik jevů A a B, tj. A ∩ B , je nemožný jev, pak tyto jevy se označují za disjunktní. Pro disjunktní jevy platí A ∩ B = ∅ .
2
Komplementární (doplňkový nebo opačný) jev. Komplementárním jevem k jevu A je jev, který nastane jen když nenastane jev A. Tento jev se označuje A . Elementární jev. Jev A je elementární, jestliže neexistují jevy různé od tohoto jevu takové, že jejich sjednocení je jev A. Elementární jev je nejjednodušší výsledek náhodného pokusu. Prostor elementárních jevů. Tímto prostorem se rozumí množina všech elementárních jevů, které mohou nastat jako výsledek náhodného pokusu. Prostorem elementárních jevů může být: • množina reálných čísel nebo některá jejich část, výsledkem pokusu je jedno (reálné) číslo; v tomto případě je pozorována (reálná) náhodná veličina • množina k-tic reálných čísel (množina k-složkových reálných vektorů nebo euklidovský prostor a nebo některá jeho část); v tomto případě je pozorován náhodný vektor nebo krozměrná náhodná veličina
{X }
• množina všech posloupností
∞
i i =1
; pak jde o pozorování náhodné nebo stochastické
posloupnosti nebo také stochastického procesu s diskrétním časem • prostor funkcí X ( t ) na intervalu 0 < t < T ; pak jde o pozorování náhodného nebo stochastického procesu se spojitým časem.
2.2 Pravděpodobnost 2.2.1 Relativní četnost a pravděpodobnost Relativní četnost. Je to podíl počtu například počtu pokusů n(A), při kterých nastal jev A, k celkovému počtu pokusů n n( A ) h( A ) = . (2-1) n Relativní četnosti navzájem disjunktních jevů se sčítají. Skutečnost, že relativní četnosti se s rostoucím počtem pokusů ustalují, se nazývá statistická stabilita relativních četností. Je přirozené přijmout limitní hodnotu četnosti za míru početnosti příslušného jevu a nazvat ji pravděpodobností tohoto jevu. Teorie pravděpodobnosti jako vědní disciplína je vybudována na axiomatických základech, které uvedený praktický poznatek respektují. 2.2.2 Axiomatická definice pravděpodobnosti Pravděpodobnost náhodného jevu A se značí P{ A} . Vlastnosti pravděpodobnosti lze axiomaticky definovat následujícím způsobem 1. Pravděpodobnost je nezáporné reálné číslo nejvýše rovno jedné, proto P{ A} ∈ 0, 1 . 2. Pravděpodobnost sjednocení konečného nebo spočetného počtu vzájemně disjunktních jevů
{ }
je dána vzorcem P ∪ A i = ∑ P{A i } . i
i
3. Pravděpodobnost jistého jevu je rovna jedné, P{ Ω} = 1. Z uvedených tří axiomů lze odvodit řadu dalších vlastností náhodných jevů: 4. Jestliže jev A implikuje jev B ( A ⊂ B ), pak P{ A} ≤ P{ B} .
5. Pravděpodobnost opačného jevu A k jevu A je rovna P{A} = 1 − P{ A} .
3
6. Pravděpodobnost nemožného jevu je rovna nule, P{ ∅} = 0 . 7. Pravděpodobností sjednocení jevů A ∪ B je dána P{ A ∪ B} = P{ A} + P{ B} − P{ A ∩ B} . 2.2.3 Podmíněná pravděpodobnost Podmíněná pravděpodobnost jevu A podmíněná jevem B (tj. skutečností, že jev B nastal) je definována jako podíl P{ A ∩ B} P{A B} = . (2-2) P{ B} Pro pravděpodobnost průniku dvou jevů proto platí P{ A ∩ B} = P{ A} P{B A} = P{ B} P{A B} ,
(2-3)
kde P{A B} je podmíněna pravděpodobnost jevu A za předpokladu, že nastal jev B a P{B A} je podmíněna pravděpodobnost jevu B za předpokladu, že nastal jev A. Nezávislost jevů. Jevy A a B jsou nezávislé, jestliže platí P{ A ∩ B} = P{ A} P{ B} . Je-li P{ B} > 0 , pak P{A B} = P{ A} a podobně pro P{ A} > 0 platí P{B A} = P{ B} . Jinak řečeno, pravděpodobnost jednoho jevu nezávisí na tom, zda druhý jev nastal. Věta o úplné pravděpodobnosti. Nechť B i , i = 1, ..., n jsou navzájem disjunktní jevy, přičemž
{ }
P{B i } > 0, i = 1,..., n a P ∪ B i = 1 . Dále nechť A je libovolný jev, jehož pravděpodobnost n
i =1
{
}
P A B i podmíněná jevem Bi je pro každé i známa. Pravděpodobnost jevu A je pak rovna
{
}
P{ A} = ∑ P A B i P{B i } . n
i =1
(2-4)
2.3 Náhodné veličiny a jejich základní charakteristiky Některé náhodné pokusy mají za výsledek jev, který přísluší prostoru elementárních jevů ve tvaru množiny reálných čísel nebo některá její podmnožiny. Výsledek náhodného pokusu, daný reálným číslem, je hodnotou veličiny ξ , která se nazývá náhodnou veličinou. Náhodné veličiny jsou pojmenovávány nejčastěji malými řeckými písmeny. Konkrétní hodnota, tzv. realizace náhodné proměnné, se označuje latinkou.
2.3.1 Distribuční funkce a hustota pravděpodobnosti Distribuční funkce. Distribuční funkci náhodné veličiny ξ nazveme reálnou funkcí F ( x ) definovanou pro každé reálné x vztahem F ( x ) = P{ ξ ≤ x} .
(2-5)
Pro zdůraznění příslušnosti k náhodné veličině se jménem ξ lze použít indexu Fξ ( x ) . Distribuční funkce libovolné náhodné veličiny má tyto vlastnosti: 1. Pro každé reálné x platí 0 ≤ F ( x ) ≤ 1 .
2. Pro každé reálné x1 < x2 je F ( x1 ) ≤ F ( x2 ) , tj. je neklesající. 4
3. Platí že, lim F ( x ) = F ( − ∞) = 0 a lim F ( x ) = F ( + ∞) = 1 . x →−∞
x →+∞
4. Distribuční funkce je zprava spojitá a má nejvýše spočetně mnoho bodů nespojitosti. 5. Platí P( x1 < ξ ≤ x2 ) = F ( x2 ) − F ( x1 ) . Rozdělení diskrétního a spojitého typu. V aplikacích se lze setkat s náhodnými veličinami dvojího typu, a to se spojitými a diskrétními náhodnými veličinami. Diskrétní náhodná veličina může nabývat jen hodnot z nějaké konečné nebo spočetné (jednotlivé hodnoty lze opatřit celočíselným indexem) množiny {x1 , x2 ,...} . Spojitá náhodná veličina může nabývat všech hodnot z určitého intervalu. Rozdělení diskrétního typu. Distribuční funkce náhodné veličiny diskrétní je dáno F ( x) =
∑ P{ ξ = x } .
x j ≤x
(2-6)
j
Rozdělení spojitého typu. Náhodná veličina má rozdělení spojitého typu existuje-li nezáporná reálná funkce f ( x ) taková, že pro všechna reálná x se dá distribuční funkce F ( x ) vyjádřit ve tvaru F ( x) =
x
∫ f ( t ) dt ,
− ∞ < x < +∞ .
(2-7)
−∞
Funkce f ( x ) se nazývá hustota pravděpodobnosti (nebo stručněji hustota) náhodné veličiny. Ve všech bodech, kde existuje derivace distribuční funkce, je f ( x) =
d f ( x) . dx
(2-8)
Ve vztahu k pravděpodobnosti příslušnosti náhodné veličiny k určitému intervalu hodnot lze význam hustoty pravděpodobnosti demonstrovat přibližným vztahem, který označuje element pravděpodobnosti P{x < ξ ≤ x + ∆ x} = f ( x ) ∆ x + O( ∆ x ) ,
(2-9)
kde funkce O( ∆ x ) je řádově menší než ∆ x , tj. taková funkce, že lim O( ∆ x ) ∆ x = 0 . ∆ x→0
Hustota rozdělení pravděpodobnosti má následující základní vlastnosti 1. lim f ( x ) = 0 , x →−∞
lim f ( x ) = 0
x →+∞
(2-10)
+∞
2.
∫ f ( x) dx = 1 .
(2-11)
−∞
Pro diskrétní náhodnou veličinu lze definovat hustotu pravděpodobnosti s pomocí Diracovy funkce δ( x ) , tj.
f ( x ) = ∑ pi δ( x − xi ) ,
(2-12)
i
kde P{ξ = xi } = pi . Jestliže diskrétní náhodná proměnná nabývá jen jediné hodnoty ξ = a , tj. ve skutečnosti je to konstanta, pak její hustota rozdělení je přímo Diracova funkce f ( x ) = δ( x − a ) .
(2-13)
5
Na závěr této kapitoly je uveden na obr. 1 příklad hustoty pravděpodobnosti pro spojitou a diskrétní náhodnou veličinu. Distribuční funkce se získá integrací hustoty pravděpodobnosti. Pro spojitou náhodnou veličinu je výsledkem spojitý průběh distribuční funkce, zatímco u diskrétní náhodné veličiny se bude jednat o funkci schodovitou.
Obr. 1. Hustota pravděpodobnosti spojité (vlevo) a diskrétní (vpravo) náhodné veličiny
2.3.2 Číselné charakteristiky náhodných veličin Střední hodnota náhodné veličiny. Nejdůležitější charakteristikou náhodné veličiny je střední hodnota (někdy je nazývána očekávaná hodnota nebo matematická naděje). Definice střední hodnoty spojité náhodné veličiny ξ se opírá o hustotu rozdělení pravděpodobnosti f ( x ) a diskrétní náhodné veličiny o pravděpodobnosti pi , i = 1, 2, ... . Platí µ = E { ξ} =
+∞
µ = E { ξ} = ∑ xi pi .
∫ x f ( x) dx ,
−∞
(2-14)
i
kde symbol E {.} představuje operátor se jménem veličiny nebo funkce uvnitř složených závorek. V posledních vzorcích je výraz vlevo pro spojitou náhodnou veličinu a výraz vpravo pro diskrétní náhodnou veličinu. U spojité náhodné veličiny má střední hodnota význam statického momentu plochy hustoty pravděpodobnosti a u diskrétní náhodné veličiny je to vážený průměr všech možných hodnot s váhami shodnými s jejich pravděpodobností výskytu. Počáteční a centrální moment náhodné veličiny. Pomocí operátoru střední hodnoty lze definovat také další charakteristiky náhodných signálů. Obecný vzorec pro počáteční statistické momenty k -tého řádu spojité a diskrétní náhodné veličiny, kde k je přirozené číslo, je následující M k = E {ξk } =
+∞
∫x
k
M k = E { ξ k } = ∑ xik pi .
f ( x ) dx ,
−∞
(2-15)
i
Střední hodnota je počáteční statistický moment prvního řádu, µ = M1 . Centrální moment spojité a diskrétní náhodné veličiny k-tého řádu je dán vzorci
{
mk = E ( ξ − µ )
k
}
+∞
=
∫ ( x − µ)
k
{
mk = E ( ξ − µ )
f ( x ) dx ,
−∞
k
} = ∑ ( x − µ) p k
i
i
(2-16)
i
Rozptyl (disperze) náhodné veličiny. Centrální moment náhodné veličiny druhého řádu, m2 , se nazývá rozptyl. Jeho definice s použitím operátoru střední hodnoty je následující
6
) } = ∫ ( x − µ) f ( x) dx , {( = m = E {(ξ − E { ξ} ) } = ∑ ( x − µ ) p .
D{ ξ} = σ = m2 = E ξ − E { ξ} 2
2
+∞
2
(2-17)
−∞
D{ ξ} = σ 2
2
2
2
i
i
(2-18)
i
Mezi rozptylem a počátečními momenty prvního a druhého řádu platí D{ ξ} = m2 = M 2 − M12 = σ 2 − µ 2 .
(2-19)
2.4 Příklady typů rozdělení pravděpodobnosti Distribuční funkce a hustota pravděpodobnosti jsou reálné funkce proměnné x. Tyto funkce jsou dány svým typem a případně také parametry. Typů rozdělení je velmi mnoho. V této příloze jsou pouze dva příklady, a to rovnoměrné a normální rozdělení.
2.4.1 Rovnoměrné rozdělení pravděpodobnosti Rovnoměrné rozdělení pravděpodobnosti má hustotu a distribuční funkci definovanou následujícími vzorci ⎧ 0, x
b ⎩ 1, kde a < b určují krajní body intervalu možných hodnot náhodné veličiny a představují parametry rozdělení. Na obr. 2 jsou grafy hustoty a distribuční funkce rovnoměrného rozdělení.
Obr. 2. Hustota a distribuční funkce rovnoměrného rozdělení Střední hodnota rovnoměrně rozdělené náhodné veličiny se vypočte prostým dosazením do definičního vzorce b +∞ b x a +b 1 ⎡ x2 ⎤ µ = E { ξ} = ∫ x f ( x ) dx = ∫ dx = = , (2-21) ⎢ ⎥ b−a b − a ⎣ 2 ⎦a 2 −∞ a
tj. střední hodnota je aritmetickým průměrem krajních hodnot. Rozptyl se vypočte podobným postupem, a to
7
D{ ξ} = σ = 2
+∞
∫ ( x − µ)
−∞
2
2 3 (b − a ) 2 a + b⎞ 1 a + b⎞ ⎤ 1 ⎡1 ⎛ ⎛ = − f ( x ) dx = ∫ ⎜ x − dx = x . ⎜ ⎟ ⎟ ⎢ ⎥ ⎝ b − a ⎣3 ⎝ 2 ⎠ b−a 2 ⎠ ⎦ 12 a b
b
a
Rovnoměrné rozdělení je modelem pro často se vyskytující náhodné veličiny. Vyšší programovací jazyky obvykle obsahují funkci, která tuto veličinu generuje. Je třeba připomenout, že výsledkem volání této funkce je pseudonáhodné číslo jehož relativní četnosti z dílčích intervalů pouze aproximují teoretické rovnoměrné rozdělení.
2.4.2 Normální rozdělení pravděpodobnosti Jiný název tohoto rozdělení je Gausssovo. Toto rozdělení má dva parametry, a to svou střední hodnotu µ a rozptyl σ 2 . Parametry tohoto rozdělení jsou na rozdíl od rovnoměrného rozdělení přímo základní charakteristiky normálního rozdělení. Hustota pravděpodobnosti náhodné veličiny s normálním rozdělením je dána vztahem ⎛ ( x − µ) 2 ⎞ 1 ⎟ , − ∞ < x < +∞ . f ( x) = (2-22) exp⎜⎜ − 2 ⎟ σ 2 σ 2π ⎝ ⎠ Distribuční funkce je dána integrálem uvedené hustoty. Na rozdíl od rovnoměrného rozdělení nelze nalézt jako výsledek integrace hustoty elementární funkci. V literatuře lze však nalézt distribuční funkce ve tvaru nekonečné řady. Proto jsou hodnoty této funkce s názvem pravděpodobnostní integrál nebo Laplaceův integrál a nebo integrál chyb x ⎛ x2 ⎞ 1 Φ( x ) = ∫ exp⎜ − ⎟ dx (2-23) ⎝ 2⎠ −∞ 2 π jen tabelovány, a to pro normalizovanou náhodnou veličinu, tj. pro µ = 0 a σ 2 = 1 . Pravděpodobnostní integrál lze aproximovat například částí následující řady ⎞ 1 1 ⎛ x3 x5 x7 ( ) (2-24) Φ x = + +...⎟ ⎜x− + − 2 6 40 336 ⎠ 2π ⎝ Tvar funkční závislosti hustoty pravděpodobnosti na veličině x je zvonovitý a představuje známou Gaussovou křivku. Extrém této křivky je pro x = µ a jeho velikost je
nepřímo úměrná směrodatné odchylce σ , tj. f ( µ ) = 1 σ 2 π . Vliv rozptylu na tvar funkční závislosti demonstruje obr. 3.
Obr. 3. Hustota normálního rozdělení, vliv rozptylu Hustota a distribuční funkce normálního rozdělení pro µ = 0 a σ = 1 je v grafech na obr. 4.
8
Obr. 4. Hustota a distribuční funkce normálního rozdělení Střední hodnota normálně rozdělené náhodné veličiny se vypočte prostým dosazením do definičního vzorce. Protože výsledek výpočtu je předem znám, jde jen o jeho verifikaci. Platí +∞ ⎛ ( x − µ) 2 ⎞ ⎛ y2 ⎞ 1 y+µ ⎜ ⎟ µ = E { ξ} = ∫ x exp⎜ − dx = ∫ exp⎜ − 2 ⎟ dy = 2σ 2 ⎟⎠ ⎝ 2σ ⎠ −∞ σ 2 π −∞ σ 2 π ⎝ +∞
+∞
+∞ ⎛ y2 ⎞ ⎛ y2 ⎞ 1 y =µ∫ exp⎜ − 2 ⎟ dy + ∫ exp⎜ − 2 ⎟ dy = µ + 0 = µ ⎝ 2σ ⎠ ⎝ 2σ ⎠ −∞ σ 2 π −∞ σ 2 π
(2-25)
2.4.3 Odhady parametrů rozdělení náhodných veličin Číselné charakteristiky náhodných veličin se vypočítají na základě znalosti typu rozdělení a velikosti jejich parametrů. Problém znalosti parametrů se zatím s mlčením přecházel. Často jediný přístupný způsob jejich určení jsou změřená data, tj. vždy konečný soubor realizací náhodné veličiny, který se nazývá náhodný výběr. Tento náhodný výběr, který má ústřední význam v matematické statistice, představuje posloupnost nezávislých a stejně rozdělených náhodných veličin X 1 , X 2 ,..., X n , kde N je rozsah výběru. Z náhodného výběru se vypočte výběrový průměr 1 i= N X = ∑ Xi N i =1 a výběrový rozptyl 2 1 i= N m2 = ∑ ( X i − X ) , N i =1
(2-26)
(2-27)
přičemž m2 se nazývá výběrová směrodatná odchylka. Pro výhodnější limitní vlastnosti se používá také veličina 1 i= N 2 S2 = Xi − X ) . (2-28) ( ∑ N − 1 i =1
Výběrový průměr a výběrový rozptyl jsou náhodné veličiny, pro které lze spočítat také jejich číselné charakteristiky, například střední hodnotu nebo rozptyl. Nechť rozdělení veličin z výběru má střední hodnotu µ a rozptyl σ 2 . Je žádoucí, aby střední hodnota výběrového
průměru byla shodná se střední hodnotou veličin výběru, tj. E { X } = µ . Této vlastnosti výběrové charakteristiky se říká nestranný (nebo nevychýlený nebo anglicky unbiased) odhad příslušného parametru. Jestliže střední hodnota výběrového průměru není rovna střední hodnotě náhodné veličiny, pak se odhad označuje jako vychýlený (anglicky biased) nebo že není 9
nestranný. Lze dokázat, že právě S 2 je nestranný odhad rozptylu, tj. E { S 2 } = σ 2 . Další výhodnou vlastností je to, že rozptyl odhadu charakteristik se s rostoucím rozsahem výběru snižuje. Lze dokázat, že například platí D{ X } = σ 2 N . Při označení odhadu jako vychýleného nebo nestranného není podstatný rozsah výběru. Odhad parametrů rozdělení pravděpodobnosti je na rozsahu výběru přirozeně závislý. Jestliže odhad konverguje pro N → +∞ ke skutečné hodnotě parametru, pak se takový odhad nazývá konzistentní. Odhad tedy nemusí být například nestranný, přestože je konzistentní. Výběrové charakteristiky X a m2 , související s dříve definovanými momenty, jsou rovny přímo tzv. bodovým odhadům parametrů µ a σ 2 normálního rozdělení. Tato metoda výpočtu bodových odhadů parametrů se opírá o výpočet výběrového průměru a rozptylu. Pro odhad parametrů existují také další metody, ze kterých lze zmínit například metodu maximální věrohodnosti.
10
2.5 Transformace náhodných veličin 2.5.1 Lineární transformace Nechť jsou známy střední hodnota a rozptyl náhodné veličiny ξ a nechť je tato náhodná veličina lineárně transformována podle vztahu η = k ξ + q , kde k, q jsou konstanty, na náhodnou veličinu η . Lze dokázat, že střední hodnota a rozptyl náhodné veličiny η jsou následující E { η} = E {k ξ + q} =
+∞
∫ (k x + q) f
ξ
( x ) dx = k E { ξ} + q ,
(2-29)
−∞
) } = E {( k ξ + q − E {k ξ + q}) } = {( = E {( k ξ + q − k µ − q ) } = E {k ( ξ − µ ) } = k E {( ξ − µ ) } = k D{ ξ} .
D{ η} = E η − E { η}
2
2
2
2
2
2
2
(2-30)
2
Lineární transformace podle následujícího vzorce
Ξ=
ξ − E { ξ} D{ ξ}
,
(2-31)
D{ ξ} a q = − E { ξ}
ve kterém k = 1
D{ ξ} , se nazývá se normalizace. Náhodná veličina
s obecnou střední hodnotou a rozptylem se převede na náhodnou veličinu s nulovou střední hodnotou a jednotkovým rozptylem, tj. platí E { Ξ} = 0 a D{ Ξ} = 1 . Lineární transformace nezmění funkční průběh hustoty pravděpodobnosti. 2.5.2 Nelineární transformace Nelineární transformace na rozdíl od lineární transformace funkční průběh hustoty pravděpodobnosti ovlivní. Nechť například výchozí náhodná veličina ξ je transformována na veličinu
Ξ
funkcí
Ξ = ϕ( ξ )
s inverzním tvarem
pravděpodobností elementů f ξ ( x ) dx = f Ξ ( y ) dy vyplývá
(
f Ξ ( y) = f ξ ψ( y)
) dψdy( y) .
ξ = ϕ −1 ( Ξ) = ψ ( Ξ) , pak z rovnosti
(2-32)
Transformační vzorec je platný jen pro jednoznačný průběh inverzní funkce ξ = ψ ( Ξ) . Pro mnohoznačnou funkční závislost je třeba definiční obor veličiny rozdělit na několik úseků s jednoznačnými průběhy ξ = ψ ( Ξ) , pro každý úsek transformovat zvlášť a dílčí výsledky sečíst. Nelineární transformace má význam pro generování náhodných veličin se zadanou hustotou pravděpodobnosti z jiné náhodné veličiny s jinou hustotou pravděpodobnosti, kterou je schopen generátor náhodných čísel vytvářet.
11
Příklad: Nechť je generována náhodná veličina rovnoměrně rozdělená náhodná veličina na intervalu od 0 do 1. Tuto náhodnou veličinu je třeba transformovat na veličinu s normálním rozdělením o střední hodnotě nula a směrodatné odchylce rovné jedné. Hustoty pravděpodobnosti výchozí a transformované veličiny jsou následující ⎧⎪1, x ∈ 0, 1 f ξ ( x) = ⎨ , ⎪⎩ 0 x ∉ 0, 1
⎛ y2 ⎞ 1 exp⎜ − ⎟ . f Ξ ( y) = ⎝ 2⎠ 2π
(2-33)
Řešení: Pro hodnoty náhodné veličiny ξ z intervalu od 0 do 1 platí ⎛ y 2 ⎞ dψ ( y ) 1 exp⎜ − ⎟ = . dy ⎝ 2⎠ 2π
(2-34)
Transformační funkce se ψ ( y ) získá integrací předchozí diferenciální rovnice y
∫
−∞
⎛ y2 ⎞ 1 exp⎜ − ⎟ dy + C = ψ ( y ) , ⎝ 2⎠ 2π
(2-35)
ve které je integrační konstanta C = 0 a transformační funkce má tvar pravděpodobnostního integrálu, tj. ψ ( y ) = Φ( y ) . Výsledku tohoto příkladu lze použít pro návrh generátoru náhodných čísel s normálním rozdělením.
2.6 Dvojrozměrné a vícerozměrné veličiny 2.6.1 Distribuční funkce a hustota vícerozměrné náhodné veličiny Výše uvedené vztahy se týkaly jednorozměrné náhodné veličiny. Vícerozměrnou náhodnou veličinu lze považovat za vektor, označený například ξ , jehož složky, ξ1 , ξ 2 , ..., ξ n , jsou jednorozměrné náhodné veličiny. Distribuční funkce této vícerozměrné náhodné veličiny je definována vztahem
Fξ1,ξ 2 ,...,ξn ( x1 , x2 ,..., xn ) = P{ξ1 ≤ x1 , ξ 2 ≤ x2 ,..., ξ n ≤ xn } ,
(2-36)
podle kterého se jedná o pravděpodobnost průniku celkem n dílčích jevů, a to ξ1 ≤ x1 , ξ 2 ≤ x2 ,..., ξ n ≤ xn . Distribuční funkce vícerozměrné náhodné veličiny má obdobné jako jednorozměrná náhodná veličina: 1. Pro každou n-tici x1 , x2 , ..., xn platí 0 ≤ F ( x1 , x2 ,..., xn ) ≤ 1 .
2. F ( x1 , x2 ,..., xn ) je neklesající funkce každé své proměnné. 3. Fξ1,...ξn ( x1 ,..., − ∞,..., xn ) = 0 . 4. Fξ1,...,ξ 2 ( + ∞,...,+∞) = 1 .
Náhodná proměnná ξ1 , ξ 2 , ..., ξ n má rozdělení spojitého typu, existuje-li nezáporná
reálná funkce f ξ1,...,ξn ( x1 ,..., xn ) taková, že pro všechna reálná x1 , ..., xn platí
12
+∞
+∞
−∞
−∞
Fξ1,...,ξ 2 ( x1 ,..., xn ) = ∫ ... ∫ f ξ1,...,ξ 2 (t1 ,..., t n )dt1 ... dt n
(2-37)
Reálná funkce f ξ1,...,ξn ( x1 ,..., xn ) se nazývá hustota pravděpodobnosti (stručněji hustota) nebo sdružená hustota pravděpodobnosti vícerozměrné náhodné veličiny ξ1 , ξ 2 , ..., ξ n . V bodech, kde existuje derivace, platí f ξ1,...,ξn ( x1 ,..., xn ) =
∂ n Fξ1,...,ξn ( x1 ,..., xn ) ∂x1 ... ∂xn
.
(2-38)
2.6.2 Marginální rozdělení
Pro další výklad bude uvažována dvourozměrná náhodná veličina. Kromě sdruženého rozdělení může být předmětem zájmu rozdělení jednotlivých náhodných veličin. Toto rozdělení se nazývá marginální. Jestliže Fξ1ξ 2 ( x1 , x2 ) je sdružená distribuční funkce veličin ξ1 , ξ 2 , pak je marginální
distribuční funkce Fξ1 ( x1 ) veličiny ξ1 dána vztahem Fξ1ξ 2 ( x1 , + ∞) = Fξ1 ( x1 ) .
(2-39)
Podobně pro marginální distribuční funkci Fξ2 ( x2 ) veličiny ξ 2 platí Fξ1ξ 2 ( + ∞, x2 ) = Fξ 2 ( x2 ) .
(2-40)
Pro rozměr náhodné veličiny větší než dvě je grafická reprezentace intervalů hodnot náhodné veličiny obtížná. Názorně lze však demonstrovat dvourozměrnou náhodnou veličinu a její hustotu, jak je zřejmé z obr. 5.
Obr. 5. Dvourozměrná hustota pravděpodobnosti
13
Objem tělesa s body, které mají jednotlivé souřadnice v rovině x1 x 2 menší souřadnice než jsou souřadnice bodu
( X1, X 2 )
a které je omezeno rovinou x1 x 2 a plochou f ( x1 , x 2 ) , určuje
velikost dvourozměrné distribuční funkce. Integrační oblast tvoří v tomto případě jeden kvadrant roviny x1 x 2 se středem v bodě ( X 1 , X 2 ) . Pro jiné vymezení oblasti hodnot náhodných veličin se při výpočtu pravděpodobnosti jejich výskytu postupuje shodně, tj. vypočte se objem tělesa nad příslušnou oblastí s omezením plochou f ( x1 , x 2 ) . Pro rozklad pravděpodobnosti dvojrozměrné veličiny na výraz obsahující pravděpodobnosti jednorozměrných veličin lze užít obecného pravidla o pravděpodobnosti průniku jevů
{ = P{[ ξ
} { ≤ x ]} P{(ξ
} ≤ x )} ,
P{ξ1 ≤ x1 , ξ 2 ≤ x2 } = P (ξ1 ≤ x1 ) P (ξ 2 ≤ x2 )(ξ1 ≤ x1 ) = 2
2
1 ≤ x1 )( ξ 2
(2-41)
2
s podmíněnými pravděpodobnostmi dílčích jevů, ze kterého plyne, že distribuční funkci dvojrozměrné veličiny lze vyjádřit jako součin marginální distribuční funkce a podmíněné distribuční funkce
(
)
(
)
(2-42)
(
)
(
)
(2-43)
Fξ1ξ 2 ( x1 , x2 ) = Fξ1 ( x1 ) Fξ 2 ξ1= x1 x2 x1 = Fξ 2 ( x2 ) Fξ1 ξ 2 = x1 x1 x2 .
Podobné vztahy platí pro hustoty f ξ1ξ 2 ( x1 , x2 ) = f ξ1 ( x1 ) f ξ 2 ξ1= x1 x2 x1 = f ξ 2 ( x2 ) f ξ1 ξ 2 = x1 x1 x2 .
Jestliže jsou jednotlivé složky popisované dvourozměrné náhodné veličiny vzájemně nezávislé, pak platí
Fξ1 ( x1 ) = Fξ1 ξ 2 = x1 ( x1 x 2 ), f ξ1 ( x1 ) = f ξ1 ξ 2 = x1 ( x1 x 2 ),
Fξ 2 ξ1= x1 ( x 2 x1 ) = Fξ 2 ( x 2 ),
f ξ 2 ξ1= x1 ( x 2 x1 ) = f ξ 2 ( x 2 )
(2-44)
a proto Fξ1ξ 2 ( x1 , x2 ) = Fξ1 ( x1 ) Fξ 2 ( x2 ),
f ξ1ξ 2 ( x1 , x2 ) = f ξ1 ( x1 ) f ξ 2 ( x2 ) .
(2-45)
2.6.3 Číselné charakteristiky vícerozměrných náhodných veličin
Pro vícerozměrné náhodné veličiny jsou definovány také momenty. Počáteční moment k = i + j -tého řádu je dán vztahem M ij = E {ξ ξ
i j 1 2
+∞ +∞
}= ∫ ∫x x
i j 1 2
f ξ1ξ 2 ( x1 , x2 ) dx1dx2 .
(2-46)
−∞−∞
Praktický význam má jen centrální moment druhého řádu m11 . Jeho definice s použitím operátoru střední hodnoty je následující
{
+∞ +∞
} ∫ ∫ ( x − µ )( x
m11 = E (ξ1 − µ1 )(ξ 2 − µ 2 ) =
1
1
−∞−∞
14
2
− µ 2 ) f ξ1ξ 2 ( x1 , x2 ) dx1dx2 ,
(2-47)
kde střední hodnoty dílčích složek jsou vypočteny pomocí marginálních hustot pravděpodobnosti µ1 = E {ξ1} =
+∞
+∞
−∞
−∞
∫ x1 f ξ1 ( x1 ) dx1 , µ 2 = E {ξ 2 } =
∫x
2
f ξ 2 ( x2 ) dx2 .
(2-48)
Lze dokázat, že pro nezávislé náhodné veličiny je počáteční moment m11 = 0 . K hodnocení souvislosti obou složek dvourozměrné náhodné veličiny, tj. jejich vzájemnou statistickou vazbu, se používá koeficient korelace m11 , m20m02
ρξ1ξ 2 =
(2-49)
kde momenty druhého řádu m20 a m02 lze rovněž určit pomocí marginálních hustot pravděpodobnosti m20 = D{ξ1} =
+∞
m02 = D{ξ 2 } = 1 − µ 1 ) f ξ1 ( x1 ) dx1 ,
∫ (x
2
−∞
+∞
∫ (x
− µ 2 ) f ξ 2 ( x2 ) dx2 .(2-50) 2
2
−∞
Příklad:
Nechť mezi složkami dvourozměrné náhodné veličiny platí ξ 2 = k ξ1 + q , kde k,q jsou konstanty. Určete koeficient korelace! Řešení: Marginální hustotu pravděpodobnosti náhodné veličiny ξ1 lze označit
f ξ1 ( x1 ) .
Podmíněná hustota pravděpodobnosti náhodné veličiny ξ 2 za podmínky, že platí ξ1 = x1 je následující
(
) (
)
f ξ 2 ξ1= x1 x2 x1 = δ x2 − ( k x1 − q ) .
(2-51)
Ve vzorci byla použita Diracova funkce, protože první složka ξ1 je známá (jak vyplývá z podmínky) a druhá složka přestává být proto náhodnou veličinou. Jak bylo již dříve uvedeno, pro deterministické veličiny je vhodným modelem jejich hustoty pravděpodobnosti Diracova funkce, protože je mimo deterministickou hodnotu nulová. Dvourozměrnou hustotu pravděpodobnosti lze proto vyjádřit ve tvaru
(
)
(
)
f ξ1ξ 2 ( x1 , x2 ) = f ξ1 ( x1 ) f ξ 2 ξ1= x1 x2 x1 = f ξ1 ( x1 )δ x2 − ( k x1 + q ) .
Podle vzorce pro centrální moment m11 platí +∞ +∞
m11 =
∫ ∫ (x ∫ ∫ (x
−∞−∞
)
− µ 1 )( x 2 − µ 2 ) f ξ1 ( x1 ) f ξ 2 ξ1= x1 x 2 x 2 dx1dx 2 =
1
− µ 1 )( x 2 − µ 2 ) f ξ1 ( x1 )δ x 2 − ( k x1 + q ) dx1dx 2 =
+∞+∞
=
(
1
−∞−∞
(
)
15
(2-52)
+∞
=
∫ (x
1
− µ 1 )( k x1 + q − µ 2 ) f ξ1 ( x1 )dx1 =
−∞
+∞
q − µ2 ⎞ ⎛ = k ∫ ( x1 − µ 1 )⎜ ( x1 − µ 1 ) + µ 1 + ⎟ f ( x )dx = ⎝ k ⎠ ξ1 1 1 −∞
(2-53)
+∞ ⎞ ⎛ +∞ q − µ2 ⎞ 2 ⎛ = k ⎜ ∫ ( x1 − µ 1 ) f ξ1 ( x1 )dx1 + ∫ ( x1 − µ 1 )⎜ µ 1 + ⎟ f ξ1 ( x1 )dx1 ⎟ = ⎝ k ⎠ ⎠ ⎝ −∞ −∞
= k σ 12 + 0 = k σ 12 , kde σ 12 = m20 je rozptyl náhodné veličiny ξ1 . Náhodná veličina ξ 2 vznikne lineární transformací náhodné veličiny ξ1 , proto její rozptyl je σ 22 = k 2 σ 12 = m02 . Koeficient korelace je tedy následující ρ ξ1ξ 2 =
m11 m20 m02
k σ 12
=
k σ 12
=
σ 12 σ 22
σ 12 k 2 σ 12
k . k
=
(2-54)
Výsledek závisí na znaménku koeficientu k , pro kladnou hodnotu je koeficient korelace +1 a pro zápornou hodnotu -1. 2.6.4 Charakteristiky součtu náhodných veličin
Nechť dvourozměrná náhodná veličina má hustotu pravděpodobnosti f ξ1ξ 2 ( x1 , x 2 ) . Na základě znalosti této hustoty je třeba vypočítat hustotu rozdělení součtu jednotlivých složek dvourozměrné náhodné veličiny, tj. náhodné veličiny η = ξ 1 + ξ 2 . Distribuční funkce náhodné veličiny η vyplývá z příslušné pravděpodobnosti výskytu menší hodnoty součtu než je proměnná z Fξ1+ ξ 2 ( z ) = P{ξ 1 + ξ 2 ≤ z} =
+∞
∫∫
−∞
z − x1
−∞
f ξ1ξ 2 ( x1 , x 2 )dx 2 dx1 .
(2-55)
Hustota rozdělení pravděpodobnosti součtu náhodných veličin je dána derivací distribuční f ξ1+ ξ 2 ( z ) =
dFξ1+ ξ 2 ( z ) dz
+∞
=
∫f
ξ1+ ξ 2
( x , z − x )dx 1
1
1
.
(2-56)
−∞
Jestliže jednotlivé složky součtu budou vzájemně nezávislé, pak hustota jejich součtu bude dána konvolucí jejich složek f ξ1+ ξ 2 ( z ) =
+∞
∫f
−∞
+∞
ξ1+ ξ 2
( x , z − x )dx = ∫ f ( x ) f ( z − x )dx . 1
1
ξ1
1
1
ξ2
1
1
(2-57)
−∞
Jak lze dokázat, střední hodnota a rozptyl součtu zmíněných náhodných veličin pro obecnou hustotu pravděpodobnosti je následující E { η} = E {ξ1} + E {ξ 2 } ,
(2-58)
D{ η} = D{ξ1} + D{ξ 2 } + 2ρξ1ξ 2 D{ξ1} D{ξ 2 } .
(2-59)
16
Pro nezávislé náhodné veličiny, tj. ρξ1ξ 2 = 0 , je rozptyl jejich součtu roven součtu jejich rozptylů. Příklad: k
Určete hustotu pravděpodobnosti součtu náhodných veličin
∑τ i =1
i
, kde τ i , i = 1, 2,..., k
jsou nezávislé náhodné veličiny s exponenciálním rozdělením, tj. s hustotou pravděpodobnosti f 1 ( t ) = λ exp( − λt ) pro t ≥ 0 a f 1 ( t ) = 0 pro t < 0. Řešení: Ze vzorce pro součet nezávislých náhodných veličin vyplývá vztah mezi hustotou pravděpodobnosti součtu k a k − 1 dílčích náhodných veličin, tj. mezi f k ( t ) a f k −1 ( t ) platí fk (t) =
+∞
∫f
k −1
( τ) f 1 ( τ − t ) dτ .
(2-60)
−∞
Poslední vzorec představuje konvoluci originálů z Laplaceovy transformace. Pro Laplaceovu transformaci posloupnosti funkcí f k ( t ) , k = 1, 2,... je zřejmé, že obraz L{ f k ( t )} se bude od obrazu
L{ f k −1 ( t )}
lišit
o
součinitel
L{ f 1 ( t )} = L{ λ exp( − λt )} = λ ( s + λ ) ,
L{ f k ( t )} = λk ( s + λ ) . Podle tabulek Laplaceovy transformace plyne
proto
k
( λ t ) k −1 fk (t) = λ exp( − λt ) . ( k − 1) !
(2-61)
Distribuční funkce příslušná hustotě f 1 ( t ) je F1 ( t ) = 1 − exp( − λt ) a pro distribuční funkci, která přísluší hustotě f k ( t ) platí t ⎡ ( λt ) k ⎤ ( λ t ) k −1 ( λt ) k exp( − λt ) dt = ⎢ exp( − λt ) ⎥ + ∫ λ exp( − λt ) dt = Fk ( t ) = ∫ λ ( k − 1) ! k! −∞ −∞ ⎣ k! ⎦ t
t
−∞
=
( λt )
k
k!
exp( − λt ) + Fk +1 ( t )
Fk +1 ( t ) = Fk ( t ) −
( λt ) k k!
exp( − λt )
(2-62)
Poslední vztah představuje rekurzivní vzorec, podle kterého s rostoucím k klesá pravděpodobnost toho, aby součet výše uvedených náhodných veličin byl menší než je časový interval délky t. Poznámka:
Shodou okolností následující výraz je Poissonův vzorec
Pk ( t ) =
( λt ) k k!
exp( − λt ) ,
(2-63)
udávající pravděpodobnost toho, že počet k výše popsaných intervalů s náhodnou délkou s hustotou rozdělení f 1 ( t ) = λ exp( − λt ) lze za sebou umístit do časového intervalu délky t. K tomu lze ještě dodat, že parametr λ má význam převrácené hodnoty střední délky zmíněných intervalů 17
+∞
T=
+∞
1
∫ t f ( t ) dt = ∫ t λ exp( − λt ) dt = λ . 1
−∞
(2-64)
0
2.6.5 Centrální limitní věta
V předchozím odstavci byla určena hustota, střední hodnota a rozptyl součtu dvou náhodných veličin bez omezení jejích vlastností. Tzv. centrální limitní věta ze zabývá problémem vlastností součtu vzájemně nezávislých náhodných veličin o obecném počtu n, tj. n
∑ξ i =1
i
. Většina jevů v různých přírodních a technických systémech je totiž ovlivněna velkým
počtem vzájemně nezávislých dílčích činitelů, které aditivně působí na některý ukazatel jejich průběhu, jehož rozdělení pravděpodobnosti je třeba zjistit. Pro velká n lze za dosti obecných podmínek aproximovat rozdělené součtu náhodných veličin rozdělením normálním. Tímto normálním rozdělením jako asymptotickým rozdělením se zabývají centrální limitní věty. Nejprve je předpokládáno, že rozdělení a parametry dílčích náhodných veličin součtu jsou shodné, a proto také jejich střední hodnota a rozptyl jsou shodné. V tomto případě střední hodnota a rozptyl součtu podle výše uvedených vzorců jsou dány vztahy ⎧n ⎫ n E ⎨∑ ξ i ⎬ = ∑ E {ξ i } = n µ , ⎩ i =1 ⎭ i = 1
⎧n ⎫ n D⎨∑ ξ i ⎬ = ∑ D{ξ i } = n σ 2 . ⎩ i =1 ⎭ i = 1
(2-65)
Lze dokázat, že pro n → ∞ konverguje rozdělení součtu k normálnímu rozdělení, což má důležitý praktický význam, protože konvergence je poměrně rychlá, a proto lze uvést ⎛ ( x − nµ ) 2 ⎞ 1 ⎟. f ( x) ≈ exp⎜⎜ − 2 ⎟ n σ 2 σ 2 πn ⎝ ⎠
(2-66)
Například generátor náhodných čísel s normálním rozdělením může sčítat jen 12 čísel s rovnoměrným rozdělením a rozdělení součtu těchto čísel se je prakticky blíží k normálnímu rozdělení. Pro rovnoměrné rozdělení pravděpodobnosti náhodné veličiny v intervalu nula až jedna je střední hodnota tohoto součtu rovna šesti a rozptyl roven jedné. Normalizované rozdělení lze tedy získat pouhým odečtením šestky od zmíněného součtu 12 náhodných veličin. Generování náhodného čísla z uvedeného intervalu patří mezi základní funkce mnoha programovacích jazyků. Je třeba si všimnout, že interval hodnot je omezen na ± 6σ . Vlastnostmi součtu náhodných veličin se zabývalo mnoho matematiků za obecnějších podmínek ve srovnání s těmi, které byly výše uvedeny ve velmi zjednodušené verzi. V některých případech k normálnímu rozdělení konvergují také součty veličin s různým rozdělením a parametry. Avšak ukázalo se také, že za určitých podmínek může součet konvergovat k jinému rozdělení.
18
3. Charakteristiky náhodných procesů V této kapitole je popsána teorie náhodných procesů. Zájemce se může dovědět podstatně více ze speciální odborné literatury [1,2,6,30,31]. Ke studiu jsou zapotřebí rovněž základy teorie signálů [7,40]. Především je soustředěn zájem na vyhodnocení korelační funkce a výkonové spektrální hustoty náhodných procesů a jejich změny průchodem lineárními dynamickými soustavami.
3.1 Typy náhodných procesů Jak bylo uvedeno v úvodní kapitole, stochastické (náhodné) procesy lze rozdělit na stochastické procesy se spojitým časem a stochastické procesy s diskrétním časem. Stochastický proces s diskrétním časem je nazýván také stochastickou posloupností. Oba typy náhodných procesů modelují reálný svět. Z důvodu technických možností záznamu stochastických procesů jsou procesy se spojitým časem vzorkovány, nejčastěji konstantní vzorkovací periodou, což představuje jejich převod na náhodné posloupnosti.
Obr. 6. Rozdělení časových průběhů náhodných procesů K pojmenování stochastického procesu se rovněž používá řecké písmeno a samozřejmě v zápisu funkce je obsažena nezávisle proměnná, kterou je čas t . Pro náhodné procesy se spojitým časem se používá označení ξ( t ) , zatímco pro náhodné procesy s diskrétním časem se čas umísťuje do indexu řeckého písmena, tj. ξ t . Konkrétní záznam časového průběhu stochastického procesu se nazývá realizace. K pojmenování realizace se používá latinka, tj. například x( t ) , resp. xt . Veličiny s indexem mohou označovat rovněž vzorky náhodného procesu se spojitým časem. Rozdíl v pojmenování náhodného procesu a jeho realizace však není striktně dodržován.
Obr. 7. Čtyři realizace náhodného procesu Skupina realizací náhodného procesu ve zvoleném časovém okamžiku představuje skupinu realizací jedné náhodné veličiny. V určitém časovém okamžiku, například t1 ,
19
představuje proto náhodná funkce náhodnou veličinu, tj. ξ(t1 ) . Příklad se čtyřmi realizacemi náhodného procesu je uveden na obr. 7. Pro tuto náhodnou veličinu ξ(t1 ) s hustotou rozdělení
f ξ ( t 1) ( x1 , t1 ) lze vypočítat výběrové charakteristiky a z nich pak odhadnout střední hodnotu
µ(t1 ) , rozptyl σ 2 (t1 ) a další. Samozřejmě tyto charakteristiky jsou obecně funkcemi času, což je zdůrazněno v zápise hustoty pravděpodobnosti. Pro dva časové okamžiky, jmenovitě t1 a t 2 , se jedná o dvě náhodné veličiny s určitou hustotou pravděpodobnosti f ξ ( t 1) ξ ( t 2 ) ( x1 , x2 , t1 , t 2 ) . Pro
tyto náhodné veličiny se lze zajímat například o koeficient korelace. Hustota pravděpodobnosti dvourozměrné náhodné veličiny je obecně funkcí zmíněných dvou časových okamžiků. Pro praxi má zvláštní význam případ, kdy uvedené základní číselné charakteristiky, tj. střední hodnota a rozptyl, na čase nezávisí a koeficient korelace je funkcí jen rozdílu t 2 − t1 . To znamená, že pro hustoty pravděpodobností platí f ξ ( t 1) ( x1 , t1 ) = f ξ ( t 1) ( x1 ) ,
f ξ ( t 1)ξ ( t 2 ) ( x1 , x2 , t1 , t 2 ) = f ξ ( t 1)ξ ( t 2 ) ( x1 , x2 , t 2 − t1 ) .
(3-1)
Náhodné procesy s těmito vlastnostmi se nazývají stacionární. Naproti tomu v případě závislosti uvedených charakteristik na čase se jedná o náhodné procesy nestacionární. V teorii se rozlišují striktně a slabě stacionární procesy. Pro slabě stacionární procesy platí výše uvedená podmínka pro dvourozměrné rozdělení. Striktně stacionární procesy mají shodná také vícerozměrná rozdělení pro různá posunutí v čase. Souběžný záznam několika realizací náhodného procesu není příliš praktický, a proto tuto skupinu realizací mohou za určitých podmínek nahradit různé úseky jedné časové realizace. Tato operace bude bez vlivu na výsledek výpočtu základních číselných charakteristik pro procesy stacionární. Pro tyto procesy je jejich střední hodnota nezávislá na čase. Jak je zřejmé z obr. 8, příklad na obr. 7 byl vytvořen rozdělením jedné realizace náhodného procesu na čtyři úseky, a proto jednotlivé realizace z následujícího obrázku na sebe plynule navazují.
Obr. 8. Realizace stacionárního náhodného procesu Podle popsaného postupu je tedy ve skutečnosti výpočet střední hodnoty ze skupiny realizací nahrazen průměrem časových vzorků. Podobně lze vypočítat rozptyl a další základní charakteristiky jednorozměrné náhodné veličiny. Obecně je při tomto postupu nahrazen výpočet charakteristik ze skupiny realizací charakteristikami časového průběhu. Tato záměna je možná u tzv. ergodických procesů.
20
Obr. 9. Rozdělení typů náhodných procesů Náhodné procesy lze tedy dělit na stacionární a nestacionární a nebo na ergodické a neergodické. Je zřejmé, že procesy ergodické a stacionární procesy mají určité společné vlastnosti. Diskuse jejich případných rozdílů je snad vhodným tématem pro specialisty, matematiky. Praktický inženýr však může něco užitečného spočítat jen pro tzv. stacionární ergodické procesy, a proto tyto procesy budou předmětem analýz celého tohoto učebního textu.
3.2 Střední hodnota a rozptyl stacionárních a ergodických procesů Střední hodnota z jediné realizace ergodického náhodného procesu se spojitým časem se vypočte podle vzorce T
1 µ = E { x( t )} = lim ∫ x( t ) dt . T →+∞ T 0
(3-2)
Rozptyl ergodického náhodného procesu lze vypočítat z časového průběhu podle následujícího vzorce T
1 2 ∫0 ( x( t ) − µ) dt . T →+∞ T
σ = D{ x( t )} = lim 2
(3-3)
Pro náhodné procesy s diskrétním časem se ve vzorcích změní integrály na sumy, proto
1 K xt , ∑ K →+∞ K t =1
µ = E {xt } = lim
1 K 2 xt − µ ) . ( ∑ K →+∞ K t =1
σ 2 = D{xk } = lim
(3-4)
3.2.1 Centrované náhodné procesy
Při vyhodnocování náhodných procesů je používáno centrování, což znamená úpravu realizace procesu x( t ) na centrovaný proces ∆ x( t ) podle následujícího vzorce ∆ x( t ) = x( t ) − E { x( t )} .
(3-5)
Tento signál má nulovou střední hodnotou.
3.3 Autokorelační funkce Střední hodnota a rozptyl jsou charakteristikami prvního řádu. V této kapitole budou definovány charakteristiky náhodných signálů druhého řádu, a to korelační funkce, která je ve skutečnosti počátečním momentem druhého řádu m11 dvojrozměrné náhodné veličiny. Jestliže je hodnocena závislost hodnot jednoho náhodného procesu ve dvou různých časových okamžicích, pak se jedná o autokorelační funkci (auto-correlation function - ACF). V případě hodnocení závislosti dvou náhodných procesů ve dvou různých časových okamžicích, jedná
21
se o křížovou (vzájemnou) korelační funkce. Podobně jako u definice střední hodnoty lze vyjít při definici autokorelační funkce z hustoty rozdělení pravděpodobnosti. Platí
{
+∞ +∞
} ∫ ∫xx f
Rξ ( t 1) ξ ( t 2 ) (t1 , t 2 ) = E ξ(t1 )ξ(t 2 ) =
1 2
−∞−∞
ξ ( t 1) ξ ( t 2 )
( x , x , t , t ) dx dx 1
2
1
2
1
2
,
(3-6)
kde f ξ ( t 1) η( t 2 ) ( x1 , x2 , t1 , t 2 ) představuje dvourozměrnou hustotu rozdělení pravděpodobnosti dvou vzájemně odlišných časových okamžicích. Podmínkou stacionarity náhodných procesů byla závislost hustoty pravděpodobnosti na vzájemném posunu časových okamžiků t1 a t2 . Autokorelační funkce stacionárního procesu je proto funkcí vzájemného posunutí τ mezi zmíněnými časovými okamžiky, Rξ ( t 1) ξ ( t 2 ) (t1 , t 2 ) = Rξ ( t 1) ξ ( t 2 ) (t 2 − t1 ) = Rξ ( t 1) ξ ( t 2 ) ( τ ) . Toto posunutí nebo také časový interval mezi časovými okamžiky t1 a t2 má v angličtině označení lag a užívá se v poisu grafů korelačních funkcí, které jsou prezentovány MATLABem. Pro ergodické náhodné procesy lze autokorelační funkci vypočítat ze střední hodnoty součinu dvou vzájemně shodných avšak v čase posunutých realizací náhodného procesu. Protože jde o realizaci x( t ) , index autokorelační funkce je xx , tj. Rxx ( τ) = E {x( t ) x( t + τ)} = lim
T →+∞
T
1 x( t ) x( t + τ) dt . T ∫0
(3-7)
U tohoto vzorce je předpokládáno, že náhodný proces je definován pro čas od 0 do + ∞ . Pro ergodické náhodné procesy s diskrétním časem se ve vzorci změní integrál na sumu, proto Rxx ( τ) = lim
K →+∞
1 K ∑x x . K t =1 t t + τ
(3-8)
Autokorelační funkce náhodného procesu s diskrétním časem je rovněž diskrétní. V posledním vzorci je posunutí τ celé číslo. Autokorelační funkce obecného náhodného procesu je sudá, Rxx ( τ) = Rxx ( − τ) . Autokorelační funkce centrovaného náhodného procesu souvisí s autokorelační funkcí necentrovaného procesu podle vzorce T
1 R∆x∆x ( τ) = lim ∫ ( x( t ) − µ )( x( t + τ ) − µ ) dt = Rxx ( τ ) − µ 2 , T →+∞ T 0
(3-9)
jak je zřejmé z obr. 10. Pro autokorelační funkci centrovaných náhodných procesů se užívá rovněž označení kovarianční funkce.
22
Obr. 10. Autokorelační funkce obecného náhodného procesu Pro nulové posunutí je autokorelační funkce centrovaného náhodného procesu shodná s jeho rozptylem, R∆x∆x ( 0) = σ 2x , protože R∆x∆x ( 0) = lim
T →+∞
T
1 ∆ x 2 ( t ) dt . T ∫0
(3-10)
Rxx ( 0) ≥ Rxx ( τ) , což lze dokázat výpočtem střední hodnoty výrazu
Obecně platí, že
( x( t ) − x( t + τ) )2 = x 2 ( t ) + x 2 ( t + τ) − 2 x( t ) x( t + τ) . Levá strana rovnice je jako druhá mocnina nezáporná, a proto je její střední hodnota také nezáporná. Střední hodnota pravé strany vede na výraz, který má být nezáporný, a proto E { x 2 ( t )} + E { x 2 ( t + τ )} − 2 E { x( t ) x( t + τ)} ≥ 0 , 2 Rxx ( 0) − 2 Rxx ( τ) ≥ 0.
(3-11)
Pro korelační funkci centrovaného náhodného procesu se definuje tzv. normovaná autokorelační nebo přesněji kovarianční funkce ρ ∆x∆x ( τ) =
R∆x∆x ( τ) , σ2
(3-12)
která nabývá pro nulové posunutí hodnoty jedna. Hodnoty normované autokorelační funkce mají význam korelačních koeficientů mezi vzájemně posunutými hodnotami náhodného procesu. Je zřejmé. že čím jsou časově vzdálenější hodnoty vzorků náhodného procesu, tím je menší jejich vzájemná souvislost a tedy v absolutní hodnotě i koeficient korelace. Náhodné procesy lze zaznamenat po vzorkování s periodou ∆ t ve tvaru konečné posloupnosti jeho časově ekvidistantních vzorků, tj. xi , i = 1, 2,..., N . Autokorelační funkci lze v tomto případě vyhodnotit jen pro vzájemné posunutí, které je celočíselným násobkem periody vzorkování, tj. teoreticky pro τ = k ∆ t , k = 0, ± 1, ± 2,..., N − 1 . Integrál pro výpočet časové střední hodnoty se změní na sumu a pro součinitel 1 T je třeba respektovat počet sčítanců v sumě. Vzorec pro odhad autokorelační funkce tzv. přímou metodou je následující R$ xx ( k ∆ t ) =
1 N −k
N −k
∑x x i =1
i i+k
.
(3-13)
Tento odhad je však vychýlený (biased), protože jeho střední hodnota je
{
}
E R$ xx ( k ∆ t ) = (1 − k N ) Rxx ( k ∆ t ) .
(3-14)
23
Pouze pro k = 0 je odhad nestranný. Vychýlení odhadu roste s rostoucím k , a proto se výpočet omezuje jen pro k < N 10 . Korekce vychýlení spočívá v násobení korekčním faktorem N ( N − k ) . Přímá metoda byla po zavedení rychlé Fourierovy transformace nahrazena efektivnějším postupem, což bude popsáno v dalších kapitolách.
3.4 Vzájemná korelační funkce Obecná definice vzájemné korelační funkce (cross-correlation function - CCF) se týká dvou náhodných procesů ξ( t ) a η( t ) , tj.
{
+∞ +∞
} ∫ ∫ xy f
Rξ ( t 1) η( t 2 ) (t1 , t 2 ) = E ξ(t1 )η(t 2 ) =
−∞−∞
ξ ( t 1) η( t 2 )
( x, y, t , t ) dxdy , 1
2
(3-15)
kde f ξ ( t 1) η( t 2 ) ( x , y , t1 , t 2 ) je dvourozměrná hustota pravděpodobnosti. Pro stacionární náhodné procesy závisí hustota pravděpodobnosti na rozdílu časů t1 a t 2 , proto vzájemná korelační funkce stacionárního procesu je funkcí vzájemného posunutí mezi uvedenými časovými okamžiky, Rξ ( t 1) η( t 2 ) (t1 , t 2 ) = Rξ ( t 1) η( t 2 ) (t 2 − t1 ) = Rξ ( t 1) η( t 2 ) ( τ) .
(3-16)
Vzájemná korelační funkce ergodických náhodných procesů je závislá jen na rozdílu časových okamžiků t1 a t2 jako vzájemná korelační funkce stacionárních signálů. Ergodicita znamená možnost použití střední hodnoty součinu x( t ) y( t + τ) v čase k výpočtu autokorelační funkce T
1 Rxy ( τ) = E {x( t ) y( t + τ)} = lim ∫ x( t ) y( t + τ ) dt . T →+∞ T 0
(3-17)
Vzájemná korelační funkce není sudá a její maximum nemusí být pro nulové posunutí, τ = 0 . Posunutí pro maximum křížové korelační funkce představuje dopravní zpoždění mezi oběma náhodnými procesy. Pro vzájemnou korelační funkci centrovaných náhodných procesů se používá rovněž označení křížová kovarianční funkce. V definici vzájemné korelační funkce ergodických náhodných procesů s diskrétním časem se nahradí integrál sumou a posunutí je celým číslem. V indexu vzájemné korelační funkce je pořadí náhodných procesů xy . Pro opačné pořadí yx lze odvodit
{
}
Rxy ( τ) = E { x( t ) y( t + τ)} = E y(t1 ) x(t1 − τ ) = Ryx ( − τ ) ,
(3-18)
kde čas t byl nahrazen časem t1 = t − τ . Jak již bylo uvedeno, lze náhodné procesy zaznamenat jako konečné posloupnosti vzorkovaných hodnot xi , yi , i = 1, 2,..., N . Vzájemnou korelační funkci lze v tomto případě také vyhodnotit jen pro vzájemné posunutí, které je celočíselným násobkem periody vzorkování, tj. teoreticky pro τ = k ∆ t , k = 0, ± 1, ± 2,..., N − 1. Vzorec pro odhad vzájemné korelační funkce zmíněnou přímou metodou je následující
24
R$ xy ( k ∆ t ) =
1 N −k
N −k
∑x y i =1
i
i+k
.
(3-19)
Tento vzorec se rovněž používá k odhadu vzájemné korelační funkce vzorkovaných signálů. O nestrannosti odhadu lze uvést totéž jako pro odhad autokorelační funkce. Z důvodu přesnosti odhadu je velikost posunutí omezena na k < N 10 . 3.4.1 Vzájemná korelační funkce nezávislých náhodných procesů
Hustotu pravděpodobnosti nezávislých náhodných veličin rozložit na součin dvou dílčích hustot, tj. f ξ ( t 1) η( t 2 ) ( x , y , t1 , t 2 ) = f ξ ( t 1) ( x , t1 ) f η( t 2 ) ( y , t 2 ) . Z této vlastnosti lze odvodit, že vzájemná korelační funkce nezávislých náhodných procesů je dána součinem jejich středních hodnot
{
}
Rξ ( t 1) η( t 2 ) (t1 , t 2 ) = E ξ(t1 )η(t2 ) =
{ } {
⎛ +∞ ⎞ x f x , t ( ) ∫−∞ ξ(t 1) 1 ⎜⎝ −∞∫ y f η(t 2) ( y, t2 ) dy⎟⎠ dx = +∞
(3-20)
}
= E ξ(t1 ) E η(t 2 )
Pro stacionární centrované nezávislé náhodné procesy, tj. s nulovými středními hodnotami, je vzájemná korelační funkce rovna nule, R∆x∆y (t 2 − t1 ) = 0 . Náhodné procesy
s konstantní nebo nulovou vzájemnou korelační funkcí se také nazývají nekoherentní. 3.4.2 Autokorelační funkce součtu dvou nezávislých náhodných procesů
Vlastnost vzájemné korelační funkce nezávislých náhodných procesů umožňuje stanovit autokorelační funkci součtu dvou nezávislých náhodných procesů ξ( t ) + η( t ) .
{(
)(
)}
Rξ + η,ξ + η (t1 , t 2 ) = E ξ(t1 ) + η(t1 ) ξ(t 2 ) + η(t 2 ) =
{
} {
} {
} { } { } { } (t , t ) + E {ξ(t )} E {η(t )} + E {ξ(t )} E {η(t )}
= E ξ(t1 )ξ(t 2 ) + E ξ(t 2 ) E η(t1 ) + E ξ(t1 ) E η(t 2 ) + E η(t1 )η(t 2 ) = = Rξ ( t 1),ξ ( t 2 ) (t1 , t 2 ) + Rη( t 1) η( t 2 )
1
2
2
1
1
2
(3-21)
{ ( )} = E {η(t )} = 0 ,
Jestliže oba náhodné procesy jsou centrovány, tj. E ξ t1,2
1, 2
pak
autokorelační funkce součtu dvou nezávislých centrovaných stacionárních procesů je rovna součtu jejich dílčích korelačních funkcí Rξ + η,ξ + η ( τ) = Rξξ ( τ) + Rηη ( τ) .
(3-22)
25
3.5 Autokorelační funkce speciálních náhodných procesů 3.5.1 Bílý šum Náhodný signál se zvláštními vlastnostmi je bílý šum (white noise). Přestože tento signál je jen matematická abstrakce, je možné pomocí něj modelovat náhodné chyby, jejichž základní charakteristikou je úplná nahodilost a žádná korelace mezi vzájemně časově posunutými hodnotami. Další uplatnění má při popisu přenosových vlastností lineárních dynamických systémů. Bílý šum e( t ) s nulovou střední hodnotou a se spojitým časem má následující autokorelační funkci Ree ( τ) = E {e( t ) e( t + τ)} = σ 2e δ( τ) ,
(3-23)
kde σ 2e má význam rozptylu bílého šumu a δ( t ) je Diracova funkce. Jak bude ukázáno dále, spektrum bílého šumu má konstantní úroveň pro všechny frekvence. Vzorkovaný náhodný proces s vlastnostmi bílého šumu má nulovou střední hodnotu a v definici autokorelační funkce neužívá Diracovy funkce, ale konečnou hodnotu pro nulové posunutí, která je rovna rozptylu vzorkovaných hodnot bílého šumu ⎧σ e2 , k = 0 , Ree ( k ∆ t ) = E {ei ei + k } = ⎨ ⎩ 0, k ≠ 0 .
(3-24)
Rozdíl v definicích je zřejmý z obr. 11.
Obr. 11. Autokorelační funkce bílého šumu u spojitého a diskrétního náhodného procesu Definice bílého šumu se neopírá o určité rozdělení pravděpodobnosti. Požadavek na typ rozdělení je tedy dodatečný. Jestliže je jeho rozdělení normální, pak tento náhodný proces se nazývá gaussovský bílý šum. Na obr. 12 jsou dva průběhy realizací 500 vzorků bílého šumu s rovnoměrným a normálním rozdělením pravděpodobnosti. Na horním grafu je bílý šum s rovnoměrným rozdělením v intervalu od -0,5 do +0,5 a na spodním obrázku je centrovaný gaussovský bílý šum s rozptylem rovným jedné. Stupnice obou grafů jsou rozdílné. Gaussovský bílý šum se pohybuje v hranicích ± 3σ s pravděpodobností 97,3%. V časovém průběhu náhodného šumu se obvykle kumuluje množství dílčích vlivů, a proto pro jeho jednotlivé hodnoty, náhodné veličiny, je nejpřirozenější normální rozdělení pravděpodobnosti.
26
Obr. 12. Realizace bílého šumu s rovnoměrným a normálním rozdělením 3.5.2 Obecný telegrafní signál Obecný telegrafní signál je náhodný proces, u kterého se střídají dvě hodnoty, a to + a a − a . Délka intervalu mezi okamžiky změny je náhodná veličina mající tzv. exponenciální rozdělení, tj. hustota pravděpodobnosti délky tohoto intervalu je f 1 ( t ) = λ exp( − λt ) pro t ≥ 0 a f 1 ( t ) = 0 pro t < 0 . Jednotlivé délky jsou navzájem nezávislé. Velikost součinu x( t ) x( t + τ) hodnot, které jsou vzájemně posunuty o interval τ > 0 závisí na znaménku buď + a 2 a nebo − a 2 . Kladný výsledek je pro shodná znaménka u x( t ) a x( t + τ) . Naproti tomu − a 2 je pro opačná znaménka u x( t ) a x( t + τ) . Shoda znamének nastane, jestliže mezi časovými okamžiky t a t + τ se velikost x( t ) nezmění a nebo nastane sudý počet změn. Rozdílná znaménka jsou tehdy, jestliže mezi zmíněnými časovými okamžiky nastane lichý počet změn velikosti x( t ) .
Pravděpodobnost počtu k změn v časovém intervalu délky τ za uvedených podmínek pro délky intervalů mezi změnami je dána Poissonovým vzorcem. Celková pravděpodobnost nulového a sudého počtu změn je dána součtem řady +∞
( λτ) 2i exp( − λτ) . i = 0 ( 2i ) ! +∞
P + = ∑ P2i ( τ ) = ∑ i =0
(3-25)
Celková pravděpodobnost lichého počtu změn je dána součtem řady s členy o lichém pořadí
( λτ) 2i +1 P = ∑ P2i +1 ( τ) = ∑ exp( − λτ) . i =0 i = 0 ( 2i + 1) ! −
+∞
+∞
Výsledná autokorelační funkce je dána vzorcem 27
(3-26)
+∞ ( λτ) 2i ( λτ) 2i +1 2 Rxx ( τ) = a P − a P = a ∑ exp( − λτ) − a ∑ exp( − λτ) = i = 0 ( 2i ) ! i = 0 ( 2i + 1) ! 2
+
2
−
+∞
2
⎛ +∞ ( λτ) 2i +∞ ( λτ) 2i +1 ⎞ ⎟= = a 2 exp( − λτ) ⎜ ∑ −∑ ⎝ i = 0 ( 2i ) ! i = 0 ( 2i + 1) !⎠
(3-27)
⎛ +∞ ( − λτ ) i ⎞ ⎟ = a 2 exp( − λτ) exp( − λτ ) ⎝ i =0 i ! ⎠
= a exp( − λτ) ⎜ ∑ 2
V posledním vzorci lze doplnit absolutní hodnota posunutí τ , aby byl výsledek oproti výchozímu předpokladu zobecněn. Exponenciální průběh autokorelační funkce je typický pro řadu procesů. Rxx ( τ) = a 2 exp( − 2λ τ ) .
(3-28)
Příklad realizace obecného telegrafního signálu je na obr. 13. Graf je diskrétní časový průběh 4001 vzorku, který byl modelován tak, aby změna znaménka nastala s pravděpodobností 0.01.
Obr. 13. Realizace obecného telegrafního signálu 3.5.3 Harmonická funkce
Harmonická funkce je libovolně fázově posunuta sinusovka A cos( ωt + ϕ ) , kde A je amplituda, ω úhlová frekvence a ϕ je počáteční fáze. Tato funkce není náhodná, ale deterministická. Její vlastnosti jsou diskutovány, protože její vliv je v korelačních funkcích často pozorovatelný. Harmonická funkce s nenulovou frekvencí má nulovou střední hodnotu. Směrodatná odchylka harmonické funkce, která se nazývá také efektivní hodnota, souvisí s její amplitudou podle jednoduchého vztahu σ = A 2 = Aef . Efektivní hodnota vystupuje ve výpočetních vzorcích výkonu, např. střídavého elektrického proudu, ve druhé mocnině. Ve vzorci pro elektrický výkon je navíc součinitel měřítka, kterým je odpor pro výpočet výkonu z proudu nebo vodivost pro výpočet z napětí. Pro harmonickou funkci lze užitím vzorce (82) určit také její autokorelační funkci
28
T
1 Rxx ( τ) = lim ∫ A2 cos( ωt + ϕ ) cos(ω( t + τ) + ϕ )dt = T →+∞ T 0 1 A2 cos( 2ωt + ωτ + 2ϕ ) + cos( ωτ ) dt = T ∫0 2 T
= lim
T →+∞
(
)
⎡ sin( 2ωt + ωτ + 2ϕ ) ⎤ 1 ⎛ A2 cos( ωτ) + ⎢ = lim ⎜ T ⎥ T →+∞ T ⎜ 2ω ⎢⎣ ⎥⎦ ⎝ 2
⎞ ⎟ ⎟ 0⎠
T
A2 cos( ωτ) Rxx ( τ) = 2
(3-29)
Autokorelační funkce libovolně fázově posunutého harmonického signálu má vždy tvar funkce kosinus s periodou, která je shodná s periodou výchozího signálu. Ukázka je na obr. 14, ve kterém výchozí signál x( t ) má amplitudu rovnou jedné, tj. efektivní hodnotu 1 2 . Polovina druhé mocniny efektivní hodnoty je rovna 0.5, což je amplituda autokorelační funkce.
Obr. 14. Autokorelační funkce harmonického signálu
29
3.6
Použití Markovových řetězců k popisu náhodných procesů
Nástroje teorie Markovových řetězců jsou vhodné zvláště k popisu náhodných procesů s diskrétním časem [31]. V čase diskrétní náhodný proces je tvořen posloupností náhodných veličin ξ t , t = 0, 1,... , u kterých t znamená diskrétní čas, jehož změna o jednotku představuje jeden časový krok. Pro další rozbor bude předpokládáno, že náhodné veličiny nabývají konečný počet N hodnot, tj. jsou diskrétní ve svých hodnotách. Všechny možné hodnoty této veličiny je možné uspořádat do sloupcového vektoru
[
X = X 1 , X 2 ,..., X N
]
T
,
(3-30)
kde exponent [ ...] značí transponování vektoru nebo matice. Tento zápis je použit z důvodu úspornosti zápisu v textu. Index i u hodnot X i může být považován za označení okamžitého stavu náhodného procesu. Posloupnost náhodných veličin ξ t takto může být nahrazena posloupností stavů it , t = 0,1,... . Při analýze se lze pak zajímat místo hodnot procesu jen jeho stavy, což je pro některé úlohy výhodné. Náhodný průběh procesu je hodnocen pravděpodobnostmi přechodů mezi stavy a pravděpodobnostmi výskytu jednotlivých stavů. Tyto pravděpodobnosti stavů a přechodů lze určit na základě dostupných informací a z těch pak je možné autokorelační funkci vypočítat. Tímto způsobem se nahradí případný rozbor realizací náhodného procesu. T
3.6.1
Nástroje popisu náhodných procesů Markovovými řetězci
Markovovy řetězce jsou zvláštní tím, že pravděpodobnost stavu it , kterému předcházel vývoj procesu řetězcem minulých stavů it −1 , it − 2 ,..., i1 , i0 , je z těchto minulých stavů závislá pouze na předposledním stavu it −1 . Nezáleží tedy na posloupnosti stavů předcházející stavu it −1 , proto pro podmíněné pravděpodobnosti platí
{
} {
}
P it it −1 , it − 2 ,..., i1 , i0 = P it it −1 .
(3-31)
Jak již bylo upozorněno, změny náhodného procesu se hodnotí pravděpodobnostmi přechodů. Jestliže i označuje výchozí stav v čase t a j konečný stav o jeden časový krok dále, tj. v čase t + 1, přičemž oba tyto stavy patří do zmíněné množiny stavů 1, 2,..., N , pak pravděpodobnost přechodu za jeden krok se značí pij (1) . Pravděpodobnosti přechodů lze
[
]
uspořádat do čtvercové matice R 1 = pij (1) . Pro zjednodušení popisu lze závorku s jedničkou vynechat, pij (1) = pij . U tzv. homogenních Markovových řetězců jsou pravděpodobnosti
přechodů konstantní, naproti tomu u nehomogenních procesů se závislost na čase předpokládá. Graficky lze přechod znázornit následujícím orientovaným grafem s uzly, které představují stavy, a orientovanými hranami, které představují přechody:
Pro výpočet pravděpodobností přechodů přes dva časové kroky, tj. s jedním stavem uprostřed mezi těmito krajními časovými okamžiky, je třeba předpokládat, že tímto mezistavem mohou být všechny možné stavy procesu, jak je znázorněno na následujícím grafu:
30
Pravděpodobnost přechodu mezi oběma stavy se vypočte podle vzorce N
pis ( 2) = pi1 (1) p1s (1) +...+ pij (1) p js (1) +...+ piN (1) p Ns (1) = ∑ pij (1) p js (1) .
(3-32)
j =1
Předchozí vzorec je shodný se vzorcem pro výpočet prvků součinu matic, proto pravděpodobnosti přechodů ze všech možných výchozích stavů v čase t do všech možných konečných stavů v čase t + s lze použít maticový zápis R s = R 1s .
(3-33)
Pro s = 0 je vhodné definovat R 0 = E , kde E je jednotková matice s jednotkami na hlavní diagonále a ostatními prvky nulovými. Prvky matice přechodů nejsou libovolné, ale jsou vázány jistými podmínkami. První podmínkou je, aby součet pravděpodobností přechodů z každého stavu do všech ostatních stavů byl roven jedné, tj. N
pi1 (1) +...+ pij (1) +...+ piN (1) = ∑ pij (1) = 1 ,
(3-34)
j =1
což lze symbolicky zapsat rovněž maticovou rovnicí R sI = I ,
(3-35)
kde I je sloupcový vektor s jednotkovými prvky. Součet řádků matice R s musí být tedy roven jedné. Dosažitelnost stavu j ze stavu i znamená, že existuje s takové, aby pij ( s) > 0 . Množina stavů se nazývá stochasticky uzavřená, jestliže pravděpodobnost přechodu mimo tuto množinu je nulová. Uzavřená množina stavů je nerozložitelná, jestliže každé dva stavy z této množiny je vzájemně dosažitelná. Pravděpodobnosti jednotlivých stavů po počtu časových kroků t jsou značeny následujícím způsobem pi ( t ) = P{ξ t = xi } = ∑ pk ( 0) pki ( t ) , i = 1, 2,..., N ,
(3-36)
k
kde pk ( 0) , k = 1, 2,..., N představuje rozdělení pravděpodobností stavů v čase t = 0 . Je dokázáno, že pravděpodobnosti jednotlivých stavů konvergují s rostoucím časem k ustáleným hodnotám lim pi ( t ) = pi ,
t →+∞
N
∑p i =1
i
= 1.
31
(3-37)
K existenci limity pi > 0, i = 1, 2,..., N stačí, aby každý stav byl dosažitelný ze všech ostatních stavů a aby aspoň pro jeden stav platilo p jj > 0 . Pro posloupnosti stavů, jejichž pravděpodobnosti konvergují, se používá označení finální. V teorii Markovových řetězců se dokazuje věta, podle které finální posloupnost stavů je stacionární. Jestliže se uspořádají ustálené pravděpodobnosti jednotlivých stavů do sloupcového vektoru
[
p = p1 , p2 ,..., p N
]
T
pi > 0, i = 1, 2,..., N
,
výskytu (3-38)
pak v souvislosti s existenci limit platí
R Ts p = p ,
resp.
pT R s = pT ,
(3-39)
což je další podmínka, která omezuje hodnoty pravděpodobností matice přechodů. Při získávání podkladů pro stanovení pravděpodobností přechodů může být pomůckou střední hodnota počtu opakování stejného stavu nebo střední doba setrvání ve stejném stavu. Pravděpodobnost j -násobného opakování i -tého stavu je piij −1 (1 − pii ) , a proto střední hodnota počtu opakování je následující +∞
+∞
j =1
j =1
ni = ∑ j piij −1 (1 − pii ) = (1 − pii )∑
⎛ +∞ j ⎞ d ⎜ ∑ pii ⎟ ⎝ j =1 ⎠ j piij −1 = (1 − pii ) = dpii
⎛ p ⎞ ii ⎟ d ⎜⎜ ⎟ (1 − pii ) − ( − 1) pii = 1 . ⎝ (1 − pii ) ⎠ = (1 − pii ) = (1 − pii ) 1 − pii dpii (1 − pii )2
(3-40)
Při výpočtu se použil postup, podle kterého je střední hodnota náhodné veličiny vypočtena jako suma součinu její velikosti a příslušné pravděpodobnosti. Ostatní úpravy jsou na základě známého součtu nekonečné geometrické řady.
3.6.2
Autokorelační funkce posloupnosti dané Markovovým řetězcem
V souladu s definici střední hodnoty diskrétní náhodné proměnné je střední hodnota posloupnosti možných hodnot procesu dána vztahem se skalárním součinem E {ξ t } = ∑ X i pi = p T . X . N
(3-41)
i =1
Centrování náhodného procesu vyžaduje snížit hodnotu příslušnou každému stavu, tj. upravit vektor jeho hodnot s pomocí výše zavedeného sloupcového vektoru s jedničkami podle vzorce x = X − pT . X I .
(3-42)
Pro odvození rozptylu a autokorelační funkce je vhodné zavést diagonální matici s pravděpodobnostmi jednotlivých stavů na hlavní diagonále
32
⎡ p1 ⎢ P = ⎢ ... ⎢⎣ 0
... pi ...
0⎤ ⎥ ... ⎥ = diag{ p1 ,..., p N } . p N ⎥⎦
(3-43)
Vzorec pro výpočet rozptylu náhodného procesu, tj. součet součinů druhých mocnin odchylek od střední hodnoty a její pravděpodobnost výskytu, se zjednoduší na tvar σ 2 = x T Px .
(3-44)
Podobně snadno se zapíše vzorec pro výpočet autokorelační funkce, tj. součet součinů hodnoty příslušné výchozímu xi a konečnému stavu x j a pravděpodobnosti jejich vzniku
pi pij ( τ) , kde τ ≥ 0 . Tato pravděpodobnost je dána součinem pravděpodobnosti výchozího
stavu pi a pravděpodobnosti přechodu do konečného stavu pij po celkem τ krocích, proto pro τ ≥ 0 Rxx ( τ) = x T PR 1τ x ,
(3-45)
kde lze zaměnit R 1τ = R τ . Pro opačná posunutí τ < 0 podle symetrie autokorelační funkce platí Rxx ( τ) = Rxx ( − τ) . Normovaná autokorelační funkce pro obecnou velikost posunutí má vzorec s absolutní hodnotou posunutí ve spodním indexu matice pravděpodobností přechodů
ρ xx ( τ) =
x T PR τ x x T Px
.
(3-46)
Odvozený vzorec pro autokorelační funkci je možné upravit na přehlednější tvar ve srovnání s mocninou čtvercové matice o velikosti τ . Vektor R τ x lze pro τ ≥ N − 1 rozložit na součin R τ x = R τ − N +1R N −1x , přičemž vektor R N −1x je nahraditelný lineární kombinací, která obsahuje výrazy s nižší mocninou matice R 1 než je N − 1. Vektory R i x, i = 0,..., N − 1 jsou totiž lineárně závislé, protože v N-rozměrném prostoru jsou všechny kolmé na vektor p o rozměru N a tudíž leží v jedné nadrovině o rozměru N - 1. Kolmost vyplývá z nulové hodnoty součinu p T R i x = 0 , protože p T R i = p T a p T x = 0 , kde vektor hodnot x přísluší centrovanému náhodnému procesu. Lineárně nezávislých vektorů může být nejvýše N-1. To znamená, že vektor R N −1x lze rozložit na lineární kombinaci vektorů s mocninou matice pravděpodobností přechodů nejvýše rovnou N - 1 N −1
R N −1x = ∑ ai R N −1−i x ,
(3-47)
i =1
kde a1 , a2 ,..., a N −1 jsou parametry modelu. Z tohoto rozkladu plyne, že hodnota korelační funkce pro τ ≥ N − 1 je nahraditelná váženým součtem korelačních funkcí s nejvýše o N - 1 zmenšeným posunutím N −1
N −1
i =1
i =1
Rxx ( τ) = x T PR τ − N +1R N −1x = ∑ ai x T PR τ −i x = ∑ ai Rxx ( τ − i ) .
(3-48)
Normovaný tvar Pro normované autokorelační funkce má poslední vzorec tvar N −1
ρ xx ( τ) = ∑ ai ρ xx ( τ − i ) ,
(3-49)
i =1
33
kde ρ( 0) = 1 . Obě diferenční rovnice pro autokorelační funkci byly odvozeny jen pro τ ≥ N − 1 . Rozklad vektoru R τ x lze uskutečnit také pro − N + 1 < τ < N − 1 s úpravou mocniny R τ− N +1 na R N −1− τ , a proto diferenční rovnice platí univerzálně včetně symetrie hodnot autokorelační funkce. Tuto vlastnost popisuje hodnot autokorelační funkce pro zmíněný interval posunutí tzv. soustava Yule-Walkerových rovnic [1] ρ(1) = a1 + a2ρ(1) +...+ a N −1ρ( N − 2)
ρ( 2) = a1ρ(1) + a2 +...+ a N −1ρ( N − 3)
(3-50)
... ρ( N − 1) = a1ρ( N − 2) + a2ρ( N − 3) +...+ a N −1 .
Z těchto rovnic lze vypočítat koeficienty a1 , a2 ,..., a N −1 na základě znalosti hodnot autokorelační funkce od posunutí nula do N-1. Modelování náhodných procesů Markovovými řetězci umožňuje pro některé jednoduché tvary korelačních funkcí zadat rozdělení pravděpodobností stavů. Rovněž lze snadno zjistit pravděpodobnost překročení hladiny, tj. určité hodnoty veličiny X i .
Příklad: V náhodně zvoleném jednom dni průměrně za dekádu je dopravena do skladu dávka o velikosti M, přičemž ve dvou dnech po sobě se dodávky neopakují. Je třeba vypočítat autokorelační funkci náhodného vstupního toku. Řešení:
[
Náhodný proces má dva stavy, a proto vektor jeho hodnot je X = X 1 , X 2
[
Pravděpodobnosti vzniku stavů jsou p = p1 , p2 diagramem:
] = [0.9, 01. ] T
T
] = [0, M ] T
T
.
. Střídání stavů lze znázornit
Stav bez přísunu dávky se opakuje v průměru devětkrát, což lze považovat za střední hodnotu, a proto z n1 = 9 plyne p11 = 1 − 1 n1 = 0.89 . Stav s přísunem dávky je bez opakování, a proto p22 = 1 − 1 n2 = 0 . To znamená, že hranu s pravděpodobností přechodu p22 není třeba kreslit. Pravděpodobnosti vzájemného přechodů z jednoho stavu do druhého jsou p12 = 1 − p11 = 1 − 0.89 = 011 . a p21 = 1 − p22 = 1 − 0 = 1 . Střední hodnota procesu je
[
]
. M . Centrovaný proces proto střídá stavy x = − p2 M , (1 − p2 ) M . p T . X = p2 M = 01 T
Obecná matice pravděpodobností přechodů mezi dvěma stavy s obecnými údaji je následující ⎡ p11 R1 = ⎢ ⎣ p21
p12 ⎤ . p22 ⎥⎦
(3-51)
34
Obecná autokorelační funkce popsaného centrovaného dvoustavového procesu je pro τ ≥ 0 ⎡ p1 Rxx ( τ) = x PR x = x ⎢ ⎣0 T
τ 1
T
0 ⎤ ⎡ p11 p2 ⎥⎦ ⎢⎣ p21
τ
p12 ⎤ x. p22 ⎥⎦
(3-52)
Diferenční rovnice pro výpočet autokorelační funkce je prvního řádu. Tato rovnice má jediný parametr, a to a1 . Ze soustavy Yule-Walkerových rovnic pro tento parametr plyne a1 = ρ(1) =
2 2 x T PR 1x x1 p1 p11 + x1 x1 ( p1 p12 + p2 p21 ) + x2 p2 p22 . = = −01111 . xT P x x12 p1 + x22 p2
(3-53)
Normovaná autokorelační funkce se tedy určí z diferenční rovnice ρ( τ ) = a1ρ( τ − 1) s počáteční podmínkou ρ( 0) = 1 . Řešením je funkce exponenciálního typu. Pro obecné posunutí − ∞ < τ < +∞ platí ρ( τ) = a1τ . Příklad realizace popsaného náhodného procesu za časový úsek 101 dní je na obr. 15 a příslušný teoretický průběh autokorelační funkce je na obr. 16. Jak je zřejmé z příkladu, jedná se o další “zobecnění” obecného telegrafního signálu, který byl popsán v předcházející kapitole. Tento příklad rovněž demonstruje postup teoretického výpočtu autokorelační funkce ze všeobecných údajů o charakteru náhodného procesu, které jsou v praxi běžné.
Obr. 15. Realizace náhodného průběhu dodávek do skladu
Obr. 16. Teoretický průběh normované autokorelační funkce
35
3.7 Charakteristiky náhodných procesů ve frekvenční oblasti 3.7.1 Fourierova transformace Autokorelační a vzájemná korelační funkce jsou charakteristikami náhodných procesů v časové oblasti (doméně). Pro náhodné procesy lze definovat rovněž charakteristiky ve frekvenční oblasti, které se nazývají spektra. Pro korelační funkce náhodných procesů se spojitým časem je nástrojem k výpočtu spekter Fourierova transformace [7], která je integrální transformací stejně jako Laplaceova transformace [44]. Obě transformace převádějí časovou funkci, tzv. originál, na funkci komplexní proměnné. Jádrem Laplaceovy transformace je funkce exp( − s t ) , a proto má transformace tvar L{ x( t )} = X ( s) =
+∞
∫ x( t ) exp( − st ) dt ,
(3-54)
0
kde t je čas a s komplexní proměnná. O transformované funkci se předpokládá, že pro záporný čas je nulová, tj. x( t ) = 0 , t < 0 . Jádro Fourierovy transformace je shodné s Laplaceovou transformací, ale komplexní proměnná s je ryze imaginární, tj. s = jω , +∞
F { x( t )} = X ( ω ) = ∫ x( t ) exp( − jωt ) dt ,
(3-55)
−∞
kde j je komplexní jednotka, ω = 2 π f je úhlová frekvence v rad/s a f je frekvence v Hz. Pro existenci obrazu se matematicky klade na časovou funkci podmínka absolutní +∞
integrovatelnosti (existence integrálu
∫ x( t ) dt ) a dále podmínka, aby transformovaná funkce
−∞
byla po částech spojitá s konečným počtem bodů nespojitosti. Hodnoty, resp. definiční obor, transformované funkce nejsou omezeny jako v případě Laplaceovy transformace. Z tohoto důvodu nelze pro Fourierovou transformaci konkrétních funkcí použít slovník Laplaceovy transformace s prostou náhradou s = jω . Obě transformace mají však stejné vlastnosti pro matematické operace jako zpoždění, derivování, integrování a konvoluce, tj. ve vzorcích lze obě zmíněné proměnné zaměnit. Fourierova transformace je stejně jako Laplaceova transformace lineárná, a proto obraz lineární kombinace transformovaných funkcí je rovněž lineární kombinace obrazů jednotlivých funkcí originálu. Inverzní Fourierova transformace je dána následujícím vzorcem +∞
1 F { X ( ω )} = x( t ) = ∫ X ( ω ) exp( jωt ) dω . 2 π −∞ −1
(3-56)
Pro korelační funkce náhodných procesů s diskrétním časem platí jen částečná analogie. V přímé transformaci nelze použít integraci, ale sumu diskrétních hodnot
F { xt } = X ( ω ) =
+∞
∑ x exp( − jωt ) .
t =−∞
(3-57)
t
Pro existenci součtu nekonečné řady je třeba, aby součet absolutních hodnot součinitelů xt byl konečný.
36
Inverzní transformace má omezený integrační obor. Diskrétní čas má jednotkovou ”periodu vzorkování”, tj. f s = 1 ∆ t = 1 . Rozsah frekvencí složek spektra tohoto signálu je omezen na f s 2 = 1 2 , tj. v úhlové frekvenci na 2 π f s 2 = π f s = π . Obor integrace v inverzní Fourierově transformaci pro funkce s diskrétním časem je proto třeba omezit, platí F { X ( ω )} = xt = −1
+π
1 X ( ω ) exp( jωt ) dω . 2 π −∫π
(3-58)
Po formální náhradě s = jω je zřejmé, že exp( st ) = z je komplexní proměnná Ztransformace. Funkce úhlové frekvence X ( ω ) se transformuje na tvar X * ( z ) . Inverzní transformace má po této substituci tvar F −1 { X * ( z )} = xt =
1 X * ( z ) z t −1 dz , 2 π j c∫1
(3-59)
kde c1 je jednotková kružnice se středem v počátku komplexní roviny ”z”. 3.7.2
Výkonová spektrální hustota
Korelační funkce Rxx ( τ) je funkce času, ze kterých vzniknou po Fourierově transformaci spektra, tj. funkce frekvence. Fourierova transformace autokorelační funkce se nazývá výkonová spektrální hustota (power spectral density PSD) S xx ( ω ) , nebo zkráceně autospektrum. Vzorce pro přímou a zpětnou Fourierovou transformaci autokorelační funkce se nazývají Wiener-Chinčinovy vztahy. Pro autokorelační funkci spojitou v čase, která odpovídá náhodným procesům se spojitým časem, mají tyto vztahy tvar přímé a zpětné Fourierovy transformace: +∞
S xx ( ω ) = ∫ Rxx ( τ) exp( − jωτ) dτ ,
(3-60)
−∞
+∞
1 Rxx ( τ) = ∫ S xx ( ω) exp( jωτ) dω . 2 π −∞
(3-61)
Autokorelační funkce je reálná funkce sudá. Lze dokázat, že Fourierova transformace této funkce, tj. výkonová spektrální hustota, je také reálná funkce sudá, proto S xx ( ω ) = S xx ( − ω ) . Spektrum je proto označováno za oboustranné, tj. je definováno pro kladné a záporné frekvence. Wiener-Chinčinovy vztahy pro autokorelační funkce náhodných procesů, které jsou diskrétní v čase, mají tvar S xx ( z ) = Rxx (τ ) =
+∞
∑R
τ =−∞
xx
( τ) z − τ ,
1
S 2π j ∫
xx
(3-62)
( z ) z t −1 dz .
(3-63)
c1
První vzorec představuje Laurentovu nekonečnou řadu, která konverguje pro komplexní proměnnou z na určitém mezikruží se středem v počátku komplexní roviny. O těchto řadách pojednává obor matematiky, který se nazývá analýza funkcí komplexní proměnné. Výkonová spektrální hustota v komplexní proměnné po její substituci, která obsahuje úhlovou frekvenci, je také sudá.
37
3.7.3 Rozptyl náhodného procesu
Korelační funkce se spojitým časem pro nulové posunutí Rxx ( 0) představuje výkon náhodného procesu. Pro centrované náhodné procesy je uvedená hodnota korelační funkce rovna rozptylu procesu. Souvislosti lze demonstrovat na příkladu ergodického náhodného procesu, pro který platí T 2
+∞
+∞
1 1 2 Rxx ( 0) = lim x( t ) ) dt = ( ∫ ∫ Sxx ( ω) dω = −∞∫ S xx ( f ) df . T →+∞ T 2 π −∞ −T 2
(3-64)
Obr. 17. Význam plochy spektra Plocha spektra v souřadnicích frekvence, f = ω 2 π , představuje tedy výkon náhodného procesu. Korelační funkce náhodného procesu s diskrétním časem pro nulové posunutí má stejný význam, tj. 1 K 2 1 ( ) Rxx 0 = lim xt = S xx ( z ) z −1 dz . (3-65) ∑ ∫ K →+∞ K 2 π j c1 t =1 3.7.4 Výkonová spektrální hustota bílého šumu
Nejjednodušší průběh závislosti hodnot výkonové spektrální hustoty na frekvenci má bílý šum. Protože autokorelační funkce bílého šumu se spojitým časem je Diracova funkce o ploše σ 2e , jeho výkonová spektrální hustota je konstanta, See ( ω ) =
+∞
∫ σ δ( τ) exp(− jω τ) dτ = σ 2 e
2 e
exp( − 0) = σ 2e ,
(3-66)
−∞
jak se lze přesvědčit z tabulky pro Fourierovou transformaci funkcí, které obsahují Diracovu funkci. Pro spojitý čas je výkon bílého šumu nekonečný. Při analýze dat z měření je spektrum vždy omezeno, přesto náhodný proces s konstantním spektrem v rámci frekvenčního rozsahu vyhodnocování je rovněž nazýván bílý šum. Autokorelační funkce a výkonová spektrální hustota bílého šumu se spojitým časem je na obr. 18. Výkonová spektrální hustota bílého šumu s diskrétním časem je následující See ( z ) =
+∞
∑R
τ =−∞
xx
( τ) z − τ = σ 2e z 0 = σ 2e ,
(3-67)
protože autokorelační funkce je nenulová jen pro nulové posunutí.
38
Obr. 18. Autokorelační funkce bílého šumu se spojitým časem Příklad 1:
Je třeba určit výkonovou spektrální hustotu, která přísluší exponenciální autokorelační funkci Rxx ( τ) = σ 2x exp( − α τ ) , α > 0 náhodného procesu se spojitým časem. Řešení: +∞
+∞
−∞
−∞
S xx ( ω ) = ∫ Rxx ( τ) exp( − jωτ) dτ = ∫ σ 2x exp( − α τ ) exp( − jωτ ) dτ = +∞
(
)
⎡ exp ( − jω − α ) τ = σ 2x ⎢ − jω − α ⎢⎣
) ⎤⎥
=
0
(
)
(
) ⎤⎥
∫ σ 2x exp ( − jω − α) τ dτ + ∫ σ 2x exp ( − jω + α) τ dτ = −∞
0
(
+∞
⎥⎦ 0
⎡ exp ( − jω + α ) τ + σ 2x ⎢ − jω + α ⎢⎣
(3-68)
0
⎥⎦ −∞
=
1 2 α σ 2x −1 2 =σ + σx = . − jω − α − jω + α ω 2 + α 2 2 x
Příklad průběhů obou charakteristik pro α = 1 je uveden v obr. 19. Časová konstanta exponenciálního průběhu u autokorelační funkce je 1/ α . Výkonová spektrální hustota poklesne na polovinu pro ω = α .
Obr. 19. Exponenciální autokorelační funkce a příslušné spektrum V logaritmických souřadnicích je výkonová spektrální hustota znázorněna v obr. 20. Podobně jako frekvenční charakteristiky v logaritmických souřadnicích je možné její průběh rozdělit na dva úseky se dvěma asymptotami. Jestliže je úhlová frekvence mnohem větší než je parametr α , pak lze tento parametr zanedbat a spektrum nabude tvar S xx ( ω ) ≈ 2 α σ 2x ω 2 . 39
Náhodný proces s výkonovou spektrální hustotou, která je úměrná čtverci převrácené hodnoty frekvence, tj. 1 f 2 , se nazývá růžový šum (pink noise).
Obr. 20. Výkonová spektrální hustota v logaritmických souřadnicích Příklad 2:
Je třeba určit výkonovou spektrální hustotu exponenciální autokorelační funkce Rxx ( τ) = σ 2x E τ , E < 1 náhodného procesu s diskrétním časem. Řešení: S xx ( z ) =
+∞
∑ Rxx ( τ) z − τ =
τ =−∞
+∞
+∞
∑ σ 2x E τ z − τ = σ 2 + ∑ σ 2x E τ z − τ +
τ =−∞
τ =1
−1
∑σ
τ =−∞
2 x
E −τ z −τ =
⎛ σ 2x (1 − E 2 ) ⎛ E z Ez ⎞ τ −τ ⎞ 2 ⎟= . = σ ⎜1 + ∑ ( E z) + ∑ ( E z) ⎟ = σ x ⎜1 + + ⎝ τ =1 ⎠ ⎝ 1 − E z 1 − E z ⎠ ( z − E )( z −1 − E ) τ =−∞ +∞
−1
(3-69)
2 x
Při výpočtu bylo třeba sečíst Laurentovu řadu, což bylo řešeno jejím rozdělením na dvě nekonečné geometrické řady, jednu s kvocientem E z a druhou s kvocientem E z . Lze poznamenat, že funkce konverguje pro komplexní proměnnou z z mezikruží E < z < 1 E , což odpovídá podmínce konvergence součtu řady, podle které je kvocient geometrické řady v absolutní hodnotě menší než jedna. Tento výpočet je poslední operací s Laurentovými řadami. Vypočtená výkonová spektrální hustota bude použita v některých příkladech uvedených dále. Je zřejmé, že tato hustota jako funkce komplexní proměnné z souvisí se Z-transformací, která se používá k popisu přenosu lineárních diskrétních systémů. Dva příklady realizace 401 vzorků náhodného procesu s diskrétním časem a s exponenciální autokorelační funkcí, které se liší velikosti parametru E, je na obr. 21. Realizace s E = 0.5 se blíží vlastnostem bílého šumu více než náhodný proces s E = 0.9 . 3.7.5
Křížové spektrum
V definici výkonové spektrální hustoty a korelační funkce je zdůrazňována příslušnost k náhodnému procesu x( t ) dvojitým indexem. Tento typ spekter je označován za autospektra. Wiener-Chinčinovy vztahy však platí také pro dvojici náhodných procesů, např. průběh vstupní x( t ) a výstupní veličiny y( t ) dynamické soustavy. Spektrum se pak nazývá křížové (cross spectral density). Pro náhodné procesy se spojitým časem platí S xy ( ω ) =
+∞
∫R
xy
( τ) exp( − jωτ) dτ ,
(3-70)
−∞
40
1 Rxy (τ ) = 2π
+∞
∫S
xy
(ω ) exp( jωτ ) dω .
(3-71)
−∞
Obr. 21. Dva příklady realizace náhodného procesu s exponenciální korelační funkcí Vzájemná korelační funkce je reálná funkce časového posunutí, zatímco křížové spektrum ke komplexní funkce úhlové frekvence. Pro náhodné procesy s diskrétním časem platí +∞
S xy ( z ) =
∑R τ
Rxy (τ ) =
1
=−∞
xy
( τ ) z −τ ,
S 2π j ∫
xy
(3-72)
( z ) z t −1 dz .
(3-73)
c1
Podobně jako u vzájemné korelační funkce lze odvodit pro křížové spektrum efekt záměny pořadí indexů. Platí S xy ( ω ) =
+∞
+∞
∫R
xy
−∞
( τ) exp( − jωτ) dτ = ∫ Ryx ( − τ) exp( − jωτ) dτ = −∞
(3-74)
+∞
=
∫ R (τ ) exp(− j( − ω) τ ) dτ yx
1
1
1
= S yx ( − ω ) .
−∞
Tento vztah má uplatnění při odvození vzorců pro frekvenční přenosové funkce. Pro nezávislé centrované náhodné procesy x( t ) a y( t ) je křížové spektrum nulové S xy ( ω ) = 0 .
41
3.8 Nepřímý výpočet korelačních funkcí 3.8.1 Výpočet spekter Přímý výpočet korelačních funkcí je možný podle jejich definičních vztahů, tj. jako průměr vzájemně v čase posunutých vzorků. Podle Wiener-Chinčinových vztahů souvisí autokorelační funkce s výkonovou spektrální hustotou a vzájemná korelační funkce souvisí s křížovým spektrem. Je proto možné obě korelační funkce vypočítat nepřímo pomocí inverzní Fourierovy transformace. Z hlediska rychlosti výpočtu se tento postup stal prakticky zajímavým po objevu algoritmu rychlé Fourierovy transformace (Fast Fourier Transform - FFT) [7,40]. Vstupem pro výpočet FFT je konečná posloupnost vzorků časového průběhu analyzované veličiny xi , i = 0,1, ..., N − 1 , tzv. záznam o délce N. Předpokládá se, že vzorkování je ekvidistantní, tj. s konstantní časovou periodou ∆ t . Nejrozšířenější algoritmus FFT požívá počtu vzorků, který je mocninou o základu 2, tj. N = 2 m . Mezi dobou záznamu T , periodou vzorkování ∆ t a počtem vzorků v záznamu platí T = N ∆ t . Výsledkem výpočtu je konečná posloupnost obecně komplexních čísel, jejichž počet je shodný s délkou záznamu, tj. X i , i = 0, 1, ..., N − 1. Pro vstupní posloupnost reálných čísel platí, že X N − k = X k* , kde hvězdička označuje komplexně sdružené číslo. Dvojice složek symetrických vzhledem k indexu N 2 se liší ve znaménku imaginární části svých hodnot.
U procesů se spojitým časem je výkonová spektrální hustota definována pro úhlové frekvence z intervalu od − ∞ do + ∞ , tj. pro kladné a záporné frekvence. Vzorkování předpokládá, že výchozí vzorkovaná veličina obsahuje ve svém spektru složky s nižší frekvencí než je frekvence vzorkování. Konečná doba záznamu snižuje rozlišitelnost spektra na násobky frekvence záznamů, tj. 1 T . Při frekvenčním omezení spektra vzorkovaného časového průběhu analyzované veličiny a konečné době trvání jejího záznamu proto vyhovuje, že spektrum je vyhodnoceno ve tvaru konečné posloupnosti amplitud a fáze svých složek. Existují dvě verze algoritmu FFT, které se liší měřítkem výsledků výpočtu, a to například FFT v programovém systému MATLAB a FFT ve speciálních signálových analyzátorech. U všech je však výkonová spektrální hustota úměrná absolutní hodnotě složek Fourierovy 2
transformace X k . Ve verzi FFT použité v programovém systému MATLAB je výkonová spektrální hustota (power spectral density PSD) dána vztahem ⎧ ⎪ S xx (2 πk T ) = ⎨ ⎪ ⎩
1 2 ∆ t X0 , k = 0, T 2 2 ∆ t X k , k = 1, 2, ..., N 2 − 1. T
(3-75)
Počet vypočtených hodnot výkonové spektrální hustoty je poloviční oproti počtu hodnot vypočtených hodnot užitím FFT. Redukce je možná, protože absolutní hodnoty výsledků výpočtu FFT jsou symetrické podle prvku s indexem N 2 . Výsledné spektrum se nazývá jednostranné, protože neobsahuje záporné frekvence. K výpočtu křížového spektra (cross spectral density - CSD) je zapotřebí zaznamenat posloupnosti vzorků dvou veličin xi , i = 0,1, ..., N − 1 a yi , i = 0,1, ..., N − 1. Hodnoty křížového spektra jsou úměrné součinu X k Yk* , jehož výsledkem je komplexní číslo. Pro zmíněnou verzi algoritmu FFT platí
42
⎧ T X 0Y0* N 2 , k = 0 S xy (2 πk T ) = ⎨ 2 * ⎩2 T X k Yk N , k = 1, 2, ..., N 2 − 1.
(3-76)
Požadovaný počet vzorků je často malý, a proto se jejich posloupnost doplňuje do nejbližší mocniny 2 nulami. Tato operace spektrum částečně vyhladí. Jinou možnost poskytuje situace, kdy je posloupnost vzorků dostatečně dlouhá a je zapotřebí tuto posloupnost rozdělit na segmenty o stejné délce. V tomto případě se dílčí vypočtená spektra z jednotlivých segmentů průměrují tak, že se vypočte aritmetický průměr pro každou složku spektra zvlášť. 1 M (3-77) ∑ S (2πk T ), k = 1, 2, ..., N 2 − 1 , M m=1 xx ,m kde K je počet segmentů. Podle shodného vzorce se vypočte průměr také pro křížové spektrum, ovšem pro jeho reálnou a imaginární složku zvlášť. Toto průměrování má za následek zpřesnění odhadu spektra, a to tak, že chyba odhadu se zmenšuje úměrně převrácené hodnotě odmocniny počtu průměrů. S xx (2 πk T ) =
Segmentování otvírá možnost částečného překrytí jednotlivých segmentů ke zvýšení počtu spekter pro výpočet průměru s cílem zvětšení přesnosti jejich odhadu. Popsaný postup výpočtu výkonové spektrální hustoty je v odborné literatuře označován jako Welchova metoda. 3.8.2 Výpočet korelačních funkcí
Výše popsaný postup je vhodný pro spektra. Jestliže by vypočtené spektrum bylo transformováno inverzní Fourierovou transformací na korelační funkci, pak výsledek vypočtu je zkreslen tzv. kruhovou korelací. Výpočet totiž předpokládá, že analyzované časové průběhy veličin jsou periodické funkce času s periodou, která je rovna době záznamu pro výpočet FFT. Na levé straně obr. 22 je demonstrován efekt kruhové korelace. Na výsledném průběhu korelační funkce má podíl vzájemný součin hodnot ze začátku výchozího a posunutého záznamu, a navíc úměrně velikosti posunutí, také součin hodnot ze začátku výchozího záznamu a konce posunutého záznamu, který má efekt zkreslující výsledky výpočtu.
Obr. 22. Kruhová korelace a její odstranění užitím „zero pad“ Kompenzace kruhové korelace se dosáhne doplněním záznamu nulami na dvojnásobnou délku. Výpočet FFT proběhne tedy pro záznam o dvojnásobném počtu vzorků. Doplnění nulami
43
se označuje anglicky „zero pad“. Z pravé části je zřejmé, že podíl součinu hodnot ze začátku a konce záznamu je nahrazen součinem hodnot ze začátku a nulami, tj. výsledek má nulový podíl na velikosti vypočtené korelační funkce. Je zřejmé, že průběh korelační funkce nebude zobrazen celý, ale jen jeho polovina, tj. do posunutí o velikosti jedné periody výchozího záznamu. Algoritmus výpočtu autokorelační funkce (autocorrealtion function - ACF) je znázorněn na obr. 23. Stejný postup bude uplatněn také pro křížovou korelační funkci (crosscorrelation function CCF).
Obr. 23. Algoritmus výpočtu autokorelační funkce (ACF) Při výpočtu korelačních funkcí je třeba dbát, aby časové průběhy byly centrovány, tj. jejich střední hodnota musí být nulová. Při nenulové střední hodnotě by po doplnění nulami vznikl v datech skok, což by se projevilo zkreslením vypočteného průběhu korelační funkce. Výpočet spektra signálu s významnými harmonickými složkami vyžaduje pro snížení chyby amplitudy složky a zvýšení selektivity spektra použití časových oken. Náhodné procesy ve významu poruchových veličin tuto vlastnost nemají a jejich spektrum je téměř ploché nebo jen s malými rezonancemi. Při výpočtu korelačních funkcí náhodných procesů je jejich použití neopodstatněné, tj. na signálovém analyzátoru se volí okno obdélníkového typu - Rectangular. Při definici autokorelační funkce bylo uvedeno, že její odhad je vychýlený. Způsob korekce je znázorněn na příkladu výpočtu autokorelační funkce nepřímou metodou v obr. 24, tj. prostřednictvím výkonové spektrální hustoty a její inverzní Fourierovy transformace.
Obr. 24. Ukázka korekce vychýleného odhadu u autokorelační funkce
44
V horní části obrázku je harmonický časový průběh funkce, tj. sinusovka. Ve spodních dvou grafech je autokorelační funkce, vlevo bez korekce vychýlení, tj. vychýlená - biased, a vpravo s korekcí vychýlení, tj. nevychýlena - unbiased. Již dříve bylo uvedeno, že autokorelační funkce harmonického signálu je funkce kosinus. Příklad byl řešen v prostředí MATLABu, jmenovitě použitím funkcí z toolboxu Signal processing.. Autokorelační funkce vychýlená byla vypočtena příkazem xcorr(x,’biased’) a nevychýlená příkazem xcorr(x,’unbiased’). Pro výpočet křížové korelační funkce mezi konečnými posloupnostmi (vektory) x a y je příkaz ve tvaru xcorr(x,y,’biased’), resp. xcorr(x,y,’unbiased’). U frekvenčních FFT analyzárorů se korekce vychýlení nazývá bow-tie, přičemž ve stavu zapnuto je „on“ a ve stavu vypnuto „off“. 3.8.3 Příklad hodnocení časového průběhu náhodné veličiny
Jako příklad náhodného procesu je vybrán časový průběh vlhkosti (ve váhových procentech vody) ve vsázce pro výrobu aglomerátu, který je jednou z kovonosných surovin pro výrobu surového železa ve vysoké peci. Výchozí záznam obsahoval 719 vzorků, které byly zaznamenány v intervalu 2 minut. Provozní dat nejsou obvykle bez různých anomálií, tj. úseků, kdy se přihodí něco výjimečného. Zařízení je např. odstaveno nebo vznikne provozní porucha. Proto bylo ze záznamu uměle odstraněno několik úseků, a proto jeho délka poklesla na 654 vzorků. Časový průběh náhodné veličiny je zaznamenán na obr. 25. V tomto obrázku je na spodních
dvou grafech autokorelační funkce s vychýleným a nevychýleným odhadem svého průběhu. Výpočet autokorelační funkce byl proveden popsanými příkazy MATLABu. Korekce vychýlení odhadu na druhém spodním grafu (‘unbaised’) zesiluje průběh pro velká posunutí,
Obr. 25. Příklad časového průběhu náhodné veličiny - vlhkosti aglomerační vsázky
45
pro která lze spíše očekávat pokles korelační funkce k nule, a proto tato korekce není vždy přínosem jako u jednoduchého příkladu na obr. 24. Průběh korelační funkce naznačuje, že náhodný průběh je součtem nejméně tří nezávislých veličin. První z nich je bílý šum, který je charakteristický pro chybu měření. Další složkou je pravděpodobně šum s autokorelační funkci exponenciálního typu, která přísluší autoregresnímu procesu prvního řádu. V časovém průběhu je také možné předpokládat harmonickou složku s periodou asi 200 až 250 minut (asi 4 až 5 period za 1000 minut). V obr. 26 je znázorněna výkonová spektrální hustota popisované náhodné veličiny, a to pro délku posloupnosti časových vzorků k výpočtu FFT 512 a 128 hodnot. K výpočtu byla použita funkce P=spectrum(x,NFFT,noverlap,wind) z toolboxu Signal processing MATLABu. Vstupní posloupnost časových vzorků (vektor) je x, délka posloupnosti pro výpočet FFT je označena NFFT, počet vzorků pro překrytí úseků (segmentů) pro výpočet FFT je označen noverlap a typ časového okna je dán posloupností wind o délce NFFT. K výpočtu bylo použito časové okno Hanning a úseky se nepřekrývaly (noverlap=0). Horní graf s NFFT=512 je průměrem dvou spekter, přičemž druhé spektrum je vypočteno z časového úseku od vzorku s pořadím 513 do 654 a tudíž je do celkové délky 512 doplněno nulami (zero pad). Výsledná výkonová spektrální hustota je průměrem jen dvou dílčích spekter, a proto je vyhlazena méně než výkonová spektrální hustota s NFFT=128, která je průměrem šesti dílčích spekter. Při volbě velmi vysokého počtu hodnot pro výpočet FFT lze dostat graf spektra s velkým množstvím složek, avšak jednotlivé významné složky, tj. zdánlivé rezonance, nejsou v tomto případě technicky opodstatněné. V případě náhodných procesů je vhodné volit menší počet bodů pro FFT a výsledná spektra průměrovat na rozdíl od diagnostických signálů, např. hluku nebo vibrací, kdy je pro rezonance zapotřebí vysoké frekvenční rozlišení.
Obr. 26. Výkonová spektrální hustota náhodných změn vlhkosti
46
Funkce toolboxů MATLABu neobsahují výpočet autokorelační funkce z průměrováné výkonové spektrální hustoty. Speciální program, který pro výuku simuluje FFT analyzátor, je tímto způsobem vyhodnocení autokorelační funkce vybaven. Výpočet autokorelační funkce z 5 nepřekrývajících se bloků o délce 128 hodnot, tj. 256 minut záznamu je na obr. 27. Šestý neúplný úsek do délky 128 hodnot není ve výpočtu zařazen. Korekce vychýlení odhadu nebyla použita. Průměrováním se vyloučí harmonická složka z časového průběhu záznamu o výše uvedené periodě. Tvar autokorelační funkce po průměrování dokonaleji zobrazuje jednotlivé složky signálu. Je zřejmé, že jedna složka bude bílý šum, který zvyšuje hodnotu autokorelační funkce pro nulové posunutí. Další složka je šum s autokorelační funkcí exponenciálního typu.
Obr. 27. Průměrovaná autokorelační funkce
47
3.9 Průchod náhodného procesu lineární dynamickou soustavou 3.9.1 Základní vlastnosti lineárního dynamické soustavy Z teorie lineárních dynamických spojitých soustav s jedním vstupem x( t ) , a jedním výstupem y( t ) je známo, že konvoluce impulsní charakteristiky této soustavy g( t ) s časovým průběhem vstupní veličiny je časový průběh výstupní veličiny +∞
+∞
−∞
−∞
y( t ) = x( t ) * g( t ) = ∫ x( t − τ) g( τ) dτ = ∫ x( τ ) g( t − τ ) dτ .
(3-78)
Podobně pro lineární dynamickou diskrétní soustavu s jedním vstupem xt a jedním výstupem yt veličinou je časová posloupnost výstupních hodnot dána konvolucí impulsní charakteristiky gt soustavy a vstupní veličiny
yt = xt * g t =
+∞
∑x
τ =−∞
t −τ
gτ =
+∞
∑x g
τ =−∞
τ
t −τ
.
(3-79)
Integrační nebo sumační meze zúžit s využitím podmínky fyzikální realizovatelnosti, podle které g( t ) = 0 nebo gt = 0 pro t < 0 .
Obr. 28. Spojitá a diskrétní dynamická soustava s jedním vstupem a jedním výstupem Laplaceova a Fourierova transformace konvoluce odpovídá součinu obrazu vstupní veličiny a impulsní charakteristiky soustavy. Po dosazení s = jω do Laplaceova přenosu s cílem určit frekvenční přenos je výsledek shodný s přenosem ve Fourierově transformaci. Obraz výstupního signálu je dán vztahem Y ( ω ) = Gxy ( jω ) X ( ω ) ,
(3-80)
kde F { g( t )} = Gxy ( jω ) je frekvenční přenosová funkce v proměnné jω, která je Fourierovým nebo Laplaceovým obrazem impulsní charakteristiky. Podobně lze vypočítat obraz konvoluce pro diskrétní soustavy v Z-transformaci
Y ( z ) = Gxy ( z ) X ( z ) .
(3-81)
3.9.2 Autokorelační funkce výstupu soustavy a vzájemná korelační funkce vstupu a výstupu soustavy
Jestliže časový průběh vstupní a výstupní veličiny dynamické soustavy lze povařovat za ergodický náhodný proces, pak k výpočtu korelačních funkcí lze použít průměr součinu vzájemně posunutých časových průběhů vstupní a výstupní veličiny. Pro zkrácení zápisu budou uváděny vzorce bez limity délky intervalu, pro který je průměr počítán. Odvození vzorců pro korelační funkce bude demonstrováno pouze pro náhodné procesy se spojitým časem. Pro náhodné procesy s diskrétním časem jsou operace s integrály nahrazeny operacemi se sumami.
48
Vzájemná korelační funkce časového průběhu vstupní a výstupní veličiny soustavy se odvodí tak, že za výstupní veličinu se dosadí konvolutorní integrál Rxy ( τ ) =
T +∞
T
1 1 x( t ) y( t + τ) dt = ∫ ∫ x( t ) x(t + τ − t1 ) g(t1 )dt1dt = ∫ T0 T 0 −∞ +∞
+∞
T
1 = ∫ ∫ x( t ) x(t + τ − t1 ) g(t1 ) dt dt1 = ∫ R xx ( τ − t1 ) g(t1 ) dt1 , T0 −∞ −∞ tj. platí Rxy ( τ ) =
+∞
∫R
xx
( τ − t ) g( t ) dt .
(3-82)
0
Tato integrální rovnice se nazývá Wiener-Hopfova a v minulosti před zavedením FFT byla používána k identifikaci impulsní charakteristiky soustavy se vstupní veličinou, kterou je náhodný proces. Pro vstupní veličinu typu bílého šumu, tj. Rxx ( τ) = σ 2x δ( τ) , je vzájemná korelační funkce vstupu a výstupu soustavy shodná s impulsní charakteristikou soustavy, což plyne z filtrační vlastnosti Diracovy funkce Rxy ( τ) =
+∞
∫σ
2 xx
δ( τ − t ) g( t ) dt = σ 2xx g( τ) dt .
(3-83)
0
Po dosazení konvolutorního integrálu za jednu výstupní veličinu do autokorelační funkce výstupu spojité soustavy a výměně pořadí integrace lze dostat R yy ( τ) =
T +∞
T
1 1 y( t ) y( t + τ ) dt = ∫ ∫ y( t ) x(t + τ − t1 ) g(t1 )dt1dt = ∫ T0 T 0 −∞ +∞
+∞
T
1 = ∫ ∫ y( t ) x( τ − t1 ) g(t1 ) dt dt1 = ∫ R yx ( τ − t1 ) g(t1 ) dt1 , T0 −∞ −∞ +∞
R yy ( τ) = ∫ R yx ( τ − t ) g( t ) dt .
(3-84)
−∞
Po dosazení konvolutorních integrálů za obě výstupní veličiny do autokorelační funkce výstupu lze dostat R yy ( τ) =
T +∞ +∞
T
1 1 y( t ) y( t + τ ) dt = ∫ ∫ ∫ x(t − t1 ) g(t1 ) x(t + τ − t 2 ) g(t 2 ) dt1dt 2 dt = ∫ T0 T 0 −∞−∞ +∞+∞
+∞+∞
T
1 = ∫ ∫ ∫ x(t − t1 ) x(t + τ − t 2 ) g(t1 ) g(t 2 ) dt dt1dt 2 = ∫ ∫ Rxx ( τ + t1 − t 2 ) g(t1 ) g(t 2 ) dt1dt 2 . T0 −∞−∞ −∞−∞ (3-85) 3.9.3 Výkonová spektrální hustota výstupu a křížové spektrum vstupu a výstupu soustavy
Wiener-Hopfova rovnice představuje konvoluci impulsní charakteristiky soustavy a autokorelační funkce jejího vstupu. Z Fourierovy transformace této rovnice plyne pro křížové
49
spektrum vstupu a výstupu, výkonovou spektrální hustotou vstupu a frekvenční přenosovou funkci následující vztah G xy ( jω ) =
S xy ( ω ) = G xy ( jω ) S xx ( ω ) , tj.
S xy ( ω )
(3-86)
S xx ( ω )
Z rovnice pro výpočet autoakorelační funkce výstupu, která je konvolucí impulsní charakteristiky soustavy s křížového spektra mezi vstupem a výstupem, plyne S yy ( ω ) = G xy ( jω ) S yx ( ω ) , tj.
G xy ( jω ) =
S yy ( ω ) S yx ( ω )
.
(3-87)
Absolutní hodnotu (modul) přenosové funkce lze určit z následujícího vzorce G xy ( jω ) = G xy ( jω ) G xy ( − jω ) = 2
S xy ( ω ) S yy ( − ω ) S xx ( ω ) S yx ( − ω )
=
S yy ( ω ) S xx ( ω )
,
(3-88)
ve kterém byla použita k úpravě výsledného vzorce Fourierova transformace vztahu (93), tj. S xy ( ω ) = S yx ( − ω ) , a skutečnost, že výkonová spektrální hustota je sudá funkce. Pro náhodné
procesy s diskrétním časem lze vzorce modifikovat substitucí z = exp( jω ) , a proto G xy ( z ) =
S xy ( z ) S xx ( z )
,
G xy ( z ) =
S yy ( z ) S yx ( z )
G xy ( z ) = G xy ( z ) G xy ( z −1 ) = 2
,
S yy ( z ) S xx ( z )
(3-89)
Vztahy mezi výkonovými spektrálními hustotami vstupu a výstupu dynamické soustavy ve frekvenční oblasti jsou znázorněny v obr. 29.
Obr. 29. Přenos náhodného procesu lineární dynamickou soustavou Výkonová spektrální hustota veličiny na výstupu lineární dynamické soustavy je dána součinem spektra veličiny na vstupu a druhou mocninou absolutní hodnoty frekvenčního přenosu soustavy. To znamená, že spektrum náhodného procesu na výstupu je průchodem tohoto procesu soustavou frekvenčně tvarováno, viz obr. 30.
Obr. 30. Tvarování spektra průchodem lineární dynamickou soustavou 3.9.4 Rozptyl náhodného procesu na výstupu lineární dynamické soustavy
Výkon ergodického náhodného procesu je dán autokorelační funkcí pro nulové posunutí. Pro centrované náhodné procesy je tento výkon shodný s rozptylem. Rozptyl náhodné veličiny v čase spojité a diskrétní lze proto vypočítat podle vzorců
50
+∞
σ
2 yy
+∞
1 1 = R yy ( 0) = S yy ( ω ) dω = ∫ ∫ Gxy ( jω)G xy ( − jω) S xx ( ω) dω , 2 π −∞ 2 π −∞
σ 2yy = R yy ( 0) =
1 1 S yy ( z ) z −1 dz = G xy ( z ) G xy ( z −1 ) S xx ( z ) z −1 dz . ∫ ∫ 2 π j c1 2 π j c1
(3-90)
Pro spektra ve tvaru racionálních funkcí lze tyto integrály vypočítat pomocí tzv. reziduové věty z analýzy funkce komplexní proměnné (viz příloha A). Protože tyto integrály jsou důležité pro hodnocení rozptylu náhodné veličiny na výstupu lineární dynamické soustavy, jsou vzorce pro jejich výpočet tabelovány nebo jsou k dispozici algoritmy jejich numerického výpočtu. Návod na výpočet těchto integrálů je v kapitole o parametrické optimalizaci regulačních obvodů. Příklad:
Vstupní signál spojité dynamické soustavy prvního řádu s jednotkovým zesílením je bílý šum. Je třeba určit výkonovou spektrální hustotu náhodného procesu na výstupu soustavy. Řešení: Výkonová spektrální hustota bílého šumu se spojitým a diskrétním časem je S xx ( ω ) = σ 2e ,
S xx ( z ) = σ 2e
(3-91)
Přenos stabilní soustavy prvního řádu a druhá mocnina jeho absolutní hodnoty jsou G xy ( jω ) =
G xy ( jω )
2
1 , 1 + jωT 1 = , 1 + ω 2T 2
G xy ( z ) =
1 , 1 − E z −1
(3-92)
G xy ( z ) = G xy ( z ) G xy ( z −1 ) = 2
1
(z − E )( z
−1
. −E) (3-93)
kde T > 0, E < 1 . Výkonová spektrální hustota výstupní veličiny je následující S yy ( ω ) =
σ e2 , 1 + ω 2T 2
S yy ( z ) =
σ 2e
( z − E )( z
−1
−E)
.
(3-94)
Popis výpočtu rozptylu výstupní veličiny bude popsán v dalších částech učebního textu. Až na součinitelé jsou odvozená spektra shodná se spektry, které přísluší exponenciálním autokorelačním funkcím. Jestliže do vzorců bude pro výpočet výkonové spektrální hustoty dosazen rozptyl na výstupu soustavy, pak zmíněné vzorce budou totožné.
51
Identifikace Téma této kapitoly se týká modelů náhodných procesů a regulovaných soustav. Kromě různých typů těchto modelů bude podán návod k identifikaci parametrů těchto modelů z charakteristik náhodných procesů, a to nástroji, které jsou k dispozici v jednom toolboxu MATLABu, jmenovitě Identification Toolbox. Tento toolbox se odvolává výhradně na knihu [18]. Kromě manuálů MATLABu nalezne zájemce další informace v knihách a časopisech [4,6,20,22,25,32].
4.
Parametrické modely náhodných procesů a regulovaných soustav
4.1 Modely stacionárních náhodných procesů 4.1.1 Model typu AR (autoregresní model) V úvodních kapitolách byly definovány vlastnosti bílého šumu, který je nejjednodušším náhodným procesem. Kromě bílého šumu byly popsány vlastnosti náhodného procesu s exponenciálním průběhem autokorelační funkce. Jeden z příkladů demonstruje, že tento náhodný proces vznikne průchodem bílého šumu stabilní lineární dynamickou soustavou prvního řádu. Například diskrétní soustava tohoto řádu modeluje diferenční rovnice stejného řádu, tj. prvního. Náhodný proces y t s diskrétním časem na výstupu soustavy popisuje její model
yt + a1 yt −1 = et ,
(4-1)
ve kterém a1 je parametr modelu a et je vstupní veličina, tj. zmíněný bílý šum s nenulovým rozptylem σ 2e . V modelu nejsou obsaženy zpožděné vstupní veličiny, pouze poslední (aktuální) hodnota. Pro model této soustavy s řádem vyšším než jedna lze napsat diferenční rovnici ve tvaru
yt + a1 yt −1 + a2 yt − 2 + ...+ an yt − n = et ,
(4-2)
kde n představuje řád soustavy nebo také řád AR modelu a a1 , a 2 ,..., a n jsou parametry, u kterých se předpokládá a n ≠ 0 . Parametry modelu a1 , a 2 ,..., a n nejsou libovolné, ale musí vyhovovat podmínce stability přenosu zmíněné soustavy, podle které všechny kořeny charakteristického polynomu z n + a1z n −1 + a2 z n − 2 +...+ an = 0
(4-3)
musí ležet uvnitř jednotkové kružnice. V případě modelu prvního řádu musí tedy platit a1 < 1 . Z tvaru diferenční rovnice je zřejmé, že aktuální velikost výstupní veličiny je součtem váženého průměru minulých hodnot o počtu, který je roven řádu soustavy, a náhodné složky s vlastnostmi bílého šumu. Diferenční rovnice má tvar regresní rovnice s jednou náhodnou chybou. Regresní rovnice popisuje závislost aktuální velikosti výstupní veličiny na jejich minulých hodnotách. Tento typ modelu se nazývá autoregresní, zkratkou AR (AutoRegressive model). Ve speciální odborné literatuře o náhodných procesech se k zápisu diferenčních rovnic používá operátor posunutí. Zpoždění o jeden časový krok lze tedy zapsat jako y t −1 = q −1 y t , resp. zpoždění o k kroků y t − k = q − k y t . Symbolický zápis diferenční rovnice
52
yt + a1 yt −1 + a2 yt − 2 + ...+ an yt − n = et ,
(4-4)
se pak změní použitím tohoto operátoru na tvar
(1 + a q
−1
1
+ a2 q −2 + ...+ an q − n ) yt = et ,
A( q −1 ) y t = et .
(4-5)
V matematických základech teorie řízení jsou studenti seznamování se Z-transformací. Formální význam proměnné z −1 je shodný s operátorem zpětného posunutí q −1 . Po Ztransformaci diferenční rovnice se model zapisuje jako diskrétní přenos soustavy, to buď ve tvaru Y ( z −1 ) Y ( z −1 ) 1 1 −1 , Gey ( z ) = Gey ( z ) = = = , −1 −1 −1 −2 −n E ( z ) (1 + a1z + a2 z + ...+ an z ) E ( z ) A( z −1 ) −1
(4-6)
nebo po rozšíření zlomku mocninou z n ve tvaru, který obsahuje jen kladné mocniny proměnné z. V čitateli přenosu zůstane z n a ve jmenovateli tzv. reciproký polynom A* ( z ) = z n A( z −1 ) , tj. Gey ( z ) =
Y ( z) zn , = n E ( z ) ( z + a1z n −1 + a2 z n − 2 + ...+ an )
Gey ( z ) =
Y ( z) zn = * . E ( z) A ( z)
(4-7)
Je třeba si všimnout, že reciproký polynom A* ( z ) odpovídá charakteristické rovnici soustavy, která je stabilní jestliže kořeny polynomu leží uvnitř jednotkové kružnice. Pro použití modelu k predikci nebo řízení je třeba znát parametry modelu, které lze často zjistit ze záznamu dostatečně dlouhé posloupnosti y1 , y 2 ,..., y N , kde počet N je větší nebo aspoň roven řádu modelu. Postup výpočtu úzce souvisí s metodou lineární regrese a bude popsána v dalších kapitolách tohoto učebního textu. Výsledkem výpočtu regrese jsou nejen parametry modelu, ale také rozptyl chyby jednotlivých rovnic, pro které se předpokládají vlastnosti bílého šumu et . Výpočet autokorelační funkce bude předveden nejprve pro model prvního řádu. Příklad:
Je třeba stanovit autokorelační funkci AR procesu prvního řádu yt + a1 yt −1 = et . Řešení: Rozptyl náhodného procesu plyne z následující rovnice
{
E { yt2 } = E ( − a1 yt −1 + et )
2
} = E {a y 2 1
2 t −1
− 2 yt −1et + et2 } =
= a12 E { yt2−1} − 2 E { yt −1et } + E {et2 } = a12 E { yt2−1} + E {et2 } ,
(4-8)
protože yt −1 a et jsou navzájem nezávislé. Velikost yt −1 závisí jen na náhodné chybě do času
t − 1. Rovnici lze vzhledem k rovnosti E { yt2 } = E { yt2−1} = σ 2y zapsat ve tvaru σ 2y = a12 σ 2y + σ 2e ,
(4-9)
ze kterého plyne velikost korelační funkce pro posunutí nula
Ryy ( 0) = σ 2y =
σ 2e , 1 − a12
(4-10)
53
Výpočet autokorelační funkce pro posunutí τ > 0 se provede tak, že rovnice modelu se vynásobí veličinou yt +τ a na výsledek, obsahující součet součinů různě posunutých hodnot
yt yt +i , se použije operátor střední hodnoty. Střední hodnota uvedeného součinu E { yt yt +i } představuje autokorelační funkci Ryy ( i ) . Protože náhodná veličina et ovlivní podle AR modelu jen veličiny yi s hodnotou indexu t , t + 1, t + 2,... a proto veličiny yt a et +τ jsou nezávislé, platí
{
}
{
}
{
}
E yt yt + τ = E yt ( − a1 yt + τ −1 + et + τ ) = E − a1 yt yt + τ −1 + yt et + τ =
{
}
{
}
{
}
(4-11)
= − a1 E yt yt + τ −1 + E yt et + τ = − a1 E yt yt + τ −1 . Z této rovnice vyplývá diferenční rovnice prvního řádu pro korelační funkci Ryy ( τ) + a1 Ryy ( τ − 1) = 0 .
(4-12)
Ke konkrétnímu řešení nejen diferenciální, ale také diferenční, rovnice n-tého řádu je třeba doplnit n počátečních podmínek. S výše uvedenou počáteční podmínkou je řešením diferenční rovnice pro τ ≥ 0 následující funkce Ryy ( τ) = σ 2y ( − a1 ) . τ
(4-13)
Vzhledem k tomu, že autokorelační funkce je sudá, je výsledný tvar pro libovolné posunutí − ∞ < τ < +∞ dán vzorcem Ryy ( τ) = σ 2y ( − a1 ) . τ
(4-14)
Výkonová spektrální hustota, která přísluší výsledné autokorelační funkci je shodná s výkonovou spektrální hustotou, která byla zjištěna u náhodné veličiny po průchodu bílého šumu dynamickou soustavou prvního řádu. Parametr modelu typu AR souvisí s dříve používaným parametrem podle vzorce E = −a1 . Popsaným postupem lze vypočítat také autokorelační funkce obecného AR modelu. Rovnice modelu pro index t + τ se vynásobí veličinou yt a na výsledek se použije operátor
střední hodnoty, tj. E { yt yt +i } . Za předpokladu, že pro posunutí platí τ > 0 jsou veličiny y t a et +τ nezávislé, platí
{
}
yt yt + τ + a1 yt yt + τ −1 + a2 yt yt + τ − 2 + ...+ an yt yt + τ − n = yt et + τ
{
}
{
}
{
}
{
}
E yt yt + τ + a1 E yt yt + τ −1 + a2 E yt yt + τ − 2 +...+ an E yt yt + τ − n = E yt et + τ ,
(4-15)
Ryy ( τ) + a1 Ryy ( τ − 1) + a2 Ryy ( τ − 2) +...+ an Ryy ( τ − n) = 0
Výsledkem výpočtu je diferenční rovnice pro posloupnost Rxx ( τ) , která je shodného řádu jako řád AR modelu. Pro řešení diferenční rovnice je třeba zadat počáteční podmínky o počtu n, tj. hodnoty autokorelační funkce Ryy ( 0) , Ryy (1) ,..., Ryy ( n − 1) . Autokorelační funkce je funkce sudá, tj. Ryy ( τ) = Ryy ( − τ) , a proto diferenční rovnice musí platit pro interval posunutí − ∞ < τ < +∞ . Tato vlastnost se popisuje tzv. YuleWalkerovými rovnicemi, které jsou tvořeny odvozenými diferenčními rovnicemi pro posunutí 1, 2, 3, ... Koeficienty AR modelu a1 , a 2 ,..., a n a počáteční podmínky Ryy ( 0) , Ryy (1) ,..., Ryy ( n − 1) splňují prvních n − 1 rovnic
54
R yy (1) + a1 R yy ( 0) + a 2 R yy (1) +...+ a n R yy ( n − 1) = 0 R yy ( 2) + a1 R yy (1) + a 2 R yy ( 0) +...+ a n R yy ( n − 2) = 0 R yy ( 3) + a1 R yy ( 2) + a 2 R yy (1) +...+ a n R yy ( n − 3) = 0
(4-16)
......... R yy ( n − 2) + a1 R yy ( n − 3) + a 2 R yy ( n − 4) +...+ a n R yy ( 2) = 0 R yy ( n − 1) + a1 R yy ( n − 2) + a 2 R yy ( n − 3) +. ..+ a n R yy (1) = 0 .
Tyto rovnice mohou být použity při znalosti hodnot korelační funkce k výpočtu koeficientů AR modelu. V souvislosti s autokorelační funkcí AR modelu je třeba podat dodatečné vysvětlení k náhodným procesům s Markovovými řetězci, u kterých se odvodila také diferenční rovnice pro výpočet autokorelační funkce. Tyto procesy lze popsat modelem typu AR. 4.1.2 Model typu MA (model s klouzavým průměrem)
Dalším typem modelu vývoje náhodného procesu je klouzavý průměr (Moving Average) minulých hodnot náhodného procesu typu bílého šumu, tj.
y t = et + c1et −1 + c2 et −2 + ...+cn et − n ,
(4-17)
kde c1 , c2 ,..., cn jsou parametry modelu, z nichž některé mohou být nulové. S použitím operátoru zpětného posunutí se zápis modelu změní na y t = (1 + c1q −1 + c2 q −2 + ...+ cn q − n ) et ,
y t = C( q −1 ) et .
(4-18)
Přenos soustavy v Z-transformaci, který je dán vztahy Gey ( z
−1
)=
Y ( z −1 )
E ( z −1 )
= 1 + c1 z
−1
+ c2 z
−2
−n
+ ...+ cn z ,
Gey ( z
−1
)=
Y ( z −1 )
E ( z −1 )
= C ( z −1 )
(4-19)
neobsahuje jmenovatel. Po rozšíření výrazem z n se však změní na zlomek s reciprokým polynomem Y ( z ) z n + c1 z n −1 + c2 z n − 2 + ...+ cn Gey ( z ) = = , E ( z) zn
Y ( z) C * ( z) Gey ( z ) = = n . E ( z) z
(4-20)
Autokorelační funkce MA modelu se vypočte shodným postupem jako u AR modelu, tj. rovnice MA modelu se násobí veličinou yt +τ s podmínkou τ > 0 a na vzniklý součet součinů se použije operátor střední hodnoty. yt + τ yt = yt + τ et + c1 yt + τ et −1 + c2 yt + τ et − 2 + ...+ cn yt + τ et − n
{
}
{
}
{
}
{
}
{
}
E yt + τ yt = E yt + τ et + c1 E yt + τ et −1 + c2 E yt + τ et − 2 +...+ cn E yt + τ et − n .
(4-21)
Levá strana poslední rovnice představuje autokorelační funkci. Na pravé straně jsou nenulové střední hodnoty jen pro rozdíl indexu t + τ u veličiny yt +τ a indexu t − i u veličin et −i , i = 0, 1, 2,..., n , který je nejvýše roven řádu modelu, tj. τ + i ≤ n . Velikost yt +τ je dána lineární kombinací náhodných veličin et +τ −k , k = 0, 1, 2,..., n , z nichž může jen jedna (s indexem k = τ + i , který je menší nebo roven n) korelovat s každou z veličin et −i , i = 0, 1, 2,..., n . Charakteristickou vlastností autokorelační funkce náhodného procesu
55
s MA modelem jsou nulové hodnoty autokorelační funkce pro posunutí větší než je řád modelu. Speciálním případem posloupnosti klouzavých průměrů je pro c1 = c2 = ... = cn = 1 . Autokorelační funkce této posloupnosti je dána jen konečným počtem nenulových hodnot, tj. pro n ≥ τ ≥ 0 platí
{
}
Ryy ( τ) = E yt + τ yt = σ 2y ( n − τ) .
(4-22)
Příklad náhodného procesu s modelem typu MA, klouzavý průměr, a s koeficienty rovnými jedné je na obr. 31. Příklad obsahuje tři průběhy s různým řádem modelu, a to s n = 1, tj. bílý šum, n = 3 a n = 10 . Rozptyl těchto náhodných procesů roste úměrně n jak vyplývá z hodnoty autokorelační funkce pro nulové posunutí
Obr. 31. Příklad náhodného procesu typu MA - klouzavý průměr 4.1.3 Model typu ARMA
Model tohoto typu představuje kombinaci modelů AR a MA (AutoRegressive Moving Average model), tj. jeho diferenční rovnice je tvaru
yt + a1 yt −1 + a2 yt − 2 + ...+an yt − n = et + c1et −1 + c2 et − 2 + ...+ cn et − n .
(4-23)
Pomocí operátoru zpětného posunutí je zápis modelu následující
(1 + a q 1
−1
+ a2 q −2 + ...+ an q − n ) yt = (1 + c1q −1 + c2 q −2 + ...+ cn q − n ) et ,
A( q −1 ) y t = C( q −1 ) et . (4-24)
Přenos soustavy, která tvaruje bílý šum na náhodný proces typu ARMA, je následující
56
Y ( z −1 ) 1 + c1z −1 + c2 z −2 + ...+ cn z − n Gey ( z ) = = −1 −2 −n , E ( z −1 ) 1 + a1z + a2 z + ...+ an z −1
Gey ( z
−1
)=
Y ( z −1 )
E ( z −1 )
=
C ( z −1 )
A( z −1 )
,
(4-25)
resp. Y ( z ) z n + c1z n −1 + c2 z n − 2 + ...+ cn , Gey ( z ) = = E ( z ) z n + a1z n −1 + a2 z n − 2 + ...+ an
Y ( z) C* ( z) Gey ( z ) = = . E ( z ) A* ( z )
(4-26)
4.1.4 Spektrum náhodného procesu typu ARMA
Vzorec pro výkonovou spektrální hustotu tohoto náhodného procesu s diskrétním časem je podle pravidel z kapitoly, která popisuje průchod náhodného procesu lineární dynamickou soustavou, následující S yy ( z ) = Gey ( z ) Gey ( z −1 ) See ( z ) =
C * ( z ) C * ( z −1 ) 2 C ( z ) C ( z − 1 ) 2 σe = σe . A* ( z ) A* ( z −1 ) A( z ) A( z −1 )
(4-27)
Spektrum je racionální funkce s proměnnou z, resp. z −1 z-1. Je zřejmé, že pro proces typu AR je C( z ) = 1 a pro proces typu MA je A( z ) = 1 . Tvar spektra jako funkce frekvence se získá transformací z = exp( jω∆ t ) , kde ∆ t je vzorkovací perioda. Frekvenční rozsah je však limitován Shannon-Kotelnikovým vzorkovacím teorémem na ω ≤ π ∆ t .
4.2 Modely nestacionárních náhodných procesů Nestacionární procesy mají uplatnění při modelování vývoje chování například ekonomických systémů. V těchto systémech se vyskytují veličiny, které jsou součtem náhodné a deterministické složky, která je nestacionární, tj. v čase proměnná. Mezi deterministické složky může patřit sezónní periodické kolísání nebo vývoj aproximovatelný polynomem. V souvislosti s popisem těchto procesů bude zaveden operátor zpětné diference wt = ∇yt = yt − yt −1 = (1 − q −1 ) yt , kde je dříve zmíněný operátor zpětného posunu q −1 . Posloupnost wt vznikne diferencováním posloupnosti yt a naproti tomu posloupnost yt vznikne postupnou sumací (integrací) posloupnosti wt . Operaci diferencování posloupnosti v Z-
transformaci popisuje přenos 1 − z −1 a sumaci (integraci) přenos 1 (1 − z −1 ) . Je třeba dodat, že integrační soustava není stabilní.
Odezva spojité integrační soustavy na vstupní funkci ve tvaru polynomu je polynom o jeden řád vyšší, což lze vyplývá ze vzorce pro integrál funkce t k , která je t k +1 ( k + 1) . Podobně spojité diferencování vede na snížení řádu polynomu. Tuto vlastnost mají také diskrétní procesy. Model ARMA pro stacionární procesy může být zobecněn na tvar vhodný pro nestacionární procesy
(1 − q ) A( q ) y −1 k
−1
t
= C( q −1 ) et ,
(4-28)
kde k je řád integrace. Charakteristický polynom v posledním modelu má navíc k-násobný kořen pro z = 1, a proto je tento proces nestabilní - nestacionární. Po k-násobném diferencování uvedeného typu nestacionárních procesů wt = ∇ k yt = (1 − q −1 ) yt , k
(4-29)
57
je výsledkem náhodný proces, A( q −1 ) wt = C( q −1 ) et .
(4-30)
jehož charakteristický polynom A( q −1 ) je stabilní, a proto je proces stacionární. Několikanásobné diferencování může transformovat proces nestacionární na stacionární. Při jedné diferenciaci ( k = 1) se z časového průběhu odstraňuje lineární trend. Dvojité diferencování odstraňuje parabolický nárůst hodnot ve sledované řadě. Popsané nestacionární modely se nazývají ARIMA (autoregressive integrated moving average). Slovo „integrated“ charakterizuje výše popsanou integraci. Příklad účinku diferencování na nestacionární náhodný proces je uveden v obr. 32 pro 401 simulovaných vzorků. Výsledkem dvojité diferenciace je stacionární náhodný proces. Prvý záznam obsahuje s časem parabolický nárůst velikosti hodnot posloupnosti yt , ve druhém je pozorovatelný lineární trend a třetí již lze považovat za stacionární náhodný proces s nulovou střední hodnotou.
Obr. 32. Pøíklad pøevodu nestacionárního procesu na stacionární dvojitým diferencováním Tento příklad byl ve skutečnosti vytvořen tak, že nejprve byla vygenerována náhodná posloupnost s autokorelační funkcí typu E τ a pak postupným sumováním byl vytvořen zde prezentovaný výchozí nestacionární náhodný proces. K postupnému sumování byla použita funkce MATLABu cumsum(x), kde x je vstupní vektor. Skutečný příklad z praxe představuje nárůst počtu obyvatelstva USA za posledních 200 let od roku 1790 do 1990 v milionech. Posloupnost počtu obyvatel a její diference do 3 řádu jsou znázorněny v obr. 33. Diference byly vypočteny funkcí MATLABu diff(x). Se zvětšováním řádu diference se zkracuje posloupnost. Podle tvaru závislosti lze nárůst počtu obyvatel považovat za parabolický, což potvrzuje také přibližně lineární nárůst první diference této
58
posloupnosti. Druhé diference posloupnosti jsou bez zřetelného trendu, avšak vykazují nestejný rozptyl v daném období. V druhých diferencích však může být nenulová střední hodnota jako důsledek diferencí lineárního trendu v prvých diferencích. Velikost střední hodnoty druhých diferencí je 1.15. Třetí diference posloupnosti by měla mít nulovou střední hodnotu. Ukazuje se však, že střední hodnota těchto diferencí je -0.04, což je vzhledem k rozptylu jejich hodnot zanedbatelné. Průběh třetí diference umožňuje tvrdit, že až na přibližně prvních 50 let je vývoj těchto diferencí možné považovat za stacionární. Vysvětlením může být to, že v prvé polovině minulého století byl celkový počet obyvatel USA nízký, a proto také jeho druhé a třetí diference jsou malé. Pro posloupnost třetích diferencí je v kapitole o optimální predikci vypočten autoregresní model, který je použit k predikci počtu obyvatel USA v roce 2000.
Obr. 33. Posloupnost vývoje poètu obyvatelstva USA a její postupné diference Speciálním nestacionárním náhodným procesem je proces s náhodnými přírůstky. Jiným označením tohoto procesu je náhodná procházka (random walk). Jeho model je následující yt = yt −1 + et ,
(4-31)
kde et je bílý šum s rozptylem σ 2e . Výsledkem diferenciace tohoto procesu je bílý šum, tj. stacionární proces. Jestliže proces začíná v čase t = 0 hodnotou y0 = 0 , pak se tento proces nazývá Wienerův nebo Brownův pohyb [4], který se týká částic o rozměru řádu 0.001 mm v tekutinách. U tohoto procesu je střední hodnota nulová a rozptyl roste s časem σ 2y = t σ 2e .
Střední hodnot veličiny v čase t = 0 je E { y0 } = E { 0} = 0 . To lze dokázat pomocí rekurzivních vztahů. Platí diferenční rovnice, podle které E { yt } = E { yt −1 + et } = E { yt −1} + E {et } = 0 , a podobně pro rozptyl
{
E { yt2 } = E ( yt −1 + et )
2
} = E{y
2 t −1
} + 2 E { y e } + E {e } = E { y } + σ 2 t
t −1 t
59
2 t −1
2 e
.
4.3 Parametrické modely regulovaných soustav 4.3.1 Model typu ARX (autoregresní model s dalším vstupem) Vlastnosti modelu typu AR, tj. soustavy se vstupem bílého šumu, byly popsány v minulých kapitolách. Jestliže veličina yt označuje výstup regulované soustavy, pak závisí nejen na poruše, reprezentované vstupem bílého šumu, ale také aspoň na jednom dalším (tzv. externím) vstupu regulované soustavy, který plní funkci akční veličiny. Tato veličina se označuje ut . Veličiny yt a ut mohou být jednorozměrné nebo vícerozměrné, tj. mohou u vícerozměrné regulované soustavy reprezentovat vektor vstupů a vektor výstupů. Autoregresní model s tímto externím vstupem má tvar rovnice
yt + a1 yt −1 + a2 yt − 2 + ...+ ana yt − n = b1ut − nk + b2 ut − nk −1 + ...+bnb ut − nk − nb + et
(4-32)
nebo ve zjednodušené verzi zápisu s polynomy s operátorem zpětného posunutí q −1 je následující A( q −1 ) yt = B( q −1 ) ut − nk + et ,
(4-33)
kde na je stupeň polynomu A( q −1 ) , nb je stupeň polynomu B( q −1 ) a nk je počet kroků dopravního zpoždění. Nejmenší počet kroků dopravního zpoždění se předpokládá rovno jedné. Z důvodu fyzikální realizovatelnosti nepřevyšuje stupeň polynomu B( q −1 ) stupeň
polynomu A( q −1 ) , tj. nb ≤ na . Tento model regulované soustavy se podle MATLABu označuje ARX (AutoRegressive with eXternal input model). Jinak se tento model nazývá regresní, a to podle tvaru rovnice, ve které je proměnná yt na levé straně a její minulé hodnoty a hodnoty akční veličiny jsou na pravé straně, přičemž et představuje náhodnou chybu. To znamená, že výstup soustavy je předpokládán ve tvaru lineární kombinace jeho minulých výstupů a zpožděné akční veličiny včetně jejich minulých hodnot. Počet minulých hodnot u regulované a akční veličiny je ovšem limitován. Rovnice v tomto tvaru je výchozí lineární regresi metodou nejmenších čtverců, kterou se z několika pozorování neznámé koeficienty vypočítají. Souvislosti korelačních funkcí a výkonových spektrálních hustot se zabývá zvláštní kapitola o průchodu náhodného signálu lineární soustavou. Úlohou řízení není jen pasivní analýza stavu, ale aktivní změny akční veličiny na základě výstupu regulované soustavy s cílem splnit zvolené kritérium, což je předmětem dalších kapitol učebního textu, a proto v tato kapitola se omezuje jen na popis vlastností jednotlivých typů modelů regulovaných soustav. 4.3.2 Model typu ARMAX (autoregresní model s klouzavým průměrem model a s dalším vstupem) Autoregresní model s klouzavým průměrem a s dalším externím vstupem má tvar rovnice
yt + a1 yt −1 + ...+ ana yt − n = b1ut − nk +...+bnb ut − nk − nb + et + c1et −1 +...+ cnc et − nc ,
(4-34)
A( q −1 ) yt = B( q −1 ) ut − nk + C( q −1 ) et ,
(4-35)
kde navíc oproti modelu ARX je polynom C( q −1 ) s řádem nc . Tento model regulované soustavy se podle MATLABu označuje ARMAX (AutoRegressive Moving Average with eXternal input model). V odborné literatuře se tento model nazývá Aströmův model podle významného odborníka v oblasti teorie řízení ze Švédska. Model neumožňuje sestavit
60
regresní rovnice s lineární kombinací minulých velikostí hodnot bílého šumu a ty pak najednou řešit metodou nejmenších čtverců. Východisko k identifikaci koeficientů modelu může být v průběžném postupu identifikace. Na začátku průběžné identifikace jsou zpožděné hodnoty chyby modelu, tj. et −1 , et − 2 ,... , nulové a postupně se poslední velikost chyby et vypočítá na základě známých posledních a zpožděných hodnot vstupů a výstupů soustavy. Tento postup se označuje jako pseudolineární regrese a bude blíže popsán v kapitole o identifikaci. 4.3.3 Ostatní modely
Nejobecnější struktura modelu regulované soustavy podle [18] je následující
A( q
nu
C( q −1 )
Bi ( q −1 )
+ u e, )y = ∑ F (q ) D( q ) A( q ) , B ( q ) , C( q ) , D( q ) , F ( q ) jsou −1
t
i =1
−1
i ,t − nki
−1
(4-36)
t
i
−1 −1 −1 −1 −1 polynomy. Speciální hodnoty některých kde i i polynomů vedou na oba již popsané modely, tj. ARX a ARMAX. Další speciální tvary modelu jsou následující
[ ] = [ B( q ) F ( q ) ] u
OE:
yt = B( q −1 ) F ( q −1 ) ut − nk + et
BJ:
yt
−1
−1
t − nk
[
]
+ C( q −1 ) D( q −1 ) et
(Output-Error)
(4-37)
(Box-Jenkins)
(4-38)
Mezi modely regulovaných soustav patří ještě stavový model s vektorem vnitřního stavu xt , pro který je výstup yt závislý na vstupu ut , vnitřním stavu xt a náhodné veličině typu bílý šum et , tj. platí xt +1 = Axt + But + Ket
(4-39)
yt = Cxt + Dut + et .
4.3.4 Přehled modelů náhodných procesů a regulovaných soustav
Přehled modelů vývoje náhodných veličin, které jsou diskrétní v čase, je v Tab. 1. Rovnice modelů jsou zapsány pomocí polynomů s operátorem zpětného posunu q −1 v jejich argumentu. Tab. 1. Základní typy náhodných procesů Název procesu
Matematický model
bílý šum
et , E {et } = 0 , E {et2 } = σ 2e , E {et et + k } = 0, k ≠ 0
proces s náhodnými přírůstky
yt = yt −1 + et
proces typu AR (autoregresní)
A( q −1 ) y t = et
proces typu MA (klouzavý průměr)
yt = C( q −1 ) et
proces typu ARMA
A( q −1 ) yt = C( q −1 ) et
61
Přehled modelů regulovaných soustav je v Tab. 2. K jejich popisu je rovněž použito polynomů s operátorem zpětného posunu. Tab. 2. Základní modely regulovaných soustav Název
Matematický model
obecný model
A( q
nu
Bi ( q −1 )
C ( q −1 )
model typu ARMAX (Aströmův model)
u + e )y = ∑ F (q ) D( q ) A( q ) y = B( q ) u + e A( q ) y = B( q ) u + C( q ) e
model typu Output-Error
yt = B( q −1 ) F ( q −1 ) ut − nk + et
model typu Box-Jenkins
yt
model typu ARX (regresní model)
−1
t
i =1
−1
−1
t − nk
t
−1
i ,t − nki
−1
−1
t
t
−1
t − nk
t
t
[ ] = [ B( q ) F ( q ) ]u −1
−1
i
−1
t − nk
[
]
+ C( q −1 ) D( q −1 ) et
K popsanému třídění a struktuře modelů je třeba dodat ještě rozdělení poruchových veličin, které lze zařadit také mezi vstupy soustavy. Na rozdíl od vstupu typu akční veličiny je velikost poruchy neovlivnitelná. Všechny popisované typy modelů předpokládají, že náhodná porucha je neměřitelná. V praxi jsou však často součástí modelu také poruchy, které lze měřit a k řízení využít, jak je naznačeno v obr. 34. Měřitelné poruchy ovlivňují výstup regulované soustavy a v regulátoru se vyhodnocují v přímovazebního regulátoru, jehož výstup se u lineárních systémů přičítá k výstupu zpětnovazebního regulátoru. Teorie řízení se zabývá návrhem zpětnovazebního regulátoru. U přímovazebního regulátoru je potřebné, aby korekce přímou vazbou odpovídala ne aktuální, ale budoucí hodnotě výstupu regulované soustavy. V přímé vazbě je tedy třeba předvídat vývoj měřených poruchových veličin..
Obr. 34. Blokové schéma regulačního obvodu s měřenou poruchou
62
5. Identifikace modelů náhodných procesů a soustav V této kapitole budou popsány identifikační metody pro parametry modelů náhodných procesů a regulovaných soustav ze záznamů náhodných průběhů veličin, jejichž vzájemné vztahy modely popisují a které musí být k dispozici. Pro výpočet parametrů modelu regulované soustavy jsou tyto záznamy obvykle pořízeny buď při jejich běžném provozu a nebo se její vstupy pro regulaci záměrně náhodně mění, přičemž rozsah a způsob těchto změn nevybočuje z běžných provozních stavů. Výhoda tohoto způsobu identifikace spočívá v tom, že regulovaná soustava se identifikuje v běžném pracovním bodě pro rozsah změn, které připadají v úvahu při běžné provozní regulaci. Při využití deterministických průběhu vstupních veličin, tj. například skoku pro měření přechodové charakteristiky, je třeba volit znatelně velkou změnu, aby se překryl vliv náhodných poruch, které ovlivňují výstup soustavy. Těmito skoky se lze dostat mimo běžný pracovní bod soustavy a nebo průběh odezvy můře způsobit dokonce ekonomické ztráty. Například by bylo nepřípustné identifikovat vliv vstupních parametrů vysokopecního procesu na složení surového železa v takovém rozsahu, že by se po několik směn vyráběl naprosto dále nezpracovatelný produkt. Popisované metody identifikace se zaměří na tzv. jednorázovou identifikaci a průběžnou identifikaci. Průběžnou identifikaci je možné použít tehdy, kdy jednorázová identifikace nestačí, protože vlastnosti regulované soustavy se průběžně mění. Výčtem předností záznamu náhodných průběhů vstupních a výstupních veličin nelze odradit uživatele od metody identifikace z průběhu impulsní nebo přechodové charakteristiky všude tam, kde je to možné a kde nejsou výsledky měření rušeny parazitními vlivy náhodných poruch nebo chyb měření. Je třeba si rovněž uvědomit, že záznamy náhodných procesů nejsou tak transparentní jako prostý skok na vstupu a jeho odezva na výstupu soustavy. Ostatně mezivýsledkem zpracování náhodných průběhů na vstupu a výstupu mohou být klasické charakteristiky dynamických vlastností regulovaných soustav v časové nebo frekvenční oblasti. Metodu identifikace je třeba vybrat na základě konkrétních podmínek.
5.1 Jednorázová identifikace parametrů modelu Jednorázovou metodou identifikace se rozumí případ, kdy je k dispozici záznam časový průběh vstupních, výstupních a případně poruchových veličin. V tomto učebním textu je pro následující výklad předpokládáno, že zaznamenané průběhy jsou náhodné. Metody identifikace lze rozdělit do dvou skupin, a to • neparametrické metody • parametrické metody Pod neparametrickými metodami identifikace modelů se rozumí postup, kdy je z náhodných průběhů vstupních a výstupních veličin soustavy získána přechodová nebo impulsní charakteristika a nebo frekvenční přenos. V základních kurzech identifikace jsou studenti dostatečně seznámení se souborem praktických metod, a to jak časové průběhy těchto charakteristik zpracovat a získat tak odhady zesílení a časových konstant soustavy. Výsledkem parametrických metod identifikace jsou parametry aproximačního diskrétního modelu regulované soustavy nebo modelu vývoje náhodného procesu, tj. parametry diferenční rovnice. Výčet různých tvarů modelu vývoje náhodných procesů a dynamických vlastností regulovaných soustav je v předcházejících kapitolách.
63
Univerzální nástroje pro identifikaci parametrů modelů poskytuje jeden z toolboxů programového systému MATLAB s názvem Identification Toolbox. Je proto vhodné se metodami již připravenými k použití podrobně zabývat. Pro výuku je důležitá příprava vstupních dat, a to zejména jejich simulační vytváření. Po výpočtu parametrů je třeba výsledky různých variant modelů ohodnotit a umět vhodný model doporučit jako výchozí pro syntézu parametrů regulátoru. Uživatel by měl rovněž něco vědět o mechanismu odhadů. Z praktických důvodů se hledání parametrů modelů vývoje náhodných procesů omezí na typy AR a ARMA a u modelů regulovaných soustav to budou typy ARX a ARMAX. Protože modely AR a ARMA jsou zjednodušením modelů ARX a ARMAX, budou opakovány jen modely regulovaných soustav. Autoregresní model (ARX) regulované soustavy má tvar yt + a1 yt −1 + a2 yt − 2 + ...+ ana yt − n = b1ut − nk + b2 ut − nk −1 + ...+bnb ut − nk − nb + et ,
(5-1)
A(q −1 ) yt = B(q −1 )ut − nk + et .
(5-2)
Je si třeba všimnout, že parametr a0 je v polynomu A(q −1 ) roven jedné a parametr b0
v polynomu B(q −1 ) je naproti tomu roven nule, a proto velikost obou parametrů není třeba identifikovat. Počet pólů přenosové funkce je na a počet nul mimo počátek komplexní roviny je nb . Přirozené číslo nk je nejméně rovno jedné a představuje počet kroků dopravního zpoždění. U soustav bez dopravního zpoždění je nk = 1 . Model typu AR je zjednodušením uvedeného modelu. Stupeň obou polynomů a zpoždění lze shrnout pro procedury MATLABu do jednoho vektoru, a to nn = [na nb nk]. Pro soustavu s jedním vstupem a jedním výstupem jsou prvky tohoto vektoru čísla. Pro soustavu s více vstupy jsou parametry nb a nk vektory, jejichž i-tý prvek přísluší i-tému vstupu. Soustavy s NU vstupy a NY výstupy mají prvky vektoru nn matice, a to na typu (NY,NY) nb typu (NY,NU) a nk typu (NY,NU). Autoregresní model s klouzavým průměrem (ARMAX) regulované soustavy má tvar yt + a1 yt −1 + ...+ ana yt − n = b1ut − nk +...+bnb ut − nk − nb + et + c1et −1 +...+ cnc et − nc ,
(5-3)
A(q −1 ) yt = B(q −1 )ut − nk + C(q −1 )et .
(5-4)
V tomto modelu je v polynomu C(q −1 ) vždy roven jednotce parametr c0 , a proto se neidentifikuje. Stupně polynomů a zpoždění lze shrnout do jednoho vektoru, a to nn = [na nb nc nk]. 5.1.1 Metody odhadu parametrů Princip metod odhadu parametrů modelu v MATLABu spočívá v minimalizaci součtu druhých mocnin odchylek mezi skutečnými hodnotami výstupní veličiny a hodnotami predikovanými pomocí modelu. Tento přístup k identifikaci je založen na chybě predikce (prediction error approach). Pro model typu AR a ARX je výsledek výpočtu dán jednorázovým řešením přeurčené soustavy lineárních rovnic, který je popsán v příloze. Ostatní metody vyžadují iterační numerické hledání zmíněného minima. Model ARX (resp. AR) lze uspřádat tak, aby odpovídal obecné rovnici yt = zt P + et pro použití metody nejmenších čtverců, která je popsána v jedné z příloh, a to například yt = b0 ut − k − a1 yt −1 + b1ut − k −1 − a2 yt − 2 + ...+bn ut − k − n − an yt − n + et .
(5-5)
Na levé straně rovnice je závisle proměnná yt a na pravé straně nezávisle proměnná zt ve tvaru řádkového vektoru
64
[
]
zt = ut − k , yt −1 , ut − k −1 , yt − 2 ,..., ut − k − n , yt − n ,
(5-6)
která je vynásobena sloupcovým vektorem parametrů (po transpozici je to vektor řádkový)
[
P = b0 , − a1 , b1 , − a2 , ..., bn , − an
]
T
,
(5-7)
Vektor nezávisle proměnných obsahuje také minulé hodnoty výstupní veličiny, které v roli výstupu soustavy mají charakter nezávislých veličin, a proto pojem nezávislé proměnné je třeba chápat jen ve spojitosti s metodou výpočtu nejmenších čtverců. Jak již bylo uvedeno, výše popsaný model se nazývá rovněž regresní. Jestliže regresní model má obsahovat také absolutní člen, pak je třeba upravit vektor nezávisle proměnných a vektor parametrů tak, že se jako poslední složka vektoru nezávislých parametrů zařadí jednotka a vektor parametrů se rozšíří o absolutní člen d
[ P = [b , − a , b , − a , ..., b , − a , d ] .
]
zt = ut − k , yt −1 , ut − k −1 , yt − 2 ,..., ut − k − n , yt − n , 1 ,
(5-8)
T
0
1
1
2
n
(5-9)
n
Nechť je počet parametrů soustavy (rozměr vektoru P ) roven L a nechť jsou shromážděna data z časových okamžiků τ = 1, 2 ,..., t . Soustava rovnic y t = Z P pro výpočet
parametrů v čase t je tvořena vektorem y t , který obsahuje počet složek t, tj. jeho typ je (t,1) , a maticí Z typu (t , L)
[
Z = z1 , z2 ,..., zt
]
T
,
[
y t = y1 , y2 ,..., yt
]
T
,
(5-10)
kde t > L , tj. zmíněná soustava je přeurčena. Podle vzorců v příloze pro řešení přeurčené soustavy rovnic je odhad vektoru parametrů v čase t dán vztahem −1 P$ = Z + y t = (Z T Z ) Z T y t
(5-11)
a odhad rozptylu chyby modelu se vypočte podle vzorce 1 R$ = (y Tt y t − P$ T Z T Z P$ ) . t
(5-12)
Výsledkem výpočtu jsou nestranné odhady parametrů jen za předpokladu, že posloupnost chyb modelu, tj. ei , i = 0,1,..., t , má vlastnosti bílého šumu. Minimalizace čtverců odchylek chyb modelu se kryje pro normální rozdělení chyb s metodou maximální věrohodností, která je rovněž stručně popsána v jedné z příloh. Protože vektor nezávislých proměnných zt obsahuje zpožděné hodnoty výstupu soustavy, je předpoklad o posloupnosti chyb modelu typu AR nebo ARX často nesplnitelný. Vzájemně posunuté hodnoty chyby nejsou nezávislé, a proto korelují. Vypočtené parametry jsou pak vychýlené. Tento nedostatek metody nejmenších čtverců lze odstranit zavedením metody tzv. instrumental variable, která přetransformuje soustavu rovnic tak, aby pro její řešení byla splněna podmínka, pro kterou je jsou odhady parametrů nestranné. Tato metoda se v MATLABu označuje IV4 (instrumental variable). Podrobnosti o této metodě se lze dozvědět v Ljungově knize [18] z roku 1987, na kterou se manuály MATLABu odvolávají. Pro jednorázový výpočet parametrů modelu typu ARMAX (resp. ARMA) nelze použít výše popsaného postupu, který se zakládá na pseudoinverzi matice jako jednoho z kroků řešení
65
přeurčené soustavy rovnic. Parametry těchto modelů lze vypočítat iteračním postupem vyhledání minima výrazu N
VN (G , H ) = ∑ ei2 ,
(5-13)
i =1
který je nazýván kvadratickým kritériem nebo ztrátovou funkcí (loss function) a ve kterém parametry G, H vyplývají z výpočtu jednotlivých chyb modelu, tj.
[
]
et = H −1 (q ) yt − G(q )ut .
(5-14)
Při průběžné identifikaci parametrů modelu typu ARMAX (resp. ARMA) lze však použít dříve zmíněný postup, který se nazývá pseudolineární regrese [20]. Princip této metody spočívá v úpravě vektoru nezávisle proměnné a vektoru parametrů do tvaru
[
]
zt = ut − k , yt −1 , ut − k −1 , yt − 2 ,..., ut − k − n , yt − n , et −1 t − 2 , et − 2 t − 3 ,..., et − n t − n −1 ,
[
P = b0 , − a1 , b1 , − a2 , ..., bn , − an , c1 , c2 ,..., cn
]
T
.
(5-15) (5-16)
Vektor nezávisle proměnné je rozšířen o chyby modelu odhadnuté v předchozích výpočetních krocích. 5.1.2 Simulace a základní charakteristiky pro neparametrickou identifikaci Následující popis se opírá o prostředky programového systému MATLAB, jmenovitě jeho Identification toolbox. Náhodné průběhy vstupních a výstupních veličin jsou v praxi získávány měřením. Z jejich záznamu lze vybrat různé úseky, pro které lze vyhodnotit parametry modelu samostatně. Je vhodné, aby záznamy byly centrovány a bez lineárního trendu. K centrování a odstranění trendu slouží funkce detrend. Pro účely výuky a osvojování vlastností identifikačních algoritmů je však třeba pokusná data generovat. Je výhodné, aby tato data odpovídala předem zvolenému modelu s parametry, které budou cvičně identifikovány některým prostředkem zmíněného toolboxu. Výsledek identifikace parametrů lze porovnat s jejich výchozí volbou. Vlastnosti simulované soustavy se zadávají vektory koeficientů polynomu, např. A, B, .... Z těchto polynomů se pomocí funkce poly2th(A,B,C,...) vygeneruje pomocná matice v tzv. theta formátu, např. označená th0, ve které jsou uspořádány všechny výsledky identifikace. Strukturou této matice není třeba studovat, protože výsledky přehledně prezentuje funkce present(th0). Polynomy tedy představují parametry funkce poly2th. Tato funkce, podobně jako řada dalších funkcí MATLABu, může obsahovat proměnlivý počet parametrů jako funkce C-jazyka. Náhodný průběh vstupní veličiny lze vygenerovat příkazem u = idinput(400,’rbs’, [0 0.3]), ve kterém první parametr, 400, udává délku vektoru u, druhý parametr představuje zadání typu náhodného procesu, ’rbs’ - random binary signal, a třetí je šířka frekvenčního pásma ve zlomku Nyquistovy frekvence, tj. zde od 0 do 0.3 mezní frekvence vzorkovaných dat. Náhodný průběh výstupní veličiny s aditivní chybou typu Gaussovského bílého šumu, e = randn(400,1), je simulován příkazem y = idsim([u e], th0). Časový průběh vygenerovaných dat lze znázornit příkazem idplot([y u]). Sled příkazů je tedy následující » A = [1 -1.5 0.7]; » B = [0 1 0.5]; » th0 = poly2th(A,B,[1 -1 0.2]); » u = idinput(400, 'rbs', [0 0.3]);
66
» e = randn(400,1); » y = idsim([u e], th0); » idplot([y u]);
Je třeba zdůraznit, že první prvek vektoru A je roven vždy jedné, první prvek vektoru B je roven vždy nule a první prvek vektoru C, který je zapsán v hranaté závorce jako třetí argument funkce poly2th, je roven vždy jedné. Výsledek simulace je znázorněn na obr. 35. Neparametrická metoda identifikace vychází ze znalosti impulsní nebo přechodové charakteristiky, která se vypočte pomocí autokorelační funkce vstupní veličiny a vzájemné korelační funkce výstupní veličiny. Impulsní charakteristika se vypočte voláním funkce cra s několika parametry. V nejjednodušším případě stačí pro výpočet funkce jako první parametr zadat [y u]. Druhý parametr představuje počet hodnot korelační funkce, viz příklad“ » ir = cra([y u],40); » sr = cumsum(ir); » plot(sr)
V argumentu funkce cra je zadán počet hodnot korelační funkce na 40, což je desetina 400, pro kterou je přesnost odhadu korelační funkce dostatečná. Průběh odhadu impulsní charakteristiky v závislosti na čase (lags) je znázorněn v obr. 36 včetně hranice spolehlivosti pro 99 %. Označení „lags“ má stejný význam jako posunutí v korelačních funkcích.
Obr. 35. Simulované časové průběhy vstupní a výstupní veličiny identifikované soustavy
67
Obr. 36. Impulsní charakteristika vypočtená z korelačních funkcí Přechodová charakteristika se získá integrací impulsní charakteristiky, tj. v diskrétních hodnotách kumulovanou sumací příkazem cumsum. Příkazem spa lze vypočítat frekvenční charakteristiku G a spektrum výstupní veličiny PHIV. Graf logaritmické amplitudové a fázové charakteristiky se vykreslí příkazem bodeplot. » [G,PHIV]=spa([y u]); » bodeplot(G) » bodeplot(PHIV)
5.1.3 Parametrické metody identifikace Základní příkaz pro výpočet odhadu parametrů modelu ve theta formátu je th = funcion([y u],ths) ,
kde funcion je obecné označení funkce pro výpočet parametrů a ths specifikuje strukturu modelu prostřednictvím rozměru jednotlivých vektorů s parametry a počet kroků zpoždění. Pro ARX modely soustav je používána funkce arx (požívá metodu nejmenších čtverců) nebo iv4 (metoda tzv. instrumental variable). Struktura ARX modelu v parametru ths funkce je dána vektorem nn = [na nb nk]. Pro AR modely vývoje náhodných procesů je použita funkce ar. První parametr je vektor y a druhým parametrem je řád modelu na, případným třetím parametrem je typ metody řešení. Pro model typu ARMAX se používá funkce armax. Struktura modelu v parametru funkce ths může být zadána buď prostřednictvím počátečního odhadu parametrů modelu ve formátu theta nebo je dána vektorem nn = [na nb nc nk]. Pro model typu ARMA není speciální funkce, ale jeho parametry lze vypočítat užitím armax, přičemž první parametr je ve tvaru vektoru a druhý parametr ve tvaru nn = [na nc]. Funkce pro výpočet odhadu parametrů modelů PEM, ARMAX, OE a BJ s iteracemi mají ještě další parametry o kterých se lze více dovědět po příkazu help auxvar. Jsou to parametry v následujícím pořadí maxiter, tol a lim. Parametr maxiter udává maximální přípustný počet iterací (pokud není zadán je zvolen 10). Parametr tol je tolerance pro ukončení iterací, se kterou se srovnává norma Gauss-Newtonova vektoru (pokud není zadána je zvolena 0.01). Parametr lim je relativní váhou pro velké chyby modelu, která se uplatňuje tak, že čtverce chyb větších než lim-násobek směrodatné odchylky jsou ve ztrátové funkci nahrazeny přímo jejich hodnotami. 68
Tento parametr dává algoritmu odhadování robustnost (pokud není zadána je zvolena 1.6, hodnota nula vylučuje zmíněnou robustnost). Zapsáním posledního parametru ‘trace’ do zmíněných funkcích se vyvolá průběžný výpis informací o postupu výpočtu. Pro data příkladu z této kapitoly platí » th = armax([y u],[2 2 2 1]); » present(th) This matrix was created by the command ARMAX on 8/14 1997 at 23:0 Loss fcn: 0.9643 Akaike`s FPE: 0.9936 Sampling interval 1 The polynomial coefficients and their standard deviations are B= 0 0
0.9940 0.0509
0.5256 0.0705
A= 1.0000 -1.4856 0.6871 0 0.0104 0.0081 C= 1.0000 -1.1007 0.2203 0 0.0502 0.0497
Ve výpisu je uvedena hodnota kritéria (loss fcn - ztrátová funkce) a Akaikeho konečná chyba predikce FPE (final prediction error), která je dána vztahem FPE =
1+ n N V, 1− n N
(5-17)
kde n je celkový počet odhadovaných parametrů, N je délka záznamu a V je hodnota kvadratického kriteria. Pod parametry vektorů B, A a C jsou uvedeny jejich směrodatné odchylky. Čtenář nechť porovná výsledek výpočtu s parametry, které byly zvoleny pro simulaci dat. 5.1.4 Výběr struktury modelu a hodnocení výsledku identifikace Struktura modelu je dána jeho typem (ARX, ARMAX, ...), stupni polynomů parametrů a počtem kroků dopravního zpoždění. Pro modely typu ARX jsou vytvořeny podpůrné prostředky pro rychlý výběr nejvhodnějšího modelu. Jedná se o funkce arxstruc, selstruc, resp. struc. Skupina porovnávaných struktur je zadána maticí NN s řádky typu [na nb nk]. Funkce V = arxstruc(ze, zv, NN) ;
vypočte pro všechny struktury modelu nejprve parametry z dat obsažených v matici ze = [y u] a pak s užitím těchto parametrů se pokračuje výpočtem kvadratického kriteria pro referenční data z matice zv a spolu s příslušnými strukturami jsou uložena do výsledku V. Výběr struktury modelu s nejmenší hodnotou kriteria, tj. nejmenší ztrátovou funkcí, lze provést příkazem nn = selstruc(V);
s výslednou nejvhodnější strukturou, která je uložena v nn. Tato funkce obsahuje také další parametry, které mění výběrové kriterium, např. na . Přirozeně lze zvolit ze = zv. Rozdílná volba dat pro identifikaci a pro srovnání se označuje jako křížové ocenění (cross validation). K usnadnění generování matice NN lze použít funkci NN = struc(na, nb, nk);
69
s parametry ve tvaru vektorů. Jestliže se například hledá počet kroků dopravního zpoždění, pak lze skupinu testovaných modelů vygenerovat např. příkazem NN = struc(2, 2, 1:5);
Podobný postup výběru struktury modelu je možný také pro metodu instrumental variable, a to funkcí . V = ivstruc(ze, zv, NN) ;
Nejprve se doporučuje stanovit počet kroků dopravního zpoždění, tj. na základě vlivu nk na velikost kvadratického kriteria pro nějakou výchozí volbu řádu modelu, a pak lze určit optimální řád modelu rovněž podle jeho vlivu na zmíněné kriterium.
70
5.2 Průběžná identifikace parametrů modelu Parametry modelu regulované soustavy a její řád jsou před návrhem algoritmu řízení jen velmi zřídka známy a předběžnou identifikaci nelze často provést vyčerpávajícím způsobem nebo je jen orientační, protože parametry modelu se mění. To znamená, že neznámé parametry je třeba zjistit až během řízení, přičemž se může jednat o jednu z následujících dvou situací • parametry soustavy jsou v čase neměnné • parametry soustavy se mění. V případě, že se parametry mění, je podstatná rychlost jejich změn. Všechny metody, které se používají k tzv. průběžné identifikaci předpokládají, že rychlost změny je pomalá. Vágním hodnocením „pomalý“ se porovnává tato rychlost s rychlostí změn velikosti poruchových veličin, které působí na regulovanou soustavu. Posouzení situace závisí na konkrétních podmínkách. Jestliže se parametry soustavy budou měnit rychle, pak je třeba k řízení využít jiné principy, které příliš nespoléhají na přesně změřené hodnoty a přisuzují jim určitou vágnost, jako například fuzzy regulátory. S účinnosti řízení ve smyslu kvadratického kritéria se teorie této regulace příliš nezabývá, ostatně základy této teorie vědomě nástroje spočívající v teorii pravděpodobnosti zavrhují jako nepoužitelné, což je někdy vskutku oprávněné. Klasický přístup k návrhu regulátoru v podmínkách působení náhodných poruch je založen na předpokladu věrohodného měření, řekněme s přesností aspoň několika procent, což je v praxi běžné. Metod průběžné identifikace je celá řada. Dále popsaná metoda průběžné identifikace, která je založena na principu využití metody nejmenších čtverců, je jednou z nejuniverzálnějších a má propracovanou teorii včetně výpočetního algoritmu. Byla popsána Peterkou [28]. Ryze teoretické práce dokazují, že jde o metodu odhadování parametrů modelu s využitím tzv. maximální věrohodnosti (maximum likehood) nebo o tzv. Bayesovskou metodu [11]. Protože výsledné vzorce jsou shodné, není třeba se těmito podrobnostmi v praxi příliš podrobně zabývat. K rozboru uvedené metody jsou připojeny poznámky o dalších algoritmech, zejména ve vztahu k Identification Toolboxu MATLABu s prostředky pro identifikaci parametrů různých modelů lineárních dynamických soustav.
Obr. 37. Blokové schéma regulačního obvodu s průběžnou identifikací regulované soustavy Řízení s průběžnou identifikací je jednou z metod tzv. adaptivního řízení. Při tomto řízení je akční veličina vypočtena s respektováním průběžně se měnících parametrů soustavy. Jinak řečeno, nejen parametry soustavy se adaptují (přizpůsobují) měnícím se podmínkám, za kterých musí regulace pracovat, ale také parametry regulátorů lze příslušným způsobem upravit. Výhody tohoto postupu pro účinek řízení není třeba zvlášť zdůvodňovat. Blokové schéma regulačního obvodu s průběžnou identifikací je na obr. 37.
71
5.2.1 Průběžné odhadování parametrů regresního modelu Vzorce, které byly popsány pro výpočet parametrů modelu typu AR a ARX, jsou velmi jednoduché, ovšem za předpokladu, že čas t je limitován, což znamená, že vektor y t a matici Z
lze umístit do paměťového prostoru počítače. Inverze matice Z T Z typu ( L, L) nepředstavuje numerický problém v případě, že počet identifikovaných parametrů nepřesahuje 10, což je pro praxi přijatelné. Je však třeba připomenout, že jeden rozměr y t a Z se lineárně s narůstajícím časem zvětšuje. Při nepřetržitém řízení se tato data po jisté době do paměti nevejdou a časové zaneprázdnění počítače výpočty se může stát neúnosné.
Výše uvedený problém je řešitelný tak, že se lze při výpočtech omezit jen na data s limitovaným stářím, řekněme od času t do času t − ∆ . To znamená, že k výpočtům je používán konečný počet pozorování, tj. jistá forma časového okénka nebo jinak také váhy o konečné délce. Tento postup se používal při první aplikaci adaptivního řízení s průběžnou identifikací na území České republiky, a to pro úlohu regulace obsahu křemíku v surovém železe počítačem Siemens 305 na jedné z vysokých pecí společnosti Vítkovice na začátku 70. let. Nevýhodou tohoto postupu je, že na vypočtených hodnotách se podílejí stejnou váhou různě stará data pokud je jejich stáří limitováno, a ostatní data jsou z výpočtu vyloučena. Protože operaci vylučování starých dat se říká zapomínání (forgetting), lze tento postup nazvat nevážené zapomínání. Časový průběh váhové funkce je rovněž na části obr. 38. Pro vypočtené parametry by však bylo nejvýhodnější, aby vliv minulých dat na výsledek výpočtu plynule klesal. Snadné uplatnění při výpočtech má exponenciálně klesající váha, u které se vliv dat pro čas t − 1 sníží oproti datům z času t o ϕ -násobek ( 0 << ϕ < 1 ). Tomuto postupu se říká exponenciální zapomínání a ϕ 2 = λ se nazývá faktor zapomínání (forgetting factor). Závislost váhové funkce příslušné aktuálnímu času t je na obr. 38.
Obr. 38. Váhová funkce pro exponenciální zapomínání ve vztahu k neváženému zapomínání Velikost faktoru zapomínání λ se volí 0.98 až 0.99, tj. blízký jedné. Rozsah hodnot ϕ je zřejmý z Tab. 3, ve které je uveden počet časových kroků pro pokles váhy (významu) dat na polovinu a desetinu. Tab. 3. Průběh váhové funkce při exponenciálním zapomínání
ϕ
0.999
0.995
0.99
0.98
0.95
0.9
i pro ϕ i = 0.5
692
138
68
34
14
7
i pro ϕ i = 01 .
2301
459
229
114
45
22
Exponenciální zapomínání lze do jednorázového výpočtu metody nejmenších čtverců aplikovat změnou definice minimalizace neváženého součtu chyb S = e12 + e22 +...+ et2 na
72
minimalizaci váženého součtu chyb S = ϕ 2( t −1) e12 +...+ ϕ 4 et2− 2 + ϕ 2 et2−1 + et2 , ve kterém se stářím dat klesá jejich podíl na výsledném součtu. Tuto modifikaci lze interpretovat také jako snížení přesnosti starých dat (zvětšení jejich rozptylu) oproti datům aktuálním v čase t, tj. pro rozptyl chyby starých dat platí Rτ = R ϕ 2 ( t − τ ) , kde R = Rt = E {et2 } je rozptyl nejnovější chyby modelu v řadě změřených dat. Tuto interpretaci chyby je možné také zapsat ve tvaru rovnice
{
}
Rτ = E (ϕ t − τ et )(ϕ t − τ et ) ,
(5-18)
ve které je chyba eτ nahrazena chybou et ϕ t − τ . 5.2.2 Rekurzivní výpočet parametrů regulované soustavy metodou nejmenších čtverců
Exponenciální zapomínání samo o sobě neodstraňuje problém ukládání dat, ale umožňuje odvodit v jednoduchém tvaru rekurzivní výpočty parametrů soustavy a rozptylu chyby modelu, tj. ve tvaru umožňujícím z odhadů pro čas t vypočítat odhady pro čas t + 1. Pro odvození vzorců je však třeba upravit definici závisle a nezávisle proměnné v souladu s rovnicemi yτ = zτ P + ϕ − ( t − τ ) et , τ = 1, 2, ..., t (5-19) s chybou o rostoucím rozptylu na tvar ϕ t − τ yτ = ϕ t − τ zτ P + et , τ = 1, 2, ..., t .
(5-20)
Je výhodné předefinovat vektor závisle a nezávisle proměnné a u všech veličin přidat index t, aby se zdůraznila souvislost s aktuálním časem, podle následujících vzorců
[
Z t = ϕ t −1z1 , ϕ t − 2 z2 ,..., ϕ zt −1 , zt
]
T
[
y t = ϕ t −1 y1 , ϕ t − 2 y2 ,..., ϕ yt −1 , yt
,
]
T
.
(5-21)
Rekurzivní vzorce budou odvozeny pro změnu indexu o jeden časový krok, t → t + 1 . Parametry v tomto o jednotku posunutém čase lze vypočítat podle dříve uvedeného vzorce pro čas t prostým zvýšením indexu o jednotku −1 P$ = (Z T Z ) Z T y . (5-22) t +1
(Z
t +1
t +1
t +1 t + 1
Z jednotlivých výrazů bude nejprve odvozen vzorec pro rekurzivní výpočet inverze
Z t +1 )
T t +1
(t + 11,)
−1
ze znalosti její hodnoty (Z Tt Z t ) . Matici Z t +1 typu (t + 1, L) a vektor y t +1 typu −1
lze rozložit na dva bloky, a to u matice Z t +1 na bloky typu (t , L) a (1, L) (druhý blok
, ) (druhý blok je jen skalár). Pro je řádkový vektor) a u vektoru y t +1 na bloky typu (t,1) a (11 neinvertovaný součin matic platí ⎡ϕ Z t ⎤ 2 T T Z Tt +1Z t +1 = ϕ Z Tt zTt +1 ⎢ (5-23) ⎥ = ϕ Z t Z t + z t +1 z t + 1 z ⎣ t +1 ⎦
[
]
a podobně
[
Z Tt +1y t +1 = ϕ Z Tt
[
y Tt +1y t +1 = ϕ y Tt
⎡ϕ y t ⎤ 2 T T zTt +1 ⎢ ⎥ = ϕ Z t y t + z t +1 y t + 1 , y ⎣ t +1 ⎦ ⎡ϕ y t ⎤ ytT+1 ⎢ = ϕ 2 y Tt y t + ytT+1 yt +1 . ⎥ ⎣ y t +1 ⎦
]
(5-24)
]
(5-25)
Jak je ukázáno v příloze B, matice
(Z Z ) T t
−1
t
po vynásobení rozptylem chyby modelu
R = E {e } představuje varianční matici parametrů modelu. Na hlavní diagonále této matice jsou rozptyly parametrů a mimo hlavní diagonálu jejich kovariance. Tato matice tedy 2 i
73
„akumuluje“ informace o přesnosti parametrů modelu. Po odvození rekurzivních vztahů bude diskutován způsob ovlivnění této matice novými daty. Nechť
Ct = (Z Tt Z t ) , −1
tj. Ct−1 = Z Tt Z t ,
(5-26)
pak vzhledem k výše uvedeným rekurzivním vzorcům platí Ct−+11 = ϕ 2 Ct−1 + zTt +1zt +1 .
(5-27)
K výpočtu inverze lze použít známou Householderovou maticovou identitu
[ A + B D B] T
−1
[
= A −1 − A −1B T D −1 + B A −1B T
]
−1
B A −1 .
(5-28)
Pro A = ϕ 2 Ct−1 , B = zt +1 , D = 1 platí −1
⎡ ⎤ C C C C Ct +1 = 2t − 2t zTt +1 ⎢1 + zt +1 2t zTt +1 ⎥ zt +1 2t . ϕ ϕ ϕ ϕ ⎣ ⎦
(5-29)
Tento vzorec lze upravit do tvaru C t +1 =
1 ϕ2
⎡ Ct zTt +1zt +1Ct ⎤ C − ⎢ t ⎥. ϕ 2 + zt +1Ct zTt +1 ⎦ ⎣
(5-30)
Pomocí matice Ct lze vypočítat odhad vektoru parametrů P$ t = Ct Z Tt y t . Z této rovnice plyne
Ct−1P$ t = Z Tt y t ,
tj. Ct−+11P$ t +1 = Z Tt +1y t +1 .
(5-31)
Jak bylo již výše uvedeno, pro rekurzivní výpočet Z Tt +1y t +1 platí
Z Tt +1y t +1 = ϕ 2 Z Tt y t + zTt +1 yt +1 ,
(5-32)
a proto po dosazení plyne
Ct−+11P$ t +1 = ϕ 2 Ct−1P$ t + zTt +1 yt +1 .
(5-33)
Podle definice platí
ϕ 2 Ct−1 = Ct−+11 − zTt +1zt +1 ,
(5-34)
a proto pro odhad vektoru parametrů platí
[
]
P$ t +1 = Ct +1 (Ct−+11 − zTt +1zt +1 )P$ t + zTt +1 yt +1 = P$ t + Ct +1zTt +1 ( yt +1 − zt +1P$ t ) ,
(5-35)
kde výraz yt +1 − zt +1P$ t lze považovat za odhad chyby, který byl vypočten pro časový okamžik t + 1 jen ze znalosti parametrů soustavy v čase t, tj. e$t +1 = yt +1 − zt +1P$ t .
(5-36)
Výsledný vzorec pro rekurzivní odhad parametrů soustavy je následující
P$ t +1 = P$ t + Ct +1zTt +1e$t +1 .
(5-37)
Velikost opravy parametrů je přímo úměrná chybě modelu v čase t + 1, která je vypočtena na základě parametrů známých v čase t. Poslední odvozený vzorec dává předpis adaptace parametrů modelu soustavy.
74
5.2.3 Rekurzivní výpočet rozptylu chyby modelu regulované soustavy Dříve než bude odvozen rekurzivní vzorec, je třeba upravit vztah pro výpočet rozptylu chyby modelu s respektováním exponenciálního zapomínání. Například pro střední hodnotu E {y Tt y t } , ve které je v definici jednotlivých vektorů y t doplněno násobení faktorem
exponenciálního zapomínání ϕ , vzhledem k nezávislosti E { yt2 } na indexu i platí
⎫ t ⎧ t E {y Tt y t } = E ⎨∑ ϕ 2( t −i ) yi2 ⎬ = ∑ ϕ 2( t −i ) E { yi2 } = κ t E { yi2 } , ⎭ i =1 ⎩ i =1
(5-38)
kde t
κt = ∑ ϕ i =1
2 ( t −i )
t −1
= ∑ ϕ 2i = 1 + ϕ 2 κ t −1 .
(5-39)
i =0
Odhad střední hodnoty druhé mocniny yt s uplatněním exponenciálního zapomínání je E { yt2 } = E {y Tt y t } κ t oproti odhadu bez tohoto zapomínání, který je E { yt2 } = E {y Tt y t } t .
Lze si všimnout také, že limita posloupnosti κ i , i = 1, 2, ... je 1 (1 − ϕ 2 ) je konečná, zatímco t ve vzorci pro odhad rozptylu chyby bez zapomínání roste do nekonečna. Vzorec pro výpočet odhadu rozptylu chyby modelu při exponenciálním zapomínání je následující 1 R$t = ( y Tt y t − P$ tT Z Tt Z t P$ t ) . (5-40) κt
Ke stanovení rekurzivního vzorce pro výpočet odhadu chyby modelu je vhodné upravit předcházející vztah náhradou součinu matic Ct−1 = Z Tt Z t , tj. κ t R$t = y Tt y t − P$ tT Z Tt Z t P$ t = y Tt y t − P$ tT Ct−1P$ t .
(5-41)
Pro posunutý index platí κ t +1 R$t +1 = y Tt +1y t +1 − P$ tT+1Ct−+11P$ t +1 .
(5-42)
Po dosazení κ t +1 R$t +1 = ϕ 2 y Tt y t + ytT+1 yt +1 − P$ tT+1Ct−+11P$ t +1 = = ϕ 2 κ t R$t + P$ tT Ct−1P$ t + y Tt y t + ytT+1 yt +1 − P$ tT+1Ct−+11P$ t +1 ,
(5-43)
a dalších úpravách plyne ⎡ ⎤ e$t2+1 κ t +1 R$t +1 = ϕ 2 ⎢κ t R$t + 2 T ⎥. ϕ + zt +1Ct zt +1 ⎦ ⎣
(5-44)
Shrnutí Jednotlivé kroky výpočtu lze shrnout do následujících rekurzivních vzorců, které je třeba počítat postupně v uvedeném pořadí. Pro jejich přehledný zápis je použita nová proměnná σ 2t +1 označující jen mezivýsledek výpočtu. Pro výpočet nových odhadů parametrů a rozptylu chyby modelu lze použít následující vzorce σ 2t +1 = ϕ 2 + zt +1Ct zTt +1
(5-45)
e$t +1 = yt +1 − zt +1P$ t
(5-46)
75
P$ t +1 = P$ t + Ct zTt +1e$t +1
(5-47)
⎡ e$ 2 ⎤ κ t +1 R$t +1 = ϕ 2 ⎢κ t R$t + t2+1 ⎥ σ t +1 ⎦ ⎣
(5-48)
κ t = 1 + ϕ 2 κ t −1
(5-49)
C t +1 =
1 ϕ2
⎡ Ct zTt +1zt +1Ct ⎤ C − ⎢ t ⎥ σ 2t +1 ⎣ ⎦
(5-50)
Při výpočtu se vychází z původního odhadu parametrů modelu a rozptylu jeho chyby v čase t, přičemž výsledkem výpočtu je aktuální odhad pro čas t + 1. Mezi vstupní data patří aktuální hodnota výstupu soustavy yt +1 a nezávisle proměnné, které jsou obsaženy v řádkovém vektoru zt +1 . Pro start výpočtu v čase t = 1 je třeba zvolit
C1 : P$1 : R$ : 1
κ1 :
diagonální matice s „malými“ čísly na hlavní diagonále první odhad parametrů modelu soustavy na základě zkušeností lze zvolit nulu je třeba zvolit jednotku
5.2.4 Směrové zapomínání Ve výpočtech jsou použity matice a vektory. Vektory mají počátek shodný s počátkem souřadného systému. Koncový bod vektorů je dán souřadnicemi shodnými s jeho složkami. Násobení vektoru čtvercovou maticí lze geometricky interpretovat jako prodloužení nebo zkrácení vektoru se současnou rotací (otočením). Výsledek násobení dvou vektorů, jako jejich skalární součin, závisí na jejich úhlu. Jestliže jsou vektory navzájem kolmé, pak je tento výsledek nulový. Například vektor parametrů P$ t +1 vznikne podle (5-47) jako součet vektoru parametrů P$ t a vektoru o směru daném vektorem Ct zTt +1 (ostatní veličiny jsou skaláry). Interpretace zpřesnění matice Ct +1 z Ct podle (5-50) je obtížnější. Nechť rovnice x T Ct x = konst přísluší ploše elipsoidu v prostoru, s tvarem charakterizujícím hustotu pravděpodobnosti výskytu odhadů vektoru parametrů pro případ, že mají normální rozdělení . Vektor x představuje vzdálenost bodu elipsoidu od jeho středu, tj. jeho „poloměr“ v daném směru. Každý rekurzivní výpočet ovlivní tvar povrchu elipsoidu. Nechť se rekurze (5-50) redukuje jen na operaci Ct +1 = Ct ϕ 2 . Dělení číslem, které je menší než jedna, způsobí v tomto rekurzivním kroku všesměrové proporcionální zvětšení zmíněného elipsoidu. Zde uvedená rekurze se zvětšováním „poloměru“ elipsoidu platí pro směr vektoru x, který je kolmý na vektor Ct zTt +1 . Pro ostatní směry je zvětšení menší než 1 ϕ 2 . Ve směru rovnoběžném s vektorem Ct zTt +1 je efekt zvětšení nejmenší. „Poloměr“ elipsoidu se může při vhodné volbě ϕ 2 dokonce zmenšit, a to nejvíce v porovnání s ostatními směry. V tomto směru se odhad parametrů modelu zpřesňuje. Jestliže se směr vektoru dat zt +1 během identifikace mění, elipsoid zmenšuje svoje rozměry všesměrově. Identifikace probíhající společně s řízením redukuje data na určitý podprostor. Například proporcionální regulátor způsobí, že vstupní a výstupní veličina je vzájemně proporcionální. Toto způsobuje trvalý vzrůst rozměru elipsoidu v některých směrech a trvalý pokles v jiných směrech. Efektem je pak tzv. „covariance wind-up“ nebo „bursting“, což představuje zhroucení identifikačního algoritmu. 76
Tomuto zhroucení algoritmu identifikace lze čelit tzv. směrovým zapomínáním. Podle [13] se rekurzivní výpočet podle (5-50) změní s využitím soustavy vzorců ε t +1 = ϕ 2 − (1 − ϕ 2 ) ( zt +1Ct zTt +1 ) ,
(5-51)
Ct−+11 = Ct−+11 + ε t +1zTt +1zt +1 ,
(5-52)
resp. po úpravách posledního vzorce Ct zt +1zTt +1Ct Ct +1 = Ct − −1 . ε t +1 + σ 2t +1
(5-53)
Vzorec (51) doplňuje soustavu vzorců ve výše uvedeném shrnutí a vzorec (53) nahrazuje vzorec (50) z tohoto shrnutí. 5.2.5 Odmocninový filtr a U-D filtr Vstupní data pro identifikaci jsou v numerickém významu tzv. špatně podmíněna, což znamená, že determinant invertované matice Z Tt Z t je velmi malý. Jestliže v některé aplikaci jsou k dispozici jen počítače s krátkou délkou slova (osm nebo 16 bitů), pak špatná podmíněnost může vést ke „zhroucení“ algoritmu. V literatuře lze nalézt proto také zdokonalené verze algoritmu průběžné identifikace [12, 28]. Princip spočívá v rozkladu matice Ct na součin dvou vzájemně transponovaných trojúhelníkových matic Ct = G t G Tt , (5-54) jejichž prvky se rekurzivně vypočítávají. Místo matice Ct se pracuje s její odmocninou. Odmocniny malých čísel jsou podstatně větší než tato čísla (např. 10−6 = 10−3 ), a proto numerické operace nejsou zatíženy velkou zaokrouhlovací chybou. Tento postup má nevýhodu v tom, že je zapotřebí operace odmocnění, a proto byl z teorie matic převzat tzv. UD rozklad (5-55) Ct = U t D t U Tt s diagonální maticí D t a ortogonální maticí U t . Pro výpočet uvedeného rozkladu není odmocňování potřebné. Tento algoritmus má uplatnění v případech, kdy je požadován zvláště rychlý výpočet.
77
5.2.7 Vlastnosti algoritmů průběžné identifikace v prostředí MATLABu Rekurzivní vzorec pro průběžnou identifikaci má obecný tvar
(
)
P$ t +1 = P$ t + K t +1 yt +1 − y$t +1 t ,
(5-56)
kde K t +1 je zesílení odchylky měřené hodnoty výstupu yt +1 a jeho odhadu yt +1 t na základě parametrů známých v čase t. Jestliže je zmíněná odchylka nulová, odhad parametrů se nekoriguje. Zesílení K t +1 určuje rychlost adaptace parametrů ze zjištěné odchylky. Toto zesílení je zvoleno obvykle
K t +1 = Q t +1ΨtT+1 ,
(5-57)
(
kde Ψt +1 je gradient změny odchylky yt +1 − y$t +1 t
) vzhledem ke změně parametrů modelu.
Pro regresní model, z něhož se vypočítá odhad y$t +1 t = zt +1Pt + et +1 , je tento gradient dán parciální derivací zmíněné odchylky podle Pt , tj. platí Ψt +1 = zTt +1 . Pro model, který nelze zapsat ve tvaru regresního modelu, je třena odhad aproximovat. Postup lze nalézt v knize [9]. Pro návrh zesílení je třeba předpokládat určitý model vývoje parametrů v čase. Typicky se volí náhodná procházka
Pt = Pt −1 + w t ,
(5-58)
kde sloupcový vektor w t o počtu složek rovném počtu parametrů představuje bílý Gaussovský šum s kovarianční maticí E {w t w Tt } = R 1 .
V dokumentaci identifikačního toolboxu MATLABu jsou popsány tři různé volby matice Q t +1 . První volba vyplývá z teorie Kalmanova filtru a má v angličtině označení KF (Kalman
Filter). Odvozené vzorce předpokládají, že rozptyl chyby modelu je dán E {et2 } = R1 . Platí
P$ t +1 = P$ t + K t +1e$t +1 ,
(5-59)
e$t +1 = yt +1 − zt +1P$ t , Pt Q t +1 = , R2 + zt +1Pt zTt +1
(5-60)
kde (5-61)
K t +1 = Q t +1zTt +1 , Pt +1 = Pt + R 1
(5-62)
Pz z P R +z Pz
T t t +1 t + 1 t T 2 t + 1 t t +1
.
(5-63)
Výše uvedené vzorce byly upraveny v souladu se značením, které je používáno v tomto učebním textu. Druhá volba představuje postup s exponenciálním zapomínáním a Q t +1 = Pt +1 . Výsledný algoritmus je shodný s dříve popsaným algoritmem, který byl odvozen s použitím metody minimálního součtu čtverců. V angličtině má tato metoda označení RLS (recursive least squares).
78
2
Třetí volba je Q t +1 = γE , resp. po normalizací Q t +1 = γ zt +1 E , kde γ je konstanta. Podle této metody zmíněné matice se parametry mění přímo podle velikosti příslušného gradientu. Na zdokonalení této metody pracoval Markl [22], který navrhl pro urychlení procesu identifikace průběžnou adaptaci parametru γ ve tvaru posloupnosti různých hodnot.
5.2.8 Popis algoritmů průběžné identifikace v prostředí MATLABu Rekurzivní identifikaci vykonávají následující funkce identifikačního toolboxu MATLABu, jejichž název začíná počátečním písmenem „r“ rarmax, rarx, rbj, rpem, rplr, roe
Základní syntaxe je následující [thm, yh] = rfcn(z, nn, adm, adg),
kde z = [y u] je matice se dvěma sloupci, z nichž první je vektor výstupu soustavy a druhý je vektor vstupů soustavy, nn specifikuje rozměry vektorů parametrů v příslušném modelu v abecedním pořadí a zbývající dva parametry adm, adg souvisí s volbou speciální metody. Pro algoritmus s exponenciálním zapomínáním se volí adm = ‘ff’; adg = lam;
přičemž lam představuje ϕ 2 . Nenormalizovaný a normalizovaný gradientní algoritmus s volbou adm = ‘ug’; adg = gam; adm = ‘ng’; adg = gam;
Se zesílením, které vyplývá z teorie Kalmanova filtru, pracuje algoritmus s volbou adm = ‘kf’; adg = R1;
přičemž R2 = 1 .
Příklad: Průběžná identifikace rekurzivní metodou nejmenších čtverců RLS je demonstrována na diskrétní lineární soustavě prvního řádu s jedním krokem zpoždění, tj. s diferenční rovnicí yt = 0.9 yt −1 + 2ut −1 + et . Model soustavy odpovídá typu ARX. Vstupní posloupnost ut o délce 100 vzorků odvozené z Gaussovského bílého šumu (‘rgs’) s filtrem do 0.7 Nyquistovy frekvence lze vygenerovat následujícím příkazem MATLABu » u=idinput(100,'rgs',[0 0.7]);
Pro generování výstupní veličiny je třeba nejdříve určit pomocnou matici formátu theta » th0=poly2th([1 -0.9],[0 2]);
ve které první argument odpovídá vektoru parametrů A( q −1 ) a druhý odpovídá vektoru
parametrů B( q −1 ) . Při zadávání tohoto vektoru je dosazena za parametr b0 nula, v souladu s tvarem modelu ARX. Výstupní veličina soustavy s aditivním Gaussovským bílým šumem je vypočtena příkazem » y=idsim([u randn(100,1)],th0);
Průběh vstupní a výstupní posloupnosti v obr. 39 lze znázornit příkazy
79
» z=[y u]; » idplot(z)
Obr. 39. Časový průběh vstupní a výstupní veličiny
A( q
Identifikovaná soustava má následující parametry, a to a1 = −0.9, b1 = 2 . Řád polynomu −1
)
je na = 1 , polynomu B( q −1 ) je nb = 1 a zpoždění je nk = 1 . Z tvaru modelu ARX
vyplývá, že parametr a0 je v polynomu A( q −1 ) roven jedné a nemusí být předmětem
identifikace stejně jako parametr b0 v polynomu B( q −1 ) , který je roven nule. Dále lze poznamenat, že u modelu regulované identifikované soustavy se předpokládá aspoň jeden krok zpoždění.
Při startu průběžné identifikace jen z vektorů y, u v tomto demonstračním příkladu jsou parametry soustavy jakoby neznámé. Identifikační procedura však vyžaduje zadat vektor nn = [na nb k] a další volby, které závisí na typu použitého způsobu průběžné identifikace. Jak bylo výše uvedeno, je ověřován postup RLS s exponenciálním zapomínáním. Následující příkazy MATLABu demonstrují postupnou identifikaci s dvěma velikostmi faktoru zapomínání, a to 0.95 a 0.98. » subplot(211) » thm=rarx(z,[1 1 1],'ff',0.95); » plot(1:100,thm(:,1),'k-',1:100,thm(:,2),'k:') » subplot(212) » thm=rarx(z,[1 1 1],'ff',0.98); » plot(1:100,thm(:,1),'k-',1:100,thm(:,2),'k:')
80
Časový průběh obou identifikovaných parametrů je znázorněn v obr. 40. Parametr a1 se ustálí po méně než 10 krocích, zatímco parametr b1 se ustaluje pomaleji, avšak po 50 krocích je jeho velikost prakticky stálá. Při této demonstrační úloze byl okamžitě zvolen správný řád soustavy, tj. stupeň polynomů A( q −1 ) a B( q −1 ) a počet kroků zpoždění nk. V praxi bude třeba tyto vstupní údaje pečlivě analyzovat a variantně zkoušet zadání vektoru nn. Uspokojivé je při této analýze to, že obvykle je řád soustavy velmi nízký (např. do 5) a dopravní zpoždění tuto hodnotu také nepřevyšuje, a proto různých variant voleb vektoru nn je nevysoký počet.
Obr. 40. Časový průběh průběžně identifikovaných parametrů
81
Optimální řízení Úlohy regulace je možné zjednodušeně rozdělit z hlediska přítomnosti náhodných poruch a chyb měření a kritérií posuzování jejich funkce do dvou skupin • náhodné chyby měření regulované veličiny a neměřené náhodné poruchy jsou vzhledem ke změnám žádané hodnoty nevýznamné nebo zanedbatelné a funkce regulačního obvodu se posuzuje podle tvaru odezvy na skok žádané hodnoty nebo poruchy • náhodné změny neměřené poruchy, případně chyby měření regulované veličiny jsou dominantní vzhledem ke skokovým změnám žádané hodnoty nebo poruchy a funkce regulace se posuzuje podle schopnosti regulačního obvodu tyto nahodilosti kompenzovat. Toto krajní dělení nemusí být striktní a mohou existovat úlohy regulace, ve kterých se v různé míře vyskytují obě zmíněné skutečnosti. Optimalizací tvaru přechodového děje se tento učební text nezabývá. Studenti specializace automatického řízení jsou seznamování v teoretických základech řízení s dostatečným počtem metod syntézy regulačních obvodů, které mohou pro praxi uplatnit. Všechny tyto metody poskytují pravidla, kterými se lze univerzálně řídit. Jedná se především o stabilitu obvodů a kvalitu přechodového děje, tj. přesnost regulace v ustáleném stavu a délku přechodového děje. Nástavbou základních poznatků teorie řízení je analýza a syntéza regulačních obvodů pro kompenzaci náhodných poruch, které mohou být u určité skupiny regulačních úloh významné. Jde zejména o regulaci provozních veličin na konstantní žádanou hodnotu, která se mění jen výjimečně a pro případ její změny, kterou je obvykle náběh po odstávce nebo odstavení technologického procesu, řízení podléhá zvláštnímu režimu nebo je vykonáváno ručně. Do stejné kategorie jako působení náhodných poruch patří náhodná změna žádané hodnoty, jako je například poloha bojového letounu, který se snaží uniknut nahodilými manévry zaměření naváděcího systému protiletadlové rakety. Pro přechodový děj uzavřeného regulačního obvodu je formulováno několik kritérií. Patří mezi ně například překmit, odchylka v ustáleném stavu, časová konstanta náběhu a dále také komplexní kritéria, jako je velikost regulační ploch. Pro funkci regulačních obvodů s náhodnou poruchou je vhodným kritériem rozptyl nebo směrodatná odchylka regulované veličiny od žádané hodnoty. Toto kritérium se stručně nazývá kvadratické kritérium. V následujícím výkladu bude popsán vztah tohoto kritéria k funkci regulace.
6. Kvadratické kriterium řízení Význam kvadratického kriteria řízení kontinuálních procesů zvyšuje jeho souvislost s ekonomickými parametry procesu, a to z hlediska • omezení extrémních hodnot • snížení rezervy z titulu nerovnoměrnosti procesu • snížení ztrát vznikajících v souvislosti s náhodnými změnami regulované veličiny. Je zřejmé, že extrémy v odchylkách regulované veličiny od žádané hodnoty lze spojovat s ekonomickou ztrátou. Jestliže například je předepsána pro některou regulovanou veličinu určitá střední hodnota a meze, ve kterých lze považovat průběh regulace za přijatelný, pak překročení těchto mezí je příčinou vzniku zmetků, jak je znázorněno na obr. 41 s hustotou pravděpodobnosti nebo četnosti hodnot regulované veličiny. Zmenšení směrodatné odchylky vede ke snížení nebo praktickému odstranění zmetků.
82
Obr. 41. Vliv velikosti rozptylu na podíl zmetků Další efekt, který plyne ze zmenšení regulační odchylky, spočívá ve zmenšení rezervy z titulu nerovnoměrnosti regulované veličiny. Snížení rozptylu tloušťky válcovaného plechu nebo gramáže papíru dovoluje snížit rezervu tloušťky ve střední hodnotě při jejich výrobě, tj. přímo šetřit materiál s příslušným ekonomickým efektem. To znamená, že příslušnému regulátoru lze zadat sníženou žádanou hodnotu tloušťky. U válcování se tomu říká válcování v minusových tolerancích. Příklad je znázorněn na obr. 42 opět jako hustota pravděpodobnosti regulované veličiny. Velikost rezervy je dána rozdílem střední hodnoty a minimální přípustné hodnoty regulované veličiny, která je v grafu označena Min.
Obr. 42. Možnost změny žádané hodnoty vlivem snížení rozptylu regulované veličiny Ekonomický efekt snížení rozptylu regulované veličiny související s další veličinou, u které je rozhodující její integrovaná hodnota za určité časové období. Integrál lze pak v tomto případě zaměnit za střední hodnotu. Například regulovanou veličinou y nechť je spalovací poměr u hořáku. Pro platbu za dodávky plynu je rozhodující integrální hodnota z, kterou je jeho měrná spotřeba. Je zřejmé, že stechiometrický spalovací poměr znamená minimum měrné spotřeby plynu. Odchylka spalovacího poměru od optimální hodnoty znamená nedokonalé spalování nebo ohřev balastního vzduchu, a tím i zvýšení jeho spotřeby. Nechť závislost integrální hodnoty z na regulované veličině y lze aproximovat například parabolou, tj. z = a0 + a1 y + a2 y 2 . Střední hodnota veličiny z je následující E { z} = a0 + a1 E { y} + a2 E { y 2 } = a0 + a1 y0 + a2 y02 + a2 σ 2y = z0 + a2 σ 2y ,
(6-1)
kde střední hodnota regulované veličiny je označena E { y} = y0 . Veličina z0 je dána střední hodnotou regulované veličiny, tj. z0 = a0 + a1 y0 + a2 y02 a rozptyl regulované veličiny je σ 2y . Tento rozptyl ovlivňuje velikost střední hodnoty veličiny z. V daném příkladu to znamená, že kolísání spalovacího poměru vyvolá zvýšení měrné spotřeby plynu v závislosti na velikosti 83
rozptylu a parametru a2 . Jestliže platí a2 = 0 , pak rozptyl regulované veličiny nemá na střední hodnotu žádný vliv. Přímá úměra efektu změn rozptylu regulované veličiny, tj. druhé mocniny směrodatné odchylky, znamená, že poklesne-li směrodatná odchylka regulované veličiny jen na 0.7 své původní hodnoty, pak se rezerva sníží na polovinu (přesněji 0.7 2 = 0.49 ). Příklad tohoto efektu snížení rozptylu včetně číselného příkladu je uveden na obr. 43. Vlevo v horní části obrázku je funkční vztah mezi regulovanou veličinou y a veličinou z, u které se sleduje střední hodnota. Vlevo dole je časový průběh regulované veličiny, a to nejprve obdélníkový (deterministický) a pak náhodný. Vpravo je časový průběh veličiny z. Obdélníkový průběh se střídou 1 : 1 střídá hodnoty 0 a 2 a jeho střední hodnota je rovna 1. Převodem parabolickou charakteristikou se tyto hodnoty změní na 1 a 5, tj. střední hodnota veličiny z je rovna 3. V grafu je to znázorněno středem úsečky označené 3 mezi body s označením 1 a 5. Jestliže místo obdélníkového průběhu bude veličina y v čase konstantní a rovna střední hodnotě 1, pak se převede na konstantní veličinu z o velikosti rovné 2. Rozdíl středních hodnot veličiny z pro neustálený a ustálený proces je tedy roven jedné, což lze považovat za důsledek kolísání veličiny y. Shodný efekt vznikne i v případě náhodného kolísání veličiny y, jak je výše dokázáno.
Obr. 43. Snížení rozptylu regulované veličiny s efektem na další veličinu V technicky smysluplných aplikacích neexistuje úloha řízení, u které by zvyšování rozptylu regulované veličiny vedlo k úsporám, naopak nelinearity výše uvedeného typu jsou běžné. Důsledkem těchto úvah je to, že rozptyl regulované veličiny souvisí přímo úměrně s velikostí ztráty z titulu působení náhodných poruch. Nejednodušší kvadratické kriterium pro regulovanou veličinu y je proto dáno vzorcem J = σ 2y .
(6-2)
84
kde rozptyl σ 2y je stření hodnotou čtverce regulační odchylky, a proto výrazem
{
E ( w − yt )
2
} → min
(6-3)
lze symbolicky definovat cíl řízení. Ze stejných příčin jako u regulované veličiny může vzniknout ztráta vlivem změn akční veličiny u. Výslednou ztrátu vlivem působení náhodných poruch, jejichž důsledkem je vznik kolísání regulované veličiny, které se omezují funkcí regulátoru a tedy kolísáním akční veličiny, lze vyčíslit podle vzorce J = λ y σ 2y + λ u σ 2u ,
(6-4)
kde λ y , λ u jsou součinitelé, kterými se převádí ztráta vlivem kolísání akční veličiny na stejné fyzikální jednotky jako má ztráta způsobena kolísáním regulované veličiny. Poslední rovnice představuje nejobecnější tvar kvadratického kriteria pro řízenou soustavu s jedním vstupem a jedním výstupem. Velikost součinitelů λ y , λ u vyplývá tedy z fyzikálních vlastností řízené soustavy a pro optimalizaci musí být tyto součinitelé zadány. Jiná interpretace může těmto součinitelům přisoudit funkci penalizace na omezení rozsahu změn regulované veličiny. Příklad s technickým významem minimalizace rozptylu akční veličiny představuje řízení zásoby v zásobníku nebo vyrovnávacím skladu. Velikost zásoby pokud se pohybuje v rámci své kapacity není třeba udržovat na konstantní zásobě. Významné je jen přeplnění nebo vyprázdnění zásobníku. Jestliže je kapacita dimenzována tak, že je šestinásobkem směrodatné odchylky kolísání jejího zaplnění, které se řídí normálním rozdělením pravděpodobnosti, pak jen ve 3 případech z 1000, tj. s pravděpodobností 0.3 % dojde ke zmíněným extrémům. Jistě je ekonomické, aby zásobování bylo co nejplynulejší, tj. vstupní tok ve funkci akční veličiny byl s minimem rozptylu kolísání. Volba kapacity zásobníku bude dána vlastnostmi poruchové veličiny, kterou je výstupní tok ze zásobníku.
6.1 Jednokrokové a vícekrokové kvadratické kriterium Výše popsaná kriteria jsou jednokroková, tj.
{
J t ,1 = E ( w − yt )
2
}.
(6-5)
Rozdíl významu tohoto jednokrokového kriteria od kriteria vícekrokového vyplývá z následující definice ⎧ N 2⎫ J t , N = E ⎨ ∑ ( w − yi ) ⎬ , ⎩i = t +1 ⎭
(6-6)
respektive ve verzi s uvažováním rozptylu akční veličiny
[
]
⎧ N 2 2 ⎫ J t , N = E ⎨ ∑ λ y ( w − yi ) + λ u (ui − u0 ) ⎬ , ⎩i = t +1 ⎭
(6-7)
kde N představuje tzv. horizont optimálního řízení. Tento horizont může být konečný nebo nekonečný. V dalších kapitolách učebního textu se bude syntéza zabývat především jednokrokovým kriteriem, proto v tomto místě bude uvedeno jen několik poznámek ke kriteriu vícekrokovému. Jak bude dále ukázáno, pro některé regulované soustavy nelze nalézt optimální řízení podle
85
jednokrokového kritéria. Příkladem takové soustavy je integrační soustava se vstupem poruchy před integračním členem. Tento typ regulovaných soustav lze však optimálně řídit regulátorem, který je odvozen pro vícekrokové kriterium. Úloha optimálního řízení podle vícekrokového kriteria je spojena s řešením tzv. Riccatiho rovnice a tento učební text se tímto problémem nezabývá. Zájemce lze odkázat na práce Ústavu teorie informace a automatizace Akademie věd ČR nebo na skripta ČVUT [20].
6.2 Účinnost řízení Pro kritérium řízení ve tvaru (6-2) lze definovat účinnost řízení, což je stupeň snížení ztráty vzhledem k velikosti ztráty u neřízené soustavy, tj. s rozptylem regulované veličiny σ 2y0 , ve tvaru
(
)
η = 1 − σ 2y σ 2y 0 100 % .
(6-8)
Jestliže je řízením dosaženo stavu σ 2y = 0 , pak je účinnost 100%. Naproti tomu řízení s σ 2y = σ 2y 0 je bez účinku.
Analýza účinnosti řízení je jednou z úloh, která předchází realizaci systémů řízení. Pro analýzu je nezbytné mít informace o charakteristikách náhodných poruch a parametrech regulátoru.
86
7. Optimální predikce diskrétních stacionárních náhodných procesů Předvídání (predikce) vývoje poruchových veličin má praktické uplatnění nejen ke zvýšení účinku regulace, ale také v různých rozhodovacích procesech. Popis metod statisticky optimální predikce se zaměří ve smyslu Aströmovy knihy [4] na náhodné procesy, které popisují modely ARMA n - tého řádu ve tvaru
yt + a1 yt −1 + a2 yt − 2 + ...+ an yt − n = et + c1et −1 + c2 et − 2 + ...+ cn et − n ,
(7-1)
kde chyba modelu je bílý šum s rozptylem E {et2 } = σ 2e . Predikované hodnoty náhodného procesu budou označeny stříškou a bude v nich vyznačen referenční čas. To znamená, že y$t +1 t značí predikci veličiny yt o jeden krok dopředu, tj. pro čas t + 1, oproti referenčnímu (výchozímu) času t. Symbol y$t + k t označuje predikci na
k kroků dopředu. Predikce je statisticky optimální, jestliže střední hodnota druhé mocniny odchylky predikce od budoucí skutečné hodnoty náhodného procesu, jinak řečeno rozptyl chyby predikce, je minimální, tj.
{(
E yt + k − y$t + k t
) } → min . 2
Toto kvadratické kritérium umožňuje úlohu pro lineární modely analyticky řešit. Princip výpočtu bude nejdříve dokumentován pro jednokrokovou predikci a modely typu ARMA prvního řádu.
7.1 Jednokroková predikce, model ARMA prvého řádu Model ARMA prvního řádu představuje rovnice s vynechanými indexy u parametrů a, c
yt + a yt −1 = et + c et −1 ,
(7-2)
u které je kromě podmínky stability pro přenos, tj. a < 1, předpokládáno, že také c < 1 , což znamená, že přenos soustavy tvarující frekvenčně bílý šum je fázově minimální. Nejprve bude vypočtena závislost hodnot procesu pro čas o jeden krok dopředu. Úpravy budou prováděny s použitím operátoru posunu o jeden krok dozadu. Model lze takto přepsat postupně do tvarů
yt +1 + a yt = et +1 + c et ,
(7-3)
yt +1 + a q −1 yt +1 = et +1 + c q −1et +1 ,
(7-4)
yt +1 =
1 + c q −1 e , 1 + a q −1 t +1
resp. et =
1 + a q −1 y. 1 + c q −1 t
(7-5)
Hlavní trik odvození spočívá v následujícím rozkladu
yt +1 = et +1 +
( c − a ) q −1et +1 1+ a q
−1
= et +1 +
( c − a) 1 + a q −1
et ,
kterým se oddělily hodnoty chyb modelu pro čas t a t + 1. Po dosazení za et lze dostat
87
(7-6)
yt +1 = et +1 +
( c − a) 1+ a q
−1
et = et +1 +
( c − a)
(1 + a q
−1
(1 + a q ) y ) (1 + c q ) −1
−1
t
= et +1 +
( c − a) 1 + c q −1
yt .
(7-7)
Na základě posledního vzorce je chyba predikce dána y t +1 − y$ t +1 t = et +1 +
c−a y − y$ t +1 t = et +1 + δ t , 1 + cq −1 t
(7-8)
kde δ t je pomocná náhodná veličina. Pro další výpočty je rozhodující velikost střední
hodnoty součinu náhodných veličin et +1 a δ t , tj. E {et +1δ t } . Protože chyba modelu je
centrovaný bílý šum, platí E {et +1 } = 0 . Velikost y t závisí pouze na chybách modelu do
časového okamžiku t, a proto E {et +1 y t } = 0 . Odtud platí E {et +1δ t } = 0 . Střední hodnota druhé mocniny chyby predikce je zmíněné statistické kritérium přesnosti predikce, pro které platí
{(
E y t +1 − y$ t +1 t
) } = E {(e 2
t +1
+ δt )
2
} = E {e
2 t +1
+ 2et +1δ t + δ 2t } =
2 ⎧⎪⎛ c − a ⎞ ⎫⎪ $ = E {e } + 2 E {et +1δ t } + E {δ } = σ + E ⎨⎜ −1 y t − y t +1 t ⎟ ⎬ . ⎠ ⎪⎭ ⎪⎩⎝ 1 + cq 2 t +1
2 t
(7-9)
2 e
Rozptyl chyby predikce je dán rozptylem chyby modelu σ 2e a zbývajícího nezáporného členu, jehož velikost lze zvolit. Protože je požadováno, aby rozptyl chyby predikce byl minimální, musí být tento člen nulový, tj. y$t +1 t =
c−a y. 1 + cq −1 t
(7-10)
Vzorec představuje optimální prediktor o jeden krok. Zlomek přenosu obsahuje polynom prvního řádu. Přenos je stabilní, jestliže platí c < 1 . Tento předpoklad byl uveden na začátku odvození a z jeho výsledku výpočtu plyne jeho význam. Po úpravách lze poslední vzorec převést na diferenční rovnici
y$t +1 t + cy$t t −1 = ( c − a ) yt .
(7-11)
Jestliže predikce začíná v čase t = 0 a ze znalosti veličiny y0 , je možné dosadit nulu za minulou, neuskutečněnou predikci, tj. y0 −1 = 0 . První predikce tedy bude y$1 0 = ( c − a ) y0 .
t = 1 bude predikce již y$2 1 + c( c − a ) y0 = ( c − a ) y1 , po úpravě
V dalším kroku, tj. v čase
y$2 1 = ( c − a ) y1 − c( c − a ) y0 , atd....
Pro parametr c = 0 je optimální predikce y$t +1 t = − a yt . Odchylka optimálně predikované a skutečné hodnoty je yt +1 − y$t +1 t = et +1 , a proto minimální chyba predikce je dána vztahem
{(
E yt +1 − y$t +1 t
) }=σ , 2
2 e
(7-12)
ze kterého vyplývá, že nelze dosáhnout přesnější predikce než je chyba modelu, jinak řečeno, nejnižší možný rozptyl chyby predikce je roven rozptylu chyby modelu.
88
7.2 Dvoukroková predikce, model ARMA prvého řádu Postup je shodný jako u jednokrokové predikce. Hlavní trik opět spočívá v následujícím rozkladu, ve kterém je změněn index o jednotku, tj. na čas t + 2 . Platí y t + 2 = et + 2 + = et + 2
(c − a ) 1+ a q
e = et + 2 + ( c − a ) −1 t +1
1 + a q −1 − a q − 1 e t +1 = 1 + a q −1
a (c − a ) ⎡ a q −1 e t +1 ⎤ = et + 2 + (c − a )et +1 − e . + ( c − a ) ⎢ e t +1 − −1 ⎥ −1 t + 1 1 + a q a q ⎦ ⎣
(7-13)
Po dosazení za et lze dostat yt + 2 = et + 2 + ( c − a ) et +1 −
−1 a( c − a ) (1 + a q )
(1 + a q ) (1 + c q ) −1
−1
yt = et + 2 + ( c − a ) et +1 −
a( c − a ) y . (7-14) 1 + c q −1 t
Chyba dvoukrokové predikce je tedy dána vztahem
yt + 2 − y$t + 2 t = et + 2 + ( c − a ) et +1 −
a( c − a ) y − y$t + 2 t . 1 + cq −1 t
(7-15)
Tato chyba je součtem výrazů, které obsahují vzájemně nezávislé chyby modelu v časových okamžicích t+1 a t+2 a dalších dva výrazy závislé na chybách do časového okamžiku t. Podobně jako v případě jednokrokové predikce je nutno pro minimalizaci chyby dvoukrokové predikce zvolit část výrazu na pravé straně poslední rovnice rovným nule. Optimální prediktor na dva kroky dopředu je tedy dán vzorcem y$t + 2 t = −
a( c − a ) y . 1 + cq −1 t
(7-16)
Zápis posledního vzorce ve tvaru diferenční rovnice je následující y$t + 2 t + cy$t +1 t −1 = − a( c − a ) yt .
(7-17)
Odchylka optimálně predikované a skutečné hodnoty je u dvoukrokové predikce yt + 2 − y$t + 2 t = et + 2 + ( c − a ) et +1 , a proto minimální chyba predikce je dána vztahem
{(
E yt + 2 − y$t + 2 t
) } = σ (1 + ( c − a) ) . 2
2 e
2
(7-18)
2 Chyba dvoukrokové predikce je o ( c − a ) σ 2e větší než chyba predikce jednokrokové.
7.3 Predikce na obecný počet kroků, model ARMA obecného řádu Postup odvození vzorce pro predikci hodnot náhodné posloupnosti s modelem typu ARMA řádu n na k časových kroků dopředu, která minimalizuje rozptyl chyby predikce, je shodný s výše dvakrát opakovaným řešením pro jednokrokovou a dvokroukovou predikcí a modelem jen prvního řádu. Nejprve je třeba převést model ARMA
yt + a1 yt −1 + a2 yt − 2 + ...+ an yt − n = et + c1et −1 + c2 et − 2 + ...+ cn et − n na symbolický přenos s operátory zpětného posunutí, tj.
89
(7-19)
yt =
C( q −1 )
A( q −1 )
resp. et =
et ,
A( q −1 )
C( q −1 )
yt ,
(7-20)
kde rozptyl chyby modelu je σ 2e a polynomy v q −1 mají tvar C( q −1 ) = 1 + c1q −1 + c2 q −2 +...+ cn q − n
A( q −1 ) = 1 + a1q −1 + a2 q −2 +...+ an q − n .
(7-21)
Kořeny obou polynomů A( q −1 ) , C( q −1 ) musí ležet uvnitř jednotkové kružnice. Podmínka pro
polynom pro kořeny polynomu A( q −1 ) vyplývá ze stability modelu typu ARMA a podmínka
pro kořeny polynomu C( q −1 ) výpočtu.
souvisí se stabilitou prediktoru, což vyplyne z výsledku
V odvození následuje posun indexů o k kroků, tj. C ( q −1 )
yt + k =
A( q −1 )
et + k .
(7-22)
Hlavní trik dřívějšího výpočtu spočíval v rozdělení pravé strany rovnice na část s chybami modelu s indexem větším než je čas t a zbytek s chybami modelu s indexem shodným nebo menším než t. Tato operace pro obecné zadání se provede zavedením dvou pomocných polynomů, a to C ( q −1 )
A( q −1 )
= F (q
et + k = F ( q
−1
)e
t +k
+
−1
)e
t +k
+q
−k
G( q −1 ) A( q −1 ) A( q −1 ) C( q −1 )
G ( q −1 ) A( q −1 )
et + k = F ( q
yt = F ( q
kde F ( q −1 ) = 1 + f 1q −1 + f 2 q −2 +...+ f k −1q − ( k −1)
−1
−1
)e
t +k
G( q −1 )
+
G ( q −1 ) A( q −1 )
et = (7-23)
)e
+
a
G( q −1 ) = g0 + g1q −1 + g2 q −2 +...+ gn −1q − ( n −1)
t +k
C( q −1 )
yt ,
jsou zmíněné polynomy. Polynom F ( q −1 ) je řádu k − 1 , aby po násobení et + k zůstal index u
chyby modelu vyšší než t. Polynom G( q −1 ) je řádu n − 1 , aby řád součinu polynomů A( q −1 ) F ( q −1 ) , který je n + k − 1 , byl shodný s řádem součinu q − k G( q −1 ) .
Ze sloučení rozdělených zlomků převodem na společného jmenovatele C ( q −1 )
A( q −1 )
et + k = F ( q −1 ) et + k + q − k
G ( q −1 ) A( q −1 )
et + k =
A( q −1 ) F ( q −1 ) + q − k G( q −1 ) A( q −1 )
et + k
(7-24)
vyplyne podmínka pro volbu polynomů F ( q −1 ) , G( q −1 ) , kterou je rovnice C( q −1 ) = A( q −1 ) F ( q −1 ) + q − k G( q −1 ) .
(7-25)
Velikosti součinitelů polynomů se určí metodou porovnávaní koeficientů. Jako příklad pro demonstrování této metody je uveden rozpis prvých dvou členů polynomu 1 + c1q −1 + c2 q −2 +... = 1 + (a1 + f 1 )q −1 + (a2 + a1 f 1 + f 2 )q −2 +....
(7-26)
Součinitelé u stejných mocnin operátoru posunutí q −1 na levé a pravé straně rovnice musí mít shodnou velikost. Úplný výčet všech vztahů plynoucích z porovnání koeficientů je následující
90
q −1 : q −2 : ... q −( k −1) : q −k : q −( k +1) : ... q −n : q −( n +1) : ... q −( n + k −1) :
c1 = a1 + f 1 c2 = a2 + a1 f 1 + f 2 ..... ck −1 = ak −1 + ak − 2 f 1 + ak − 3 f 2 +...+ a1 f k − 2 + f k −1 ck = ak + ak −1 f 1 + a k − 2 f 2 +...+ a1 f k −1 + g0 ck +1 = ak +1 + ak f 1 + ak −1 f 2 +...+ a2 f k −1 + g1 ..... cn = an + an −1 f 1 + an − 2 f 2 +...+ an − k +1 f k −1 + gn − k 0 = an f 1 + an −1 f 2 +...+ an − k + 2 f k −1 + gn − k +1 ..... 0 = an f k −1 + gn −1
(7-27)
Chyba k - krokové predikce je tedy dána vztahem y t + k − y$ t + k t =
C ( q −1 ) A( q
−1
)
et + k − y$ t + k t = F ( q
)e
−1
t +k
+
G ( q −1 ) C( q
−1
)
y t − y$ t + k t = F ( q −1 ) et + k + δ t (7-28)
s pomocnou náhodnou veličinou δ t . Střední hodnotu druhé mocniny chyby lze vypočítat následujícím způsobem
{(
E y t + k − y$ t + k t
) } = E {( F ( q 2
) }= = E {( F ( q ) e ) } + 2 E { F ( q ) e −1
−1
)e
t +k
+ δt
2
2
−1
t +k
t +k
}
δ t + E {δ
2 t
}.
(7-29)
Jako v případě jednokrokové predikce je E {et +1δ t } = 0 . Minimální hodnota rozptylu chyby predikce je pro nulovou hodnotu druhého členu rozkladu, tj. δ t = 0 . Přenos k - krokového prediktoru je proto dán vzorcem y$t + k t =
G( q −1 ) C( q −1 )
yt .
(7-30)
Ve jmenovateli přenosu je polynom C( q −1 ) , který je rozhodující pro jeho stabilitu, a proto je součástí výchozích podmínek požadavek, aby kořeny tohoto polynomu ležely uvnitř jednotkové kružnice. Vzorec přenosu prediktoru lze přepsat do tvaru diferenční rovnice, tj. y$t + k t + c1 y$t + k −1 t −1 + c2 y$t + k − 2 t − 2 +...+ cn y$t + k − n t − n = g0 yt + g1 yt −1 +...+ gn −1 yt − n +1 .
(7-31)
Při startu predikce je třeba zvolit počáteční hodnoty predikce, nejlépe nuly. Minimální chyba této predikce je
{(
E yt + k − y$t + k t
) } = E {( F ( q 2
−1
) e ) } = (1 + f 2
t +k
2 1
+ f 22 +...+ f k2−1 ) σ 2e .
(7-32)
Nejnižší rozptyl chyby predikce má jednokrokový prediktor. Rozptyl jeho chyby je roven rozptylu chyby modelu procesu. Se zvětšováním počtu kroků se chyba predikce zvyšuje. Statisticky optimální predikce je možná jen u stabilních, tj. stacionárních, náhodných procesů s modely typu ARMA, jejichž polynom C( q −1 ) má nuly uvnitř jednotkové kružnice.
91
Přenos soustavy, která tvaruje bílý šum, musí být fázově minimální. Způsob transformace nestacionárních procesů na stacionární je popsán v kapitole o modelech náhodných procesů. Příklad 1:
Je třeba navrhnout jednokrokový prediktor náhodného procesu typu AR. Řešení: Pro náhodný proces typu AR je polynom C( q −1 ) = 1 a polynom F ( q −1 ) má řád nula, tj.
F ( q −1 ) = 1 . Podmínka pro další volitelný polynom G( q −1 ) se zjednoduší na 1 = A( q −1 ) + q −1G( q −1 )
(7-33)
a soustava rovnic pro výpočet koeficientů polynomů F ( q −1 ) , G( q −1 ) bude následující 0 = a1 + g0 , 0 = a2 + g1 ,
..... 0 = an + gn −1 ,
(7-34)
tj.
q −1: g0 = − a1 , q −2 : g1 = − a2 ,
....., q − n :
gn −1 = − an .
(7-35)
Přenos optimálního jednokrokového prediktoru pro náhodné procesy s modelem typu AR je dán vzorcem
y$t +1 t = G( q −1 ) yt = − a1 yt − a2 yt −1 −...− an yt − n +1 .
(7-36)
Postup výpočtu predikce podle tohoto vzorce vychází přímo z rovnice modelu. V rovnici modelu se dosadí za neznámou chybu nula a predikce y$t +1 t se vypočte jednoduchým dosazením minulých hodnot do této rovníce. Rozptyl chyby predikce je shodný s rozptylem chyb modelu , tj.
{(
E yt +1 − y$t +1 t
) } =σ . 2
2 e
(7-37)
Příklad 2:
Je třeba navrhnout jednokrokový prediktor náhodného procesu typu ARMA s modelem
yt + a1 yt −1 + a2 yt − 2 = et + c1et −1 + c2 et − 2 .
(7-38)
Řešení: Zadání příkladu charakterizuje n = 2, k = 1 s polynomy C( q −1 ) = 1 + c1q −1 + c2 q −2
A( q −1 ) = 1 + a1q −1 + a2 q −2 .
Volitelné polynomy jsou F ( q −1 ) = 1 a
polynom G( q −1 ) je následující
(7-39)
G( q −1 ) = g0 + g1q −1 . Podmínka pro volitelný
C( q −1 ) = A( q −1 ) + q −1G( q −1 ) .
(7-40)
Po dosazení polynomů 1 + c1q −1 + c2 q −2 = 1 + a1q −1 + a2 q −2 + q −1 ( g0 + g1q −1 ) 1 + c1q −1 + c2 q − 2 = 1 + (a1 + g0 )q −1 + (a2 + g1 )q − 2
92
(7-41)
lze metodou porovnání koeficientů dostat q −1: c1 = a1 + g0
(7-42)
q − 2 : c2 = a2 + g1
koeficienty G( q −1 ) = − a1 − a2 q −1 . Přenos prediktoru bude mít tvar
y$t +1 t = −
a1 + a2 q −1 y 1 + c1q −1 + c2 q − 2 t
(7-43)
a příslušná diferenční rovnice
y$t +1 t + c1 y$t t −1 + c2 y$t −1 t − 2 = − a1 yt − a2 yt −1 .
(7-44)
Rozptyl chyby predikce je shodný s rozptylem chyb modelu , tj.
{(
E yt +1 − y$t +1 t
) } =σ . 2
2 e
(7-45)
Příklad 3:
Poslední příklad této kapitoly bude pokračováním příkladu nestacionární posloupnosti vývoje počtu obyvatel USA. Úkolem je predikovat počet obyvatel v roce 2000. Vývoj počtu obyvatelstva je nestacionární proces, který lze převést na stacionární proces opakovaným diferencováním. Na grafech bylo ukázáno, že lze diferencovat třikrát a výsledný proces v diferencích třetího řádu lze přibližně považovat za stacionární. Výběr vhodného modelu může být zajímavou úlohou. V tomto příkladu je volba omezena na model typu AR, přičemž řád bude třeba nalézt. Následující funkce MATLABu dovoluje vypočítat parametry modelu a jejich charakteristiky » thn=ar(y,n);
kde n je řád modelu y je posloupnost počtů obyvatel a thn jsou parametry modelu ve formátu theta. Optimální řád vyplyne z velikosti ztrátové funkce (loss fcn): řád modelu ztrátová funkce
1
2
3
4
5
38.12
29.81
29.19
21.76
24.26
Nejvhodnější je tedy model čtvrtého řádu, tj.
yt + 12401 . yt −1 + 12243 . yt − 2 + 0.9256 yt − 3 + 0.5551 yt − 4 = et . kde t = 1820,...,1990 Výše popsaným postupem se vypočte predikce o jeden krok dopředu, tj. y2000 1990 . Vypočtené pokračování posloupnosti do roku 2000 nemá význam počtu obyvatel v tomto roce, ale je posledním členem posloupnosti třetích diferencí posloupnosti počtů obyvatel v uvedeném období. Posloupnost druhých diferencí lze dostat příkazem pro výpočet kumulovaného součtu. Protože se integruje, je třeba na začátek posloupnosti třetích diferencí doplnit první prvek posloupnosti druhých diferencí. Takto se snižuje řád diference až k výchozí, nediferencované, posloupnosti počtu obyvatel. Poslední prvek, který je predikcí počtu obyvatel v USA v roce 2000 má velikost 280.7953 milionů. Jiné řešení úlohy je v demo-příkladu MATLABu s názvem Census.m. Zájemce může jednotlivé předpovědi porovnat nebo počkat na skutečné statistické údaje do roku 2001.
93
8. Strukturálně optimální řízení V této kapitole bude řešena úloha strukturální optimalizace pro lineární model regulačního obvodu a kvadratické kriterium řízení podle Aströmovy knihy [4]. Ve zkratce je tato úloha označována LQ. Při syntéze statisticky optimálního řízení soustav s náhodnými poruchami je předpokládán model ve tvaru, který reprezentuje schéma na obr. 44.
Obr. 44. Blokový diagram regulované soustavy V tomto schématu et označuje bílý šum s rozptylem E {et2 } = σ 2e , ut vstupní veličinu regulované soustavy, tj. akční veličinu, vt aditivní poruchu k výstupu regulované soustavy a yt regulovanou veličinu. Index označuje diskrétní čas, tj. t. Protože ve speciální literatuře o statisticky optimálním řízení se upřednostňuje používání operátoru zpětného posunu q −1 před aparátem Z-transformace, je také model regulované soustavy popsán rovnicí yt =
B1 ( q −1 )
A1 ( q −1 )
ut − k + vt ,
(8-1)
kde k > 0 je počet kroků zpoždění. Model náhodné poruchy popisuje rovnice vt =
C1 ( q −1 )
A2 ( q −1 )
et .
(8-2)
Výsledný model regulované soustavy a model vývoje náhodné poruchy popisuje rovnice, kterou lze upravit do tvaru yt =
B1 ( q −1 )
A1 ( q −1 )
ut − k +
C1 ( q −1 )
A2 ( q −1 )
et ,
(8-3)
A1 ( q −1 ) A2 ( q −1 ) yt = A2 ( q −1 ) B1 ( q −1 ) ut − k + A1 ( q −1 ) C1 ( q −1 ) et .
Součiny dílčích polynomů z modelu na obr. 44 je vhodné sloučit následujícím způsobem A( q −1 ) = A1 ( q −1 ) A2 ( q −1 ) , B( q −1 ) = A2 ( q −1 ) B1 ( q −1 ) , C( q −1 ) = A1 ( q −1 ) C1 ( q −1 ) ,
(8-4)
aby výsledný model měl tvar A( q −1 ) yt = B( q −1 ) ut − k + C( q −1 ) et ,
yt =
B ( q −1 )
A( q −1 )
ut − k +
C ( q −1 )
A( q −1 )
(8-5)
et ,
(8-6)
kde 94
A( q −1 ) = 1 + a1q −1 + a2 q −2 +...+ an q − n
(8-7)
B( q −1 ) = b0 + b1q −1 + b2 q −2 +...+bn q − n
(8-8)
C( q −1 ) = 1 + c1q −1 + c2 q −2 +...+ cn q − n .
(8-9)
Za povšimnutí stojí koeficient b0 polynomu B( q −1 ) , který reprezentuje zesílení regulované soustavy. Výše odvozený model je typu ARMAX. Jinak se tento model nazývá Aströmův model n tého řádu. Diferenční rovnice tohoto modelu je
yt + a1 yt −1 + ...+ an yt − n = b0ut − k + b1ut − k −1 + ...+bn ut − k − n + et + c1et −1 +...+ cn et − n .
(8-10)
V souvislosti s indexy veličin je třeba zdůraznit, že výstup regulované soustavy v časovém okamžiku t je ovlivněn akční veličinou, která byla určena v časovém okamžiku t − k , tj. je k kroků zpožděna. Z důvodu fyzikální realizovatelnosti je vždy aspoň k = 1 , tj. v regulačním obvodu je aspoň jeden krok zpoždění. Při zadání není diskutováno, kde toto zpoždění vzniká, zda v regulované soustavě nebo v regulátoru. U diskrétních regulačních obvodů není totiž možné, aby k = 0 , což zmíněný matematický model reflektuje. Úkolem syntézy je navrhnout regulátor, tj. uzavřít regulační smyčku, který kompenzuje působení náhodné poruchy, jak je znázorněno na obr. 45, ve kterém wt představuje žádanou hodnotu. Podle tohoto schématu není porucha, jako jeden z dalších možných vstupů regulátoru, měřena. Regulátor nemusí vyhodnocovat regulační odchylku, ale určitou obecnější kombinaci žádané hodnoty a regulované veličiny, jak vyplyne z výsledků výpočtů.
Obr. 45. Regulační obvod pro model regulované soustavy typu ARMAX Vlastnosti regulátoru, tj. například typ PID, který je znám z klasické teorie regulace, nejsou předem zvoleny. Struktura regulátoru bude výsledkem výpočtu, a proto se syntéza nazývá strukturální optimalizací na rozdíl od parametrické optimalizace, u které jsou optimalizovány jen parametry předem zvoleného typu regulátoru, například zmíněného typu PID regulátoru. Kriteriem optimálnosti je tzv. kvadratické kritérium, podle kterého se minimalizuje střední hodnota druhé mocniny regulační odchylky. Statisticky optimální řízení tedy minimalizuje rozptyl regulační odchylky
{
E ( wt − yt )
2
} → min .
(8-11)
Toto kvadratické kritérium je součástí výchozího zadání k řešení úlohy optimalizace řízení pro lineární modely analyticky stejně jako pro úlohu optimální predikce. Ve srovnání s odvozením statisticky optimální predikce se jedna prakticky o shodný postup. 95
Následující odvození bude předpokládat konstantní žádanou hodnotu, tj. wt = wt −1 =... = w = konst . Ve skutečných regulačních obvodech s významným náhodným kolísáním poruchy je obvykle žádána hodnota v čase neměnná. Naproti tomu například v servomechanismech může být porucha zanedbatelná a náhodné změny žádané hodnoty významné. Tuto úlohu lze řešit shodným postupem jako úlohu statisticky optimální kompenzace náhodné poruchy. Princip výpočtu bude nejdříve dokumentován pro model typu ARMAX (Aströmův model) regulované soustavy prvního řádu s jedním krokem zpoždění.
8.1 Řízení soustavy s modelem typu ARMAX prvního řádu Model typu ARMAX pro nejjednodušší regulovanou soustavu, tj. prvního řádu s jedním krokem dopravního zpoždění, představuje rovnice s vynechanými indexy u parametrů
yt + a yt −1 = b ut −1 + et + c et −1 ,
(8-12)
u které je předpokládáno, že c < 1 , což znamená, že přenos soustavy tvarující frekvenčně bílý šum je fázově minimální. Opodstatnění této podmínky plyne ze stability přenosu uzavřeného obvodu se statisticky optimálním regulátorem, což vyplyne z jeho tvaru, jak bude zřejmé v závěru kapitoly. Nejprve bude vypočtena závislost hodnot výstupu regulované soustavy pro čas o jeden krok dopředu, tj. o zmíněné dopravní zpoždění
y t +1 = − a y t + b ut + et +1 + c et = δ t + et +1 ,
(8-13)
kde δ t je pomocná veličina. K výpočtu akčního zásahu ut jsou k dispozici údaje o regulované veličině, tj. yt , yt −1 ,... , a samozřejmě minulé akční zásahy, tj. ut −1 , ut − 2 ,... , ze kterých lze také navíc vypočítat chybu modelu et a její minulé hodnoty, tj. et −1 , et − 2 ,... . Kriteriem optimálnosti řízení je střední hodnota druhé mocniny regulační odchylky, proto
{
E ( w − y t +1 )
2
} = E{(w − δ − e ) } = E{(w − δ ) } + 2 E {(w − δ )e } + E {e = E {( w + a y − b u − c e ) } + E {e }. 2
2
t +1
t
t
2
t
t
t
2 t +1
t
t +1
2 t +1
}=
(8-14)
Jako u optimální predikce byla při výpočtu užita rovnost E{(w − δ t ) et +1 } = 0 , která vyplývá z nezávislosti chyby et +1 na ostatních veličinách, které byly změřeny nebo vypočteny do časového okamžiku t. Minimum rozptylu odchylky regulované veličiny je dosaženo, jestliže první člen upravené pravé strany poslední rovnice je nulový, tj. ut =
1 ( w + a yt − c et ) . b
(8-15)
Poslední vzorec představuje statisticky optimální regulátor soustavy prvního řádu. Minimální hodnota kritéria optimálnosti regulace je podle vzorce
{
E ( w − y t +1 )
2
} = E {e
2 t +1
}=σ
2 e
(8-16)
rovna rozptylu chyby modelu. Tato chyba představuje poruchu, která působí aditivně na výstup regulované soustavy.
96
Rovnice pro výpočet akční veličiny obsahuje velikost chyby et . Aby bylo možné tuto veličinu ze vzorce vyloučit je vhodné ji nahradit podle následujícího vzorce 1 + a q −1 b et = u , −1 y t − 1+ c q 1 + c q −1 t −1
(8-17)
který plyne z modelu řízené soustavy po použití operátoru zpětného posunu. Po dosazení plyne
⎞ cb 1⎛ 1 + a q −1 ut = ⎜ w + a yt − c −1 yt + −1 ut −1 ⎟ , 1+ c q 1+ c q b⎝ ⎠ ⎞ c−a c 1⎛ ⎜w − ut = −1 ut −1 + −1 yt ⎟ . b⎝ 1+ c q 1+ c q ⎠
(8-18)
Pro realizaci regulátoru je třeba výsledek výpočtu ve formě přenosů s operátorem posunutí q přepsat do vzorce, který je vhodný pro výpočet akčních zásahů. Při úpravách se z rovnice odstraní zlomky, tj. −1
ut (1 + c q −1 ) = c ut −1 +
(
)
1 w(1 + c q −1 ) − ( c − a ) yt . b
(8-19)
Po vykrácení a úpravě výrazu s žádanou hodnotou, která je podle zadání konstantní w = wt = wt −1 , tj. platí w(1 + c q −1 ) = wt (1 + c q −1 ) = wt + c wt −1 = w + w c = w(1 + c) ,
(8-20)
je výsledný vzorec pro výpočet akčního zásahu ut =
1+ c c−a w− y . b b t
(8-21)
Struktura regulátoru je z hlediska tradičních regulátorů PID dosti nepřehledná, což je pro funkci regulačního obvodu nepodstatné. Přenos regulované soustavy v Z-transformaci je následující Y ( z) =
b z −1 1 + c z −1 ( ) U z + E ( z) , 1 + a z −1 1 + a z −1
(8-22)
b z+c Y ( z) = U ( z) + E ( z) , z+a z+a
podobně přenos regulátoru je
U ( z) =
c−a 1+ c w− Y ( z) . b b
(8-23)
Uzavřený obvod s regulátorem a soustavou je znázorněn v blokovém schématu na obr. 46. Regulátor nepracuje s regulační odchylkou, ale s kombinací žádané a regulované veličiny, což má zaručovat nulování trvalé regulační odchylky jako jeden z praktických požadavků, které plynou ze základů teorie syntézy regulačních obvodů. Přenos řízení je následující
97
b 1+ c 1+ c b 1+ c z+a . = = Gwy ( z ) = − b c a b b z+c z+c 1+ z+a b
(8-24)
Tento přenos řízení je stabilní, jestliže c < 1 , což dodatečně zdůvodňuje podmínku pro velikost parametru c, která je součástí zadání úlohy. Jednotkový skok žádané hodnoty má ustálenou hodnotu, kterou lze vypočítat známým způsobem pomocí limity y∞ = lim ( z − 1) Gwy ( z ) z →1
z 1+ c z = lim ( z − 1) = 1, z − 1 z →1 1+ z z − 1
(8-25)
tj. odezva na jednotkový skok je bez trvalé regulační odchylky.
Obr. 46. Blokové schéma regulovaného obvodu pro model typu ARMAX prvního řádu Z hlediska klasických kombinací složek PID regulátoru je zpětnovazební signál v uzavřené smyčce zpracován jen proporcionálním blokem, tj. typu P. Statisticky optimální regulace soustavy prvního řádu představuje proporcionální regulátor. Pro posouzení struktury regulátoru bude vhodné upravit vstup poruchy v blokovém schématu na obr. 46 před regulovanou soustavu, tj. jako aditivní porucha k akční veličině. Jak je zřejmé z obr. 47, porucha představuje náhodný proces typu MA, protože je klouzavým váženým průměrem dvou realizací bílého šumu.
Obr. 47. Upravené blokové schéma regulovaného obvodu
98
8.2 Řízení soustavy s modelem typu ARX prvního řádu Poslední poznámka k výsledkům rozboru statisticky optimální regulace se bude týkat modelu regulované soustavy prvního řádu a typu ARX. Jak již bylo uvedeno model typu ARX se nazývá rovněž regresní model. U tohoto typu modelu platí, že polynom C( z ) = 1 , tj. c = 0 . Protože regresní model je zjednodušený model typu ARMAX, lze výsledek syntézy získat jen dosazením speciální hodnoty parametru c = 0 . Platí
yt + a yt −1 = b ut − k + et .
(8-26)
Model regulované soustavy v Z-transformaci má následující tvar
Y ( z) =
b z U ( z) + E ( z) z+a z+a
(8-27)
a vzorec pro statisticky optimální řízení regresního modelu prvního řádu a jeho Ztransformace jsou
ut =
c −a w− y , b b t
U ( z) =
(8-28)
1 −a w− Y ( z) . b b
(8-29)
Regulátor je proporcionální a porucha, která vstupuje jako aditivní k akční veličině je náhodný proces typu bílého šumu.
8.3 Řízení soustavy s modelem typu ARMAX obecného řádu Výpočet statisticky optimálního řízení pro konstantní žádanou hodnotu a náhodnou poruchu má shodný postup jako u výše popsané jednoduché úlohy. Pro stabilitu regulačního obvodu se statisticky optimálním regulátorem je třeba, aby reciproký polynom C * ( z ) = z n C( z −1 )
k polynomu C( z −1 ) měl kořeny jen uvnitř jednotkové kružnice. Správnost této podmínky vyplyne v závěru odvození. Protože akční veličina v čase t ovlivní regulovanou veličinu v čase t+k (soustava má k kroků zpoždění) je kriteriem optimálnosti řízení střední hodnota druhé
{
mocniny regulační odchylky ve tvaru E ( w − yt + k )
veličiny yt + k . Platí
yt + k =
B ( q −1 )
2
} , je třeba stanovit velikost regulované
C ( q −1 )
ut + et + k . (8-30) A( q −1 ) A( q −1 ) Druhý výraz na pravé straně předchozí rovnice je třeba upravit tak, aby se oddělily hodnoty bílého šumu s indexem větším než t a nejvýše rovným t. Důvod je shodný jako při rozboru statisticky optimální predikce a řízení výše uvedené jednoduché soustavy. Pro zmíněné rozdělení je třeba zavést dva pomocné polynomy C ( q −1 )
A( q −1 )
et + k = F ( q
−1
)e
t +k
+
G ( q −1 ) A( q −1 )
et ,
kde F ( q −1 ) = 1 + f 1q −1 + f 2 q −2 +...+ f k −1q − ( k −1)
(8-31) a
G( q −1 ) = g0 + g1q −1 + g2 q −2 +...+ gn −1q − ( n −1) .
Polynom F ( q −1 ) je řádu k − 1 , aby po násobení et + k zůstal index u chyby modelu vyšší než t.
99
Polynom G( q −1 ) je řádu n − 1 , aby řád součinu polynomů A( q −1 ) F ( q −1 ) , který je n + k − 1 , byl shodný s řádem součinu q − k G( q −1 ) . Koeficienty obou polynomů se stanoví z podmínky C( q −1 ) = A( q −1 ) F ( q −1 ) + q − k G( q −1 )
(8-32)
metodou porovnání koeficientů, která byla popsána v kapitole o optimální predikci. Ze vzorce pro výpočet yt + k je třeba eliminovat veličinu et pomocí vztahu et =
A( q −1 )
C( q
−1
)
yt −
B ( q −1 )
C( q
−1
)
q − k ut .
(8-33)
Postupné úpravy jsou následující yt + k =
B ( q −1 )
A( q −1 )
ut + F ( q −1 ) et + k +
G( q −1 ) ⎛ A( q −1 ) B ( q −1 ) − k ⎞ ⎜⎜ y − q ut ⎟⎟ , t A( q −1 ) ⎝ C( q −1 ) C ( q −1 ) ⎠
(8-34)
⎛ B ( q − 1 ) G ( q −1 ) B ( q −1 ) − k ⎞ G ( q −1 ) ⎟⎟ ut + y t + k = F ( q −1 ) et + k + ⎜⎜ − q yt , −1 −1 −1 C( q −1 ) ⎝ A( q ) A( q ) C( q ) ⎠ yt + k = F ( q
−1
)e
+ B( q
t +k
y t + k = F ( q −1 ) et + k +
−1
)
C ( q −1 ) − q − k G ( q − 1 )
B( q −1 ) F ( q −1 ) C( q −1 )
A( q −1 ) C( q −1 )
ut +
G ( q −1 ) C( q −1 )
ut +
G ( q −1 ) C ( q −1 )
(8-35)
yt ,
(8-36)
y t = F ( q −1 ) et + k + δ t .
(8-37)
Kriterium řízení ve tvaru střední hodnoty druhých mocnin regulační odchylky bude mít po této úpravě tvar
{
E ( w − yt + k )
2
} = E {(w − F (q )e − δ ) } = = E {( w − δ ) } + 2 E {( w − δ ) F ( q ) e } + E {( F ( q = E {( w − δ ) } + E {( F ( q ) e ) }, 2
−1
t +k
t
2
−1
t
t
2
t +k
−1
)e ) t +k
2
}=
(8-38)
2
−1
t +k
t
{
}
kde pro nezávislost δ t a et + k platí E ( w − δ t ) F ( q −1 ) et + k = 0. Minimální velikost kriteria je dosaženo pro w − δ t = 0 , tj. w−
B ( q −1 ) F ( q − 1 ) C ( q −1 )
ut −
G ( q −1 ) C( q −1 )
yt = 0 .
(8-39)
Statisticky optimální řízení je dáno vzorcem ut =
B( q
1
−1
) F (q ) −1
(C( q ) w − G ( q ) y ) . −1
−1
t
(8-40)
Pro konstantní žádanou hodnotu w = wt = wt −1 =... = wt − n platí w C( q −1 ) = wt (1 + c1 q −1 +...+ cn q − n ) = wt + c1wt −1 +...+ cn wt − n =
= w + c1w+...+ cn w = w + w c = w C(1) = w(1 + c1 +...+ cn ) .
100
(8-41)
Vzorec pro optimální řízení lze tedy upravit na konečný tvar přenosové funkce statisticky optimálního regulátoru ut =
(
)
1 C(1) w − G( q −1 ) yt , −1 B( q ) F ( q ) −1
(8-42)
ze kterého se po konkretizaci všech polynomů odvodí rekurzivní vzorec k výpočtu akční veličiny. V přenosu regulátoru je polynom B( q −1 ) , který rozhoduje o jeho stabilitě pro případ, že předpokládané nuly přenosu soustavy se liší od nul skutečných. Pro fázově neminimální soustavy jsou některé kořeny polynomu mimo jednotkovou kružnici, a proto tyto regulátory mohou způsobit nestabilitu regulačního obvodu. Minimální hodnota kritéria optimálnosti regulace je
{
E ( w − yt + k )
2
} = E {( F (q
−1
)e ) } = E {((e t +k
2
t +k
) } = σ (1 + f
+ f 1et + k −1 +...+ f k −1et +1 )
2
2 e
2 1
+...+ f k2−1 ) . (8-43)
Z tohoto vzorce je zřejmé, že rozptyl regulační odchylky roste s dopravním zpožděním. Rozbor stability a přesnosti regulace bude využívat přenosové funkce v Z-transformaci. Blokové schéma regulačního obvodu je znázorněno na obr. 48. Z tohoto schématu jsou zřejmé vlastnosti jednotlivých bloků. Regulační odchylka je tvořena lineární kombinací žádané hodnoty a regulované veličiny. Žádaná hodnota a regulovaná veličina jsou násobeny vhodnými součiniteli tak, aby regulační odchylka po skoku žádané hodnoty byla nulová, což bylo zatím ukázáno jen na příkladu řízení modelu typu ARMAX prvního řádu. Neměřená poruchová veličina je tvarována přenosem, který transformuje bílý šum na náhodnou veličinu s omezeným spektrem. V regulačním obvodu se předpokládá k kroků dopravního zpoždění.
Obr. 48. Blokové schéma regulačního obvodu pro model soustavy typu ARMAX Přenos řízení uzavřeného obvodu je dán následujícím výpočtem, ve kterém jsou uváděny přenosy bez argumentu z − k B1 C(1) C(1) B1 A2 F A1 Gwy ( z ) = C(1) = = . −k z B1 AF + z − k G C( z −1 ) 1+ G B1 A2 F A1
101
(8-44)
Při úpravách byly použity tyto vztahy: A1 A2 = A a C = AF + z − k G . Jmenovatel přenosu
řízení obsahuje polynom C( z −1 ) . Reciproký polynom k tomuto polynomu je C * ( z ) = z n C( z −1 ) . Pro stabilitu regulačního obvodu musí kořeny reciprokého polynomu ležet uvnitř jednotkové kružnice. Zmíněný polynom je součinem dvou polynomů, a to C( q −1 ) = A1 ( q −1 ) C1 ( q −1 ) . Polynom A1 ( q −1 ) přísluší jmenovateli regulované soustavy a C1 ( q −1 ) přísluší filtru, který tvaruje bílý šum na poruchu působící aditivně k výstupu regulované soustavy. Vlastnosti filtru bílého šumu a regulované soustavy se zjistí identifikací.
Souhrnně lze uvést, že statisticky optimální regulátor pro stabilní regulační obvod lze navrhnout jen pro • stabilní regulovanou soustavu • fázově neminimální filtr tvarující bílý šum na poruchu, která působí na výstupu soustavy. Odezva na jednotkový skok žádané hodnoty je v ustálené hodnotě rovna limitě, která plyne z věty o ustálené hodnotě obrazu v Z-transformaci y∞ = lim ( z − 1) Gwy ( z ) z →1
z C(1) z = lim ( z − 1) = 1. z − 1 z→1 C ( z −1 ) z − 1
(8-45)
Regulační obvod pracuje bez trvalé regulační odchylky. Statisticky optimální regulátor lze spojit s průběžnou identifikací parametrů regulované soustavy. Stabilita regulačního obvodu byla předmětem analýz [3] a výsledná doporučení jsou následující: • parametr související se zesílením soustavy se nedoporučuje identifikovat, ale volit tak, aby byl větší než polovina skutečného zesílení (volba zesílení se nesmí podhodnotit) • řád soustavy nesmí být zvolen menší než skutečný • počet kroků dopravního zpoždění musí být určen přesně • jak bylo již uvedeno, soustava nesmí být fázově neminimální.
8.4 Řízení soustavy s modelem typu ARX a jedním krokem dopravního zpoždění Regresní model řízené soustavy s jedním krokem dopravního zpoždění je následující A( q −1 ) yt = B( q −1 ) ut −1 + et .
(8-46)
Platí tedy C( q −1 ) = 1 a k = 1. Z toho plyne, že volitelný polynom F ( q −1 ) je rovněž roven
jedné. Zbývá tedy určit jen polynom G( q −1 ) , a to ze vztahu 1 = A( q −1 ) + q −1G( q −1 ) ,
(8-47)
který lze rozepsat do tvaru 1 = 1 + a1q −1 +...+ an q − n + q −1 ( g0 + g1q −1 +...+ gn −1q − n +1 ), 1 = 1 + (a1 + g0 )q −1 + (a2 + g1 )q − 2 +...+(an + gn −1 )q − n .
(8-48)
Pro koeficientu polynomu G( q −1 ) platí
g0 = −a1 , g1 = − a2 , ..., gn −1 = − an .
(8-49)
102
Vzorec pro optimální řízení lze tedy upravit na konečný tvar ut =
(
)
1 C(1) w − G( q −1 ) yt = −1 B( q ) F ( q ) −1
(
)
1 w + (a1 + a2 q −1 + a3q − 2 +..+ an q − n +1 ) yt . = −1 B( q )
(8-50)
Po přepsání do tvaru rekurzivního vzorce, lze dostat
b0 ut + b1 ut −1 +..... = w + a1 yt + a2 yt −1 + a3 yt − 2 +..... .
(8-51)
Akční zásahy ut se tedy vypočítají tak, že do rovnice regresního modelu s časem posunutým z t na t + 1 bez neznámé chyby et +1 se za yt +1 dosadí žádaná hodnota w. Blokové schéma regulačního obvodu je na obr. 49. Aditivní porucha na výstupu regulované soustavy je autoregresní náhodný proces.
Obr. 49. Regulační obvod s modelem typu ARX a jedním krokem dopravního zpoždění
8.5 Řízení integrační soustavy s poruchou působící na vstupu Tato úloha je v praxi velmi běžná například při regulaci zásobníků ovládáním vstupního toku a náhodným výstupním tokem. Blokové schéma zmíněné regulované soustavy a ekvivalentní soustavy s přemístěním poruchy na výstup integrační soustavy je na obr. 50.
Obr. 50. Regulovaná soustava se vstupem poruchy před integrační částí modelu soustavy Součiny dílčích polynomů z modelu v uvedeném blokovém schématu jsou
103
A1 ( q −1 ) = A11 ( q −1 )(1 − q −1 ) ,
A2 ( q −1 ) = A21 ( q −1 )(1 − q −1 ) .
(8-52)
Polynomy pro model regulované soustavy ve tvaru A( q −1 ) yt = B( q −1 ) ut − k + C( q −1 ) et ,
(8-53)
jsou následující
A( q −1 ) = A11 ( q −1 ) A21 ( q −1 )(1 − q −1 ) , 2
B( q −1 ) = A21 ( q −1 ) B1 ( q −1 )(1 − q −1 ) ,
C( q −1 ) = A11 ( q −1 ) C1 ( q −1 )(1 − q −1 ) .
(8-54) (8-55)
Reciproký polynom C * ( z ) = z C( z −1 ) má kořen na jednotkové kružnici, a proto strukturálně statisticky optimální řízení je nestabilní.
104
8.6 Příklad návrhu statisticky optimální regulace V této kapitole bude demonstrován úplný návrh statisticky optimálního regulátoru pro soustavu s náhodnou poruchou, která je znázorněna na obr. 51 v blokovém schématu s využitím prostředků toolboxu SIMULINK programového systému MATLAB.
Obr. 51 Blokové schéma regulované soustavy s aditivní poruchou na výstupu Regulovaná soustava (Plant) je prvního řádu. K výstupu soustavy (Output signal) se přičítá (Sum) porucha (Disturbance) typu autoregresní náhodný proces. Tato porucha je modelována průchodem bílého šumu (White noise) přes soustavu prvního řádu (Filter). Je předpokládáno, že bílý šum má rozptyl roven jedné. Návrh statisticky optimální regulace bude pro akční zásahy (Control signal) bez dopravního zpoždění a se zpožděním jedné vzorkovací periody. Pro jednotlivé polynomy z blokového schématu na obr. 51 platí A1 ( q −1 ) = 1 − 0.5q −1 , B1 ( q −1 ) = 1 , A2 ( q −1 ) = 1 − 0.9q −1 , C1 ( q −1 ) = 1 .
(8-56)
Tyto polynomy je třeba sloučit do následujících polynomů A( q −1 ) = A1 ( q −1 ) A2 ( q −1 ) = (1 − 0.5q −1 )(1 − 0.9q −1 ) = 1 + a1q −1 + a2 q −2 = 1 − 14 . q −1 + 0.45q −2 , B( q −1 ) = A2 ( q −1 ) B1 ( q −1 ) = (1 − 0.9q −1 ) * 1 = b0 + b1q −1 = 1 − 0.9q −1 , C( q −1 ) = A1 ( q −1 ) C1 ( q −1 ) = (1 − 0.5q −1 ) * 1 = 1 + c1q −1 = 1 − 0.5q −1 .
Po substitucích se zvýšil řád soustavy na n = 2 . Je třeba si všimnout, že polynom C( q −1 ) v reciprokém tvaru, tj. C * ( z ) = z − 0.5 , má nulu uvnitř jednotkové kružnice.
a) Návrh statisticky optimálního řízení pro k = 1 , tj. bez dopravního zpoždění Nejprve je třeba určit polynom F ( q −1 ) řádu k − 1 = 1 − 1 = 0 , tj. F ( q −1 ) = 1 a polynom
G( q −1 ) řádu n − 1 = 2 − 1 = 1, tj. G( q −1 ) = g0 + g1q −1 . Tyto polynomy splňují pro statisticky optimální řízení podmínku C( q −1 ) = A( q −1 ) F ( q −1 ) + q − k G( q −1 ) ,
(8-57)
tj. v obecném tvaru se jedná o rovnice, ze kterých lze metodou porovnání koeficientů vypočítat hodnoty koeficientů polynomu G( q −1 ) 1 + c1q −1 = (1 + a1q −1 + a2 q −2 ) * 1 + q −1 ( g0 + g1q −1 ), 1 + c1q −1 = 1 + (a1 + g0 )q −1 + (a2 + g1 )q − 2 .
105
(8-58)
Platí q −1: c1 = a1 + g0 , q −2 : 0 = a2 + g1 ⇒ g0 = c1 − a1 , g1 = − a2 .
(8-59)
. = 0.9, g1 = − a2 = −0.45 . tj. V konkrétních číselných hodnotách je to g0 = c1 − a1 = −0.5 + 14
je roven G( q −1 ) = 0.9 − 0.45q −1 . Statisticky optimální řízení je dáno
hledaný polynom přenosem ut = =
(
)
(1 + c) w − ( g0 + g1q −1 ) yt
0.5 w − ( 0.9 − 0.45q −1 ) yt = . 1 − 0.9q −1
1 1 + c1 +...+ cn ) w − G( q −1 ) yt = ( −1 −1 F ( q ) A2 ( q ) B1 ( q ) −1
1 − 0.9q −1
(8-60)
{
Rozptyl regulační odchylky bude teoreticky jednotkový, tj. E ( w − yt +1 )
2
}=σ
2 e
= 1.
b) Návrh statisticky optimálního řízení pro k = 2 , tj. bez dopravního zpoždění Polynom F ( q −1 ) řádu k − 1 = 2 − 1 = 1 pro tuto úlohu je následující F ( q −1 ) = 1 + f 1q −1 a
polynom G( q −1 ) řádu n − 1 = 2 − 1 = 1 je G( q −1 ) = g0 + g1q −1 . Tyto polynomy splňují pro statisticky optimální řízení podmínku C( q −1 ) = A( q −1 ) F ( q −1 ) + q − k G( q −1 ) ,
(8-61)
a proto platí
(
)(
)
(
)
1 + c1q −1 = 1 + a1q −1 + a 2 q −2 1 + f 1q −1 + q −2 g 0 + g1q −1 , 1 + c1q −1 = 1 + (a1 + f 1 )q −1 + (a 2 + a1 f 1 + g 0 )q −2 + (a 2 f 1 + g1 )q −3 , q −1 : c1 = a1 + f 1 , q −2 : 0 = a 2 + a1 f 1 + g 0 , q −2 : 0 = a 2 f 1 + g1 , ⇒ f 1 = c1 − a1 , g 0 = − a 2 − a1 f 1 , g1 = − a 2 f 1 .
(8-62)
(8-63)
V konkrétních číselných hodnotách je to f 1 = c1 − a1 = −0.5 + 14 . = 0.9, g0 = − a2 − a1 f 1 = 0.81, g1 = − a2 f 1 = −0.405 . tj. hledané polynomy mají tvar F ( q −1 ) = 1 + 0.9q −1 a G( q −1 ) = 0.81 − 0.405q −1 . Statisticky optimální řízení je dáno přenosem ut = =
(
)
1 1 + c1 +...+ cn ) w − G( q −1 ) yt = ( −1 −1 F ( q ) A2 ( q ) B1 ( q ) −1
(1 + c) w − ( g0 + g1q −1 ) yt
(1 + 0.9q )(1 − 0.9q ) −1
−1
0.5 w − ( 0.81 − 0.405q −1 ) yt = . 1 − 0.81q − 2
(8-64)
Rozptyl regulační odchylky bude teoreticky jednotkový, tj.
{
E ( w − yt +2 )
2
} = σ (1 + f 2 e
2 1
. , ) = 181
(8-65)
což znamená, že rozptyl se zvýší 1.81-krát.
106
c) Simulační ověření optimálního řízení Blokové schéma úplného regulačního obvodu bez dopravního zpoždění je na obr. 52.
Obr. 52. Model regulačního obvodu bez dopravního zpoždění (k = 1) Žádaná hodnota (set point) je generována blokem Step Fcn a je rovna jedné. Blok Gain realizuje zesílení dané součtem koeficientů polynomu C( q −1 ) , který je roven 1 + c = 1 − 0.5 = 0.5 . Sumační blok Sum1 vytváří rozdíl vážené žádané hodnoty a výstupu regulované soustavy. Blok Filter1 realizuje násobení výstupní veličiny regulačního obvodu přenosem (polynomem) G( q −1 ) . Blok Filter2 představuje přenos v jehož jmenovateli je součin polynomů B( q −1 ) F ( q −1 ) , tj. v dané úloze jen polynom A2 ( q −1 ) , protože ostatní polynomy jsou rovny jedné. Výstup modelu lze pozorovat na tzv. osciloskopech (Scope) nebo lze výsledky převést do pracovního prostředí MATLABu, ve kterém je možné jejich další zpracování a vykreslení grafů.
V dané úloze nezáleží na volbě integrační metody. Smysluplné výsledky lze však obdržet jedině pro určitou volbu periody vzorkování signálů. Všechny bloky mají stejnou periodu vzorkování, a to rovnou jedné. Pro správný výsledek simulace je třeba nastavit pořadí výpočtů bloků [8,9]. Po výpočtu výstupu bloku Plant musí následoval výpočet bloku Filter1 a pak teprve bloku Filter2. Výhodou SIMULINKu je možnost volby tzv. offsetu jako položky parametrů diskrétních bloků. V řádku Sample time se zapíše vektor, jehož první složka je vzorkovací perioda (zvolena jednotka) a druhá složka je zmíněný offset, který posouvá výpočet (okamžik vzorkování) oproti ostatním blokům. Pro blok Filter1 bylo zvoleno 0.001 a pro blok Filter2 bylo zvoleno 0.002. Na absolutní velikosti těchto ofsetů nezáleží pokud nejsou větší než vzorkovací perioda. Rozhodující je jen pořadí časových okamžiků výpočtu, které určuje seřazení ofsetů podle velikosti. Při výpočtu jsou jednotlivé diskrétní bloky s proměnnou z −1 považovány za algebraické (tzv. rychlé) smyčky, pořadí jejich výpočtu iteracemi je v případě nulového offsetu mimo kontrolu zadaní úlohy a řešení může být nestabilní. Popsaná úprava korekcí offsetu vede ke správným výsledkům simulace. Přenosy bloků popisovaného schématu korespondují s jednotlivými bloky regulátoru a filtru pro generování náhodné poruchy. Odlišné je jen zadání bloku regulované soustavy. V popisu přenosů v např. v Z-transformaci bude v čitateli uvedeno v souhlase s k = 1 také z −1 . V simulačním modelu však tento posun chybí. Při programování výpočtu bloků zřetězených do uzavřené smyčky, tj. se zpětnou vazbou, tento jeden krok zpoždění přidává automaticky
107
algoritmus řešení. Čtenář se o tom může přesvědčit tak, že vypočte přenos uzavřené smyčky a jeho odezvu na jednotkový skok porovná s odezvou uzavřeného obvodu, od kterého je odpojen vstup náhodné poruchy. Zapojení uzavřeného obvodu a jeho náhradního přenosu je na obr. 53. Blokové schéma obsahující přenos uzavřené smyčky ve spodní části obrázku lze z horního zapojení získat jen v případě, že do uzavřeného obvodu je při výpočtu přenosu přidán člen z −1 , který v horním schématu chybí. Mechanický přepis přenosů v Z-transformaci do programu SIMULINKu může být zdrojem záludných chyb, které pro stabilní úlohy nejsou postřehnutelné.
Obr. 53. Zapojení bloků se shodnou odezvou Úprava blokového schématu regulačního obvodu s dopravním zpožděním je znázorněna v obr. 54. V tomto případě je upraven jen blok modelující regulovanou soustavu. Přestože je k = 2 , do čitatele přenosu bloku je doplněno jen z −1 z výše uvedených důvodů. Ve schématu jsou dále změněny koeficienty přenosů bloků Filter1 a Filter2 v souladu s výsledkem výpočtu.
Obr. 54. Model regulačního obvodu s jedním krokem dopravního zpoždění Ze simulačních výpočtů bude nejprve znázorněn náhodný průběh poruchové veličiny pro 200 kroků simulačního výpočtu, a to na obr. 55. Vzhledem ke vstupu poruchy je tento průběh shodný s průběhem výstupu regulované soustavy bez regulace. Směrodatná odchylka je rovna 2.403, její druhá mocnina, rozptyl, je rovna 5.8. Jak již bylo uvedeno, náhodná porucha je autoregresní náhodný proces s průběhem značně odlišným od bílého šumu. Tento typ poruchy je
108
v praxi velmi častý. Ve středním úseku obsahuje dokonce vlnu s velkou periodou, kterou musí regulátor potlačit.
Obr. 55. Časový průběh poruchové veličiny, tj. výstupu soustavy bez regulace Porovnání účinku regulace bez dopravního zpoždění a s jedním krokem dopravního zpoždění je na obr. 56. Žádaná hodnota pro regulační smyčku je rovna jedné. Přechodový děj je zcela překryt působením poruchové veličiny. Úloha regulace patří tedy do kategorie, kdy kolísání poruchové veličiny je dominantní. Regulační obvod je navržen na nulovou regulační odchylku. Střední hodnota regulované veličiny je velmi blízká žádané hodnotě. Rozdíl střední hodnoty a žádané hodnoty je jen 0.02. Směrodatná odchylka regulované veličiny při regulaci bez dopravního zpoždění je 1.02 (rozptyl 102 . 2 ≈ 104 . ) a rozptyl při regulaci s jedním krokem 2 dopravního zpoždění je 1.33 (rozptyl 133 . ≈ 177 . ). Poměr obou rozptylů je velmi blízký vypočtenému poměru (1.81).
Obr. 56. Časový průběh regulované veličiny při působení náhodné poruchy Na obr. 57 je uveden průběh akčních veličin u obou porovnávaných regulačních obvodů. Je zřejmé, že u obvodu bez dopravního zpoždění je rozsah hodnot akční veličiny větší ve
109
srovnání s obvodem, který obsahuje dopravní zpoždění, kdy je regulace „opatrnější“. U obou variant regulačních obvodů je třeba porovnávat souhrnné charakteristiky časového průběhu, jako jsou střední hodnota a směrodatná odchylka, popřípadě rozptyl.
Obr. 57. Průběh akční veličiny u regulačního obvodu bez dopravního zpoždění a s jedním krokem zpoždění
110
8.7 Citlivost statisticky optimálního řízení na změnu parametrů soustavy Robustnost algoritmů řízení je předmětem mnoha analýz, např. [4]. Cílem je obvykle zjistit, jak se změní vlastnosti regulovaného obvodu, jestliže model, podle kterého byl navržen regulátor, neodpovídá jeho skutečným vlastnostem. Matematicky lze úlohu formulovat tak, že parametry modelu regulované soustavy, podle kterého se regulátor navrhuje A(q ) y t = B(q ) ut − k + C(q ) et ,
(8-66)
se liší od skutečného, neznámého, modelu A o ( q ) yt = B o ( q ) ut − k + C o ( q ) et .
(8-67)
V obou modelech jsou nahrazeny polynomy v proměnné q −1 , tzv. reciprokými polynomy v proměnné q. Jestliže řád obou modelů je shodný, pak jejich koeficienty jsou obvykle velmi blízké. Podle známého modelu je navržen následující statisticky optimální regulátor ut =
− G * ( q ) yt
B * ( q −1 ) F * ( q − 1 )
=
− G ( q ) q k yt B( q ) F ( q )
,
(8-68)
přičemž je bez omezení obecnosti předpokládáno, že žádaná hodnota je nula. Při převodu na reciproké polynomy je třeba uvážit stupně polynomů B( q ) , F ( q ) , G( q ) , a proto po vykrácení mocnin proměnné q zbude v čitateli její mocnina q k . Protože funkci regulačního obvodu popisuje samozřejmě správný model, je třeba zkoumat jeho vlastnosti při použití odvozeného přenosu řízení, který byl navržen pomocí nepřesného modelu s málo odlišnými parametry od skutečnosti. Po dosazení do správného přenosu za akční veličinu platí A o ( q ) yt = − B o ( q )
G( q )
B( q ) F ( q )
yt + C o ( q ) et .
(8-69)
Po úpravách lze dostat ⎛ o B o ( q )G( q ) ⎞ ⎟⎟ yt = C o ( q ) et . ⎜⎜ A ( q ) + B( q ) F ( q ) ⎠ ⎝
(8-70)
Převodem následující rovnice C( q −1 ) = A( q −1 ) F ( q −1 ) + q − k G( q −1 ) ,
(8-71)
podle které byly určeny oba volitelné polynomy F ( q −1 ) , G( q −1 ) , na reciproké polynomy lze odvodit výraz q k −1C( q ) = A( q ) F ( q ) + G( q ) .
(8-72)
Po dosazení do předchozího vztahu lze dostat rovnici
[q
k −1
(
)
]
B o ( q ) C( q ) + Ao ( q ) B( q ) − A( q ) B o ( q ) F ( q ) yt = B( q ) F ( q ) C o ( q ) et ,
ze které vyplývá charakteristická rovnice regulačního obvodu
111
(8-73)
(
)
q k −1 B o ( q ) C( q ) + Ao ( q ) B( q ) − A( q ) B o ( q ) F ( q ) = 0 .
(8-74)
Charakteristická rovnice regulačního obvodu má význam polynomu jmenovatele přenosu uzavřeného obvodu. Poloha kořenů této rovnice určuje chování celého obvodu. Jestliže jsou kořeny této rovnice uvnitř stabilní oblasti, tj. uvnitř kružnice s poloměrem rovným jedné a středem v počátku komplexní roviny, pak je uzavřený obvod stabilní. Kořeny mimo stabilní oblast vedou vždy k nestabilitě, tj. po sebemenším vzruchu se soustava rozkmitá nebo výstup soustavy se zvětší teoreticky k nekonečnu. Jestliže bude přibližně platit Ao ≈ A, B o ≈ B, C o ≈ C , pak se charakteristická rovnice
zredukuje na q k −1 B o ( q ) C o ( q ) = 0 . Význam kořenů polynomu C o ( q ) byl již diskutován. Je třeba připomenout, že B 0 ( q ) = A2o ( q ) B1o ( q ) . Poruchová veličina se předpokládá stacionární, tj.
se stabilním přenosem, a proto kořeny polynomu A2o leží uvnitř stabilní oblasti komplexní roviny. V praxi existují regulované soustavy s přenosem, který má nuly mimo stabilní oblast. Jsou to již několikrát zmíněné fázově neminimální soustavy. Při syntéze se jejich vliv zdánlivě vyruší, ale ve skutečnosti při rozdílu předpokládané a skutečné polohy kořenu polynomu čitatele přenosu soustavy vznikne nestabilita. Tento jev lze kompenzovat zhoršením účinku regulace tzv. suboptimálním regulátorem.
8.8 Suboptimální řízení fázově neminimálních regulovaných soustav Každý polynom lze rozdělit na kořenové činitelé B( q ) = (q − q1 )(q − q2 )... (q − qn ) ,
(8-75)
kde q1 , q2 ,..., qn jsou kořeny. Hlavní idea odvození suboptimálního řízení spočívá v tzv.
faktorizaci polynomu čitatele přenosu regulované soustavy B( q ) tak, aby se tento polynom rozdělil na součin dvou dílčích polynomů, z nichž prvý má všechny kořeny uvnitř jednotkové kružnice a druhý má kořeny vně této kružnice. Platí B( q ) = BI ( q ) BII ( q ) ,
(8-76)
kde polynom BI ( q ) je řádu nI s kořeny uvnitř jednotkové kružnice a polynom BII ( q ) je řádu nII = n − nI s kořeny vně jednotkové kružnice. Pro suboptimální řízení se význam polynomů z rovnice (8-72) změní tak, že polynom BII ( q ) se přičlení k polynomu G( q ) . Volitelné polynomy F ′( q −1 ) , G ′( q −1 ) se určí z rovnice q nII − k −1C( q ) = A( q ) F ′( q ) + BII ( q ) G ′( q ) .
(8-77)
Stupeň polynomu G ′( q ) zůstane n − 1 , avšak stupeň polynomu F ′( q ) se zvýší z k − 1 na nII + k − 1 , a proto je třeba také zvýšit exponent mocniny se základem q na levé straně rovnice. Shodným postupem, který byl již popsán, lze odvodit přenos regulátoru
ut =
− G ′( q ) q k
BI ( q ) F ′( q )
yt =
− G ′ ( q −1 )
BI ( q −1 ) F ′( q −1 )
yt ,
kterému odpovídá rozptyl regulační odchylky
112
(8-78)
{
E ( w − yt + k )
2
} = σ (1 + f 2 e
2 1
)
+...+ f k2−1 + f k′ 2 +...+ f n′II2+ k −1 =
(
(8-79)
)
= σ e2 (1 + f 12 +...+ f k2−1 ) + σ 2e f k′ 2 +...+ f n′II2+ k −1 .
Rozptyl je rozdělen na součet dvou sčítanců. Z postupu výpočtu plyne, že první sčítanec odpovídá teoretickému minimu regulační odchylky, která odpovídá nestabilnímu regulačnímu obvodu. Druhý sčítanec zvyšuje rozptyl regulace, avšak regulační obvod je stabilní. Po dosazení rozkladu (8-76) do rovnice uzavřeného regulačního obvodu (8-73) se pro suboptimální regulátor dostane
[ A ( q ) B ( q ) F ′( q ) + B ( q ) G ′( q ) ] y o
o
I
t
= BI ( q ) F ′( q ) C o ( q ) et .
(8-80)
Charakteristická rovnice uzavřeného obvodu se suboptimálním regulátorem je q nII + k −1 BIo ( q ) C o ( q ) = 0 .
(8-81)
Protože tato charakteristická rovnice obsahuje jen část polynomu B( q ) , a to BI ( q ) s kořeny uvnitř jednotkové kružnice, je uzavřený obvod stabilní. Odvozený vzorec pro suboptimální řízení předpokládá nulovou žádano hodnotu. Pro nenulovou žádanou hodnotu je třeba jeho tvar upravit. Přenos uzavřeného obvodu na obr. 58 od rozdílového členu k výstupu regulované soustavy je z−k B z − k BII BII ( z −1 ) BII BI F ′ A F A ′ ( ) G0 y z = . = = = z −k B z − k BII AF ′ + z − k BII G C( z −1 ) 1 + G′ 1 + G′ BI F ′ A F′ A
(8-82)
Obr. 58. Blokové schéma suboptimálního obvodu pro nulovou žádanou hodnotu Aby přenos žádané hodnoty v ustáleném stavu byl jednotkový, je třeba žádanou hodnotu násobit faktorem Gwy ( z ) = G0 y ( z )
C(1) . BII (1)
(8-83)
Vzorec pro výpočet akční veličiny suboptimálního regulátoru s nenulovou žádanou hodnotou je následující ut
( w C(1) =
)
BII (1) − G ′( q ) q k yt
BI ( q ) F ′ ( q )
=
w C(1) BII (1) − G ′( q −1 ) yt B I ( q −1 ) F ′ ( q − 1 )
113
.
(8-84)
Suboptimální řízení fázově neminimálních regulovaných soustav lze použít také tehdy, jestliže kořeny polynomu B( q ) sice leží ve stabilní oblasti komplexní roviny, tj. uvnitř jednotkové kružnice, ale v těsné blízkosti této kružnice a případné malé změny polohy těchto kořenů mohou způsobit nestabilitu uzavřeného obvodu. Postup návrhu suboptimálního regulátoru bude demonstrován na příkladu. Příklad:
Nechť je regulovaná soustava popsána diferenční rovnicí yt + a o yt −1 = ut −1 + b o ut − 2 + et + c o et −1 ,
(8-85)
kde a o = −0.7, b o = 0.99, c o = 0.95 . Velmi těsně jednotkové kružnici je umístěn kořen
polynomu B( q ) , což může způsobit problémy při řízení jak již bylo uvedeno. Pro
soustavu
tedy
platí
A o ( q −1 ) = 1 + a o q − 1 ,
k = 1,
B o ( q −1 ) = 1 + b o q − 1
a
C o ( q −1 ) = 1 + c o q −1 , kde c o < 1 a chybou modelu s rozptylem σ 2e . Polynom F ( q −1 ) je stupně
k − 1 = 1 − 1 = 0 , tj. F ( q −1 ) = 1 , a polynom G( q −1 ) je stupně n − 1 = 1 − 1 = 0 , tj. G( q −1 ) = g . Tyto polynomy splňují podmínku C o ( q −1 ) = Ao ( q −1 ) F ( q −1 ) + q −1G( q −1 )
(8-86)
tj. 1 + c o q −1 = (1 + a o q −1 ) *1 + q −1 g ,
(8-87)
1 + c o q −1 = 1 + ( a o + g ) q −1 ,
a proto q −1: g = c o − a o . Statisticky optimální řízení je dána přenosem ut =
1 (1 + co ) w − ( co − a o ) yt , 1 + b o q −1
(
)
(8-88)
který je pro konkrétní hodnoty parametrů dán vztahem ut =
1 . w − 165 . yt ) , (195 1 + 0.99q −1
(8-89)
ut = −0.99ut −1 + 195 . w − 165 . yt .
(8-90)
Podle této rovnice se ve výpočtu akční veličiny uplatňuje minulá hodnota této veličiny, která je násobena součinitelem -0.99, což je příčinou jejího kolísání. Vliv velikosti tohoto součinitele na rozptyl regulované veličiny bude popsán v jiném příkladě. Nyní bude pouze
{
uvedeno, že teoreticky minimální rozptyl regulované veličiny je E ( w − yt +1 )
2
}=σ
2 e
.
Suboptimální řízení se odvodí stejným postupem jako optimální řízení s tím, že polynom F ′( q ) zvětší svůj stupeň o počet kořenů polynomu B o ( q −1 ) , který je třeba rozkladem oddělit, −1
tj. o jednotku. Stupeň polynomu F ′( q −1 ) je nII + k − 1 = 1 + 1 − 1 = 1. Hledaný polynom bude F ′( q −1 ) = 1 + f ′q −1 . Polynom G ′( q −1 ) zůstane stupně n − 1 = 1 − 1 = 0 , tj. G ′( q −1 ) = g ′ . Tyto polynomy splňují podmínku C o ( q −1 ) = Ao ( q −1 ) F ′( q −1 ) + q −1 BII ( q −1 ) G ′( q −1 )
114
(8-91)
tj.
1 + c o q −1 = (1 + a o q −1 )(1 + f ′ q −1 ) + q −1 (1 + b o q −1 ) g ′ ,
(8-92)
1 + c o q −1 = 1 + ( a o + f ′ + g ′ ) q − 1 + ( a o f ′ + b o g ′ ) q − 2 ,
(8-93)
a proto f ′ = b o ( c o − a o ) (b o − a o ) a g ′ = − a o ( c o − a o ) (b o − a o ) . Suboptimální regulace je dána přenosem ut =
1 (1 + co ) (1 + b o ) w − g ′ yt , 1 + f ′ q −1
(
)
(8-94)
který je pro konkrétní hodnoty parametrů dán vztahem ut =
1 (0.980 w − 0.684 yt ) , 1 + 0.966q −1
(8-95)
ut = −0.966ut −1 + 0.980w − 0.684 yt .
(8-96)
Ve vzorci pro výpočet akčního zásahu se zmenšilo zesílení regulované veličiny a nepatrně také poklesl násobek minulé velikosti akční veličiny. Rozptyl regulované veličiny při
{
suboptimální regulaci je E ( w − yt +1 )
2
. σ , tj. přibližně dvakrát větší než } = σ (1 + f ′ ) = 193 2 e
2
2 e
při teoreticky optimální regulaci. U suboptimálního regulátoru je odstraněna nestabilita strukturálně optimálního regulátoru z titulu možné odchylky skutečných hodnot parametrů modelu, blízkých mezi stability, od jejich hodnot, které jsou použity k návrhu regulátoru, . Porovnání účinku obou regulátorů, tj. statisticky optimálního a suboptimálního, bude provedeno simulací v prostředí SIMULINKu. Blokové schéma zapojení diskrétního regulačního obvodu se statisticky optimálním regulátorem je na obr. 59. Soustava (Plant) má kořen čitatele blízký jedné, což je nebezpečné pro vznik nestabilit jak je ukázáno na příkladu. Regulátor zde tvoří bloky Gain, Gain1 a Filter2. Jejich parametry jsou ve schématu navoleny pro statisticky optimální regulátor. Suboptimální regulátor má jiné parametry těchto bloků. Vzorkovací perioda je rovna jedné. U bloku Filter2 byl nastaven offset rovný 0.001 z důvodu ovládání pořadí výpočtů jednotlivých bloků.
Obr. 59. Blokové schéma regulačního obvodu se statisticky optimálním regulátorem
115
Poruchu tvoří náhodný proces typu klouzavý průměr (MA). Porucha je modelována průchodem bílého šumu blokem Filter1. V obou simulačních výpočtech má porucha shodný časový průběh, který je znázorněn v obr. 60.
Obr. 60. Časový průběh náhodné poruchy Časový průběh regulované veličiny při statisticky optimální a suboptimální regulaci je znázorněn na obr. 61. V obou grafech je vložena žádaná hodnota o velikosti jedna. Je zřejmé, že přechodový děj na začátku regulace není téměř postřehnutelný. Regulovaná veličina se náhodně mění kolem žádané hodnoty, přičemž rychlost změn u suboptimální regulace je menší oproti statisticky optimální regulaci. Směrodatná odchylka vzroste jen o 40 %, tj. z hodnoty jedna u statisticky optimální regulace na 1.39 u suboptimální regulace. Zhoršení účinku regulace není významné.
Obr. 61. Časový průběh regulované veličiny při statisticky optimální a suboptimální regulaci Časový průběh akční veličiny u obou srovnávaných typů regulátoru ke znázorněn na obr. 62. Z měřítek obou grafů plyne, že rozkmit průběhu akční veličiny při statisticky optimální 116
regulaci je více než 10-krát větší než rozkmit při suboptimální regulaci. Z praktického hlediska bude pravděpodobně upřednostněna regulace suboptimální.
Obr. 62. Časový průběh akční veličiny u statisticky optimální a suboptimální regulace
117
9. Parametricky optimální řízení V mnoha praktických úlohách regulace vystačí klasický PID regulátor, který je složen z proporcionální, integrační a derivační složky. Derivační složka je v případě přítomnosti šumů při měření regulované veličiny často z regulace vyloučena. Teorie a praxe řízení nabízí k seřízení PID regulátorů mnoho postupů. Tato kapitola tyto metody nehodnotí, ani vzájemně neporovnává. Popisuje jen nástroje k analýze účinku regulace za přítomnosti náhodných poruch nebo chyb měření regulované veličiny, a to vliv proporcionálního zesílení regulátoru a velikosti časových konstant integrační a derivační složky na rozptyl regulované veličiny. To znamená, že popisuje postupy výpočtu kvadratického kriteria řízení. Jestliže je zvládnut postup výpočtu kvadratického kriteria, pak lze analyzovat vliv parametrů regulátoru na velikost kvadratického kriteria nebo dokonce vypočítat parametricky optimální seřízení. Toto parametricky optimální seřízení se liší od strukturálně optimálního seřízení. Při parametrické optimalizaci regulátoru je jeho struktura předem zvolena, naproti tomu u strukturální optimalizace regulátoru je jeho struktura a velikost parametrů předmětem výpočtu. Pro parametrickou optimalizaci je třeba znát vlastnosti poruchové veličiny. V případě, že vlastnosti konkrétní poruchy nejsou známy, je vhodné zvolit typovou náhodnou poruchu stejně jako se volí při analýze odezvy regulačního obvodu pro žádanou hodnotu nebo poruchu skok polohy nebo rychlosti (nebo výjimečně zrychlení). Vhodným typovým náhodným procesem je proces s exponenciální autokorelační funkcí. Pro optimalizaci je předpokládáno, že uzavřený regulační obvod je lineární dynamická soustava se vstupem x( t ) , kterým je náhodný proces, a výstupem y( t ) , jehož rozptyl je třeba vypočítat. Základní vzorce pro spektrum náhodné veličiny po průchodu dynamickou soustavou byly již popsány. Ze spektra výstupní veličiny je třeba vypočítat jen rozptyl. Vzorce pro soustavy s diskrétním a spojitým časem jsou následující σ 2y =
dz 1 Gxy ( z ) Gxy ( z −1 ) S xx ( z ) , ∫ z 2 π j c1
(9-1)
+∞
1 σ = ∫ Gxy ( jω ) Gxy ( − jω) S xx ( ω) dω . 2 π −∞ 2 y
(9-2)
Oba vzorce mají společné vlastnosti. Oba přenosy, Gxy ( jω ) , Gxy ( z ) , a obě výkonové
spektrální hustoty, S xx ( ω ) , S xx ( z ) , jsou pro dříve popsané modely náhodných procesů typu AR, MA a ARMA racionální funkce komplexní proměnné, tj. jejich součin, představující integrovanou funkci, je podíl dvou polynomů, tj. racionální funkce. V příloze je popsán postup výpočtu integrálu těchto funkcí užitím tzv. residuové věty, pro kterou je třeba znát singulární body integrované funkce, tj. póly racionální funkce. Polynom stupně n může být zapsán budˇve známém tvaru P( s) = p0 s n + p1sn −1 +...+ pn ,
(9-3)
kde pi , i = 0, 1,..., n jsou parametry, nebo v rozkladu na kořenové součinitele
P( s) = p0 ( s − s1 ) ( s − s2 ) ... ( s − sn ) , n1 + n2 +...+ nr = n , n1
n2
nr
kde si , i = 0,1,..., n jsou kořeny polynomu s násobnostmi ni , i = 0,1,..., r .
119
(9-4)
Integrovanou komplexní funkci lze pro spojité a diskrétní obvody faktorizovat, tj. rozložit na součin dvou funkcí, z nichž jedna je regulární uvnitř stabilní oblasti komplexní roviny a druhá vně této oblasti. Přenosové funkce jsou obvykle dány podílem dvou polynomů, jejichž kořeny jsou obvykle neznámé. Výkonová spektrální hustota může být rovněž dána ve stejném tvaru jako přenosová funkce. Jestliže je třeba typ výkonové spektrální hustoty pro analýzu zvolit, pak je výhodný tvar s rozkladem na kořenové činitele. V této kapitole jsou tabelovány vzorce, pomocí kterých je možné tyto integrály vypočítat analyticky a numericky.
9.1 Diskrétní regulační obvody Nechť racionální integrovanou funkci F ( z ) v křivkovém integrálu po jednotkové kružnici c1 se středem v počátku komplexní roviny I=
1 dz F ( z ) F ( z −1 ) ∫ 2 π j c1 z
(9-5)
lze rozložit následujícím způsobem B( z ) C ( z ) A( z ) D( z ) ,
(9-6)
A( z ) = a0 z l + a1z l −1 +...+ al ,
(9-7)
B( z ) = b0 z l + b1z l −1 +...+bl ,
(9-8)
F ( z) = kde
C( z ) = ( z − c1 )
(z − c ) ...( z − c ) D( z ) = ( z − d ) ( z − d ) ... ( z − d ) m1
m2
2
n1
n2
1
mr
, m1 + m2 +...+ mr = m ,
ns
, n1 + n2 +...+ ns = n, n ≥ m .
mr
2
ns
(9-9)
(9-10)
V integrované funkci (9-6) jsou u polynomů v čitateli a ve jmenovateli známy jen některé kořeny, a proto byl zvolen zápis ve tvaru rozkladu části polynomu čitatele a jmenovatele na kořenové činitele. Funkce F ( z −1 ) vznikne formálním dosazením z −1 na místo z ve všech uvedených výrazech, tj. v (9-7) až (9-10) A( z −1 ) = a0 z − l + a1z − l +1 +...+ al ,
(9-11)
B( z −1 ) = b0 z − l + b1z − l +1 +...+bl ,
(9-12)
C( z −1 ) = ( z −1 − c1 )
(z D( z ) = ( z − c ) ( z −1
−1
1
m1
−1
− c2 ) ... ( z −1 − cmr ) ,
(9-13)
n1
−1
− c2 ) ... ( z −1 − cns ) .
(9-14)
m2
mr
n2
ns
Po vytknutí mocnin z − l z obou polynomů v podílu B( z −1 ) A( z −1 ) a jejich vzájemného vykrácení je výsledkem podíl dvou reciprokých polynomů B * ( z ) A* ( z ) , kde A* ( z ) = a0 + a1z +...+ al z l ,
(9-15)
B * ( z) = b0 + b1z +...+bl z l .
(9-16)
120
Z polynomu C( z −1 ) lze vytknout mocninu z − m a z polynomu D( z −1 ) mocninu z − n . Podíl polynomů C( z −1 ) D( z −1 ) dostane po vykrácení mocnin z − m a z − n tvar podílu dvou reciprokých polynomů, které jsou vynásobeny mocninou z o velikosti t = n − m , platí C ( z −1 ) C * ( z ) t = * z , D( z −1 ) D ( z )
(9-17)
kde reciproké polynomy C * ( z ) , D* ( z ) mají tvar C * ( z ) = (1 − c1z )
(1 − c z) ...(1 − c z) D ( z ) = (1 − d z) (1 − d z ) ... (1 − d z ) m1
m2
2
n1
*
1
mr
,
(9-18)
ns
.
(9-19)
mr
n2
2
ns
9.1.1 Analytický výpočet integrálu
V této podkapitole je popsáno odvození tabelovaných vzorců. Postup výpočtu je podle práce autora tohoto učebního textu, publikované v [36], který je zobecněním postupu z knihy [34] pro C( z ) = D( z ) = 1 . Ve shodě s citovanou literaturou je definováno následující doplňující značení pro část integrované funkce s póly mimo jednotkovou kružnici β( z ) =
B ( z ) B ( z −1 ) , A( z −1 )
δ( z ) =
C ( z ) C ( z −1 ) . D( z −1 )
(9-20)
Pro výpočet integrálu je vhodné definovat obecnější integrál ve srovnání s I podle (9-5), a to ve tvaru Ik =
z k β( z ) δ( z ) dz 1 , 2 π j c∫1 A( z ) D( z ) z
(9-21)
přičemž I = I 0 . Poslední integrál (9-21) je upraven do tvaru, ve kterém je v integrované funkci oddělena část s kořeny uvnitř jednotkové kružnice, tj. polynomy A( z ) , D( z ) a samotné z, a část vně jednotkové kružnice. Převrácená hodnota komplexního čísla, tj. z −1 , odpovídá geometricky kruhové inverzi a zrcadlení kolem reálné osy, a proto jestliže polynomy A( z ) , D( z ) mají kořeny uvnitř jednotkové kružnice, pak reciproké polynomy A* ( z ) , D* ( z ) mají kořeny vně jednotkové kružnice. K výpočtu integrálu I k lze tedy použít v příloze popsaný postup s využitím residuové věty. Pro polynom D( z ) je to snadné vzhledem ke znalosti jeho kořenů, ovšem pro polynom A( z) je třeba postupovat jinak. Základní trik pro obejití neznalosti kořenů polynomu A( z) spočívá v sestavení soustavy následujících lineárních rovnic o počtu l + 1 l
∑a I k =0
k l − k −h
l 1 (a0 z +..+ al )β( z ) δ( z ) dz 1 β( z ) δ( z ) dz = = , h = 0,1,..., l , h z A( z ) D( z ) z 2 π j c∫1 z h D( z ) z 2 π j c∫1
(9-22)
s neznámými integrály I l , I l −1 ,..., I1 , I 0 , I −1 ,..., I − l +1 , I − l o počtu 2l + 1 , kde l je stupeň polynomu A( z ) . Protože platí I − k = I k , je počet neznámých jen l + 1. Z této soustavy však stačí vypočítat jen jednu neznámou, a to I 0 . Rovnost integrálů I k s opačným indexem lze
121
dokázat pomocí parametrického vyjádření integrační dráhy z = exp( jω ) pro 0 ≤ ω ≤ 2 π a vhodnou substitucí parametru ω = 2 π − Ω . Zájemce se může s podrobným postupem seznámit v knize [34]. V tomto odstavci lze jen připomenout, že integrály na pravé straně rovnic jsou z integrovaných funkcí se známými póly, a proto lze k jejich výpočtu použít již zmíněnou residuovou větu. Funkce v integrálech na pravé straně soustavy rovnic (9-22) mají pól v počátku komplexní roviny, tj. z = 0 , s násobnosti rovnou jedné. Residuum v tomto bodě lze spočítat podle vzorce z přílohy pojednávající o residuové větě. Platí γ *h =
dh 1 lim h h! z→0 d z
d h ⎡ β( z ) δ( z ) ⎤ 1 ⎡ β( z ) δ( z ) h +1 ⎤ ( ) z − = lim 0 ⎢ z h +1 D( z ) ⎥ h! z→0 d z h ⎢ D( z ) ⎥ . ⎣ ⎦ ⎣ ⎦
(9-23)
Další póly náleží polynomu D( z) , a to z = di , i = 1, 2,..., s s násobnostmi n1 , n2 ,..., ns . Součet residuí příslušných k těmto pólům je následující d ni −1 ⎡ β( z ) δ( z ) ni ⎤ lim ni −1 ⎢ h +1 εh = ∑ z − di ) ⎥. ( z → di d z ⎣ z D( z ) ⎦ i =1 (ni − 1)!
1
s
(9-24)
Soustava lineárních rovnic (9-22) po záměně indexů l − k → k a po dosazení zatím nedopočítaných výrazů na pravé straně nabude tvar l
∑a k =0
I
l − k k −h
= γ *h + ε h , h = 0,1,..., l .
(9-25)
Při výpočtu velikosti γ *h lze postupovat následujícím způsobem. Podle známého Leibnitzova vzorce pro výpočet derivace vyššího řádu součinu dvou funkcí, tj.
(u v )
(k )
= u ( 0) v ( k ) + u (1) v ( k −1) +...+ u( k )v ( 0) ,
s derivacemi o řádu označeném v závorce exponentu, platí (h− k )
1 ⎡ δ( z ) ⎤ β( k ) ( 0) γ =∑ . k ! ( h − k ) ! ⎢⎣ D( z ) ⎥⎦ z = 0 k =0 h
* h
(9-26)
Pro reciproké polynomy C * ( z ) = z mC( z −1 ) a D* ( z ) = z n D( z −1 ) a ve vztahu (9-17) použitou substituci t = n − m platí δ( z ) C( z ) C * ( z ) t = z = R( z ) z t , * ( ) ( ) ( ) Dz Dz D z
(9-27)
kde R( z ) je racionální funkce. Derivace k - tého řádu funkce R( z ) z t v bodě z = 0 je ⎛ k⎞ i =0 ⎝ i ⎠ k
[ R( z) z t ] z =0 = ∑ ⎜ ⎟ [ z t ] z =0 R ( k −i ) ( 0) . (k )
(i )
(9-28)
Protože pro t = i je [ z t ] z = 0 = t ! a pro t ≠ i je [ z t ] z = 0 = 0 , lze předchozí derivaci vyjádřit ve (i )
(i )
tvaru
[ R( z ) z ]
t (k ) z=0
⎧ R ( k − t ) ( 0) ⎪k ! , k ≥ t, = ⎨ ( k − t )! ⎪⎩0, k < t.
(9-29)
122
Pro tabelování vzorců je vhodné použít následující označení ve shodě s knihou [34], kde je předpokládáno C( z ) = D( z ) = 1 , tj. bez znalosti pólů integrované funkce β ( k ) ( 0) γk = . k!
(9-30)
Pro část pravé strany zmíněné soustavy lineárních rovnic (9-22) platí ⎧h R ( k − t ) ( 0) ⎪ γk , h ≥ t, γ *k = ⎨∑ ( k − t )! k =t ⎪⎩0, h < t.
(9-31)
Výrazy γ *k jsou zobecněním γ k a jsou použitelné pro případ, kdy C( z ) ≠ 1 nebo D( z ) ≠ 1. Souvislost obou výrazů ukazují přehledně vztahy γ *0 = γ 1* =... = γ *t −1 , γ *t = γ 0 R( 0) , γ *t +1 = γ 1 R( 0) + γ 0
R (1) ( 0) , 1!
(9-32)
.......... γ = γ l −1 R( 0) + γ l − t −1 * l
R (1) ( 0) R ( l − t ) ( 0) +...+ γ 0 . (l − t )! 1!
Závěrem odvození lze uvést, že neznámý integrál I 0 v soustavě lineárních rovnic je podle Cramerova pravidla dána vztahem
I0 =
∆1 , ∆
(9-33)
kde determinant ∆ ve jmenovateli má tvar
al a l −1 al − 2 ∆= . . a0
al −1 a l + al − 2 al −1 + al − 3 .
al − 2 al − 3 al + al − 4 .
. a1
. a2
....... ....... .......
a1 a0 0 .
a0 0 0 .
.
. al
....... al −1
(9-34)
a determinant ∆ 1 v čitateli vznikne z determinantu ve jmenovateli náhradou prvního sloupce pravými stranami soustavy rovnic (9-25). Pro usnadnění výpočtu kvadratického kriteria řízení jsou pro stupně polynomu A( z ) , l = 1, 2, 3 v Tab. 4 vypočteny výsledné vzorce. V této tabulce je z důvodu úspory místa nahrazen podíl determinantů jejich násobením, přičemž druhý činitel má mocninu -1.
123
Tab. 4 Analytický výpočet kvadratického kriteria l = 1:
b02 + b12 )a0 − b0b1a1 ( b0b1 γ0 = ; γ1 = ; a0 a02 I1 =
γ0
a0 a1
a0
γ1
a1 a0
a1
−1
=
γ 0a1 − γ 1a0 . a12 − a02
l = 2:
b0b2 b0b1 + b1b2 a1b0b2 b02 + b12 + b22 a2b0b2 + a1 (b0b1 + b1b2 ) a12b0b2 γ0 = ; γ1 = − 2 ; γ2 = − + ; a0 a0 a0 a0 a02 a03
γ0 I1 = γ 1 γ2
a1 a2 + a 0
a0 a2 0 a1
a1 a2 + a 0
a0 0
a1
a2 a0
a1
a2
−1
=
(a + a )(a γ − a γ ) + a γ (a − a ) . (a − a )(a − a + a )(a + a + a ) 2
0
2
2
0
0
2
0
1
2
1 1
0
2
0
2
1
0
l = 3: bb b b +bb a b b γ 0 = 0 3 ; γ 1 = 0 2 1 3 − 1 02 3 ; a0 a0 a0 1 1 a12 γ 2 = (b0b1 + b1b2 + b2b3 ) − 2 (a2b0b3 + a1b0b2 + a1b1b3 ) + 3 b0b3 ; a0 a0 a0 1 1 γ 3 = (b02 + b12 + b22 + b32 ) − 2 a3b0b3 + a2b0b2 + a2b1b3 + a1 (b0b1 + b1b2 + b2b3 ) + a0 a0
[
+
I1 =
]
a1 a13 2 a b b + a b b + a b b − bb; ( ) 2 0 3 1 0 2 1 1 3 a03 a04 0 3 γ0
a2
a1
a0 a3
a2
a1
a0
γ1
a3 + a1
a0
0 a2
a3 + a1
a0
0
γ2
a2 + a0
a3
0 a1
a2 + a0
a3
0
γ3
a1
a2
a3 a0
a1
a2
a3
−1
.
Shrnutí: 1. Nejprve je třeba spočítat přenosovou funkci a zvolit typ náhodné poruchy reprezentované výkonovou spektrální hustotou. 2. Pak je třeba rozdělit integrovanou funkci na část se známými kořeny jmenovatele a čitatele a část obsahující jen polynomy. Pro výkonovou spektrální hustotu náhodné veličiny jinou než bílý šum, která vznikne průchodem bílého šumu lineární dynamickou soustavou, je část s proměnnou z rozlišitelná od části s proměnnou z −1 jako u přenosu soustavy. 3. Podle stupně polynomu s neznámými kořeny je třeba vybrat vzorce z Tab. 4 a vypočítat hodnoty γ i , i = 0,1,... jako by část integrované funkce se známými kořeny polynomu čitatele a jmenovatele v integrálu nebyla, tj. do vzorců se dosazují jen parametry polynomů A( z ) , B( z ) .
124
4. Pro výpočet γ *i , i = 0, 1,... podle (9-32) je třeba vytvořit funkci R( z ) a určit velikost t podle vzorce (9-27). Pro funkci R( z ) a její derivace bude třeba určit funkční hodnoty pro z = 0 . 5. Podle vzorce (9-24) je třeba vypočítat rezidua známých kořenů jmenovatele integrované funkce. 6. Posledním krokem výpočtu je dosazení a výpočet integrálu podle vzorce (9-33). Pro l = 1, 2 jsou v Tab. 4 uvedeny přímo vzorce, pro l = 3 je třeba determinanty v čitateli a ve jmenovateli vypočítat. Příklad demonstrující postup výpočtu podle jednotlivých bodů shrnutí:
Ad 1) Regulovaná soustava je tvořena zásobníkem, tj. integrační soustavou, a proporcionálně sumačním PS regulátorem (diskrétní verze PI regulátoru), který řídí vstupní tok do zásobníku. Výtok ze zásobníku je náhodná veličina. Diskrétní čas je t = 0, 1, 2,.. . Zaplnění zásobníku v okamžiku měření, tj. v čase t, je dáno vztahem yt = yt −1 + ht − 2 − vt −1 , kde y je regulovaná veličina, h je akční veličina, která působí se dvěma kroky dopravního zpoždění, a v je náhodná porucha. Výstup PS regulátoru je vypočten okamžitě po změření skutečné hodnoty regulované veličiny. Protože doba výpočtu a nastavení akčního členu vyžaduje čas, který je oproti periodě t ⎞ ⎛ vzorkování zanedbatelný, platí ut = K ⎜ et + r ∑ ei ⎟ , kde et = w − yt je regulační odchylka, K je ⎝ ⎠ i =0 proporcionální zesílení a r je vlivnost sumačního členu. Přenos regulované soustavy a regulátoru v Z-transformaci je dán vztahem z −2 1 GS ( z ) = , −1 = z( z − 1) 1− z
z ⎞ ⎛ GR ( z ) = K 1 + r (1 + z −1 + z − 2 +...) = K ⎜ 1 + r ⎟. ⎝ z − 1⎠
(
)
Blokové schéma regulačního obvodu s bloky, které popisují přenos regulátoru a regulované soustavy, je na
Obr. 63. Regulační obvod s integrační soustavou a PS regulátorem Přenos poruchy na výstup regulované soustavy je dán vztahem GS ( z ) z2 − z Gvy ( z ) = = . 1 + GR ( z ) GS ( z ) z 3 − 2 z 2 + z( K + Kr + 1) − 1
Pro posouzení volby parametrů regulátoru, tj. jeho proporcionálního zesílení a vlivnosti sumační složky, je třeba vyšetřit vliv náhodné poruchy na rozptyl regulované veličiny. K analýze bude zvolena typová náhodná porucha s exponenciální autokorelační funkci. Výkonová spektrální hustota této poruchy je dána vztahem
125
1− E 2 Svv ( z ) = σ , ( z − E )( z −1 − E ) 2 v
(9-35)
kde E < 1 je parametr náhodné poruchy, související se šířkou jeho frekvenčního spektra, a σ 2v je rozptyl poruchy. Rozptyl regulované veličiny se vypočte podle následujícího vzorce, ve kterém jsou na rozdíl od (9-1) upraveny jen indexy, tj. σ 2y =
dz 1 Gvy ( z ) Gvy ( z −1 ) Svv ( z ) . ∫ z 2 π j c1
(9-36)
Tento integrál lze vypočítat podle popsaného způsobu s využitím vzorců z Tab. 4. Ad 2) Nejprve je třeba stanovit souvislost konkrétních hodnot přenosové funkce a výkonové spektrální hustoty s dříve definovanými polynomy a pomocnými funkcemi. Platí A( z ) = z 3 − 2 z 2 + ( K + Kr + 1) z − K ,
B( z ) = z 2 − z ,
(9-37)
tj. l = 3, a0 = 1, a1 = −2, a2 = K + Kr + 1, a3 = − K , b0 = 0, b1 = 1, b2 = −1, b3 = 0 , D( z ) = z − E ,
C( z ) = σ v 1 − E 2 ,
(9-38)
tj. m = 0, n = 1 a proto t = n − m = 1 − 0 = 1 a B( z ) B( z −1 ) z 2 − z )( z −2 − z −1 ) ( − z 2 ( z − 1) β( z ) = = −3 = , z − 2 z − 2 + ( K + Kr + 1) z −1 − K 1 − 2 z + ( K + Kr + 1) z 2 − Kz 3 A( z −1 ) 2
(
)(
)
σv 1 − E 2 σv 1 − E 2 C( z ) C( z −1 ) σ 2v (1 − E 2 ) δ( z ) = = = −1 , z −1 − E z −E D( z −1 )
σ 2v (1 − E 2 ) δ ( z ) −1 R( z ) = z = , D( z ) ( z − E )(1 − z E )
(9-39)
Ad 3) Podle vzorců v Tab. 4 pro l = 3 platí
γ 0 = γ 1 = γ 3 = 0, γ 2 = −1 .
(9-40)
tj. tři ze čtyř hodnot jsou nulové. Ad 4) Pro výpočet γ *i , i = 0, 1,..., 3 podle (9-32) stačí určit jen následující hodnotu funkce
R( 0) = − σ 2v (1 − E 2 ) E . Podle vzorců (9-32) platí γ *0 = γ 1* = γ *2 = 0, γ *3 = σ v2 (1 − E 2 ) E .
(9-41)
Ad 5) Polynom D( z ) má jen jeden kořen z = E s násobnosti jedna. Proto podle vzorce (9-24) je třeba vypočítat jen
126
β( z ) δ( z ) β( E ) δ( E ) σ 2v E 2 (1 − E ) 1 (z − E) = =− h ε h = lim h +1 . z→ E z E h +1 E (1 − 2 E + E 2 ( K + Kr + 1) − KE 3 ) D( z ) 2
(9-42)
Ad 6) Po dosazení do vzorce (9-33) lze dostat σ 2y =
[
]
1 ε ∆ − ε ∆ + ε ∆ − (ε 3 + γ *3 )∆ 41 σ 2v , ∆ 0 11 1 21 2 31
(9-43)
kde ∆ = K 2 r (1 − K − r ) ( K ( r + 2 ) + 4 ) ,
(9-44)
∆ 11 = − K ( K 2 + K (1 − r ) − 2) , ∆ 21 = K ( Kr 2 + K 2 (1 + r ) − 3(1 − r ) ) + 2 , ∆ 31 = −2 Kr ( K + 1) , ∆ 41 = K ( K − r + 1) − 2 .
Po úpravách lze dostat funkční závislost podílu rozptylu regulované veličiny a poruchy na parametrech nastavení PS regulátoru, kterými jsou jeho proporcionální zesílení a vlivnost sumační části, a vlastnosti poruchy, zejména šíře jejího frekvenčního spektra, která souvisí s parametrem E σ 2y σ 2v
=
2(1 − E )[ ( K + 1) + E (1 − K + Kr ) − E 2 K ( K + 1) ]
K (1 − K − r )( K ( r + 2) + 4)(1 − 2 E + E 2 ( K + Kr + 1) − KE 3 )
.
(9-45)
Poslední vztah má podobu přenosu rozptylu poruchy na rozptyl regulované veličiny. Je vhodné si všimnout jmenovatele tohoto přenosu, který je součinem několika členů. Z tohoto součinu lze zjistit, pro které parametry regulačního obvodu je přenos rozptylu nekonečný, tj. soustava je nestabilní. Je zřejmé, že tuto vlastnost má přenos pro K = 0 , tj. rozpojený regulační obvod. Stejnou vlastnost má kombinace parametrů K a r splňujících rovnici 1 − K − r = 0 , tj. pro vlivnost integrální části regulátoru r = 1 − K . Z rovnice K ( r + 2) + 4 = 0 plyne K = − 4 ( r + 2) . Pro nezápornou vlivnost sumační části regulátoru r ≥ 0 je přípustná hodnota zesílení regulátoru z intervalu 0 < K < 1 a vlivnost je omezena na 0 ≤ r < 1 − K . Vrstevnicové grafy závislostí přenosu rozptylu poruchy na parametrech regulátoru pro čtyři různé hodnoty parametru E, tj. E = 0, 0.5, 0.9, 0.95 jsou na obr. 64. Vrstevnice grafů jsou znázorněny pro řadu hodnot zmíněného přenosu 2.4, 2.6, 3, 3.5, 4, 5, 7, 10, 20, 30 a 50, přičemž pro E = 0.95 je začátek řady upraven na 1.4, 1.7, 2, 2.5, 3, 3.5, .... Ve všech těchto příkladech je extrém velmi plochý, což znamená, že účinek řízení se nebude se změnou parametrů regulátoru významně měnit. Pro náhodnou poruchu typu bílý šum ( E = 0 ) minimalizuje přenos rozptylu poruchy na rozptyl regulované veličiny jen proporcionální regulátor bez sumační části se zesílením rovným přibližně polovině zesílení maximálního, pro které je regulační obvod stabilní. Toto zesílení se nazývá kritické. Polovina kritického zesílení je rovněž doporučena podle experimentálního postupu seřízení proporcionálního zesílení podle Zieglera-Nicholse. Rozbor tedy ukazuje, za jakých podmínek je u popsaného regulačního obvodu toto doporučení správné v případě, že úkolem regulátoru je minimalizovat vliv náhodných poruch na regulovanou veličinu. Jestliže je hodnota parametru E vyšší než nula, pak pro minimalizaci zmíněného přenosu rozptylu je třeba zesílení zvýšit a po překročení určité meze je vhodné zapojit do řízení také sumační složku
127
regulátoru. V závislosti na parametru výkonové spektrální hustoty dochází ke změně struktury regulátoru. Strukturálně statisticky optimální řízení se vstupem poruchové veličiny před integrační soustavou nelze podle popsaného postupu navrhnout. Protože tento typ soustav lze přesto regulovat, je možné k optimalizaci parametrů regulátoru pro minimalizaci vlivu náhodné poruchy na regulovanou veličinu použít výše popsaný postup.
Obr. 64. Závislost podílu rozptylu regulované veličiny a rozptylu poruchy na parametrech regulátoru a šířce spektra poruchy
128
9.1.2 Numerický výpočet integrálu Výsledkem popsaného analytického postupu výpočtu integrálu, představujícího kvadratické kritérium řízení, je vzorec, ze kterého je možné například určit oblast stability v prostoru parametrů regulátoru případně regulované soustavy, což je také jednou z výhod analytického postupu oproti postupu, který bude popsán v této kapitole. Nevýhodou však je praktická použitelnost jen do třetího řádu přenosu uzavřené soustavy. Pro vyšší řád než tři jsou vzorce velmi složité, a proto nepřehledné. V této podkapitole bude uveden numerický postup výpočtu podle Aströmovy knihy [4], který lze použít pro řád přenosu teoreticky libovolný, prakticky vždy větší než je výše uvedený třetí řád. Výsledek výpočtu není ve formě vzorce, ale numerických hodnot. Do algoritmu výpočtu se dosazují numerické hodnoty, a proto není důležité rozdělení integrované funkce na část příslušející přenosu a část příslušející výkonové spektrální hustotě. Stačí se zabývat jen postupem výpočtu integrálu následujícího typu B( z ) B( z −1 ) dz 1 I= , 2 π j c∫1 A( z ) A( z −1 ) z
(9-46)
který obsahuje následující polynomy A( z ) = a0 z n + a1z n −1 +...+ an ,
(9-47)
B( z ) = z nb0 + b1z n −1 +...+bn .
(9-48)
Oba tyto polynomy lze odvodit vynásobením polynomů v čitateli a jmenovateli přenosu a příslušných částí výkonové spektrální hustoty. Numerický výpočet, který je popsán v této kapitole, je rekurzivní s počtem kroků rovným stupni polynomu A( z ) . Před formulací postupu výpočtu budou definovány pomocné operace a polynomy. Především bude používán reciproký polynom A* ( z ) = z n A( z −1 ) = a0 + a1z +...+ an z n .
(9-49)
Aby se u polynomu a jeho koeficientů zdůraznil stupeň, používá se následující označení Ak ( z ) = a0k z n + a1k z n −1 +...+ a kk ,
(9-50)
Bk ( z ) = z nb0k + b1k z n −1 +...+bkk .
(9-51)
U koeficientů není pravý horní index mocnina, ale označení příslušnosti k polynomu k - tého stupně. Stupeň polynomů lze snižovat podle následujících rekurzivních vztahů Ak −1 ( z ) = z −1 ( Ak ( z ) − α k Ak* ( z ) ) ,
Bk −1 ( z ) = z −1 ( Bk ( z ) − β k Ak* ( z ) ) ,
(9-52)
a to za předpokladu, že koeficient a0k je různý od nuly, tj. platí α k = a kk a0k ,
β k = bkk a0k ,
(9-53)
Bn ( z ) = B( z ) ,
(9-54)
přičemž pro polynomy stupně n platí An ( z ) = A( z ) ,
tj. výchozí polynomy stupně n představují počáteční podmínky rekurzivního výpočtu. Je zřejmé, že koeficienty polynomu se stupněm o jednotku nižší, tj. k − 1 souvisejí s koeficienty polynomu se stupněm k podle rekurzivních vzorců 129
aik −1 = aik − α k a kk−i ,
bik −1 = bik − β k a kk−i , i = 0,1,..., k − 1
(9-55)
bin = bi , i = 0, 1,..., k − 1.
(9-56)
s výchozími hodnotami koeficientů ain = ai ,
Popsaný algoritmus může být použit ke snížení stupně výchozích polynomů A( z ) , B( z ) k nule, jestliže koeficienty a0k , k = n, n − 1, ..., 1 jsou nenulové, tj. je možné vypočítat postupně všechny součinitele α k , β k , k = n, n − 1, ..., 2, 1 . Při odvození rekurzivních vzorců bude potřebné, aby kořeny polynomů se sníženým stupněm zůstaly uvnitř jednotkové kružnice. To znamená, aby příslušely stabilnímu přenosu. Rekurzivní výpočet má mít podobu kriteria stability. Odvození a úplný důkaz příslušných tvrzení, týkajících se stability, přesahuje rámec tohoto učebního textu, který se zaměřuje jen na výpočty. V Aströmově knize [4] jsou dokázány dvě matematické věty. Podle první z nich platí: Nechť a0k > 0 , pak jsou ekvivalentní následující tvrzení: 1. Polynom Ak ( z ) má kořeny uvnitř jednotkové kružnice. 2. Polynom Ak −1 ( z ) má kořeny rovněž uvnitř jednotkové kružnice a koeficient a0k −1 je kladný. Podle této věty operace snižování stupně polynomu ze stupně k na stupeň k − 1 podle vzorců (9-52) až (9-56) zachovává stabilitu polynomu se stupněm k − 1 , zaručuje kladnou hodnotu koeficientu a0k −1 , a tím umožňuje pokračování ve snižování stupně polynomu na k − 2 , atd.. Podle druhé věty platí:
Nechť a0n > 0 , pak jsou ekvivalentní následující tvrzení: 1. Polynom An ( z ) má kořeny uvnitř jednotkové kružnice. 2. Pro koeficienty platí a0k > 0 pro k = 0,1,..., n − 1 . Druhá věta formuluje kriterium stability diskrétních lineárních soustav, podle kterého lze kontrolovat smysluplnost výsledku numerického výpočtu integrálu (9-46) podle dále popsaného rekurzivního algoritmu. Pro dokazování obou vět je výchozí tvrzení, podle kterého pro polynom f ( z ) s reálnými koeficienty a kořeny uvnitř jednotkové kružnice a příslušný reciproký polynom f * ( z ) platí f ( z ) < f * ( z ) ⇔ z < 1,
f ( z ) = f * ( z ) ⇔ z = 1,
f ( z) > f * ( z) ⇔ z > 1 .
Toto tvrzení lze dokázat z velikosti podílu obou polynomů rozložených na kořenové činitele a existence komplexně sdružených kořenů. Místo dalších podrobností o důkazu je možné toto tvrzení použít pro porovnání hodnot stabilního polynomu Ak ( z ) , tj. s kořeny uvnitř jednotkové kružnice, a k němu příslušnému reciprokému polynomu v bodě z = 0 . Platí Ak ( 0) < Ak* ( 0) .
(9-57)
Protože Ak ( 0) = akk a Ak* ( 0) = a0k , z poslední nerovnosti vyplývá vztah pro absolutní hodnotu koeficientu α k = akk a0k < 1 .
(9-58)
130
Z rovnice (9-55) pak vyplývá po následujících úpravách kladná hodnota a0k −1
[
a0k −1 = a0k − α k a kk = a0k − (a kk ) a0k = (a0k ) − (a kk ) 2
2
2
]a
k 0
> 0,
(9-59)
protože bylo předpokládáno a0k > 0 . Jestliže polynom Ak ( z ) je stabilní platí Ak ( z ) ≥ Ak* ( z )
pro z ≥ 1.
(9-60)
Poslední nerovnost kombinovaná s (9-58) umožňuje stanovit podmínku (9-60) ve tvaru ostré nerovnosti Ak ( z ) > α k Ak* ( z ) .
(9-61)
Ze vzorce (9-52) plyne pro absolutní hodnotu polynomu Ak −1 ( z ) z Ak −1 ( z ) = Ak ( z ) − α k Ak* ( z ) ≥ Ak ( z ) − α k Ak* ( z ) > 0
pro z ≥ 1.
(9-62)
Protože absolutní hodnota polynomu Ak −1 ( z ) pro z ≥ 1 je kladná, nemá tento polynom kořeny vně jednotkové kružnice. Tímto je dokázána implikace první uvedené věty, a to že pro stabilní polynom je po snížení jeho stupně výsledný polynom rovněž stabilní a že koeficient a0k −1 je kladný. Pro úplnost je třeba dokázat také opačnou implikaci. Pro zájemce o postup důkazu je k dispozici citovaná kniha [4]. Cílem této kapitoly je odvodit a hlavně popsat rekurzivní výpočet integrálu Ik =
Bk ( z ) Bk ( z −1 ) dz 1 . 2 π j c∫1 Ak ( z ) Ak ( z −1 ) z
(9-63)
Prvním krokem bude odvození vztahu tohoto integrálu I k s integrálem Bk −1 ( z ) Bk −1 ( z −1 ) dz 1 , I k −1 = 2π j c∫1 Ak −1 ( z ) Ak −1 ( z −1 ) z
(9-64)
který obsahuje polynomy o stupeň nižší. Integrovaná racionální funkce má uvnitř jednotkové kružnice póly, které jsou kořeny zi polynomu Ak −1 ( z ) , a dále pól z = 0 . Póly reciprokého
polynomu Ak*−1 ( z ) k polynomu Ak −1 ( z −1 ) leží vně jednotkové kružnice, a proto se jejich residua nepodílejí na hodnotě integrálu (9-64). Pro kořeny zi je hodnota polynomu Ak −1 ( zi ) = 0 , a proto podle (9-52) platí Ak ( zi ) = α k Ak* ( zi ) = α k zik Ak ( zi−1 ) .
(9-65)
Při výpočtu residuí v pólech integrované funkce uvnitř jednotkové kružnice je třeba znát velikost polynomu Ak −1 ( z −1 ) v kořenu zi , který přísluší polynomu Ak −1 ( z ) . Z poslední rovnice a vztahů (9-49) a (9-52) plyne
( = z ( A (z ) − α z
) (
)
Ak −1 ( zi−1 ) = zi Ak ( zi−1 ) − α k Ak* ( zi−1 ) = zi Ak ( zi−1 ) − α k zi− k Ak* ( zi ) = i
k
−1 i
−k k i
)
α k zik Ak ( zi−1 ) = (1 − α 2k )zi Ak ( zi−1 ) .
Jelikož ze vztahů (9-49) a (9-52) lze rovněž odvodit
131
(9-66)
Ak*−1 ( z ) = Ak* ( z ) − α k Ak ( z ) ,
(9-67)
pro hodnotu polynomu Ak −1 ( z ) v dalším pólu z = 0 integrované funkce platí Ak*−1 ( 0) = Ak* ( 0) − α k Ak ( 0) = a0k − α k akk = a0k (1 − α 2k ) .
(9-68)
Podle předchozích výpočtů plyne, že integrovaná funkce z (9-64) Bk −1 ( z ) Bk −1 ( z −1 ) 1 Bk −1 ( z ) Bk*−1 ( z ) 1 = * Ak −1 ( z ) Ak −1 ( z −1 ) z Ak −1 ( z ) Ak −1 ( z ) z
(9-69)
a následující funkce, ve které je dosazen výsledek výpočtu (9-66), Bk −1 ( z ) Bk −1 ( z −1 )
[
Ak −1 ( z ) z(1 − α 2k ) Ak ( z −1 )
]
Bk −1 ( z ) Bk*−1 ( z ) 1 1 = z Ak −1 ( z ) (1 − α 2k ) Ak* ( z ) z
[
]
(9-70)
mají póly ve shodných bodech uvnitř jednotkové kružnice, tj. z = zi , z = 0 , a stejné hodnoty residuí v těchto pólech. Proto integrály těchto funkcí jsou shodné I k −1 =
Bk −1 ( z ) Bk −1 ( z −1 ) dz 1 1 1 Bk −1 ( z ) Bk*−1 ( z ) dz = 2 π j c∫1 Ak −1 ( z ) Ak*−1 ( z ) z 1 − α 2k 2 π j c∫1 Ak −1 ( z ) Ak ( z −1 ) z 2
(9-71)
Po substituci z → z −1 lze poslední integrál upravit na tvar Bk −1 ( z ) Bk −1 ( z −1 ) 1 1 I k −1 = dz . 1 − α 2k 2 π j c∫1 Ak ( z ) Ak −1 ( z −1 )
(9-72)
Integrovaná funkce v posledním integrálu má póly jen v kořenech polynomu Ak ( z ) . Pro další výpočty je třeba zjistit hodnoty polynomu Ak −1 ( z ) pro výpočet residuí v těchto pólech. Podle (9-52) platí
( ) ( ) Pro kořeny platí A ( z ) = 0 , a proto poslední vztah je možné zjednodušit A (z ) = z A (z ) . Ak −1 ( z −1 ) = z Ak ( z −1 ) − α k Ak* ( z −1 ) = z Ak ( z −1 ) − α k z − k Ak ( z ) . k
k −1
−1 i
(9-73)
i
i
k
−1 i
(9-74)
Integrovaná funkce z (9-72) Bk −1 ( z ) Bk −1 ( z −1 ) Ak ( z ) Ak −1 ( z −1 )
(9-75)
a funkce, ve které je použito výsledku (9-74), Bk −1 ( z ) Bk −1 ( z −1 ) 1 Bk −1 ( z ) Bk* ( z ) = Ak ( z ) Ak* ( z ) Ak ( z ) Ak ( z −1 ) z
(9-76)
mají uvnitř jednotkové kružnice shodné póly a shodné velikosti příslušných residuí. Integrál (9-72) je tedy možné upravit na tvar I k −1 =
Bk −1 ( z ) Bk −1 ( z −1 ) dz 1 1 . 1 − α 2k 2 π j c∫1 Ak ( z ) Ak ( z −1 ) z
132
(9-77)
Do posledního integrálu lze dosadit za polynomy v čitateli podle (9-52)
][
[
]
Bk ( z ) − β k Ak* ( z ) Bk ( z −1 ) − β k Ak* ( z −1 ) dz 1 = (1 − α ) I k −1 = 2π j ∫ z Ak ( z ) Ak ( z −1 ) c1 2 k
=
Bk ( z ) Bk ( z −1 ) dz β k Bk ( z ) Ak* ( z −1 ) dz 1 − − 2 π j c∫1 Ak ( z ) Ak ( z −1 ) z 2 π j c∫1 Ak ( z ) Ak ( z −1 ) z
(9-78)
Ak* ( z ) Bk ( z −1 ) dz β 2k Ak* ( z ) Ak* ( z −1 ) dz βk . − + 2 π j c∫1 Ak ( z ) Ak ( z −1 ) z 2 π j c∫1 Ak ( z ) Ak ( z −1 ) z
První integrál na pravé straně poslední rovnice je roven integrálu (9-63), tj. I k . Druhý integrál v (9-78) může být upraven následujícím způsobem
Bk ( z ) Ak* ( z −1 ) dz βk β B ( z ) Ak ( z ) dz = k ∫ k = ∫ −1 2 π j c1 Ak ( z ) Ak ( z ) z 2 π j c1 Ak ( z ) Ak ( z −1 ) z βk Bk ( z ) dz Bk ( 0) bkk = = βk * = β k k = β 2k , * ∫ 2 π j c1 Ak ( z ) z Ak ( 0) a0
(9-79)
protože integrovaná funkce má uvnitř jednotkové kružnice jen jediný pól a to v bodě z = 0 . Třetí integrál v (9-78) je z důvodu podobnosti s druhým integrálem rovněž roven β 2k . Čtvrtý integrál v (9-78) lze upravit Ak* ( z ) Ak* ( z −1 ) dz Ak ( z −1 ) Ak ( z ) dz dz β 2k β 2k β 2k = = = β 2k . ∫ ∫ ∫ −1 −1 2 π j c1 Ak ( z ) Ak ( z ) z 2 π j c1 Ak ( z ) Ak ( z ) z 2 π j c1 z
Výsledný rekurzivní vzorec pro výpočet integrálu je podle (9-78) tedy následující (1 − α 2k ) I k −1 = I k − β 2k .
(9-80)
(9-81)
Pro k = 0 je velikost integrálu 2
1 ⎛ b00 ⎞ dz ⎜ ⎟ I0 = = β 20 . 2 π j c∫1 ⎝ a00 ⎠ z
(9-82)
Další hodnoty integrálu pro k = 1 až k = n se počítají rekurzivně podle následujícího vzorce I k = (1 − α 2k ) I k −1 + β 2k .
(9-83)
Protože podle (9-55) pro i = 0 platí a0k −1 = a0k − α k akk = a0k (1 − α 2k ) ,
(9-84)
lze vzorec (9-83) přepsat do tvaru a0k −1 I k −1 = a0k I k − a0k β 2k
(9-85)
nebo
a0k I k = a0k −1 I k −1 + β k bkk = a0k −1 I k −1 + (bkk ) a0k . 2
Integrál je tedy dán rovněž sumou
133
(9-86)
1 In = n a0
n
(b )
k =0
a
∑
k 2 k k 0
.
(9-87)
9.1.3 Výpočetní aspekty
Při ručním výpočtu integrálu podle popsaného postupu je vhodné, aby koeficienty polynomů A( z ) = a0 z n + a1z n −1 +...+ an a B( z ) = z nb0 + b1z n −1 +...+bn byly uspořádány do tabulky a0
a1
....... a n −1
an
b0
b1
....... bn −1
bn
an
a n −1
....... a1
a0
an
a n −1
....... a1
a0
a a
n −1 0 n −1 n −1
a a
n −1 1 n −1 n−2
....... a ....... a
n −1 n −1 n −1 0
n −1 0 n −1 n −1
b a
... a a a
b a
n −1 n −1 n −1 0
....... b ....... a
...
... 1 0 1 1 0 0
n −1 1 n −1 n−2
... a a
1 1 1 0
b01
a11
a11
a 01
b00
Levá část této tabulky obsahuje jen koeficienty polynomu Ak ( z ) , zatímco v pravé částí se střídají koeficienty polynomů Ak ( z ) a Bk ( z ) . Liché řádky obsahují koeficienty se vzestupným indexem (klesající mocnina z), a to levá část tabulky koeficienty polynomu Ak ( z ) a pravá část koeficienty polynomu Bk ( z ) . Sudé řádky v obou částech tabulky obsahují jen koeficienty polynomu Ak ( z ) , a to v opačném pořadí indexů. Koeficienty lichých řádků se vypočtou podle vzorců aik −1 = aik − α k akk−i ,
α k = akk a0k ,
(9-88)
bik −1 = bik − β k a kk−i ,
β k = bkk a0k .
(9-89)
Sudé řádky se násobí vlevo koeficienty α k a vpravo koeficienty β k tak, aby koeficient polynomu s nejvyšším indexem z lichého řádku obou částí tabulky byl vynulován. Například, aby na třetím řádku byl vynulován zmíněný koeficient odečtením násobku koeficientu z druhého řádku, je třeba, aby druhý řádek v levé části byl násoben podílem an a0 a v pravé části byl násoben podílem bn a0 . K demonstraci výpočetního algoritmu je také následující příklad A( z ) = z 3 + 0.7 z 2 + 0.5 z − 0.3,
(9-90)
B( z ) = z 3 + 0.3 z 2 + 0.2 z + 01 ..
Uspořádání výpočtu je zřejmé z následující tabulky. V prvním sloupci jsou tučným písmem zdůrazněny hodnoty koeficientů, které musí být u stabilního polynomu A( z ) kladné.
134
αk 1.0 − 0.3
0.7 0.5
0.5 0.7
0.91
0.85
0.71
0.71
βk
− 0.3 . 10
− 0.3
. 10 − 0.3
0.3 0.5
0.2 0.7
. 103
0.25
. 013
. 01 . 01 . 10
0.85 0.91 . 0.356 0187 . 0187 0.356
0.780 0.71 0.85 0.91 . 0.929 0129
. 0143
. 0.525 0187
0.361
0.258
1
0.861
0.356
3.338
Velikost integrálu se vypočte podle vzorce (9-87) tak, že se sečtou podíly druhých mocnin koeficientů bkk a koeficientu a0k a výsledek se podělí a0n , tj. 1 ⎛ 01 . 2 013 . 2 0129 . 2 0.8612 ⎞ I= + + + ⎜ ⎟ = 2.948 . 10 0.91 0.356 0.258 ⎠ . ⎝ 10 . function [V,Err] = QCD1(A,B) % % Program for evaluating the integral of the rational function % 1/(2*pi*i)*B(z)*B(1/z)/(A(z)*A(1/z))*(1/z) % around the unit circle. % A - vector with the coefficients of polynomial % A(1)*z^N+A(2)*z^(N-1)+....+A(N+1) % B - vector with the coefficients of polynomial % B(1)*z^N+B(2)*z^(N-1)+....+B(N+1) % V - the returned loss % Err- when returning Err=0 if the polynomial A has all zeros % inside unit circle, Err=1 if the polynomial A has any root % outside or on the unit circle or if A(1) is not positive % a0 = A(1); Err= 0; V = 0; n = length(A); if length(B)~=n|n<1, Err = 1; break, end k = n; while k>1, V = V + B(k)^2/A(1); Ab = A(k:-1:1); alfa = A(k)/A(1); beta = B(k)/A(1); A(1:k-1) = A(1:k-1) - alfa*Ab(1:k-1); if A(1)<=0, Err = 1; break, end B(1:k-1) = B(1:k-1) - beta*Ab(1:k-1); k = k-1; end; V = V + B(1)^2/A(1); V = V/a0;
Obr. 65 M-file pro výpočet kvadratického kriteria řízení v prostředí MATLABu
135
M-file ve tvaru funkce pro výpočet kvadratického kriteria v prostředí MATLABu je v obr. 65. Výsledek výpočtu obsahuje dva prvky, a to velikost integrálu a informaci o správnosti zadání polynomů a o stabilitě přenosu, které jsou kumulovány do jediného parametru Err. Pro Err = 0 je výsledek výpočtu správný. Pro Err = 1 jsou buď nesprávně zadány vstupní vektory nebo je přenos nestabilní.
9.1.4 Porovnání statisticky optimální a suboptimální regulace V kapitole o strukturální optimalizaci je uveden příklad, který demonstruje vliv polohy kořene čitatele přenosu soustavy na průběh regulované a akční veličiny u dvou verzí regulátoru, a to statisticky optimálního a suboptimálního. Regulovaná soustava byla sice fázově minimální, ale podle tvaru a parametrů jejího přenosu z −1 + b 0 z − 2 GS ( z ) = , a o = −0.7, b o = 0.99 , 1 + a 0 z −1
(9-91)
se může stát po velmi malé změně parametru b 0 fázově minimální. Tato skutečnost byla spojována s případnou neznalostí skutečných parametrů soustavy. Na výstupu regulované soustavy působí aditivní náhodná porucha, která vznikla průchodem bílého šumu soustavou GV ( z ) =
1 + c 0 z −1 , 1 + a 0 z −1
c o = 0.95 .
(9-92)
Pro řízení byly navrženy dvě verze regulátorů Statisticky optimální regulátor
Suboptimální regulátor
c0 − a 0 GR ( z ) = 1 + b z −1
GV ( z ) =
g 1 + f z −1
Číselné hodnoty parametrů regulátoru byly c o − a o = 165 . , b = 0.99 a g = 0.684, f = 0.966 . Cílem této kapitoly je demonstrovat vliv velikosti parametru b a f na rozptyl regulované a akční veličiny.
Úloha je řešena numerickým výpočtem rozptylu. Prvým krokem je stanovení přenosu bílého šumu na rozptyl regulované a akční veličiny podle blokového schématu na obr. 66, ve kterém je bez újmy obecnosti předpokládána nulová žádaná hodnota.
Obr. 66 Regulační obvod s náhodnou poruchou Přenosy bílého šumu na regulovanou a akční veličinu jsou následující Statisticky optimální regulátor
Suboptimální regulátor
z 2 + ( c 0 + b) z + c 0b Y ( z) = 2 E ( z ) z + ( c 0 + b) z + a 0 (b − b 0 ) + c 0b 0
z 2 + ( c0 + f ) z + c0 f Y ( z) = E ( z) z 2 + ( a 0 + f + g ) z + ( a 0 f + b0 g )
(
)
( c0 − a 0 ) z + c0 ( c0 − a 0 ) U ( z) =− 2 E ( z) z + ( c 0 + b) z + a 0 (b − b 0 ) + c 0b 0
(
)
136
U ( z) g z + g c0 =− 2 E ( z) z + (a 0 + f + g) z + (a 0 f + b0 g)
Z hlediska stability regulačního obvodu pro maximální přípustné hodnoty parametrů b a f platí následující omezení Statisticky optimální regulátor
b<
Suboptimální regulátor
1 − c 0 (1 − b 0 ) − a 0b 0 ≈ 0,9903 1− a0
f <
1 − a 0 − g(1 − b 0 ) − a 0 ≈ 0,9962 1− a0
a0b < 1 + b0 (a0 − c0 ) ⇒ b > 0.905 Optimální hodnota parametru b je vzdálená od meze stability jen o 0.0003, zatímco hodnota parametru f se liší od mezní hodnoty jen o 0.03. Závislost rozptylu regulované a akční veličiny na parametrech b a f je vypočtena numericky pomocí dříve popsané funkce QCD1 z prostředí MATLABu a výsledky byly vykresleny v obr. 67. Jak je zřejmé z grafů na tomto obrázku, statisticky optimální regulace je velmi citlivá na změnu parametru regulátoru b ve jmenovateli jeho přenosu a má velmi vysoký rozptyl akční veličiny. Naproti tomu suboptimální řízení s rozptylem jen dvakrát větším (směrodatná odchylka je jen 1.41-krát větší) má rozptyl akční veličiny řádově menší, a proto je technicky přijatelnější. Velmi plochý průběh závislosti rozptylu regulované veličiny na parametru f v okolí minima dovoluje nastavit tento parametr na bezpečnou hodnotu vzhledem k mezi stability.
Obr. 67 Rozptyl regulované a akční veličiny u statisticky optimální a suboptimální regulace Analýza regulačních obvodů s náhodnou poruchou použitím funkce QCD1 není omezena řádem regulované soustavy. Smysluplné výsledky lze dostat jen po pečlivé analýze oblasti stability parametrů uzavřeného obvodu.
137
9.2 Spojité regulační obvody Integrál pro výpočet rozptylu náhodné veličiny po průchodu lineární soustavou se spojitým časem má podobnou strukturu jako u soustav diskrétních. +∞
1 I= ∫ F ( jω ) F ( − jω ) dω . 2π −∞
(9-93)
Po substituci s = jω se předchozí integrál změní na integrál + j∞
1 I= F ( s) F ( − s) ds , 2π j −∫j∞
(9-94)
který má tvar rovněž křivkového integrálu komplexní proměnné, a to po imaginární ose komplexní roviny. Tato křivka může být uzavřena tak, aby obklopovala s kladným smyslem oběhu zápornou polovinu komplexní roviny (záporná reálná část komplexních čísel). Pro všechny způsoby výpočtu bude předpokládáno, že funkce F ( s) v (93) je racionální funkcí, tj. F ( s) =
B ( s) , A( s)
(9-95)
kde A( s) = a0 sn + a1sn −1 +...+ an −1s + an ,
(9-96)
B ( s) =
(9-97)
b1s n −1 +...+bn −1s + bn .
Stupeň polynomu B( s) je o jednotku menší z důvodu fyzikální realizovatelnosti. V postupech výpočtu nebude užito znalosti některých kořenů jmenovatele polynomu A( s) . Formulace zadání úlohy je vhodná pro všechny možné kombinace tvaru přenosu soustavy a výkonové spektrální hustoty. 9.2.1 Analytický výpočet integrálu Vzorce pro výpočet lze odvodit pomocí již zmíněné residuové věty. Odvození nebude prezentováno. Pouze bude uveden výsledný vzorec. Pro výsledný vzorec jsou sloučeny polynomy v čitateli integrované funkce, tj. n −1 n −1
C( s) = B( s) B( − s) = ∑ ∑ bi bk si + k ( − 1) . k
(9-98)
i =0 k =0
Výsledný polynom C( s) je součtem součinů, ve kterém jsou členy se symetrickými indexy
[
]
k i k i bi bk si + k ( − 1) + bk bi s k +i ( − 1) = bi bk si + k ( − 1) + ( − 1) .
(9-99)
Součet těchto členů závisí na tom, zda součet indexů i + k je sudý nebo lichý. Pro sudý součet indexů i + k je výsledek součtu zmíněných členů buď +1 nebo -1, tj. nenulový. V případě lichého součtu indexů je výsledek součtu nulový. Z této úvahy vyplývá, že polynom C( s) neobsahuje liché mocniny komplexní proměnné s. Polynom (9-98) má tedy tvar
137
C( s) = c0 s2( n −1) + c1s2 ( n −2 ) +...+ cn −2 s2 + cn −1 .
(9-100)
Integrál (9-94) po náhradě integrované funkce a zdůraznění stupně polynomu ve výsledku integrace má následující tvar 1 1 C ( s) In = ds = ∫ 2 π j − j∞ A( s) A( − s) 2π + j∞
C ( jω ) ∫ A( jω) A( − jω ) dω .
+∞
(9-101)
−∞
Bez důkazu platí, že velikost integrálu (9-101) je
In =
( − 1) n +1 N n 2 a0
Dn
,
(9-102)
kde jmenovatel a čitatel představují determinanty d11 d12 d 21 d 22 Dn = ... ... d n1 d n 2
..... d1n ..... d 2 n , ... ..... d nn
c0 d12 c1 d 22 Nn = ... ... cn −1 d n 2
..... d1n ..... d 2 n ... ..... d nn
(9-103)
s prvky ⎧a2 m− r , 0 ≤ 2m − r ≤ n, d mr = ⎨ 2m − r < 0, 2m − r > n. ⎩0,
(9-104)
Výraz N n v čitateli zlomku (9-102) je determinant shodný s determinantem Dn až na první sloupec, který tvoří koeficienty polynomu C( s) . Příklad:
Podle metody inverze dynamiky [42, 43, 45] je k řízení setrvačné soustavy prvního řádu doporučen PI regulátor. Schéma regulačního obvodu je na obr. 68.
Obr. 68. Spojitý regulační obvod s náhodnou poruchou Před soustavou vstupuje náhodná porucha. Je třeba analyzovat vliv seřízení regulátoru na velikost přenosu rozptylu poruchy na rozptyl regulované a akční veličiny. Žádaná hodnota je konstantní. Výkonová spektrální hustota poruchy nechť odpovídá náhodnému procesu po průchodu filtrem prvního řádu, tj. Svv ( ω ) =
2 α σ v2 , ω2 + α2
(9-105)
kde parametr α charakterizuje šířku spektra. Toto spektrum lze považovat za typové stejně jako například jednotkový skok při analýze přechodového děje. Nejprve je třeba stanovit přenos poruchy na regulovanou a akční veličinu [21]. Platí
138
Gvy ( s) =
Gvu ( s) =
1 1 + T1s
Kr (1 + TI s) 1 1+ TI s 1 + T1s −
Kr (1 + TI s) 1 1 + T1s TI s
Kr (1 + TI s) 1 1+ 1 + T1s TI s
TI s
=
TI T1s 2 + TI (1 + Kr )s + Kr
=
TI T1s + TI (1 + Kr )s + Kr
− Kr (1 + TI s)
2
,
(9-106)
.
(9-107)
Výkonová spektrální hustota regulované a akční veličiny se vypočte 2 α σ v2 = ω2 + α2 ⎤ ⎡ 1 ⎤⎡ 1 = 2 α σ v2 ⎢Gvy ( jω ) Gvy ( − jω ) , ⎢ ⎥ − jω + α ⎥⎦ jω + α ⎦ ⎣ ⎣ 2 α σ v2 ( ) ( ) = Suu ω = Gvu ( jω ) Gvu ( − jω ) Svv ω = Gvu ( jω ) Gvu ( − jω ) 2 ω + α2 ⎤ ⎡ 1 ⎤⎡ 1 = 2 α σ v2 ⎢Gvu ( jω ) Gvu ( − jω ) . ⎢ ⎥ − jω + α ⎥⎦ jω + α ⎦ ⎣ ⎣ S yy ( ω ) = Gvy ( jω ) Gvy ( − jω ) Svv ( ω ) = Gvy ( jω ) Gvy ( − jω )
(9-108)
Integruje se tedy součin funkcí s opačným argumentem, a proto stačí určit jen jednu z nich Gvy ( s)
TI s 1 = = s + α ( s + α ) TI T1s 2 + TI (1 + Kr )s + Kr
(
= Gvu ( s)
)
TI s
(
)
(
)
TI T1s + TI (1 + Kr + αT1 )s + αTI (1 + Kr ) + Kr s + αKr 3
2
,
− Kr (1 + TI s) 1 = . s + α TI T1s 3 + TI (1 + Kr + αT1 )s 2 + αTI (1 + Kr ) + Kr s + αKr
(9-109)
Výrazy ve jmenovateli obou funkcí pro výpočet rozptylů jsou shodné, proto koeficienty polynomu A( s) jsou a0 = TI T1 , a1 = TI (1 + Kr + αT1 ), a2 = αTI (1 + Kr ) + Kr , a3 = αKr .
(9-110)
Čitatel funkce pro výpočet rozptylu regulované veličiny je (součinitel 2ασ 2v je vypuštěn) C( s) = − TI2 s 2 :
c0 = 0, c1 = − TI2 , c2 = 0 .
(9-111)
Čitatel funkce pro výpočet rozptylu akční veličiny je (součinitel 2ασ 2v je rovněž vypuštěn) C( s) = Kr2 (1 − TI2 s2 ) :
c0 = 0, c1 = − Kr2 TI2 , c2 = Kr2 .
(9-112)
Všechny determinanty jsou třetího stupně. Determinant jmenovatele je pro výpočet rozptylu regulované a akční veličiny podle (9-102) shodný, naproti tomu determinant v čitateli je u obou integrovaných funkcí různý. Pro výpočet rozptylu regulované veličiny je tento čitatel označen N 3, y a pro výpočet rozptylu akční veličiny je označen N 3,u . Při výpočtu není výhodné za prvky determinantu dosazovat, a proto obecně platí 139
a1 D3 = a3 0
a0 a2 0
0 0 a0 2 a1 = a1a2 a3 − a0a3 , N 3, y = c1 a2 0 0 a3
0 a1 = − c1a0a3 , N 3,u = a0a1c2 − a0a3c1 . a3
Po dosazení do vzorce (9-102) lze vypočítat oba rozptyly s obecnými prvky determinantů σ = 2ασ 2 y
2 v
σ 2u = 2ασ 2v
( − 1) 3+1 N 3, y 2 a0
D3
( − 1) 3+1 N 3,u 2a0
D3
= 2ασ v2
1 − c1a0a3 − c1 2 , 2 = ασ v 2a0 a1a2 a3 − a0a3 a1a2 − a0a3
(9-113)
= 2ασ v2
a1c2 − a3c1 1 a0a3c2 − a0a3c1 2 . 2 = ασ v a1a2 a3 − a0a32 2a0 a1a2 a3 − a0a3
(9-114)
Po dalším dosazení za obecné prvky determinantů v obou vzorcích lze dostat podíly rozptylů regulované a akční veličiny k rozptylu poruchy σ 2y
=
αTI
,
(9-115)
Kr (1 + Kr + αT1 + αTI Kr ) σ 2u . 2 = σ v (1 + Kr + αT1 ) αTI (1 + Kr ) + Kr − αT1 Kr
(9-116)
σ
2 v
(1 + K
r
(
)
+ αT1 ) αTI (1 + Kr ) + Kr − αT1 Kr
(
)
Regulační obvod má přenos druhého řádu, a proto je stabilní pro libovolné kladné zesílení Kr a libovolnou nezápornou integrační časovou konstantu TI . Pro soustavy tohoto řádu bez dopravního zpoždění je podle metody inverze dynamiky doporučeno, aby integrační časová konstanta byla zvolena o velikosti časové konstanty regulované soustavy, tj. TI = T1 . Zesílení regulátoru se volí podle této metody v závislosti na časové konstantě Tw přenosu řízení uzavřeného obvodu, jehož přechodová charakteristika je na obr. 69, tj. Kr = T1 Tw .
Obr. 69. Přechodová charakteristika regulačního obvodu Účinek regulace se zmíněným regulátorem pro volbou TI = T1 závisí na dvou parametrech, a to bezrozměrné šířce ϕ = αT1 dříve definovaného pásma spektra poruchy a zesílení Kr = T1 Tw . Pro grafické znázornění je vhodné upravit vzorce pro přenos rozptylů do tvaru σ 2y Kr ( 1 + ϕ ) σ 2u ϕ , = . (9-117) = 2 2 σ v ϕ(1 + Kr ) + Kr + ϕ 2 σ v (1 + Kr ) ϕ(1 + Kr ) + Kr + ϕ 2
(
)
Jestliže bude regulační obvod rozpojen, tj. Kr = 0 , pak pro přenosy rozptylů bude platit 140
σ 2y σ 2v
= Kr = 0
σ 2u σ 2v
1 , 1+ ϕ
= 0.
(9-118)
Kr = 0
Rozptyl akční veličiny je nulový, zatímco výstup regulované veličiny ovlivňuje jen náhodná porucha s rozptylem závislým jen na ϕ = αT1 . U regulačního obvodu s přenosem druhého řádu může být zesílení teoreticky nekonečné. Pro tuto limitu platí σ 2y σ v2
σ 2u σ 2v
= 0, Kr →+∞
= 1,
(9-119)
Kr →+∞
tj. rozptyl regulované hodnoty se zmenší k nule, zatímco rozptyl akční veličiny nepřevýší rozptyl poruchy. Limitní hodnoty jsou užitečné pro volbu měřítek grafů, které jsou znázorněny v obr. 70. Hodnoty bezrozměrné šířky pásma ϕ = αT1 spektra poruchy jsou voleny v mezích, ve kterých je prakticky výhodné regulátor využívat.
Obr. 70. Pøenos rozptylu poruchy na rozptyl akèní a regulované velièiny Grafy znázorňující závislost rozptylu akční a regulované veličiny mohou být v praxi užitečné k odhadování účinku regulace při kompenzaci náhodných poruch. Projektant regulačního obvodu může zákazníkovi prokázat, za jakých podmínek může regulace přinést zlepšení ve zrovnoměrnění technologického procesu. Tento efekt regulace je pro praxi, tj. z hlediska uživatele, ekonomicky zajímavější než animované grafy na displejích počítačů.
141
9.2.2 Numerický výpočet integrálu
Analyzovaný obvod z příkladu předchozí kapitoly není příliš komplikovaný a je bez dopravního zpoždění. Dopravní zpoždění lze aproximovat soustavou vyššího řádu s významným průtahem ve srovnání s náběhem. Analytický postup výpočtu pro soustavy s řádem vyšším než 3 nebo 4 nebude možné použít, a proto je k dispozici numerický způsob výpočtu integrálu podobně jako pro diskrétní soustavy. Algoritmus numerického výpočtu nebude odvozen stejně jako analytický výpočet rozptylu pro lineární spojité soustavy. Dále popsaný algoritmus je zajímavý také tím, že jej navrhl prof. Nekolmý z ČVUT [24] a byl v době svého vzniku citován jako pravděpodobně jediný poznatek z oboru teorie řízení v literatuře, která byla vydávána ve vyspělých průmyslových státech [4]. Pro numerický výpočet integrálu bude předpokládán jeho následující tvar
B ( s) B ( − s) 1 I= ds ∫ 2π j − j∞ A( s) A( − s) + j∞
(9-120)
ve kterém integrovaná funkce je složena z polynomů
A( s) = a0 s n + a1s n −1 +...+ an −1s + an ,
(9-121)
B ( s) =
(9-122)
b1s n −1 +...+bn −1s + bn .
Oba tyto polynomy lze odvodit vynásobením polynomů v čitateli a jmenovateli přenosu a příslušných částí výkonové spektrální hustoty stejným způsobem jako u příkladu z předchozí kapitoly. Postup výpočtu je opět založen na snižování stupně polynomu. Proto je polynom A( s) rozdělen na část se sudými (even) a lichými (odd) indexy jeho koeficientů. Platí
Ae ( s) = a0 sn + a2 s n − 2 +.... =
[
]
1 n A( s) + ( − 1) A( − s) , 2
Ao ( s) = a1s n −1 + a3 s n − 3 +.... =
[
]
1 n A( s) − ( − 1) A( − s) . 2
(9-123) (9-124)
Pro označení stupně polynomů a jejich koeficientů indexem k Ak ( s) = a0k sn + a1k s n −1 +...+ ank−1s + ank , Bk ( s) =
(9-125)
b1k sn −1 +...+bnk−1s + bnk ,
který je u koeficientů umístěn vpravo nahoře a nemá tedy význam mocniny, lze postup snižování jejich stupně popsat následujícími rekurzivními vzorci Ak −1 ( s) = Ak ( s) − α k sAko−1 ( s) ,
Bk −1 ( s) = Bk ( s) − β k Ako−1 ( s) ,
(9-126)
kde parametry α k , β k jsou definovány podle následujících vzorců α k = a0k a1k ,
β k = b1k a1k ,
(9-127)
tak, aby se v rozdílu (9-126) zrušil člen polynomu s nejvyšší mocninou proměnné s, přičemž na počátku rekurzivních výpočtů je třeba zvolit An ( s) = A( s) ,
Bn ( s) = B( s) .
142
(9-128)
Pro polynom A( s) je algoritmus snižování jeho stupně shodný s algoritmem, který se používá v kriteriu stability lineárních spojitých soustav podle Schour-Routha. Jednotlivé kroky redukce stupně jsou podmíněny nenulovou hodnotou koeficientu a1k . V Aströmově knize [4] jsou dokázány dvě matematické věty o stejném významu jako v případě lineárních diskrétních soustav. Podle první z nich platí: Nechť a0k > 0 , pak jsou ekvivalentní následující tvrzení: 1. Polynom Ak ( s) má kořeny v levé polovině komplexní roviny. 2. Polynom Ak −1 ( s) má kořeny rovněž v levé polovině komplexní roviny a koeficient a1k −1 je kladný. Podle této věty operace snižování stupně polynomu ze stupně k na stupeň k − 1 zachovává stabilitu polynomu se stupněm k − 1 , zaručuje kladnou hodnotu koeficientu a1k −1 , a tím umožňuje pokračování ve snižování stupně polynomu na k − 2 , atd.. Podle druhé věty platí:
Nechť a0n > 0 , pak jsou ekvivalentní následující tvrzení: 1. Polynom An ( s) má kořeny v levé polovině komplexní roviny. 2. Pro koeficienty platí a1k > 0 pro k = 0,1,..., n − 1 . Druhá věta formuluje kriterium stability spojitých lineárních soustav podle SchourRoutha, kterým lze kontrolovat smysluplnost výsledku numerického výpočtu integrálu podle dále popsaného rekurzivního algoritmu. Důkazy přesahují obou vět rámec tohoto učebního textu. Hlavním cílem této kapitoly je popsat rekurzivní výpočet integrálu 1 Bk ( s) Bk ( − s) Ik = ds . ∫ 2 π j − j∞ Ak ( s) Ak ( − s) + j∞
(9-129)
Bez důkazu platí β 2k I k = I k −1 + , k = 1, 2, ..., n , 2α k
(9-130)
přičemž I 0 = 0 . Hledaná hodnota integrálu je pro k = n , tj. I = I n . 9.2.3 Výpočtové aspekty
Při ručním výpočtu integrálu podle popsaného postupu je vhodné, aby koeficienty polynomů A( s) = a0 s n + a1s n −1 +...+ an a B( s) = b1s n −1 +...+bn byly uspořádány do tabulky
143
a0 a1
a2 a3
a0n −1 a 1n −1
a1n −1 a2n −1 a3n −1 ..... a3n −1 0 ..... 0 ...
a3 0
a4 a5
..... .....
a1 0
b1 b2 a1 0
b3 a3
b4 0
... a12 0 a01 a 11
..... .....
b1n −1 b2n −1 b3n −1 b4n −1 ..... a1n −1 0 a3n −1 0 .....
... . .. a02 a 12
b5 a5
a22
... ... b12 a12
a11
b22 0 b00
0 a00
function [V,Err] = QCC1(A,B) % % Program for evaluating the integral of the rational function % 1/(2*pi)*B(s)*B(-s)/(A(s)*A(-s)) % along the imaginary axis. % A - vector with the coefficients of polynomial % A(1)*s^N+A(2)*s^(N-1)+....+A(N+1) % B - vector with the coefficients of polynomial % B(2)*s^(N-1)+....+B(N+1) % V - the returned loss % Err- when returning Err=0 if all zeros of A are in left half % plane, Err=1 if the polynomial A does not have all zeros % in left plane or if A(1) is not positive % Err= 0; V = 0; n = length(A); if length(B)~=n|n==0|B(1)~=0|A(1)<=0, Err = 1; break, end B(1) = [ ]; k = n; while k>1, if A(1)<=0, Err = 1; break, end As=A([2:k 1]); As(k)=0; N=zeros(size(A)); As(2:2:k)=N(2:2:k); alfa = A(1)/A(2); beta = B(1)/A(1); V = V + beta^2/alfa/2; A = A - alfa*As; As(k)=[ ]; B = B - beta*As; A(1)=[ ]; B(1)=[ ]; k = k - 1; end;
Obr. 71. M-file pro výpočet kvadratického kriteria řízení v prostředí MATLABu
144
Oproti algoritmu z kriteria stability podle Schur-Routha je v tabulce doplněna ještě pravá část s koeficienty polynomu B( s) . V obou částech tabulky se postupuje při redukci shodně. Sudé řádky se násobí parametrem, který při odečtení takto upraveného řádku od předchozího (lichého) řádku vynuluje první koeficient dalšího (tj. lichého) řádku. V obou částech tabulky se používají různé parametry pro násobení, v levé části tabulky se použije α k a v pravé βk . části Posloupnost těchto parametrů nebo určité prvky popsané tabulky slouží k výpočtu integrálu. Platí n b1k ) ( β 2k I =∑ =∑ k k . k =1 2 a0 a1 k =1 2 α k n
2
Při výpočtu je kontrolována stabilita, a to podle kladných hodnot tučně vyznačených koeficientů ve výše uvedené tabulce. Program pro výpočet kvadratického kriteria řízení v prostředí MATLABu je uveden na obr. 71..
Pøíloha A: Výpočet integrálů komplexních funkcí Podobně jako integrál jednoduché nebo vícerozměrné proměnné existují integrály také komplexní proměnné [35], a to jako součást matematické analýzy funkcí komplexní proměnné. Patří mezi ně například inverzní Laplaceova transformace nebo inverzní Z-transformace. V kapitole o parametrické transformaci je třeba rovněž vyčíslit integrály komplexních funkcí, které jsou racionálními funkcemi komplexní proměnné. Pro komplexní funkci platí, že jestliže má v okolí nějakého bodu derivaci, pak je v tomto bodě regulární (též holomorfní). Existenci derivace podmiňuje splnění Cauchyovy-Riemannovy podmínky. Při výpočtu integrálů je soustředěn zájem jen na racionální funkce, které jsou dány podílem polynomů. Racionální funkce je regulární s výjimkou singulárních bodů, které se také nazývají póly. Poloha pólů je dána kořeny polynomu jmenovatele. Dříve než bude popsán postup výpočtu křivkových integrálů, je třeba se zmínit o rozvoji v Laurentovu řadu. Komplexní funkci f ( z ) , proměnné z, která je regulární s výjimkou bodu a komplexní roviny, lze rozvinout v řadu f ( z ) =
+∞
∑ a ( z − a)
i =−∞
i
i
, která je konvergentní pro jisté mezikruží se středem v bodě a.
Koeficient řady s indexem rovným -1, tj. a−1 se nazývá residuum funkce f ( z ) v bodě a. Toto reziduum má při výpočtu integrálů zvláštní význam. Pro křivkový integrál komplexní funkce po uzavřené křivce s kladným smyslem oběhu podle tzv. residuové věty platí
∫
f ( z ) dz = 2 πj ∑ res f ( zi ) , n
(A-1)
i =1
c1
kde zi , i = 1, ..., n jsou singulární body, tj. v případě racionálních funkcí póly, které obepíná (obklopuje) uzavřená křivka c1 . Každý pól má svou násobnost, kterou určuje mocnina kořenového činitele. Součet násobností všech pólů je roven stupni polynomu. Residuum příslušné pólu v bodě zi o násobnosti ni se vypočte podle vzorce res f ( zi ) =
1
(n − 1)! i
lim z → zi
[
]
d ni −1 ni ( ) . ni −1 f z ( z − zi ) dz
(A-2)
Příklad:
Je třeba vypočítat následující křivkový integrál po jednotkové kružnici c1 : 1 f ( z ) dz = ? , 2 πj c∫1
kde f ( z ) =
1− E 2 1 1− E 2 = , ( z − E )( z −1 − E ) z ( z − E )(1 − zE )
E < 1.
Uvnitř jednotkové kružnice je jeden pól: z1 = E s násobností jedna. Residuum je
⎡ (z − E) ⎤ 1− E 2 res f ( E ) = lim ⎢ ⎥ = 1. z → E ( z − E ) ( z −1 − E ) z ⎦ ⎣
(A-3)
Pro hledaný integrál platí 1 1− E 2 1 dz 2 πj * 1 = 1 . = ∫ −1 2 πj c1 ( z − E )( z − E ) z 2 πj
A-1
(A-4)
Příloha B: Matice, vektory a řešení soustavy přeurčených a nedourčených rovnic V této příloze je uveden přehled názvosloví matic včetně věty o řešení přeurčené, resp. nedourčené soustavy lineárních rovnic. Podrobnosti nalezne čtenář v knihách [10,23]. Názvosloví, vlastnosti matic A = (aik ) je matice typu (m, n) (o rozměru m řádků a n sloupců) z prvků aik det( A ) je determinant matice
je transponovaná matice k matici A = (aik ) s prvky bik = a ki , tj. matice překlopená kolem hlavní diagonály * B=A je konjugovaná matice k matici A = (aik ) s prvky symetrickými a komplexně sdruženými bik = a ki , tj. s opačným znaménkem u jejich imaginárních částí E je jednotková matice s jednotkami na hlavní diagonále a ostatními prvky nulovými A je ortogonální, jestliže AA T = E A je unitární, jestliže AA * = E A je regulární, jestliže existuje matice B , aby AB = E , přičemž det( A ) ≠ 0 a je vektor o rozměru n 0 je nulový vektor se všemi prvky jsou nulovými (a,b) , a.b je skalární součin vektorů a, b , součet součinů prvků a1b1 + a2b2 +...+anbn B = AT
( Ax, y)
(Ax, x) A
je bilineární forma s maticí A se sloupcovými vektory x a y je kvadratická forma s maticí A
je positivně definitní, jestliže je hermitovská (popř. symetrická) a (Ax, x) > 0
A
je positivně semidefinitní, jestliže je hermitovská (popř. symetrická) a (Ax, x) ≥ 0
g2 ( x )
je euklidovská norma rozměrném prostoru.
x T x = x12 + x22 +...+ xn2 (délka sloupcového vektoru v n-
Soustava vektorů a1 , a 2 , ..., a n je lineárně závislá, jestliže existují skaláry c1 , c2 , ..., cn , z nichž aspoň jeden je různý od nuly, takové, že c1a 1 + c2 a 2 + ...+ cn a n = 0 , v opačném případě se soustava vektorů nazývá lineárně nezávislá. Věta z teorie matic o řešení soustav lineárních rovnic Nejdříve bude definována pseudoinverzní matice neboli Mooreova-Penroseova zobecněná inverzní matice A + k matici A , která je typu (m, n) , kde počet řádků a sloupců m, n jsou obecně různé (viz např. [9]). Nechť tato obecně obdélníková matice A má lineárně nezávislé sloupce, pak matice A * A je regulární a platí A + = A T ( AA T ) , −1
(B-1)
A + = (A T A) A T . (B-2) Obě definice jsou shodné. Při výpočtu prvního vzorce se invertuje čtvercová matice typu (m, m) , zatímco u druhého vzorce se invertuje čtvercová matice typu (n, n) . Výraz Ax = b označuje soustavu lineárních rovnic. Jestliže m < n , pak je soustava rovnic nedourčena - více −1
146
neznámých než rovnic. Jestliže m > n , pak je soustava rovnic přeurčena - více rovnic než neznámých. Jestliže m = n , pak počet rovnic se rovná počtu neznámých. A * (b − Ax) = 0 se nazývá soustava normálních rovnic (pro matice s reálnými prvky je A T (b − Ax) = 0 ). Jestliže A má lineárně nezávislé sloupce, pak řešení x 0 normální soustavy rovnic A (b − Ax) = 0 k soustavě Ax = b lze vyjádřit vztahem x = A +b . Toto řešení minimalizuje euklidovskou normu g2 (b − Ax) . *
Pro přeurčenou soustavu rovnic je g2 (b − Ax 0 ) > 0 a minimalizují se vlastně chyby jednotlivých rovnic jako například v metodě nejmenších čtverců. Pro nedourčenou soustavu rovnic je g2 (b − Ax 0 ) = 0 , přičemž se minimalizuje euklidovská norma řešení g2 (x 0 ) , tj. vypočte se řešení x 0 , které jako vektor má nejkratší délku. Nedourčené soustavy rovnic jsou pro výpočet chyby ve vyrovnávacím počtu. Pro soustavy se vzájemně nezávislými rovnicemi s m = n se jedná o jednoznačné řešení. V programovém systému MATLAB (matrix laboratory) je implementována pseudoinverze matic. Proto řešení soustavy Ax = b s libovolným typem (m, n) matice A se zapíše příkazem x = A \ b , kde obrácené lomítko znamená dělení pseudounverzní maticí A zleva. Výsledek x má výše popsané vlastnosti přeurčených nebo nedourčených soustav rovnic. Metoda nejmenších čtverců (Gauss 1806) Tato metoda se používá při zpracování experimentálních dat, pro které je třeba vypočítat aproximaci vzorci, které jsou lineární v parametrech. Měřené veličiny mají charakter nezávisle proměnných (například vstupy soustavy) a závisle proměnných (výstupy soustavy). Označení pro nezávisle proměnnou je y, a v dalším bude předpokládáno, že je to skalár. Pro vícerozměrné soustavy s více než jedním výstupem lze závisle proměnnou považovat za vektor. Označení pro nezávisle proměnné je z a představuje řádkový vektor, který má v případě dynamického modelu soustavy komplikovanější význam než prosté x pro vstup soustavy. Rozměr vektoru z nechť je n. Jedno měření se nazývá pozorování a jeho pořadí se označuje indexem i nebo t (ve významu diskrétního času). Pro naměřená data se výpočtem metodou nejmenších čtverců hledá model yi = zi P + ei , i = 1, 2, ... ,
(B-3)
který je lineární v parametrech uspořádaných do sloupcového vektoru P o rozměru n. Veličina ei je chyba, tj. odchylka naměřené hodnoty závisle proměnné od hodnoty, která byla vypočtena lineárním modelem ze změřených nezávisle proměnných. Výše uvedený model se nazývá regresní. Absolutní člen se do výše uvedeného vzorce připojí tak, že za jednu ze složek řádkového vektoru z (pro přehlednost například poslední) bude dosazována jednotka. Pro výpočet parametrů se nezávisle proměnné uspořádají do matice, závisle proměnné a chyby do vektoru
[
]
T
Z = z1 , z2 ,..., zm ,
[
]
T
y = y1 , y2 ,..., ym ,
[
]
T
e = e1 , e2 ,..., em ,
(B-4)
přičemž matice Z obsahuje lineárně nezávislé sloupce. Běžně u experimentálních dat přesahuje počet pozorování počet neznámých parametrů modelu m > n , tj. soustava rovnic pro jejich výpočet y = ZP
(B-5)
147
je přeurčena, a proto musí být doplněna vektorem chyb e. Použitím věty o řešení soustav lineárních rovnic platí, že příslušná normální soustava rovnic je Z T ( y − ZP) = 0 , a odhad neznámých parametrů modelu je −1 P$ = Z + y = (Z T Z ) Z T y .
(B-6)
Toto řešení soustavy přeurčených rovnic zaručuje minimalizaci euklidovské normy vektoru
chyb g2 ( y − ZP) = g2 ( e) = e T . e . Součet čtverců chyb S = e12 + e22 +...+ em2 je čtvercem euklidovské normy. Tento součet se také nazývá reziduální součet čtverců. Je třeba si všimnout, že byl zvolen z hlediska velikosti invertované matice Z T Z výhodnější vzorec, protože typ této matice je (n, n) , zatímco u matice Z Z T je to (m, m) , kde m > n . Výsledek výpočtu vektoru parametrů byl označen stříškou, která se používá ve statistice k označování odhadů lišících se obecně od přesných hodnot. U vektoru parametrů je to zdůvodnitelné tím, že k jejich odhadu se použije jen limitovaný počet pozorování.
Pro střední hodnotu chyb platí E {ei } = 0 . Rozptyl vektoru chyb je označován R = E {ei2 } . Odhad rozptylu (označený opět stříškou) lze vypočítat podle vzorce
{
}
1 1 T R$ = E {e T e} = E (y − ZP$ ) (y − ZP$ ) = m m 1 = E {y T y − y T ZP$ − P$ T Z T y + P$ T Z T ZP$ } = m 1 = E y T y − (P$ T Z T + e T )ZP$ − P$ T Z T (ZP$ + e) + P$ T Z T ZP$ = (B-7) m 1 T = y y − P$ T Z T + E {e T } ZP$ − P$ T Z T (ZP$ + E {e}) + P$ T Z T ZP$ = m 1 = (y T y − P$ T Z T ZP$ ). m Protože zi P je nenáhodný vektor, z vlastností střední hodnoty plyne E {y} = ZP a var y = R . Odhad parametrů P$ je nestranný a má varianční matici
{
(
}
(
)
)
−1 −1 −1 var P$ = (Z T Z ) Z T ( var y) Z(Z T Z ) ′ = R (Z T Z ) .
(B-8)
Na hlavní diagonále varianční matice jsou rozptyly jednotlivých parametrů a mimo hlavní diagonálu jejich kovariance. Variance (rozptyl) chyby modelu R je skalár. Část varianční matice parametrů, daná inverzi čtvercové matice Z T Z , je ovlivněna jen nezávisle proměnnými.
148
Příloha C: Metoda maximální věrohodnosti pro odhad parametrů Tato metoda je určena k odhadu parametrů rozdělení pravděpodobnosti [19]. Zdůvodnění metody spočívá ve výpočtu pravděpodobnosti výskytu daného souboru experimentálních dat o počtu N, jejichž jednotlivá pozorování představují nezávislé jevy (pokusy), proto PΣ = f ( x1 , Θ)∆ x... f ( x N , Θ)∆ x ,
(C-1)
kde xi je experimentální data, Θ je vektor parametrů a f ( x,Θ) je hustota rozdělení pravděpodobnosti. Nezvykle oproti teoretickým kapitolám tohoto učebního textu je mezi argumenty hustoty pravděpodobnosti zařazeno Θ . Důvodem je jen zdůraznění faktu, že průběh hustoty pravděpodobností na těchto parametrech závisí.
V teorii pravděpodobnosti se definují maximálně věrohodné odhady parametrů tak, že maximalizují výše uvedenou pravděpodobnost PΣ . Pomocí této pravděpodobnosti se definuje věrohodnostní funkce L( x1 , x2 ,..., x N ;Θ) (likehood function) ve významu daném vzorcem PΣ = L( x1 , x2 ,..., x N ; Θ)( ∆ x ) ,
(C-2)
L( x1 ,..., x N ; Θ) = ∏ f ( x1 ; Θ) .
(C-3)
N
tj. platí N
i =1
Pro výpočty je vhodnější logaritmus věrohodnostní funkce ln L( x1 ,..., x N ; Θ) = ∑ ln f ( xi ; Θ) . N
(C-4)
i =1
Příklad:
Hustota pravděpodobnosti náhodné veličiny e o nulové střední hodnotě E { e} = 0 a rozptylu E { e 2 } = σ 2 s normálním (Gaussovským) rozdělením s jediným parametrem Θ = σ je ⎛ e2 ⎞ 1 exp⎜ − 2 ⎟ . (C-5) ⎝ 2σ ⎠ σ 2π Pro počet N vzájemně nezávislých hodnot této náhodné veličiny je logaritmus věrohodnostní funkce následující f (e; σ ) =
1 ln L(e1 ,..., e N ; σ ) = ∑ ln f (ei ; Θ) = − N ln σ − N ln 2 π − 2 2σ i =1 N
Pro dané hodnoty
e1 , e2 ,..., eN
N
∑e i =1
2 i
.
(C-6)
minimalizuje věrohodnostní funkce odhad rozptylu
N
σ$ 2 = ∑ ei2 N . Ověřte si toto tvrzení! i =1
Při odhadech parametrů modelů lineárních dynamických soustav nejsou chyby ei , i = 1, 2,..., N přímo měřeny, ale závisí na vstupní a výstupní posloupnosti ui , yi , i = 1, 2,..., N . Ve výše uvedené věrohodnostní funkci není suma
N
∑e i =1
2 i
konstantní, ale její
velikost závisí na velikosti parametrů modelu, které je třeba vybrat tak, aby tato suma byla minimální.
1
L.iteratura [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24]
Anděl, J.: Matematická statistika. SNTL/ALFA, Praha 1978. Anděl, J.: Statistická analýza časových řad. SNTL, Praha 1975. Aström, K.J. - Wittenmark, B.: On Self Tuning Regulators. Automatica, Vol. 9, pp. 185-199. Aström, K.J.: Introduction to Stochastic Control Theory. ACADEMIC PRESS, NewYork 1970, s.115-158. Balátě, a kol.: Technické prostředky automatického řízení. SNTL/ALFA, Praha 1986. Box, G.E.P. - Jenkins, G.M.: Time Series Analysis, forecasting and control. HoldenDay, San Francisco, 1970. Čížek, V.: Diskrétní Fourierova transformace a její použití. SNTL, Praha 1981. Farana, R.: Poznatky z nasazení simulačního programu SIPRO do řízení laboratorních úloh. Sborník vědeckých prací VŠB - TU Ostrava, řada strojní. 41, 1995, č. 1, článek č.1154. Farana, R.: Problematika simulace diskrétních systémů v blokově orientovaném simulačním programu. Sborník vědeckých prací VŠB - TU Ostrava, řada strojní. 42, 1996, č. 1, článek č.1166. Fiedler, M.: Speciální matice a jejich použití v numerické matematice. SNTL Praha, 1981. Kárný, J. et al.: Design of LQ adaptive control: theory and algorithms for practice. Supplement to Kybernetika 21, No. 3 - 6, 1985. Kaminski, P.G. - Bryson, A.E. - Schmidt, S.F.: Discrete Square Root Filtering: A Survey of Current Techniques. IEEE Transactions on Automatic Control, Vol. AC-16, No. 6, December 1971. Kulhavý, R.: Directional Tracking of Regression Type Model Parameters. 2nd IFAC Workshop on Adaptive Systems in Control and Signal Processing, Lund. Kulhavý, R.: Restricted Exponential Forgetting in Real Time Identification. Automatica 23, 1989, pp. 589-600. Kusyn, J. - Víteček, A. - Smutný, L.: Teorie řízení, statická optimalizace. Ostrava, skripta FSE VŠB Ostrava, 1986. Likeš, J. - Machek, J.: Matematická statistika. Matematika pro vysoké školy technické, sešit IV. SNTL, Praha 1983. Likeš, J. - Machek, J.: Počet pravděpodobnosti. Matematika pro vysoké školy technické, sešit X. SNTL, Praha 1981. Ljung, L.: System Identification: Theory for the User. Prentice Hall, Englewood Cliffs 1987. Hátle, J. - Likeš, J.: Základy počtu pravděpodobnosti a matematické statistiky. SNTL, Praha 1974. Havlena, V. - Šlechta, J.: Moderní teorie řízení. Učební texty Fakulty elektrotechnické ČVUT, Vydavatelství ČVUT, Praha1996. Herudek, E.: Syntéza systémů řízení technologických procesů s náhodným průběhem poruchové veličiny. Ostrava, diplomová práce, 1997. Markl, J.: Recursive Estimation as an Optimaly Controlled Process. Kybernetika, 21, 1985, č.4, s.272-286. Mika, S.: Numerické metody algebry. Matematika pro vysoké školy technické, sešit IV. SNTL, Praha 1985. Nekolmý, J.: Nová jednoduchá metoda testu jakosti regulace. Strojnický časopis, Praha 1957.
150
[25] Niederliňski, A.: Číslicové systémy pro řízení technologických procesů - I a II. díl. SNTL, Praha 1984. [26] Noskievič, P.: Metody a prostředky simulace systémů. Ostrava, skripta FS VŠB-TU, Ostrava 1996. [27] Peterka, V.: On Steady State Minimum Variance Control. Kybernetika 8 (1972) Nr.3, pp 219-231. [28] Peterka, V.: A Square Root Filter for Real Time Multivariate Regression. Kybernetika 11 (1975) Nr.1, pp 53-67. [29] Peterka, V.: číslicové řízení procesů s náhodnými poruchami. Doktorská disertační práce ÚTIA Praha, 1975. [30] Pugačev, V.A.: Teoria slučajnych funkcii. GIFML, Moskva 1962. [31] Rogalewicz, V.: Stochastické procesy (Analýza časových řad). Učební texty Fakulty elektrotechnické ČVUT, Vydavatelství ČVUT, Praha1993. [32] Söderström, T. - Stoica, P.: System Identification. Prentice Hall International, London, 1989. [33] Smutný, L. – Novák, R.: Prostředky automatického řízení. Ostrava, skripta FS VŠB-TU Ostrava, 1993. [34] Strejc, V. a kol.: Syntéza regulačních obvodů s číslicovým počítačem. ČSAV, Praha 1995, s.51. [35] Šulista M.: Základy analýzy v komplexním boru. Matematika pro vysoké školy technické, sešit XIII. SNTL, Praha 1981. [36] Tůma, J.: Výpočet kvadratického kriteria řízení s diskrétním časem. Automatizace, 28, 1985, č. 11, s.281-284. [37] Tůma, J.: Diskrétní extremální regulátor. Automatizace, 21, 1978, č. 10, s264-268. [38] Tůma, J.: Diskrétní řídicí algoritmy. In: Sborník z “4. mezinárodní konference ARS ‘78”, Ostrava, 25.-28.9.1978, s.511-520. [39] Tůma, J.: Statisticky optimální řízení integračních soustav proporcionálním regulátorem. Automatizace, 29, 1986, č. 7, s.177-181. [40] Tůma, J.: Zpracování signálů získaných z mechanických systémů užitím FFT. Sdělovací technika, Praha 1997. [41] Vítečková, M.: Syntéza lineárních regulačních obvodů, metoda inverze dynamiky. Ostrava, doplňkový učební text FS VŠB-TU Ostrava, 1993. [42] Vítečková, M.: Syntéza číslicových a analogových regulačních obvodů metodou inverze dynamiky. Ostrava, habilitační práce, 1996. [43] Vítečková, M.: L- a Z-transformace. Ostrava, skripta K ATŘ FS VŠB-TU Ostrava, 1995. [44] Víteček, A.: Optimalizace systémů, dynamická optimalizace. Ostrava, skripta FS VŠBTU Ostrava, 1992. [45] Vítečková, M.: Seřízení regulátorů metodou inverze dynamiky. Ostrava, skripta K ATŘ FS VŠB-TU Ostrava, 1998. [46] Zítek, P. - Víteček, A.: Návrh řízení podsystémů se zpožděním a nelinearitami. Praha, Vydavatelství ČVUT Praha, 1999. Manuály programového systému MATLAB: SIMULINK, Dynamic System Simulation Software Ljung, L.: System Identification Toolbox, For Use with MATLAB
151