Dinamikus rendszerek paramétereinek BAYES BECSLÉSE
Hangos Katalin VE Számítástudomány Alkalmazása Tanszék
1
Bayes-becslések 1. A véletlen Bayes féle fogalma A "véletlen" Bayes féle értelmezése a megfigyelést (mérést vagy kísérletet) végző személy tudása szempontjából osztályozza a változókat. Bayes értelemben véletlen változónak tekintünk minden változót vagy akár paramétert is, amely nem ismert előttünk, mint megfigyelők előtt. Ilyen értelemben az ismeretlen θ rendszerparaméterek valószínűségi véltozóknak tekintendők.
A Bayes formula Klasszikus eset Legyenek adva az alábbi Bi események illetve P (Bi ) valószínűségeik: • B1 , B2 , . . . , Bn ∈ B eseményalgebra, ahol • B1 , B2 , . . . , Bn teljes eseményrendszert alkot, azaz ∪N i=1 Bi = Ω és Bj ∩ Bi = ∅ • P (Bi ) > 0
i = 1, 2, . . . , N
P (Bk | A) =
P (A | Bk )P (Bk ) P (Bk ∩ A) = PN P (A) i=1 P (A | Bi )P (Bi )
2
Bayes-becslések 2. Bayes formula feltételes valószínűségi sűrűségfüggvényekre Jelölések: • az a valószínűségi változó sűrűségfüggvénye: p(a) = fa (x), • az a és b együttes sűrűségfüggvénye: p(a, b) = fab (x1 , x2 ), • az a-nak a b-re vonatkozó feltételes s.f.-e: p(a|b) = f(a|b) (x) p(a, b) p(b|a) = p(a) p(b|a) =
p(a) =
,
Z
p(a, b)db
Ωb
p(a, b) p(a|b)p(b) =R p(a) p(a, b)db
( P (Bk | A) = )
P (Bk ∩ A) P (A | Bk )P (Bk ) = PN P (A) i=1 P (A | Bi )P (Bi )
3
Bayes-becslések 3. A Bayes formula több feltételes sűrűségfüggvényre A feltételes és együttes sűrűségfüggvényekre vonatkozó összefüggés: p(a, b|c) = p(a|b, c)p(b|c) , és p(b|c) =
Z
p(a, b|c) = p(b|a, c)p(a|c)
p(a, b|c)da
Ωa
Ekkor a Bayes formula: p(a|b, c) =
A láncszabály
p(b|a, c)p(a|c) p(a, b|c) p(a, b|c) =R =R p(b|c) p(a, b|c)da p(b|a, c)p(a|c)da
A láncszabály a feltételes és együttes sűrűségfüggvényekre vonatkozó p(a, b) = p(a|b)p(b) összefüggés általánosítása több (N ) valószínűségi változóra. A láncszabályt rekurzív módon vezethetjük le: p(xN , xN −1 , . . . , x1 ) = p(xN |xN −1 , . . . , x1 )p(xN −1 , xN −2 , . . . , x1 ) = p(xN |xN −1 , . . . , x1 )p(xN −1 |xN −2 , . . . , x1 ) . . . p(x1 ) = ··· N Y = ( p(xk |xk−1 , . . . , x1 ))p(x1 ) k=2
4
Dinamikus rendszerek prediktív Bayes modellje Egyszerűség kedvéért: SISO eset. LTI rendszerek bemenet-kimenet modelljének Bayes féle alakja az alábbi feltételes sűrűségfüggvény: p(y(k) | u(k), Dk−1 )
(1)
amely alkalmas előrebecslésre és szabályozótervezésre is, de nem szerepelnek benne a θ rendszerparaméterek. Parametrizált prediktív bemenet-kimenet modell Bayes-féle alakja: p(y(k) | u(k), Dk−1 , θ)
(2)
Fontos, hogy a fenti parametrizált rendszermodellt, azaz a fenti feltételes sűrűségfüggvény alakját a Bayes paraméterbecslésnél adottnak tételezzük fel. A nem parametrizált bemenet-kimenet modell a parametrizált alakból az alábbi összefüggéssel kapható meg: Z k−1 p(y(k) | u(k), D ) = p(y(k), θ | u(k), Dk−1 )dθ Z = p(y(k) | θ, u(k), Dk−1 )p(θ | u(k), Dk−1 )dθ
(3)
A θ paraméterek Bayes féle becslése a p(θ|u(k), Dk−1 ) feltételes sűrűségfüggvvény, amely azonban paraméterbecslés esetén nem függ u(k)-tól, mint feltételtől, hiszen az egy általunk beállított determinisztikus változó p(θ | u(k), Dk−1 ) = p(θ | Dk−1 )
5
(4)
Rekurziv paraméterbecslés a Bayes formulával 1. Egy rekurzív lépés A θ paréterek becslése Bayes értelemben a p(θ|Dk ) feltételes sűrűségfüggvény, amelynek feltételében szereplő adatsorozatot szétválasztjuk a jelen k időpillanat és a k − 1 időpillanatig beérkezett adatokra: p(θ | Dk ) = p(θ | y(k), u(k), Dk−1 ) = p(θ | y(k), Dk−1 ) Ezután a p(a|b, c) = R
p(b|a, c)p(a|c) p(b|a, c)p(a|c)da
feltételes sűrűségfüggvényekre vonatkozó Bayes formulát alkalmazzuk a b ∼ y(k) , a ∼ θ , c ∼ Dk−1 szereposztással és a következő rekurzív paraméterbecslési formulához jutunk: p(θ | Dk ) = R
p(y(k) | Dk−1 , θ)p(θ | Dk−1 ) p(y(k) | Dk−1 , θ)p(θ | Dk−1 )dθ
A formula jobboldalán szereplő, fizikai értelemmel is bíró részek: • p(θ | Dk−1 ) az előző k − 1 időpillanatbeli becslés, • p(y(k) | Dk−1 , θ) az adott parametrizált rendszermodell, • a nevezőben pedig egy normalizálási tényező.
6
(5)
Rekurziv paraméterbecslés a Bayes formulával 1. Nem rekurzív Bayes paraméterbecslési formula Az egylépéses p(θ | Dk ) = R
p(y(k) | Dk−1 , θ)p(θ | Dk−1 ) p(y(k) | Dk−1 , θ)p(θ | Dk−1 )dθ
Bayes paraméterbecslő formulából a láncszabállyal:
p(θ | DN ) =
hQ
N k=1
i p(y(k) | Dk−1 , θ) p0 (θ) N ORM
ahol p0 (θ) = p(θ | D0 ) az úgynevezett prior vagy kezdeti becslés és N ORM egy normalizáló tényező.
7
A Bayes paraméterbecslés tulajdonságai A Bayes paraméterbecslésnek az alábbi fontos, és a többi paraméterbecslési módszertől erősen különböző tulajdonságai vannak. 1. A becslési eljárás eredménye a p(θ|DN ) feltételes valószínűségi sűrűségfüggvény. Ez a módszer elméleti ereje és alkalmazhatósági gyengesége egyben. Elméletileg a becsült θ paraméterekre vonatkozó teljes statisztika rendelkezésre áll, nemcsak aszimptotikusan, hanem véges esetben is, ehhez azonban egy függvényt kell(ene) minden lépésben kiszámítani. 2. A becslés maga a Bayes formulából adódóan természetében rekurzív, végrehajtásához a p(y(k)|Dk−1 , θ) parametrizált rendszermodellen kívül a p0 (θ) prior vagy kezdeti becslés is szükséges. A prior becsléssel a paraméterekről rendelkezésünkre álló technológiai, fizikai vagy üzemeltetői tudás építhető be a paraméterbecslésbe elméletileg tiszta, és jól követhető módon. 3. Belátható, hogy autoregressziós bemenet-kimenet modell és normális eloszlású becslési hiba, valamint normális eloszlású prior becslés mellett a Bayes becslés a standard rekurzív legkisebb négyzetes (LKN) becslésre vezet, tehát ilyen esetben jól számítható.
8
Maximum a posteriori becslés A nem rekurzív Bayes paraméterbecslő formula ML alakja p(θ | DN ) =
hQ
N k=1
i p(y(k) | Dk−1 , θ) p0 (θ)
N ORM formula számlálójában a mért y(k), k = 1, ..., N kimenetek p(y |θ) együttes sűrűségfüggvénye áll N
p(y N |θ) =
N Y
p(y(k)|Dk−1 , θ)
k=1
hiszen a Bayes becslésnél is a rendszer prediktív teljes valószínűségi modelljét használjuk fel.
A maximum a posteriori becslés elve A maximum a posteriori becslés a Bayes becslésből származtatható úgy, hogy a becslés eredményeképpen kapott teljes p(θ|DN ) valószínűségi sűrűségfüggvény helyett annak egy pontbecslését, méghozzá a maximum likelihood elve (legnagyobb valószínűség elve) alapján képezett pontbecslését használjuk.
A maximum a posteriori becslés A Bayes paraméterbecslés nem rekurzív alakja a következő formában is felírható: p(θ | y N ) =
p(y N | θ)p0 (θ) ∼ fy (θ; y N )gθ (θ) p(y N )
Ebből a maximum likelihood elven képezett becslés a Maximum A Posteriori (MAP) becslés: £ ¤ θˆM AP (y N ) = arg max fy (θ; y N )gθ (θ) θ
9
A segédváltozók módszere Instrumental variable method
10
A segédváltozók módszere (Instrumental variable method) Alkalmazása: • elsősorban korrelált mérési hibákkal terhelt esetekben • legkisebb négyzetes módszernél nem garantálható a becslés aszimptotikus torzítatlansága Elve: a regresszor helyett vagy mellett a mért adatoktól függő alkalmas segédváltozókat vezetünk be.
A predikciós hiba és a múltbeli adatok korreláltsága Ideális (fehérzajos) esetben a M(θ) :
yˆ(k | θ) = g(k, Dk−1 ; θ) ε(k, θ) = y(k) − yˆ(k | θ) függetlenek, adott fε (x; k; θ) sűrűségfüggvénnyel
teljes valószínűségi modell garantálja a korrelálatlanságot. "jó" egy becslés, ha a becslési hiba független (korrelálatlan) a múltbeli mért adatoktól. Ha ez nem teljesül, akkor válasszunk egy másik, a múltbeli mért adatoktól függő {ζ(k)} vektort és egy, a predikciós hibára alkalmazott α transzformációt úgy, hogy a két sorozat korrelálatlan legyen, azaz N 1 X ζ(k)α(ε(k, θ)) = 0 N k=1
empirikus keresztkorrelációs együtthatók nullák legyenek. Válasszuk meg a θ paraméter vektor becslését úgy, hogy θˆ kielégítse a a fenti egyenletrendszert. 11
A segédváltozók és a becslés 1. Paraméterekben lineáris egybemenetű-egykimenetű modell esetén: yˆ(k|θ) = ϕT (k)θ ahol ϕ(.) az úgynevezett regresszor.
Standard ARX eset: LKN módszere A rendszermodell: y(k) = ϕT (k)θ0 + ε(k) ahol ε(k) független ϕ(k)-tól. Ilyenkor nincs segédváltozóra szükség. A θ paraméter vektor LKN becslése az alábbi, a kvadratikus veszteségfüggvény minimalizálásából származó lineáris egyenletrendszer megoldásaként állítható elő: ) ( N X 1 LKN ϕ(k)[y(k) − ϕT (k)θ] = 0 θˆN = sol N k=1
12
A segédváltozók és a becslés 2. Nem független predikciós hiba esete A rendszermodell: y(k) = ϕT (k)θ0 + ν0 (k) ahol most ν0 (k) korrelált ϕ(k)-val. Válasszunk a LKN egyenlet megoldásához a korrelált ϕ(k) regresszor helyett egy alkalmas nem-korrelált vektort, ζ(k)-t: elemei a segédváltozók. A segédváltozók módszere szerinti becslés: IV = sol θˆN
(
) N 1 X ζ(k)[y(k) − ϕT (k)θ] = 0 N k=1
egyenletrendszer megoldásaként kapható meg. A becslés zárt alakban: IV θˆN
#−1 N N 1 X 1 X T ζ(k)ϕ (k) ζ(k)y(k) = N k=1 N k=1 "
13
A segédváltozók megválasztása Szükséges feltételek az aszimptotikus torzítatlansághoz Eζ(k)ϕT (k) : nem szinguláris Eζ(k)ν0 (k) = 0
(6) (7)
Szavakban: a segédváltozóknak korrelálatlanoknak kell lenniük a predikciós hibával, de korreláltaknak kell lenniük a regresszorral.
A segédváltozók megválasztása a modell alapján a segédváltozók ζ(k) vektorának mérete azonos kell legyen a ϕ(k) regresszor méretével (és egyben a becsülendő θ paraméterek számával): dim ζ(k) = dim ϕ(k) = dim θ
A segédvektor fenti feltételeknek eleget tevő, de az adott alkalmazás igényeinek legjobban megfelelő megválasztására ugyanakkor nincs általános szabály: ezt mindenkor az adott feladatról rendelkezésünkre álló előzetes ismeretek és a mérnöki intuíció alapján végezzük.
14
Példa: ARMAX modellek paramétereinek becslése segédváltozókkal A egybemenetű-egykimenetű ARMAX modell prediktív alakja: y(k) = −a1 y(k − 1) − ... − ana y(k − na ) + +b1 u(k − 1) + ... + bnb u(k − nb ) + c0 e(k) + ... + cnc e(k − nc ) ahol e(k), k = 1, ..., N fehérzaj sorozat. A regresszor, a paramétervektor és a predikciós hiba: ϕ(k) = [−y(k − 1) ... − y(k − na ) u(k − 1) ... − u(k − nb )]T
, θ0 = [a1 ... ana b1 ... bnb ]T , ν0 (k) = c0 e(k) + ... + cnc e(k − nc )
és a predikciós hiba korrelált a regreszorban lévő y(k − i), i = 1, ..., na mért kimenetekkel.
A segédváltozók megválasztása A regresszor vektorában csak a kimeneteknek megfelelelő elemeket cseréljük ki új segédváltozókra úgy, "hasonlítsanak" dinamikájukban a kimenetekre, de mégse legyenek korreláltak ν0 (k)-val. ζ(k) = [−v(k − 1) ... − v(k − na ) u(k − 1) ... − u(k − nb )]T
,
v(k) = K(q −1 )u(k) =
ahol K(q −1 ) egy alkalmas lineáris időinvariáns (állandó együtthatós) szűrő, úgy hogy deg E(q −1 ) = deg B(q −1 ) = nb
,
A szűrő optimális megválasztása pont a Kopt (q −1 ) = ha a valódi B(q −1 ) és A(q −1 ) rendszerpolinomokat ismernénk. 15
deg F (q −1 ) = deg A(q −1 ) = na B(q −1 ) A(q −1 )
E(q −1 ) u(k) F (q −1 )