Markov modellek 2015.03.19.
Markov-láncok Markov-tulajdonság: egy folyamat korábbi állapotai a későbbiekre csak a jelen állapoton keresztül gyakorolnak befolyást. Semmi, ami a múltban történt, nem ad előrejelzést a jövőre nézve. Markov-láncok: speciális diszkrét sztochasztikus folyamatok, melyek Markov-tulajdonságúak. Pl. érmedobás: van egy szabályos érménk, ha 10-szer fejet dobtunk, ugyanúgy ½ valószínűséggel dobunk 11-edszer is fejet.
Időjárás Állapotok: s1=napos, s2=borús, s3=esős Kérdés: mi az esélye, hogy egy napos állapot után {napos, esős} sorozat következzen? Átmenet-valószínűség: (pij) annak a valószínűsége, hogy a folyamat egy időperiódus alatt az i állapotból a j-be lép át. Segítségével felírható az átmenet-valószínűségi mátrix. P({s1,s1,s3} Is1}=1*p11*p13=1*0.8*0.3=0.24
Részvényárfolyam Ha egy részvény árfolyamáról szeretnénk valamilyen elemzést készíteni, sok esetben elég csak annyit tudnunk, hogy az adott részvény árfolyama a vizsgált napokon nőtt vagy csökkent. Becsülni szeretnénk a következő napi, illetve a hosszú távú változását. 1. Csak a legutolsó változás befolyásolja a következő napi árfolyamot. 2. A legutolsó két nap változása befolyásolja a következő napi árfolyamot.
Részvényárfolyam nap
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
mozgás
N
C
C
N
N
C
C
N
C
C
N
C
C
C
N
nap
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
mozgás
C
N
C
C
N
C
N
N
C
N
C
C
N
C
C
N
C
N
2/12
10/12
C
9/17
8/17
Részvényárfolyam Szükségünk van a kezdeti eloszlásra, valamint az átmenetvalószínűségi mártixra (P). A kezdeti eloszlás: Q(0)=(0,1) (mert a 30. napon csökkent az árfolyam) Q(1)=(9/17 , 8/17), azaz 0,47 valószínűséggel csökkenni fog az árfolyam a 31. napon. Ha arra vagyunk kíváncsiak, n nap múlva, mekkora eséllyel fog csökkenni az árfolyam: Q(n)=Q(0)*Pn
Csökkenés valószínűsége a következő 1 hétben
Részvényárfolyam Az 5. naptól megfigyelhető, hogy a csökkenés valószínűsége 0,6115 körüli értékeket vesz fel. Ennek oka, hogy az átmenet-valószínűségi mátrix ergodikus. (Minden állapot visszatérő aperiodikus, és az állapotok kommunikálnak egymással.)
Részvényárfolyam/2 Utolsó két nap mozgásait vesszük figyelembe. Ekkor 4 állapotot és 28 átmenetet vizsgálunk: NN (2 db) , NC (10 db) , CN (9 db), CC (7 db) NNC (2 db), így az NN-NC átmenet relatív gyakorisága 2/2. CNC (7 db), így a CN-NC átmenet relatív gyakorisága 7/9. Mivel az utolsó két nap csökkent az árfolyam, a kezdeti eloszlás: Q(1)=(0, 0,0, 1)
Részvényárfolyam/2
NN
NC
CN
CC
NN
0
1
0
0
NC
0
0
3/10
7/10
CN
2/9
7/9
0
0
CC
0
0
6/7
1/7
Részvényárfolyam/2 Ugyanúgy járunk el, mint a korábbi feladatnál: Q(1)=(0, 0, 0.8571, 0.1429) Eszerint a csökkenés valószínűsége 0.1429, ami jóval kisebb, mint abban az esetben, mikor csak az utolsó napi mozgást vettük figyelembe. Az első pár napban itt is nagyobb ingadozások lehetnek (pl. a 2. nap 0.0204, a 3. nap 0.4696 valószínűséggel csökken az árfolyam).
Rejtett Markov modell (HMM) Az állapotokat nem ismerjük (rejtettek), megfigyelések segítségével következtetünk az állapotok egy olyan valószínűsíthető sorozatára, mely a megfigyelt eseményeket okozhatta. Pl. szabadidős tevékenységek alapján következtethetünk időjárásra Hasonlóan az egyszerű Markov modellekhez, átmenet-valószínűségi mátrixok, valamint a megfigyelt adatokra illesztett kezdeti eloszlás segítségével tudjuk vizsgálni a háttérben lévő Markov-lánc fejlődését. Az illesztett eloszlás függ az egyes rejtett állapotoktól, velük együtt változik.
Beszédfelismerés Beszélt szöveget hallva meg akarjuk határozni a beszédben szereplő szó/fonémasorozatot. Figyelembe kell venni, hogy különböző nyelveknél mások a karakterszekvencia-eloszlások, így különböző valószínűségek is társulnak az egyes karakterátmenetekhez (pl. „th”). Felépíthető HMM a nyelvfelismerési problémára is, mely ezekre a különbségekre épít, majd következtet egy ismeretlen dokumentum nyelvére.
Betegség előrehaladása ●
●
●
Betegségek előrehaladása leírható azok súlyosságának fokozataival. Sok esetben ismeretlen a betegség kialakulásának ideje, valamint az egyes kontrollok közti időszakokban történő folyamatos változás. Számít a vizsgálatok időpontjainak eloszlása (pl. a betegség egy súlyosabb fázisában gyakrabban szükségesek a kontrollok), azonban nem minden esetben informatívak.
Bronchiolitis Obliterans Szindróma (BOS) Tüdőátültetés után leggyakrabban kialakuló tünetegyüttes, mely teljesen tönkreteszi a szervezet által idegennek tekintett beültetett tüdőt. Vizsgálati módszer: FEV1 (forced expiratory volume in 1 second)
Kiindulópont ●
●
●
●
BOS-re diszkrét folyamatként tekintünk 3 állapottal: 1:még nem alakult ki (FEV1:100%) 2:BOS (FEV1:54%) 3:halál Megfigyeléseink az egyes FEV1-tesztek Transzplantáltak adatait vizsgáljuk – Normális eloszlásúak ismeretlen paraméterekkel (ezek az egyes állapotoktól függnek) Akut események befolyásolják a FEV1 eredményeket
A modell ●
●
●
●
●
Kérdés: a transzplantáció után várhatóan mikor jelentkezik a BOS? Kialakulása után mennyi ideig élhetnek a betegek? 3-állapotú modell (átmenet-mátrix) A FEV1 eredmények normális eloszlást követnek, a paraméterek ismeretlenek és különböznek a BOS 1., valamint 2. állapotáétól. Feltehető, hogy az 1. állapotban a várható érték 100, a szórás 16, a 2. állapotban 54 a várható érték és 18 a szórás. Becsülni szeretnénk a paramétereket (MLE)
Eredmények Az 1. állapotban a mérőbázis 98%, míg a 2. állapotban ez 52%. Ezeket az időközben felmerülő akut események 8%-kal csökkentik. A transzplantáció után átlagosan közel 4 év múlva alakul ki a betegség, mellyel még közel 3 és fél évig élhetnek a betegek.