Pˇr´ıklady aplikac´ı bayesovsk´ych s´ıt´ı Jiˇr´ı Vomlel ˇ ´ ˇ CR UTIA, Akademie ved http://www.utia.cas.cz/vomlel
6. prosince 2011
ˇ ´ J. Vomlel (UTIA AV CR)
Aplikace bayesovsk´ych s´ıt´ı
6. prosince 2011
1/3
Jednoduch´y pˇr´ıklad z medic´ıny X1 X2 X3 X4 X5 X6 X7 X8
“Pobyt v Asii” ´ “Kuˇrak” ´ “Tuberkuloza” “Rakovina plic” ´ et ˇ pruduˇ “Zan ˚ sek” ´ nebo rakovina” “Tuberkuloza ´ “Positivn´ı rentgenov´y nalez” “Duˇsnost”
ˇ ´ J. Vomlel (UTIA AV CR)
X1
X2
X3
X4
X5
X6
X7
Aplikace bayesovsk´ych s´ıt´ı
X8
6. prosince 2011
2/3
Jednoduch´y pˇr´ıklad z medic´ıny X1 X2 X3 X4 X5 X6 X7 X8
“Pobyt v Asii” ´ “Kuˇrak” ´ “Tuberkuloza” “Rakovina plic” ´ et ˇ pruduˇ “Zan ˚ sek” ´ nebo rakovina” “Tuberkuloza ´ “Positivn´ı rentgenov´y nalez” “Duˇsnost”
X1
X2
X3
X4
X5
X6
X7
X8
ˇ Sdruˇzena´ pravdepodobnostn´ ı distribuce definovana´ bayesovskou s´ıt´ı: P(X1 , X2 , . . . , X8 ) =
8 Y
P(Xi | Xj j∈Pa(i) )
i=1
ˇ ´ J. Vomlel (UTIA AV CR)
Aplikace bayesovsk´ych s´ıt´ı
6. prosince 2011
2/3
Jednoduch´y pˇr´ıklad z medic´ıny X1 X2 X3 X4 X5 X6 X7 X8
“Pobyt v Asii” ´ “Kuˇrak” ´ “Tuberkuloza” “Rakovina plic” ´ et ˇ pruduˇ “Zan ˚ sek” ´ nebo rakovina” “Tuberkuloza ´ “Positivn´ı rentgenov´y nalez” “Duˇsnost”
X1
X2
X3
X4
X5
X6
X7
X8
ˇ Sdruˇzena´ pravdepodobnostn´ ı distribuce definovana´ bayesovskou s´ıt´ı: P(X1 , X2 , . . . , X8 ) =
8 Y
P(Xi | Xj j∈Pa(i) )
i=1
= P(X8 |X6 , X5 ) · P(X7 |X6 ) · P(X6 |X3 , X4 ) ·P(X5 |X2 ) · P(X4 |X2 ) · P(X3 |X1 ) · P(X2 ) · P(X1 ) ˇ ´ J. Vomlel (UTIA AV CR)
Aplikace bayesovsk´ych s´ıt´ı
6. prosince 2011
2/3
ˇ a´ pravdepodobnost ˇ Podm´ınen ˇ ´ kdyˇz v´ıme, zˇ e je “Jaka´ je pravdepodobnost, zˇ e pacient ma´ tuberkulozu ´ a trp´ı duˇsnost´ı?” kuˇrak
ˇ ´ J. Vomlel (UTIA AV CR)
Aplikace bayesovsk´ych s´ıt´ı
6. prosince 2011
3/3
ˇ a´ pravdepodobnost ˇ Podm´ınen ˇ ´ kdyˇz v´ıme, zˇ e je “Jaka´ je pravdepodobnost, zˇ e pacient ma´ tuberkulozu ´ a trp´ı duˇsnost´ı?” kuˇrak X1
X2
X3
X4
X5
X6
X7
P(X3 , |X2 = 1, X8 = 1) =
ˇ ´ J. Vomlel (UTIA AV CR)
X8
P(X2 = 1, X3 , X8 = 1) P(X2 = 1, X8 = 1)
Aplikace bayesovsk´ych s´ıt´ı
6. prosince 2011
3/3
ˇ a´ pravdepodobnost ˇ Podm´ınen ˇ ´ kdyˇz v´ıme, zˇ e je “Jaka´ je pravdepodobnost, zˇ e pacient ma´ tuberkulozu ´ a trp´ı duˇsnost´ı?” kuˇrak X1
X2
X3
X4
X5
X6
X7
P(X3 , |X2 = 1, X8 = 1) =
ˇ ´ J. Vomlel (UTIA AV CR)
X8
P(X2 = 1, X3 , X8 = 1) P X3 P(X2 = 1, X3 , X8 = 1)
Aplikace bayesovsk´ych s´ıt´ı
6. prosince 2011
3/3
ˇ a´ pravdepodobnost ˇ Podm´ınen ˇ ´ kdyˇz v´ıme, zˇ e je “Jaka´ je pravdepodobnost, zˇ e pacient ma´ tuberkulozu ´ a trp´ı duˇsnost´ı?” kuˇrak X1
X2
X3
X4
X5
X6
X7
P(X3 , |X2 = 1, X8 = 1) = P(X2 = 1, X3 , X8 = 1) =
X8
P(X2 = 1, X3 , X8 = 1) P X3 P(X2 = 1, X3 , X8 = 1) X P(X1 , X2 = 1, X3 , . . . , X7 , X8 = 1) X1 ,X4 ,X5 ,X6 ,X7
ˇ ´ J. Vomlel (UTIA AV CR)
Aplikace bayesovsk´ych s´ıt´ı
6. prosince 2011
3/3
Aplikace 1: modelova´nı´ deˇdicˇny´ch nemocı´
17
18
19
20
Aplikace 2: podpora rozhodova´nı´ Cı´l: maximalizace ocˇeka´vane´ho uzˇitku
21
22
23
24
Aplikace 3: Technicka´ diagnostika - popis proble´mu • Prˇ´ıcˇiny proble´mu (za´vady) C ∈ C . • Akce A ∈ A - opravne´ kroky, ktere´ mohou odstranit za´vadu. • Ota´zky Q ∈ Q - kroky, ktere´ mohou pomoci identifikovat, kde je za´vada. • Ke kazˇde´ akci i ota´zce je prˇirˇazena cena (c A znacˇı´ cenu akce A, cQ cenu ota´zky Q). Cena mu˚zˇe znamenat: dobu potrˇebnou k provedenı´ akce cˇi ota´zky, cenu za na´hradnı´ dı´l, ktery´ pouzˇijeme rizikovost akce neˇjaka´ kombinace vy´sˇe uvedeny´ch.
25
Prˇ´ıklad technicke´ diagnostiky tiska´rny Trouble: sveˇtly´ tisk. Troubleshooter: doporucˇı´ kroky, ktere´ pomohou odstranit “trouble” Akce a ota´zky
cena
A1 : Remove, shake and reseat toner
5
A2 : Try another toner
15
A3 : Cycle power
1
Q1 : Is the printer configuration page printed light?
2 P(Ci )
Mozˇne´ za´vady prˇi sveˇtle´m tisku C1 : Toner low
0.4
C2 : Defective toner
0.3
C3 : Corrupted dataflow
0.2
C4 : Wrong driver setting
0.1
26
Light Print Problem - Bayesian Network Actions Causes Problem
A1
C1 A2
c1 c2 c3 c4
C2 A3 C3 Questions C4 Q1
27
Sveˇtly´ tisk - strategie odstraneˇnı´ za´vady
A1 = yes A1 = no
Q1 = no
A2 = no Q1 = yes A2 = yes
28
Application 4: Adaptivnı´ testova´nı´ znalostı´ Prˇ´ıklady u´loh: 3 4
T1 :
·
5 6
1 6
+
T3 :
1 4
· 1 21 1 2
·
−
1 8
1 12
T2 :
T4 :
1 2
·
1 3
+
1 3
=
15 24
−
1 8
=
2 12
+
1 12
=
=
1 4
·
3 2
=
3 8
=
1 4
·
2 3
=
2 12
29
=
5 8
1 8
=
3 12
=
1 4
=
1 6
−
.
4 8
=
1 2
Za´kladnı´ a operacˇnı´ dovednosti CP
Porovna´va´nı´ (spol. cˇitatel nebo jmenovatel)
1 2
> 13 ,
AD
Scˇı´ta´nı´ (spol. jmenovatel)
1 7
+
2 7
=
1+2 7
=
3 7
SB
Odecˇı´ta´nı´ (spol. jmenovatel)
2 5
−
1 5
=
2−1 5
=
1 5
MT
Na´sobenı´
1 2
·
CD
Spol. jmenovatel
1 2 2, 3
3 4 6, 6
CL
Kra´cenı´
4 6
=
2·2 2·3
CIM
Konv. na slozˇ. zlomek
7 2
=
3·2+1 2
CMI
Konv. na nepravy´ zlomek
3 12 = 3·22+1 =
30
3 5
=
2 3
>
1 3
3 10
=
=
2 3
= 3 12 7 2
Sˇpatne´ postupy Oznacˇenı´
Popis
MAD
a+c b+d −c − = ba− d c a·c ·b = b · bc = ab+·bc · dc = ab··dc · dc = ba+·cd a bc = ac·b
MSB MMT1 MMT2 MMT3 MMT4 MC
a b a b a b a b a b a b
+
c d c d
31
Vy´skyt
=
14.8% 9.4% 14.1% 8.1% 15.4% 8.1% 4.0%
Model studenta
HV2
AD
HV1
SB
ACMI
ACIM
ACL
ACD
CMI
CIM
CL
CD
MT
MMT1
MMT2
MMT3
CP
MAD
MSB
MC
32
MMT4
Model u´lohy T1
T1
⇔
3 5 · 4 6
−
1 15 1 5 1 4 1 = − = − = = 8 24 8 8 8 8 2
MT & CL & ACL & SB & ¬ MMT3 & ¬ MMT4 & ¬ MSB CL
ACL
MT
SB
MSB
MMT4
T1
MMT3
P(X1 | T1) X1
33
Model studenta spojeny´ s modely ota´zek
34
Uzˇitkovou funkcı´ je informacˇnı´ zisk “Cˇ´ım nizˇsˇ´ı je entropie, tı´m vı´ce o studentovi vı´me.”
H ( P(X)) = − ∑ P(X = x) · log P(X = x) x
entropy
1
0.5
0
0
0.5 probability
1
Informacˇnı´ zisk v uzlu n strategie IG (en )
=
H ( P(S)) − H ( P(S | en )) 35
Skill Prediction Quality 92
adaptive average descending ascending
90
Quality of skill predictions
88 86 84 82 80 78 76 74
0
2
4
6
8
10
12
Number of answered questions
36
14
16
18
20