Cvičení 3 Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze © Rudolf Blažek 2011
Pravděpodobnost a statistika BI-PST, LS 2010/11
Evropský sociální fond Praha & EU: Investujeme do vaší budoucnos@
Cvičení
ˇ o upln ´ rozkladu pravdepodobnosti ˇ Veta ´ em
Bayesova věta
´ Soubor nahodn´ ych jevu˚ B1 , B2 , . . . , Bn se naz´yva´ rozkladem mnoˇziny ⌦ jestliˇze n ˙ ⌦ = [i =1 Bi (disjunktn´ı sjednocen´ı: Bi \ Bj = ? pro kaˇzde´ i 6= j).
ˇ (Veta ˇ o upln ´ rozkladu pravdepodobnosti) ˇ Veta ´ em Nechtˇ B1 , B2 , . . . , Bn je rozklad mnoˇziny ⌦ takov´y, zˇ e P (Bi ) > 0 pro kaˇzde´ i. Pak ˇ a´ pravdepodobnost ˇ Podm´ınen n
Bayesova formule
P ( A) =
X i =1
Bayesova formule
P ( A | Bi ) P ( Bi )
´ pro kaˇzd´y nahodn´ y jev A.
ˇ (Bayes) Veta Dukaz. ˚ Nech tˇ B1 , podm´ B2 , . .ı.n,en rozklad mnoˇziny a⌦aditivity, takov´y, zˇ e P (Bi ) > 0 pro kaˇzde´ i a ˇBne´ je ˇ Z definice pravd epodobnosti P P n n> 0. Pak ˇ ´ necht A n ahodn´ y jev s P ( A ) P (A | B )P (B ) = P ( A \ B ) = P ( A) . i =1
i
i
i =1
i
P ( Bk ) P ( A | Bk )
P ( Bk | A) = P n
.
P (B )P (A | Bi ) BI-PST, LS 2010/11, Pˇredna´ ska ˇ 2
ˇ Roman Kotecky, ´ Rudolf Blaˇzek (FIT CVUT)
i avislost ˇ a´ pravdepodobnost ˇ i =1 ´ Podm´ınen a nez
Rudolf Blažek, Ph.D. (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11
8 / 18
2
(a) Spoˇctˇete pravdˇepodobnost, zˇ e vyroben´y obvod projde testem jako “akceptovateln´y”. Odpovˇed’: Cvičení (b) Spln´ı nyn´ı firma poˇzadavek z´akazn´ıka? Rada: Jak´a je podm´ınˇen´a pravdˇepodobnost, zˇ e obvod je plnˇe funkˇcn´ı za pˇredpokladu, zˇ e proˇsel testem jako “akceptovateln´y”?
Bayesova věta
2. Dle odhadu 90% vyroben´ych integrovan´ych obvod˚u je plnˇe funkˇcn´ıch. Poˇzadavek z´akazn´ıka je vˇsak 99% plnˇe funkˇcn´ıch obvod˚u. Vyroben´e obvody jsou proto otestov´any. Studie uk´azala, zˇ e testem projde jako “akceptovateln´y” pˇribliˇznˇe 80% plnˇe funkˇcn´ıch a 10% vadn´ych obvod˚u. (a) Spoˇctˇete pravdˇepodobnost, zˇ e vyroben´y obvod projde testem jako “akceptovateln´y”. Odpovˇed’: (b) Spln´ı nyn´ı firma poˇzadavek z´akazn´ıka? Rada: Jak´a je podm´ınˇen´a pravdˇepodobnost, zˇ e obvod je plnˇe funkˇcn´ı za pˇredpokladu, zˇ e proˇsel testem jako “akceptovateln´y”? Odpovˇed’: (c) V´yroba obvodu stoj´ı 2Kˇc a jeho test stoj´ı 0.2Kˇc. Obvody, kter´e neprojdou testem jsou skartov´any. Kolik pak celkem stoj´ı dodavatele jeden dodan´y obvod?
Odpovˇed’:
Rudolf Blažek, Ph.D. (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11
3
Cvičení
n ˙ Example . , Bn of events is called a partition of ⌦ if ⌦ = [i =1 Bi (it means and Bi \ Bj = ? whenever i 6= j). What is the probability that in the sequence of
Stromový diagram there are no hearts? A e distinction formula)
= {i-th card is not he be a partition of ⌦ such that P (Bi ) P >(A 0 1for\allAi. \ A3 ) = P ( A1 ) P ( A2 | A1 ) P ( A3 | A1 2 Then i
Illustration of the computation with the help of X • P (A1 \ A2 \ A3 ) P ( A) = P ( A | Bi ) P ( Bi ) Nakreslete stromový n
P (A3 |A1 \ A2 )
i =1
diagram pro příklad
A3
•
Použijte základní obability Bayes formula vzorce
P (A2 |A1 )
P (Ac3 |A1 \ A2 )
A2
• P (A1 \ A2 \ Ac3 )
•
A \ Bi ), by definition of conditional probability and by aditivity,
Bi ) =
=
ˇ FIT CVUT)
Bi )
Pn
i =1
P ( A \ Bi ) = P ( A) .
P ( A \ Bk )
A1 •
= P (Bk | A)
Statistika pro informatiku
P ( A)
P (Ac2 |A1 )
P (A1 )
39/52
• P (Ac1 )
ˇ MI-SPI, ZS 2011/12, Pˇredna´ ska 2
• 6 / 23
•
The probability in a given vertex of the tree is Rudolf Blažek, Ph.D. (ČVUT)
LS2010/11 values on the path stemmingBI-PST, from the root.
Pravděpodobnost a statistika
4
Cvičení
Bayesova věta Z analýzy našeho účtu elektronické pošty jsme zjistili, že
• • •
30% dosud přijatých zpráv byl spam (nevyžádaná pošta). V 65% spamových zpráv se vyskytuje slovo "kopie". Z legitimních zpráv je slovo "kopie" obsaženo pouze v 15%.
Uvažujme nově příchozí zprávu obsahující slovo "kopie".
•
Spočtěte pravděpodobnost, že tato zpráva je spam.
Poznámka:
•
Bayesovské filtry spamu opravdu fungují na podobném principu
Rudolf Blažek, Ph.D. (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11
5
Cvičení
ˇ o upln ´ rozkladu pravdepodobnosti ˇ Veta ´ em
Bayesova věta
´ Soubor nahodn´ ych jevu˚ B1 , B2 , . . . , Bn se naz´yva´ rozkladem mnoˇziny ⌦ jestliˇze n ˙ ⌦ = [i =1 Bi (disjunktn´ı sjednocen´ı: Bi \ Bj = ? pro kaˇzde´ i 6= j).
ˇ (Veta ˇ o upln ´ rozkladu pravdepodobnosti) ˇ Veta ´ em Nechtˇ B1 , B2 , . . . , Bn je rozklad mnoˇziny ⌦ takov´y, zˇ e P (Bi ) > 0 pro kaˇzde´ i. Pak ˇ a´ pravdepodobnost ˇ Podm´ınen n
Bayesova formule
P ( A) =
X i =1
Bayesova formule
P ( A | Bi ) P ( Bi )
´ pro kaˇzd´y nahodn´ y jev A.
ˇ (Bayes) Veta Dukaz. ˚ Nech tˇ B1 , podm´ B2 , . .ı.n,en rozklad mnoˇziny a⌦aditivity, takov´y, zˇ e P (Bi ) > 0 pro kaˇzde´ i a ˇBne´ je ˇ Z definice pravd epodobnosti P P n n> 0. Pak ˇ ´ necht A n ahodn´ y jev s P ( A ) P (A | B )P (B ) = P ( A \ B ) = P ( A) . i =1
i
i
i =1
i
P ( Bk ) P ( A | Bk )
P ( Bk | A) = P n
.
P (B )P (A | Bi ) BI-PST, LS 2010/11, Pˇredna´ ska ˇ 2
ˇ Roman Kotecky, ´ Rudolf Blaˇzek (FIT CVUT)
i avislost ˇ a´ pravdepodobnost ˇ i =1 ´ Podm´ınen a nez
Rudolf Blažek, Ph.D. (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11
8 / 18
6
Cvičení
Jak spravit falešnou minci? (Úplný rozklad pravděpodobnosti) Hoď 2x mincí (Head / Tail; Panna / Orel):
• • •
HT - Ty vyhraješ &
TH - Já vyhraji
HH or TT - zopakuj oba hody HT a TH mají stejnou pravděpodobnost: P(H)P(T)
Dokažte: P(Já vyhraji) = 1/2 ... není to zcela lehké Zopakovat musíme OBA hody, nikoliv přidat jeden
• •
Správný postup: (HH)(TT)(TT)(TH) Chybný postup: HHT ...výhra
•
Pokud první hod je H, tak takonec vyhraji já! Jinak prohraji.
Rudolf Blažek, Ph.D. (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11
7
Cvičení
Jak spravit falešnou minci? (Úplný rozklad pravděpodobnosti) Předpokládejme P(H) = p, P(T)=1-p
•
V každém páru hodů:
• • •
P(HT) = p (1 – p) P(TH) = (1 – p) p P(HH or TT) = p2 + q2
Spočtěte P(Já vyhraji) a P(Ty vyhraješ)
•
Důležitý trik − Úplný rozklad pravděpodobnosti N=počet párů (náhodný “stopping time”)
P (j´ a vyhraji) =
1 X
P (j´ a vyhraji, N = n)
n=1 Rudolf Blažek, Ph.D. (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11
8
Cvičení
Zajímavost: Jak napálit protivníka? 1)+ Postavte minci na hranu na stůl + Udeřte zespodu na desku stolu + Jedna strana je obvykle padne častěji
• •
Otestujte si vlastní minci. Navrhněte jak ji otestovat! (Probereme ve statistice)
2)+ Držte minci ukazováčkem postavenou na hraně + Roztočte minci na stole cvrnknutím + Naučte se, aby přistála nahoru stranou, do které cvrnkete Rudolf Blažek, Ph.D. (ČVUT)
Pravděpodobnost a statistika
BI-PST, LS2010/11
9