Kansrekening en Statistiek College 1 Dinsdag 14 September
1 / 34
Literatuur
http://www.phil.uu.nl/˜ iemhoff Applied Statistics for the Behavioral Sciences - 5th edition, Dennis E. Hinkle, William Wiersma, and Stephen G. Jurs. Hoofdstuk 1 t/m 4 van de (legale) online versie van Introduction to Probability, Charles M. Grinstead and J. Laurie Snell: http://www.dartmouth.edu/∼chance/teaching aids/books articles/ probability book/book.html. Optioneel: software R.
2 / 34
Kansrekening en Statistiek?
• Wat is de kans dat ik de loterij win? Kansspelen • Bevordert luieren de fantasie? Psychologie • Hoe leert mijn spamfilter wat spam is? Informatica • Does God play dice with the universe? Natuurkunde • Is Lucia de B. schuldig? Nee. Rechtspraak • Werkt paracetamol? Geneeskunde • Wat is een kans? Filosofie
3 / 34
Inductief redeneren
Deductief redeneren (logica): Uit dit volgt dat. Inductief redeneren (kansrekening): Uit dit volgt met deze waarschijnlijkheid dat. Als dit gebeurt is de kans dat dat gebeurt zo en zoveel.
4 / 34
Indeling college
1 Kansrekening. 2 Statistiek. Onderweg Toepassingen, geschiedenis, filosofie en kritiek.
5 / 34
Kritisch zijn
6 / 34
1 Kansrekening
Indeling: • Axioma’s van de kansrekening • Eigenschappen • Discrete stochasten • Natuurlijke getallen.
7 / 34
Vragen: verjaardag
Wat is de kans dat twee van ons op dezelfde dag jarig zijn?
8 / 34
Vragen: Monty Hall
Achter ´e´en van drie gesloten deuren staat een auto, achter de andere twee een geit. Jij gaat voor een deur staan. Bijv: geit
geit
auto
jij
De quizmaster Monty Hall opent een van de twee deuren waar jij niet voor staat en waarachter een geit staat: geit
?? ?? ?? ?
geit
auto
jij
Jij mag blijven staan of voor de andere gesloten deur gaan staan. Vervolgens win je dat wat achter jouw deur staat. Is het beter altijd van deur te veranderen (indien je geen geit wilt)?
9 / 34
Vragen: loterij
Wat is de kans dat je bij een loterij met 100 loten en drie prijzen een prijs wint als je 7 loten koopt? Is die kans veel groter dan als je 5 loten koopt?
10 / 34
Vragen: cirkels
'$ &% Een computer genereert willekeurige punten in de grote cirkel. Wat is de kans dat het punt in de kleine cirkel valt? In tegenstelling tot de vorige vragen is bij dit experiment het aantal uitkomsten oneindig.
11 / 34
Vragen: natuurlijke getallen
Wat is de kans dat je uit een zak gevuld met de natuurlijke getallen een 7 trekt?
12 / 34
Vragen: het drie gevangenen probleem
Er zijn drie gevangen, A, B en C , die weten dat er twee van hen willekeurig gekozen en vervolgens terechtgesteld zullen worden. De overlevingskans voor ieder van hen is dus 31 . A vraagt aan Rita, de cipier, om ´e´en gevange ongelijk A te noemen die terechtgesteld wordt. Rita zegt: B. Wat is nu de kans dat A overleeft? Er lijken twee antwoorden mogelijk: • A krijgt geen nieuwe informatie, hij wist toch al dat B of C terechtgesteld zou worden, dus zijn overlevingskans blijft 13 . • Eerst waren er drie mogelijkheden: A of B of C overleeft. Nu zijn er twee mogelijkheden: A of C overleeft. De kans dat A overleeft is 12 . Wat is de juiste redenering?
13 / 34
Vragen: een rechtszaak
De rechtszaak People vs Collins (1968) in Californi¨e: Een portemonnee wordt gestolen en een getuige zegt een blonde vrouw met staart te hebben zien vluchten in een gele auto bestuurd door een zwarte man met baard. Een aantal dagen later wordt er een paar dat aan deze beschrijving voldoet gearresteerd, maar er wordt geen bewijsmateriaal gevonden. Hoe zou je kansrekening kunnen toepassen in deze rechtszaak?
14 / 34
Vragen: spam
Je laat een spamfilter weten dat een mail onterecht als spam is geclassificeerd. Volgens welke regels past het filter zich aan, d.w.z. hoe leert een spamfilter?
15 / 34
Uitkomstenruimte
Def. Een kansexperiment heeft een aantal mogelijke uitkomsten. De uikomstenruimte (sample space) is de verzameling S van alle mogelijke uitkomsten. (Het boek gebruikt Ω in plaats van S.)
16 / 34
Uitkomstenruimte
Vb. • Twee dobbelstenen gooien en het aantal ogen tellen: S = {2, 3, . . . , 12}. • Een dobbelsteen en een munt gooien: S = {1K , 1M, 2K , 2M, . . . , 6K , 6M} = {1, . . . , 6} × {K , M}. • Een vis uit een vijver hengelen: S =
17 / 34
Uitkomstenruimte
Vb. Het aantal manieren om drie schilderijen naast elkaar te hangen.
S = {ASD,ADS,SAD,SDA,DAS,DSA}.
18 / 34
Uitkomstenruimte: volgorde
Vb. • Twee willekeurige getallen onder de 2 kiezen ongeacht de volgorde: S = {(0, 0), (0, 1), (1, 1)}. • Een willekeurig getal onder de 2 kiezen, en dan nogmaals: S = {(0, 0), (0, 1), (1, 0), (1, 1)}. • Een commissie van drie parlementsleden kiezen: S bestaat uit alle verzamelingen van drie parlementsleden. • Een commissie van drie parlementsleden kiezen, bestaande uit een voorzitter, secretaris en penningmeester: S bestaat uit alle rijtjes van drie parlementsleden.
19 / 34
Gebeurtenis
Def. Een gebeurtenis (event) is een deelverzameling A van de uitkomstenruimte S: A ⊆ S.
@ @
@ @
@ @ @ S @ A @ @ @ @
20 / 34
Gebeurtenis
Vb. • Even gooien bij het gooien van een dobbelsteen: A = {2, 4, 6}.
1
3
5
2
4
6
• Positieve uitslag bij het testen op een ziekte: A = {ziek}. • Een bruine, grijze en zwarte hoed worden willekeurig aan haakjes 1 t/m 3 gehangen. De gebeurtenis dat de grijze hoed aan haakje 1 of 2 en de zwarte hoed aan 1 of 3 hangt: A = {GBZ,BGZ,ZGB}.
21 / 34
Kansen toekennen
Vraag: Wat is de kans op een gebeurtenis? Doel: Kansen kunnen berekenen en vergelijken. Inductief redeneren. Intu¨ıtie: Als alle uitkomsten even waarschijnlijk zijn, dan is de kans op elke uitkomst hetzelde.
22 / 34
De drie axioma’s van de kansrekening Def. De kans op gebeurtenis A wordt aangeduid met P(A). Def. Het aantal elementen in A wordt aangeduid met #A.
Axioma’s • Voor elke gebeurtenis A geldt P(A) ≥ 0. • Voor de uitkomstenruimte S geldt P(S) = 1. • Als A1 , A2 , . . . onafhankelijk (onderling disjunct) zijn, dan geldt P(
∞ [ i=1
Ai ) =
∞ X
P(Ai ).
i=1
St. Als S een eindige uitkomstenruimte is waarin alle uitkomsten dezelfde kans hebben, dan geldt voor elke gebeurtenis A: P(A) =
#A aantal elementen van A = . #S aantal elementen van S
23 / 34
Kansen toekennen
•
•
•
•
•
•
•
•
P(A) =
•
#A 3 = . #S 9
24 / 34
Kansen toekennen
Vb. S bestaat uit zes schoeisels:
Bij het willekeurig pakken van een schoeisel is de kans op een vis 31 . De kans op een slipper is 23 .
25 / 34
Kansen toekennen
Vb. • Een bruine, grijze en zwarte hoed willekeurig aan haakjes 1 t/m 3 hangen: P(BGZ ) = P(BZG ) = P(GBZ ) = P(GZB) = P(ZGB) = P(ZBG ) = 61 . • Een dodeca¨eder gooien: P(1) = P(2) = · · · = P(12) =
1 . 12
26 / 34
Kansen toekennen
Vb. De kans op een blauwe of grijze bal bij het trekken van 1 bal uit een vaas met 2 blauwe, 3 grijze en 4 paarse ballen: P(B of G ) =
# blauwe en grijze ballen 5 = . # ballen 9 •
@ @ •
@ @ @
•
•
• •
•
•
@ • @ @ @
27 / 34
Kansen toekennen: ongeordend
Vb. Uit een groep van 3 vrouwen en 2 mannen wordt een commissie van drie mensen (willekeurig) gekozen. De kans op een commissie van 2 vrouwen en 1 6 man is P(twee vrouwen en een man) = 10 = 35 : S
={
{~,~,~}, {|,~,~}, {|,~,~}, {|,~,~}, ? {|,~,~}, {|,~,~}, {|,~,~}, ? {|,|,~}, {|,|,~}, {|,|,~} }.
28 / 34
Kansen toekennen: geordend Vb. Uit een groep van 3 vrouwen en 2 mannen wordt een commissie bestaande uit een voorzitter, secretaris en penningmeester gekozen. De kans op een commissie waarbij de voorzitter en secretaris vrouwen zijn en de 12 penningmeester een man, is P(twee vrouwen en een man) = 60 = 15 : S
={
~~~, ~~~, ~~~, ~~~, ~~~, ~~~, |~~, |~~, |~~, |~~, |~~, |~~, ~|~, ~|~, ~|~, ~|~, ~|~, ~|~, ~~|, ~~|, ~~|, ~~|, ~~|, ~~|, ? |~~, |~~, |~~, |~~, |~~, |~~, ~|~, ~|~, ~|~, ~|~, ~|~, ~|~, ~~|, ~~|, ~~|, ~~|, ~~|, ~~|, ? ||~, ||~, ||~, ||~, ||~, ||~, |~|, |~|, |~ |, |~|, |~|, |~|, ~ ||, ~||, ~||, ~||, ~||, ~|| }.
29 / 34
Stochasten Def. Een stochastische variabele (stochast, random variable) is een variabele waarvan de waarden de uitkomsten van een kansexperiment zijn, d.w.z. de waarden van de bijbehorende uitkomstenruimte. Stochasten worden aangeduid met X , Y , Z . Als S een aftelbare uitkomstenruimte van een experiment is en X is de bijbehorende stochast, dan is de kansverdeling (verdeling, distributie, distributiefunctie) van X de functie f (m in boek) die aan elke waarde van X de kans op die waarde toekent. Er geldt: •
P(X = i) = f (i)
•
f : S → [0, 1]
•
X
f (i) = 1
i∈S
•
P(A) =
X
f (i).
i∈A
30 / 34
Stochasten
Vb. • Een dobbelsteen gooien: de waarden van X zijn 1, 2, 3, 4, 5, 6. De verdeling f wordt gegeven door f (1) = · · · = f (6) = 16 . Compacte notatie: “P(X = 2)” i.p.v. “P(2 gooien)”. • De kans op een zekere ziekte is 0.6. Testen op de ziekte: de waarden van X zijn pos en neg. De verdeling f wordt gegeven door f (pos) = 0.6 en f (neg ) = 0.4.
31 / 34
Stochasten
Vb. Een bal trekken uit een vaas met 2 blauwe, 3 grijze en 4 paarse ballen: •
@ @ •
@ @ @
•
•
• •
•
•
@ • @ @ @ De waarden van X zijn B, G en P. f (B) = P(X = B) = 92 , f (G ) = P(X = G ) = 93 , f (P) = P(X = P) = 49 . P(X = B of X = G ) = 59 .
32 / 34
Conventie
Ten behoeve van een compacte notatie kan het nuttig zijn om een stochast X alleen getalswaarden te laten aannemen. Vb. De kans op een zekere ziekte is 0.6. Het experiment is het testen op de ziekte. Voor de waardes van de bijbehorende stochast worden niet pos en neg maar 1 (pos) en 0 (neg) genomen. Dat geeft P(X = 0) = 0.4 en P(X = 1) = 0.6.
33 / 34
Finis
34 / 34