Statistiek
cursus Statistiek 2 mei 2012
werkcollege 4 ch6 Peck & Devore - probability
2012.05.02
Statistiek
huiswerk bespreken • P&D • opgaven Ch.3: 16, 30 • opgaven Ch.4: 12, 14, 15, 24, 31, 38, 39, 60, 61, 62
2012.05.02
Statistiek
2012.05.02
1
Statistiek
intuïties over kans • er is 15% kans dat mijn trein vertraagd is • zaterdag is de kans op neerslag 50% • bellen tijdens het autorijden, ook handsfree, verdubbelt de kans op een ongeluk – www.3vo.nl
• per maand wordt 1 winnaar miljonair in de Staatsloterij (kans 1:3.350.000); per jaar worden 5 mensen in Nederland door de bliksem getroffen (kans 1:3.200.000) 2012.05.02
Statistiek
kans • een Nederlands scrabble-spel heeft N=102 letters, waarvan NA=6 met de letter A erop. • wat is de kans om een A te trekken? • kans op A = Probabiliteit (A) = P(A) = NA / N = 6/102 = 0.059 2012.05.02
Statistiek
kans is proportie • teller altijd kleiner dan noemer; dus kans P altijd tussen 0 en 1: proportie • complementaire kansen: P(niet-A) = 1–P(A) (N–NA) / N = 96/102 = .941 = 1–.059 2012.05.02
2
Statistiek
enkele trekking • een Nederlands scrabble-spel heeft N=102 letters, waarvan 38 klinkers (Vocalen) (A,E,I,O,U,Y) 62 medeklinkers (Consonanten) 2 blanco • P(Voc) = 38/102 = .373 P(Cons) = 62/102 = .608 2012.05.02
Statistiek
twee letters • twee letters trekken, met teruglegging • 4 mogelijke uitkomsten: {V en V, V en C, C en V, C en C} of { V V, V C, C V, C C } • bij en worden kansen vermenigvuldigd
2012.05.02
Statistiek
kansen vermenigvuldigen (en) P(Voc) P(Cons)
uitkomst
= 38/102 = .373 = 62/102 = .608
P(uitkomst)
VV
.373 x .373
= .139
VC
.373 x .608
= .227
CV
.608 x .373
= .227
CC
.608 x .608
= .370 2012.05.02
3
Statistiek
kansen vermenigvuldigen (en) • de kans op één gecombineerde uitkomst van twee of meer onafhankelijke gebeurtenissen, is het product van de kansen van die gebeurtenissen.
2012.05.02
Statistiek
kansen optellen (of) • wat is de kans op één van de uitkomsten uit de deelverzameling {VV,CC}, dwz VV of CC? • uitkomsten VV en CC sluiten elkaar uit P(VV,CC)
= P(VV) + P(CC) = = .139 + .370 = .509 2012.05.02
Statistiek
kansen optellen (of) • de kans op één uitkomst uit een deelverzameling van mogelijke uitkomsten die elkaar wederzijds uitsluiten, is de optelsom van de kansen van de mogelijke uitkomsten in die deelverzameling. • Compleet: {VV,VC,CV,CC} P(VV,VC,CV,CC) = 1 = kans op VV of VC of CV of CC 2012.05.02
4
Statistiek
kansen optellen (of) • voor één trekking van een enkele letter sluiten de verschillende uitkomsten (A,B,C,...,X,Y,Z,blanco) elkaar wederzijds uit. P(Voc)
= P(A,E,I,O,U,Y) = = P(A)+P(E)+P(I)+P(O)+P(U)+P(Y) = 6/102 + 18/102 + 4/102 + 6/102 + 3/102 + 1/102 = 38/102 = .373 QED 2012.05.02
Statistiek
terzijde • in een gewoon spelletje scrabble zijn de twee opeenvolgende trekkingen niet onafhankelijk, omdat de getrokken letter niet wordt teruggestopt in de zak. • wat is dan de kans op één gecombineerde uitkomst V1 en V2 ? • P(V1&V2) = P(V1) x P(V2) = = (38/102) x (37/101) = .136 2012.05.02
Statistiek
2012.05.02
5
Statistiek
scrabble zonder blanco • ‘blanco’ letter verwijderen uit spel • P(Voc) = 38/100 = .38 =p P(Cons)= 62/100 = .62 =q • kansen zijn nu complementair: P(Voc) + P(Cons) = p+q = 1 • stel dat we nu drie letters trekken, met teruglegging . . . 2012.05.02
Statistiek
scrabble zonder blanco uitkomst VVV VVC VCV CVV CCV CVC VCC CCC
kans ppp = p3 ppq = p2q pqp = p2q qpp = p2q qqp = pq2 qpq = pq2 pqq = pq2 qqq = q3
d bin it is d ve omia e rd eli alng de interne ordening van V en C in een uitkomst maakt niet uit voor de kans van die uitkomst; de aantallen van V en C maken wel uit 2012.05.02
Statistiek
3 trekkingen mogelijke uitkomsten • • • •
1x: 3x: 3x: 1x:
3 klinkers, 0 medeklinkers 2 klinkers, 1 medeklinker 1 klinker, 2 medeklinkers 0 klinkers, 3 medeklinkers
2012.05.02
6
Statistiek
binomiaalverdeling • algemene vorm (geen tabel maar formule): Drie trekkingen betekent (p of q) en (p of q) en (p of q) = (p+q)(p+q)(p+q) = (p+q)3
(p+q)3 = 1p3 + 3 p2q + 3 pq2 + 1q3 2012.05.02
Statistiek
kansen hebben geen geheugen • zie Gambler’s Fallacy • vb 1: P(blanco) = 2/102 = 1/51 maar dit betekent niet dat er na 51 trekkingen met teruglegging altijd een blanco getrokken is! de letterzak heeft geen geheugen. • vb 2: stel P(fout)=1/20, P(goed)=19/20 maar dit betekent niet dat 19x een goede beslissing wordt genomen en 1x een foute; iedere beslissing heeft kans om fout te zijn, net zoals je bij iedere loterij de jackpot kunt winnen. 2012.05.02
Statistiek
onafhankelijke kansen? • Voorbeeld kerncentrale: Stel dat een ongeluk alleen optreedt bij een combinatie van storing en blunder. • p(ongeluk) = p(storing) * p(blunder) verwacht: 1/1000 * 1/100 = 1/100000 • In werkelijkheid zien we echter p(ongeluk)=1/10000, hoe kan dat? 2012.05.02
7
Statistiek
conditionele kansen • De kans op een blunder is blijkbaar veel groter wanneer er een storing is. Onder die conditie is de kans op een blunder al 1/10: p(ongeluk) = p(storing) * p(blunder|storing) = 1/1000 * 1/10 = 1/10000 • [De kans op een blunder wanneer er geen storing optreedt is, is minder dan 1/1000] • [Lees: P(blunder|storing) als: de kans op een blunder, gegeven een storing] 2012.05.02
Statistiek
nog eens zijn gebeurtenissen wel echt onafhankelijk? • Overstroming ontstaat bij combinatie van Storm en Blunder • P(Storm)=1/1000, P(Blunder)=1/100 • P(Overstroming)=1/1000 x 1/100=1/100000, 1x per 274.0 jaar • maar niet onafhankelijk: P(Blunder|Storm)=1/10 • P(Overstroming)=1/1000 x 1/10=1/10000, 1x per 27.4 jaar 2012.05.02
Statistiek
2012.05.02
8
Statistiek
huiswerk • lezen: P&D, Ch.7+8 • maken: P&D, opgaven Chapter 6: 9, 19, 25, 33 • maken: P&D, opgaven App A: A.1, A.9 • maak je uitwerkingen op papier.
2012.05.02
9