TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica
Eindtentamen Kansrekening en Statistiek (2WS13), Tussentoets Kansrekening en Statistiek (2WS04), Vrijdag 8 april 2011, om 9:00-12:00. Dit is een tentamen met gesloten boek. De uitwerkingen van de opgaven dienen duidelijk en overzichtelijk te worden opgeschreven. Elk onderdeel levert 10 punten op. Het cijfer is het totaal van de behaalde punten gedeeld door 15, afgerond op een geheel getal. Op elk ingeleverd vel de naam van de student, de code van het college en de datum van het tentamen noteren. U mag gebruik maken van een onbeschreven Statistisch Compendium en een (grafische) rekenmachine. ==========================================
1. Gezamenlijke dichtheid. De kansdichtheid van het paar (X, Y ) wordt gegeven door: f (x, y) =
e−y , 2y
0 < x < 2y,
0 < y < ∞.
(a) Bereken de marginale (cumulatieve) verdelingsfunctie van Y . Geef een formule voor de kansdichtheid van X in termen van een expliciete integraal. (b) Zijn X en Y onafhankelijk? Bereken P(X > 3 | Y = 2). 2. Voetbalplaatjes. Bij een landelijke supermarktketen krijg je bij aankoop van 10 euro precies ´e´en voetbalplaatje. In totaal zijn er 110 verschillende voetbalplaatjes van 10 teams met elk 11 spelers. Neem aan dat elke keer als een kind een plaatje krijgt, het met gelijke kans een plaatje krijgt van elke speler. (a) Wat is de kans dat een kind bij zijn eerste 10 plaatjes nog geen speler heeft gekregen van zijn favoriete team? (b) Wat is het verwachte aantal plaatjes dat het kind moet krijgen voordat het precies ´e´en speler van zijn favoriete team heeft gekregen? (c) Wat is de verwachte hoeveelheid geld dat de ouders van het kind aan boodschappen moeten spenderen voordat het zijn favoriete team compleet heeft? 3. Genetica. De mogelijke genotypen van een bepaald organisme zijn AA, Aa en aa, waarbij Aa en aA hetzelfde genotype zijn. Als organismen paren, dan geeft elk van de ouders onafhankelijk van elkaar met kans 21 ´e´en van zijn genen aan de nakomeling. (a) Als de genotypen van de ouders AA en Aa zijn, wat zijn dan de mogelijke genotypen van de nakomelingen en wat zijn de bijbehorende kansen? (b) Stel dat elk van de ouders met kans p genotype AA, met kans 2q genotype Aa en met kans r genotype aa heeft (waarbij p + 2q + r = 1), onafhankelijk van elkaar. Laat zien dat de nakomeling met kans (p + q)2 genotype AA en met kans (r + q)2 genotype aa heeft. 1
(c) Nu bekijken we nakomelingen van twee ouders uit de eerste generatie, die dus met kans (p+q)2 genotype AA heeft, met kans (r +q)2 genotype aa en met kans 1−(p+q)2 −(r +q)2 genotype Aa hebben. Laat zien dat deze nakomelingen van ouders uit de eerste generatie weer met kans (p + q)2 genotype AA en met kans (r + q)2 genotype aa hebben. Dit is de Hardy-Weinberg Wet uit de genetica. (Hint: Gebruik dat p + 2q + r = 1.) 4. Geef een gemotiveerd antwoord op de volgende vragen: (a) Ik gooi twee keer met een dobbelsteen. Wat is de kans dat de eerste worp ´e´en meer is dan de tweede? (b) A, B en C zijn drie onafhankelijke gebeurtenissen met P(A) = 1/2, P(B) = 1/6, P(C) = 1/8. Wat is P(A ∪ B ∪ C)? (c) Laat zien dat voor een continue stochast X met waarden in [0, ∞) en E[X 3 ] < ∞ geldt dat Z ∞ 3 3x2 P(X > x)dx. E[X ] = 0
(d) De stochastische variabele X is exponentieel verdeeld met parameter λ. Gegeven is dat P[X > 2] = P[X < 2]. Wat is de parameter λ? (e) Een random variabele X heeft moment genererende functie 1 1 1 MX (t) = e−t + + et . 4 2 4 Bereken E[X] en E[X 2 ].
Succes!
2
UITWERKINGEN 1. Gezamenlijke dichtheid. (a) We berekenen eerst de marginale kansdichtheid van Y (3pt): −y 2y Z 2y −y e e fY (y) = dx = x = e−y . 2y 2y 0 0 De verdelingsfunctie van Y wordt dan gegeven door (4pt): Z y h i 0 0 y e−y dy 0 = −e−y = 1 − e−y . FY (y) = 0
0
De kansdichtheid van X wordt gegeven door (3pt): Z ∞ −y e dy. fX (x) = 1 x 2y 2
(b) X en Y zijn niet onafhankelijk, want de support van de kansdichtheid is geen Carthesisch product (4pt). (Alternatief: geef een voorbeeld dat f (x, y) 6= fX (x)fY (y).) We berekenen P[X > 3 | Y = 2] als volgt (6pt): 4 Z 4 −2 Z 4 Z 4 e 1 f (x, 2) 1 dx = dx = x = . P[X > 3 | Y = 2] = f (x|y = 2)dx = −2 4 3 4 3 4e 3 3 fY (2) 2. Voetbalplaatjes. (a) Deze kans is (10pt):
11 1− 110
10
=
1 1− 10
10 ≈ 0.3487.
(b) Het aantal plaatjes dat het kind moet krijgen voordat het precies ´e´en speler van zijn 1 favoriete team heeft gekregen is Geometrisch verdeeld met succeskans p = 10 (4pt). Het verwacht aantal benodigde plaatjes is dus (6pt): 1 = 10. p (c) Het aantal plaatjes dat het kind moet krijgen voordat het een plaatje krijgt uit zijn favoriete 11 . Vervolgens moet het kind nog een team Geometrisch verdeeld met succeskans p = 110 10 Geo 110 verdeeld aantal plaatjes krijgen voordat het een tweede plaatje krijgt uit zijn favoriete team dat hij nog niet heeft, etc. (4pt). Het verwachte aantal plaatjes dat het kind dus moet krijgen is dus (4pt): 110 110 110 110 110 110 110 110 110 110 110 83711 + + + + + + + + + + = ≈ 332.187. 11 10 9 8 7 6 5 4 3 2 1 252 De ouders moeten dus naar verwachting (2pt): 10 ∗ 332.187 = 3321.87 euro aan boodschappen spenderen voordat het kind zijn favoriete team compleet heeft. 3
3. Genetica. (a) Als de genotypen van de ouders AA en Aa zijn, dan kunnen nakomelingen de genotypen AA en Aa hebben (5pt), beiden met kans 12 (5pt). (b) Laat AA de gebeurtenis zijn dat de nakomeling genotype AA heeft, mAAvAA de gebeurtenis dat de moeder genotype AA heeft en de vader genotype AA, etc. Dan geldt (2pt): P[AA] = P[AA | mAAvAA]P[mAAvAA] + P[AA | mAAvAa]P[mAAvAa] + P[AA | mAAvAa]P[mAAvAa] + P[AA | mAavAA]P[mAavAA] + P[AA | mAavAa]P[mAavAa] + P[AA | mAAvaa]P[mAAvaa] + P[AA | maavAA]P[maavAA] + P[AA | mAavaa]P[mAavaa] + P[AA | maavAa]P[maavAa]. Dus (3pt): P[AA] = 1 · p2 +
1 1 1 · p · 2q + · 2q · p + · (2q)2 + 0 = p2 + 2pq + q 2 = (p + q)2 . 2 2 4
Op vergelijkbare wijze krijgen we (5pt): P[aa] = 1 · r2 + 2 ·
1 1 · 2qr + · (2q)2 = r2 + 2rq + q 2 = (r + q)2 . 2 4
(c) Merk eerst op dat p + 2q + r = 1 en dus ook (p + 2q + r)2 = 1 (2pt). We kunnen dan 1 − (p + q)2 − (r + q)2 herschrijven als (3pt): 1−(p+q)2 −(r+q)2 = (p+2q+r)2 −(p+q)2 −(r+q)2 = 2(q 2 +pq+qr+pr) = 2(p+q)(r+q). Nu gebruiken we uit opgave (b) dat (of leiden op vergelijkbare wijze af dat) (5pt): 2 1 P[AA] = (p + q)2 + (1 − (p + q)2 − (r + q)2 ) = ((p + q)(p + q + r + q))2 = (p + q)2 . 2 4. (a) Laat D1 en D2 de uitkomsten zijn van respectievelijk de eerste en de tweede dobbelsteen. Dan geldt (5pt): P[D1 = D2 +1] = P[D1 = D2 +1 | D1 = 1]P[D1 = 1]+. . .+P[D1 = D2 +1 | D1 = 6]P[D1 = 6]. Invullen geeft (5pt): 2 1 5 P[D1 = D2 + 1] = 0 + 5 · = ≈ 0.1389. 6 36 (b) Er geldt dat (4pt): P[A ∪ B ∪ C] = P[A] + P[B] + P[C] − P[A ∩ B] − P[A ∩ C] − P[B ∩ C] + P[A ∩ B ∩ C]. Doordat A, B en C onafhankelijk zijn kunnen we dit herschrijven als (2pt): P[A ∪ B ∪ C] = P[A] + P[B] + P[C] − P[A]P[B] − P[A]P[C] − P[B]P[C] + P[A]P[B]P[C]. Invullen geeft (4pt): P[A ∪ B ∪ C] =
1 1 1 1 1 1 1 61 + + − − − + = ≈ 0.6354. 2 6 8 12 16 48 96 96 4
(c) Er geldt dat (10pt): 3
Z
∞
∞Z x
Z
x f (x)dx = 3y 2 dyf (x)dx 0 0 Z ∞ Z ∞ Z ∞ 2 3y 2 P[Y > y]dy. f (x)dxdy = 3y =
E[X ] =
3
0
0
y
0
Alternatief: Door partieel integreren krijgen we (6pt): Z ∞ Z ∞ ∞ 3 ∞ 2 x3 f (x)dx = x3 (1 − F (x)) 0 + E[X 3 ]. 3x P[X > x]dx = x (1 − F (x)) 0 + 0
0
Aangezien (4pt) 3 ∞ x (1 − F (x)) 0 = lim r3 P[X > r] = lim r3 r→∞
r→∞
Z
∞
Z
∞
f (x)dx ≤ lim
r→∞ r
r
x3 f (x)dx = 0,
waar we in de laatste gelijkheid hebben gebruikt dat E[X 3 ] < ∞, krijgen we het gewenste resultaat. (d) We berekenen eerst (3pt): Z P[X > 2] =
∞
h i∞ λe−λx dx = −e−λx = e−2λ , 2
2
en (3pt): 2
Z P[X < 2] =
h i2 λe−λx dx = −e−λx = 1 − e−2λ . 0
0
Dit aan elkaar gelijk stellen geeft (4pt): P[X > 2] = P[X < 2]; e−2λ = 1 − e−2λ ; 1 e−2λ = ; 2 1 −2λ = log ; 2 1 λ = log 2. 2 (e) Er geldt dat (5pt): d 1 −t 1 t 1 1 E[X] = MX (t) =− e + e = − + = 0, dt 4 4 t=0 4 4 t=0 en (5pt): 1 1 1 d2 1 −t 1 t E[X ] = 2 MX (t) = e + e = + = . dt 4 4 t=0 4 4 2 t=0 2
5