TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica
Tentamen Kansrekening (2WS20), Vrijdag 24 januari 2014, om 9:00-12:00. Dit is een tentamen met gesloten boek. De uitwerkingen van de opgaven dienen duidelijk en overzichtelijk te worden opgeschreven. Elk onderdeel levert 10 punten op. Het cijfer is het totaal van de behaalde punten gedeeld door 17, afgerond op een geheel getal. Er is ´e´en bonusopgave, wat het 18de onderdeel is, dat extra punten kan opleveren. Op elk ingeleverd vel de naam van de student, de code van het college en de datum van het tentamen noteren. U mag gebruik maken van een onbeschreven Statistisch Compendium en een (grafische) rekenmachine. ===========================================================
1. Compulsieve gokker. Een compulsieve gokker bezoekt een casino en ziet een rij van n gokautomaten. Hij kan zich er niet van weerhouden op elke gokautomaat te spelen net zolang totdat hij een keer gewonnen heeft op elke gokautomaat. We nemen aan dat verschillende spellen onafhankelijk zijn van elkaar. De i−de gokautomaat heeft kans pi ∈ (0, 1) op winst. (a) Laat Xi het aantal malen zijn dat hij speelt op gokautomaat i. Geef de kansmassafunctie van Xi . (b) Laat M := min(X1 , . . . , Xn ) het minimale aantal keren dat hij op dezelfde automaat speelt. Wat is de kansmassafunctie van M ? [Hint: kijk naar P(M > k) voor elke k ≥ 0.] (c) Stel dat p1 = p2 = · · · = pn = p, en definieer S := X1 + X2 + · · · + Xn . Geef een uitdrukking voor P(S = k). (d) Stel p = 1/3 en n = 50. Benader de kans dat S ≤ 180. (e) Een random variabele X die waarden in N = {1, 2, . . .} aanneemt heet geheugenloos als P(X > k + l | X > k) = P(X > l) voor alle k, l ∈ N. Laat zien dat elke geometrisch verdeelde random variabele geheugenloos is. (f) Stel dat Y een discrete random variabele is die waarden in N = {1, 2, . . .} aanneemt, en geheugenloos is. Laat zien dat Y geometrisch verdeeld moet zijn.
2. Laat X, Y, Z onafhankelijk en gelijkverdeelde uniforme random variabelen zijn op het interval (0, 1), zodat fX (x) = fY (x) = fZ (x) = 1 voor x ∈ (0, 1) en 0 anders. (a) Als n ∈ N een (willekeurig, maar vast) positief geheel getal is, welke verdeling heeft dnXe dan? Hier is dxe het kleinste gehele getal groter dan x ∈ R. (b) Laat U := XY Z en S := X 2 + Y 2 + Z 2 . Bereken E[U ], Var(U ) en E[S]. R1 (c) Stel g : [0, 1] → [0, 1] is een functie. Laat zien dat P(X < g(Y )) = 0 g(y)dy.
1
3. Gezamenlijke verdeling. De (continue) random variabelen (X, Y ) hebben een gezamenlijke kansdichtheid op [1, ∞)2 van de vorm fX,Y (x, y) = c(x + y)−5 , 1 ≤ x ≤ y < ∞, voor een zekere c > 0. De gezamenlijke kansdichtheid is nul anders. (a) Laat zien dat c = 192. (b) Bereken E[XY ]. Zijn X en Y onafhankelijk? (c) Bereken E[Y | X = 2].
4. Moment genererende functie. De momentgenererende functie van de random variabele X wordt gegeven door MX (t) = E[etX ] =
1 h et −1 i 1 + . 2 t 2
(a) Bereken E[X]. (b) Laat zien dat E[X k ] = 1/[2(k + 1)] voor alle k ≥ 1. (c) (Bonus opgave voor 10 punten) Wat is P(X = 0)? En wat is de verdeling van X?
5. Geef een gemotiveerd antwoord op de volgende vragen: (a) Op een Sinterklaasfeest geeft en krijgt iedereen 2 kados. De lootjes worden verdeeld door van alle deelnemers 2 briefjes met hun naam erop in een bak te doen, en iedereen twee briefjes te laten trekken. We noemen een loting geldig als niemand zichzelf trekt, en we noemen een loting saai als iemand 2 keer dezelfde persoon trekt. Wat is de kans dat een loting in een gezin van 3 mensen geldig en niet saai is? √ (b) Stel dat X1 , . . . , X100 onafhankelijk en gelijk verdeeld zijn met dichtheid fX (x) = (3/2) x voor 0 ≤ x ≤ 1 en fX (x) = 0 anders. Geef een benadering voor P(X1 + · · · + X100 ≤ 50). (c) Stel dat U1 , U2 , . . . , Un een rij van onafhankelijke en gelijkverdeelde uniforme random variabelen is op het interval (0, a) voor een zekere a > 0. Laat zien dat n min(U1 , . . . , Un ) in verdeling convergeert naar een exponenti¨ele random variabele met parameter 1/a.
Succes!
2
Uitwerkingen: 1. (a) Laat Xi het aantal malen zijn dat hij speelt op gokautomaat i. Geef de kansmassafunctie van Xi . Antwoord: Xi is geometrisch met succeskans pi , dus, voor k ∈ N, P(Xi = k) = pi (1 − pi )k−1 . Dit kan je ook begrijpen doordat Xi = k precies als de gokker de eerste k −1 spellen heeft verloren, en de kde wint. Omdat de verschillende spellen onafhankelijk zijn, geeft dat bovenstaande. (b) Laat M := min(X1 , . . . , Xn ) het minimale aantal keren dat hij op dezelfde automaat speelt. Wat is de kansmassafunctie van M ? Antwoord: Om de verdeling van M te berekenen, beginnen we met de observatie dat n n Y k Y k P(M > k) = P(X1 > k, . . . , Xn > k) = P(X1 > k) · · · P(Xn > k) = (1−pi ) = (1−pi ) . i=1
De verdeling van M is dus geometrisch met succeskans q = 1 −
Qn
i=1 (1
i=1
− pi ), dus
P(M = k) = q(1 − q)k−1 . (c) Stel dat p1 = p2 = · · · = pn = p, en definieer S := X1 + X2 + · · · + Xn . Geef een uitdrukking voor P(S = k). Antwoord: De gebeurtenis dat S = k betekent dat de gokker in de eerste k − 1 spellen precies n − 1 keer moet hebben gewonnen, en dat de kde weer winst geeft. Omdat alle kansen voor de verschillende automaten gelijk zijn, maakt het niet uit op welke automaat de gokker speelt. De kans op precies n − 1 keer winst in k − 1 spellen is k − 1 n−1 p (1 − p)k−n , n−1 en de kans op winst in het laatste spel is p zodat, voor k ≥ n, k−1 n P(S = k) = p (1 − p)k−n . n−1 Alternatieve oplossing is met genererende functies, omdat GS (s) = GX1 (s)n =
n et , 1 − (1 − p) et
wat de genererende functie is van een negatief binomial verdeling (zie statistisch compendium). (d) Stel p = 1/3 en n = 50. Benader de kans dat S ≤ 180. Antwoord: Stap 1: S = X1 + · · · + X50 , waarbij (Xi )50 i=1 onafhankelijke en gelijkverdeelde Geometrische random variabelen zijn met succeskans p, met eindige verwachting en variantie. Dus, we mogen de centrale limiet stelling gebruiken. Stap 2: We berekenen E[Xi ] = 1/p = 3, Var(Xi ) = (1 − p)/p2 = 6. Standaardizeren geeft dus S − 150 S − 150 180 − 150 P(S ≤ 180) = P √ ≤ √ )=P √ ≤ 1, 732 . 50 · 6 50 · 6 50 · 6 3
Stap 3: Benader met P(S ≤ 180) ≈ P(Z ≤ 1, 732), Stap 4: Tabel: P(S ≤ 180) ≈ P(Z ≤ 1, 732) ≈ 0.9582. (e) Een random variabele X die waarden in N aanneemt heet geheugenloos als P(X > k + l | X > k) = P(X > l) voor alle k, l ∈ N. Laat zien dat elke geometrisch verdeelde stochast geheugenloos is. Antwoord: Voor een geometrische random variabele met parameter k geldt dat P(X > k) = (1 − p)k . Hiermee rekenen we uit P(X > k+l | X > k) =
P(X > k + l, X > k) P(X > k + l) (1 − p)k+l = (1−p)l = P(X > l). = = P(X > k) P(X > k) (1 − p)k
Dus is X inderdaad geheugenloos. (f) Stel dat Y een discrete random variabele is die waarden in N aanneemt, en geheugenloos is. Laat zien dat Y geometrisch verdeeld moet zijn. Antwoord: Noem p = P(Y = 1). Dan rekenen we uit dat (met een telescoping product) k
k
k
i=1
i=1
i=1
Y P(Y > k) Y P(Y > k + 1) Y P(Y > k) = = = P(Y > k+1 | Y > k) = P(Y > 1) = (1−p)k , P(Y > 0) P(Y > k) waarbij we in de een na laatste gelijkheid de geheugenloosheid gebruiken. Dus, P(Y = k) = P(Y > k − 1) − P(Y > k) = (1 − p)k−1 − (1 − p)k = p(1 − p)k−1 , ofwel Y is geometrisch met kans p. 2. (a) Als n ∈ N een (willekeurig, maar vast) positief geheel getal is, welke verdeling heeft dnXe dan? Hier is dxe het kleinste gehele getal groter dan x ∈ R. Antwoord: U := dnXe heeft de uniforme verdeling op {1, . . . , n}, want ( 0 als i ≤ 0 of i > n, en i − 1 i P(U = i) = P X ∈ , = 1 n n als i ∈ {1, . . . , n}. n (b) Laat U := XY Z en S := X 2 + Y 2 + Z 2 . Bereken E[U ], Var(U ) en E[S]. Antwoord: We rekenen eerst uit dat Z 1 E[X] = xfX (x)dx = 1/2, 0
E[X 2 ] =
Z
1
x2 fX (x)dx = 1/3.
0
De random variabelen Y en Z hebben dezelfde verdeling en dus dezelfde momenten. Daarom is, vanwege onafhankelijkheid, E[U ] = E[XY Z] = E[X]E[Y ]E[Z] = 1/8, en E[U 2 ] = E[(XY Z)2 ] = E[X 2 Y 2 Z 2 ] = E[X 2 ]E[Y 2 ]E[Z 2 ] = 1/27. 4
Er geldt dus dat Var(U ) = E[U 2 ] − E[U ]2 =
1 1 37 − ( )2 = . 27 8 1728
Verder geldt dat E[S] = E[X 2 + Y 2 + Z 2 ] = E[X 2 ] + E[Y 2 ] + E[Z 2 ] = 1. (c) Stel g : [0, 1] → [0, 1] is een functie. Laat zien dat P(X < g(Y )) =
R1 0
g(y)dy.
Antwoord: We rekenen uit, met B = {(x, y) : x < g(y)}, Z Z fX,Y (x, y)dxdy. P(X < g(Y )) = B
Omdat X en Y onafhankelijk zijn en g(x) ∈ [0, 1], geldt 1 Z g(y)
Z
Z Z
0
B
1
g(y)dy.
dxdy =
fX (x)fY (y)dxdy =
P(X < g(Y )) =
Z 0
0
3. Gezamenlijke verdeling. De (continue) random variabelen (X, Y ) hebben een gezamenlijke kansdichtheid op [1, ∞)2 van de vorm fX,Y (x, y) = c(x + y)−5 , 1 ≤ x ≤ y < ∞, voor een zekere c > 0. De gezamenlijke kansdichtheid is nul anders. (a) Laat zien dat c = 192. Antwoord: Er moet gelden dat Z
∞
Z
∞
fX,Y (x, y)dydx = 1. −∞
We rekenen uit: Z Z ∞Z ∞ fX,Y (x, y)dydx = −∞
−∞
−∞
∞Z ∞
−5
c(x+y)
1
∞
Z dxdy =
x
1
c c [− (x+y)−4 ]∞ x dx = 4 64
Z
∞
x−4 dx =
1
Dus, c = 192. (b) Bereken E[XY ]. Zijn X en Y onafhankelijk? Antwoord: We berekenen Z
∞
Z
∞
E[XY ] =
Z xyfX,Y (x, y)dydx = c
−∞
−∞
1
We schrijven y = (x + y) − x om te komen op Z ∞Z ∞ Z E[XY ] = xyfX,Y (x, y)dydx = c −∞
∞Z ∞
−∞
1
∞Z ∞
xy(x + y)−5 dydx.
x
x(x + y)−4 − x2 (x + y)−5 dydx.
x
Nu kunnen we beide termen integreren over y: Z ∞ Z ∞ 1 1 1 1 −3 ∞ 2 −4 ∞ E[XY ] = c x[− (x + y) ]x − x [− (x + y) ]x dx = c x x−3 − x2 x−4 dx. 3 4 24 64 1 1 5
c . 192
Dit kunnen we verder uitrekenen met Z ∞ 1 1 1 1 1 1 x−2 dx = c( − ) = 192( − ) = 5. E[XY ] = c( − ) 24 64 1 24 64 24 64 X en Y zijn afhankelijk, want P(X ∈ [2, 3], Y ∈ [1, 2]) = 0, maar P(X ∈ [2, 3]) ≥ P(X ∈ [2, 3], Y ∈ [3, 4]) en P(Y ∈ [1, 2]) ≥ P(X ∈ [0, 1], Y ∈ [1, 2]), die beide strikt positief zijn omdat de dichtheid op deze rechthoeken strikt positief is. (c) Bereken E[Y | X = 2]. Antwoord: We rekenen eerst fX (x) uit: Z Z ∞ fX,Y (x, y)dy = c fX (x) = −∞
∞
x
1 c −4 (x + y)−5 dy = c[− (x + y)−4 ]∞ x . x = 4 64
c 1024 .
Voor x = 2 geeft dit fX (2) = Nu gebruiken we fY |X (y|x) = fX,Y (x, y)/fX (x) en rekenen uit Z ∞ Z ∞ Z ∞ −5 E[Y | X = 2] = yfY |X (y|2)dy = 1024 y(2+y) dy = 1024 (2+y)−4 −2(y+2)−5 dy. −∞
2
2
Derhalve is 1 1024 2048 16 10 1 −4 ∞ − = −2 = . E[Y | X = 2] = 1024[− (2 + y)−3 ]∞ 2 − 2048[− (y + 2) ]2 = 3 4 3 · 64 4 · 256 3 3 4. Moment genererende functie. De momentgenererende functie van de random variabele X wordt gegeven door 1 h et −1 i 1 MX (t) = E[etX ] = + . 2 t 2 (a) Bereken E[X]. 0 (0). Hievoor rekenen we uit Antwoord: We gebruiken dat E[X] = MX 0 MX (t) =
1 h et t − [et −1] i 1 h [et −1]t − [et −1 − t] i = 2 t2 2 t2
Nu gebruiken we dat et −1 − t 1 = , 2 t→0 t 2
[et −1]t = 1, t→0 t2
lim
zodat
lim
1 1 1 0 E[X] = MX (0) = [1 − ] = . 2 2 4
(b) Laat zien dat E[X k ] = 1/[2(k + 1)]voor alle k ≥ 1. Antwoord: We gebruiken dat t
e =
∞ k X t k=0
Invullen geeft MX (t) =
k!
.
∞
∞
k=1
k=1
1 X tk−1 1 1X tk + =1+ . 2 k! 2 2 (k + 1)!
Hieruit rekenen we uit dat (k)
E[X k ] = MX (0) = k!
6
1 1 1 = . 2 (k + 1)! 2(k + 1)
(c) (Bonus opgave voor 10 punten) Wat is P(X = 0)? En wat is de verdeling van X? Antwoord: We herkennen Verder is
et −1 t
als de moment genererende functie van een uniforme verdeling.
1 1 MY (t) + 2 2 de moment genererende functie van de random variabele die 0 is met kans 1/2, en met kans 1/2 een uniforme verdeling aanneemt. Dus P(X = 0) = 1/2 en X heeft dezelfde verdeling als IU , waarbij I een Bernoulli verdeling heeft met succeskans 1/2 en U een uniforme verdeling op [0, 1]. 5. Geef een gemotiveerd antwoord op de volgende vragen: (a) Op een Sinterklaasfeest geeft en krijgt iedereen 2 kados. De lootjes worden verdeeld door van alle deelnemers 2 briefjes met hun naam erop in een bak te doen, en iedereen twee briefjes te laten trekken. We noemen een loting geldig als niemand zichzelf trekt, en we noemen een loting saai als iemand 2 keer dezelfde persoon trekt. Wat is de kans dat een loting in een gezin van 3 mensen geldig en niet saai is? Antwoord: Er zijn 3 deelnemers. De eerste deelnemer dient twee verschillende lootjes te krijgen, een van beide andere deelnemers. Die kans is 42 4 = . 65 15 Als de eerste deelnemer zijn lootjes heeft gekregen, zijn er nog 4 lootjes, een van elk van de overgebleven deelnemers, en 2 van de deelnemer die zijn lootjes al heeft. De kans dat de tweede deelnemer niet zichzelf trekt en ook verschillend zijn in dus, conditioneel op dat de eerste al een goede trekking had, gelijk aan P(deelnemer 2 geldig en niet saai | deelnemer 1 geldig en niet saai) = P(2 geldig en niet saai | 1e lotje 2 is van 1)P(1e lotje 2 is deeln. 1) + P(2 geldig en niet saai | 1e lotje 2 is van 3)P(1e lotje 2 is deeln. 1) = 2/4 · 1/3 + 2/3 · 1 = 1/3. Als de tweede deelnemer ook goede lootjes heeft getrokken, blijven er voor deelnemer 3 nog 2 lootjes over van deelnemer 1 en van 2, en zijn de lootjes van deelnemer 3 dus correct. We krijgen dat de kans op een goede loting gelijk is aan 42 1 4 × = . 65 3 45 Je moet dus wel een paar keer trekken voordat dit goed gaat!
√ (b) Stel dat X1 , . . . , X100 onafhankelijk en gelijk verdeeld zijn met dichtheid fX (x) = (3/2) x voor 0 ≤ x ≤ 1 en fX (x) = 0 anders. Geef een benadering voor P(X1 + · · · + X100 ≤ 50). Antwoord: Stap 1: We gebruiken de centrale limiet stelling. Dat mag, omdat X1 , . . . , X100 onafhankelijk en gelijk verdeeld zijn, met eindige verwachting en variantie. Stap 2: We berekenen Z ∞ Z 3 1 3/2 32 3 µ = E[Xi ] = xfX (x)dx = x dx = = , 2 0 25 5 −∞
7
terwijl E[Xi2 ] =
Z
∞
x2 fX (x)dx =
−∞
zodat σ 2 = Var(Xi ) = E[Xi2 ] − E[Xi ]2 =
3 2
Z
1
x5/2 dx =
0
32 3 = , 27 7
3 3 9 75 − 63 12 3 − ( )2 = − = = . 7 5 7 25 175 175
Daarmee kunnen we standaardizeren: X + · · · + X − 100µ 50 − 60 1 √ 100 P(X1 + · · · + X100 ≤ 50) = P ≤√ . 100σ 2 100σ 2 Stap 3: We benaderen
1 50 − 60 √ ≈ −3.82, = −p 2 12/175 100σ
en dus, vanwege de centrale limiet stelling P(X1 + · · · + X100 ≤ 50) ≈ P(Z ≤ −3.82). Stap 4: Dit zoeken we op in de tabel P(X1 + · · · + X100 ≤ 50) ≈ P(Z ≤ −3.82) = 1 − P(Z ≤ 3.82) < 0.001. (c) Stel dat U1 , U2 , . . . , Un een rij van onafhankelijke en gelijkverdeelde uniforme random variabelen is op het interval (0, a) voor een zekere a > 0. Laat zien dat n min(U1 , . . . , Un ) in verdeling convergeert naar een exponenti¨ele random variabele met parameter 1/a. Antwoord: Laat Xn = n min(U1 , . . . , Un ). We rekenen uit FXn (x) = P(Xn ≤ x) = 1−P(Xn > x) = 1−P(n min(U1 , . . . , Un ) > x) = 1−P(U1 > x/n, . . . , Un > x/n). We gebruiken dat, voor n zo groot dat x/n ∈ (0, a), P(U1 > x/n, . . . , Un > x/n) = P(U1 > x/n) · · · P(Un > x/n) = P(U1 > x/n)n = (1−x/(an))n → e−x/a . We concluderen dat voor x < 0, FXn (x) = 0 en voor x > 0, lim FXn (x) = 1 − e−x/a .
n→∞
Aangezien dit de verdelingsfunctie is van een exponenti¨ele verdeling met parameter 1/a, geldt dat Xn in verdeling naar een exponenti¨ele verdeling met parameter 1/a convergeert.
8