Les 1: Waarschijnlijkheidrekening A Men neemt een steekproef van 1000 appelen. Deze worden ingedeeld volgens gewicht en volgens symptomen van een bepaalde schimmel: geen, mild, gematigd of ernstig. Het volgende werd waargenomen: •
van de 300 appels met een gewicht < 60 g zijn er 60 zonderziekteverschijnselen, 70 met “milde” en 80 met “gematigde” symptomen.
•
van de 400 appels met een gewicht tussen 60 en 80 g zijn er 140 zonder symptomen, 120 “gematigd” en 80 “ernstig”.
•
van de klasse met een gewicht > 80 g zijn er 80 die geen ziekteverschijnselen vertonen, 70 met “milde”, 100 met “matige” en de rest met “ernstige” symptomen.
Vertrekkende van bovenstaande informatie, wat is de kans dat een appel met een gewicht ≥ 60 g “gematigde” of “ernstige” symptomen vertoont?
B Over de nieuwe alcoholtest van de Belgische rijkswacht zijn de volgende gegevens bekend: • • •
De kans dat een dronken bestuurder positief wordt bevonden is 0,95. De kans dat een nuchtere chauffeur een negatief testresultaat bekomt is 0,97. De kans dat een bestuurder dronken is, is 0,15.
Wat is de kans dat een bestuurder, waarbij de test negatief was, toch dronken is?
Les 2-3: Meetschalen en parameters A Zoek de correcte uitspraken: 1. De standaardafwijking van een steekproef kan soms negatief zijn. 2. De mediaan van een even aantal metingen die allemaal verschillend zijn Is de waarde die exact in het midden valt wanneer de gegevens gerangschikt worden volgens grootte. De helft van de waarden zijn groter en de helft van de waarden zijn kleiner. 3. De variantie voor de waarden 1, 1, 1, 1, en 1 is gelijk aan 1. 4. Een correlatiecoëfficiënt met de waarde -1 betekent dat de variabelen helemaal niet gecorreleerd zijn. 5. De variantie heeft dezelfde meeteenheid als de waarden uit de steekproef. 6. De mediaan van de getallenreeks 11, 5, 23, 14 en 2, bedraagt 11. 7. De amplitude is het verschil tussen de grootste en kleinste waarneming.
B Bij arbeiders in een fabriek wordt het aantal huidverkleuringen per huidoppervlak bepaald. Men vindt: 2 arbeiders met 11 verkleuringen per huidoppervlak 1 arbeider met 13 verkleuringen per huidoppervlak 1 arbeider met 14 verkleuringen per huidoppervlak 4 arbeiders met 16 verkleuringen per huidoppervlak 4 arbeiders met 17 verkleuringen per huidoppervlak 5 arbeiders met 18 verkleuringen per huidoppervlak 1 arbeider met 19 verkleuringen per huidoppervlak Bepaal de mediaan.
C Gegeven de volgende metingen: 38,3
32,5
41,1
41,6
39,5
37,2
29,3
Bereken gemiddelde en standaardafwijking.
36,1
21,6
Les 4: Discrete verdelingen
A De kans dat een therapie met een nieuw geneesmiddel succesvol is als het toegepast wordt op 1 persoon is 0,80. Als we nu een steekproef nemen van 20 personen, wat is dan de kans dat er minder dan 16 zullen genezen?
Les 5: Continue verdelingen A De polsomtrek X, van volwassen mannen is normaal verdeeld met een gemiddelde µ = 17,40 cm en een standaardafwijking σ van 1,02 cm. Bereken de volgende kansen : A: P(16,51 < X < 19,05) B: P(X > 17,78)
B Zij X ~ F40,8. Bepaal het getal a zodat P(X < a) = 0,05. C De lengte van pasgeboren jongens is normaal verdeeld met een gemiddelde van 51,0 cm en een standaardafwijking van 10 cm. Stel dat we deze baby’s willen onderverdelen in de 3 categorieën M, L en XL. De groep M omvat alle baby’s met een lengte < dan 46 cm en de overige baby’s worden zodanig over de 2 resterende categorieën verdeeld dat de kans dat ze in de groep L vallen 2 keer zo groot is als de kans dat ze in groep XL vallen. Op welke lengte moet men de grens tussen groep L en de groep XL dan leggen?
Les 6: Schatters en betrouwbaarheidsintervalllen A Voor een steekproef van 19 hartoperaties berekende men een gemiddelde ~ kostprijs van 73.249 Bfr met een standaardafwijking, S , van 37.246. Bereken het 90% betrouwbaarheidsinterval voor de gemiddelde kost van alle hartoperaties.
B Gegeven de volgende metingen: 8,00
8,50
0,00
12,75 3,75
11,00 -1,10 -0,25 31,25 0,98
Bereken een zuivere schatter van de populatie-variantie waaruit deze metingen komen.
C Stel dat men over een steekproef met n = 35 weet dat
∑ i =1 ( x i − x ) 2 = n
∑i =1 xi = 1085 en dat n
20580. Bereken hieruit het 95% betrouwbaarheidsinterval
voor het gemiddelde van de populatie waaruit deze steekproef komt.
Les 7-8: Parameter en vergelijkingstoetsen A Stel dat volgende metingen komen uit een normale verdeling met een standaardafwijking van 6,3. Kan men, gebruik makend van een twee-zijdige toets met α = 0,05, aannemen dat het gemiddelde van de populatie waaruit deze steekproef komt, gelijk is aan 46? •
Bereken tevens de p-waarde. Nr. Meting
1 70
2 49
3 55
4 51
5 52
6 49
7 41
8 56
9 56
B 2 operatietechnieken, A en B, worden elk toegepast op 40 patiënten, Over de duur van de ingreep vond men de volgende resultaten: X A = 10,75 min ~ S A = 0,21 min • •
X B = 10,61 min ~ S B = 0,19 min
Kan men op het 5% significantienieveau aannemen dat er geen verschil is in gemiddelde tijdsduur tussen de 2 technieken? Geef tevens de gevonden p-waarde.
C Het aantal minuten vóór het optreden van een bepaalde huidirritatie werd bij 12 patiënten gemeten voor en na het nuttigen van een grote hoeveelheid wortelen. Kan men aannemen, bij α = 5%, dat de gemiddelde duur dezelfde is, als men er van uitgaat dat deze metingen komen uit een normale verdeling. •
Geef tevens de gevonden toetsgrootheid.
Patiënt 1 87 Voor 100 Na
2 61 83
3 53 75
4 98 140
5 101 120
6 97 123
7 133 145
8 110 124
9 61 79
10 63 83
11 96 110
12 92 104
Les 9: χ
2
-Toets
A Een fabriek maakt gebruik van het 2-ploegen systeem en men wil nagaan of er een verschil is in oplettendheid tussen de 2 ploegen. Op een dag werd daartoe nagegaan hoeveel stukken verkeerd werden geassembleerd. Voor ploeg 1 waren er 32 van de 127 slecht en bij ploeg 2, 18 van de 97. Is er een verschil tussen de twee ploegen voor wat betreft de frequentie van fouten (bij α = 5%) en welke toetsgrootheid (TG) vond je?
B Een groep van 70 personen gaan samen op reis naar India. De helft van de groep neemt eens per week een hoge dosis anti-malaria pil, de andere helft neemt elke dag een lage dosis pil. Na de 5-weken durende reis zijn er in de eerste helft 16 aan malaria ten prooi gevallen, in de tweede groep 9. Geef de grenzen voor de p-waarde van de toets die nagaat of er een verschil in efficiëntie bestaat tussen de 2 toedieningswijzen.
C Dezelfde bevruchtingsmethode wordt toegepast op 13 leeuwen in de zoo van Kinshasa en op 14 in de zoo van Antwerpen. In Kinshasa heeft het bij 5 leeuwen succes, in Antwerpen bij 8. Bij het nagaan van de hypothese dat succes en plaats onafhankelijk zijn, vondt men dat men deze hypothese kan aanvaarden. Welke toetsgrootheid (TG) werd er bij deze toets gevonden?
Les 10-11: Niet-parametrische statistiek A De nevenwerkingen van 2 medicijnen op het gewicht van de patiënten werd gemeten. De volgende veranderingen werden waargenomen: medicijn A: medicijn B: • •
7 4
-5 27
10 16
3 9
11
18
Is er een significant verschil tussen de 2 medicijnen qua gewichtsverandering? Gebruik α = 5% en geef tevens de gevonden p-waarde.
B Een bepaalde bloedparameter die volgens de geneesheren niet verandert ten gevolge van de toegediende medicijnen werd bij 9 patiënten net voor en 12 maand na het begin van de therapie gemeten. Kan men uit onderstaande gegevens besluiten dat de gemiddelde waarden verschillend zijn? Patiënt Voor 9 1 6 2 8 3 3 4 7 5 3 6 10 7 4 8 5 9
Na 5 2 3 5 3 5 5 6 4
Geef tevens de gevonden p-waarde.
C Het aantal ziektedagen die een federaal ambtenaar per jaar opneemt volgt een symmetrische verdeling. Van 9 willekeurige ambtenaren werd nagegaan hoeveel dagen zij het afgelopen jaar namen: Nr. #dage n
1 17
2 11
3 3
4 12
5 9
6 6
7 0
8 4
9 7
Geef de p-waarde van de toets die nagaat of de mediaan M = 9.
Les 12: Regressie Analyse A Voor tien interventies met de ambulance werden de afstand van het hospitaal tot de plaats van het ongeluk gemeten. De volgende tabel geeft de gevonden waarden weer: Nr 1 2 3 4 5 6 7 8 9 10 •
afstand in km 2.1 2.9 3.5 4.8 4.9 7.3 7.8 8.5 9.2 10.1
tijd in min 5 7 6 11 8 11 12 8 15 12
Als je studentenkot 4,9 km van de plaats van vertrek ligt, wat is dan de geschatte tijd die de ambulance nodig heeft om je te bereiken?
Les 13: Anova - Analysis of variance A
Bij een test van 3 haargroeimiddelen wordt het aantal nieuw aangegroeide haren geteld na de benodigde behandelingsperiode. Elk middel werd op ni personen uitgetest: Haargroeimidde l 1 2 3 •
ni 4 6 5
# nieuwe haren (duizendtallen) 11, 11, 9, 13 33, 30, 27, 31, 28, 25 19, 21, 23, 19, 30
Toets bij α = 5% of de 3 haargroeimiddelen even effectief zijn. • Geef tevens de gevonden toetsgrootheid.
Bijkomende oefeningen - Resultaten
Reeks 1 1 2-3 2-3 2-3 4 5 5 5 6 6 6 7-8
Vraag A B A B C A A B C A B C A
7-8 7-8 9 9 9 10-11 10-11 10-11 12 13
B C A B C A B C A A
Antwoord 0,50 0,009 2, 6 en 7 17 x = 35,24 en S = 6,11 0,3704 A: 0,755 en B: 0,356 a = 0,46 58,4 [ 58.474 ; 88.024 ] 94,66 [ 22,85 ; 39,15 ] nee, met p-waarde = 0,00058 nee, met p-waarde = 0,002 nee, met tg = 8,027 nee, met tg = 1,4 0,05 < p-waarde < 0,10 1,0 nee, met p-waarde = 0,067 nee, met p-waarde = 0,129 p-waarde > 0,10 8,41 min nee, met tg = 35,08