Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN
1
C
2
B
3
C
4
A
5
C
6
B
7
B
8
B
9
D
10
D
11
C
12
A
13
B
14
A
15
C
Lever zowel het antwoordformulier als de interim toets in
Versie A 1. 2. 3. 4. 5. 6. 7.
2
Dit tentamen bestaat uit 15 meerkeuzevragen, waarvan steeds 1 antwoord goed is. Tenzij anders is vermeld gebruik je bij het toetsen een significantie niveau van 5% Vul op het antwoordformulier je naam en studentnummer in. Controleer het versie nummer op het antwoordvel en de interimtoets. Kruis eerst de juiste antwoorden in de interim toets aan en pas op het einde de juiste antwoorden op het antwoordformulier. Fraude wordt bestraft. Succes!
1. Welke bewering over het vergelijken van twee onafhankelijke steekproeven is NIET JUIST. A. B. C. D.
De Levene’s test wordt gebruikt om twee varianties te testen. De onderliggende voorwaarde van de Mann-Whitney toets is dat de verdelingen van de data in beide groepen gelijk moeten zijn. Het aantal waarnemingen in beide groepen moet gelijk zijn. De Mann-Whitney toets wordt gebruikt om de mediane waarden van twee groepen met elkaar te vergelijken.
De enige voorwaarden die gelden bij de ongepaarde t-toets is de normaliteit van de residuen, de gelijkheid van de varianties, additief model en onafhankelijkheid. Bij de MannWhitney is de enige voorwaarde dat de verdelingen gelijk moeten zijn. Dus in beide gevallen worden er geen voorwaarden gesteld voor het aantal waarnemingen in een groep. 2. Welk van de onderstaande beweringen is JUIST: A. B. C. D.
Een nominale variabele heeft categorieën die geordend zijn. Een ratio/interval variabele heeft numerieke waarden. Bij een ordinale variabele zijn de afstanden tussen de categorieën gelijk. Een ratio variabele is altijd continu.
Alternatief A is fout want de nominale variabele is de enige type variabele die geen ordening heeft. Alternatief C is ook fout want een ordinale variabele kan ook niet numeriek zijn of geen numerieke betekenis hebben. Tenslotte is alternatief D ook fout want een ratio variabele kan ook discreet zijn (denk aan tellingen: aantal bladeren aan een zaailing bijvoorbeeld). 3. Lepomis macrochirus is een straalvinnige vis uit de familie van zonnebaarzen (Centrarchidae). We veronderstellen dat de lengte van een populatie L. macrochirus normaal verdeeld is met gemiddelde 152.1 mm en standaardafwijking 19.6 mm. Welke bewering is JUIST? A B. C.
In een steekproef van 40 vissen uit deze populatie zal de schatting van de standaardafwijking altijd kleiner zijn dan in een steekproef van 10 vissen. Ongeveer 95% van de buisjes heeft een lengte tussen 132.5 mm en 171.7 mm. Prob(X > 214.8) is gelijk aan Prob(Z > 3.2) waarbij Z standaard normaal verdeeld is.
Versie A D.
3
Bij 13.4% van aselect gekozen vissen zal de lengte kleiner zijn dan 122.7 mm.
A is fout want de SEM wordt kleiner maar niet per se de SD. B is fout want gegeven is het interval gemiddelde ± SD en daartussen valt ca 68% van de data en geen 95% D is fout want de gegeven kans is de tweezijdige kans en gevraagd werd de eenzijdige kans
De vragen 4 en 5 hebben betrekking op het volgende onderzoek met bijbehorende SPSS uitvoer. Een onderzoeker gaat de werkzaamheid van een groeihormoon preparaat onderzoeken. Een groep van genetisch gelijke ratten wordt aselect in twee groepen verdeeld. De eerste groep ratten krijgt 3 maanden lang een placebo, de tweede groep krijgt 3 maanden lang het groeipreparaat. Na 3 maanden worden de ratten gewogen om te kijken of de ratten in de tweede groep inderdaad meer gegroeid zijn dan de ratten in de eerste groep. Group Statistics
toename gewicht
groep placebo groeipreparaat
N
Mean 257.6609 266.4152
10 10
Std. Deviation 11.91587 9.52502
Std. Error Mean 3.76813 3.01208
Independent Samples Test Levene's Test for Equality of Variances
F toename gewichtEqual variances assumed Equal variances not assumed
.678
Sig. .421
t-test for Equality of Means
t
Mean Std. Error Sig. (2-tailed) Difference Difference
df
-1.815
18
.086
-8.75430
4.82404 -18.88924
1.38064
-1.815
17.167
.087
-8.75430
4.82404 -18.92460
1.41601
4. Bereken voor de groeipreparaat groep een 99% betrouwbaarheidsinterval voor het gemiddelde gewichtstoename. A. B. C. D.
[256.63; 276.20] [256.87; 275.96] [258.66; 274.17] [259.61; 273.23]
t verdeling met df = 9 en α= 1% t verdeling met df = 10 en α= 1% z verdeling met α= 1% t verdeling met df = 9 en α= 5%
5. Wat zijn de getoetste hypotheses? A. B. C. D.
H0: µ1 = µ2, H1: µ1 ≠ µ2 H0: µ1 ≠ µ2, H1: µ1 = µ2 H0: µ1 ≥ µ2, H1: µ1 < µ2 H0: µ1 ≤ µ2, H1: µ1 > µ2
95% Confidence Interval of the Difference Lower Upper
Versie A
4
De toets is eenzijdig en je verwacht gemiddelde toename gewicht is in groep 2 groter 6. In een bepaald soort kunstmest zou volgens de fabrikant 0,1 mg werkzame stof moeten zitten. Met behulp van een aselecte steekproef wordt nagegaan of dit gemiddeld genomen wel correct is (α =0,05). Het gevonden gemiddelde blijkt gelijk te zijn aan 0,087 mg. Verder wordt de volgende SPSS-output gemaakt. Kan met deze output een conclusie worden getrokken over het accepteren of verwerpen van de nulhypothese (µ=0,1 mg)? One-Sample Test Test Value = 0
Werkzame stof
A.
B. C. D.
t 5.553
df 6
Sig. (2-tailed) ,001
Mean Difference ,087
95% Confidence Interval of the Difference Lower Upper 0.0487 0.1255
ja, een conclusie kan door de foutief opgegeven referentiewaarde van 0 wel uit de gegeven p-waarde, maar niet uit het 95%-betrouwbaarheidsinterval worden getrokken ja, een conclusie kan door de foutief opgegeven referentiewaarde van 0 wel uit het 95%-betrouwbaarheidsinterval, maar niet uit de gegeven p-waarde worden getrokken ja, een conclusie kan zowel uit de gegeven p-waarde als uit het 95%betrouwbaarheidsinterval worden getrokken nee, een conclusie kan door de foutief opgegeven referentiewaarde van 0 in zijn geheel niet worden getrokken
De gegeven p-waarde is de p-waarde die hoort bij de nulhypothese µ=0 en niet bij µ=0.1. Wat je wel zou kunnen zeggen is dat de juiste p-waarde groter zal zijn dan 0.001 maar hoeveel groter weet je niet. Het betrouwbaarheidsinterval geeft aan wat het mogelijke populatie gemiddelde met een zekere betrouwbaarheid zou kunnen zijn. Omdat de Test Value gelijk is aan 0 is het gegeven interval gelijk aan het 95% betrouwbaarheidsinterval voor het verschil. De waarde µ=0.1 ligt in dit interval dus het populatie gemiddelde zou 0.1 kunnen zijn. Dus die nulhypothese zou je dan niet mogen verwerpen. Een andere benadering is: het gegeven betrouwbaarheidsinterval geeft alle waarden voor µ0 aan waarvoor je de nulhypothese H0: µ - “test value” = µ0 niet zou gaan verwerpen (zie ook opgave 4 uit werkcollege 5). In dit geval is test value gelijk aan 0 dus geldt het gegeven betrouwbaarheidsinterval voor het toetsen van de nulhypothese H0: µ = µ0. De waarde µ=0.1 ligt in dit interval, dus de nulhypothese mag je dus verwerpen. 7. Veronderstel dat een bioloog de uitspraak doet dat het verschil tussen twee steekproefgemiddelden “statistisch significant is op het 5% niveau”. Wat bedoelt hij dan precies? A. B. C. D.
Er is tenminste 95% kans dat er een reёel verschil is tussen de gemiddelden in de beide populaties De p-waarde voor de nulhypothese H0: µ1 = µ2 is 5% of minder Het waargenomen verschil wijkt minder dan 5% af van het biologisch relevante verschil. Er is een verschil van minder dan 5% tussen de steekproefgemiddelden.
Versie A
5
Alternatief A is fout want je gaat uit van de nulhypothese en niet van de alternatieve hypothese. Ook ga je bij het toetsen geen uitspraken doen over de grootte van het verschil maar alleen of het afwijkt van nul of niet. Of een verschil reëel is hangt ook heel sterk af van wat biologisch relevant is. De uitspraak van de onderzoeker heeft te maken met het toetsen, en zegt dus niets over het verschil tussen waargenomen verschil en het biologisch relevante verschil (alternatief C) of de grootte van het waargenomen verschil (alternatief D).
8. Bewering 1: de standaardfout van het gemiddelde (SEM) is een maat voor de precisie waarmee het populatiegemiddelde geschat wordt. Bewering 2: de standaardfout van het gemiddelde (SEM) kan alleen worden geschat als we herhaalde steekproeven uit de populatie nemen. A. B. C. D.
beide beweringen zijn juist bewering 1 is juist en bewering 2 is onjuist bewering 1 is onjuist en bewering 2 is juist beide beweringen zijn onjuist
We schatten juist altijd een standaardfout op basis van één steekproef! Alleen de theorie over de SEM zich gedraagt is gebaseerd op oneindig vele steekproeven. 9. Twee onderzoekers verrichten allebei bloeddrukmetingen met een kwikmanometer. Onderzoeker A leest de bloeddruk nauwkeurig af (dus precisie is goed), echter van zijn bloeddrukmeter geeft de schaal de bloeddruk gemiddeld 10 mm Hg te hoog aan (dus bias). Onderzoeker B gaat minder nauwkeurig te werk (geen precisie) en gebruikt een bloeddrukmeter die de bloeddrukhoogte goed weergeeft (geen bias). De resultaten van onderzoeker A hebben naar verwachting, ten opzichte van B: A. Een kleinere bias en een slechtere precisie B. Een kleinere bias, maar een betere precisie C. Een grotere bias en een slechtere precisie D. Een grotere bias, maar een betere precisie 10. Het effect van drie verschillende antibiotica op de groei van een bacteriekolonie wordt onderzocht. De antibiotica worden toegevoegd aan petrischalen en vervolgens worden de schalen geïnfecteerd met de bacteriekolonie. Ook is een controlegroep gebruikt, waarbij geen antibioticum is toegevoegd. Na drie dagen is de diameter van de bacteriekolonies (in mm) gemeten. Op basis van de getoonde boxplot, welke van onderstaande beweringen is NIET JUIST?
Versie A
A. B. C. D.
6
De waarnemingen in de controlegroep en de groepen met antibioticum A of C zijn nagenoeg symmetrisch verdeeld De groep met antibioticum A heeft de laagste mediaan De groep met antibioticum C heeft de kleinste interkwartielafstand De waarnemingen in de groep met antibioticum B zijn links scheef verdeeld
De waarnemingen zijn juist rechts scheef verdeeld. De vragen 11, 12 en 13 hebben betrekking op het volgende onderzoek met bijbehorende SPSS uitvoer. Wat is de invloed van rondwormen op de groei van planten? Een bioloog bereid 16 identieke potten voor en voegt verschillende aantallen rondwormen toe aan de potten. Dan verdeelt hij 16 identieke tomatenzaailingen over de potten. Na 16 dagen meet hij de toename in lengte van de planten. De onderzoekers hebben de data in SPSS geanalyseerd. De analyse staat hieronder weergegeven. Descriptives groei zaalingen (cm)
N 0 1000 5000 10000 Total
4 4 4 4 16
Mean Std. Deviation Std. Error 10.650 2.0535 1.0267 10.425 1.4863 .7432 5.600 1.2437 .6218 5.450 1.7711 .8855 8.031 2.9886 .7471
95% Confidence Interval for Mean Lower Bound Upper Bound Minimum Maximum 7.382 13.918 9.1 13.5 8.060 12.790 8.2 11.3 3.621 7.579 4.6 7.4 2.632 8.268 3.2 7.5 6.439 9.624 3.2 13.5
Versie A
7
Levene's Test of Equality of Error Variances a Dependent Variable: groei zaalingen (cm) F
df1 .286
df2 3
Sig. .834
12
Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept+nematoden
Tests of Between-Subjects Effects Dependent Variable: groei zaalingen (cm) Source Corrected Model Intercept nematoden Error Total Corrected Total
Type III Sum of Squares 100.647a 1032.016 100.647 33.328 1165.990 133.974
df 3 1 3 12 16 15
Mean Square 33.549 1032.016 33.549 2.777
F 12.080 371.591 12.080
Sig. .001 .000 .001
a. R Squared = .751 (Adjusted R Squared = .689)
Tests of Normality a
Residual for groei
Kolmogorov-Smirnov Statistic df Sig. .091 16 .200*
*. This is a lower bound of the true significance. a. Lilliefors Significance Correction
Shapiro-Wilk Statistic df .971 16
Sig. .859
Versie A
8
11. Welke van de onderstaande beweringen is JUIST? A. De range in de groep zaailingen zonder nematoden is 6.536. B. De gepoolde standaardafwijking van de vier groepen is 2.9886. C. De variantie in de groep zaailingen met 5000 nematoden is 1.547. D. Er is geen verschil tussen de vier groepen want het gemiddelde 8.031 ligt in het 95% betrouwbaarheidsinterval [6.439; 9.624] De juiste range is 4.4 (alternatief A). In alternatief B is de standaardafwijking gegeven als je alle waarnemingen als 1 groep beschouwd. De echte gepoolde standaardafwijking is 1.6665 (de wortel van de MSerr). Alternatief D is pure onzin: een steekproef gemiddelde ligt altijd precies in het midden van het betrouwbaarheidsinterval voor het populatie gemiddelde. 12. Welke van de onderstaande beweringen is JUIST? A. De overschrijdingskans van de ANOVA is 0.001. B. Je mag geen ANOVA uitvoeren op deze data omdat de varianties significant verschillen. C. Op basis van de Q-Q plot kun je concluderen dat de variabele ‘groei’ nagenoeg normaal verdeeld is. D. De toetsingsgrootheid van de ANOVA is 371.591. Alternatief B is fout want de Levene toets geeft juist aan dat de variantie wel homogeen zijn, de p-waarde is immers groter dan 0.05. Alternatief C is ook fout want de Q-Q plot zegt alleen maar dat de residuen van het ANOVA model normaal verdeeld zijn en zegt dus niets over de verdeling van de groei zelf. (Zie werkcollege 7, vraag 4b en antwoord daarop.)
Versie A
9
Alternatief D is ook fout want de toetsgrootheid om te toetsen of er verschillen zijn tussen de viertal aantallen rondwormen is gelijk aan 12.080. 13. De onderzoekers willen post-hoc toetsen (met Bonferroni correctie) uitvoeren om de verschillen tussen alle groepen te bekijken. Geef de toetsingsgrootheid en de (geschatte) kritieke waarde voor de vergelijking van het gemiddeld verschil in groei tussen de groep zaailingen met 5.000 en de groep zaailingen met 10.000 nematoden. A. B. C. D.
t = 0.127, kritieke waarde is ongeveer 2.179 t = 0.127, kritieke waarde is ongeveer 3.055 t = 0.139, kritieke waarde is ongeveer 2.179 t = 0.139, kritieke waarde is ongeveer 3.055
LSD toets zonder Bonferroni LSD toets met Bonferroni t toets zonder Bonferroni t toets met Bonferroni
Gevraagd worden post hoc toetsen, dus de LSD toets gebruiken en niet de t-toets voor 2 onafhankelijke groepen (zie onder andere opgave 5 uit werkcollege 7). Verder zijn er totaal 6 paarsgewijze vergelijkingen die worden uitgevoerd. Dus bij het toetsen met Bonferroni correctie ga je niet werken met een tweezijdige α van 5% maar met een α van 5%/6 = 0.83% 14. Blootstelling aan lood heeft een effect op neuromusculaire verbindingen en veroorzaakt myopathie (ziekte van het spierweefsel). Antioxidanten zoals ascorbinezuur beschermen mogelijk tegen myopathie. Om het effect van ascorbinezuur op door lood veroorzaakte myopathie te onderzoeken voert een onderzoeker het volgende experiment uit. Bij 12 aan lood blootgestelde ratten wordt de isometrische spierspanning in de tibialis anterior gemeten. Na toediening van ascorbinezuur wordt de spierspanning opnieuw gemeten. De onderzoeker verwacht dat de spierspanning als gevolg van het geven van ascorbinezuur afneemt. Hieronder staan de door de onderzoeker verzamelde gegevens. Voer de juiste t-toets uit en beslis of er sprake is van een significante afname van de spierspanning. Rat nr.
Spierspanning vooraf (g)
Spierspanning na toediening van ascorbinezuur (g)
verschil
1
3
3
0
2
2
3
1
3
4
3
-1
4
3
2
-1
5
3
3
0
6
4
3
-1
7
2
1
-1
8
4
4
0
9
4
5
1
10
3
0
-3
11
3
1
-2
12
3
1
-2
Versie A
10
Opzet is gepaard dus de gepaarde t-toets moet worden gebruikt. Er zijn geen aanwijzingen dat de verschillen niet normaal verdeeld zouden zijn. Gemiddeld verschil is -0.75 met een SD van 1.215. Dit geeft een toetsingsgrootheid van T=-2.138. De toets was eenzijdig dus de pwaarde is 0.025
0.025 < p < 0.05, er is dus wel sprake van een significante afname. 0.025 < p < 0.05, er is dus geen significante afname gevonden op basis van deze gegevens. 0.05 < p < 0.10, er is dus wel sprake van een significante afname. 0.05 < p < 0.10, er is dus geen significante afname gevonden op basis van deze gegevens.
Alternatief B en C zijn fout vanwege de verkeerde link tussen de grootte van de p-waarde en het al dan niet verwerpen van je nulhypothese. In het algemeen geldt als de p-waarde lager is dan je gestelde significantie nivo (meestal 5%) dan verwerp je je nulhypothese. Dan is er sprake van ‘significant’ verschil. Het foute alternatief D krijg je als je of 1) tweezijdig gaat toetsen of 2) de ongepaarde t-toets hebt gebruikt maar wel eenzijdig. 15. Een arts meet kwaliteit van leven op een schaal van 0 tot 100 bij 3 groepen patiënten. Hij wil onderzoeken of de kwaliteit van leven van deze groepen patiënten verschilt. Hieronder is een deel van de analyse welke in SPSS is uitgevoerd weergegeven.
Versie A
11
Levene's Test of Equality of Error Variances a Dependent Variable: kwaliteit F
df1 .000
df2 2
297
Sig. 1.000
Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept+group
Welke toets moet de arts toepassen? A. B. C. D.
variantie-analyse (ANOVA) variantie-analyse (ANOVA) op de logaritmisch-getransformeerde data de Kruskal-Wallis toets geen enkele toets is mogelijk met deze data
De varianties zijn homogeen maar de residuen zijn niet normaal verdeeld. Een ANOVA zou dus niet mogen (alternatief A). De data logarithmisch transformeren maakt het probleem alleen maar erger omdat de residuen links scheef verdeeld zijn. Door het transformeren wordt de verdeling nog meer scheef naar links. Alternatief B is dus fout. Alternatief D is een onzin antwoord want je had niet alleen de Kruskal-Waliis toets kunnen gebruiken maar ook je had ook de anti-log kunnen nemen van de data in de hoop dat je dan wel aan voorwaarden van de ANOVA gaat voldoen.