Faculteit der Wiskunde en Informatica
Tentamen Biostatistiek 2 voor BMT (2DM50), op dinsdag 5 april 2011 9.00-12.00 uur
Bij het tentamen mag alleen gebruik worden gemaakt van een zakrekenmachine. Het gebruik van boek, college-aantekeningen, Statistisch Compendium, laptop ed. is NIET toegestaan. De antwoorden dienen gemotiveerd, duidelijk geformuleerd en overzichtelijk opgeschreven te worden. Indien niet anders gespecificeerd geldt: toets met een onbetrouwbaarheid van 5%. Betrouwbaarheidsintervallen 95%. Er zijn 6 vraagstukken met in totaal 20 onderdelen. Elk onderdeel wordt gewaardeerd met 5 punten. Het eindcijfer wordt berekend door het totaal door 10 te delen. Aan het eind van dit tentamen zijn bijlagen met uitvoer van SPSS toegevoegd.
Opgave 1: (2 x 5 = 10 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 1 noodzakelijk) Onderzoekers willen nagaan of bij longfunctiemetingen de positie van de proefpersoon, liggend of zittend, van invloed is op het verkregen resultaat. Daartoe meten ze bij een aantal gezonde proefpersonen voor beide posities, zittend danwel liggend, het expiratoir secondevolume, FEV1: het volume dat in de eerste seconde kan worden uitgeademd tijdens een geforceerde uitademingmanoeuvre. Op basis van deze resultaten en hun verschilwaarden zijn een aantal analyses uitgevoerd, welke vermeld staan in bijlage 1.
a. Voer op basis van de resultaten in bijlage 1 een Exploratieve Data Analyse uit. Vermeld relevante kentallen, beschrijf opvallende zaken en bespreek in hoeverre er sprake is van een symmetrische verdeling van de resultaten.
b. Voer op basis van de resultaten in de bijlage 1 een adequate toets uit om te bepalen of er een verschil is in de waarde voor het expiratoir secondevolume, FEV1, voor beide posities. Indien meerdere methoden van toepassing zijn beargumenteer dan welke methode de voorkeur verdient. Omschrijf het principe van de toets en vermeld hypothesen, significantie en conclusie.
2DM50
1
5-4-2011
Opgave 2: (2 x 5 = 10 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 2 noodzakelijk) Om na te gaan in hoeverre diabetes een rol speelt bij het optreden van een acuut hartinfarct is een matched case-control studie uitgevoerd. Hierbij zijn slachtoffers van een acuut hartinfarct gematched (groep: cases), naar leeftijd en geslacht, met personen zonder hart-en vaatziekten (groep: control). De proefpersonen is gevraagd of ze ooit gediagnosticeerd zijn voor diabetes. Resultaten zijn:
Op basis van de resultaten zijn een aantal analyses uitgevoerd, welke vermeld zijn in bijlage 2. a. Voer op basis van de resultaten in bijlage 2 een Exploratieve Data Analyse uit naar een mogelijke verband tussen diabetes en het optreden van een acuut hartinfarct. Is hier sprake van een onderzoekopzet met afhankelijke of met onafhankelijke data? b. Voer op basis van de resultaten in bijlage 2 een toets uit om te bepalen of er een verband bestaat tussen diabetes en het optreden van een acuut hartinfarct. Beargumenteer welke toets in dit geval van toepassing is en omschrijf het principe van de toets.
2DM50
2
5-4-2011
Opgave 3: (3 x 5 = 15 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 3 noodzakelijk) Drop-out, het voortijdig beëindigen van een behandeling, is een veelvoorkomend probleem bij onder andere de behandelingen van overgewicht. Men vermoedt dat de kans op drop-out toeneemt naarmate iemand al vaker pogingen ondernomen heeft om overgewicht te bestrijden. Om dit nader te onderzoeken verzamelt men van personen die deel gaan nemen aan een nieuwe therapie gegevens over het aantal pogingen om overgewicht te bestrijden dat, voorafgaand aan de nieuwe therapie, al ondernomen is. Ook houdt men gedurende een periode van 3 maanden de drop-out bij van de nieuwe therapie. Resultaten zijn:.
Op basis van de resultaten zijn een aantal analyses uitgevoerd, welke vermeld zijn in bijlage 3. a.
Voer op basis van de resultaten in bijlage 3 een Exploratieve Data Analyse uit naar een mogelijke samenhang tussen het aantal pogingen dat iemand al ondernomen heeft om overgewicht te bestrijden en de drop-out bij de nieuwe therapie tijdens de eerste drie maanden.
b. Voer op basis van de resultaten in bijlage 3 een toets uit om te bepalen of er een samenhang is tussen het aantal pogingen dat iemand al ondernomen heeft om overgewicht te bestrijden en de drop-out bij de nieuwe therapie tijdens de eerste drie maanden. Vermeld hypothesen, toetsingsgrootheid, steekproevenverdeling en conclusie. Is aan de noodzakelijke voorwaarden voor deze toets voldaan? c.
Voer op basis van de resultaten in bijlage 3 een toets uit om te bepalen of er een trend is tussen de dropout bij de nieuwe therapie tijdens de eerste drie maanden en het aantal pogingen dat iemand al ondernomen heeft om overgewicht te bestrijden. Vermeld hypothesen, toetsingsgrootheid, en conclusie.
2DM50
3
5-4-2011
Opgave 4: (5 x 5 = 30 punten) (Bij deze opgave is gebruik van resultaten uit de bijlagen 4a t/m 4c noodzakelijk) Om inzicht te krijgen in risicofactoren voor hart en vaatziekten bepaalt men van een aantal proefpersonen de systolische bloeddruk en het lipiden profiel. Op basis hiervan beschikt men over scores op elk van de volgende kenmerken: x1: systolische bloeddruk (in mm HG), x2: totaal gehalte cholesterol (in mg/DL), x3: gehalte HDL cholesterol (in mg/DL) en x4: gehalte triglyceriden. Met deze gegevens zijn een aantal analyses uitgevoerd, welke vermeld zijn in bijlagen 4a en 4b. a. Voer op basis van de resultaten in bijlage 4a een Exploratieve Data Analyse uit voor de gerapporteerde kenmerken x1: systolische bloeddruk, x2: totaal gehalte cholesterol, x3: gehalte HDL cholesterol en x4: gehalte triglyceriden. Beschrijf opvallende zaken en besteed aandacht aan mogelijke samenhang tussen de variabelen. Om een mogelijke samenhang tussen de gerapporteerde kenmerken nader te onderzoeken zijn, in bijlage 4b, ook een aantal partiële correlatiecoefficienten gerapporteerd. b. Leg uit wat het verschil is tussen partiële correlatiecoefficienten, zoals vermeld in bijlage 4b, en de ‘gewone’ (Pearson) correlatie coefficienten zoals vermeld in bijlage 4a. Vergelijk resultaten voor de ‘gewone’ (Pearson) correlaties met resultaten voor de partiële correlaties en interpreteer mogelijke verschillen. Van de proefpersonen is ook het zuurstofverbruik, y, bepaald. Men is geïnteresseerd in een model om dit zuurstofverbruik te kunnen voorspellen op basis van de eerder aangegeven kenmerken: x1: systolische bloeddruk, x2: totaal gehalte cholesterol, x3: gehalte HDL cholesterol en x4: gehalte triglyceriden. Op basis van de beschikbare gegevens is met een automatische modelselectie techniek een regressiemodel gefit. Resultaten staan in bijlage 4c. c.
Welke automatische modelselectie techniek is hier gebruikt en hoe werkt deze in principe? Beschrijf de concrete stappen die tijdens dit selectieproces gezet zijn en specificeer het uiteindelijk geselecteerde model.
d. Beoordeel met behulp van een adequate statistische toets de significantie van het uiteindelijk geselecteerde model als geheel. Vormt multicollineariteit een probleem? e. Welke aannamen zijn van toepassing op het gefitte regressiemodel? Beargumenteer op basis van de resultaten in bijlage 4c of aan deze aannamen voldaan lijkt te zijn.
2DM50
4
5-4-2011
Opgave 5: (5 x 5 = 25 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 5 noodzakelijk) Voor drie medicijnen (type A, type B of type C) wil men nagaan in hoeverre de dosis (laag of hoog) van invloed is op de reactietijd van een gebruiker. Men voert een experiment uit waarbij proefpersonen één van de medicijnen, type A, type B of type C, in één van de twee mogelijke doses, laag of hoog, toegediend krijgen. Bij elke proefpersoon vindt meeting van de reactietijd plaats. Op basis van de zo verkregen gegevens zijn een aantal analyses uitgevoerd welke vermeld staan in bijlage 5. a. Van welk type experiment opzet (experimental setup) is bij het geschetste experiment sprake? Geef de structuur aan van de kwadratensom-opsplitsing voor dit model en vermeld welke termen bijdragen aan het modeleffect en welke aan de error. b. Voer op basis van de resultaten in bijlage 5 een Exploratieve Data Analyse uit. Beschrijf opvallende zaken en bespreek in hoeverre er sprake is van een symmetrische verdeling. Is er sprake van een gebalanceerde opzet? Voor de “Test of Between-Subjects Effects” zijn twee methoden opgenomen in bijlage 5: de Type II Sum of Squares (experimental method) en de Type III Sum of Squares (unique method). c.
Bespreek de verschillen tussen beide methoden en de onderliggende oorzaken hiervoor. Beargumenteer welke methode in dit geval je voorkeur heeft!
d. Bepaal op basis van de resultaten in de bijlage 5 of factoren en hun interacties significant zijn. Vermeld hypothesen, toetsingsgrootheid, steekproevenverdeling, gebruikte methode en conclusie. e. Bepaal op basis van een geschikte post-hoc analyse in hoeverre er voor de verschillende medicijnen, type A, type B of type C verschillen in reactietijden zijn. Indien meerdere methoden van toepassing zijn beargumenteer dan welke methode de voorkeur verdient. Geef ook een interpretatie voor andere significante effecten en/of interacties, voor zo ver deze significant zijn!
Opgave 6: (3 x 5 = 15 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 6 noodzakelijk) Om te bepalen of koperdeficiëntie van invloed is op de groei voert men een experiment uit waarbij proefdieren willekeurig toegewezen worden aan een van drie mogelijke diëten, namelijk dieet A (koper-arm), dieet B (koperadequaat) of dieet C (koper-overvloedig). Na 20 weken wordt bij elk proefdier het relatieve gewicht bepaald van hart, lever, nieren en milt. Op basis van de zo verkregen gegevens zijn een aantal analyses uitgevoerd welke vermeld staan in bijlage 6. a. Van welk type experiment opzet (experimental setup) is bij het geschetste experiment sprake? Geef de structuur aan van de kwadratensom-opsplitsing voor dit model en vermeld welke termen bijdragen aan het modeleffect en welke aan de error. Is er sprake van een gebalanceerde opzet? b. Bepaal op basis van de resultaten in de bijlage 6 welke “within subject” effecten en/of interacties significant zijn. Vermeld hypothesen, toetsingsgrootheid, steekproevenverdeling en conclusie. Beargumenteer of sphericiteit in dit geval een probleem is. Geef voor significante interacties een interpretatie! c.
Bepaal op basis van de resultaten in de bijlage 6 welke “between subject” effecten en/of interacties significant zijn. Vermeld hypothesen, toetsingsgrootheid, steekproevenverdeling en conclusie. Beargumenteer of sphericiteit in dit geval een probleem is. Geef voor significante interacties een interpretatie!
2DM50
5
5-4-2011
Bijlage 1 (opgave 1):
FEV1 zittend
FEV1 liggend
verschil: FEV1 zittend –FEV1 liggend
2DM50
6
5-4-2011
Bijlage 2 (opgave 2):
volgorde: Cases Diabetes {No, Yes}
2DM50
volgorde: Control Diabetes {No, Yes}
7
5-4-2011
Bijlage 3 (opgave 3):
volgorde: drop out binnen 3 maanden {nee, ja}
2DM50
volgorde: aantal eerdere pogingen {geen, 1, 2, 3, 4 of meer}
8
5-4-2011
Bijlage 4a (opgave 4a):
Bijlage 4b (opgave 4b): Partial Correlations:
Partial Correlations:
vervolg bijlage 4
2DM50
9
5-4-2011
Bijlage 4c (opgave 4 c t/m e):
vervolg bijlage 4c
2DM50
10
5-4-2011
Bijlage 4c – vervolg (opgave 4 c t/m e): Scatterplot of Standardized Predicted Values versus Studentized Residuals
2DM50
11
Studentized Residuals
5-4-2011
Bijlage 5 (opgave 5):
Type II Sum of Squares (experimental method)
Type III Sum of Squares (unique method)
Vervolg bijlage 5
2DM50
12
5-4-2011
Bijlage 5 vervolg (opgave 5):
laag
hoog
type B
type C
type A
2DM50
13
5-4-2011
Bijlage 6 (opgave 6):
Vervolg bijlage 6
2DM50
14
5-4-2011
Bijlage 6 Vervolg (opgave 6):
(1=hart, 2=lever, 3=nieren, 4=milt)
(1=Cu-arm, 2=Cu-adequaat, 3=Cu-overvloedig)
hart Cu overvloedig
lever nieren
Cu arm
milt
Cu adequaat
(1=hart, 2=lever, 3=nieren, 4=milt)
2DM50
15
5-4-2011