Studentnaam: Studentnummer:
Voorblad bij tentamen (in te vullen door de examinator) Vaknaam:Biostatistiek en Lineaire Algebra
Vakcode: 2DM81
Datum: 12-4-2016 Begintijd:13.30
Eindtijd: 16.30
Aantal pagina’s:2 voor Lineaire Algebra en 7 voor Biostatistiek (excl. voorblad) Aantal vragen: 5 voor Lineaire Algebra (13 onderdelen), 3 voor Biostatistiek (10 onderdelen) Aantal te behalen punten/normering per vraag: Totaal 100 punten, detailscores per vraag vermeld Wijze van vaststellen eindcijfer:
2DM81: totaalscore gedeeld door 10, afgerond op 1 decimaal Dit cijfer bepaalt voor 70% het eindcijfer van 2DM80
Wijze van beantwoording vragen: formulering, ordening, onderbouwing, multiple choice: De uitwerkingen van de opgaven dienen gemotiveerd, duidelijk geformuleerd en overzichtelijk opgeschreven te worden. In het bijzonder dienen bij statistische toetsen expliciet de volgende details vermeld te worden: hypothesen, toetsingsgrootheden, relevante steekproefverdelingen en steekproefresultaten.
Indien niet anders gespecificeerd geldt: toets met een onbetrouwbaarheid van 5%. Betrouwbaarheidsintervallen 95%. Aan het eind van deze toets zijn bijlagen met uitvoer van R & R Commander en kanstabellen toegevoegd.
Antwoorden Lineaire Algebra & Biostatistiek GESCHEIDEN inleveren ! Instructies voor studenten en surveillanten Toegestane hulpmiddelen (mee te nemen door student): x (Standaard) zakrekenmachine (GEEN grafische calculator)
Let op: • toiletbezoek is alleen onder begeleiding toegestaan • binnen 15 minuten na aanvang en 15 minuten voor het einde mag de tentamenruimte niet worden verlaten, tenzij anders aangegeven • er dient altijd tentamenwerk (volledig ingevuld tentamenpapier: naam, studentnummer e.d.) te worden ingeleverd • tijdens het tentamen dienen de huisregels in acht te worden genomen • aanwijzingen van examinatoren en surveillanten dienen opgevolgd te worden • etui ligt niet op tafel • onderling worden geen hulpmiddelen geleend/uitgewisseld
Tijdens het maken van schriftelijke tentamens wordt onder (poging tot) fraude in ieder geval verstaan: • gebruik van andermans ID-bewijs/campuskaart • mobiele telefoon of enige andere media dragende devices liggen op tafel of zijn opgeborgen in de kleding • (poging tot) gebruik van ongeoorloofde bronnen en hulpmiddelen, zoals internet, mobiele telefoon e.d. • het gebruik van een clicker die niet je eigen clicker is • ander papier voor handen hebben dan door de TU/e is verstrekt, tenzij anders aangegeven • toiletbezoek (of naar buiten lopen) zonder toestemming of begeleiding
Behorende bij Regeling centrale tentamenafname TU/e
Faculteit der Wiskunde en Informatica
2DM81: Eindtoets Biostatistiek & Lineaire Algebra, op dinsdag 12 April 2016, 13.30-16.30 LINEAIRE ALGEBRA GEDEELTE Antwoorden Lineaire Algebra & Statistiek Gescheiden Inleveren ! Opgave LA1: (10 = 5 + 5 punten)
1 1 2 1 Beschouw een matrix A 2 1 1 en vector b 0 : 4 2 3 2 a.
Bereken een LU-decompositie van de matrix A. Licht je werkwijze toe!
b.
Los met behulp van deze LU-decompositie de matrixvergelijking Ax=b op. Licht je werkwijze toe!
Opgave LA2: (6 = 3 + 3 punten) Geef in elk van de volgende gevallen aan of de uitspraak waar is of niet. Beargumenteer je antwoord ! a.
Als A een m bij n matrix is en de vergelijking Ax=b is consistent voor alle bRm , dan heeft de trapvorm van A in alle elke kolom een spil (pivot).
b.
Voor een inverteerbare 3 bij 3 matrix A geldt:
det 3 A 3det A
Opgave LA3: (12 = 5 + 5 + 2 punten) Beschouw een matrix A met bijbehorende trapvorm (echelon form):
1 0 3 2 1 0 3 2 A 0 1 5 4 0 1 5 4 . 3 2 1 3 0 0 0 1 a.
Bepaal een basis voor Col A, de kolomruimte van A. Licht je werkwijze toe!
b.
Bepaal een basis voor Nul A, de nulruimte van A. Licht je werkwijze toe!
c.
Beargumenteer of de afbeelding T: R4 R3 , gedefinieerd als T(x)=Ax, één-op-één (one-to-one) is.
Vervolg Lineaire Algebra
2DM81: 12-4-2016
1
Opgave LA4: (12 = 5 + 5 +2 punten)
2 2 3 Beschouw een matrix A 0 3 2 . 0 1 2 a.
Bereken het karakteristiek polynoom van A. Bepaal op basis daarvan de eigenwaarde(n) van A en de bijbehorende algebraische multipliciteit(en).
b.
Bepaal een basis voor de eigenruimte(s) van A en de bijbehorende geometrische multipliciteit(en).
c.
Beargumenteer of de matrix A diagonaliseerbaar is, dat wil zeggen of er een inverteerbare matrix P en een diagonaal matrix D bestaan, zo dat A=PDP-1. Hint: Je hoeft P, D en P-1 niet expliciet te bepalen!
Opgave LA5: (10 = 2 +4 + 4 punten) Beschouw een matrix, A, en een vector, b, met:
16 b 8 22
2 2 A 6 0 4 1 a.
Bepaal of de kolommen van de matrix A orthonormaal zijn.
b.
Bepaal een basis voor het orthogonaal complement van Col A, de kolomruimte van A.
c.
Bepaal de projectie van de vector b op Col A, de kolomruimte van A.
2DM81: 12-4-2016
2
Faculteit der Wiskunde en Informatica
2DM81: Eindtoets Biostatistiek & Lineaire Algebra, op dinsdag 12 april 2016, 13.30 - 16.30 STATISTIEK GEDEELTE Antwoorden Lineaire Algebra & Statistiek Gescheiden Inleveren ! Opgave 1: (3 x 5 = 15 punten) (Bij deze opgave is gebruik van resultaten uit Appendix 1 noodzakelijk) Om het cholesterol gehalte, XChol_level, van personen die een macrobiotisch dieet volgen te bepalen voert men een aantal experimenten uit. De gemeten waarden, opgeslagen in de variabele “Chol_level”, zijn statistisch geanalyseerd, de resultaten zijn opgenomen in Appendix 1. Hiervan kan bij het beantwoorden van de volgende vragen gebruik gemaakt worden!
a.
Bereken een 95%-betrouwbaarheids-interval voor de verwachtingswaarde, Chol_level, van het cholesterol gehalte van personen die een macrobiotisch dieet volgen. Beargumenteer of dit interval breder of smaller wordt wanneer we de gewenste betrouwbaarheid van het interval verhogen.
b.
Voer een toets uit om te bepalen of de verwachtingswaarde, Chol_level, van het cholesterol gehalte van personen die een macrobiotisch dieet volgen kleiner is dan de specificatiewaarde van 5.8 eenheden. Vermeld duidelijk details, p-waarde en conclusie van de toets.
c.
Bepaal een schatting voor de verwachtingswaarde, Chol_level , en de standaardafwijking, Chol_level, van het cholesterol gehalte van personen die een macrobiotisch dieet volgen, XChol_level. Gebruik deze schattingen om een schatting af te leiden van de verwachtingswaarde, Y, en de standaardafwijking, Y, van de inverse van de vastgestelde cholesterol gehalte van personen die een macrobiotisch dieet volgen:
Y g X Chol_ level
1 X Chol_ level
Opgave 2: (3 x 5 = 15 punten) (Bij deze opgave is gebruik van resultaten uit Appendix 2 noodzakelijk) Verschilt het bloedsuiker gehalte van personen met vernauwde halsslagader van dat van personen zonder vernauwde halsslagader? Om dit te onderzoeken bepaalt men van een aantal personen met en van een aantal personen zonder vernauwde halsslagader het bloedsuiker gehalte. De beschikbare gegevens, opgeslagen in de variabelen ‘Sugar’ en ‘Vernauwing’ (levels: ‘Yes’ en ‘No’), zijn statistisch geanalyseerd, de resultaten opgenomen in Appendix 2. Hiervan kan bij het beantwoorden van de volgende vragen gebruik gemaakt worden!
a.
Voer een Exploratieve Data Analyse uit. Vermeld relevante kentallen, beschrijf opvallende zaken en bespreek in hoeverre er sprake is van een symmetrische verdeling danwel van een Normale verdeling van de resultaten.
b.
Voer een toets uit om te bepalen of de varianties (!) van de bloedsuiker gehaltes van beide groepen significant verschillen. Vermeld duidelijk details, p-waarde en conclusie van de toets.
c.
Voer een toets uit om te bepalen of de verwachtingswaardes van de bloedsuiker gehaltes van beide groepen significant verschillen. Vermeld duidelijk details, p-waarde en conclusie van de toets. Indien meerdere toetsen van toepassing zijn, beargumenteer dan welke toets de voorkeur verdient.
2DM81
1
12-4-2016
Opgave 3: (4 x 5 = 20 punten) (Bij deze opgave is gebruik van resultaten uit de Appendices 3a en 3b noodzakelijk) Men vermoedt dat bij personen die aan een bijzondere vorm van bloedarmoede lijden, namelijk aplastische anemie, de hoeveelheid rode bloedcellen een goede voorspeller is voor het gehalte reticulocyten in hun bloed. Om dit te onderzoeken bepaalt men volgens een standaard procedure bij een aantal betroffenen de hoeveelheid rode bloedcellen en het gehalte reticulocyten. De gemeten waarden, opgeslagen in de variabelen ‘Reticulo’ en ‘RedBlood’, zijn statistisch geanalyseerd, de eerste resultaten opgenomen in Appendix 3a.
a.
Voer een Exploratieve Data Analyse uit op deze data. Geef aan of in dit geval een eerste orde lineair model geschikt lijkt om de resultaten van het onderzoek te beschrijven en geef de vergelijking van de bijbehorende regressielijn die het gehalte reticulocyten als functie van de hoeveelheid rode bloedcellen beschrijft.
b.
Voer een ANOVA-toets uit om te bepalen of het model als geheel significant is. Vermeld expliciet hypothesen, toetsingsgrootheid, beslisregels, p-waarde en conclusies !
c.
Welke modelaannamen gelden voor het eerste orde lineaire model? Beargumenteer op basis van de residuen of aan deze modelaannames voldaan lijkt te zijn.
Tijdens het experiment is ook bij alle betrokkenen de hoeveelheid witte bloedcellen geregistreerd. Deze zijn opgeslagen in een variabele ’WhiteBlood’. Om na te gaan of het gehalte reticulocyten beïnvloed wordt door de hoeveelheid witte bloedcellen is, in aanvulling op het eerder beschreven enkelvoudige lineair model, ook een meervoudig lineair model gefit. Resultaten hiervan staan vermeld in Appendix 3b.
d.
Voer een toets uit om te bepalen of de hoeveelheid witte bloedcellen een significante invloed gehad heeft op het gehalte reticulocyten in het beschreven experiment. Vermeld duidelijk details, p-waarde en conclusie van de toets. Vergelijk ook, op basis van de beschikbare gegevens, de kwaliteit en sterkte van het meervoudige en het eerder gevonden enkelvoudige model onderling en interpreteer eventuele verschillen!
2DM81
2
12-4-2016
Appendix 1 (opgave 1) 3.0
Histogram
6.0
1.5
4.5
5.0
5.5
6.0
Chol_level
5.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
norm quantiles
4.0
4.5
Chol_level
5.5
4.0
6.0
6.5
Boxplot
6.5
5.0
4.0
4.5
3.5
Chol_level
0.0
0.5
5.5
1.0
frequency
2.0
6.5
2.5
Quantile comparison plot
> numSummary(Exercise01[,"Chol_level"], statistics=c("mean", "sd", "se(mean)", "IQR", + "quantiles"), quantiles=c(0,.25,.5,.75,1)) mean sd se(mean) IQR 0% 25% 50% 75% 100% n 5.232222 0.8992605 0.2997535 1.28 3.62 4.67 5.16 5.95 6.4 9 > with(Exercise01, (t.test(Chol_level, alternative='two.sided', mu=5.8, conf.level=.95))) data: Chol_level t = -1.8941, df = ??, p-value = 0.09482 > with(Exercise01, sigma.test(Chol_level, alternative='two.sided', sigma=5.8, conf.level=.95)) data: Chol_level X-squared = 0.19231, df = ??, p-value = 6.597e-06 > with(Exercise01, shapiro.test(Chol_level)) data: Chol_level W = 0.95154, p-value = 0.707
2DM81
3
12-4-2016
Appendix 2 (opgave 2) Boxplot of Sugar (order: Vernauwing Yes, No)
7.4 6.6
6.6
6.8
6.8
7.0
7.2
Sugar
7.2 7.0
Sugar
7.4
7.6
7.6
7.8
7.8
Stripchart of Sugar (order: Vernauwing Yes, No)
Yes
No
Yes
No Vernauwing
Quantile comparison plot of Sugar (Vernauwing Yes)
No
7.2 6.6
7.2
6.8
7.4
7.0
Yes
7.6
7.4
7.6
7.8
7.8
Quantile comparison plot of Sugar (Vernauwing No)
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
-1.5
norm quantiles
-1.0
-0.5
0.0
0.5
1.0
1.5
norm quantiles
> numSummary(Exercise02[,"Sugar"], groups=Exercise02$Vernauwing, statistics=c("mean", + "sd", "se(mean)", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1)) mean sd se(mean) IQR 0% 25% 50% 75% 100% Yes 7.20 0.4268749 0.13498971 0.575 6.5 6.900 7.35 7.475 7.8 No 7.57 0.2750757 0.08698659 0.350 7.1 7.425 7.60 7.775 7.9 > t.test(Sugar~Vernauwing, alternative='two.sided', conf.level=.95, + var.equal=TRUE, data=Exercise02)
data:n 10 10
data: Sugar by Vernauwing t = -2.304, df = 18, p-value = 0.03336 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.70738537 -0.03261463 > t.test(Sugar~Vernauwing, alternative='two.sided', conf.level=.95, + var.equal=FALSE, data=Exercise02) data: Sugar by Vernauwing t = -2.304, df = 15.375, p-value = 0.03556 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.7115618 -0.0284382 > t.test(Sugar~Vernauwing, alternative='two.sided', conf.level=.95, + paired=TRUE, data=Exercise02) data: Sugar by Vernauwing t = -1.81, df = 9, p-value = 0.1037 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.83243765 0.09243765 > var.test(Sugar ~ Vernauwing, alternative='two.sided', conf.level=.95, + data=Exercise02) data: Sugar by Vernauwing F = 2.4082, num df = 9, denom df = 9, p-value = 0.2066 95 percent confidence interval: 0.5981686 9.6954925
2DM81
4
12-4-2016
Appendix 3a (opgave 3) > numSummary(Exercise03[,c("RedBlood", "Reticulo")], statistics=c("mean", "sd", + "se(mean)", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1))
RedBlood Reticulo
mean 0.4338 0.2017
sd se(mean) 0.1565 0.05532 0.0430 0.01519
IQR 0% 25% 50% 75% 100% 0.1875 0.2000 0.3275 0.4300 0.5150 0.7000 0.0535 0.1311 0.1770 0.2073 0.2305 0.2622
n 8 8
x-axis: RedBlood, y-axis: Reticulo 0.25
> cor(Exercise03[,c("RedBlood","Reticulo")])
0.15
Reticulo
0.20
RedBlood Reticulo RedBlood 1.0000000 0.7335022 Reticulo 0.7335022 1.0000000
0.10
> Anova(RegModel.1, type="II") Response: Reticulo 0.2
0.3
0.4
0.5
0.6
Sum Sq RedBlood 0.0069519 Residuals 0.0059692
0.7
RedBlood
> qqPlot(RegModel.1)
1 0 -1
Residual standard error: 0.03154 on ?? degrees of freedom Multiple R-squared: 0.538, Adjusted R-squared: 0.461 F-statistic: 6.988 on ?? and ?? DF, p-value: 0.03836
-2
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.11432 0.03488 ????? 0.0169 RedBlood 0.20140 0.07619 ????? 0.0384
Studentized Residuals(RegModel.1)
2
> RegModel.1 <- lm(Reticulo~RedBlood, data=Exercise03)
Df F value Pr(>F) ?? 6.9877 0.03836 ??
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
t Quantiles
> plot(RegModel.1)
6
0.16 0.18 0.20 0.22
6
1
0.4
0.8
2
0.0
Standardized residuals
0.02
8
-0.02 -0.06
Residuals
1
1.2
Scale-Location
Residuals vs Fitted
0.16 0.18 0.20 0.22
0.24
0.24
Fitted values
Fitted values
Appendix 3b
2DM81
5
12-4-2016
Appendix 3b (opgave 3d)
0 -1 -2
Residual standard error: 0.02965 on ?? degrees of freedom Multiple R-squared: 0.6598, Adjusted R-squared: 0.5237 F-statistic: 6.80 on ?? and ?? DF, p-value: 0.0375
Studentized Residuals(RegModel.2)
1
> RegModel.2 <- lm(Reticulo ~ RedBlood + WhiteBlood, data=Exercise03) Coefficients: > qqPlot(RegModel.2) Estimate Std. Error t value Pr(>|t|) (Intercept) -12.77243 9.63198 ?????? 0.2422 RedBlood 0.21784 0.07267 ?????? 0.0302 WhiteBlood 20.12441 15.04155 ?????? 0.2385
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
t Quantiles
Scale-Location
6
0.16
0.18
0.20
0.22
1.2
1
0.8 0.16
0.24
0.18
0.20
0.22
0.24
Fitted values
Fitted values
2DM81
6 7
0.4
0.00
1
0.0
7
Standardized residuals
Residuals vs Fitted
-0.04
Residuals
0.04
> plot(RegModel.2)
6
12-4-2016
Tabel Student t-verdeling
2DM81
7
12-4-2016