1., Egy területen véletlenszerűen kihelyezet kvadrátokban megszámlálták az Eringium maritimum (tengerparti ördögszekér) egyedeit. 1., Határozza meg az átlagos egyedszámot és a szórást. Egyedszám (xi)
0
1
2
3
4
5
6
7
8
Kvadrát (fi)
16
41
49
20
14
5
1
1
0
;
;
R-ben:
n<-sum(kvadrat) egyedszam<-c(0,1,2,3,4,5,6,7,8) kvadrat<-c(16,41,49,20,14,5,1,1,0) atlag<-sum(egyedszam*kvadrat)/n [1] 1.993197 szoras<-sqrt((sum(egyedszam^2*kvadrat)-(n*atlag^2))/(n-1)) [1] 1.352302
2., Jellemezhető-e az eloszlás Poisson eloszlással. tehát H0 = x Poisson eloszlású.
-statisztával teszteljük.
emp.p<-dpois(egyedszam, atlag) chisq.test(kvadrat, p=emp.p) Chi-squared test for given probabilities data: kvadrat X-squared = 5.5886, df = 8, p-value = 0.6932
A H0 hipotézis valószínűsége 0.69, így az ördögszekér eloszlása Poisson eloszlásúnak tekinthető.
2., Két a Baëtis genuszba tartozó kérészfaj (A és B) lárváit 80 darab 100 cm2-es randomizáltan kihelyezet mintavételi egységben vizsgálták. Az alábbi adatokat kapták: esz 0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
A/k 0
0
0
0
2
2
4
7
10
10
10
10
8
6
4
4
2
1
B/k 3
7
9
12
10
6
7
6
5
4
3
2
2
1
1
1
1
0
Számítsa ki a fajok átlagos egyedszámát és szórását kvadrátonként. Mi lehet a magyarázata az átlagok és a szórások különbséégének? Egyedszam<-c(0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17) A.keresz<-c(0,0,0,0,2,2,4,7,10,10,10,10,8,6,4,4,2,1) B.keresz<-c(3,7,9,12,10,6,7,6,5,4,3,2,2,1,1,1,1,0) A.n<-sum(A.keresz) B.n<-sum(B.keresz) A.atlag<-sum(A.keresz*Egyedszam)/sum(A.keresz) > A.atlag [1] 10.125 B.atlag<-sum(B.keresz*Egyedszam)/sum(B.keresz) > B.atlag [1] 5.3125 A.szoras<-sqrt((sum(Egyedszam^2*A.keresz)-(A.n*A.atlag^2))/(A.n-1)) A.szoras A variancia (v=s2) [1] 2.931172 8.591772 B.szoras<-sqrt((sum(Egyedszam^2*B.keresz)-(B.n*B.atlag^2))/(B.n-1)) B.szoras A variancia (v=s2) [1] 3.678861 13.53402
Az A faj átlaga és varianciája alig különböznek. A Poisson eloszlás esetében , ezért joggal feltétezhetjük a Poisson eloszlást. A B faj varianciája nagyobb mint az átlag, s ezért a nagy varianciáért az aggregáció a felelős: valamely lárva környezetében nagyobb valószínűséggel él másik lárva, mint olyan környezetben ahol más lárva nincsen. 3., Tegyük fel,hogy a humán menstruációs ciklus hosszúsága normális eloszlású. Egy nő esetében a ciklus hosszúságára az alábbi megfgyeléseket teték. 26, 24, 29, 33, 25, 26, 23, 30, 31, 30, 28, 27, 29, 26, 28 Megfelel-e a ciklus átlagos hossza, a 29.5 napos átlagértéknek, 95%-os valószínűség szinten? ; alternatív hipotézis: ciklus<-c(26, 24, 29, 33, 25, 26, 23, 30, 31, 30, 28, 27, 29, 26, 28) > t.test(ciklus, mu=29.5) One Sample t-test data: ciklus t = -2.5886, df = 14, p-value = 0.02145 alternative hypothesis: true mean is not equal to 29.5 95 percent confidence interval: 26.14767 29.18567
sample estimates: mean of x 27.66667
A megfgyelt ciklus rövidebb, mint a feltételezet. 4., Egy kísérleti sertéshízlalóban két tápszert próbáltak ki. Mindkét tápszer esetében vizsgálták az adot intervallumbeli súlygyarapodást, és 12-12 megfgyelt állatra a következő adatokat kapták. T1: 41, 34, 29, 26, 32, 35, 38, 34, 30, 29, 32, 31 T2: 26, 24, 28, 29, 30, 29 ,32, 26, 31, 29, 32, 28 Tegyük fel, hogy a súlygyarapodás normális eloszlású. Vizsgáljuk meg, hogy 95% szignifkancia szinten, hogy van-e különbség a tápok hatását illetően? ; alternatív
hipotézis
T1<-c(41, 34, 29, 26, 32, 35, 38, 34, 30, 29, 32, 31) T2<-c(26, 24, 28, 29, 30, 29 ,32, 26, 31, 29, 32, 28) > var.test(T1,T2) F test to compare two variances data: T1 and T2 F = 2.8338, num df = 11, denom df = 11, p-value = 0.09825 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.815773 9.843595 sample estimates: ratio of variances 2.83375
A két testsúly gyarapodás varianciája azonosnak tekinthető, mivel a kapot valószínűség 0.05< p. t.test(T1,T2, var.equal=T) Two Sample t-test data: T1 and T2 t = 2.8147, df = 22, p-value = 0.01009 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 1.030898 6.802435 sample estimates: mean of x mean of y 32.58333 28.66667
Az első (T1) táp szignifkánsan nagyobb súlynövekedést indukált. 5., A Daphnia longispina két populációjának 7-7 klónjának napokban kifejezet életartamának a következő idők adódtak: A: 7.2, 7.1, 9.1, 7.2, 7.3, 7.2, 7.5 B: 8.8, 7.5, 7.7, 7.6, 7.4, 6.7, 7.2 Az életartam a két populáció esetében normális eloszlásúnak adódot. Azonosnak tekinthető-e a
populációk életartama, 95%-os szignifkancia szinten? ; alternatív hipotézis: > A<-c(7.2, 7.1, 9.1, 7.2, 7.3, 7.2, 7.5) > B<-c(8.8, 7.5, 7.7, 7.6, 7.4, 6.7, 7.2) > var.test(A,B) F test to compare two variances data: A and B F = 1.2326, num df = 6, denom df = 6, p-value = 0.8061 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.2117886 7.1731883 sample estimates: ratio of variances 1.232558
A két Daphnia populáció életartamának varianciája azonosnak tekinthető. t.test(A,B, var.equal=T) Two Sample t-test data: A and B t = -0.1186, df = 12, p-value = 0.9076 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.8302870 0.7445727 sample estimates: mean of x mean of y 7.514286 7.557143
A két Daphnia populáció életartamában nincs különbség. 6., Egy vizsgálat során 12 állat szérum-koleszterolszintjét és az altériafal kalciumtartalmát mérték. A következő eredményeket kapták: koleszterin (mg/100 ml): Ca-tartalom: (mg/sz.s 100g): Találunk-e kapcsolatot közötük
59, 52, 42, 59, 24, 24, 40, 32, 63, 57, 36, 24 289, 303, 233, 287, 236, 245, 265, 233, 286, 290, 264, 239 szinten?
; alternatív hipotézis: koleszt<-c(59, 52, 42, 59, 24, 24, 40, 32, 63, 57, 36, 24) Ca<-c(289, 303, 233, 287, 236, 245, 265, 233, 286, 290, 264, 239) > cor(koleszt, Ca) [1] 0.8522909 > cor.test(koleszt, Ca) Pearson's product-moment correlation data:
koleszt and Ca
t = 5.1526, df = 10, p-value = 0.0004298 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.5449331 0.9577347 sample estimates: cor 0.8522909
A szérum-kolszterol és az artéria fal Ca tartaloma közöt szoros korreláció tapasztalható. 7., Két tulajdonságpárral kapcsolatos keresztezési kísérletben, az F2 nemzedékben a következő gyakorisági adatokat kapták: fenotipus: gyakoriság
AB 247
Ab 81
aB 53
ab 27
Elfogadható-e, hogy az F2 nemzedék 9:3:3:1 eloszlású? H0 : a minta egy olyan populációból származik amelyre jellemző az adot elméleti eloszlás H1: a minta egy más eloszlású populációból származik fenotipus<-c(247,81,53,27) chisq.test(fenotipus, p=c(9/16,3/16,3/16,1/16)) Chi-squared test for given probabilities data: fenotipus X-squared = 8.9063, df = 3, p-value = 0.03056
A hipotézist elvetjük, a kísérletben az F2 nemzedék nem követi az elméleti arányt. 8., Az 2., feladatban döntsük el a Poisson eloszlásra vonatkozó hipotézist.
val.gyak.A.keresz<-A.keresz[5:18] elm.p.A.keresz<-dpois(Egyedszam[5:18], A.atlag) elm.p.A.keresz[14]<-1-sum(elm.p.A.keresz[1:13]) elm.gyak.A.keresz<-elm.p.A.keresz*sum(A.keresz) x2<-sum(((val.gyak.A.keresz-elm.gyak.A.keresz)^2)/ elm.gyak.A.keresz) x2 [1] 2.75636 1-pchisq(x2, 14-1-1) [1] 0.9917578 # p – valószínűség
Más módon: > chisq.test(rbind(val.gyak.A.keresz,elm.gyak.A.keresz)) Pearson's Chi-squared test data: rbind(val.gyak.A.keresz, elm.gyak.A.keresz) X-squared = 1.7272, df = 13, p-value = 0.9999
9., A Poisson eloszlásra való hipotézisünket elfogadjuk. Egy fenyőfaj térbeli eloszlásának vizsgálata adot mintaterületen 100 db, 7.3 m 2 nagyságú random módon elhelyezet kvadrátban vizsgálták a fák számát. Fák száma: kvadrát gyakoriság
0, 1, 2, 3, 4, 5, 6, 7, 8, ≥ 9 7, 16, 20, 24, 17, 9, 5, 1, 1, 0
Igazolható-e, hogy e a fák eloszlását a véletlen határozza meg (Poisson eloszlású)? fa<-c(0,1,2,3,4,5,6,7,8,9) kvadrat<-c(7, 16, 20, 24, 17, 9, 5, 1, 1, 0) fa.atlag<-sum(fa*kvadrat)/sum(kvadrat) fa.atlag [1] 2.86 elm.vals<-dpois(fa, fa.atlag) elm.vals[10]<-1-sum(elm.vals[1:9]) elm.gyak<-elm.vals*sum(kvadrat) x2<-sum(((kvadrat-elm.gyak)^2)/elm.gyak) x2 [1] 1.910754 > 1-pchisq(x2,9) [1] 0.9928 > chisq.test(kvadrat, p=elm.gyak)) Pearson's Chi-squared test data: kvadrat X-squared = 1.9108, df = 9, p-value = 0.9928
A hipotézist, miszerint a fák eloszlása a véletlent követi, igaz. 10., Egy adot területen valamely madárfaj egyedszámára vonatkozó megfgyelési eredményeket foglaltuk össze. Elfogadható-e a nemek évszakonkénti azonos arányára tet H0 hipotézis? hím nőstény
Tavasz 163 86
nyár 135 77
ősz 71 40
tél 43 38
H0 = X, Y azonos eloszlású madar<-matrix(c(163,135,71,43,86,77,40,38), byrow=T, nrow=2) > madar [,1] [,2] [,3] [,4] [1,] 163 135 71 43 [2,] 86 77 40 38 > chisq.test(madar, correct=F) Pearson's Chi-squared test data: madar X-squared = 4.1506, df = 3, p-value = 0.2457
A p >0.05, ezért a H0 hipotézist elfogadjuk, miszerint nincs különbség az ivarok évszakonkénti eloszlásában.
11., A Primula sinensis kankalinfaj egyedeinek magvait esővízzel, illetve sok agyagkolloidot tartalmazó „zavaros” talajvízzel átitatot szűrőpapíron csíráztaták, és a következő adatokat kapták: esővíz talajvíz
Kicsírázot 37 32
nem csírázot ki 13 18
Szignifkáns-e a kezelési különbség, 0.2 szignifkancia szinten? > kankalin<-matrix(c(37,13,32,18), byrow=T, nrow=2) > chisq.test(kankalin, correct=F) Pearson's Chi-squared test data: kankalin X-squared = 1.1688, df = 1, p-value = 0.2797
A valószínűség > 0.2, így a különbség nem szignifkáns. 12., A négytényezős kontingenciatáblázat eseténben az -próba alkalmazásának feltételeként szokták tekinteni, hogy minden elméleti gyakoriság 5-nél nagyobb legyen. Kis mintaelemszám esetén a Yates-féle korrekciót alkalmazzuk (R-ben alapeset (lásd, help): cisq.test(x, correct=T). Egy terápiás eljárás alkalmazásakor 30 beteg kozül 20 gyógyult meg, anélkül 17 beteg közül 12. Vizsgáljuk meg a Yates-korrekcióval módosítot -próbával, hogy 0.1 szignifkancia szinten van-e különbség a kezelt és nem kezeltek közöt. Felírjuk a kontingenciatáblázatot: Nem kezetlt gyógyult 12 nem gyógyult 5
kezelt 20 10
terapia<-matrix(c(12,20,5,10),2,2,byrow=T) chisq.test(terapia) Pearson's Chi-squared test with Yates' continuity correction data: terapia X-squared = 0.0024, df = 1, p-value = 0.9613
Mivel p > 0.1 ezért a kezelésnek nem tulajdonítunk szignifkáns hatást. 13., Bodmer and Payne (1965) két szérum (4a és 4c) precipitációs hatását vizsgálva azt kapta, 23 személy esetében mindkét szérum a vér precipitációját eredményezte, 2 esetben csak az Ac savóval, 47 esetben csak a 4a savóval következet be precipitáció, végül 35 személy esetében egyik savó sem okozot precipitációt. Függetlennek tekinthetők-e a hatások (α=0.05)? H0 = a hatások függetlenek, H1 a hatások nem függetlenek
Felírjuk a kontingenciatáblázatot: 4a/4c + + 23 47
2 35
savo<-matrix(c(23,2,47,35),2,2,byrow=T) > chisq.test(savo) Pearson's Chi-squared test with Yates' continuity correction data: savo X-squared = 8.7121, df = 1, p-value = 0.003161 > chisq.test(savo, correct=F) Pearson's Chi-squared test data: savo X-squared = 10.1875, df = 1, p-value = 0.001414
A kapot -statisztika valószínűsége kisebb, mint a szignifkancia szint, ezért a hatások nem tekinthetők függetlennek. 14., A Bükk egy rétállományában 100-100 randomizáltan kihelyezet mintavételi kvadrátal vizsgálták a Festuca rubra és a Nardus stricta fűfajok térbeli asszociáltságát. A kvadrátok oldalhosszúsága a négy esetben rendre a következő volt: 2 cm, 32 cm, 64 cm, 128 cm. Az eredményeket az alábbi kontingencia táblák mutatják (a1, b1 prezencia, a0, b0, abszenciát jelöl). Tekintsük az asszociáltság mértékének a értéket, irányának pedig az ad-bc előjelét, ahol a betűk előjele a szokásos. kontingencia tábla 1 2 1 a b 2 c d
32 cm
2 cm b1 b0
a1 10 30
a0 30 30
b1 b0
64 cm a1 70 10
a0 10 10
b1 b0
128 cm a1 90 0
hisq.test(kvadrat_2cm, correct=F) Pearson's Chi-squared test data: kvadrat_2cm X-squared = 6.25, df = 1, p-value = 0.01242 10*30-30*30; [1] -600;→ negatív > chisq.test(kvadrat_32cm, correct=F)
a0 5 5
b1 b0
a1 100 0
a0 0 0
Pearson's Chi-squared test data: kvadrat_32cm X-squared = 14.0625, df = 1, p-value = 0.0001768 chisq.test(kvadrat_64cm, correct=F) > 70*10-10*10; [1] 600; → pozitív Pearson's Chi-squared test data: kvadrat_64cm X-squared = 47.3684, df = 1, p-value = 5.882e-12 > 90*5-5; [1] 445; → pozitív > chisq.test(kvadrat_128cm, correct=F) Pearson's Chi-squared test data: kvadrat_128cm X-squared = NaN, df = 1, p-value = NA → nulla
Ha a mintavétel egység kellően alacsony akkor az asszociáltság kisebb, és gyakran negatív. A mintavételi egység növelésével az asszociáltság értéke pozitív és növekedő, kellően nagy egység esetén eltűnik. 15., Két növényfaj (A ill. B) egyedeinek száma egy véletlenszerűen kihelyezet kvadrátban. Azonos eloszlású-e a két faj előfordulása (α=0.05)? A: B:
36 28
41 36
28 22
11 8
3 4
1 2
H0 = X, Y azonos eloszlású > a1<-c(36,41,28,11,3,1) > a2<-c(28,36,22,8,4,2) > chisq.test(rbind(a1,a2)) Pearson's Chi-squared test data: rbind(a1, a2) X-squared = 1.1862, df = 5, p-value = 0.9462
16., Vizsgáljuk egy humán populációban a nem és hajszín összefüggését, 0.05 szignifkancia szinten. férf: nő:
Fekete barna vörös szőke 32 43 9 16 55 65 16 64
H0 a hajszín és a nem független egymástól. H1 a hajszín és a nem függenek egymástól. > haj<-matrix(c(32,43,9,16,55,65,16,64),2,4,byrow=T) > haj [,1] [,2] [,3] [,4] [1,] 32 43 9 16 [2,] 55 65 16 64
> chisq.test(haj) Pearson's Chi-squared test data: haj X-squared = 8.9872, df = 3, p-value = 0.02946
A H0 nem igaz mert a p < 0.05, így a nemek és a hajszín nem bizonyult függetlennek. 17., Roberts és Grifths (1937) angol gyermekek értelmi lépességét vizsgálva az un. BINET-, és OTIStesztre adot pontszámokat hasonlítoták össze. A kiválszatot 65 gyerekre kapot értékeket a pelda_17.txt fájl tartalmazza. gyerek<-read.table(file="pelda_17.txt", header=T, sep=",") reg1<-lm(OTIS~BINET) detach(gyerek) > reg1 Call: lm(formula = OTIS ~ BINET) Coefficients: (Intercept) -99.019
BINET 2.069
summary(reg1) Call: lm(formula = OTIS ~ BINET) Residuals: Min 1Q -40.386 -10.881
Median 0.396
3Q 11.396
Max 46.366
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -99.0191 13.5643 -7.30 5.99e-10 *** BINET 2.0693 0.1368 15.12 < 2e-16 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 16.87 on 63 degrees of freedom Multiple R-squared: 0.7841, Adjusted R-squared: 0.7806 F-statistic: 228.7 on 1 and 63 DF, p-value: < 2.2e-16
b=2.069 p < 0.05 → szignifkáns és pozitív kapcsolat van a két teszt közöt. A több BINET pontot elért gyerek nagy valószínűséggel az OTIS tesztben is magasabb pontszámot kap. 18., Széna foszfortartalmának meghatározása során négy vegyésztecnikus 5-5 párhuzamos mérést végez. Az eredmények mg/g-ban kifejezve, a következők: 1: 2 3
34 37 34
36 36 37
34 35 35
35 37 37
34 37 36
4:
36
34
37
34
35
Van-e különbség a tecnikusok mérései közöt, α = 0.05 szinten.
foszfor<-c(34,36,34,35,34,37,36,35,37,37,34,37,35,37,36, 36,34,37,34,35) technikus<-c(1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,4,4,4,4,4) meres<-data.frame(foszfor,factor(technikus)) attach(meres) anova1<-aov(foszfor~technikus, meres) > anova1 Call: aov(formula = foszfor ~ technikus, data = meres) Terms: Sum of Squares Deg. of Freedom
technikus Residuals 0.36 28.64 1 18
Residual standard error: 1.261393 Estimated effects may be unbalanced > summary(anova1) Df Sum Sq Mean Sq F value Pr(>F) technikus 1 0.36 0.3600 0.2263 0.64 Residuals 18 28.64 1.5911
A p > 0.05, ezért a nullhipotézit elfogadjuk. A négy tecnikus mérése közöt nincs különbség. 19., A Tribolium confuusm (lisztbogár) adot időtartam alati, mg-ban mért súlyvesztésére állandó hőmérsékletű levegőben különböző százalékos páratartalom mellet a következő eredményeket kapták: páratartalom: 0, 12, 29.5, 43, 53, 62,5, 75.5, 85, 93 súlyveszteség: 8.98, 8.14, 6.67, 6.08, 5.90, 5.83, 4.08, 4.20, 3.72 Irja fel a regresszió egyenletét, és írja le, hogy a kapcsolat milyenségét?
para<-c(0, 12, 29.5, 43, 53, 62.5, 75.5, 85, 93) sulyveszt<-c(8.98, 8.14, 6.67, 6.08, 5.90, 5.83, 4.08, 4.20, 3.72) reg2<-lm(sulyveszt~para) > summary(reg2) Call: lm(formula = sulyveszt ~ para) Residuals: Min 1Q -0.49351 -0.28222
Median 0.08815
3Q 0.14934
Max 0.54100
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 8.728814 0.233540 37.38 2.55e-09 *** para -0.055037 0.003969 -13.87 2.40e-06 ***
--Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.3617 on 7 degrees of freedom Multiple R-squared: 0.9649, Adjusted R-squared: 0.9598 F-statistic: 192.2 on 1 and 7 DF, p-value: 2.399e-06
A páratartalom csökkenésével szignifkánsan csökken a lisztbogarak súlya. 20., Drosophila persimilisen vizsgálták a lárvakori denzitás és a felnőtkori testömeg kapcsolatát. (A lárvakori denzitást a kísérletező állítota be, a testömeg normál eloszlású a vizsgált denzitástartományban.) Milyen a lárvakori denzitás és a felnőtkori testömeg kapcsolata? Illeszen egyenest az adatokra és határozza meg a paramétereit (meredekség, tengelymetszet), ha lehet! Denzitás Tömeg
1 3 5 6 10 20 40 1,356 1,356 1,284 1,252 0,989 0,664 0,475
denzitas<-c(1,3,5,6,10,20,40) tomeg<-c(1.356,1.356,1.284,1.252, 0.989, 0.664, 0.475) reg3<-lm(tomeg~denzitas) > summary(reg3) Call: lm(formula = tomeg ~ denzitas) Residuals: 1 2 0.02794 0.07718
3 0.05442
4 5 6 0.04704 -0.11747 -0.19626
7 0.10715
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.352683 0.064217 21.064 4.47e-06 *** denzitas -0.024621 0.003646 -6.752 0.00108 ** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.1231 on 5 degrees of freedom Multiple R-squared: 0.9012, Adjusted R-squared: 0.8814 F-statistic: 45.59 on 1 and 5 DF, p-value: 0.001082
A p < 0.05, a lárvakori tömegesség szignifkáns negatív hatással van felnőtkori testömegre.