Populációbecslés és monitoring Eloszlások és alapstatisztikák
Eloszlások • Az eloszlás megadja, hogy milyen valószínűséggel kapunk egy adott intervallumba tartozó értéket, ha egy olyan populációból veszünk mintát, amelyben a vizsgált változó az adott eloszlást követi. • Normál és binomiális eloszlás • A normál eloszlás folytonos, azaz bármely értéket felvehet → két paraméterrel adjuk meg: átlag és szórás. • A binomiális eloszlás a diszkrét eloszlásokhoz tartozik, azaz a változó csupán bizonyos értékeket vehet fel. → pl. fej vagy írás
• Egy egyén IQ-ja folytonos, a gyermekeinek száma diszkrét változó. • Normál eloszlású populáció 100-as átlaggal és 10-es szórással: • Kis elemszám esetén a minta eloszlása még nem követi jól az elméleti eloszlást, de már 1500-as mintanagyságnál szépen illeszkedik a görbéhez. → ha a populáció erre a görbére illeszkedik, akkor a változó eloszlása ebben a populációban ilyen normál eloszlást követ 160
30
140 120 20
100 80 60
10
40 20 0
0
0 7. 11 0 5. 11 0 3. 11 0 1. 11 0 9. 10 0 7. 10 0 5. 10 0 3. 10 0 1. 10 .0 99 .0 97 .0 95 .0 93 .0 91 .0 89 .0 87 .0 85 .0 83
0 8. 11 0 6. 11 0 4. 11 0 2. 11 0 0. 11 0 8. 10 0 6. 10 0 4. 10 0 2. 10 0 0. 10 .0 98 .0 96 .0 94 .0 92 .0 90 .0 88 .0 86
250-es minta
1500-as minta
Alapstatisztikák • Parametrikus próbák → normál eloszlású változó esetén → Kolmogorov-Szmirnov teszt • Két populáció összehasonlítására: kétmintás tpróba • Kezelés hatásának kimutatására: páros t-próba • Három vagy több populáció összehasonlítására: Variancia analízis • Összefüggések kimutatására: korreláció analízis, lineáris regresszió
Házi rozsdafarkú etetési viselkedését vizsgálták. A megfigyelések során mérték a szülők által a fészekbe hordott rovarok hosszát. Vajon a hím és a tojó által behordott rovarok hossza eltérő-e? A nullhipotézis, hogy a két nem által hozott rovarok hossza nem tér el. Egy korábbi vizsgálatból már ismert, hogy a bevitt rovarok hossza normális eloszlást követ . A következő eredményeket kapták. A tojó által bevitt rovarok átlagos hossza 1 = 128.5 mm volt (s1 = 9.2, n1 = 52), míg a hím átlagosan 2 = 131.9 mm-es rovarokkal etette a fiókákat (s2 = 8.2. n2= 39). Mivel a szórások nem különböztek (hogyan döntötték el?) t-próbával hasonlították össze az átlagokat.
df = 89. A táblázatban keresve a kritikus értéket egy problémába ütközünk: nem találunk df = 89-es szabadsági fokhoz tartozó sort. Csak df = 60 és df = 120-hoz vannak megadva az értékek. Ilyen esetekben általában lineáris interpolációt alkalmazunk.
ahol t' az interpolált érték, t60 és t120 a táblázatban szereplő szabadsági fokokhoz tartozó t-értékek. A számolást elvégezve p = 0.05-ös szignifikanciaszintre, t' = 2.00+ (1.98 - 2.00)*89/(120-60) = 1.97 A számított ts-értékünk (abszolút értékben) kisebb, mint az interpolált érték. Így a nullhipotézis elutasítására nincs okunk, és nem állíthatjuk, hogy a két szülő különböző hosszúságú rovarokat hordott volna.
Egy fiziológiai kísérletben vizsgálták az ijedtség vérnyomásra kifejtett hatását. E célból kiválasztottak tíz önként jelentkezőt és megmérték a vérnyomásukat. Ezután egy ajtót becsapva, hirtelen megijesztették őket, majd vérnyomásmérés következett. A következő eredményeket kapták: Vérnyomás ijesztés Személy
előtt
után
Különbség (di)
di2
1
90
100
10
100
2
110
129
19
361
3
85
100
15
225
4
125
155
30
900
5
130
135
5
25
6
100
123
23
529
7
115
143
28
784
8
95
99
4
16
9
85
97
12
144
10
140
165
25
625
171
3709
=17,1
ts=17,1/2,953=5.791, df = 10-1 = 9. A kapott t-érték (ts) nagyobb, mint a táblázatbeli kritikus érték (t0,001[9] = 4.791). Így levonhatjuk a következtetést, hogy az ijesztés szignifikánsan (p < 0.001) növelte a vérnyomást.
• Nem-paraméteres próbák: • Két minta összehasonlítására: Mann-Whitney U-teszt • Három vagy több csoport esetén: KruskalWallis próba • Eloszlások összehasonlítására: Chi2-teszt • Összefüggések vizsgálatára: Rangkorreláció
A bíbicek Vanellus vanellus tojásméretét vizsgálták. A bíbicek két élőhelyen költenek a Dél-Alföldön: legelőn és kaszálón. Különböző tömegűek-e a két élőhelyen lerakott tojások? A nullhipotézis, hogy a két élőhelyen nem különbözik a tojások tömege. Egyetlen fészekaljon belül azonban a 3-5 tojás tömege nem független egymástól, mivel a tojók hasonló méretű tojásokat raknak. Így a tojások tömegét fészekaljanként átlagoljuk, és az átlagokat használjuk a rangsoroláshoz. Feltételezzük, hogy a fészkeket különböző tojók rakták.
S = 61.5, n1 = 7 így, T=61.5-(7*8)/2=33.5 mivel n1 = 7, n2 = 9, így a táblázat alapján w0,025 = 13 W0.975 = 50 T értéke nem kisebb az alsó kritikus értéknél, sem nem nagyobb a felső kritikus értéknél, ezért a nullhipotézist nem utasítjuk el p = 0.05 szinten.
Három erdőben vizsgálták a hektáronkénti fák számát. Az erdészek nullhipotézise szerint nincs különbség a három erdő fasűrűségében. Fenntartható-e a nullhipotézis? Ri
Fa/hektár A erdő
126
142
156
228
245
Rang
7
8
9
11
12
B erdő
98
98
216
249
301
319
Rang
5,5
5,5
10
13
14
15
C erdő
29
39
60
78
Rang
1
2
3
4
47
63
10
A három mintát összevonjuk, és az összevont minta rangjait az adatokhoz rendeljük. A tesztstatisztikát Ri-k alapján számoljuk:
A kritikus érték χ22,0,025 = 7.378 (p = 0.025 szinten és 2 szabadsági foknál), így a három erdő azonos fasűrűségére vonatkozó nullhipotézist elutasítjuk.
Hullatékeloszlás - kukorica, június
távolság (m)
valós (db)
egyenletes (db)
eltérés
0
17
9
7.111111111
50
6
9
1
100
6
9
1
150
7
9
0.444444444 9.555555556
kritikus érték p<0.025-nél :9.35
Hullatékeloszlás - május,június
távolság (m)
búza
gyep
0
11
1
10
17
21
60
50
7
8
16
14
8
53
100
4
9
24
10
6
53
150
1
2
7
6
7
23
23
20
57
47
42
189
összes
vegyes napraforgó
kukorica
összes
elméleti eloszlás
e.érték búza
e.érték gyep
e.érték vegyes
e.érték nap.
e.érték kuk.
0.317460317
7.3015873 6.34920634 02 9
18.095238 1
14.9206 3
13.333333 33
0.28042328
6.4497354 5.60846560 5 8
15.984126 98
13.1798 9
11.777777 78
0.28042328
6.4497354 5.60846560 5 8
15.984126 98
13.1798 9
11.777777 78
0.121693122
2.7989417 2.43386243 4 99
6.9365079 37
5.71957 7
5.1111111 11
Eltérés - május,június
búza
gyep
1.873326
4.506706
3.621554
0.2897839
4.4083333
0.046946
1.019786
1.58E-05
0.0510303
1.21174
0.930457
2.050918
4.019877
0.7672085
2.8343816
1.15622
0.077341
0.000581
0.0137488
0.6980676
4.00695
7.654752
7.642028
1.1217714
9.1525226
vegyes
napraforgó
kukorica
29.57802312 DF=12 kritikus érték p<0,01-nél: 26.2