Populációbecslések és monitoring A becslés szerepe az ökológiában és a vadgazdálkodásban. Statisztikai fogalmak és próbák. Mintavételezés. A becslési módszerek csoportosítása. Teljes számlálás.
Fontos lehet tudnunk, hogy hány egyed él a területünkön → számlálás. De ez nehézkes, vagy esetleg lehetetlen is → vélekedés → megbízhatatlan, mert bizonytalan (Dániai őzek esete)! Marad a becslés: a létszám mintavételezésen alapuló megközelítése. Ebben az esetben a megbízhatóság, a hiba mérhető! Várható érték: a becslés többszöri megismétlése alapján várható érték Pontosság: mennyire megismételhető a becslés, mennyire közel esnek a becslések értékei a populáció valódi nagyságához → a véletlen hibák okozzák.
A pontosságot a szórás jellemzi → csökkenthető az ismétlések számának növelésével. A torzítás a rendszeres hibákból adódik, vagy a becslési modell hibájából → mennyire tér el a várható érték a populáció valódi értékétől.
Megbízható egy becslés, ha torzítatlan és pontos. Konfidencia intervallum (CI): a becslés "hihetőségének" kifejezésére szolgál meghatározott valószínűségi szinten milyen sávba eshetnek az egyes becslések.
Mintavételezés
a: egyöntetű, vagy egyenletes b: véletlen c: csoportosuló
Leggyakrabban csoportosulnak az állatok, ekkor a becslés pontosságát nagymértékben befolyásolja a mintavételi eljárás, vagyis a mintaterületek elhelyezése. → Mintavételi eljárások: Random, rétegzett random, szisztematikus. Ha mintavételi területnek egy olyan élőhelyrészt választunk, ahol az egyedek valamilyen oknál fogva nagyobb sűrűségben találhatók; az egész vizsgálati területre vonatkoztatott becslésünk erősen torzított lesz, mégpedig pozitív irányban, azaz túlbecsüljük a valós populációnagyságot. A véletlen eloszlásnál nem ennyire lényeges a mintavételi területek elhelyezése. Torzítatlan becsléshez csakis akkor juthatunk (ha populációnk nem egységes vagy véletlen eloszlású), ha több mintavételi egységen gyűjtünk adatokat, és ezeket a mintavételi helyeket véletlenszerűen választjuk meg (random mintavétel).
Becslési eljárások csoportosítása
Minden egyed látható - teljes számlálás 1. Teljes számlálás 2. Hajtásos számlálás: meghatározott területről a vad kihajtása → fehérfarkú szarvas ± 20-30% hiba 3. Teljes térképezés → jelölt állatok territóriumainak térképezése 4. Spot.mapping → énekes madarak megfigyelése, csomópontok alapján a territóriumok kijelölése 5. Thermal scanning → távérzékelés → hőkép alapján állatok számlálása → hőkontraszt! 6. Populáció rekonstrukció → több év során elhullott állatok koreloszlásából a populáció felépítése 7. Légi fotózás → vizuális kontraszt, sebesség stb.
Nem minden állat látható és számlálás 1. Mintaterületeken végzett teljes számlálás 2. Kettős mintavétel → kis részterületeken teljes számlálás, az egész területen részleges (β< 1) β= y/x (y: a nem teljes számlálás eredménye, x: a teljes számlálás eredménye) N = C/β (C: a mintavétel során látott összes állat) 3. Jelölt alminta - láthatóság becslése β= m/n1 N = n2/β N = populációnagyság, n1 = a jelölt állatok száma, n2 = látott jelölt és jelöletlen állatok száma, m = a számlálás során látott jelölt állatok száma. 4. Független megfigyelők módszere → két független megfigyelő számlál ugyanazon a területen → n1, n2 és m → ”jelölés-visszafogás" 5. Nem független megfigyelők → az első megfigyelőhöz mennyit tesz hozzá a második → kétmintás elvonásnak felel meg (egyenlő megfigyelő képességet tételez fel) 6. Line transect becslés merőleges távolságra alapozott adatok meglátási távolság és vonallal bezárt szög Változatok: light-transect, légi transect stb.
A mintavételes becslések
Előnyök: kevesebb munkaráfordítás csökken az egyes állatok többszöri számlálásából származó hiba valószínűsége hosszabb időtartam, több ismétlés a pontosság (ismételhetőség) és a megbízhatóság (torzítás) jellemezhető Feltételezés: az állatok véletlenszerűen helyezkednek el az állatok nem csoportosulnak ha ez nem igaz, növelni kell az ismétlések számát
Statisztikai alapfogalmak
Várható érték: a középértékkel (az átlaggal) írjuk le. Ha véletlenszerűen kiveszünk egy babszemet egy urnából, amelyben különböző méretű babszemeket helyeztünk el, akkor "várhatóan" a legnagyobb valószínűséggel olyat fogunk kihúzni, amely átlagos méretű, mérete tehát a középérték körül van.
Szintén a minta lokalizációját mutatja a medián: A medián az adatok középpontjának helye, azaz egyforma számú adat esik a mediántól "lefelé" és "felfelé". A medián kiszámításához az adatokat növekvő sorrendbe állítjuk, és a lista aljáról kezdve az (n +1)/2-ik adatot kiválasztjuk. Ha n páratlan, a medián a rangsorba állított adatok középső értéke. Ha n páros, akkor a medián a rangsorba állított lista két középső adatának átlaga. A várható értéktől való eltérés jellemzésére az átlagos eltérés, a variancia szolgál. A szórás a variancia négyzetgyöke.
Szintén a minta diszperzióját jellemzi az interkvartilis tartomány, ami az alsó és a felső kvartilis különbsége. Parametrikus próbák Két populáció összehasonlítására: kétmintás t-próba Kezelés hatásának kimutatására: páros t-próba Három vagy több populáció összehasonlítására: Variancia analízis Összefüggések kimutatására: korreláció analízis, lineáris regresszió
Házi rozsdafarkú etetési viselkedését vizsgálták. A megfigyelések során mérték a szülők által a fészekbe hordott rovarok hosszát. Vajon a hím és a tojó által behordott rovarok hossza eltérő-e? A nullhipotézis, hogy a két nem által hozott rovarok hossza nem tér el. Egy korábbi vizsgálatból már ismert, hogy a bevitt rovarok hossza normális eloszlást követ . A következő eredményeket kapták. A tojó által bevitt rovarok átlagos hossza 1 = 128.5 mm volt (s1 = 9.2, n1 = 52), míg a hím átlagosan 2 = 131.9 mm-es rovarokkal etette a fiókákat (s2 = 8.2. n2= 39). Mivel a szórások nem különböztek (hogyan döntötték el?) t-próbával hasonlították össze az átlagokat.
df = 89. A táblázatban keresve a kritikus értéket egy problémába ütközünk: nem találunk df = 89-es szabadsági fokhoz tartozó sort. Csak df = 60 és df = 120-hoz vannak megadva az értékek. Ilyen esetekben általában lineáris interpolációt alkalmazunk.
ahol t' az interpolált érték, t60 és t120 a táblázatban szereplő szabadsági fokokhoz tartozó t-értékek. A számolást elvégezve p = 0.05-ös szignifikanciaszintre, t' = 2.00+ (1.98 - 2.00)*89/(120-60) = 1.97 A számított ts-értékünk (abszolút értékben) kisebb, mint az interpolált érték. Így a nullhipotézis elutasítására nincs okunk, és nem állíthatjuk, hogy a két szülő különböző hosszúságú rovarokat hordott volna.
Egy fiziológiai kísérletben vizsgálták az ijedtség vérnyomásra kifejtett hatását. E célból kiválasztottak tíz önként jelentkezőt és megmérték a vérnyomásukat. Ezután egy ajtót becsapva, hirtelen megijesztették őket, majd vérnyomásmérés következett. A következő eredményeket kapták: Vérnyomás ijesztés Személy előtt
után
Különbség (di) di2
1
90
100
10
100
2
110
129
19
361
3
85
100
15
225
4
125
155
30
900
5
130
135
5
25
6
100
123
23
529
7
115
143
28
784
8
95
99
4
16
9
85
97
12
144
10
140
165
25
625
171
3709
=17,1
ts=17,1/2,953=5.791, df = 10-1 = 9. A kapott t-érték (ts) nagyobb, mint a táblázatbeli kritikus érték (t0,001[9] = 4.791). Így levonhatjuk a következtetést, hogy az ijesztés szignifikánsan (p < 0.001) növelte a vérnyomást.
Nem-paraméteres próbák: Két minta összehasonlítására: Mann-Whitney Uteszt Három vagy több csoport esetén: Kruskal-Wallis próba Eloszlások összehasonlítására: Chi2-teszt Összefüggések vizsgálatára: Rangkorreláció
A bíbicek Vanellus vanellus tojásméretét vizsgálták. A bíbicek két élőhelyen költenek a Dél-Alföldön: legelőn és kaszálón. Különböző tömegűek-e a két élőhelyen lerakott tojások? A nullhipotézis, hogy a két élőhelyen nem különbözik a tojások tömege. Egyetlen fészekaljon belül azonban a 3-5 tojás tömege nem független egymástól, mivel a tojók hasonló méretű tojásokat raknak. Így a tojások tömegét fészekaljanként átlagoljuk, és az átlagokat használjuk a rangsoroláshoz. Feltételezzük, hogy a fészkeket különböző tojók rakták.
S = 61.5, n1 = 7 így, T=61.5-(7*8)/2=33.5 mivel n1 = 7, n2 = 9, így a táblázat alapján w0,025 = 13 W0.975 = 50 T értéke nem kisebb az alsó kritikus értéknél, sem nem nagyobb a felső kritikus értéknél, ezért a nullhipotézist nem utasítjuk el p = 0.05 szinten.
Három erdőben vizsgálták a hektáronkénti fák számát. Az erdészek nullhipotézise szerint nincs különbség a három erdő fasűrűségében. Fenntartható-e a nullhipotézis? Ri
Fa/hektár A erdő
126
142
156
228
245
Rang
7
8
9
11
12
B erdő
98
98
216
249
301
319
Rang
5,5
5,5
10
13
14
15
C erdő
29
39
60
78
Rang
1
2
3
4
47
63
10
A három mintát összevonjuk, és az összevont minta rangjait az adatokhoz rendeljük. A tesztstatisztikát Ri-k alapján számoljuk:
A kritikus érték χ22,0,025 = 7.378 (p = 0.025 szinten és 2 szabadsági foknál), így a három erdő azonos fasűrűségére vonatkozó nullhipotézist elutasítjuk.
Hullatékeloszlás - kukorica, június
távolság (m)
valós (db)
egyenletes (db)
eltérés
0
17
9
7.111111111
50
6
9
1
100
6
9
1
150
7
9
0.444444444 9.555555556
kritikus érték p<0.025-nél :9.35
Hullatékeloszlás - május,június
távolság (m)
összes
búza
gyep
vegyes
napraforgó kukorica
összes
0
11
1
10
17
21
60
50
7
8
16
14
8
53
100
4
9
24
10
6
53
150
1
2
7
6
7
23
23
20
57
47
42
189
elméleti eloszlás
e.érték búza e.érték gyep
0.317460317 7.301587302 6.349206349
e.érték vegyes
e.érték nap.
e.érték kuk.
18.0952381 14.92063 13.33333333
0.28042328
6.44973545 5.608465608 15.98412698 13.17989 11.77777778
0.28042328
6.44973545 5.608465608 15.98412698 13.17989 11.77777778
0.121693122 2.798941799 2.433862434 6.936507937 5.719577 5.111111111
Eltérés - május,június
búza
gyep
vegyes
napraforgó
kukorica
1.873326
4.506706
3.621554
0.2897839
4.4083333
0.046946
1.019786
1.58E-05
0.0510303
1.21174
0.930457
2.050918
4.019877
0.7672085
2.8343816
1.15622
0.077341
0.000581
0.0137488
0.6980676
4.00695
7.654752
7.642028
1.1217714
9.1525226
29.57802312 DF=12 kritikus érték p<0,01-nél: 26.2