1. feladat. Egy erdőben az egy fészekben levő tojásszámokat vizsgáltuk egy madárfajnál. A következő tojásszámokat találtuk: 1, 1, 1, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 5, 6, 7. Mi a mintának a minimuma, maximuma, terjedelme, mediánja, módusza, alsó- és felső kvartilise, átlaga? Rajzold fel a minta alapján szerkeszthető hisztogrammot. A minta minimuma 1, maximuma 7, terjedelme 6. Módusza 2 (ebből van a legtöbb). A 19 mintának a mediánja (10. elem): 3. Alsó kvartilise a 4-5. elem átlaga azaz 2. Felső kvartilise a 14-15. elem átlaga, azaz 3,5. Átlaga 2,94. Hisztogrammot mindenkinek a fantáziájára bízom. 2. feladat. Eloszlásról a következőt tudom. Elemszáma 11, minimuma 3, terjedelme 4, módusza és mediánja 5, alsó kvartilise 3,5, felső kvartilise 5. Rajzold fel vázlatosan az eloszlás hisztogrammját. Tegyük fel, hogy a minták növekvő sorba vannak rendezve (a mediánhoz úgyis kell). Az eloszlás legkisebb eleme 3, ez legyen az 1. elem. A legnagyobb (utolsó) elem 7. A mediánja a 6. elem, ami 5. Az alsó kvartilise a 3-4 elemek átlaga, így a 3. elem 3, a 4. elem 4. A felső kvartilis a 8-9 elemek átlaga, mindkettő 5. Ezek után biztos, hogy a 2. elem 3-as, a 7. elem meg 5-ös. Legtöbb 5-ösből van. Ez már teljesül. Az 5. elem 4 vagy 5, a 10. elem 5-7, leginkább 6. 1 3
2
3 3
4 4
5
6 5
7
8 5
9 5
10
11 7
3. feladat. Egy tenyésztett, 34 egyedből álló kutyapopulációban a kutyák átlagos hossza 64.5 cm, szórásuk 2.2 cm. Milyen kétoldali 75%-os konfidencia intervallumba esik a kutyák hossza?
s . A t eloszlásnál ne feledjük, hogy 75% n konfidenciaintervallumnál nézzük, azaz a 12,5%-os valószínűségnél kell az inverzét megnézni (szabadsági fok 33). Ez 1,57. Így a 75%-os kétoldali konfidencia intervallum 64.5 ± 0.6 cm.
A konfidencia intervallum képlete: x ± t(α / 2,df )
4. feladat: Egy tanulócsoporttal egy tesztet elvégeztettek a félév elején, s a félév végén, hogy lássák mennyit fejlődött a csoport. Feltételezzük, hogy a pontszámok normális eloszlásúak. 5%os szignifikanciaszint mellett eredményesnek mondható-e az okítás? 1 2 3 4 5 6 7 8 9 10 11 12
91 97 75 78 76 70 65 75 55 82 77 73
94 95 80 75 79 75 51 63 92 89 71 87
Mindenekelőtt ki kell számolnunk a tesztek eredményeinek változását. Ezt követően a különbségekre kell tesztelni, hogy azok várhatóértéke 0-e. Ez lényegében egy párosított mintájú t próba. 1
91
94
3
2
97
95
-2
3
75
80
5
4
78
75
-3
5
76
79
3
6
70
75
5
7
65
51
-14
8
75
63
-12
9
55
92
37
10
82
89
7
11
77
71
-6
12
73
87
14
H0: Az okításnak nincs hatása, a pontszám különbség = 0. H1: Az okításnak van hatása, a pontszámkülönbség ≠ 0. α=0,05 Próbastatisztika t =
d 3.08 = = 0.800 sd 13.34 12
Kritikus érték tkritikus = 2,59 Mivel a kritikus érték nagyobb, mint a próbastatisztika, így a nullhipotézist α=0,05 szignifikanciaszint mellett elfogadjuk. Azaz az okításnak nincs szignifikáns hatása.
6. feladat: M&M cukorkák szín szerinti megoszlását vizsgáltuk. Felbontottunk egy dobozt, s egybeöntve megszámoltuk, hogy hány kék, narancs, sárga, zöld, piros és barna cukorka van bennük. Egyenlő arányban van bennük minden színből? Kék Narancs Sárga Zöld Barna Piros 5 8 20 19 21 31 H0: A cukorkák szín szerinti eloszlása egyenletes eloszlást követ. H1: A cukorkák szín szerint nem egyenletesen oszlanak el. α=0,05 Összesen 104 cukorka volt a dobozban. Ha egyenletesen lennének elosztva, akkor minden színből 17.3 darab lenne a dobozban. 2 f i − Fi ) ( 2 = χ =∑ Fi
( 5 − 17.3) = 17.3 = 25,93
2
(8 − 17.3) + 17.3
2
( 20 − 17.3) + 17.3
2
(19 − 17.3) + 17.3
2
( 21 − 17.3) + 17.3
2
( 31 − 17.3) + 17.3
2
=
Kritikus érték χ 2 kritikus = 11, 07 Mivel a kritikus érték kisebb, mint a próbastatisztika, így a nullhipotézist α=0,05 szignifikanciaszint mellett elvetjük. Azaz a M&M cukorkák szín szerinti eloszlása nem egyenletes (nem azonos mennyiségű van minden dobozban minden szinből).
7. feladat: Félév végén a biometria gyakorlat vezetők összesítik a hallgatóik jegyeit. Feltételezve, hogy az egyes csoportokba véletlenül lettek beosztva a hallgatók, van-e különbség az egyes tanárok osztályzása között (azaz hasonlóan osztályoznak, vagy van aki szigorúbb/megengedőbb)? 5 5 5 5 5 5 2 4 4 5 5 4 3 4 4 4 3 4 4 3
H0: Az egyes tanulócsoportok között különbség nincs. H1: Legalább egy tanulócsport jegyei eltérnek a többitől. α=0,05 A legkisebb rangot a 2-es jegy kapja. A 3 darab 3-as átlagos rangja 3. A 8 darab 4-es átlagos rangja 8,5; míg az 5-ösöké 16,5. Az egyes csoportokban a rangok a következőképpen alakulnak:
Rangösszeg
16.5 16.5 8.5 3 3 47.5
16.5 16.5 16.5 8.5 8.5 66.5
16.5 1 16.5 8.5 8.5 51
16.5 8.5 8.5 8.5 3 45
⎛ k Ri2 ⎞ ⎞ 12 12 ⎛ 47.52 66.52 512 452 3 1 N − + = + + + − 63 ⎟ = 62.8 ( ) ⎜∑ ⎟ ⎜ 5 5 5 N ( N + 1) ⎝ i =1 ni ⎠ ⎠ 20 ⋅ 21 ⎝ 5 3 ∑ ( ti − ti ) = 1 − 33 − 3 + 83 − 8 + 83 − 8 = 0.87 C = 1− N3 − N 203 − 20 H 62.8 H korrigált = = = 71.9 C 0.87 χ 2(α / 2,k −1) = 9.35 H=
Mivel a tesztstatisztika nagyobb a kritikus értéknél, így szignifikanciaszinten elvetjük, azaz van különbség az osztályzásban.
a
nullhipotézist
1-α
Gyakorló feladatok 1. feladat. Mi a mintának a minimuma, maximuma, terjedelme, mediánja, módusza, alsó- és felső kvartilise, átlaga? Rajzold fel a minta alapján szerkeszthető hisztogrammot. Minta 1: 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5 Minta 2: 2, 3, 3, 3, 3, 5, 5, 6, 6, 6, 7, 7 Minta 3: 2, 2, 3, 3, 3, 3, 4, 4, 5, 6, 6, 7 2. feladat. Eloszlásról a következőt tudom. Elemszáma 14, minimuma 3, terjedelme 5, módusza és mediánja 5, alsó kvartilise 4, felső kvartilise 6. Rajzold fel vázlatosan az eloszlás hisztogrammját.
3. feladat. Mi a kétoldali 90%-os konfidencia intervalluma a 56 elemből álló, 33,5 átlagú és 5,92 szórású eloszlásnak. 4. feladat. Mi a kétoldali 99%-os konfidencia intervalluma a 100 elemből álló, 50 átlagú és 12 szórású eloszlásnak. 5. feladat. Egy sportosztály tanulóinak pulzusát megmérték 200 méter futás előtt, s után. A 21 tanulónak átlagosan 2-vel lett magasabb a pulzusa, a különbség szórása 3. Változott-e a tanulók pulzusa a futástól? 6. feladat. Egy növénypopulációban a magok tömegét megmértük. Átlaguk 3,456 g, szórásuk 1,749 g (összesen 100 magot megmérve). Tudjuk, hogy a 3 grammnál nehezebb magokat a szél nem szállítja, elképzelhető-e, hogy ezen faj magjainak szállításában a szél fontos szerepet játszik? 7. feladat. Egy igen nagy rágcsálópopulációban az egyedek 20%-ának a szőrzete világos, a többié sötét. 5 egyedet csapdázva kísérletenként 2647 mintát vettek és feljegyezték, hogy hány világos szőrű egyed volt a mintában. Független-e a csapdázás a bőrszíntől? világos megfigyelt szőrzetű gyakoriság egyedek a mintában 0 860 1 1090 2 543 3 137 4 15 5 2
Megoldások 1. Átlag Minimum Maximum Terjedelem Módusz Medián Alsó kvartilis Felső kvartilis
Minta 1 3,69 3 5 4 3 4 3 4
2. feladat. Egy lehetséges kitöltés például. 1 2 3 4 5 6 7 3 3 4 4 4 5 5
Minta 2 4,67 2 7 5 3 5 3 6 8 5
9 5
Minta 3 4,00 2 7 5 3 3,5 3 5,5 10 6
11 6
12 7
13 7
14 8
3. feladat: 33,5 ± 1,58 4. feladat: 50 ± 3,4 d 2 = = 3.05 és a tkritikus = 2, 42 , tehát a nullhipotézist sd 3 21 elvetjük, a pulzus változott (növekedett).
5. feladat: A próbstatisztika t =
6. feladat: A kérdés az, hogy átlagosan 3 grammnál nehezebbek-e a magok. Ez egy egyoldali x−μ 3, 456 − 3, 000 = 10 = 2, 60 . A kritikus t érték egymintás t teszt. Próbastatisztika t = n 1, 749 s (egyoldali tesztnél ugye α-nál nézve a t táblázatot, s nem α/2-nél!) 1,98. A nullhipotézist el kell vetnünk, a magok átlagosan nehezebbe 3 grammnál, így a szél nem a fő terjedési módjuk. 7. feladat Binomiális eloszlásból vesszük a várt értéket szőrszíntől független csapdázás esetén. S a két eloszlást χ 2 próbával összehasonlítom. Próbastatisztika χ 2 = 1.9 . A kritikus érték χ 2 kritikus = 11, 07 . A H0-t elfogadjuk. A feladatnál az 5 világost csapdázó esetben a várt egyedszám 0,84. Ezt össze kéne vonni az előző (4 világos 1 sötét) esettel.