Protokol č. 3 DĚDIČNOST KVALITATIVNÍCH VLASTNOSTÍ 1) Jednorozměrné rozdělení – fenotypové charakteristiky (hodnoty) populace 2) Vícerozměrné rozdělení – korelační a regresní počet pro dvě sledované vlastnosti
ad 1) Mějme ve výběrovém souboru 10 králic kalifornského plemene, u kterých známe počet živě narozených mláďat. Naším úkolem je vypočítat v tomto vzorku jednotlivé fenotypové ukazatele (statistické charakteristiky). Příslušné údaje s naznačeným postupem výpočtu uvádí tab. 1. Tab. 1. Určení základních fenotypových ukazatelů (živě narozená mláďata 10 králic) Pořadová číslo n mláďat ve vrhu králice 1 8 2 7 -1 1 3 6 -2 4 4 11 +3 9 5 8 6 11 +3 9 7 7 -1 1 8 7 -1 1 9 9 +1 1 10 6 -2 4 ∑=10 ∑=80 ∑=30
králíčat králíčat
Zjištěné hodnoty obvykle zapisujeme v pořadí : ; s, V. v našem případě tedy: = 8 ± 3×0,58 živě narozených králíčat s = 1,82 živě narozených králíčat V% = 22,75% Poznámka: Při práci s velkými čísly, příp. s čísly desetinnými zpravidla hodnotu s2 zjišťujeme takto:
ad 2) Korelace, regrese, koeficient pořadové korelace, rovnice regresní přímky včetně grafického znázornění Tab. 2 : Základní údaje o obvodu hrudníku (x, v cm) a živé hmotnosti (y, v kg) pro stanovení korelačního a obou regresních koeficientů Poř. č. 1 2 3 4 5
x 150 154 152 152 162
Y 284 297 330 305 333
-3 +1 -1 -1 +9
120 150 283 -3 ∑ 15606 31212 n = 120, ∑x = 15606 cm, ∑y = 31212 kg, A =∑ B= ∑ = 1668 C= ∑ = 55600
-22 -9 +24 -1 +27 -23 =153 cm,
9 1 1 1 81 9 1668 (B) = 306 kg
484 81 576 1 729
+66 -9 -24 +1 +243
259 55600 (C)
69 6672 (A)
r=
r – mezi obvodem hrudníku a živou hmotností byla zjištěna kladná závislost vyjádřena korelačním koeficientem (r=0,69) při zvýšení obvodu hrudníku u plemenných býčků (v 9. měsíci stáří) v průměru 1 cm, zvýší se jejich živá hmotnost v průměru o 4 kg při zvýšení živé hmotnosti plemenných býčků (v 9. měsíci stáří) v průměru o 1 kg, zvýší se jejich obvod hrudníku v průměru o 0,12 cm. Výpočet korelačního, regresních koeficientů není úplně přesný, k určité chybě ve výpočtu dochází v souvislosti s početností a representativností zpracovaného výběru. Měřítkem chyby je střední chyba korelačního koeficientu (sr) a stření chyby koeficientů regresních (sbx/y , sby/x ). Tyto střední chyby (vzorce a dosažené údaje našeho příkladu) počítáme následující způsobem:
Střední chyba je jedním z měřítek průkaznosti vypočteného koeficientu. Jestliže dvojnásobek (lépe, když ani trojnásobek) střední chyby nedosahuje příslušného koeficientu, lze tento korelační, popřípadě regresní koeficient považovat za průkazný.
Vraťme se k příkladu, ve kterém jsem sledovali u plemenných býků vztah mezi obvodem hrudníku (x) a jejich živou hmotností (y): = 153 cm by/x = 4kg = 306 kg bx/y = 0,12 cm A sestavme rovnice obou regresních přímek: Závislá proměnná y (živá hmotnost) na x: Závislá proměnná x (obvod hrudníku) na y: b = by/x = 4 b = bx/y =0,12 a= -b a= -b a = 306 – 4×153 = -306 a = 153 – 0,12×306 =116,28 = a + bx = -306 + 4x = a + by = -116,28 + 4y x = 155 cm y = 314 kg = -306 + 4 × 155 = 314 kg = 116,28 + 4 × 314 =153,96 cm x = 147cm y = 282 cm = -306 + 4 × 147 = 282 kg = 116,28 + 4 × 282 = 150,12 cm Pomocí těchto vypočtených hodnot vyneseme v bodovém poli 0xy obě statistické regresní přímky. Tyto přímky se potínají v průměrných hodnotách x a y, úhel, který spolu svírají, vyjadřuje výši korelačního koeficientu (v našem případě r = 0,69). Hodnotě r = 1 odpovídá splývání regresních přímek s úhlem 0° (funkční závislost, která je extrémním případem závislosti statistické), nulová korelace je charakterizována úhlem 90°.
Poznámka ke grafickému znázornění lineární stochastické závislosti pomocí sdružených regresních přímek:
a (absolutní člen) – úsek osy regresní přímky b (regresní koeficient) – směrnice regresní přímky Součet rozdílu teoretických a skutečných (empirických hodnot) tzn. vzdáleností jednotlivých průsečíků xy a regresní přímky je vždy = 0;platí pro jakoukoliv přímku v ose souřadnic 0xy. Pouze pro dvě přímky platí tzv. kritérium nejmenších čtverců: součet čtverců odchylek (vzdáleností) mezi jednotlivými průsečíky xy a regresní přímkou je nejmenší. Pro: xˆ a by se jedná o součet čtverců délky úseček mezi průsečíky xy jednotlivých náhodných proměnných x a y a regresní přímkou, přičemž uvažované úsečky jsou rovnoběžné s osou x. Pro: yˆ a bx - úsečky jsou rovnoběžné s osou y.
Výpočet koeficientu pořadové korelace (R). V praktickém příkladě budeme zjišťovat hodnotu pro procentický obsah tuku v mléce krav mezi prvou a druhou laktací. Potřebné údaje pro výpočet udává následující tabulka. Dosazením hodnoty ∑d2.= 156,5 a počtu pozorování (n=13) do uvedného vzorce dostáváme: 6(d 2 ) 6 156,5 R 1 1 0,57 2 13 (169 1) n (n 1)
Tabulka: Údaje o tučnosti mléka (v%) z prvou a druhou laktaci soužící pro výpočet koeficientu pořadové korelace Číslo Tučnost Pořadí d = x –y d2
krávy 1 2 3 4 5 6 7 8 9 10 11 12 13
Tabulky
1. laktace (x) 3,80 4,15 4,18 3,91 3,88 3,73 3,79 4,28 3,42 4,34 3,76 3,70 3,63
2. laktace (y) 4,00 4,01 4,19 3,69 3,92 3,63 3,89 4,82 3,78 4,09 3,92 4,15 3,90
1. laktace 2. lakatce (x) (y) 7 8 -1 10 9 +1 11 12 -1 9 2 +7 8 6,5 +1,5 4 1 +3 6 4 +2 12 13 -1 1 3 -2 13 10 +3 5 6,5 -1,5 3 11 -8 2 5 -3
1 1 1 49 2,25 9 4 1 4 9 2,25 64 9 ∑156,5
Úkoly pro samostatnou práci: Úkol č. 1: Následující tabulka uvádí hodnoty živé hmotnosti (x) a hmotnosti střiže (y) ve výběrovém souboru deseti ovcí. Pro oba tyto ukazatele vypočítejte hlaví statistické charakteristiky a určete, která ze sledovaných vlastností se vyznačuje větší vyrovnaností: Vlastnost 1 2 Živá hmotnost (x) 70 71 Hmotnost střiže (y) 4,0 4,5 Poznámka: obě vlastnosti v kg
3 72 5,0
Pořadové číslo ovce 4 5 6 7 74 75 70 80 5,5 6,0 8,5 8,0
8 85 7,0
9 75 7,5
10 80 6,0
Úkol č. 2: Pomocí korelačního koeficientu r, koeficientu pořadové korelace R a obou regresních koeficientů (bx/y a by/x) vyjádřete vztah mezi výše uvedenými vlastnostmi. Průkaznost korelačního koeficientu „r“ a oba regresní koeficienty ověřte výpočtem středních chyb. Vztah mezi vlastnostmi x a y rovněž vyjádřete rovnicemi příslušných regresních přímek a vynesením těchto přímek do osy souřadnic 0xy. Úkol č. 3: Vztah mezi jatečnou délkou těla (x) a výškou hřbetního špeku (y) u jedné z populací prasat je charakterizován těmito hodnotami: x = 92,9 cm
y = 3,8 cm
by/x = -0,13 cm
bx/y = -5,55 cm
rxy = -0,85
Jaké závěry lze z hodnot korelačního a obou regresních koeficientů učinit? Doplňte tento vztah výpočtem obou rovnic regresních přímek a vynesením těchto přímek do osy souřadnic 0xy.