Efektivní velikost populace Wright (1931)
- velikost populace z genetického hlediska nemusí být rovna censu, někteří jedinci mohou zanechat potomků více, jiní se rozmnožování nezúčastní vůbec - to má dopad i na evoluci
“efektivní velikosti populace” Ne
= velikost ideální populace, mající stejné množství NGD jako populace
pozorovaná (aktuální) - může být mnohem menší, než census - velký význam pro "conservation genetics and biology" - řada faktorů : nestejný poměr pohlaví, variabilní počet potomků, periodické kolísání velikosti populace.....
Genetický drift a evoluce 3 situace, kdy RGD může hrát významnou roli při evoluci populací 1. Kontinuální drift populace zůstávají malé v každé generaci variabilita ve vzorkování se snižuje obvykle se objevuje u ohrožených druhů (inbrední deprese)
2. Nárazový nebo občasný drift (bottleneck) - populace je někdy snížena na takovou velikost, že RGD začne fungovat = efekt "hrdla láhve" (bottleneck) - v okamžiku snížení velikosti je mortalita náhodná - vzorek "přeživších" má jiné genetické složení a redukovanou heterozygositu v důsledku náhodnosti - pokud populace zůstane malá po dvě a více následujících generací, začíná proces 1
Bottleneck
Účinek bottlenecku na genetickou variabilitu
původní populace
bottleneck
přeživší jedinci
Silné linie znázorňují populace s počátečním počtem jedinců N0= 2. Přerušované N0 = 10. Růstová rychlost r = 0,1 nebo r = 1,0
Bottleneck gepard Acinonyx jubatus 1985 - překvapivý experiment, v němž nepříbuzní gepardi v zajetí přijali vzájemné kožní transplantáty - dříve rozšíření v Africe a Asii, dnes pouze v parcích - mají nemoci typické pro extrémní inbríding - 47 alozymových lokusů monomorfních, DNA studie našly diverzitu minimální; indikace dávného bottlenecku (12 tisíc let) a recentní fragmentace
Bottleneck Northern elephant seal (rypouš severní) Mirounga angustirostris
- kdysi velmi početní, ale velmi lovení - v r. 1890 přežilo na kalifornském pobřeží asi 30 jedinců - díky ochranné legislativě se populace zvýšila na desítky tisíc - 55 alozymů (N=159) neprokázalo ŽÁDNOU variabilitu DNA pouze minimální variabilitu (mtDNA-1%) - Southern elephant seals (rypouš sloní) mají variabilitu normální (2.3%)
3. Vliv zakladatele (founder effect) - nová populace je často založena malým počtem migrantů (analogicky bottlenecku) - tento soubor má jenom zlomek genetické variability původní populace - nové populace se budou náhodně lišit jak od původní populace, tak mezi sebou
Efekt zakladatele populace založené malým počtem jedinců mají kromě ztráty polymorfismu vyšší frekvenci dříve vzácných alel "Afrikaners“ Afrikánci z Holandska - autozomální dominantní choroby Huntingtonova choroba - dnes přenašečů 1 na 300, vystopována k jedinému muži z první lodi v r. 1652 Porphyria variegata - nyní 30 tisíc přenašečů, stopa k jedinému páru v r. 1688 Amišové - potomek jediného páru (1744), Ellis-Van Creveldův syndrom (trpasličí vzrůst a 6 prstů) je běžný
Populační struktura Přírodní populace jsou obvykle tvořeny menšími populacemi (subpopulacemi, démy) - vykazují populační strukturu - odděleny v důsledku ekologických (omezené zdroje, host-parazit), geografických (řeky, jezera), behaviorálních (sociální struktura) aj. bariér - démy mohou udržovat genetickou provázanost prostřednictvím výměny rozmnožujících se migrantů, výsledkem genetického toku může být “homogenizace” populací v důsledku vyrovnávání rozdílů v alelových četnostech - způsob migrace a doba separace mezi démy mají obrovský vliv na stupeň jejich genetické diferenciace
Wright, S. (1943) Analysis of local variability of flower color in Linanthus parryae modré (aa) nebo bílé (AA, Aa) květy (Desert snow) každý kruh představuje subpopulaci o 4000 jedincích
Z
A
a
relativní frekvence
V
• průměrná heterozygosita ze všech subpopulací je menší než očekávaná (podle průměrné alelové frekvence) (Wahlundův efekt, Wrightův fixační index Fst)
Očekávaná vs. pozorovaná heterozygotnost jako míra populační struktury (pro genotypy: p2 + 2pq + q2 = 1
pro alely: p + q = 1)
2 populace které jsou reprodukčně izolované… AA Heterozygotnost Aa aa p H (2pq)
64 32 4 0.8 0.32
1 18 81 0.1 0.18
Míra "populační struktury" má rozsah 0 (žádná struktura) – 1 (kompletní struktura)
Havg = (0.32 + 0.18)/2 = 0.25 Jak bude vypadat kombinovaná populace s HWE? (po 1 generaci náhodného křížení)
p H (2pq)
0.45 0.495
Podíl z celkové heterozygotnosti (z potenciální kombinované populace) patřící subpopulaci 0.495 – 0.25 = 0.49 0.495
Fst
Genetická divergence mezi populacemi Fixační index FST - index genetické diferenciace (genetické vzdálenosti - genetic distance) vhodné a často používané měřítko genetické rozdílnosti mezi populacemi, nabývá hodnot v rozmezí: FST = 0 .... frekvence alel jsou v subpopulacích stejné FST = 1 .... alternativní alely jsou v subpopulacích fixovány (alely směřují k fixaci, proto fixační index) Kvalitativní vodítka pro interpretaci FST (Wright, 1978): FST = 0 - 0,05 ...... malá genetická divergence FST = 0,05 - 0,15 ... střední genetická divergence FST = 0,15 - 0,25 ... velká genetická divergence FST > 0,25 ............ velmi velká divergence
Přírodní výběr - selekce
Přírodní výběr – selekce evoluce
x
přírodní výběr
změna ve fenotypové (nebo genetické) kompozici populace v průběhu času, probíhá tedy mezi generacemi
může vést k evoluci, jestliže fenotypové změny, které vyprodukoval, jsou udrženy i v následující generaci Nemusí tedy nutně vést k evoluci !
Fitness
Klasifikace selekcí vzhledem k fenotypu
Selekce - fitness - omezíme se na rozdíly v životaschopnosti různých genotypů (“viability” - pravděpodobnost, že jedinec přežije od okamžiku oplození do reprodukčního věku). Genotyp
AA
Aa
viabilita = absolutní fitness W
0.75
0.65
Relativní fitness w
0.75/0.75 =1
Selekční koeficient
s11= 0
0.65/0.75 = 0.87 s12= 0.13
aa 0.5 0.5/0.75 = 0.67
standardizace pro vzájemná srovnání
s22 = 0.33
s=1-w
Relativní fitness (w) relativní schopnost jedinců s různými genotypy předat své alely do příštích generací.
Modelování selekce Jak určit změnu v alelových frekvencích ? Genotyp AA
Aa
aa
Relativní fitness
wAA
wAa
waa
Frekvence před selekcí
p2
2pq
q2
p2wAA
2pqwAa
q2waa
Příspěvek pro další generaci průměrná fitness populace (náhodného jedince) před selekcí Frekvence po selekci
w = p2wAA+ 2pqwAa+ q2waa p2(wAA/w)
2pq(wAa/w)
q2(waa/w)
Selekce direktivní (proti recesivní alele) jedna alela nebo znak upřednostňován před druhým; tj. jedna alela je redukována, druhá bude fixována ==> snížení genetické variability Genotyp
Frekvence před selekcí Relativní fitness Příspěvek pro další generaci Frekvence po selekci
AA
Aa
aa
p2
2pq
q2
1
1-s
p2
2pq
q2(1-s)
p2/(1-sq2)
2pq/(1-sq2)
q2(1-s)/(1-sq2)
1
Průměrná fitness populace : w = p2 + 2pq + q2(1 - s) = 1 - sq2 (p2 + 2pq + q2=1) Frekvence alely a po selekci : q’ = ½ [2pq/(1 - sq2)] + [q2(1 - s)]/(1 - sq2) = [q(1 - sq)]/(1 - sq2) Velikost změny alelové frekvence za jednu generaci: ∆q = q’-q ∆q = [(-sq2)(1-q)]/(1 - sq2)
Selekce direktivní Změna frekvence alely a v průběhu jedné generace pro různé počáteční frekvence (q), existuje-li selekce proti recesivnímu genotypu aa
∆q = (-spq2)/(1 - sq2)
- jestliže je a ve frekvenci vysoké, pak odstraňování probíhá rychle
- jestliže a je v nízké frekvenci, pak je "schována" v heterozygotech, odstraňování je pomalé
šipky znázorňují směr změny alelové frekvence
Selekce Výpočet změny v alelových frekvencích při různých typech selekce Hodnoty fitness
Selekce s obecnou dominancí "čistící" (purifying) Selekce proti recesivnímu znaku Selekce pro heterozygota (overdominance) Selekce proti heterozygotovi (underdominance)
AA
Aa
aa
Změna q
1
1 - hs
1-s
∆q =
1
1
1-s
1 - sAA
1
1 - saa
1 + sAA
1
1 + saa
− spq[h − q(2h − 1)] 1 − 2hspq − sq2
− spq2 ∆q = 1 − sq2 ∆q =
pq(sAAp − saa q) 1 − sAAp2 − saa q2
∆q =
pq(saa q − sAAp) 1 + sAAp2 + saa q2
Výhoda heterozygota - overdominance Balancovaný polymorfismus heterozygot má vyšší fitness než homozygoti, proto jsou obě alely v populaci udržovány prostřednictvím heterozygotního genotypu (znak srpkovité anémie)
Distribuce malárie a alely Hb-S.
Nevýhoda heterozygota - underdominance Příklad - Rh systém Rh-D gen, kodominantní
OK
OK rodiče D- x dd => matka dd (Rh-) dítě heterozygot Dd => (Rh+)nekompatibilita - současná západoevropská populace má q = 0.35 - odhadovaná seletivní nevýhoda 5%
Mutačně-selekční rovnováha mutace - objevují se s konstantní rychlostí škodlivé alely nejsou nikdy zcela eliminovány selekce - odstraňovat škodlivé mutace resp. omezuje jejich frekvenci - tyto dvě síly působí proti sobě, v určitém okamžiku se velikost jejich účinku vyrovná ∆qS + ∆qM = 0 Lze odvodit následující vztahy : a) je-li a úplně recesivní:
ˆ≈ q
µ s
b) je-li a neúplně recesivní (stupeň dominance je dán hodnotou h):
ˆ≈ q
µ hs
Změna frekvence alel při výskytu mutace a selekci proti recesivitě ∆qmu
∆q
10-5
∆q 0,0
∆qs -10-5
-2,0x10-5 0,0
0,002
0,004
q
0,006
0,008
0,01
MOLEKULÁRNÍ EVOLUCE
Výhody molekulárních markerů a dat : 1. Jsou skutečně genetické (interpretace je na rozdíl od dat morfologických či fyziologických mnohem jednodušší) a mohou být použity u každého organismu. 2. Metody jsou víceméně universální pro všechna organismy, vytvářejí tak srovnatelné typy dat, lze použít tutéž charakteristiku (např. ribozomální RNA sekvence, DNA barcoding pomocí COXI). 3. Odkrývají neomezené množství kvantifikovatelné variability.
MOLEKULÁRNÍ EVOLUCE 4. Obsahují informace o evoluci a mohou rozlišit: homologie - přítomnost podobného fenotypového nebo genotypového znaku u různých druhů vyvinutých ze společného předka; analogie - přítomnost podobných znaků u značně odlišných druhů, které vznikly vývojem unikátním pro každý druh, tj. podobnost je důsledkem jiných faktorů než společného předka, např. konvergentní evolucí 5. Spojují řadu dříve oddělených disciplín: molekulární biologii, fylogenetiku, systematiku a taxonomii, ekologickou genetiku, konzervační biologii a jsou také aplikovatelné v klinické a soudní praxi.
Techniky Gelová elektroforéza - technika umožňující separaci směsi molekul na gelu v elektrickém poli - nalitím agarosy nebo polyakrylamidu do formy vzniká porézní gel (velikost pórů závisí na koncentraci média) - substance, jež má být rozdělena, je nanesena do jamek na jedné straně gelu a gel je vystaven el. proudu (obvykle ponořen do komory s pufrem) - migrace proteinů, RNA nebo DNA závisí na náboji/hmotnosti (malé kousky běží rychleji)
Horizontální elektroforéza
Vertikální elektroforéza
Techniky Allozymy • elektroforeticky separovatelné formy téhož enzymu • relativné levné, kodominantní (lze detekovat heterozygoty) • detekují pouze malou část variability (jen ty změny aminokyselin, které vedou ke změně mobility v gelu)
Techniky RFLP (Restriction Fragment Lenght Polymorphism) • jedinci se mohou lišit v přítomnosti/nepřítomnosti restrikčních míst určitého úseku DNA, což se projeví na délce DNA fragmentů vzniklých po působení restriktáz na danou DNA • fragmenty variabilní délky jsou skutečnými alelami s Mendelovskou dědičností • variabilita na úrovni DNA (detekce i neutrálních změn) ale metoda náročná na množství DNA
Techniky
RFLP Restriction Fragment Lenght Polymorphism
PCR polymerase chain reaction
baktérie Thermus aquaticus
PCR - polymerase chain reaction Výhoda - minimální množství templátové DNA !! 94°
94° 72° 55°
Logaritmická replikace 2 4 8 16 32 64 128 256 512 1028
Techniky RAPD (Randomly Amplified Polymorphic DNA) • technika umožňující vyšetřování DNA na polymorfismus za použití arbitrárních krátkých primerů v PCR, které náhodně naamplifikují anonymní sekvence • obvykle s Mendelovskou charakteristikou dědičnosti obdobně jako RFLP data • rychlé, levné, ale dominantní !!!!!
Techniky RAPD (Randomly Amplified Polymorphic DNA)
Techniky DNA fingerprinting • použití vysoce variabilních úseků DNA pro identifikaci jednotlivců
• vysoce variabilní, rychlá evoluce, kodominantní • relativně drahé a časové náročné na zavedení u nového druhu
Mikrosatelity primery v přiléhajících oblastech (flanking regions) -PCR amplifikace produktů o různé velikosti -elektroforetická separace produktů - genotypy identifikovány jako velikost produktu
DNA Databáze CODIS CODIS: COmbined DNA Index System • obsahuje DNA profily z kriminálních skvrn a usvědčených pachatelů • navrženy pro nalezení spojitosti u sériových a nevyřešených případů s již odsouzenými pachateli •projekt začal v r. 1998, spojuje všech 50 států •v současnosti má 150,000 DNA profilů ze skvrn a 2 miliony DNA profilů pachatelů
DNA statistika TH01 D19 D3 AMEL
D8
D5
VWA
D21
TPOX D13
D7
CSF D16 D18
D2
FGA
Pravděpodobnost shody tohoto profilu v FBI vzorku "Caucasian" (bělošské) populace je 1 : 1.56 kvadrilionu (1015)
Forenzní analýza - DNA důkazy
Crime Scene Investigation
Techniky DNA sekvenování • určení nukleotidové sekvence DNA (nebo aminokyselinové sekvence proteinu) • používá se především pro fylogenetiku a studium evoluce genů
Techniky
Variabilita na úrovni DNA - každý nukleotid v DNA sekvenci představuje lokus (alelu) Species - line D. melanogaster - CR Africa D. simulans - CR Africa D. yakuba
T T G G G
Poly/Div
d
T T T T T
A A A A G
T G T G G
T T C T T
d p p
T T T T T
G G T T G d
G G G G G
C C C C C
polymorfismus segregující, na dané pozici je v rámci druhu více nukleotidů divergence - znamená pozici v rámci druhu monomorfní (fixovanou) ale rozdílnou mezi druhy
nesynonymní (replacement) vs. synonymní (silent) Arg Gln Val Arg Gln Val AGA CAA GTA AGA CAA GTA ↓ ↓ AGA CGA GTA AGA CAG GTA Arg Arg Val
Arg Gln Val
MOLEKULÁRNÍ EVOLUCE Rychlost molekulární evoluce r rychlost evolučních změn v nukleotidových sekvencích = rychlost nukleotidových substitucí (počet nukleotidových změn/bázi/rok)
r = K / (2T) K – počet aminokyselinových substitucí mezi dvěma proteinovými sekvencemi (pro nukleotidy se značí - k) T – doba divergence mezi dvěma sekvencemi (obvykle se odvozuje od paleontologických dat )
K
µ = r = K/(2T) ... rychlost nukleotidových substitucí/místo/rok
Rychlost molekulární evoluce Výpočet: - porovnání homologních sekvencí (uspořádat – align) - určit počet rozdílných substitucí (pomocí matematických modelů), které vznikly od dob jejich divergence - hodnota se pak vydělí evolučním časem (tj. dobou jejich evoluční separace, obvykle získanou z fosilních dat) µ = r = K/(2T) ... rychlost nukleotidových substitucí/místo/rok 50 million years ago
L = 10 K = 3/L = 0.3 r = 0.3/100My
Různé geny a různé části genů mají rozdílnou rychlost evoluce obecně platí, že nejvyšších hodnot substituce obvykle dosahují sekvence s nejmenším vlivem na funkci proteinu.
MOLEKULÁRNÍ HODINY • rychlost nukleotidových a aminokyselinových substitucí u různých genů různá, průměrná rychlost molekulární evoluce je poměrně jednotná z hlediska dlouhých časových úseků • uniformita rychlostí byla poprvé popsána Zuckerkandlem a Paulingem (1965) a je známa jako molekulární hodiny • zájem o použití makromolekul v evolučních studiích - zejména pro možnost determinace datování druhové divergence a rekonstrukci fylogeneze • po objasnění některých detailů se předpoklad konstantní rychlosti používá pro odhad divergenční doby i rekonstrukci fylogenetických stromů
MOLEKULÁRNÍ HODINY Konstantní rychlost evoluce alpha-globinu. Každý bod na grafu reprezentuje dvojici druhů nebo skupinu druhů.
Neutralní teorie molekulární evoluce (M. Kimura)
Alelová frekvence
- spojuje drift, mutaci, selekci -změna frekvence nových neutrálních mutací v čase Ne … efektivní velikost populace µ … mutační rychlost (2N)
1
Fixace 4Ne
Doba mezi fixacemi 1/µ
0 Čas
vzorek
Neutrální teorie molekulární evoluce • Většina změn v proteinech a na úrovni DNA, které jsou fixovány mezi druhy nebo které segregují uvnitř druhů, nemají žádný selekční význam. • Rychlost substituce je rovna rychlosti neutrálních mutací. k = µneutral • Míra polymorfismu v populaci je funkcí její efektivní velikosti a neutrální mutační rychlosti θ = 4Neµ • Polymorfismy jsou spíše přechodnou fází než v balancované rovnováze. • Pro mutaci ovlivňující fitness selekčním koeficientem s je genetický drift určujícím faktorem, jestliže lsl<< (1/2N) (i.e. mutace je v tomto případě EFEKTIVNĚ NEUTRÁLNÍ).
Koalescentní teorie (J.F.C. Kingman)
- popisuje genealogické vztahy mezi jedinci v populaci - všechny kopie genu v populaci pocházejí z jediného ancestrálního genu - podstatou koalescentní metody je, že rozdíly v DNA sekvenci jednotlivých alel daného lokusu obsahují informaci o jejich evoluci Neutrální teorie nám umožňuje odhadovat dobu koalescence, tj. umožňuje přidat do analýz časový rozměr.
Koalescentní teorie
Genealogie neutrálního lokusu
minulost
T2
4Ne (v průměru)
T3 T4
současnost
Neutral
1
Balancing Selection
2
3
4
5
T5
Directional Selection
MOLEKULÁRNÍ FYLOGENETIKA - rekonstruovat správné evoluční vztahy mezi organismy - odhadnout dobu divergence mezi organismy uplynulou od doby, kdy sdílely společného předka
Fylogenetický strom - je matematická struktura, model evoluční historie skupiny sekvencí nebo organismů = evoluční hypotéza uzly (operační taxonomické jednotky, OTU - druhy, vyšší taxony, izolované populace téhož druhu, jedinci, nerekombinující se alely téhož genu) vnitřní uzly ancestrální data
jeden unikátní uzel = kořen stromu - předek všech sekvencí
větve (definujících vztahy mezi OTU ve smyslu předek = ancestor potomek = descendant)
teminální = koncové uzly = recentní sekvence nebo organismy, z nichž máme data (OTU)
MOLEKULÁRNÍ FYLOGENETIKA Fylogenetický strom - zakořeněný (rooted; určitý uzel = kořen, od něhož vede unikátní cesta ke ke všem ostatním uzlům; společný předek)
A A B
1 2 B
C
D
C 1 2
D
- nezakořeněný (v tom případě směr evoluce není definován)
Zakořenění stromu se provádí za pomocí “vnější skupiny” (outgroup), což je OTU u níž máme důkaz např. paleontologický, že se oddělila dříve než zkoumané OTU.
MOLEKULÁRNÍ FYLOGENETIKA Metody rekonstrukce fylogenetického stromu a) metody matice vzdáleností (distance matrix) - pro všechny páry OTU je vypočtena evoluční vzdálenost (počet nukleotidových nebo aminokyselinových substitucí rozdělujících dvě OTU) - fylogenetický strom je konstruován na základě určitého funkčního vztahu mezi těmito vzdálenostmi (např. UPGMA, neighbor-joining NJ) b) metody maximální parsimonie (parsimonie - úspornost) - nalezení stromu, který vyžaduje co nejmenší počet evolučních změn mezi OTU druhový strom X genový strom
Evoluce genomů (změny velikosti) exon shuffling – exony různých genů se vyměňují, a vytvářejí tak geny, ktere jsou „mozaikou“ jiných genů, nové geny tedy mohou kódovat proteiny, které mají funkce „smíchané“ z původních genů
genová duplikace – duplikací a následnou divergencí vznikají multigenové rodiny, tj. sady genů, které jsou velice podobné svou sekvencí ale jejich produkty mohou mít jiné funkce
genomová duplikace – polyplodie horizontální genový transfer – na rozdíl od přenosu vertikálního (rodič- potomek) někdy dochází k přenosu mezi různými druhy (nejčastěji z bakterie na eukaryoty)
repetitivní DNA sekvence – vznikají především prostřednictvím transpozomů
„Exon shuffling“ může vytvořit nové geny (např. tissue plasminogen activator TPA)
Genová duplikace
Horizontální transfer