Populační genetika II
4. Mechanismy měnící frekvence alel v populaci
Genetický draft (genetické svezení se)
Genetický draft = zvýšení frekvence alely díky genetické vazbě s výhodnou mutací.
Selekční vymetení „selective sweep“ = snížení genetické variability v okolí výhodné mutace.
Selekce na pozadí = snížení frekvence alel díky genetické vazbě s nevýhodnou mutací. Také vede ke snížení genetické variability v populaci, není však tak výrazné, jako u selekčního vymetení.
Vazebná nerovnováha Vyjadřuje skutečnost, že se určité kombinace alel ve dvou či více lokusech vyskytují v populaci častěji či méně často než by odpovídalo jejich náhodné kombinaci.
B
A b
A
a a
A a
A
A
b
b a
a a
A A b
B
A
B
B
B
B
A
b
B
B
a a
b
AB…. 25% ab…. 25% aB…. 25% Ab…. 25% VAZEBNÁ ROVNOVÁHA
b
B a
B
A A b
B a
A
B
b b
a
b a
b
AB…. 40% ab…. 40% aB…. 10% Ab…. 10% VAZEBNÁ NEROVNOVÁHA
Vazebná nerovnováha (D) D = pozorované – očekávané frekvence kombinace alel
Očekávané frekvence kombinace alel (tj. náhodné kombinace) jsou dané pouze frekvencí alel v populaci.
Očekávané frekvence AB
p1q1
ab
p2q2
Ab
p1q2
aB
p2q1 D=0 D > 0 či D < 0
p1 … frekvence alely A p2 … frekvence alely a q1 … frekvence alely B q2 … frekvence alely b
vazebná rovnováha vazebná nerovnováha
Vazebná nerovnováha (D) •
Míra vazebné nerovnováhy závisí nepřímoúměrně na míře rekombinace (r) a efektivní velikosti poulace (Ne).
•
Vazebná nerovnováha způsobená vzájemnou vazbou genů po čase v populaci vymizí. D=
1 4Ner
Populační rekombinační rychlost
Míra rekombinace (r) •
Odhaduje se jako počet cM na Mb.
•
U člověka v průměru 1cM ~ 1Mb. U myši 1cM ~ 2Mb.
•
Liší se však výrazně v různých částech genomu.
•
Většina rekombinačních událostí v určitých krátkých úsecích – horká místa rekombinace. Pozice a síla horkých míst se v evoluci rychle mění. Jsou variabilní v i rámci druhu.
•
Míra rekombinace se liší mezi pohlavími. Haldane-Huxley pravidlo: Pokud jedno pohlaví nerekombinuje vůbec, pak je to vždy pohlaví heterogametické
•
Obecně větší míra rekombinace na malých chromosomech než na velkých.
•
Obecně rekombinace néně častá u centromery a častější u telomer.
Genetický draft zvyšuje míru vazebné nerovnováhy v populaci
Míra vazebná nerovnováhy je různá v různých částech genomu
Haplotypová mapa lidského genomu •
Mapuje míru vazebné nerovnováhy podél genomu.
•
Využívá se pro genetické mapování znaků v populaci (asociační mapování).
5. Neutrální teorie molekulární evoluce
Neutrální teorie molekulární evoluce Mottoo Kimura, konec 60. a začátek 70. let 20. stol. •
Její vytvoření stimulováno pozorováním, že v populacích existuje velké množství polymorfismu. Kimura navrhl, že by se mohlo jednat o neutrální polymorfismus.
•
Ukazuje jak bude vypadat genetická variabilita v rámci populace a mezi druhy v případě, že mutace jsou neutrální.
•
Poskytuje nulovou hypotézu. Většina testů selekce založena na tom, že se snaží vyvrátit neutralitu.
Neutrální teorie molekulární evoluce
•
Neutrální teorie evoluce je matematický model.
•
Předpoklady modelu: panmiktická populace, nepřekrývající se generace, konstantní velikost populace.
•
Model je popsán několika volně nastavitelnými parametry (např. mutační rychlost, frekvence alel, velikost populace).
•
Parametry lze odhadovat ze skutečných dat (odhady parametrů).
•
Lze testovat, jestli naše data odpovídají neutrálnímu modelu či ne.
Míra vnitrodruhového polymorfismu za předpokladu neutrality
Genetický polymorfismus θ = 4Neµ
•
Míra polymorfismu v populaci závisí přímoúměrně na mutační rychlosti a velikosti populace.
•
Druhy s velkými populacemi (drozofila) jsou polymorfnější než druhy s malými populacemi (člověk).
Empirické odhady genetického polymorfismu (θ)
polymorfismus = existence více než jedné alely v populaci.
AGTGAGTCGTCAGTACTGCTG ACTGAGTCGTCAGTACAGCTG AGTGTGTCGTCCGTACTGCTG ACTGAGTCGTCAGTACTGCTG ACTGAGTCGTCAGTACTGCTG AGTGTGTCGTCCGTACTGCTG ACTGAGTCGTCAGTACTGCTG ACTGTGTCGTCCGTACTGCTG AGTGAGTCGTCAGTACTGCTG AGTGAGTCGTTAGTACTGCTG ACTGAGTCGTCAGTACTGCTG
θ = proporce polymorfních míst π = nukleodidová diverzita, průměrná heterozygozita
Rozložení frekvence alel za předpokladu neutrality
V populaci je nejvíce vzácných alel a nejméně častých alel.
Při neutrální distribuci frekvence alel, θ = π Pokud θ ǂ π a) Na sekvenci působí selekce. b) Jsou porušeny předpoklady modelu. Obvykle populace nemá konstantní velikost. θ>π
nadbytek vzácných alel (pozitivní a negativní selekce či populační expanze).
π>θ
nadbytek středně četných alel (balancing selekce či bottle-neck)
Tajima’s D test - test na detekci selekce. - založen na porovnání θ a π.
D = (π - θ)/Var(D)
Jak od sebe odlišit vliv selekce a demografických faktorů?
Doba fixace mutace •
Průměrná doba fixace nové mutace (počítáno jen pro mutace, které se nakonec zafixují):
•
neutrální mutace: t = 4Ne generací (pro chrX: 3Ne, pro chrY, mt DNA: 1Ne)
•
• •
U druhů s velkou efektivní velikostí populace může přetrvávat neutrální polymorfismus několik milionů let. Vysvětluje proč je ve velkých populacích velké množství polymorfismu. Průměrná doba existence druhu je 4 milióny let. Dva příbuzné druhy mohou sdílet polymorfismus, který zdědily od společného předka (ancestrální polymorfismus).
Rychlost evoluce za předpokladu neutrality Evoluční/substituční/fixační rychlost = počet nových mutací x pravděpodobnost jejich fixace k = 2Neµ 1 = µ 2Ne
Ne … efektivní velikost populace µ … mutační rychlost
pravděpodobnost fixace nové mutace počet nových mutací v populaci
Evoluční rychlost pro neutrální sekvence je ovlivněna pouze mutační rychlostí. Nezávisí na efektivní velikosti populace. Za předpokladu neměnné mutační rychlosti je evoluční rychlost v čase konstantní. Molekulární hodiny.
Míra divergence za předpokladu neutrality Genetická divergence
D = 2µt
= substituční rychlost x čas počet mutací, které vzniknou za určitý čas.
t
Odhad genetické divergence ze skutečných dat
AGTGAGTCGTCAGTACTGCTG ACTTAGCCGTGAGTACAGCTA
D=
6 = 0,2857 (28,57%) 21
Proporce nukleotidových míst, které se liší mezi dvěma sekvencemi DNA.
Problém saturace •
Po určité době divergence přestane stoupat. Je to kvůli mnohočetným substitucím ve stejné pozici. Došlo k saturaci.
•
Divergence spočítaná mezi sekvencemi s mnohočentými substitucemi ve stejné pozici je podhodnocená.
skutečných počet substitucí pozorovaný počet substitucí
Jak odhadnout skutečnou divergenci? Nukleotidové substituční modely Umožňují korekci na mnohonásobné substituce a odhad skutečné divergence. Jukes & Cantor (1 parameter) model -Nejjednodušší jednoparametrový model model -Předpokládá, že všech možné substituce stejnou pravděpodobnost (α) a všechny nukleotidy mají stejnou frekvenci. Kimura (2 parameter) model -Pravděpodobnost tranzic větší než pravděpodobnost transverzí Felsenstein 81 (4 parameter) model -Umožňuje nastavit různé frekvence nukleotidů HKY-Hasegawa,Kishino,Yano (5 parameter) model -Zohledňuje odlišnou pravděpodobnost transic a transverzí i různé frekvence nukleotidů HKY + Γ -Gama parametr umožňuje modelovat odlišnou rychlost substitucí v různých nukleotidových pozicích Program ModelTest: vybere model, který nejlépe sedí na data
Molekulární hodiny a odhad doby divergence •
Umožňují odhadnout dobu divergence dvou taxonů pokud známe jejich genetickou divergenci a substituční rychlost sekvence.
D = 2µt
•
Substituční rychlost se dá odhadnout pomocí známé doby divergence některých taxonů určené např. na základě paleontologických dat (kalibrace molekulárních hodin).
•
nejčastěji se používá sekvence cytochromu b (mt DNA), která má u savců a ptáků substituční rychlost cca 0,01. Tzn. 2% divergence ~ 1 mil let.
•
Pomocí molekulárních hodin odhadujeme dobu divergence sekvencí.
•
Ta může být výrazně nadhodnocená pokud druhy stále sdílí ancestrální polymorfismus.
•
Odhady divergence pomocí molekulárních hodin má smysl používat jen pro vzdálenější taxony.
divergence sekvencí divergence druhů
Substituční rychlost je velmi variabilní u různých taxonů
Substituční rychlosti pro cytochrom b u ptáků. Pravidlo 2% divergence ~ 1 mil let, neplatí!
Proč je substituční rychlost tak rozličná mezi druhy/taxony? Velkou část variability v substituční rychlosti vysvětlí variabilita ve velikosti těla.
Hypotéza generační doby •
Malé druhy mají obvykle kratší generační dobu. Druhy s krátkou generační dobou se častěji rozmnožují. Mají celkově více buněčných dělení v germinální linii v přepočtu na jeden rok. Pokud většina mutací vzniká při replikaci, je u nich zvýšená mutační rychlost a tím pádem i substituční rychlost.
•
Nedokáže ale vysvětlit proč substituční rychlost obecně vyšší u teplokrevných organismů.
Metabolická hypotéza •
Mutační rychlost a tím pádem substituční rychlost daná především rychlostí metabolismu. Při vyšší rychlosti metabolismu, vyšší oxidativní stres. Druhy s malou velikostí mají rychlejší substituční rychlost.
•
Vysvětlí proč teplokrevní mají vyšší substituční rychlost než studenokrevní.
Hypotéza dlouhověkosti •
Dlouhověké druhy si vyvinuly mechanismy, jak se bránit oxidativnímu stresu. Nezpůsobuje u nich tolik mutací, můžou se tak dožít vysokého věku. Substituční rychlost je tak u nich snížená.
vysoký metabolismus
nízký metabolismus
dlouhověcí
krátkověcí
Téměř neutrální teorie evoluce •
neutrální mutace působí na ně drift
•
škodlivé / výhodné mutace působí na ně selekce
•
mírně škodlivé / výhodné mutace působí na ně drift i selekce Tomoko Ohta
Pokud |2s| = 1/2Ne, selekce a drift na osud alely stejný vliv. (Téměř) neutrální mutace: |2s| < 1/2Ne O jejich osudu rozhoduje více drift než selekce Mírně škodlivé/výhodné mutace se v malých populacích chovají jako neutrální, kdežto ve velkých jako škodlivé.
Téměř neutrální teorie evoluce předpovídá rychlejší evoluční rychlost v malých populacích
•
Většina mutací škodlivých.
•
V malých populacích se fixuje více škodlivých mutací než ve velkých.
•
Druhy s malými populacemi mají rychlejší substituční rychlost (rychlejší molekulární hodiny) než druhy s velkými populacemi.
>
>
Téměř neutrální evoluce může vysvětlit rychlejší evoluci chromosomu X Chromosom X má menší efektivní velikost populace než autosomy. Můžou se na něm snadněji fixovat mírně škodlivé mutace. Rychlejší evoluce.
Molekulární hodiny V praxi moc nefungují ze dvou důvodů:
1. Mutační rychlost pro jednotlivé geny není konstantní napříč fylogenezí. Liší se u různých taxonů. 2. Evoluční rychlost není zcela nezávislá na velikosti populace. Ta se také velmi liší mezi různými druhy.
Existuje souvislost mezi substituční rychlostí a rychlostí fenotypické evoluce? Hatérie novozélandská pomalý metabolismus dlouhá generační doba pomalá fenotypická evoluce Ale rychlé molekulární hodiny! Substituční rychlost nemusí být daná pouze generační dobou a metabolickou rychlostí. Substituční rychlost nemusí souviset s rychlostí fenotypické evoluce.
6. Detekce selekce na molekulární úrovni
Výhody detekce selekce na molekulární úrovni
Netřeba znát předem fenotyp. Lze detekovat i selekci, která působila v minulosti.
Typy selekce Pozitivní selekce: • • •
působí na výhodné mutace, vede k jejich fixaci v populaci snižuje genetickou variabilitu v populaci (selektivní vymetení) dlouhodobá pozitivní selekce zvyšuje míru divergence mezi druhy
Negativní selekce: • • •
působí na nevýhodné mutace, vede k jejich odstranění z populace snižuje genetickou variabilitu v populaci (selekce na pozadí) dlouhodobá negativní selekce snižuje míru divergence mezi druhy
Balancing selekce: • •
Udržuje v populaci trvale polymorfismus selekce ve prospěch heterozygotů, frekvenčně závislá selekce
Detekce nedávné pozitivní selekce 1. Detekce založená na průvodních jevech „selective sweep“
•
-
snížení genetické variability (Hudson-Kreitman-Aguadé test)
-
zvýšení vazebné nerovnováhy (Extended haplotype test)
-
změna v distribuci frekvence alel (Tajima’s D test)
Selekce před max. ~ Ne generacemi (u člověka ~ 250 000 let).
vznik výhodné mutace
neúplný selective sweep
úplný selective sweep
Detekce nedávné pozitivní selekce
2. Detekce založená na zvýšené míře genetické diferenciace subpopulací - Detekce genů odpovědných za lokální adaptace. Disruptivní selekce. - FST outlier test Geny podmiňující lokální adaptace vykazují menší genový tok mezi subpopulacemi ve srovnání s neutrálními geny. Budou vykazovat odlišnější frekvence alel mezi subpopulacemi a tím pádem větší hodnoty FST.
Mapa recentě pozitivně selektovaných lokusů v lidské populaci 9 studií na Perlegen či HapMap SNP datových souborech. Detekce selekce pomocí LD, distribuce frekvence alel či Fst.
Identifikováno: 5110 různých lokusů (zahrnuje 23 % všech genů). 722 ve > 2 studiích 271 ve > 3 studiích 129 ve > 4 studiích
LCT gen kódující laktázu V lidské populaci vzniklo nezávisle několik mutací v LCT genu, které umožňují trávit mléko i v dospělostí. Souvisí s rozšířením pastevectví.
Výskyt laktázové perzistence
Evropská populace Asijská populace
G6PD gen kódující glukóza-6-fosfát dehydrogenázu Mutace v tomto genu způsobují rezistenci vůči malárii.
Další geny identifikované v testech pozitivní selekce •
Alcohol dehydrogenase (ADH) gene
•
Geny odpovědné za pigmentaci kůže
Analýza funkce 2465 genů, které leží v 722 lokusech identifikovaných ve > 2 studiích
Recentní pozitivní selekce se často týká genů s funkcí v metabolismu. Souvisí pravděpodobně s výraznou změnou ve stravování lidí v nedávné historii.
Mezi několika málo geny identifikovanými v 6 z 9 studiích gen PCDH15
•
Hraje roli ve vývoji vnitřního ucha a sítnice.
•
Mutace v tomto genu způsobují hluchotu a slepotu (Uscherův syndrom)
•
Mezi geny identifikovanými v několika studiích také MYO1B, MYO3A a MYO6, které také důležité ve funkci vnitřního ucha.
•
Důležitá role smyslů v lidské evoluci.
Mezi pozitivně selektovanými geny jsou i geny podmiňující různé lidské chroroby
CFTR gen - mutace v tomto genu způsobují cystickou fybrózu ALMS1 gen - spojený s Alstromovým syndromem (pacienti vykazují obezitu, cukrovku, slepotu) GBA gen - štěpení glukosacharidů, - mutace v tomto genu způsobují Gaucherovu chorobu
Jak může frekvenci mutací způsobujících lidské choroby ovlivňovat pozitivní selekce?
1. Mutace způsobující chorobu jsou recesivní a v heterozygotním stavu přinášejí nějakou výhodu (balancing selekce). G6PD gen způsobuje resistenci vůči malárii v heterozygotním stavu, ale v homozygotním stavu, může způsobit hemolytickou anémii. CFTR gen způsobuje v homozygotním stavu cystickou fibrózu, ale v heterozygotním stavu poskytuje ochranu proti astma. 2. V historii došlo ke změně ve směru působení selekce Dříve spíše nedostatek potravy, selekce maximalizovala účinnost metabolismu. Dnešní nadbytek potravy způsobuje metabolické choroby. Alely, které byly výhodné dříve jsou dnes nevýhodné.
Detekce dlouhodobě působící selekce
•
Využívá se srovnání sekvencí z různých, často vzdálených, druhů
•
Negativní selekce – snižuje míru divergence mezi druhy, častější synonymní substituce
•
Pozitivní selekce – zvyšuje míru divergence mezi druhy, častější nesynonymní mutace
Test neutrality založený na relativním počtu nesynonymních (KA) synonymních (KS) substitucí mezi druhy
Synonymní substituce: nevedou k záměně aminokyseliny Nesynonymní substituce: vedou k záměně aminokyseliny
KA/KS = 1 KA/KS > 1 KA/KS < 1
neutrální evoluce pozitivní selekce negativní selekce
KA/KS test •
Většina genů má KA/KS zhruba 0,1 – 0,2. Tzn. na většinu genů působí negativní selekce.
člověk vs myš
KA/KS test •
V rámci jednoho genu může na některé kodóny působit pozitivní selekce, na jiné negativní a jiné se mohou vyvíjet neutrálně.
•
Nové metody umožňují počítat KA/KS pro jednotlivé kodóny či pro jednotlivé evoluční linie.
•
Užitečná je analýza „sliding window“ umožnující počítat KA/KS pro různé oblasti genu.
Geny s vysokým poměrem KA/KS Často důležitou roli v reprodukci. U savců dále v imunitní odpovědi a čichu (např. MHC geny, OBP geny).