Filogenetikai analízis Törzsfák szerkesztése
Neighbor joining (szomszéd összevonó) módszer • A fában egymás mellé kerülı objektumok kiválasztása a távolságmátrix értékei és az objektumoknak az összes többivel alkotott távolságai alapján. • A módosított távolság annál kisebb lesz az eredetinél minél nagyobb a két objektum átlagos távolsága a többitıl, hiszen a nagy átlag (=„nagy evolúciós sebesség”) megnöveli a kettejük relatív közelségét. • A fa teljes felépítése során a távolságmátrix fokozatosan redukálódik. • Az eljárás megfelel a minimális evolúció módszerének, végeredményben a fa éleinek összhosszúságát optimalizáljuk.
Távolság mátrix spenót rizs
szúnyog majom
ember
spenót
0.0
84.9
105.6
90.8
86.3
rizs
84.9
0.0
117.8
122.4
122.6
szúnyog
105.6
117.8
0.0
84.7
80.8
majom
90.8
122.4
84.7
0.0
3.3
ember
86.3
122.6
80.8
3.3
0.0
Az elsı lépés 3.3 (ember-majom) a legkisebb távolság. Így összekapcsoljuk az embert és a majmot embmajként, és új távolságot számítunk. embmaj
szúnyog
spenót
rizs
ember
majom
Új távolság számítása • Miután összekapcsoltunk két fajt egy „alfába”, ki kell számolnunk minden egyes pontnak és az új „subtree”-nek a távolságát. • Ezt egy egyszerő átlag számítással kapjuk meg: Dist[spenót,embmaj] =(Dist[spenót, majom] + Dist[spenót,ember])/2 =(90.8 + 86.3)/2= 88.55
embmaj
spenót
ember
majom
Következı ciklus spenót rizs szúnyog embmaj
spenót
rizs
szúnyog
embmaj
0.0
84.9
105.6
88.6
84.9
0.0
117.8
122.5
105.6
117.8
0.0
82.8
88.6
122.5
82.8
0.0
szúny-(emb-maj) emb-maj rizs
spenót szúnyog
ember
majom
Utolsó elıtti ciklus spenót
rizs
szúnyembmaj
spenót
0.0
84.9
97.1
rizs
84.9
0.0
120.2
szúnyembmaj
97.1
120.2
0.0
szúny-(emb-maj) spen-rizs
rizs
spenót szúnyog
emb-maj ember
majom
Utolsó ciklus spenrizs szúnyembmaj
spenrizs
szúnyembmaj
0.0
108.7
108.7
0.0
(spen-risz)-(szúny-(emb-maj))
szúny-(emb-maj) spen-rizs
rizs
spenót szúnyog
emb-maj ember
majom
Parszimónia - elv • Egy jelenség magyarázatában az egyszerőbb hipotéziseket kell elfogadnunk a komplikáltabbakkal szemben. • Minimális evolúciós utak elve (távolság – alapú kladisztika, karakter alapon mőködı módszerek) • Parsimony – „takarékossági elv”
karakterek OTU1
A0 B0 C0 D1 E0 F0
2 3 4 5 6 7
8 9 10 11
1 1 0 0 0 0
1 0 0 0 0 0
0 0 1 1 0 0
0 1 0 0 0 0
1 1 1 1 0 0
0 0 0 0 1 1
1 0 0 0 0 0
0 0 0 1 0 0 E
0 0 1 0 0 0
0 0 0 0 0 1
1
2
4 2 3 1 3 1 4 2 1 0 2 1 F D 11 1,9
1
2
Leszármaztatott állapotok száma Apomorfiák összesített száma az egyes taxonokra
A
B
7,8
4
C 10 3
2
6 5
wings
-
-
-
-
-
-
Human
Bat
Kangeroo
6
antorbital fenestra
5
placenta
4
lactation
3
hair
Frog
2
amnion
1
Cocodile
CHARACTERS
Bird
Frog
Parszimónia a gyakorlatban 6
6
4
5 Tree 1 3 2
+
-
-
-
+
+
Crocodile
+
-
-
-
+
-
Kangeroo
+
+
+
-
-
-
+
+
+
+
-
+
Human
+
+
+
+
-
-
TREE LENGTH
Tree 1
1
1
1
1
1
2
7
Tree 2
1
2
2
2
2
1
10
FIT
Bat
Human
Bird
Bat
Cocodile
Kangeroo
1
Frog
TAXA
Bird
4 2
5
3
5 4
6
Tree 2
3 2 1
A két fa közül kisebb hosszúságú a Tree 1, így a parszimónia – elv szerint ez lesz a megfelelı. Mindkét fa igényel néhány homopláziát (extra lépés).
Parszimónia módszerek • Általánosságban a parszimónia módszerek az evolúciós fa ágainak összhosszúságát minimalizálják. • Olyan fát keresünk, amely a lehetı legkisebb számú karakterállapot változást (evolúciós lépést) teszi szükségessé a leszármazási viszonyok magyarázásához. • A feladat: -az adott topológiához legmegfelelıbb (legkisebb hosszúságot eredményezı) állapotokat kell rendelni a belsı szögpontokhoz -a fa topológiájának optimalizálása
Bootstrap • Modern számitógég-intenzív újramintavételezési módszer, amelyben kiindulásként feltételezzük, hogy a mintában lévı m egységre kapható gyakoriságeloszlás a lehetı legjobban képviseli az eredeti populációban levı gyakoriságot.
• A mintákból m-elemő visszatevéses mintavételezést sokszor végrehajtva kapjuk a bootstrap mintákat. • Minden egyes bootstrap mintát használhatunk valamilyen paraméter becslésére (parszimónia, ML, megismételt többváltozós analízis). • Bootstrap konszenzus fát eredményez a változók bootstrap újramintavételezésével elıállított alternatív fák egyesítése. %-ban fejezi ki, hogy hányszor helyezi a fában azonos helyre a mintákat. • Kiküszöböli a változók kiválasztásában jelentkezı szubjektív elemeket, s alkalmas a leginkább stabil osztályok kimutatásásra.
Bootstrap – egy példa SSUrDNA Ochromonas (1) Symbiodinium (2)
100
Prorocentrum (3) Euplotes (8)
84
Tetrahymena (9) 96 100
Loxodes (4) Tracheloraphis (5)
100 100
Spirostomum (6) Gruberia (7)
Bootstrap konszenzus fa
123456789 Freq ----------------.**...... 100.00 ...**.... 100.00 .....**.. 100.00 ...****.. 100.00 ...****** 95.50 .......** 84.33 ...****.* 11.83 ...*****. 3.83 .*******. 2.50 .**....*. 1.00 .**.....* 1.00
Karakterállapotok közötti lehetséges átmenetek A
G
T
C
Rendezetlen: egy tulajdonság állapotai az evolúció során bármelyik másikba át- ill. visszaalakulhatnak.
Rendezett és reverzibilis: A karakterek állapotai sorba rendezettek, az átalakulás A B C D mindkét irányban végbemehet. „A” állapotból rendezett és reverzibilis csak a szomszédos állapotba juthatunk el közvetlenül. rendezetlen
A
B
C
irreverzibilis
D
Irreverzibilis: A rendezett karakter állapotai csak egy irányban alakulhatnak át egymásba.
A stepmatrix meghatározza a különbözı karakterek közötti változás súlyát. Pu Py
transzverzió
PURINES (Pu)
A
T
G
C
PYRIMIDINES (Py) tranzíció Py Py Pu Pu
A A 0 C 5 G 1 T 5
C 5 0 5 1
G 1 5 0 5
T 5 1 5 0
DNS szubsztitúciós modellek
JC/ Jukes & Cantor A C G T FEL/ Felsenstein
A C
K2P/ Kimura 2 paraméter
G T
A C G
A C G
T
T A C
G T
A C
G T
HKY/ Hasegawa, Kishino, Yano A C G T A
C
G
T
Maximum – likelihood módszer • Konkrét evolúciós modell alkalmazását igényli. • Meg kell adni, hogy miképp alakulhat át az egyik szekvencia a másikba (morfológiai karakterekre ilyen célra alkalmazható modellrıl még nem tudunk). • A modell ismeretében megadja, hogy a sok lehetıség közül melyik fa kialakulása a leginkább valószínő. • A számítások során a teljes szekvenciát figyelembe kell venni, nemcsak az eltéréseket okozó pozíciókat (ahogy a parszimónia esetében tesszük). • Legegyszerőbb modell a JC. K2P modell már bevezeti k tranzíció/tranzverzió hányadost.
Maximum – likelihood módszer • K-ból és a gyakoriságból meghatározhatók a nukleotidcserék evolúciós idıegységre vonatkoztatott rátái. • A mutációs ráták segítségével kiszámítható annak az eseménynek a valószínősége, hogy t idı elteltével A bázis helyére G bázis kerül. PAG(t) • Annak az esélye (L=likelihood!), hogy adott szekvencia valamely pozíciójában az A nukleotid van, és ezt t idı elteltével G váltja fel: LAG(t)=ƒA PAG(t) ƒA az A nukleotid relatív gyakorisága a kezdeti szekvenciában