MENDELOVA ZEMĚDĚLSKÁ A LESNICKÁ UNIVERZITA V BRNĚ ZAHRADNICKÁ FAKULTA V LEDNICI
POROVNÁNÍ VÝSLEDKŮ POUŽITÍ RŮZNÝCH KOEFICIENTŮ PODOBNOSTI PRO ZPRACOVÁNÍ RAPD DAT
Diplomová práce
Vedoucí diplomové práce
Autor diplomové práce
Ing. Miroslav Vachůn, Ph.D.
Bc. Veronika Bambasová
-6-
Prohlašuji tímto, že jsem zadanou diplomovou práci vypracovala samostatně pod vedením Ing. Miroslava Vachůna, Ph.D. a uvedla v seznamu literatury veškerou použitou literaturu a další zdroje.
V Lednici dne 10.5.2009 _________________________________
Poděkování Na tomto místě bych ráda poděkovala Ing. Miroslavu Vachůnovi, Ph.D. za jeho odborné vedení, cenné rady a především ochotu, se kterou odpovídal na všechny mé dotazy.
4
OBSAH 1. ÚVOD A CÍL ................................................................................................................................................ 7 2. LITERÁRNÍ PŘEHLED ............................................................................................................................. 8 2.1 GENOVÉ ZDROJE ................................................................................................................................. 8 2.1.1 Informace o genových zdrojích ....................................................................................................... 8 2.1.2 Síly formující genetickou diverzitu................................................................................................. 11 2.1.3 Ochrana genetické diverzity........................................................................................................... 11 2.1.4 Důležitost genetické diverzity......................................................................................................... 12 2.2 MOLEKULÁRNÍ MARKERY ...................................................................................................................... 13 2.3 GENETICKÝ POLYMORFISMUS ................................................................................................................. 16 2.4 FYLOGENETIKA................................................................................................................................. 18 2.4.1 Molekulární fylogenetika ............................................................................................................... 19 2.4.2 Molekulárněfylogenetické metody.................................................................................................. 20 2.4.3 Dendrogramy ................................................................................................................................. 22 2.4.4 Konstrukce dendrogramu............................................................................................................... 23 2.4.5 Test kvality dendrogramu............................................................................................................... 25 2.5 STATISTICKÉ ANALÝZY ........................................................................................................................... 26 2.5.1 Shluková analýza ........................................................................................................................... 26 2.5.2 Koeficienty podobnosti................................................................................................................... 27 2.5.3 Mantelův test.................................................................................................................................. 28 2.6 FREETREE PROGRAM .............................................................................................................................. 29 2.7 NTSYSPC ............................................................................................................................................... 30 2.8 R-PROJECT .............................................................................................................................................. 30 2.9.PRUNUS ARMENIACA – MERUŇKA .......................................................................................................... 31 2.9.1 Systematika meruněk...................................................................................................................... 32 2.9.2 Původ a genová centra meruněk .................................................................................................... 32 2.10 VITIS VINIFERA - RÉVA VINNÁ .............................................................................................................. 34 2.10.1 Systematika révy........................................................................................................................... 34 2.10.2 Původ a genová centra révy......................................................................................................... 35 3. METODIKA ............................................................................................................................................... 37 3.1 TESTOVANÝ MATERIÁL........................................................................................................................... 37 3.2 POUŽITÝ SOFTWARE ............................................................................................................................... 38 3.3 POUŽITÉ METODY A KOEFICIENTY .......................................................................................................... 39 3.4 METODIKA PROGRAMU FREETREE ......................................................................................................... 39 3.5 METODIKA PROGRAMU NTSYSPC .......................................................................................................... 41 3.6 METODIKA PROGRAMU R-PROJECT ......................................................................................................... 43 3.7 MANTELŮV TEST ZA POUŽITÍ PROGRAMU NTSYSPC .............................................................................. 44 4. VÝSLEDKY PRÁCE ................................................................................................................................. 46 4.1 VYHODNOCENÍ RAPD DAT PRUNUS ARMENIACA ZÍSKANÉ PROGRAMEM FREETREE .............................. 46 4.2 VYHODNOCENÍ RAPD DAT PRUNUS ARMENIACA ZÍSKANÉ PROGRAMEM NTSYSPC .............................. 49 4.3 VYHODNOCENÍ RAPD DAT PRUNUS ARMENIACA ZÍSKANÉ PROGRAMEM R-PROJECT ............................. 53 4.4 VYHODNOCENÍ SSR DAT PRUNUS ARMENIACA ZÍSKANÉ PROGRAMEM FREETREE ................................ 54 4.5 VYHODNOCENÍ SSR DAT PRUNUS ARMENIACA ZÍSKANÉ PROGRAMEM NTSYSPC ................................. 56 4.6 VYHODNOCENÍ SSR DAT PRUNUS ARMENIACA ZÍSKANÉ PROGRAMEM R-PROJECT................................. 59 4.7 VYHODNOCENÍ RAPD DAT VITIS VINIFERA ZÍSKANÉ PROGRAMEM FREETREE ...................................... 60 4.8 VYHODNOCENÍ RAPD DAT VITIS VINIFERA ZÍSKANÉ PROGRAMEM NTSYSPC ....................................... 63 4.9 VYHODNOCENÍ RAPD DAT VITIS VINIFERA ZÍSKANÉ PROGRAMEM R-PROJECT ..................................... 67 4.10 CELKOVÉ VYHODNOCENÍ KOEFICIENTŮ A SOFTWARŮ........................................................................... 68 5. DISKUZE .................................................................................................................................................... 69 6.ZÁVĚR ......................................................................................................................................................... 71
5
7. RESUME..................................................................................................................................................... 72 8. LITERÁRNÍ ZDROJE .............................................................................................................................. 73 9. SEZNAM OBRÁZKŮ................................................................................................................................ 78 10. SEZNAM TABULEK .............................................................................................................................. 78 11.PŘÍLOHY ............................................................................. CHYBA! ZÁLOŽKA NENÍ DEFINOVÁNA.
6
1. ÚVOD A CÍL Tato diplomová práce se věnuje tématu softwarů a statistických programů, které jsou používány pro analýzu genetických informací. Statistické metody v kombinaci s genetickými postupy slouží k hodnocení genetické diverzity a pro zjišťování příbuzenských vztahů mezi druhy a odrůdami rostlin. Pro úvod do problematiky genetických informací je vysvětlen význam genových zdrojů a manipulace s genovými zdroji jak v České republice, tak v celém světě. Nejvhodnějšími procesy, jak získat data potřebné pro statistickou analýzu, je DNA fingerprinting a molekulární markery. Pro určování příbuznosti se dají použít i metody tzv. klasické, ale genetika odhalí vlastnosti, které by nebylo možné zjistit jiným způsobem, proto se v současné době hojně těchto metod využívá. V této práci se budu zabývat RAPD a SSR markery. Podstatou příbuzenských vztahů mezi rostlinami se zabývá fylogenetika. Proto se hlavní část literárního přehledu věnuje fylogenetice, konstrukcím dendrogramů a statistickým metodám, které vedou k tvorbě dendrogramů, a dále metodám pro ověřování spolehlivosti takto vytvořených dendrogramů. Statistické metody jsou založeny na koeficientech podobnosti. Každý koeficient byl vyvinut jiným způsoben a výpočet je potom také jiný. Hlavním cílem této diplomové práce je porovnat spolehlivost koeficientů a vhodnost jejich používání při analýze genetických dat. Statistické programy, které budou použity v této práci, jsou založené na jiných principech. NTSYSpc a FreeTree software byly vytvořeny přímo pro zpracovávání genetických dat a pro potřeby biologie. R-project je složitý program pro potřeby statistiky obecně, který se pak aplikuje na další vědy. Využívá jiné metody a koeficienty než předchozí. Pro analýzu byla použita genetická data RAPD a SSR markerů meruněk a révy vinné. U révy vinné se hodnotí příbuznost položek známých odrůd a podnoží, meruňky jsou zaměřeny na dvě desítky odrůd pěstovaných v Evropě. Dendrogramy se porovnávají s informacemi o původu odrůd.
7
2. LITERÁRNÍ PŘEHLED 2.1 GENOVÉ ZDROJE 2.1.1 Informace o genových zdrojích S rychlým vývojem člověka a jeho rostoucími potřebami vznikají stále větší požadavky na kvalitu zemědělských plodin a zachování genofondu kulturních rostlin pro další výzkum, ale zároveň dochází vlivem lidské činnosti k narušování ekosystémů a mizení nenahraditelných genetických zdrojů. Význam genetických zdrojů rostlin se dále zvyšuje v důsledku rychlého rozvoje šlechtění a jeho technik a technologií, přibývajících poznatků o důležitosti diverzity plodin a odrůd v zemědělství a diverzity agroekosystémů v souvislosti s minimalizací zásahů zemědělské výroby do životního prostředí a přijetí principu národní suverenity nad přírodními a genetickými zdroji. (SVITÁČKOVÁ, 2003) Genetickými zdroji rostlin se rozumí šlechtěné (pěstované i starší restringované) odrůdy zemědělských plodin, krajové odrůdy a primitivní formy, genetické linie a šlechtitelské materiály (nová šlechtění), ale také plané druhy příbuzné zemědělským plodinám. (Národní program, 20.3.2006) Bob Harlan a De Wet rozdělily rostliny podle šlechtitelské využitelnosti a botanické příbuznosti na: •
primární gene-pool (genový zdroj)- pěstované druhy a druhy příbuzné, z nichž lze snadno získat geny, kříží se mezi sebou a je možné získat generace F1 a F2.
•
sekundární gene-pool- druhy, kde je přenos genů doprovázen obtížemi
•
terciární gene-pool- zde je přenos genů mimořádně obtížný a vyžaduje speciální techniky
(SVITÁČKOVÁ, 2003, BEDNÁŘ, 1997, CHLOUPEK, 2000) Kulturní rostliny pocházejí z původních planých druhů. Geografické oblasti vzniku kulturních rostlin se nazývají genová centra. Mohou být společné s centry diverzity, která jsou charakteristická genetickou variabilitou mezi genotypy pěstovaných plodin a příbuzných druhů. Botanik, genetik a šlechtitel Vavilov (1926) rozdělil genová centra do osmi oblastí (viz Obr.1). V Tab.1 jsou uvedeny příklady původních rostlin v jednotlivých genových centrech. Jeho kolekce obsahovaly převážně šlechtěné druhy, sbírka planých rostlin byla velmi chudá. Se svými kolegy podnikal expedice na blízký Východ, do
8
Afghanistánu, Etiopie, atd. a shromažďoval poznatky o původu rostlin. Podle Vavilova rostou původní druhy v určitých oblastech a kulturní formy vznikají mutacemi, křížením, kombinacemi a rekombinacemi z více oblastí. Proto se domníval, že centra genetické diverzity jsou shodná s centry původu. Pozdější poznatky ukázaly, že tomu tak není. V 50.letech 20.století Harlan tvrdil, že ke změnám genetické diverzity dochází vlivem migrací a výměnou genetických informací. 1971 vymezil Žukovskij dvanáct genových center (Tab.2). (ZOHARY, 1970, BEDNÁŘ, 1997, DOLEŽALOVÁ, 20.3.2006)
1. Východní Asie 2. Indie, Indomalajsie 3. Centrální Asie 4. Blízký Východ 5. Středozemí 6. Etiopie 7. Jižní Mexiko a Střední Amerika 8. Jižní Amerika
Obr.1: Centra původu kulturních rostlin podle Vavilova 20.3.2006)
(Zdroj: DOLEŽALOVÁ,
Tab.1: Světová centra diverzity s příklady rostlin podle Vavilova z roku 1951 1. Východní Asie Glycine hispida
Prunus persica Citrus sinensis Camellia sinensis
2. Indie, Indomalajsie Oryza sativa Phaseolus aconitifolius Solanum melongena Colocasia antiquorum Cucumis sativus Cocos nucifera
5. Středozemí Triticum durum Vicia faba
6. Etiopie Triticum dicoccum Lens esculenta
7. Jižní Mexiko a Střední Amerika 8. Jižní Amerika Zea mays Ipomoea batatas Phaseolus vulgaris Solanum tuberosum
Phaseolus vulgaris Prunus armeniaca
9
3. Centrální Asie Triticum aestivum
4. Blízký Východ Hordeum vulgare
Daucus carota Pisum sativum
Secale cereale Linum usitatissimum
Pyrus communis Juglans regia Malus sp.
Cucumis melo Ficus carica Vitis vinifera
Brassica oleracea Olea europea Lactuca sativa
Eleusine coracana Pisum sativum Sesamum indicum Coffea arabica (Zdroj: FRANKEL, BENNET, 1970)
Capsicum annuum Agave sisalana Cucurbita spp.
Lycopersicon lycopersicum Nicotiana tabacum Theobroma cacao Ananas comosa
Tab.2 Geografická centra dle Žukovského 1971 I. Čína - Japonsko II. Indonésie - Indočína III. Austrálie IV. Indie V. Střední Asie VI. Přední Asie
VII. Oblast Středozemního moře VIII. Afrika IX. Evropa a Sibiř X. Střední Amerika XI. Jižní Amerika XII. Severní Amerika
(Zdroj: BEDNÁŘ, VYHNÁNEK, 2004)
Na genovém základě se rostliny postupem času vyvinuly z planých do kulturních. Globálně hrozí vymizení přírodních genových zdrojů selekcemi a introdukcemi, a proto je nutné shromažďovat a dlouhodobě uchovávat materiál. Tento vývoj ale může být přínosem pro zahradnictví, protože se minimalizují rozdíly mezi oblastmi a požadavky rostlin. Z toho důvodu je možné pěstovat i nepůvodní druhy bez náročné péče. (FRANKEL, BENNETT, 1970) Genové zdroje v České republice shromažďují a uchovávají genové banky, přičemž musejí respektovat zákony č.148/2003 Sb., 114/1992 Sb. a další a mezinárodní smlouvy, zejména Úmluvu o biologické rozmanitosti z roku 1992 a Mezinárodní dohodu o genetických zdrojích rostlin z roku 1999. Koordinátorskou činnost zastává Výzkumný ústav rostlinné výroby Praha. Genobanky zajišťují ochranu plodin i planých druhů a poskytují informace o genetických zdrojích a jejich vzorky pro potřeby šlechtění, výzkumu, vědy a vzdělávání. (BEDNÁŘ, 2000, Národní program,21.3.2007 ) Vzhledem k suverenitě států nad svými přírodními zdroji je největší pozornost věnována materiálu domácího původu, starým odrůdám, krajovým formám a planým druhům. Vzorky se získávají sběratelskou činností, šlechtěním nebo výměnami se zahraničními genobankami. Tyto vzorky jsou shromažďovány do kolekcí podle rodů či druhů. Kolekce se dělí podle šíře působnosti na národní a mezinárodní kolekce a podle způsobu využití na základní, aktivní a pracovní. Česká republika zodpovídá za
10
mezinárodní databázi pšenice, lnu, ovsíku a trojštětu. Základní kolekci tvoří původní československé odrůdy a významné a ohrožené genové zdroje. Aktivní kolekce obsahuje veškeré genové zdroje. Pracovní kolekce se skládá ze vzorků s nedostatečným množstvím semen, kterým ještě nebylo přiděleno národní evidenční číslo. (BEDNÁŘ, 1997, Národní program, 21.3.2007)
2.1.2 Síly formující genetickou diverzitu Pokud by z nějakého důvodu nastala skutečnost, že populace by tvořili pouze homozygoti, nevedlo by to k evoluci a evoluce by neexistovala. Konstantní změny závisí pouze na nových druzích. Genetická populace je souhrnem alelických frekvencí všech genů v dané populaci a populace se tedy vyvíjí, pokud nastanou změny v jejich genech. Vzhledem k tomu, že změny v populacích, směřující ke genetické rozmanitosti, mají původ v změnách genetických frekvencích, je nutné pozorumět, jak se mohou tyto frekvence změnit. Primární příčiny změn jsou: mutace, migrace, rekombinace, výběr a drift. Každá z těchto příčin ovlivňuje diverzitu různou měrou. Mutace zvyšuje genetickou diverzitu, ale jen nepatrně, míra změn je velmi malá. Největší vliv na diverzitu má migrace, naopak drift ji snižuje, neboť vyvolává ztrátu alel. Rekombinace nepodporují vznik nové diverzity, ale vytváří nové kombinace v již existující populaci. Selekce pomáhá přežít schopným jedincům v prostředí, ale nelze jednoznačně říci, že zvyšuje nebo snižuje diverzitu. (DE VINCENTE at all, 2004)
2.1.3 Ochrana genetické diverzity Materiál se nadále dlouhodobě uchovává dvojím způsobem: metodou ex situ a in situ. •
Konzervace in situ znamená uchovávání vzorků na místě jejich původního výskytu, který umožňuje další vývoj v souladu s podmínkami prostředí.
11
•
Konzervací ex situ se uchovávají genetické zdroje mimo místa jejich původního výskytu, tzn. v polních kolekcích, semenných genových bankách a v in vitro kulturách (brambory).
V České republice jsou všechny kolekce uchovávány ex situ, na celém světě činí konzervace ex situ asi 90 % z celkového počtu 6,1 milionu vzorků. (Národní program, 21.3.2007, STEHNO, ŠKALOUD, 1998 in CHLOUPEK, 2000) Aby mohly být genetické zdroje identifikovány a plně využity, probíhá ve 2-3letých intervalech jejich hodnocení podle národních klasifikátorů a zařazení do evidence. Hodnocení provádějí všechna pracoviště Národního programu. Český informační systém evidence
genových
zdrojů
http://genbank.vurv.cz/genetic/resources/
EVIGEZ obsahuje
dostupný passportní
na údaje,
adrese které
jsou
univerzální pro všechny kolekce, popisné údaje získané hodnocením podle klasifikátorů, kterých je v současné době 34, a monitoring skladu genové banky. Klasifikátor určuje znaky pro celou kolekci, zatímco deskriptor u každého vzorku. U menších druhových kolekcích nejsou dostupné klasifikátory, tudíž probíhá hodnocení podle passportních deskriptorů. (BEDNÁŘ, 1997, Národní program, 21.3.2007, HON, 21.3.2007) V rámci uchovávání a ochrany genetických zdrojů je nutná spolupráce na mezinárodní úrovni. Tyto aktivity zajišťují mezinárodní instituce různými programy a úmluvami, na kterých se Česká republika podílí. Prvním impulzem bylo založení genové banky EUCARPIA. Genofondům zemědělských plodin se věnuje Mezinárodní rada pro genetické zdroje rostlin (IBPGR) se svou nástupnickou organizací Mezinárodním ústavem pro rostlinné genetické zdroje (IPGRI). S těmito institucemi úzce spolupracuje Organizace spojených národů pro zemědělství a výživu (FAO), která přijala v roce 1992 Úmluvu o biologické rozmanitosti. Evropský program spolupráce na úseku genetických zdrojů rostlin (ECP/GR) zajišťuje uchování a využití genetických zdrojů mnoha států Evropy. (SVITÁČKOVÁ, 2003, CHLOUPEK , 2000)
2.1.4 Důležitost genetické diverzity Pohled do minulosti nám umožňuje zvážit situace, které mohou nastat v důsledku nedostatečné ochrany diverzity rostlin. Ať už je to hladomor v Irsku v 19. století, 12
způsobený zničením poloviny úrody plísní bramborovou, neboť se pěstovalo jen několik genotypů brambor, nebo škody na úrodě způsobené listovým patogenem kukuřice (Helminthosporium maydis) v 70.letech v USA (VYHNÁNEK, 2008), vše s jistotou ukazuje, jak důležitou roli hraje biologická diverzita pro lidstvo. S každým vyhynutým druhem se snižuje rozmanitost přírody, což není příznivé ani pro genetický výkum, protože se vytrácí velice cenný materiál. Nárůst lidské populace v rozvojovém světě na straně jedné a zvyšující se nároky spotřebitelů na straně druhé kladou stále vyšší nároky na zemědělskou produkci. Jednou z možností, jak toto ustát a ještě kvalitňovat produkci, je zvyšování biologického potenciálu rostlin, a to např. efektivním využitím genových zdrojů a molekulárních markerů nebo genovými manipulacemi. (OVESNÁ at all, 2002) Šlechtěním nepříbuzných odrůd, neboli odrůd s větší genetickou diverzitou, a mapováním chorob, škůdců a jiných stresových faktorů, které ohrožují rostliny, lze předcházet mnoha problémům, které se týkají genetické diverzity. (CHLOUPEK, 2000)
2.2 Molekulární markery Molekulární markery jsou využívány pro své specifické vlastnosti v širokém spektru oborů, od obecných genetických studií přes konstrukci genových map až k vývoji DNA polí. Praktická aplikace molekulárních markerů již významně ovlivnila šlechtitelské postupy a stala se základním inovačním prvkem rovněž v oblasti semenářství. Specifické místo nalezly markery při kontrolách přítomnosti patogenních mikroorganismů v rostlinách i při sledování výskytu GMO (geneticky modifikovaných organismů). (KUČERA at all, 2002). V oblasti taxonomie a evoluční biologie přinášejí molekulární markery významné usnadnění výzkumu a poskytují informace, které by nebylo možno získat jiným způsobem. Jejich jedinečné vlastnosti umožňují stanovit míru genetického polymorfismu a hojně se využívají při studiu genetické diversity populací nebo souborů genových zdrojů. Velmi důležitý je ale správný výběr vhodného markeru podle toho, jaký je účel a cíl studie (rozdílné markery při analýzách cizosprašných nebo samosprašných druhů, rozsah
13
a použití souhranných vzorků DNA při studiích genetické variability, možnosti pracoviště, atd.). (KUČERA at all, 2002) Molekulární markery jsou molekuly, které identifikují přítomnost určitého genu a jím podmíněného znaku ve studovaném genotypu. Vymezují geny (cDNA, RFLP, EST markery) nebo proteiny (isozymové markery) nebo genomové DNA (RFLP, RAPD, mikrosatelitní markery) a nejsou ovlivňovány epistatickým působením nebo vlivy prostředí. Molekulární marker je vysoce polymorfní znak, který je snadno rozpoznatelný a není závislý na podmínkách vnějšího prostředí. Marker musí být lokalizován na stejném chromozómu v takové blízkosti od genu, na který se selektuje, aby se s ním společně přenášel do následující generace, crossing over se mezi nimi očekává jen výjimečně. Existují na bázi gelu nebo PCR (polymerázové řetězové reakci). Výskyt více vyhotovení jedné genetické struktury se nazývá polymorfismem. Ve šlechtění mají markery velký význam při tvorbě genetických map, selekci rostlin určitých genotypů a při identifikaci odrůd. Perspektivnější než proteinové markery se zdá využití markerů DNA, ale je to finančně náročnější. (CHLOUPEK, 2000, Molekulární markery, 6.5.2007)
1. Markery proteinů: Isoenzymy (Isozymy, Allozymy)- proteiny katalyzující základní biochemické reakce. Na základě různého elektrického náboje jsou jednotlivé alely rozděleny elektroforézou. (Molekulární markery, 6.5.2007) Vzhledem k nákladnosti se pro výzkum taxonomie neužívá.
2. DNA markery: RAPD markery (Random Amplified Polymorfic DNA)- je markerová technika, při které není zapotřebí sekvenování, je založena na bázi PCR. Jsou to krátké (asi 10 párů bazí) náhodné primerové sekvence k štěpení DNA a obecně ke zjišťování inserce nebo delece polymorfismu. Tato technika je jednoduchá, levná a rychlá, a protože jeden RADP primer může vyhledat více restrikčních míst, využívá se pro fylogenetická studia. Není vhodná pro srovnávací mapování. (Points on the Map, 6.5.2007)
14
Pomocí této metody lze vytvořit SCAR marker (Sequence Characterised Amplified Regions), sekvenci charakterizující amplifikovanou oblast. Určitými modifikacemi RAPD metody je DAF (DNA Amplification Fingerprinting) a RAMPO (Random Amplified Microsatelite Polymorphism). (VYHNÁNEK, 2008)
AFLP markery (Amplified Fragment Length Polymorphism)- pracuje na stejném principu jako RADP makery s tím rozdílem, že se skládá z dlouhých ( asi 15 párů bazí) fixovaných úseků a krátkých (2-4 bp) náhodných úseků. Dlouhé úseky primery stabilizují a krátké štěpí lokusy. Na konce fragmentů DNA se ligují adaptory, které fungují jako místo, kam se při PCR naváží AFLP primery. Díky detekci mnoha lokusů se využívá pro fingerprinting a opět se nedoporučuje pro srovnávací mapování. Vysoce spolehlivá metoda. (Points on the Map, 6.5.2007, Molekulární markery, 6.5.2007)
RFLP markery (Restriction Fragment Length Polymorphism)- DNA je specificky štěpena restrikčním enzymem na fragmenty. Z velkého množství fragmentů je část vizualizována hybridizací se značenou sondou, mohou být na základě genomu nebo cDNA. Technika je na bázi gelu a nevyžaduje sekvenování, ale je náročná na čas. Detekuje důsledně jednotlivé lokusy, proto je vhodná pro srovnávací mapování a QTL studie. Polymorfizmus je dán jako diference molekulární hmotnosti fragmentů. (Points on the Map, 6.5.2007, Molekulární markery, 6.5.2007)
STS markery (Sequence Tagged Site)- založený na bázi PCR detekuje jednoduché a jednotné znaky na genomu. Není zapotřebí klonů, ale informací o sekvencích. Primery o velikosti 18-20 párů bazí štěpí krátké, jednotné fragmenty DNA, jehož sekvence jsou známé. Polymorfismus je definován jako rozdíl ve velikosti štěpených produktů. Metoda se využívá pro mapování. (Points on the Map, 6.5.2007, Molekulární markery, 6.5.2007)
EST markery (Expressed Sequence Tag)- vytvořeny z částí sekvencí cDNA, většinou koncových, s 18-20 páry bazí. Detekují specifická místa na genomech a slouží k označení sekvence genů, nevyžadují klonování, ale je třeba informací o sekvencích. Metoda je
15
založena na PCR. Polymorfismus je závislý na velikosti štěpených produktů. (Points on the Map, 6.5.2007, Molekulární markery, 6.5.2007)
Mikrosatelitní markery (SSR-Simple Sequence Repeats, STR- Short Tandem Repeat, VNTR- Variable Number Tandem Repeat)- opakující se několika nukleotidové, 1-5 bp dlouhé sekvence, obklopené DNA. Odhalují variabilní místa na genomu a jsou vysoce specifické. Nutné je znát primery, které se objevují v genomu jen jednou. Jsou založeny na PCR. Doporučuje se pro mapování, QTL studie a fingerprinting. (Points on the Map, 6.5.2007, Molekulární markery, 6.5.2007) Mikrosatelity se nejčastěji vyskytující v nekódující oblasti genomu a jsou v něm relativně rovnoměrně zastoupeny. Mají kodominantní charakter, takže lze rozlišit heterozygoty. Tyto motivy 1 až 5 nukleotidů vykazují vysoký stupeň polymorfismu a velkou výhodou je, že vyžadují minimální množství DNA pro analýzu. (VYHNÁNEK, 2008) Pro molekulární fylogenetiku se nejvíce využívají RAPD markery, mikrosatelitní markery a AFLP markery.
2.3 Genetický polymorfismus Jak už zde bylo uvedeno, evoluce zavisí na výskytu změn v populaci. E.B. Ford, britský evoluční biolog, použil termín genetický polymorfismus pro výskyt více než jedné alely na lokusu. To znamená, že se vyskytují 2 a více alternativních fenotypů v populaci. Obvykle uvažujeme polymorfismus lokusu, pokud se druhá alela objevuje v populaci frekvencí 5 % (v některých případech uváděno 1 %) a více. Na začátku šedesátých let se vědci domnívali, že polymorfismus se vyskytuje jen u několika lokusů, po dalších výzkumech (např. Lewontin a Hubby 1966 na Drosophila pseudoobscura) se ale došlo k závěru, že genetický polymorfismus tvoří významnou část intrapopulační genetické variability. Genetická diverzita je tedy podmíněna existencí genetického polymorfismu. (TAMARIN, 1999, ŘEHOUT, 2003, DE VINCENTE at all, 2004, POSPÍŠKOVÁ, 2002)
16
Široký pojem genetického polymorfismu lze členit do několika oblastí podle objektu studia: •
polymorfismus DNA,
•
biochemický polymorfismus,
•
imunologický polymorfismus,
•
morfologický polymorfismus.
Každá genetická variabilita má svůj podklad ve variabilitě na úrovni DNA. To platí pro každou variabilitu detekovanou na fenotypové úrovni, i pro všechny výše zmiňované polymorfismy. Ve fenotypu se však projeví jen malá část variability DNA.(ŘEHOUT, 2003) Znaky genotypu jsou přirozeně dány v každé populaci, tyto znaky jsou však navíc ovlivněny prostředím. Potom je velice obtížné dohledat fenotypové rozdíly způsobené jednotlivými geny. Výsledků dosáhneme pouze za použití molekulárních technologií, jako jsou genetické markery. (DE VICENTE, 2004) Genetický polymorfismus je nejčastěji způsoben mutacemi, které se dají velmi dobře vysledovat metodami na úrovni DNA. Výhodou genetického polymorfismu na úrovni DNA je skutečnost, že rozdíly na této úrovni nejsou oproti morfologickým znakům ovlivněny podmínkami prostředí a jsou zdrojem obrovského počtu znaků. Další předností je možnost stanovit sestavu alel už během prvních stádií ontogeneze organismu.(POSPÍŠKOVÁ, 2002) Polymorfismus se má široké uplatnění. Využívá se při mapování genomu a stanovení vazby genů, při studiu evoluce druhů, ve fylogenetických studiích, v populační genetice, dále při diagnostice patogenů rostlin i živočichů, při šlechtění (čistota a pravost odrůd rostlin nebo rodičovství u plemenných zvířat). Metody k sledování polymorfismu se dělí na náhodné (RAPD) a lokusové (mikrosatelity). Podle zvýraznění polymorfismu cílového místa se člení na hybridizační (RFLP) a amplifikační (RAPD a mikrosatelity). Mikrosatelity mají mnohostranné využití při studiu DNA polymorfismu. Je to pravděpodobně z důvodu jejich vysoké variability spojené s rychlostí a spolehlivostí, se kterou lze informaci získat v laboratoři. Setkáváme se ale s problémem nedostatečné prozkoumanosti biologie a tzv.“životního cyklu“ mikrosatelitů, což způsobuje těžkosti při jejich zpracování (Chambers a Macavoy 2000 in POSPÍŠKOVÁ, 2002)
17
2.4 FYLOGENETIKA Fylogenetika zkoumá analytické metody rekonstrukce příbuzenských vztahů. Každá z mnoha konkurujících si fylogenetických hypotéz má podobu schématu příbuzeneckých vztahů, tedy fylogenetického stromu. (ZRZAVÝ, 2006) Předmětem jejího studia je fylogeneze, vznik a vývoj jednotlivých vývojových linií, kterou lze rozčlenit do dvou vzájemně se doplňujících aspektů: • kladogeneze – pořadí a způsob větvení všech vývojových linií v průběhu evoluce. • anageneze – vývoj jednotlivých vlastností organismů v rámci příslušných vývojových linií. (FLEGR, 2005) V procesu kladogeneze dochází k odvětvování jednotlivých linií organismu. Z jednoho druhu mateřského vzniknou v určitý okamžik dva nebo více druhů dceřinných. Něteré druhy mohou být v podstatě identické s mateřským, jiné se mohou lišit. Vzácnějším případem kladogeneze je splynutí dvou nezávislých linií v jednu, která se pak dále větví. Tento proces se nazývá syngeneze a může se tak dít buď vznikem nového druhu organismu integrací dvou nepříbuzných organismů, které žijí po určitou dobu v nějaké formě symbiózy (symbiogeneze), nebo náhodným zkřížení příslušníků dvou různých druhů (mezidruhová hybridizace). Kladogeneze by se bez anageneze neobešla, neboť anagenetické změny umožňují rozpoznat kladogenezi. Dochází ke změnám ve fenotypech příslušných druhů a tudíž je lze od sebe rozlišit. Pro znázornění kladogeneze, příp. fylogeneze se využívá grafu dendrogramu (stromu), viz dále. (FLEGR, 2005) Ve zkratce zahrnuje fylogenetická analýza čtyři kroky: • vytvoření datového modelu a vytříbení souboru dat • determinace náhradního modelu – nutno uvažovat odchylky sekvencí • vytvoření stromu • zhodnocení stromu. (NCBI, 20.3.2009)
18
2.4.1 Molekulární fylogenetika Molekulární fylogenetika od 90.let 20. století získala na důležitosti zejména v molekulární biologii a metodách konstrukcí fylogenetických stromů. S dalším vývojem technik v molekulární fylogenetice lze tvrdit, že molekulární biologie, genetika, evoluce, epidemiologie, ekologie, systematická biologie jsou pouze některými příklady z mnoha rozdílných oborů, kterých jsou metody a teorie molekulární fylogenetiky součástí. V podstatě jsou využívány konstrukce stromů pro výzkum hypotéz a modelů důležitých historických událostí v biologii a vztahů mezi organismy. Fylogenetika přináší přirozenou cestou velké množství cenných informací o evoluci. (NCBI, 20.3.2009) S rozvojem vědy se ve fylogenetice začaly používat molekulární znaky, které původně sloužily k výzkumu v biologii, biochemii nebo fyziologii. Molekulárními znaky jsou pořadí monomerů v řetězcích biopolymerů, případně chemické a fyzikální vlastnosti biopolymerů. Pomocí těchto znaků je možno ve fylogenetice rozpoznávat jednotlivé druhy organismů, třídit je či zjišťovat míru genealogické příbuznosti jedinců v rámci populace. Kromě jiných oborů, např. v ekologii, sociobiologii, se molekulární znaky využívají pro studium fylogenetiky a systematické biologie, tento samostatný obor se nazývá molekulární fylogenetika. Molekulární znaky mají ve srovnání s klasickými znaky mnoho výhod. Jako klasický znak si lze představit barvu květu a jako molekulární znak sekvenci určitého úseku DNA. V případě morfologických znaků je obtížné určit hranice mezi znaky nebo jde-li o jeden nebo více znaků. Molekulárních znaků je obrovské množství a zpravidla lze analýzu provést opakovaně, bez časového omezení, pouze s omezením finančním. Molekulární znaky nám usnadňují výzkum a nalézt výsledky, které by nebylo možno nalézt využitím morfologických znaků (příbuznost vzájemně nepodobných si organismů). Jsou to znaky kvalitativní, narozdíl od morfologických kvantitativních, takže se dají lépe popsat. Jelikož jde o genetické znaky, proto odrážejí společné znaky u dvou druhů jejich příbuznost, nikoliv podobnost způsobenou podmínkami vnějšího prostředí, které na ně působily. (FLEGR, 2005) I přes tyto výhody nejsou molekulární znaky využitelné pro studium anageneze. Dle názoru Doležalové a kol. „opomíjení klasické taxonomie a upředostňování, až
19
nadhodnocování molekulárních metod, uplatňované v posledních letech, může vést k zavádějícím výsledkům při použití takového materiálu pro vědecké účely. Navíc tento jednostranný přístup nedává přesný obraz odpovídající příbuzenským vztahům jednotlivých položek v rámci dané taxonomické skupiny.“ Závěrem lze tvrdit, že nejkomplexnější
výzkum
zahrnuje
jak
metody
klasické,
tak
molekulární.
(DOLEŽALOVÁ at all, 2002)
2.4.2 Molekulárněfylogenetické metody Molekulárněfylogenetické metody se rozčleňují do dvou skupin: jednolokusové a multilokusové metody. Jednolokusovou metodou je například sekvenování genu nebo analýza mikrosatelitů, kde se získávají
informace o genech nebo jejich prodkutech
kódovaných v jednotlivých lokusech. Naopak pomocí multilokusových metod získáváme data pro velké množství lokusů nebo pro celý genom (totilokusové metody), přičemž informace jednotlivých lokusů od sebe nelze ani dodatečně oddělit. Typickými multilokusovými metodami jsou DNA-fingerprinting a totilokusovou metodou je hybridizace DNA v roztoku. Bohužel se objevují některá rizika, která mají za důsledek rozdíly mezi topologií genového stromu (tj. fylogenetického stromu tvořeného na základě dat získaných v jednom lokusu) a topologií druhového stromu (tj. fylogenetického stromu pro druhy daného taxonu). Jedním z nebezpečí je, že v případě použití jednolokusových metod
bude
fylogenetický strom odrážet správně vývoj genu nacházejícího se v daném lokusu, ale nebude správně odrážet fylogenezi studovaného taxonu, což je zapříčiněné třeba mezidruhovým přenosem genu. Další riziko přináší možnost přenosu genového polymorfismu z mateřského druhu na dceřinný a následující nepravidelné rozdělení jednotlivých alel v průběhu dalších speciačních událostí. Jestliže totiž datujeme jednotlivé štěpné události pomocí molekulárněbiologických metod, mohou být některé časové odhady zatíženy chybou, neboť divergence alel časově předcházela odštěpení druhů a společný předek vykazoval v daném lokusu polymorfismus. Někdy přenos polymorfismu ovlivní časové odhady doby jednotlivých speciací, jindy i odhad pořadí 20
speciací. Konečně poslední příčinou rozdílu topologií stromu může být náhoda. Náhoda může způsobit, že alely, které se postupně odvětvovaly, se budou lišit různým počtem znaků. Tuto hrozbu lze snížit využitím některé z multilokusových metod. Pro účely širokého spektra vnitropopulačních studií, pro zastoupení homozygotů a heterozygotů v populaci jsou nejvhodnější jednolokusové metody. Některé molekulárně taxonomické metody získávání dat nám umožňují získat data znaková, jiná distanční. Znaková data přesně popisují určitý znak, např. výskyt určitého nukleotidu v daném genu nebo délka mikrosatelitu v určitém lokusu. Z toho vyplývá, že znaky jsou buď kvalitativní nebo kvantitativní. Distanční data nestanoví, jestli se organismy liší nebo ne, pouze umožňují odhadnout, v jak velkém počtu nebo procentu znaků se dva porovnávané organismy liší nebo naopak shodují. Mezi taková data patří např. střední teploty tání DNA heteroduplexů. Znaková data mají výhodu, že je vždy možné je převést na data distanční, opačně to nelze. Pro zpracování těchto dat slouží řada metod. Výhradně pro znaková data jsou to metody maximální parsimonie a maximální věrohodnosti. Distanční data se zpracovávají metodami UPGMA (Unweighted Pair Group Method with Arithmetic mean), Neighborjoining nebo metodou minimální evoluce. Jejich nevýhodou je, že se musí provést porovnání u n druhů n(n-1)/2 , zjistit vzdálenost jednoho druhu od druhého, na druhé straně jsou to výrazně jednodušší metody a jsou schopné ze vstupních znakových dat vypočíst distanční vzdálenosti. Pokud zjistíme počet společných znaků, můžeme spočítat míru vzájemné podobnosti jednotlivých studovaných organismů. Výše zmíněné metody poskytují data, dle kterých lze roztřídit organismy na základě podobnosti nebo příbuznosti. Těmito daty jsou indexy podobnosti (s – similarity index) a indexy genetické vzdálenosti (d – distance index). Z indexu genetické vzdálenosti je možné indexy podobnosti spočítat, a to pomocí jednoduchého vzorce s = 1 – d. Index genetických vzdáleností se ale musí pohybovat v intervalu 0-1. (FLEGR, 2004)
21
2.4.3 Dendrogramy Schéma, které vyjadřuje příbuzenské vztahy se nazývá strom (tree)
neboli
dendrogram. Strom tvoří systém postupně se odvětvujících čar, tzv. větví (branches), přičemž pořadí a místa větvení, tj. rozložení uzlů (nodes), odrážejí časovou posloupnost vzájemného odvětvování vývojových linií. Každá koncová větev označuje jeden druh. Větve vycházející z jednoho určitého uzlu znázorňují jednotlivé vývojové linie organismů. Druhy jedné vývojové linie (může být pouze jeden druh) se označují jako Operační taxonomická jednotka (Operational Taxonomic Unit, OTU). Kořen stromu (root) popisuje společného předka druhů, od kterých se ostatní větve odvětvují.
Obr.2 Příklad dendrogramu (Zdroj: NCBI, 20.3.2009)
Dendrogram vyjadřuje míru příbuznosti a podobnosti jednotlivých organismů. K vytvoření dendrogramu potřebujeme určité podmnožiny všech znaků, které jsou u druhu rozpoznatelné.
Schema kladogeneze vyjadřuje pouze pořadí odvětvování jednotlivých druhů (OTU) a nikoli jejich příbuznost, tzn. že délky větví v dendrogramu nehrají žádnou roli.
Kladogram se užívá pro označení stromů, které znázorňují rozložení ampomorfií (tj. evolučních novinek).
22
Fenogram (fenetický strom) vyjadřuje fenotypovou podobnost mezi organismy. Vytváří se na základě všech rozpoznatelných znaků. (FLEGR, 2005)
Fylogram (fylogenetický strom) zobrazuje historii evoluce druhu, tzn. příbuznost zkoumaných druhů. Jak už bylo zmíněno, molekulární fylogenetika poskytuje informace, které by nebylo možné zjistit jinou cestou, např. u nekompletních a nejasných záznamů o starých druzích. (TAMARIN, 1999)
Genealogický strom zobrazuje příbuznost a pořadí odvětvování jednotlivých linií pouze u jednoho druhu. Proces zkoumání se nazývá tokogeneze. (FLEGR, 2005)
2.4.4 Konstrukce dendrogramu Pro konstrukci dendrogramů slouží dva typy metod, a to metody znakové (character state methods) a metody vzdálenostní (distance matrix methods). Ať se použije jakékoliv metody, cílem je sestrojit jediný “nejlepší možný“ strom nebo pak vyhledat nejlepší z množiny všech možných dendrogramů. Vyhledávací metody jsou matematicky náročnější, ale na druhou stranu poskytují širokou škálu dendrogramů, což v případě problematických dat dovoluje vytvořit konsensus z několika nejlepších stromů. (CVRČKOVÁ, 2006) Pro sestavení dendrogramu přichází v úvahu mnoho metod a je k dispozici mnoho statistických programů. Výběr jedné z možností je závislý na dostupnosti programu a složitosti statistické metody. Nejrozšířenějšími jsou metody využívající algoritmy UPGMA a Neighbor-joining . Postup je u obou metod podobný, vypočtou se vzdálenosti mezi všemi dvojicemi sekvencí a sestrojí se matice vzdáleností. Ty nejbližší dvě sekvence se propojí prostřednictvím dvou větví a uzlu, což značí společného předka. Postupně se propojí všechny OTU a vznikne dendrogram. Metodou UPGMA vznikne dendrogram fenogram, Neighbor-joining produkuje fylogram. UPGMA (Unweighted Pair Group Method with Arithmetic mean, Sneath a Sokal 1973) je nejjednodušší metodou pro konstrukci stromu. Původně byla vyvinuta pro fenogramy, ale dá se využít i pro sestrojení fylogramu. Využívá sekvenční shlukový 23
algoritmus, ve kterém jsou topologické vztahy identifikovány na základě podobnosti. Postup je takový, že se nejprve naleznou mezi všemi OTU dva nejpodobnější a pak se s nimi zachází jako s novým OTU. Postupně tímto způsobem z celé skupiny OTU zbydou jen dva. Tato metoda je velice citlivá k evolučním datům nestejné váhy, což znamená, že díky mutaci za určitý čas může vzniknout špatná topologie stromu. (OPPERDOES, 17.3.2009) Neighbor-joining (Saitou a Nei 1987) metoda slouží pro konstrukci fylogramů. Je založena na matici vzdáleností a zohledňuje možnost nestejně rychlého vývoje organismů ve větvích. Tento algoritmus patří v současnosti mezi nejpoužívanější. Neighbor-joining algoritmus se používá pro metody vzdálenostní, bez ohledu na optimalizační kriterium. Dochází k vkládání větví mezi nejbližší (neboli nejizolovanější) sousedy a proces se opakuje, až dojde ke vzniku stromu. (BAXEVANIS, 2005) Dle studií při porovnání a hodnocení různých algoritmů byl tento shledán lepším než ostatní (např. Farrisova metoda, Sattathova a Tverského metoda, Liova metoda). (SAITOU, NEI, 1987) Protože se však výsledky z různých metod mohou do určité míry lišit, neboť nelze porovnávat výsledky, kde byly užity metody založené na jiných principech, je vhodné udělat více analýz, které pak budou mít lepší výpovědní kvalitu (např. pokud dendrogram strojený metodou maximální parsimonie vypadá jako kytice dlouhých větví spojených blízko u kořene, nebere se v úvahu, neboť uvedená metoda trpí tzv. artefakty z přitahování dlouhých větví). (CVRČKOVÁ, 2006) Dalšími metodami jsou Wardova metoda (Ward’s method) používá funkcionál kvality
rozkladu,
kritériem
pro
spojování
shluků
je
přírůstek
celkového
vnitroskupinového součtu čtverců odchylek pozorování od shlukového průměru. Wardova metoda má tenfenci odstraňovat malé shluky, tedy tvořit shluky zhruba shodné velikosti, což je často vítaná vlastnost. (HEBÁK, 2005) Complete linkage metoda, která vyhledává sobě podobné shluky. Single linkage metoda zastává shlukovou strategii “přátelé přátel“. Metoda Average linkage a McQuittova metoda se využívají postup obou výše zmíněných metod Complete linkage a Single linkage. Median linkage a Centroid linkage metody nevedou k monotónní míře vzdáleností, tudíž výsledné dendrogramy mohou být inversní, což se těžko interpretuje. (MURTAGH, 2009)
24
2.4.5 Test kvality dendrogramu Vytvořený dendrogram, nezávisle na algoritmu, který byl použit ke konstrukci, zobrazuje výsledky, přičemž nevíme, nakolik jsou důvěryhodné a správné pro jejich použití a prezentování. Je nutné otestovat, jaká úroveň je rozložení znaků mezi porovnávanými OTU ve kterých schématech a dále spolehlivost odhadnutých pořadí odvětvování druhů. Pro tyto testy slouží řada resamplingových metod (resampling = opakovaný výběr). Resamplingový test porovnává získaný výsledek s výsledky pseudovzorků, které jsou náhodně vytvořeny z výchozích dat. Tyto pseudovzorky jsou do určité míry „pokažené“ a porovnáním těchto výsledků s „nepokaženými“ výchozími daty se určí stupeň podpory pro náš výsledek. Nejběžnější z těchto testů je bootstrapping, jackknifing a OTUjackknifing. (CVRČKOVÁ, 2006, FLEGR, 2005) Bootstrapping (Bradley Efron, 1979) byl nejprve používán na zhodnocení opakovatelnosti dosažených výsledků, nyní interpretuje míru pravděpodobnosti pravdivých výsledků. (HILLIS, BULL, 1993) Test je založený na náhodném výběru z výchozích dat k tvorbě pseudovzorků. Jinými slovy, pokud máme například sekvenci DNA, vyberou se náhodné pozice úseků sekvencí, a to tolik, kolik mělo výchozí přiřazení pozic. V takovém získaném pseudovzorku jsou pozice z výchozího přiřazení promíchány a některé zastoupeny vícekrát, některé vůbec, zůstává však zachována identita OTU. Pseudovzorků musí být dostatečné, reprezentativní množství (500 - 1000 pseudovzorků). Z každého pseudovzorku se pak sestrojí dendrogram, vypočte se konsensus všech dendrogramů a porovnávají se uzly stromu získané na základě výchozích dat s uzly konsensuálního stromu. Bootstrappingová hodnota (bootstrap values, 0-100 %) značí, jak vysoká je podpora existence uzlu ve výchozích datech. Nízká bootstrappingová hodnota (pod 50 %) bývá způsobena malým množstvím výchozích dat, absencí fylogenetického signálu ve vstupních datech nebo existence konfliktu mezi dvěma protichůdnými signály (úsek vzniklý spojením genů s různou evoluční historií). Dále nelze porovnávat dendrogramy obsahující jiné počty druhů, množství OTU musí být stejné. Jackknifing (Maurice Quenouille, 1949) a OTU-jackknifing jsou dalšími metodami pro ověřování spolehlivosti stromů. Jsou vhodnější než bootstrapping pro
25
velké datové matice. (FARRIS at all, in SCHUBERT at all, 2000) Postup vytváření pseudovzorků je takový, že se vypustí určitý počet pozic z výchozího souboru dat nebo určitý počet druhů. Výpočet se dále provádí analogicky s předchozí metodou. (FLEGR, 2005)
2.5 Statistické analýzy 2.5.1 Shluková analýza Shluková analýza patří mezi statistické metody vícerozměrných analýz (multivariační analýzy), jejíž podstatou je vyhledat určité podmnožiny z celku. Jednotky v podmnožině by mezi sebou měly vykazovat co nejmenší odchylky a podmnožiny mezi sebou co největší. Shluková analýza je často označována jako taxonomická analýza, kde podmnožiny jsou identifikovány v rámci populace. Při vyhledávání těchto homogenních skupin nemusí být předem znám ani jejich počet, ani způsob jejich vymezení a doknce ani to, zda takové skupiny jednotek uvnitř zkoumaného souboru vůbec existují. (GARSON, 4.4.2009, MINAŘÍK, 1998) Postupy pro třídění jednotek lze klasifikovat z různých pohledů. Z hlediska znaků se rozlišují postupy pro kvantitativní nebo kvalitativní znaky, podle mohutnosti rozkládané množiny na vhodné pro malé nebo velké množiny objektů. Podle typu výpočetního algoritmu se dělí metody na hierarchické, paralelní a sekvenční, přičemž hierarchické se dále člení na aglomerativní a divizní. (KELBEL, ŠILHÁN, 4.4.2009, MINAŘÍK, 1998) Závažnou otázkou je posouzení, do jaké míry bylo v dané situaci při použití konkrétního algoritmu dosaženo cíle shlukové analýzy. Pro tento účel bylo navrženo několik kritérií (funkcionálů kvality rozkladu) např. Wardovo kritérium. Po výběru proměnných se rozhoduje o způsobu hodnocení vzdálenosti či podobnosti objektů. Pro data, ve kterých jsou proměnné zhruba na stejné úrovni lze použít Hemmingovu vzdálenost (city-block), Euclidian distance (Euklidovská vzdálenost) či Čebyševskou vzdálenost. Pro proměnné, mezi nimiž je mimořádně velký rozdíl, se bude počítat s tzv. Minkovského metrikou. Dále existují speciální postupy v případě chybějících údajů,
26
kromě standardních, jako je vynechání řádku, v němž údaj chybí či odhadu chybějící hodnoty. (HEBÁK, 2005) Nejpoužívanější je hierarchický postup, kde se na původní množině jednotek vytváří stále menší počet shluků tak, že se v každém kroku spojují nejbližší jednotky nebo shluky. Při dané volbě proměnných X1, X2,...Xn a při dané vzdálenosti D se budou výsledky uplatnění popsaného algoritmu lišit podle způsobu, jakým se hodnotí vzdálenost mezi shluky. Procedura končí vytvořením jediného shluku, zahrnujícího celou množinu objektů. Výsledné grafické znázornění se nazývá tzv. hierarchický strom neboli dendrogram.
Každý
uzel
dendrogramu
představuje
shluk.
Horizontální
řez
dendrogramem představuje rozklady ze shlukovací sekvence, vertikální směr vzdálenost mezi shluky. (KELBEL, ŠILHÁN, 4.4.2009, MINAŘÍK, 1998)
2.5.2 Koeficienty podobnosti Multivariační analýzy se používají pro výpočet podobnosti jednotek, tedy organismů nebo druhů a odrůd. Při poměřování vzdálenosti mají dva podobní jednotlivci minimální hodnotu vzdálenosti a maximální hodnotu podobnosti, takže je vzálenost podobnosti nepřímo úměrná. Pro stanovení míry podobnosti srovnávaných vzorků na základě získaných binárních dat byla navržena řada párových genetických indexů (koeficientů) vycházejících převážně z údajů o shodě nebo rozdílech ve výskytu (přítomnosti nebo nepřítomnosti) určitého fragmentu DNA (alely). Obecně lze rozdělit párové genetické indexy, tj. koeficienty, na koeficienty, které kalkulují s hodnotami vyjadřujícími nepřítomnost určitého fragmentu u obou vzorků a na výpočetní postupy ignorující případy shody v absenci příslušného markeru. (KUČERA et al., 2002, DE VICENTE, 2004) Nejpoužívanějšími koeficienty jsou Jaccard J (1900, 1901, 1908), Dice D (1945), Nei-Li NL (1979) a Simple Matching SM (1958). Jaccard koeficient ( Jaccard, 1908) a/(a+b+c) Jaccardův koeficient počítá pouze bandy prezentované pro každého jedince. Dvojité absence jsou považovány za chybějící údaje. Pokud se objeví false-negative a false27
positive data, odhad tendence indexem bude zkreslený. Jaccardův koeficient může být použit s kodominantními markerovými daty.
Simple matching koeficient ( Sokal and Michener, 1958) (a+d)/(a+b+c+d) Simple Matching koeficient je užíván s dominantími markery (RAPD a AFLP), protože absence odpovídá homozygotnímu lokusu a mohla by odpovídat recesivnímu homozygotu.
Nei-Li koeficient (Nei and Li, 1979) or Dice (Dice, 1945) 2a/(2a+b+c) Oba koeficienty mají stejnou výpočetní rovnici. Koeficient počítá procento sdílených bandů u dvou jedinců a dává větší váhu těm, které se vyskytují u obou jedinců. To znamená, že absence má menší biologickou hodnotu, a také se tento koeficient uplatňuje u pojmů DNA podobnosti. Může být použit s kodominantními markery (RFLP, SSR) (DE VICENTE, 2004)
Tab.3: Příklady koeficientů podobnosti Autor Jaccard Dice, Nei-Li Sokal and Michener Russel and Rao Simpson Braun-Blanquet Ochiai Kulczynski 2 Sokal and Sneath 5 Kulczynski 1 Rogers and Tanimoto Sokal and Sneath 1 Sokal and Sneath 3
Vyjádření a/(a+b+c) a/[a+(b+c)/2] (a+d)/n a/n a/min[(a+b),(a+c)] a/max[(a+b),(a+c)] a/[(a+b)(a+c)]½ (a/2)([1/(a+b)]+[1/(a+c)]) a/[a+2(b+c)] a/(b+c) (a+d)/[a+d+2(b+c)] (a+d)/[a+d+(b+c)/2] (a+d)/(b+c)
* pokud a=3, b=1, c=3, d=2.
2.5.3 Mantelův test
28
Příklad hodnoty koeficientu* 0,429 0,600 0,556 0,333 0,750 0,500 0,612 0,625 0,273 0,750 0,385 0,714 1,250
Mantelův test je statistický test pro korelaci mezi dvěma maticemi. Byl vytvořen Nathanem Mantelem na základě výzkumů v medicíně. Jedna matice může obsahovat například odhady genetických vzdáleností mezi všemi dvojicemi druhů, zatímco jiná matice obsahuje vzdálenosti mezi každým druhem a ostatními druhy. Pokud jsou matice symetrické, tzn. vzdálenost bodu a do bodu b je stejná jako z bodu b do bodu a obsahuje taková matice n(n-1)/2 vzdáleností. (MANTEL, 1967, Mantel test, 29.4.2009)
2.6 FreeTree Program Program FreeTree byl původně vytvořen pro analýzy výsledků metod DNA fingerprinting (RFLP, RAPD) nebo jiných metod poskytujících binární charakter dat (přítomnost nebo nepřítomnost znaku). V porovnání s ostatními softwary má FreeTree výhodu, že poskytuje hodnocení topologie stromů bootstrap, jackknife nebo OTUjackknife analýzou. (PAVLÍČEK at all, 1999 in HAMPL, PAVLÍČEK, FLEGR, 2001) Pro taková binární data tento program počítá vzdálenost matice, konstruuje fenetické a fylogenetické stromy a počítá bootstrapping a jackknifing hodnoty pro vnitřní větve stromu. Program FreeTree může být také použit na analýzy dat získaných ve dvou nebo více nezávislých experimentech neidentických podmnožin taxonu a také pro konstrukci stromů na základě frekvenčních dat (např. izoenzymové analýzy). Nicméně pro frekvenční data není program schopen testovat spolehlivost stromů. (HAMPL, PAVLÍČEK, FLEGR, 2001) Program FreeTree byl speciálně vytvořen pro účely biologie a taxonomie. Je určen pro operační systém Windows a je schopný zpracovávat poměrně velké množství dat a rozsáhlé soubory. (HAMPL, PAVLÍČEK, FLEGR, 2001) Program i manuál jsou volně ke stahnutí na adrese http://www.natur.cuni.cz/flegr/programs/freetree/ nebo v .zip formátu na adrese http://ijs.sgmjournals.org/content/vol51/issue3/ . Doplňkový program TreeView slouží k lepšímu grafickému zobrazení stromů. Pro zpracování dat RFLP a RAPD lze použít dvě metody, a to UPGMA nebo Neighborjoining, k dispozici je 16 koeficientů podobnosti.
29
2.7 NTSYSpc NTSYSpc (Numerical Taxonomic System) podporovaný opět operačním systémem Windows, je statistický program, který se užívá k odhalení struktur v multivariačních datech. Byl vytvořen v 60.letech minulého století, ale od té doby byl kompletně zrenovován pro vhodnější použití na dnešní počítačové technice. Je dostupný za poplatek. Pokud data pocházejí ze dvou či více rozdílných populací nebo je cílem odhadnout fylogenetický strom za použití UPGMA nebo neighborjoining metody pro sestavení dendrogramu, v obou případech se zjistí, že jednotky v některých podmnožinách proměnné jsou vysoce shloučené (clustered). K roztřídění těchto jednotek podmnožin pomůže NTSYSpc. Transformuje data, odhaduje ne/podobnost mezi objekty a připravuje shrnutí vztahů za použití shlukové analýzy, utřídění znaků a monohofaktorové analýzy. Výsledky mohou být zobrazovány jak číselně, tak graficky. Jazyk programu je jednoduchý, obvykle užívaný v analýzách podobnosti. Dále je umožněno zpracovávat rozsáhlé datové soubory a nazývat je dlouhými názvy. Soubry jsou ukládány jako ASCll soubory, tudíž mohou být sdíleny s jinými programy. Je možné využít další funkce, jako např. názvy, barvy, barvy pozadí, velikosti, stupnice,... (ROHLF, 2009)
2.8 R-project R je jazyk a program pro zpracování statistických výpočtů a jejich grafickou prezentaci. Software přizpůsobený pro Windows, UNIX a MacOS je volně ke stažení na webové adrese http://www.r-project.org/. R je programovací jazyk, považovaný za implementaci S jazyka, jehož charakteristika je uvedena ve čtyřech knihách od Johna Chamberse a kolegů. Základní informace o R jazyce lze dohledat v knihách Richarda A. Beckera, Johna Chamberse a Allana R. Wilkse. R-project je vyvinutý pro matematické a statistické operace, ne primárně pro oblast biologie či genetiky. Tím se program jeví složitější, neboť obsahuje mnoho funkcí. Je to ucelený systém nástrojů, který je neustále inovován a rozvíjen, převážně o balíčky funkcí (packages).
30
Tato integrovaná sada softwaru pro manipulaci dat, výpočet a zobrazení zahrnuje: •
efektivní zpracování dat a jejich ukládání
•
sadu operátorů pro výpočty matic
•
grafické zařízení pro analýzu dat a zobrazování jak na obrazovce tak pro tisk
•
dobře vyvinutý a jednoduchý programovací jazyk. (GENTLEMAN et al., 2009)
Vhodné je používat R-project s GUI (Graphical User Interface), protože práce s programem je potom přehlednější a jednodušší. GUI zahrnuje několik projektů, které se nainstalují. Zvláště pro biologii jsou to projekty R Commander, SciViews-R, JGR, RKward a Brodgar. (GROSJEAN, 15.4.2009) R commander okno se skládá z několika menu a informačních polí, skript a výstupního okna. Menu jsou snadno konfigurovatelné přes textový soubor nebo lépe přes plug-in balíčky. Nově vložená data mají svůj aktivní data set. V okně zpráv se objevují error zprávy, varování a poznámky k právě probíhající analýze. Při instalaci balíčku R commander jsou instalovány další nezbytné balíčky, pokud je počítač v online režimu. (FOX, 15.4.2009)
2.9.Prunus armeniaca – Meruňka Tradiční metody založené na pomologických a fenotypických deskriptorech neposkytují dostačující informace k vysledování expanzí meruněk z místa původu. K tomuto účelu se ukázala nejlepší cesta pomocí molekulárních markerů. Izoenzymy značí nízký stupeň polymorfismu, nicméně se uplatnily při identifikacích genotypů a zařazování kultivarů do skupin původu. DNA markery poskytují nové možnosti pro hodnocení genetické diverzity. V současné době se velice často využívají SSR markery a mikrosatelity, které jsou vysoce polymorfické a nezávislé na prostředí, ačkoli RAPD, RFLP a AFLP markery byly úspěšně uplatněny ve výzkumu meruněk. První mikrosatelitní studie meruněk využívaly několik sad primerů získané převážně z broskví a jiných druhů Prunus (Cipriani at al., 1999, Testolin at al., 2000, Aranzana at al., 2002, Wang at al., 2002). Nyní bylo vyvinuto několik sad primerů na základě informací sekvence meruněk (Lopes
31
at al., 2002, Hagen at al., 2004, Messina at al., 2004) a práce vědců se soustředí na další. (PEDRYC at al., 2009)
2.9.1 Systematika meruněk Meruňka (Prunus armeiaca L., syn. Armeniaca vulgaris Lam.) patří do čeledi Rosaceae a podčeledi Prunoideae. Rod Armeniaca zahrnuje okolo 12 druhů, z nichž ovocnářsky významné jsou kromě Prunus armeniaca Prunus sibirica Lam., pocházející z východní Sibiře, Mongolska a Číny, je velmi odolná mrazu a suchu. Dalším druhem je Prunus mandshurica Max.Kost., pocházející z dálného východu Ruska, Mongolska a Číny, bujného vzrůstu a používá se jako mrazu a suchu odolná podnož. Prunus mume Sieb.Kost. pochází z Japonska, je odolná k houbových chorobám napadající kořeny. Prunus ansu Max.Kost. je ovocnářsky významná v Číně a Japonsku a je zdrojem odolnosti k patogenu Clasterosporium carphophyllum. Prunus dasycarpa Ehrh., přírodní kříženec mezi P.armeniaca a P.cerasifera. Často je meruňka rozdělována do čtyř geotypů: occidentalis, orientalis, caucasica a chinensis. V České republice jsou nejvíce pěstovány odrůdy typu occidentalis. Meruňky se z pěstitelského hlediska řadí mezi krátkověké ovocné druhy, dožívající se 25 let (pro ekonomické účely). Jsou to diploidní rostliny 2n = 16, většina odrůd je samosprašných, některé mohou být ale částečně samosprašné jako odrůda Veecot, Lejuna, Leskora, nebo cizosprašné, např. Orangered. Potom je nutná kombinace odrůd ve výsadbě. Meruňka je velice odolná k mrazu, ale pouze v období dormance, snesou až 25ºC. Vlastní květ snese až -3,5ºC, plod pouze 0,6-1,0ºC v závislosti na odrůdě.. (NEČAS, 2004)
2.9.2 Původ a genová centra meruněk Čína a Centrální Asie (od Ťan-Šanu po Kašmír) jsou dvě původní genová centra meruněk. Blízký Východ (Írán, Kavkaz a Turecko) a Korezmská oblast (Uzbekistán) byly určeny jako sekundární centrum původu (Vavilov, 1951). Systém (Kostina 1969)
32
rozčleňuje kultivary meruněk do čtyř hlavních geografických skupin: Centrální Asie, Irán-Kavkaz, Evropa a Džungarský Ala Tau. Iránsko-kavkazské a Centrálně asijské skupiny vykazují bohatou variabilitu, ostatní jsou spíše méně rozmanité. (PEDRYC at al., 2009) Meruňky se z původního genového centra Číny a Centrální Asie rozšířily do Střední a Západní Asie a odtud do ostatních světadílů. Záznamy o pěstování meruněk v Číně pochází z roku 2198 př.n.l. z období císaře Yü, ale nálezy pecek potvrzují výskyt meruněk již 6000 let př.n.l. V Evropě se meruňky objevily nejdříve v Řecku a Itálii asi 100 let před Kr., ve Francii až v 15. století a ve Španělsku v 17. století. Jedna cesta vedla přes Indii, Kavkaz, Arménii a Irán, druhá, tzv. severní cesta, vedla přes střední Asii do Turecka, k Černému moři a dále do východní Evropy. V 17. století se meruňky dostaly také na africký a americký kontinent. Největšího rozmach dosáhlo pěstování meruněk až na počátku 20. století. (VACHŮN, 1999, NEČAS, 2004) Z pomologického hlediska se setkáváme s dalším členěním meruněk. Dle souhrnu jejich biologických, morfologických a hospodářských vlastností s důrazem na geografický původ řadíme odrůdy do následujících skupin: •
středoasijské – Čína, Afghanistán, Pákistán, sev. Indie
•
íránsko-kavkazské – Gruzie, Arménie, Ázerbajdžán, Sýrie, Turecko
•
evropské – již. Evropa, USA, jižní Afrika, Austrálie
•
džungarsko-zailijské – Kazachstán, severozápadní Čína, Alma-Ata
•
mandžursko-sibiřské – odrůdy Mičurina, Zabajkalska a Dálného Východu (NEČAS, 2004)
Do České republiky se rozšířily třemi pravděpodobnými cestami, a to přes Moldávii, Rumunsko a Maďarsko, nebo přes Itálii a Rakousko, nebo přes Francii a Německo. Broskvoně se u nás vyskytovaly mnohem dříve než meruňky, již v 9. století. První písemné zmínky o pěstování meruněk pocházejí z 15. století. Mathiolli se ve svém Herbáři z roku 1563 zmiňuje o meruňkách, jejich popisech, použití a účincích. V roce 1627 byla údajně známá odrůda Bohutická. Meruňkové odrůdy jsou dobře introdukovány jen v menších regionech, proto se v našich podmínkách neuplatnily všechny introdukované odrůdy. V roce 1922 byla vysázena kolekce 25 odrůd ve Státní ovocné
33
školce ve Velkých Pavlovicích. V 60. letech byly získány nové zdroje ze Střední Asie a z Číny. Zahradnická fakulta Mendelovy zemědělské a lesnické univerzity se již dlouhá léta zabývá šlechtěním meruněk. Program šlechtění zčásti navazuje na křížení v zahraničí prof. F. Houghem z USA. V rámci tohoto programu vznikala od roku 1962 kolekce zahrnující 71 odrůd meruněk. Meruňky se šlechtily ještě na dalších dvou místech, dnešní Seva-Flora ve Valticích a VŠÚO Holovousy. Z prvních výsledků byly vyšlechtěny dvě odrůdy ‘Karola‘ a ‘Kráska’. (VACHŮN, 1999, KRŠKA et al., 10.4.2009)
2.10 Vitis vinifera - Réva vinná 2.10.1 Systematika révy Z paleontologických objevů je zřejmé, že révovité rostliny vyrůstaly v nejrůznějších oblastech naší planety a jejich morfologické a fyziologické vlastnosti se utvářely pod vlivem různých stanovištních podmínek. V období svého přirozeného vývoje podléhaly révovité rostliny přirodnímu výběru jedinců na četných stanovištích. Postupně se vytvořilo několik druhů rodu Vitis, adaptovaných k určitým ekologickým podmínkám. Rod Vitis L., patřící do čeledi Vitaceae Juss., dělíme na dva podrody Muscadinia a Euvitis. Muscadinia má jen dva druhy Vitis rotundifolia Michx. a Vitis munsoniana Simps. a tvoří přechod mezi rody Vitis a Ampelopsis. Od ostatních druhů Vitis se liší mimo jiné tím, že v jednoletých vyzrálých výhonech je dřeňový výlec nepřerušovaný přepážkami a má vyšší počet chromozómů (2n = 40). Podrod Euvitis (2n = 38) má asi 70 druhů, které pocházejí ze tří areálů rozšíření. Většina druhů používaných ve vinohradnictví pochází ze Severní Ameriky – americké, velmi bohatá skupina z Asie – asijské a pouze jediný druh z Evropy – evropské. Mezi významné americké druhy patří např. Vitis aestivalis Michx., Vitis labrusca L., Vitis cordifolia Michx., Vitis cinerea Engelm., Vitis berlandieri Planch., Vitis riparia Michx. a Vitis rupestris Scheele. Do asijské skupiny je zařazeno přes 40 druhů jako Vitis thunbergii Sieb., Vitis romaneti Rom du Gail., Vitis wilsonae Weitch. a Vitis amurensis Ruprecht.
34
Evropská réva má botanický název Vitis vinifera L. Tento druh má dva poddruhy Vitis vinifera ssp. silvestris Gmel, který se dále rozděluje na tři sortotypy Vitis silvestris typica, Vitis silvestris aberans a Vitis silvestris balcanica, a Vitis vinifera ssp. sativa D.C, ze které vzniklo šlechtěním velké množství odrůd. (PAVLOUŠEK, 1999, KRAUS et al., 2004)
2.10.2 Původ a genová centra révy Předpokládá se, že se Vitis vinifera L. objevila v Eurasii již před 65 miliony let. První dochovaný důkaz o produkci vína byl objeven v Iránu v Hajji Firuz Tepe asi před 74007000 lety. Semena z domestikovaných hroznů byla nalezena v Gruzii a Turecku před 8000 lety. Nicméně i v Evropě byly nalezeny semena v době bronzové, přesněji ve Francii. Z těchto primárních center původu došlo k šíření révy do Egypta a Dolní Mezopotámie (před 5000 lety) a pak následovalo rozptýlení kolem Středomoří po hlavních civilizacích té doby jako jsou Asyřané, Féničané, Řekové, Římané, Etruskové, Kartáginci, atd. Pod vlivem Římanů se réva dostala do oblastí Německa a byli to právě Římané, kdo začal dávat odrůdám jména. Do Číny a Japonska se réva rozšířila asi před 3200 lety. Ve středověku docházelo k další introdukci révy do islámských zemí a do Ameriky. V 19.století se réva dostala do Austálie, na Nový Zéland a do jižní Afriky. V posledních 50 letech dochází ke snižování biologické diverzity u révy. Odrůdy jako Chardonnay, Cabernet Sauvignon, Shiraz a Merlot se pěstují na obrovských rozlohách a jsou nejpoptávanějšími víny, z toho důvodu zanikají staré lokální odrůdy nebo plané druhy. Dnešní diverzita révy byla utvářena po dlouhou historii. Několik tisíc existujících kultivarů zahrnuje ale většinu v germplasmových kolekcích. (THIS, 2006) Americké druhy révy vinné mají centra původu od jižní části USA a Mexika, přes východ USA, až po sever území USA a Kanadu. Význam těchto druhů neustále stoupá, neboť jsou nositeli rezistence proti houbovým chorobám a révokazu. Výzkum asijských druhů prbíhá velmi pomalu. Převážná většina se vyskytuje v tropických oblastech a mají jen velmi nízkou rezistenci vůči révokazu, houbovým
35
chorobám a mrazu. Vitis amurensis Ruprecht. Pochází z povodí řeky Amur a vyskytuje se i v Číně a Koreji. Ostatní pocházejí z oblastí Centrální Asie a Blízkého východu. Nejpoužívanější klasifikaci druhu révy evropské Vitis vinifera L. vytvořil Negrul (1946). Rozděluje odrůdy do geograficko-ekologických skupin podle místa vzniku, podle morfologických a biologických vlastností: •
západní Proles occidentalis – pochází z ní většina v současnosti pěstovaných odrůd
•
černomořská Proles pontica – podskupina balkánská a podskupina gruzínská
•
východní Proles orientalis – podskupina kaspická (Subproles caspica) a podskupina maloasijská (Subproles antasiatica) – Chrupka. (PAVLOUŠEK, 1999, KRAUS et al., 2004)
Na Zahradnické fakultě v Lednici jsou v rámci Národního programu konzervace a využití genových zdrojů rostlin udržovány kolekce révy vinné a dalších druhů. V roce 2001 obsahovala kolekce révy vinné 362 položek, jejíž počet stále stoupá. Výsadby jsou umístěny na pracovišti Mendeleum a na pokusné parcele Ústavu ovocnictví a vinohradnictví. Každý genový zdroj je udržován v počtu 15 keřů. Nejvyšší zastoupení podle zemí původu má Moldávie, dále Česká republika a Německo. Kolekce obsahuje odrůdy podnožové révy, odrůdy Vitis vinifera L. a interspecifické odrůdy, tzn. mezidruhové křížence evropské révy s americkými nebo asijskými.(PIDRA, 2002)
36
3. METODIKA 3.1 Testovaný materiál Pro analýzu byla použita data RAPD a SSR (mikrosatelitů) meruněk a révy vinné. Viz Příloha 1: Tab. 1 Vstupní data RAPD meruňky Tab. 2 Vstupní data SSR meruňky Tab. 3 Vstupní data RAPD réva vinná
Původ jednotlivých odrůd meruněk a révy vinné: Tab.4: Tabulka původu odrůd meruněk Odrůda Původ Achrori SUN Lasgerdi Mashed IRQ Lunik SUN Salah Gvardejskij Hargrand CAN C4 R8 T22 USA Priusadebnyj Moi Chua Sin CHN Arzami Aromatnyj MDA In Bej Sin CHN Cina CHN Narjadnyj SUN Madarska HUN Kec Psar SUN Abu Talibu Churmai Hasan Bey Mulla Sadik Chuan Zhi Gong CHN Liaonig CHN Kabasi TUR Saman Hong CHN Zdroj: EVIGEZ, 29.4.2009 Pozn. U odrůd označených “ - “ není původ znám.
37
Tab.5: Tabulka původu odrůd révy vinné Stát původu CSK CSK FRA
Odrůda Ariana Cabernet Moravia Petit Cabernet Blaufrankish Merlot noir Portugais Bleu Neronet Pinot noir St.Laurent Zweigelt blau Arkadia Diamant Chasselas blanc Chasselas rose Julski biser Olšava Panonia Kincse Pola Vitra Amos Kober 5BB SO - 4 Craciunel Teleki 5C 125 AA LE - K/1
Odrůda Zkratka Aurelius AU Děvín DV Pinot Chardonay CHR Irsai Oliver Muscotaly IO HUN Kerner KR DEU Lena LN CZE Malverina ML CZE Muscat Moravia MM CSK Muscat Ottonel MO FRA Riesling Silvaner MT DEU Neuburger blanc NEU AUT Pálava PA CSK Pinot blanc RB FRA Pinot gris RŠ FRA Riesling blanc RR FRA Riesling Italico RV FRA Sauvignon blanc SA FRA Gruner Silvaner SZ DEU Traminer rot TČ ITA Veltliner VČR AUT Gruner Veltliner VZ AUT Veritas VER CSK Agni AG CZE Alibernet AL SUN André AN CSK Zdroj: EVIGEZ, 29.4.2009, PAVLOUŠEK, 1999
Zkratka ARN
Stát původu CZE
CM CS FR MR MP NR RM SV ZW AR DA CHB CHČ JB OL PK PO VT AM 5BB SO4 CR 5C AA LE
CZE FRA AUT FRA AUT CSK FRA FRA AUT UKR CSK EGY EGY BGR CSK HUN CZE CZE CZE AUT DEU RUM HUN AUT CSK
3.2 Použitý software Pro zhodnocení dat byly použity tři programy: FreeTree, NTSYSpc a R-project.
1. FreeTree: autoři Adam Pavlíček and Jaroslav Flégr, Přírodovědecká fakulta, Karlova
univerzita,
Praha,
Česká
republika,
1998.
Dostupné
na
http://www.natur.cuni.cz/flegr/programs/freetree/. 2. TreeView: současná verze 1.6.6 Win 32 (Windows 95 a Windows NT), 3. září 2001, autor: Roderic D. M. Page, Division of environmental and evolutionary
38
biology, Institute of biomedical and life sciences, University of Glasgow, Glasgow, UK. Dostupné na http://taxonomy.zoology.gla.ac.uk/rod/treeview.html. 3. NTSYSpc: verze 2.2 pro Windows, NT/2000/XP&Vista 4. NTedit: verze 5.5 pro Windows, 2004 5. R-project: r verze 2.8.0 pro Windows 2009 Copyright (C) the R Foundation, autoři: John Chambers, Robert Gentleman a Ross Ihaka, 1997. Dostupné z http://www.r-project.org/. 6. R commander: verze 1.4-5 pro Windows 2008, autor John Fox. Dostupné z http://socserv.mcmaster.ca/jfox/Misc/Rcmdr/.
3.3 Použité metody a koeficienty 1. FreeTree:
metoda UPGMA koeficienty Jaccard, Nei-Li/Dice, Sokal and Sneath 1/Anderbeg, Sokal and Sneath 3, Ochiai, Reynolds, Rogers
2. NTSYSpc:
metoda UPGMA koeficienty Jaccard, Dice, Hamman, Simple Matching, UN 1, UN 3, Ochiai, Russel and Rao, Rogers and Tanimoto
3. R-project:
metody Ward’s method, Single linkage, Complete linkage, Average linkage, McQuitty method, Median linkage a Centroid linkage
3.4 Metodika programu FreeTree Program FreeTree je velice přehledný a jednoduchý program pro zpracování genetických dat a vytváření dendrogramů. Umožňuje vkládání dat pomocí Excelu. Pro analýzu dat si lze vybrat metodu UPGMA nebo neighbor-joining a ze šestnácti koeficientů podobnosti. Binární matice je zanalyzována, vzdálenosti mezi OTU se vloží do programu TreeView, který zobrazí výsledný dendrogram.
39
Postup: 1. Příprava dat: Data vložena do Excelu v tabulce viz Tab. 4. 2. Vložení dat: V programu FreeTree si otevřeme ve File New analysis, tabulku z Excelu pouze zkopírujeme, takže máme data v .xls formátu a vložíme do tabulky ve FreeTree. 3. Analýza dat: V části Distance/similarity matrix si zvolíme metodu analýzy UPGMA nebo neighbor-joining a koeficient podobnosti. Tuto matici si ukládáme do Excelu pro další použití v programu NTSYSpc pro Mantelův test. V dalším kroku v Reference tree dostaneme číselné vyjádření vzdáleností OTU, které ale musíme zobrazit v TreeView. Tento číselný dendrogram zkopírujeme a vložíme do Poznámkového bloku a uložíme v .txt formátu. 4. Zobrazení dendrogramu: Otevřeme program TreeView, ve File klikneme na Open a otevřeme uložený číselný dendrogram z Poznámkového bloku. Zobrazí se nám dendrogramy – radiální strom, kladogram, fylogram. Uložíme je ve formátu .emf.
Příloha 2: příklad dat pro vložení do programu FreeTree
40
Gvardejskij C4 R8 T22 Liaonig Hargrand Salah Hasan Bey Chuan Zhi Gong Cina Moi Chua Sin Achrori Lasgerdi Mashed In Bej Sin Priusadebnyj Abu Talibu Saman Hong Kabasi Lunik Mulla Sadik Churmai Kec Psar Arzami Aromatnyj Madarska Narjadnyj
Obr. 3: Výchozí dendrogram programu FreeTree
3.5 Metodika programu NTSYSpc Program NTSYSpc je kvalitně zpracovaný program, jehož součástí je funkce Mantelova testu pro zhodnocení koeficientů použitých při analýze dat. Celý postup probíhá v několika krocích, důležitá je příprava dat, poté je postup velice jednoduchý a srozumitelný. Program zahrnuje pět metod pro analýzu, včetně UPGMA a neighborjoining a možnost využití šestnácti koeficientů. V manuálu je vysvětleno, kde a pro jaká data by se měl který koeficient použít. Mantelův test porovnává
41
Postup: 1. Příprava dat: Tabulka ve formátu .xls musí mít speciální formu, viz Tab. 5. Důležité je v prvním řádku napsat název tabulky, druhý řádek může zůstat volný, ve třetím řádku v první buňce je počet matic, ve druhé buňce je počet řádků, ve třetí počet sloupců matice a ve čtvrté je počet chybějících buněk. 2. Vložení dat: Data lze vložit dvěma způsoby. Formát .xls je nutno předělat na formát .nts. Prvním způsobem si otevřeme program NTedit, je nutné opět vyplnit počet řádků, počet sloupců, chybějící buňky, počet matic a typ matice. Ve File klikneme na Open file in grind a otevřeme excelový soubor. Tuto matici uložíme ve formátu .nts. Druhá možnost je vložení dat přímo do programu NTSYSpc. V Output&transf. zvolíme možnost Standardization a vložíme data formátu .xls a přetvoříme na formát .nts. 3. Analýza dat: Otevřeme program NTSYSpc, pokud jsme přetvářeli data v NTedit, a v sekci Similarity vybereme Qualitative data. Vložíme .nts soubor a vybereme koeficient. Soubor uložíme, neboť ho budeme potřebovat pro Mantelův test v další části pro porovnání podobnosti koeficientů. V sekci nabídky zvolíme Clustering a metodu, kterou chceme pro analýzu použít. 4. Zobrazení dendrogramu: Klikneme na SAHN, což je metoda UPGMA, otveřeme předešlý soubor a získáme požadovaný dendrogram kliknutím na naznačený dendrogram dole na liště.
Příloha 2: příklad dat pro vložení do programu NTSYSpc.
42
Achrori LasgerdiMashed MoiChuaSin Priusadebnyj InBejSin Salah Hargrand C4R8T22 Liaonig Cina ChuanZhiGong HasanBey Lunik Kabasi AbuTalibu SamanHong KecPsar Churmai MullaSadik ArzamiAromatnyj Narjadnyj Madarska Gvardejskij
ArzamiAromatnyjMW
0.00
0.25
0.50
0.75
1.00
Coefficient
Obr. 4 Výchozí dendrogram programu NTSYSpc
3.6 Metodika programu R-project R-project je složitější statistický program, který obsahuje velké množství funkcí nejen pro konstrukci dendrogramů. Tento program je značně odlišný svými funkcemi, systematikou a obsahem od dvou předchozích, protože není vyvinut speciálně pro obor biologie, taxonomie nebo fylogenetiky. Záleží na tom, které balíčky se nainstalují. Každý balíček obsahuje funkce pro určitou analýzu dat. R commander velice zjednodušuje práci a poskytuje prostředí pro shlukovou analýzu a konstrukci dendrogramů. Program zahruje 7 metod, např. Ward’s method, Single linkage, Complete linkage, atd. Neumožňuje ale aplikaci koeficientů a Mantelova testu.
43
Postup: 1. Příprava programu: Po nainstalování programu R-project se musí nainstalovat balíčky. V Packages zvolíme Install package. Zde si vybereme balíček Rcmdr, který potom načteme v Load packege. Otevře se nás program R commander, který budeme používat pro analýzu dat. 2. Příprava dat: R commander přečte data v různých formátech. 3. Vložení dat: V sekci Data zvolíme Import data a vložíme soubor formátu .xls. 4. Analýza dat: Dále v části Statistics zvolíme Dimensional analysis, poté Cluster analysis a poté Hierarchical cluster analysis. Zde označíme metodu, kterou chceme použít Clustering method a Distance mesure
a zaškrtneme Plot
dendrogram. 5. Zobrazení dendrogramu: Dendrogram se zobrazí v samostatné části R-projectu. Místo názvů jedinců se zobrazují čísla tak, jak jsou uspořádány (viz View data set na liště R commanderu).
Příloha 2: příklad dat pro vložení do programu R-project.
3.7 Mantelův test za použití programu NTSYSpc Program NTSYSpc zahrnuje funkci Matrix comparison plot, která slouží pro výpočet Mantelova testu. Mantelův test je statistický program pro korelaci dvou matic. Pomocí Mantelova testu se zhodnotí použití koeficientů při analýze genetických dat. Mohou být posuzovány dvě matice, které jsou stejného typu, nebo korelace dvou matic s třetí.
Postup: 1. Otevřeme progam NTSYSpc a v sekci Graphics zvolíme Matrix comparison plot. Zde v Input file X vložíme již získaný výpočet z předchozí části, a to z Analýzy dat, kde bylo upozorněno na uložení. Do pole Input file Y vložíme další matici, ale s jiným koeficientem.
44
2. Pokud jsme získali data z programu FreeTree, uložili jsme si matici ve fázi Analýzy dat ve formátu .xls. Tento formát se opět musí převést do .nts formátu v programu NTedit. Vložíme tabulku z Excelu, v Matrix type však musíme zvolit Symmetric (similarity) a získáme .nts formát. V programu NTSYSpc v sekci Graphics zvolíme Matrix comparison plot a vložíme matici v .nts formátu za X a další s jiným koeficientem za Y. 3. Dostaneme graf znázorňující podobnost či odlišnost dvou koeficientů použitých pro sestrojení dendrogramu.
45
4. VÝSLEDKY PRÁCE 4.1 Vyhodnocení RAPD dat Prunus armeniaca získané programem FreeTree Pomocí Mantelova testu se vyhodnotí koeficienty použité v programu FreeTree ke konstrukci dendrogramu. Hodnocení je prováděno na základě hodnocení grafů a číselného hodnocení. Použité koeficienty: Jaccard, Nei-Li/Dice, Sokal and Sneath 1/Anderbeg, Sokal and Sneath 3, Ochiai, Reynolds, Rogers.
Saman Hong Hargrand Mulla Sadik Hasan Bey Lunik Salah Gvardejskij Priusadebnyj Madarska Narjadnyj Arzami Aromatnyj Kabasi Churmai Abu Talibu Kec Psar C4 R8 T22 Chuan Zhi Gong In Bej Sin Moi Chua Sin Cina Liaonig Achrori Lasgerdi Mashed
Obr.5 : Dendrogram za použití koeficientu Jaccard. Další dendrogramy viz Příloha 3.
Výsledné grafy Mantelova testu:
46
Obr.6: Vyhovující - Graf Mantelova testu – porovnání koeficientů Ochiai a Ne-Li/Dice
Obr.7: Spíše vyhovující - Graf Mantelova testu – porovnání koeficientů Rogers a Jaccard
47
Obr.8: Nevyhovující - Graf Mantelova testu – porovnání koeficientů Rogers a SS3
Na základě grafů (viz Příloha 4) byly vyhodnoceny koeficienty: Vyhovující – Jaccard, Nei-Li/Dice Spíše vyhovující – Ochiai, SS3, SSA Nevyhovující – REY, ROG
48
Tab.6: Zhodnocení koeficientů Mantelovým testem. J J
NLD
O
REY
ROG
SS3
SSA
r t p r t p r t p r t p r t p r t p r t p
NLD
0.99599 10.1011 1 0.99536 10.0806 1 0.69145 6.3344 1 -0.72624 -7.268 0 0.9736 10.9915 1 0.99417 10.5367 1
0.9997 9.96 1 0.68991 6.205 1 -0.7132 -7.0197 0 0.96736 10.7724 1 0.98077 10.2364 1
O
REY
0.69022 6.1978 1 -0.71143 -6.9921 0 0.96628 10.7476 1 0.9798 10.2127 1
-0.96955 -8.5883 0 0.59895 6.105 1 0.68384 6.4714 1
ROG
-0.6616 -7.2838 0 -0.73196 -7.5428 0
SS3
SSA
0.9711 11.228 1
Pozn. r: Matrix correlation, t: Approximate Mantel t-test, p: Prob. Random Z Koeficienty byly vyhodnoceny jako: Vyhovující – Jaccard, Nei-Li/Dice, Ochiai Spíše vyhovující – SSA, SS3 Nevyhovující – REY, ROG
4.2 Vyhodnocení RAPD dat Prunus armeniaca získané programem NTSYSpc Použité koeficienty: Jaccard, Dice, Hamann, Simple Matching, UN 1, UN 3, Ochiai, Russel and Rao, Rogers and Tanimoto. Dendrogram programu NTSYSpc:
49
Achrori LasgerdiMashed Lunik Salah HasanBey MullaSadik Gvardejskij Priusadebnyj Hargrand Narjadnyj Madarska ArzamiAromatnyj
ArzamiAromatnyjMW
Kabasi KecPsar AbuTalibu Churmai SamanHong MoiChuaSin InBejSin ChuanZhiGong Cina Liaonig C4R8T22 0.42
0.53
0.64
0.74
0.85
Coefficient
Obr.9: Dendrogram za použití koefficientu Jaccard. Další dendrogramy v Příloze 5. Výsledné grafy Mantelova testu:
Obr.10: Vyhovující - Graf Mantelova testu – porovnání koeficientů Dice a Ochiai 50
Obr.11: Spíše vyhovující - Graf Mantelova testu – porovnání koeficientů RT a UN1
Obr.12: Nevyhovující - Graf Mantelova testu – porovnání koeficientů UN3 a Ochiai.
Na základě grafů (viz Příloha 6) byly vyhodnoceny koeficienty:
51
Vyhovující – Jaccard, Hamann, Dice Spíše vyhovující – Ochiai, Simple Matching, RT Nevyhovující – UN1, UN3, RR
Tab.7: Zhodnocení koeficientů Mantelovým testem. J
Dice
O
H
SM
RR
RT
UN1
UN3
r t p r t p r t p r t p r t p r t p r t p r t p r t p
J
Dice
O
H
SM
RR
RT
UN1
0.99602 9.7068 1 0.99529 9.682 1 0.93717 10.5422 1 0.93717 10.5422 1 0.90122 7.2112 1 0.93975 10.6738 1 0.93199 10.4409 1 0.78335 10.4605 1
0.99966 9.581 1 0.93292 10.3704 1 0.93292 10.3704 1 0.91031 7.1562 1 0.92909 10.4305 1 0.93206 10.3173 1 0.7382 9.7887 1
0.93024 10.3251 1 0.93024 10.3251 1 0.91166 7.151 1 0.92627 10.3836 1 0.92948 10.2733 1 0.73542 9.7433 1
1 12.4594 1 0.71017 6.683 1 0.9969 12.5135 1 0.9986 12.4026 1 0.80464 11.3803 1
0.71017 6.683 1 0.9969 12.5135 1 0.9986 12.4026 1 0.80464 11.3803 1
0.70504 6.719 1 0.71036 6.649 1 0.52286 6.2402 1
0.99139 12.4059 1 0.8441 11.9861 1
0.77752 10.978 1
Koeficienty byly vyhodnoceny jako: Vyhovující – Jaccard, Dice, Ochiai, Hamann Spíše vyhovující – Simple Matching, RT, UN1 Nevyhovující – RR, UN3
52
UN3
4.3 Vyhodnocení RAPD dat Prunus armeniaca získané programem R-project Použité metody: Ward’s method, Single linkage, Complete linkage, Average linkage, McQuitty method, Median linkage, Centroid linkage
Distance: Euclidian, Squared-euclidian, City-block
Dendrogram programu R-project:
1 2 9
19
20 10 11
5 21
13 14 6 12 7 8
3 4
15 17
0
18
16
22
23
2 1
Height
3
4
5
Cluster Dendrogram for Solution HClust.1
Observation Number in Data Set rp Method=ward; Distance=euclidian
Obr.13: Výsledný dendrogram programu R-project
Vyhodnocení metod použitých pro tvorbu dendrogramu: Vyhovující – Wardova, Complete, McQuitty Spíše vyhovující – Average
53
1
Achrori
2
Lasgerdi Mashed
3
Lunik
4
Salah
5
Gvardejskij
6
Hargrand
7
C4 R8 T22
8
Priusadebnyj
9
Moi Chua Sin
10
Arzami Aromatnyj
11
In Bej Sin
12
Cina
13
Narjadnyj
14
Madarska
15
Kec Psar
16
Abu Talibu
17
Churmai
18
Hasan Bey
19
Mulla Sadik
20
Chuan Zhi Gong
21
Liaonig
22 23
Kabasi Saman Hong
Nevyhovující – Centroid, Median Výsledné dendrogramy viz Příloha 7.
Vzhledem k inverzím a problémům interpretace dendrogramů u metod Centroid linkage a Median linkage tyto metody nedoporučuji.
4.4 Vyhodnocení SSR dat Prunus armeniaca získané programem FreeTree Použité koeficienty: Jaccard, Nei-Li/Dice, Sokal and Sneath 1/Anderbeg, Sokal and Sneath 3, Ochiai, Reynolds, Rogers.
Saman Hong Kabasi Liaonig Arzami Aromatnyj Hargrand Priusadebnyj Lunik Narjadnyj Cina Achrori Gvardejskij Mulla Sadik Madarska C4 R8 T22 Salah Churmai In Bej Sin Hasan Bey Abu Talibu Moi Chua Sin Chuan Zhi Gong Kec Psar Lasgerdi Mashed
Obr.14: Příklad dendrogramu za použití koeficientu Jaccard. Další dendrogramy viz Příloha 8.
Výsledné grafy Mantelova testu:
54
Obr.15: Vyhovující - Graf Mantelova testu – porovnání koeficientů Ochiai a Ne-Li/Dice.
Obr.16: Nevyhovující – Graf Mantelova testu – porovnání koeficientů Ochiai a Rogers.
Na základě grafů byly vyhodnoceny koeficienty: Vyhovující – Jaccard, Nei-Li/Dice, Spíše vyhovující – Ochiai, SS3, SSA Nevyhovující – ROG, REY
Tab.8: Zhodnocení koeficientů Mantelovým testem.
55
J J
NLD
O
REY
ROG
SS3
SSA
r t p r t p r t p r t p r t p r t p r t p
0.99356 11.1963 1 0.99342 11.1859 1 0.61793 6.5383 1 -0.7177 -8.1931 0 0.99704 11.4534 1 0.9956 11.5857 1
NLD
0.99997 11.0808 1 0.62805 6.5277 1 -0.70997 -7.9796 0 0.99778 11.2872 1 0.97881 11.2216 1
O
REY
0.6278 6.5192 1 -0.70959 -7.9691 0 0.99774 11.278 1 0.97858 11.2105 1
-0.87012 -9.18 0 0.6224 6.6142 1 0.60473 6.5235 1
ROG
-0.71987 -8.2487 0 -0.7181 -8.3361 0
SS3
SSA
0.98674 11.5238 1
Koeficienty byly vyhodnoceny jako: Vyhovující – Jaccard, Nei-Li/Dice, Ochiai Spíše vyhovující – SS3, SSA Nevyhovující – ROG, REY
4.5 Vyhodnocení SSR dat Prunus armeniaca získané programem NTSYSpc Použité koeficienty: Jaccard, Dice, Hamann, Simple Matching, UN 1, UN 3, Ochiai, Russel and Rao, Rogers and Tanimoto. Dendrogram programu NTSYSpc:
56
Achrori Gvardejskij Cina Hargrand SamanHong Kabasi Priusadebnyj Liaonig ArzamiAromatnyj Lunik Narjadnyj Salah C4R8T22 MullaSadik Madarska InBejSin Churmai LasgerdiMashed KecPsar ChuanZhiGong MoiChuaSin HasanBey AbuTalibu
ArzamiAromatnyjMW
-0.04
0.22
0.48
0.74
1.00
Coefficient
Obr.17: Dendrogram za použití korficientu Hamann
Další dendrogramy viz Příloha 9. Výsledné grafy Mantelova testu:
Obr.18: Vyhovující - Graf Mantelova testu – porovnání koeficientů Simple Matching a Hamann.
57
Obr.19: Nevyhovující - Graf Mantelova testu – porovnání koeficientů UN1 a RR.
Na základě grafů byly vyhodnoceny koeficienty: Vyhovující – Jaccard, Hamann, Dice Spíše vyhovující – Ochiai, Simple Matching Nevyhovující – UN1, UN3, RR, RT
58
Tab.9: Zhodnocení koeficientů Mantelovým testem. J
Dice
O
H
SM
RR
RT
UN1
UN3
r t p r t p r t p r t p r t p r t p r t p r t p r t p
J
Dice
O
H
SM
RR
RT
UN1
0.99318 10.9841 1 0.99301 10.9673 1 0.95379 11.3593 1 0.95379 11.3593 1 0.98111 10.0961 1 0.9603 11.5745 1 0.94682 11.1893 1 0.93955 12.1063 1
0.99997 10.8639 1 0.95823 11.2539 1 0.95823 11.2539 1 0.98367 9.9374 1 0.95797 11.3911 1 0.95604 11.1385 1 0.90717 11.562 1
0.95762 11.2332 1 0.95762 11.2332 1 0.9838 9.923 1 0.95733 11.3702 1 0.95546 11.1182 1 0.90641 11.5414 1
1 12.5274 1 0.89995 9.9149 1 0.99804 12.6323 1 0.99897 12.431 1 0.93858 12.5749 1
0.89995 9.9149 1 0.99804 12.6323 1 0.99897 12.431 1 0.93858 12.5749 1
0.90136 10.0726 1 0.89678 9.7898 1 0.86156 10.436 1
0.99419 12.5025 1 0.95732 12.9271 1
0.92332 12.3075 1
Koeficienty byly vyhodnoceny jako: Vyhovující – Jaccard, Dice, Ochiai Spíše vyhovující – Hamann, Simple Matching,RT Nevyhovující – RR, UN1, UN3
4.6 Vyhodnocení SSR dat Prunus armeniaca získané programem R-project Použité metody: Ward’s method, Single linkage, Complete linkage, Average linkage, McQuitty method, Median linkage, Centroid linkage
59
UN3
Distance: Euclidian, Squared-euclidian, City-block
Příklad dendrogramu:
Achrori
2
Lasgerdi Mashed
3
Lunik
4
Salah
5
Gvardejskij
6
Hargrand
7
C4 R8 T22
8
Priusadebnyj
9
Moi Chua Sin
10
Arzami Aromatnyj
11
In Bej Sin
12
Cina
13
Narjadnyj
14
Madarska
15
Kec Psar
16
Abu Talibu
17
Churmai
18
Hasan Bey
19
Mulla Sadik
20
Chuan Zhi Gong
21
Liaonig
22 23
Kabasi Saman Hong
12 1 5 23 22 21 10 6 8 11 17 3 13 19 14 4 7 20 2 15 18 9 16
0
2
Height
4
6
8
Cluster Dendrogram for Solution HClust.27
1
Observation Number in Data Set SSR Method=ward; Distance=euclidian
Obr.20: Dendrogram za použití Wardovy metody
Vyhodnocení metod použitých pro tvorbu dendrogramu: Vyhovující – Wardova, McQuitty, Average Spíše vyhovující – Complete Nevyhovující – Centroid, Median Výsledné dendrogramy viz Příloha 10.
4.7 Vyhodnocení RAPD dat Vitis vinifera získané programem FreeTree Použité koeficienty: Jaccard, Nei-Li/Dice, Sokal and Sneath 1/Anderbeg, Sokal and Sneath 3, Ochiai, Reynolds, Rogers.
60
27 30 35 5 40 37 38 16 10 8 12 19 15 9 33 14 32 26 34 24 29 31 41 36 39 51 42 43 6 23 4 25 28 20 1 11 2 18 13 3 17 7 21 22 47 48 49 45 46 44 50
Obr.21: Příklad dendrogramu za použití koeficientu Nei-Li/Dice.
Tab.10: Vysvětlivky odrůd Číslo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Odrůda Aurelius Děvín Pinot Chardonay Irsai Oliver Muscotaly Kerner Lena Malverina Muscat Moravia Muscat Ottonel Riesling Silvaner Neuburger blanc Pálava Pinot blanc Pinot gris Riesling blanc Riesling Italico Sauvignon blanc
Číslo 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
Odrůda Gruner Silvaner Traminer rot Veltliner Gruner Veltliner Veritas Agni Alibernet André Ariana Cabernet Moravia Petit Cabernet Blaufrankish Merlot noir Portugais Bleu Neronet Pinot noir St.Laurent
Další dendrogramy viz Příloha 11.
Výsledné grafy Mantelova testu:
61
Číslo 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51
Odrůda Zweigelt blau Arkadia Diamant Chasselas blanc Chasselas rose Julski biser Olšava Panonia Kincse Pola Vitra Amos Kober 5BB SO – 4 Craciunel Teleki 5C 125 AA LE - K/1
Obr.22: Vyhovující - Graf Mantelova testu – porovnání koeficientů Nei-Li a Ochiai.
Obr.23: Nevyhovující - Graf Mantelova testu – porovnání koeficientů SSA a ROG.
Na základě grafů byly vyhodnoceny koeficienty: Vyhovující – Nei-Li/Dice, Jaccard, Ochiai Spíše vyhovující – SS3, SSA Nevyhovující – ROG, REY
62
Tab.11: Zhodnocení koeficientů Mantelovým testem. J
NLD
O
REY
ROG
SS3
SSA
r t p r t p r t p r t p r t p r t p r t p
J
NLD
O
REY
ROG
SS3
0.99721 13.3205 1 0.99673 13.3047 1 0.67935 7.8512 1 -0.70018 -8.6459 0 0.9754 13.898 1 0.99487 14.2896 1
0.99982 12.9951 1 0.68169 7.6631 1 -0.69413 -8.3408 0 0.97237 13.4985 1 0.98472 13.7813 1
0.67822 7.6184 1 -0.69035 -8.2893 0 0.97349 13.5046 1 0.98388 13.7599 1
-0.97044 -10.0498 0 0.61441 7.3915 1 0.66954 8.1233 1
-0.64472 -8.2814 0 -0.70205 -9.0931 0
0.97122 14.4829 1
SSA
Koeficienty byly vyhodnoceny jako: Vyhovující – Jaccard, Nei-Li, Ochiai Spíše vyhovující – SS3, SSA Nevyhovující – REY, ROG
4.8 Vyhodnocení RAPD dat Vitis vinifera získané programem NTSYSpc Použité koeficienty: Jaccard, Dice, Hamann, Simple Matching, UN 1, UN 3, Ochiai, Russel and Rao, Rogers and Tanimoto. Dendrogram programu NTSYSpc:
63
1 2 20 3 13 18 21 4 23 6 5 30 35 25 28 8 10 16 11 9 15 12 19 17 29 31 37 38 14 32
10MW
0.64
0.73
0.81
0.90
0.99
Coefficient
Obr.24: Dendrogram za použití koeficientu Simple Matching.
Další dendrogramy viz Příloha 12.
Výsledné grafy Mantelova testu:
Obr.25: Vyhovující - Graf Mantelova testu – porovnání koeficientů Simple Matching a Hamann.
64
Obr.26: Nevyhovující - Graf Mantelova testu – porovnání koeficientů UN3 a RR.
Na základě grafů byly vyhodnoceny koeficienty: Vyhovující – Hamann, Dice, Jaccard, Simple Matching Spíše vyhovující – RT, Ochiai Nevyhovující – UN1, UN3, RR
65
Tab.12: Zhodnocení koeficientů Mantelovým testem. J
Dice
O
H
SM
RR
RT
UN1
UN3
r t p r t p r t p r t p r t p r t p r t p r t p r t p
J
Dice
O
H
SM
RR
RT
UN1
0.99729 13.5831 1 0.99681 13.5689 1 0.98768 13.9414 1 0.98768 13.9414 1 0.91445 10.6812 1 0.98922 14.4952 1 0.98234 13.5856 1 0.57591 16.8382 1
0.99981 13.2601 1 0.98921 13.6087 1 0.98921 13.6087 1 0.91674 10.421 1 0.98459 14.0664 1 0.98809 13.316 1 0.53918 15.6047 1
0.98962 13.6066 1 0.98962 13.6066 1 0.91431 10.3872 1 0.98473 14.0606 1 0.98869 13.3164 1 0.53833 15.5764 1
1 14.2555 1 0.85275 10.0653 1 0.99636 14.7428 1 0.99826 13.944 1 0.55312 16.2341 1
0.85275 10.0653 1 0.99636 14.7428 1 0.99826 13.944 1 0.55312 16.2341 1
0.84742 10.4062 1 0.85225 9.8451 1 0.4503 12.1834 1
0.98968 14.3531 1 0.59693 17.7674 1
0.52508 15.2892 1
Koeficienty byly vyhodnoceny jako: Vyhovující – Jaccard, Dice, Simple Matching, Hamann, Ochiai, RT, UN1 Nevyhovující – RR, UN3
66
UN3
4.9 Vyhodnocení RAPD dat Vitis vinifera získané programem Rproject Použité metody: Ward’s method, Single linkage, Complete linkage, Average linkage, McQuitty method, Median linkage, Centroid linkage
Distance: Euclidian, Squared-euclidian, City-block
Příklad dendrogramu:
43 42 41 39 36 35 34 33 30 26 25 23 19 17 16 14 12 6 11 49 48 45 47
44 46 32 22 1 21 28 24 20 18 13 10 8 4 2 3 38 37 31 29 9 27 15 50 40 51 5 7
0
5
Height
10
15
Cluster Dendrogram for Solution HClust.36
Observation Number in Data Set vino Method=ward; Distance=euclidian
Obr.27: Dendrogram za použití Wardovy metody.
Vyhodnocení metod použitých pro tvorbu dendrogramu:
67
Vyhovující – Wardova Spíše vyhovující – Average, Complete, McQuitty Nevyhovující – Centroid, Median
Výsledné dendrogramy viz Příloha 13.
4.10 Celkové vyhodnocení koeficientů a softwarů Podle výsledných dendrogramů Mantelova testu: •
FreeTree -
Vyhovující – Jaccard, Nei – Li Spíše vyhovující – Ochiai, SS3, SSA Nevyhovující – ROG, REY
•
NTSYSpc -
Vyhovující – Hamann, Dice, Jaccard Spíše vyhovující – Ochiai, Simple Matching, RT Nevyhovující – UN1, UN3, RR
Podle výsledných výpočtů Mantelova testu: •
FreeTree -
Vyhovující – Jaccard, Nei – Li, Ochiai Spíše vyhovující – SS3, SSA Nevyhovující – ROG, REY
•
NTSYSpc -
Vyhovující – Jaccard, Dice, Ochiai, Hamann Spíše vyhovující – Simple Matching, RT, UN1 Nevyhovující – UN3, RR
Podle výsledných dendrogramů (R-project): •
Vyhovující – Wardova, McQuitty Spíše vyhovující – Average, Complete Nevyhovující – Median, Centroid
68
5. DISKUZE Výsledky získané analýzami vstupních dat odrůd meruněk a révy vinné si navzájem odpovídají. Nenalezla jsem rozdíly doporučení koeficientů nebo programu, které by se lišily mezi těmito druhy. FreeTree je český program vytvořený přesně pro potřeby taxonomie a fylogenetiky. Je to jednoduchý software, který lze bezplatně nainstalovat do počítače. Pro tvorbu dendrogramů využívá dvou nejpoužívanějších metod UPGMA a Neighbor-joining. Graficky se dendrogramy zobrazují v programu TreeView. Většina výsledků shodně potvrzuje vhodnost či nevhodnost aplikace koeficientů u tohoto programu. Obecně zřejmě nejpoužívanější koeficient Jaccard a Nei – Li/ Dice (dva koeficienty, které mají stejnou výpočetní rovnici) byly shledány jako nejspolehlivější, a to jak podle výpočtů Mantelova testu, tak hodnocením dendrogramů. Koeficient Ochiai poskytuje také velmi dobré výsledky, zvláště numerické hodnoty, dendrogramy mají menší odchylky od původu odrůd. SSA a SS3 jsou spíše vyhovující. Grafické znázornění se shoduje s výpočty Mantelova testu. Koeficienty Reynolds a Rogers jsem vyhodnotila jako nejméně vhodné pro analýzu genetických dat. Numerické hodnoty Mantelova testu vycházely velice špatně a dendrogramy vůbec neodpovídaly původu odrůd. Celosvětově známý program NTSYSpc se skládá opět ze dvou částí, i když NTedit není nutné použít. Program je propracovanější než FreeTree a velice přehledný. Nabízí více koeficientů podobnosti. Nejlépe byly vyhodnoceny koeficienty Nei-Li/Dice, Hamann a Jaccard. Odpovídají správným výsledků jak po stránce grafické, tak po stránce numerické. Koeficient Ochiai opět jako u programu FreeTree vykazuje velmi dobré hodnoty vypočtené Mantelovým testem, grafické zobrazení jsem zhodnotila jako spíše vyhovující. Simple matching a RT koeficienty lze spíše doporučit. Nedoporučuji však nepopsané koeficienty UN1 a UN3 a také koeficient RR. Grafické znázornění příbuznosti odrůd očividně neodpovídá skutečnosti, což jen potvrzují výsledky Mantelova testu. Výsledky získané pomocí programu R-project není možné srovnávat s výsledky výše zmíněnými. R-project je statistický program vyvinutý pro potřeby statistiky s mnoha
69
aplikacemi, které se poté uplatňují v různých oborech. Obsahuje jiné metody pro konstrukci dendrogramů, z čehož je obecně nejpoužívanější Wardova metoda, která také poskytuje nejlepší výsledky. Ze vzdálenostních algoritmů jsou na výbec Euclidian, Squared euclidian a City-block. Wardova metoda poskytuje velmi dobré dendrogramy, které odpovídají údajům o původu odrůd a shodují se s dendrogramy vytvořenými programy NTSYSpc a FreeTree za pomoci vyhovujících koeficientů.Vhodná je také metoda Average a McQuitty. Metodu Complete doporučuji jako spíše vhodnou. Naprosto nevyhovující jsou metody Centroid a Median, které zkresleně zobrazují míry vzdáleností. Single metoda je dle popisů v literatuře založena na podobném principu jako Average metoda, výsledné dendrogramy ale ukazují jiné výsledky, takže ji také nedoporučuji. Ze tří popisovaných a využívaných programů je pro analýzu genetických informací podle mého názoru nejvhodnější program NTSYSpc. Orientace v tomto programu je velice snadná. FreeTree nemá tolik funkcí jako NTSYSpc a pro vytvoření dendrogramu je třeba používat TreeView a poznámkový blok, což práci trochu prodlužuje. R-project pro oblast genetiky a taxonomie nedoporučuji, neboť je ve srovnání s NTSYSpc a FreeTree zbytečně složitý a obsahuje jiné metody výpočtů, které nejsou v genetice tolik využívány.
70
6.ZÁVĚR Problematice genetické diverzity rostlin a jejímu zachování je v současné době zaslouženě a oprávněně věnována čím dál větší pozornost. Tato diplomová práce byla zaměřena na odrůdy meruněk (Prunus armeniaca) a révy vinné (Vitis vinifera), což jsou velmi významné druhy v zahradnické produkci. Práce se zabývá vyhodnocováním dat získaných genetickými metodami, jako jsou molekulární markery. Z takto získaných dat jsou tvořeny dendrogramy, grafická znázornění příbuznosti a podobnosti odrůd nebo druhů. Pro tvorbu dendrogramů se využívá statistických programů a softwarů, kde pomocí shlukové analýzy vytváří dendrogramy. Metody těchto programů jsou různé, záleží na typu programu a účelu, pro který byl vytvořen. Genetické programy používají metody UPGMA a Neighbor-joining, obecně nejužívanější je Wardova metoda. Další funkcí programů jsou koeficienty podobnosti, na základě jejichž rovnic výpočtu jsou vytvářeny shluky z množiny jednotek. Pro posouzení, který koeficient přináší lepší výsledky, slouží Mantelův test. Mantelův test zhodnotí použití koeficientů navzájem a ukazuje spolehlivost koeficientu. V mé práci jsem hodnotila RAPD a SSR markery meruněk a révy vinné třemi programy NTSYSpc, FreeTree a R-project. Z koeficientů podobnosti se na základě grafů a výpočtů nejspolehlivějšími prokázaly Nei-Li/Dice a Jaccard, které jsou také nejpoužívanějšími v genetických analýzách. Ze softwarů byl shledán nejúčinnějším NTSYSpc, který poskytuje výstižné funkce pro oblast fylogenetiky.
71
7. RESUME This thesis deals with genetic analysis, methods and softwares leading to create graphical images. Recently, there is a big focus on plant genetic diversity and it still increases. In this thesis I concentrate on the specieses of apricots (Prunus armeniaca) and grapes (Vitis vinifera), which are ones of the most important specieses in horticultural production. The data, which are used for a genetic research, are achieved by molecular markers. From those data are created dendrograms, graphical representation of similarity and relationships among specieses. The statistic programs and softwares are used for the construction of dendrograms, which basis on application of cluster analysis. Methods of these programs are different, depens on the type and the object of the program, what was developed for. Genetic programs use UPGMA and Neighbor-joining methods, generally the most used method is Ward’s. Coefficients of similarity belong to other options of the program, according to their equations are made some clusters from sets of points. For the assessment, which coefficient brings better results, serves Mantel test. Mantel test assesses the coefficients with each other and shows the reliability of the coefficient. I evaluated SSR and RAPD markers of apricots and grapes by three programs NTSYSpc, FreeTree and R-project in this thesis. From all coefficients used for the analysis, Jaccard and Nei-Li/Dice were found as the best, which are the most using coefficients all around the world. From those three softwares, NTSYSpc was found as the most effectual, due to its functions developed efficiantely for fylogenetics.
72
8. LITERÁRNÍ ZDROJE Elektronické zdroje:
1. DE VICENTE, M.C., LOPEZ, C. FULTON, T.: Genetic diversity analysis with molecular marker data: Learning module. International Plant. Genetic resources institute (IPGRI), Rome, Italy, 2004. 2. DOLEŽALOVÁ, I.: Genová centra. Online 20.3.2007. Dostupné z: http://botany.upol.cz/prezentace/dolezal/centra.pdf. 3. FOX, J.: The R Commander- A basic- statistics GUI for R. 2008. Online 15.4.2009. Dostupné z http://socserv.mcmaster.ca/jfox/Misc/Rcmdr/. 4. GARSON, D.G.: Cluster analysis. 1998, 2008, 2009. Online 3.4.2009. Dostupné z http://faculty.chass.ncsu.edu/garson/PA765/cluster.htm. 5. GENTLEMAN, R., IHAKA, R., et al: Introduction to R. Online 15.4.2009. Dostupné z http://www.r-project.org/. 6. GROSJEAN, P.:R GUI projects overview. 2006. Online 15.4.2009. Dostupné z http://www.sciviews.org/_rgui/. 7. HON, I.: EVIGEZ- Plant genetic resources documentation in the Czech Republic. 2006. Online 27.4.2007. Dostupné z: http://genbank.vurv.cz/genetic/resources/asp2/default_a.htm. 8. KELBEL, J., ŠILHÁN, D.: Shluková analýza. Online 4.4.2009. Dostupné z http://gerstner.felk.cvut.cz/biolab/X33BMI/slides/KMeans.pdf 9. KRŠKA, B., VACHŮN, Z., NEČAS, T.: Šlechtění meruněk v České republice. Online 10.4.2009. Dostupné z http://tilia.zf.mendelu.cz/ustavy/551/ustav_551/slechteni.pdf . 10. Mantel test. Wikipedia. Online 29.4.2009. Dostupné z http://en.wikipedia.org/wiki/Mantel_test. 11. Molekulární markery. Online 6.5.2007. Dostupné z: http://botany.natur.cuni.cz/fer/markers/Markery1-1.pdf. 12. NCBI: Phylogenetic factsheet. Online 20.3.2009. Dostupné z http://www.ncbi.nlm.nih.gov/About/primer/phylo.html.
73
13. NEČAS, T. a kol.: Multimediální učební texty Ovocnictví, Obecná část, Meruňky. 2004. Online 5.4.2009. Dostupné z http://tilia.zf.mendelu.cz/ustavy/551/ustav_551/eltronic_ovoc/_private/ovoc_1/dat a/merunka.pdf. 14. OPPERDOES, F.: Construction of a distance tree using clustering with the UPGMA. Online 17.3.2009. Dostupné z http://www.icp.be/~opperd/private/upgma.html. 15. Points on the Map. Online 6.5.2007. Dostupné z: http://www.nal.usda.gov/pgdic/tutorial/lesson4.htm. 16. ROHLF, J.F.: Software for multivariate statistics and data analysis. Online 5.3.2009. Dostupné z http://www.exetersoftware.com/cat/ntsyspc/ntsyspc.html. 17. ŘEHOUT V. a kol.: Základy genetiky a poradenství. České Budějovice, 2003. Online 3.4.2009. Dostupné z http://www.zsf.jcu.cz/struktura/katedry/kko/ucebni_texty/zaklady-genetiky-aporadenstvi.
Tištěné zdroje:
1. BAXEVANIS, A.,D., OUELLETTE, B.,F.,F.: Bioinformatics. A practical guide to the analysis of genes and proteins. Willey, New Jersey, 2005. ISBN 0-47147878-4. 2. BEDNÁŘ, J.: Vybrané kapitoly z genetiky rostlin. Mendelova zemědělská a lesnická univerzita, Brno, 1997. 123 s. 3. BEDNÁŘ, J.: Základy genového inženýrství rostlin. Mendelova zemědělská a lesnická univerzita, Brno, 2000. 92 s. 4. CVRČKOVÁ, F.: Úvod do praktické bioinformatiky. Academia, Praha, 2006. 148 s. ISBN 80-200-1360-1. 5. DOLEŽALOVÁ, I., LEBEDA, A., DZIECHCIARKOVÁ, M., KŘÍSTKOVÁ, E., ASTLEY, D., VAN DE WIEL, C.C.M.: Vztahy mezi morfologickými znaky, polymorfismem isoenzymů a variabilitou DNA – jejich význam v taxonomii rodu
74
Lactuca. Sborník přednášek Agritec, výzkum šlechtění a služby, s.r.o. Šumperk, 2002. 243 s. 6. FARRIS, J.S, ALBERT, V.A, KALLERSJO, M., LIPSCOMB, D, KLUGE, A.G.: Parsimony jackknifing outperforms neighbor-joining. Cladistics 1996, 12:99–124 in SCHUBERT, M, HOLLAND, L.Z., HOLLAND, N.D., JACOBS, D.K.: A Phylogenetic Tree of the Wnt Genes Based on All Available Full-Length Sequences, Including Five from the Cephalochordate Amphioxus. Oxford Journals, Molecular biology and evolution, 2000, Vol. 17, č. 12, str. 1896-1903 7. FLEGR, J.: Evoluční biologie. Academia, Praha, 2005. 559 s. ISBN 80-200-12702. 8. FRANKEL, O. H., BENNETT, E.: Genetic resources- Introduction. In Genetic resources in plants – their exploration and conservation. Oxford: Blackwell Scientific Publiations, 1970. 554 s. IBP handbook. 9. HAMPL,V., PAVLÍČEK, A., FLEGR, J.: Construction and bootstrap analysis of DNA fingerprinting-based phylogenetics trees with the freeware program FreeTree: aplication to trichomonad parasites. International Journal of Systematic and Evolutionary Biology, 2001, vol. 51, str. 731-735. 10. HEBÁK, P. et al:Vícerozměrné statistické metody 3. Informatorium, Praha, 2005. 255 s. ISBN – 80-7333-039-3. 11. HILLIS, D.M., BULL, J.J.: An empirical test of bootstrapping as a method for assesing confidence in phylogenetic analysis. Abstrakt. Oxford journals, Systematic biology, 1993, Vol. 42, č. 2, str. 182-192. 12. CHLOUPEK, O.: Genetická diverzita, šlechtění a semenářství. Academia, Praha, 2000. 311 s. 13. KRAUS, V., HUBÁČEK, V., ACKERMANN, P.: Rukověť vinaře. ČSZ – nakladatelství KVĚT a nakladatelství Brázda, Praha, 2004. s. 3-5. 14. KUČERA, L., POLÁKOVÁ, K., LEIŠOVÁ, L., OVESNÁ, J.: Přístup k analýze molekulárních dat. Sborník přednášek Agritec, výzkum šlechtění a služby, s.r.o. Šumperk, 2002, 243 s. 15. MANTEL, N.: The detection of disease clustering and a generalized regression approach. Cancer Research. Vol. 27, 209. 1967.
75
16. MURTAGH, F.: Hierarchical clustering. R help for packages stat. R-project. 17. Národní program konzervace a využívání genetických zdrojů rostlin, zvířat a mikroorganismů významných pro výživu, zemědělství a lesní hospodářství. Ministerstvo zemědělství, Praha, 2004. 30 s. 18. OVESNÁ, J., RULCOVÁ, J., POLÁKOVÁ, K., KUČERA, L., LEIŠOVÁ, L.: DNA markery – současnost a perspektivy. Sborník přednášek Agritec, výzkum šlechtění a služby, s.r.o. Šumperk, 2002. 243 s. 19. PEDRYC, A., RUTHNER, S., HERMÁN, R., KRŠKA, B., HEGEDUS, A., HALÁSZ, A.: Genetic diversity of apricot revealed by a set of SSR markers from linkage group G1. Scientia horticulturae, 2009, 2009.01.014. 20. PAVLÍČEK, A., HRDÁ, Š., FLEGR, J.: FreeTree- freeware program for construction of phylogenetic trees on the basis of distance data and Bootstrap/Jackknife analysis of the tree robustness, application in the RAPD analysis of genus frenkelia. Folia Biologica, 1999, vol. 45, str. 97-99. 21. PAVLOUŠEK, P.: Vinohradnictví – odrůdy révy vinné. Mendelova zemědělská a lesnická univerzita v Brně, Brno, 1999. 122 s. ISBN 80-7157-415-5. 22. PIDRA, M., BARÁNEK, M., MORAVCOVÁ, K., KOPECKÝ, J., VACHŮN, M., PAVLOUŠEK, P., SOTOLÁŘ, R.: Použití RAPD fingerprintingu u révy (Vitis spp.). Sborník přednášek Agritec, výzkum šlechtění a služby, s.r.o. Šumperk, 2002, 243 s. 23. POSPÍŠKOVÁ, M.: DNA polymorfismus: Obecné využití se zaměřením na metodu mikrosatelitů a DNA polymorfismus u topolu a dubu. Acta Průhoniciana 73, s. 249 – 256. Průhonice, 2002. 24. SAITOU, N., NEI, M.: The neighbor-joining method: A new method for reconstructing phylogenetic trees. Molecular biology and evolution, 1987, Volume 4, Nm. 4, str. 406-425. 25. SVITÁČKOVÁ, B.: Využití genových zdrojů. In SALAŠ, P.: Modernizace výukového procesu u předmětů ovocné, okrasné školkařtví a ovocnářství. Sborník přednášek z odborného semináře. Lednice na Moravě, 2003. s. 129-132. 26. TAMARIN, R.H.: Principles of genetics. The McGraw-Hill, USA, 1999. 686 s. ISBN 0-07-115581-3.
76
27. VACHŮN, Z.: Ovocnictví. Pěstování meruněk. Mendelova zemědělská a lesnická univerzita, Brno, 1999. 132 s. ISBN 80-7157-393-0. 28. ZOHARY, D.: Center of diversity and Center of Origin. In Genetic resources in plants – their exploration and conservation. Oxford: Blackwell Scientific Publiations, 1970. 554 s. IBP handbook. 29. ZRZAVÝ, J.: Fylogeneze živočišné říše. Scientia, Praha, 2006. 255 s. ISBN 8086960-08-0.
77
9. SEZNAM OBRÁZKŮ Obrázek 1. Centra původu kulturních rostlin podle Vavilova ...........................................9 Obrázek 2. Příklad dendrogramu ......................................................................................22 Obrázek 3. Výchozí dendrogram programu FreeTree ......................................................40 Obrátek 4. Výchozí dendrogram programu NTSYSpc......................................................42 Obrázek 5. Dendrogram za použití koeficientu Jaccard....................................................45 Obrázek 6. Graf Mantelova testu – porovnání koeficientů Ochiai a Ne-Li/Dice..............46 Obrázek 7. Graf Mantelova testu – porovnání koeficientů Rogers a Jaccard....................46 Obrázek 8. Graf Mantelova testu – porovnání koeficientů Rogers a SS3.........................47 Obrázek 9. Dendrogram za použití koefficientu Jaccard. .................................................49 Obrázek 10. Graf Mantelova testu – porovnání koeficientů Dice a Ochiai.......................49 Obrázek 11. Graf Mantelova testu – porovnání koeficientů RT a UN1............................50 Obrázek 12. Graf Mantelova testu – porovnání koeficientů UN3 a Ochiai.......................50 Obrázek 13. Výsledný dendrogram programu R-project...................................................52 Obrázek 14. Příklad dendrogramu za použití koeficientu Jaccard....................................53 Obrázek 15. Graf Mantelova testu – porovnání koeficientů Ochiai a Ne-Li/Dice............54 Obrázek 16. Graf Mantelova testu – porovnání koeficientů Ochiai a Rogers...................54 Obrázek 17. Dendrogram za použití korficientu Hamann................................................ 56 Obrázek 18. Graf Mantelova testu – porovnání koeficientů Simple Matching a Hamann56 Obrázek 19. Graf Mantelova testu – porovnání koeficientů UN1 a RR............................57 Obrázek 20. Dendrogram za použití Wardovy metody………………………………… 59 Obrázek 21. Příklad dendrogramu za použití koeficientu Nei-Li/Dice.............................60 Obrázek 22. Graf Mantelova testu – porovnání koeficientů Nei-Li a Ochiai....................61 Obrázek 23. Graf Mantelova testu – porovnání koeficientů SSA a ROG.........................61 Obrázek 24. Dendrogram za použití koeficientu Simple Matching..................................63 Obrázek 25. Graf Mantelova testu – porovnání koeficientů Simple Matching a Hamann63 Obrázek 26. Graf Mantelova testu – porovnání koeficientů UN3 a RR............................64 Obrázek 27. Dendrogram za použití Wardovy metody.....................................................66
10. SEZNAM TABULEK Tabulka 1 Světová centra diverzity.....................................................................................9 Tabulka 2 Geografická centra dle Žukovského 1971........................................................10 Tabulka 3 Příklady koeficientů podobnosti.......................................................................28 Tabulka 4 Tabulka původu odrůd meruněk ......................................................................36 Tabulka 5 Tabulka původu odrůd révy vinné....................................................................37 Tabulka 6 Zhodnocení koeficientů Mantelovým testem...................................................48 Tabulka 7 Zhodnocení koeficientů Mantelovým testem...................................................51 Tabulka 8 Zhodnocení koeficientů Mantelovým testem...................................................55 Tabulka 9 Zhodnocení koeficientů Mantelovým testem...................................................58 Tabulka 10 Vysvětlivky odrůd..........................................................................................60 Tabulka 11 Zhodnocení koeficientů Mantelovým testem.................................................62 Tabulka 12 Zhodnocení koeficientů Mantelovým testem.................................................65
78