MASARYKOVA UNIVERZITA Lékařská fakulta Biologický ústav
Mgr. Marie Zobaníková
Komparativní genomika nekultivovatelných patogenních treponemat: identifikace genetických rozdílů mezi původci syfilis a yaws
DIZERTAČNÍ PRÁCE
Školitel: doc. MUDr. David Šmajs, Ph.D.
Brno 2012
Bibliografická identifikace
Bibliografická identifikace Jméno a příjmení autora:
Mgr. Marie Zobaníková
Název dizertační práce (česky):
Komparativní genomika nekultivovatelných patogenních treponemat: identifikace genetických rozdílů mezi původci syfilis a yaws
Název dizertační práce (anglicky): Comparative genomics of uncultivatable pathogenic treponemes: identification of genetic differences between yaws and syphilis causing agents Studijní obor:
Lékařská biologie 5103V022
Školitel:
doc. MUDr. David Šmajs, Ph.D.
Rok obhajoby:
2012
Klíčová slova (česky):
Treponema pallidum, Treponema pertenue, Treponema paraluiscuniculi, syfilis, yaws, endemická syfilis, komparativní genomika, genomové sekvenování
Klíčová slova (anglicky):
Treponema pallidum, Treponema pertenue, Treponema paraluiscuniculi, syphilis, yaws, endemic syphilis, comparative genomics, whole genome sequencing
Poděkování
Ráda bych poděkovala svému školiteli Davidu Šmajsovi za možnost vypracovat dizertační práci pod jeho vedením v jeho laboratoři na Biologickém ústavě Lékařské fakulty Masarykovy univerzity a za rady a cenné zkušenosti, které jsem během studia nabyla. Chtěla bych také poděkovat Georgovi M. Weinstockovi a Erice Sodergren za možnost spolupráce s jejich laboratoří. Dále bych chtěla poděkovat všem, kteří mi poskytovali cenné rady během mé práce zabývající se komparativní genomikou treponemálních kmenů, především Petře Pospíšilové, Michalovi Strouhalovi, Darině Čejkové, Barboře Štaudové, Lence Mikalové, Heleně Pětrošové a všem kolegyním a kolegům ze skupiny bakteriální genetiky a genomiky a i ostatním členům Biologického ústavu za vytvoření příjemného pracovního prostředí.
Obsah
OBSAH 1
SOUHRN ............................................................................................................8
2
ABSTRACT........................................................................................................9
3
ÚVOD...............................................................................................................10 3.1
Nekultivovatelná patogenní treponemata ........................................................10
3.2
Syfilis ...............................................................................................................11
3.2.1
Původce syfilis – Treponema pallidum .......................................................11
3.2.2
Způsob přenosu syfilis .................................................................................13
3.2.3
Epidemiologie..............................................................................................14
3.2.4
Projevy onemocnění ....................................................................................14
3.2.5
Laboratorní diagnostika ...............................................................................15
3.2.6
Léčba............................................................................................................16
3.3
Endemické treponematózy – epidemiologie a klinické projevy......................16
3.3.1
Yaws ............................................................................................................16
3.3.2
Endemická syfilis.........................................................................................18
3.3.3
Pinta .............................................................................................................19
3.4
Treponematózy u primátů................................................................................19
3.5
Venerická spirochetóza u králíků ....................................................................20
3.6
Venerická spirochetóza u zajíců ......................................................................21
3.7
Rozdíly mezi původci endemických treponematóz a syfilis a jejich využití v
praxi 22 3.8
Geny, lišící se u většiny kmenů T. pallidum a jejich využití při typizaci kmenů 26
4
CÍLE PRÁCE....................................................................................................28
5
MATERIÁL A METODY................................................................................29 5.1
Použité kmeny rodu Treponema ......................................................................29
5.2
Izolace DNA laboratorních kmenů treponemat ...............................................29
5.3
Základní principy použitých celogenomových sekvenačních metod ..............31 4
Obsah
5.4
Sekvenace a kompletace genomu kmene Samoa D.........................................32
5.5
Anotace genomu Samoa D ..............................................................................33
5.6
Ověření genomové sekvence metodou whole genome fingerprinting (WGF) 34
5.7
Srovnání celogenomových sekvenačních metod CGS, pyrosekvenace,
Illumina........................................................................................................................34 5.8
Sekvenace paralogních genů tpr a repetic v genomech Gauthier a Fribourg-
Blanc 34 5.9
Sekvenace homopolymerních oblastí v genomech Samoa D a Fribourg-Blanc 35
5.10
Sestavení genomové sekvence kmene Fribourg-Blanc ...................................36
5.11
Porovnání celogenomových sekvencí..............................................................37
5.12
Výpočet typ selekce genu a detekce rekombinace...........................................38
5.13
Sekvenace rrn operonů u různých kmenů nekultivovatelných patogenních
treponemat ...................................................................................................................38 5.13.1
Fylogenetická analýza nekultivovatelných patogenních treponemat v rrn1 a
rrn2 lokusech .............................................................................................................38 5.13.2
Analýza složení intergenových oblastí 16S-23S v rrn1 a rrn2 operonech
klinických izolátů.......................................................................................................39 6
VÝSLEDKY.....................................................................................................41 6.1
Sekvenace a kompletace genomu T. pallidum subsp. pertenue Samoa D .......41
6.2
Hodnocení celogenomových sekvenačních metod použitých při sekvenaci
genomu Samoa D.........................................................................................................42 6.3
Charakteristiky genomu kmene Samoa D .......................................................43
6.4
Souhrn odlišností mezi genomy kmene Nichols a DAL-1 ..............................45
6.5
Sekvenace a kompletace genomu opičího izolátu Treponema Fribourg-Blanc 47
6.6
Shrnutí celkové odlišnosti genomu kmene Fribourg-Blanc od genomů kmenů
TPE
48
5
Obsah
6.7
Identifikace rozdílů mezi genomy původců syfilis, yaws, spirochetózy králíků
a treponemálního onemocnění paviána........................................................................51 6.7.1
Sekvenční identita a genetická diverzita mezi kmeny TPA, TPE a Fribourg
Blanc a Cuniculi A.....................................................................................................52 6.7.2
Souhrn genetických rozdílů mezi poddruhy T. p. pallidum a T. p. pertenue 53
6.7.3
Nukleotidové rozdíly mezi kmeny TPA a TPE a jejich vliv na proteiny ....59
6.7.4
Geny kódující proteiny s většími sekvenčními změnami mezi kmeny obou
poddruhů TPA a TPE.................................................................................................62 6.8
Fylogenetická analýza mezi genomy původců syfilis, yaws, spirochetózy
králíků a treponemálního onemocnění paviána ...........................................................71 6.9
Rozdíly v rrn operonech u různých kmenů nekultivovatelných patogenních
treponemat. ..................................................................................................................72 6.9.1
Detekce tRNA-Ile a tRNA-Ala v rrn1 a rrn2 operonech u klinických izolátů. 74
7
DISKUZE .........................................................................................................80 7.1
Srovnání celogenomových sekvenačních metod .............................................80
7.2
Variabilita mezi genomy nekultivovatelných patogenních treponemat ..........80
7.3
Detekce genů zodpovědných za rozdílné klinické projevy yaws a syfilis.......82
7.4
Nespecifikovaný opičí izolát Fribourg-Blanc..................................................86
7.5
Význam sekvence rRNA lokusů......................................................................87
8
ZÁVĚRY ..........................................................................................................89
9
LITERATURA .................................................................................................90
10
PŘÍLOHY .......................................................................................................103
6
Seznam zkratek SEZNAM ZKRATEK aa
aminokyselina (aminokyseliny)
CGS
metoda komparativní genomové sekvenování
cons
konzervativní substituce – náhrada za aminokyselinu se stejnými fyzikálněchemickými vlastnostmi
DDT
dideoxyterminátorová sekvenační metoda
FrBl
nespecifikovaný opičí izolát Fribourg-Blanc
HP
hypotetický protein
CHMP
konzervovaný hypotetický membránový protein
CHP
konzervovaný hypotetický protein
MSC
major sequence changes – 15 nebo více aminokyselinových substitucí, změny typu inzerce/delece delší než 10 aminokyselin, zkrácené proteiny nebo naopak proteiny o plné délce
NON
záměna nukleotidu v genu způsobí substituci aminokyseliny v odpovídajícím proteinu
noncons
nekonzervativní substituce – náhrada za aminokyselinu s odlišnými fyzikálně-chemickými vlastnostmi
SYN
záměna nukleotidu v genu nevede k substituci aminokyseliny v odpovídajícím proteinu
TEN
Treponema pallidum subsp. endemicum
TCHOMP
treponemální konzervovaný hypotetický protein vnější membrány
TCHP
treponemální konzervovaný hypotetický protein
TPA
Treponema pallidum subsp. pallidum
TPc
Treponema paraluiscuniculi
TPE
Treponema pallidum subsp. pertenue
WGA
metoda whole genome amplification – celogenomová amplifikace
WGF
metoda whole genome fingerprinting
7
Souhrn
1 SOUHRN Rod Treponema zahrnuje několik blízce příbuzných nekultivovatelných zástupců. Kromě lidských patogenů, původců syfilis a endemických treponematóz, jsou to také původci onemocnění u zvířat. Tyto zástupce rodu Treponema nelze běžně používanými metodami morfologickými, imunologickými ani serologickými od sebe odlišit. Jednotlivé druhy a poddruhy se odlišují na základě epidemiologických charakteristik a rozdílné klinické manifestace onemocnění. Ovšem mechanismy jejich patogeneze ani virulence stále nejsou přesně objasněny. Jejich genomy vykazují velkou sekvenční podobnost. Metodou „whole genome fingerprinting“ byla zjištěna více než 99,5% identita mezi genomy poddruhů T. p. pallidum a T. p. pertenue. Příčinou rozdílné klinické manifestace obou onemocnění jsou tedy relativně malé genetické rozdíly mezi oběma poddruhy. V rámci dizertační práce byl proto sekvenován genom kmene T. p. subsp. pertenue Samoa D s využitím celogenomových sekvenačních metod pyrosekvenování, technologie Illumina a komparativního genomového sekvenování. Pro porovnání genomů patogenních treponemat pak byly využity celogenomové sekvence 3 kmenů T. p. subsp. pertenue, 5 kmenů T. p. subsp. pallidum, kmene Treponema paraluiscuniculi a treponemálního izolátu kmene Fribourg-Blanc. Porovnání genomů těchto kmenů bylo použito k určení genetické variability mezi patogenními nekultivovatelnými bakteriemi rodu Treponema. Možnost rozlišení druhů/poddruhů patogenních treponemat s využitím genů pro rRNA byla zkoumána sekvenací lokusů pro rRNA u dostupných laboratorních kmenů. Počet nukleotidových rozdílů mezi poddruhy pallidum a pertenue byl řádově 10x vyšší než mezi kmeny v rámci poddruhů. Nízká variabilita genomu kmene Fribourg-Blanc oproti kmenům TPE implikuje možné zařazení kmene do poddruhu pertenue. Nukleotidová divergence mezi kmenem Cuniculi A a kmeny pallidum i pertenue byla o řád vyšší než nukleotidová divergence mezi poddruhy pallidum a pertenue. Mezi všemi kmeny pallidum a pertenue bylo nalezeno 2493 rozdílných nukleotidů, které mohou mít vliv na rozdílnou patogenitu syfilis a yaws. Největší počet rozdílů je zahrnut ve skupině 33 genů
kódujících
proteiny
s více
než
6
aminokyselinovými
rozdíly
nebo
prodlouženou/zkrácenou délkou. Získání kompletní nukleotidové sekvence kmenů T. pallidum subsp. pertenue pomohlo vymezit vnitrodruhovou genetickou variabilitu treponemat, odhalit nové cíle pro specifickou molekulární diagnostiku yaws a odhalit geny pravděpodobně zodpovědné za odlišnou klinickou manifestaci syfilis a yaws. 8
Abstract
2 ABSTRACT The genus Treponema contains several closely related uncultivable pathogenic species and subspecies. Strains of this group are causative agents of human treponemal diseases syphilis, endemic syphilis, yaws and pinta. Strains of this group are also causative agents of treponemal infection in primates, venereal spirochetosis in rabbits and similar disease in hares. The pathogenic Treponema are indistinguishable in terms of morphology, immunology and serological tests. Treponemal species and subspecies are therefore differentiated based on different epidemiological and clinical manifestations. Mechanisms of treponemal pathogenesis and virulence are still not clear. Whole genome fingerprinting method reavealed more than 99,5% identity between genomes of T. p. subsp. pallidum and T. p. subsp. pertenue. Therefore, only relatively small genetic differences between these two subspecies are responsible for different clinical manifestations of both diseases. My work partly focused on sequencing of T. p. subsp. pertenue Samoa D by several whole genome sequencing methods including pyrosequencing, Illumina technology and Comparative genome sequencing method. Another aim was to compare 3 strains of T. p. subsp. pertenue, 5 strains of T. p. subsp. pallidum, strain Treponema paraluiscuniculi and strain Fribourg-Blanc on a genomewide scale. The comparison of the genomes of these strains was used for determination of genetic variability among pathogenic bacteria of the genus Treponema. Sequencing of genes that codes for rRNA in laboratory treponemal strains was performed to test this locus for its ability to distinguish between subspecies/species. The number of nucleotide differences between subspecies pallidum and pertenue was 10times higher than variability among strains of the same subspecies. High sequence relatedness of strain Fribourg-Blanc and subsp. pertenue strains implicates that this strain belongs to subsp. pertenue. Nucleotide divergence between Cuniculi A strain and pallidum and pertenue strains was higher than between pallidum and pertenue strains. A set of 2493 different nucleotides between all strains of subsp. pallidum and all strains of subsp. pertenue likely represents different pathogenicity of strains causing syphilis and yaws. The highest number of differences was found in the group of 33 genes encoding proteins with more than 6 amino acid differences or elongated/truncated proteins.
9
Úvod
3 ÚVOD 3.1
Nekultivovatelná patogenní treponemata Bakteriální rod Treponema zahrnuje několik blízce příbuzných nekultivovatelných
zástupců, z toho čtyři jsou lidské patogeny. Jsou to Treponema pallidum subsp. pallidum, původce venerické syfilis, a tři původci tzv. endemických treponematóz Treponema pallidum subsp. pertenue, původce yaws; Treponema pallidum subsp. endemicum, původce endemické syfilis a Treponema carateum, původce pinty. Dále do této skupiny patří také zástupci způsobující onemocnění u zvířat. Treponema paraluiscuniculi způsobuje venerickou spirochetózu u králíků. Podobné onemocnění se vyskytuje také u divokých zajíců patrně způsobené kandidátním druhem Treponema paraluisleporis. Nespecifikovaný izolát Fribourg-Blanc byl získán roku 1966 z paviána, u něhož způsoboval onemocnění podobné yaws (Fribourg-Blanc & Mollaret, 1969). Tyto zástupce rodu Treponema se zatím nepodařilo kontinuálně kultivovat v podmínkách in vitro (Cox, 1994; Lumeij, 2010; Willcox & Guthe, 1966), nelze je odlišit morfologicky (Angulo et al., 1951; Engelkens et al., 1991; Hougen et al., 1973, 1976; Ovcinnikov & Delektorskij, 1970), imunologicky (Thornburg & Baseman, 1983) ani při použití rutinních serologických metod (Baker-Zander & Lukehart, 1983, 1984; Fohn et al., 1988; Martin et al., 1990; Noordhoek et al., 1990; Pahor, 1979). Jednotlivé druhy a poddruhy se odlišují na základě epidemiologických charakteristik a rozdílné klinické manifestace onemocnění (tabulka 1). Pro všechna uvedená lidská treponemální onemocnění jsou společné klinické příznaky v podobě primárních a sekundárních lézí, střídání fází symptomatického onemocnění a fází latence a následný přechod do terciárního stádia onemocnění. Syfilis se vyskytuje celosvětově, přenáší se sexuálně nebo kongenitálně, je vysoce invazivní a v terciární fázi dochází k systémové infekci. Oproti tomu endemické treponematózy způsobují onemocnění u dětí do patnácti let s nedostatečnými hygienickými návyky a nedostatečným zahalením těla oděvem především v chudých venkovských oblastech. Přenáší se přímým kontaktem kůže nebo kůže a sliznice nebo kontaminovanými předměty. Yaws se vyskytuje převážně ve vlhkých oblastech tropů a subtropů, endemická syfilis převážně v suchých pouštních oblastech a pinta ve středně vlhkých lesnatých oblastech Jižní a Střední Ameriky včetně Kuby (Antal et al., 2002; Farnsworth & Rosen, 2006) (tabulka 1).
10
Úvod Tabulka 1. Charakteristika nekultivovatelných patogenních treponemat (upraveno podle Norrise (Norris et al., 2001; Norris & Weinstock, 2006) původce
T. p. subsp. pallidum (TPA)
T. p. subsp. pertenue (TPE)
T. p. subsp. endemicum (TEN)
Treponema carateum
Treponema paraluiscuniculi (TPc)
onemocnění
SYFILIS (lues)
YAWS (frambézie, pian, parangi)
ENDEMICKÁ SYFILIS (bejel, dichuchwa)
PINTA (carate, cute)
VENERICKÁ SPIROCHETÓZA KRÁLÍKŮ
celosvětový
vlhké tropické oblasti Afriky, Jižní Ameriky, Karibských ostrovů, Indonézie
suché horké oblasti, severní Afrika, Střední Východ, jižní Evropa, jihovýchodní Asie
středně vlhké teplé oblasti, Střední a Jižní Amerika
kritérium nelze aplikovat
člověk
člověk
člověk
člověk
králík
děti, dospívající, dospělí
děti
děti, dospívající a dospělí
děti a dospívající
kritérium nelze aplikovat
přenos
sexuálním kontaktem, kongenitálně
přímým kontaktem pokožky, zřídka kongenitálně
přímým kontaktem sliznic nebo pokožky, zřídka kongenitálně
přímým kontaktem pokožky
sexuálním kontaktem
invazivita
vysoká
střední
střední
neinvazivní
nepatogenní pro člověka
kožní a kostní léze, infekce se vyskytují v časné, latentní i pozdní formě
kožní a kostní léze, infekce se vyskytují v časné, latentní i pozdní formě
kožní léze, nedochází k systémové infekci
nepatogenní pro člověka
k infekci jsou citliví králíci, křečci a morčata
k infekci jsou citliví králíci, křečci a morčata
pro laboratorní zvířata neinfekční
genitální léze u králíků
geografický výskyt přirozený hostitel výskyt onemocnění podle věkové skupiny
patogenita u člověka
patogenita u zvířat
lokální i systémové infekce, které se vyskytují v časné, latentní i pozdní formě k infekci jsou citliví křečci, morčata a králíci, kteří jsou vysoce citliví ke kožní a testikulární infekci.
3.2
Syfilis
3.2.1
Původce syfilis – Treponema pallidum Treponema pallidum subsp. pallidum, původce syfilis, je nejlépe prozkoumaná ze
všech patogenních treponemat. Jako původce syfilis byla bakterie tehdy ještě pod názvem Spirochaeta pallida identifikována Schaudinnem a Hoffmanem v roce 1905 v Berlíně (Schaudinn & Hoffman, 1905). Treponema pallidum je Gram-negativní bakterie spirálního tvaru, o délce 6 až 15 µm a průměru 0,2 µm. Buněčný obal je tvořen tenkou vrstvou peptidoglykanu, periplazmatickým prostorem a vnější membránou. Všechny treponemy mají v periplazmatickém prostoru mezi vnější a vnitřní membránou flagelární filamenta, která T. pallidum umožňují aktivní pohyb rotací kolem podélné osy (Jepsen et al., 1968; Ovcinnikov & Delektorskij, 1966). T. pallidum je mikroaerofilní nesporulující obligátní lidský parazit, vysoce citlivý na vyschnutí a zvýšenou koncentraci kyslíku, a proto mimo savčího hostitele dlouho nepřežívá. Dosud se nepodařilo nalézt vhodné podmínky pro kultivaci in vitro. Stabilní 11
Úvod propagace kmenů T. pallidum bylo dosaženo pouze v savčím hostiteli, a to nejčastěji v králíkovi (Lukehart & Marra, 2007). Limitovaná kultivace je možná mimo hostitele pouze ve tkáňových kulturách (Fieldsteel et al., 1977; Fieldsteel et al., 1982; Fitzgerald et al., 1975). Ve tkáňových kulturách však bylo dosaženo jen asi 100násobného pomnožení bakterií (Fieldsteel et al., 1981; Norris, 1982). Ke zkoumání bakterie tedy není možné použít techniky přímé genetické manipulace, využívající selektivní kultivační média. Optimálními podmínkami pro kultivaci ve tkáňové kultuře jsou teploty v rozmezí 33 až 35 °C, koncentrace atmosférického kyslíku v rozsahu 1,5 až 5 % a kultivační médium obsahující 20 % fetálního bovinního séra spolu s extraktem z králičích varlat (Fieldsteel et al., 1982). Ve
tkáňových
kulturách
byla
testována
také
citlivost
T.
pallidum
k antimikrobiálním látkám. Po vystavení bakterií antibiotiku v kultuře byla testována jejich viabilita v savčím hostiteli (byla provedena intradermální inokulace do králičího hostitele, zaznamenána byla koncentrace, po které již nedošlo k vytvoření kožní léze vzhledem k referenci). Žádné léze se neobjevily při použití následujících koncentrací antibiotik: penicillin G: 0.0025 µg/ml; tetracyklin: 0.5 µg/ml; erythromycin: 0.005 µg/ml; a spectinomycin: 0.5 µg/ml (Norris & Edmondson, 1988). Na rozdíl od penicilinu je nutné při použití makrolidových antibiotik při léčbě onemocnění počítat s výskytem kmenů s chromozomální mutací, způsobující rezistenci k makrolidovým antibiotikům (Katz & Klausner, 2008; Lukehart et al., 2004; Matějková et al., 2009; Stamm, 2010; Stamm & Bergen, 2000; Stamm et al., 1988; Woznicová et al., 2010). Další úrovně zkoumání patogenních treponemat bylo dosaženo při stanovení celogenomové sekvence Treponema pallidum subsp. pallidum kmene Nichols v roce 1998 (Fraser et al., 1998). To umožnilo zkoumat treponemální genetickou informaci na celogenomové úrovni a určit charakteristiky treponemálního metabolismu. Důsledkem malého genomu T. pallidum (Fraser et al., 1998; Matějková et al., 2008) je celkově omezená metabolická kapacita tohoto patogenu, např. citlivost patogenu k vyšším teplotám (Fieldsteel et al., 1982; Wagner-Jauregg, 1918) a chybějící geny pro katalázu a oxidázu. Energii získává T. pallidum rozkladem glukózy při glykolýze biochemickou dráhou Embden-Meyerhof-Parnas. Většinu esenciálních makromolekul přijímá tato treponema od hostitele velkým počtem transportních systémů se širokou substrátovou specifitou. Například enzymy pro fermentaci kompletně chybí. Mastné kyseliny a lipidy musí Treponema pallidum rovněž přijímat od hostitele, protože chybí enzymy pro jejich syntézu
12
Úvod i pro β-oxidaci mastných kyselin. Naproti tomu její geny pro dráhy, které se podílejí na replikaci, reparaci a expresi DNA, kódují syntézu kompletní sady proteinů. Klonování chromozomální DNA do bakteriálních arteficiálních chromozomů (BAC) umožnilo vytvoření BAC knihovny 19 kmenů E. coli. V této knihovně chybí pouze úsek o délce 15,6 kb (v oblasti 248727 – 264323 bp genomu Nichols), pokrývá tedy 98,7 % predikovaných ORF (Šmajs et al., 2002). Tím knihovna umožňuje zkoumat treponemální DNA bez nutnosti pracovat přímo s treponemálními buňkami. Rozluštění celogenomové sekvence dále umožnilo vytvořit treponemální DNA čipy a stanovit hladiny RNA transkriptů během experimentální infekce králičích varlat (Šmajs et al., 2005). Systematické klonování otevřených čtecích rámců (McKevitt et al., 2003) pak umožnilo identifikovat 106 antigenních proteinů, z nich 84 bylo identifikováno poprvé (McKevitt et al., 2005), a dále také zkoumat interakce mezi páry proteinů v kvasinkovém dvouhybridním systému. Z téměř miliónu zkoumaných proteinových interakcí bylo touto metodou stanoveno 3649 interakcí mezi 726 proteiny. Z toho bylo na základě dvou nezávislých ověřovacích metod nakonec vybráno 576 proteinů spojených 991 interakcemi. Zkoumané interakce pak umožnily předpovědět pravděpodobné funkce dvaceti konzervovaných hypotetických proteinů u Treponema pallidum (Titz et al., 2008). Díky znalosti celogenomové sekvence bylo možné využít různé algortimy také pro predikci dosud neznámých lipoproteinů, kterých bylo u T. pallidum nakonec predikováno 46 (Setubal et al., 2006). 3.2.2
Způsob přenosu syfilis Syfilis postihuje nejčastěji sexuálně aktivní dospívající a dospělé, nebo děti
infikovaných matek, protože se přenáší sexuálně nebo kongenitálně. Nejvíce infekční jsou primární nebo sekundární léze, které obsahují velké množství treponemat. Přenos je možný také mikroskopickými abrazemi během pohlavního styku, tedy dříve než vůbec dojde k vytvoření primární léze. K dosažení 50% pravděpodobnosti infekce stačí u člověka inokulum obsahující 57 treponem (kmen Nichols), u králíků byla hodnota ID50 třiadvacet treponem v inokulu (Magnuson et al., 1956). Vzhledem ke způsobu přenosu jsou primární léze nejčastěji lokalizovány na penisu a vulvě, ale mohou být také v oblastech hůře přístupných aspekci a tudíž i včasné diagnostice (konečník, pochva, perianální oblast, dutina ústní). Léze mohou mít také atypický vzhled, zejména při koinfekci s HIV (Karumudi & Augenbraun, 2005). Problematická je také diagnostika syfilis v případě výskytu primárního vředu na atypických místech, jako je například prst ruky (Ramoni et 13
Úvod al., 2010; Starzycki, 1983). Riziko vzniku kongenitální syfilis u těhotných žen v primárním nebo sekundárním stádiu onemocnění je 30 až 80 % a je závislé na vztahu mezi délkou trvání těhotenství a délkou trvání infekce (Hollier et al., 2001). K nevenereálnímu přenosu může dojít také např. při porodu (Dorfman & Glaser, 1990), líbání nebo kojení nebo také předžvýkanou potravou (Zhou et al., 2009). 3.2.3
Epidemiologie Podle odhadu WHO bylo v roce 1999 na celém světě asi 12 miliónů nových
případů syfilis (WHO, 2001), většina z nich v rozvojových zemích, kde byla také hlavním důvodem potratů, porodů mrtvých novorozenců a úmrtí po porodu v důsledku kongenitální syfilis (Schmid et al., 2007). V devadesátých letech 20. století došlo k epidemii syfilis hlavně ve státech východní Evropy a bývalého Sovětského svazu, a to převážně u heterosexuální části populace, zatímco v USA a Kanadě docházelo k menším epidemiím převážně u homosexuálních mužů (CDC, 2011). Také v České republice se incidence syfilis od roku 1990 výrazně zvýšila z méně než 200 případů ročně na více než 1000 případů ročně v letech 2000 – 2002. V té době byla způsobena hlavně vyšším výskytem syfilis u cizinců (Pavelka et al., 2011). Největším problémem plynoucím ze zvyšující se incidence syfilis je usnadnění současné infekce virem HIV během primární nebo sekundární fáze syfilis, kdy riziko přenosu infekce je pak dvou až pětinásobně vyšší (Stamm, 2010). 3.2.4
Projevy onemocnění Syfilis je multisystémové onemocnění charakterizované primárním, sekundárním
a terciárním stádiem onemocnění. Fáze symptomatického onemocnění se střídají s fázemi latence a není vždy snadno rozpoznatelné, ve kterém stádiu pacient právě je. Během dnů až týdnů (9 – 90 dnů) po infekci dochází v místě infekce k vytvoření charakteristické tvrdé nepurulentní nebolestivé primární léze. Již velmi krátce po infekci dochází k přechodu treponem do krevního oběhu a jejich disseminaci po celém těle (Turner & Hollander, 1957), což dříve často vedlo k přenosu infekce v inkubační době krví při transfúzi (Raiziss & Severac, 1933). Již během primární syfilis prochází treponemy skrz hematoencefalickou bariéru do centrálního nervového systému, kde mohou způsobit časnou formu neurosyfilis (Golden et al., 2003; Marra et al., 2004). Sekundární stádium je projevem disseminace onemocnění. Obvykle nastává čtyři až deset týdnů po vzniku primární léze, která přitom ještě nemusí být vyhojená. Příznaky
14
Úvod jsou často proměnlivé. Časté jsou kožní projevy, vyrážka na dlaních a ploskách nohou až u 75 % pacientů, lymfadenopatie. Z dalších příznaků se může vyskytnout bolest v krku, malátnost, horečka, meningismus, myalgie, artralalgie, vypadávání vlasů, condylomata lata (Golden et al., 2003; Mindel et al., 1989). Slizniční a kožní léze se většinou spontánně vyhojí během tří až dvanácti týdnů. Pacient se stává asymptomatickým a prodělává stádium latence. Až u 25 % pacientů během následujícího roku dochází k relapsům onemocnění. K relapsu však může dojít i po pěti letech od začátku onemocnění. Více než 30 % pacientů v „The Oslo Study of Untreated Syphilis“ přešlo do terciárního stádia onemocnění (Clark & Danbolt, 1955; Gjestland, 1955). Terciární stádium je nejčastěji charakterizováno kardiovaskulárními a neurologickými komplikacemi a gummatózními lézemi, což je proliferativní nebo destruktivní granulomatózní proces, postihující kůži, kosti, slizniční povrchy a příležitostně i viscerální orgány a CNS. Velké množství informací o průběhu neléčené syfilis pochází ze studie „The Oslo Study of Untreated Syphilis“, která vznikla na základě sledování pacientů s neléčenou syfilis, kteří byli hospitalizováni v letech 1890 – 1910 na oddělení doktora Boecka v Oslu. Doktor Boeck byl přesvědčen, že tehdejší používaná léčba měla více toxických než terapeutických účinků. Proto pacienty hospitalizoval (téměř 2000 pacientů) a sledoval, dokud všechny příznaky nezmizely. V dalším sledování a hodnocení výsledků pak pokračoval i jeho následovník Brusgaard. Výsledkem sledování a statistického zpracování výsledků bylo několik studií, které významně přispěly k našim znalostem o neléčené syfilis (Clark & Danbolt, 1955; Gjestland, 1955). Jedním z těchto zjištění je, že do terciárního stádia onemocnění se dostane asi třetina neléčených pacientů a také, že většina neléčených pacientů netrpí vážnými zdravotními komplikacemi ani potížemi. 3.2.5
Laboratorní diagnostika Při laboratorní diagnostice se kombinují metody přímého průkazu T. pallidum ve
vzorku odebraném od pacienta a serologické metody nepřímého průkazu (Wicher et al., 1999). Uvedené diagnostické testy se používají také při diagnostice yaws a endemické syfilis. Metody přímého průkazu se používají pro detekci přítomnosti treponemální DNA nebo treponemat v lézi/vzorku. Přítomnost treponemat se prokazuje buď mikroskopií v temném poli, která ovšem závisí na přítomnosti dostatečného počtu bakterií, nebo citlivější a specifičtější přímou imunofluorescencí DFA-TP (direct fluorescent antibody test for T. pallidum), která využívá vazby mezi treponemami a značenými protilátkami, 15
Úvod nebo schopnosti treponemat vyvolat infekci v králíkovi (RIT - rabbit infectivity test). Přítomnost treponemální DNA se prokazuje polymerázovou řetězovou reakcí (PCR) (Marfin et al., 2001; Palmer et al., 2003; Šmajs et al., 2006) nebo real time PCR (GayetAgeron et al., 2009; Leslie et al., 2007; Tipple et al., 2011). Metodami nepřímého průkazu se pak prokazují protilátky proti treponemální infekci. Lze je rozdělit na detekci netreponemálních protilátek (detekce protilátek proti fosfolipidu – VDRL test nebo také rychlá reaginová reakce – RRR a modifikovaný RPR test)
a treponemálních
protilátek
(hemaglutinační
reakce
-
TPHA,
nepřímá
imunofluorescence - FTA-ABS, ELISA, Westernblott, Nelsonův imobilizační test – TPIT). 3.2.6
Léčba Doporučeným způsobem léčby nekomplikované primární syfilis podle CDC z roku
2010 je jedna injekční dávka (2,4 milionu jednotek) penicilinu G (benzathin penicilinu) (Workowski & Berman, 2010). 3.3
Endemické treponematózy – epidemiologie a klinické projevy
3.3.1
Yaws Původce onemocnění yaws, Treponema pallidum subsp. pertenue, byl objeven ve
stejném roce (Castellani, 1905) jako původce syfilis. Yaws je endemické onemocnění, které se vyskytuje v tropických chudých venkovských oblastech Afriky, Jižní Ameriky, Karibských ostrovů a Indonésie, kde nejčastěji postihuje děti do patnácti let. Onemocnění yaws má z nevenerických endemických treponematóz nejvyšší prevalenci v populaci. Ještě na začátku 50. let 20. století byla odhadovaná prevalence yaws více než 50 milionů případů v Africe, Asii, Střední a Jižní Americe, Indonésii a ostrovech v pacifické oblasti. Během 50. a 60. let zorganizovala WHO rozsáhlou kampaň s cílem eradikovat endemické treponematózy. Výsledkem rozsáhlé léčby penicilinem (benzathin penicilin G nebo prokain penicilin G) prevalence endemických treponematóz poklesla o 95 % na 2,5 milionu případů (Guthe, 1960). Tento přístup při dodržení intenzivního dohledu na výskyt onemocnění spolu se zapojením hygienické kontroly už v základní zdravotní péči se zdál být příslibem kompletní eradikace těchto onemocnění. Koncem 60. let byla už kontrola yaws převedena pod základní zdravotní péči. Vzhledem k selhání mnoha zemí integrovat aktivní kontrolní opatření do funkcí venkovských zdravotních služeb a obecně k problematickému přístupu k pravidelné zdravotnické péči v rozvojových zemích došlo k rozšíření ohnisek nemoci a zvýšenému přenosu nákazy zejména v oblastech s nízkými 16
Úvod hygienickými standardy (Antal & Causse, 1985; Meheus, 1985). Během 80. let se některé země pokusily obnovit kontrolní programy pro endemické treponematózy a také WHO obnovila pokusy o eradikaci yaws, které ale vzhledem k nedostatečným finančním a technickým zdrojům měly jen omezený úspěch (Meheus & Antal, 1992). Navíc se v druhé polovině 80. let do popředí zájmu dostala infekce virem HIV, jejíž léčba se stala prioritou. Yaws se v současné době vyskytuje v několika ohniscích. Za konkrétní zmínku stojí hlavně Jihovýchodní Asie (Indonésie, Timor-Leste, Papua Nová Guinea) a Afrika (Ghana, Republika Kongo). Odhadovaná prevalence yaws podle WHO v roce 1995 byla 2,5 milionů, počet aktivních onemocnění byl 460 000, z toho 400 000 případů v Africe (WHO, 1998). V současné době je prevalence yaws neznámá, protože případy onemocnění yaws již nepodléhají povinnému hlášení organizaci WHO a mnoho zemí, kde se původně yaws endemicky vyskytovala, přestalo výskyt zaznamenávat. Podle zprávy WHO bylo v roce 2005 nahlášeno 26000 případů v Ghaně a 5000 nových případů je ročně hlášeno z oblasti Jihovýchodní Asie (Rinaldi, 2008). V roce 2005 byla ve zkoumané oblasti Republiky Kongo hlášena průměrná prevalence 4,7 % a více než šestnácti tisícům obyvatel byla v návaznosti na průzkum poskytnuta zdarma léčba (Gerstl et al., 2009). V současnosti je jedinou známou oblastí výskytu yaws ve Střední a Jižní Americe Guyana (Scolnik et al., 2003), kde se stále vyskytuje ve formě latentní infekce a sporadických aktivních případů. Úspěch při eradikaci yaws byl zaznamenán v Indii, kde od roku 2004 nebyl zaznamenán žádný nový případ infekce yaws (Bora et al., 2005). Podle zprávy dr. Asiedu byly obnoveny plány pro eradikaci yaws i ve zbylých ohniscích ve světě (Asiedu, 2008). Tyto plány však nabyly konkrétní podoby až po setkání expertů na treponematózy letos v březnu (Maurice, 2012). Přestože jsou endemické treponematózy relativně snadno léčitelné jednou injekční dávkou penicilinu, je nutná přítomnost zdravotnického personálu pro podání injekce. Dále existuje problém se sterilitou jehel a tudíž přenosem virových onemocnění a také strachem dětí z injekce. Nově navržený přístup, který byl použit při léčbe yaws u dětí na Papua Nové Guinei (Mitja et al., 2012) by měl využívat léčbu azitromycinem, který lze podávat perorálně. Přístup k tomuto léčivu je ve venkovských oblastech omezený, a proto je pravděpodobnost výskytu rezistence k tomuto makrolidu nízká oproti částem světa, kde se používá mnohem častěji i k léčení jiných typů onemocnění (Lukehart et al., 2004; Marra et al., 2006; Matějková et al., 2009; Zhou et al., 2010). Bude sloužit pouze jako léčivo dané kampaně a jinak nebude používán. Všechny případy potencionální rezistence budou pečlivě zkoumány a případně léčeny jiným antibiotikem (Maurice, 2012). 17
Úvod Klinická manifestace yaws probíhá, stejně jako u syfilis, ve třech stádiích. Po inkubační době (10 dní až 3 měsíce) se v primárním stádiu v místě infekce, nejčastěji na nohou nebo hýždích, objeví papulární léze (mother yaw). Léze je svědivá, velmi bohatá na treponemy a přetrvává několik týdnů až měsíců, může přetrvat až do sekundárního stádia onemocnění. V primárním stádiu se může objevovat lokální lymfadenitida, horečka a artralgie (Antal et al., 2002). Několik týdnů po vzniku primární léze přechází onemocnění do sekundárního stádia, které se projevuje charakteristickými sekundárními lézemi, velkými rostoucími papilomy a papulami s vysoce infekčním exudátem. Mohou se objevit mukózní plaky v ústní dutině. Běžné jsou také hyperkeratózní změny na dlaních a chodidlech. Projevy onemocnění jsou závislé na klimatických podmínkách. Během období sucha jsou léze více omezeny na vlhké záhyby kůže, jako je podpaží, ústní dutina a okolí konečníku. Ve velmi suchých oblastech blízko pouště jsou projevy yaws podobné endemické syfilis. Sekundární léze se většinou vyléčí samovolně a bez jizev během týdnů až měsíců. Přibližně u 10 % osob se během pěti až deseti let od propuknutí onemocnění vyvine terciární
stádium
onemocnění,
charakterizované
destruktivními
kožními
lézemi
a deformacemi kostí a kloubů, případně jen bolestmi kostí a kloubů bez patrných zranění (Antal et al., 2002). Chronická osteitida holenní kosti vede k typickému šavlovitému tvaru holeně (saber shin), v blízkosti kloubů se mohou vytvářet uzlíky a nepravidelné depigmentované skvrny převážně v oblasti holeně, zápěstí a rukou (Antal et al., 2002). Mezi atypické formy terciární yaws patří gangosa nebo rhinofaryngitida působící perforaci a deformaci patrové nebo nosní přepážky a také goundou, deformující lézi charakterizovanou bilaterální hypertrofickou periostidou horní čelisti a nosního oblouku (Mafart, 2002). Ačkoliv k takovým případům dochází zřejmě jen zřídka i yaws může být komplikována přenosem infekce na plod, nebo zasažením kardiovaskulárního systému pacienta (Roman & Roman, 1986). Při diagnostice yaws se používají stejné testy jako u syfilis. Při léčbě se však užívá nižší dávka antibiotika než při léčbě syfilis (1,2 miliónu jednotek benzathin penicilinu G a poloviční dávka u dětí). 3.3.2
Endemická syfilis Endemická syfilis má v některých oblastech Blízkého východu a Sahelu (Gazin &
Meynard, 1988; Julvez et al., 1998; Pace & Csonka, 1984) nadále vysokou prevalenci. 18
Úvod Onemocnění se pravděpodobně přenáší orálním kontaktem – líbáním, sdílením jídla, společným nádobím. Primární (většinou malá a proto často přehlédnutá) léze se objevuje na sliznici v ústní dutině nebo nosohltanu dva až čtyři týdny po infekci často spolu se zvětšením regionálních mízních uzlin. Pacient přejde do sekundárního stádia onemocnění typicky tři až šest měsíců po infekci. Projevuje se na sliznici, kostech (osteitida a periostitida) a kůži (condylomata lata). Terciární stádium může nastat po šesti až devíti měsících od infekce nebo po dlouhých letech latence. Postižena bývá kůže (gummatózní kožní uzlíky přecházející v depigmentované jizvy s tmavými okraji), nosohltan (ulcerace, propad nosní přepážky), kosti (periostitida, zřídka změny připomínající postižení kostí u yaws) (Antal et al., 2002; Farnsworth & Rosen, 2006). 3.3.3
Pinta Pinta je nejmírnější z endemických treponematóz. Poslední známé případy se
vyskytly v Jižní Americe (Castro, 1994). Léze, které při onemocnění vznikají, jsou striktně omezeny na kůži. Neexistují důkazy o systémové infekci nebo kongenitálním přenosu onemocnění (Antal et al., 2002; Farnsworth & Rosen, 2006). Původce pinty zůstává jediným z původců lidských treponematóz, kterého se nepodařilo opakovaně pasážovat na králících (Leon-Blanco & Oteiza, 1945), a proto neexistuje typový laboratorní kmen. Nebylo tak možné provést DNA-hybridizační test, a z tohoto důvodu je původce pinty Treponema carateum stále považován za samostatný druh. 3.4
Treponematózy u primátů K treponemálnímu onemocnění jsou podobně jako lidé náchylní také ostatní
primáti. V 60. letech byl zkoumán výskyt treponematóz u paviánů (Papio cynocephalus), jako důsledek pozitivního nálezu protilátek v séru opic, které měly být použity pro imunologické studie primátů. Serologicky pozitivní na treponemální infekci byli převážně paviáni, nicméně také několik kočkodanů a šimpanzů, kteří pocházeli z různých regionů střední a západní Afriky. Tedy pocházeli z oblastí, které se překrývají s výskytem yaws. U zvířat byly pozorovány kožní jizvy a zvětšené uzliny, ale žádné specifické klinické projevy (Fribourg-Blanc & Mollaret, 1969). Výluh z lymfatických uzlin vyvolával treponemální infekci u křečků. Kmen Fribourg-Blanc, který byl izolován v roce 1966 z paviána odchyceného na území západní Afriky, byl morfologicky neodlišitelný od kmenů T. p. pallidum nebo pertenue (Fribourg-Blanc & Mollaret, 1969). U kmene Fribourg-Blanc byla experimentální infekcí dobrovolníků prokázána schopnost vyvolat infekci u člověka
19
Úvod (Smith et al., 1971). Treponematózy u primátů byly potvrzeny i v dalších případech (Cousins, 1984, 2008; Felsenfeld & Wolf, 1971; Levrero et al., 2007; Lovell et al., 2000; Meder, 1994), kdy byly klinické příznaky u zvířat podobné onemocnění yaws u člověka, nebo šlo o infekci bez klinických příznaků. Laboratorní analýza kožních vzorků potvrdila onemocnění yaws také u paviánů v africkém národním parku Gombe v roce 1989. Nicméně se tato infekce přenášela sexuálním kontaktem. Léze způsobené onemocněním se vyskytovaly v okolí genitálií obou pohlaví primárně u sexuálně aktivních dospělých. U několika jedinců byly léze tak závažné, že vedly k poškození a obstrukci močových cest a ke smrti. Skupině těchto paviánů byla poskytnuta léčba, která zabránila dalšímu šíření infekce (Wallis & Lee, 1999). Onemocnění neznámé etiologie způsobující anogenitální léze u paviánů bylo poprvé hlášeno v roce 1994 také v Národním parku Lake Manyara (LMNP). Onemocnění se svými klinickými příznaky podobalo infekci syfilis u člověka. V roce 2007 bylo vyšetřeno 41 zvířat s klinickými projevy onemocnění a 24 bez klinických příznaků. U 57 ze všech odebraných vzorků bylo provedeno histologické a histochemické vyšetření, molekulárně biologická vyšetření a séra byla testována na přítomnost protilátek proti T. pallidum. Metodou PCR byla ověřována přítomnost DNA patogenů T. pallidum, Klebsiella granulomatis, Haemophilus ducrey, Herpes virus papio 2, Pan-herpes virus. Vzorky byly pozitivní na přítomnost treponemální DNA (38 vzorků; z toho 6 od symptomatických zvířat) a virovou DNA (54 bylo pozitivních na pan-herpes virus). U izolátů pozitivních na přítomnost treponemální DNA od 3 různých jedinců byly amplifikovány a sekvenovány lokusy, u nichž byla publikována sekvenční odlišnost mezi poddruhy pallidum a pertenue. Výsledné sekvence byly nejvíce podobné sekvencím poddruhu T. p. pertenue (Knauf et al., 2012) . 3.5
Venerická spirochetóza u králíků Původcem venerické spirochetózy u králíků je Treponema paraluiscuniculi. První
zmínka o této bakterii je z roku 1912 (Ross, 1912), podrobněji pak byla popsána v roce 1913 (Bayon, 1913), kdy byla izolována z papulárního vředu na genitáliích králíka. Pro tohoto králičího patogena byl nejprve navržen název Spirochaeta paralues-cuniculi (Jacobsthal, 1920), který v roce 1921 změnil Noguchi (Noguchi, 1921) na Treponema cuniculi. Smibert (1974) označil tento organizmus jako Treponema paraluis-cuniculi. Morfologie bakteriální buňky je stejná a neodlišitelná od druhu Treponema pallidum. 20
Úvod Buňky mají tvar pravidelné šroubovice dlouhé 8 – 15 µm a tenké 0,15 µm (Hougen et al., 1973). Ani serologicky nelze druh Treponema pallidum a Treponema paraluiscuniculi (Baker-Zander & Lukehart, 1984) odlišit. Onemocnění venerickou spirochetózou se u králíků primárně projevuje zarudnutím kůže, otokem a ulcerujícími lézemi v oblasti genitálií a přenáší se sexuálním kontaktem. Léze se však také často vyskytují kolem obličeje, očí, uší, čenichu a na končetinách. Organismus je infekční také pro myši, krysy, křečky, ježky a opice. Nepřenáší se však na člověka, jak bylo prokázáno při experimentální infekci dobrovolníka v roce 1921 (Levaditi et al., 1921) a v roce 1981 (Graves & Downes, 1981). Incidence u králíků je variabilní, a to v rozmezí 10 – 50 %. Zatímco syfilis u člověka je doprovázená často různými systémovými klinickými projevy (např. kardiovaskulárními či neurologickými) (Norris et al., 2003; Singh & Romanowski, 1999), králičí spirochetóza je charakterizována spíše lokalizovanými genitálními lézemi a systémové příznaky se příliš nevyskytují. Genetické rozdíly T. paraluiscuniculi vůči Treponema pallidum subsp. pallidum, založené především na metodě WGF a rozdíly v tpr genech, jsou popsány v publikaci Strouhal et al., 2007. Celá genomová sekvence kmene T. paraluiscuniculi Cuniculi A pak byla publikována v roce 2011 (Šmajs et al., 2011). 3.6
Venerická spirochetóza u zajíců První zmínka o výskytu granulomatózních lézí na pohlavních orgánech zajíců,
připomínající syfilis u člověka, pochází z roku 1874. Nález původce onemocnění, spirálního organismu Spirocheta pallida subgenus Treponema, pochází z mnohem pozdější doby (z roku 1957), kdy byl popsán v obarvených preparátech lézí zajíců (Horvath et al., 1979). Při studiích infekcí zajíců v Maďarsku byly jen asi u patnácti z celkem 1400 odchycených zajíců nalezeny ulcerativní léze nebo hemoragické krusty na pohlavních orgánech. Jen u pěti z nich byl pozitivní nález treponem podobných Treponema pallidum při mikroskopii v temném poli (zástinu). Infekčnost izolátů z lézí byla ověřena experimentálně inokulací obsahu léze do testes králíků (Horvath et al., 1979). V jiné studii byl zkoumán výskyt treponematóz u zajíců serologickými testy. Z celkového počtu 15000 odchycených zajíců bylo vybráno 202 zkoumaných, kteří až na výjimky vykazovali léze na kůži a v okolí genitálií, nebo měli atrofii varlat. Z nich pak 27 % mělo pozitivní serologické testy na syfilis. U dvanácti zajíců s negativní serologií byl proveden test citlivosti k infekci patogenem Treponema pallidum. Léze se vyvinuly po inokulaci do varlat, ze kterých bylo následně izolováno velké množství treponemat. Při podkožní 21
Úvod aplikaci nedošlo k vytvoření lézí ani k sérokonverzi, což bylo v kontrastu s výsledky získanými u králíků (Horvath et al., 1980). Onemocnění podobné syfilis bylo popsáno také u zajíců v Německu (Kötsche & Gottschalk, 1972, 1990) a v Nizozemí, kde byla serologicky i histologicky prokázána infekce patogenem morfologicky podobným Treponema pallidum a Treponema paraluiscuniculi u dvou samců s lézemi podobnými treponemálním lézím u králíků v oblasti čumáku a genitálu (Lumeij et al., 1994). Původce treponematózy u zajíců byl prozatím předběžně označen jako Treponema paraluisleporis. Infekce byla v dané části Nizozemí (Flevoland) široce rozšířena vzhledem k séropozitivitě šedesáti procent z testovaných zvířat (celkem 100 testovaných zvířat), ale pouze tři zvířata měla genitální léze, u nichž bylo histologicky prokázáno, že způsobují syfilis. I vzhledem k předchozím výsledkům (Horvath et al., 1980) se tak zdá, že u většiny infikovaných zvířat nedojde ke vzniku klinického onemocnění. Výskyt onemocnění byl zkoumán i v dalších oblastech Nizozemska (Lumeij, 2010). Zatím není známa míra příbuznosti mezi T. paraluiscuniculi a T. paraluisleporis. Mezi králíky a zajíci nebyl zaznamenán sexuální styk, který by přenos onemocnění umožnil. Ani při pokusu o umělé oplodnění vajíčka králíka spermií zajíce a naopak, nedošlo k oplodnění. Onemocnění u zajíců má podobný průběh jako u králíků. Pro serologickou detekci onemocnění byly použity metody pro detekci syfilis využívající zkříženou hybridizaci mezi protilátkami proti T. pallidum a T. paraluisleporis, podobně jako při detekci T. paraluiscuniculi (Baker-Zander & Lukehart, 1984). 3.7
Rozdíly mezi původci endemických treponematóz a syfilis a jejich využití v praxi O tom, zda je původcem syfilis, yaws a endemické syfilis jeden druh bakterie, který
se různě přenáší a způsobuje klinicky odlišná onemocnění důsledkem odlišného klimatu (Hudson, 1963), nebo onemocnění způsobují různé blízce příbuzné, ale biologicky odlišitelné druhy (Cockburn, 1961; Turner, 1937), probíhaly dlouhé debaty. Yaws a syfilis se liší způsobem přenosu, ale i syfilis se může přenášet nevenericky. Naopak yaws se přenáší přímým kontaktem mezi dětmi a léze se vyléčí před prvním sexuálním stykem. Proto nebyl zaznamenán přenos během sexuálního styku. Způsob přenosu se tak zdá být spíše důsledkem příležitosti, než biologických vlastností těchto bakterií. Zejména sekundární léze (condylomata lata) syfilis a yaws jsou podobné a vyskytují se na podobných místech. Hlavním klinickým rozdílem mezi yaws a syfilis je treponemální infekce CNS a kongenitální přenos infekce na plod. 22
Úvod První pokusy odlišit původce onemocnění yaws a syfilis s cílem vyřešit otázku, zda je yaws jen formou syfilis, a jaký je vlastně původ syfilis, probíhaly již velmi záhy po identifikaci původců obou onemocnění (Russell, 1908). Dalším důvodem pro určení rozdílu mezi původci obou onemocnění byl hlavně výskyt současné koinfekce oběma poddruhy, a to především u těhotných žen, v oblastech, kde se výskyt syfilis a yaws překrýval. Vzhledem k tomu, že se při léčbě yaws užívá nižší dávka antibiotika než při léčbě syfilis (1,2 miliónu jednotek benzathin penicilinu G u dospělých a poloviční dávka u dětí), je správná diagnóza důležitá. U těhotné ženy léčené v dětství na yaws byla opominuta možnost infekce syfilis. Toto opominutí mělo za následek narození dítěte s kongenitální syfilis (Wilson & Mauger, 1973). Vzhledem k plánu eradikovat yaws bude také třeba kontrolovat léčbu a přítomnost původce onemocnění v populaci. Někteří autoři popisovali velmi jemné morfologické rozdíly mezi bakteriálními původci syfilis a yaws, nicméně podmínkou bylo pořídit preparáty za přesně stejných podmínek (Russell, 1908). K podobnému závěru došli i vědci, kteří později porovnávali původce yaws a syfilis po zobrazení elektronovým mikroskopem. Ačkoli nalezli strukturální rozdíly v morfologii buněk obou poddruhů, které zpracovali stejným způsobem, nepodařilo se jim identifikovat spolehlivá a opakovatelná strukturní kritéria, která by oba poddruhy odlišovala (Ovcinnikov & Delektorskij, 1970). Byla také zkoumána zkřížená imunita a antigenní zkřížené reakce mezi kmeny TPA a TPE. Z výsledků vyplývá, že lidé jsou při infekci yaws imunní vůči koinfekci syfilis. Důležitým faktorem je délka trvání onemocnění yaws (Turner, 1936). Séra pacientů s akutní yaws reagovala stejným způsobem s antigeny T. p. pallidum i antigeny T. p. pertenue (Martin et al., 1990). Ačkoliv experimentální infekce králíků různými treponemálními kmeny mají podobný klinický průběh, bylo možné na základě porovnání tří skupin králíků (každá skupina zahrnovala 20 králíků), kteří byli infikováni buď T. p. pallidum, T. p. pertenue nebo T. paraluiscuniculi, charakterizovat rozdíly mezi průběhem experimentální infekce. Při infekci T. p. pallidum měla kožní reakce u zvířat celkově intenzivnější průběh. Serologická reakce byla oproti kontrole podobná u všech tří skupin, ale u zvířat infikovaných T. p. pallidum byl zaznamenán ostřejší nástup i následný pokles hladiny protilátek (McLeod & Turner, 1946). Při kultivaci kmenů obou poddruhů ve tkáňových kulturách za aerobních podmínek bylo možné pozorovat rozdíl v počtech bakteriálních buněk, které adherovaly na buňkách tkáňové kultury. Bakteriální buňky dvou kmenů T. p. pallidum (Nichols, KKJ) adherovaly 23
Úvod k buňkám tkáňové kultury Sf1Ep ve stejném počtu jako buňky kmene Gauthier (T. p. pertenue). Časem se však počet adherovaných buněk u TPA kmenů zvyšoval, zatímco počet adherovaných bakterií kmene Gauthier zůstával stejný, nebo se zvýšil mnohem méně než u TPA kmenů. Podobně jako kmen Gauthier adheroval k buňkám v tkáňové kultuře také opičí kmen Fribourg-Blanc (Fieldsteel et al., 1979). Určité drobné variace mezi kmeny TPA a TPE bylo možno pozorovat i při rozdělení všech treponemálních proteinů metodou dvourozměrné gelové elektroforézy. Tyto rozdíly však měly charakter spíše kvantitativní než kvalitativní (Thornburg & Baseman, 1983). Podobné výsledky byly získány také metodou „lactoperoxidasecatalyzed surface iodination“, kdy povrchové proteiny T. p. pallidum byly silně značené, zatímco odpovídající proteiny T. p. pertenue byly označené pouze slabě (Thornburg & Baseman, 1983). Při zkoumání míry genetické příbuznosti mezi patogenními i pěti kultivovatelnými treponemálními kmeny byla sekvenční homologie mezi T. pallidum, T. phagedenis a T. refringens, zjištěná metodou DNA-DNA hybridizace, menší než 5 % (Miao & Fieldsteel, 1978). V kontrastu s tímto výsledkem je pak genetická příbuznost původců syfilis a yaws, jejichž DNA byla podle stejné metody identická v rámci 2% rozlišovací schopnosti metody. Na základě těchto výsledků byly původní druhy Treponema pallidum a Treponema pertenue reklasifikovány na poddruhy T. p. pallidum a T. p. pertenue (Miao & Fieldsteel, 1980). Následně byly nalezeny některé konkrétní genetické rozdíly mezi oběma poddruhy. Při studiu antigenů T. pallidum (Noordhoek et al., 1989) se zdála reakce protilátek na protein TpF1 u séra syfilických pacientů vyšší oproti reakci séra pacientů s yaws. Při bližším zkoumání důvodů pro signifikantní rozdíly v reaktivitě syfilitických sér a sér pacientů s yaws s proteinovým antigenem T. pallidum o velikosti 190 kDa bylo po sekvenaci genů tpf1 a tyf1 (TP1038) zjištěno, že se liší jedním nukleotidovým rozdílem a jimi kódované proteiny označené TyF1 u T. p. pertenue kmene CDC 2575 se liší jednou aminokyselinou od obdobného proteinu T. p. pallidum označeného TpF1. Nicméně reaktivita protilátek k oběma antigenům, vzájemně se lišícím jen jednou aminokyselinou, byla příliš variabilní, než aby byla použitelná v serologické diagnostice. Ani další studie s monoklonálními protilátkami proti antigenům T. p. pallidum neprokázaly rozdíl mezi reaktivitou antigenů T. p. pallidum a antigenů T. p. pertenue (Noordhoek et al., 1990). Jedním z antigenů, který poskytoval signifikantní ochranu proti infekci syfilis u králíků, je glycerolfosfodiesterfosfodiesteráza (Gpd). Při sekvenaci genu kódujícího tento 24
Úvod protein (TP0257) byla nalezena jednonukletidová substituce mezi sekvencí TPA kmenů a TPE i TEN kmenů. Změna nezpůsobila záměnu aminokyseliny a je ji možné detekovat pomocí RFLP analýzy s využitím restrikčního enzymu PleI. V sekvenci genu kmene TPc Cuniculi A bylo nalezeno celkem 6 substitucí (Cameron et al., 1999). Vzhledem k silné imunogenitě lipoproteinu o velikosti 15 kDa během treponemální infekce, byla zkoumána jeho úloha v protektivní imunitě před syfilis a sekvence genu (TP0171) kódujícího tento protein u různých kmenů T. p. pallidum, pertenue, endemicum, T. paraluiscuniculi a opičího izolátu Fribourg-Blanc. Bylo zjištěno, že sekvence genu je u všech zkoumaných kmenů identická, až na jednu tichou nukleotidovou substituci u T. paraluiscuniculi (Centurion-Lara et al., 1997). Jedna nukleotidová záměna je u všech kmenů TPA před ORF kódujícím tento lipoprotein a u kmenů T. paraluiscuniculi je jedna nukleotidová záměna za tímto genem. K odlišení TPA kmenů od TPE a TEN kmenů a také kmenů T. paraluiscuniculi lze tak využít analýzu restrikčních fragmentů (Centurion-Lara et al., 1998). Dalším proteinem, který vykazoval sekvenční shodu v rámci kmenů TPA a odlišnosti mezi kmeny TPA, TPE a T. paraluiscuniculi je Tp92, antigen o velikosti 92 kDa, který je pravděpodobně proteinem vnější membrány (Cameron et al., 2000). Harper et al., 2008b při pokusu objasnit původ syfilis sekvenovali 21 oblastí. Mezi nimi některé dosud nezkoumané lokusy. Celkem identifikovali 17 SNP odlišující TPA, TPE a TEN kmeny . Na základě těchto výsledků pak určili původ syfilis. Nicméně počet hodnocených SNP byl pro takovéto závěry příliš malý. Navíc jako tzv. „outgroup“ byl pro fylogenetickou analýzu použit kmen Treponema paraluiscuniculi. Fylogenetických vztah tohoto druhu k druhu Treponema pallidum však není známý (Mulligan et al., 2008). Odpověď na otázku původu syfilis by mohly poskytnout celogenomové sekvence několika kmenů poddruhů pertenue a endemicum (Harper et al., 2008b; Mulligan et al., 2008). Nejvíce odpovědí by pak poskytla analýza treponemální DNA izolované z kosterních pozůstatků nesoucích stopy proběhlé treponemální infekce. Nicméně úspěšnou izolaci treponemální DNA z 200 let starých kosterních pozůstatků (Kolman et al., 1999) se nepodařilo v dalších studiích úspěšně zopakovat (Bouwman & Brown, 2005; von Hunnius et al., 2007). Metoda pro odlišení jednotlivých poddruhů Treponema pallidum byla publikována v roce 2006 (Centurion-Lara et al., 2006). Kromě kombinace již uvedených odlišujících genetických změn bylo využito charakteristických rozdílů v genech tprC a tprI při RFLP analýze, která umožnila odlišit rovněž kmen Fribourg-Blanc. 25
Úvod Detekce rozdílů mezi genomy kmenů TPA (Nichols, SS14, DAL-1, Mexico A), TPE (Samoa D, CDC-2, Gauthier) a genomem nespecifikovaného opičího izolátu byla popsána v práci (Mikalová et al., 2010). Detekce byla provedená s využitím metody fyzikálního mapování - whole genome fingerprinting. Na tuto studii navazovala práce porovnávající celogenomové sekvence tří kmenů poddruhu pertenue (Samoa D, CDC-2, Gauthier) v rámci poddruhu a kmeny poddruhů pallidum (Nichols, SS14, DAL-1, Chicago) a pertenue (Čejková et al., 2012). Nalezené rozdíly lze dále využít pro rozlišení původců syfilis, yaws a endemické syfilis pomocí molekulárně biologických metod. První praktický případ využití molekulárně biologické techniky pro identifikaci původce kožního onemocnění u desetiletého chlapce byl popsán roce 2011. Původcem infekce byl druh Treponema pallidum. Amplifikací a sekvenací lokusů obsahujících specifické změny mezi kmeny TPA a TPE byla potvrzena diagnóza onemocnění yaws (Pillay et al., 2011). Vzhledem k problémům při kultivaci patogenních treponem nebylo možné při jejich zkoumání použít většinu molekulárně biologických technik. I po stech letech od identifikování původců syfilis a yaws nejsou mechanismy jejich patogeneze a virulence stále přesně objasněny. Sekvenace genomů původců syfilis a yaws tak pomohla zjistit variabilitu mezi genomy kmenů jednotlivých poddruhů (Matějková et al., 2008; Pětrošová et al., 2012; Zobaníková et al., 2012). Porovnání genomů obou poddruhů následně odhalilo geny s velkou mírou pravděpodobnosti zodpovědné za odlišnou klinickou manifestaci syfilis a yaws (Čejková et al., 2012). 3.8
Geny, lišící se u většiny kmenů T. pallidum a jejich využití při typizaci kmenů Výrazně odlišné sekvence některých genů lze nalézt mezi kmeny jednoho poddruhu
i v rámci jediného kmene. Oblastmi s největšími genetickými rozdíly mezi kmeny patogenních treponemat T. pallidum i T. paraluiscuniculi jsou tpr geny (T. pallidum repeat). Geny tpr tvoří dvanáctičlennou rodinu genů (Centurion-Lara et al., 1999; Fraser et al., 1998; Stamm et al., 1998), jejichž sekvence jsou homologní ke genu pro protein Msp (major surface protein) druhu Treponema denticola. Protein Msp je vysoce imunogenní protein vnější membrány, který umožňuje vazbu bakterie T. denticola na fibronectin, laminin a fibrinogen (Haapasalo et al., 1992), a je tak z velké míry odpovědný za interakci bakterie s buňkami hostitele (Fenno et al., 1996). Nicméně funkce Tpr proteinů, kromě TprK, zatím není známá, ale předpokládá se jejich podíl na virulenci bakterie Treponema pallidum. Podle sekvenční homologie se rozdělují do tří skupin, do podrodiny I (TprC, 26
Úvod TprD, TprF, TprI), podrodiny II (TprE, TprG, TprJ) a podrodiny III (Tpr A, TprB, TprH, TprK, TprJ). Geny tpr, jejich evoluce , míra jejich exprese v rámci jednoho kmene i mezi různými kmeny (Giacani et al., 2005; Giacani et al., 2007b; Gray et al., 2006) a jimi kódované proteiny, jejich vliv na imunitní odpověď organismu a možné využití pro vakcínu proti syfilis (Anand et al., 2012; Giacani et al., 2005; Morgan et al., 2003) byly a jsou u různých kmenů T. pallidum intenzivně zkoumány. U T. paraluiscuniculi bylo nalezeno pět tpr genů nefunkčních v důsledku posunové nebo nesmyslné mutace (tprC, tprD, tprG1 a tprG2, tprG/I) (Giacani et al., 2004; Strouhal et al., 2007; Šmajs et al., 2011). Nejintenzivněji zkoumaný je protein vnější membrány TprK. Tento protein je charakteristický heterogenitou v rámci kmene a změnami sekvence ve variabilních oblastech, k nimž dochází v průběhu infekce. To pravděpodobně umožnuje bakterii unikat imunitnímu systému (Centurion-Lara et al., 2000a; Centurion-Lara et al., 2004; Giacani et al., 2012; LaFond et al., 2003; LaFond et al., 2006a; LaFond et al., 2006b; Morgan et al., 2002). K dalším genům variabilním i v rámci kmenů jednoho poddruhu patří TP0433 (arp gen) s proměnlivým počtem repetitivních sekvencí o délce 60 bp. Analýza restrikčních fragmentů tří tpr genů (tprE,G,J) v kombinaci s analýzou počtu repetitivních sekvencí v arp genu je používána jako typovací systém původců syfilis T. pallidum subsp. pallidum (Pillay et al., 1998). Tento systém byl později rozšířen o RFLP analýzu genu tprC, o určení alely genu tprD v odpovídajícím lokusu, o detekci inzerce 51 bp v oblasti mezi geny TP0126 a TP0127 a analýzu dalšího genu velmi variabilního i mezi kmeny jednoho poddruhu, genu TP0548 (Marra et al., 2010). Genu TP0548 spolu s genem TP0136 bylo pro typizaci klinických izolátů použito poprvé roku 2006 (Flasarová et al., 2006). Později byl tento typovací systém rozšířen i o detekci mutací v genu pro 23S rRNA, vedoucích k rezistenci k makrolidovým antibiotikům (Flasarová et al., 2012). Detekce rezistence k makrolidům bylo použito nezávisle i jinými autory v kombinaci s typovacím systémem z roku 1998 (Martin et al., 2009a; Martin et al., 2010b; Martin et al., 2009b). Gen TP0136 rovněž patří ke skupině genů variabilních mezi kmeny T. pallidum. U odpovídajícího proteinu byla prokázána lokalizace ve vnější membráně, vazba na lidský fibronektin a schopnost indukovat tvorbu částečně protektivních protilátek (Brinkman et al., 2008).
27
Cíle práce
4 CÍLE PRÁCE 1. Stanovit kompletní sekvenci genomu Treponema pallidum subsp. pertenue Samoa D 2. Identifikovat specifické rozdíly mezi genomy původců syfilis a yaws a nalézt geny způsobující rozdílnou klinickou manifestaci obou onemocnění 3. Určit variabilitu mezi genomy kmenů
Treponema pallidum a Treponema
paraluiscuniculi 4. Stanovit a anotovat sekvenci chromozomu treponemálního opičího izolátu FribourgBlanc a identifikovat rozdíly vůči kmenům Treponema pallidum subsp. pertenue 5. Analyzovat genom Treponema pallidum subsp. pallidum DAL-1 a identifikovat rozdíly vůči referenčnímu kmeni Nichols 6. Nalézt změny specifické pro jednotlivé druhy a poddruhy v lokusech kódujících ribozomální RNA 7. Porovnat celogenomové sekvenační metody CGS, pyrosekvenování a metodu Illumina
28
Materiál a metody
5 MATERIÁL A METODY 5.1
Použité kmeny rodu Treponema V této práci byla použita DNA jednadvaceti patogenních kmenů rodu Treponema
a třicetipěti klinických vzorků. Mezi laboratorními kmeny bylo jedenáct kmenů Treponema pallidum subsp. pallidum, pět kmenů Treponema pallidum subsp. pertenue, dva kmeny Treponema pallidum subsp. endemicum, nespecifikovaný opičí izolát FribourgBlanc, kmen Treponema paraluiscuniculi Cuniculi A a izolát Treponema paraluisleporis. Seznam těchto kmenů a jejich původ je uveden v tabulce 2. 5.2
Izolace DNA laboratorních kmenů treponemat Kmeny treponemat byly udržovány pasážováním v králičích testes. Byly použity
dva postupy izolace chromozomální DNA. První postup odpovídá protokolu, který byl použit při sekvenaci kmene Nichols v roce 1998 (Fraser et al., 1998), kdy byl z extraktu testikulární tkáně získán pelet buněk T. pallidum. Dále byly bakteriální buňky separovány od králičích buněk nelineární gradientovou centrifugací v látce Hypaque, jak bylo popsáno jíž dříve (Baseman et al., 1974). Chromozomální DNA byla izolována z lyzovaných buněk podle standardního postupu s využitím extrakce DNA směsí fenol-chloroformisoamylalkohol a přesrážení DNA ethanolem (Fraser et al., 1998). Při druhém postupu byl kousek tkáně králičích varlat vložen do 100 µl fosfátového pufru (PBS) a byl třepán po dobu 30 minut. Vzorek byl pak centrifugován při nízkých otáčkách 100 g po dobu 5 minut. Odebraný supernatant byl znovu centrifugován při 100 g dalších 5 minut. Tento krok byl zopakován celkem 5 krát, aby byla odstraněna většina eukaryontních buněk. Bakteriální pelet byl pak přímo použit při celogenomové amplifikaci DNA (whole genome amplification – WGA) s využitím kitu REPLI-g (REPLIg Midi Kit, Qiagen, Hilden, Germany) podle návodu výrobce. Způsob izolace DNA jednotlivých kmenů je uvedený v tabulce 2. U některých kmenů byly použity oba způsoby. V případě zvýšené potřeby, byla DNA po izolaci ještě dodatečně amplifikována metodou WGA.
29
Materiál a metody Tabulka 2. Použité treponemální kmeny kmen
druh/ poddruh
místo izolace
rok izolace
citace v literatuře
zdroj
DNA použitá v analýzách
Bosnia A
TEN
Bosna a Hercegovina
1950
(Turner & Hollander, 1957)
Sylvia M. Bruisten, PHL, Amsterdam, NL
non-WGA
Iraq B
TEN
Irák
1951
(Turner & Hollander, 1957)
Kristin N. Harper, EU, Atlanta, GA, USA
WGA
Bal 73-1
TPA
Baltimore, USA
1968
(Hardy et al., 1970)
David L. Cox, CDC, Atlanta, GA, USA
WGA
DAL-1
TPA
Dallas, USA
1991
(Wendel et al., 1991)
David L. Cox, CDC, Atlanta, GA, USA
WGA
Grady
TPA
Atlanta, USA
198089
?
David L. Cox, CDC, Atlanta, GA, USA
WGA
Haiti B
TPA
Haiti
1951
(Turner & Hollander, 1957)
David L. Cox, CDC, Atlanta, GA, USA
WGA
Madras
TPA
Madras, India
1954
Laboratorní deník Roba George, CDC
David L. Cox, CDC, Atlanta, GA, USA
WGA
Mexico A
TPA
Mexico City, Mexico
1953
(Turner & Hollander, 1957)
David L. Cox, CDC, Atlanta, GA, USA
WGA
MN-3
TPA
Minnesota, USA
?
?
David L. Cox, CDC, Atlanta, GA, USA
WGA
Nichols
TPA
Washington, D.C., USA
1912
(Nichols & Hough, 1913)
Steven J. Norris, UT, Houston, TX, USA
non-WGA, WGA
Philadelphia 1
TPA
Philadelphia, USA
1988
?
David L. Cox, CDC, Atlanta, GA, USA
WGA
Philadelphia 2
TPA
Philadelphia, USA
?
?
David L. Cox, CDC, Atlanta, GA, USA
WGA
SS14
TPA
Atlanta, USA
1977
(Stamm et al., 1983)
Steven J. Norris, UT, Houston, TX, USA
non-WGA
CDC-1
TPE
Dersuso, Ghana
1980
(Liska et al., 1982)
David L. Cox, CDC, Atlanta, GA, USA
WGA
CDC-2
TPE
Akorabo, Ghana
1980
(Liska et al., 1982)
Steven J. Norris, UT, Houston, TX, USA
non-WGA, WGA
Gauthier
TPE
Brazzaville, Congo
1960
(Gastinel et al., 1963)
Steven J. Norris, UT, Houston, TX, USA
WGA
Samoa D
TPE
Samoa
1953
(Turner & Hollander, 1957)
Steven J. Norris, UT, Houston, TX, USA
non-WGA
Samoa F
TPE
Samoa
1953
(Turner & Hollander, 1957)
Steven J. Norris, UT, Houston, TX, USA
WGA
Cuniculi A
TPc
?
před rokem 1957
(Turner & Hollander, 1957)
Steven J. Norris, UT, Houston, TX, USA
non-WGA
paraluisleporis
Nizozemí
1993
(Lumeij et al., 1994)
J. T. Lumeij, Utrecht University, Utrecht, Holandsko
WGA
neklasifikovaný opičí izolát
Guinea
1966
(Fribourg-Blanc & Mollaret, 1969)
David L. Cox, CDC, Atlanta, GA, USA
WGA
Fribourg-Blanc
? – informace není známa WGA – celogenomově amplifikovaná DNA Non-WGA – neamplifikovaná DNA
30
Materiál a metody
5.3
Základní principy použitých celogenomových sekvenačních metod • Komparativní genomová sekvenace (CGS). Metoda je založena na hybridizaci testované DNA s oligonukleotidovým čipem. V první fázi metody probíhá porovnání účinnosti hybridizace referenční a testované DNA k sondám oligonukleotidového čipu, které byly vytvořeny podle referenční DNA. Nehybridizující sondy ukazují na místa, kde se sekvence genomů liší. V druhé fázi dochází k resekvenaci těchto oblastí pomocí oligonukleotidových sond. Výsledkem sekvenace je seznam rozdílů mezi testovanou a referenční sekvencí. K sekvenaci neznámého genomu je nutná znalost sekvence genomu blízce příbuzného (odlišnost do 5 % při mapování mutací). Tento přístup vyžaduje relativně velké vstupní množství DNA (5 – 10 µg), je rychlý (dny – týden), identifikuje
až
97
%
všech
SNP
v unikátní
oblasti
genomu
(www.NimbleGen.com). Není ale vhodný pro hypervariabilní a repetitivní oblasti, kde dochází ke zkřížené hybridizaci, a správnost výsledků je závislá na správnosti referenční sekvence. • Pyrosekvenování 454 (Margulies et al., 2005). Metoda je založena na principu sekvenování při syntéze replikovaného řetězce (sequencing-by-synthesis) na kuličce v pikotitrační destičce. Při pyrosekvenační reakci syntetizuje polymeráza řetězec DNA. Při inkorporaci nukleotidu dochází k uvolnění pyrofosfátu, což vede k tvorbě ATP a následně k emisi světelného kvanta, jehož objem odpovídá počtu inkorporovaných nukleotidů. Klíčovým krokem je klonální amplifikace fragmentů DNA knihovny na kuličkách, která probíhá v micele při emulzní PCR. Každá micela obsahuje jednořetězcovou DNA navázanou na kuličku a reagencie pro PCR. Výsledkem jsou kuličky s přichycenými miliony (asi 107 kopií) řetězců identické DNA. Metoda potřebuje nízké množství vstupní DNA (100 ng) a umožňuje vyšší pokrytí (coverage) každé baze sekvenačními čteními (ready), což zvyšuje přesnost metody (99,5 %, Roche Diagnostics GmbH, 2008). Délka sekvenačních čtení je 100 – 500 bp. Proto není metoda vhodná pro dlouhé repetitivní nebo paralogní sekvence. Navíc intenzita světelných signálů emitovaných při začleňování nukleotidů do prodlužujícího se řetězce DNA je lineární pouze do osmi za sebou jdoucích stejných nukleotidů, proto dochází k častějším chybám v oblasti homopolymerů.
31
Materiál a metody • Technologie Solexa/Illumina (Bennett, 2004). Metoda je založena na principu sekvenování při syntéze replikovaného řetězce přímo na povrchu sekvenační destičky (flow cell). Fragmenty DNA jsou přichyceny na povrch sekvenační destičky, kde jsou mnohonásobně amplifikovány. Při vlastní sekvenaci jsou přidány primery ve směsi s DNA polymerázou a fluorescenčně značenými nukleotidy. Nukleotidy jsou na 3'-konci modifikovány tak, že způsobují vratné ukončení prodlužujícího se řetězce DNA. Je tak zajištěno, že se řetězec v každém cyklu prodlouží právě o jednu bazi. Následuje zachycení obrazu baze a odblokování 3'-konce. Tyto kroky se opakují a řetězec se prodlužuje o další baze až do zachycení celé sekvence. Metoda vyžaduje nízké množství vstupní DNA (100 ng) a umožňuje vysoké pokrytí každé baze, takže deklarovaná přesnost metody je 99,99 % (Illumina, 2008). Maximální délka sekvenačních čtení byla 36 bp, proto také nebyla vhodná pro repetitivní nebo paralogní sekvence. 5.4
Sekvenace a kompletace genomu kmene Samoa D Chromozom kmene Samoa D byl nejprve pyrosekvenován na sekvenátoru GS20
(454 Life Science, Branford, Connecticut, USA) v sekvenačním centru Human Genome Sequencing Center (Baylor College of Medicine, Houston, Texas, USA) a paralelně také metodou CGS (NimbleGen, Madison, WI, USA). DNA kmene Samoa D pro sekvenaci metodou CGS a pyrosekvenaci připravila kolegyně P. Pospíšilová. Pyrosekvenování bylo provedeno na přístroji GS20 (454 Life Sciences Corporation, Branford, CT, USA), průměrná délka sekvenačních čtení byla 100 bp a průměrné pokrytí jedné baze 27x. Sekvenační čtení byla složena pomocí softwaru Newbler assembler do 154 kontigů, které byly po přiložení k referenční sekvenci Nichols a odfiltrování kontaminujících sekvencí složeny do výsledných 45 kontigů. Sekvenace genomu Samoa D metodou CGS byla provedena stejně jako pro kmen SS14 (Matějková et al., 2008). Nalezené sekvenční změny odhalené metodou CGS a konsenzuální sekvence získané Sangerovým sekvenováním jsem převzala ke kompletaci genomu kmene Samoa D. Srovnáním kontigů získaných oběma metodami k referenční sekvenci Nichols v softwaru Lasergene (DNASTAR, Madison, WI, USA) byly identifikovány mezery v dočasné sekvenci Samoa D i diskrepance mezi oběma sekvenačními metodami. Pro tyto rozdíly a mezery bylo použito Sangerovo sekvenování. V softwaru Primer3 (Rozen 32
Materiál a metody & Skaletsky, 2000) byly navrženy primery tak, že výsledný amplifikovaný fragment DNA měl 650 – 800 bp a diskrepance nebo mezera byla vzdálena alespoň 150 bp od konce tohoto fragmentu. Nově bylo navrženo celkem 339 párů primerů a 1 primer do páru s již používaným primerem pro CDC-2 a ty pak byly použity spolu se 13 primery určenými k sekvenaci CDC-2. Primery (tabulka S1) byly použity k amplifikaci DNA Taqpolymerázou a vytvoření PCR produktů. Výsledné PCR produkty byly purifikovány pomocí QIAquick PCR Purification Kitu (QIAGEN, Hilden, Německo) nebo kitu ExoSapIT (Affymetrix, Santa Clara, CA, USA) a sekvenovány s využitím Taq DyeDeoxy Terminator Cycle Sequencing Kitu (Applied Biosystems, Foster City, CA, USA). Z důvodů vysoké sekvenční podobnosti mezi paralogními skupinami tpr genů byly tyto geny sekvenovány s využitím XL PCR produktů. Tyto XL PCR produkty připravil a osekvenoval Michal Strouhal. Tímto způsobem zkompletovaná sekvence Samoa D byla resekvenována na přístroji Illumina Genome Analyzer (Illumina, San Diego, CA, USA) v Human Genome Sequencing Center (Baylor College of Medicine, Houston, Texas, USA). Získaná sekvenační čtení byla složena do 230 kontigů pomocí softwaru Velvet assembler (Zerbino & Birney, 2008), které byly po přiložení k referenční sekvenci a odfiltrování kontaminujících sekvencí složeny do výsledných 195 kontigů. Výsledná
sekvence
byla
použita
k hodnocení
chyb
jednotlivých
metod
a k porovnání s dalšími genomy nekultivovatelných patogenních treponemat. 5.5
Anotace genomu Samoa D Vzhledem k době uplynulé od anotace prvního sekvenovaného genomu T. p. subsp.
pallidum Nichols byla provedena anotace genomu Samoa D de novo. Pro predikci otevřených čtecích rámců (ORF) byly nezávisle použity programy FgenesB (Softberry Inc., New York, USA), GeneMark (Lukashin & Borodovsky, 1998) a Glimmer (Delcher et al.,
1999).
Anotace
probíhala
poloautomaticky
s využitím
systému
Genboree
(www.genboree.org) a databáze CONAN (Highlander et al., 2007; McLeod et al., 2004) sekvenačního centra Human Genome Sequencing Center (Baylor College of Medicine, Houston, Texas, USA). K predikci genů pro tRNA, rRNA a jiných nekódujících RNA byly použity tRNAscan (Lowe & Eddy, 1997), RNAmmer (Lagesen et al., 2007) and Rfam (Gardner et al., 2009). K porovnání sekvencí DNA byly použity algoritmy BLASTN a BLASTX, proteinové sekvence byly analyzovány s použitím algoritmu BLASTP spolu s databází v NCBI (Sayers et al., 2010). Pro hypotetické proteiny s neznámou funkcí byla stanovena limitní minimální délka genu 150 bp. Predikce a anotace každého genu byla 33
Materiál a metody zkontrolována vždy dvěma členy anotační skupiny (celkem 10 osob). Pokud se oba v anotaci jednoho genu neshodovali, byla anotace vzájemně diskutována. Pro většinu genů ortologních ke genům, které byly predikovány i v genomu Nichols, byla u TPE genů zachována hodnota locus tag. Pro nově anotované geny byla použita hodnota locus tag předcházejícího genu spolu s koncovkou a,b nebo c. Takto získaná anotace byla vložena do databáze GeneBank, kde proběhly poslední úpravy anotace. Anotace genomu Samoa D byla dále v upravené podobě použita pro další nově sekvenované genomy CDC-2, Gauthier, DAL-1 (D. Čejková), Fribourg-Blanc a částečně i Cuniculi A. U kmene Cuniculi A byla zkombinována (D. Šmajs, D. Čejková) s automatickou anotační metodou používanou v sekvenačním centru The Genome Center at Washington University (Human Microbiome Consortium, 2010). 5.6
Ověření genomové sekvence metodou whole genome fingerprinting (WGF) Pro ověření sekvence výsledných genomů (Samoa D) bylo provedeno srovnání
fragmentů získaných metodou WGF a analýzy restrikčních fragmentů sekvenovaného genomu in silico. K analýze všech amplikonů byly vždy použity tři restrikční enzymy BamH I, EcoR I a Hind III. Použití dalších restrikčních enzymů bylo variabilní a záviselo na délce restrikčních fragmentů a přítomnosti restrikčních míst v sekvenci (Mikalová et al., 2010; Strouhal et al., 2007). 5.7
Srovnání celogenomových sekvenačních metod CGS, pyrosekvenace, Illumina. Kontigy metody CGS, pyrosekvenování a Illumina byly srovnány ke konsenzuální
sekvenci Samoa D v softwaru Lasergene (DNASTAR, Madison, WI, USA). Chyby byly počítány na úsecích pokrytých kontigy všech tří metod, kromě oblastí kódujících tpr geny, rRNA a geny arp a TP0470. Do chyb CGS nebyly počítány ty, které vznikly v důsledku chyb v referenčním genomu Nichols (AE00520). 5.8
Sekvenace paralogních genů tpr a repetic v genomech Gauthier a FribourgBlanc Vzhledem k vysoké sekvenční příbuznosti mezi tpr geny (Treponema pallidum
repeat) byly k amplifikaci těchto genů využity odpovídající tzv. TPI (Treponema pallidum interval) oblasti (TPI11-tprC, TPI12 - tprD , TPI25A – tprE , TPI25B – tprF a tprG, TPI48 – tprI a tprJ, TPI78 – tprL), které byly amplifikovány s využitím GeneAmp®XL PCR Kitu (Applied Biosystems, Foster City, CA, USA) (Strouhal et al., 2007). XL PCR produkty
34
Materiál a metody byly purifikovány pomocí QIAquick PCR Purification Kitu (QIAGEN, Hilden, Německo) a sekvenovány s využitím Taq DyeDeoxy Terminator Cycle Sequencing Kitu (Applied Biosystems, Foster City, CA, USA) se sadami interních primerů. Podobným způsobem byla u kmene Fribourg-Blanc sekvenována také problematická oblast TPI71A (8762 bp), která nebyla zahrnuta ve vzorcích určených k celogenomovému sekvenování. Pro sekvenaci genů tprK (TP0897), arp (TP0433) a TP0470 byly odpovídající XL PCR produkty klonovány pomocí TOPO klonování do vektoru pCR2.1-TOPO (Invitrogen, Carlsbad, CA, USA). Sekvence byla získána nejméně ze tří nezávislých klonů v případě TP0433 a TP0470 a z deseti nezávislých klonů v případě tprK. Sekvenaci TPI11, TPI25A, TPI48, TPI78, TP0433, TP0470 a tprK u kmene Fribourg-Blanc provedly kolegyně Lenka Ambrožová a Petra Pospíšilová. Hotové sekvence TPI oblastí získané z genomu kmene Gauthier byly předány kolegyni D. Čejkové k sestavení celogenomové sekvence. 5.9
Sekvenace homopolymerních oblastí v genomech Samoa D a Fribourg-Blanc Některé sekvence PCR produktů obsahující oblasti G a C homopolymerů
vykazovaly heterogenitu. Pro tyto úseky jsem navrhla amplifikaci Pfu polymerázou (Fermentas Inc., Glen Burnie, Maryland, USA) ve směsi: 5 µl 10x Pfu pufru s 20 mM MgSO4, 1 µl dNTP mixu (každý nukleotid v 10 mM koncentraci), 1 µl DNA (1-5 ng/µl), 41 µl vody pro PCR, 1 µl Pfu DNA polymerázy za těchto podmínek: 94 °C po dobu 1 minuty, dále 30 cyklů: 94 °C po dobu 1 minuty, 60 °C po 30 s, 72 °C po 1 minutu, závěrečná syntéza při 72 °C po 10 minut. Po ukončení PCR reakce, byly ke vzorku přidány 0,2 µl Taq polymerázy a následovala inkubace 10 min při 72 °C. Po vytvoření A-konců byly PCR produkty ihned klonovány do vektoru pCR2.1-TOPO (Invitrogen, Carlsbad, CA, USA). Plazmidy s vloženou sekvencí kmene Samoa D, izolované pomocí QIA Kitu (QIAGEN, Hilden, Německo) o koncentraci 100 – 300 ng/µl, byly nejprve 100x naředěny a amplifikovány pomocí kitu TempliPhi (GE Healthcare, Life Science, Piscataway, New Jersey, USA). Plazmidy pak byly sekvenovány s využitím univerzálních primerů z kitu TOPO® TA Cloning® Kit. U Samoa D bylo 9 variabilních úseků a u kmene FribourgBlanc bylo 11 variabilních úseků. Podobným způsobem byly sekvenovány úseky bohaté na homopolymery také u genomů CDC-2 a Gauthier (D. Čejková). V případě, kdy byl počet G nebo C v daném úseku u jednotlivých klonů variabilní, byl počet nukleotidů v homopolymeru určen podle počtu klonů se stejným počtem nukleotidů v homopolymeru.
35
Materiál a metody 5.10
Sestavení genomové sekvence kmene Fribourg-Blanc Genom kmene Fribourg-Blanc byl sekvenován metodami pyrosekvenování
s využitím Roche/Genome Sequencer FLX System (454 Life Sciences, Branford, CT, USA) a metodou Illumina s využitím přístroje Illumina/Solexa Genome Analyzer (Illumina, San Diego, CA, USA) v sekvenačním centru Washington University School of Medicine (St. Louis, MO, USA). Pro získání kompletní nukleotidové sekvence kmene Fribourg-Blanc byla zvolena metoda, označená jako „pooled segment genomic sequencing“, PSGS. Metoda umožnila rozdělit celý genom do čtyř vzorků značených charakteristickou sekvencí, tzv. MID sekvencí. Geny byly rozděleny do různých vzorků tak, aby se v jednom vzorku nenacházely paralogní geny nebo identické sekvence rrn operonů. Přítomnost charakteristického MID v dílčí sekvenci pak umožnila přiřazení sekvenačního čtení k příslušné podoblasti. (Pozn.: V době přípravy vzorků pro kmeny Fribourg-Blanc nebyla ještě k dispozici možnost použít MID sekvence pro sekvenování metodou Illumina, proto vzorky nebyly indexovány). Průměrná délka sekvenačních čtení získaných pyrosekvenováním byla 230 bp a jedna baze byla pokryta (coverage) průměrně 70x. Čtení, která nebyla rozlišována podle MID sekvence, byla složena do 94 kontigů softwarem Newbler assembler. V případě, kde byla čtení podle příslušné sekvence MID přiřazena k příslušné podoblasti, bylo získáno celkem 43 kontigů. Délka sekvenačních čtení získaných zmetody Illumina byla 35 bp, jedna baze byla průměrně pokryta 465x. Čtení byla složena do 166 kontigů softwarem Velvet assembler 0.6 (Zerbino & Birney, 2008). Kontigy získané oběma metodami byly srovnány k referenční sekvenci kmene CDC-2
v softwaru
Lasergene
(DNASTAR,
Madison,
WI,
USA).
Diskrepance
identifikované mezi metodami a mezery mezi kontigy byly navrženy k Sangerově sekvenaci. K Sangerově sekvenaci bylo celkem navrženo 85 oblastí, pro které byly navrženy primery a které byly sekvenovány metodou DDT (Mikalová, Strouhal). Z kontigů pyrosekvenování, Illuminy, TPI oblastí zahrnujících tpr geny, TPI71A, repetitivních oblastí, kontigů získaných sekvenací homopolymerních oblastí, mezer a diskrepancí byla sestavena výsledná sekvence, která byla anotována s využítím softwaru Geneious v5.6.5 (Drummond et al., 2012) na základě anotace pro genom Samoa D. Sekvence byla dále využita při porovnání celogenomových sekvencí.
36
Materiál a metody 5.11
Porovnání celogenomových sekvencí Rozdíly mezi celogenomovými sekvencemi byly zkoumány u tří kmenů TPE
(Samoa D, CDC-2, Gauthier), pěti kmenů TPA (Nichols, DAL-1, SS14, Chicago, Mexico A), kmene TPc Cuniculi A a kmenem Fribourg-Blanc (tabulka 2). Jako první z kmenů Treponema pallidum byl sekvenován genom kmene Nichols (AE000520.1, Fraser et al., 1998) a jako druhý genom kmene SS14 (CP000805.1, Matějková et al., 2008), který byl sekvenován metodou CGS. Vzhledem k chybám v sekvenci genomu kmene Nichols, byl tento genom resekvenován metodami pyrosekvenování a Illumina. Pro tuto práci byla použita již upravená sekvence z června 2012 (dosud nepublikovaná práce P. Pospíšilová a H. Pětrošová). Vzhledem k použití metody CGS při sekvenaci genomu SS14 byly některé chyby sekvence genomu Nichols (AE000520.1) zahrnuty i do sekvence genomu SS14. Proto i tento genom byl resekvenován metodou Illumina a pro tuto práci byla použita jeho upravená sekvence (dosud nepublikovaná práce P. Pospíšilová a H. Pětrošová). Sekvence genomu Chicago (CP001752.1; Giacani et al., 2010) byla získána z databáze GenBank.
Ostatní
sekvence
byly
připravovány
na
našem
pracovišti
a spolupracujících ústavech Human Genome Sequencing Center (Baylor College of Medicine, Houston, Texas, USA) a Washington University School of Medicine (St. Louis, MO, USA). Genomy kmenů DAL-1 (CP03115.1; Zobaníková et al., 2012), CDC-2 (CP002375.1, Čejková et al., 2012) a Gauthier (CP002376.1; Čejková et al., 2012) byly získány kombinací metod pyrosekvenování a Illumina, genom kmene TPc Cuniculi A kombinací metod CGS, pyrosekvenování a Illumina, sekvenační čtení pro genom TPA kmene Mexico (CP003064.1; Pětrošová et al., 2012) byly získány metodou Illumina (tabulka 9). K analýze rozdílů mezi genomovými sekvencemi bylo využito skriptu založeného na softwaru Cross match, genomová a genová porovnání (alignmenty) zpracovávaná v programu Geneious v5.6.5 (Drummond et al., 2012) a v programech programového balíku Lasergene (DNASTAR, Madison, WI, USA). Genomy byly srovnány vedle sebe v softwaru Geneious s využitím pluginu MAFFT alignment v1.2. V softwaru SeqMan (DNASTAR, Madison, WI, USA) byly provedeny manuální korekce porovnání. Tohoto softwaru bylo využito k identifikaci specifických rozdílů v intergenových i kódujících oblastech mezi kmeny TPA, TPE, Fribourg-Blanc a Cuniculi A. Sekvenční změny variabilních úseků V1-V7 genu tprK (TP0897) nebyly do analýzy zahrnuty, protože tyto sekvence se navzájem v rámci populace velmi výrazně liší (LaFond et al., 2003; LaFond et al., 2006a). S využitím skriptu k softwaru Cross match, programu Geneious v5.6.5 37
Materiál a metody a MegAlign ze softwarového balíčku Lasergene byl v kódujících oblastech v pozicích specifických nukleotidových rozdílů mezi kmeny TPA a TPE vyhodnocen jejich vliv na záměny zakódovaných aminokyselin (aa). Geny lišící se pouze odlišnými pozicemi start kodonu, které byly důsledkem rozdílných algoritmů použitých při anotaci, byly považovány za identické. Nukleotidové změny mezi poddruhy TPA a TPE a uvnitř poddruhů byly vypočteny z analýzy porovnání celých genomových sekvencí všech kmenů softwary Geneious v5.6.5 (výpočet sekvenční identity) a DnaSP v5.10 (Librado & Rozas, 2009), genetická příbuznost mezi kmeny uvnitř poddruhů byla charakterizována výpočtem nukleotidové diverzity (π). Genetická příbuznost mezi kmeny obou poddruhů byla charakterizována hodnotou nukleotidové divergence (dA). 5.12
Výpočet typ selekce genu a detekce rekombinace Test pro odhadnutí typu selekce byl proveden s využitím Kumarova modelu (Nei
& Kumar, 2000) v programu MEGA4 (Tamura et al., 2007). K detekci lokusů, ve kterých pravděpodobně došlo k rekombinaci, byly použity 3 metody. Metoda RDP, GENECONV (Padidam et al., 1999) a metoda Maximum Chisquared (Posada & Crandall, 2001; Smith, 1992) s využitím programu Recombination Detection Program v3.44 (RDP3) (Martin et al., 2010a). Bylo použito standardních nastavení. Maximální hodnota p byla nastavena na 0,01 a byla použita Bonferroniho korekce. Za signifikantní byl považován výsledek predikovaný všemi třemi metodami. 5.13
Sekvenace rrn operonů u různých kmenů nekultivovatelných patogenních treponemat Pro amplifikaci rrn operonů byla z důvodů vysoké sekvenční podobnosti mezi
oběma rrn operony použita amplifikace pomocí XL PCR produktů s využitím GeneAmp®XL PCR Kitu (Applied Biosystems, Foster City, CA, USA). XL PCR produkty byly následně sekvenovány s využitím Taq DyeDeoxy Terminator Cycle Sequencing Kitu (Applied Biosystems, Foster City, CA, USA) a sad interních primerů. 5.13.1 Fylogenetická analýza nekultivovatelných patogenních treponemat v rrn1 a rrn2 lokusech K analýze byly použity spojené sekvence z rrn1 a rrn2 operonů po vyloučení heterologních oblastí, přesné koordináty jsou uvedeny v tabulce 3. K fylogenetické analýze
38
Materiál a metody T. paraluispleporis byla použita oblast 16S rDNA a předcházející sekvence. Ke konstrukci vývojových stromů byl použit program MEGA4 (Tamura et al., 2007) a metoda Neighborjoining (Saitou & Nei, 1987). Pro každý z uzlů stromu byly vypočítány hodnoty metodou bootstrap při nastavení počtu 1000 opakování rekonstrukce fylogenetického stromu. Větve s nižší než 50% podporou metody bootstrap byly zrušeny. Tabulka 3. Seznam koordinát sekvencí, které byly použity při analýze rrn lokusů zkoumané sekvence
koordináty podle TPA Nichols (AE000520.1)
koordináty podle TPE Samoa D (CP002374.1)
rrn1 operon
229575-235425
230341-236192
rrn2 operon
278035-283955
278803-284690
sekvence rrn operonů analyzovaných v tabulce 20
229763-235110; 278329283554
230529-235877; 279097284289
sekvence rrn operonů sloučené do jedné bez heterologních oblastí (obrázek 6(a))
(229927-231763)+(231828235110)+(278360280197)+(280272-283554)
(230693-232530)+(232595235877)+(279095280932)+(281007-284289)
sekvence rrn operonů sloučené do jedné zahrnující pouze 16S rDNA a sekvence před ní (obrázek 6 (b))
(229763-231763) +(278360280197)+(280272-283554)
(230529-232530) +(279095280932)
5.13.2 Analýza složení intergenových oblastí 16S-23S v rrn1 a rrn2 operonech klinických izolátů Pro detekci tRNA-Ile nebo tRNA-Ala v rrn1 a rrn2 operonech klinických izolátů byla optimalizována metoda nested PCR. V prvním kroku byla DNA každého klinického izolátu testována ve čtyřech paralelních reakcích s následující kombinací primerů: RNA1Fb a RNA1-tRNA-Ile-5 (první reakce); RNA1Fb a RNA2- tRNA-Ala-5 (druhá reakce); RNA2Fc a RNA1-tRNA-Ile-5 (třetí reakce); a RNA2Fc a RNA2-tRNA-Ala-5 (čtvrtá reakce). Primery RNA1Fb a RNA2Fc jsou specifické pro lokus rrn1 respektive rrn2, naopak primery RNA1-tRNA-Ile-5 a RNA2-tRNA-Ala-5 jsou specifické pro geny pro tRNA-Ile respektive tRNA-Ala. K amplifikaci v první reakci tedy dojde, pokud DNA obsahuje tRNA-Ile v rrn1 lokusu. K amplifikaci v první reakci naopak nedojde, pokud je v rrn1 lokusu tRNA-Ala. Ve druhém kroku nested PCR byl produkt rrn1 lokusu (z první a druhé reakce) amplifikován s použitím primerů cdc_TP0225_F a TP0225-6bR. PCR produkt rrn2 lokusu (třetí a čtvrtá reakce) byl amplifikován s použitím primerů RNA2Fa a TP0225-6bR. Použité primery jsou uvedeny v tabulce 4. Druhý krok není specifický pro přítomnost
39
Materiál a metody Ile/Ala nebo Ala/Ile v intergenovém prostoru 16S-23S, ale zvyšuje citlivost detekce PCR produktu z prvního kroku reakce. Každá PCR reakce obsahovala 0,4 µl 10 mM dNTP mixu, 2 µl 10x ThermoPol Reaction buffer, 0,1 µl každého primeru (100 pmol/µl), 0,1 µl Taq polymerázy (5000 U/ml, New England BioLabs, Frankfurt am Main, Germany), 1 µl testované DNA a 16,3 µl vody pro PCR, výsledný objem reakce byl 20 µl. PCR amplifikace byla provedena na termocykleru GeneAmp 9800 Applied Biosystems (Foster City, CA, USA) za následujících podmínek: 94 ºC (5 min); 40 cyklů: 94 ºC (60 s), 72 ºC (20 s), 72 ºC (150 s); závěrečná syntéza při 72 ºC (10 min). Druhý krok nested PCR probíhal za stejných podmínek, pouze se lišil nižší teplotou nasedání primerů (67 °C). Produkty druhého kroku byly podrobeny elektroforetické analýze. Výsledný vzor se liší podle toho, zda rrn1/rrn2 lokusy obsahují geny pro tRNA v pořadí tRNA-Ile/tRNA-Ala nebo tRNA-Ala/tRNA-Ile (obrázek 5). Uvedené metody nested PCR bylo v upravené podobě použito k amplifikaci 16S rDNA v genomu kmene Treponema paraluisleporis. Nejprve bylo ověřeno pořadí Ile/Ala v rrn1/rrn2 lokusech. Po té byl ve druhém kroku nested PCR produkt z první a čtvrté reakce prvního kroku amplifikován ve dvou paralelních reakcích A a B. Produkt z prvního kroku byl v reakci A amplifikován s použitím primerů RNA1Fc a TP0225-6bR. V reakci B pak s použitím primerů TP0225LF a RNA1-tRNA-Ile-1. Produkt ze čtvrté reakce byl v reakci A amplifikován s použitím primerů RNA2Fa a TP0225-6bR a v reakci B primery TP0225LF a RNA1-tRNA-Ala-1. Další primery bylo nutno použít, aby bylo možné Tabulka 4. Primery použité pro detekci tRNA v intergenové oblasti 16S-23S klinických vzorků a pro amplifikaci genu kódujícího 16S rRNA u T. paraluisleporis název primeru
sekvence (5' → 3')
primery pro přípravu produktů prvního kroku RNA1Fb CCTTGTAGACGTGGTTTTACCTAATTCCGTGAAGGAAAT GATTAGAGTTGAACTAATGACCCCTTCCTTATCAGAGAA RNA1-tRNA-Ile-5 GTGCTCTAACCAAC CCCTTTCTGACAAAGGGACAATACCGCCTGCGTGTGCG RNA2Fc ATAGTAATGAGCCCTGCG CCCTGGAGATAAGGGGACTCGAACCCCTGACCTACGAC RNA2-tRNA-Ala-5 CTGCAAAGCCGTCGCTCTAGCCAGT primery pro přípravu produktů druhého kroku cdc_TP0225_F AGGTTGTCGGAATTTGGTTG RNA1Fc CCGTGAAG-GAAATTGGATCTGGGGC RNA2Fa AGAGCGTGTGAGTATGTATCACGATT TP0225-6bR GGGTAAGGTTCCTCGCGTAT TP0225LF GCGAACAGGATTAGATACCC RNA1-tRNA-Ile-1 ACTGAGCTACAAGCCCCTTT RNA2-tRNA-Ala-1 CGTCGCTCTAGCCAGTTGAG
zdroj primerů tato práce tato práce tato práce tato práce D. Čejková tato práce tato práce P. Pospíšilová P. Pospíšilová tato práce tato práce
40
Výsledky
6 VÝSLEDKY 6.1
Sekvenace a kompletace genomu T. pallidum subsp. pertenue Samoa D Na základě dat získaných metodou CGS byla upravena referenční sekvence kmene
Nichols a takto bylo získáno celkem 91 kontigů vzájemně oddělených mezerami o celkové délce 12548 bp a mediánem délky 15 bp. Kontigy CGS tak pokrývaly 98,9 % genomu Samoa D (tabulka 5). Kombinací kontigů CGS a Sangerova sekvenování vzniklo 8 kontigů (s mezerami o délce 7098 bp) pokrývajících 99,40 % genomu. Pyrosekvenování genomu Samoa D poskytlo po srovnání k referenční sekvenci celkem 45 kontigů, které pokrývaly 98,5 % genomu. Byly mezi nimi mezery o celkové délce 17231 bp a mediánu 88 bp. Kontigy z obou metod byly porovnány k referenčnímu genomu Nichols (AE00520.1). Obě metody vykázaly 547 krátkých rozdílných úseků; z toho 71 již bylo osekvenováno dle Sangera. Zbylo osekvenovat 476 úseků rozdílných mezi kontigy vykázanými oběma metodami a 25 mezer. Tyto oblasti byly rozděleny do 346 úseků pro amplifikaci a následnou sekvenaci individuálních PCR produktů (tabulka S1). Zkompletovaná předběžná sekvence chromozomu kmene Samoa D byla resekvenována na metodou Illumina. Při skládání sekvenačních čtení do kontigů de novo bylo po přiřazení těchto kontigů k referenci získáno finálních 195 kontigů, které pokrývaly 97,8 % genomu. Mezi kontigy z metody Illumina a předběžnou sekvencí byly nalezeny čtyři rozdíly, které byly lokalizovány uvnitř kontigů metody Illumina (dále než 20 nukleotidů od konce kontigů). Tyto rozdíly byly ověřeny metodou DDT. Tři rozdíly představovaly chybu metody Illumina a čtvrtý rozdíl představoval chybu, která byla nalezena metodou Illumina v kontizích metod CGS a pyrosekvenování. Finální sekvence byla ověřena srovnáním restrikčních fragmentů získaných metodou WGF s fragmenty získanými restrikční analýzou výsledné sekvence in silico. Celkem bylo ověřováno 1773 restrikčních míst, což představuje 10,6 kb sekvence DNA. Mezi experimentální restrikční analýzou a fragmenty získanými restrikčním štěpením in silico nebyly u genomu Samoa D nalezeny žádné diskrepance. Restrikční analýzu pro genom Samoa D provedl kolega M. Strouhal.
41
Výsledky 6.2
Hodnocení celogenomových sekvenačních metod použitých při sekvenaci genomu Samoa D Celkem bylo pro všechny metody CGS, pyrosekvenování a Illumina zjištěno 424
chyb v 419 různých pozicích. Na pěti pozicích chybovaly dvě metody zároveň. Kombinované chyby jsou složeny např. z jednoho substituovaného a jednoho deletovaného nukleotidu vedle sebe. Z výsledků vyplývá (tabulka 5), že CGS vneslo 3x více chyb než metoda Illumina. Nejvíce chyb pak vneslo pyrosekvenování (50 %, obrázek 1). Chyby CGS byly ze 74 % substituce, podobně i Illumina vnášela v 69 % případů substituční chyby. Pyrosekvenování chybovalo substitucemi pouze v 5 % případů, 94 % chyb byly inzerce nebo delece. Illumina chybovala nejméně často a ve 48 případech z 51 byly chyby na koncích kontigů. Ze zbylých 3 chyb se 2 vyskytovaly v homopolymerech (10C, 10G), kde chybovala také ještě pyrosekvenace nebo CGS. Celková délka nesekvenované části genomu byla největší u sekvenace firmy Illumina (25252 bp), o něco kratší se jeví tato oblast při pyrosekvenování (17231 bp) a nejkratší je u CGS (12548 bp). Tabulka 5. Hodnocení celogenomových sekvenačních metod použitých při sekvenaci genomu Samoa D sekvenační metoda
CGS
pyrosekvenace
Illumina
počet kontigů = počet mezer
91
154a (45)b
230a (195)b
celková délka mezer (bp)
12548
17231
25252
medián délky mezer (bp)
15
88
24
pokrytí genomu
98,90 %
98,50 %
97,80 %
pokrytí genomu všemi metodami
99, 83 %
průměrné pokrytí jedné baze
N/A
30 x
73 x
průměrná délka sekvenačních čtení
N/A
100 bp
36 bp
počet chyb metody celkem
159
214
51
z toho substitucí
119 (74 %)
10 (5 %)
35 (68 %)
z toho delecí
20 (13 %)
82 (38 %)
12 (24 %)
z toho inzercí
14 (9 %)
120 (56 %)
2 (4 %)
z toho kombinovaných chyb
6 (4%)
2 (1 %)
2 (4 %)
a
Počet kontigů získaných složením sekvenačních čtení de novo. Snížení počtu kontigů, získaných složením sekvenačních čtení de novo po jejich přiřazení k referenční sekvenci.
b
42
Výsledky CGS 12%
pyrosekvenování Illumina 38%
50%
Obrázek 1. Podíl chyb jednotlivých metod na celkovém součtu chyb všech metod 6.3
Charakteristiky genomu kmene Samoa D Výsledná sekvence genomu kmene Samoa D má délku 1139330 bp se zastoupením
bazí G+C 52,8 % a celkovou délkou intergenových oblastí 52844 bp (4,64 % genomu). V genomu bylo de novo anotováno celkem 1125 genů (tabulka 10). Z toho 54 genů pro nekódující RNA (45 pro tRNA, 6 pro rRNA, 3 pro ncRNA), 640 genů s predikovanou funkcí, 140 genů kódujících treponemální konzervované hypotetické proteiny (TCHP, tj. proteiny s neznámou funkcí, podobné proteinům jiných druhů rodu Treponema), 141 genů kódujících konzervované hypotetické proteiny (CHP), 147 genů kódujících hypotetické proteiny (HP) a 3 geny anotované jako pseudogeny (geny obsahující autentické posunové mutace oproti obdobným genům ostatních bakterií – jsou to TPESAMD_0146, TPESAMD_0520 a TPESAMD_0812). Průměrná délka genu kmene Samoa D je 980 bp, medián délky genu představuje hodnota 831 bp. Oproti genomům kmenů CDC-2 a Gauthier neobsahuje genom kmene Samoa D rozsáhlé strukturní přestavby, delece, duplikace či multiplikace genů. Protože byla pro genomy kmenů CDC-2 a Gauthier použita upravená anotace genomu kmene Samoa D, neliší se kmeny TPE počtem genů ani jim přiřazenými funkcemi. (tabulka 10) . Oproti genomu Nichols (AE000520.1) bylo u kmene Samoa D (a všech TPE) navíc anotováno 95 genů. Tyto geny s výjimkou TPE_0409a (gen pro transportní protein) kódují proteiny s neznámou funkcí (tabulka S2; HP - 89 genů, TCHP - 2 geny, CHP - 3 geny). Mediánem délky těchto genů je hodnota 228 bp, která je mnohem nižší oproti hodnotě mediánu všech anotovaných genů. Všechny tyto nově anotované geny by bylo možno anotovat i u TPA kmenů, s výjimkou 4 hypotetických genů: TPE_0126b (nese posunové mutace, místo něj je anotován gen TPA_0126d), TPE_0349a (mutace ve start kodonu 43
Výsledky u TPA kmenů), TPE_0548a (delece 52 bp u TPA kmenů vedoucí ke zkrácení kódovaného proteinu pod limit 150 bp) a genu TPE_0911a (posunová mutace u TPA kmenů – gen je kratší než limit 150 bp) (tabulka S2).
Obrázek 2. Genom kmene Samoa D Od vnějšího kruhu k vnitřnímu: Geny na vedoucím řetězci DNA (obarvené podle funkčních kategorií COG), geny na komplementárním řetězci (obarvené podle funkčních kategorií COG), geny kódující RNA (geny pro tRNA zeleně, pro rRNA červeně, ostatní RNA černě), zastoupení bazí G a C, GC skew – poměr bazí C a G. Kategorie COG: [A] - RNA processing and modification, [B] - Chromatin structure and dynamics, [C] - Energy production and conversion, [D] - Cell cycle control, cell division, chromosome partitioning, [E] Amino acid transport and metabolism, [F] - Nucleotide transport and metabolism, [G] - Carbohydrate transport and metabolism, [H] Coenzyme transport and metabolism, [I] - Lipid transport and metabolism, [J] - Translation, ribosomal structure and biogenesis, [K] Transcription, [L] - Replication, recombination and repair, [M] - Cell wall/membrane/envelope biogenesis, [N] - Cell motility, [O] Posttranslational modification, protein turnover, chaperones, [P] - Inorganic ion transport and metabolism, [Q] - Secondary metabolites biosynthesis, transport and catabolism, [R] - General function prediction only, [S] - Function unknown, [T] - Signal transduction mechanisms, [U] - Intracellular trafficking, secretion, and vesicular transport, [V] - Defense mechanisms, [W] - Extracellular structures, [Y] - Nuclear structure, [Z] - Cytoskeleton, [NA] - Not Assigned
U genomu Samoa D naopak nebyly anotovány některé hypotetické geny kmene Nichols (AE000520.1). Těchto celkem 40 genů bylo buď kratších než stanovený limit 150 bp (27 genů), nebo byl v odpovídajícím lokusu anotován jiný gen (6 genů), a nebo v důsledku posunové mutace došlo k jejich zkrácení pod limit 150 bp (6 genů, tabulka S3). Poslední skupina genů patří mezi pseudogeny kmene Samoa D (i ostatních TPE) oproti genům
TPA
kmenů.
Je
to
6
neanotovaných
pseudogenů
(TPESAMD_0132, 44
Výsledky TPESAMD_0180,
TPESAMD_0266,
TPESAMD_0318,
TPESAMD_0532,
TPESAMD_1030). Celkem je v genomu kmene Samoa D (i ostatních TPE) oproti kmenům TPA 12 pseudogenů (tabulka 10). 24 genů kmene Samoa D (i jejich ortologů u ostatních kmenů TPE) vzniklo fúzí 50 původních genů kmene Nichols, většinou v důsledku chyb v původní sekvenci kmene Nichols (AE000520.1). V genomu kmene Samoa D oproti ostatním TPE i TPA kmenům navíc došlo k fúzi genů TP0126 a TP0126a do genu TPESAMD_0126a. Stejná fúze nastává i v genomu kmene SS14. V genomu kmene Samoa D je tedy celkem 25 genů fúzováno z 52 genů kmene Nichols. Opravená sekvence kmene Nichols pak obsahuje stejně fúzované geny. Výjimkou je gen TPESAMD_0314, který vznikl fúzí ortologních genů TP0314 a TP0315, které jsou i v opravené sekvenci kmene Nichols a ostatních TPA kmenů odděleny. Druhou výjimkou je gen TPESAMD_0859, který vznikl fúzí ortologních genů TP0859 a TP0860, které jsou odděleny v genomu kmene Chicago a fúzovány v nejnovější sekvenci genomu kmene Nichols, SS14 a DAL-1. Zda dojde mezi geny TP0859 a TP0860 k fúzi, je závislé na počtu nukleotidů G v homopolymerní sekvenci, která se nachází na konci genu TP0859. Jednoznačně určit přesný počet nukleotidů G v této oblasti není možné, protože v rámci jednotlivých kmenů byla nalezena sekvenční heterogenita. U kmene Cuniculi A dochází ke stejným fúzím jako u TPA kmenů, i u tohoto kmene jsou geny ortologní ke genům TP0314 a TP0315 oddělené. Navíc zde však dochází i k fúzi genů ortologních ke genům TP0021 a TP0022 (tabulka 11). K podobné situaci jako v genu TP0859 a jeho ortolozích dochází i v jiných lokusech bohatých na seskupení G nebo C nukleotidů, u kterých byla nalezena heterogenita v rámci jednoho kmene. 6.4
Souhrn odlišností mezi genomy kmene Nichols a DAL-1 Genom kmene DAL-1 byl získán kombinací kontigů ze dvou celogenomových
sekvenačních metod zahrnujících pyrosekvenování (de novo 235 kontigů, 52 výsledných kontigů po přiložení k referenci Nichols) a metodu Illumina (de novo 303 kontigů, 295 kontigů se sekvenční příbuzností k referenci). Dideoxyterminátorovou metodou byly sekvenovány mezery v kontizích z pyrosekvenování, TPI oblasti obsahující tpr geny nebo repetitivní sekvence a odlišnosti mezi sekvencí kmene Nichols a první verzí sekvence kmene DAL-1, která byla sestavena z kontigů pyrosekvenace (pokud již nebyly ověřeny sekvencí kontigů z Illuminy). U sekvence byla ověřena její správnost při srovnání se
45
Výsledky sekvenačními daty. Sekvence byla anotována s použitím upravené anotace genomu Samoa D. Sekvence kmene DAL-1 byla téměř identická s opravenou sekvencí kmene Nichols (míra identity podle metody WGF 99,98 %, nukleotidová diverzita 0,00005 ± 000003, tabulka 12). Její délka byla 1139971 bp, podíl bazí G+C byl 52,8 %. V kmeni DAL-1 bylo anotováno 1121 genů (prefix TPADAL_) včetně 54 netranslatovaných genů pro ribozomální, transferovou a jinou nekódující RNA a osmi pseudogenů (TPADAL_0009, TPADAL_0067, TPADAL_0136, TPADAL_0146, TPADAL_0316, TPADAL_0520, TPADAL_0609
a
TPADAL_0812).
Kromě
TPADAL_0067,
TPADAL_0136,
a TPADAL_0609 jsou v těchto lokusech pseudogeny i u ostatních TPA genomů. Genomové charakteristiky kmene DAL-1 a ostatních genomů jejichž sekvenaci jsem prováděla nebo se na ní podílela jsou uvedeny v tabulce 10. Pro většinu kódujících genů (více než 60 %) byla predikována funkce. V genomu DAL-1 vzniklo 23 genů fúzí původních genů kmene Nichols (AE00050.1) Sekvence DAL-1 a Nichols se vzájemně nejvíce odlišovaly ve dvou genech. 94 nukleotidových změn bylo v genu pro protein vázající fibronektin TPADAL_0136 (Brinkman et al., 2008). Inzerce 288 nukleotidů (inzerce 12 repetic po 24 bp) byla nalezena v genu TPADAL_0470. V genech tprF (TP0316), tprG (TP0317) a tprK (TP0897) byly nalezeny 2, 1 a 4 nukleotidové změny. U genu tprK byly nalezeny, stejně jako u ostatních genomů, sekvenčně variabilní oblasti (LaFond et al., 2006b). Mimo již uvedené bylo mezi genomy DAL-1 a Nichols nalezeno 31 nukleotidových změn. 9 jednonukleotidových změn typu inzerce/delece v homopolymerech, delece čtyř nukleotidů, delece dvou nukleotidů a 16x došlo k substitucím. 10 nukleotidových substitucí způsobilo nesynonymní a zároveň nekonzervativní záměnu devíti aminokyselin. Devět jednonukleotidových změn typu inzerce/delece vedlo k posunové mutaci u genů: TPADAL_0012 (HP, neanotovaný), TPADAL_0040 (gen kódující methyl vázající chemotaktický protein), TPADAL_0127a (HP), TPADAL_0134a (HP) a TPADAL_0479 (HP). Delece čtyř nukleotidů vedla k posunové mutaci a zkrácení proteinu TPADAL_0609 (kóduje protein kratší o 123 aa oproti proteinu kmene Nichols). Delece dvou nukleotidů vedla k posunové mutaci a zkrácení genu TPADAL_0067 o 330 bp oproti genu kmene Nichols. Ke třem substitucím došlo v intergenových oblastech, tři nezpůsobily změnu aminokyseliny, 10 nukleotidových substitucí způsobilo nesynonymní a zároveň nekonzervativní záměnu devíti aminokyselin u genů: TPADAL_0051 (prfA, „peptide chain
release
factor
RF1“),
TPADAL_0065
(„probable
SAM
dependent
up 46
Výsledky methyltransferase“), TPADAL_0279 („bifunctional cytidylate kinase/ribosomal protein S1“), TPADAL_0433 (arp), TPADAL_0674 (CHP), TPADAL_0720 (fliY, „bifunctional chemotaxis protein CheC/flagellar motor switch protein FliY“) a TPADAL_0854 (CHP). 6.5
Sekvenace a kompletace genomu opičího izolátu Treponema Fribourg-Blanc K získání genomu opičího izolátu Fribourg-Blanc byla použita kombinace dvou
celogenomových sekvenačních metod, pyrosekvenování a technologie Illumina. Nebyla však použita knihovna fragmentů celkové DNA, ale čtyři pooly XL-PCR produktů reprezentujících celý genom, které byly smíchány s ohledem na vysokou sekvenční příbuznost mezi paralogními skupinami tpr genů a na přítomnost dvou téměř identických operonů kódujících ribozomální RNA geny. V poolech chyběla pouze malá část sekvence o délce 6744 bp, kterou se při přípravě poolů nepodařilo naamplifikovat. Každému poolu byla při pyrosekvenování navíc přířazena jedinečná sekvence MID. Dideoxyterminátorová (DDT) metoda pak sloužila jako referenční metoda a technika ke kompletaci chybějících částí. Průměrná délka sekvenačních čtení získaných pyrosekvenováním byla 230 bp, kdy jedna baze byla pokryta (coverage) průměrně 70x. Čtení, která nebyla rozlišována podle sekvence MID byla de novo složena do 94 kontigů. Jen 85 kontigů bylo možné přiřadit k referenčnímu genomu kmene CDC-2, čímž bylo získáno 37 výsledných kontigů oddělených 37 mezerami o celkové délce 21471 bp (včetně chybějícící sekvence o délce 6744 bp). V případě, kdy byla pyrosekvenační čtení přiřazena podle sekvence MID k příslušné podoblasti, bylo získáno celkem 43 kontigů. 26 kontigů bylo možné přirovnat k referenční sekvenci. Takto bylo získáno 9 výsledných kontigů oddělených 9 mezerami o celkové délce 10050 bp (včetně chybějícící sekvence o délce 6744 bp). Délka sekvenačních čtení získaných z metody Illumina byla 35 bp, jedna baze byla průměrně pokryta 465x. Čtení byla složena do 166 kontigů, které byly po odfiltrování kontaminujících sekvencí přiloženy k referenční sekvenci a tak složeny do výsledných 56 kontigů, mezi nimiž bylo 56 mezer o celkové délce 23470 bp (včetně chybějícící sekvence o délce 6744 bp). Kontigy získané oběma metodami spolu se sekvencemi z DDT metody byly složeny do výsledné sekvence o celkové délce 1140481 bp. Zastoupení bazí G a C bylo stejné jako u TPE a TPA kmenů (52,8 %). V genomu bylo anotováno 1122 genů, z toho stejně jako u kmenů TPE 54 genů pro netranslatovanou RNA, 640 genů s predikovanou funkcí, 425 genů s neznámou funkcí (139 genů kódujících TCHP, 141 genů kódujících 47
Výsledky CHP a 145 genů kódujících HP) a 3 geny anotované jako pseudogeny (geny s autentickou posunovou mutací, tabulka 10). Délka intergenových oblastí představuje 4,63 % genomu. Oproti kmenům TPE nejsou u kmene Fribourg-Blanc anotované geny TPFB_0012 (HP) a TPFB_0896 (HP). Tyto geny obsahují 1 bp deleci, způsobující posunovou mutaci. Respektive 2 bp substituci, vedoucí k nesmyslné mutaci (stop kodonu). Jsou tak kratší, než stanovená limitní hodnota 150 bp a představují pseudogeny v genomu kmene FribourgBlanc. Gen TPFB_0304 (TCHP) není anotován, protože u něj došlo k fúzi s genem TPFB_0303 („DNA mismatch repair protein MutL“). Tato fúze je specifická pro kmen Fribourg-Blanc, ostatní fúze (tabulka 11) jsou stejné jako u kmenů TPE (kromě TPADAL_0126, který je oddělen od TPADAL_0126a). Sekvence genomu kmene Fribourg-Blanc byla vložena do databáze GenBank pod číslem CP003902.1. 6.6
Shrnutí celkové odlišnosti genomu kmene Fribourg-Blanc od genomů kmenů TPE Genomová sekvence kmene Fribourg-Blanc je z 99,8 % identická se sekvencí
každého z kmenů TPE. Stejná míra identity platí i pro kmeny TPE mezi sebou navzájem (tabulka 12). Nejnižší je nukleotidová diverzita mezi genomem kmene Fribourg-Blanc a CDC-2, nejvyšší mezi genomem kmene Fribourg-Blanc a Gauthier (tabulka 6). Celková nukleotidová diverzita, vypočtená mezi všemi třemi kmeny TPE (0.00032 ± 0.00011), se snížila po zahrnutí kmene Fribourg-Blanc do skupiny kmenů TPE na hodnotu 0.00029 ± 0.00008 (tabulka 13). Tabulka 6. Míra nukleotidové diverzity mezi genomy kmenů TPE a kmenem T. Fribourg-Blanc Samoa D ***
CDC-2
Gauthier
Fribourg-Blanc
0,00016 ± 0,00008 0,00044 ± 0,00022 0,00023 ± 0,00012 Samoa D ***
0,00037 ± 0,00018 0,00016 ± 0,00008 CDC-2 ***
0,00044 ± 0,00022 Gauthier *** Fribourg-Blanc
Mezi sekvencí tří kmenů TPE a genomovou sekvencí kmene Fribourg-Blanc bylo nalezeno celkem 630 ovlivněných nukleotidů, které představovalo 10 delecí, 7 inzercí a 122 substitucí v genomu Fribourg-Blanc (tabulka 7). Sekvenční změny variabilních úseků V1-V7 genu tprK (TP0897) nebyly do analýzy zahrnuty, protože tyto sekvence se navzájem v rámci populace velmi výrazně liší, jak již bylo popsáno u jiných kmenů 48
Výsledky a izolátů (LaFond et al., 2003; LaFond et al., 2006a). Všechny odhalené sekvenční odlišnosti jsou v suplementárním materiálu, v tabulce S4. V intergenových oblastech se nacházelo 443 ovlivněných nukleotidů včetně inzerce dlouhé 430 bp mezi geny TPFB_0696 – TPFB_0697 (Mikalová et al., 2010). Tabulka 7. Souhrn změn specifických pro kmen Fribourg-Blanc oproti kmenům TPE nekódující sekvence typ změny v sekvenci DNA/proteinu
počet změn
počet ovlivněných nukleotidů (443 bp)
kódující sekvence počet počet ovlivněných nukleotidů změn (187 bp)
významně ovlivněné geny
117
3x 1 bp,1x5 bp => posunová mutace (8 bp); 1x 6 bp, 1x 3 bp, 1x 42 bp => 2, 1 a 14 aa delece (51 bp) 1x 2 bp => posunová mutace (2 bp); 3x 3 bp => 3x 1 aa inzerce (9 bp) 117 bp
2
2 bp
-
18
17 bp (z toho 1 nukleotid způsobuje SYN i NON změnu)a
nesynonymní aa
-
88
95 bp
konzervativní aa
-
6
7 bp
nekonzervativní aa
-
82
88 bp
nesmyslná mutace
-
1
2 bp
TPFB_0896
mutace ve stop kodonu
-
1
1 bp
TPFB_0303
delece
3
inzerce
3
substituce kódující u TPE/intergenová u FrBl
5
synonymní aa
2x 1 bp,1x 2 bp (4 bp) 2x 2 bp,1x 430 bp (IGR TPFB_0696 – TPFB_0697) (434 bp) 5 bp
7
4
TPFB_0012, 0040, 0461a, 0484; TPFB_0370, 0548, 0859 TPFB_0347; TPFB_0179, 0279, 0462
TPFB_0117 – 1 aa TPFB_0968 – 1 aa TPFB_0117 – 14 aa, TPFB_0126a – 2 aa TPFB_0316 – 4 aa TPFB_0324 – 4aa TPFB_0488 – 4 aa TPFB_0620 – 6 aa TPFB_0865 – 3 aa TPFB_0968 – 3 aa
Celkem 630 ovlivněných nukleotidů a
Jeden nukleotid obsažený ve dvou překrývajících se genech způsobuje synonymní změnu aa v jednom genu a nesynonymní změnu aa v druhém genu.
Sedm delecí, čtyři inzerce a 117 substitucí, to jsou změny, kterými se kmeny TPE a Fribourg-Blanc vzájemně lišily v kódujících oblastech. Substituce vedly k jedné nesmyslné mutaci, k mutaci ve start kodonu, mutaci ve stop kodonu a také k 88 nesynonymním mutacím. Z toho 82 mutací vedlo k nekonzervativním aminokyselinovým změnám. Nejvíce rozdílných aminokyselin kódovaly geny tprC (TPFB_0117) a tprI (TPFB_0620). Ostatní geny s většími změnami v odpovídajících proteinech jsou uvedeny v tabulce 7. Čtyři delece a jedna inzerce vedly k posunové mutaci u pěti genů. Tyto geny proto buď nebyly anotovány (TPFB_0012; HP), nebo byly zkráceny (TPFB_0040 (gen mcp); TPFB_0347 (HMP); TPFB_0484 (CHP)) nebo naopak prodlouženy (TPFB_0461a; HP) oproti genům u kmenů TPE. Delece jsou u těchto genů v sekvenci několika po sobě 49
Výsledky jdoucích nukleotidů G (homopolymer G). Délku genu TPFB_0548 ovlivnila delece 42 bp. Geny kmene Fribourg-Blanc, jež obsahovaly mutace signifikantně ovlivňující délku kódovaného proteinu, jsou uvedeny v tabulce 8. Kromě již uvedených sem patřil také gen TPFB_0303. Tento gen byl prodloužen v důsledku mutace ve stop kodonu v genu TPFB_0304, který s ním fúzoval do jednoho genu. Dále sem patřil gen TPFB_0126b (HP), zkrácený v důsledku mutace ve start kodonu, v důsledku nesmyslné mutace neanotovaný gen TPFB_0896 a 2 geny, obsahující delší repetitivní sekvence TPFB_0433 (repetice o délce 60 bp, gen arp) a TPFB_0470 (repetice o délce 24 bp, CHP). Tabulka 8. Geny kmene Fribourg-Blanc, obsahující oproti genům kmenů TPE mutace, které signifikantně ovlivňují délku proteinu ovlivněný gen specifická (predikovaný změna protein) TPFB_0012 (HP) TPFB_0040 (Mcp) TPFB_0126b (HP)
TPFB_0303 (MutL, HP)
TPFB_0347 (HMP) TPFB_0433 (Arp) TPFB_0461a (HP) TPFB_0470 (CHP) TPFB_0484 (CHP)
1 bp delece (v homopolymeru G) 5 bp delece (v homopolymeru G) 3 bp substituce mutace ve start kodonu 1 bp mutace ve stop kodonu 2 bp inzerce (v homopolymeru G) 15 repetitivních oblastí o délce 60 bp 1 bp delece (v homopolymeru G) 22 repetitivních oblastí o délce 24 bp 1 bp delece (v homopolymeru A)
důsledek mutace
koordináty koordináty změny změny podle podle genomu genomu Nichols Samoa D (AE000520.1)
posunová mutace a zkrácení 12476 - 12485 genu o 47 bp pod limit 150 bp (129 bp) - gen nebyl anotován posunová mutace a zkrácení genu o 17 bp na 2433 bp (na 3´- 49355 - 49364 konci genu) zkrácení genu o 42 bp (na 5´konci genu) na 366 bp
12479 - 12488
49360 - 49369
148519 - 148520 148677 - 148679
mutace ve stop kodonu genu TPFB_0304 (3117 bp) vede k 318666 jeho prodloužení a fúzi s genem 318320 TPFB_0303 (výsledná délka 5076 bp) posunová mutace a zkrácení genu o135 bp (na 5´-konci 372050 - 372062 373403 - 373415 genu, výsledná délka 711 bp) 461504 - 461505 463154 - 463155 posunová mutace a prosloužení genu o 61 bp (na 3´-konci genu, 490843 - 490848 492493 - 492501 výsledná délka 243 bp) 497688 - 497689 499198 - 499199 posunová mutace a zkrácení genu o 309 bp ( na 5´-konci genu, výsledná délka 1707 bp)
515425 - 515433 516937 – 516945
TPFB_0548 (TCHP)
42 bp delece, 1 bp substituce
delece 14 aa, 1 aa nesynonymní 591799 - 591846 593330 - 593371 nekonzervativní změna
TPFB_0896 (HP)
2 bp substituce – nesmyslná mutace
předčasné ukončení genu – gen není anotován
974281, 974283
975892, 975894
50
Výsledky
6.7
Identifikace rozdílů mezi genomy původců syfilis, yaws, spirochetózy králíků a treponemálního onemocnění paviána Rozdíly
mezi
genomy
původců
yaws,
syfilis,
spirochetózy
králíků
a
treponemálního onemocnění paviána byly zkoumány mezi třemi kmeny TPE (Samoa D, CDC-2, Gauthier) pěti kmeny TPA (Nichols, DAL-1, SS14, Chicago, Mexico A), kmenem TPc Cuniculi A a kmenem Fribourg-Blanc (tabulka 2). U těchto kmenů je publikována nebo byla stanovena výsledná genomová sekvence a anotace (tabulka 9). Jako první z kmenů Treponema pallidum byl sekvenován genom kmene Nichols (AE000520.1; Fraser et al., 1998), jako druhý genom kmene SS14 (CP000805.1; (Matějková et al., 2008), který byl sekvenován metodou CGS. Vzhledem k chybám v sekvenci genomu kmene Nichols, které byly (díky využití metody CGS) zahrnuty i do sekvence kmene SS14, byly oba genomy resekvenovány metodou Illumina v kombinaci s pyrosekvenováním. Pro tuto práci byla použita jejich upravená sekvence (dosud nepublikovaná práce P. Pospíšilové a H. Pětrošové). Sekvence genomu Chicago byla získána z databáze GenBank, ostatní sekvence byly získány na našem pracovišti s použitím sekvenačních metod uvedených v tabulce 9. Tabulka 9. TPE a TPA kmeny použité k porovnání celogenomových sekvencí a metody jejich sekvenace kmen TPE Samoa D TPE CDC-2 TPE Gauthier TPA Nichols TPA DAL-1 TPA SS14
sekvenační metoda CGS, pyrosekvenování, Illumina pyrosekvenování, Illumina pyrosekvenování, Illumina DDT, pyrosekvenování, Illumina pyrosekvenování, Illumina CGS, pyrosekvenování, Illumina
délka GenBank genomu (bp)
reference
1139330
CP002374.1
(Čejková et al., 2012)
1139744
CP002375.1
(Čejková et al., 2012)
1139417
CP002376.1
(Čejková et al., 2012)
1139633 1139971
nepublikovaný CP03115.1
1139524
(Zobaníková et al., 2012) nepublikovaný
TPA Chicago
Illumina
1139281
CP001752.1
(Giacani et al., 2010)
TPA Mexico A
Illumina
1140038
CP003064.1
(Pětrošová et al., 2012)
1140481
CP003902.1
připravuji manuskript
1133390
CP002103.1
(Šmajs et al., 2011)
pyrosekvenování, Illumina CGS, pyrosekvenování, TPc Cuniculi A Illumina Kmeny TPA jsou zvýrazněny tučně. T. Fribourg-Blanc
51
Výsledky Sumarizované vlastnosti genomů kmenů TPE, Fribourg-Blanc, DAL-1 a Cuniculi A jsou uvedeny v tabulce 10. Genové fúze, které byly pozorované v genomech kmenů TPA, TPE, Fribourg-Blanc a Cuniculi A zvláště vzhledem k prvnímu sekvenovanému genomu Nichols (AE000520.1) jsou shrnuty v tabulce 11. Všechny genomy kmenů TPA, TPE, Fribourg-Blanc i Cuniculi A mají obdobné zastoupení bazí G a C v genomu (52,8 %). Délka genomů kmenů TPE se mezi nejdelším a nejkratším genomem liší jen o 414 bp (1139330 bp až 1139744 bp). Rozdíl mezi délkou nejdelšího (Mexico A, 1140038 bp) a nejkratšího (Chicago, 1139281 bp) genomu TPA je o něco větší, 757 bp. Zatím nejdelší je genom kmene Fribourg-Blanc 1140481 bp. Výrazně kratší (o 5891 bp oproti genomu kmene Chicago a o 7091 bp oproti genomu kmene Fribourg-Blanc) je genom T. paraluiscuniculi Cuniculi A, který má jen 1133390 bp. Medián délky genů je podobný u všech nově anotovaných genomů (831 bp u kmenů TPE a FrBl, 834 bp u kmene DAL-1, 873 bp u kmene TPc). U Cuniculi A byl anotován menší počet genů (1070), které jsou odděleny delšími intergenovými oblastmi (u TPE, FrBl a DAL-1 představují 4,6 – 4,7 % délky genomů, u TPc 5,5 % délky genomu). Resekvenování genomu kmene Nichols vedlo ke stejným fúzím genů jako v genomech kmenů TPE, s výjimkou genů TP0314 a TP0315. Fúze jejich ortologů je specifická pro kmeny TPE a Fribourg-Blanc, ale zůstávají oddělené u kmenů TPA a Cuniculi A. Fúze některých genů jsou specifické pouze pro některé genomy (TP0127 u kmene Nichols, TPESAMD_0126 u kmene Samoa D, TPFB_0303 u kmene Fribourg-Blanc, TPCCA_0021 u kmene Cuniculi A). 6.7.1
Sekvenční identita a genetická diverzita mezi kmeny TPA, TPE a Fribourg Blanc a Cuniculi A Pro výpočet sekvenční identity mezi kmeny bylo použito porovnání všech kmenů
vedle sebe (alignment). Vlastní výpočet byl proveden v programu Geneious. Do výpočtu byly zařazeny i změny typu inzerce/delece. Stejný alignment byl použit pro výpočet genetické diverzity a divergence mezi kmeny, který byl proveden v programu DnaSP. Pozice se změnami typu inzerce/delece byly v tomto případě z výpočtu vyřazeny. Sekvenční identita mezi kmeny TPE i mezi kmeny TPE a Fribourg-Blanc je 99,8 % až 99,9 %. Obdobně mezi kmeny TPA je sekvenční identita 99,8 – 99,9 %. Rozdíl mezi oběma poddruhy je vyjádřen nižší sekvenční identitou 99,5 - 99,6 % mezi genomy. Kmeny obou poddruhů se o 1,9 – 2,1 % identity DNA sekvence liší od sekvence kmene Cuniculi A (tabulka 12).
52
Výsledky Nukleotidová diverzita (tabulka 13) mezi všemi zkoumanými TPA kmeny (0.00041 ± 0.00011) je 1,4 krát větší než nukleotidová diverzita mezi kmeny TPE spolu s kmenem Fribourg-Blanc (0.00029 ± 0.00008). Celková nukleotidová divergence (0.00152 ± 0.00053) mezi poddruhy TPA a TPE (včetně kmene FrBl) je o řád vyšší (3,7 krát a 5,2 krát) než nukleotidová diverzita mezi kmeny v rámci poddruhu. Nukleotidová divergence mezi kmenem Treponema paraluiscuniculi Cuniculi A a kmeny Treponema pallidum je navíc ještě o jeden řád vyšší než mezi oběma poddruhy Treponema pallidum (0,01047 ± 0,00427 u TPA kmenů a 0,01026 ± 0,00450 u kmenů TPE). 6.7.2
Souhrn genetických rozdílů mezi poddruhy T. p. pallidum a T. p. pertenue S využitím programů Geneious a SeqMan byly identifikovány rozdíly mezi
poddruhy pallidum a pertenue, tedy rozdíly, kterými se všechny zkoumané kmeny poddruhu pallidum lišily od všech zkoumaných kmenů poddruhu pertenue. Celkem bylo nalezeno 3021 rozdílných nukleotidů, které představovaly 25 delecí (celkem 594 bp), 17 inzercí (810 bp) a 1617 substitucí v genomech TPE oproti genomům TPA. Z již popsaných důvodů nebyly sekvenční změny variabilních úseků V1-V7 genu tprK (ortologní geny k TP0897) do analýzy zahrnuty (LaFond et al., 2003; LaFond et al., 2006a). Nalezené změny byly navíc ještě rozděleny podle toho, jestli se vyskytovaly v kódujících nebo intergenových
oblastech.
Některé
oblasti
byly
v důsledku
posunových
mutací
vyhodnoceny jako nekódující u kmenů TPA, ale zároveň kódující u kmenů TPE a naopak. V případě, kdy byl rozdíl v délce genu způsoben pouze anotačním algoritmem, ale ne rozdílem v sekvenci, byly změny hodnoceny podle delšího genu. V kódujících oblastech pak bylo hodnoceno, zda došlo v důsledku změny v nukleotidu k substituci aminokyseliny, tedy zda jsou aminokyseliny v odpovídajících pozicích odpovídajících proteinů obou poddruhů synonymní nebo nesynonymní. V případě nesynonymních aminokyselin bylo hodnoceno, zda jsou konzervativní, tj mají stejné fyzikálně-chemické vlastnosti, nebo nekonzervativní. Zároveň ovšem pokud se rozdíl mezi kmeny TPA a TPE ještě nacházel v genu, ale již za místem posunové mutace, nebylo možné vyhodnotit změnu aminokyseliny (21 nukleotidových změn). Některé substituce (celkem 28) specifické mezi všemi kmeny TPA a TPE byly součástí trojice nuklotidů, které kódovaly aminokyseliny, které se u některých kmenů TPA nebo TPE odlišovaly (v důsledku kmenově specifických změn v sousedním nukleotidu). Došlo k tomu v ortologních genech TP0136, TP0279, TP0488, TP0859 a TP0865). Všechny odhalené sekvenční odlišnosti jsou uvedeny v tabulce S5 v suplementárním materiálu, shrnutí těchto změn představuje tabulka 14. 53
Výsledky
Tabulka 10. Genomové statistiky pro kmeny TPE, Fribourg-Blanc, DAL-1 a Cuniculi A charakteristika genomu
Samoa D
CDC-2
Gauthier
Fribourg-Blanc
DAL-1
Cuniculi A
velikost genomu
1 139 330 bp
1 139 744 bp
1 139 417 bp
1 140 481 bp
1 139 971
1 133 390
zastoupení bazí G+C
52,80 % 1125 včetně 54 netranslatovaných genů 25 (původních 52 genů v genomu TPA Nicholsa) 52 844 bp (4,64 %) 980,3/831,0 bp
52,80 % 1125 včetně 54 netranslatovaných genů 24 (původních 52 genů v genomu TPA Nicholsa) 52 963 bp (4,65 %) 980,4/831,0 bp
52,80 % 1125 včetně 54 netranslatovaných genů 24 (původních 52 genů v genomu TPA Nicholsa) 53 300 bp (4,68 %) 979,3/831,0 bp
52,80 % 1122 včetně 54 netranslatovaných genů 25 (původních 54 genů v genomu TPA Nicholsa) 52 785 bp (4,63 %) 982,6/831,0 bp
52,80 % 1121 včetně 54 netransaltovaných genů 23 (původních 50 genů v genomu TPA Nicholsa) 53 785 bp (4,72 %) 982,0/834,0 bp
52,80 % 1070 včetně 54 netranslatovaných genů 25 (původních 52 genů v genomu TPA Nicholsa) 62 494 bp (5.5 %) 1006,0/873,0
600/525
600/525
600/525
599/523
596/525
577/493
640
640
640
640
638
650
140
140
140
139
138
139
141
141
141
141
140
139
147
147
147
145
143
88
3 (12 oproti genomu Nichols) 45
3 (12 oproti genomu 3 (12 oproti genomu 3 (14 oproti genomu 8 Nichols) Nichols) Nichols) 45 45 45 45
6 (51 oproti genomu Nichols) 45
počet rRNA lokusů
6 (2 operony)
6 (2 operony)
6 (2 operony)
6 (2 operony)
6 (2 operony)
6 (2 operony)
počet ncRNA lokusů
3
3
3
3
3
3
počet predikovaných genů
počet fúzovaných genů celková délka intergenových oblastí (procenta z délky genomu) průměr/medián délky genu počet genů kódovaných na plus/minus DNA řetězci počet genů kódujících proteiny s predikovanou funkcí počet genů kódujících treponemální konzervované hypotetické proteiny s neznámou funkcí počet genů kódujících konzervované hypotetické proteiny s neznámou funkcí počet genů kódujících hypotetické proteiny s neznámou funkcí počet genů anotovaných jako pseudogeny počet tRNA lokusů
a
AE000520.1
54
Výsledky
Tabulka 11. Fúze genů, pozorované v genomech TPA, TPE, T. Fribourg-Blanc, TPc Cuniculi A a TPA Nichols (AE000520.1) anotované geny TPA Nichols (AE000520.1)
geny resekvenovaného geny TPA kmene TPA a Nichols
počet fúzovaných geny TPE genů kmene Nichols
TP0006, TP0007, TP0008
TP0006_7_8
TPA_0006
3
TPE_0006
TP0013, TP0014
TP0013_14
TPA_0013
2
TP0018, TP0019
TP0018_19
TPA_0018
TP0021, TP0022
TP0021, TP0022
TPA_0021, TPA_0022
TP0126
TP0126, TP0126a
TP0127
TP0127
TP0172, TP0173
TP0172_173
počet genů kmene Nichols fúzovaných v genomech TPE a FrBl
anotované geny T. FrBl
annotované geny TPc Cuniculi A
3
TPFB_0006
TPCCA_0006
TPE_0013
2
TPFB_0013
TPCCA_0013
2
TPE_0018
2
TPFB_0018
TPCCA_0018
0
TPE_0021, TPE_0022
0
TPFB _0021, TPFB _0022 TPFB_0126 TPFB_0126a TPFB_0127a TPFB_0127b
TPCCA_0021
TPA_0126, TPA_0126a 0 (2) (TPASS_0126b) TPA_0127a 0d TPA_0127b
TPE_0126, TPE_0126a 0 (2) (TPESAMD_0126b)
TPA_0172
2
TPE_0172
2
TPFB_0172
TPCCA_0172
TP0174, TP0175, TP0176
TP0174_175_176 TPA_0174
3
TPE_0174
3
TPFB_0174
TPCCA_0174
TP0284, TP0285
TP0284_285
TPA_0284
2
TPE_0284
2
TPFB_0284
TPCCA_0284
TP0286, TP0287
TP0286_287
TPA_0286
2
TPE_0286
2
TPFB_0286
TPCCA_0286
TP0288, TP0289
TP0288_289
TPA_0288
2
TPE_0288
2
TPFB_0288
TPCCA_0288
TP0299, TP0300
TP0299_300
TPA_0300
2
TPE_0300
2
TPFB_0300
TPCCA_0300
TP0303, TP0304
TP0303, TP0304
TPA_0303, TPA_0304
0e
TPE_0303 TPE_0304
0 (2)e
TPFB_0303
TP0314, TP0315
TP0314, TP0315
TPA_0314, TPA_0315
2
TPE_0314
2
TPFB_0314
TP0324, TP0325
TP0324_325
TPA_0324
2
TPE_0324
2
TPFB_0324
TPE_0127a TPE_0127b 0d
TPCCA_0125a TPCCA_0126c rozsáhlé delece v homologní oblasti
TPCCA_0303 TPCCA_0304 TPCCA_0314, TPCCA_0315 TPCCA_0324
55
Výsledky
TP0377, TP0378
TP0377_378
TPA_0377
2
TPE_0377
2
TPFB_0377
TPCCA_0377
TP0419, TP0420
TP0419_420
TPA_0419
2
TPE_0419
2
TPFB_0419
TPCCA_0419
TP0433, TP0434
TP0433_434
TPA_0433
2
TPE_0433
2
TPFB_0433
TPCCA_0433
TP0462, TP0463
TP0462_463
TPA_0462
2
TPE_0462
2
TPFB_0462
TPCCA_0462
TP0468, TP0469
TP0468_469
TPA_0468
2
TPE_0468
2
TPFB_0468
TPCCA_0468
TP0481, TP0482
TP0481_482
TPA_0481
2
TPE_0481
2
TPFB_0481
TPCCA_0481
TP0587, TP0588
TP0587_588
TPA_0587
2
TPE_0587
2
TPFB_0587
TPCCA_0587
TP0597, TP0598
TP0597_598
TPA_0597
2
TPE_0597
2
TPFB_0597
TPCCA_0597
TP0702, TP0703
TP0702_703
TPA_0702
2
TPE_0702
2
TPFB_0702
TPCCA_0702
TP0781, TP0782
TP0781_782
TPA_0781
2
TPE_0781
2
TPFB_0781
TPCCA_0781
TP0859, TP0860
TP0859_860
TPA_0859
2
TPE_0859
2
TPFB_0859
TPCCA_0859
TP0899, TP0900
TP0899_900
TPA_0899
2
TPE_0899
2
TPFB_0899
TPCCA_0899
TP0928, TP0929
TP0928_929
TPA _0928
2
TPE_0928
2
TPFB_0928
TPCCA_0928
TP1030, TP1031
TP1030f, TP1031
TPA_1030f, TPA_1031 0
TPE_1031
0f
TPFB_1031
TPCCA_1031
a
Resekvenování genomu kmene Nichols (nepublikované výsledky) vedlo k podobným k fúzím genů (s výjimkou genů TP0126, TP0126a; TP0314, TP0315) jako v genomu kmene Samoa D. Názvy genů s podtržítky označují fúzi uvedených genů. b Geny jsou fúzované pouze v genomech kmenů Samoa D a SS14, ale ne v ostatních uvedených genomech nebo testovaných TPA genomech. c Gen TPCCA_0125a odpovídá genu TP0126, je pouze jinak pojmenovaný, gen TPCCA_0126 odpovídá části genu TP0126a, další část genu TPCCA_0126 je deletovaná. d Geny jsou fúzované pouze v genomu kmene Nichols a oddělené v ostatních zkoumaných genomech (Samoa D, CDC-2, Gauthier, SS14, Chicago, Fribourg-Blanc, Mexico A). e Geny jsou fúzované pouze v genomu kmene Fribourg-Blanc. f Gen je u TPA kmenů výrazně kratší (411 bp) oproti původnímu genu (AE000520.1) v důsledku posunové mutace, která je důsledkem chyby v původní sekvenci genomu Nichols. U kmenů TPE, FrBl ani Cuniculi A nebyl anotován, protože na homologním lokusu byl anotován prodloužený gen TPE_1031 (TPFB_1031, TPCCA_1031). Nejde o pravou fúzi mezi geny TP1030 a TP1031, protože TP1030 je kódován na zpětném řetězci a TP1031 na přímém řetězci DNA.
56
Výsledky Tabulka 12. Míra sekvenční identity mezi genomovými sekvencemi pěti kmenů TPA, tří kmenů TPE, kmenem T. paraluiscuniculi Cuniculi A a nespecifikovaným opičím izolátem Fribourg-Blanc Cuniculi A
Samoa D
CDC-2
Gauthier
Fribourg-Blanc
Nichols
DAL-1 a
Chicago B
Cuniculi A 100,0 98,0 97,9 97,9 97,9 98,0 (98,21) 98,0 98,0 a Samoa D 98,0 100,0 99,8 99,8 99,8 99,6 (99,64) 99,6 99,6 CDC-2 97,9 99,8 100,0 99,9 99,8 99,6 (99,63)a 99,6 99,6 a Gauthier 97,9 99,8 99,9 100,0 99,8 99,6 (99,64) 99,6 99,6 Fribourg-Blanc 97,9 99,8 99,8 99,8 100,0 99,6 (99,57)a 99,6 99,5 98,0 99,6 99,6 99,6 99,6 100,0 100,0 99,9 Nichols 98,0 99,6 99,6 99,6 99,6 100,0 (99,98)a 100,0 99,9 DAL-1 98,0 99,6 99,6 99,6 99,5 99,9 99,9 100,0 Chicago B 98,1 99,6 99,5 99,5 99,6 99,9 (99,92)a 99,8 99,8 SS14 a 98,0 99,6 99,6 99,6 99,6 99,9 (99,93) 99,9 99,8 Mexico A Výpočet identity byl proveden v programu Geneious z porovnání celogenomových sekvencí včetně mezer v důsledku inzercí/delecí. Kmeny TPA jsou označeny tučně. a Hodnoty v závorkách byly získány metodou WGF (Mikalová et al., 2010).
SS14
Mexico A
98,1 99,6 99,5 99,5 99,6 99,9 99,8 99,8 100,0 99,9
98,0 99,6 99,6 99,6 99,6 99,9 99,9 99,8 99,9 100,0
Tabulka 13. Nukleotidová diverzita a divergence vypočtená mezi kmeny TPA, TPE a Treponema Fribourg-Blanc a TPc Cuniculi A v rámci poddruhů a mezi druhy a poddruhy parameter (π) ± SD průměrný počet nukleotidových rozdílů mezi kmeny obou poddruhů/druhů (dA) ± SD
TPE a FrBl kmenya
TPA kmenya
TPc a TPA kmenya
TPc a TPE, FrBl kmenya
(0,01033 - 0,01065) ± (0,00513 - 0,00529)
(0,01053 - 0,01086) ± (0,00523 - 0,00539)
2118.4
11972,0
11664,3
0.00152 ± 0.00053
0,01047 ± 0,00427
0,01026 ± 0,00450
0.00041 ± 0.00011
0.00029 ± 0.00008
π – nukleotidová diverzita, dA – nukleotidová divergence, SD - směrodatná odchylka a Výpočet byl proveden z porovnaných celogenomových sekvencí v programu DnaSP, z výpočtu byly vyřazeny části sekvence obsahující inzerce/delece.
57
Výsledky
Tabulka 14. Souhrn změn specifických pro kmeny TPE (a Fribourg-Blanc) oproti kmenům TPA kódující u TPA/nekódující u TPE počet změn (počet počet ovlivněných nukleotidů ovlivněných (126 bp) nukleotidů – 66 bp)
nekódující u TPA/kódující kódující sekvence u TPE počet změn (počet počet ovlivněných počet ovlivněných nukleotidů (2764bp) změn nukleotidů – 65 bp)
nekódující sekvence
typ změny v sekvenci DNA/proteinu
počet změn
delece
5
celkem 41 bp (1 bp, 2x 2 bp, 6 bp, 30 bp)
3 (9 bp, 17 bp, 13 bp)
2 (1 bp, 3 bp)
15
510 bp (2x 1bp, 7x 3bp, 2x 9bp, 27 bp, 30 bp, 33 bp, 379 bp)
inzerce
4
celkem 9 bp (3x 1 bp, 6 bp)
-
1 (52 bp)
12
749 bp (2 bp, 7x 3bp, 12 bp, 14 bp, 65 bp, 635 bp)
substituce
76
40x TPA+TPc, 32x TPE+TPc, 4x TPc unikátní
27 (27 bp)
9 (9 bp)
1505
5xTPA+FrBl, 12xFrBl unikátní, 236xTPA+TPc, 272xTPE+TPc, 573x TPc unikátních
-
-
21
-
-
22
synonymní aa
-
-
-
-
485
nesynonymní aa
-
-
-
-
762
konzervativní aa
-
-
-
-
95
nekonzervativní aa
-
-
-
-
666
mutace ve stop kodonu
-
-
-
-
1
nukleotidové změny za posunovou mutací změny specifické pro TPE v nukleotidu, ale ne v aa
28 bp 479 bp (375 bp TPA+TPE+FrBl+TPc, 104 bp TPA+TPE+FrBlxTPc) (977 bp)
-
Celkem ovlivněných nukleotidů 3021 bp TPA+TPc – kmen Cuniculi A se v odpovídajících pozicích genu shoduje s kmeny TPA, TPE+TPc – kmen Cuniculi A se v odpovídajících pozicích genu shoduje s kmeny TPE, TPc unikátní (xTPc) – kmen Cuniculi A se v pozicích, kde se liší kmeny TPA a TPE neshoduje ani s jedním poddruhem TPE+FrBl – kmen Frbl se v odpovídajících pozicích shoduje s kmeny TPE
58
Výsledky
6.7.3
Nukleotidové rozdíly mezi kmeny TPA a TPE a jejich vliv na proteiny Vliv nukleotidových změn na sekvence proteinů byl hodnocen u 982 genů, které
byly anotovány podobně u kmenů TPE a původního genomu kmene Nichols (AE000520.1). V této skupině bylo zahrnuto rovněž 12 genů, které představují pseudogeny u kmenů TPE. Z nich 3 geny byly anotovány jako autentické posunové mutace a 3 geny jako zkrácené sekvence. Zbylých 6 genů nebylo u kmenů TPE anotováno vzhledem k jejich zkrácení pod stanovemý limit 150 bp. Hodnoceny byly ty změny, které se nacházely konzistentně mezi všemi kmeny TPA a všemi TPE. Podle tohoto kritéria kódovalo jen 8,7 % genů (84 genů) ze zbylých 970 genů (počet společných genů nezahrnujících pseudogeny kmenů TPE) proteiny se dvěma a více aminokyselinovými záměnami nebo MSC v proteinové sekvenci a 91,3 % genů (886 genů) proteiny s maximálně jedním aminokyselinovým rozdílem. Každému genu byla při anotaci přidělena pravděpodobná funkce jím kódovaného proteinu a podle ní lze geny rozdělit do sedmi funkčních skupin. Na obrázku grafu (obrázek 3) je zobrazeno procentuální zastoupení všech genů společných kmenům TPA i TPE podle funkčních skupin (pravý sloupec) a zastoupení genů se dvěma a více aa změnami v kódovaných proteinech podle funkčních skupin (levý sloupec). Z grafu lze v levém sloupci odečíst zvýšení zastoupení genů z funkčních skupin neznámé funkce a virulence a zároveň snížené zastoupení genů z funkčních skupin obecný metabolismus, buněčná stavba a buněčné procesy a regulace, transkripce a translace. Pro získání přesnějších výsledků byly na základě množství rozdílů mezi oběma poddruhy ve srovnávaných 982 proteinech rozděleny odpovídající geny do čtyř kategorií. První kategorie zahrnovala 692 genů (70,5 %), které kódovaly proteiny identické mezi oběma poddruhy včetně proteinů FrBl (436 genů bylo identických, dalších 152 genů obsahovalo substituce, ale kódovalo identické proteiny) nebo identické, ale s kmenově specifickými změnami (104 genů, tabulka S6). Druhá kategorie obsahuje 194 genů (19,8 %) kódujících proteiny s jednou aminokyselinovou změnou mezi všemi kmeny TPA a TPE. Třetí kategorie 63 (6,4 %) genů, které kódovaly proteiny se dvěma až pěti aminokyselinovými změnami a čtvrtá kategorie 33 genů (3,4 %) kódujících proteiny se 6 nebo více aminokyselinovými změnami, zkrácené proteiny (jako důsledek posunové mutace, které jsou kódovány pseudogeny kmenů TPE) a prodloužené proteiny (jako důsledek reverzní posunové mutace byly prodlouženy geny, jež byly pseudogeny u TPA kmenů). 59
Výsledky
Zastoupení genů dané funkční skupiny v příslušné kategorii genů (%)
100%
neznámá funkce 90%
33.3
virulence
80%
47.9 70%
transport
3.3 60%
11.5 regulace, transkripce, translace
50%
14.6
17.6
40%
30%
11.5
5.2
4.2
12.7 5.2
20%
6.3 10%
16.4
10.4
DNA replikace, oprava, rekombinace buněčná stavba a buněčné procesy obecný metabolismus
0%
TPE geny kódující proteiny se 2 a všechny geny společné TPA i TPE více aa změnami mezi TPE a TPA kmenům proteiny
Kategorie genů
Obrázek 3. Rozdělení genů společných všem kmenům TPA a TPE podle funkčních skupin
TPE geny v těchto kategoriích byly dále rozděleny podle funkce kódovaného proteinu do sedmi funkčních skupin. První skupina genů. uplatňujících se v obecném metabolismu, sloužila jako kontrolní skupina. Druhou skupinu představovaly geny, podílející se na buněčných procesech a na vytváření buněčných struktur. Třetí skupina zahrnovala geny, podílející se na DNA metabolismu. Ve čtvrté jsou geny, učastnící se regulace a genové exprese. V páté skupině jsoou geny s transportní funkcí, v šesté geny ovlivňující virulenci nebo potencionální virulenční faktory a v sedmé jsou geny s neznámou funkcí (tabulka 15). V kategorii genů, kódujících identické proteiny s virulentní funkcí, došlo ke statisticky signifikantnímu poklesu počtu genů (p < 0,001) oproti kontrolní skupině genů s funkcí v obecném metabolismu. K poklesu došlo také u skupiny genů s neznámou funkcí (p = 0,01), ten však nebyl vzhledem k Bonferroniho korekci statisticky významný. 60
Výsledky Naopak ke statisticky významnému zvýšení počtu genů ve srovnání s kontrolní skupinou došlo v kategorii genů, kódujících proteiny se šesti a více změnami nebo MSC ve funkční skupině potencionálních virulentních faktorů (p < 0,001) i ve skupině genů s neznámou funkcí (p = 0,006) (tabulka 15). Tabulka 15. Rozdělení proteinů kmenů TPA a TPE podle míry shody a funkční skupiny kódujícího genu
funkční skupina genu
metabolismus obecně buněčné procesy; buněčná struktura replikace, oprava, rekombinace DNA regulace; transkripce; translace transport virulence; možný virulenční faktor neznámá funkce počet genů v kategorii
počet genů kódujících identické proteiny (%) statistická významnosta 125 (77,6) 86 (68,8) 35 (68,6) -
počet genů kódujících proteiny s 1 aa substitucí (%) statistická významnost 26 (16,2) 33 (26,4) p = 0.033 11 (21,6)
9 (5,6) 5 (4,0) 4 (7,8) -
počet genů kódujících proteiny se 6 a více změnami nebo MSCb (%) statistická významnost 1 (0,6) 1 (0,8) 1 (2,0) -
počet genů kódujících proteiny se 2 -5 aa substitucemi (%) statistická významnost
137 (79,2)
32 (18,5) -
4 (2,3) -
0 (0,0) -
80 (70,8) 12 (37,5) p < 0,001 217 (66,4) p = 0,01
22 (19,5) 6 (18,7) 64 (19,6) -
11 (9,7) 3 (9,4) 27 (8,2) -
0 (0,0) 11 (34,4) p < 0,001 19 (5,8) p = 0,006
692
194
63
33
celkový počet genů (%)
161 (100) 125 (100) 51 (100) 173 (100) 113 (100) 32 (100) 327 (100) 982
Genetické rozdíly byly charakterizovány u 982 genů anotovaných podobně u TPE (Samoa D, CDC-2, Gauthier) i TPA kmenů (Nichols, DAL-1, SS14, Chicago, Mexico A). Hodnoceny byly pouze změny, které se nacházely pouze mezi všemi kmeny TPA a všemi TPE. a
Ve srovnání s geny kódujícími složky obecného metabolismu vykazovalo zastoupení genů statisticky
významné výsledky. Výsledná hodnota p byla upraveno podle Bonferroniho korekce pro mnohonásobná porovnávání na p = 0,008, hodnoty p nižší než 0.008 byly považovány za statisticky signifikantní. Zobrazeny jsou rovněž hodnoty p nižší než 0,05. b
MSC (major sequence changes) byly pro porovnání TPE a TPA kmenů definovány jako 15 nebo více
aminokyselinových substitucí, indely delší než 10 aminokyselin, zkrácené proteiny nebo naopak proteiny o plné délce (v důsledku posunové mutace, revertované posunové mutace, nesmyslné mutace nebo mutace ve start kodonu). c
Hodnota p je popsána jen pro statisticky významné rozdíly, statisticky nevýznamné rozdíly jsou označeny
pomlčkou
61
Výsledky
6.7.4
Geny kódující proteiny s většími sekvenčními změnami mezi kmeny obou poddruhů TPA a TPE Celkem 90 genů anotovaných u kmenů TPE (i Fribourg-Blanc) kódovalo proteiny,
které se lišily dvěma a více aminokyselinami nebo většími změnami (MSC) od odpovídajících proteinů TPA kmenů. K této skupině bylo možné navíc připočítat i geny, které jsou u kmenů TPE kratší než u kmenů TPA, nebyly proto anotovány a patří mezi pseudogeny kmenů TPE (TPE_0132, TPE_0180, TPE_0266, TPE_0318, TPE_0532, TPE_1030). Z této skupiny 96 genů mělo 52,1 % genů (50 genů) predikovanou funkci (tabulka 16, tabulka 18) a 47,9 % (46 genů) genů mělo funkci neznámou (tabulka 17, tabulka 19). Ke každému genu byla v literatuře nalezena míra exprese genu při experimentální infekci králíka (Šmajs et al., 2005). Dále bylo ověřeno, zda gen nekóduje pravděpodobný antigen nebo lipoprotein, jejichž detekce resp. predikce byla popsána v publikacích McKevitt et al., 2005; Setubal et al., 2006. Ověřována byla také účast na predikovaných interakcích (Titz et al., 2008). U genů, u nichž nebylo predikováno ovlivnění prostřednictvím rekombinace a které neobsahují posunové mutace, byl vypočten typ selekce. Z genů s predikovanou funkcí jich 36 obsahovalo 2 – 5 aa změn v odpovídajících proteinech (tabulka 18) a 14 genů 6 a více změn nebo MSC v odpovídajících proteinech (tabulka 16). Pět genů, kódujících proteiny s většími změnami, patřilo do funkční skupiny DNA replikace, transkripce a translace. 6 genů patřilo do skupiny buněčné procesy a buněčná struktura, 4 geny do skupiny regulace, transkripce, translace a 14 genů do skupiny virulenčních nebo potenciálně virulenčních faktorů. U všech genů patřících do kategorie genů, kódujících proteiny se šesti a více změnami a MSC, byly velké změny mezi kódovanými proteiny zaznamenány i u proteinů TPc Cuniculi A. U genu TPCCA_0009 došlo, stejně jako u kmenů TPE, k reverzní posunové mutaci. Naopak u genu TPCCA_0671 nedošlo k mutaci ve start kodonu. U ostatních TPCCA genů z této kategorie se vyskytly MSC specifické pro TPc (tabulka 16). Mezi geny s neznámou funkcí jich 27 obsahovalo 2 – 5 aa změn v odpovídajících proteinech (tabulka 19) a 19 genů obsahovalo 6 a více změn nebo MSC v odpovídajících proteinech (tabulka 17). V této skupině 46 genů s neznámou funkcí bylo identifikováno 18 genů kódujících signální peptidy, 12 genů kódujících membránové proteiny (8 proteinů) nebo proteiny vnější membrány (4 proteiny). U dvou proteinů byl predikován lipoproteinový charakter (Setubal et al., 2006) a 8 proteinů bylo identifikováno jako 62
Výsledky antigeny (McKevitt et al., 2005). Navíc bylo 30 z těchto 46 genů nalezeno jako součást proteinových interakcí mezi treponemálními proteiny (Titz et al., 2008). Způsob selekce byl testován u 78 genů z 96 s většími změnami nebo MSC v kódovaných proteinech mezi kmeny TPA a TPE. Z testování byly vyřazeny lokusy ovlivněné rekombinací. Z testů detekce rekombinace vyplývá, že k rekombinaci mohlo dojít u ortologních genů k TP0136, TP0316, TP0433, TP0618, TP0619, TP0898 iTP1031. Proto byly tyto geny spolu s ortology genů u nichž byla rekombinace detekována a publikována již v předchozích studiích (TP0117, TP0131, TP0620, TP0621; Gray et al., 2006) vyřazeny z testování selekce. Z tohoto testování byly dále vyřazeny ortologní geny s posunovou mutací (TP0103, TP0132, TP0180, TP0314, TP0318 a TP1030) nebo reverzní posunovou mutací (TP0009). Vyřazen byl i v rámci kmene variabilní gen tprK (LaFond et al., 2003; LaFond et al., 2006b). Pozitivní nebo negativní selekce byla detegována u 18 genů. Pozitivní selekce byla predikována u devíti genů se známou funkcí včetně šesti genů s predikovanou membránovou nebo periplasmatickou buněčnou lokalizací. Do této skupiny patří gen pro antigen TPE_0136 (tp92), geny pro proteiny buněčných procesů a struktur TPE_0488, TPE_0506, TPE_0729 (mcp, tig, fliK) a geny kódujících proteiny s transportní funkcí TPE_0143, TPE_0771 (-, nptA). Pozitivní selekce byla predikována i u genů kódujících proteiny s funkcí v obecném metabolismu TPE_0556, TPE_0559 (asnA, thiI) a protein podílející se na translaci TPE_0831 (argS) (tabulka 16, tabulka 18). Ve skupině genů s neznámou funkcí byla pozitivní selekce predikována u osmi genů. U čtyř z nich byla navíc detegována signální sekvence a gen TPE_0515 byl predikován jako gen kódující membránový protein. Šest z těchto osmi genů má také vysokou hladinu transkriptů při treponemální infekci králičích varlat (Šmajs et al., 2005). Negativní selekce byla detegována pouze u genu TPE_0140 kódujícího protein s transportní funkcí.
63
Výsledky
Tabulka 16. Geny kmenů TPE a FrBl s většími sekvenčními změnami oproti TPA kmenům, kódující proteiny s predikovanou funkcí gen
0009
název genu
tprA
funkce genu/proteinu
funkční skupina genu
Tpr protein A
možný virulenční faktor
0103
recQ
helikáza RecQ
0117
tprC
Tpr protein C
0131
tprD
Tpr protein D
0326
0433
možný virulenční faktor
důsledek větší změny v proteinua
změny v ortologních pozicích u Cuniculi Ab
2 bp I, 3 bp S
rev. pos. mut.
MSC v ortologním genu kmene Cuniculi A, stejná rev. pos. mut. jako u TPE (Giacani et al., 2004)
0.315
1 bp D, 1 bp S
pos. mut., prodloužení proteinu
1 bp D – pos. mut. – zkrácení proteinu, MSC v ortologním genu kmene Cuniculi A
0.394
MSC v ortologním genu kmene Cuniculi A (Giacani et al., 2004) pos. mut. a MSC v ortologním genu kmene Cuniculi A – publikovaná v (Giacani et al., 2004)
MSC
15 bp S/9 aa S
treponemální konzervovaný hypotetický protein vnější membrány
virulence
MSC
tprF
Tpr protein F
možný virulenční faktor
635 bp I
tp92
protein vnější membrány
virulence
4 bp S, 15 bp D (také u kmene Mexico)/ 2 aa S, 5 aa D (také u kmene Mexico A)
arp
treponemální konzervovaný hypotetický protein
možný virulenční faktor
0136
0316
replikace, oprava, rekombinace DNA možný virulenční faktor
typ změnya v genu/proteinu u TPE a FrBl
MSC
rev. pos. mut., prodloužení proteinu
exprese genuc pozn.
autentická pos. mut. v genomu Nichols
typ selekce (p)d (Z-test) -
-
0.737
detegována rekombinacee (Gray et al., 2006)
-
0.703
detegována rekombinace (Gray et al., 2006)
-
MSC v ortologním genu kmene Cuniculi A
5.199
antigenf, možný lipoproteing, detegována rekombinace
-
částečná delece v ortologních pozicích genu TPCCA_0316 (Giacani et al., 2004)
0.679
detegována rekombinace
-
MSC v ortologním genu kmene Cuniculi A
0.628
antigen
pozitivní (0.048)
1.390 1.985
antigen; detegována rekombinace; pozitivní selekce (Harper et al., 2008a)
-
MSC v ortologním genu kmene Cuniculi A
64
Výsledky
0488
mcp
chemotaktický protein vázající methyl
buněčné procesy
MSC
MSC v ortologním genu kmene Cuniculi A
3.341
0620
tprI
Tpr protein I
možný virulenční faktor
28 bp S/12 aa S
kompletní delece ortologního genu kmene Cuniculi A (Giacani et al., 2004)
0.654
detegována rekombinace (Gray et al., 2006)
-
0621
tprJ
Tpr protein J
možný virulenční faktor
MSC
pos.mut. v ortologním genu kmene Cuniculi A (Giacani et al., 2004)
0.751
detegována rekombinace (Gray et al., 2006)
-
Ethanolamin fosfotransferáza
metabolismus obecně
1 bp S - mutace ve start kodonu
TPA+TPcxTPE+FrBl
0.197
pseudogen
0671
0897
tprK
Tpr protein K
virulence
MSC
1031
tprL
Tpr protein L
možný virulenční faktor
379 bp D
zkrácení proteinu na Nkonci o 11 aa
posun. mut.
MSC v ortologním genu kmene Cuniculi A (Giacani et al., 2004) 444 bp I oproti TPE a pos. mut. v ortologním genu kmene Cuniculi A (Giacani et al., 2004)
pozitivní (0.000)
1.121
-
0.757
-
TPE geny kódující proteiny s predikovanou funkcí, které obsahují alespoň 6 aminokyselinových substitucí nebo jiné větší změny (mutace ve stop-kodonu, posunové mutace) mezi všemi kmeny TPA a TPE a
D, delece; pos. mut., posunová mutace; I, inzerce; MSC (major sequence changes) - 15 nebo více aminokyselinových substitucí, indely delší než 10 aminokyselin, zkrácené proteiny nebo naopak proteiny o plné délce
(v důsledku posunové mutace, revertované posunové mutace, nesmyslné mutace nebo mutace ve start-kodonu); rev. pos. mut., reverzní posunová mutace; S, substituce. b
Změny nalezené v genomu Treponema paraluiscuniculi Cuniculi A (Šmajs et al., 2011) .
c
Míra exprese genu v kmeni Nichols při kultivaci v králičích testes (Šmajs et al., 2005).
d
Test selekce byl vypočten podle Kumarova modelu (Nei & Kumar, 2000) v programu MEGA4 (Tamura et al., 2007).
e
V genu byla identifikována pravděpodobná rekombinace (Gray et al., 2006).
f
Protein byl identifikován jako pravděpodobný antigen (McKevitt et al., 2005).
g
Protein byl identifikován jako pravděpodobný lipoprotein (Setubal et al., 2006).
65
Výsledky
Tabulka 17. Geny kmenů TPE a FrBl kódující hypotetické proteiny s většími sekvenčními změnami oproti proteinům TPA kmenů gen
predikce proteinu
změnya v genu/proteinu u kmenů TPE a FrBl
0129
HP
2 bp S
0132
HP
29 bp S, 13 bp D, 17 bp D, 9 bp D
0180
HP
2 bp I
důsledek větší změny v proteinua nesmyslná mut. => zkrácení genu o 78 bp, u proteinu o 26 aa na N-konci pos. mut. => zkrácení predikovaného proteinu pod limit pos. mut. =>zkrácení predikovaného proteinu pod limit
exprese genuc
pozn.
částečná delece v ortologním genu kmene Cuniculi A
0.763
pseudogen
0.832
pseudogen
-
1.741
pseudogen
-
1 bp D v ortologním genu kmene Cuniculi A – pos. mut. – zkrácení genu o 16 bp mutace ve start kodonu, pos. mut. v ortologním genu kmene Cuniculi A částečná delece v ortologních pozicích genu TPCCA_0133 a 0134 vede k fůzi obou genů výsledkem je TPCCA_0133, Nkonec kódovaného proteinu odpovídá N-konci proteinu 0133 a C-konec C-konci proteinu 0134
e
0133
TCHP
13 aa S
0134
TCHOMP
6 aa S
0266
HP
33 bp D
0304
TCHP
6 aa S, 1 aa D
0314
TCHP
MSC
0318
HP
1 bp D
0370
HP
1bp S - nesmyslná mutace
0462
CHP
MSC
0483
TCHP
7 aa S
0577
TCHMP
5 aa S, 4 aa I
MSC v ortologním genu kmene Cuniculi A
0.531
0619
TCHP
MSC
gen u kmene Cuniculi A deletován
1.068
0733
TCHP
6 aa S
částečná delece genu, zkrácení pod délkový limit
typ selekce (p)d (Z-test)
změny v ortologních pozicích u Cuniculi Ab
2.093
antigen , možný lipoproteinf
3.586
17 bp delece, pos. mut.
3.213
pseudogen
-
MSC v ortologním genu kmene Cuniculi A
1.235
pos. mut. => fúze genů
MSC v ortologním genu kmene Cuniculi A
0.906 0.919
antigen
-
pos. mut. =>zkrácení predikovaného proteinu pod limit 150 bp zkrácení genu o 135 bp, 45 aa na Nkonci, délka proteinu má 68 % délky proteinu u TPA
2 bp D – pos. mut., =>zkrácení predikovaného proteinu pod limit 150 bp
0.947
pseudogen
-
MSC v ortologním genu kmene Cuniculi A
0.822
pseudogen,
MSC v ortologním genu kmene Cuniculi A
4.894 4.184
lipoprotein, antigen signální peptidg
0.446
1.735
v genu detegována recombinaceh signální peptid
pozitivní (0.000)
-
66
Výsledky
0858
TCHP
MSC
MSC v ortologním genu kmene Cuniculi A
11.770
0865
TCHOMP
11 aa S, 1 aa I
1 aa S u FrBl odlišná od TPE
MSC v ortologním genu kmene Cuniculi A
0.371
0968
TCHP
11 aa S
1 aa S u FrBl odlišná od TPE
MSC v ortologním genu kmene Cuniculi A
3.256
1030
HP
379 bp D
částečná delece genu
3 bp S – nesmyslná mutace => gen nebyl anotován
1.46
antigen, signální peptid signální peptid
pseudogen
pozitivní (0.013) pozitivní (0.035) -
TPE geny kódující proteiny s predikovanou funkcí, které obsahují alespoň 6 aminokyselinových substitucí nebo jiné větší změny (mutace ve stop-kodonu, posunové mutace) mezi všemi kmeny TPA a TPE a
D, delece; pos. mut., posunová mutace; I, inzerce; MSC (major sequence changes) - 15 nebo více aminokyselinových substitucí, indely delší než 10 aminokyselin, zkrácené proteiny nebo naopak proteiny o plné délce
(v důsledku posunové mutace, revertované posunové mutace, nesmyslné mutace nebo mutace ve start-kodonu); rev. pos. mut., reverzní posunová mutace; S, substituce. b
Změny nalezené v genomu Treponema paraluiscuniculi Cuniculi A (Šmajs et al., 2011).
c
Míra exprese genu v kmeni Nichols při kultivaci v králičích testes (Šmajs et al., 2005).
d
Test selekce byl vypočten podle Kumarova modelu (Nei & Kumar, 2000) v programu MEGA4 (Tamura et al., 2007).
e
Protein identifikován jako pravděpodobný antigen (McKevitt et al., 2005).
f
Protein identifikován jako pravděpodobný lipoprotein (Setubal et al., 2006).
g
Program Signal P predikoval v proteinu signální peptid (Petersen et al., 2011).
h
V genu byla identifikována pravděpodobná rekombinace (Gray et al., 2006).
67
Výsledky
Tabulka 18. Geny kmenů TPE a FrBl kódující proteiny s predikovanou funkcí se 2 - 5 aminokyselinovými změnami oproti proteinům TPA kmenů změnaa v proteinu u TPE a FrBl
gen
název genu
funkce genu/proteinu
funkční skupina genu
0081
coxM
xantin dehydrogenáza
metabolismus obecně replikace, oprava, rekombinace DNA replikace, oprava, rekombinace DNA
2 aa S
0.306
-
2 aa S
0.534
-
2 aa S
0.405
-
transport
2 aa S
0.349
-
0102 0116
helikáza z rodiny UvrD/REP
změny v ortologních pozicích u Cuniculi Ab
exprese pozn. genuc
uvrB
podjednotka UvrB excizní endonukleázy
transport
4 aa S
0.448
-
0164
troB
transport
2 aa S
0.923
-
0227
cbiO
transport
2 aa S
1.669
-
0241
rpoB
(K+) transportér z rodiny Trk, membranový protein transportér vázající ATP ze superrodiny ABC, membranový protein (Fe2+)/(Zn2+)/(Mn2+) transportér vázající ATP ze superrodiny ABC, ABC protein Co2+ transportér vázající ATP ze superrodiny ABC, ABC protein RNA polymeráza řízená DNA, beta podjednotka
transkripce
2 aa S
0.047
-
0303
mutL
protein opravující DNA MutL
replikace, oprava, rekombinace DNA
2 aa S
0.817
antigene
0140 0143
pos. mut. v ortologním genu kmene Cuniculi Ad (Giacani et al., 2004)
0313
tprE
Tpr protein E
možný virulenční faktor
4 aa S
0344
trcF
transkripce
3 aa S
0.273
-
0367
smc
buněčné procesy
2 aa S
0.707
-
0379
secA
spojovací faktor transkripce-oprava ATPáza podílející se na segregaci chromozomu protein SecA
transport
2 aa S
0.95
-
0429
ntpI
transport
2 aa S
1.166
-
0446
gcpE
ATPáza, V(0) podjednotka I 4-hydroxy-3-methylbut-2-en-1-yl difosfát syntáza symporter-2 rodiny NCS2
metabolismus obecně
2 aa S
0.338
-
transport
2 aa S
-
-
peptidylprolyl izomeráza
buněčné procesy
3 aa S
1.058
-
0451a 0506
tig
typ selekce (p)d (Z-test)
negativní (0.041) pozitivní (0.013)
0.7
pozitivní (0.036)
68
Výsledky
0556
asnA
aspartate--ammonia ligáza
metabolismus obecně
3 aa S - mutace ve start kodonu protein je o 4 aa delší na N-konci u TPE+FrBl
1.813
-
pozitivní (0.034)
0559
thiI
ATP pyrofosfatáza pro biosyntézu thiaminu
metabolismus obecně
2 aa S
0.907
-
pozitivní (0.020)
0569
pepP
Xaa-Pro aminopeptidáza
metabolismus obecně
2 aa S
0.434
-
0586
leuS
leucine--tRNA ligáza
translace
2 aa S
0.972
-
0610
tprH
Tpr protein H
možný virulenční faktor
2 aa S
0.916
-
0639
mcp
chemotaktický protein vázající methyl
buněčné procesy
3 aa S
0.726
-
0691
scpA
segregační a kondenzační protein ScpA
buněčné procesy
3 aa S
0.289
-
0695
accC
biotin karboxyláza
metabolismus obecně
2 aa S
0.699
-
0715
flhB
sekreční protein IIISP Typ III (virulence)
virulence
2 aa S
0.171
-
0729
fliK
protein kontrolující délku bičíku FliK
buněčná struktura
5 aa S
2.949
-
pozitivní (0.010)
0735
gltD
glutamát syntáza (NADPH)
metabolismus obecně
2 aa S
0771
nptA
fosfát:sodík (Na+) symportér
transport
3 aa S
0.514
-
pozitivní (0.042)
0780
nadE
NAD(+) syntáza
metabolismus obecně
2 aa S
0.398
-
0831
argS
arginin--tRNA ligáza
translace
3 aa S
0.459
-
0861
glmS
glutamin--fruktóza-6-fosfát transamináza
metabolismus obecně replikace, oprava, rekombinace DNA
5 aa S
0.973
-
0898
recB
exodeoxyribonukleáza V beta podjednotka
0949
oxaA
0988
marC
dikarboxylát/aminokyselina: (Na+) nebo (H+) symportér cytochrom oxidázu tvořící protein transportér antibiotické rezistence z rodiny MarC
0934
a
5 aa S
MSC v ortologním genu kmene Cuniculi A
MSC v ortologním genu kmene Cuniculi A
1.338
pozitivní (0.050)
0.413
transport
2 aa S
0.879
-
transport
3 aa S
0.492
-
transport
2 aa S
0.653
-
D, delece; I, inzerce; S, substituce.
b
Změny nalezené v genomu Treponema paraluiscuniculi Cuniculi A (Šmajs et al., 2011).
c
Míra exprese genu v kmeni Nichols při kultivaci v králičích testes (Šmajs et al., 2005).
d
Test selekce byl vypočten podle Kumarova modelu (Nei & Kumar, 2000) v programu MEGA4 (Tamura et al., 2007).
e
Protein byl identifikován jako pravděpodobný antigen (McKevitt et al., 2005). .
69
Výsledky
Tabulka 19. Geny kmenů TPE a FrBl kódující hypotetické proteiny se 2 - 5 aminokyselinovými změnami oproti proteinům TPA kmenů gen 0067 0086 0110 0335 0346 0369 0376 0408 0422 0484 0515 0548 0564 0618 0638 0697 0698 0738 0854 0856 0859 0864 0866 0967 0969 0987
predikovaný protein
CHP CHP TCHP TCHMP CHP TCHP CHP CHP TCHP CHP CHOMP TCHMP TCHMP TCHP TCHMP HMP HMP CHP CHMP TCHP TCHP CHP CHP TCHP TCHOMP TCHP možný vzácný lipoprotein A 0993 CHP a D, delece; I, inzerce; S, substituce. b
změnya v genu/proteinu u TPE a FrBl kmenů 1 aa S, 3 aa D 3 aa S 5 aa S 2 aa S 5 aa S 3 aa S 2 aa S 2 aa S 2 aa S 3 aa S 2 aa S 2 aa S, 3 aa D 2 aa S 3 aa S 2 aa S 5 aa S 2 aa S 2 aa S 2 aa S 3 aa S 2 aa S, 5 aa I, 6 aa S 2 aa S 3 aa S 1 aa I , 3 aa S 5 aa S 2 aa S
změny v ortologních pozicích u Cuniculi Ab
MSC v ortologním genu kmene Cuniculi A MSC v ortologním genu kmene Cuniculi A posun čtecího rámce v ortologním genu kmene Cuniculi A
MSC v ortologním genu kmene Cuniculi A
MSC v ortologním genu kmene Cuniculi A MSC v ortologním genu kmene Cuniculi A
MSC v ortologním genu kmene Cuniculi A MSC v ortologním genu kmene Cuniculi A
3 aa S
exprese genuc 0.622 2.497 0.561 0.882 2.874 0.918 1.587 1.606 0.511 0.489 0.104 0.898 0.378 1.227 0.711 0.885 1.813 0.709 0.221 5.697 2.231, 1.204 1.100 0.721 2.844 2.751 0.555 2.487
pozn. signální peptide antigenf, signální peptid signální peptid signální peptid signální peptid signální peptid signální peptid antigen, signální peptid signální peptid signální peptid signální peptid antigen, signální peptid
typ selekce (p)d (Z-test) pozitivní (0.036)
pozitivní (0.035)
pozitivní (0.000)
pozitivní (0.046)
-
signální peptid antigen, signální peptid
pozitivní (0.033)
Větší změny nalezené v genomu Treponema paraluiscuniculi Cuniculi A (Šmajs et al., 2011) .
c
Míra exprese genu v kmeni Nichols při kultivaci v králičích testes (Šmajs et al., 2005).
d
Test selekce byl vypočten podle Kumarova modelu (Nei & Kumar, 2000) v programu MEGA4 (Tamura et al., 2007).
e
Program Signal P predikoval v proteinu signální peptid (Petersen et al., 2011).
f
Protein byl identifikován jako pravděpodobný antigen (McKevitt et al., 2005)..
70
Výsledky
6.8
Fylogenetická analýza mezi genomy původců syfilis, yaws, spirochetózy králíků a treponemálního onemocnění paviána Porovnání genomů všech kmenů, které bylo použito při detekci variability mezi
kmeny, bylo použito i pro vytvoření fylogenetického stromu v programu MEGA 4. Strom byl získán s využitím metody Neighbor-Joining (Saitou & Nei, 1987). Ve fylogenetickém stromu je patrné rozdělení treponemálních kmenů do 3 hlavních větví, do větve syfilitických kmenů, větve kmenů yaws která zahrnuje kmen Fribourg-Blanc a do větve kmene Cuniculi A. Skupina syfilitických kmenů se dále rozvětvuje na skupinu kmenů podobných kmeni Nichols a na skupinu kmenů podobných kmeni SS14.
Obrázek 4. Nezakořeněný fylogenetický strom byl získán s využitím metody modifikované minimální evoluce Neighbor-Joining (Saitou & Nei, 1987) z deseti celogenomových sekvencí uvedených kmenů. Podpora jednotlivých uzlů byla vypočítána metodou bootstrapu s použitím 1000 opakování (Felsenstein, 1985). Číslice u jednotlivých větví vyjadřují procentuální zastoupení stromů ve kterých byly při testování metodou bootstrapu jednotlivé skupiny asociovány do jedné větve. Evoluční vzdálenosti byly vypočteny s použitím metody autorů Tamura-Nei (Tamura & Nei, 1993) a vyjadřují počet substitucí na jednu bazi. Všechny pozice obsahující mezery a chybějící data byly eliminovány. Celkem bylo analyzováno 1129108 nukleotidových pozic.
71
Výsledky 6.9
Rozdíly v rrn operonech u různých kmenů nekultivovatelných patogenních treponemat. K taxonomické identifikaci bakterií a ke zjištění jejich evoluční historie se
používají sekvence kódující rRNA (Woese et al., 1990). Proto byly ostatní kmeny patogenních treponem, které byly k dispozici, porovnány právě na úrovni genů pro rRNA. V genomu patogenních treponemat byly popsány 2 rrn operony (16S-23S-5S), které navíc mezi geny pro 16S a 23S rRNA zahrnují geny kódující buď tRNA-Ala nebo tRNA-Ile (Fraser et al., 1998; Fukunaga et al., 1992; Giacani et al., 2010; Šmajs et al., 2011). Metodou XL-PCR byly amplifikovány rrn operony u dosud nesekvenovaných kmenů. A to u 7 kmenů Treponema pallidum subsp. pallidum (Bal 73-1, Grady, Haiti B, Madras, MN-3, Philadelphia-1, Philadelphia-2), 3 kmenů Treponema pallidum subsp. pertenue (CDC-1, Gauthier, Samoa F), 1 kmene Treponema pallidum subsp. endemicum (Iraq B) a 1 kmene Treponema paraluisleporis. Sekvence ostatních kmenů lokusů pro rRNA byly získány z databáze GenBank nebo od kolegů, kteří je připravovali. U kmene T. paraluisleporis byla sekvenována pouze část obou operonů zahrnující 16S rDNA. Sekvence byly získány pro všechny zpracovávané XL PCR produkty (24). K následné analýze byly použity sekvence rrn operonů i ostatních kmenů uvedených v tabulce 2 a sekvence rrn operonů kmene Chicago B (CP001752; Giacani et al., 2010). Množství zdrojové DNA kmene TEN Iraq B bylo velmi malé. Amplifikace rrn2 operonu byla problematičtější a sekvence pro 23S rRNA v určitých pozicích nerozhodná. A proto jí nebylo použito při konstrukci fylogenetického stromu zahrnujícího oba celé operony (obrázek 6). Sekvenční polymorfismy, nalezené uvnitř rrn operonů u 22 patogenních treponemálních kmenů, jsou zvýrazněné v tabulce 20 (což je upravená tabulka D. Čejkové). U všech kmenů byly sekvence mezi oběma rrn operony daného kmene identické. A to včetně 54 bp za genem pro 5S rRNA, 212 bp před genem pro 16S rRNA u TPA, 186 bp u TPc Cuniculi A a T. paraluisleporis a 181 bp u TPE, TEN a FribourgBlanc. Lišily se pouze geny pro tRNA-Ile nebo tRNA-Ala mezi geny pro 16S a 23S rRNA, což představuje 64 bp respektive 74 bp. Výjimkou je kmen DAL-1, u něhož se v operonu rrn1 v intergenové oblasti 171-167 bp před genem pro 16S rRNA vyskytuje delece G (GGGG) oproti operonu rrn2, kde je na stejné pozici sekvence pěti G (GGGGG). Tento rozdíl byl několikrát ověřený Sangerovým sekvenováním. Některé kmeny mají v operonu rrn1 gen pro tRNA-Ile a v rrn2 operonu pro tRNA-Ala (např. kmen Nichols, SS14, Samoa D, Cuniculi A) a u některých je tomu naopak (např. kmen Haity B, Madras, CDC-2, Bosnia
72
Výsledky A). Tato translokace neodpovídá druhové ani podruhové příslušnosti kmene. Podrobněji se jí zabývá práce D. Čejkové. Při porovnávání rrn operonů včetně IGR oblasti předcházející genu pro 16S rRNA mezi jednotlivými kmeny bylo nalezeno pouze 19 pozic, ve kterých se některé z kmenů lišily, nicméně chyběla sekvence pro geny 23S rRNA a 5S rRNA u T. paraluisleporis. Na 18 místech došlo k jednonukleotidové substituci a na jedné pozici k jednonukleotidové deleci u kmene DAL-1. Všechny kmeny TPA se od ostatních patogenních treponem liší v pozici 766 genu pro 23S rRNA. Kmeny TPE spolu s kmenem Fribourg-Blanc lze odlišit od ostatních kmenů jednonukleotidovou záměnou 93 párů bazí před genem pro 16S rRNA. Kmeny TEN se liší od ostatních patogenních treponemat jednonukleotidovou záměnou na pozici 1375 genu pro 16S rRNA. Kmen SS14 se od ostatních zkoumaných kmenů liší na pozici 2104 genu pro 23S rRNA, což odpovídá mutaci vedoucí k makrolidové rezistenci treponemálních kmenů (Stamm & Bergen, 2000). Kmen Fribourg-Blanc lze odlišit od ostatních kmenů substitucí na pozici 458 genu pro 23S rRNA. T. paraluiscuniculi se od ostatních patogenních treponemat kromě T. paraluisleporis liší ve dvanácti pozicích. Z toho pět záměn bylo v genu pro 16S rRNA nebo sekvenci, která ho předchází. Ve čtyřech těchto pozicích se od ostatních zkoumaných kmenů kromě T. paraluiscuniculi lišila také T. paraluisleporis, na páté pozici (647. baze v genu pro 16S rRNA) se T. paraluisleporis shodovala s ostatními zkoumanými kmeny a lišila se pouze s T. paraluiscuniculi. T. paraluisleporis se od všech zkoumaných genů včetně T. paraluiscuniculi navíc odlišovala na pozici 45 bp od konce genu pro 16S rRNA v intergenové oblasti mezi geny pro 16S rRNA a tRNA. V tabulce 20 je také zahrnuta část genu TP0225, která byla součástí XL PCR produktu při sekvenaci rrn1 operonu. V tomto genu jsou další 4 pozice, ve kterých se zkoumané kmeny liší. Na pozici 671 genu TP0225 se liší TEN spolu s T. paraluiscuniculi a také T. paraluisleporis od kmenů TPA a TPE. Na pozici 670 genu TP0225 se liší TEN od ostatních zkoumaných kmenů. T. paraluisleporis lze odlišit od ostatních kmenů také substitucí v 641. nukleotidu genu TP0225 a T. paraluiscuniculi substitucí na pozici 727 genu TP0225. Významnou změnu lze nalézt také v genu TP0266 před rrn2 operonem. V homologické pozici dochází oproti kmenům TPA k delci 33 bp u kmenů TPE, TEN a kmene Fribourg-Blanc a k deleci 17 bp u kmenů T. paraluiscuniculi a T. paraluisleporis, která vede ke zkrácení a/nebo k posunu ve čtecím rámci u ortologních genů. Ze spojených sekvencí obou rrn operonů po vyřazení heterologních tRNA sekvencí (tabulka 3) byl pro 20 kmenů vytvořen fylogenetický strom (obrázek 6 (a)). Pro nedostatek 73
Výsledky dat nebo pro nižší kvalitu 23S rRNA sekvence v rrn2 operonu do něj nebyl zařazen kmen T. paraluisleporis a Iraq B. Byl proto vytvořen strom pouze ze spojených sekvencí pro 16S rRNA a okolních sekvencí (tabulka 3), do kterého mohly být zařazeny i kmeny T. paraluisleporis a Iraq B (obrázek 6(b)). Kmeny se v obou stromech řadily do větví podle příslušnosti k druhu nebo poddruhu. T. paraluisleporis se řadila do stejné větve k T. paraluiscuniculi Cuniculi A. Vzhledem k použití 16S rRNA sekvence pro konstrukci stromu na obrázku 6(b) zanikla sekvenční odlišnost kmene SS14 a Fribourg-Blanc oproti ostatním kmenům TPA respektive TPE. 6.9.1
Detekce tRNA-Ile a tRNA-Ala v rrn1 a rrn2 operonech u klinických izolátů. Metoda zavedená pro detekci tRNA v rrn operonech byla ověřena na laboratorních
treponemálních kmenech (obrázek 5 a obrázek 7) a testována na 35 vzorcích DNA izolovaných z klinických vzorků pacientů se syfilis (Flasarová et al., 2012). Výsledek, který bylo možno získat pro 30 vzorků klinických izolátů byl u všech vzorků klinických izolátů stejný a odpovídal vzoru na obrázku 5A. Stejně jako u kmene Nichols obsahovaly všechny vzorky v lokusu rrn1 gen pro tRNA-Ile a v lokusu rrn2 gen pro tRNA-Ala. Výsledky pro klinické vzorky jsou uvedeny v tabulce S7 v příloze. A
1
2
3
4
5
B
1
2
3
4
5
Obrázek 5. Elektroforetická analýza PCR produktů 2. kroku nested PCR při detekci tRNA v intergenové oblasti genů pro 16S-23S 1 – 1kb standard (NEB), 2 a 3 - produkt rrn1 lokusu (z první a druhé reakce 1. kroku nested PCR) amplifikován s použitím primerů cdc_TP0225_F a TP0225-6bR, 4 a 5 - PCR produkt rrn2 lokusu (třetí a čtvrtá reakce) amplifikován s použitím primerů RNA2Fa a TP0225-6bR. A – kmen T. pallidum obsahující gen pro tRNA-Ile v lokusu rrn1 a pro tRNA-Ala v lokusu rrn2. B – kmen T. pallidum obsahující geny pro tRNA-Ala v lokusu rrn1 a pro tRNA-Ile v lokusu rrn2
74
Výsledky
Tabulka 20. Sekvenční polymorfismy nalezené uvnitř rrn operonů 22 patogenních treponemálních kmenů. Žlutě a zeleně jsou zvýrazněny nukleotidové polymorfismy, oranžově jsou zvýrazněny translokace tRNA homologní sekvence operonů rrn u treponemální kmenů TPA, TPE, TEN, T. paraluiscuniculi Cuniculi A a T. paraluisleporis Pozice před genem (upstream – U) nebo za genem (downstream – D) nebo uvnitř genu
TP0225 (741 bp)
IGR (181 bp)
16S rRNA (1537 bp)
641 670 671 727 171-167 U 96 U 93 U T P A
Bal 73-1 (rrn1)
A
G
T
A
Bal 73-1 (rrn2) Chicago (rrn1)
A
G
T
A
Chicago (rrn2) DAL-1 (rrn1)
A
G
T
A
DAL-1 (rrn2) Grady (rrn1)
A
G
T
A
Grady (rrn2) Haiti B (rrn1)
A
G
T
A
Haiti B (rrn2) Madras (rrn1)
A
G
T
A
Madras (rrn2) Mexico A (rrn1) Mexico A (rrn2)
A
G
T
A
IGR (117 nebo 116 bp)*
IGR tRNA (111 nebo (74 bp)* 122 bp)*
647 1134 1375 1441 45D 71 D
IGR (50 bp)
23S rRNA (2951 bp)
5S rRNA (110 bp)
21 U
458
763
766
1092
1359
1546
2104
47 D
81
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ile
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ala
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ile
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ala
G
G
G
G
G
A
A
A
C
C
GGGG
A
A
G
G
G
C
G
G
tRNA-Ile
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ala
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ile
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ala
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ala
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ile
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ile
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ala
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ala
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ile
G
G
G
G
G
A
A
A
C
C
75
Výsledky MN-3 (rrn1)
A
G
T
A
MN-3 (rrn2) Nichols (rrn1)
A
G
T
A
Nichols (rrn2) Philadelphia 1 (rrn1) Philadelphia 1 (rrn2) Philadelphia 2 (rrn1) Philadelphia 2 (rrn2) SS14 (rrn1)
A
A
A
G
G
G
T
T
T
A
A
A
SS14 (rrn2) CDC-1 (rrn1)
A
G
T
A
CDC-1 (rrn2) CDC-2 (rrn1)
A
G
T
A
CDC-2 (rrn2) T P E
Gauthier (rrn1)
A
G
T
A
Gauthier (rrn2) Samoa D (rrn1)
A
G
T
A
Samoa D (rrn2) Samoa F (rrn1) Samoa F (rrn2)
A
G
T
A
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ala
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ile
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ile
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ala
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ile
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ala
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ala
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ile
G
G
G
G
G
A
A
A
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ile
G
G
G
G
G
A
A
G
C
C
GGGGG
A
A
G
G
G
C
G
G
tRNA-Ala
G
G
G
G
G
A
A
G
C
C
GGGGG
A
G
G
G
G
C
G
G
tRNA-Ile
G
G
G
A
G
A
A
A
C
C
GGGGG
A
G
G
G
G
C
G
G
tRNA-Ala
G
G
G
A
G
A
A
A
C
C
GGGGG
A
G
G
G
G
C
G
G
tRNA-Ala
G
G
G
A
G
A
A
A
C
C
GGGGG
A
G
G
G
G
C
G
G
tRNA-Ile
G
G
G
A
G
A
A
A
C
C
GGGGG
A
G
G
G
G
C
G
G
tRNA-Ala
G
G
G
A
G
A
A
A
C
C
GGGGG
A
G
G
G
G
C
G
G
tRNA-Ile
G
G
G
A
G
A
A
A
C
C
GGGGG
A
G
G
G
G
C
G
G
tRNA-Ile
G
G
G
A
G
A
A
A
C
C
GGGGG
A
G
G
G
G
C
G
G
tRNA-Ala
G
G
G
A
G
A
A
A
C
C
GGGGG
A
G
G
G
G
C
G
G
tRNA-Ile
G
G
G
A
G
A
A
A
C
C
GGGGG
A
G
G
G
G
C
G
G
tRNA-Ala
G
G
G
A
G
A
A
A
C
C
76
Výsledky
T.
Fribourg-Blanc (rrn1) Fribourg-Blanc (rrn2) Bosnia A (rrn1)
T E N
A
A
G
A
T
C
A
A
BosniaA (rrn2) Iraq B (rrn1)
A
A
C
A
Iraq B (rrn2) T P c
T.
Cuniculi A (rrn1) Cuniculi A (rrn2) paraluisleporis (rrn1) paraluisleporis (rrn2)
A
G
G
G
C
C
G
A
GGGGG
A
G
G
G
G
C
G
G
tRNA-Ala
G
A
G
A
G
A
A
A
C
C
GGGGG
A
G
G
G
G
C
G
G
tRNA-Ile
G
A
G
A
G
A
A
A
C
C
GGGGG
A
A
G
G
A
C
G
G
tRNA-Ala
G
G
G
A
G
A
A
A
C
C
GGGGG
A
A
G
G
A
C
G
G
tRNA-Ile
G
G
G
A
G
A
A
A
C
C
GGGGG
A
A
G
G
A
C
G
G
tRNA-Ala
G
G
G
A
G
A
A
A
C
C
GGGGG
A
A
G
G
A
C
G
G
tRNA-Ile
G
G
G
A
G
A
A
A
C
C
GGGGG
G
A
A
A
G
T
G
A
tRNA-Ile
A
G
A
A
A
G
G
A
T
A
GGGGG
G
A
A
A
G
T
G
A
tRNA-Ala
A
G
A
A
A
G
G
A
T
A
GGGGG
G
A
G
A
G
T
T
A
tRNA-Ile
?
?
?
?
?
?
?
?
?
?
GGGGG
G
A
G
A
G
T
T
A
tRNA-Ala
?
?
?
?
?
?
?
?
?
?
* Délka intergenové oblasti mezi 16S and 23S rRNA se mění podle toho, jestli je přítomna sekvence genu tRNA-Ile (117+74+111, celkem 302 bp) nebo tRNA-Ala (116+74+122, celkem 312 bp)
77
Výsledky (b)
Obrázek 6. (a) Nezakořeněný strom z konkatenovaných sekvencí rrn operonů po vyřazení tRNA genů. rrn operony se rozdělují podle druhové/poddruhové klasifikace treponem. (b) Nezakořeněný strom z konkatenovaných sekvencí rrn operonů zahrnujících gen pro16S RNA a nejbližší sekvenované okolí. Proto bylo možné zahrnout i sekvence kmene TEN IraqB a T. paraluisleporis.
78
Výsledky
Obrázek 7. Schematické zobrazení treponemálních operonů rrn. rrn operony se skládají z genů pro 16S-23S-5S rRNA. V oblasti mezi geny pro 16S-23S rRNA je gen pro tRNA-Ile nebo tRNA-Ala. Malé zeleně a fialově vybarvené šipky představují primery, které byly použity při amplifikaci 16S rRNA u klinických izolátů. V obrázku jsou laboratorní treponemální kmeny rozdělené podle druhu/poddruhu a genu tRNA v oblasti mezi 16S-23S rRNA.
79
Diskuze
7 DISKUZE 7.1
Srovnání celogenomových sekvenačních metod O nových, tzv. highthroughput, sekvenačních metodách již vzniklo mnoho
publikací a review (Alkan et al., 2011; Haiminen et al., 2011; Mardis, 2008; Metzker, 2010). Srovnání uvedené v mé práci vzniklo při zavádění celogenomových sekvenačních metod do laboratorní praxe. Hlavním cílem bylo vybrat metodu vhodnou pro sekvenaci dalších genomů Treponema pallidum a také usnadnit rozhodování při hodnocení dat. Při sekvenaci genomu kmene Samoa D vložila nejvíce chyb do sekvence metoda pyrosekvenování a nejméně metoda Illumina. Hlavní rozdíl mezi metodami byl v zastoupení typů chyb. Podstatný byl také rozdíl v délce a četnosti mezer mezi kontigy. Nejméně mezer měla z principu metoda CGS. Druhé nejmenší zastoupení mezer měla metoda pyrosekvenování. To je dáno hlavně delšími sekvenačními čteními oproti metodě Illumina, která má mezi kontigy nejdelší a nejčetnější mezery. Výsledky porovnání metod použitých při sekvenaci Samoa D se shodují s daty uvedenými v publikacích. Mezery v kontizích metody pyrosekvenování a Illumina byly z velké části dány přítomností paralogních genů v sekvenci. Tím, že se při sekvenaci chromozomu kmene Fribourg-Blanc genom rozdělil na čtyři soubory XL-PCR produktů, byla celková délka mezer mezi kontigy podstatně zkrácena. Výsledná délka mezer byla menší než 3,5 kb. Pro získání kvalitní celogenomové sekvence de novo je tedy nejvhodnější zvolit kombinaci metod: metody poskytující dlouhá sekvenační čtení i když menší průměrné pokrytí jedné baze a metody s vysokým sekvenčním pokrytím jedné baze. 7.2
Variabilita mezi genomy nekultivovatelných patogenních treponemat Již před zahájením projektu sekvenace genomů původců yaws bylo identifikováno
několik nukleotidových změn mezi genomy původců syfilis a yaws. Těchto rozdílů však bylo příliš málo na to, aby se dalo s jistotou tvrdit, že se nevyskytují i v rámci syfilitických kmenů. Nebylo tedy ani možné určit, do jaké míry jsou tyto rozdíly příčinou odlišných klinických manifestací obou onemocnění. Nahlédnout do celogenomové variability syfilitických kmenů se podařilo až deset let po získání první celogenomové sekvence syfilitického kmene Nichols (Fraser et al., 1998). Došlo k tomu díky určení nukleotidové sekvence syfilitického kmene SS14 (Matějková et al., 2008) a později kmene Chicago (Giacani et al., 2010), DAL-1 (Zobaníková et al., 2012) a Mexico A (Pětrošová et al.,
80
Diskuze 2012). Zatímco při porovnání sekvencí kmenů SS14 a Mexico A se sekvencí kmene Nichols bylo nalezeno více než 300 substitucí, porovnáním sekvencí kmenů Chicago a DAL-1 s kmenem Nichols bylo nalezeno méně než 70 substitucí. Z těchto dat i výpočtů nukleotidové diverzity (Šmajs et al., 2012) mezi kmeny TPA vyplývá, že se kmeny poddruhu pallidum dělí do dvou skupin. Rozdíly v genomových sekvencích a nukleotidové diverzitě jsou v rámci skupiny menší než mezi kmeny z různých skupin. Počet substitucí nalezených mezi kmeny TPE a TPA byl však řádově desetkrát vyšší (1581 substitucí) než počet substitucí v rámci kmenů TPA. Tento fakt jasně odporuje teorii, že všechna treponemální onemocnění jsou různými projevy jediného původce (Hudson, 1963, 1965). Při porovnání všech dosud získaných celogenomových sekvencí bylo zjištěno, že všechny genomy kmenů TPA, TPE, Fribourg-Blanc i Cuniculi A mají obdobné zastoupení bazí G a C (52,8 %). Jak vyplývá z tabulky (tabulka 9), ani rozdíl v délce genomů mezi kmeny TPA a TPE (1200 bp, 0,1 % délky genomu kmene Chicago) neodpovídá poddruhové příslušnosti kmenů T. pallidum. Vzhledem k velmi odlišným místům a letopočtům izolace je tento rozdíl navíc velmi malý. Nejkratší genom Treponema pallidum má kmen Chicago (1139281 bp). Nejdelší je genom kmene Fribourg-Blanc (1140481 bp). Výrazně kratší o 7091 bp oproti genomu kmene Fribourg-Blanc je genom T. paraluiscuniculi Cuniculi A, který má 1133390 bp. U kmene Cuniculi A byl anotován menší počet genů, které jsou odděleny celkově delšími intergenovými oblastmi než u TPE nebo TPA kmenů. Částečně je to způsobeno delecí některých úseků chromozomu hlavně v lokusech některých tpr genů (Giacani et al., 2004; Strouhal et al., 2007). Dalším důvodem je, že při anotaci byl použit jiný algoritmus než u kmenů TPE, DAL-1 a FrBl. Proto mají geny kmene Cuniculi A vyšší průměrnou délku genu i medián délky genu (1006, 873 bp). Na rozdíl od délky genomů, sekvenční identita a genetická diverzita odpovídají druhové/poddruhové příslušnosti kmene. Sekvenční identita genomů se v rámci poddruhů liší maximálně o 0,1 % a nukleotidová diverzita se v rámci poddruhů pohybuje řádově v jen o málo nižších hodnotách (0,00041 ± 0,00011 u kmenů TPA a 0,00029 ± 0,00008 u kmenů TPE). Kmeny mezi oběma poddruhy se pak liší již o 0,2 – 0,4 procenta sekvenční identity. Nukleotidová divergence mezi oběma poddruhy je o řád vyšší než diverzita v rámci poddruhů (0.00152 ± 0.00053). Ještě výraznější je rozdíl při srovnání kmenů TPA či TPE s kmenem Cuniculi A. Nukleotidová divergence mezi kmeny obou poddruhů a kmenem TPc Cuniculi A je ještě o řád vyšší než mezi oběma poddruhy (0,01047 ± 0,00427 u kmenů TPA a 0,01026 ± 0,00450 u kmenů TPE). Sekvenční identita mezi kmeny TPA 81
Diskuze a Cuniculi A (98,0 %) je jen o málo vyšší než mezi kmeny TPE a Cuniculi A (97,9 %). Pouze dvouprocentní rozdíl v nukleotidové sekvenci mezi kmeny Treponema pallidum a kmenem Treponema paraluiscuniculi znamená, že jde spíše o dva poddruhy než dva samostatné bakteriální druhy. 7.3
Detekce genů zodpovědných za rozdílné klinické projevy yaws a syfilis Při pokusu o identifikaci genů zodpovědných za rozdílnou klinickou manifestaci
syfilis a yaws byly porovnávány genomy pěti kmenů TPA a tří kmenů TPE (tabulka 9). U rozdílů nalezených v kódujících oblastech byl dále hodnocen jejich vliv na odlišnost aminokyselin. Rozdíly mezi geny kmenů TPA a TPE byly hodnoceny u 976 genů podobně anotovaných u kmenů TPE a kmene Nichols (AE000520.1). A také u šesti pseudogenů kmenů TPE (celkem 982 genů). Nalezené rozdíly lze rozdělit do několika úrovní: 1. kmenově specifické rozdíly, které se v dané oblasti nevyskytují u většiny ostatních kmenů, 2. oblasti rozdílů, které jsou variabilní pro všechny kmeny v rámci poddruhů TPA i TPE, 3. oblasti rozdílů, ve kterých se genomy všech kmenů TPA odlišují od genomů všech kmenů TPE. Kmenově specifické rozdíly mohou vzniknout působením selekčního tlaku imunitního systému při infekci a tak vést k ovlivnění virulence daného kmene. Lze je dále využít pro sledování epidemiologie daného kmene, např. k odlišení reinfekce a reaktivace syfilitického kmene. Z nedávné publikace (Giacani et al., 2010) vyplývá, že většina z SNP mezi kmenem Chicago a Nichols jsou změny specifické pro kmen Nichols. Tyto změny vznikly pravděpodobně jako důsledek přizpůsobení se dlouhodobé kultivaci kmene v králíkovi. Oblasti rozdílů mezi všemi kmeny v rámci poddruhů TPA i TPE jsou pravděpodobně vystaveny selekčnímu tlaku imunitního systému u obou poddruhů. Patří tak mezi kandidáty pro vakcínu proti syfilis. Tyto oblasti jsou také využívány při typizaci klinických vzorků syfilis. Mezi geny obsahující tyto oblasti patří především tpr geny (Centurion-Lara et al., 2000b; Giacani et al., 2005; LaFond et al., 2006b; Leader et al., 2003; Morgan et al., 2003; Sun et al., 2004). Zejména gen tprK, který se liší i v rámci stejného kmene (Centurion-Lara et al., 1999; Centurion-Lara et al., 2000a; LaFond et al., 2003; LaFond et al., 2006a). Dále k těmto oblastem patří úseky G a C homopolymerů, které jsou také variabilní i v rámci jednoho kmene během infekce. Bylo ověřeno, že nejde o chybu při sekvenaci. V oblastech, kde některé kmeny vykazují variabilitu počtu G, jiné kmeny variabilní nejsou. Sekvence těchto oblastí po vložení do plazmidů nevykazovaly 82
Diskuze změny v počtu nukleotidů. U všech kmenů sekvenovaných v naší laboratoři byla nalezena výrazná variabilita v počtu nukleotidů v homopolymerním úseku u genů ortologních k TP0040 (chemotaktický protein vázající metyl - mcp), TP0859_860 (treponemální konzervovaný hypotetický protein) a TP0865 (treponemální konzervovaný hypotetický protein vnější membrány). U bakteriálních patogenů úseky homopolymerů v promotorech regulují expresi genů virulenčních faktorů (van der Woude & Baumler, 2004). Podobná regulace byla zjištěna i u promotorů tpr genů (Giacani et al., 2007a). Do skupiny genů s oblastmi rozdílů mezi všemi kmeny TPA i TPE patří také geny TP0136 (Brinkman et al., 2008), TP0548 (Flasarová et al., 2012) a geny s proměnlivým počtem repetitivních sekvencí TP0433 (Harper et al., 2008a; Liu et al., 2007) a TP0470 (McKevitt et al., 2003). Celkem 3021 nukleotidů, ve kterých se genomy všech TPA kmenů odlišují od genomů všech kmenů TPE, představují genetické determinanty pravděpodobně zodpovědné za rozdílnou klinickou manifestaci obou onemocnění. Z toho 479 bp způsobuje synonymní rozdíly aminokyselin a 49 bp nevede k odlišení aminokyselin všech kmenů TPA od všech kmenů TPE. Ze zbývajících 2493 nukleotidů je 2236 nukleotidů v kódujích oblastech kmenů TPE. Tyto změny lze pak nalézt v různých kategoriích genů podle počtu rozdílů v kódovaných proteinech. 19,7 % genů kóduje proteiny s jedním aminokyselinovým rozdílem, 6,4 % genů kóduje proteiny se 2 – 5 aminokyselinovými rozdíly a 3,4 % genů (33 genů) kóduje proteiny se 6 a více aminokyselinovými rozdíly nebo MSC. 70,5 % genů bylo zařazeno do kategorie genů kódujících proteiny identické mezi kmeny TPA i TPE. Tyto geny tudíž neovlivňují rozdíl v klinické manifestaci obou onemocnění. Právě v kategorii genů kódujících proteiny se 6 a více aminokyselinovými rozdíly nebo MSC byl zaznamenán statisticky signifikantní nárůst počtu genů ve skupině genů s virulenční funkcí a ve skupině genů s neznámou funkcí oproti kontrolní skupině housekeeping genů. Rozdíly v těchto 33 genech (tabulka 16, tabulka 17) jsou tedy nejvážnějšími kandidáty na genetické determinanty vedoucí k odlišným klinickým projevům mezi syfilis a yaws. U čtrnácti z těchto genů byla predikována jejich funkce (tabulka 16). Osm z nich patří k tpr genům u nichž se předpokládá podíl na patogenezi onemocnění. 3 geny kódují proteiny s predikovanými nebo prokázanými antigenními vlastnostmi. Do skupiny dále patří protein prodlouženého genu TPE_0103 (RecQ) podílející se na metabolismu DNA, gen TPE_0488 kódující protein, který ovlivňuje chemotaxi a zkrácený gen TPE_0671 kódující etanolaminfosfotransferázu. 83
Diskuze Variabilita v genech TPE_0136, TPE_0326 a TPE_0433 je popsána mezi poddruhy TPA a TPE, ale i mezi kmeny v rámci obou poddruhů. Vzhledem k této variabilitě je pravděpodobné, že jde o geny kódující faktory virulence. Produkty těchto genů jsou pravděpodobně vystaveny imunitní reakci hostitele, na kterou patogen může reagovat změnou v sekvenci genu (pozitivní selekce). Bakterii T. pallidum nelze kultivovat. Proto testování genu na typ selekce je jednou z mála možností, jak identifikovat geny kódující faktory virulence. Pozitivní selekce byla identifikována u genu TPE_0326 a již dříve u genu TPE_0433 (Liu et al., 2007). U genu TPE_0136 nebyl test na selekci proveden, protože u něj bylo predikováno ovlivnění rekombinací. Možná rekombinace byla detegována také v genu TPE_0433, což ovšem vylučuje pozitivní selekci tohoto genu. U genu TPE_0488 byla detegována silná pozitivní selekce. Při sekvenaci kmene Mexico A bylo zjištěno, že geny TPAMA_0326 a TPAMA_0488 jsou mozaikou sekvencí specifických pro kmeny TPA i TPE. U genu TPAMA_0326 došlo také k deleci patnácti nukleotidů, která do té doby byla považována za specifickou změnu kmenů TPE a Fribourg-Blanc. Z výsledků pak vyplývá, že na mutacích v genech TPAMA_0326 a TPAMA_0488 kmene Mexico A se pravděpodobně podílí také proces rekombinace (Pětrošová et al., 2012). U ortologního genu kmene Nichols k pseudogenu TPE_0671 byla nalezena velmi nízká exprese při experimentální infekci králíka (Šmajs et al., 2005), je proto pravděpodobné, že protein nemá esenciální funkci ani u kmenů TPA. RecQ DNA helikáza se u E. coli podílí na dráze opravy DNA paralelně s rekombinační dráhou, která je řízená komplexem RecBCD (Ordonez et al., 2012). Kromě prodloužení genu pro protein RecQ, dochází ke dvěma aminokyselinovým změnám také v proteinu UvrD/REP DNA helikáze, která je kódována vedlejším genem (TPE_0102) a také v dalších 3 genech podílejících se na procesu opravy nebo rekombinace DNA (tabulka 18). Rozdíl mezi kmeny TPA a TPE tak může být ovlivněn modifikací drah opravného/rekombinačního systému DNA podobně jako u kmene Cuniculi A (Šmajs et al., 2011). V proteinových interakcích popsaných pro metabolismus DNA u T. pallidum (Titz et al., 2008) však nejsou mezi popsanými proteiny identifikovány žádné přímé interakce. U 19 genů (tabulka 17) ze skupiny 33 nejvíce ovlivněných genů nebyla predikována funkce proteinu. Šest z těchto genů představuje pseudogeny v genomech kmenů TPE. Čtyři pseudogeny byly příliš krátké na to, aby byly anotovány. U čtyř genů byly detegovány antigenní vlastnosti (TPE_0133, TPE_0314, TPE_0462, TPE_0858) (McKevitt et al., 2005). Gen TPE_0314 je jedinným genem, který vznikl fúzí dvou genů 84
Diskuze kmene Nichols (AE000520.1), ale kdy tato fúze nebyla detegována v ortologních sekvencích kmenů TPA. Kromě antigenních vlastností byl u genů TPE_0133, TPE_0462 predikován zároveň lipoproteinový charakter a současně i pozitivní selekce u genu TPE_0462. A oba tyto geny spolu s TPE_0134 (tabulka 17) a TPE_0136 vytváří rodinu paralogních proteinů (Brinkman et al., 2008) s charakteristickou vysokou úrovní exprese. Všechny tyto vlastnosti naznačují, že popsané geny jsou rovněž pod vlivem selekčního tlaku imunitního systému hostitele a zároveň jsou podstatou rozdílů mezi kmeny TPA a TPE. Zbylé geny kódují signální peptidy (TPE_0483, TPE_0733, TPE_0858, TPE_0865, TPE_0968), jsou ovlivněny rekombinací (TPE_0619) a nebo jsou pod vlivem pozitivní selekce (TPE_0865, TPE_0968). Na rozdílnou klinickou manifestaci onemocnění syfilis a yaws mohou působit rovněž geny ovlivněné pozitivní selekcí, kterých bylo v rámci skupiny genů s většími změnami (tabulka 16, tabulka 17, tabulka 18, tabulka 19) identifikováno 17. Kromě již popsaných genů, kóduje dalších pět genů s neznámou funkcí proteiny s antigenními vlastnostmi, se signální sekvencí, lipoproteiny a membránové proteiny. Zbylých 7 pozitivně selektovaných genů kóduje proteiny, které se účastní na buněčných procesech a buněčné struktuře, transportu, obecném metabolismu a translaci, čímž mohou ovlivňovat adaptaci mikroorganismu na klimatické podmínky a stáří hostitele. Treponemální
konzervované
hypotetické
proteiny
TPE_0967,
TPE_0968
a treponemální konzervovaný protein vnější membrány TPE_0969 by mohly být lokalizovány do jednoho operonu. Tyto geny mají při experimentální infekci králíka podobně vysokou expresi. U genu TPE_0968 byla detegována pozitivní selekce. Při předchozích molekulárně biologických analýzách bylo zjištěno, že původce endemické syfilis, poddruh endemicum je blízce příbuzný poddruhu pertenue (Cameron et al., 1999; Centurion-Lara et al., 1998). Až RFLP analýza genů tprI a tprC umožňuje odlišit TPE od TEN (Centurion-Lara et al., 2006; Gray et al., 2006). Na základě předběžné analýzy celogenomové sekvence T. p. endemicum kmene Bosnia A lze potvrdit bližší přibuznost kmene TEN ke kmenům TPE. Identifikace genů identických mezi poddruhy TPE a TEN, ale zároveň odlišných od poddruhu TPA, pak pomůže identifikovat geny zodpovědné za odlišnost mezi klinickými příznaky a způsobem přenosu venerických a endemických treponematóz
85
Diskuze 7.4
Nespecifikovaný opičí izolát Fribourg-Blanc Výsledná sekvence genomu kmene Fribourg-Blanc byla porovnána se sekvencí
genomů tří kmenů TPE. Mezi kmeny TPE a Fribourg-Blanc nebyly nalezeny delece nebo strukturní přestavby (Mikalová et al., 2010) a ukázala se vysoká míra identity genomové sekvence kmene Fribourg-Blanc se sekvencí každého z kmenů TPE (99,8 %). Stejná míra identity platí i pro kmeny TPE mezi sebou navzájem (tabulka 12). Nukleotidová diverzita mezi kmenem Fribourg-Blanc a kmeny TPE je v rámci hodnot diverzity kmenů TPE. Dokonce kmen Gauthier vykazuje větší nukleotidovou diverzitu oproti Samoa D a CDC-2 než opičí izolát, kmen Fribourg-Blanc. Nejde o překvapivý výsledek. Z předchozích studií vyplývalo, že kmen Fribourg-Blanc je příbuznější ke kmenům TPE než ke kmenům TPA (Centurion-Lara et al., 1997; Gray et al., 2006; Harper et al., 2008b). Nicméně kmen byl izolován z lymfatické uzliny paviána bez zjevných klinických projevů onemocnění. Byl tedy očekáván spíše větší počet rozdílů mezi kmenem Fribourg-Blanc a kmeny TPE. Kmen Fribourg-Blanc se stejně jako kmeny TPE liší počtem repetitivních sekvencí v genech TPFB_0433 (repetice o délce 60 bp, gen arp) a TPFB_0470 (repetice o délce 24 bp, CHP). Ve 3 proteinech došlo k inzerci a ve 3 proteinech k deleci aminokyselin. Větší množství substitucí se nachází hlavně v genech tprC, tprI a tprF (TPFB_0117, TPFB_0620, TPFB_ 0316). Další větší množství substitucí se nachází v genu mcp který kóduje protein, jež se podílí na chemotaxi (TPFB_0488), dále v genech pro predikovaný protein vnější membrány (TPFB_0324, TPFB_0865) nebo v genu pro protein s neznámou funkcí TPFB_0968 (tabulka 7 a tabulka S4). Jedna substice nukleotidu ve stop kodonu genu TPFB_0304 (HP) vede k fúzi tohoto genu s genem TPFB_0303 (protein MutL podílející se na metabolismu DNA). Tato fúze je specifická pro kmen Fribourg-Blanc (tabulka 11). Poslední výraznou změnou mezi kmeny TPE a opičím izolátem je inzerce dlouhá 430 bp mezi geny TPFB_0696 – TPFB_0697, která byla identifikována metodou WGF (Mikalová et al., 2010). Jde o repetitivní sekvenci. Část této repetitivní sekvence je lokalizována v genu TPFB_0696. Pseudogeny a geny s posunovou mutací oproti genům kmenů TPE jsou v pěti ze sedmi případů způsobeny různým počtem nukleotidů v oblastech homopolymerů G nebo A. Podle dosavadních výsledků patří kmen Fribourg-Blanc také do poddruhu T. p. subsp. pertenue a počet variabilních genů se zdá být stejně malý jako mezi ostatními kmeny TPE. Vzhledem k potvrzené schopnosti tohoto kmene vyvolat infekci podobnou yaws také u člověka (Smith et al., 1971) je možné, že v oblastech výskytu yaws dochází k přenosu infekce z člověka také na jiné primáty. Bylo potvrzeno, že se na primáty ve 86
Diskuze volné přírodě přenáší i jiné lidské infekce (Wallis & Lee, 1999). Lidé se naopak mohou infikovat od opic. To může zkomplikovat současnou snahu o eradikaci endemických treponematóz (Maurice, 2012). Kmen Fribourg-Blanc nezpůsoboval u paviána, od nějž byl izolován, klinicky zjevné onemocnění. U člověka infekce kmenem Fribourg-Blanc vedla k projevům podobným yaws (Smith et al., 1971). U paviánů v africkém národním parku Gombe a také v Národním parku Lake Manyara (LMNP) bylo pozorováno onemocnění, které se svými klinickými příznaky podobalo syfilis u člověka. Sekvenované lokusy byly zatím identické s obdobnými lokusy u kmene Fribourg-Blanc (Knauf et al., 2012). Teprve až další analýzy mohou odpovědět na otázku, čím se liší tyto kmeny od kmene Fribourg-Blanc. 7.5
Význam sekvence rRNA lokusů Analýza operonů rrn u treponemálních kmenů různých druhů a poddruhů potvrdila
shodu v sekvenci mezi kmeny daného druhu/poddruhu. Všechny testované kmeny TPA se liší od všech testovaných kmenů TPE, TEN i kmene Fribourg-Blanc. Větší sekvenční variabilita oproti kmenům T. pallidum byla popsána u izolátů T. paraluiscuniculi a T. paraluisleporis. Bylo ověřeno, že geny pro 16S i 23S rRNA jsou v obou lokusech v rámci kmenů identické. To platí i pro mutace vedoucí k makrolidové rezistenci. Treponema pallidum a paraluiscuniculi tedy patří mezi asi 40 % bakterialních druhů s identickými geny pro rRNA (Pei et al., 2009; Pei et al., 2010). V rrn operonech pravděpodobně dochází k homogenizaci genů pro rRNA prostřednictvím homologní rekombinace (Liao, 2000). Z tabulky (i z porovnání obou fylogenetických stromů) vyplývá, že pro odlišení poddruhů Treponema pallidum včetně kmene Fribourg-Blanc je nutné získat sekvence 16S i 23S rRNA. Pro odlišení druhů/poddruhů Treponema stačí sekvence 16S rRNA rozšířená o sekvenci o délce 100 nukleotidů před genem. Amplifikace a sekvenace lokusů pro rRNA vzhledem k jejich délce i k identitě obou lokusů není jednoduchá. Umožňuje však odlišit všechny tři poddruhy i T. paraluiscuniculi i T. paraluisleporis. Zároveň umožňuje identifikovat případnou rezistenci kmene k makrolidovým antibiotikům. Detekce odlišností v 16S rRNA mezi kmeny patřícími k druhům/poddruhům pallidum, pertenue, endemicum a paraluiscuniculi také umožní ověřit původce onemocnění. Tedy zda jde u izolovaného kmene skutečně o původce yaws, syfilis, endemické syfilis nebo králičí treponematózy. Je tak možné ověřit alespoň poddruhovou identitu izolovaného nebo laboratorního kmene v případě záměny, podobné, jako nastala 87
Diskuze u kmenů Madras a Haiti B. Kmeny Madras a Haiti B byly původně izolovány z lézí typických pro yaws a tudíž byly považovány za kmeny poddruhu pertenue (Turner & Hollander, 1957). Nicméně při použití molekulárně-biologických technik pro odlišení kmenů TPA a TPE, obsahoval kmen Haiti B (Cameron et al., 1999; Centurion-Lara et al., 1998; Harper et al., 2008b) i kmen Madras (Harper et al., 2008b) DNA determinanty typické pro kmeny TPA. I v naší práci se oba kmeny svou sekvencí v rrn lokusech řadí ke kmenům TPA. Při manipulaci s oběma kmeny tedy pravděpodobně došlo k jejich nesprávnému označení (Harper, 2008). Byla také vyvinuta metoda umožňující amplifikaci každého lokusu pro 16S rRNA zvlášť. Tuto metodu lze využít k detekci typu tRNA v intergenové oblasti i z malého množství zdrojového materiálu. Metodu by bylo možné využít při typizaci klinických vzorků. Touto metodou byly testovány klinické izoláty dostupné v naší laboratoři. U všech vzorků však byl detegován stejný vzor jako u kmene Nichols (obrázek 5A). Všechny vzorky DNA tedy obsahovaly v lokusu rrn1 gen pro tRNA-Ile a v lokusu rrn2 gen pro tRNA-Ala. Získaný výsledek odpovídá tomu, že podle používaného typovacího systému je většina klinických izolátů příbuzná kmeni SS14 (Flasarová et al., 2012). Takže tento lokus není příliš vhodný pro typování klinických izolátů v České republice. Touto metodou byla úspěšně amplifikována sekvence pro 16S rRNA u kmene, který byl izolován z lézí připomínajících syfilis u zajíců. Tato sekvence byla porovnána s odpovídající sekvencí u T. paraluiscuniculi. Na základě toho lze hodnotit, že treponematóza zajíců je způsobena odlišným, i když blízce příbuzným původcem - patrně se jedná o dva poddruhy jednoho druhu.
88
Závěry
8 ZÁVĚRY •
S využitím celogenomových sekvenačních metod v kombinaci se Sangerovou sekvenační metodou byla stanovena sekvence genomu kmene Samoa D. Vzhledem k době uplynulé od anotace prvního sekvenovaného genomu T. p. subsp. pallidum Nichols byla provedena anotace genomu Samoa D de novo. Tato anotace byla dále v upravené podobě použita pro další nově sekvenované genomy. Výsledná sekvence byla použita k hodnocení chyb jednotlivých metod a k porovnání s dalšími genomy nekultivovatelných patogenních treponemat.
•
Sekvence genomů původců syfilis a yaws jsou velmi blízce příbuzné. Rozdíly v hostitelské specifitě a manifestaci onemocnění jsou způsobeny jen velmi malými genetickými rozdíly. Byly vytipovány geny, jež jsou pravděpodobně genetickou podstatou rozdílných klinických projevů mezi syfilis a yaws.
•
K hodnocení
variability
mezi
genomy
byly
použity
různé
genomové
charakteristiky. Na rozdíl od délky genomů, hodnoty sekvenční identity a genetické diverzity odpovídají druhové/poddruhové příslušnosti kmene. •
Kombinací celogenomových sekvenačních metod a Sangerovy metody byla určena sekvence genomu Fribourg-Blanc, která byla anotována s využitím modifikované anotace kmene Samoa D. Byla prokázána vysoká míra identity genomové sekvence kmene Fribourg-Blanc se sekvencí každého z kmenů Treponema pallidum subsp. pertenue, což implikuje možné zařazení kmene do poddruhu pertenue.
•
Sekvence genomu kmene DAL-1 byla porovnána se sekvencí kmene Nichols a byla použita k porovnání s dalšími genomy nekultivovatelných patogenních treponemat.
•
Analýza operonů rrn u treponemálních kmenů různých druhů a poddruhů potvrdila shodu v sekvenci mezi kmeny daného druhu/poddruhu. Izolát Treponema paraluisleporis tedy není shodný s druhem Treponema paraluiscuniculi.
•
Pro získání kvalitní sekvenace nových genomů je nejvhodnější použít kombinaci minimálně dvou celogenomových sekvenačních metod a/nebo při sekvenaci rozdělit identické a paralogní oblasti genomu.
89
Literatura
9 LITERATURA Alkan, C., Sajjadian, S. & Eichler, E. E. (2011). Limitations of next-generation genome sequence assembly. Nat Methods, 8, 61-65. Anand, A., Luthra, A., Dunham-Ems, S., Caimano, M. J., Karanian, C., LeDoyt, M., Cruz, A. R., Salazar, J. C. & Radolf, J. D. (2012). TprC/D (Tp0117/131), a trimeric, pore-forming rare outer membrane protein of Treponema pallidum, has a bipartite domain structure. J Bacteriol, 194, 2321-2333. Angulo, J. J., Watson, J. H., Wedderburn, C. C., Leon-Blanco, F. & Varela, G. (1951). Electronmicrography of treponemas from cases of yaws, pinta, and the socalled Cuban form of pinta. Am J Trop Med Hyg, 31, 458-478. Antal, G. M. & Causse, G. (1985). The control of endemic treponematoses. Rev Infect Dis, 7 Suppl 2, S220-226. Antal, G. M., Lukehart, S. A. & Meheus, A. Z. (2002). The endemic treponematoses. Microbes Infect, 4, 83-94. Asiedu, K. (2008). The return of yaws. Bull World Health Organ, 86, 507-508. Baker-Zander, S. A. & Lukehart, S. A. (1983). Molecular basis of immunological crossreactivity between Treponema pallidum and Treponema pertenue. Infect Immun, 42, 634-638. Baker-Zander, S. A. & Lukehart, S. A. (1984). Antigenic cross-reactivity between Treponema pallidum and other pathogenic members of the family Spirochaetaceae. Infect Immun, 46, 116-121. Baseman, J. B., Nichols, J. C., Rumpp, J. W. & Hayes, N. S. (1974). Purification of Treponema pallidum from Infected Rabbit Tissue: Resolution into Two Treponemal Populations. Infect Immun, 10, 1062-1067. Bayon, H. (1913). A new species of Treponema found in the genital sores of rabbits. Br Med J, 2, 1159. Bennett, S. (2004). Solexa Ltd. Pharmacogenomics, 5, 433-438. Bora, D., Dhariwal, A. C. & Lal, S. (2005). Yaws and its eradication in India--a brief review. J Commun Dis, 37, 1-11. Bouwman, A. S. & Brown, T. A. (2005). The limits of biomolecular palaeopathology: ancient DNA cannot be used to study venereal syphilis. J Archaeol Sci, 32, 703713. Brinkman, M. B., McGill, M. A., Pettersson, J., Rogers, A., Matějková, P., Šmajs, D., Weinstock, G. M., Norris, S. J. & Palzkill, T. (2008). A novel Treponema pallidum antigen, TP0136, is an outer membrane protein that binds human fibronectin. Infect Immun, 76, 1848-1857. Cameron, C. E., Castro, C., Lukehart, S. A. & Van Voorhis, W. C. (1999). Sequence conservation of glycerophosphodiester phosphodiesterase among Treponema pallidum strains. Infect Immun, 67, 3168-3170. Cameron, C. E., Lukehart, S. A., Castro, C., Molini, B., Godornes, C. & Van Voorhis, W. C. (2000). Opsonic potential, protective capacity, and sequence conservation of the Treponema pallidum subspecies pallidum Tp92. J Infect Dis, 181, 1401-1413. Castellani, A. (1905). Further observations on parangi (Yaws). Brit Med Jour1330-1331. Castro, L. G. (1994). Nonvenereal treponematosis. J Am Acad Dermatol, 31, 1075-1076. CDC. (2011). Sexually Transmitted Disease Surveillance 2010. Atlanta, USA: Centers for Disease Control and Prevention. Centurion-Lara, A., Arroll, T., Castillo, R., Shaffer, J. M., Castro, C., Van Voorhis, W. C. & Lukehart, S. A. (1997). Conservation of the 15-kilodalton lipoprotein 90
Literatura among Treponema pallidum subspecies and strains and other pathogenic treponemes: genetic and antigenic analyses. Infect Immun, 65, 1440-1444. Centurion-Lara, A., Castro, C., Barrett, L., Cameron, C., Mostowfi, M., Van Voorhis, W. C. & Lukehart, S. A. (1999). Treponema pallidum major sheath protein homologue Tpr K is a target of opsonic antibody and the protective immune response. J Exp Med, 189, 647-656. Centurion-Lara, A., Castro, C., Castillo, R., Shaffer, J. M., Van Voorhis, W. C. & Lukehart, S. A. (1998). The flanking region sequences of the 15-kDa lipoprotein gene differentiate pathogenic treponemes. J Infect Dis, 177, 1036-1040. Centurion-Lara, A., Godornes, C., Castro, C., Van Voorhis, W. C. & Lukehart, S. A. (2000a). The tprK gene is heterogeneous among Treponema pallidum strains and has multiple alleles. Infect Immun, 68, 824-831. Centurion-Lara, A., LaFond, R. E., Hevner, K., Godornes, C., Molini, B. J., Van Voorhis, W. C. & Lukehart, S. A. (2004). Gene conversion: a mechanism for generation of heterogeneity in the tprK gene of Treponema pallidum during infection. Mol Microbiol, 52, 1579-1596. Centurion-Lara, A., Molini, B. J., Godornes, C., Sun, E., Hevner, K., Van Voorhis, W. C. & Lukehart, S. A. (2006). Molecular differentiation of Treponema pallidum subspecies. J Clin Microbiol, 44, 3377-3380. Centurion-Lara, A., Sun, E. S., Barrett, L. K., Castro, C., Lukehart, S. A. & Van Voorhis, W. C. (2000b). Multiple alleles of Treponema pallidum repeat gene D in Treponema pallidum isolates. J Bacteriol, 182, 2332-2335. Clark, E. G. & Danbolt, N. (1955). The Oslo study of the natural history of untreated syphilis; an epidemiologic investigation based on a restudy of the BoeckBruusgaard material; a review and appraisal. J Chronic Dis, 2, 311-344. Cockburn, T. A. (1961). The origin of the treponematoses. Bull World Health Organ, 24, 221-228. Consortium, H. M. (2010). A catalog of reference genomes from the human microbiome. Science, 328, 994-999. Cousins, D. (1984). Notes on the occurence of skin infections in gorillas (Gorilla gorilla). Zool Garten NF Jena, 54, 333-338. Cousins, D. (2008). Possible goundou in gorillas. Gorilla Journal, 37, electronický článek. Cox, D. L. (1994). Culture of Treponema pallidum. Methods Enzymol, 236, 390-405. Čejková, D., Zobaniková, M., Chen, L., Pospišilová, P., Strouhal, M., Qin, X., Mikalová, L., Norris, S. J., Muzny, D. M., Gibbs, R. A., et al. (2012). Whole genome sequences of three Treponema pallidum ssp. pertenue strains: yaws and syphilis treponemes differ in less than 0.2% of the genome sequence. PLoS Negl Trop Dis, 6, e1471. Delcher, A. L., Harmon, D., Kasif, S., White, O. & Salzberg, S. L. (1999). Improved microbial gene identification with GLIMMER. Nucleic Acids Res, 27, 4636-4641. Dorfman, D. H. & Glaser, J. H. (1990). Congenital syphilis presenting in infants after the newborn period. N Engl J Med, 323, 1299-1302. Drummond, A. J., Ashton, B., Buxton, S., Cheung, M., Cooper, A., Duran, C., Heled, J., Kearse, M., Markowitz, S., Moir, R., et al. (2012). Geneious v5.6.5. http://www.geneious.com. Engelkens, H. J., Vuzevski, V. D., ten Kate, F. J., van der Heul, P., van der Sluis, J. J. & Stolz, E. (1991). Ultrastructural aspects of infection with Treponema pallidum subspecies pertenue (Pariaman strain). Genitourin Med, 67, 403-407. Farnsworth, N. & Rosen, T. (2006). Endemic treponematosis: review and update. Clin Dermatol, 24, 181-190. 91
Literatura Felsenfeld, O. & Wolf, R. H. (1971). Serological reactions with treponemal antigens in nonhuman primates and the natural history of treponematosis in man. Folia Primatol (Basel), 16, 294-305. Felsenstein, J. (1985). Confidence-Limits on Phylogenies - an Approach Using the Bootstrap. Evolution, 39, 783-791. Fenno, J. C., Muller, K. H. & McBride, B. C. (1996). Sequence analysis, expression, and binding activity of recombinant major outer sheath protein (Msp) of Treponema denticola. J Bacteriol, 178, 2489-2497. Fieldsteel, A. H., Becker, F. A. & Stout, J. G. (1977). Prolonged survival of virulent Treponema pallidum (Nichols strain) in cell-free and tissue culture systems. Infect Immun, 18, 173-182. Fieldsteel, A. H., Cox, D. L. & Moeckli, R. A. (1981). Cultivation of virulent Treponema pallidum in tissue culture. Infect Immun, 32, 908-915. Fieldsteel, A. H., Cox, D. L. & Moeckli, R. A. (1982). Further studies on replication of virulent Treponema pallidum in tissue cultures of Sf1Ep cells. Infect Immun, 35, 449-455. Fieldsteel, A. H., Stout, J. G. & Becker, F. A. (1979). Comparative behavior of virulent strains of Treponema pallidum and Treponema pertenue in gradient cultures of various mammalian cells. Infect Immun, 24, 337-345. Fitzgerald, T. J., Miller, J. N. & Sykes, J. A. (1975). Treponema pallidum (Nichols strain) in tissue cultures: cellular attachment, entry, and survival. Infect Immun, 11, 1133-1140. Flasarová, M., Pospišilová, P., Mikalová, L., Vališová, Z., Dastychová, E., Strnadel, R., Kuklová, I., Woznicová, V., Zákoucká, H. & Šmajs, D. (2012). Sequencingbased molecular typing of Treponema pallidum strains in the Czech Republic: All identified genotypes are related to the sequence of the SS14 Strain. Acta Derm Venereol, 92, 669-674. Flasarová, M., Šmajs, D., Matějková, P., Woznicová, V., Heroldová-Dvořaková, M. & Votava, M. (2006). [Molecular detection and subtyping of Treponema pallidum subsp. pallidum in clinical specimens]. Epidemiol Mikrobiol Imunol, 55, 105-111. Fohn, M. J., Wignall, S., Baker-Zander, S. A. & Lukehart, S. A. (1988). Specificity of antibodies from patients with pinta for antigens of Treponema pallidum subspecies pallidum. J Infect Dis, 157, 32-37. Fraser, C. M., Norris, S. J., Weinstock, G. M., White, O., Sutton, G. G., Dodson, R., Gwinn, M., Hickey, E. K., Clayton, R., Ketchum, K. A., et al. (1998). Complete genome sequence of Treponema pallidum, the syphilis spirochete. Science, 281, 375-388. Fribourg-Blanc, A. & Mollaret, H. H. (1969). Natural treponematosis of the African primate. Primates Med, 3, 113-121. Fukunaga, M., Okuzako, N., Mifuchi, I., Arimitsu, Y. & Seki, M. (1992). Organization of the ribosomal RNA genes in Treponema phagedenis and Treponema pallidum. Microbiol Immunol, 36, 161-167. Gardner, P. P., Daub, J., Tate, J. G., Nawrocki, E. P., Kolbe, D. L., Lindgreen, S., Wilkinson, A. C., Finn, R. D., Griffiths-Jones, S., Eddy, S. R., et al. (2009). Rfam: updates to the RNA families database. Nucleic Acids Research, 37, D136D140. Gastinel, P., Vaisman, A., Hamelin, A. & Dunoyer, F. (1963). [Study of a recently isolated strain of Treponema pertenue]. Prophyl Sanit Morale, 35, 182-188. Gayet-Ageron, A., Ninet, B., Toutous-Trellu, L., Lautenschlager, S., Furrer, H., Piguet, V., Schrenzel, J. & Hirschel, B. (2009). Assessment of a real-time PCR 92
Literatura test to diagnose syphilis from diverse biological samples. Sex Transm Infect, 85, 264-269. Gazin, P. & Meynard, D. (1988). [A clinical and serologic survey of bejel in north Burkina Faso]. Bull Soc Pathol Exot Filiales, 81, 827-831. Gerstl, S., Kiwila, G., Dhorda, M., Lonlas, S., Myatt, M., Ilunga, B. K., Lemasson, D., Szumilin, E., Guerin, P. J. & Ferradini, L. (2009). Prevalence study of yaws in the Democratic Republic of Congo using the lot quality assurance sampling method. PLoS One, 4, e6338. Giacani, L., Brandt, S. L., Puray-Chavez, M., Reid, T. B., Godornes, C., Molini, B. J., Benzler, M., Hartig, J. S., Lukehart, S. A. & Centurion-Lara, A. (2012). Comparative Investigation of the Genomic Regions Involved in Antigenic Variation of the TprK Antigen among Treponemal Species, Subspecies, and Strains. J Bacteriol, 194, 4208-4225. Giacani, L., Hevner, K. & Centurion-Lara, A. (2005). Gene organization and transcriptional analysis of the tprJ, tprI, tprG, and tprF loci in Treponema pallidum strains Nichols and Sea 81-4. J Bacteriol, 187, 6084-6093. Giacani, L., Jeffrey, B. M., Molini, B. J., Le, H. T., Lukehart, S. A., Centurion-Lara, A. & Rockey, D. D. (2010). Complete genome sequence and annotation of the Treponema pallidum subsp. pallidum Chicago strain. J Bacteriol, 192, 2645-2646. Giacani, L., Lukehart, S. & Centurion-Lara, A. (2007a). Length of guanosine homopolymeric repeats modulates promoter activity of subfamily II tpr genes of Treponema pallidum ssp. pallidum. FEMS Immunol Med Microbiol, 51, 289-301. Giacani, L., Molini, B., Godornes, C., Barrett, L., Van Voorhis, W., Centurion-Lara, A. & Lukehart, S. A. (2007b). Quantitative analysis of tpr gene expression in Treponema pallidum isolates: Differences among isolates and correlation with Tcell responsiveness in experimental syphilis. Infect Immun, 75, 104-112. Giacani, L., Sun, E. S., Hevner, K., Molini, B. J., Van Voorhis, W. C., Lukehart, S. A. & Centurion-Lara, A. (2004). Tpr homologs in Treponema paraluiscuniculi Cuniculi A strain. Infect Immun, 72, 6561-6576. Gjestland, T. (1955). The Oslo study of untreated syphilis; an epidemiologic investigation of the natural course of the syphilitic infection based upon a re-study of the BoeckBruusgaard material. Acta Derm Venereol Suppl (Stockh), 35, 3-368; Annex I-LVI. Golden, M. R., Marra, C. M. & Holmes, K. K. (2003). Update on syphilis: resurgence of an old problem. JAMA, 290, 1510-1514. Graves, S. & Downes, J. (1981). Experimental infection of man with rabbit-virulent Treponema paraluis-cuniculi. Br J Vener Dis, 57, 7-10. Gray, R. R., Mulligan, C. J., Molini, B. J., Sun, E. S., Giacani, L., Godornes, C., Kitchen, A., Lukehart, S. A. & Centurion-Lara, A. (2006). Molecular evolution of the tprC, D, I, K, G, and J genes in the pathogenic genus Treponema. Mol Biol Evol, 23, 2220-2233. Guthe, T. (1960). The treponematoses as a world problem. Br J Vener Dis, 36, 67-77. Haapasalo, M., Muller, K. H., Uitto, V. J., Leung, W. K. & McBride, B. C. (1992). Characterization, cloning, and binding properties of the major 53-kilodalton Treponema denticola surface antigen. Infect Immun, 60, 2058-2065. Haiminen, N., Kuhn, D. N., Parida, L. & Rigoutsos, I. (2011). Evaluation of methods for de novo genome assembly from high-throughput sequencing reads reveals dependencies that affect the quality of the results. PLoS One, 6, e24182. Hardy, J. B., Hardy, P. H., Oppenheimer, E. H., Ryan, S. J., Jr. & Sheff, R. N. (1970). Failure of penicillin in a newborn with congenital syphilis. JAMA, 212, 1345-1349.
93
Literatura Harper, K. N. (2008). RE: Molecular Studies in Treponema pallidum Evolution: Toward Clarity? (Rebuttal from the authors of "On the Origin of the Treponematoses"). PLoS Negl Trop Disonline reply. Harper, K. N., Liu, H., Ocampo, P. S., Steiner, B. M., Martin, A., Levert, K., Wang, D., Sutton, M. & Armelagos, G. J. (2008a). The sequence of the acidic repeat protein (arp) gene differentiates venereal from nonvenereal Treponema pallidum subspecies, and the gene has evolved under strong positive selection in the subspecies that causes syphilis. FEMS Immunol Med Microbiol, 53, 322-332. Harper, K. N., Ocampo, P. S., Steiner, B. M., George, R. W., Silverman, M. S., Bolotin, S., Pillay, A., Saunders, N. J. & Armelagos, G. J. (2008b). On the origin of the treponematoses: a phylogenetic approach. PLoS Negl Trop Dis, 2, e148. Highlander, S. K., Hulten, K. G., Qin, X., Jiang, H., Yerrapragada, S., Mason, E. O., Jr., Shang, Y., Williams, T. M., Fortunov, R. M., Liu, Y., et al. (2007). Subtle genetic changes enhance virulence of methicillin resistant and sensitive Staphylococcus aureus. BMC Microbiol, 7, 99. Hollier, L. M., Harstad, T. W., Sanchez, P. J., Twickler, D. M. & Wendel, G. D., Jr. (2001). Fetal syphilis: clinical and laboratory characteristics. Obstet Gynecol, 97, 947-953. Horvath, I., Kemenes, F. & Molnar, L. (1979). Isolation of pathogenic treponemes from hare. Experientia, 35, 320-321. Horvath, I., Kemenes, F., Molnar, L., Szeky, A. & Racz, I. (1980). Experimental syphilis and serological examination for treponematosis in hares. Infect Immun, 27, 231-234. Hougen, K. H., Birch-Andersen, A. & Jensen, H. J. (1973). Electron microscopy of Treponema cuniculi. Acta Pathol Microbiol Scand B Microbiol Immunol, 81, 1528. Hougen, K. H., Birch-Andersen, A. & Jensen, H. J. (1976). Ultrastructure of cells of Treponema pertenue obtained from experimentally infected hamsters. Acta Pathol Microbiol Scand B, 84, 101-108. Hudson, E. H. (1963). Treponematosis and anthropology. Ann Intern Med, 58, 1037-1048. Hudson, E. H. (1965). Treponematosis and Man's Social Evolution. Am Anthropol, 67, 885-901. Jacobsthal, E. (1920). Untersuchungen uber eine syphilisahnliche Spontanerkrankungen des Kaninchens (Paralues cuniculi). Derm Wschr, 71, 569-571. Jepsen, O. B., Hougen, K. H. & Birch-Andersen, A. (1968). Electron microscopy of Treponema pallidum Nichols. Acta Pathol Microbiol Scand, 74, 241-258. Julvez, J., Michault, A. & Kerdelhue, V. (1998). [Serologic studies of non-venereal treponematoses in infants in Niamey, Niger]. Med Trop (Mars), 58, 38-40. Karumudi, U. R. & Augenbraun, M. (2005). Syphilis and HIV: a dangerous duo. Expert Rev Anti Infect Ther, 3, 825-831. Katz, K. A. & Klausner, J. D. (2008). Azithromycin resistance in Treponema pallidum. Curr Opin Infect Dis, 21, 83-91. Knauf, S., Batamuzi, E. K., Mlengeya, T., Kilewo, M., Lejora, I. A., Nordhoff, M., Ehlers, B., Harper, K. N., Fyumagwa, R., Hoare, R., et al. (2012). Treponema infection associated with genital ulceration in wild baboons. Vet Pathol, 49, 292303. Kolman, C. J., Centurion-Lara, A., Lukehart, S. A., Owsley, D. W. & Tuross, N. (1999). Identification of Treponema pallidum subspecies pallidum in a 200-yearold skeletal specimen. J Infect Dis, 180, 2060-2063.
94
Literatura Kötsche, W. & Gottschalk, C. Krankheiten der Kaninchen und Hasen. Jena: G. Fischer, 1972. 294 s. Kötsche, W. & Gottschalk, C. Krankheiten der Kaninchen und Hasen (4., èuberarb. Aufl. ed.). Jena: Fischer, 1990. 359 s. 3-334-00295-0. LaFond, R. E., Centurion-Lara, A., Godornes, C., Rompalo, A. M., Van Voorhis, W. C. & Lukehart, S. A. (2003). Sequence diversity of Treponema pallidum subsp. pallidum tprK in human syphilis lesions and rabbit-propagated isolates. J Bacteriol, 185, 6262-6268. LaFond, R. E., Centurion-Lara, A., Godornes, C., Van Voorhis, W. C. & Lukehart, S. A. (2006a). TprK sequence diversity accumulates during infection of rabbits with Treponema pallidum subsp. pallidum Nichols strain. Infect Immun, 74, 1896-1906. LaFond, R. E., Molini, B. J., Van Voorhis, W. C. & Lukehart, S. A. (2006b). Antigenic variation of TprK V regions abrogates specific antibody binding in syphilis. Infect Immun, 74, 6244-6251. Lagesen, K., Hallin, P., Rodland, E. A., Staerfeldt, H. H., Rognes, T. & Ussery, D. W. (2007). RNAmmer: consistent and rapid annotation of ribosomal RNA genes. Nucleic Acids Research, 35, 3100-3108. Leader, B. T., Hevner, K., Molini, B. J., Barrett, L. K., Van Voorhis, W. C. & Lukehart, S. A. (2003). Antibody responses elicited against the Treponema pallidum repeat proteins differ during infection with different isolates of Treponema pallidum subsp. pallidum. Infect Immun, 71, 6054-6057. Leon-Blanco, F. & Oteiza, A. (1945). The Experimental Transmission of Pinta, Mal Del Pinto or Carate to the Rabbit. Science, 101, 309-311. Leslie, D. E., Azzato, F., Karapanagiotidis, T., Leydon, J. & Fyfe, J. (2007). Development of a real-time PCR assay to detect Treponema pallidum in clinical specimens and assessment of the assay's performance by comparison with serological testing. J Clin Microbiol, 45, 93-96. Levaditi, C., Marie, A. & Nicolau, S. (1921). Virulence pour l'homme du spirochete de la spirillose spontanee du lapin. C R Acad Sci, 172. Levrero, F., Gatti, S., Gautier-Hion, A. & Menard, N. (2007). Yaws disease in a wild gorilla population and its impact on the reproductive status of males. Am J Phys Anthropol, 132, 568-575. Liao, D. (2000). Gene conversion drives within genic sequences: concerted evolution of ribosomal RNA genes in bacteria and archaea. J Mol Evol, 51, 305-317. Librado, P. & Rozas, J. (2009). DnaSP v5: a software for comprehensive analysis of DNA polymorphism data. Bioinformatics, 25, 1451-1452. Liska, S. L., Perine, P. L., Hunter, E. F., Crawford, J. A. & Feeley, J. C. (1982). Isolation and transportation of Treponema pertenue in Golden-Hamsters. Current Microbiology, 7, 41-43. Liu, H., Rodes, B., George, R. & Steiner, B. (2007). Molecular characterization and analysis of a gene encoding the acidic repeat protein (Arp) of Treponema pallidum. J Med Microbiol, 56, 715-721. Lovell, N. C., Jurmain, R. & Kilgore, L. (2000). Skeletal evidence of probable treponemal infection in free-ranging African apes. Primates, 41, 275-290. Lowe, T. M. & Eddy, S. R. (1997). tRNAscan-SE: a program for improved detection of transfer RNA genes in genomic sequence. Nucleic Acids Res, 25, 955-964. Lukashin, A. V. & Borodovsky, M. (1998). GeneMark.hmm: new solutions for gene finding. Nucleic Acids Res, 26, 1107-1115. Lukehart, S. A., Godornes, C., Molini, B. J., Sonnett, P., Hopkins, S., Mulcahy, F., Engelman, J., Mitchell, S. J., Rompalo, A. M., Marra, C. M., et al. (2004). 95
Literatura Macrolide resistance in Treponema pallidum in the United States and Ireland. N Engl J Med, 351, 154-158. Lukehart, S. A. & Marra, C. M. (2007). Isolation and laboratory maintenance of Treponema pallidum. Curr Protoc Microbiol, Chapter 12, Unit 12A 11. Lumeij, J. T. (2010). Widespread treponemal infections of hare populations (Lepus europaeus) in the Netherlands. Eur J Wildl Res, 56, DOI 10.1007/s10344-1001010428-10343. Lumeij, J. T., de Koning, J., Bosma, R. B., van der Sluis, J. J. & Schellekens, J. F. (1994). Treponemal infections in hares in The Netherlands. J Clin Microbiol, 32, 543-546. Mafart, B. (2002). Goundou: a historical form of yaws. Lancet, 360, 1168-1170. Magnuson, H. J., Thomas, E. W., Olansky, S., Kaplan, B. I., De Mello, L. & Cutler, J. C. (1956). Inoculation syphilis in human volunteers. Medicine (Baltimore), 35, 3382. Mardis, E. R. (2008). Next-generation DNA sequencing methods. Annu Rev Genomics Hum Genet, 9, 387-402. Marfin, A. A., Liu, H., Sutton, M. Y., Steiner, B., Pillay, A. & Markowitz, L. E. (2001). Amplification of the DNA polymerase I gene of Treponema pallidum from whole blood of persons with syphilis. Diagn Microbiol Infect Dis, 40, 163-166. Margulies, M., Egholm, M., Altman, W. E., Attiya, S., Bader, J. S., Bemben, L. A., Berka, J., Braverman, M. S., Chen, Y. J., Chen, Z., et al. (2005). Genome sequencing in microfabricated high-density picolitre reactors. Nature, 437, 376380. Marra, C. M., Colina, A. P., Godornes, C., Tantalo, L. C., Puray, M., CenturionLara, A. & Lukehart, S. A. (2006). Antibiotic selection may contribute to increases in macrolide-resistant Treponema pallidum. J Infect Dis, 194, 1771-1773. Marra, C. M., Maxwell, C. L., Smith, S. L., Lukehart, S. A., Rompalo, A. M., Eaton, M., Stoner, B. P., Augenbraun, M., Barker, D. E., Corbett, J. J., et al. (2004). Cerebrospinal fluid abnormalities in patients with syphilis: association with clinical and laboratory features. J Infect Dis, 189, 369-376. Marra, C. M., Sahi, S. K., Tantalo, L. C., Godornes, C., Reid, T., Behets, F., Rompalo, A., Klausner, J. D., Yin, Y. P., Mulcahy, F., et al. (2010). Enhanced molecular typing of Treponema pallidum: geographical distribution of strain types and association with neurosyphilis. J Infect Dis, 202, 1380-1388. Martin, D. P., Lemey, P., Lott, M., Moulton, V., Posada, D. & Lefeuvre, P. (2010a). RDP3: a flexible and fast computer program for analyzing recombination. Bioinformatics, 26, 2462-2463. Martin, I. E., Gu, W., Yang, Y. & Tsang, R. S. (2009a). Macrolide resistance and molecular types of Treponema pallidum causing primary syphilis in Shanghai, China. Clin Infect Dis, 49, 515-521. Martin, I. E., Tsang, R. S., Sutherland, K., Anderson, B., Read, R., Roy, C., Yanow, S., Fonseca, K., White, W., Kandola, K., et al. (2010b). Molecular typing of Treponema pallidum strains in western Canada: predominance of 14d subtypes. Sex Transm Dis, 37, 544-548. Martin, I. E., Tsang, R. S., Sutherland, K., Tilley, P., Read, R., Anderson, B., Roy, C. & Singh, A. E. (2009b). Molecular characterization of syphilis in patients in Canada: azithromycin resistance and detection of Treponema pallidum DNA in whole-blood samples versus ulcerative swabs. J Clin Microbiol, 47, 1668-1673.
96
Literatura Martin, P. M., Cockayne, A., Georges, A. J. & Penn, C. W. (1990). Immune response to Treponema pertenue and Treponema pallidum Nichols in patients with yaws. Res Microbiol, 141, 181-186. Matějková, P., Flasarová, M., Zákoucká, H., Borek, M., Kremenová, S., Arenberger, P., Woznicová, V., Weinstock, G. M. & Šmajs, D. (2009). Macrolide treatment failure in a case of secondary syphilis: a novel A2059G mutation in the 23S rRNA gene of Treponema pallidum subsp. pallidum. J Med Microbiol, 58, 832-836. Matějková, P., Strouhal, M., Šmajs, D., Norris, S. J., Palzkill, T., Petrosino, J. F., Sodergren, E., Norton, J. E., Singh, J., Richmond, T. A., et al. (2008). Complete genome sequence of Treponema pallidum ssp. pallidum strain SS14 determined with oligonucleotide arrays. BMC Microbiol, 8, 76. Maurice, J. (2012). WHO plans new yaws eradication campaign. Lancet, 379, 1377-1378. McKevitt, M., Brinkman, M. B., McLoughlin, M., Perez, C., Howell, J. K., Weinstock, G. M., Norris, S. J. & Palzkill, T. (2005). Genome scale identification of Treponema pallidum antigens. Infect Immun, 73, 4445-4450. McKevitt, M., Patel, K., Smajs, D., Marsh, M., McLoughlin, M., Norris, S. J., Weinstock, G. M. & Palzkill, T. (2003). Systematic cloning of Treponema pallidum open reading frames for protein expression and antigen discovery. Genome Res, 13, 1665-1674. McLeod, C. & Turner, T. B. (1946). Studies on the biologic relationship between the causative agents of syphilis, yaws, and venereal spirochetosis of rabbits; comparison of the experimental disease produced in rabbits. Am J Syph Gonorrhea Vener Dis, 30, 455-462. McLeod, M. P., Qin, X., Karpathy, S. E., Gioia, J., Highlander, S. K., Fox, G. E., McNeill, T. Z., Jiang, H., Muzny, D., Jacob, L. S., et al. (2004). Complete genome sequence of Rickettsia typhi and comparison with sequences of other rickettsiae. J Bacteriol, 186, 5842-5855. Meder, A. (1994). Causes of Death and Diseases of Gorillas in the Wild. Gorilla J, 2, 1920. Meheus, A. (1985). Integration of yaws control and primary health care. Rev Infect Dis, 7 Suppl 2, S284-288. Meheus, A. & Antal, G. M. (1992). The endemic treponematoses: not yet eradicated. World Health Stat Q, 45, 228-237. Metzker, M. L. (2010). Sequencing technologies - the next generation. Nat Rev Genet, 11, 31-46. Miao, R. & Fieldsteel, A. H. (1978). Genetics of Treponema - Relationship between Treponema pallidum and 5 Cultivable Treponemes. J Bacteriol, 133, 101-107. Miao, R. M. & Fieldsteel, A. H. (1980). Genetic relationship between Treponema pallidum and Treponema pertenue, two noncultivable human pathogens. J Bacteriol, 141, 427-429. Mikalová, L., Strouhal, M., Čejková, D., Zobaniková, M., Pospišilová, P., Norris, S. J., Sodergren, E., Weinstock, G. M. & Šmajs, D. (2010). Genome analysis of Treponema pallidum subsp. pallidum and subsp. pertenue strains: most of the genetic differences are localized in six regions. PLoS One, 5, e15713. Mindel, A., Tovey, S. J., Timmins, D. J. & Williams, P. (1989). Primary and secondary syphilis, 20 years' experience. 2. Clinical features. Genitourin Med, 65, 1-3. Mitja, O., Hays, R., Ipai, A., Penias, M., Paru, R., Fagaho, D., de Lazzari, E. & Bassat, Q. (2012). Single-dose azithromycin versus benzathine benzylpenicillin for treatment of yaws in children in Papua New Guinea: an open-label, non-inferiority, randomised trial. The Lancet, 379, 342-347. 97
Literatura Morgan, C. A., Lukehart, S. A. & Van Voorhis, W. C. (2003). Protection against syphilis correlates with specificity of antibodies to the variable regions of Treponema pallidum repeat protein K. Infect Immun, 71, 5605-5612. Morgan, C. A., Molini, B. J., Lukehart, S. A. & Van Voorhis, W. C. (2002). Segregation of B and T cell epitopes of Treponema pallidum repeat protein K to variable and conserved regions during experimental syphilis infection. J Immunol, 169, 952-957. Mulligan, C. J., Norris, S. J. & Lukehart, S. A. (2008). Molecular studies in Treponema pallidum evolution: toward clarity? PLoS Negl Trop Dis, 2, e184. Nei, M. & Kumar, S. Molecular evolution and phylogenetics. Oxford: Oxford University Press, 2000. 333 s. 0-19-513584-9 (hbk.), 0-19-513585-7 (pbk.). Nichols, H. J. & Hough, W. H. (1913). Demonstration of Spirochaeta pallida in the cerebrospinal fluid. JAMA, 60, 108-110. Noguchi, H. (1921). A note on the venereal spirochetosis of rabbits. JAMA, 77, 20522053. Noordhoek, G. T., Cockayne, A., Schouls, L. M., Meloen, R. H., Stolz, E. & van Embden, J. D. (1990). A new attempt to distinguish serologically the subspecies of Treponema pallidum causing syphilis and yaws. J Clin Microbiol, 28, 1600-1607. Noordhoek, G. T., Hermans, P. W. M., Paul, A. N., Schouls, L. M., Vandersluis, J. J. & Vanembden, J. D. A. (1989). Treponema pallidum subspecies pallidum (Nichols) and Treponema pallidum subspecies pertenue (CDC-2575) differ in at least one nucleotide - comparison of 2 homologous antigens. Microbial Pathogenesis, 6, 29-42. Norris, S. J. (1982). In vitro cultivation of Treponema pallidum: independent confirmation. Infect Immun, 36, 437-439. Norris, S. J., Cox, D. L. & Weinstock, G. M. (2001). Biology of Treponema pallidum: correlation of functional activities with genome sequence data. J Mol Microbiol Biotechnol, 3, 37-62. Norris, S. J. & Edmondson, D. G. (1988). Invitro culture system to determine MICS and MBSC of antimicrobial agents against Treponema pallidum subsp. pallidum (Nichols strain). Antimicrobial Agents and Chemotherapy, 32, 68-74. Norris, S. J., Pope, V., Johnson, R. E. & Larsen, S. A. Treponema and Other Human Host-Associated Spirochetes. In P. R. Murray, E. J. Baron, J. H. Jorgensen, M. A. Pfaller & R. H. Yolken (Eds.), Manual of Clinical Microbiology, 8th edition (pp. 955-971). Washington, DC, USA: ASM Press, 2003. Norris, S. J. & Weinstock, G. M. Comparative Genomics of Spirochetes. In J. D. Radolf & S. Lukehart (Eds.), Pathogenic Treponema: Molecular and Cellular Biology (pp. 19-38). Norfolk, England: Caister Academic Press, 2006. Ordonez, H., Unciuleac, M. & Shuman, S. (2012). Mycobacterium smegmatis RqlH defines a novel clade of bacterial RecQ-like DNA helicases with ATP-dependent 3'-5' translocase and duplex unwinding activities. Nucleic Acids Res, 40, 46044614. Ovcinnikov, N. M. & Delektorskij, V. V. (1966). Morphology of Treponema pallidum. Bull World Health Organ, 35, 223-229. Ovcinnikov, N. M. & Delektorskij, V. V. (1970). Treponema pertenue under the electron microscope. Br J Vener Dis, 46, 349-379. Pace, J. L. & Csonka, G. W. (1984). Endemic non-venereal syphilis (bejel) in Saudi Arabia. Br J Vener Dis, 60, 293-297. Padidam, M., Sawyer, S. & Fauquet, C. M. (1999). Possible emergence of new geminiviruses by frequent recombination. Virology, 265, 218-225. 98
Literatura Pahor, A. L. (1979). Yaws or syphilis? Br Med J, 1, 912. Palmer, H. M., Higgins, S. P., Herring, A. J. & Kingston, M. A. (2003). Use of PCR in the diagnosis of early syphilis in the United Kingdom. Sex Transm Infect, 79, 479483. Pavelka, J., Homola, L., Mikolášek, P., Plachá, L. & Bartošová, D. (2011). Případ sekundární syfilitidy u 15letého chlapce. Pediatr. prax, 12, 259–261. Pei, A. N., Nossa, C. W., Chokshi, P., Blaser, M. J., Yang, L. Y., Rosmarin, D. M. & Pei, Z. H. (2009). Diversity of 23S rRNA Genes within Individual Prokaryotic Genomes. PLoS One, 4, e5437. Pei, A. Y., Oberdorf, W. E., Nossa, C. W., Agarwal, A., Chokshi, P., Gerz, E. A., Jin, Z., Lee, P., Yang, L., Poles, M., et al. (2010). Diversity of 16S rRNA genes within individual prokaryotic genomes. AEM, 76, 3886-3897. Petersen, T. N., Brunak, S., von Heijne, G. & Nielsen, H. (2011). SignalP 4.0: discriminating signal peptides from transmembrane regions. Nat Methods, 8, 785786. Pětrošová, H., Zobaníková, M., Čejková, D., Mikalová, L., Pospíšilová, P., Strouhal, M., Chen, L., Qin, X., Muzny, D. M., Weinstock, G. M., et al. (2012). Whole genome sequence of Treponema pallidum ssp. pallidum, Strain Mexico A, suggests recombination between Yaws and Syphilis strains. PLoS Negl Trop Dis, 6, e1832. Pillay, A., Chen, C. Y., Reynolds, M. G., Mombouli, J. V., Castro, A. C., Louvouezo, D., Steiner, B. & Ballard, R. C. (2011). Laboratory-confirmed case of yaws in a 10-year-old boy from the Republic of the Congo. J Clin Microbiol, 49, 4013-4015. Pillay, A., Liu, H., Chen, C. Y., Holloway, B., Sturm, A. W., Steiner, B. & Morse, S. A. (1998). Molecular subtyping of Treponema pallidum subspecies pallidum. Sex Transm Dis, 25, 408-414. Posada, D. & Crandall, K. A. (2001). Evaluation of methods for detecting recombination from DNA sequences: computer simulations. Proc Natl Acad Sci U S A, 98, 1375713762. Raiziss, G. W. & Severac, M. (1933). Rapidity with which Spirochaeta pallida invades the bloodstream. Arch Dermatol Syphilol, 35, 1101-1109. Ramoni, S., Cusini, M., Boneschi, V., Galloni, C. & Marchetti, S. (2010). Primary syphilis of the finger. Sex Transm Dis, 37, 468. Rinaldi, A. (2008). Yaws: a second (and maybe last?) chance for eradication. PLoS Negl Trop Dis, 2, e275. Roman, G. C. & Roman, L. N. (1986). Occurrence of congenital, cardiovascular, visceral, neurologic, and neuro-ophthalmologic complications in late yaws: a theme for future research. Rev Infect Dis, 8, 760-770. Ross, E. H. (1912). An intracellular parasite developing into spirochaetes, Found by the Jelly Method of in Vitro Staining in Syphilitic Lesions and in the Circulating Blood During the Secondary Stages of the Disease. Br Med J, 2, 1651-1654. Rozen, S. & Skaletsky, H. (2000). Primer3 on the WWW for general users and for biologist programmers. Methods Mol Biol, 132, 365-386. Russell, F. F. (1908). The comparative morphology of the spirochetes of syphilis and yaws (framboesia tropica). Arch. of Internal Med., ii, 74. Saitou, N. & Nei, M. (1987). The neighbor-joining method: a new method for reconstructing phylogenetic trees. Mol Biol Evol, 4, 406-425. Sayers, E. W., Barrett, T., Benson, D. A., Bolton, E., Bryant, S. H., Canese, K., Chetvernin, V., Church, D. M., DiCuccio, M., Federhen, S., et al. (2010). Database resources of the National Center for Biotechnology Information. Nucleic Acids Research, 38, D5-D16. 99
Literatura Scolnik, D., Aronson, L., Lovinsky, R., Toledano, K., Glazier, R., Eisenstadt, J., Eisenberg, P., Wilcox, L., Rowsell, R. & Silverman, M. (2003). Efficacy of a targeted, oral penicillin-based yaws control program among children living in rural South America. Clin Infect Dis, 36, 1232-1238. Setubal, J. C., Reis, M., Matsunaga, J. & Haake, D. A. (2006). Lipoprotein computational prediction in spirochaetal genomes. Microbiology, 152, 113-121. Schaudinn, F. & Hoffman, E. (1905). Über Spirochaeta pallida bei Syphilis und die Unterschiede dieser Form gegenuber anderen Arten dieser Gattung. Berlin Klin Wochschr, 42, 673-675. Schmid, G. P., Stoner, B. P., Hawkes, S. & Broutet, N. (2007). The need and plan for global elimination of congenital syphilis. Sex Transm Dis, 34, S5-10. Singh, A. E. & Romanowski, B. (1999). Syphilis: review with emphasis on clinical, epidemiologic, and some biologic features. Clin Microbiol Rev, 12, 187-209. Smith, J. L., David, N. J., Indgin, S., Israel, C. W., Levine, B. M., Justice, J., Jr., McCrary, J. A., 3rd, Medina, R., Paez, P., Santana, E., et al. (1971). Neuroophthalmological study of late yaws and pinta. II. The Caracas project. Br J Vener Dis, 47, 226-251. Smith, J. M. (1992). Analyzing the mosaic structure of genes. J Mol Evol, 34, 126-129. Stamm, L. V. (2010). Global challenge of antibiotic-resistant Treponema pallidum. Antimicrob Agents Chemother, 54, 583-589. Stamm, L. V. & Bergen, H. L. (2000). A point mutation associated with bacterial macrolide resistance is present in both 23S rRNA genes of an erythromycinresistant Treponema pallidum clinical isolate. Antimicrob Agents Chemother, 44, 806-807. Stamm, L. V., Greene, S. R., Bergen, H. L., Hardham, J. M. & Barnes, N. Y. (1998). Identification and sequence analysis of Treponema pallidum tprJ, a member of a polymorphic multigene family. FEMS Microbiol Lett, 169, 155-163. Stamm, L. V., Kerner, T. C., Jr., Bankaitis, V. A. & Bassford, P. J., Jr. (1983). Identification and preliminary characterization of Treponema pallidum protein antigens expressed in Escherichia coli. Infect Immun, 41, 709-721. Stamm, L. V., Stapleton, J. T. & Bassford, P. J., Jr. (1988). In vitro assay to demonstrate high-level erythromycin resistance of a clinical isolate of Treponema pallidum. Antimicrob Agents Chemother, 32, 164-169. Starzycki, Z. (1983). Primary syphilis of the fingers. Br J Vener Dis, 59, 169-171. Strouhal, M., Šmajs, D., Matějková, P., Sodergren, E., Amin, A. G., Howell, J. K., Norris, S. J. & Weinstock, G. M. (2007). Genome differences between Treponema pallidum subsp. pallidum strain Nichols and T. paraluiscuniculi strain Cuniculi A. Infect Immun, 75, 5859-5866. Sun, E. S., Molini, B. J., Barrett, L. K., Centurion-Lara, A., Lukehart, S. A. & Van Voorhis, W. C. (2004). Subfamily I Treponema pallidum repeat protein family: sequence variation and immunity. Microbes Infect, 6, 725-737. Šmajs, D., Matějková, P., Woznicová, V. & Vališová, Z. (2006). Diagnosis of syphilis by polymerase chain reaction and molecular typing of Treponema pallidum. Reviews in Medical Microbiology, 1793-99. Šmajs, D., McKevitt, M., Howell, J. K., Norris, S. J., Cai, W. W., Palzkill, T. & Weinstock, G. M. (2005). Transcriptome of Treponema pallidum: gene expression profile during experimental rabbit infection. J Bacteriol, 187, 1866-1874. Šmajs, D., McKevitt, M., Wang, L., Howell, J. K., Norris, S. J., Palzkill, T. & Weinstock, G. M. (2002). BAC library of T. pallidum DNA in E. coli. Genome Res, 12, 515-522. 100
Literatura Šmajs, D., Norris, S. J. & Weinstock, G. M. (2012). Genetic diversity in Treponema pallidum: implications for pathogenesis, evolution and molecular diagnostics of syphilis and yaws. Infect Genet Evol, 12, 191-202. Šmajs, D., Zobaniková, M., Strouhal, M., Čejková, D., Dugan-Rocha, S., Pospišilová, P., Norris, S. J., Albert, T., Qin, X., Hallsworth-Pepin, K., et al. (2011). Complete genome sequence of Treponema paraluiscuniculi, strain Cuniculi A: the loss of infectivity to humans is associated with genome decay. PLoS One, 6, e20415. Tamura, K., Dudley, J., Nei, M. & Kumar, S. (2007). MEGA4: Molecular Evolutionary Genetics Analysis (MEGA) software version 4.0. Molecular biology and evolution, 24, 1596-1599. Tamura, K. & Nei, M. (1993). Estimation of the number of nucleotide substitutions in the control region of mitochondrial DNA in humans and chimpanzees. Mol Biol Evol, 10, 512-526. Thornburg, R. W. & Baseman, J. B. (1983). Comparison of major protein antigens and protein profiles of Treponema pallidum and Treponema pertenue. Infect Immun, 42, 623-627. Tipple, C., Hanna, M. O., Hill, S., Daniel, J., Goldmeier, D., McClure, M. O. & Taylor, G. P. (2011). Getting the measure of syphilis: qPCR to better understand early infection. Sex Transm Infect. Titz, B., Rajagopala, S. V., Goll, J., Hauser, R., McKevitt, M. T., Palzkill, T. & Uetz, P. (2008). The binary protein interactome of Treponema pallidum--the syphilis spirochete. PLoS One, 3, e2292. Turner, T. B. (1936). The resistance of yaws and syphilis patiens to reinoculation with yaws spirochetes. Am J Hyg, 23, 431-448. Turner, T. B. (1937). Studies on the relationship between yaws and syphilis. Am J Epidemiol, 25, 477-506. Turner, T. B. & Hollander, D. H. (1957). Biology of the treponematoses based on studies carried out at the International Treponematosis Laboratory Center of the Johns Hopkins University under the auspices of the World Health Organization. Monogr Ser World Health Organ3-266. van der Woude, M. W. & Baumler, A. J. (2004). Phase and antigenic variation in bacteria. Clin Microbiol Rev, 17, 581-611, table of contents. von Hunnius, T. E., Yang, D., Eng, B., Waye, J. S. & Saunders, S. R. (2007). Digging deeper into the limits of ancient DNA research on syphilis. J Archaeol Sci, 34, 2091-2100. Wagner-Jauregg, J. (1918). Über die Einwirkung der Malaria auf die progressive Paralyse. Psychiatr. Neurol. Wochenschr., 20, 132-134. Wallis, J. & Lee, D. R. (1999). Primate Conservation: The Prevention of Disease Transmission. Int J Primatol, 20, 803-826. Wendel, G. D., Jr., Sanchez, P. J., Peters, M. T., Harstad, T. W., Potter, L. L. & Norgard, M. V. (1991). Identification of Treponema pallidum in amniotic fluid and fetal blood from pregnancies complicated by congenital syphilis. Obstet Gynecol, 78, 890-895. WHO. (1998). The World Health Report 1998-life in the 21century: a vision for all. World Health Organization132. WHO. (2001). Global prevalence and incidence of selected curable sexually transmitted infections: overview and estimates. Tech Report No WHO/HIV_AIDS/200102, WHO/CDS/CSR/EDC/200110.
101
Literatura Wicher, K., Horowitz, H. W. & Wicher, V. (1999). Laboratory methods of diagnosis of syphilis for the beginning of the third millennium. Microbes Infect, 1, 1035-1049. Willcox, R. R. & Guthe, T. (1966). Treponema pallidum. A bibliographical review of the morphology, culture and survival of T. pallidum and associated organisms. Bull World Health Organ, 35 Suppl, 5-169. Wilson, J. & Mauger, D. G. (1973). Syphilis in pregnancy supervening on yaws: case report. N Z Med J, 77, 384-388. Woese, C. R., Kandler, O. & Wheelis, M. L. (1990). Towards a natural system of organisms - proposal for the domains archea, bacteria, and eucarya. Proc. Natl. Acad. Sci. USA, 87, 4576-4579. Workowski, K. & Berman, S. (2010) Sexually Transmitted Diseases Treatment Guidelines. Vol. 59. MMWR 2010. Atlanta: Centers for Disease Control and Prevention. Woznicová, V., Matějková, P., Flasarová, M., Zakoucká, H., Vališová, Z., Šmajs, D. & Dastychová, E. (2010). Clarithromycin treatment failure due to macrolide resistance in Treponema pallidum in a patient with primary syphilis. Acta Derm Venereol, 90, 206-207. Zerbino, D. R. & Birney, E. (2008). Velvet: algorithms for de novo short read assembly using de Bruijn graphs. Genome Res, 18, 821-829. Zhou, P., Li, K., Lu, H., Qian, Y., Gu, X., Gong, W., Tucker, J. D. & Cohen, M. S. (2010). Azithromycin treatment failure among primary and secondary syphilis patients in Shanghai. Sex Transm Dis, 37, 726-729. Zhou, P., Qian, Y., Lu, H. & Guan, Z. (2009). Nonvenereal transmission of syphilis in infancy by mouth-to-mouth transfer of prechewed food. Sex Transm Dis, 36, 216217. Zobaníková, M., Mikolka, P., Čejková, D., Pospíšilová, P., Chen, L., Strouhal, M., Qin, X., Weinstock, G. M. & Šmajs, D. (2012). Complete genome sequence of Treponema pallidum strain DAL-1. Stand. Genomic Sci., 7, 2615838.
102
Přílohy
10 PŘÍLOHY Přílohy jsou uloženy na přiloženém CD. Příloha č 1 – Tabulka S1 Seznam primerů použitých k amplifikaci úseků DNA zahrnujících mezery nebo rozdíly mezi kontigy, které byly získány metodami pyrosekvenování a CGS při sekvenování genomu Samoa D
Příloha č 2 – Tabulka S2 Skupina 95 genů nově predikovaných v genomech Treponema pallidum ssp. pertenue (TPE) ve srovnání s anotovaným genomem T. p. ssp. pallidum (TPA) Nichols (AE000520.1) Příloha č 3 – Tabulka S3 Geny Treponema pallidum ssp. pallidum Nichols (TPA), které nejsou anotovány v genomech Treponema pallidum ssp. pertenue (TPE)
Příloha č 4 – Tabulka S4 Seznam rozdílů mezi sekvencí genomu Fribourg-Blanc a genomy kmenů TPE
Příloha č 5 – Tabulka S5 Seznam rozdílů mezi kmeny TPA, TPE (včetně Fribourg-Blanc) a Cuniculi A
Příloha č 6 – Tabulka S6 692 genů kódujících proteiny, které se neliší mezi oběma porovnávanými skupinami, skupinou kmenů TPE a Fribourg-Blanc a skupinou kmenů TPA
Příloha č 7 – Tabulka S7 Složení intergenových oblastí 16S-23S rDNA v klinických vzorcích T. pallidum subsp. pallidum.
103