BAKALÁŘSKÁ PRÁCE MASARYKOVA UNIVERZITA PŘÍRODOVĚDECKÁ FAKULTA
ÚSTAV EXPERIMENTÁLNÍ BIOLOGIE ODDĚLENÍ GENETIKY A MOLEKULÁRNÍ BIOLOGIE
SEKVENAČNÍ METODY NOVÉ GENERACE: JEJICH PRINCIPY A POTENCIÁLNÍ VYUŢITÍ V GENETICE ČLOVĚKA, ETICKÉ ASPEKTY
BRNO, 2011
Marie Kývalová
Poděkování Ráda bych poděkovala vedoucí mé bakalářské práce Mgr. Romaně Zaoralové za odbornou pomoc a cenné rady, díky kterým jsem mohla přivést tuto práci do zdárného konce.
2
OBSAH SEZNAM ZKRATEK ...................................................................................................................5 1
ÚVOD ......................................................................................................................................6
2
HISTORIE SEKVENCOVÁNÍ DNA A LIDSKÝ GENOM ..............................................7
3
TRADIČNÍ SEKVENAČNÍ METODY ...............................................................................9
4
3.1
Sangerova metoda ..................................................................................................9
3.2
Maxam-Gilbertova metoda ..................................................................................10
SEKVENAČNÍ METODY NOVÉ GENERACE ..............................................................11 4.1
Masivně paralelní sekvencování ..........................................................................11
4.2
Pyrosekvenace (metoda 454/Roche) ....................................................................13
4.2.1 Postup sekvenační metody 454/Roche ...........................................................13 4.3
Illumina (Solexa) Genome Analyzer ...................................................................15
4.3.1 Postup sekvenace pomocí Illumina Genome Analyzer ..................................15 4.4
Applied Biosystems (AB) SOLiDTM System.......................................................18
4.4.1 Příprava DNA knihovny a amplifikace ..........................................................18 4.4.2 Postup sekvenace s metodou AB SOLiDTM System.......................................19 4.4.3 Dvoubázové dekódování ................................................................................21 4.5
Sekvenace jednotlivých molekul DNA................................................................21
4.5.1 Helicos Biosciences HeliScopeTM ..................................................................22 4.5.2 Pacific Biosciences SMRTTM .........................................................................23 5
VYUŢITÍ NGS V NÁDOROVÉ GENETICE ČLOVĚKA ..............................................25 5.1
Podstata vzniku rakoviny .....................................................................................25
5.2
Chronická myeloidní leukémie ............................................................................25
5.3
Rakovina prsu ......................................................................................................26
5.4
Sekvencování rakoviny ........................................................................................27
3
6
ETICKÉ ASPEKTY CELOGENOMOVÉHO SEKVENCOVÁNÍ ................................28 6.1
Informovaný souhlas............................................................................................29
6.2
Informace o výsledcích výzkumu ........................................................................29
6.3
Otázka vyšetřování dětí........................................................................................30
7
ZÁVĚR ..................................................................................................................................31
8
POUŢITÁ LITERATURA ..................................................................................................32
4
SEZNAM ZKRATEK AMK
aminokyselina
cDNA
kyselina deoxyribonukleová komplementární
ddNTP
2‘,3‘-dideoxynukleozidtrifosfát
dNTP
deoxynukleozidtrifosfát
emPCR
emulzní polymerázová řetězová reakce
MPSS
masivně paralelní sekvencování (z anglického „Massively Parallel Signature Sequencing“)
NGS
sekvenační metody nové generace (z anglického „Next-Generation Sequencing“)
PPi
pyrofosfát
SNP
jednonukleotidový polymorfismus (z anglického „Single Nucleotide Polymorphism“)
SOLiD
sekvencování oligonukleotidů na základě ligace (z anglického „Sequencing by Oligo Ligation and Detection“)
tSMS
TM
tzv. přesné sekvencování jednotlivých molekul DNA (z anglického „True Single Molecule Sequencing“)
5
1
ÚVOD Sekvencování DNA patří již řadu let ke standardním metodám molekulárně-genetických
analýz biologického materiálu. Pomocí sekvencování DNA je možné určit pořadí jednotlivých nukleotidů v řetězci DNA a analýzou nalezené sekvence zachytit získat informace relevantní např. k původu geneticky podmíněných onemocnění. V medicíně nachází sekvencování DNA široké uplatnění, zejména v oblasti diagnostiky dědičných chorob a nádorových onemocnění (Pospíšilová et al., 2009). V roce 1977 vyvinuly dva vědecké týmy nezávisle na sobě první sekvenační metody pod názvy Sangerova a Maxam-Gilbertova metoda. Následně byla zvýšena přesnost a efektivita Sangerovy sekvenační metody až o tři řády. Díky tomu se Sangerova metoda stala nejužívanější metodou až do konce dvacátého století. Sekvenace DNA touto metodou je však poměrně nákladná a pomalá. Proto se od počátku 21. století začínají vyvíjet sekvenační metody nové generace (z anglického „Next-Generation Sequencing“ = NGS). První takto popsanou metodou se stala technologie tzv. masivního paralelního sekvencování, jejíž obecný princip se stal základem pro následující NGS. Další vyvinutou technologií byla metoda pyrosekvencování (454/Roche) a postupně se začaly vyvíjet další sekvenační metody od různých společností. Patří mezi ně Illumina HiSeq, SOLiD™,
Helicos Heliscope™ a doposud nejnovější metoda
sekvenace jednotlivých molekul DNA Pacific SMRT™. Postup ve vývoji výpočetní techniky a bioinformatiky vedl ke snížení nákladů na sekvencování a také k zrychlení sekvenace celého genomu. Tento významný technologický pokrok umožnil rozvoj celogenomového sekvencování včetně analýz individuálních lidských genomů a nastartoval rozvoj tzv. personální genomiky. Na začátku této práce uvádím historii sekvencování a následného objevu lidského genomu. Ve druhé kapitole věnuji pozornost principům tradičních sekvenačních metod (Sangerova a Maxam-Gilbertova metoda). Cílem mé práce je popis principů metod NGS. U jednotlivých sekvenačních technologií se zabývám zpracováním vzorku DNA, amplifikací (u technologií 454/Roche, Illumina a SOLiD) a následným sekvencováním. Následně se zaměřuji na využití NGS v onkogenetice člověka a v poslední kapitole se věnuji teoretickému rozboru etických aspektů celogenomového sekvencování, zvláště u nedospělých osob.
6
2
HISTORIE SEKVENCOVÁNÍ DNA A LIDSKÝ GENOM Počátek výzkumu sekvencování DNA můžeme datovat do padesátých let 20. století.
V roce 1953 James D. Watson a Francis H. C. Crick sestavili molekulární strukturu nukleových kyselin. Ve své práci popisují DNA jako dva šroubovité řetězce, které jsou stočené okolo stejné osy a navzájem spojené purinovými a pyrimidinovými bázemi. Na začátku sedmdesátých let bylo určení pořadí nukleotidů velmi obtížné a obvykle se provádělo nepřímo, tedy sekvencováním RNA molekul a proteinů. První sekvencování krátké sekvence DNA provedl v roce 1970 Ray Wu z Cornellské univerzity. Tato sekvence se skládala z pouhých dvanácti nukleotidů a pocházela z okrajových regionů genomu fága lambda. Průlom nastal v druhé polovině sedmdesátých let, kdy v roce 1974 angličtí vědci Frederick Sanger a A. R. Coulson vyvinuli svou sekvenační metodu a v témže roce vyvinuli američtí vědci Allan Maxam a Walter Gilbert nezávisle na Sangerovi další, poměrně rychlou metodu sekvencování molekuly DNA s podobným postupem, přičemž oba vědecké týmy se za svou vědeckou činnost podělily v roce 1980 o Nobelovu cenu. Pro svou praktičnost se však standardem stala pouze Sangerova metoda (King et al, 2006). Nové sekvenační technologie byly zpočátku schopny přečíst během jednoho běhu pouze 100 bází. Jejich postupným zdokonalováním, například automatizací detekce fluorescenčně značených molekul nebo zavedením kapilárních sekvenátorů, je v současnosti standardně dosahováno přečtení až 1000 bází během jednoho běhu. Tyto zdokonalené techniky umožnily rutinně využívat sekvencování pro analýzu fragmentů DNA (např. produktů PCR), a staly se tak běžnou diagnostickou metodou v medicínské praxi. Sekvencování celých genomů však bylo stále velmi zdlouhavé a časově i finančně náročné (Pospíšilová et al., 2009). Při prvních pokusech bylo možno osekvencovat za den jen několik tisíc nukleových bází a sekvencování celého genomu bylo velice náročné. Postupně jsou metody modernizovány a vědecká veřejnost má k dispozici v databázích sekvence DNA čítající několik stovek miliard nukleových bází. Prvním zcela osekvencovaným genomem byl genom bakterie Haemophilus influenzae a dnes už je k dispozici široké rozpětí genomů jiných různých organizmů (Tab. 1, Mitchelson, 2007).
7
bakteriální genomy
eukaryotické genomy
kompletně osekvencované
2122
265
probíhající genomové projekty
6170
2003
Tab. 1: Přehled osekvencovaných genomů organizmů k 14.4.2011 (http://www.genomesonline.org9; převzato). Přečtení DNA, která představuje lidský genom, bylo velice očekávané a zároveň se očekává jeho velký přínos pro porozumění lidské evoluci, příčinám řady nemocí a vztahu mezi životním prostředím a dědičností při definování postavení člověka v přírodě. Projekt s cílem stanovení úplné nukleotidové sekvence lidského genomu byl poprvé formálně navržen v roce 1985 a v roce 1990 byl ve Spojených státech oficiálně zahájen projekt lidského genomu (The Human Genome Project), který kompletně osekvencoval lidský genom (Venter et al., 2001). První podoba genomu člověka byla zveřejněna v roce 2001 (The International Human Genome Mapping Consortium, 2001), ale nejnovější data byla publikována až v roce 2006 (Gregory et al., 2006). Složitost lidského genomu přináší mnoho výzev pro shromažďování dalších sekvencí (The International Human Genome Mapping Consortium, 2001). Molekuly DNA v lidském genomu jsou uspořádány do 46 chromozomů (22 párů autozomů a jeden pár gonozomů), velikost haploidního genomu je 3,2 miliardy nukleotidů (tj. 3200 Mb) a přibližně obsahuje 25 000 genů. Kódující oblasti, převážně tvořené exony strukturních genů, zaujímají přibližně 1,5 % genomu. Zbytek genomu tvoří introny, pseudogeny, mobilní elementy, repetitivní sekvence a další úseky, jejichž význam dosud nebyl zcela objasněn (Pospíšilová et al., 2009). The International Human Genome Sequencing Consortium (2001) sestavilo mapu celého genomu, jejímž cílem je umožnit výběr klonů pro sekvenaci a pro jeho přesné stanovení.
8
3 3.1
TRADIČNÍ SEKVENAČNÍ METODY Sangerova metoda Sangerova metoda, označována také jako dideoxy sekvenace nebo enzymová sekvenace,
je založena na sekvenaci pomocí detekce ukončení prodlužujícího se vlákna DNA. K tomuto ukončení vlákna DNA se využívá dideoxynukleotid (ddNTP) (http://www.bio.davidson.edu8). Jedná se o nejčastěji používanou sekvenační technologii založenou na elektroforéze a stala se základem pro Human Genome Project (Jarvie, 2005). Na začátku experimentu je potřeba příprava tzv. DNA knihovny. Řetězec DNA je sestřižen na kratší úseky, naklonován do DNA vektorů a amplifikován in vivo. Amplifikace probíhá v bakteriálních buňkách, ze kterých se následně extrahují plazmidy nesoucí klonované fragmenty (Sanger et al., 1977). Kromě toho, že ddNTPs obsahují na 3‘ uhlíku vodík hydroxylové skupiny, jsou ddNTPs v podstatě stejné jako deoxynukleotidy (dNTPs). Jsou-li tyto modifikované nukleotidy začleněny do sekvence, znemožní vytvoření fosfodiesterové vazby s dalším nukleotidem, čímž ukončuje prodlužující se řetězec DNA (http://www.bio.davidson.edu8). Sekvenace probíhá ve čtyřech oddělených zkumavkách, do kterých je přidána reakční směs obsahující primery, templát, DNA polymeráza, fluorescenčně značené dNTPs a přidané ddNTPs. V každé ze čtyř reakčních směsí je přítomen jeden charakteristický ddNTP – ddATP, ddCTP, ddGTP nebo ddTTP. Aby mohla zároveň probíhat i klasická syntéza DNA, jsou ddNTPs ve směsi v nízké koncentraci (poměr ddNTP : dNTP zpravidla odpovídá 1 : 100). Výsledkem reakce jsou fragmenty DNA o různé délce, zakončené fluorescenčně značenými ddNTPs. Fragmenty jsou denaturovány a roztříděny podle velikosti elektroforézou na polyakrylamidovém gelu (každá reakční směs má svou dráhu). Po ozáření vzniká obraz s typickými proužky, ze kterých lze odvodit sekvenci DNA (Obr. 1, Sanger et al., 1977). V současnosti je Sangerova metoda nejpoužívanější a nejpřesnější sekvenační metodou při sekvenaci de novo. Délka čtených fragmentů dosahuje velikosti 700-800 bp. Nevýhodou oproti NGS je časová a finanční náročnost této metody. Nové metody navíc nevyžadují klonování DNA do bakteriálních vektorů, při kterém dochází k disproporciálnímu zastoupení DNA fragmentů v genomové knihovně. Novější modifikace Sangerovy metody, kapilární elektroforéza, umožňuje sekvenaci v jedné reakci. Každý ddNTP (popř. primer) je značen jiným fluorescenčním barvivem a elektroforéza probíhá v jedné skleněné kapiláře.
9
Obr. 1: Znázornění Sangerovy sekvenační metody DNA (http://9e.devbio.com/5; převzato a upraveno). 3.2
Maxam-Gilbertova metoda Maxam a Gilbert (1977) vyvinuli sekvenační DNA metodu, která je založena
na chemické modifikaci DNA a následném štěpení specifických dNTPs. Maxam-Gilbertova metoda je známá jako metoda chemického sekvencování a vznikla při studiu struktury nukleových kyselin. Pomocí této metody je možné sekvencovat dvouřetězcovou i jednořetězcovou DNA. Vzorek krátké sekvence DNA je označen radioaktivním fosforem (32P) na 5’ nebo 3‘-konci a dále je rozdělen na fragmenty, které jsou dále vystaveny chemickému působení. Každý z použitých enzymů specificky štěpí DNA v místě rozpoznání jednoho z čtyř dNTPs. Fragmenty ze čtyř reakcí jsou následně uspořádány vedle sebe na polyakrylamidovém gelu a podrobeny elektroforéze. Pro vizualizaci fragmentů je využíván elektroforetogram, ve kterém je gel po ukončení elektroforézy vystaven γ-záření, což způsobí zesvětlení těch částí sekvence DNA, která byla na začátku označena radioaktivním 32P. Výsledkem reakce je tedy soubor fragmentů, jejichž délka by se měla vzájemně lišit o jediný nukleotid.
10
4
SEKVENAČNÍ METODY NOVÉ GENERACE Objev, že jsou různé druhy nemocí zapříčiněny genetickou změnou a zlepšení v oblasti
technologií nukleových kyselin měly velký dopad na oblast „genomické medicíny“. Nicméně běžně užívané sekvenační metody nejsou schopné z důvodu obrovské velikosti lidský genom kompletně přečíst. Chceme-li plně využít možnosti genomiky pro léčení lidí, musíme toto omezení překonat (Wheeler et al., 2008). Použité přístupy vycházející z automatizované Sangerovy metody, v současnosti reprezentované zejména např. přístroji řady ABI3730XL, se však dostaly na maximum kapacitních možností. Další rozvoj sekvencování lidských genomů byl podmíněn vznikem nové, výkonnější a levnější technologie (Pospíšilová et al., 2009). 4.1
Masivně paralelní sekvencování Masivně paralelní sekvencování (podle anglického „Massively Parallel Signature
Sequencing“ = MPSS) je základní sekvenační metoda nové generace, která na základě počtu jednotlivých mRNA molekul, produkovaných každým genem, analyzuje úroveň exprese těchto genů ve vzorku (Brenner et al., 2000). Technologie MPSS řeší dvě zásadní otázky: fyzické oddělení jednotlivých fragmentů nukleových kyselin a vlastní čtení sekvence. První otázka je řešena pomocí emulzní PCR (emPCR) nebo amplifikace ve shlucích. Při emPCR dochází k vytvoření tzv. mikroreaktorů, v nichž jsou uzavřeny všechny potřebné komponenty pro PCR (nukleotidy, enzym polymeráza, primery). Na mikrokuličky je navázaný fragment nukleové kyseliny. Při emPCR dochází ke klonální amplifikaci – všechny molekuly DNA vytvořené v mikroreaktoru pochází z jediné molekuly templátu. Druhá otázka – čtení sekvence – je u dostupných zařízení řešena dvěma metodami: sekvencováním syntézou („sequencing by synthesis“) a sekvencováním založeném na ligaci („ligation based sequencing“) (Pospíšilová et al., 2009). Označené PCR produkty (amplikony) získané z cDNA jsou amplifikovány tak, aby každá příslušná mRNA molekula dávala asi 100 000 amplikonů s jedinečnou značkou. Značky se používají k upevnění amplikonů mikrokuličkami. Po několika kolech ligace sekvence se pomocí restrikční endonukleázy BbvI typu IIs stanovuje posloupnost značek. Na každé kuličce je identifikováno asi 16-20 bp (kvalitní sekvence běžně obsahuje 17 bp). Během jednoho experimentu je získáno až jeden milion sekvencí. Každé označení sekvence (MPSS značka) v datovém souboru MPSS se srovnává se všemi ostatními značkami a identické značky jsou počítány. Úroveň exprese jakéhokoli genu se vypočítá vydělením počtu označení určitého genu celkovým počtem označení pro všechny mRNA, přítomné v datovém souboru. 11
MPSS z různých datových souborů lze vzájemně doplňovat, což znamená, že lze kombinovat datové soubory z více analýz, jejichž vzorek má stejnou počáteční mRNA. MPSS má citlivost na úrovni několika málo molekul mRNA na buňku a datové soubory jsou v digitálním formátu, který zjednodušuje správu a analýzu dat (Brenner et al., 2000). James D. Watson pomocí masivně paralelního sekvencování osekvencoval během dvou měsíců v reakčních nádobách o velikosti pikolitrů až 7,4 násobný nadbytek informací o diploidním genomu jednoho člověka a tato metoda potřebovala přibližně setinu nákladů oproti tradiční kapilární elektroforéze. Srovnání sekvence s genomem vedlo k identifikaci 3,3 milionů jednonukleotidových polymorfismů (z anglického „Single Nucleotide Polymorphisms“ = SNP), z toho 10 654 způsobujících záměnu aminokyseliny (AMK) v kódované sekvenci. Kromě toho byl identifikován malý počet (2-40 000 bp) inzerčních a delečních polymorfismů stejně jako počet rozdílů majících za následek zisk nebo ztrátu chromozomálních segmentů ve velkém měřítku (od 26 000 do 1,5 milionu bp). Výsledky celkově souhlasí s nedávnými výsledky sekvencování jedince tradičními metodami. Kromě toho, že je sekvenční technologie nové generace rychlejší a levnější, zabraňuje i náhodným ztrátám genomické sekvence. V důsledku se vědci snaží získat nové informace o lidském genomu a identifikovat nové geny, které nemohly být dříve zjištěny pomocí tradičního genomového sekvencování (Wheeler et al., 2008). Několik nedávno vyvinutých sekvenačních technologií, jako jsou pyrosekvenace (metoda 454/Roche), Illumina HiSeq a SOLiD, nabízí masivně paralelní produkci krátkých úseků. S použitím těchto technologií je možno izolovat a amplifikovat tisíce až miliony molekul DNA, navázat je na pevný povrch (např. na mikrokuličku nebo na průtokovou kyvetu) a nakonec tyto molekuly souběžně sekvencovat (Morrissy et al., 2009).
12
4.2
Pyrosekvenace (metoda 454/Roche) Pyrosekvenace je jednou z prvních sekvenačních metod nové generace, která se začala
rozvíjet jako alternativa ke klasické Sangerově metodě. Již v roce 1987 P. Nyrén navrhl, jak lze monitorovat aktivitu DNA polymerázy pomocí bioluminiscence. Trvalo téměř jedenáct let, než byla pyrosekvenace sama o sobě uvedena do praxe. V roce 2000 byla založena společnost 454 Life Siences (http://454.com1), která v květnu roku 2005 podepsala smlouvu s Roche Diagnostics. Tato firma měla zajistit sekvenační přístroje a činidla (Jarvie, 2005). Technologie firmy Roche FLX Genome Sequencer (FLX GS) byla první komerčně dostupné zařízení pro masivní paralelní sekvencování (Pospíšilová et al., 2009). V roce 2011 přichází na trh další FLX GS série Titanium, který umožní zlepšení výkonu prodloužením čtecího rámce, který je srovnatelný s kapilární Sangerovou metodou. Tento sekvenátor kombinuje jednotlivé extra dlouhé řetězce s jedinečnými párovými konci o délce 20 kb, 8 kb a 3 kb. Během sekvenace de novo se vytváří vysoce kvalitní uspořádání s větším pokrytím kompletního genomu (http://454.com2). 4.2.1 Postup sekvenační metody 454/Roche Na samém začátku je vzorek genomové DNA rozštěpen do krátkých (300-800 bp) fragmentů. Pro menší vzorky jako např. malé nekódující RNA nebo amplikony PCR není nutná fragmentace. Následuje příprava DNA knihovny. Mezi standardní molekulárně biologické techniky patří specifické připojení krátkých adaptérů A a B na 3´ a 5´-konec každého odděleného úseku DNA. Adaptéry jsou důležité pro čištění, amplifikaci a sekvenaci (http://454.com3). Technologie 454/Roche využívá amplifikaci jednotlivých molekul jednořetězcové nebo dvouřetězcové DNA zachycených na mikrokuličkách o velikosti 28 µm (Jarvie, 2005). Abychom dosáhli toho, že amplifikace fragmentů bude probíhat současně, musíme izolovat jednotlivé mikrokuličky nesoucí DNA v oddělených 100µm vodních kapkách vytvořených prostřednictvím emPCR. Mikrokuličky jsou tedy izolované na emulzi voda-olej. Kapičky hrají roli samostatných mikroreaktorů, ve kterých dochází k paralelní amplifikaci DNA a vyrobení přibližně 107 kopií templátu na mikrokuličku (ve standardní 2ml zkumavce je možné připravit 800 ml emulze obsahující 1,5 milionu kuliček). Každá emulze je beze zbytku aplikována do 8 PCR zkumavek pro amplifikaci (Obr. 2). Po PCR jsou rozbitím emulze získány mikrokapky, které obsahují kuličky fixovaných templátů DNA a dále jsou získány mikrokapky s prázdnými mikrokuličkami. Obvykle se během jedné emPCR vyprodukuje 450 000 mikrokuliček, které obsahují templát, což z celkového počtu činí přibližně 30 %. Obsah připravené emulze závisí na velikosti genomu (Margulies et al., 2005). 13
Dále jsou molekuly DNA na mikrokuličkách ukládány do pikolitrových jamek čipu PicoTiterPlateTM o velikosti 60x60 mm2, který je tvořen optickými vlákny (Jarvie, 2005). Mikrokuličky jsou na čipech tříděny tak, že zajišťují, aby ve většině jamek nebyla více než jedna kulička. Bylo pozorováno, že přibližně ve 2-5 % naplněných jamek je obsaženo dvě a více kuliček. Po zavedení všech mikrokuliček vyprodukovaných během emPCR na každé polovině čipu bylo experimentálně zjištěno, že z celkového počtu jamek došlo k obsazení pouze u 35 %. Tím dochází ke snížení počtu chemických a optických nežádoucích signálů mezi jamkami. K vytvoření individuálních sekvenačních reaktorů jsou do jamek přidávány směsi menších kuliček, které obsahují nadbytek DNA polymerázy, ATP sulfurylázy a luciferázy. Tyto směsi jsou nezbytné k vytvoření světla z volného pyrofosfátu (PPi) (Margulies et al., 2005).
Obr. 2: Fragmentace vzorku, příprava DNA knihovny, vložení mikrokuličky s fragmentem do emPCR a amplifikace úseku. (http://454.com3; převzato a upraveno) Měření genové exprese pomocí pyrosekvenace vyžaduje nezkreslené přečtení cDNA molekuly bez ohledu na délku nebo složení sekvence. Prvním předpokladem pro spolehlivé měření genové exprese na základě absolutní četnosti je přesná identifikace přepisu, který je shodný se čtenou sekvencí (Torres et al., 2008). Pomocí sekvenační technologie Roche/454 jsme schopni sekvencovat minimálně 20 Mb v průběhu čtyř až pěti hodin. Program přístroje pro pyrosekvenaci (the 454 Life Siences) je založen na detekci změny množství PPi, který je uvolňován po polymerázou zprostředkované adici dNTP na volném řetězci. Snímací kamera (z anglického „the charge-coupled device“ = CCD kamera) zachycuje světlo, které je uvolňováno z sekvenační reakce a výsledné signály jsou uspořádány do pořadí (Jarvie, 2005). Vytvořené světlo projde základem optického vlákna snímku a je detekováno velkým formátem CCD kamery (4095×4096 pixelů) (Obr. 3). Mikrokulička obsahující 10 miliónů kopií templátu přitom emituje takové množství světla, že je CCD kamerou zachycováno přibližně 10 000 fotonů na jeden nukleotid začleněný do DNA řetězce. Každým obrazem snímaným CCD kamerou jsou získána data o velikosti až 30 MB (Margulies et al., 2005). 14
Obr. 3: Sekvenační reakce při pyrosekvenaci pomocí přístroje Roche Genome Sequencer. Jedna mikrokulička obsahuje miliony kopií DNA molekul (http://454.com4; převzato). 4.3
Illumina (Solexa) Genome Analyzer Sekvenační přístroj firmy Solexa byl obchodně využit v roce 2006 a o rok později jej
odkoupila firma Illumina. Stejně jako tomu bylo u metody 454/Roche, je princip metody založen na sekvenaci syntézou (Ansorge, 2009). Illumina Genome Analazer dokáže číst velice krátké úseky DNA (většinou jsou úseky DNA dlouhé 36 bp) a byla původně určena pro resekvencování genomu (Farrer et al., 2009). 4.3.1 Postup sekvenace pomocí Illumina Genome Analyzer Při metodě Illumina se DNA knihovna připravuje odlišně, než je tomu u metody 454/Roche (Obr. 4). Vzorek DNA je vložen do nebulizéru, ve kterém je DNA řetězec vlivem stlačeného vzduchu (220,6 kPa po dobu 6 minut) rozdělen na menší fragmenty (Croucher et al., 2009). Délka fragmentů se pohybuje od 0 do 1200 bp. Nebulizace je reprodukovatelná technika, která není závislá na sekvenci DNA a zároveň je rychlá a levná (Quail et al., 2008). Konce fragmentů jsou poté opravovány enzymatickou reakcí obsahující dlouhý Klenowův fragment, T4 polymerázu a polynukleotid kinázu T4. Pomocí Klenowova fragmentu je na 3‘-konec odštěpené DNA připojován adenin. Následně jsou na úseky DNA navázány dva rozdílné adaptéry a prostřednictvím gelové elektroforézy dochází k výběru fragmentů o délce 200-250 bp.
15
Obr. 4: Příprava DNA knihovny. Na odděleném úseku DNA (A) dochází k připojení adeninu (B) a pomocí adaptérů (C) dochází k výběru fragmentů (D) (Ansorge, 2009; převzato a upraveno). Vybrané fragmenty jsou následně amplifikovány v osmnácti cyklech PCR s použitím fúzní DNA polymerázy („phusion polymerase“) (Croucher et al., 2009). Metoda amplifikace, je nazývaná jako „můstková“ (z anglického „bridge“) z toho důvodu, že po přidání enzymů dochází k ohnutí fragmentu (Obr. 5). Tento proces je také nazýván jako tzv. „vytváření shluků“ (z anglického „cluster generation“). Probíhá na amplifikační destičce („the flow cell“) v osmi oddělených liniích, jejichž povrch je pokryt oligonukleotidy komplementárními k oběma typům adaptérů. Dochází ke klonování každého fragmentu knihovny a výsledkem této izotermické amplifikace je sto milionů jedinečných svazků. V závěru můstkové amplifikace dochází na konci každého úseku DNA k navázání primeru.
Obr. 5: Proces amplifikace fragmentů z DNA knihovny. DNA je vkládána na amplifikační destičku (E), kde dochází k vytvoření můstků (F), naklonování úseků DNA (G) a nakonec k navázání příslušného primeru (H) (Ansorge, 2009; převzato a upraveno).
16
Samotná sekvenace všech amplifikovaných částí DNA probíhá najednou v přístroji Illumina Genome Analyzer™ (Obr. 6). Templáty DNA jsou sekvencovány báze po bázi pomocí čtyř odlišných fluorescenčních barviv. Postupně dochází k navázání jednotlivých fluorescenčně značených bází na templát. Po každém kole syntézy jsou shluky detekovány laserem přístroje, který podle určitého fluorescenčního barviva pozná, o kterou bázi se jedná (http://www.giga.ulg.ac.be11).
Obr. 6: Sekvenace v Illumina Genome Analyzeru. Dochází v emisi fluorescenčního světla u první navázané báze (I), která se postupně opakuje až na konec čteného úseku DNA (J). Pomocí laseru dochází k detekci (K) (Ansorge, 2009; převzato a upraveno).
17
4.4
Applied Biosystems (AB) SOLiDTM System Od října roku 2007 je možné sekvencování pomocí technologie AB SOLiDTM. Je využito
jedinečného sekvenačního procesu katalyzovaného DNA ligázou. Zkratka SOLiDTM uvádí, že přístroj této technologie pracuje na principu ligace oligonukleotidů (z anglického „Sequencing by Oligo Ligation and Detection“). Nové modely firmy AB (5500 a 5500xl SOLiDTM System) slibují sekvenaci s přesností nad 99,99 % (http://www.appliedbiosystems.com6). Sekvenační přístroj technologie AB SOLiD přečte řetězce o délce 25-35 bp. Přečtění dat o velikosti 3-4 gigabáze obvykle trvá pět dní (Mardis, 2007). Systém je také schopen přečíst sekvenci až 300 milionů fragmentů o délce dvakrát 50 bází („mate-pairs“), v jednom běhu trvajícím 12-14 dní tak generuje až 30 gigabází (Pospíšilová et al., 2009).
4.4.1
Příprava DNA knihovny a amplifikace U metody SOLiD může příprava DNA knihovny probíhat dvěma způsoby (Obr. 7). První
způsob je příprava tzv. fragmentové DNA knihovny. Po izolaci je DNA rozštěpena na fragmenty o délce 60-90 bp, na jejichž 5‘-konec se naváže 25 bp dlouhý adaptér P1 a na 3‘-konec se naváže stejně dlouhý adaptér P2. Párová neboli „mate-paired“ příprava DNA knihovny probíhá následujícím způsobem. Získané fragmenty jsou odděleny od fragmentu známé délky a následně dochází ligací k začlenění interního adaptéru. Na konce DNA fragmentu jsou taktéž připojovány adaptéry P1 a P2 (Ansorge, 2009).
Obr. 7: Dva způsoby přípravy DNA knihovny technologií AB SOLiD System. Pro přesnější mapování genomu je častěji využívána párová („mate-paired“) DNA knihovna (http://www.appliedbiosystems.com7; převzato a upraveno). K amplifikaci DNA fragmentů dochází obdobně, jako tomu bylo u metody 454/Roche (Obr. 8). DNA úseky se naváží na 1µm mikrokuličky, které jsou následně podrobeny emPCR (Mardis, 2007). V mikroreaktorech jsou obsaženy reakční komponenty PCR, templát, kuličky a 18
primery. Po emPCR dochází k denaturaci šablon a kuličky s amplifikovanými fragmenty jsou odděleny od nežádoucích. Vybrané mikrokuličky podstoupí 3‘-modifikaci, která umožňuje vytvoření kovalentní vazby se snímkem.
Obr. 8: Amplifikace DNA fragmentů pomocí emPCR (http://www.appliedbiosystems.com7; převzato a upraveno). Následně se 3‘ modifikované kuličky ukládají na skleněné sklíčko. Během nanášení mikrokuliček je sklíčko rozdělováno do jedné, čtyř nebo osmi sekcí. Hlavní výhodou tohoto systému je schopnost přijmout zvětšující se počet kuliček na každém snímku, což vede k vyšší úrovni propustnosti (http://www.appliedbiosystems.com7). Sklíčko obsahující mikrokuličky je poté vkládáno do kazety uvnitř sekvenátoru (Mardis, 2007). 4.4.2
Postup sekvenace s metodou AB SOLiDTM System Sekvencování pomocí technologie SOLiDTM se od předchozích dvou metod liší (Obr. 9).
Dochází zde totiž k tzv. sekvenaci ligací (z anglického „sequencing by ligation“), která využívá hybridizaci krátkých fluorescenčně značených sond. Značené sondy jsou definovány prvními dvěma dNTPs (Pospíšilová et al., 2009). V prvním kroku je primer hybridizován s adaptérem, a poté dochází k navázání směsi oligonukleotidových oktamerů. V těchto oktamerech jsou obsaženy dvojice čtvrtých a pátých bází, které jsou charakteristické jednou ze čtyř fluorescenčních barviv na konci oktameru (Ansorge, 2009). Sada fluorescenčně značených dvoufázových sond soutěží o ligaci k sekvenačnímu primeru (Pospíšilová et al., 2009). Po fluorescenční detekci označených bazí jsou oktamery štěpeny za pátou bází, fluorescence je odstraněna, poté může být proces ligace opakován. V druhém kole jsou stanovovány sekvence devět a deset, ve třetím to jsou čtrnáct a patnáct, atd. (Ansorge, 2009). Množství cyklů ligace, detekce fluorescence a štěpení ligovaných sond závisí na požadované délce přečtené sekvence.
19
Obr. 9: Sekvenace pomocí metody SOLiDTM (http://www.appliedbiosystems.com7). K přečtení kompletní sekvence je zapotřebí proces hybridizace a následné ligace zopakovat nejméně pětkrát. Tím, že je každá pozice v sekvenci charakterizována dvěma fluorescenčními signály, dochází k zajištění vyšší spolehlivosti určení báze. Po dosažení požadované délky je nově vzniklý řetězec odstraněn a celý proces se opakuje s novým sekvenčním primerem (Obr. 10, Pospíšilová et al., 2009). Sekvenační proces pokračuje stejným způsobem s použitím primeru, který je kratší o jeden dNTP než předchozí (n-1). V tom případě dochází k posunutí čtecího rámce (budou detekovány báze 3 a 4, 8 a 9, 13 a 14, atd.) (Ansorge, 2009). Postupné obnovování primerů kratších vždy o jeden dNTP (n-2, n-3 a n-4) se opakuje celkem čtyřikrát, což znamená pět kol kompletní sekvenace.
Obr. 10: Proces obnovování primerů (http://www.appliedbiosystems.com7).
20
4.4.3
Dvoubázové dekódování Jedinečná vlastnost sekvenace založené na ligaci a označování oktamerů je
tzv. dvoubázové dekódování (z anglického „two base encoding“), pomocí něhož dokážeme v oktamerech identifikovat dNTP rozdíly a chyby v průběhu analýzy dat (Obr. 11, Mardis, 2007). Prostřednictvím procesu vyměňování primerů je detekována každá báze dvěma různými primery ve dvou nezávislých ligacích. Dvojí detekce je zásadní pro nesrovnatelnou přesnost, kterou se vyznačuje AB SOLiDTM System (http://www.appliedbiosystems.com7).
Obr. 11: Znázornění dvoubázového dekódování a určení genetických změn (Mardis, 2007; převzato a upraveno).
4.5
Sekvenace jednotlivých molekul DNA Technologie, které byly popisovány výše, vyžadují pro dostatečně silný světelný signál
amplifikaci fragmentů DNA. V některých případech může docházet k chybám v sekvenaci, čímž se mění četnost a množství různých fragmentů DNA, které existovaly před amplifikací. Sekvenací jednotlivých molekul DNA je teoreticky možné dosáhnout miniaturizace do řádu nanometrů s minimální spotřebou reagencií. Pro tuto metodu je vyžadován velmi citlivý systém detekce světla, který musí být schopen identifikovat světlo z jediné molekuly barviva (Ansorge, 2009). Přímá detekce jednotlivých molekul DNA není náročnou sekvenační metodou a předpokládá se její dobrá realizovatelnost ve veřejných laboratořích. Pomocí této technologie je umožněna rychlá sekvenace malého množství DNA (Jarvie, 2005) bez nutnosti předchozí amplifikace molekuly DNA, čímž je zařazena do sekvenační skupiny třetí generace (Pettersson et al., 2009). V posledním desetiletí byly vyvinuty techniky pro detekci a analýzu jednotlivých molekul DNA, které obsahují systém pro citlivou detekci jediného fotonu (Ansorge, 2009). V této práci jsem se zaměřila na dvě z nich. 21
4.5.1
Helicos Biosciences HeliScopeTM Braslavsky et al. (2003) publikoval práci o první platformě sekvencování jednotlivých
molekul DNA s názvem HeliScopeTM, která byla vyvinuta společností Helicos Biosciences. Komerčně dostupná se stala až v roce 2007 (Ansorge, 2009), a první objednávka přístroje HeliScopeTM byla uskutečněna na začátku února 2008. V tomto roce bylo očekáváno, že přístroj bude schopen osekvencovat lidský genom za 72 000 USD (Pettersson et al., 2009). Sekvenátor HeliScopeTM pracuje na principu tzv. přesného sekvencování jednotlivých molekul DNA (z anglického „True Single Molecule Sequencing“ = tSMSTM) a dokáže analyzovat mnoho milionů jednotlivých fragmentů DNA současně, což vede k sekvenaci rychlostí až 1 Gb za den. Před samotnou sekvenací se vzorek DNA štěpí na fragmenty o délce 100-200 bp a poté se připojují adaptéry s fluorescenční značkou na polyadeninovém 3‘-koncem (Obr.12, Braslavsky et al., 2003). Denaturované řetězce jsou na 3‘-koncích hybridizovány příslušnými oligonukleotidy a následně uchycovány na povrchu destičky (z anglického „cell-flow“). Destička je schopna zachytit až 100×106 templátů na čtverečním centimetru. Pro sekvenaci je na destičku přidána DNA polymeráza a jeden ze čtyř fluorescenčně značených dNTPs. Polohové souřadnice zachycených řetězců jsou zaznamenány CCD kamerou a před dalším sekvencováním je fluorescenční značení odstraněno a odplaveno (Harris et al., 2008).
Obr. 12: Postup sekvenace metodou HeliScopeTM. Syntéza (1), promytí (2), zobrazení (3) a odštěpení (4) (Tucker et al., 2009; převzato a upraveno).
22
4.5.2
Pacific Biosciences SMRTTM Eid et al. (2009) představil dosud nejnovější platformu NGS, SMRTTM (z anglického
„Single Molecule Real-Time Sequencing“) od společnosti Pacific Biosciences. Systém je srovnatelný se stávajícími laboratorními postupy. Příprava vzorku je jednoduchá a rychlá. Nicméně příprava vzorků je spojena s nákladným vybavením a činidly a je závislá na velkém prostoru laboratoře. Sekvencování pomocí této technologie probíhá v reálném čase a využívá přirozený proces replikace DNA (http://www.pacificbiosciences.com12). Současně probíhá katalyzované začlenění komplementárních fluorescenčně značených dNTPs. Reakce jsou měřeny současně v tisících uspořádaných „neřízených vlnových vedeních“ (z anglického „zero-mode waveguides“ = ZMWs), což jsou dutiny v čipu o průměru 10-50 nm (Gupta, 2008), které mají nanofotonickou strukturu a snižují pozadí fluorescence (Obr. 13). Tím je umožněno použití vysokých koncentrací značených dNTPs potřebných k podpoře rychlého průběhu sekvencování syntézou (Flusberg et al., 2010). Na dně každého ZMW je připojena DNA polymeráza s jednořetězcovou templátovou DNA (Gupta, 2008). Systézou začlěněný dNTP svítí díky laserovému paprsku, který zprostředkovává osvětlení malého množství detekované DNA.
Obr. 13: Příprava na sekvenaci v ZMW čipu. Templátová molekula DNA je navázána na dně na DNA polymerázu, která je zespodu osvětlována laserovým světlem (Eid et al., 2009; převzato).
23
Detekce fluorescence je ukončena po rozštěpení fluoroforu, který je spojený s nukleotidovým koncovým fosfátem, na polymeráze (Flusberg et al., 2010). Vzhledem k tomu, že je fluorofor připojován k fosfátové skupině, musí dojít k jeho rozštěpení a vypuštění ještě před dalším začleněním dNTP (Obr. 14). Tento proces umožňuje začleňování dNTPs v rychlosti deseti bází za sekundu, což vede k detekci tisíce dNTPs během několika minut (Gupta, 2008).
Obr. 14: Schematické znázornění sekvenace bází s navázaným fluorescenčním barvivem a fosfátovém konci. Komplementární označený dNTP se naváže na templát (1), čímž způsobuje zvýšení fluorescence na odpovídající barevný kanál (2). Fosfodiesterová formace uvolní pyrofosfát, který se šíří z ZMW a ukončuje fluorescenční impuls (3). DNA polymeráza se přemístí na další pozici (4), a tak dochází k dalšímu navázání dNTP (5) (Eid et al., 2009; převzato).
24
5
VYUŢITÍ NGS V NÁDOROVÉ GENETICE ČLOVĚKA Sekvenační metody nové generace se v posledních letech začaly využívat k sekvencování
v nádorové genetice. Je zvažováno i následné využití v klinické genetice člověka u různých typů onemocnění. Sekvenátory nové generace mohou být využity i pro mnoho dalších aplikací. Významné uplatnění mají například v metagenomice, která se zabývá genomickými analýzami patogenů a umožňuje definovat tzv. mikrobiom člověka. Dále jsou tyto technologie využitelné pro analýzy DNA-proteinových interakcí včetně detekce vazebných DNA sekvencí proteinů po chromatinové imunoprecipitaci – tzv. „CHIP-seq“, proto mohou být velmi přínosné při hledání malých nekódujících RNA, zejména microRNA (Pospíšilová et al., 2009). V této práci jsem se zaměřila na sekvencování v nádorové genetice člověka. 5.1
Podstata vzniku rakoviny Stratton et al. (2009) se domnívá, že všechny druhy rakoviny sdílejí společnou
patogenezi. Každý druh je výsledkem procesu Darwinovy evoluční teorie, která předpokládá, že v samotných buňkách mnohobuněčného organismu je zabudován kód jeho postupného vývoje. Rozvoj rakoviny je založen na dvou základních procesech. První je plynulé získávání dědičného genetického rozdílu v jednotlivých buňkách, mezi které patří i náhodné mutace. Druhý je přirozený výběr působící na výslednou fenotypovou rozdílnost. Stejně jako všechny buňky, které tvoří lidské tělo, je nádorová buňka přímým potomkem linie mitotického buněčného dělení oplodněného vajíčka, a proto nese kopii jeho diploidního genomu. Nicméně sekvence DNA rakovinné buňky tak získala i soubor rozdílů jejího předka, které jsou souhrnně nazývány jako somatické mutace kvůli rozlišení od zárodečných mutací, které se dědí z rodičů a jsou předávány potomkům. 5.2
Chronická myeloidní leukémie V roce 1890 sledoval německý biolog David von Hasemann odlišnou strukturu mitóz
v buňkách karcinomu a jako první upozornil na fakt, že rakovina může být geneticky podmíněná choroba. V následujících šedesáti letech nedošlo k žádnému významnému objevu v oblasti rakovinového výzkumu. S příchodem cytogenetické analýzy chromozomů prošel výzkum genetiky rakoviny revolučním obdobím. Po objevení Philadelphského chromozomu u pacientů s chronickou myeloidní leukémií (CML) Nowellem a Hungerfordem v roce 1960 prošla studie chromozomálních abnormalit u karcinomu zásadním zvratem. Následné zjištění, že Philadelpský chromozom, který je specifický pro CML, je způsoben balancovanou translokací 25
mezi chromozomy č. 9 a 22, neumožnilo pouze diagnostický test (test chromozomálních přestaveb). Toto zjištění nakonec vedlo k rozvoji cílené terapie u CML, protože fúzní gen vytvořený translokací je prvním krokem k mutaci, která vede ke vzniku karcinomu. Karyotypové metody, používané k identifikaci t(9;22), připravily půdu pro objevy dalších chromozomálních translokací. V roce 1970 a 1980 vedly tyto metody také k lepším výsledkům v léčbě mnoha pacientů. K nedávnému pokroku v objevu genů rakoviny došlo až po zavedení nových technologií DNA sekvencování. Můžeme uvést příklad objevu genů, po jejichž mutaci dochází ke vzniku karcinomu. V posledních padesáti letech je téma sekvencování genů rakoviny stále aktuální a identifikace genetických změn, které vedou k vývinu rakoviny, urychlí objevení nových léčebných postupů (Walter et al., 2009). 5.3
Rakovina prsu Karcinom prsu je u žen po celém světě nejčastěji diagnostikovaným typem rakoviny,
která končí smrtí. Zvýšený výskyt rakoviny prsu byl pozorován v západních zemích na konci osmdesátých let dvacátého století a pravděpodobně vyplývá ze změn reprodukčních faktorů (užívání postmenopauzální hormonální terapie). V roce 2008 představovala z celkového počtu nových případů rakoviny 23 % (1,38 milionu lidí). Nejvyšší výskyt tohoto typu rakoviny můžeme nalézt v západní Evropě, Severní Americe a v Austrálii. Díky včasnému rozpoznání pomocí mamografie došlo k výraznému snížení úmrtnosti (Jemal et al., 2011). Vysoký výskyt rakoviny prsu předurčují zděděné mutace genů BRCA1 a BRCA2, které u více jak 80 % žen představují celoživotní riziko. Genetické testování těchto mutací se stalo nedílnou součástí klinických vyšetření u žen s těžkou rodinnou dispozicí. Nicméně až u 50 % pacientek se zděděnými mutacemi genů BRCA1 a BRCA2 nemají blízké příbuzné s karcinomem prsu, protože je zdědily parentálně. Proto je užitečné analyzovat více genů, jejichž mutace mohou být zodpovědné za dědičné predispozice k tomuto typu rakoviny. Mutační spektra těchto genů zahrnují SNP, vložení malých fragmentů DNA, delece a velké genomové přestavby zahrnující více kilobází. Detekce mutací založená na nových sekvenačních metodách musí být přesná a efektivní, aby mohla být použita v klinické diagnostice (Walsh et al., 2010). Walsh et al. (2010) použil pro sekvenaci rakovinového genomu Illumina Genome Analyzer a přesně identifikoval delece v genech BRCA1 a BRCA2, jejichž velikosti se pohybovaly v rozmezí 1–19 bp. Standardní test se skládá ze sekvencování DNA obou genů a stojí 3 340 USD. Pokud je testování negativní (tj. wild type), jsou testy prováděny u dalších podezřelých genů pouze selektivně (Walsh a King, 2007). 26
5.4
Sekvencování rakoviny Několik nedávných studií dokládá, že kombinací PCR a Sangerovy metody sekvencování
je možné dokázat přítomnost mutací v genomu nádoru. Přestože studie, které používají tuto metodu, jsou zaměřeny na omezený počet genů a úspěšnou identifikaci klíčových somatických mutací v genomu rakoviny. Tato metoda byla nedávno použita i k charakterizaci stovky genů jako jsou například exony, které kódují známé bílkoviny. Nejvýznamnější dopad sekvenačních metod nové generace na genom rakoviny má schopnost jej analyzovat a porovnat s normálním genomem u jednoho pacienta. Díky výrazně snížené ceně a zvýšené výkonnosti je nyní možné sekvencovat vzorky několika pacientů s určitým typem rakoviny (Mardis a Wilson, 2009). Mnohem přesnější genetická klasifikace rakoviny je umožněna pomocí nastupujících sekvenačních metod nové generace, díky nimž lze současně identifikovat všechny strukturální chromozomální abnormality a specifické genové mutace v genomu rakoviny. Mnoho nebo dokonce všechny z metod mohou být chápány jako krok vpřed v osobní léčbě. Sekvenační metody nové generace můžeme ocenit také po finanční stránce, protože před jejich zavedením byly náklady na sekvencování celého genomu mimo dosah jakékoliv laboratoře či instituce. Asi před pěti lety stálo osekvencování celého genomu téměř 90 milionů USD. S příchodem nových technologií tato cena klesla přibližně na 100 000 USD a další pokles se očekává v blízké budoucnosti. Náklady na sekvencování celého genomu jsou vysoké, protože lidský druh nemůžeme záměrně křížit, jak je tomu možné u laboratorních zvířat. Výsledkem je, že každý člověk má 3-4 miliony sekvenčních rozdílů a stovky rozdílů v počtu kopií, které musí být posouzeny z hlediska jejich možného příspěvku do fenotypu rakoviny. Kromě toho, že se lidský genom vyskytuje v mnoha různých variantách, se ve vzorku tkáně vyskytuje zároveň normální genom i genom nádoru a v každém vzoru se musí určit, zda se jedná o genomickou variantu vrozenou nebo získanou. Vzhledem k tomu, že očekáváme heterozygotní somatické mutace, musí být obě alely rovněž odebírány na každém místě v genomu k získání dostatečného rozsahu pro objev mutace. MPSS je v současné době metodou, kterou využívá většina genomových center a používá se pro zjištění všech genomových změn, které by mohly být významné pro rakovinnou patogenezi. Pro vyjádření části genomu ve vzorku se také provádí sekvenace traskriptomu a představuje tak důležitý doplněk k sekvencování celého genomu (Walter et al., 2009).
27
6
ETICKÉ ASPEKTY CELOGENOMOVÉHO SEKVENCOVÁNÍ Dalo by se říci, že MPSS je rychle postupující metoda a je velmi pravděpodobné, že
v blízké budoucnosti se bude řadit do rutinních klinických aplikací. Nicméně, MPSS, a to zejména sekvencování celého geonomu, vyvolává řadu důležitých etických otázek, které musí být zodpovězeny ještě před rutinním klinickým provedením (Tucker et al., 2009). Etické normy se neustále zkoumají a v souvislosti celogenomového sekvencování existují tři důležité aspekty, které mohou mít vliv na etické problémy. Za prvé jsou tyto metody používány společně s rostoucím ukládáním vzorků a informací, které se konají v rámci projektů, ve velkých mezinárodních konsorciích nebo v biologických bankách. Identifikace jedince je možná nejen v rámci jedné databáze, ale i spojením dohromady s několika zdroji informací (genomické, zdravotní, sociální,…). Nové zdroje vznikají propojením existujících souborů dat nebo vytvořením nových biomedicínských zdrojů. Za druhé, s vývojem většího zpřístupnění se sdílení dat stává klíčovým prvkem vědní politiky. Investoři výzkumných pracovníků požadují uložení dat nově financovaných projektů a stále se předpokládá, že by údaje měly být sdíleny. Stále častěji jsou výzkumná data sdílená v rámci neformálních prostředků nebo ukládání do archívů, které jsou přístupné mnoha výzkumníkům. Přímá identifikace jednotlivce, rodiny nebo skupiny se tím pádem stává ještě snadnější. A za třetí jsou genetické metody používány v sociálním kontextu. Nastávají zde obavy ze ztráty
soukromí
a
neoprávněného
použití
poskytnutých
informací
o
pacientovi.
Demokratizace biologických technologií znamená, že jednotlivec má větší přístup ke genetické informaci pacienta. Tyto aspekty nelze ignorovat, protože mají eventuální vliv na lékařský výzkum, který by v případě nepříznivé události mohl ztratit důvěru a podporu veřejnosti. A ta je pro lékařský výzkum nezbytná. S použitím nových sekvenačních metod je třeba zvážit řadu etických otázek jako je informovaný souhlas, zveřejnění výsledků výzkumu, ochrana soukromí a provádění experimentální analýzy na dětech (Kaye et al., 2010).
28
6.1
Informovaný souhlas Již koncem devatenáctého století bylo zvykem, že před chirurgickým zákrokem lékař
žádal pacienta o souhlas s operací. První zákonný záznam napsal soudce Benjamin Cardoza z Nejvyššího soudu New Yorku a pochází z roku 1914: „… každá lidská bytost dospělého věku a zdravé mysli má právo určit, co bude děláno s jejím vlastním tělem.“ (Nicholson, 2000). Informovaný souhlas se ve vědeckém výzkumu začal objevovat v polovině dvacátého století. Souhlas původně vznikl v rámci biomedicínského výzkumu a zahrnoval i možnost dobrovolného odstoupení z výzkumu. Spíše než na shromažďování osobních údajů o vyšetřované osobě byl informovaný souhlas zaměřen na ochranu účastníků před možnými fyzickými škodami, které mohly nastat při klinickém zákroku nebo odběru vzorků. V genetickém výzkumu je výskyt fyzických škod méně častý, proto je souhlas směřován k zajištění ochrany osobních údajů. V genomice se kromě souhlasu určeného pro jednotlivce navíc používají souhlasy zaměřené na rodinu či skupiny obyvatelstva. V rámci tohoto faktu by měli být rodinní příslušníci zařazováni do diskuzí, ve kterých budou seznámeni s podrobným postupem výzkumu (např. v genetickém poradenství). V tomto okruhu výzkumu je velmi obtížné získat informovaný souhlas pro sekundární výzkum. Řešením problému se stalo použití širokého souhlasu, což je souhlas pro celou řadu výzkumných použití. Tento souhlas ale ohrožuje základní zásady lékařského výzkumu a právo na soukromí. Proto by jednotlivci měli být předem informováni a musí mít možnost si vybrat, jak bude zacházeno s jejich osobními údaji. 6.2
Informace o výsledcích výzkumu Informování pacienta a veřejnosti o výsledcích výzkumu lze považovat za důležitou
součást budování a udržování důvěry. Účastníkům jsou poskytnuty informace o obecných poznatcích výzkumu ve formě vědeckých publikací. Nicméně v oblasti celogenomového sekvencování je tento fakt velice sporný. Zveřejnění výsledků genomických studií je komplikováno řadou faktorů. K užitečnému klinickému objevu dochází pouze ve výjimečných případech a technologie používané v oblasti výzkumu neodpovídají standardu, který by byl nutný pro klinické ověření. Mnoho objevů celogenomových sekvenačních metod identifikovalo genetické varianty, které jsou odpovědné za velmi malé zvýšení rizika onemocnění (Kaye et al., 2010). Vliv genetických faktorů na rozvoj multifaktoriálních chorob dospělého věku (např. diabetu, hypertenze či kardiovaskulárních onemocnění) se dle současných znalostí pohybuje v řádu jednotek procent. Zavádějící interpretace výsledku může vyšetřované traumatizovat neodůvodněnými obavami, nebo naopak falešně uklidnit a vést k vyšší náchylnosti k rizikovým aktivitám, jako je např. kouření (http://www.tribune.cz13). V takových případech je 29
třeba určit, zda se nový poznatek vztahuje i na ostatní členy rodiny a eventuálně jej zveřejnit (Kaye et al., 2010). Kromě toho je třeba zdůraznit fakt, že publikované studie byly provedeny v různých
populacích
a pro
tu
naši,
českou,
zatím
obdobné
studie
neexistují
(http://www.tribune.cz13). 6.3
Otázka vyšetřování dětí Všechny výše uvedené etické problémy komerčně nabízeného prediktivního genetického
testování exponenciálně narůstají v případě testování dětí. To odporuje všem oficiálním stanoviskům zahraničních společností lékařské genetiky. Evropská společnost lékařské genetiky (ESHG) a Evropská komise jednoznačně doporučují prediktivní genetické testování dětí odsunout do věku, kdy je pacient schopen pochopit aspekty genetického testování a svobodně se rozhodnout, zda si testování přeje. Výjimku tvoří pouze onemocnění s nástupem v dětském věku nebo ta onemocnění, u kterých je znám vliv časného zahájení účinné prevence či léčby. Důvodem doporučení ESHG je časově omezená autonomie nezletilých (od adolescence či 18 let), kdy za ně plně rozhodují jejich zákonní zástupci. To může vést k diskriminaci (pozitivní i negativní) v rámci rodiny, která může projevit přehnaným zájmem nebo naopak nezájmem rodičů, vedoucích až k ovlivňování takových závažných rozhodnutí, jako je výběr životní profese, zájmů apod. Dalším důvodem proti je i neschopnost nezletilých kontrolovat zachování důvěrnosti dat získaných genetickým testováním. Zde existuje riziko celoživotní psychické a sociální stigmatizace na základě porušení důvěrnosti a v důsledku špatné interpretace výsledků (uchovávání výsledků v dokumentaci dětského lékaře bez zajištění omezeného přístupu, případně jejich přetlumočení vzdělávacím zařízením nebo ústní šíření rodiči v rámci rodiny). Všechny tyto důvody poměrně jednoznačně hovoří proti prediktivnímu testování nezletilých (http://www.tribune.cz13).
30
7
ZÁVĚR Pomocí sekvenačních metod jsme schopni charakterizovat řadu typů rakoviny
na genomové úrovni. Detekce mutací, aberací a somatických přestaveb je nyní možné provést již za několik týdnů. S použitím MPSS budeme schopni přehodnotit několik aspektů týkajících se vzniku
rakovinného
genomu.
Tato
technologie
nabízí
jedinečnou
příležitost
přejít
k prognostickým klasifikačním systémům funkční genomové taxonomie, která je založena na genetických aberacích, zapříčiňujících specifické druhy rakoviny. Nově získané informace o genetických změnách nám mohou pomoci lépe pochopit podstatu vzniku rakovinových buněk. Díky těmto informacím bychom mohli být schopni posunout vývoj léčby rakoviny a jiných geneticky podmíněných onemocnění opět kousek dopředu. Nevyřešeným problémem stále zůstává otázka rychlosti a finanční nákladnosti sekvenačních metod. V posledních třiceti letech byla Sangerova metoda velice používanou sekvenační metodou. Cena za osekvencování lidského genomu touto metodou ale činí 10 000 000 USD. S nástupem technologie MPSS došlo ke snížení ceny a zvýšení rychlosti sekvenace kompletního genomu. Cena za sekvencování genomu neustále klesá. Původní rozpočet na projekt lidského genomu dokončeného v roce 2001 činil 3 miliardy USD. Nyní se cena pohybuje v řádu stovek tisíc Kč za jeden genom. Velký tlak na redukci nákladů na sekvencování a nová technická řešení je vyvíjen v souvislosti s probíhajícím projektem 1000 genomů a lze předpokládat, že v horizontu několika let bude možno sekvencovat lidské genomy řádově desítky za tisíc Kč (Pospíšilová et al., 2009). Jako motivací pro všechny vědce zabývající se sekvencováním celého genomu je od roku 2004 soutěž Archon Genomic X PRIZE. Týmy soutěží o prvenství v sestavení přístroje pro sekvenaci sta lidských genomů během deseti dnů a méně s přesností max. jedné chyby v 100 000 osekvencovaných bázích. Tým, kterému se podaří tento přístroj sestavit a navíc dokáže, že cena sekvenace nepřesáhne 10 000 USD za jeden lidský genom, obdrží cenu 10 000 000 USD (http://genomics.xprize.org10). Doposud se ještě žádnému týmu nepodařilo vyhrát hlavní cenu. Surovým datovým výstupem NGS, který se dále bioinformaticky zpracovává je videosekvence snímků pořízených v závislosti na časové ose, tedy 3D datový formát. Tím se liší od tradičních sekvenačních metod, jejichž konečným výstupem byla jednorozměrná sekvence i od technologie mikročipů typu aCGH, které konečný výsledek sekvenace zobrazují do dvourozměrného obrazu. Vývoj technologií NGS můžeme tedy chápat jako logický krok vpřed.
31
8
POUŢITÁ LITERATURA
Ansorge, W. J. 2009. Next-generation DNA sequencing techniques. New Biotechnology. 25: 195-203. Braslavsky, I., Hebert, B., Kartalov, E. and Quake, S. R. 2003. Sequence information can be obtained from single DNA molecules. The Proceedings of the National Academy of Sciences. 100: 3960-3964. Brenner, S., Johnson, M., Bridgham, J., Golda, G., Lloyd, D. H., Johnson, D., Shujun, L., McCurdy, S., Foy, M., Ewan, M., Roth, R., George, D., Eletr, S., Albrecht, G., Vermaas, E., Williams, S. R., Moon, K., Burcham, T., Pallas, M., DuBridge, R. B., Kirchner, J., Fearon, K., Jen-i, M. and Corcoran, K. 2000. Gene expression analysis by massively parallel signature sequencing (MPSS) on microbead arrays. Nature Biotechnology. 18: 630-634. Croucher, N. J., Fookes, M. C., Perkins, T. T., Turner, D. J., Marguerat, S. B., Keane, T., Quail, M. A., Miao, H., Assefa, S., Bähler, J., Kingsley, R. A., Parkhill, J., Bentley, S. D., Dougan, G. and Thomson, N. R. 2009. A simple method for directional transcriptome sequencing using Illumina technology. Nucleic Acids Research. 37: e148. Eid, J., Fehr, A., Gray, J., Khai, L., Lyle, J., Otto, G., Peluso, P., Rank, D., Baybayan, P., Bettman, B., Bibillo, A., Bjornson, K., Chaudhuri, B., Christians, F., Cicero, R., Clark, S., Dalal, R., deWinter, A., Dixon, J., Foquet, M., Gaertner, A., Hardenbol, P., Heiner, Ch., Hester, K., Holden, D., Kearns, G., Xiangxu, K., Kuse, R., Lacroix, Y., Lin, S., Lundquist, P., Congcong, M., Marks, P., Maxham, M., Murphy, D., Park, I., Thang, P., Phillips, M., Roy, J., Sebra, R., Shen, G., Sorenson, J., Tomaney, A., Travers, K., Trulson, M., Vieceli, J., Wegener, J., Wu, D., Yang, A., Zaccarin, D., Zhao, P., Zhong, F., Korlach, J. and Turner, S. 2009. Real-Time DNA sequencing from single polymerase molecules. Science. 323: 133-138. Farrer, R. A., Kemen, E., Jones, J. D. G. and Studholme, D. J. 2009. De novo assembly of the Pseudomonas syringae pv. syringae B728a genome using Illumina/Solexa short sequence Real. FEMS Microbiology Letters. 291: 103-111.
32
Flusberg, B. A., Webster, D., Lee, J., Travers, K., Olivares, E., Clark, T. A., Korlach, J. and Turner, S. W. 2010. Direct detection of DNA methylation during single-molecule, real-time sequencing. Nature Methods. 7: 461-465. Gregory, S. G., Barlow, K. F., McLay, K. E., Kaul, R., Swarbreck, D., Dunham, A., Scott, C. E., Howe, K. L., Woodfine, K., Spencer, C. C. A., Jones, M. C., Gillson, C., Searle, S., Zhou, Y., Kokocinski, F., McDonald, L., Evans, R., Phillips, K., Atkinson, A., Cooper, R., Jones, C., Hall, R. E., Andrews, T. D., Lloyd, C., Ainscough, R., Almeida, J. P., Ambrose, K. D., Anderson, F., Andrew, R. W., Ashwell, R. I. S., Aubin, K., Babbage, A. K., Bagguley, C. L., Bailey, J., Beasley, H., Bethel, G., Bird, C. P., Bray-Allen, S., Brown, J. Y., Brown, A. J., Buckley, D., Burton, J., Bye, J., Carder, C., Chapman, J. C., Clark, S. Y., Clarke, G., Clee, C., Cobley, V., Collier, R. E., Corby, N., Coville, G. J., Davies, J., Deadman, R., Dunn, M., Earthrowl, M., Ellington, A. G., Errington, H., Frankish, A., Frankland, J., French, L., Garner, P., Garnett, J., Gay, L., Ghori, M. R. J., Gibson, R., Gilby, L. M., Gillett, W., Glithero, R. J., Grafham, D. V., Griffiths, C., Griffiths-Jones, S., Grocock, R., Hammond, S., Harrison, E. S. I., Hart, E., Haugen, E., Heath, P. D., Holmes, S., Holt, K., Howden, P. J., Hunt, A. R., Hunt, S. E., Hunter, G., Isherwood, J., James, R., Johnson, C., Johnson, D., Joy, A., Kay, M., Kershaw, J. K., Kibukawa, M., Kimberley, A. M., King, A., Knights, A. J., Lad, H., Laird, G., Lawlor, S., Leongamornlert, D. A., Lloyd, D. M., Loveland, J., Lovell, J., Lush, M. J., Lyne, R., Martin, S., Mashreghi-Mohammadi, M., Matthews, L., Matthews, N. S. W., McLaren, S., Milne, S., Mistry, S., Moore, M. J. F., Nickerson, T., O'Dell, C. N., Oliver, K., Palmeiri, A., Palmer, S. A., Parker, A., Patel, D., Pearce, A. V., Peck, A. I., Pelan, S., Phelps, K., Phillimore, B. J., Plumb, R., Rajan, J., Raymond, C., Rouse, G., Saenphimmachak, C., Sehra, H. K., Sheridan, E., Shownkeen, R., Sims, S., Skuce, C. D., Smith, M., Steward, C., Subramanian, S., Sycamore, N., Tracey, A., Tromans, A., Van Helmond, Z., Wall, M., Wallis, J. M., White, S., Whitehead, S. L., Wilkinson, J. E., Willey, D. L., Williams, H., Wilming, L., Wray, P. W., Wu, Z., Coulson, A., Vaudin, M., Sulston, J. E., Durbin, R., Hubbard, T., Wooster, R., Dunham, I., Carter, N. P., McVean, G., Ross, M. T., Harrow, J., Olson, M. V., Beck, S., Rogers, J. and Bentley, D. R. 2006. The DNA sequence and biological annotation of human chromosome 1. Nature. 441: 315-321. Gupta, P. K. 2008. Single-molecule DNA sequencing technologies for future genomics research. Trends in Biotechnology. 26: 602-611.
33
Harris, T. D., Buzby, P. R., Babcock, H., Beer, E., Bowers, J., Braslavsky, I., Causey, M., Colonell, J., Dimeo, J., Efcavitch, J. W., Giladi, E., Gill, J., Healy, J., Jarosz, M., Lapen, D., Moulton, K., Quake, S. R., Steinmann, K., Thayer, E., Tyurina, A., Ward, R., Weiss, H. and Xie, Z. 2008. Single-molecule DNA sequencing of a viral genome. Science. 320: 106-109. The International Human Genome Mapping Consortium 2001. A physical map of the human genome. Nature. 409: 934-941. Jarvie, T. 2005. Next generation sequencing technologies. Drug Discovery Today: Technologies. 2: 255-260. Jemal, A., Bray, F., Center, M. M., Ferlay, J., Ward, E. and Forman, D. 2011. Global Cancer Statistics. A Cancer Journal of Clinicians. 61: 69-90. Kaye, J., Boddington, P., de Vries, J., Hawkins, N. and Melham, K. 2010. Ethical amplications of the use of whole genome methods in medical research. European Journal of Human Genetics. 18: 398-403. King, R. C., Stansfield, W. D. and Mulligan, P. K. 2006. A dictionary of genetics (7th Ed.). Oxford Uneversity Press, New York. Mardis, E. R. 2007. The impact of next-generation sequencing technology on genetics. Trends in Genetics. 24: 133-141. Mardis, E. R. and Wilson, R. K. 2009. Cancer genome sequencing: a review. Human Molecular Genetics. 18: 163-168. Margulies, M., Egholm, M., Altman, W. E., Attiya, S., Bader, J. S., Bemben, L. A., Berka, J., Braverman, M. S., Yi-Ju, Ch., Zhoutao, Ch., Dewell, S. B., Lei, D., Fierro, J. M., Gomes, X. V., Goodwin, B. C., Wen, H., Helgesen, S., Chun, H. H., Irzyk, G. P., Jando, S. C., Alenquer, M. L. I., Jarvie, T. P., Jirage, K. B., Jong-Bum, K., Knight, J. R., Lanza, J. R., Leamon, J. H., Lefkowitz, S. M., Ming, L., Jing, L., Lohman, K. L., Hong, L., Makhijani, V. B., McDade, K. E., McKenna, M. P., Myers, E. W., Nickerson, E., Nobile, J. R., Plant, R., Puc, B. P., Ronan, M. T., Roth, G. T., Sarkis, G. J., Simons, J. F., Simpson, J. W., 34
Srinivasan, M., Tartaro, K. R., Tomasz, A., Vogt, K. A., Volkmer, G. A., Wang, S. H., Yong, W., Weiner, M. P., Pengguang, Y., Begley, R. F. and Rothberg, J. M. 2005. Genome sequencing in open microfabricated high density picoliter reactors. Nature. 437: 376-380. Maxam, A. M. and Gilbert, W. 1977. A new method for sequencing DNA. The Proceedings of the National Academy of Sciences. 74: 560-564. Morrissy, A. S., Morin, R. D., Delaney, A., Zeng, T., McDonald, H., Jones, S., Yongjun, Z., Hirst, M. and Marra, M. A. 2009. Next-generation tag sequencing for cancer gene expression profilig. Genome Research. 19: 1825-1835. Nicholson, R. H. 2000. Evidence to the independent inquiry into clinical trials in North Staffordshirre. Bullettin of Medical Ethics. (London). 13-19. Nyrén, P. 1987. Enzymatic method of continuous monitoring of DNA polymerase activity. Analytical Biochemistry. 167: 235–238. Pettersson, E., Lundeberg, J. and Ahmadian, A. 2009. Generations of sequencing technologies. Genomics. 93: 105-111. Pospíšilová, Š., Tichý, B. a Mayer, J. 2009. Sekvenování lidského genomu – technologie nové generace aneb budeme rutinně sekvenovat lidské genomy?. Časopis lékařů českých. 148: 296-302. Quail, M. A., Kozarewa, I., Smith, F., Scally, A., Stephens, P. J., Durbin, R., Swerdlow, H. and Turner, D. J. 2008. A large genome centre’s improvements to the Illumina sequencing system. Nature Methods. 5: 1005-1010. Rosypal, S., Doškař, J., Pantůček, R., Kailerová, J., Relichová, J., Růţičková, V., Šmarda ml., J., Šmarda, J. a Štěpán, J. 2001. Terminologie molekulární biologie (první vydání). Rosypal, Brno.
35
Sanger, F., Nicklen, S. and Coulson, A. R. 1977. DNA sequencing with chain-terminating inhibitors. The Proceedings of the National Academy of Sciences. 74: 5463-5467. Stratton, M. R., Campbell, P. J. and Futreal, P. A. 2009. The cancer genome. Nature. 458: 719-724. Torres, T. T., Metta, M., Ottenwälder, B. and Schlötterer, Ch. 2008. Gene expression profiling by massively parallel sequencing. Genome Research. 18: 172-177. Tucker, T., Marra, M. and Friedman, J. M. 2009. Massively parallel sequencing: The next big thing in genetic medicine. The American Journal of Human Genetics. 85: 142-154. Venter, J. C., Adams, M. D., Myers, E. W., Li, P. W., Mural, R. J., Sutton, G. G., Smith, H. O., Yandell, M., Evans, Ch. A., Holt, R. A., Gocayne, J. D., Amanatides, P., Ballew, R. M., Huson, D. H., Wortman, J. R., Zhang, Q., Kodira, Ch. D., Zheng, X. H., Chen, L., Skupski, M., Subramanian, G., Thomas, P. D., Zhang, J., Miklos, G. L. G., Nelson, C., Broder, S., Clark, A. G., Nadeau, J., McKusick, V. A., Zinder, N., Levine, A. J., Roberts, R. J., Simon, M., Slayman, C., Hunkapiller, M., Bolanos, R., Delcher, A., Dew, I., Fasulo, D., Flanigan, M., Florea, L., Halpern, A., Hannenhalli, S., Kravitz, S., Levy, S., Mobarry, C., Reinert, K., Remington, K., Abu-Threideh, J., Beasley, E., Biddick, K., Bonazzi, V., Brandon, R., Cargill, M., Chandramouliswaran, I., Charlab, R., Chaturvedi, K., Deng, Z., Di Francesco, V., Dunn, P., Eilbeck, K., Evangelista, C., Gabrielian, A. E., Gan, W., Ge, W., Gong, F., Gu, Z., Guan, P., Heiman, T. J., Higgins, M. E., Ji, R.-R., Ke, Z., Ketchum, K. A., Lai, Z., Lei, Y., Li, Z., Li, J., Liang, Y., Lin, X., Lu, F., Merkulov, G. V., Milshina, N., Moore, H. M., Naik, A. K., Narayan, V. A., Neelam, B., Nusskern, D., Rusch, D. B., Salzberg, S., Shao, W., Shue, B., Sun, J., Wang, Z. Y., Wang, A., Wang, X., Wang, J., Wei, M.-H., Wides, R., Xiao, Ch., Yan, Ch., Yao, A., Ye, J., Zhan, M., Zhang, W., Zhang, H., Zhao, Q., Zheng, L., Zhong, F., Zhong, W., Zhu, S. C., Zhao, S., Gilbert, D., Baumhueter, S., Spier, G., Carter, Ch., Cravchik, A., Woodage,´T., Ali, F., An, H., Awe, A., Baldwin, D., Baden, H., Barnstead, M., Barrow, I., Beeson, K., Busam, D., Carver, A., Center, A., Cheng, M. L., Curry, L., Danaher, S., Davenport, L., Desilets, R., Dietz, S., Dodson, K., Doup, L., Ferriera, S., Garg, N., Gluecksmann, A., Hart, B., Haynes, J., Haynes, Ch., Heiner, Ch., Hladun, S., Hostin, D., Houck, J., Howland, T., Ibegwam, Ch., Johnson, J., Kalush, F., Kline, L., Koduru, S., Love, A., Mann, F., May, D., McCawley, S., McIntosh, T., McMullen, 36
I., Moy, M., Moy, L., Murphy, B., Nelson, K., Pfannkoch, C., Pratts, E., Puri, V., Qureshi, H., Reardon, M., Rodriguez, R., Rogers, Y.-H., Romblad, D., Ruhfel, B., Scott, R., Sitter, C., Smallwood, M., Stewart, E., Strong, R., Suh, E., Thomas, R., Tint, N. N., Tse, S., Vech, C., Wang, G., Wetter, J., Williams, S., Williams, M., Windsor, S., Winn-Deen, E., Wolfe, K., Zaveri, J., Zaveri, K., Abril, J. F., Guigo, R., Campbell, M. J., Sjolander, K. V., Karlak, B., Kejariwal, A., Mi, H., Lazareva, B., Hatton, T., Narechania, A., Diemer, K., Muruganujan, A., Guo, N., Sato, S., Bafna, V., Istrail, S., Lippert, R., Schwartz, R., Walenz, B., Yooseph, S., Allen, D., Basu, A., Baxendale, J., Blick, L., Caminha, M., CarnesStine, J., Caulk, P., Chiang, Y.-H., Coyne, M., Dahlke, C., Mays, A. D., Dombroski, M., Donnelly, M., Ely, D., Esparham, S., Fosler, C., Gire, H., Glanowski, S., Glasser, K., Glodek, A., Gorokhov, M., Graham K., Gropman, B., Harris, M., Heil, J., Henderson, S., Hoover, J., Jennings, D., Jordan, C., Jordan, J., Kasha, J., Kagan, L., Kraft, Ch., Levitsky, A., Lewis, M., Liu, X., Lopez, J., Ma, D., Majoros, W., McDaniel, J., Murphy, S., Newman, M., Nguyen, T., Nguyen, N., Nodell, M., Pan, S., Peck, J., Peterson, M., Rowe, W., Sanders, R., Scott, J., Simpson, M., Smith, T., Sprague, A., Stockwell, T., Turner, R., Venter, E., Wang, M., Wen, M., Wu, D., Wu, M., Xia, A., Zandieh, A. and Zhu, X. 2001. The sequence of the human genome. Science. 291: 1304-1351. Walter, M. J., Graubert, T. J., DiPersio, J. F., Mardis, E. R., Wilson, R. K. and Ley, T. J. 2009. Next-generation sequencing of cancer genomes: back to the future. Per Med. 6: 653. Walsh, T. and King, M. C. 2007. Ten genes for inherited breast cancer. Cancer Cell. 11: 103-105. Walsh, T., Lee, M. K., Casadei, S., Thornton, A. M., Stray, S. M., Pennil, Ch., Alex S. Nord, A S., Mandell, J. B., Swisher, E. M. and King, M.-C. 2010. Detection of inherited mutations for breast and ovarian cancer using genomic capture and massively parallel sequencing. PNAS. 107: 12629–12633. Watson, J. D. and Crick, F. H. C. 1953. Molecular structure of nucleic acids. Nature. 171: 737-738. Wheeler, D. A., Srinivasan, M., Egholm, M., Shen, Y., Chen, L., McGuire, A., Wen, H., YiJu, Ch., Makhijani, V., Roth, G. T., Gomes, X., Tartaro, K., Niazi, F., Turcotte, C. L., 37
Irzyk, G. P., Lupski, J. R., Chinault, C., Xing-zhi, S., Yue, L., Ye, Y., Nazareth, L., Xiang, Q., Muzny, D. M., Margulies, M., Weinstock, G. M., Gibbs, R. A. and Rothberg, J. M. 2008. The complete genome of an individual by massively parallel DNA sequencing. Nature. 452: 872-876.
Elektronické zdroje http://454.com1: http://454.com/about-454/index.asp [cit. 2011-04-22] http://454.com2: http://454.com/products-solutions/future-of-454-sequencing.asp [cit. 2011-04-22] http://454.com3: http://454.com/products-solutions/how-it-works/index.asp [cit. 2011-04-22] http://454.com4: http://454.com/products-solutions/how-it-works/sequencing-chemistry.asp [cit. 2011-04-22] http://9e.devbio.com5: http://9e.devbio.com/article.php?ch=2&id=32 [cit. 2011-04-20] http://www.appliedbiosystems.com6: http://www.appliedbiosystems.com/absite/us/en/home/applications-technologies/solid-nextgeneration-sequencing/next-generation-systems.html [cit. 2011-04-22] http://www.appliedbiosystems.com7: http://www.appliedbiosystems.com/absite/us/en/home/applications-technologies/solid-nextgeneration-sequencing/next-generation-systems/solid-sequencing-chemistry.html [cit. 2011-04-22]
38
http://www.bio.davidson.edu8: http://www.bio.davidson.edu/Courses/Molbio/MolStudents/spring2003/Obenrader/sanger_metho d_page.htm [cit. 2011-04-22] http://www.genomesonline.org9: http://www.genomesonline.org/cgi-bin/GOLD/bin/gold.cgi http://genomics.xprize.org10: http://genomics.xprize.org/archon-x-prize-for-genomics/prize-overview [cit. 2011-04-22] http://www.giga.ulg.ac.be11: http://www.giga.ulg.ac.be/jcms/prod_26859/illumina-genome-analyser-sequencing-technologyhow-it-works [cit. 2011-04-22] Mitchelson, K. R. New high throughput technologies for DNA sequencing and genomics. Elsevier
[online]. 2007, 1th
Ed.
[cit.
2011-04-22], s.
381. Dostupný
z
WWW:
. ISSN 1871-0069. http://www.pacificbiosciences.com12: http://www.pacificbiosciences.com/smrt-biology/smrt-technology [cit. 2011-04-22] http://www.tribune.cz13: http://www.tribune.cz/clanek/11442-hrozi-diskreditace-lekarske-genetiky [cit. 2011-04-22]
39