variabilita genomu Nature
genetická diverzita člověka na úrovni SNP je nízká: asi 0.1% Science
cca. 90% variace je uvnitř populací cca. 10% mezi populacemi (kontinenty)
bottleneck
personal genomes James Watson Craig Venter Marjolein Kriek Afričané, Číňané, Korejci, Japonci, genomy nádorů PGP-10 George Church George Church, professor of genetics, Harvard Medical School. Misha Angrist, scientific editor at the Duke Institute for Genome Sciences and Policy in Durham. Keith Batchelder, CEO at Genomic Healthcare Strategies. Esther Dyson, investor and adviser to multiple technology firms. Rosalynn Gill-Garrison, chief science officer at Sciona. John Halamka, chief information officer at Harvard Medical School. Stanley Lapidus, chief executive officer of Helicos. Kirk Maxey, president of Cayman Chemical. James Sherley, stem cell researcher and associate professor, formerly of MIT. individual #10
1000 Genomes (~2500) Wellcome Trust Sanger Institute in Hinxton, England, Beijing Genomics Institute Shenzhen in China, NIH National Human Genome Research Institute (NHGRI)
2001: 2 genomy 2009: 10 genomů 2010: 3,000 genomů 2011: 30,000 genomů
modifikováno podle http://www.nature.com/news/2010/101027/pdf/4671026a.pdf
sekvenování nové generace
fragmentace DNA
ligace adaptorů, denaturace
annealing fragmentů na partikule
vytvoření emulze
emulzní PCR, denaturace
zachycení partikulí v pikotitrační desce
pyrosekvenace a detekce záblesků
pyrosekvenace a detekce záblesků DNA(n) + dNTP (polymeráza) DNA(n+1) + PPi APS + PPi (sulfuryláza) ATP ATP + luciferin (luciferáza) oxyluciferin + dNTP, ATP (apyráza) dNDP, dNMP, ADP, AMP, Pi
A
T
G
T
G
C
A
T
G
AA
T
GG
C
A
A
T
G
G
C
sekvenování nové generace 2nd generation: s amplifikací DNA 3rd generation: sekvenace jednotlivých molekul DNA
454/Roche http://www.454.com/ Solexa/Illumina http://www.illumina.com/ SOLiD/ABI http://www.appliedbiosystems.com/ Helicos http://www.helicosbio.com/ Pacific Biosciences http://www.pacificbiosciences.com/ Complete Genomics http://www.completegenomicsinc.com/ http://www.youtube.com/watch?v=77r5p8IBwJk http://www.youtube.com/watch?v=kYAGFrbGl6E&NR=1
sekvenování exomů - po "exon capture"
další využití sekvenování nové generace genomy nádorů
RNA seq genová exprese, malé RNA (miRNA) chromatin immunoprecipitation (ChIP) seq metagenomika, mikrobiomy fetální DNA v mateřské krvi
základní typy mutací ATG ACC CAG CAG CCA ATG AAA Met Thr Gln Gln Pro Met Lys
normální sekvence čtecí rámec je označen mezerami
▼ ATG CCC CAG CAG CCA ATG AAA Met Pro Gln Gln Pro Met Lys
bodová substituce typu missense (threonin je nahrazen prolinem)
▼ ATG ACC TAG CAG CCA ATG AAA Met Thr STOP -
bodová substituce typu nonsense (předčasné ukončení syntézy proteinu)
▼ ATG ACA CAG CAG CCA ATG AAA Met Thr Gln Gln Pro Met Lys
tichá substituce (threonin je kódován jiným kodonem)
▼▼▼ ATG --- CAG CAG CCA ATG AAA Met - Gln Gln Pro Met Lys
delece bez posunu čtecího rámce (chybí jedna aminokyselina)
▼ ATG -CCC AGC AGC CAA TGA AA Met Pro Ser Ser Gln STOP -
delece s posunem čtecího rámce (jiné aminokyseliny + předčasná terminace)
▼▼▼ ▼▼▼ ▼▼▼ ATG ACC CAG CAG CAG CAG CAG CCA ATG AAA Met Thr Gln Gln Gln Gln Gln Pro Met Lys
expanze trinukleotidové repetice (vložen polyglutaminový úsek) dynamické mutace
základní typy polymorfismů DNA polymorfismus typu SNP (Single Nucleotide Polymorphism) ▼ ATGCCCCAGCAGCCAAT ▼ ATGCCCTAGCAGCCAAT
chromozóm (jedinec) A chromozóm (jedinec) B tři možné genotypy
polymorfismus typu STR (Short Tandem Repeat) ▼ ▼ ▼ ▼ ▼ ▼ ▼
ATGCCCCACACACACACACAGAAA
alela A
▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼
ATGCCCCACACACACACACACAGAAA
alela B
▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼
ATGCCCCACACACACACACACACACAGAAA
alela C mnoho možných genotypů
typy variability bodové substituce: SNP, bodové mutace malé delece a inserce krátké tandemové repetice polymorfismy typu STR, VNTR dynamické mutace (zejm. expanze trinukleotidů)
polymorfní inserce retroelementů velké strukturální varianty: delece, duplikace, inverze (SV - Structural Variants, CNV - Copy Number Variants) většinou submikroskopické přes 10 tis. lokusů, medián několik kb mikrodelečním syndromy často v oblastech segmentálních duplikací
referenční sekvence genomu = ? klinická interpretace CNV = ?
velké fragmenty
střední fragmenty
malé fragmenty
Southernova metoda restrikční štěpení DNA (pondělí/úterý)
gelová elektroforéza (úterý/středa)
hybridizace se sondou (čtvrtek/pátek)
blotting na membránu (středa/čtvrtek)
autoradiografie (pátek/pondělí, nebo déle)
Southern 1975 Northern Western
denaturace DNA
hybridizace primerů (annealing) (mají délku kolem 20 bází) vstup do dalšího cyklu syntéza nové DNA termostabilní polymerázou
PCR Polymerase Chain Reaction
Mullis 1985
po proběhnutí dvou cyklů se jedna molekula DNA zmnoží na čtyři po proběhnutí jednoho cyklu se jedna molekula DNA zmnoží na dvě
po proběhnutí n cyklů se jedna molekula DNA zmnoží na 2n molekul
základní typy polymorfismů DNA polymorfismus typu SNP (Single Nucleotide Polymorphism) ▼ ATGCCCCAGCAGCCAAT ▼ ATGCCCTAGCAGCCAAT
chromozóm (jedinec) A chromozóm (jedinec) B tři možné genotypy
polymorfismus typu STR (Short Tandem Repeat) ▼ ▼ ▼ ▼ ▼ ▼ ▼
ATGCCCCACACACACACACAGAAA
alela A
▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼
ATGCCCCACACACACACACACAGAAA
alela B
▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼
ATGCCCCACACACACACACACACACAGAAA
alela C mnoho možných genotypů
? 3/4
3/3
2/3
1/3
1/2
1/1
M
?
M
800
300 200
378
4
4
308
3
3
238
2
2
168
1
1
100
identifikace osob
paternita jednolokusové sondy
jednolokusové sondy
multilokusové sondy
multilokusové sondy Pemberton & Amos Trends Genet 1990
polymorfismus x mutace ~ varianta definice: polymorfismus nad 1% x mutace pod 1% ale DF508 ~ 1.5% (nosiči CF 1/25, mutace CF 1/50, z toho DF508 70%)
98 95
polymorfismus x mutace ~ varianta neutralita x nepříznivý vliv pro nositele ale projev alely (polymorfismu či mutace) může záviset na prostředí, na genotypu a frekvence polymorfismu/mutace může odrážet selekční tlaky v minulosti, které se dnes již nemusí projevovat
výhoda heterozygotů závislost na genotypu (heterozygot, homozygot) závislost na prostředí (černoši v Americe)
polymorfismus x mutace ~ varianta alela původní (ancestrální) x alela nově vzniklá (“mutací”) nelze se opřít o dnešní frekvenci, ancestrální alela může být z populace odstraněna
persistence laktázy
Jobling, Hurles, Tyler-Smith: Human Evolutionary Genetics
persistence laktázy x intolerance laktózy i kulturní prostředí může určovat, který genotyp je výhodný a který ne
sestřihové mutace 1
2
3
4
5
6
7
8
9
5
6
7
8
9
GT AG 1
2
3
4
GT AT
syndrom sousedících genů (contiguous gene syndrome)
hot-spots pro variabilitu dinukleotid CG (CpG): meCG mutuje na TG tandemové repetice: sklouznutí při replikaci (slippage) rozptýlené repeaty: rekombinace mezi nealelními kopiemi ATG ACG CAG CAG CCC CCT ATG AAA Met Thr Gln Gln Pro Pro Met Lys ▼ ATG ATG CAG CAG CCC CCT ATG AAA Met Met Gln Gln Pro Pro Met Lys ▼ ATG ACG CAG CAG CCC CTA TGA AA Met Thr Gln Gln Pro Leu STOP ▼▼▼ ▼▼▼ ▼▼▼ ATG ACG CAG CAG CAG CAG CAG CCC CCT ATG AAA Met Thr Gln Gln Gln Gln Gln Pro Pro Met Lys
vzorky 1-4: úplná komplementarita, sonda hybridizuje
1
2
3
4
vzorek 5: neúplná komplementarita, sonda nehybridizuje
5
alelově specifická hybridizace hybridizace s alelově specifickými oligonukleotidy (ASO)
1
2
3
4
DNA čipové technologie: paralelní hybridizace s mnoha oligonukleotidy (nebo delšími klonovanými sondami) rozmístěnými hustě na pevném podkladu
5
DNA čipové technologie: resekvenace
5´
GCGGCATGAACCGTAGGCCCATC 3´ 3´
5´
GCCGTACTTGGAATCCGG GCCGTACTTGGCATCCGG GCCGTACTTGGGATCCGG GCCGTACTTGGTATCCGG GCCGTACTTGG-ATCCGGG CCGTACTTGGCATCCGGG CCGTACTTGGCCTCCGGG CCGTACTTGGCGTCCGGG CCGTACTTGGCTTCCGGG CCGTACTTGGC-TCCGGGT
del
3´CCGCGTGTCTCATTCTCT 5´
3´CCGCGTGTCTCCTTCTCT 5´
3´CCGCGTGTCTCGTTCTCT 5´
3´CCGCGTGTCTCTTTCTCT 5´
3´CCGCGTGTCTC-TTCTCTT 5´
5´CGGCGCACAGAGGAAGAGAATCTCCGCAAG 3´ 5´CGGCGCACAGAGGAAGAGAATCTCCGCAAG 3´
T
G C
A
3´CCGCGTGTCTCATTCTCT 5´
3´CCGCGTGTCTCCTTCTCT 5´
3´CCGCGTGTCTCGTTCTCT 5´
3´CCGCGTGTCTCTTTCTCT 5´
3´CCGCGTGTCTC-TTCTCTT 5´
del T
G C
A
del
3´CCGCGTGTCTCATTCTCT 5´
3´CCGCGTGTCTCCTTCTCT 5´
3´CCGCGTGTCTCGTTCTCT 5´
3´CCGCGTGTCTCTTTCTCT 5´
3´CCGCGTGTCTC-TTCTCTT 5´
5´CGGCGCACAGAGGAAGAGAATCTCCGCAAG 3´ 5´CGGCGCACAGAGAAAGAGAATCTCCGCAAG 3´
T
G C
A
3´CCGCGTGTCTCATTCTCT 5´
3´CCGCGTGTCTCCTTCTCT 5´
3´CCGCGTGTCTCGTTCTCT 5´
5´GCGCACAGAGAAAGAGAATC 3´ 3´CCGCGTGTCTCTTTCTCT 5´
3´CCGCGTGTCTC-TTCTCTT 5´
del T
G C
A
homozygot pro normální sekvenci (GAA = Glu) 5´CGGCGCACAGAGGAAGAGAATCTCCGCAAG 3´ 5´CGGCGCACAGAGGAAGAGAATCTCCGCAAG 3´
del
T
G
C
A
heterozygot pro mutovanou sekvenci (GAA = Glu / AAA = Lys) 5´CGGCGCACAGAGGAAGAGAATCTCCGCAAG 3´ 5´CGGCGCACAGAGAAAGAGAATCTCCGCAAG 3´
del
T
G
C
A
www. affymetrix.com
G G CAC A G A G A AA G AGA A C G T del
heterozygot pro mutovanou sekvenci TP53 (kodon 286: GAA = Glu / AAA = Lys)
3´
neznačená testovaná DNA
T
TTCTCTTAGAGGCGTTCTT
extenze oligonukleotidu zakotveného v buňce čipu o jeden značený dideoxynukleotid
5´
homozygot pro normální sekvenci (286 GAA (Glu)) 5´CGGCGCACAGAGGAAGAGAATCTCCGCAAG 3´ 5´CGGCGCACAGAGGAAGAGAATCTCCGCAAG 3´
červený fluorescenční signál v buňce B
heterozygot pro mutovanou sekvenci (286 AAA (Lys)) 5´CGGCGCACAGAGGAAGAGAATCTCCGCAAG 3´ 5´CGGCGCACAGAGAAAGAGAATCTCCGCAAG 3´
červený + modrý fluorescenční signál v buňce B
286 Glu/Glu
286 Glu/Lys
GERMLINE p53 MUTATION IN FAMILY 7 Glu286Lys (exon 8)
FAMILY 7
* *
proven carrier proven non-carrier
childhood cancer
2
I. 1
* pancreatic cancer (47y)
breast cancer (50y)
II.1
wild type G A G G A A G A G 286 285 287 Glu Glu Glu
2
* thyroid cancer (18y)
III.1
III.1 blood 2
* rhabdomyosarcoma (3y) non-Hodgkin lymphoma B (7y)
G G A G A A A G A G 285 286 287 Glu Glu Glu Lys
normální DNA
CGH comparative genome hybridisation
DNA nádoru
DNA čipové technologie: počet kopií v genomu (copy number) array CGH
normální DNA
DNA nádoru
G C A C A G C G A A T G G G A C G G T G A A C C A C G 17p 17q
fluorescenční in situ hybridizace (FISH)