ENBIK 2014
Od sekvencí k chromozómům: výzkum repetitivní DNA rostlin v Laboratoři molekulární cytogenetiky BC AVČR
Jiří Macas Biologické centrum AVČR Ústav molekulární biologie rostlin České Budějovice
Biology Centre ASCR, České Budějovice, Czech Republic
Rostliny se liší velikostí svých jaderných genomů Brachyscome dichromo-somatic a 2n = 4
Fritillaria sp. 2n = 24
Myriophyllum spicatum 2n =1 4
Selaginella kraussiana 2n = 40
Equisetum variegatum 2n ~ 216
Rostliny se liší velikostí svých jaderných genomů
A. thaliana 130 Mbp Genlisea nigrocaulis 86 Mbp
Fritillaria (lilie) >100,000 Mbp
rýže 420 Mbp
bob 13,000 Mbp hrách 4,100 Mbp
ječmen 4,800 Mbp
člověk (3,200 Mbp)
Geny tvoří jen malou část genomu; většinu jaderné DNA představují opakující se sekvence (repetitivní DNA)
Podíl repetitivní DNA roste s velikostí genomu rostlin Proportion of transposable elements (TE) in plant genomes differing in size
Tenaillon, Hollister and Gaut (2010)
Vlivem repetic jsou genomy rostlin velké a z velké části neznámé
?
Repetitivní DNA
Tandemové repetice
Mobilní elementy (transpozóny)
Repetitivní DNA Sekvence, které se v genomu opakují v desítkách až milionech kopií Repetitivní DNA tvoří podstatnou část genomů vyšších rostlin (až > 90% jaderné DNA) a způsobuje většinu rozdílů ve velikostech genomů Na základě uspořádání v genomu se repetice dělí na tandemové a rozptýlené Nejde o zcela náhodně vznikající sekvence, ale o skupiny genetických elementů sdílejících určité mechanizmy vzniku a množení v genomu
Tandemové repetice
Mobilní elementy (transpozóny)
Má repetitivní DNA v genomu nějakou funkci ?
Má repetitivní DNA v genomu nějakou funkci ?
selfish elements, parasitic DNA ?
Má repetitivní DNA v genomu nějakou funkci ?
selfish elements, parasitic DNA ? structural / functional regions of chromosomes telomeres centromeres
telomere Pisum sativum
Centromeric repeats in rice (Oryza sativa)
(Macas et al., 2007) CentO CRR chromosome CentO (satellite)
CRR (retrotransposon)
(Cheng et al., 2002)
Má repetitivní DNA v genomu nějakou funkci ?
selfish elements, parasitic DNA ? structural / functional regions of chromosomes telomeres centromeres generation of allelic diversity knockout of genes by transposon insertion
Cell 60: 115-122, 1990
changes in gene expression patterns
Ac/Ds transposon
Feschotte (2008) Nat.Rev. Genet.
SBEI gene
Vlivem repetic jsou genomy rostlin velké a z velké části neznámé
?
Sekvenování genomů rostlin
klasické sekvenování
Sekvenování genomů rostlin
= Nová generace sekvenačních technologií drasticky zlevnila a zrychlila sekvenování
Sekvenování genomů rostlin
Analýza dat Nová generace sekvenačních technologií drasticky zlevnila a zrychlila sekvenování
Laboratoř molekulární cytogenetiky rostlin, BC AVČR Bioinformatics:
Development of novel tools for repeat analysis from NGS data
Bioinformatics: Next generation sequencing:
Repeat analysis in various genomes
Illumina 454/Roche PacBio Petr Novák Jiří Macas Pavel Neumann
Jiří Macas Petr Novák Pavel Neumann
Repetitive DNA Cytogenetics:
Centromeres:
In situ hybridizations and immunodetection
Sequence composition; epigenetics; determination
Wet-lab techniques:
Pavel Neumann Jasper Manning Iva Fuková
Verification of bioinformatic results; cloning, plant transformation, etc... Andrea Koblížková Iva Fuková
Iva Fuková Jasper Manning Pavel Neumann
RepeatExplorer pipeline Bioinformatics:
Development of novel tools for repeat analysis from NGS data
Petr Novák Jiří Macas Pavel Neumann
Laboratoř molekulární cytogenetiky rostlin, BC AVČR Bioinformatics:
Development of novel tools for repeat analysis from NGS data
Bioinformatics: Next generation sequencing:
Repeat analysis in various genomes
Illumina 454/Roche PacBio Petr Novák Jiří Macas Pavel Neumann
Jiří Macas Petr Novák Pavel Neumann
Charakterizace repetitivní DNA v různých druzích rostlin Repeat type:
Ty3/gypsy Ty1/copia Satellite DNA rDNA other/unknown
cluster size (% of reads)
pea (Pisum sativum)
1C = 4,300 Mb
cluster size (% of reads)
soybean (Glycine max) 1C = 1,115 Mb
Macas et al. (2007) BMC Genomics 8: 427.
cumulative % of reads
Charakterizace repetitivní DNA v různých druzích rostlin Repeat type:
Ty3/gypsy Ty1/copia Satellite DNA rDNA other/unknown
cluster size (% of reads)
pea (Pisum sativum)
1C = 4,300 Mb
Prospero autumnale
1C = 4,400 Mb
cumulative % of reads
Charakterizace repetitivní DNA v různých druzích rostlin Repeat type:
Ty3/gypsy Ty1/copia Satellite DNA rDNA other/unknown
Genlisea hispidula
1C = 1,550 Mb
Genlisea nigrocaulis 1C =
In collaboration with I. Schubert, IPK Gatersleben
86 Mb
cumulative % of reads
Laboratoř molekulární cytogenetiky rostlin, BC AVČR Bioinformatics:
Development of novel tools for repeat analysis from NGS data
Bioinformatics: Next generation sequencing:
Repeat analysis in various genomes
Illumina 454/Roche PacBio Petr Novák Jiří Macas Pavel Neumann
Jiří Macas Petr Novák Pavel Neumann
Cytogenetics: In situ hybridizations and immunodetection
Iva Fuková Jasper Manning Pavel Neumann
Pohlavní a B-chromozómy rostlin Silene latifolia (2n = 22A + XX/XY)
Relative proportions of reads in repeat clusters (Illumina WGS reads from male + female plants)
XY (male)
equal proportions
XX (female)
Macas et al. (2011) PLoS ONE 6
Laboratoř molekulární cytogenetiky rostlin, BC AVČR
Centromerická varianta histonu H3 (CENH3)
Centromeres:
Sequence composition; epigenetics; determination
Pavel Neumann Jasper Manning Iva Fuková
Identifikace centromerických repetic pomocí ChIP-seq Illumina seq. (36 nt reads)
Outline of the experiment Pisum sativum Isolation of nuclei, digestion with micrococcal nuclease
Chromatin immunoprecipitation with CenH3 antibody
DNA isolation (“ChIP”)
DNA isolation (“INPUT”)
Sequencing 9.5 mil. reads
Sequencing 20 mil. reads
Mapping reads to clusters of long (>100nt) reads, calculating ratio of ChIP / INPUT Cluster = repeat family
Identifikace centromerických repetic pomocí ChIP-seq Illumina seq. (36 nt reads)
Outline of the experiment Pisum sativum Isolation of nuclei, digestion with micrococcal nuclease
Chromatin immunoprecipitation with CenH3 antibody
DNA isolation (“ChIP”)
DNA isolation (“INPUT”)
Sequencing 9.5 mil. reads
Mapping reads to clusters of long (>100nt) reads, calculating ratio of ChIP / INPUT
Sequencing
Cluster = repeat family
20 mil. reads
100.00
ChIP / input
10.00
1.00
Satellites ●
TR_11 PisTR-B
●
0.10 0
100
200
300 cluster no.
400
500
600
Laboratoř molekulární cytogenetiky rostlin, BC AVČR Bioinformatics:
Development of novel tools for repeat analysis from NGS data
Bioinformatics: Next generation sequencing:
Repeat analysis in various genomes
Illumina 454/Roche PacBio Petr Novák Jiří Macas Pavel Neumann
Jiří Macas Petr Novák Pavel Neumann
http://w3lamc.umbr.cas.cz Cytogenetics:
Centromeres:
In situ hybridizations and immunodetection
Sequence composition; epigenetics; determination
Wet-lab techniques:
Pavel Neumann Jasper Manning Iva Fuková
Verification of bioinformatic results; cloning, plant transformation, etc... Andrea Koblížková Iva Fuková
Iva Fuková Jasper Manning Pavel Neumann