Van monogeen naar multifactorieel: 2ontwikkelingen in de moleculaire genetica
2 MTI Onderwijs Ziekteleer 2002 Koppelingsonderzoek
Richard Sinke Divisie Medische Genetica Universitair Medisch Centrum Utrecht
Richard Sinke
11 februari 2002
11 februari 2002
Divisie Medische Genetica
Divisie Medische Genetica
Waarom?
Uitdaging voor humane genetici • De moleculaire basis van complex genetische ziektes ontrafelen, door: + De genen die betrokken zijn bij de pathogenese van de ziektes identificeren + Gen-gen en gen-omgevings interacties te leren begrijpen
Ontwikkelen van nieuwe geneesmiddelen
Nieuwe therapieen
Vroeg diagnostiek Preventie
1
Hoe? Expression profiling
m od el le n
Kandidaat genen
Di er
no Ge
om
re sc
Ontwikkelen therapie
?
s en
Positional cloning
Individuele behandeling (farmacogenetica) farmacogenetica)
1
Positional Cloning Families met genetische ziekte
Koppelings onderzoek
Sibpaar studie
Inzicht in gen functie
Gen localisatie
Gen identificatie & mutatie analyse
Positional cloning
1
Divisie Medische Genetica
1
11 februari 2002
Blad 1
Genetische variatie Voorwaarden voor positional cloning: 1. Voldoende en goed gekarakteriseerd familie materiaal 2. DNA markers verspreid door het hele humane genoom (genetische variatie)
Genetische variatie op DNA niveau: • veel meer dan verwacht wordt op grond van eiwit data • is meestal neutraal + geldt m.n voor niet-coderend DNA (95%) De analyse van genetische variatie draagt bij aan: • populatie genetica & historie • genetische evolutie theorie • moleculaire mechanismes van mutatie • bepalen van positie en volgorde van genen in het humane genoom = koppelingsonderzoek
of linkage analyse
1
1
Genetische loci
Genetische loci (genen of DNA markers): > zijn lineair langs chromosomen gerangschikt
Gedurende 1e meiotische deling:
> loci die op hetzelfde chromosoom gelegen zijn worden ook vaak samen doorgegeven -> segregatie is niet willekeurig, als gevolg van genetische koppeling
• uitwisseling van chromsoom fragmenten tussen homologe chromosomen = crossing-over • gevolg: loci gelegen op hetzelfde chromosoom worden niet altijd samen doorgegeven. Dit hangt af van: • de genetische afstand tussen de twee loci • de recombinatie frequentie
1
1
Koppelingsonderzoek (1) In de mens is koppelingsonderzoek pas mogelijk gebleken na de ontdekking (Kan & Dozy, 1978) en de toepassing van (neutrale) DNA polymorfismes (Botstein et al., 1978)
Eerste genetische kaarten in Drosophila door Morgan. 1 cM komt overeen met 1% recombinatie 1% recombinatie = 1 cross-over / 100 meioses 6 globaal: 1 cM = 10 bp humane genoom ~ 3300 cM
Werkhypothese Botstein en collega’s: • DNA polymorfismes gebruiken om een complete linkage map van het hele humane genoom te maken • linkage map stelt je vervolgens in staat om ieder Mendeliaans-overervende aandoening te localiseren. Dit stelt je in staat tot: • diagnostiek (pre- en postnataal) • klonering van het bijbehorende gen middels ‘positional cloning’
1
Divisie Medische Genetica
1
11 februari 2002
Blad 2
Koppelingsonderzoek (2)
Randvoorwaarden: • voldoende variatie in het DNA om de twee homologe chromosomen van elkaar kunnen worden onderscheiden
Formeel:
•eiwit polymorfismes -> alleen coderend DNA (~ 5%) •DNA polymorfismes -> coderend en niet-coderend DNA
• families testen voor de mate waarin crossing-over (recombinatie) plaatsvindt tussen twee loci
•families; voldoende en voldoende groot •‘gezonde’ families -> linkage map van het humane genoom; bepalen van positie en afstand van DNA markers (CEPH) 1987 - Donis-Keller et al.: 403 markers (393 RFLP’s) 1996 - Dib et al.: 5264 markers (CA-repeats)
•‘zieke’ families met een duidelijk overervingspatroon (AD, AR, Xgebonden) -> gebruiken om een bepaald ziektegen te localiseren t.o.v. een van de DNA markers
• ziektelocus en polymorfe DNA marker • recombinatie frequentie <50% is aanwijzing voor genetische koppeling
• een grote familie of meerdere kleinere
1
1
Hoe doe je dat?:
Genetische variatie
•DNA van iedere persoon analyseren met DNA markers •Genotypes vaststellen (de allelen van een marker op de twee afzonderlijke homologe chromosomen) •Hypothese testen: HO = 50% recombinatie, HA < 50% recombinatie
• Eiwit / enzym variatie + in coderend gebied (5 - 15%)
•Loci die op verschillende chromosomen gelegen zijn, of ver van elkaar op hetzelfde chromosoom vertonen 50% recombinatie Dus: geen koppeling tussen ziektelocus en DNA marker: recombinatie fractie/frequentie (θ) = 0.5 •Loci die genetisch gekoppeld zijn vertonen minder dan 50% recombinatie: koppeling tussen ziektelocus en DNA marker: recombinatie fractie < 50%; 0 < θ < 0.5
• DNA variatie (i.e. DNA polymorfismes) + Ook buitend coderend gebied (100%) + Kan gebruikt worden voor gen lokalisatie studies en positional cloning! + DNA markers maken om DNA polymorfismes zichtbaar
•HO verwerpen bij een lodscore van +3 of hoger -> HA aannemen = genetische koppeling
1
1
DNA markers
1. Restriction fragment length polymorphism (RFLP): • puntmutatie geeft aanleiding tot verlies van restrictie site • frequent (iedere paar kb?) • detecteerbaar m.b.v. Southern blot analyse • laag informatief (heterozygositeit < 35%)
3. Simple tandem repeat polymorphism (STRP): • variatie in aantal repeat units (2, 3, 4 of 5 bp) • frequent (iedere 20 - 50 kb) • detecteerbaar m.b.v. PCR • hoog informatief (heterozygositeit ~ 70%)
2. Variable number of tandem repeat (VNTR): • variatie in aantal repeat units (> 50 bp in grootte) • m.n. frequent aan telomeren • detecteerbaar m.b.v. Southern blot analyse • zeer informatief (heterozygositeit ~ 100%)
4. Single nucleotide polymorphism (SNP): • puntmutatie • zeer frequent (iedere 100 bp) • detecteerbaar m.b.v. DNA chips • laag informatief (heterozygositeit < 35 %)
1
Divisie Medische Genetica
1
11 februari 2002
Blad 3
Erfelijke ziektes
STR - simple tandem repeat marker
• • • • • •
Allel 1
CACACACACA
Allel 2
CACACACA
• Veel goed gekarakteriseerde ziektes + monogeen + zeldzaam (< 0.001%) • Veel-voorkomende ziektes met een genetische component + Complex of multifactorieel -> geen duidelijk overervingspatroon! + frequent (tot 10% van de populatie) + 2/3 van alle mensen zal hieraan overlijden
Evenredig verspreid door het genoom; 1 / 50 kb; > 60.00 in het humane genoom Repeat = 1-5 bp in lengte Meest bekende is CA-repeat Heterozygositeit > 70% Detectie m.b.v. PCR (polymerase kettingreactie) Primer sequenties beschikbaar via internet
1
1
Rett syndroom en andere monogene ziektes Z z A a
z z a a
Z z A a
Eén gen is noodzakelijk EN voldoende om de ziekte te veroorzaken
Z z A a
Z z a a
z z a a
z z A a
z z a a
1
Z z A a
z z a a
Z z A a
Z z A a
Z a
genotype 1:
z a
z a
1
z z A a
gameten status
z a
ZA/za ZA NR
Za R
zA R
za NR
2:
Za/zA
ZA R
Za NR
zA NR
za R
bij random 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 segregatie -> Kans van R = θ, kans van NR = 1−θ z z a a
Bepaal fase: hoort Z bij A of hoort Z bij a? Met 100% zekerheid vast te stellen bij 3 generaties. Anders zijn er twee mogelijkheden: ZA/za en Za/zA
1
Divisie Medische Genetica
1
11 februari 2002
Blad 4
Lodscore berekening
fase Z Stel: z z z is ZA/za A a a a genotype gameten statusZ z
Z z z z A aZA/za a a ZA
Za
waarschijnlijkheid van koppeling, θ < 0. 5 zA
Lodscore = Log10
za
waarschijnlijkheid geen koppeling, θ = 0. 5
Z NR z zR z R z NR z A a A a RA aNR a a NR NR Observering: 1 recombinant, 3 niet-recombinanten
Voorbeeld met 3 NR (1−θ) en 1 R (θ); θ = 0.25:
= 25% recombinatie, θ = 0.25
1−θ∗ 1−θ∗ 1−θ∗ θ
Lodscore
= Log10 θ∗ θ∗ θ∗ θ
Lodscore = Log10 waarschijnlijkheid van koppeling, θ < 0. 5 waarschijnlijkheid geen koppeling, θ = 0. 5
0.75∗0.75∗ 0.75∗0.25
= 0.23
= Log10 0.5∗0.5∗0.5∗0.5
1
1
Koppelingsonderzoek (3) Statistisch Bewijs van Koppeling
Belangrijk te weten: • crossing-over gedurende meiose is verschillend voor mannen en vrouwen. • langere genetische kaart voor vrouwen
Bij 10 volledig informatieve meioses zonder recombinatie (θ = 0):
110
1−θ10
Lodscore = Log10
= Log10 θ10
• crossing-over neemt toe aan telomeren
= 3.0103 0.510
• min oneindig bij θ = 0 betekend in ieder geval 1 recombinatie
Ieder informatieve meiose draagt 0.3 bij aan lodscore Bij recombinant wordt noemer 0, en lodscore - oneindig
• ieder informatieve meiose kan 0.3 bijdragen aan de lodscore
1
• gebieden waar lodscore < -2 is kunnen worden uitgesloten
1
Eventuele problemen: Ideale omstandigheden: •kleine families •lodscores van verschillende families kunnen worden opgeteld
•complete penetrantie ziektegen
•genetische heterogeniteit
•DNA marker is heterozygoot in alle sleutel personen
•lastig bij optellen van lodscores van verschillende families
•hoog polymorfe markers
•gereduceerde penetrantie
•familie is groot genoeg om een lodscore > +3 te geven •minstens 10 informatieve meioses bij een recombinatie frequentie van 0
•fenocopieen
1
Divisie Medische Genetica
1
11 februari 2002
Blad 5
Coeliakie
Complexe ziektes - problemen
en andere complexe ziektes Glu ten
?
* onduidelijk fenotype * fenocopieën * lage penetrantie * genetische heterogeniteit
Gen 1 Gen 2
DQ2
Ziek
?
OmgeOmgeving
Meerdere genen in combinatie met omgevingsfactoren zijn nodig om de ziekte te veroorzaken
Gen 3
* polygene effecten * omgevingsfatoren
1
1
Hoe weten we dat een aandoening genetisch bepaald is?
Complexe ziektes - voorbeelden • • • •
Diabetes (type 1 en type 2) Astma, eczeem Reuma Psychiatrische aandoeningen (o.a. ADHD en schizofrenie) • Coeliakie • Hart- en Vaatziekten • Etc.
• Tweeling studies + +
Concordantie MZ tweelingen > DZ tweelingen Concordantie MZ tweelingen >70%
• Familie studies + + +
Klustering; niet-Mendeliaanse overerving Risico 1e-graads Risico voor siblings: ~10% verwant (λs) = 20 Populatie risico: 0.5%
}
(1:200 in populatie screen)
1
Nu: één genetische risico factor voor coeliakie bekend
1
Wat is het principe van een aangedane sibpaar studie? 1. Genoom screenen met 400 DNA markers in groot aantal ASPen 2. Voor iedere DNA marker: Bepaal % allelen dat gedeeld wordt tussen 2 aangedane siblings
HLA-DQ: +
90% van ned. coeliakie patiënten: HLA-DQ2 (rest is DQ8)
+
Maar: 25% van onze Nederlandse populatie is ook HLA-DQ2
-> Andere genen zijn ook betrokken en minstens zo belangrijk!
1
Divisie Medische Genetica
2
1
11 februari 2002
1
0
Blad 6
1
p
Genoom screen m.b.v. ASPen
Gemiddeld: Gemiddeld: twee sibs delen 1 allel (= 50% sharing)
vader moeder
Bloed van ieder individu
DNA
coeliakie coeliakie
Verzamelen van families met ASPen
>> 50% sharing voor een bepaalde DNA marker: DNA marker is nauw gekoppeld met het gevoeligheidsgen dat aanwezig is in beide sibs! q
50% sharing
Genoom screen met 400 DNA markers
Identificatie van een coeliakie gen
Identificatie van een chromosoom gebied met een gevoeligheidsgen (>> 50% sharing)
1
Hoe komen we aan patiënten materiaal?
Totale genoom screen Om nieuwe genen voor coeliakie te identificeren wordt momenteel in Utrecht een aangedane sibpair studie uitgevoerd in ~100 Nederlandse ASPen
1
• • •
Samenwerking met kinderartsen en (kinder)gastroenterologen Voordrachten, nationaal en internationaal Nederlandse Coeliakie Vereniging
Thans:
> 700 coeliakie patiënten (> 150 families; > 100 ASPen)
1
1
Genoom screen coeliakie 400 PCR reacties / DNA monster
• 100 ASPen (totaal 384 individuen) • DNA markers voor alle 22 chromosomen +
DNA isolatie + + +
Statistische analyse
Divisie Medische Genetica
Gemiddeld één DNA marker iedere 10 miljoen bp ~ 400 DNA markers >> 150.000 genotypes worden gegenereerd Verwachte afronding: voorjaar 2001
analyse van de > 150.000 genotypes
1
1
11 februari 2002
Blad 7
In Utrecht wordt er gewerkt aan ontwikkeling van nieuwe technieken
HL ADQ 2
DNA pooling: u gl
n te
Een alternatief voor ASP analyse? Geschikt voor analyse grote aantallen DNA’s met grote aantallen markers?
? ??? …? Coeliakie
1
Individual genotyping
1
DNA pooling • 100 DNAs van patienten in 1 buisje, DNA van 100 controles in een tweede buisje • Vergelijken allel frequenties tussen deze 2 groepen • Reductie van inspanningen nodig voor genotypering : + 3000 markers voor 1 pool met patienten DNA en 1 pool met control DNA = 6000 genotypes
1
Ideale DNA pools
1
Pool patronen: de eerste indruk
Marker 1
Marker 2
1
Divisie Medische Genetica
1
11 februari 2002
Blad 8
% of total peak height
MICB-Pooled genotypin 50 40 30
Controls Celiac diseas
20 10 0 1
6 27,8 32,6 -14,8 -4,8
7 23,8 24,5 -3,0 -0,7
8 9,0 10,2 -11,8 -1,2
R ES TT o t a a l 11,7 100,0 8,9 100,0 648,0 2,8 0,0
5 27,73 47,44 75,17 5 25,06 50,12 75,17
6 27,8 65,28 93,07 6 31,02 62,05 93,07
7 23,77 49,03 72,8 7 24,27 48,54 72,8
8 9,03 20,47 29,5 8 9,834 19,67 29,5
R ES TTo ta l 11,7 100 17,8 200 29,4 300 R ES TTo ta l 9,82 100 19,6 200 29,4 300
5 6 Cas e s 0,286 0,336 C o n t ro ls 0,143 0,168 To ta l 0,429 0,504 p - v a lu e ( 4 d f )
7 0,01 0,005 0,015
8 0,066 0,033 0,099
R ES TTo ta l 0,35 1,0484 0,18 0,5242 0,53 1,5726 0 ,8 14
% p e a k h e ig h t c a s e s c o n t ro ls % in c re a s e in c a s e s % d if f e re n c e f ro m t o t a l
O b s e rv e d
Cas e s C o n t ro ls To ta l
E xp e c t e d
Cas e s C o n t ro ls To ta l
C h i- s q u a re
Allele 3 Chi-square 0.07 p-value (1df) 0.79
2
4 0.41 0.52
3
4
5 2.89 0.09
5
6
7
6 1.34 0.25
8
9
7 3.57 0.06
10
8 1.06 0.3
11 12
13 14
11 0.27 0.6
12 2.18 0.14
15
16
13 5.97 0.01
14 7.3 0.01
REST 1.42 0.23
Total 26.472 0.003
MICB-individual genotypi 50 % frequency
5 27,7 23,7 16,9 4,0
40 30
Controls Celiac diseas
20 10 0 1
1
Allele Chi-square p-value (1df)
2
4 0.196 0.658
3
4
5
5 2.883 0.089
6
7
7 8.66 0.003
8
9
10 11 12 13 14 15 16 17
8 1.627 0.202
11 1.303 0.254
12 0.612 0.434
14 16.08 6E-05
REST 0.042 0.837
Total 31.406 5E-05
1
PCR artefacten 1: stutter
D14S617- plus A
RubenTaq
• ‘Slipping’ van polymerase resulteert in kortere PCR producten
Taq Gold Taq Gold + Klenow
1
1
PCR artefacten 2: differentiele amplificatie MICB 0.7 0.6 0.5
• Amplificatie voordeel van kortere allelen • Pools: onderschatting van langere allelen
first stutter peak
0.4
second stutter peak third stutter peak
0.3 0.2 0.1 0 265
270
275
280
285
290
295
300
Lenght of allelic peak
1
Divisie Medische Genetica
1
11 februari 2002
Blad 9
Waar zijn we na de genoom screen? Families met coeliakie MICB
ontwikkelen van therapie
1.2
aangedane sibpaar analyse Chromosomale lokalisaties v/d genen
1
Begrip van de processen die coeliakie veroorzaken
0.8
Series1
0.6
0.4
functionele studies
0.2
0 0
5
10
15
20
25
het opsporen van de genen
30
Identificatie van de genen & mutatie analyse
1
Divisie Medische Genetica
DNA diagnostiek
1
11 februari 2002
Blad 10