Homozygositeitsmapping voor identificatie van ziektegenen voor retinale dystrofieën.
Elly De Vlieghere
Verhandeling ingediend tot behalen van de graad van Master in de biomedische wetenschappen. Promotor: Dr. Elfride De Baere Vakgroep: Pediatrie en Genetica Academiejaar 2008-2009
“De auteur en de promotor geven de toelating deze masterproef voor consultatie beschikbaar te stellen en delen ervan te kopiëren voor persoonlijk gebruik. Elk ander gebruik valt onder de beperkingen van het auteursrecht, in het bijzonder met betrekking tot de verplichting uitdrukkelijk de bron te vermelden bij het aanhalen van resultaten uit deze masterproef.”
Datum
Elly De Vlieghere
Dr. Elfride De Baere
Voorwoord Langs deze weg zou ik graag iedereen bedanken die bijgedragen heeft tot de verwezenlijking van deze masterproef.
Mijn dank gaat in het bijzonder uit naar mijn promotor Dr. Elfride De Baere die mij samen met Frauke Coppieters uitstekend hebben begeleid.
Daarnaast wil ik ook Dr. Bart Leroy en andere doorverwijzende clinici bedanken, voor de accurate klinische informatie, en Steve Lefever voor het Perl script bedanken.
Het personeel van het DNA labo, in het bijzonder Sarah De Jaegere, mag ik zeker niet vergeten voor hun hulpvaardigheid en vele praktische tips.
Als laatste wil ik Agnes en Lieve bedanken om dit werk na te lezen en Maarten voor zijn onvoorwaarlijke steun.
Elly De Vlieghere
Lijst met afkortingen
CORS
Betekenis autosomaal recessieve retinitis pigmentosa centrale areolaire choroidale dystrofie charge-coupled device centimorgan Centrum Medische Genetica Gent cerebello-oculo-renaal syndroom
Cx
chromosoom
DMSO DNA dNTP dsDNA EDTA ERG ESE EtBr F-primer FSP gDNA GSU HGVS HPLC IBD IBS IFT IS JS kb LCA
dimethylsulfoxide deoxyribonucleic acid of deoxyribonucleïne zuur deoxyribonucleosidetrifosfaat dubbelstrengig DNA ethyleendiaminotetra-azijnzuur electroretinografie exonic splicing enhancer ethidiumbromide forward primers fragmentselectie door PCR genomisch DNA genetic service unit Human Genome Variation Society high pressure liquid chromatography identity-by-descent identity-by-state intraflagellair transport systeem binnenste segment van de fotoreceptor Joubert syndroom kilobasenparen Leber congenitale amaurosis
LOD
logarithm of odds
Mb MKS NCBI
megabasen Meckel Syndroom National Center for Biotechnology Information nefronoftisis buitenste segment van de fotoreceptor polymerase chain reaction of polymerase kettingreactie reference data group
Afkorting ARRP CACD CCD cM CMGG
NPH
OS PCR RDG
ROA ROI RP R-primer SLS SNP ssDNA TBE trm UCSC
recessieve optische atrofie region of interest retinitis pigmentosa retinaal pigmentepitheel reverse primer Senior-Loken syndroom single nucleotide polymorfismen enkelstrengig DNA tris-boraat-EDTA toeren per minuut University of California Santa Cruz
UMD
Universal Mutation Database
UTR
untranslated region
UV
ultra-violet
RPE
Inhoudstafel 1 2
Samenvatting ..................................................................................................................1 Inleiding .........................................................................................................................2 2.1 De Retina ................................................................................................................2 2.2 Pathologie ...............................................................................................................6 2.2.1 Centrale areolaire choroidale dystrofie (CACD) ..............................................7 2.2.2 Autosomaal recessieve retinitis pigmentosa (ARRP) .......................................7 2.2.3 Leber congenitale amaurosis (LCA) ................................................................8 2.2.4 Autosomaal recessieve optische atrofie (ROA) ................................................9 2.3 Identificatie van nieuwe ziektegenen door middel van homozygositeitsmapping .....9 2.3.1 Principe identity-by-descent (IBD) ................................................................10 2.3.2 IBD mapping door middel van genoomwijde SNP chip genotypering ............13 3 Materialen en methoden................................................................................................14 3.1 Patiëntenmateriaal.................................................................................................14 3.1.1 Familie A ......................................................................................................14 3.1.2 Familie B ......................................................................................................14 3.1.3 Familie C ......................................................................................................14 3.1.4 Familie D ......................................................................................................15 3.1.5 Famililie E.....................................................................................................15 3.1.6 Familie F .......................................................................................................15 3.2 SNP chip genotypering..........................................................................................16 3.2.1 Eigenschappen 250K arrays ..........................................................................16 3.2.2 Methode ........................................................................................................18 3.2.3 Data-analyse door middel van Perl script ......................................................18 3.3 Polymerase kettingreactie of PCR .........................................................................20 3.3.1 Principe .........................................................................................................20 3.3.2 Materialen .....................................................................................................22 3.3.3 Methode ........................................................................................................22 3.4 Agarose gelelektroforese.......................................................................................23 3.4.1 Principe .........................................................................................................23 3.4.2 Materiaal .......................................................................................................24 3.4.3 Methode ........................................................................................................24 3.5 Koppelingsanalyse aan de hand van microsatellietmerkers ....................................25 3.5.1 Principe .........................................................................................................25 3.5.2 Materiaal .......................................................................................................28 3.5.3 Methode ........................................................................................................29 3.6 Selectie van kandidaatgenen..................................................................................31 3.6.1 Selectie van gekende ziektegenen na SNP analyse .........................................31 3.6.2 Selectie van kandidaatgenen na microsatellietanalyse ....................................31 3.7 Sequenering ..........................................................................................................31 3.7.1 Algemeen principe ........................................................................................31 3.7.2 Sequenering door Genetic Service Unit of GSU.............................................32 3.7.3 Data-analyse met SeqScape ...........................................................................33 4 Resultaten en discussie .................................................................................................35 4.1 Familie A: .............................................................................................................35 4.1.1 Homozygositeitsmapping ..............................................................................35 4.2 Familie B: .............................................................................................................37 4.2.1 Homozygositeitsmapping ..............................................................................37 4.2.2 Sequeneren RLBP1........................................................................................40 4.3 Familie C ..............................................................................................................40
4.3.1 SNP analyse ..................................................................................................41 4.3.2 Selectie kandidaatgenen.................................................................................41 4.3.3 Sequenering kandidaatgenen .........................................................................41 4.4 Familie D ..............................................................................................................42 4.4.1 SNP analyse ..................................................................................................42 4.4.2 Selectie kandidaatgenen.................................................................................43 4.4.3 Sequeneren ziektegenen.................................................................................43 4.5 Familie E ..............................................................................................................44 4.5.1 SNP chip analyse...........................................................................................44 4.5.2 Selectie kandidaatgenen.................................................................................45 4.5.3 Sequeneren NPHP5 .......................................................................................45 4.6 Familie F...............................................................................................................46 4.6.1 SNP chip analyse...........................................................................................46 4.6.2 Selectie kandidaatgen ....................................................................................46 5 Algemene conclusie......................................................................................................48 6 Referentielijst ...............................................................................................................50
1 Samenvatting Retinale dystrofieën zijn zowel genetisch als klinisch zeer heterogene aandoeningen. Voor deze aandoeningen zijn bijna 200 loci gekend die naar schatting 50% van de ziektegenen vertegenwoordigen. Het kennen van het causale ziektegen is belangrijk voor een bevestiging van de klinische diagnose, het kunnen bieden van gerichte genetische counseling en als voorbereiding op toekomstige genspecifieke behandelingen zoals retinale gentherapie. In 2008 werden de eerste fase I klinische trials met succes uitgevoerd voor RPE65-gerelateerde retinale dystrofieën, wat perspectieven biedt voor andere vormen. De algemene doelstelling van deze studie is de identificatie van het causale ziektegen in families met verschillende retinale dystrofieën door middel van homozygositeitsmapping. Dit project kadert in een onderzoekslijn die gericht is op het verwerven van nieuwe inzichten in de genetische regulatie van de ontwikkeling, differentiatie en homeostase van de retina. Er werden 6 indexpatiënten geïncludeerd met respectievelijk centrale areolaire choroidale dystrofie (CACD) (2), autosomaal recessieve retinitis pigmentosa (ARRP) (2), Senior-Loken syndroom (SLS) en autosomaal recessieve optische atrofie (ROA). Het onderliggend genetisch defect was nog niet gekend in deze families. Deze zijn allen afkomstig van een consanguin huwelijk, waardoor kan vooropgesteld worden dat de causale mutatie afkomstig is van een gemeenschappelijke voorouder van de ouders, en dat het causale ziektegen kan geïdentificeerd worden door middel van homozygositeitsmapping. Homozygote regio’s werden geïdentificeerd door middel van genoomwijde SNP genotypering (250K SNP arrays), en verder onderzocht door locusspecifieke microsatellietanalyse. Kandidaatgenanalyse werd uitgevoerd in homozygote regio’s van interesse. Door middel van deze strategie werd het causale defect gevonden in 2 van de 6 families. In één van de twee patiënten met ARRP werd een nieuwe homozygote mutatie (p.Arg4192Cys) gevonden in het USH2A gen, dat betrokken is bij Usher syndroom type 2 en ARRP. In de patient met SLS werd een gekende homozygote mutatie (p.Phe142ProfsX5) aangetroffen in het NPHP5 gen, die reeds beschreven werd in associatie met deze aandoening. In de overige 4 families werd het moleculair defect niet geïdentificeerd. In de tweede patiënt met ARRP werd het CNGA1 gen weerhouden als potentieel kandidaatgen, terwijl in de familie met ROA een potentiële kandidaatlocus geïdentificeerd werd. Homozygositeitsmapping door middel van SNP chip analyse bleek een effectieve strategie te zijn voor het onderzoeken van de betrokkenheid van gekende ziektegenen, en het identificeren en fijnmappen van nieuwe loci.
1
2 Inleiding 2.1 De Retina Het oog is opgebouwd uit drie lagen (Figuur 1). De buitenste laag bestaat uit de cornea, een lichtdoorlatende laag die voor de lens ligt, en de sclera, die de rest van de oogbol omgeeft. Beiden vormen een ondersteunende laag. De middelste laag wordt anterieur gevormd door de iris met het ciliaire lichaam en posterieur door het choroid of vaatvlies. Het pigment van de iris bepaalt onze oogkleur. Het licht kan enkel door de iris via de pupil. De circulaire spieren van de iris kunnen de pupil vernauwen of verwijden en zo de hoeveelheid binnenkomend licht regelen. In het ciliair lichaam zijn de spieren aanwezig die nodig zijn om de lens te accomoderen. Het choroid bevat veel kleine bloedvaten en voorziet een deel van de retina van bloed. De binnenste laag is de retina, waarin de fototransductie en visuele cyclus plaatsvindt (1, 2, 3).
Figure 1: Schematische voorstelling van de verschillende structuren in het oog en uitvergroting van de verschillende cellen in de retina (1)
De retina is opgebouwd uit 10 histologische lagen: (3) 1. Buitenste segment van de fotoreceptoren: lichtgevoelige dendrieten van de fotoreceptoren in de vorm van staafjes en kegeltjes. 2. De membrana limitans externa: een laag van dicht op elkaar gepakte celuitlopers, zij verbinden de steuncellen van Müller met het binnensegment van de fotoreceptoren. 3. De buitenste korrellaag (outer nuclear layer): kernen van de fotoreceptoren. 4. De buitenste plexiforme laag: synapsen tussen de fotoreceptoren en bipolaire zenuwcellen. 5. De binnenste korrellaag (inner nuclear layer): bipolaire cellen. 6. De binnenste plexiforme laag: synapsen tussen de bipolaire- en ganglioncellen.
2
7. De ganglionaire laag: ganglioncellen die hun axonen uitzenden naar de blinde vlek(papil), waar de retina geen fotoreceptoren bevat. 8. De optische vezels: bundeling van de axonen van de ganglioncellen die samen de Nervus opticus vormen en naar het centraal zenuwstelsel lopen. 9. De membrana limitans interna: vertakte uitlopers van de Müllercellen (deze cellen strekken zich uit over de 10 lagen). Een foton gaat door al deze lagen voor ze het buitenste segment van de fotoreceptoren bereikt, waar het wordt omgezet in een elektrische prikkel via de fototransductie cascade. Als men via een oftalmoscoop naar de fundus kijkt, ziet men een cirkel- tot ovaalvormige witte regio (Figuur 2), de blinde vlek of papil. Hier is de retina onderbroken en worden geen fotosensorische waarnemingen gedaan. Op deze plaats verlaten de oogzenuw en de bloedvaten de retina. Meer temporaal is er een donkere vlek die vrij is van bloedvaten. Dit is de macula met als centraal punt de fovea. In de retina zijn
Figure 2: Beeld van de fundus door een oftalmoscoop (1)
de staafjes en kegeltjes niet gelijk verdeeld. Perifeer treft men vooral staafjes aan, hoe dichter bij de macula hoe meer kegeltjes er aanwezig zijn. In de fovea bestaat de retina enkel uit kegeltjes. De retina is hier uitgehold en erg verdund; doordat de ganglion en bipolaire cellen enkel perifeer aanwezig zijn (Figuur 3). Op deze plaats vallen de lichtstralen rechtstreeks in op de kegeltjes, waardoor scherptezicht mogelijk is (1, 2, 3).
Figure 3: De foveola (2) In de fovea bevinden zich enkel kegeltjes. De bipolaire en ganglioncellen liggen hier perifeer, waardoor het licht rechtstreeks op de fotoreceptoren invalt.
3
Staafjes en kegeltjes hebben een verschillende functie. De staafjes zijn zeer lichtgevoelig en werken bij een lage lichtintensiteit, maar dragen weinig bij tot de visus. Als de lichtintensiteit zo laag is (in het donker) dat enkel de staafjes actief zijn, spreekt men van scotopisch zicht. De kegeltjes hebben een hoge lichtintensiteit nodig om gestimuleerd te worden. Zij zijn overdag verantwoordelijk voor de visus (scherptezicht) en zorgen eveneens voor kleurenzicht. Er bestaan 3 soorten kegeltjes die gevoelig zijn voor licht met een ander golflengte: 558 nm (rood), 531 nm ( groen), 419 nm (blauw) of de lange (L), midden (M) en korte (S) golflengte type kegeltjes. Bij hoge lichtintensiteit werken enkel de kegeltjes en dan spreekt men van fotopisch zicht (1, 2, 3) (Figuur 4).
Figuur 4: Spectrum van de staafjes en kegeltjes (2) Bij lage lichtintensiteit werken enkel de staafjes: dit zijn scotopische omstandigheden. Bij meer licht worden ook de kegeltjes geprikkeld dan spreekt men van mesopisch zicht. Bij hoge lichtintensiteit worden enkel de kegeltjes gestimuleerd: dit is fotopisch zicht.
Structureel kunnen de fotoreceptoren in drie delen opgedeeld worden (Figuur 5): het buitenste segment (OS), het binnenste segment (IS) en het verbindend cilium. Het OS is lichtgevoelig en is opgebouwd uit verschillende afgeplatte disci. Het IS bevat het cellichaam met de kern en is rijk aan mitochondriën. Beide segmenten worden met elkaar verbonden door het verbindend cilium. Het cilium is opgebouwd uit een centraal cytoskelet, het axonema, dat 9 microtubuli doubletten bevat (Figuur 6). Het axonema ontwikkelt zich uit een gespecialiseerd centriool, het basale lichaam, opgebouwd uit 9 microtubuli tripletten. Net als
Figure 5: Structuur van de fotoreceptoren (2)
het centriool is het basale lichaam een microtubuliorganiserend centrum. Het verbindend cilium heeft naast zijn structurele rol een belangrijke functie in het transport tussen IS en OS. Het OS van de fotoreceptoren is niet in staat om de 4
noodzakelijke eiwitten en lipiden te produceren die nodig zijn voor de fototransductie en het onderhoud van het buitenste segment. Het OS is afhankelijk van de moleculen die het IS produceert en via het verbindend cilium naar het OS getransporteerd worden. Het transport wordt gemedieerd door middel van het intraflagellair transport systeem (IFT) (Figuur 7). Vesikels afkomstig van het Golgi apparaat worden door de vesikeltransporter dyneïne 1 naar het basale lichaam gebracht, waar IFT partikels het meest geconcentreerd zijn. De IFT partikels binden de vesikels en oplosbare eiwitten. Dit complex fusioneert met de plasmamembraan van het cilium en wordt naar de ciliaire tip gebracht door kinesine II (anterograad transport). Aan de ciliaire tip binden de vesikels en oplosbare eiwitten aan complexen van het OS. De IFT partikels worden terug naar het basale lichaam getransporteerd via dyneïne 2/1b (retrograad transport). Defecten in het intrafotoreceptortransport kunnen leiden tot retinale dystrofieën. Enkele genen die hierin een cruciale rol spelen zijn: de USH-familie, de NPHP-familie, de RPGR/RPGRIP1 genen coderend voor een complex en CEP290 dat bijdraagt aan een belangrijk aandeel van Leber congenitale amaurosis in Noordwest-Europa (3, 4, 5, 6, 7).
Figure 6: (6) A) Schema van het cilium met doorsnede van de microtubuli. B) Schema van het verbindend cilium in een fotoreceptor. OS: buitenste segment, IS: binnenste segment, MT: microtubuli, CC: verbindend cilium
Figure 7: Het intraflagellair transport systeem (IFT) (7) Dyneïne 1 brengt de vesikels van het Golgi apparaat naar het basale lichaam van het cilium waar het door de IFT partikels gebonden wordt. De IFT partikels binden aan kinesine II die het complex naar de ciliaire tip transporteren. Daar worden de vesikels aan het buitenste segment afgegeven. De IFT partikels worden door middel van dyneïne 2/1b terug naar het basale lichaam getransporteerd.
5
2.2 Pathologie Retinale dystrofie wordt gekenmerkt door een dysfunctie of afbraak van de fotoreceptoren wat verminderde visus en in sommige gevallen blindheid tot gevolg heeft. Momenteel is er nog geen routine behandeling beschikbaar. Retinale dystrofieën zijn genetisch zeer heterogeen en vertonen onderling vaak overlap. Op dit moment zijn er bijna 200 loci gekend (Figuur 8); naar schatting zouden deze maar 50% van alle ziektegenen uitmaken (8). De identificatie van het ziektegen is belangrijk om de klinische diagnose moleculair te bevestigen, de prognose
Figuur 8: (8) Aantal geïdentificeerde ziektegenen en -loci voor retinale dystrofieën in functie van de tijd
van de ziekte te voorspellen, prenatale diagnostiek te kunnen aanbieden en in de toekomst genspecifieke behandelingen (gentherapie) mogelijk te maken. Genetische heterogeniteit wordt niet alleen gekenmerkt door de grote diversiteit aan genen, maar ook door verschillende overervingspatronen, het grote aantal verschillende mutaties in één gen (grote allelische heterogeniteit), de mogelijke invloed van modifiers en van polymorfismen. Bovendien zijn deze aandoeningen ook klinisch zeer heterogeen, gekenmerkt door overlappende symptomen en inter- en intrafamiliale fenotypische variabiliteit voor eenzelfde mutatie. Dit compliceert het stellen van een accurate klinische diagnose (5). Een klinische diagnose van een retinale aandoening is ondermeer mogelijk door fundusonderzoek, evaluatie van visuele functie, nagaan van aanvangsleeftijd en het afnemen van een elektroretinogram (ERG). Bij een ERG onderzoekt men de elektrische respons van de retina op licht (bij verschillende lichtomstandigheden) (9). Als behandeling voor deze aandoeningen zijn er perspectieven wat gentherapie betreft. Drie verschillende groepen hebben in 2008 fase I klinische studies uitgevoerd voor gentherapie in RPE65-gerelateerde LCA. Via recombinante adeno-geassocieerde virale (AAV) vectoren werden miljarden normale kopijen van het gen ingespoten in de subretinale ruimte. Deze studies in 9 volwassen individuen hebben aangetoond dat deze therapie veilig is, geen toxiciteit vertoont, en zelfs een discrete verbetering van de visus kan teweegbrengen in een reeds gevorderd stadium van de ziekte. De eerste studies zijn lopend in jongere patiënten in wie men nog betere resultaten verwacht. Men werkt met RPE65-gerelateerde LCA omdat de
6
retinale architectuur lang intact blijft in dit subtype. Bovendien liggen loss-of-function mutaties aan de basis van deze recessieve aandoening, waardoor genadditie mogelijk is (zonder het defecte gen te moeten verwijderen) (10). Een voorwaarde om retinale genspecifieke therapie te kunnen toepassen, is het identificeren van het onderliggend genetisch defect. In deze studie lag de focus op recessieve retinale dystrofieën.
2.2.1 Centrale areolaire choroidale dystrofie (CACD) Centrale areolaire choroidale dystrofie (CACD, MIM[215500]) is een choroidale dystrofie die voor het eerst beschreven werd in 1939 door Sorsby. (11). Patiënten merken een verminderde visus in de derde tot vierde decade, en worden volledig blind vanaf de leeftijd van 70 jaar. De ziekte tast de retina aan tussen de macula en de papil, met een granulaire hyperpigmentatie van de fovea (Figuur 9). Enkele tientallen jaren later ontstaat er atrofie van de retina, het retinaal pigment epitheel (RPE) en de choriocapillaris in de maculaire regio (12). Meestal ziet men een dominant overervingpatroon, maar de recessieve vorm werd eveneens beschreven zowel in patiënten die van een consanguin als niet-consanguin huwelijk afkomstig zijn (13). Voor de dominante vorm kent men één locus en één gen. De locus omvat een gebied van 24 cM op chromosoom
Figuur 9: Fundus foto CACD patiënt (14) Granulaire hyperpigmentatie ter hoogte van de fovea.
17 tussen de merkers D17S1810 en D17S1353 (15). Het gekende ziektegen is RDS of peripherin (PRPH2) (16). Familie-onderzoek wees tevens op het voorkomen van een recessieve vorm (13).
2.2.2 Autosomaal recessieve retinitis pigmentosa (ARRP) Retinitis pigmentosa (RP, MIM[268000]) is de meest frequente retinale dystrofie met een prevalentie van 1/3.000-1/4.000, en wordt gekenmerkt door degeneratie van de staafjes die initieel nachtblindheid en kokerzicht veroorzaakt (Figuur 10). De staafjes bevinden zich voornamelijk perifeer in de retina waardoor het perifeer gezichtsveld primair wordt aangetast. Vervolgens is er ook degeneratie van de kegeltjes waardoor visusverlies optreedt. Sommige patiënten worden volledig blind,
7
Figure 10: Het gezichtsveld van een patiënt met kokerzicht (17)
anderen behouden een deel van hun visus. De aanvangsleeftijd van deze ziekte verschilt sterk, net zoals het fenotype. ARRP is niet enkel klinisch, maar ook genetisch sterk heterogeen (18). Er zijn reeds 23 ziektegenen gekend voor de recessieve vorm (ABCA4, CERKL, CNGA1, CNGB1, CRB1, EYS, IDH3B, LRAT, MERTK, NR2E3, NRL, PDE6A, PDE6B, PRCD, PROM1, RGR, RHO, RLBP1, RP1, RPE65, SAG, TULP1, USH2A) en 4 loci (RP22, RP28, RP29, RP32) (8).
2.2.3 Leber congenitale amaurosis (LCA) Leber congenitale amaurosis (LCA, MIM[204000]) is de meest ernstige vorm van alle retinale dystrofieën en is de frequentste oorzaak van congenitale blindheid. Kinderen zijn volledig blind of sterk slechtziend voor de leeftijd van 1 jaar. De patiënten vertonen naast blindheid ook nystagmus en afwezigheid van ERG respons. Deze aandoening vertoont meestal een recessief overervingpatroon, hoewel er ook zeldzame dominante vormen beschreven zijn. Het fenotype is zeer variabel en het verschil met bijvoorbeeld early-onset RP is niet altijd duidelijk. Er is ook een zekere overlap tussen de causale genen van deze entiteiten (19). LCA is genetisch zeer heterogeen: er zijn tot nu toe 13 ziektegenen (AIPL1, CEP290, CRB1, CRX, GUCY2D, LCA5, LRAT, RD3, RDH12, RPE65, RPGRIP1, TULP1 en SPATA7) en 1 locus (LCA9) gekend voor de recessieve vorm (8, 20). Experimentele gentherapie, waarbij het defecte RPE65 wordt vervangen, lijkt veelbelovend voor de behandeling van deze aandoening (zie 2.2) (10). LCA wordt ook gezien in combinatie met nefronoftisis, een chronische nieraandoening met degradatie van de niertubuli. Joubert syndroom (JS, MIM[213300]) en Senior-Loken syndroom (SLS, MIM[266900]) zijn twee syndromen waar men zowel nefronoftisis als LCA of RP ziet. Joubert syndroom is een neurologische ontwikkelingsaandoening met als diagnostische criteria: vermis hypoplasia, hypotonia, abnormale ademhaling en oogbewegingen. Neuroradiologisch ziet men karakteristiek het molar tooth sign. Deze aandoening wordt ook in combinatie gezien met retinale dystrofie of nierafwijkingen. Als beiden aanwezig zijn, spreekt men van cerebello-oculo-renaal syndroom (CORS) (zie Figuur 11). SLS is een combinatie van LCA en nefronoftisis. Net als Meckel syndroom (MKS) valt deze aandoening onder Joubert syndroom gerelateerde aandoeningen (JSRD). Deze groep van aandoeningen zijn ciliopathiën. Cilia hebben niet alleen een belangrijke functie in de fotoreceptoren, maar ook in het ontwikkelen en onderhoud van de renale tubuli (21, 22, 23).
8
Figuur 11: Genotype-fenotype correlaties in JSRD (22)
De gele, blauwe en rode cirkel vertegenwoordigen respectievelijk pure JS, geïsoleerde NPH en geïsoleerde LCA. De overlap tussen de cirkels geven de multi-orgaan aandoeningen weer, met in het midden CORS die de fenotypische eigenschappen van de drie verschillende aandoening heeft.
2.2.4 Autosomaal recessieve optische atrofie (ROA) Autosomaal recessieve optische atrofie (ROA) is een neurodegeneratieve aandoening die gekarakteriseerd wordt door het verlies van zenuwvezels afkomstig van het centrale deel van de retina. Dit leidt tot centraal visusverlies. In tegenstelling tot de dominante vorm is recessieve optische atrofie vaak geassocieerd met systemische manifestaties van het centraal zenuwstelsel en andere organen (hersenen, hart, spieren en gehoor). Geïsoleerde ROA is vrij zeldzaam, hiervoor is nog maar één ziektelocus gekend (OPA6). Voor de geïsoleerde dominante vorm is er 1 gen (OPA1) en zijn 2 loci (OPA4 en OPA5) gekend. Voor de Xgebonden vorm, zowel geïsoleerd als systemisch, is 1 gen gekend (TIMM8A), en 1 locus (OPA2, geïsoleerde vorm). Veel van de gekende genen voor optische atrofie coderen voor mitochondriale eiwitten (8, 21, 24).
2.3 Identificatie van nieuwe ziektegenen door middel van homozygositeitsmapping Er zijn verschillende strategieën die men kan aanwenden voor de identificatie van nieuwe ziektegenen voor autosomaal recessieve aandoeningen: klassieke koppelingsanalyse, kandidaatgen analyse en “identity-by-descent” (IBD) mapping. Via klassieke koppelingsanalyse met microsatellietmerkers verspreid over het hele genoom, werden reeds enkele retinale ziektegenen geïdentificeerd, waaronder AIPL1, GUCY2D, en RDH12 (9). Deze aanpak heeft echter een groot nadeel: het is noodzakelijk om grote families
9
te kunnen onderzoeken. Voor LCA bijvoorbeeld zijn er minimum 6 aangetaste individuen nodig om significante koppeling te kunnen aantonen; in consanguine families zijn dit er 3 à 4 afhankelijk van de graad van consanguiniteit en het aantal consanguine lussen in de familie. Aangezien retinale dystrofieën genetisch heterogene aandoeningen zijn, is het quasi onmogelijk om kleine families te groeperen voor een analyse (9). Bovendien komen voor recessieve aandoeningen met een ernstig fenotype meestal slechts enkele aangetasten voor per familie. Klassieke koppeling is dus geen optimale strategie. Nieuwe ziektegenen kunnen ook geïdentificeerd worden door de analyse van functionele kandidaatgenen. Deze strategie is in het verleden eveneens al succesvol gebleken voor de identificatie van een aantal retinale ziektegenen (LRAT, RPE65, RPGRIP1, CRB1, CRX en IMPHP1) (9). Er is echter een zeer grote groep genen en eiwitten verantwoordelijk voor een goed functioneren van de retina (fototransductiecascade en visuele cycus). Kandidaatgenanalyse werd in deze studie slechts aangewend in een tweede termijn na de identificatie van kandidaatregio’s. De mogelijkheid om via single nucleotide polymorfismen (SNP) arrays een groot aantal SNPs goedkoop en snel te analyseren, maakt van IBD mapping een interessante strategie. Het CEP290 gen (25), het meest prevalente ziektegen voor LCA in de West-Europese populatie, en LCA5 (26) werden al op deze manier geïdentificeerd. Deze methode vereist niet noodzakelijk grote families. Om deze redenen verkozen wij IBD mapping voor de identificatie van nieuwe ziektegenen in onze patiëntenpopulatie.
2.3.1 Principe identity-by-descent (IBD) Twee verwante individuen kunnen op twee verschillende manieren eenzelfde allel dragen. Dit kan afkomstig zijn van dezelfde (voor)ouder (“identity-bij-descent” of IBD) of van verschillende (voor)ouders (“identity-by-state”of IBS) (Figuur 12). IBS allelen zien er identiek uit en kunnen zelfs dezelfde DNA sequentie bezitten, maar werden niet overgeërfd van een gezamelijke voorouder. IBS ziet men vaak als men weinig informatieve merkers gebruikt. IBD allelen zijn kopieën van een gezamelijk (voor)ouderlijk allel. Voor zeldzame allelen kan IBD op IBS lijken. Het IBD allel is dan afkomstig van een gemeenschappelijke voorouder, die zo ver verwijderd is van de proband dat er verwarring mogelijk is met IBS (27).
10
A
B
Figuur 12: Identity-by-descent (IBD) en identity-by-state (IBS) A) IBD: beide kinderen hebben het allel A1 overgeërfd van een gemeenschappelijke voorouder (I.1) B) IBS: beide kinderen hebben het allel A1 overgeërfd van een verschillende (voor)ouder. II.1 kreeg dit van I.1 en II.2 van I.2. Het allel is dus afkomstig van verschillende voorouders.
In consanguine families is het mogelijk dat individuen een IBD allel met zichzelf delen. De ouders dragen in dat geval een identiek allel afkomstig van een gemeenschappelijke voorouder. Als zij beiden het IBD allel doorgeven aan hun nakomelingen, krijgen deze 2 identieke allelen afkomstig van dezelfde voorouder, wat leidt tot homozygositeit (Figuur 13) (27).
Figuur 13: IV.1 en IV.2 zijn afkomstig uit een consanguin huwelijk. Hun ouders delen een allel dat afkomstig is van een gemeenschappelijke voorouder (IBD). IV.1 en IV.2 hebben beiden gemeenschappelijke allelen overgeërfd van hun ouders, delen dus een IBD allel met zichzelf en zijn homozygoot.
Hoe groter de verwantschap, hoe groter de homozygote regio’s zijn die overgeërfd worden van de gemeenschappelijke voorouder. Bij een kind met een zeldzame recessieve aandoening uit een consanguin huwelijk, ligt het ziektegen bijna altijd in een IBD regio. De mutaties in het ziektegen zijn in dat geval afkomstig van een gemeenschappelijke voorouder (28). De gemiddelde grootte van de regio (in cM) waarin het causaal ziektegen zich bevindt, kan
11
berekend worden met de volgende vuistregel: 100/N waarbij N het aantal generaties is tussen de patiënt en de gemeenschappelijke voorouder (Figuur 14). Deze vuistregel werd theoretisch berekend en experimenteel bevestigd in families met een achtergrond van consanguiniteit (29).
Gemiddelde grootte van homozygote regio met mutatie ~ 33cM
Gemiddelde grootte van homozygote regio met mutatie ~ 10cM
Figuur 14: (9)
De gemiddelde grootte van de regio waarin het causaal ziektegen zich bevindt, kan door een eenvoudige vuistregel worden bepaald: 100/N waarbij N het aantal generaties is tussen de patiënt en de gemeenschappelijke voorouder. Patiënt A is afkomstig uit een consanguin huwelijk van de derde graad (ouders zijn first cousins): 100/3 is ongeveer 33 cM. Patiënt B is afkomstig uit een consanguin huwelijk van de 10de graad: 100/10 = 10cM.
Bij een huwelijk tussen first cousins hebben de kinderen theoretisch 1/16 of 6% van hun genoom gemeenschappelijk met elkaar (gemiddelde grootte van 20 cM). In gemeenschappen waar consanguine huwelijken vaker voorkomen, ontstaat een achtergrond van consanguiniteit. Nakomelingen van een consanguin huwelijk hebben een grotere fractie homozygoot DNA dan theoretisch voorspeld. Bij nakomelingen van een huwelijk tussen first cousins is dit een gemiddelde van 11%. In theorie hebben alle homozygote regio’s evenveel kans om het causaal ziektegen te bevatten. In de praktijk ziet men echter dat het ziektegen meer dan theoretisch voorspeld wordt in de grootste homozygote regio voorkomt (29). Het opsporen van deze regio’s kan een zeer krachtige aanpak zijn, ook in kleine families en in geïsoleerde gevallen afkomstig van zowel consanguine (inbred) als niet-consanguine (outbred) families. Omdat het in deze studie over relatief zeldzame recessieve aandoeningen gaat, is het niet ondenkbaar dat de causale mutaties in niet-consanguine families toch afkomstig zijn van een gemeenschappelijke voorouder (founder mutatie) (30).
12
2.3.2 IBD mapping door middel van genoomwijde SNP chip genotypering Door middel van SNP chip genotypering bekijkt men een groot aantal SNPs die verspreid liggen over het hele genoom. Hoe hoger het aantal SNPs (= densiteit), hoe groter de resolutie van de homozygote regio’s zijn die kunnen geïdentificeerd worden. Grotere regio’s kunnen ook met meer zekerheid worden vastgesteld, want hoe meer homozygote SNPs aangetroffen worden, hoe kleiner de kans dat dit door toeval kan verklaard worden. In deze studie werd ervoor gekozen om SNP analyse uit te voeren bij de proband en één of meerdere aangetaste broers of zussen. Hoe meer siblings er onderzocht worden, hoe groter de kans op de identificatie van een significante homozygote regio (29). SNP analyse voert men doorgaans niet uit op niet aangetaste familieleden. SNPs zijn beperkt in hun heterozygositeit; waardoor een homozygote regio bij niet aangetaste individuen niet a priori kan uitgesloten worden (31). Na de SNP analyse bekomt men een aantal homozygote regio’s door middel van deze strategie. In deze regio’s kan directe kandidaatgenscreening uitgevoerd worden, of kan men ervoor opteren om eerst de grootte van de homozygote regio’s te verfijnen. Dit gebeurt door microsatellietanalyse in alle beschikbare familieleden.
13
3 Materialen en methoden 3.1 Patiëntenmateriaal 3.1.1 Familie A In deze familie lijden 3 van 8 siblings aan CACD; van één van hen is de status nog onbekend. De ouders zijn echter niet aangetast. Het zou in deze familie om recessieve CACD gaan. Alvorens deze familie in het onderzoek op te nemen, werden de exonen en exon/intron grenzen van het RDS gen (ENST00000230381) gesequeneerd in de indexpatiënt. In dit gen dat betrokken is bij dominante CACD, werd geen mutatie gevonden. Vervolgens werd nagegaan of de proband homozygoot is voor de gekende CACD locus op chromosoom 17 (15), wat niet het geval was. De ouders van deze siblings zijn in de 5de graad verwant.
3.1.2 Familie B De proband komt uit een gezin van 7 kinderen waarvan 3 CACD hebben. De ouders vertonen geen symptomen, wat een recessieve vorm suggereert. In diagnostische setting werd al eerder bepaald dat de proband negatief is voor de meest recurrente mutatie in RDS (c.424C
3.1.3 Familie C Eén familielid lijdt aan autosomaal recessieve RP. Deze patiënt werd in diagnostische setting getest met de ARRP chip. Deze chip van Asper Ophthalmics bevat 585 mutaties en polymorfismen voor gekende ARRP genen (CERKL, CNGA1, CNGB1, MERTK, PDE6A, PDE6B, PNR, RDH12, RGR, RLBP1, SAG, TULP1, CRB, RPE65, USH2A, USH3A, LRAT, PROML1) (32). Er werden echter geen mutaties gevonden. De moeder van deze patiënt is getrouwd met de zoon van haar nicht (first cousins once removed). Er is echter maar één aangetast individu. Hierdoor kon de kandidaatregio moeilijker verfijnd worden door middel van microsatellieten, en werd na SNP chip analyse onmiddellijk overgegaan tot het selecteren van kandidaatgenen.
14
3.1.4 Familie D In deze familie beschikt men enkel over de proband, die lijdt aan ARRP en negatief bleek na ARRP chipanalyse. Zijn ouders zijn first cousins. Omdat men enkel over de proband beschikt, werd na SNP chip analyse onmiddellijk overgegaan tot selectie en mutatiescreening van kandidaatgenen.
3.1.5 Famililie E De proband uit deze familie lijdt aan LCA met nefronoftisis en beantwoordt aan de diagnose van Senior-Loken syndroom (MIM[266900]). In diagnostische setting werden alle exonen met exon/intron grenzen samen met de meest recurrente diep-intronische mutatie (c.2991+1655A
3.1.6 Familie F In deze familie hebben 3 van de 8 kinderen geïsoleerde ROA. Enkel DNA van de proband is ter beschikking. In diagnostische setting werden de meest recurrente mutaties van OPA1 (exonen 8, 9, 14, 17, 21, en 27) nagekeken. Hierin vond men geen mutaties. In research setting werd vervolgens het volledige gen (28 exonen met exon –intron grenzen) gesequeneerd. Ook hier werden geen mutaties gevonden. De ouders van dit gezin zijn verwant, de graad van consanguiniteit is echter niet gekend.
x
x
x
15
x
x x x x x x x x
x
Leeftijd
SNP-array
x x x ?
Geslacht
Aangetast
II:1 II:2 II:3 II:4 II:5 II:6 II:7 II:8 III:6 III:9 IV:1 IV:2 IV:4
Microsatelliet
Individu
Belgisch Noord Afrikaans
Afkomst
5de graad 2de graad
Consanguiniteit
CACD CACD
Aandoening
Familie A Familie B
Familie
Tabel 1: Overzicht van de verschillende families
M M M M M V M V M V M V M
55 60 61 48 51 57 58 52 66 61 46 43 38
Belgisch NoordAfrikaans Belgisch NoordAfrikaans
2-3de graad 2de grraad 2 de graad ?
RP ARRP LCA met nephronrisis ROA
Familie C Familie D Familie E Familie F
IV:6 IV:7 IV:9 IV:10 IV:12 III:1 II:2 III:4 IV:3 IV:4 V:1 V:2
V V M V M M V V M V M V
37 35 33 29 24 84 82 95 61 59 35 23
M
29
I:1
M
47
I:2
M
45
II:1
x
x
x
x
x
x
x
x
x
x
II:1
x
x
V
21
II:1
x
x
M
32
In deze tabel wordt een overzicht gegeven van alle individuen waarover men tijdens deze studie kon beschikken. Deze personen werden genummerd volgens stamboomnummer (Bijlage 1), die men terugvindt in de kolom “Individu”.
3.2 SNP chip genotypering Voor IBD mapping werd genoomwijde SNP chip genotypering uitgevoerd. SNPs zijn minder informatief dan microsatellietmerkers maar door hun hoge densiteit in het volledige genoom en de high-throughput mogelijkheden kunnen ze aangewend worden als merker voor genoomwijde IBD mapping. Om dezelfde informatie te verkrijgen van één microsatellietmerker zijn er 1,7 tot 2,5 SNPs nodig (33). Voor genoomwijde analyse gebruikt men ongeveer 400 microsatellietmerkers die 10 tot 12 cM van elkaar verwijderd liggen (31). Om dezelfde informatie met een SNP array te bekomen, zijn ongeveer 1000 SNPs nodig. Een SNP array heeft minimum 10 maal zoveel SNPs en biedt dus meer informatie dan genoomwijde microsatellietanalyse.
3.2.1 Eigenschappen 250K arrays Voor SNP chip analyse werd gebruik gemaakt van de GeneChip van Affymetrix. Affymetrix heeft verschillende types GeneChip ter beschikking: 10K, 100K, 500K, 5.0 en 6.0 arrays (Tabel 2) (34).
16
Array
Tabel 2: De verschillende Affymetrix SNP arrays (34) Aantal SNPs Afstand tussen 2 SNPs Opmerkingen
10K 100K 500K 5.0 6.0
10 000 100 000 500 000 500 000 906 600
278 kb 26 kb 5.5 kb 5.5 kb 3.3 kb
Bestaat uit 2 maal 250K array Is gelijk aan 500K, maar op één array Selectie van 482 000 SNPs uit de 5.0 array met 424 000 additionele SNPs (X en Y chromosoom, mitochondriaal, nieuwe SNPs)
In onze patiëntenpopulatie was de gemeenschappelijke voorouder soms tot 5 generaties verwijderd van de proband. In deze patiënten werden kleinere homozygote regio’s verwacht. Omwille van deze reden zijn de 10K en 100K arrays niet informatief genoeg. 500K, 5.0 en 6.0 brengen een extra kost met zich mee, maar bieden niet zoveel extra informatie ten opzichte van de 250K arrays. In de bestudeerde patiëntencohorte opteerden we om te genotyperen met de 250K array van Affymetrix. Affymetrix beschikt over 2 verschillende 250K arrays: (1) gebaseerd op NspI restrictie enzym digestie en bestaande uit ongeveer 262 000 SNPs; (2) gebaseerd op StyI en bestaande uit 238 000 SNPs. Wij maakten gebruik van het NspI array. De genotypering zelf werd uitgevoerd door het bedrijf DNAVision, en bestaat uit de volgende stappen (35): (1) eerst wordt het gDNA geknipt met het NspI restrictie enzyme. Na deze restrictie bekomt men fragmenten van verschillende grootte; (2) door ligatie met een adaptorsequentie kunnen alle fragmenten geamplificeerd worden met één primerpaar. De condities van de PCR worden zo aangepast dat enkel fragmenten tussen de 200 en 1100 bp in het PCR product aanwezig zijn; dit verlaagt de complexiteit en verhoogt de accuraatheid. Deze techniek noemt men fragmentselectie door PCR of FSP; (3) het PCR product bekomen door middel van FSP wordt gefragmenteerd en gelabeld; (4) de SNPs worden gegenotypeerd door allelspecifieke hybridisatie. Na de hybridisatie volgt nog een wasstap; (5) aflezen van de GeneChip (Figuur 15) (36, 37).
Figuur 15: De verschillende stappen bij het uitvoeren van een SNP array (36)
17
3.2.2 Methode Alvorens de stalen te versturen naar DNAVision, wordt de concentratie van het oorspronkelijke staal gemeten met de NanoDrop-1000 versie 3.5. Op een 0,8% agarose gel (zie 4.4) laadt men 2µl van 50ng/µl om na te gaan of het genomisch DNA niet gedegradeerd is. Vervolgens wordt 25µl van 50ng/µl genomisch DNA op droog ijs verstuurd naar DNAVision. Men ontvangt zowel de ruwe data als de data geanalyseerd met het HR finder programma, dat gebaseerd is op ExcludeAR. ExcludeAR werkt met Exel en heeft de 10 grootste homozygote regio’s weer (31). Via een script geschreven in Perl verwerkt men zelf de ruwe data in een Excel werkblad. Dit Perl script (S. Lefever, ongepubliceerde data) vergelijkt het genotype van elke SNP tussen alle patiënten en duidt homozygote regio’s aan die groter zijn dan een vooraf opgegeven minimale grootte. Omdat de genotypering niet 100% (99.1%) accuraat is, laat men in een grote regio van homozygote SNPs een heterozygote SNP toe (37). Uit de regio’s die door Perl geselecteerd worden, worden de meest interessante regio’s gekozen. Hierbij wordt gelet op de grootte van de regio, het aantal SNPs dat deze regio bevat, het aantal heterozygote SNPs en de frequentie van de SNPs. Bij de gegevens over de SNPs van DNAVision zit ook de frequentie van de verschillende SNPs per populatie. Door middel van steekproef verifieert men deze data via HapMap (38). Vervolgens kijkt men na of de frequentie van het homozygote allel hoger of lager is dan 60%. Regio’s die bijna uitsluitend homozygoot zijn voor SNPs waarvan de allelfrequentie groter is dan 60%, worden minder interessant geacht. Dit kan men echter alleen doen bij patiënten van wie men de origine kent, en wanneer de allelfrequentie voor deze populatie gekend is. Indien er slechts één aangetast kind ter beschikking is zonder broers of zussen, gaat men onmiddellijk over tot selectie van kandidaatgenen. Indien er meerdere familieleden beschikbaar zijn, start men met microsatellietanalyse.
3.2.3 Data-analyse door middel van Perl script De resultaten van DNAVision worden in lijsten geplaatst die het mogelijk maken om door het Perl programma gelezen te worden. Per chromosoom wordt eerst een lijst gemaakt met de SNP genotypes van alle patiënten. Deze lijst bevat de volgende kolommen: SNP ID, chromosoom, fysische positie en de DNA ID code gegeven door DNAVision van alle patiënten onder de vorm van DNAxxx-00x_Call. In de volgende lijst komen alle genotype lijsten. Deze lijst krijgt de naam filelist en laat toe om alle genotypes voor alle chromosomen en patiënten in één keer in te lezen. Alle lijsten moeten op dezelfde plaats opgeslaan zijn.
18
3.2.3.1 Perl script (S. Lefever, ongepubliceerde data) Perl vraagt naar de lijst met de input files en de output file, zodat de te verwerken data terug te vinden zijn en de resultaten kunnen weggeschreven worden.Vervolgens moet men ingeven of men 1 of meerdere patiënten wil vergelijken. Hier heb je twee opties: 1 en 2 (meerdere patiënten). Indien voor 1 patiënt gekozen wordt, wordt er gevraagd naar de patiënt ID (door DNAVision toegekend) en de minimale grootte van een homozygote regio in bp. Perl selecteert de juiste patiënt en doorloopt vervolgens de genotypes. Eens een genotype gelijk aan AA of BB wordt gevonden, wordt een homozygote regio gestart. Deze regio wordt dan verder uitgebreid tot een heterozygoot genotype (AB of BA) wordt bereikt. Een dergelijke regio zal dus enkel de genotypes AA, BB of ‘No Call’ bevatten. Perl berekent de lengte door de positie van de SNP op de plaats van de start van de regio af te trekken van die op de plaats van waar de regio eindigt. Enkel als deze regio groter of gelijk is aan de opgegeven minimale grote van een homozygote regio, wordt deze regio weggeschreven naar de output file. Perl bepaalt het aantal SNPs door het aantal genotypes te tellen bij het maken van de regio’s In de output file komt de ID van de geanalyseerde patiënt en de volgende gegevens over de regio: region, chromosome, length, number of SNPs, first SNP, physicals position first SNP, last SNP, physical position last SNP. Als Perl alle regio’s heeft doorlopen, krijg je de keuze tussen 3 opties. 1.
de minimale grootte van de regio aanpassen
2.
heterozygote SNPs die omgeven zijn door een grote regio van homozygote SNPs ook in de regio opnemen
3.
programma beëindigen
- Bij selectie 1 wordt opnieuw een output file en de minimale grootte van de regio gevraagd. Het vorige scenario wordt doorlopen. - Indien selectie 2 wordt gekozen, vraagt Perl opnieuw een output file alsook de grootte van een regio die een heterozygote SNP moet omringen om als een homozygote regio te worden beschouwd. Vervolgens werd voor alle vorige regio’s (ook de regio’s die niet werden weggeschreven) bepaald welke groter of gelijk zijn aan de minimale grootte van een regio rond een heterozygote SNP. Als een dergelijke regio gevonden wordt, wordt door Perl gezocht naar de afstand tussen het einde van deze regio en het begin van de volgende regio. Is dit gelijk aan 1, dan is er maar 1 heterozygote SNP die de twee regio’s van elkaar scheidt, en bepaalt het programma de grootte van de regio die na deze heterozygote SNP komt. Als ook deze regio dezelfde minimale grootte heeft, en als de som van beide regio’s groter of gelijk is aan de minimale grootte van een homozygte regio, dan schrijft Perl de resultaten weg. 19
-Bij selectie 3 wordt het programma afgesloten. -Wordt er gekozen voor meerdere patiënten, dan vraagt Perl het aantal patiënten en hun IDs. Vervolgens is de procedure gelijk aan deze voor één patiënt. De genotypes worden opnieuw doorlopen en een homozygote regio wordt gestart als alle patiënten hetzelfde genotype hebben (dus allemaal AA of allemaal BB). Binnenin de regio mogen naast identieke homozygote genotypes, ook No Calls voorkomen (als bijvoorbeeld 1 patiënt een genotype AA heeft, en de 2 andere patiënten op dezelfde positie een “No Call” hebben, wordt dit ook aanvaard en aan de homozygote regio toegevoegd). De homozygote regio wordt beëindigd als er een positie bereikt wordt waarop 1 of meerdere patiënten een heterozygoot of een verschillend homozygoot genotype hebben. Om verschillende patiënten te vergelijken, zoekt Perl naar een SNP positie waar het genotype van de verschillende patiënten gelijk is aan AA of BB. Als de twee genotypes gelijk zijn of No Call begint de teller te lopen. Zolang aan deze voorwaarde voldaan is, blijft de teller lopen. 3.2.3.2 Data analyse De uitkomst van het Perl script bevat lijsten met alle homozygote regio’s die aan de vooropgestelde voorwaarden voldoen. Deze worden geordend volgens grootte van de regio en het aantal SNPs. Voor de interessantste regio’s bekijkt men de ruwe data. In Excel sheets worden per chromosoom de regio’s en heterozygote SNPs aangeduid. Zo kan men gemakkelijk zien of er veel heterozygote SNPs aanwezig zijn in de regio en hoever omliggende homozygote regio’s liggen. Voor patiënten waarvan de allelfrequentie in hun populatie gekend is, voegt men deze in een extra kolom toe. Indien de regio vooral bestaat uit SNPs waarvan de ene variant zeer frequent voorkomt, is de betekenis van deze homozygote regio onduidelijk en is deze regio minder informatief. In de interessantste regio’s gaat men over tot microsatelliet analyse en selectie van kandidaatgenen.
3.3 Polymerase kettingreactie of PCR 3.3.1 Principe De selectie van een deel van het genoom is mogelijk door middel van de polymerase kettingreactie (PCR) techniek. Met deze techniek amplificeer je één specifiek stuk DNA aan de hand van sequentie-specifieke primers (Figuur 16).
20
De eerste stap is denaturatie, hierbij ontdubbelen de twee strengen van het dubbelstrengig DNA (dsDNA) en vormen twee enkelstrengige DNA (ssDNA) strengen. Dit bekomt men door een hoge temperatuur (92 – 95°C) waarbij de waterstofbruggen tussen de twee strengen worden verbroken. De tweede stap is de annealing stap, hierbij binden de sequentie-specifieke primers aan de ssDNA strengen. Deze primers binden hun complement op een specifieke annealing of aanhechtingstemperatuur. Deze stap wordt bij deze tempratuur (55 – 60°C) uitgevoerd. In de derde stap of elongatiestap wordt de sequentie overgeschreven vanaf de primer in de 5’ richting. Het polymerase enzym bouwt telkens het complementair dNTP in tot de volledige streng is overgeschreven met de al aanwezige streng als template. Men gebruikt het Taq polymerase, dit enzyme
Figuur 16: PCR reactie (39) PCR is een techniek om een specifiek stuk DNA te amplificeren. Dit gebeurt door een cyclus van drie opeenvolgende stappen enkele malen te herhalen. Stap 1: denaturatie van dsDNA bij 94°C. Stap 2: annealing van de sequentie-specifieke primers bij 5560°C. Stap 3: elongatie bij 72°C. Door deze drie stappen te herhalen, wordt het deel tussen de primers exponentieel vermenigvuldigd.
heeft een hoge temperatuur nodig om geactiveerd te worden (hotstart enzyme) en wordt dus niet bij hoge temperaturen afgebroken. Dit polymerase werkt het best bij een temperatuur van 72°C. De drie stappen samen vormen 1 cyclus en worden enkele malen herhaald. Bij de tweede cyclus bindt de primer zowel op de oude als op de nieuw gevormde strengen. Deze vormen echter een template die een stuk korter is. De sequentie wordt dan maar overgeschreven vanaf de ene primer tot de plaats waar de andere primer in de eerste cyclus bond. Dit stukje tussen de twee primers is de sequentie van interesse. Bij elke cyclus wordt dit deeltje verdubbeld. De specifieke sequentie wordt dus exponentieel vermenigvuldigd. Hierdoor is deze sequentie in een zodanige overmaat aanwezig in het mengsel dat je bij volgende handelingen kan stellen dat je enkel dit stukje van het DNA bekijkt (40).
21
3.3.2 Materialen -
DNA-stalen van patiënten
-
Enhancer oplossing (Invitrogen)
(geïsoleerd in het CMGG door
-
HPLC-H2O
middel van PureGene extractie,
-
PCR - toestel; 2720 thermal cycler (Applied Biosystems)
QIAgen) -
-
10x buffer (Invitrogen): 20mM
Tips: gefilterd (pre-PCR,
Tris-HCL (ph8.4) 500mM KCl
OMNITIP), niet gefilterd (post-
(zonder voor Enhancer mix)
PCR, Molecular BioProducts)
-
dNTPs, 1mM (Healthcare)
-
PCR-plaat; 96-well (ABgene)
-
MgCl2 of MgSO4 50mM (voor
-
Epjes (BioScience)
Enhancer mix, Invitrogen)
-
Seal: AB-0558 (ABgene)
Forward en reverse primers
-
Vortex (VWR)
(Invitrogen)
-
Centrifuge 5415D (Eppendorf)
-
DMSO (Vel)
-
Handschoenen (Romea)
-
Platinum Taq polymerase, 5U/µl
-
(Invitrogen)
3.3.3 Methode PCR is een zeer gevoelige techniek en dus gevoelig voor contaminatie. Om dit te vermijden, werkt men in 2 aparte ruimtes: pre- en post-PCR. In pre-PCR gebeuren de voorbereidingen van de PCR-reactie. Ook draagt men net zoals in post-PCR handschoenen en een labojas. In post-PCR staan de PCR-toestellen en worden alle post-PCR behandelingen uitgevoerd. Het uiteindelijke PCR-product bevat een zeer hoge concentratie aan DNA moleculen, dit kan voor contaminatie zorgen. Daarom worden andere labojassen gebruikt dan in pre-PCR, en worden er geen producten van post-PCR naar pre-PCR verplaatst. Alle primers, condities en PCR programma’s die gebruikt werden in dit onderzoek zijn terug te vinden in Bijlage 2. 3.3.3.1 Primer ontwerp Om de coderende regio van een gen te sequeneren beoogt men de exonen en de intronexongrenzen van de mogelijke transcripten te analyseren. In Ensembl vindt men de verschillende transcripten terug. Het grootste transcript dat geëxpreseerd wordt in het weefsel van interesse met eventuele bijkomende exonen kan gebruikt worden als template om de primers te ontwerpen (41). Dit gebeurt met Primer3Plus (42), een programma dat primers
22
ontwerpt rond een geselecteerde regio met de ingestelde voorwaarden. In dit onderzoek werden de primers steeds rond de exonen inclusief de intron-exon grenzen ontworpen. Ingestelde voorwaarden zijn een smelttemperatuur rond de 60°C, een GC gehalte tussen de 40 – 60% , de lengte van de primers ongeveer 20 bp en het PCR product niet langer dan 500 bp. Primer3Plus geeft enkele mogelijke primerparen. Men kiest een paar dat zo weinig mogelijk met zichzelf of met gelijk welke andere sequentie aanhecht. Als laatste controleert men of deze primerparen geen aspecifieke PCR producten opleveren (PrimerBlast, UCSC). Primerparen mogen ook niet op SNPs gelegen zijn (UCSC, Ensembl). Indien dit toch zo is, zal de primer minder goed annealen op een sequentie die de SNP bevat. Hierdoor zal in een patiënt enkel de streng zonder SNP goed geamplificeerd worden. 3.3.3.2 Mix maken De juiste hoeveelheid epjes (aantal primerparen) wordt klaargezet en gemarkeerd. Alle stoffen worden gevortext en afgedraaid in de centrifuge. Enzymen worden enkel afgedraaid (gevoelig aan afbraak). In de epjes worden alle stoffen samengevoegd behalve het DNA, beginnend met het grootste volume en eindigend met Taq polymerase (gevoelig voor afbraak). De mix wordt kort gevortext en afgedraaid. 3.3.3.3 Uitverdelen van de mix en het DNA De 96-well plaat wordt aan de onderkant voorzien van een opschrift (naam gen, datum en initialen). De juiste hoeveelheid mix (totaal volume van het PCR product min de hoeveelheid DNA) wordt uitverdeeld in de 96-well plaat. In elke well wordt DNA toegevoegd. De plaat wordt afgedekt met een seal. In post-PCR wordt de plaat in het PCR toestel geplaatst, het PCR-programma gekozen en het juiste volume ingesteld.
3.4 Agarose gelelektroforese 3.4.1 Principe Gelelektroforese is een techniek die toelaat om DNA fragmenten volgens grootte te scheiden. Hiermee kan men ook de specificiteit en opbrengst van een PCR reactie nagaan en kan contaminatie uitgesloten worden. Een agarosegel wordt een netwerk waarvan de grootte van de poriën wordt bepaald door de concentratie van agarose. Hoe hoger deze concentratie, hoe kleiner de poriën. Men laat DNA moleculen door deze poriën bewegen door een elektrische gradiënt over de gel te plaatsen. DNA moleculen zijn namelijk negatief geladen bij neutrale pH door de vele fosfaatgroepen. 23
DNA verplaatst zich over de elektrische gradiënt van de negatieve naar de positieve pool. De kleinere DNA fragmenten zullen sneller een weg banen tussen de poriën van de agarosegel. Na het wegnemen van de elektrische gradiënt zullen de kleinere fragmenten verder gemigreerd zijn door de gel dan de grote (40).
3.4.2 Materiaal -
Agarose (Invitrogen)
-
1x TBE buffer; ph 7.5- 7.8
-
Elektroforesebak met elektroden (BioRad)
(10xTBE buffer; 0.1Mtris, 0.9M
-
Gelhouder met kammen (BioRad)
boric zuur, 0.01M EDTA
-
Stroombron (BioRad)
Invitrogen)
-
UV-lichtbron (Syngene)
-
Ethidiumbromide (EtBr) (Sigma)
-
Digitale camera (Canon)
-
Ladingsbuffer: mix van 500 µl
-
Microgolfoven (DAEWOO)
glycerol, 250 µl bromofenol (1%)
-
Handschoenen (KleenGard G10)
en 250 µl xyleenglycol (1%)
-
Microtiterplaat (Greiner-bio-one)
DNA-Ladder: Reddy Run
-
Erlenmeyer 500 ml
-
SuperLadder low 100bp (100-1000 bp) (ABgene)
3.4.3 Methode EtBr intercaleert tussen het DNA, waardoor dit een carcinogene stof is. Agarose geleletroforese wordt om deze reden in een apart lokaal uitgevoerd. Hier dient men speciale handschoenen en labojas te dragen. Afval wordt verwijderd in een afgesloten zak. 3.4.3.1 Gieten van de gel Om een 2% agarosegel te maken met 250ml 1xTBE buffer, weegt men 5 g agarose af. Voor 0.8% is dit 2 g voor 250ml. De agarose wordt in een erlenmeyer opgelost en 1,5 tot 2 minuten in de microgolfoven geplaatst, tot het kookpunt net bereikt is. Onder stromend koud water laat men de oplossing afkoelen tot 50-60 5°C. Per 50 ml oplossing voegt men 1 druppel EtBr toe. Met een draaiende beweging meng je de oplossing voorzichtig. De agaroseoplossing giet je voorzichtig in de gelhouder met kammen. Dit alles laat men nu 15 à 20 minuten afkoelen bij kamertemperatuur, hierbij neemt de agarose zijn gelstructuur aan.
24
3.4.3.2 Gel laden en lopen In een microtiterplaat elke well vullen met 2µl ladingsbuffer en 5µl DNA. De kammen verwijderen uit de opgesteven gel en deze in de elektroforesebak plaatsen. Deze wordt opgevuld met 1xTBE buffer tot de gel volledig ondergedompeld is. Per laantje wordt er 1 well met mengsel DNA en ladingsbuffer geladen en per rij 1 laantje met ladder. Het deksel op de elektroforesebak plaatsen en verbinden met de stroombron, op 135V voor 30-45 minuten. 3.4.3.3 Gel bekijken en foto nemen De gelhouder wordt uit de elektroforesebak gehaald en of de UV-lichtbak geplaatst. Het plexiglas ter bescherming dient over de gel geplaatst te worden vooraleer de UV-lichtbak aangeschakeld kan worden. Zo kan de gel manueel bekeken worden. Om een foto te nemen, dient de digitale camera over de gel geplaatst te worden, de UV-lichtbak aangeschakeld en vervolgens kan men een foto nemen.
3.5 Koppelingsanalyse aan de hand van microsatellietmerkers 3.5.1 Principe 3.5.1.1 Microstatellietmerkers Microsatellietmerkers zijn korte herhalingen van 1 tot 5 basen die at random voorkomen in het volledige genoom. Ze ontstaan door polymerase of DNA slippage. Tijdens DNA replicatie ontstaat een mispair tussen de nieuwe en de bestaande DNA streng; de DNA streng vormt dan een soort lusstructuur. Als de lus op de nieuwe DNA streng aanwezig is, ontstaat een extra herhaling. Indien de lus zich vormt op de oude streng, zal de nieuwe streng een herhaling minder hebben (Figuur 17). Hoe langer de herhaling, hoe groter de mispair tussen de twee strengen. Dit verklaart waarom grotere herhalingen minder voorkomen en stabieler zijn. DNA mispair wordt herkend door het DNA mispair repair systeem en hersteld. Hierdoor komt DNA slippage niet zo vaak voor. Toch is verandering van het aantal herhalingen 10 000 keer meer waarschijnlijk dan een basepaarverandering in een gen (43). Microsatellietmerkers zijn dus minder stabiel dan SNPs, hierdoor hebben ze een grotere variabiliteit. Ze liggen echter minder verspreid over het genoom en de mogelijkheid om “high troughput” te werken zijn beperkt. Hierdoor zijn ze minder geschikt om genoomwijde analyse uit te voeren. In deze toepassing gebruikt men microsatellietmerkers enkel om koppeling van een geselecteerde locus na te gaan in zowel niet-aangetaste als aangetaste familieleden. De hoge variabiliteit zorgt er ook voor dat microsatellietmerkers kunnen variëren tussen verschillende generaties, 25
maar dit is relatief zeldzaam. Hiermee moet zeker rekening gehouden worden als men patiënten bekijkt uit een consanguin huwelijk waarvan de gemeenschappelijke voorouder vele generaties verwijderd is van de proband. Om segregatie goed te kunnen nagaan, bekijkt men niet 1 merker maar een reeks opeenvolgende merkers om zo haplotypes te kunnen bepalen (44).
Figuur 17: Ontstaan van verschillen in nucleotideherhalingen door DNA slippage (27) Tijdens DNA replicatie kan in een nucleotideherhaling een mispair ontstaan tussen de nieuwe (blauwe) en de oude (zwarte) streng. Hierbij ontstaat een lusstructuur waardoor de lengte van de herhaling verandert. Vormt de lus zich op de nieuwe streng (backward slippage), dan krijgt deze een extra herhaling. Ontstaat de lus op de oude streng (forward slippage), dan zal de nieuwe streng een herhaling minder bevatten.
3.5.1.2 Koppeling Door koppelingsanalyse verfijnt men de homozygote regio’s gevonden door middel van SNP genotypering. Koppelingsanalyse steunt op de volgende basisprincipes: 1) Op een bepaalde locus moet elk parentaal allel een even grote kans hebben om aan het kind te worden doorgegeven. 2) Men gaat uit van random recombinatie, dus hoe dichter twee loci bij elkaar liggen, hoe groter de kans dat ze samen worden overgeërfd. In consanguine families zullen microsatellietmerkers die gekoppeld zijn met het ziektegen preferentieel homozygoot voorkomen bij nakomelingen die aangetast zijn. Merkers die ver van het ziektegen gelegen zijn worden random homozygoot overgeërfd tussen niet en wel aangetaste familieleden. In het algemeen kan men met de LOD score bepalen of koppeling significant is. Dit is het logaritme van de odds ratio, dit is de ratio van de kans dat er 26
koppeling is met de geobserveerde recombinatie fractie ten opzichte van de kans dat er geen koppeling is. Een LOD score van 3 betekent dat de kans op koppeling 1000 maal groter is dan dat de merkers co-segregeren op basis van toeval, en wordt als significant beschouwd. (44). In de regio’s die koppeling vertonen, worden kandidaatgenen gezocht. Koppelingsanalyse wordt uitgevoerd op alle beschikbare familieleden. Hierbij amplificeert men de merkers met primers die de herhaling flankeren. De lengte van een fluorescent gemerkt PCR product wordt door capillaire elektroforese gescheiden en gedetecteerd met een laser. Het fluorescent labelen van individuele primers voor elke merker is duur. Daarom maakt men gebruik van een nested PCR methode (45). De F- en R-primers zijn ampliconspecifiek, de F-primer bezit nog een M13-staart. In de PCR-mix dient de hoeveelheid Fprimer ongeveer een vierde van de R-primer te zijn, de fluorescente M13-primer wordt in dezelfde hoeveelheid als de R-primers toegevoegd. Tijdens de eerste cycli van de PCR ontstaat er een product dat tussen de F- en de R- primer ligt. De template bevat aan het 5’ uiteinde de M13 sequentie. Doordat de F-primer maar in beperkte hoeveelheid aanwezig is, dienen in de volgende cycli de ingebouwde M13-staarten als template voor de fluorescente M13 primer. De aanhechtingstemperatuur van M13 is slechts 53°C, er moeten minstens 8 cycli op 53°C of minder gelopen worden (Figuur 18).
Figuur 18: Nested PCR om PCR product fluorecent te labelen (45) Om niet alle primers fluorescent te moeten labelen, kan men gebruik maken van nested PCR. Bij de eerste PCR cycli (D) word het DNA geamplificeerd met de forward (A) en reverse (B) primer die sequentie-specifiek zijn. De forward (A) heeft een M13 staart aan het 5’ uiteinde. In de PCR mix wordt de forward (A) primer in ondermaat toegevoegd. Na enkele cycli (E) is deze opgebruikt, de reactie gaat verder met de M13-primer (C) en de reverse primer. De M13-primer kan binden op de M13-sequentie die in het PCR product aanwezig is dankzij de M13-staart van de forward (A) primer. De M13-primer (C) is fluorescent gelabeld waardoor het PCR product dit ook is (F).
27
3.5.1.3 Scheiden en detecteren van fragmenten via capillaire elektroforese Fragmentanalyse scheidt DNA-fragmenten volgens lengte en bepaalt hun grootte. Dit gebeurt met de ABI 3730xl (96 capillairen) of ABI 3130xl (16 capillairen) DNA analysers (Applied Biosytems) die fluorescent gelabelde DNA fragmenten kunnen scheiden en detecteren. De capillair wordt geïnjecteerd met gedenatureerde fluorescente DNA fragmenten. Deze worden over een elektrische gradiënt gescheiden in de capillair. Langere fragmenten binden beter aan het polymeer dat zich aan de wand van de capillair bevindt, en migreren dus trager. Als de fragmenten voorbij het detectievenster komen, worden ze bestraald met een laser. Ze geven hun fluorescentie vrij en dit detecteert men met een CCD camera. Door het gebruik van een interne grootte standaard kan de grootte van de fragmenten bepaald worden (46).
3.5.2 Materiaal DNA-stalen van patiënten
-
Seal: AB-0558 (Abgene)
(geïsoleerd in het CMGG door
-
Vortex (VWR)
middel van PureGene extractie,
-
Centrifuge 5415D (Eppendorf)
QIAgen)
-
Handschoenen (Romea)
-
10x buffer (ROCHE)
-
Hi-DiTM formamide (Applied
-
dNTPs, 1mM (Healthcare)
-
MgCl2, 50mM (ROCHE)
-
Forward en reverse primers
-
Biosystems) -
merkers tussen 35-500bp -
(Invitrogen) -
3’) (Invitrogen) Platinum Taq polymerase (Invitrogen) -
HPLC-H2O
-
PCR - toestel; 2720 thermal cycler (Applied Biosystems)
-
Tips: gefilterd (pre-PCR, OMNITIP), niet gefilterd (postPCR, Molecular BioProducts)
-
PCR-plaat; 96-well (Abgene)
-
Epjes (BioScience)
ABI3730xl of ABI3130xl (Applied Biosystems)
M13 primer (5’CACGACGTTCTAAAACGAC
-
Rox500 (Applied Biosystems), 16
28
3.5.3 Methode 3.5.3.1 Selectie van geschikte merkers De merkers worden gezocht met MapViewer van NCBI bij Homo sapiens, build 36.3 (47). Men geeft een regio op die 1 Mb vroeger start en later stopt dan de gevonden regio. Dit omdat MapViewer de merkers sorteert op cM en die volgorde kan verschillen afhankelijk van de gebruikte genetische mappen. In het tabblad Maps and Options kiest men voor de genetische mappen Decode, Genethon, Marshfield en de optie Genes. Per merker houdt men de volgende gegevens bij: naam, start en einde (bp, fysische positie), positie volgens DeCode, Genethon en Marshfield (cM, genetische positie), F en R primer, lengte PCR product, type herhaling en genen die in de buurt van deze merkers liggen. Merkers die geen variabel PCR product hebben of een aspecifiek product geven, worden niet gebruikt. Uit de aangelegde lijst van merkers worden enkele merkers gekozen die zo goed mogelijk verspreid liggen in de gekozen regio, en zo heterozygoot mogelijk zijn (gebaseerd op de lengte van het PCR-product). 3.5.3.2 Fragmentanalyse Nested PCR wordt uitgevoerd met de forward en reverse primer rond de microsatelliet merker en een fluorescente M13-primer. Methode: zie 3.3.3, condities Bijlage 2.1. De staalnamen en primers worden ingeven in RunEditor (48). Mix maken van 8,5 µl Hi-DiTM formamide (denaturatie door destabilisatie van de waterstofbruggen) en 0,5 µl Rox500 per staal (grootte standaard). 9 µl mix uitverdelen en 1µl DNA toevoegen. Hi-DiTM bevat formamide, met dit product wordt altijd in de trekkast gewerkt. Stalen worden afgeven aan de Genetic Service Unit (GSU) waar ze op de capillair ABI 3730xl of ABI 3130xl worden geladen. 3.5.3.3 Data-analyse met GeneMapper De ruwe data analyseert men met GeneMapper version 3.7(Applied Biosystems) met analyse methode microsatellite default en grootte standaard GS500. In GeneMapper bekijk je alle familieleden merker per merker door alle familieleden te selecteren en op “display plots” te klikken. In een nieuw scherm verkrijg je per familielid een plot van de geselecteerde merker. Op de X-as staat de grootte van het fragment, op de Y-as de intensiteit van het signaal. De plot bestaat uit verschillende pieken. De rode pieken zijn afkomstig van de interne grootte standaard en laten toe om de grootte van het fragment te bepalen. De verschillende fragmenten van de merker worden weergegeven als blauwe pieken. De pieken van twee verschillende allelen zijn altijd een veelvoud van de herhaling van elkaar gescheiden. Kleine 29
herhalingen zijn gevoelig aan slippage en vertonen hierdoor stotterpieken. Deze zijn altijd kleiner dan de piek die het allel voorstelt en liggen altijd een veelvoud van de herhaling naar links. Taq polymerase verlengt soms het 3’ uiteinde met een extra A. Deze piek ligt altijd 1 plaats rechts van de allelische piek en kan zowel groter als kleiner zijn (Figuur 19). Door de juiste allelische pieken te identificeren weet men of de persoon homo- of heterozygoot is voor die welbepaalde microsatelliet en hoelang de herhaling is. De verschillende lengtes van de herhalingen krijgen een allelnummer. Dit gebeurt voor alle merkers bij alle familieleden. In het stamboomprogramma Progeny (Progeny Software Inc.) worden alle allelnummers uitgezet op een stamboom en kan men haplotypes van verschillende merkers interpreteren. Indien een regio wordt gevonden die een homozygoot haplotype vertoont in alle aangetaste familieleden en waar ditzelfde haplotype niet homozygoot aanwezig is bij niet-aangestaste familieleden, gaat men over op selectie van kandidaatgenen.
Figuur 19: Plots GeneMapper GeneMapper analyseert de fragmenten van de microsatellietmerkers aan de hand van hun grootte. Op de X-as staat de grootte van de pieken, op de Y-as de intensiteit. De rode pieken zijn afkomstig van de interne lengte standaard, de blauwe zijn de allelische pieken met hun +A en stotterpieken.
30
3.6 Selectie van kandidaatgenen Het selecteren van kandidaatgenen kan onmiddellijk na SNP analyse gebeuren of na koppelingsanalyse met microsatellieten. Koppelingsanalyse wordt uitgevoerd als er meerdere familieleden ter beschikking zijn. Is er enkel DNA van de proband, dan wordt er na SNP analyse onmiddellijk overgegaan tot selectie van de kandidaatgenen.
3.6.1 Selectie van gekende ziektegenen na SNP analyse Bij het selecteren van loci na SNP analyse wordt een lijst opgesteld van alle gekende genen en loci die een gelijkaardig fenotype veroorzaken (Bijlage 5). Voor elk gen wordt nagegaan of het in een homozygote regio ligt. De genen die in een homozygote regio liggen, worden gesequeneerd, prioritair diegene die in de grootste regio liggen. Indien er geen gekende ziektegenen in homozygote regio’s liggen, zie 3.6.2.
3.6.2 Selectie van kandidaatgenen na microsatellietanalyse In de regio waar koppeling aangetoond is door middel van microsatellietanalyse of in een homozygote regio gevonden door SNP genotypering, zal via genomische databanken (UCSC, NCBI, Ensembl) (41, 49, 50) gekeken worden welke genen er aanwezig zijn. Vervolgens zullen genen geselecteerd worden als kandidaatgenen op basis van de volgende criteria: functie (visuele cyclus, fototransductiecascade), expressieprofiel (oog, retina, fotoreceptoren, RPE), rol in andere retinale aandoeningen of ciliopathieën, interactie met gekende eiwitten en mutaties in diermodellen die een gelijkaardig ziektebeeld geven. Functionele kandidaatgenen worden gesequeneerd.
3.7 Sequenering 3.7.1 Algemeen principe Sequeneren gebeurt via de Sanger (dideoxy terminatie) methode. Deze methode is gebaseerd op thermische cycli, met een mix van één primer, dNTPs en fluorescente ddNTP. Elke ddNTP heeft een andere fluorescente kleur. ddNTPs missen de 3’OH groep waarop de volgende dNTP normaalgezien bindt. Hierdoor kan het polymerase geen moleculen meer inbouwen nadat er een ddNTP is ingebouwd (terminatie). Door de ddNTPs in lage concentratie toe te voegen, worden ze maar sporadisch ingebouwd. De sequentie wordt dus vanaf de primer verlengd tot er op een willekeurige plaats een ddNTP wordt ingebouwd. Hierdoor krijgt men
31
fragmenten met verschillende lengte (Figuur 20), die gescheiden kunnen worden door middel van een capillaire gelelectroforese (zie 3.5.1.3) (27, 40).
Figuur 20: Sequeneren volgens Sanger (40)
De sequentie wordt geëlongeerd vanaf de primer. Op willekeurige plaatsen wordt een ddNTP ingebouwd in plaats van een dNTP (terminatie). Men krijgt fragmenten van verschillende lengte. Na scheiding door elektroforese kent men de exacte volgorde van de nucleotiden.
3.7.2 Sequenering door Genetic Service Unit of GSU GSU is een beschikbare sequeneringsfaciliteit van het CMGG voor onderzoeksgroepen binnen de Universiteit Gent. De PCR-producten moeten opgezuiverd worden voor men de sequeneringsreactie uitvoert. Deze stappen worden automatisch uitgevoerd door de robots ALH-3000 (Caliper) en ALH-4000 (Caliper). Men kan deze reacties ook zelf manueel uitvoeren en het sequeneringsproduct afgeven om te laten analyseren (just run) (48). De sequentie wordt gegenereerd door middel van capillaire elektroforese, (zie 3.5.1.3) op de ABI-3130xl ABI-3730xl analysers (Applied Biosystems). 3.7.2.1 Manuele enzymatische opzuivering PCR product Het overblijvend enkelstrengig DNA (primer overschot) wordt geïnactiveerd door fosfatasen, vervolgens afgebroken door exonucleasen. Bij 5µl PCR product wordt 0.05µl Exonuclease I (20000U/ml, New England Biolabs, M0293S), 0.20µl antarctic fosfatase (5000U/ml, New England Biolabs M0289S) en 0.75µl water toegevoegd. Het reactiemengsel wordt achtereenvolgens 15 min bij 37°C, 20 min bij 80°C en 1 min bij 4°C in de PCR blok geplaatst.
32
3.7.2.2 Manueel sequeneren De reactie mix bestaat uit 2µl sequeneringsbuffer (5X buffer, BigDye Terminator v3.1), 2µl primer (1µM), 1µl opgezuiverd PCR product, 0.5µl ready reaction mix (BigDye Terminator v3.1, bevat dNTPs en fluorescente ddNTPs), 0.5µl DMSO en 4µl water. Dit reactiemengsel wordt ook in een PCR blok geplaatst: 25 cycli, 10 sec bij 92°C, 5 sec bij 55°C en 4 min bij 60°C. 3.7.2.3 Manueel opzuiveren van het sequeneringsproduct via precipitatie Door middel van deze opzuiveringsstap wordt de kwaliteit van de sequenties verhoogd. Per 10µ l reactie wordt 40µl oplossing toegevoegd (1.5 µl NaOAc [pH 4.6], 31.25 µl 95% ethanol en 7.25 µl H2O). Na 15 s vortexen worden de platen 40 min afgedraaid bij 3700 tpm. DNA wordt neergeslaan in ethanol. Het supernatans wordt verwijderd door met de platen omgekeerd op papier te kloppen en af te draaien. Bij elk staal wordt nog 75µl 70% ethanol toegevoegd. Na 15 sec vortexen, worden de platen 10 min afgedraaid bij 3700 tpm. Het supernatans wordt op dezelfde manier verwijderd als hierboven. De laatste resten ethanol worden verwijderd door 1 min bij 90°C te drogen. Het DNA wordt opnieuw opgelost door middel van Hi-Di formamide. Dit werkt tevens denaturerend. Na goed vortexen en afdraaien volgt nog een korte denaturatiestap van 1 à 2 min bij 90°C. Dit product ondergaat capillaire electroforese. 3.7.2.4 Finch Finch (Geospiza) is een online management systeem dat door de GSU gebruikt wordt om alle aanvragen en data geordend bij te houden. Deze software is op de site van het CMGG beschikbaar. Finch is opgebouwd in drie niveaus: Labgroup > Project > Folder. Labgroup en Project worden door GSU administrators zelf aangemaakt. Folders kunnen door de gebruiker aangemaakt en geordend worden. Met een login kan men een aanvraag indienen en eigen data bekijken.
3.7.3 Data-analyse met SeqScape De sequentie die bekomen wordt met middel van capillaire electroforese wordt in het programma SeqScape (Applied Biosystems) vergeleken met een referentiesequentie. Hiervoor heeft men een referentiesequentie en testsequentie nodig.
33
3.7.3.1 Aanmaak van referentie sequentie De referentiesequentie vindt men in GenBank (NCBI) of Ensembl (41, 51). Bij meerdere transcripten gebuikt men het transcript waarop de primers gebaseerd zijn. Reference data group (RDG) vindt men onder SeqScape manager, hierin plaatst men de referentiesequentie samen met gen- en analysespecifieke informatie. De referentiesequentie wordt ingeladen via Add Ref. Segment (GenBank) of Past Ref. Segment (Ensembl). Via tabblad ROI zie je de volledige sequentie. Dit is layer 1, in een tweede layer duidt men de exonen, intronen, 5’ en 3’ UTRs aan. Deze referentiesequentie kan gebruikt worden om het sequentieproduct te analyseren. 3.7.3.2 Analyseren van sequentie Via add samples laadt men per patiënt het sequentieproduct in SeqScape. Na het opslaan laat men het programma analyseren. Na analyse bekijkt men de sequentie. SeqScape duidt aan op welke plaatsen de sequentie niet goed leesbaar is en welke nucleotiden verschillen van de referentiesequentie. 3.7.3.3 Evaluatie sequentieveranderingen Evaluatie van sequentieveranderingen gebeurt via in het programma ALAMUT, waarin sequentieveranderingen volgens de HGVS nomenclatuur worden weergegeven (52). ALAMUT (Interactive Biosoftware) geeft aan of de sequentieverandering een gekende variant is. Als de sequentieverandering geen SNP is, moet er vervolgens worden nagegaan wat de invloed is van de deze verandering op het eiwit. Via ALAMUT kunnen gemakkelijk verschillende online predictie-algoritmen geraadpleegd worden (missense verandering: PolyPhen, SIFT, Alingn GVGD; intronische mutaties: SpliceSiteFinder, MaxEntScan, GeneSplicer; silent mutaties: ESE finder) (52, 53). Verder geeft ALAMUT ook de Grantham afstand die betekenisvol kan zijn indien deze groter is groter is dan 60 (54). Het belang van een sequentieverandering kan ook via de literatuur worden nagegaan. Op basis van de verschillende predicties wordt besloten of de variant polymorfisme, unclassified variant dan wel een causale mutatie is. Bij een nonsense of frameshift mutatie kan men in de meeste gevallen aannemen dat deze pathogeen zijn.
34
4 Resultaten en discussie Alle ruwe data die via DNAVision werden bekomen, werden geanalyseerd met het in huis ontwikkelde Perl programma (S. Lefever, ongepubliceerde data). Dit leidde tot de identificatie van homozygote regio’s van minimum 100 kb groot. Heterozygote SNPs die omringd werden door een homozygote regio van minimum 50 kb, werden toegelaten in een homozygote regio om mogelijke fouten bij het aflezen van de chip te corrigeren. In dat geval kunnen heterozygote SNPs aanzien worden als homozygoot. In een aantal families werd microsatellietanalyse uitgevoerd met merkers gelegen in homozygote regio’s. Het selecteren van kandidaatgenen gebeurde ofwel onmiddellijk na SNP analyse of na koppelingsanalyse met microsatellieten. Relevante geselecteerde kandidaatgenen werden onderzocht door sequentie-analyse.
4.1 Familie A: De ouders van de indexpatiënt zijn in de 5de graad verwant. Er kan verwacht worden dat hun kinderen kleine homozygote regio’s hebben in hun genoom. Er zijn 6 generaties tussen de siblings en de gemeenschappelijke voorouder van de ouders. Volgens de vuistregel (2.3.1) zal het causaal gen gelegen zijn in een regio van ongeveer 17 Mb. Deze vuistregel is gebaseerd op families met een achtergrond van consanguiniteit. Er is in deze familie echter geen sprake van meerdere consanguine lussen. Bovendien werden twee patiënten met elkaar vergeleken. Dit leidde tot de identificatie van kleinere homozygote regio’s dan verwacht.
4.1.1 Homozygositeitsmapping In deze familie van Belgische origine werd het nieuwe beschikbare protocol voor data analyse van de SNP chips voor de eerste keer uitgetest, en werden de vooropgestelde criteria geëvalueerd. Twee patiënten van deze familie (II:1 en II:3) ondergingen SNP chip analyse. De output van Perl werd per chromosoom bekeken. Alle regio’s die dicht bij elkaar lagen, werden samen genomen. Hier werd als minimum grootte 100 kb gebruikt en 100 kb rond een heterozygote SNP. Dit laatste werd in de volgende families veranderd naar 50 kb omdat er te veel regio’s dienden samen genomen te worden. Zoals verwacht, werden in deze siblings kleine gemeenschappelijke homozygote regio’s aangetroffen. In eerste instantie werd gesorteerd op de grootte van de regio. Regio’s 1, 2 en 3 op respectievelijk chromosoom 7, 16 en 19 zijn groter dan 10 Mb, wat minimum 5 Mb groter is dan de overige homozygote regio’s (Bijlage
35
3). Voor deze regio’s werd microsatellietanalyse uitgevoerd op alle sibs, maar geen enkele van deze regio’s bleek gekoppeld te zijn (Tabel 3, Bijlage 4). Aangezien de grootste regio’s niet gekoppeld bleken, werd de strategie gewijzigd: er werd namelijk geopteerd om minder microsatellietmerkers in veel verschillende regio’s te analyseren, eerder dan veel merkers in weinig regio’s te onderzoeken. Bij de keuze van de regio’s werd bovendien ook gekeken naar het aantal en de allelfrequentie van de SNPs. Zo werden nog 11 regio’s geselecteerd voor microsatellietanalyse (Tabel 3). Geen enkele van deze regio’s bleek gekoppeld met het CACD fenotype in deze familie.
Koppeling Geen
152.765.482
18
Geen
D19S222
33.154.482
6
Geen
49.699.157
D8S1815
54.065.270
3
Geen
D1S253
7.063.791
D1S1635
10.933.589
4
Geen
234
D2S342
195.519.979
D2S316
197.748.829
3
Geen
1.950.949
212
D6S1651
46.593.594
/
48.544.543
1
Geen
1
1.744.331
48
D1S1597
12.075.775
/
13.820.106
1
Geen
9
1
1.593.758
104
D1S2626
102.516.897
/
104.110.655
1
Geen
10
6
1.528.143
207
D6S388
29.502.406
/
31.030.549
1
Geen
11
1
1.515.206
71
D1S421
44.651.136
D1S451
46.166.342
2
Geen
12
5
1.358.135
108
D5S1473
22.748.614
D5S813
24.106.749
2
Geen
13
1
1.327.815
62
D1S498
148.978.520
D1S2343 150.306.335
2
Geen
14
7
1.061.760
91
D7S2452
132.552.341
D7S631
3
Geen
N°
Chromosoom
Lengte in bp
# SNPs
Eerste merker
Start regio
1
16
15.727.839
158
D16S3120
31.767.900
2
7
14.829.970
982
D7S800
137.935.512
D7S550
3
19
11.938.418
252
D19S911
21.216.064
4
8
4.366.113
482
D8S1745
5
1
3.938.779
226
6
2
2.228.850
7
6
8
Stop regio
10
Laatse merker
Aantal merkers
Tabel 3: De homozygote regio’s die met microsatellietanalyse werden onderzocht in familie A
D16S3137 47.495.739
133.614.101
De regio begint bij de SNP voor de eerste homozygote SNP en eindigt met de eerste SNP na de laatste homozygote SNP. # SNPs zijn het aantal SNPs die hiertussen liggen. Dit is van toepassing op alle hiernavolgende tabellen (tot en met Tabel 8). Regio 1 werd samengesteld uit verschillende kleinere regio’s die bij elkaar aansluiten.
In deze familie werd het causaal ziektegen niet gevonden. De homozygote regio’s die niet door middel van microsatellietanalyse werden onderzocht, zijn zo klein dat het onderscheid tussen significante regio’s en niet significante regio’s moeilijk te maken is. Bovendien zijn in deze kleine regio’s minder of geen microsatellietmerkers te vinden. Er werd geopteerd om deze niet verder te onderzoeken. Een verklaring waarom geen gekoppelde homozygote regio werd aangetroffen, kan zijn dat men niet kan uitsluiten dat de aangetaste patiënten samengesteld heterozygoot zijn voor 36
mutaties in het causale ziektegen, ondanks de consanguiniteit van de ouders. Een kritische herevaluatie van het fenotype, de klinische status van de onderzochte individuen en het overervingspatroon zijn noodzakelijk alvorens deze familie verder te onderzoeken. De bezorgheid bestaat dat niet één, maar verschillende onafhankelijke fenotypes segregeren in deze familie. De klinische status in een aantal beschikbare individuen werd niet geëvalueerd door de doorverwijzende arts, maar toegewezen op basis van aanwijzingen van de proband. Alhoewel eerder onwaarschijnlijk, is het niet uit te sluiten dat in deze familie een dominant fenotype segregeert. Dit kan verklaard worden door gonadaal en somatisch mosaïcisme in één van de ouders, of door non-penetrantie van een dominante mutatie.
4.2 Familie B: De ouders van de proband zijn first cousins. De aangetaste individuen zijn drie generaties verwijderd van de gemeenschappelijke voorouder. Volgens de vuistregel is te verwachten dat het causale ziektegen in een homozygote regio van ongeveer 33 cM gelegen is. Door de verschillende aangetaste familieleden met elkaar te vergelijken, kon een bijkomende reductie van de kandidaatregio verwacht worden.
4.2.1 Homozygositeitsmapping In eerste instantie was er enkel DNA van IV:10 beschikbaar, waarop SNP chip analyse werd uitgevoerd. In de proband werd op chromosoom 22 een homozygote regio van meer dan 28 Mb (2039 SNPs) gevonden. In deze regio ligt TIMP3 (ENST00000266085), een gekend ziektegen van 5 exonen voor Sorsby maculaire dystrofie (8). Er werden geen TIMP3 mutaties gevonden na sequenering van de exonen en exon-intron grenzen. Hierna was ook het familielid IV:4 ter beschikking voor SNP chip analyse. Met Perl werden de data van IV:10 en IV:7 vergeleken en de regio op chromosoom 22 bleek niet meer aanwezig te zijn in de grote homozygote regio’s. De grootste gemeenschappelijke homozygote regio was een regio van ongeveer 24 Mb (2255 SNPs). Microsatellietanalyse met 6 merkers in deze regio werd uitgevoerd in de beschikbare aangetaste en gezonde individuen, en was niet volledig conclusief voor exclusie van koppeling (Figuur 21).
37
Figuur 21: Microsatellietanalyse voor de homozygote regio op chromosoom 15 Microsatellietanalyse met D15S994, D15S123, D15S978, D15S1016, D15S1029 en D15S155. IV:4 en IV:10 zijn aangetast en homozygoot, IV:6 voor de eerste 5 merkers ook maar is niet aangetast. IV:7 is wel aangetast maar niet homozygoot tenzij voor de 6de merker. Koppeling van deze locus met CACD in familie B is onwaarschijnlijk.
Hierna werd SNP chip analyse uitgevoerd in de aangetaste IV:7. Na vergelijken van de 3 patiënten vond Perl 3565 homozygote regio’s van minimum 100 kb groot inclusief heterozygote SNPs. Slechts 9 van deze regio’s waren groter dan 5 Mb, waaronder enkele weinig informatieve regio’s met weinig SNPs (Tabel 4). Vijf van deze regio’s bevatten meer dan 500 SNPs, waarvan 1 meer dan 1000 SNPs. Regio 3 is samengesteld uit 3 verschillende aansluitende homozygote regio’s op chromosoom 3 (Tabel 4).
Positie stop
SNP stop
Positie start
SNP start
# SNPs
Lengte in bp
N°
Chromosoom
Tabel 4: Gemeenschappelijke homozygote regio’s van meer dan 5 Mb in familie B
1 1 22.689.930 8 SNP_A_2220590 120.887.054 SNP_A_4238570 143.576.984 2 16 13.573.590 52 SNP_A_2303925 31.767.900 SNP_A_1806103 45.341.490 3 3 14.300.919 1291 SNP_A_2267765 158.776.926 SNP_A_2267292 173.077.845 4 12 9.686.667 938 SNP_A_2264969 79.851.408 SNP_A_4201367 89.538.075 5 19 8.866.177 12 SNP_A_2145852 24.147.333 SNP_A_4196914 33.013.510 6 9 6.291.811 8 SNP_A_1835774 38.737.064 SNP_A_4225691 45.028.875 7 15 5.661.277 542 SNP_A_2190137 83.830.339 SNP_A_1930897 89.491.616 8 5 5.495.538 565 SNP_A_4211432 167.330.191 SNP_A_2205728 172.825.729 9 6 5.163.124 539 SNP_A_2067875 143.766.211 SNP_A_2194482 148.929.335 Regio’s die in vet gedrukt staan, werden onderzocht door middel van microsatellietanalyse.
38
Microsatellietanalyse werd eerst uitgevoerd voor regio 3 en 4. Het CEP290 gen ligt op chromosoom 12 in regio 4; 2 merkers werden zo gekozen dat ze deze regio omsluiten (>1 Mb). Er waren echter geen aanwijzingen voor koppeling (Figuur 22 en 23).
Figuur 22: Microsatellietanalyse voor regio 3 (chromosoom 3). Microsatellietanalyse met D3S3575, D3S3702, D3S3622 en D3S1564. Alle aangetasten zijn homozygoot voor deze merkers, gezond individu VI:2 is echter ook homozygoot voor deze merkers.
Figuur 23: Microsatellietanalyse voor regio 4 (chromosoom 12). Microsatellietanalyse met D12S1670, D12S81, D12S365, D12S1593, D12S1598, D12S1717, D12S351 en D12S1346. III:6 is homozygoot voor de eerste 6 merkers, waardoor deze niet informatief zijn. De laaste twee merkers werden buiten de regio gekozen. IV:4 heeft een ander paterneel haplotype dan IV:7 en IV:10, wat koppeling van deze locus met de aandoening onwaarschijnlijk maakt.
Regio’s 7, 8 en 9 waren de grootste overblijvende regio’s met meer dan 500 SNPs. Op chromosoom 15 in regio 7 ligt het RLBP1 gen. Dit is een gekend ziektegen voor ARRP en speelt een mogelijke rol in de visuele cyclus (55). Microsatellietanalyse werd uitgevoerd met
39
de merkers D15S202 en D15S1045, die op minder dan 1 cM gelegen zijn van dit gen. Er werd segregatie gezien van deze gekoppelde merkers met de aandoening, suggestief voor koppeling (Figuur 24).
Figuur 24: Microsatellietanalyse voor gekoppelde merkers met RLBP1 in regio 7 Er werd segregatie-onderzoek uitgevoerd met gekoppelde merkers D15S1045 en D15S202 (voor RLBP1). Alle aangetaste individuen (zwart) hebben hebben hetzelfde homozygoot haplotype, dit haplotype komt niet voor bij niet-aangetaste broers of zussen, wat suggestief is voor koppeling van deze merkers met CACD.
4.2.2 Sequeneren RLBP1 Primers voor het RLBP1 gen werden ontwikkeld op basis van de referentiesequentie ENST00000268125. Dit transcript bevat 9 exonen, waarvan de eerste twee, een deel van het derde en het laatste niet vertaald worden. De primers omvatten alle exonen en intron-exon grenzen. PCR amplificatie en sequentie-analyse werd geoptimaliseerd voor deze 9 exonen (10 amplicons). Er werden 6 sequentieveranderingen gevonden (zie Bijlage 6), geen van deze veranderingen zijn echter suggestief voor een causale mutatie. Als volgende stap zal segregatie-analyse voor de regio’s 7, 8 en 9 uitgevoerd worden, gevolgd door selectie en sequentie-analyse kadidaatgenen.
4.3 Familie C De gemeenschappelijke voorouder van de ouders van de indexpatiënt is langs maternele zijde 3 generaties verwijderd, langs de paternele 4 generaties. Volgens de vuistregel zou het causaal ziektegen in een regio tussen de 33 en 25 cM liggen. Indien geen consanguine achtergrond voorkomt in deze familie, kan de regio nog kleiner zijn.
40
4.3.1 SNP analyse In patiënt V:1 werden 3932 regio’s gevonden die aan de vooropgestelde criteria voldoen. Van deze regio’s zijn er 7 groter dan 5 Mb. De interessantste regio is regio 3 op chromosoom 1, die meer dan 22 Mb groot is en 2288 SNPs omvat (Tabel 5).
Lengte n bp
# SNPs
SNP start
1 2 3 4 5 6 7
1 9 1 16 19 8 2
24.127.190 25.248.365 22.775.305 15.403.142 8.880.202 7.974.100 8.259.258
41 8 2288 110 16 182 62
SNP_A-2198638 SNP_A-4228947 SNP_A-1840897 SNP_A-2243836 SNP_A-1951026 SNP_A-1915283 SNP_A-2268191
Positie stop
120.211.226 43.493.496 206.197.041 31.328.918 24.131.560 42.004.277 87.344.242
SNP stop
Positie start
N°
Chromosoom
Tabel 5: Homozygote regio’s van meer dan 5 Mb in familie C (indexpatiënt V:1)
SNP_A-1784125 SNP_A-1812761 SNP_A-1815960 SNP_A-4221710 SNP_A-1885880 SNP_A-4215323 SNP_A-2108592
144.338.416 68.741.861 228.972.346 46.732.060 33.011.762 49.978.377 95.603.500
In de regio die vet gedrukt staat, werden kandidaatgenen geselecteerd.
4.3.2 Selectie kandidaatgenen V:1 lijdt aan ARRP. Aangezien het fenotype van LCA en andere retinale dystrofieën (inclusief maculaire degeneratie) klinische overlap vertoont met ARRP, werden gekende ziektegenen verantwoordelijk voor deze fenotypes toegevoegd aan deze gekend voor ARRP (8)(lijst zie Bijlage 5) De positie van deze genen werd vergeleken met de positie van de homozygote regio’s. De RD3 en USH2A genen liggen in regio 3 op chromosoom 1. RD3 is een gekend gen voor ARRP en USH2A voor Usher syndroom type IIa en ARRP (8).
4.3.3 Sequenering kandidaatgenen 4.3.3.1 Sequenering RD3 RD3 (ENST00000367002) heeft 3 exonen, waarvan het eerste en een deel van het laatste niet vertaald worden. Primers werden ontworpen voor exon 2 en het eerste deel van exon 3, en rond de exon-intron grenzen (5 amplicons). PCR en sequenering werden geoptimaliseerd. Er werden geen sequentieveranderingen teruggevonden. 4.3.3.2 Sequenering USH2A Het USH2A gen kon onderzocht worden, gebruik makend van condities die reeds in de routine diagnostiek geoptimaliseerd werden (referentiesequentie ENST00000307340). Dit transcript bevat 72 exonen (74 amplicons). De sequentie van exon 64 was van slechte kwaliteit. In de
41
overige exonen werden 11 sequentieveranderingen gevonden (Bijlage 6). De variant c.12574C>T (p.Arg4192Cys) is suggestief voor causaliteit. Deze mutatie wordt niet in de UMD (55)vermeld en is waarschijnlijk nog nooit gerapporteerd. De Grantham afstand (53) is hoger dan 60 (i.e. 180). PolyPhen (56) voorspelt dat deze substitutie waarschijnlijk pathogeen is en via ALAMUT geeft SIFT (57) een score lager dan 0.5 (0.00), wat wijst op een mogelijk effect op eiwitfunctie/structuur. Als men de SIFT predictie liet uitvoeren met het GI nummer (89161185) van de sequentie in plaats met werd een score bekomen van 0.14, die als “tolerated” aanzien wordt. Op deze manier worden meer orthologen gekeken. Voor de lange isovorm van USH2A zijn er echter nog niet zoveel orthologen gekend, waardoor deze predictie dient genuanceerd te worden. Op basis van de verschillende data, werd geconcludeerd dat deze sequentieverandering waarschijnlijk causaal is. Om dit met meer zekerheid te kunnen stellen, moet segregatieonderzoek uitgevoerd worden in de rest van de familie. Omdat de causale mutatie vermoedelijk geïdentificeerd werd, werd exon 64 niet opnieuw gesequeneerd. USH2A mutaties veroorzaken meestal Usher syndroom type 2, maar mutaties worden ook gevonden in 5 tot 10% van de ARRP patiënten zonder gehoorsverlies. In relatie tot ARRP zijn er 3 mutaties beschreven: p.Cys759Phe, p.Glu284ProfsX38 en p.Gln1408Leu, waarvan p.Cys759Phe zeer recurrent is (58, 59, 60). Er zijn geen klinische gegevens beschikbaar over eventueel neurosensorieel gehoorsverlies in deze patiënt. Aan de doorverwijzende arts zal een evaluatie van het gehoor zeker aanbevolen worden.
4.4 Familie D Deze patiënt is 3 generaties verwijderd van de gemeenschappelijke voorouder van zijn ouders. Volgens de vuistregel zou het causaal gen gelegen zijn in een regio van 33 cM. Zoals in de vorige families, zijn er geen gegevens over een consanguine achtergrond bij de ouders, waardoor de kandidaatregio kleiner kan zijn.
4.4.1 SNP analyse In de proband II:1 werden 3563 regio’s gevonden die aan de voorwaarden voldoen. Van deze regio’s zijn er 16 groter dan 5 Mb, waarvan er 6 meer dan 500 SNPs hebben en 5 meer dan 1000 SNPs. Regio 1 op chromosoom 8 werd samengesteld uit twee aaneensluitende regio’s (17 Mb en 9 Mb) (Tabel 6).
42
SNP start
36.298.801 31.622.288 31.352.472 22.689.930 13.939.280 12.417.377 11.375.166 9.122.026 8.698.418 8.140.433 7.874.261 6.915.165 6.746.066 6.804.616 5.458.204 5.188.594
2088 29 3094 8 888 1043 38 1070 1143 990 829 393 105 21 422 523
SNP_A-1992865 SNP_A-1944371 SNP_A-4233403 SNP_A-2220590 SNP_A-2299337 SNP_A-4200179 SNP_A-1828932 SNP_A-2043377 SNP_A-1942557 SNP_A-1932340 SNP_A-2085559 SNP_A-2049082 SNP_A-1820737 SNP_A-2006542 SNP_A-2006471 SNP_A-1790961
29.282.859 38.693.364 139.819.348 120.887.054 43.213.395 66.286.929 34.969.553 122.165.969 232.339.941 78.499.593 57.707.399 15.551.377 89.417.537 89.395.623 71.610.153 100.628.818
Positie stop
# SNPs
8 9 4 1 4 5 16 10 1 11 8 22 3 2 2 6
SNP stop
Lengte in bp
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Positie start
N°
Chromosoom
Tabel 6: Homozygote regio’s van meer dan 5 Mb in familie D (indexpatiënt II:1)
SNP_A-2191837 SNP_A-2251554 SNP_A-2078022 SNP_A-4238570 SNP_A-2045939 SNP_A-1836733 SNP_A-2197686 SNP_A-2006668 SNP_A-2300350 SNP_A-2002110 SNP_A-2191837 SNP_A-2044602 SNP_A-2261103 SNP_A-2051223 SNP_A-4220431 SNP_A-4226664
65.581.660 70.315.652 171.171.820 143.576.984 57.152.675 78.704.306 46.344.719 13.1287.995 241.038.359 86.640.026 65.581.660 22.466.542 96.163.603 96.200.239 77.068.357 105.817.412
In de regio’s die in vet staan, werden kandidaatgenen geselecteerd.
4.4.2 Selectie kandidaatgenen Indexpatiënt II:1 lijdt aan ARRP, zoals deze uit familie C. Daarom werd gebruikt gemaakt van dezelfde lijst met kandidaatgenen (Bijlage 5). De positie van de ziektegenen werd vergeleken met de positie van de homozygote regio’s. De gekende ARRP genen LRAT en RP1 liggen beiden in een grote homozygote regio. LRAT ligt in regio 3 op chromosoom 4, RP1 in regio 1 op chromosoom 8.
4.4.3 Sequeneren ziektegenen RP1 ligt in een samengestelde homozygote regio, LRAT in een regio die bestaat uit één blok homozygote merkers. Omwille hiervan werd gestart met de analyse van LRAT. Voor beide genen werden primers ontworpen en de PCR reactie geoptimaliseerd (Bijlage 2). 4.4.3.1 Sequeneren LRAT Primers voor LRAT werden ontworpen rond de exon-intron grenzen van het transcript ENST00000336356. Dit transcript bevat 3 exonen, waarvan exon 1 en een deel van exon 3 niet vertaald worden. In totaal werden 7 amplicons geoptimaliseerd en gesequeneerd. Er werden geen sequentieveranderingen gevonden.
43
4.4.3.2 Sequeneren RP1 RP1 bestaat uit 4 exonen, waarvan het eerste en een deel van het laatste niet vertaald worden. Primers werden rond de coderende intron-exon grenzen ontworpen. De 34 amplicons werden geoptimaliseerd en gesequeneerd. Enkel in amplicon 4L waren enkele nucleotiden niet leesbaar. In exon 4 werden 4 sequentieveranderingen gevonden (Bijlage 6). Drie hiervan zijn gekende polymorfismen. c.5175A>G is een silent mutatie die een nieuwe exonic splicing enhancer bindingsplaats creëert. De introductie van één extra bindingsplaats is echter weinig suggestief voor splicing veranderingen, bijvoorbeeld wanneer nog een silencer in de nabijheid gelegen is. Deze sequentieverandering is weinig suggestief voor pathogeniciteit maar kan maar uitgesloten worden na functioneel onderzoek. Verder moet amplicon 4L opnieuw worden gesequeneerd. In regio 5 (chromosoom 4) ligt CNGA1, dit is een gekend ziektegen voor ARRP en een goed kandidaatgen voor deze familie.
4.5 Familie E De ouders van patiënt II:1 zijn first cousins. Men verwacht grote homozygote regio’s. De patiënt is 3 generaties verwijderd van de gemeenschappelijke voorouder. Volgens de vuistregel zou het causaal gen in een homozygote regio liggen die ongeveer 33 cM groot is. In deze familie is echter geen achtergrond van consanguiniteit, waardoor een kleinere regio kan verwacht worden.
4.5.1 SNP chip analyse Door middel van het Perl script werden in de indexpatiënt II:1 4183 regio’s gevonden die aan de vooropgestelde condities voldoen. Van deze regio’s zijn er 12 groter dan 5 Mb, waaronder 4 regio’s met meer dan 500 SNPs en 3 met meer dan 1000 SNPs. Van deze 12 regio’s liggen 3 regio’s op chromosoom 4, die nauw aansluiten en één blok vormen. De grootste regio met de meeste SNPs is 29,25 Mb groot, bevat 2477 SNPs en ligt op chromosoom 3 (Tabel 7).
SNP start
31.638.912 29.279.475 23.450.282 15.534.977 10.888.330 10.434.719
34 2477 28 120 1108 1018
SNP_A-4235756 SNP_A-2049596 SNP_A-2220590 SNP_A-2243836 SNP_A-1943710 SNP_A-1906362
38.729.117 118.506.247 120.887.054 31.328.918 166.957.371 148.231.514
44
Positie stop
# SNPs
9 3 1 16 4 4
SNP stop
Lengte in bp
1 2 3 4 5 6
Positie start
N°
Chromosoom
Tabel 7: Homozygote regio’s van meer dan 5 Mb in familie E (indexpatiënt II:1)
SNP_A-4200479 SNP_A-2025160 SNP_A-1939423 SNP_A-4219111 SNP_A-2079047 SNP_A-2010282
70.368.029 147.785.722 144.337.336 46.863.895 177.845.701 158.666.233
7 8 9 10 11 12
19 4 8 7 2 3
8.880.315 8.248.809 6.596.068 6.474.971 6.330.025 5.814.743
17 919 97 116 17 37
SNP_A-1951026 SNP_A-4229887 SNP_A-2189175 SNP_A-4212400 SNP_A-2170422 SNP_A-1883343
24.131.560 158.688.314 42.737.443 57.616.486 88.771.381 89.603.821
SNP_A-2052713 SNP_A-2055854 SNP_A-2053827 SNP_A-2155775 SNP_A-1812516 SNP_A-2178144
33.011.875 166.937.123 49.333.511 64.091.457 95.101.406 95.418.564
In de regio in vet gedrukt werd een kandidaatgen geselecteerd.
4.5.2 Selectie kandidaatgenen Deze patiënt vertoont een combinatie van LCA met nefronoftisis en vertoont dus gelijkenissen met Senior-Loken syndroom (MIM[266900]) en Joubert syndroom (JS, MIM[213300]). Alle gekende genen voor deze twee aandoeningen en andere verwante aandoeningen (nefronoftisis (MIM[256100]) en Meckel Syndroom (MKS, MIM[249000]) werden als kandidaatgenen geselecteerd (22, 61) (lijst zie Bijlage 5). De positie van deze genen werd vergeleken met deze van de homozygote regio’s. NPHP5 en NPHP3 liggen beiden in regio 2. Deze genen zijn gekende ziektegenen voor nefronoftisis, bovendien wordt NPHP5 vaak gezien in combinatie met LCA (61, 62).
4.5.3 Sequeneren NPHP5 Primers voor NPHP5 werden ontworpen rond de exonen volgens referentiesequentie ENST00000310864. Na optimalisatie werd het gen gesequeneerd (optimalisatie van exon 8 was niet geslaagd). Er werd één sequentieverandering gevonden: een deletie van twee Ts in exon 6: c.424_425del (Figuur 25). Deze deletie veroorzaakt een frameshift die start in codon Phe142 en 4 codons verder een stopcodon genereert (p.Phe142ProfsX5). Segregatie analyse bij de ouders is momenteel lopend. c.424_425del
Patiënt
Controle
Figuur 25: Elektroferogram van een wild type sequentie (links) en de homozygote mutatie c.424_425del in II:1 (rechts)
NPHP5 behoort tot de familie van de NPHP-genen, die coderen voor ciliaire eiwitten, en die betrokken zijn bij de pathogenese van nefronoftisis (NPHP), een zeldzame recessieve
45
nieraandoening, die in 15% van de gevallen met RP of LCA geassocieerd is. In dit geval spreekt men over SLS (MIM[266900]). NPHP5 komt tot expressie in het verbindend cilium van de fotoreceptoren en de primaire cilia van het nierepitheel (61). Het NPHP5 eiwit bevat een IQ-domein waarmee het interageert met het RPGR eiwit, dat betrokken is bij RP en tot expressie komt in het verbindend cilium van de fotoreceptoren, en met calmoduline (62). Daarnaast interageert het met CEP290 (63), dat in belangrijke mate betrokken is bij LCA in West-Europa. De gevonden 2 bp-deletie werd door Otto et al. (2008, 2009) (64, 65) beschreven als loss-of-function mutatie. Bij niet-verwante patiënten zagen zij hetzelfde haplotype terugkeren, wat wijst op een founder muatie. Zij maakten gebruik van de StyI SNP chip waardoor hun data niet met het genotype van II:2 kan worden vergeleken.
4.6 Familie F De graad van consanguiniteit is in deze familie niet gekend, waardoor geen schatting kan gemaakt worden van de verwachte grootte van de kandidaatregio.
4.6.1 SNP chip analyse Perl vond in de II:1 3618 regio’s die aan de vooropgestelde criteria voldoen. Hiervan zijn er 9 groter dan 5Mb, waarvan er 3 meer dan 500 SNPs bevatten, en 1 (regio 2) zelfs 3374 SNPs. Deze regio is samengesteld uit twee regio’s die op elkaar aansluiten (Tabel 8).
SNP start
30005388 27444167 23365758 14716490 10628470 9705303 5842043 5852785 5435801
14 3374 20 84 804 979 50 11 71
SNP_A-2078117 SNP_A-4221532 SNP_A-2198638 SNP_A-2303925 SNP_A-1831302 SNP_A-2125652 SNP_A-2143755 SNP_A-1932841 SNP_A-2213328
38736473 76029213 120211226 31767900 179053703 218079703 89819382 89750715 44662567
Positie stop
# SNPs
9 11 1 16 3 2 3 2 5
SNP stop
Lengte in bp
1 2 3 4 5 6 7 8 9
Positie start
N°
Chromosoom
Tabel 8: Homozygote regio’s van meer dan 5 Mb in familie F (indexpatiënt II:1)
SNP_A-1812761 SNP_A-2155922 SNP_A-4238570 SNP_A-1835934 SNP_A-1837638 SNP_A-2021900 SNP_A-1841424 SNP_A-2108592 SNP_A-4210939
68741861 103473380 143576984 46484390 189682173 227785006 95661425 95603500 50098368
In de regio in vet werd een kandidaatgen geselecteerd.
4.6.2 Selectie kandidaatgen Tijdens de loop van deze studie werd een nieuw gen ontdekt voor geïsoleerde ROA, namelijk TMEM126A. Dit gen dat codeert voor een mitochondriaal eiwit, is gelegen op chromosoom 11 en ligt in regio 2. Primers voor de 5 exonen van dit gen werden ontworpen rond de exon-
46
intron grenzen van het ENST00000304511 transcript (5 amplicons). PCR amplificatie en sequentie-analyse leidde tot de identificatie van 1 sequentieverandering in exon 3, namelijk c.162T>C. Deze substitutie heeft geen invloed op de aminozuursequentie en is niet suggestief voor causaliteit. Net naast TMEM126A ligt het enige paraloog TMEM126B. Het TMEM126B eiwit heeft dezelfde structuur als TMEM126A en komt tot expressie in zenuwweefsel en in het oog. Ditt gen werd nog nooit met een fenotype gecorreleerd (66). TMEM126B is het volgende kandidaatgen voor ROA in deze patiënt.
47
5 Algemene conclusie Het doel van deze studie was de identificatie van het causaal genetisch defect in 6 consanguine families met retinale dystrofieën. Door middel van genoomwijde homozygositeitsmapping met SNP arrays, werden grote homozygote regio’s geïdentificeerd die in een aantal families gekoppeld bleken te zijn met de aandoening. Daaropvolgende analyse van gekende ziektegenen, leidde tot de identificatie van de causale mutatie in 2 families met respectievelijk AARP en SLS. In één familie CACD werd het aantal grote homozygote regio’s drastisch verkleind door verdere microsatellietanalyse. In een andere familie kon door deze methode geen koppeling bevestigd worden, ondanks microsatellietanalyse van verschillende regio’s bekomen met de homozygositeitsmapping. In de twee overige families met ARRP en ROA werden geen mutaties gevonden na sequenering van verschillende gekende ziektegenen gelegen in de grootste homozygote regio’s. Door analyse van de overige regio’s werden echter wel genen geselecteerd die in de toekomst verder zullen onderzocht worden. Bovendien konden diep intronische veranderingen en mutaties in alternatieve transcripten niet gedetecteerd worden door de gevolgde strategie, waarbij de coderende regio en intron-exon boorden van genen onderzocht werden.
Tijdens deze studie zagen we dat het beter is alle beschikbare aangetasten uit een familie te onderwerpen aan SNP chip analyse. In familie A konden de regio’s 2, 3 en 10 uitgesloten worden omdat de patiënt die niet werd onderworpen aan SNP chip analyse, niet homozygoot was voor deze regio. In Familie B zag men dat de grootste homozygote regio kon geëxcludeerd worden telkens wanneer er een nieuwe patiënt gegenotypeerd werd. Een conclusie van deze studie is dat de algemene vuistregel dat het causaal ziektegen te vinden is in de grootste homozygote regio niet van toepassing is op een genotype van één individu. Bovendien werd in Familie C en E het (mogelijk) causale gen ook niet in de grootste homozygote regio gevonden, maar wel in de grootste regio met een aanzienlijk aantal SNPs (>2000). In familie D werd geen mutatie gevonden in de kandidaatgenen in de twee grootste regio’s met een groot aantal SNPs. Het volgende geselecteerde kandidaatgen ligt echter in de derde grootste regio die veel SNPs bevat. In familie F ligt nog een interessant kandidaatgen in de grootste regio met een aanzienlijk aantal SNPs. Een bijkomende conclusie is dat het
48
causale ziektegen niet noodzakelijk in de grootste homozygote regio dient gezocht te worden, maar eerder in grote homozygote regio’s die bestaan uit een aanzienlijk aantal SNPs (~1000).
Wanneer we de grootste homozygote regio’s van alle onderzochte families/indexpatiënten (met een verschillende etnische achtergrond) vergeleken, zagen we 5 recurrente homozygote regio’s. Deze regio’s bevatten zeer weinig SNPs (Figuur 26, Bijlage 7). De regio’s op chromosoom 16 en 19 werden geanalyseerd door middel van microsatellietanalyse in familie A. De twee patiënten voor wie SNP chip analyse uitgevoerd werd, bleken niet homozygoot te zijn voor de onderzochte microsatellietmerkers. De NspI 250K chip bevat waarschijnlijk weinig informatieve SNPs op deze chromosomale loci. Om dit met zekerheid te kunnen besluiten, moeten meer patiënten met elkaar vergeleken worden en onderworpen worden aan microsatellietanalyse. Deze bevindingen werden voor zover geweten nog nooit eerder gerapporteerd.
Figuur 26: Overlappende homozygote regio’s in de verschillende families Op chromosoom 1, 2, 9, 16 en 19 ziet men grote homozygote regio’s met weinig SNPs die overlappen tussen de verschillende families.
49
6 Referentielijst 1
Kolb, B., Fernandez, E., Nelson, R. WebVison, the organization of the retina and visual system. Purves, D., Augustine, G.J., Fitzpatrick, D., Katz, L. C., LaMantia, A., McNamara, J. O., Williams, S. M. . 2001. Neuroscience. 3 Junqueira, L. C., Carneiro, J. Kelly, R.O. 2002. Functionele histologie. 4 Adams, N. A., Awadein, A. and Toma, H. S. 2007. The retinal ciliopathies. Ophthalmic Genet 28: 113-25. 5 Koenekoop, R. K., Lopez, I., den Hollander, A. I., Allikmets, R. and Cremers, F. P. 2007. Genetic testing for retinal dystrophies and dysfunctions: benefits, dilemmas and solutions. Clin Experiment Ophthalmol 35: 473-85. 6 Roepman, R. and Wolfrum, U. 2007. Protein networks and complexes in photoreceptor cilia. Subcell Biochem 43: 209-35. 7 Pazour, G. J., Baker, S. A., Deane, J. A., Cole, D. G., Dickert, B. L., Rosenbaum, J. L., Witman, G. B. and Besharse, J. C. 2002. The intraflagellar transport protein, IFT88, is essential for vertebrate photoreceptor assembly and maintenance. J Cell Biol 157: 103-13. 8 RetNet. http://www.sph.uth.tmc.edu/retnet. 9 den Hollander, A. I., Roepman, R., Koenekoop, R. K. and Cremers, F. P. 2008. Leber congenital amaurosis: genes, proteins and disease mechanisms. Prog Retin Eye Res 27: 391-419. 10 Smith, A. J., Bainbridge, J. W. and Ali, R. R. 2009. Prospects for retinal gene replacement therapy. Trends Genet 25: 156-65. 11 Sorsby, A. 1939. Choroidal Angio-Sclerosis with Special Reference to Its Hereditary Character. Br J Ophthalmol 23: 433-44. 12 Lotery, A. J., Silvestri, G. and Collins, A. D. 1998. Electrophysiology findings in a large family with central areolar choroidal dystrophy. Doc Ophthalmol 97: 103-19. 13 Sorsby, A. and Crick, R. P. 1953. Central areolar choroidal sclerosis. Br J Ophthalmol 37: 129-39. 14 Boon, C. J., Klevering, B. J., Cremers, F. P., Zonneveld-Vrieling, M. N., Theelen, T., Den Hollander, A. I. and Hoyng, C. B. 2009. Central areolar choroidal dystrophy. Ophthalmology 116: 771-82, 82 e1. 15 Lichanska, A. M., McGibbon, D., Silvestri, G. and Hughes, A. E. 2001. A physical and expression map of the D17S1810-D17S1353 region spanning the central areolar choroidal dystrophy locus. Cytogenet Cell Genet 93: 43-7. 16 Reig, C., Serra, A., Gean, E., Vidal, M., Arumi, J., De la Calzada, M. D., Antich, J. and Carballo, M. 1995. A point mutation in the RDS-peripherin gene in a Spanish family with central areolar choroidal dystrophy. Ophthalmic Genet 16: 39-44. 17 Blinden zorg Licht en Liefde. www.tasten-in-het-duister.be. 18 Pagon, R. A., Daiger, S.P. 2005. Retinitis Pigmentosa Overview GeneReviews 19 Cremers, F. P., van den Hurk, J. A. and den Hollander, A. I. 2002. Molecular genetics of Leber congenital amaurosis. Hum Mol Genet 11: 1169-76. 20 Wang, H., den Hollander, A. I., Moayedi, Y., Abulimiti, A., Li, Y., Collin, R. W., Hoyng, C. B., Lopez, I., Bray, M., Lewis, R. A., Lupski, J. R., Mardon, G., Koenekoop, R. K. and Chen, R. 2009. Mutations in SPATA7 cause leber congenital amaurosis and juvenile retinitis pigmentosa. Am J Hum Genet 84: 380-7. 21 OMIM-Online Mendelian Inheritance in Man www.ncbi.nlm.nih.gov/omim. 22 Valente, E. M., Brancati, F. and Dallapiccola, B. 2008. Genotypes and phenotypes of Joubert syndrome and related disorders. Eur J Med Genet 51: 1-23. 23 Hanein, S., Perrault, I., Roche, O., Gerber, S., Khadom, N., Rio, M., Boddaert, N., Jean-Pierre, M., Brahimi, N., Serre, V., Chretien, D., Delphin, N., Fares-Taie, L., Lachheb, S., Rotig, A., Meire, F., Munnich, A., Dufier, J. L., Kaplan, J. and Rozet, J. M. 2009. TMEM126A, encoding a mitochondrial protein, is mutated in autosomalrecessive nonsyndromic optic atrophy. Am J Hum Genet 84: 493-8. 24 den Hollander, A. I., Koenekoop, R. K., Yzer, S., Lopez, I., Arends, M. L., Voesenek, K. E., Zonneveld, M. N., Strom, T. M., Meitinger, T., Brunner, H. G., Hoyng, C. B., van den Born, L. I., Rohrschneider, K. and Cremers, F. P. 2006. Mutations in the CEP290 (NPHP6) gene are a frequent cause of Leber congenital amaurosis. Am J Hum Genet 79: 556-61. 25 den Hollander, A. I., Koenekoop, R. K., Mohamed, M. D., Arts, H. H., Boldt, K., Towns, K. V., Sedmak, T., Beer, M., Nagel-Wolfrum, K., McKibbin, M., Dharmaraj, S., Lopez, I., Ivings, L., Williams, G. A., Springell, K., Woods, C. G., Jafri, H., Rashid, Y., Strom, T. M., van der Zwaag, B., Gosens, I., Kersten, F. F., van Wijk, E., Veltman, J. A., Zonneveld, M. N., van Beersum, S. E., Maumenee, I. H., Wolfrum, U., Cheetham, M. E., Ueffing, M., Cremers, F. P., Inglehearn, C. F. and Roepman, R. 2007. Mutations in LCA5, encoding the ciliary protein lebercilin, cause Leber congenital amaurosis. Nat Genet 39: 889-95. 26 Strachan, T., Read, A.P. 2004. Human Molecular Genetics 3. 2
50
27
Lander, E. S. and Botstein, D. 1987. Homozygosity mapping: a way to map human recessive traits with the DNA of inbred children. Science 236: 1567-70. 28 Woods, C. G., Cox, J., Springell, K., Hampshire, D. J., Mohamed, M. D., McKibbin, M., Stern, R., Raymond, F. L., Sandford, R., Malik Sharif, S., Karbani, G., Ahmed, M., Bond, J., Clayton, D. and Inglehearn, C. F. 2006. Quantification of homozygosity in consanguineous individuals with autosomal recessive disease. Am J Hum Genet 78: 889-96. 29 den Hollander, A. I., Lopez, I., Yzer, S., Zonneveld, M. N., Janssen, I. M., Strom, T. M., Hehir-Kwa, J. Y., Veltman, J. A., Arends, M. L., Meitinger, T., Musarella, M. A., van den Born, L. I., Fishman, G. A., Maumenee, I. H., Rohrschneider, K., Cremers, F. P. and Koenekoop, R. K. 2007. Identification of novel mutations in patients with Leber congenital amaurosis and juvenile RP by genome-wide homozygosity mapping with SNP microarrays. Invest Ophthalmol Vis Sci 48: 5690-8. 30 Woods, C. G., Valente, E. M., Bond, J. and Roberts, E. 2004. A new method for autozygosity mapping using single nucleotide polymorphisms (SNPs) and EXCLUDEAR. J Med Genet 41: e101. 31 ASPER ophthalmics www.asperophthalmics.com/ARRPgenetest.htm 32 Sellick, G. S., Longman, C., Tolmie, J., Newbury-Ecob, R., Geenhalgh, L., Hughes, S., Whiteford, M., Garrett, C. and Houlston, R. S. 2004. Genomewide linkage searches for Mendelian disease loci can be efficiently conducted using high-density SNP genotyping arrays. Nucleic Acids Res 32: e164. 33 Affymetrix® http://www.affymetrix.com. 34 DNAVision. http://www.dnavision.be. 35 Affymetrix. http://www.affymetrix.com/support/technical/datasheets/500k_datasheet.pdf. 36 Kennedy, G. C., Matsuzaki, H., Dong, S., Liu, W. M., Huang, J., Liu, G., Su, X., Cao, M., Chen, W., Zhang, J., Liu, W., Yang, G., Di, X., Ryder, T., He, Z., Surti, U., Phillips, M. S., Boyce-Jacino, M. T., Fodor, S. P. and Jones, K. W. 2003. Large-scale genotyping of complex DNA. Nat Biotechnol 21: 1233-7. 37 International HapMap Project 38 Brawn, T. 2002. Genomes 2. 39 Lodish, L., Berk, A., Zipursky,L.S., Matsudaira, P., Baltimore, D., Darnell, J. 2000. Moleculaire Cell Biology. 40 Ensemble. http://www.ensembl.org/index.html. 41 primer3plus. http://www.bioinformatics.nl/cgi-bin/primer3plus/primer3plus.cgi. 42 Moxon, E. R. and Wills, C. 1999. DNA microsatellites: agents of evolution? Sci Am 280: 94-9. 43 Bennett, P. 2000. Demystified ... microsatellites. Mol Pathol 53: 177-83. 44 Schuelke, M. 2000. An economic method for the fluorescent labeling of PCR fragments. Nat Biotechnol 18: 233-4. 45 2002. Applied Biosystems 3730/3730xl DNA Analyzers Sequencing Chemistry Guide. 46 Map Viewer. http://www.ncbi.nlm.nih.gov/mapview. 47 Centrum Medische Genetica Gent http://medgen.ugent.be/CMGG. 48 UCSC. http://genome.ucsc.edu. 49 NCBI. www.ncbi.nlm.nih.gov. 50 http://www.ncbi.nlm.nih.gov/Genbank/. 51 http://agvgd.iarc.fr/agvgd_input.php. 52 SIFT. http://blocks.fhcrc.org/sift/SIFT.html 53 Grantham, R. 1974. Amino acid difference formula to help explain protein evolution. Science 185: 862-4. 54 Entrez gene. http://www.ncbi.nlm.nih.gov/sites/entrez?db=gene&cmd=search&term=. 55 Universal Mutation Database. http://www.umd.be/usher.html. 56 Sunyaev, S., Ramensky, V. and Bork, P. 2000. Towards a structural basis of human non-synonymous single nucleotide polymorphisms. Trends Genet 16: 198-200. 57 Ng, P. C. and Henikoff, S. 2001. Predicting deleterious amino acid substitutions. Genome Res 11: 863-74. 58 Seyedahmadi, B. J., Rivolta, C., Keene, J. A., Berson, E. L. and Dryja, T. P. 2004. Comprehensive screening of the USH2A gene in Usher syndrome type II and non-syndromic recessive retinitis pigmentosa. Exp Eye Res 79: 167-73. 59 Rivolta, C., Sweklo, E. A., Berson, E. L. and Dryja, T. P. 2000. Missense mutation in the USH2A gene: association with recessive retinitis pigmentosa without hearing loss. Am J Hum Genet 66: 1975-8. 60 Rivolta, C., Berson, E. L. and Dryja, T. P. 2002. Paternal uniparental heterodisomy with partial isodisomy of chromosome 1 in a patient with retinitis pigmentosa without hearing loss and a missense mutation in the Usher syndrome type II gene USH2A. Arch Ophthalmol 120: 1566-71. 61 Hildebrandt, F., Attanasio, M. and Otto, E. 2009. Nephronophthisis: disease mechanisms of a ciliopathy. J Am Soc Nephrol 20: 23-35. 62 Otto, E. A., Loeys, B., Khanna, H., Hellemans, J., Sudbrak, R., Fan, S., Muerb, U., O'Toole, J. F., Helou, J., Attanasio, M., Utsch, B., Sayer, J. A., Lillo, C., Jimeno, D., Coucke, P., De Paepe, A., Reinhardt, R., Klages, S., Tsuda, M., Kawakami, I., Kusakabe, T., Omran, H., Imm, A., Tippens, M., Raymond, P. A., Hill, J., Beales, P., He, S., Kispert, A., Margolis, B., Williams, D. S., Swaroop, A. and Hildebrandt, F. 2005. Nephrocystin-5, a
51
ciliary IQ domain protein, is mutated in Senior-Loken syndrome and interacts with RPGR and calmodulin. Nat Genet 37: 282-8. 63 Schafer, T., Putz, M., Lienkamp, S., Ganner, A., Bergbreiter, A., Ramachandran, H., Gieloff, V., Gerner, M., Mattonet, C., Czarnecki, P. G., Sayer, J. A., Otto, E. A., Hildebrandt, F., Kramer-Zucker, A. and Walz, G. 2008. Genetic and physical interaction between the NPHP5 and NPHP6 gene products. Hum Mol Genet 17: 3655-62. 64 Otto, E. A., Helou, J., Allen, S. J., O'Toole, J. F., Wise, E. L., Ashraf, S., Attanasio, M., Zhou, W., Wolf, M. T. and Hildebrandt, F. 2008. Mutation analysis in nephronophthisis using a combined approach of homozygosity mapping, CEL I endonuclease cleavage, and direct sequencing. Hum Mutat 29: 418-26. 65 Hildebrandt, F., Heeringa, S. F., Ruschendorf, F., Attanasio, M., Nurnberg, G., Becker, C., Seelow, D., Huebner, N., Chernin, G., Vlangos, C. N., Zhou, W., O'Toole, J. F., Hoskins, B. E., Wolf, M. T., Hinkes, B. G., Chaib, H., Ashraf, S., Allen, S. J., Vega-Warner, V., Wise, E., Harville, H. M., Lyons, R. H., Washburn, J., Macdonald, J., Nurnberg, P. and Otto, E. A. 2009. A systematic approach to mapping recessive disease genes in individuals from outbred populations. PLoS Genet 5: e1000353. 66 AceView. http://www.ncbi.nlm.nih.gov/IEB/Research/Acembly/index.html?human.
52
Addendum: bijlagen Bijlage 1: stambomen van de onderzochte families (A-F)
Figuur 1: Stamboom familie A
Figuur 2: Stamboom familie B
Figuur 3: Stamboom familie C
Figuur 4: Stamboom familie D
Figuur 5: Stamboom familie E
Figuur 6: Stamboom familie F
Bijlage 2: primers, PCR-condities en programma’s Bijlage 2.1: microsatellietmerkers Tabel 1: Microsatellietmerkers voor familie A: Merker
Start
Einde
DeCode
Genethon
Marshfield
F-primer (5’-3’)
R-primer (5’-3’)
PCR-product
Repeat
Gen
D1S253
6.282.214
6.282.379
16.40
14.59
TGCGCTACTAAGCCCCT
TTACCGGACGCCACAC
164-172
CA
ACOT7, NPHP4
D1S2694
7.264.352
7.264.600 12.9
17.40
15.13
AGGTCCAAGAAGCGGAG
TCACGGGGTATTAAGTGG
241-255
CA
CAMTA1
D1S450
9.508.007
9.508.269 16.61
22.90
20.61
GCTCCAATGTCCAAGGG
GGGTACTCAGATGGCTGGT
243-267
CA
D1S1635
10.910.141
10.910.287
23.35
GTGTGGTCAACACAGCAAGA
AAACAAAGGTAATAAACTTACCACC
152-168
TGGT
D1S1597
13.656.774
13.656.943 23.27
29.93
TTTATTGAGATATATTTGACATGCA
AAGGAGGAAAGCTTTTTGGA
159-179
CTAT
D1S421
45.029.408
45.029.557 68.9
73.81
AGCTGGCATCTCACCC
CTGACTGGCGTTACATTCTC
146-152
CA
D1S451
45.529.927
45.530.102 68.9
77.60
75.66
ATCATGGGACTTTGCAGC
ATGGCCTGGCATAGTGTG
174-188
CA
D1S2626
102.768.223
102.768.514
139.80
136.34
TGTATTATCTCTTATCCCTGGTGTA
CGTTCAAGCACAAACTGAAT
290-304
CA
D1S498
149.568.188
149.568.378 144.94
160.70
155.89
TTGCTGAAGGGACATAGTG
TGCTGGGTTATATCCAATATC
183-205
CA
MCKD1, PRPF3
D1S2343
149.800.520
149.800.777 145.44
160.70
155.89
GGGTGGATCACTTAAGCCT
CTAGCATATTCGTCCTGAACTAA
218-268
CA
TUFT1, PTCPRN
D2S342
195.592.381
195.592.621
201.40
194.45
CTGAGAGCCTGCACTGG
CTCAACAAAACCATTCAACA
231-247
CA
D2S2387
196.888.094
196.888.199 196.24
201.70
195.65
TCAGAAGTGAAGATGCCTCC
TTGGTCCTACAGCACGAG
86-118
CA
D2S316
197.505.370
197.505.516
201.70
195.65
GCCCCACCCTCCTAATACTA
GGACAGGAGTTAGAAACAAAACTTA
140-154
CA
D5S1473
23.031.085
23.031.335
36.25
CACAAACCAAAAACATGCAA
GGAGAATTAAGCCCATTTACG
246-262
GA
D5S813
23.626.999
23.627.239 42.97
37.32
TCCAAAGAGACTGAATCAATAGG
TTGAGGATTTTGGACTTGGA
220-249
GATA
D6S388
30.442.997
30.443.106 51.24
44.41
GAGGAAGATGATGGGAAGC
AGAGAGAATAAGGGGCACG
60-160
TG
D6S1651
47.418.707
47.418.910
71.50
73.13
CCAGGTATGTGGGATTGC
ACAAGCTCTGGAGTTGGAAG
174-216
CA
D7S2452
133.074.459
133.074.653 138.75
140.50
138.42
TCCAGCATGAGTTGAGAAG
GGCATTGAAGTTTATCGTGA
187-203
CA
EXOC4
D7S681
133.211.479
133.211.735 138.75
140.50
138.42
TCATGTATGGACATTTGGC
ACTCATATTGCTTAGGTTAAGGAA
249-261
CA
EXOC4
D7S631
133.590.465
133.590.584 138.86
139.70
138.42
CTCAACCACATGCCAGTTTC
TTTCTCGCCGGGTAGTAGTT
108-124
CA
D7S800
134.587.382
134.587.612 139.1
140.63
CTGGTTATTTGAAAAGTGTG
AGATGGGTGTTGTATTAG
158-231
CA
IBD7
HECW2
SCZD1
D7S509
136.961.487
136.961.705 142.55
145.80
143.33
ACTGAACCTGGGGTGG
GTTGCTGGCCCTGTAGTA
203-225
CA
DGKI
D7S2450
137.967.200
137.967.302 146.24
148.60
146.28
TGAAGTGGCTCAGACTGC
CTTAGAACCAGGTGGGGTG
93-121
CA
SVOPL
D7S2505
138.437.874
138.438.093 147.15
150.30
148.11
TTAACAGTAATAAATCATGCTGAG
CTGGGACCAGGCTAGT
202-226
CA
ZC3HAV1
D7S1824
139.659.034
139.659.211
149.90
GCACCTGTTTGATTCAGTCA
CCAGCCTGTGTGACTATGTG
163-199
tetra
EN2, BW27
D7S2513
141.053.887
141.054.049 150.22
154.10
151.25
GCAGCATTATCCTCAACAGC
CACAAATGGCAGCCTTTC
157-181
CA
PAPA4
D7S661
143.232.921
143.233.188 151.86
157.50
155.10
TTGGCTGGCCCAGAAC
TGGAGCATGACCTTGGAA
252-282
CA
D7S1798
145.007.780
145.008.031
155.79
AGGTGAGTAGTATGTAAAAACACCG
CACCTAGATCTAATTTGTGCTCC
245-253
tetra
D7S2511
146.179.482
146.179.744 154.43
159.00
156.33
CAGAGCAATACCATCAAAAC
GTACCATAAACTGGGTGGC
225-265
CA
CNTNAP2
D7S2419
148.053.127
148.053.306
163.40
159.53
TTGTCCCAGGCAGTTTTAC
GGCAATGAAGTTTCCCAG
150-198
CA
CUL1
D7S505
150.122.714
150.122.983
163.40
161.21
ACTGGCCTGGCAGAGTCT
CAGCCATTCGAGAGGTGT
262-278
CA
TMEM176B, PRKAG2
D7S2439
150.769.899
150.770.099
166.40
163.74
CAGCAAAAGGTACAGCAATTTC
AAAGTCTACGCCGCATTC
173-211
CA
D7S483
151.829.108
151.829.281
167.60
165.18
AGTGGTCATTAGCCTTGGCAAAATC
AACCAGAGTTGTAAGCCATGAAAGT
166-188
CA
D6S293
152.442.708
152.442.913 169.87
171.30
168.98
AGCTGCAAAATAGTGGAAGTAG
CATCAATTCACATAATGACCG
200-218
CA
D7S2462
153.192.621
153.192.761
172.30
169.81
GCCAAGATTGCACCACTAC
TGTTAAAAGTTCCCCAAGC
127-147
CA
GPDS1
D7S637
154.034.434
154.034.663 174.04
175.50
173.03
GCTGTACCTCCCAGCA
ATATCAAAACCAAGATGTTGAC
222-232
CA
DPP6
D7S550
155.210.379
155.210.571
180.80
178.41
TCTCATCTGTGAATGCACTATC
GCAGTTGGGTTATTTCAAGTC
177-200
CA
SHH, GPDS1, RBM33
149.90
TCTCTTACCCTTTGGGACCT
CTTGCAGATGGCCTAATTGT
149-169
tetra
PAPA4
GAACCCACTAATTGCGGAC
125-137
CA
D7S2202 D8S1745
50.382.723
50.382.851
65,8
66,2 AAAAGTTCACACCAAATGCC
D8S1831
51.968.859
51.969.125
63,65
66,9
67,27 TGCACTGAAAGATCAGCAAAT
AGTCCAGGCTGCGGTT
263-277
CA
D8S1815
53.161.087
53.161.335
64,73
66,9
67,27 AATTAAATTCTTTAGTAAGCCATGT
TCTATGCCAGTATCTATGTAATCA
217-249
CA
D16S3120
27.074.622
27.074.877 53.38
60.00
62.11
CTGGGTGCGATTGCTC
GGCCCCATGACAGAAC
216-262
CA
D16S3022
28.227.537
28.227.773 54.04
56.20
57.79
ATCTGGGGCTGCATGT
AGCTATCGTGCCTGGC
235-245
CA
D16S753
31.181.005
31.181.273 56.8
57.79
CAGGCTGAATGACAGAACAA
ATTGAAAACAACTCCGTCCA
252-276
tetra
D16S3105
45.349.601
45.349.795 57.86
56.70
58.46
GATCTTCCCAAAGCGCC
TCCCGTCAGCCAAGCTA
183-195
CA
D16S3044
45.995.121
45.995.315 57.88
56.70
58.46
ATACTCACTTTTAGACAGTTCAGGG
GGCTCAGTTCCTAACCAGTTC
163-207
CA
D16S409
47.333.372
47.333.510 58.41
56.20
58.46
TGAATCTTACATCCCATCCC
AGTCAGTCTGTCCAGAGGTG
135-147
CA
D16S261
47.795.608
47.795.700 58.93
57.79
AAGCTTGTATCTTTCTCAGG
ATCTACCTTGGCTGTCATTG
88-100
di
ITGAM, NOD2
ITFG1
D16S3080
48.240.903
48.241.183 59.1
57.80
59.68
GGATGCCTGCTCTAAATACC
CCCAGGGGTCAAACTTAAT
269-285
CA
ZNF423, PKC
D16S3035
49.215.118
49.215.388 60.3
60.00
62.11
AAAGCCAACCTTGCTTCA
TCTTGGAAACAGGTAAGTGC
269-275
CA
NKD1
D16S3137
52.239.994
52.240.217
66.90
69.05
GCAAAGAATAATTGCACATATACG
AGTACAAAGAGATCCCCTGTAAC
217-237
CA
RPGRIPL1, ANMA, ALS6
D19S911
20.708.313
20.708.540 47.46
47.70
49.75
AGGAATTGGTCTTAACCTAGTG
TCCCAAACTGCTGGAA
227-235
CA
D19S568
22.286.983
22.287.241 47.72
47.70
50.81
TGAGTCTGCTGAGACCAAAGTTAG
ATAATGTAGCCTTGTCCTGGAATAG
249-275
CA
D19S434
22.559.664
22.559.932
49.75
GCCCACCATATTACTGTGGA
TTGACTAAAGCCACCACACA
264-280
tetra
D19S910
23.414.576
23.414.820
49.40
49.75
CAACGCTTGCGACTGAC
GCTGAAGCTGACCTTTTGG
242-258
CA
D19S419
32.983.103
32.983.269 48.86
48.80
49.75
GATTATCGGGGCAGGT
CATTAAATATGAAATTCAGGTAAGC
165-169
CA
D19S931
33.315.292
33.315.441 49.06
48.90
49.75
GGGTCACATGGCTAGGCTAA
AGCTGTTTGCCCGCAG
148-176
CA
D19S222
33.417.785
33.418.017
49.40
49.75
GAAATGTCCTATTTGAAACTGTGC
CTGTTGAAATGTATCCAGTAAATCG
233-241
CA
Tabel 2: microsatellietmerkers voor familie B: Merker
Start
Einde
D3S3575
160.837.713
D3S3702
164.884.041
D3S3622
DeCode
Genethon
Marshfield
F-primer (5’-3’)
R-primer (5’-3’)
160.837.933 165.61
177.60
173.34
ACTATCACCACACTGAAAATGTAG
TCCCACCCTTAGCAGAG
164.884.254
179.80
174.94
GTATCCTGGGTTTTCCC
CCAAACATCACACGGG
169.346.654
169.346.882
183.10
177.75
GCAAGGGGTCTTTAGTCAAC
CTTTCATGCGTACCTAGCAG
221-233
CA
D3S1564
171.671.510
171.671.687 171.45
187.00
180.80
GTGTGGCTGTGGACCTTC
TCAAAATGTTACACAAACAGTATCT
176-190
CA
SLC7A14
D12S1670
81.963.415
81.963.682
94.20
92.89
GTTGTTCCCTGTGAAGGATAAAACT
GATGGTCGCCAGCACTC
234-314
CA
TMTC2
D12S81
84.031.772
84.031.923
95.00
93.69
CTATTCCAGATGAGGGGGTC
TCAAATCATAAGGGTATCAGAAATT
146-166
CA
LRRIQ1
D12S365
84.875.912
84.876.077 98.07
95.80
94.49
TCTGGGAGTCGGAGGT
CAAGACTGAATTGTTTACAGTTTT
161-170
CA
D12S1593
86.179.034
86.179.127 98.19
96.50
95.03
AGCTAAACTGCCAATCGCCT
TCCAAATTCTTTCACAGAGCC
84-102
CA
D12S1598
88.052.040
88.052.211
96.50
95.03
TTTTTCAGGAGCCAAGA
GAGGGCTGAGTCTGTTCT
144-174
CA
D12S1717
89.272.989
89.273.183 99.79
96.50
95.03
TATTCCCTAAATCTCAAATTGATAG
CCAGAGACAATCTTTGTGTG
167-203
CA
D12S351
90.429.472
90.429.633 101.06
97.10
95.56
TTGCTCTAAACTCAATATCTCAGC
GTGCATCTGTATGTGCGTG
151-169
CA
D12S1346
92.708.661
92.708.922 103.94
99.50
97.16
CAGGTAAGCATGATCTGTACTCC
CAACCCCAATGTATGAATGA
262-276
CA
D15S1045
87.396.635
87.396.852 94.83
83.70
85.64
AGCAGGCAGGCTAATC
CCTCATCTTCACATGGC
176-224
CA
D15S202
87.802.612
87.802.845 95.48
83.70
85.64
AACCTGGGTGGCACAGTGAG
CAGGACCTTTGCACAGGC
226-247
CA
Tabel 3: PCR-condities voor micosattellietmerkers DNA buffer MgCl2 dNTP's DMSO pr F pr R 100ng/µl Roche 25mM/L 1mM/L 10µM 10µM 0,6 1,5 0,9 3 0,7 0,2
M13 taq H2O 10µM 5U/µl 1 1,00 0,10 6
PCR-product
Herhaling
Gen
207-229
CA
SCHIP1
214-232
CA
CRADD
Tabel 4:PCR-programma voor microsatellietmerkers Stap temp min 1 95°C 4:00 2 95°C 0:20 -1°C/cyclus 3 60°C 0:20 12 cyli 4 72°C 0:40 5 95°C 0:20 6 48°C 0:20 25 cycli 7 72°C 0:20 8 72°C 10:00 9 15°C 10:00
Bijlage 2.2: Genen Tabel 5: RLBP1
Exon 1 2 3 4 5 6 7 8 9A 9B
F-primer (5’-3’)
R-primer (5’-3’)
agcaggagcacacaaaggag
tctggctcaacctggagaat
atgaatgggacctgttctgg
ataggaggaaacgggaggag
atgcctcgggtgattctgat
ccgggcagagcataagatag
ttgggcaaaagaactgaagg
ggccagtctatcaggtccag
gctctggcaggagactcatc
tgacttgcccacagtatgga
cagctcggtcacacatagga
ctggagaaccaggaatgagg
ctgcagcaaattaccccagt
cttctcagttccctgcaagc
agaggcagcagggaatgag
gggatccacatagctcagga
gcaaagactgcacatgatgg
cgggcttagggagtctaagg
gcctctcctcaactgtcctg
tcttccaccctggaattctg
Conditie Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard Enhancer Standaard
Programma STS 55 STS 55 STS 55 STS 55 TD 64-52S STS 55 TD 64-52S STS 55 TD 55 STS 55
Tabel 6: RD3
Exon 2A 2B 3A 3B 3C
F-primer (5’-3’)
R-primer (5’-3’)
ccttgggttcccaggttc
cagacctttctgaccgcatt
atgcgagaggctgagagg
ctagtcctggtggcctca
ggactaattggccatgagga
ggcctcctcttcctgcttc
aggaggtgtcccagctcttc
gcagggagtcgcttcattt
actgcggtcctggagcat
gcagggagtcgcttcattt
Conditie Programma Standaard TD64-52 Standaard TD64-52 Standaard TD64-52 Standaard TD64-52 Standaard STS 55
Tabel 7: USH2A
Exon 1 2A 2B 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28/29 30 31 32 33 34 35 36 37 38 39
F-primer (5’-3’)
R-primer (5’-3’)
aatggattgaggtgcatgag
acccaacaccatctgtctgt
gcctgggatgagcttcag
gacctcgtgactcagtcaag
caggtcattgaaatgttgatc
ggtttggaattcaggctga
caccactgtaactgcacaatacc
ctgctgcagattttgtgagtaga
gtcttcccagctgaacaaagta
gtggtaatttgttcagtagccctag
gtcaggtattgcttggtaaacag
cagcatttatcctttcggttc
tgacattcatttgtaacgactcc
aagtttgtgggcatttgttg
ccatggtttgatatatactgatgg
caccagcctagagagctagc
caacattttgatttctgttttgc
tgctctgacatcttaatgtgct
cacacaatgcatatagtcctagg
tgttaggccaagattaagttcat
tgatatgtgctttacttctggtg
gcattgtagatagaagcacacag
tggcaggtagagatgaaagg
gcaaatgcagtcttcaattctac
ccctgtcttgtacctaatgagc
ttccagatggtaatagagatgtga
gcagtagcattgtttgtgtctc
gtagaagccacaaaccagaaac
gggaattagtgccttggtagag
gaagttattgctttgcaactgc
aagccgtcttactctacaatgct
ttctgatgggttctaaatggag
gcaatcctgaatcagaaagacc
ccacaacagcatttatcctcaa
gagaggaaagcagttagcaatg
gattctcattcatgtcttgacca
aagtaacccctttgtctgatgagt
ggaaacatttgcattcagagg
tcagaaactaaatgaatgtgtga
tgccctgtttaatcaatatagag
tggtggttggcaataattcc
gagttagtgagggaggagaagaca
agccatacagatacttgaaacc
gctatcaaagggctgaattag
ccatgcgagtatattgctgtg
caaggtttgaatgaagattcag
caggaaagccagaatgatgc
atggaattgagtagaaattatgg
caggcaatgaggagagagga
cctaaaggaaatttttggcaca
tgaatcattaagaggcttgcag
ctaggttcatatgaggtcaag
tgagatttactcagtggcag
ccaattaagtgtaatgccaac
tgctttcagggaactgttttg
ggtgctgcttttagcctgag
tgctgcagaggacaaaaatg
ttcagggtaatagtccttcc
tgcggccattaaaagtgaag
ggaagttaatagggtctactc
tctcttatagacacacacac
caaattaggttggggtttgc
tgatttattggtttgggtctg
gcattcttgattaaatttgcag
tgaagcatcctatatgttattgc
cctcccctgattgaactcac
atttcctttttgcccctcag
aggatgggaagagagttttc
ttggggaagtaaaggtagcac
agcaccacatataagctgcc
aaatcacatcaagagtgcttgc
cctgcttgaaaggctagctg
tgtgctttgatcctgctgac
accaacatctgtggctaaaag
gtaaagttacagacctatttgg
aataaacaaggtattcaatgga
aggagttcaggaatgaaaatg
tgagaactgacctactcttc
Conditie Programma USH2A USH2A USH2A-E USH2A USH2A-E USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A
40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 A 63 B 63 C 64 65 66 67 68 69 70 71 72
agatctcatttgatggcagaa
ggctcatttctttgctttgg
tcatatccttgtagcagag
ggtacattcctaagtctgcaa
gcaaaattctaggcctcgtg
aagcctccttcatttcccta
atgccacagaacagcctgag
aacacgctcacacaatgaag
ttttgtagaggggtggaagg
tgtgtacatgggggaggtt
catttccaaaacaaaggctctc
ttttagcctccacccccttc
aagcagataagcgaggaacc
ccaagacagaagatatccac
agggaaggtgggattcagac
tgtcatggctgagaggatac
ctgccactttttacttaagac
gatcataatacatcatggtgtg
atggtctcagatcttctatgc
tgttgagagggaggtgtttg
tgggatctgcaagatgattg
attagatataaccaatgtgagc
atttcagcaactgcctgagc
gaaaatgaataatgcacacagg
cattcatcaagtaagtggagg
ggcctcaaagtatgatggaatg
caaagcgtttagagcattaaac
gcatagggcaattaaatgtag
gtattgcatttcttccgaacac
agcagtcacaacctggatg
aaagggaaatgcttctccaag
cccctaaccacaatgacaga
gctatcatatctacaactctg
caactttattgcctcttcctt
gatggtgtgacttttgataca
gaatggccaatgaatgagga
ggcaaagagtttgcaatttgtc
catatttatccaggagaccga
catttgttgcccattctgtt
ggactgagaatgtattccttt
gtatatatgcaaaaggacagg
gattctgctgtgttggagca
tgacaccaggaagaaacagc
caacgtattcaccagataatc
ctttggccatgaggttcaga
tgaagggagttttcccacagt
ggctaagtaactacacaaag
ggatagagcatttcattcctt
gatttcctggatcccaccag
cttctgatctggccatttgg
cacctggaaacctccaagaa
gtttaggtggatggaggttg
caatctcggctcactgcaag
gctgacgggtgcaaacaatc
cagccttagggtatcttgct
cgtagagcaactgagaacag
gtaggaggtgggatcttgg
ctaggtgcagagtaggctat
gagcagtttcctgcaaatgg
gagtttcagggcaagcttct
gcacacctgcactccttcaa
cgtaaagctggggaacagag
cgtcataacttgctttggaatc
caacacttggcacaatttcttc
ctatcaaatagcagggccag
cttgttaccatggctatgacaca
cgtgttgtgggtgctcatag
ctaagtgctcagaggcgagt
ctattgatagcaagtatgtagc
ctgccaaacagaaccaagtg
USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A / USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A
USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A / USH2A USH2A USH2A USH2A USH2A USH2A USH2A USH2A
Tabel 8: LRAT
Exon 1A 1B 2A 2B 2C 3A 3B
F-primer (5’-3’)
R-primer (5’-3’)
agtgagctttccgggtctgt
gctcagccaagccacaat
accggttccttatccgtctc
gcatggggttcttcatcct
ctccaagacgccctcttcc
ggcaacacggttgtctcc
cctgacccactatggcatct
ctcgttgagcagtgcctttt
ggtcaatcacctggacgagt
ggggaagagaaaaggtcagg
cagaaaatagctgggaaaactga
gttagccagccatccatagg
tctgtacgggcttggtatcat
agcctttgttcttgggctta
Conditie Standaard Standaard Standaard Standaard Standaard Standaard Standaard
Programma STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55
Conditie Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard / Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard
Programma STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 / STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55 STS 55
Tabel 9: RP1
Exon 2A 2B 2C 2D 2E 3A 3B 4A 4B 4C 4D 4E 4F 4G 4H 4I 4J 4K 4L 4M 4N 4O 4P 4Q 4R 4S 4T 4U 4V
F-primer (5’-3’)
R-primer (5’-3’)
ttagcatgcattagtattaccatgt
ggggtctccgctcttgtaga
gcctcactcatcctgttgtg
ccgtgggaacataggtagga
ggagtgaggaacatcagcac
cattcctgaagaccactaggc
cattagcgcgcactcacc
cagaacgctcaccctcctt
cttctgagcaggagggtcac
atcggagcacacacactcac
tcaagcctaggaggttgttga
acgctgagagatccctggta
ggaagggagccatttaaacc
ttcgtttctgtggtggaaga
gctgcctcttcctttggata
aactgtcatagtgccgtcttga
acttggccttagaaaagaatga
ttcgctccataggtgacaca
tccaggaagaacagaaagtcg
aggtcacactgccaatcaca
tcgtttttataggccccctac
tgacttaagcagactgttttccttt
ttcttgcagtaaaatgtcatcag
aaaaatgggttgcatctgct
tcaaaacttatggtaacaccaatg
ttcctttggttgcaagctgt
tgttgccagcaaaaagaaga
tccttgaaccttggaattttg
ttccaaaagtaatctcaattcca
gatgccacttctgcttgaga
tttaacatccttgagcaaaaacc
gatgagcaatagcctcagga
atgctacaaccagggcaaa
tgtgcttattactttccataacaaaa
gcaataatagtttttcagggaatga
cttgaatggcagcctctaca
tcccctgcatgaacactgta
caagtgaacctggcatttga
tgcaagcttcagttcctggt
ccactaaattggcaacagca
tgcattgttggagattctaaagc
tctcacatggagagcaagtca
tcctctttggatggaggttg
tttggagtttaaaaagtcaatgg
aaggcttgtgctcaaaagga
tcaagttctgcttctttttcact
tggtgtcacatcaaaatgtcag
ttttactagcctctacctcttcttgg
aaccatgacactgatatctttaataca
ccagtttccatagttttcacca
tgaaaaggagaccaatgaagg
aaaaagatggtttgataatatctgc
ggcgaacttacccaagagaa
caataattgtccctcacagca
ggcagtcatttggctcttct
tggggccaaattaccaaaat
acaccacatcagtggacacc
gacagatgtgcatactctttctga
4W 4X 4Y 4Z 4AA
cctgagtctgtaattgttggaaaa
Standaard Standaard Standaard Standaard Standaard
STS 55 STS 55 STS 55 STS 55 STS 55
R-primer (5’-3’)
Conditie
Programma
Standaard Standaard Standaard Standaard Standaard Standaard Standaard
STS 55 STS 55
tgcctcatggtagtgactcag
ggcaatgttgaccacaaaga
aaccattgcctggcagtaata
tatatcaccaatggcattatcaa
caaaaatgtgttcagggaagag
tgttcttgagccctggaatc
gcggtcagacaaatgaaatct
cttcttgttctctactgctttcaa
tttgtatgtttgagggtgaaaatc
Tabel 10:NPHP5 Exon F-primer (5’-3’) 1
cggagcgtctcacgttct
ggctgacttcgtccaggag
2
tggggaggagaaagaggatt
aattcaacacttctcccatcttt
3
gcctctcaaacaaggcaaga
cctctctgaacaaatttaaaagaaa
4
cttttaaatttgttcagagaggtctt
ggcagataaataaaaagcaaatg
5
ttgtcttggtaacaaaagaagca
ctttcagccaaatattgcaca
6
tccccagagagaagtctcctta
tggtttcatttcagtgtggtt
7
tgctttgatttggtttgaaaag
tggtgatggaacttcagcat
8
cacagtccggcatcaagtta
ttccacatgctatctgtagtgaca
9
ttgtttttaagccagactttttagc
aagaaagtgaggaacatttaaggaa
gccctaacctgatactttaagagg cagcagcagatgacaagcta gaattgggaaaattagtgaacaa cacactcagagttaatcattattgc gctaagcagtctaaaacctctgc tctgcctgcagagttacagc ggtggaaccaaaccacctta
cctttgctttgaaagtgcatc aaaaatcatcacgtagctagaaaag tgaccaaggctttacaacagg gccaatgcattaccttatacca ttcctgaggttaggggatga gcaggtcttgtctggaggag ttgagcatttcttttcctcaca
10 11 12 13 14 15A 15B
TD64-52S
STS 55 STS 55 STS 55 STS 55
/
/
Standaard Standaard Standaard Standaard Standaard Standaard Standaard Standaard
STS 55 TD64-52S
STS 55 STS 55 STS 55 STS 55 STS 55 STS 55
Tabel 11:TMEM126A Exon
F-primer (5’-3’)
R-primer (5’-3’)
2 tgttgcttttcatgttctggtt
agggcaatttccttctcaca
3 ccagttagtgtattcccaaagtcc
ctgcattacagcatacagctactt
4 cctgtgatacacaaaagaggatct
tggtctaaatgccttaaaaacaaa
5 agccttgaagcaaactggat
ccttttgttgtaggtcccaga
Conditie
Programma
Standaard Standaard Standaard Standaard
STS 55 TD 64-52S STS 55 STS 55
PCR-condities: Tabel 12: Standaard condities DNA 100 ng/µl
Buffer dNTP Invitrogen 1 mM 1 3
MgCl2 25mM 6
pr F 50µM 0,9
pr R 50µM 0,3
Taq 0,3
DMSO 0,2
H2O 2
16,3
Tabel 13: Enhancer condities DNA 100 ng/µl 1
Enhancer
Buffer MgSO4 Invitrogen 50mM 3 0,9
6
dNTPs 1mM 6
pr F 50µm 0,4
pr R 50µm 0,4
Taq 0,3
Tabel 14: USH2A condities DNA 25 ng/µl 4
Buffer Invitrogen 3
MgCl2 50mM 0,9
dNTPs 1mM 6
pr F+R 50µm 0,6
Taq
MgSO4 50mM 0,9
dNTPs 1mM 6
pr F+R 50µm 0,6
0,2
H2O 15,3
Tabel 15: USH2A-E condities DNA 25 ng/µl 4
Enhancer 6
Buffer Invitrogen 3
PCR-programma’s: Tabel 16: STS 55programma Stap Temp Min 1 92°C 5:00 2 92°C 1:00 3 55°C 1:00 30 cycli 4 72°C 1:00 5 72°C 0:20 6 15°C 0:20 Tabel 17: TD 64-52programma Stap Temp Min 1 95°C 4:00 2 95°C 0:20 -1°C/cyclus 3 64°C 0:15 12 cycli 4 72°C 1:00 5 94°C 0:40 6 52°C 0:40 20 cycli 7 72°C 0:40 8 72°C 10:00 9 15°C 10:00
Taq 0,3
H2O 9,2
H2O 10
Tabel 18: TD 55 programma Stap Temp Min 1 94°C 5:00 2 94°C 0:20 -1°C/cyclus 3 65°C 0:15 10 cycli 4 72°C 1:00 5 94°C 0:45 6 55°C 0:45 20 cycli 7 72°C 1:30 8 72°C 10:00 9 15°C 10:00
Tabel 19: USH2A programma Min Stap Temp 1 95°C 10:00 2 95°C 0:30 3 55°C 0:30 38 cycli 4 72°C 2:00 5 72°C 10:00 6 15°C 10:00
Bijlage 3: Homozygote regio’s
15.727.839 11.938.418 8.906.357 6.657.647 6.596.068 5.629.066 5.335.142 4.915.609 4.897.100 4.848.665 4.366.113 4.058.761 3.943.059 3.938.779 3.903.470 3.287.262 2.632.996 2.598.596 2.422.674 2.228.850 2.204.378 2.123.116 2.120.203 2.033.250 2.032.053 1.950.949 1.939.492 1.839.534 1.744.331 1.691.051 1.663.579 1.611.363 1.593.758 1.587.392 1.540.434 1.528.143 1.515.206 1.406.844 1.373.005 1.358.728 1.358.135 1.327.815 1.306.783
31.767.900 21.216.064 137.935.512 88.440.703 42.737.443 97.211.605 48.190.372 82.990.250 49.063.116 50.591.698 49.699.157 15.268.797 90.556.266 7.013.286 108.526.731 149.478.220 161.688.128 83.254.244 55.318.319 195.519.979 37.353.037 54.366.415 89.190.270 57.242.211 26.866.620 46.593.594 129.749.756 32.685.825 12.075.775 22.673.906 85.735.283 65.401.760 102.516.897 77.418.817 83.518.021 29.502.406 44.651.136 95.843.718 73.784.937 80.211.357 22.748.614 148.978.520 52.477.690
SNP_A-1847078 SNP_A-2201357 SNP_A-4198102 SNP_A-4199662 SNP_A-2053827 SNP_A-1792830 SNP_A-2086717 SNP_A-2292008 SNP_A-2214982 SNP_A-1897747 SNP_A-2253264 SNP_A-1933557 SNP_A-4211104 SNP_A-2176916 SNP_A-2030553 SNP_A-2090936 SNP_A-1965655 SNP_A-2035303 SNP_A-2262380 SNP_A-1856125 SNP_A-1905162 SNP_A-2158861 SNP_A-2022236 SNP_A-2175889 SNP_A-2053468 SNP_A-4229930 SNP_A-2089244 SNP_A-1976754 SNP_A-1999886 SNP_A-1942429 SNP_A-2190307 SNP_A-2247459 SNP_A-2216602 SNP_A-2183247 SNP_A-1853585 SNP_A-2182258 SNP_A-1834404 SNP_A-2307435 SNP_A-1908389 SNP_A-2080775 SNP_A-4219948 SNP_A-2073475 SNP_A-2023516
Positie stop
SNP_A-2303925 SNP_A-1828687 SNP_A-1817529 SNP_A-1826519 SNP_A-2189175 SNP_A-1990697 SNP_A-2196903 SNP_A-2049514 SNP_A-1827593 SNP_A-2011005 SNP_A-1811087 SNP_A-1855275 SNP_A-2303393 SNP_A-4206185 SNP_A-2223137 SNP_A-2078119 SNP_A-2089932 SNP_A-4239255 SNP_A-2032304 SNP_A-2184670 SNP_A-2142974 SNP_A-4226334 SNP_A-4236990 SNP_A-2173413 SNP_A-2084861 SNP_A-2256026 SNP_A-2057719 SNP_A-4202329 SNP_A-2214122 SNP_A-1830451 SNP_A-4226831 SNP_A-4238126 SNP_A-2123040 SNP_A-2078439 SNP_A-1986658 SNP_A-2218425 SNP_A-1860360 SNP_A-2063654 SNP_A-2163236 SNP_A-2064036 SNP_A-4228544 SNP_A-2070147 SNP_A-2266078
SNP stop
#SNPs 158 252 733 31 97 192 109 449 164 91 482 149 240 224 176 220 202 227 105 234 212 80 216 266 205 212 102 161 48 151 141 107 104 131 153 207 71 146 99 127 108 62 225
Positie start
16 19 7 2 8 7 4 7 3 11 8 17 5 1 12 7 2 12 17 2 11 12 6 12 3 6 5 4 1 18 13 14 1 12 6 6 1 13 5 12 5 1 13
SNP start
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43
Lengte in bp
N°
Chromosoom
Tabel 20: Homozygote regio’s van meer dan 1Mb in familie A (indexpatiënt II:1 en II:3)
47.495.739,00 33.154.482,00 146.841.869,00 95.098.350,00 49.333.511,00 102.840.671,00 53.525.514,00 87.905.859,00 53.960.216,00 55.440.363,00 54.065.270,00 19.327.558,00 94.499.325,00 10.952.065,00 112.430.201,00 152.765.482,00 164.321.124,00 85.852.840,00 57.740.993,00 197.748.829,00 39.557.415,00 56.489.531,00 91.310.473,00 59.275.461,00 28.898.673,00 48.544.543,00 131.689.248,00 34.525.359,00 13.820.106,00 24.364.957,00 87.398.862,00 67.013.123,00 104.110.655,00 79.006.209,00 85.058.455,00 31.030.549,00 46.166.342,00 97.250.562,00 75.157.942,00 81.570.085,00 24.106.749,00 150.306.335,00 53.784.473,00
44 45 46 47 48 49 50 51 52 53 54
2 7 7 13 2 13 7 6 2 7 6
1.271.451 1.259.844 1.254.017 1.253.613 1.232.411 1.194.609 1.152.621 1.152.123 1.114.119 1.061.760 1.040.688
100 134 153 162 76 150 141 91 104 91 124
SNP_A-1891146 SNP_A-2132809 SNP_A-4224198 SNP_A-2146664 SNP_A-1833599 SNP_A-2060791 SNP_A-1843586 SNP_A-2205473 SNP_A-2275379 SNP_A-1949674 SNP_A-2232003
187.201.209 26.441.201 107.379.150 62.535.278 185.232.836 69.100.679 19.070.729 109.115.071 80.768.625 132.552.341 99.369.299
SNP_A-2190712 SNP_A-4212281 SNP_A-2293313 SNP_A-2175624 SNP_A-4231199 SNP_A-2226883 SNP_A-1989095 SNP_A-4211901 SNP_A-4203784 SNP_A-1941073 SNP_A-2128926
188.472.660,00 27.701.045,00 108.633.167,00 63.788.891,00 186.465.247,00 70.295.288,00 20.223.350,00 110.267.194,00 81.882.744,00 133.614.101,00 100.409.987,00
Bijlage 4: Microsatellietmerkers voor familie B
Figuur 7 : Haplotypes voor regio 1 op chromosoom 16.
Segregatie-onderzoek werd uitgevoerd met de microsatellietmerkers D16S3120, D16S3022, D16S753, D16S3105, D16S3044, D16S409, D16S261, D16S3080, D16S3035 en D16S3137. Twee niet aangetaste sibs vertonen hetzelfde samengesteld heterozygote genotype als de drie aangetaste individuen, wat suggereert dat deze locus in familie A niet gekoppeld is met het CACD fenotype.
Figuur 8 Haplotypes voor regio 2 op chromosoom 7.
Segregatie-onderzoek werd uitgevoerd met de mircosatellietmerkers D7S800, D7S809, D7S2450, D7S2505, D7S1824, D7S2202, D7S2513, D7S661, D7S1798, D7S2511, D7S505, D7S2439, D7S483, D6S293, D7S2462, D7S637 en D7S550. Aangezien de genotypes voor deze regio verschillend zijn in de drie aangetaste siblings, is dit suggestief voor afwezigheid van koppeling van deze locus en het CACD fenotype in familie A.
Figuur 9: Haplotypes voor regio 3 op chromosoom 19.
Segregatie-onderzoek met de microsatellietmerkers D19S568, D19s434, D19S910, D19S419, D19S931 en D19S222. Aangezien de drie aangetaste siblings geen gemeenschappelijk genotype hebben, kan besloten worden tot exclusie van koppeling van deze regio en het CACD fenotype in familie A.
Figuur 10: Haplotypes voor regio 4 op chromosoom 8.
Segregatie-onderzoek werd uitgevoerd met de microsatellietmerkers D8S1745, D8S1831 en D8S1815. Aangezien de drie aangetaste siblings geen gemeenschappelijk genotype hebben, kan besloten worden tot exclusie van koppeling van deze regio en het CACD fenotype in familie A.
Figuur 11: Haplotypes voor regio 5 op chromosoom 1.
Segregatie-onderzoek werd uitgevoerd met de microsatellietmerkers D1S253, D1S2694, D1S450 en D1S1635. Aangezien de drie aangetaste siblings geen gemeenschappelijk homozygoot genotype hebben, kan besloten worden tot exclusie van koppeling van deze regio en het CACD fenotype in familie A.
Figuur 12: Haplotypes merkers voor regio 6 op chromosoom 2.
Segregatie-onderzoek werd uitgevoerd met de microsatellietmerkers D2S342, D2S2387 en D2S316. Aangezien de drie aangetaste siblings geen gemeenschappelijk homozygoot genotype hebben, kan besloten worden tot exclusie van koppeling van deze regio en het CACD fenotype in familie A.
Figuur 13: Haplotypes merkers voor regio 7 op chromosoom 6.
Segregatie-onderzoek werd uitgevoerd met de microsatellietmerker D6S1651. Aangezien de drie aangetaste siblings geen gemeenschappelijk homozygoot genotype hebben, kan besloten worden tot exclusie van koppeling van deze regio en het CACD fenotype in familie A.
Figuur 14: Haplotypes merkers voor regio 8 op chromosoom 1.
Segregatie-onderzoek werd uitgevoerd met de microsatellietmerker D1S1597. Aangezien de drie aangetaste siblings geen gemeenschappelijk genotype hebben, kan besloten worden tot exclusie van koppeling van deze regio en het CACD fenotype in familie A.
Figuur 15: Haplotypes merkers voor regio 9 op chromosoom 1.
Segregatie-onderzoek werd uitgevoerd met de microsatellietmerker D1S2626. Aangezien de drie aangetaste siblings geen gemeenschappelijk genotype hebben, kan besloten worden tot exclusie van koppeling van deze regio en het CACD fenotype in familie A.
Figuur 16: Haplotypes merkers voor regio 10 op chromosoom 6.
Segregatie-onderzoek werd uitgevoerd met de microsatellietmerker D6S388. Aangezien de drie aangetaste siblings geen gemeenschappelijk genotype hebben, kan besloten worden tot exclusie van koppeling van deze regio en het CACD fenotype in familie A.
Figuur 17: Haplotypes merkers voor regio 11 op chromosoom 1.
Segregatie-onderzoek werd uitgevoerd met de microsatellietmerker D1S421en D1S451. Aangezien de drie aangetaste siblings geen gemeenschappelijk genotype hebben, kan besloten worden tot exclusie van koppeling van deze regio en het CACD fenotype in familie A.
Figuur 18: Haplotypes merkers voor regio 12 op chromosoom 5.
Segregatie-onderzoek werd uitgevoerd met de microsatellietmerker D5S1473 en D5S813. Aangezien de drie aangetaste siblings geen gemeenschappelijk genotype hebben, kan besloten worden tot exclusie van koppeling van deze regio en het CACD fenotype in familie A.
Figuur 19: Haplotypes merkers voor regio 13 op chromosoom 1.
Segregatie-onderzoek werd uitgevoerd met de microsatellietmerker D1S498 en D1S2343. Aangezien de drie aangetaste siblings geen gemeenschappelijk genotype hebben, kan besloten worden tot exclusie van koppeling van deze regio en het CACD fenotype in familie A.
Figuur 19: Haplotypes merkers voor regio 14 op chromosoom 7.
Segregatie-onderzoek werd uitgevoerd met de microsatellietmerker D7S2452, D7S681 en D7S631. Aangezien de drie aangetaste siblings geen gemeenschappelijk genotype hebben, kan besloten worden tot exclusie van koppeling van deze regio en het CACD fenotype in familie A.
Bijlage 5: Kandidaatgenen Tabel 21: Ziektegenen voor RP, LCA en maculaire degeneratie Cx
Gen
Cx
Gen
Cx
Gen
Cx
Gen
1 ABCA4
3 RHO
8 RP1
17 GUCY2D
1 SEMA4A
4 CNGA1
9 TOPORS
17 AIPL1
1 HMCN1
4 PROM1
10 RGR
17 CA4
1 RPE65
4 PDE6B
11 BEST1
17 PRCD
1 CRB1
4 LRAT
11 ROM1
17 FSCN2
1 CFH
5 PDE6A
11 C1QTNF5
19 CRX
1 RD3
6 GUCA1B
12 CEP290
19 RPPF31
1 LCA5
6 PRPH2
14 RPGRIP1
22 TIMP3
1 USH2A
6 TULP1
14 NRL
2 EFEMP1
6 LCA5
14 RDH12
2 SAG
6 ELOVL4
15 NR2E3
2 MERTK
7 RP1
15 RLBP1
2 CERKL
7 IMPDH1
16 CNGB1
Tabel 22: Ziektegenen voor Joubert syndroom, Senior-Loken syndroom, Meckel syndroom en nefronoftisis Cx
Gen
1 NPHP4/SLSN4
Cx Gen 9 NPHP2
2 NPHP1/SLSN1
11 MKS2
2 ARL13B/JBTS8/ARL2L1 3 NPHP3/SLSN3
12 NPHP6, CEP290/SLSN6/JBTS5/MKS4
3 NPHP5/SLSN5
16 NPHP8/JBTS7/MKS5
4 CC2D2A
16 RPGRIP1L
6 AHI1
17 NPHP9/NEK8
8 MKS3/TMEM67
17 MKS1
16 NPHP7
Bijlage 6: Sequentie verandering Tabel 23: Sequentieverandering in RLBP1 voor familie B Intron cDNA SNP Frequentie 3 3 5 7 3’UTR 3’UTR
c.13-100T>C c.13-96del c.347-83T>C c.684+20C>T c.*167T>G c.*296G>A
/ / rs4932483 rs950541 rs834 rs2710
/ / / 0.07 / 0.11
Splicing
Conclusie
niet suggestief niet suggestief niet suggestief niet suggestief / /
onwaarschijnlijk causaal onwaarschijnlijk causaal onwaarschijnlijk causaal onwaarschijnlijk causaal onwaarschijnlijk causaal onwaarschijnlijk causaal
Tabel 24: Exonische sequentieverandering in USH2A voor familie C Exon
cDNA
Eiwit
SNP
Frequentie
UMD
Grantham afstand (>60)
Polyphen
SIFT (≤0.5)
ESE
Conclusie
11
c.1931A>T
p.Asp644Val
rs1805048
/
/
152
niet pathogeen
0.03
1 bindingsplaats extra
25
c.4994T>C
p.Ile1665Thr
rs6522536
/
polymorfisme
89
mogelijks pathogeen
0.01
/
onwaarschijnlijk causaal onwaarschijnlijk causaal onwaarschijnlijk causaal onwaarschijnlijk causaal onwaarschijnlijk causaal waarschijnlijk causaal onwaarschijnlijk causaal onwaarschijnlijk causaal
32
c.6317T>C
p.Ile2106Thr
rs6657250
0.4
/
89
niet pathogeen
1.00
1 bindingsplaats minder, 3 extra
34
c.6506T>C
p.Ile2169Thr
rs10864219
0.4
/
89
niet pathogeen
0.04
/
38
c.7300+43C>T
/
rs41277206
/
/
/
/
/
/
63
c.12574C>T
p.Arg4192Cys
/
/
/
180
waarschijnlijk pathogeen
0.00
2 bindingsplaats minder, 1 extra
63
c.12612A>G
p.=
rs2797235
0.055
polymorfisme
/
/
/
/
63
c.12666A
p.=
rs2797234
0.226
polymorfisme
/
/
/
/
Tabel 25: Intronische sequentieverandering in USH2A voor familie C Intron cDNA SNP Frequentie 7 21 37
c.1328+36_1328+39del c.4628-63C>T c.6958-132G>A
/ rs7540411 rs12069955
/ / /
Splicing
Conclusie
niet suggestief niet suggestief niet suggestief
onwaarschijnlijk causaal onwaarschijnlijk causaal onwaarschijnlijk causaal
Tabel 26: Sequentieverandering in RP1 voor familie D Exon
cDNA
Eiwit
SNP
Frequentie
Grantham afstand (>60)
Polyphen
SIFT (≤0.5)
ESE
Conclusie
4
c.5071T>C
p.Ser1691Pro
rs414352
0.075
74
niet pathogeen
0.33
1 bindingsplaats minder
4
c.5008G>A
p.Ala1670Thr
rs446227
0.063
58
niet pathogeen
0.69
/
4
c.55701610G
p.Arg872His
rs444772
0.137
29
niet pathogeen
0.06
1minder, 1extra
4
c.5175A>G
p.=
/
/
/
/
/
1 extra
onwaarschijnlijk causaal onwaarschijnlijk causaal onwaarschijnlijk causaal onwaarschijnlijk causaal
Bijlage 7: Overlappende homozygote regio’s tussen de verschillende families
1
2
9
Positie stop
positie start
# SNPs
Lengte (in bp)
Familie
Chromosoom
Tabel 27: Overlappende grote homozygote regio’s
A
22.689.930
8
120.887.054
143.576.984
B
22.689.930
8
120.887.054
143.576.984
C
24.127.190
41
D
22.689.930
8
120.211.226 120.887.054
144.338.416 143.576.984
E
23.450.282
28
120.887.054
F
20 31
120.211.226
A
23.365.758 6.657.647
144.337.336 143.576.984
88.440.703
95.098.350
B
5.014.482
2
89.900.203
94.914.685
C
8.259.258
62
D
6.804.616
21
87.344.242 89.395.623
95.603.500 96.200.239
E
6.330.025
17
88.771.381
95.101.406
F
11 9
89.750.715
95.603.500
A
5.852.785 25.271.420
43.470.441
68.741.861
B
6.291.811
8
38.737.064
45.028.875
C
25.248.365
8
D
31.622.288
29
43.493.496 38.693.364
68.741.861 70.315.652
E
31.638.912
34
38.729.117
70.368.029
F
30.005.388
14
38.736.473
68.741.861
A
16
158 52
31.767.900
47.495.739
B
15.727.839 13.573.590
31.767.900
C
15.403.142
110
31.328.918
45.341.490 46.732.060
D
11.375.166
38
34.969.553
46.344.719
E
15.534.977
120
31.328.918
46.863.895
F
14.716.490
84
31.767.900
46.484.390
A
11.938.418 8.866.177
252 12
21.864.073
33.154.482
8.880.202 /
16 /
24.147.333 24.131.560
33.011.875 33.011.762 /
8.880.315 /
17 /
/ 24.131.560
B 19
C D E F
/
33.011.875 /