Moleculaire Celbiologie BAC3 (Biochemie) 2007 - 2008
E. De Herdt In deze cursus wordt de basis gelegd om biologische verschijnselen te kunnen verklaren op moleculair vlak. Een goede kennis van de verschillende biomoleculen is hiervoor onontbeerlijk omdat we dieper ingaan op de structuur – functie relatie. De studie van de organisatie van het genoom, de werking en regulatie van genen op moleculair vlak is noodzakelijk omdat ze de basis vormt van de grote verscheidenheid aan levensvormen. Een beknopte introductie tot de bioinformatica wordt eveneens gestart!
Nucleïnezuren: sequentiebepaling PCR en toepassingen DNA replicatie Moleculaire structuur van genen en chromosomen Transcriptie en regulatie RNA processing, - transport en translatie, regulatie RNAi Natuurlijke recombinatieprocessen Signaaltransductie wegen Modelorganismen Moleculair biologische databanken consulteren Power Point slides
1-20 1-17 1-10 1-9 1-8 1-10 1-5 1-12
1-183
Cursus Moleculaire Celbiologie E. De Herdt / F. Mahieu EVALUATIE HOORCOLLEGE Eerste (januari) of tweede (juni) examenperiode: De evaluatie van het HC gebeurt schriftelijk aan de hand van kleine vraagjes (j/f, invul, bespreek) over de gehele cursus. Materiaal dat je mag gebruiken: Schrijfgerief.
Derde examenperiode (september): Idem als tijdens eerste of tweede examenperiode
LABO Permanente evaluatie: Dit betekent tijdens de labo experimenten op elk ogenblik weten wat je aan het doen bent of het u tenminste afvragen; bv. weten waarom je een bepaald product op een gegeven ogenblik toevoegt, waarom je incubeert, ... Het afwerken van een experiment binnen de voorziene tijd is hieraan ondergeschikt. Uw leergierigheid moet duidellijk worden voor de labo verantwoordelijke!!! Evaluatie: 50% op individuele inzet tijdens de zitting, 50% op groepsverslag (samen maken en samen verantwoordelijk!!!). Derde examenperiode (september): Er gebeurt een automatische overdracht van de punten. Studenten die bij een laag cijfer een nieuwe proef wensen, dienen mij hiervan persoonlijk op de hoogte te stellen voor aanvang van de derde examenperiode! De bijkomende proef zal worden afgenomen op hetzelfde ogenblik als het examen van het hoorcollege!
E. De Herdt / F. Mahieu
Nucleïnezuren
Nucleïnezuren Nucleïnezuren zijn evenals eiwitten lange, ketenachtige macromoleculen die instaan voor één van de meest essentiële levensfuncties namelijk de opslag en overdracht van de genetische informatie. Zij bevatten het plan voor de synthese van eiwitmoleculen die op hun beurt bepalend zijn voor de structuur van het organisme. Deoxyribonucleïnzeuur (DNA) en ribonucleïnezuur (RNA) zijn hoofdbestanddelen van alle cellen (5 – 15 % g/g, droog). Virussen bevatten eveneens nucleïnezuren. Niettegenstaande DNA voor het eerst werd geïsoleerd uit kernen, komen zowel DNA als RNA ook voor in andere delen van de cel (cytoplasma, mitochondriën). Naar analogie met de eiwitten waar de aminozuren de bouwstenen vormen, kunnen nucleïnezuren opgebouwd worden uit een opeenvolging van verschillende nucleotiden. De unieke sequentie bepaalt hier het unieke karakter van elk nucleïnezuurtype. Na volledige hydrolyse van nucleïnezuren verkrijgen we een mengsel van 1 mol fosfaat, 1 mol suiker en 1 mol van een mengsel van verschillende heterocyclische basen.
1Bouwsten van de nucleïnezuren Organische basen De basen (heterocyclische moleculen) welke worden teruggevonden in nucleïnezuren zijn ofwel pyrimidines of purines (= samengesmolten pyrimidine-imidazol ringsysteem) welke een uitgesproken aromatisch karakter bezitten. In hun vrije vorm komen ze maar in zeer kleine concentratie voor in de cel als gevolg van enzymatische hydrolyse van nucleïnezuren. De pyrimidines zijn vlakke moleculen, - de purines zijn bijna vlak (beetje geplooid). Naast hun afmeting is ook de mogelijkheid voor H-binding van belang. Hierbij spelen vooral de aminogroepen van adenine, guanine, cytosine, de ring NH groep op positie 1 van adenine, guanine en positie 3 van de pyrimidine basen en de sterke electronegatieve zuurstofatomen van de pyrimidines (positie 2) en van guanine (positie 6) een belangrijke rol. Vrije pyrimidines en purines zijn vrij slecht oplosbaar en zijn zwak basisch. Afhankelijk van de pH komen ze in verschillende tautomere vormen voor. Uracyl bijvoorbeeld komt voor als lactam en lactim vorm. Bij pH 7 overheerst de lactam-vorm. De structuur zoals weergegeven in de figuur is deze van de tautomere vorm die overheerst bij pH7. Het zijn ook de vormen welke verantwoordelijk zijn voor de geobserveerde H-binding tussen basen in natief DNA (zie later). Alle basen absorberen ultraviolet licht. Typische absorptie spectra worden hieronder weergegeven. Dit is niet alleen van belang voor de detectie van basen (en derivaten) en hun Groep T
E. De Herdt
p. 1
Nucleïnezuren identificatie in oplossing of op een vaste drager, maar tevens voor concentratiebepalingen van nucleïnezuren. Naast de vijf meest voorkomende basen (U, T, C, A, G) zijn er ook nog een groot aantal gemodifiëerde basen teruggevonden in nucleïnzuren. De meeste zijn methylderivaten van voornoemde vijf basen maar anderen bevatten acetyl- of hydroxymethylgroepen. Deze gemodifiëerde basen worden voornamelijk teruggevonden in transfer RNA’s (+/-10%) en worden gevormd door modificatie van het gesynthetiseerde polymere nucleïnezuur. Bij DNA worden methylatiepatronen in verband gebracht met de transcriptie efficiëntie van genen.
Nucleosiden Dit zijn moleculen bestaande uit een purine of pyrimidine base welke covalent gebonden is met D-ribofuranose (ribonucleosiden) of met 2deoxy-D-ribofuranose (deoxyribonucleosiden) door een N- β -glycoside verbinding. De binding vindt plaats tussen de de hemiacetal groep van C1 van de pentose suiker en het N9 van een purine of het N1 van een pyrimidine. Pseudouridine, een nucleoside dat voorkomt in transfer RNA’s is verbonden door een C- β glycoside binding waarbij de C1 van de ribose verbonden is met de C5 van uracyl. Vrije nucleosiden komen ook maar in zeer kleine concentraties voor in de cel als gevolg van chemische of enzymatische hydrolyse van nucleotiden. De nucleosiden zijn wel veel beter oplosbaar in water dan de vrije basen. Zij kunnen eenvoudig gescheiden en geïdenteficeerd worden door chromatografische methoden. Zoals de meeste glycosiden zijn nucleosiden vrij stabiel in alkalisch milieu. De purine nucleosiden worden echter wel gehydrolyseerd door zuren tot de vrije base en de pentose suiker. Pyrimidine nucleosiden zijn echter wel stabiel in zuur milieu.
Nucleotiden Dit zijn fosfaatesters van nucleosiden. Er bestaan verschillende klassen aangezien de fosfaatester kan gevormd worden met het 2’, 3’ of 5’ C atoom van een ribonucleoside of met een 3’ of 5’ C atoom van een deoxyribonucleoside. De meest voorkomende zijn de 5’ monofosfaten alsook de di- en trifosfaat derivaten. Hieronder vindt u de algemene structuur en de benamingen.
Groep T
E. De Herdt
p. 2
Nucleïnezuren
Afkorting A G U C T
Base Adenine Guanine Uridine Cytidine Thymidine
Nucleoside (deoxy)adenosine (deoxy)guanosine (deoxy)uridine (deoxy)cytidine (deoxy)thymidine
Nucleotide (deoxy)adenosine 5’-monofosfaat (deoxy)guanosine 5’-monofosfaat Uridine 5’-monofosfaat (deoxy)cytidine 5’-monofosfaat Deoxythymine 5’-monofosfaat
De fosforzure groep is lichtjes zuurder dan H3PO4 zelf (pK: 2.1/7.2/12.5). Bij fysiologische pH bestaan ze dus voornamelijk in de N-O-PO32vorm. Door de aanwezigheid van de basen absorberen ze eveneens sterk het U.V.-licht. Nucleosiden en nucleotiden bevatten bijna twee vlakke ringen (suiker - base). In de meest stabiele conformatie staan beide ringen in een rechte hoek ten overstaan van elkaar. Door de ionisatie van de fosforzure groepen vormen de di- en trifosfaat residus complexen met divalente kationen zoals Mg2+ en Ca2+. In de intacte cel komen door de vrij hoge Mg2+ concentratie bijna alleen de Mg2+ complexen voor van de nucleoside 5’di- en 5’trifosfaten. De γ en β fosfaatgroep worden door verhitting bij 100°C en 1 N HCl gemakkelijk afgesplitst. De α groep is hierbij stabiel. De nucleoside trifosfaten hebben belangrijke biologische functies. ATP wordt gebruikt in de overdracht van fosfaatgroepen en drager van chemische energie in verschillende enzymatische reacties. (ATP/ADP systeem). Dit wordt ook, maar in mindere mate uitgevoerd door GTP, UTP en CTP. Zij worden ook in een coënzymeachtige manier gebruikt als drager van specifieke bouwstenen. UDP is een specifiek drager van glucose groepen in de biosynthese van polysacchariden. CDP is drager van choline in de biosynthese van choline bevattende fosfoglyceriden. De trifosfaat residu’s zijn tevens de energierijke precursoren van de mononucleotide bouwstenen in de biosynthese van DNA en RNA. De chemische energie opgeslagen in de β en γ fosfaatgroepen wordt hier dus gebruikt voor de vorming van een nieuwe covalente binding. Andere in de natuur voorkomende nucleotiden zijn: * ribonucleoside 2’3’cyclisch fosfaat (intermediair -) en ribonucleoside 3’fosfaat = eindproduct in de hydrolyse van RNA door sommige ribonucleasen. * adenosine 3’5’ cyclisch fosfaat = cAMP Groep T
E. De Herdt
p. 3
Nucleïnezuren Dit wordt gevormd door adenylaat cyclase, een enzyme gelocaliseerd in de celmembraan dat gestimuleerd wordt door bepaalde hormonen. CAMP is dus een tweede boodschapper aangezien het het signaal van de hormonen in het bloed overdraagt en versterkt binnenin de cel. * Guanosine 5’ difosfaat 3’difosfaat (ppGpp) en guanosine 5’ trifosfaat 3’ difosfaat (pppGpp): Deze zijn betrokken in de regulatie van de DNA transcriptie in bacteriën. * verschillende coënzymen zijn nucleotiden of derivaten ervan (NAD, NADP, FAD)
2Polynucleotiden Onderstaande figuur toont de structuur van een RNA tetranucleotide met de vier belangrijkste basen. De nucleotiden zijn verbonden door fosfodiëster bindingen tussen de 3’ en 5’ koolstofatomen van opeenvolgende ribosylresidu’s. Dezelfde 3’ - 5’ fosfodiësterbinding komt voor in DNA maar dan tussen de deoxyribosylresidu’s. Het zijn dus lineaire polymeren met een 5’ terminus (vrije C5‘ -OH) en een 3’ terminus (vrije C3’ OH). Het getoonde tetranucleotide kan ook door 5’-ApCpGpU-3’ worden weergegeven. Bij conventie is er overeengekomen dat de opeenvolging van de verschillende nucleotiden wordt weergegeven van het 5’ einde naar het 3’ einde (ACGU).
Groep T
E. De Herdt
p. 4
Nucleïnezuren
Desoxyribonucleïnezuren Bij eukaryoten is het grootste deel van het DNA geconcentreerd in de kern. Extranucleair DNA komt voor in chloroplasten, mitochondriën en andere grote organellen welke op zijn minst zelf reproduceerbaar zijn. Kernen bevatten ongeveer 4 à 8.10-12 g DNA per kern (dieren). Deze grootheid verandert niet met de fysiologische toestand van het dier of met zijn voeding maar is rechtstreeks afhankelijk van het aantal chromosomen (haploïd - diploïd) in de cel.
De basesamenstellling en sequentie van een grote variëteit van DNA’s uit verschillende organismen is heden bekend. De volgende bevindingen komen naar voor (E. Chargaff): * De basesamentstelling is karakteristiek voor elke soort; * verschillende cellen van hetzelfde organisme bezitten dezelfde basesamenstelling onafhankelijk van ouderdom, ontwikkeling, voeding en andere fysiologische of uitwendige factoren; * de basesamenstelling variëert sterk van organisme tot organisme en wordt het best weergegeven door de disymmetrieverhouding A+T/G+C; * verwante soorten bezitten ongeveer gelijkaardige basesamenstelling; ¨alle “normale” (=ideale) DNA moleculen vertonen de volgende regelmatigheden: A = T en G = C
Groep T
/
A+G = T+C
E. De Herdt
p. 5
Nucleïnezuren
2.1.1DNA structuur - Dubbele helix van Watson & Crick DNA bestaat uit twee rechtshandige helicoïdale polynucleotide kettingen van tegengestelde polariteit (3’ - 5’ / 5’ - 3’) die ronde éénzelfde as gekronkeld zijn om een dubbele helix te vormen. De twee ketens zijn dus anti-parallel. De basen zitten aan de binnenkant in zulke paren gerangschikt dat een pyrimidine van de ene ketting steeds gepaard is met een purine base van de andere. De vlakken van de basen zijn parallel met elkaar en staan loodrecht op de lengte-as van de dubbele helix; De gepaarde basen liggen in hetzelfde vlak. De enige basen die toegelaten zijn op basis van afmeting en H-brugvorming zijn A - T (2) en G - C (3). De sterk negatieve fosfodiësterbinding zit aan de buitenzijde waar de polaire groepen interageren met de watermoleculen en met positieve kationen (Mg) of specifieke kleurstoffen. Er zijn 10 basen per draai. Stabilisatie treedt op door Van der Waals interactie tussen de aromatische ringen van de verschillende basen die boven elkaar gestapeld zijn. De helix is 2 nm in diameter; er is een smalle groef van 12 angstrom en een brede groef van 22 angstrom. Deze groeven zijn als het ware de enige twee vensters waardoor de basen kunnen geïdentificeerd worden door een extern molecule (endonucleasen, transcriptiefactoren, enz.). De twee antiparallelle kettingen verschillen zowel in basesequentie als in basesamenstelling. De twee polynucleotidekettingen zijn echter wel mekaars complement. Hierdoor kan er verdubbeling optreden doordat de twee strengen uit elkaar gaan waarna de complementaire stukken terug enzymatisch worden aangebouwd. Er ontstaan dus 2 dochtermoleculen met elk één ouder- en één nieuw gesynthetiseerde ketting (=semi-conservatieve replicatie!).
2.1.2Denaturatie van DNA Tijdens denaturatie van DNA worden geen covalente bindingen verbroken. De dubbele helix ontrolt zich en de twee polynucleotide strengen worden gescheiden waardoor enkelstrengig of gedenatureerd DNA ontstaat. De denaturatie kan veroorzaakt worden door extreme pH (ionisatie verandert), warmte (verbreken van H-bruggen), wijziging in diëlectrische constante van de omgeving (interactie zijgroepen), ureum (verbreken van Hbruggen), enz.. Het gevolg is dat de viscositeit daalt, de absorptie bij 260 nm stijgt, de optische rotatie negatiever wordt en de zweefdichtheid stijgt. De eenvoudigste manier om denaturatie te meten is door de verhoging van de U.V. absorptie (= hyperchromiciteit). Natief DNA absorbeert veel minder U.V. licht dan de som van zijn mononucleotiden. Bij denaturatie stijgt de absorptie (+/- 40 %) en is ze gelijk aan de som van die van de mononucleotiden. De mindere (dan de som) lichtabsorptie (= hypochromiciteit) is te wijten aan de interactie tussen de basen in de dubbele helix waardoor de absorptiehoeveelheid van elke risidu vermindert. Natieve DNA moleculen denatureren binnen een klein temperatuursverschil. Hoe kleiner het DNA hoe steiler het traject. Hierdoor kunnen we de smelttemperatuur Tm definiëren als het middelpunt van de smeltcurve. De Tm stijgt indien de hoeveelheid G-C baseparen stijgt. Groep T
E. De Herdt
p. 6
Nucleïnezuren Deze bevatten immers drie H-bindingen en zijn het meest stabiel. DNA’s van verschillende celtypes hebben karakteristieke smelttemperaturen. In de denaturatie van DNA helixen kunnen we twee fasen onderscheiden. In een eerste fase zijn de twee ketens bijna gescheiden doch vormen nog met een kort segment een dubbele helix. Tijdens de tweede fase worden de ketens volledig gescheiden. Indien nu vlug wordt afgekoeld, plooit de keten op zichzelf terug met de vorming van intramoleculaire helix segmenten, er wordt geen renaturatie bekomen. In de eerste fase is renaturatie eenvoudig en spontaan. Dit is te wijten aan het coöperatief karakter van de opeenvolgende interacties waardoor elke interactie de vorming van de volgende interactie stimuleert.
Ribonucleïnezuren (RNA) De cel bevat drie typen RNA die alle een rol spelen bij de eiwitsynthese. Deze drie typen zijn boodschapper RNA (mRNA) ribosomaal RNA (rRNA) en transport RNA (tRNA). Zij komen allen voor als enkelvoudige polynucleotide kettingen doch hebben wel een karakteristieke molecuulgewichtsverdeling en sedimentatiecoëfficiënt. Per cel zijn er drie of meer rRNA’s, >60 tRNA’s en 100 tot 10 000 verschillende mRNA’s. De cellen bevatten dan ook 2 à 8 maal meer RNA dan DNA.
2.1.3Boodschapper RNA mRNA bevat voornamelijk de vier hoofdbasen (A,U,G,C). Het wordt gesynthetiseerd in de kern tijdens de transcriptie waarbij de basesekwentie van één streng van het chromosomaal DNA enzymatisch wordt afgeschreven onder de vorm van enkelstrengig mRNA. Hierna wordt het naar het cytoplasma getransporteerd en nadien naar het ribosoom waar het fungeert als template voor de ordening van de aminozuren tijdens de biosynthese van eiwitten. Elk van de verschillende eiwitten gesynthetiseerd door de cel worden gecodeerd door specifieke mRNA’s. Deze verschillen dan ook sterk in molecuulgewicht en basesamenstelling. Typisch voor elke mRNA is dat ze een poly(A) sekwentie bevatten (0 - 200 nucleotiden) aan het 3’ einde en een CAP structuur (ppGmpp) aan het 5’ uiteinde. Beide spelen een rol in het transport van het mRNA en zorgen tevens voor een bescherming tegen 5’- en 3’ exonucleasen. De lengte van de poly(A) staart is een indicatie van de levensduur van het mRNA. Via oligo(dT) affiniteitschromatografie kan aldus de totale mRNA populatie afgezonderd worden uit een totaal RNA extract. Groep T
E. De Herdt
p. 7
Nucleïnezuren
2.1.4Transport RNA tRNA’s zijn vrij kleine moleculen die tot taak hebben specifieke individuele aminozuren te transporteren naar de plaats waar ze aaneengeregen worden tot eiwitketens. Zij hebben een molecuulgewicht van ongeveer 25 000 en een sedimentatiecoëfficiënt van 4 S. Ze bevatten +/- 80 nucleotiden. Normaal zijn er een 3 tal verschillende tRNA’s voor elk aminozuur, waardoor er +/- 60 verschillende tRNA’s voorkomen in de cel. tRNA’s bevatten een grote hoeveelheid (+/- 10%) gemodificeerde basen. Aangezien er complementaire stukken voorkomen in het RNA wordt er een secundaire structuur gevormd. Voor tRNA bestaat deze uit een klaverblad structuuur met 60 à 70 % in dubbele helixvorm. Gemeenschappelijke kenmerken zijn: de 3’ terminale sekwentie (CCA). De vrije hydroxylgroep van het adenosine wordt enzymatisch geacetyleerd met het specifieke α aminozuur waardoor de opgeladen vorm van het transport RNA gevormd wordt (aminoacyl tRNA). De aanhechting gebeurt dus aan de aminozuur arm. De anticodon arm bevat een triplet van basen welke complementair zijn met het codon triplet op het mRNA. De TΨC arm wordt gekarakteriseerd door de aanwezigheid van pseudouridine en de DHU arm door de aanwezigheid van dihydrouridine. De driedimensionele structuur (tertiaire structuur) van tRNA lijkt op een hoofdletter L. Op het uiteinde van het korte stuk bevindt zich het triplet ACC en op het uiteinde van het lange stuk, loodrecht op het korte, bevindt zich het anticodon.
2.1.5Ribosomaal RNA Het rRNA beslaat ongeveer 60% van de massa in het ribosoom. Het rRNA is in het ribosoom geassociëerd (niet covalent gebonden) met specifieke eiwitten. Een E.coli cel bevat ongeveer 15 000 ribosomen. Ribosomen komen zowel vrij in het cytoplasma voor als gebonden op het endoplasmatisch reticulum. Het ribosoom is opgebouwd uit twee subeenheden (procaryoot: 30S en 50S; eucaryoten: 40S en 60S). Bij procaryoten bevat de 50S subeenheid een 23S en 5S rRNA en de 30S subeenheid een 16S rRNA. Bij eucaryoten bevat de 60S subeenheid een 28S een 5,8S en een 5S rRNA en de 40S subeenheid een 18S rRNA. Elk rRNA is in de subeenheid geassociëerd met zijn eigen reeks van specifieke eiwitten. Ze zijn echter niet volledig bedekt met eiwitten. De 5S component bevat een nucleotide Groep T
E. De Herdt
p. 8
Nucleïnezuren sequentie welke complementair is met een deel van alle tRNA’s waardoor de binding tussen het ribosoom en tRNA vereenvoudigd wordt. Het 18S rRNA interageert met een een nucleotide sequentie welke steeds aanwezig is aan het 5’ einde van alle mRNA’s.
Functie van ribosomen: * vastankeringsplaats voor mRNA, aminoacyltRNA’s; * zorgen voor de aanwezigheid van enzymen welke de peptide binding catalyseren; * ze ondergaan een structurele verandering waardoor ze over het mRNA schuiven van triplet naar triplet; * ze herkennen zowel het begin als het einde van de gecodeerde eiwitsequentie op het mRNA waardoor het intacte eiwit wordt losgelaten. De meeste ribosomen komen in metabolisch actieve cellen voor als polysomen, welke gevormd worden door de vasthechting van een groot aantal ribosomen aan hetzelfde mRNA waardoor parelachtige strengen ontstaan met een hoge sedimentatieconstante. De groeiende eiwitketen is hiermee ook geassociëerd waardoor via immunologische technieken één welbepaald mRNA kan opgezuiverd worden uit een complexe verzameling polysomen.
3Supramoleculaire structuren tussen eiwit en nucleïnezuren Dit zijn niet covalente bindingen tussen nucleïnezuren en eiwitten * Ribosomen: zie hierboven * Chromosomen: bestaan uit een lange DNA streng welke gecomplexeerd is met eiwitten (= histonen) met een sterk basisch karakter. De DNA - histoon keten is dikwijls teruggeplooid (gecondenseerd) en vormt daardoor een chromosoom. * Virussen: zijn deeltjes bestaande uit nucleïnezuren en een aantal eiwitten. Na infectie van een gastcel (bacterie, plant, dier) dwingen ze deze om hun metabolisme zodanig aan te passen dat er replicatie van het virus plaatsvindt. Groep T
E. De Herdt
p. 9
Nucleïnezuren Vele ziekten zoals griep, verkoudheid, mazelen enz. worden overgedragen door virussen. Ze kunnen in een homogene vorm geïsoleerd en gekristalliseerd worden. De virussen hechten zich vast aan het oppervlak van de gastcel waarna het nucleïnezuur in het cytoplasma wordt gebracht. De DNA bevattende virussen zorgen ervoor dat hun DNA gebruikt wordt als template voor transcriptie. Hierdoor ontstaat mRNA dat de ribosomen dwingt om virale eiwitten en enzymen te maken die zullen instaan voor de replicatie van het viraal DNA. Bij RNA virussen heeft het viraal RNA de functie van mRNA dat een grotere affiniteit bezit voor de ribosomen dan het mRNA van de gastcel.
Virussen verschillen enorm in grootte, vorm en chemische samenstelling. Eén van de kleinste is de E.coli bacteriofaag φX174 (5 kb); de E.coli bacteriofaag T2 (200 kb) is één van de grootste en bevat een 50 tal verschillende eiwit subeenheden, terwijl het tabak mozaïk virus (TMV) maar één enkel type eiwitsubeenheid bevat. Plantvirussen bevatten enkel RNA en zijn ofwel staafvormig of polyhedrisch. Diervirussen bevatten ofwel DNA ofwel RNA. De bacteriële virussen, bacteriofagen zijn het best geschikt voor genetisch en biochemisch onderzoek omdat ze in grote aantallen repliceren in bacteriële suspensies.
Groep T
E. De Herdt
p. 10
Nucleïnezuren
4Hydrolyse van nucleïnezuren Zuren en basen Zachte, zure hydrolyse van DNA bij pH 3 veroorzaakt een selectieve hydrolytische verwijdering van alle purine basen zonder iets te wijzigen aan de pyrimidine - deoxyribose binding of aan de fosfodiëster bindingen van de DNA-ruggegraat. DNA zonder purine basen noemen apurinezuur. DNA is niet hydrolyseerbaar door verdund alkali, RNA wel. Voor RNA verkrijgen we een mengsel van 2’ en 3’ fosfaten. Cyclische 2’,3’ monofosfaten zijn de noodzakelijke intermediairen. Dit is de reden waarom DNA niet gehydrolyseerd wordt. Het bezit namelijk geen 2’ OH groep en kan het cyclische intermediair dus niet vormen.
Enzymatische hydrolyse van nucleïnezuren Deze enzymen kunnen ingedeeld worden naargelang welke zijde van de fosfodiëster binding ze hydrolyseren. De 3’ enzymen hydrolyseren de esterbinding tussen het 3’ Catoom en de fosforgroep. De 5’ enzymen hydrolyseren de binding tussen de fosforgroep en het 5’ C atoom. Enzymen welke enkel het uiteinde van de polynucleotideketting hydrolyseren zijn exonucleasen (zij hebben dus een vrije 3’ of 5’ terminus nodig). De endonucleasen kunnen bepaalde 3’ of 5’ fosfodiësterbinding hydrolyseren binnenin de keten. Een speciale klasse hierin zijn de restrictie enzymen, die veelvuldig gebruikt worden tijdens het maken van recombinant DNA.
Restrictie enzymen Een restrictie enzyme komt in de procaryote cel voor als onderdeel van een “restrictie modificatie systeem”, RM. Dit bestaat uit een restrictie enzyme enerzijds en een restrictie methyl transferase die beiden dezelfde sequentie herkennen. De eerste klieft de herkenningsplaats, de andere modificeert ze via methylatie, waardoor de herkenningsplaats (restrictieplaats) niet meer kan gekliefd worden door het restrictie enzyme. Hierdoor wordt het eigen, endogene DNA beschermd en valt vreemd DNA, dat niet het juiste methylatiepatroon vertoont ten prooi aan restrictie afbraak. Meestal klieven restrictie enzymen de herkenningsplaats (veelal 4, 5 of 6 bp groot) volgens een symmetrisch patroon waardoor ofwel “botte” uiteinden ofwel “sticky” uiteinden gevormd worden. Isoschizomeren zijn restrictie enzymen geïsoleerd uit verschillende organismen die dezelfde herkenningssequentie hebben. Groep T
E. De Herdt
p. 11
Nucleïnezuren
5DNA sequentie-analyse Twee technieken werden ongeveer gelijktijdig in de zeventiger jaren ontwikkeld, nl. de dideoxynucleotide-keten-terminatie methode van Sanger en Coulson in GB, en de chemische degradatie methode van Maxam en Gilbert in de VS. Deze laatste wordt praktisch niet meer toegepast en wordt dus niet verder besproken. De sequeneringstechniek is gebaseerd op de bereiding van een “nested-set” van het te analyseren DNA fragment. Met zo’n set wordt een mengsel bedoeld van gemerkte, enkelstrengige oligonucleotiden van verschillende lengte, die alle een gemeenschappelijk uiteinde hebben. Het ander einde daarentegen zal afhankelijk zijn van het type basespecifieke reactie. De bekomen set is optimaal als elk individueel nucleotide van het DNA fragment in dezelfde mate als eindpunt vertegenwoordigd is. De merking wordt bewerkstelligd door ofwel de primer ofwel de ddNTP’s te merken via radioactiviteit (35S of 32P) of zoals nu gebruikelijk is via fluorofore groepen. Met deze laatste techniek kan men gebruik maken van verschillende fluorofore groepen voor elk ddNTP waardoor het complexe mengsel van de “nested” set in één keer kan geanalyseerd worden. De dideoxynucleotide-keten-terminatie methode, gaat uit van in vitro synthese van DNA fragmenten door het DNA polymerase I (Klenow fragment). Hierbij steunend op de eigenschap dat het enzym ook 2’,3’-dideoxynucleotiden als substraat kan gebruiken, zij het met een beduidend lagere frequentie. De ddNMP’s worden in de keten ingebouwd via hun 5’-fosfaatgroep, maar door afwezigheid van de 3’-OH-functie zijn ze niet in staat om een fosfodiësterbinding aan te gaan met het volgende mononucleotide. Wanneer zo’n dideoxynucleotide geïncorporeerd wordt, is verdere ketenverlenging dus niet meer mogelijk. Vervolgens worden de producten van elke reactie gescheiden door electroforese op een denaturerend polyacrylamide gel. De resolutie van dit gel is zodanig hoog dat scheiding volgens relatieve molecuulmassa van DNA fragmenten die slechts één nucleotide in lengte verschillen mogelijk is. Tegenwoordig wordt ook gebruik gemaakt van capillaire electroforese. Veelal worden volgende stappen doorlopen: * het te sequeneren DNA wordt bereid als een enkelstrengig molecule, dat dienst doet als matrijs voor het DNA polymerase; * vervolgens wordt een kort complementair stukje DNA gehybridiseerd aan de 3’-zijde van de regio die geanalyseerd moet worden. Deze starter wordt meestal chemisch gesynthetiseerd en is commerciëel verkrijgbaar voor tal van sequeneringsvectoren; * synthese reactie wordt gestart met dNTP, ddNTP’s en het DNA polymerase. * de bekomen nested set wordt gescheiden via gel- of capillaire electroforese.
Groep T
E. De Herdt
p. 12
Nucleïnezuren
Groep T
E. De Herdt
p. 13
Nucleïnezuren
Groep T
E. De Herdt
p. 14
Nucleïnezuren
Capillaire electroforese m.b.v. de ABI PRISM® 310 Genetic Analyzer Het grote oppervlak van een capillair biedt de mogelijkheid de hitte, gegenereerd gedurende elektroforese, op een efficiënte manier af te voeren, wat high-voltage elektroforese toelaat. Het resultaat is een snelle scheiding, met hoge resolutie, van DNA-fragmenten. Andere voordelen van capillaire elektroforese t.o.v. slab gel elektroforese zijn o.a. kortere looptijden, geen manueel laden van de stalen - het toestel gebruikt elektrokinetische injectie – en het feit dat er slechts heel weinig staal nodig is, zodat het staal, indien nodig, verschillende keren kan gelopen worden. De ABI PRISM® 310 Genetic Analyzer; te zien in onderstaande figuur, maakt gebruik van al deze voordelen. Het is een geautomatiseerd toestel voor de analyse van fluorescerend gelabelde DNA-fragmenten d.m.v. capillaire electroforese.
De ABI PRISM® 310 Genetic Analyzer Bron : www.appliedbiosystems.com
Werking van de ABI PRISM® Genetic Analyzer 5.1.1Algemeen De buisjes met de stalen worden in een autosampler ‘tray’ geplaatst, die ofwel 48 ofwel 96 stalen bevat. De autosampler brengt achtereenvolgens elk staal in contact met de kathode elektrode en één uiteinde van een glazen capillair, gevuld met een scheidingspolymeer. Een anode elektrode aan het andere uiteinde van het capillair is ondergedompeld in buffer. Het staal komt in het capillair terecht als er stroom vloeit van de kathode naar de anode. De korte periode gedurende de welke de kathode en het capillair ondergedompeld zitten in het staal, noemt men de elektrokinetische injectie. Het staal vormt een dense band in het capillair gedurende deze injectie. Vervolgens wordt het uiteinde van het capillair in de buurt van de kathode in buffer geplaatst. Er wordt opnieuw stroom aangelegd om verder te gaan met de elektroforese. Wanneer de DNA-fragmenten een detectorvenster in het capillair passeren, worden de fluorescerende labels geëxciteerd door een laser. De uitgezonden fluorescentie wordt eens per seconde gecollecteerd door een gekoelde, ‘charge-coupled device’ (CCD) camera in bepaalde golflengtegebieden (virtuele filters) en opgeslagen als digitale gegevens in een Power Macintosh computer. De Sequencing Analysis software interpreteert het resultaat en leidt uit de fluorescentie-intensiteit op elk datapunt de basen af. Groep T
E. De Herdt
p. 15
Nucleïnezuren
In de bovenstaande figuur wordt capillaire elektroforese schematisch voorgesteld.
5.1.2Analyse van de ruwe data Na een sequencingreactie verkrijgt men in eerste instantie ruwe data. In Figuur Xa is een elektroferogram te zien van ruwe data, met op de X-as de datapoints (wat dus eigenlijk overeenkomt met de looptijd) en op de Y-as de piekintensiteit. De operator kan dan aan de computer vragen de ruwe data te analyseren. In onderstaande figuur is een elektroferogram voorgesteld van ruwe en geanalyseerde data.
Elektroferogram van ruwe data (boven) en geanalyseerde data (onder)
Groep T
E. De Herdt
p. 16
Nucleïnezuren
Terminator
Dye
Kleur van ruwe data op elektroferogram
A C G T
dR6G dROX dR110 dTAMRA
groen rood blauw zwart
Kleur van geanalyseerde data op elektroferogram groen blauw zwart rood
Kleuren van de verschillende dyes op het elektroferogram van de ruwe data en het elektroferogram van de geanalyseerde data
Cycle Sequencing De cycle sequencing reactie bestaat, net zoals een traditionele PCR-reactie, uit opeenvolgende cycli van denaturatie, annealing en verlenging. Doordat er nu echter ook ddNTP’s in het reactiemengsel aanwezig zijn, wordt er een mix van fragmenten van verschillende lengte, allemaal eindigend op een gelabelde ddNTP, bekomen. In onderstaande figuur is de cycle sequencing reactie schematisch voorgesteld. De cycle sequence reactie
Bij de bereiding van de stalen voor de cycle sequencing reactie, wordt gebruik gemaakt van bijvoorbeelde de ABI PRISM® BigDye ™ Terminator Cycle Sequencing Ready Reaction Kit. Deze bevat de Terminator Ready Reaction Mix. De Terminator Ready Reaction Mix bevat in eerste instantie de 4 ddNTP’s, elk gelabeld met een eigen Big Dye. Deze Big Dyes bestaan uit 2 componenten, waardoor de excitatie in 2 stappen gebeurt. De ‘fluorescein donor dye’ (6-FAM) is een fluorofoor die geoptimaliseerd is om zo goed als alle excitatie-energie van de Argon-ionen laser te absorberen. Deze donor dye geeft dan zijn energie op een zeer efficiënte manier (bijna 100% !) door aan de ‘dRodamine acceptor dyes. Groep T
E. De Herdt
p. 17
Nucleïnezuren
Door gebruik te maken van ddNTP’s die gelabeld zijn met een fluorescerende groep, wordt de groeiende keten tegelijk beëindigd én gelabeld met de kleur die overeenkomt met die welbepaalde base. Een andere mogelijkheid bestaat uit het gebruik van gelabelde primers. De gelabelde ddNTP’s hebben echter als voordeel dat de reacties in één tube kunnen gebeuren. Er is dus veel minder pipeteerwerk in vergelijking met gelabelde primers. Bovendien kan het bekomen product achteraf geanalyseerd worden d.m.v. één enkele capillaire injectie. Fragmenten die niet eindigen op een dideoxynucleotide worden tenslotte niet gedetecteerd omdat er geen fluorescerende groep aan vasthangt. Een andere belangrijke component uit de Terminator Ready Reaction Mix is het Amplitaq DNA Polymerase, FS. Dit is een mutante vorm van het Thermus aquaticus (Taq) DNA polymerase;het bevat een puntmutatie in het actief centrum, die resulteert in een verminderde discriminatie tegenover dideoxynucleotiden. Het Amplitaq DNA Polymerase, FS bevat ook een mutatie t.h.v. het amino terminaal uiteinde, die practisch alle 5’→3’ exonuclease activiteit elimineert. Het enzyme is bovendien voorzien van een thermisch stabiel anorganisch pyrofosfatase, dat het anorganisch fosfaat (PPi), een bijproduct van de extensiereactie, afbreekt. Hoge concentraties van PPi geven nl. aanleiding tot pyrofosforolyse: een nucleoside monofosfaat wordt verwijderd van het extensieproduct, gevolgd door de additie van een PPi t.v.v. een nucleoside trifosfaat. De Terminator Reaction Mix bevat daarnaast nog de dNTP’s, MgCl2 en Tris-HCl buffer, pH 9,0.
Groep T
E. De Herdt
p. 18
Nucleïnezuren
Groep T
E. De Herdt
p. 19
Nucleïnezuren
6Belangrijke enzymatische activiteiten in het kader van nucleïnezuur onderzoek DNA polymerase Incorporeert dNTP’s in de 5’→3’ richting vanuit het 3’ einde van een primer die gehybridiseerd werd aan ssDNA in de aanwezigheid van Mg2+ ionen. Sommige DNA polymerase preparaten bezitten ook nog hun originele 3’→5’ exonuclease activiteit die we “proofreading” functie noemen. Deze verhoogt de betrouwbaarheid waarmee nucleotiden geïncorporeerd worden, maar zorgt ook voor de afbraak van 3’ ssDNA uiteinden. In de afwezigheid van dNTP’s gaat de verwijdering van 3’ nucleotiden van dsDNA verder!
RNA polymerase Deze incorporeren NTP’s in de 5’→3’ richting vanaf een dsDNA promoter sequentie. Polymerase specifieke terminator sequenties zullen deze transcriptie stoppen, alhoewel niet voor 100%. Door toe te laten dat het RNA polymerase van het DNA template afrolt, zullen we een hoger percentage identieke transcriptgroottes bekomen.
Reverse transcriptase Dit enzyme incorporeert dNTP’s in de 5’→3’ richting vanaf het 3’ uiteinde van een DNA initiator die gehybridiseerd werd aan RNA of DNA.
Terminaal deoxynucleotidyl transferase Voegt één of meerdere dNTP’s toe aan het 3’ einde van ds- of ssDNA.
Groep T
E. De Herdt
p. 20
PCR
De polymerase kettingreactie PCR Het succes van nucleïnezuur-onderzoek of diagnostische testen gesteund op de detectie van nucleïnezuren hangt in grote mate af van de beschikbare hoeveelheid DNA of RNA aanwezig in het te analyseren staal. De invoering van de polymerase kettingreactie - verder afgekort als PCR (Polymerase Chain Reaction) - heeft een ware omwenteling teweeg gebracht, zowel in het fundamentele als meer toegepaste onderzoek. Daar PCR de mogelijkheid biedt de hoeveelheid nucleïnezuur in een staal op vrij eenvoudige, snelle (2 tot 3 h) en specifieke wijze minstens een miljoenmaal te vermenigvuldigen, worden vele clonerings- of analyseproblemen beduidend vergemakkelijkt en wordt de detectiegrens dermate verlegd dat met de bestaande detectietechnieken een gering aantal kopijen kunnen worden opgespoord. Inmiddels zijn nog verscheidene andere amplificatiesystemen uitgewerkt, zoals de "Nucleic Acid Sequence-Based Amplification" (NASBA), de "Ligase Chain Reaction", het Qb-replicasesysteem en de "Cycling Probe Reaction". In tegenstelling tot PCR hebben de meeste van deze systemen een beperkt toepassingsgebied en moet hun robuustheid nog aangetoond worden. http://www.pcrlinks.com/
1 Principe De PCR is gesteund op de meest fundamentele eigenschappen van DNA: DNA is doorgaans dubbelstrengig en kan gedupliceerd worden in aanwezigheid van een DNA-polymerase. De PCR bestaat uit drie stappen die meestal bij verschillende temperaturen doorgaan. Eerst wordt het doelwit-DNA gedenatureerd bij hoge temperatuur (denaturatie). Vervolgens wordt er geïnkubeerd met twee oligonucleotiden (primers) waarmee na hybridizatie "primer-template" complexen gevormd worden (annealing) die dan als initiatiepunt dienen voor de aanbouw van een complementaire DNA-keten door een DNApolymerase uitgaande van deoxyribonucleotide trifosfaten ( extensie ). Door deze cyclus meerdere malen (bv 30 x) te herhalen, wordt een exponentiële vermeerdering bekomen van het DNA-fragment gelegen tussen de beide primers (zie figuur). Een typische PCR-cyclus ziet eruit als volgt: denaturatie : 1 min, 95°C; annealing : 1 min, 45°C; extensie: 1.5 min, 72°C.
Groep T
E. De Herdt
p. 1
PCR
2 Componenten 2.1 Uitgangsmateriaal In principe is het uitgangsmateriaal steeds dubbelstrengig DNA. Zelfs relatief onzuiver (bv bacteriële kolonie) en gedeeltelijk afgebroken DNA (archeologische stalen) kan als doelwit dienen, zolang het stuk tussen de primers maar intakt is! Stukken <800 bp zijn het efficiënts te versterken maar onder bepaalde voorwaarden kunnen fragment tot 30 kb ook versterkt worden. Ook RNA en enkelstrengig DNA kan door middel van PCR geamplificeerd worden, mits hiervan eerst dubbelstrengige DNA-copijen worden aangemaakt (bvb. met behulp van reverse transcriptase). De hoeveelheid DNA is niet zo belangrijk; we moeten eerder denken in termen van het aantal targetplaatsen.
2.2 Primers A1s primers worden synthetische oligonucleotiden gebruikt. Doorgaans zijn ze 15 tot 30 nucleotiden lang. Ten opzichte van het doelwit-DNA worden de primers in grote overmaat (1020/reactiemengsel) toegevoegd om in competitie te kunnen treden met de renaturatie van het dubbelstrengig DNA. Vooral aan het 3'-uiteinde van de primer moet de sekwentie grotendeels complementair zijn met de beoogde sekwentie in het doelwit-DNA. Verder moet de eindstandige 3'-OH-groep vrij zijn. Het 5'-uiteinde van de primer is veel minder kritisch wat mogelijkheden opent voor een aantal interessante modificaties van de PCR, waardoor aan het 5’ uiteinde van de versterkte DNA fragmenten restrictieplaatsen, promotorplaatsen, labels, enz. kunnen geïncorporeerd worden. Door gebruik te maken van bv één mismatch in de primer kan men op een welbepaalde plaats, basespecifieke in vitro mutagenese uitvoeren op het DNA fragment. De gebruikte primers moeten kompatiebel zijn met elkaar; dit houdt in: gelijkaardige smelttemperatuur (Tm), deze is functie van het GC gehalte; er bestaan verschillende empirische formules om Tm te berekenen op basis van de sekwentie; geen affiniteit voor elkaar, want anders krijg je primerdimeervorming; geen interne complementariteit, want anders krijg je secundaire structuren.
2.3 Deoxyribonucleotide trifosfaten. Meestal worden dATP , dCTP, dGTP en TTP in equimolaire hoeveelheden toegevoegd aan het PCR-mengsel. De meeste polymerasen kunnen echter ook gemodificeerde nucleotide trifosfaten als substraat gebruiken, zoals biotine-7-dA TP en digoxigenine-11-dUTP. Ook dit Groep T
E. De Herdt
p. 2
PCR draagt uiteraard bij tot de verscheidenheid van het PCR-systeem. Ook ddNTP kunnen geïnkorporeerd worden tijdens een sekwentie PCR reactie bv.
2.4 Enzyme Bijna elk DNA-polymerase kan gebruikt worden voor de extensie. Initiëel werd DNApolymerase uit E.coli gebruikt (Klenow). Tegenwoordig worden bijna uitsluitend DNApolymerasen gebruikt uit thermofiele organismen ( doorgaans Thermus species, bvb. Taqpolymerase uit Thermus aquaticus). Hierdoor kan de reactie volledig geautomatiseerd doorgaan in zogenaamde "thermocyclers". Het polymerase wordt niet vernietigd bij de denaturatietemperatuur (> 90°C) en de annealing kan gebeuren bij een hogere, meer specifieke, temperatuur (50°C of meer). Voor routinetoepassingen worden DNA polymerasen gebruikt zonder 3’ exonuclease activiteit. Deze werken snel en hebben als bijzonder kenmerk dat ze een extra adenine residu inbouwen waardoor het fragment begrensd wordt met één 3’ A enkelstrengige overhang. Hierdoor zijn dergelijke fragmenten eenvoudig cloneerbaar in vectoren uitgerust met een 5’ T overhang die commerciëel verkrijgbaar zijn. Voor sequentie PCR wordt gebruik gemaakt van DNA polymerasen met een proofreading functie (3’ exonuclease activiteit) welke veel minder foute basen incorporeren. Voor grote DNA fragmenten te versterken hebben we ‘long stretch’ polymersen nodig die een betere thermostabiliteit vertonen. Onder invloed van wisselende kationconcentraties (Mg/Mn) vertonen sommige DNA polymerasen ook een reverse transcriptase activiteit.
2.5 PCR-buffer De PCR-buffer bevat meestal 50 mM KCI, 10 mM Tris-HCI, pH 8.3 en een wisselende hoeveelheid MgCl2 (1 tot 10 mM). De concentratie van MgCl2 is zowel belangrijk voor de opbrengst als voor de specificiteit van de PCR. Bij lage concentraties werkt het DNA polymerase niet, bij hoge concentraties neemt de aspecifieke versterking toe. De optimale MgCl2-concentratie verschilt van toepassing tot toepassing en moet experimenteel bepaald worden. Voor bepaalde toepassingen kan het wenselijk zijn niet-ionische detergenten of DMSO toe te voegen aan de buffer .
Groep T
E. De Herdt
p. 3
PCR
3 Efficiëntie De amplificatiefactor kan theoretisch worden berekend met de volgende formule: y = (1 + x)n met: x = gemiddelde efficiëntie n = aantal cycli y = amplificatiefactor Als de efficiëntie 100% is ( d.i. x = 1) en het aantal cycli ( n ) 30, dan is de amplificatiefactor 109. In de praktijk mag een amplificatiefactor tussen 106 en 107 verwacht worden. De efficiëntie is immers nooit 100% en wordt door vele factoren bepaald zoals : *de lengte van het fragment; *de extensietijd; *voorkomen van GC-rijke gebieden; *concentratie van o.a. MgCl2, dNTP's, primers, en polymerase; *activiteit van het polymerase (neemt af met het aantal cycli). *contaminatie Als een hoge nauwkeurigheid en betrouwbaarheid wordt nagestreefd (bv klinische analyse) wordt er een totale scheiding (materialen, ruimten) toegepast tussen pre-PCR handelingen (DNA, RNA extractie, samenstellen van PCR mixen) en post-PCR (electroforese, sequentiebepaling, gelextractie, enz…)
4 Specificiteit De specificiteit van de PCR-procedure wordt bepaald door een wisselwerking tussen de nucleotidesekwentie van de primers en de temperatuur (bij een welbepaalde zoutconcentratie) waarbij de annealing plaatsgrijpt. Is de sekwentie van de primers absoluut complementair met deze van de corresponderende gebieden in het doelwit-DNA en wordt de annealing-temperatuur dicht bij de dissociatietemperatuur van het primertemplate hybride gekozen, dan zal annealing slechts doorgaan ter hoogte van de beoogde complementaire sequenties in het DNA en zal slechts het gewenste DNA-fragment geamplificeerd worden. Dit gaat echter enigszins ten koste van de efficiëntie. Lagere annealing-temperaturen, niet perfect overeenstemmende primers of het voorkomen van sterk homologe gebieden elders gelegen op het genoom of aanwezig in het staal, kunnen aanleiding geven tot bij-banden of een smeer. In sommige gevallen kan het eigenlijke product hierdoor niet meer worden gedetecteerd. Ook de MgCl2 concentratie speelt een rol bij de specificiteit.
Groep T
E. De Herdt
p. 4
PCR
5 Detectie van PCR producten PCR-producten worden routinematig gedetect,eerd door middel van agarose of polyacrylamide gelelektroforese en ethidiumbromide kleuring. Een DNA-fragment van een bepaalde grootte wordt dan zichtbaar. Vermits een PCR niet altijd specifiek is, kan meer nauwkeurige analyse nodig zijn. Meestal wordt dan overgegaan naar Southern hybridizaties, met één of meerdere intern-gelegen DNA-probes of wordt het fragment geïdentificeerd aan de hand van restrictie-analyse. Uiteraard zijn ook dot-spot hybridizaties mogelijk, wat doorgaans sneller tot identificatie leidt.
6 PCR terminologie 6.1 Hot start PCR Bij aanvang van de PCR wordt de mix opgewarmd van 4°C naar denaturatietemperatuur. Hierbij komt men voorbij het ideale werkingsgebied van het DNA polymerase. Hierdoor is het mogelijk dat primers die op een verkeerde plaats gehybridiseerd zijn toch een aangrijpingspunt vormen voor het DNA polymerase zodat aspecifieke fragmenten ontstaan, die dan in de volgende cycli een aspecifieke band gaan genereren. De Hot start techniek is daarom ontwikkeld die de werking van het enzyme inhibeert tot bijvoorbeeld een temperatuur van > 75°C bereikt werd. Dit wordt gerealiseerd door één van de essentiële reactiecomponenten inactief te houden (associatie van het enzyme met een thermolabiele inhibitor) of fysisch van de rest van het reactiemengsel te scheiden (Mg of enzyme in wasbolletjes).
6.1.1 Manueel Een component zoals het polymerase of Mg2+ wordt pas toegevoegd aan het reactiemengsel wanneer de temperatuur hoger is dan 70°C. Opmerking: Manuele toevoeging van de componenten aan de hete buisjes is meestal niet gebruikelijk en kan tot problemen leiden zoals gebrek aan reproduceerbaarheid.
6.1.2 Fysische scheiding Reactiecomponenten worden verdeeld over 2 mixen, welke gescheiden worden door een grens, zoals een wax bead. De wax beads die Mg2+-ionen bevatten worden toegevoegd aan de PCR mix. Tijdens de initiële denaturatiestap gaat de wax smelten (75° - 80°C) en laat toe om al de reactiecomponenten te mixen.
6.1.3 Polymerase antilichamen
Groep T
E. De Herdt
p. 5
PCR Een hittegevoelig antilichaam werd toegevoegd aan het polymerase zodat het inactief blijft in het reactiemengsel. Als de temperatuur in de buisjes stijgt, wordt het antilichaam geïnactiveerd en komt het actieve polymerase vrij.
6.1.4 Chemische modificatie van polymerase Door het toevoegen van hitte-labiel blokkerende groepen aan aminozuurresidues van het Taq DNA polymerase blijft het gemodificeerd enzyme inactief bij kamertemperatuur. Activatie treedt op wanneer bij hoge temperaturen de blokkerende groepen worden verwijderd. Dit gebeurt tijdens de pre-PCR hitte stap.
6.1.5 Andere inhibitoren Andere polymerase inhibitoren (zoals polymerasebindende en oligonucleotiden) worden toegevoegd aan het reactiemengsel; dit houdt het enzyme eveneens inactief totdat bij stijgende temperatuur de inhibitor dissocieert van het enzyme. Het polymerase is dan in staat te polymeriseren.
6.2 Touch down PCR Hierbij gaat men bij de eerste cycli gebruik maken van een hogere annaeling temperatuur om de specificiteit van de versterkte fragmenten te verhogen. Naargelang het aantal cycli toeneemt laat men de annaelingtemperatuur echter stelselmatig zakken zodat toch een aanvaardbare opbrengst bekomen wordt. De specificiteit van de eerste cycli is immers de belangrijkste factor in de regeneratie van aspecifieke banden.
6.3 Single PCR Dit is feitelijk een controlevorm om zeker te zijn dat elke primer een unieke bindingsplaats heeft. Bij single PCR wordt maar één specifieke primer toegevoegd. Er mag geen fragment versterkt worden. Is dit wel zo dan betekent dit dat deze ene primer twee bindingsplaatsen heeft op het targetmolecule in tegenstelde oriëntatie en op een zodanige afstand van elkaar dat een fragment kan genereerd worden (<1 kb).
6.4 Inverse PCR Klassieke PCR versterkt een fragment waarvan we de uiteinden kennen (primers!). Bij inverse PCR kunnen we een fragment versterken rondom een gekende sequentie. Na fragmentatie van het DNA via restrictie afbraak worden de bekomen fragmenten gecirculariseerd met DNA ligase. De circel met daarin de gekende sekwentie wordt gelineariseerd via een restrictie digestie van een herkenningsplaats in de gekende sekwentie.
Groep T
E. De Herdt
p. 6
PCR Het bekomen fragment wordt nu geflankeerd door delen van deze gekende sekwentie en aangepaste primers kunnen ontworpen worden om een klassieke PCR uit te voeren.
6.5 Nested PCR Als er weinig uitgangsmateriaal voorhanden is, of als een hoge specificiteit gewenst is kunnen twee opeenvolgende PCR’s uitkomst bieden. In een eerste PCR wordt een fragment versterkt met behulp van twee primers. Een tweede PCR maakt gebruik van één of twee nieuwe primers die gelegen zijn binnen het gebied van dit versterkt fragment.
6.6 Multiplex PCR Hieronder verstaat men de gelijktijdige versterking van verschillende loci langsheen het DNA target en het bekomen van fragmenten die voldoende verschillen in grootte om ze individueel te kunnen detecteren. De moeilijkheid zit hem vooral in de ontwikkeling van de verschillende set van primers. Voor elke loci heeft men 2 primers nodig die kompatiebel zijn met elkaar maar ook met de andere primers nodig voor de versterking van de andere loci. De detectie kan eenvoudiger verlopen indien men de primers merkt met verschillende fluorofore groepen. Hierdoor kan men dan toch fragmenten met een gelijkaardige grootte van elkaar onderscheiden. Deze techniek wordt veel toegepast voor het onderzoek naar genetische afwijkingen, waarbij meerdere mutaties kunnen voorkomen in hetzelfde gen en die men alzo tegelijkertijd kan detecteren, maar ook in het kader van persoonsidentifikatie. Groep T
E. De Herdt
p. 7
PCR
Groep T
E. De Herdt
p. 8
PCR
6.7 Asymmetrische PCR Asymmetrische PCR wordt uitgevoerd om enkelstrengig DNA te bekomen voor bv sekwentie analyse of voor probe bereiding. Hierbij wordt een asymmetrische verhouding van primers gebruikt (50/1; 100/1) waardoor gedurende de eerste cycli dsDNA exponentiëel wordt aangemaakt. Wanneer de limiterende primer opgebruikt is zal ssDNA lineair worden versterkt uitgaande van de niet-limiterende primer.
6.8 Kompetitieve PCR Als richtlijn neemt men aan dat de amplificatie lineair is tot 30 cycli als het aantal startcopies ligt tussen 12 -400, tot 25 cycli met 200 - 3 200 copies en slechts tot 20 cycli bij een aantal templates variërend tussen 3 200 en 51 200. Het lineaire gebied voor een gegeven staal moet steeds verkend worden. Dit kan gebeuren via het gebruik van controlestalen of standaarden. Deze laatste moeten een samenstelling hebben die zo dicht mogelijk ligt bij deze van het doelwit-materiaal. In het ideale geval wordt ook van dezelfde primers gebruik gemaakt. De standaard kan homoloog zijn (gebaseerd op de te detecteren sekwentie: groter of kleiner gemaakt) of heteroloog zijn (andere sekwentie, wel dezelfde uiteinden, groter of kleiner dan doelwit fragment) De PCR wordt dan uitgevoerd in aanwezigheid van een variabele hoeveelheid gespiked “mimic” DNA. Beide doelwitten worden geamplificeerd met dezelfde PCR primers. Na electroforese wordt de relatieve intensiteit van doelwit en mimic DNA (dat in stijgende hoeveelheid in competitie voor de amplificatie wordt aangeboden) vergeleken. De concentratie van het doelwit wordt verkregen door extrapolatie uit de gekende hoeveelheid toegevoegd “mimic” DNA. De belangrijkste toepassingen van kwantitatieve PCR zijn: gendosering, taxeren van de mate van genexpressie (bv hoeveelheid van één bepaald mRNA, inschatten van de graad van virale infectie (aantal virale genoom copyen = “viral load”) Een andere manier om aan kwantificatie te doen is gebruik maken van Real time PCR (bv Light Cycler van Roche)
6.9 In situ PCR Deze techniek combineert de extreme gevoeligheid van PCR met de intracellulaire localisatie van in situ hybridisatie. Met deze techniek is het mogelijk verschillende fenomenen op te sporen: viraal DNA in een cel; viraal RNA; gentranscripten (in combinatie met RT -P CR).
Groep T
E. De Herdt
p. 9
PCR In situ vraagt dat de reactie opgaat in gefixeerde cellen of weefsel, na semidoorlaatbaar maken van de membranen voor de PCR-reagentia. De meeste onderzoekers maken gebruik van de hot-start methode om verhoogde gevoeligheid en specificiteit te krijgen. PCR gebeurt tussen draag- en dekglaasje (zoals gebruikt in microscopie). De reactie verloopt op een verwarmingsblok in een thermocycler en detectie van de amplicer kan zowel direct als indirect gebeuren. Directe detectie kan na incorporatie van niet-isotoop gelabelde nucleotiden in het geamplificeerd product (immunohistochemische opsporing). Een minder snelle, maar meer gevoelige en indirecte methode vraagt een supplementaire stap door in situ hybridisatie met amplicon-specifieke oligoprobes. Directe detectie geeft zowel specifiek als niet-specifiek geamplificeerd materiaal, dit in tegenstelling tot de indirecte opsporing. Het veeleisend karakter van in situ PCR vraagt het overwinnen van tal van complicaties en stelt een aantal technische vereisten : het PCR-proces met het thermoprofiel mag de celmorfologie niet verstoren; de gebruikte reagentia moeten in staat zijn via diffusie in de halfdoorlaatbare cellen terecht te komen; de gevormde amplicons mogen niet buiten de cellen diffunderen; het uitdrogen van het weefsel of het loskomen van het glazen plaatje mag niet gebeuren gedurende amplificatie of detectie. Vooral de voorbereiding van de cellen, de fixatie en de permeabilisatie zijn kritisch. Om deze te controleren heeft men in situ PCR thermal cyclers op de markt (o.a. in situ-PCR System 1000, PE-Applied Biosystems). Deze firma levert hierbij GeneAmp(S\ in situ PCR Gorekits voor tal van doeleinden. Door directe inbreng van biotine in de P CR reactie of via hybridisatie na PCR met biotine-gelabelde probes, gevolgd door detectie met biotinestreptavidine-alkalisch fosfatase is het mogelijk in formaline gefixeerde menselijke cellen HPV, cytomegalovirus, Epstein-Barr virus en Helicobacter pylori op te sporen.
6.10 RAPD (Random amplification of polymorphic DNA) of AP-PCR (Arbitrarily primed PCR) Hier maakt men gebruik van slechts één kortere primer (10-15 bp) en een lagere annealing temperatuur. Hierdoor krijg je verschillende bindingsplaatsen langsheen het DNA molecule. Afhankelijk van hun onderlinge afstand en oriëntatie krijgt men dus al dan niet een aantal fragmenten die zullen versterkt worden. Dit bandenpatroon is afhankelijk van de gebruikte primer en de reactieomstandigheden. Als deze constant zijn, is het bekomen bandenpatroon aldus typisch voor het DNA dat men als startmateriaal gebruikt heeft. Het patroon kan dan gebruikt worden om bv. verschillende bacteriële stammen te identificeren of om het patroon en sommige banden in relatie te brengen met bepaalde fenotypische eigenschappen zoals gebruikelijk bij het volgen van een gewenste eigenschap tijdens veredelingsprogramma’s van cultuurgewassen. Het typische is dus dat men op DNA niveau kijkt via de PCR techniek zonder dat men ook maar enig sequentie informatie hoeft te hebben. Het vergt wel veel ‘trial and error’
Groep T
E. De Herdt
p. 10
PCR methodologie om een geschikte combinatie van primer en reactieomstandigheden op te sporen die een informatief bandenpatroon oplevert.
6.11 RT-PCR (reverse transcriptase PCR) Hierbij wordt gebruik gemaakt van mRNA als startmateriaal. Afhankelijk van de gebruikte primers kan men ofwel een cDNA bibliotheek samenstellen van de totale mRNA populatie, ofwel kan men één specifiek mRNA trachten om te vormen tot zijn cDNA komplement om daar dan een grote hoeveelheid van te maken in de navolgende PCR.
Gebruik van twee sequentie specifieke primers of één sequentie specifieke primer in combinatie met een oligo(dt) primer levert ons één welbepaald cDNA na reverse transcripatase inwerking, waarna dit fragment via een klassieke PCR verder kan versterkt worden. De SMART techniek maakt gebruik van een gemodifieerde oligo(dT) primer die aan het begin van de poly(A) staart bindt. In combinatie met het SMART oligonucleotide (bindt het 3’ einde van het gesynthetiseerde cDNA wordt het cDNA transcript verlengd tot voorbij het 5’ einde van het mRNA. Via gebruik van de SMART primer kan dan in de navolgende PCR een volledige cDNA bibliotheek opgesteld worden van alle mRNA’s (van hun 5’ begin naar hun 3’ einde!).
6.12 Real Time PCR 6.12.1 Wat is Real-time PCR? Real-time PCR laat een gelijktijdige amplificatie en kwantificatie van specifieke nucleïnezuursequenties toe. Hiertoe wordt, tijdens elke cyclus van de PCR reactie, de hoeveelheid gegenereerd DNA gemeten. Hoe minder cycli er nodig zijn om een detecteerbaar treshold level van DNA te bereiken, hoe meer targetsequentie er aanvankelijk aanwezig was. Real-time PCR valt gemakkelijk te combineren met rt-PCR, zodat ook de hoeveelheid van een specifieke RNA-sequentie in een staal m.b.v. deze techniek kan bepaald worden.
6.12.2 Hoe werkt Real-time PCR? De instrumenten die gebruikt worden voor Real-time PCR zijn fluorescentie detecterende thermocyclers. Fluorescentie tijdens PCR kan op twee manieren opgewekt worden: 6.12.2.1 Hybridisatieprobes Hierbij gaat men, naast een voorwaartse en een achterwaartse primer, een sequentie specifieke probe toevoegen, die de fluorescentie verzorgt. Er bestaan verschillende types van dergelijke probes. Eerst en vooral zijn er de zogenaamde Double-Dye Oligonucleotiden. Er wordt hier gesteund op de 5’ exonuclease activiteit van het DNA polymerase. Zoals zichtbaar is op Fig. 1, annealt de Double-Dye Oligonucleotide probe tijdens PCR tussen de voorwaartse en de Groep T
E. De Herdt
p. 11
PCR achterwaartse primer. De probes zijn typisch 20 – 27 basenparen lang en ze dragen een 5’ fluorofoor en een 3’ quencher molecule. De meest voorkomende combinatie is FAM als fluorofoor en TAMRA als quencher, maar ook andere fluoroforen kunnen gebruikt worden. Zolang de fluorofoor en de quencher zich in mekaars nabijheid bevinden, is er geen signaal zichtbaar. Dit komt doordat de fotonen, uitgezonden door de fluorofoor, geabsorbeerd worden door de quencher. Tijdens de amplificatiereactie klieft de 5’-3’ exonuclease activiteit van het polymerase de fluorofoor van de probe. Nu bevindt deze fluorofoor zich dus niet langer in de dichte buurt van de quencher; zijn fluorescentie wordt m.a.w. niet langer onderdrukt en kan nu gedetecteerd worden. Dit signaal is snel of minder snel meetbaar, afhankelijk van de hoeveelheid startmateriaal. Het aantal cycli waarna het signaal boven de detectiedrempel uitkomt (treshold cycle, CT) is bijgevolg omgekeerd evenredig met de hoeveelheid nucleïnezuren bij de aanvang. Het is zeer belangrijk dat de Tm van de Double Dye Oligonucleotide probe hoger is dan die van de voorwaartse primer. Op die manier vermijdt men de situatie waarbij de voorwaartse primer al verlengd wordt, terwijl de probe nog niet geanneald is.
Een gelijkaardig principe vinden we terug bij de zogenaamde Beacons. Dit zijn oligonucleotideprobes met een lus-stam-structuur. De lus is een complementaire sequentie van de targetsequentie. De stam wordt gevormd door complementaire armsequenties, aan de uiteinden van de probesequentie. Aan het einde van de éne arm is een fluorofoor covalent gebonden, terwijl aan het uiteinde van de andere arm een quenchermolecule is vastgehecht. Door de stamstructuur worden fluorofoor en quencher dicht bij mekaar gehouden en de fluorescentie wordt gedoofd door energietransfer. Wanneer de probe zijn target sequentie nadert, grijpt er een confirmatieverandering plaats, waarbij de armen en dus ook fluorofoor en quencher uit mekaar gedreven worden, wat leidt tot een plotse verhoging van de fluorescentie. Een derde type hybridisatieprobes zijn de Scorpions. Een Scorpion bestaat uit een specifieke probesequentie, die in een haarspeldbochtconfiguratie gehouden wordt door de hybridisatie van complementaire stamsequenties aan elk uiteinde. Aan het 5’-uiteinde is een fluorofoor gehecht, waarvan het fluorescent signaal echter gedoofd wordt door een quenchingmolecule aan het 3’-uiteinde. Dit geheel is vastgehecht aan een primer. Tussen de primer en de lusstam-configuratie bevindt zich een “PCR-stopper”, een chemische modificatie die voorkomt dat tijdens PCR de lus-stam-sequentie van de Scorpion-primer gekopieerd wordt, wat zou kunnen leiden tot de opening van de haarspeldbocht in afwezigheid van de targetsequentie. Groep T
E. De Herdt
p. 12
PCR Na verlenging van de Scorpionprimer, gaat de probe-sequentie van de Scorpion achteruit plooien en binden aan zijn complement in dezelfde DNA-streng. Deze hybridisatie opent de haarspeldbocht, zodat de fluorescentie niet langer gedoofd wordt door de quenchermolecule. Ook hier is het zo dat de fluorescentie recht evenredig is met de hoeveelheid target DNA. Het spreekt voor zich dat het gebruik van een hybridisatieprobe een erg specifieke techniek is, aangezien de probes zich enkel hechten aan de te kopiëren sequentie. De specificiteit wordt soms nog verhoogd door gebruik te maken van twee speciaal ontworpen, sequentiespecifieke oligonucleotiden, voorzien van twee verschillende fluorescerende labels. De detectie is hier dan gebaseerd op de generatie van een fluorescent signaal door Fluorescentie Resonantie Energie Transfer (FRET) wanneer de twee probes op de targetsequentie binden. Hoe meer target er aanwezig is, hoe hoger het signaal zal zijn. Hoe de hybridisatieprobes zich gedragen gedurende de verschillende stadia van PCR, is afgebeeld in Fig. 2.
Figuur 2 : fluorescentiedetectie op basis van FRET Figuur a toont de essentiële componenten bij het gebruik van fluorescentiegelabelde oligonucleotiden als hybridisatieprobes: twee verschillende, gelabelde oligonucleotiden, een primer en het te amplificeren product. De sequenties van de twee probes zijn zodanig geselecteerd dat zij gaan hybridiseren aan het te amplificeren DNA-fragment in een kopstaart-configuratie, waarbij de twee fluorescente labels zeer dicht in mekaars nabijheid gebracht worden (Figuur b). De eerste label wordt geëxciteerd door een LED in het PCR-toestel en zendt bijvoorbeeld groen licht uit. Wanneer de twee labels zich in mekaars nabijheid bevinden, gaat de energie, uitgezonden door de label op de eerste probe, de label op de tweede hybridisatieprobe exciteren. Deze label gaat dan op zijn beurt bijvoorbeeld rood fluorescerend licht uitzenden bij een langere golflengte. Deze energie transfer, FRET genoemd, is sterk afhankelijk van de afstand tussen de twee labels. Enkel wanneer de moleculen zich zeer dicht bij mekaar bevinden (1-5 nucleotiden) is de energie die getransfereerd wordt efficiënt. De intensiteit van het licht, uitgezonden door de tweede label, wordt gemeten door het PCR-toestel. De toenemende hoeveelheid gemeten fluorescentie is proportioneel met de toenemende hoeveelheid DNA, gegenereerd tijdens het voortschrijdende PCR-proces. Doordat de Groep T
E. De Herdt
p. 13
PCR tweede label enkel een signaal uitzendt wanneer beide oligo’s gehybridiseerd zijn, moet de fluorescentie gemeten worden na de annealing (Figuur b). Er grijpt geen hybridisatie plaats gedurende de denaturatie van de PCR en dus kan er geen fluorescentie gemeten worden. Na annealing wordt de temperatuur verhoogd en de hybridisatieprobes worden verwijderd door het DNA-polymerase (Figuur c). Op het einde van de elongatiefase is het PCR-product dubbelstrengig en de twee hybridisatieprobes zijn te ver van mekaar verwijderd om FRET toe te laten (Figuur d). 6.12.2.2 SYBR Green I Dye De SYBR Green I Dye bindt in de kleine groeve van dsDNA. De fluorescentie wordt in grote mate verhoogd door de binding. Gedurende de opeenvolgende PCR-stappen kunnen er verschillende intensiteiten van fluorescerende signalen gemeten worden, afhankelijk van de hoeveelheid dsDNA die aanwezig is (Fig. 3).
Figuur 3 : fluorescentiedetectie op basis van de SYBR Green I Dye Na denaturatie is al het DNA enkelstrengig (Figuur a). SYBR Green I Dye zal niet binden en de intensiteit van de fluorescentiesignalen is laag. Gedurende de annealing-stap, hybridiseren de PCR-primers op de targetsequentie, wat resulteert in kleine stukjes dsDNA. SYBR Green I Dye kan dus gaan binden, waardoor de fluorescentie-intensiteit verhoogt (Figuur b). Tijdens de elongatiefase worden de PCR-primers verlengd en kan er dus steeds meer SYBR Green I Dye gaan binden (Figuur c). Op het einde van de elongatiefase is al het DNA dubbelstrengig geworden en een maximale hoeveelheid Dye is gebonden (Figuur d). De fluorescentie wordt gemeten op het einde van de elongatiefase en de toenemende hoeveelheden PCR-product kunnen van cyclus tot cyclus in beeld gebracht worden. Het grote nadeel van deze methode is dat er ook een signaal kan gedetecteerd worden in afwezigheid van de specifieke targetsequentie. Dit signaal wordt veroorzaakt door het binden van de SYBR Green I Dye op dubbelstrengige bijproducten, zoals primerdimeren.
6.12.3 Kwantificatie Identificatie van de cyclus, gedurende de welke het loglineaire signaal kan worden onderscheiden van de achtergrond, maakt het mogelijk de targetconcentraties in stalen te vergelijken. Groep T
E. De Herdt
p. 14
PCR Het voorbeeld in Fig. 4a toont verschillende stalen van humaan DNA, gebruikt als standaarden in een b-globuline kwantificatie-experiment. Twee stalen met een onbekende concentratie van het gen werden tegelijkertijd geamplificeerd. Nadat de PCR voltooid is, verwerkt de software van het Real-time PCR-toestel de ruwe data. De eerste stap hierbij is het vastleggen van een treshold fluorescentielevel, dat aangeeft dat de PCR zich in de loglineaire fase bevindt. Vervolgens berekent de software de logaritmische waarden voor alle punten die boven dit treshold level gelegen zijn (Figuur 4b). Dan gaat de software een vloeiende lijn tekenen doorheen een door de gebruiker gedefinieerd aantal punten boven de tresholdwaarde en op die manier de snijpunten met de detectiedrempel bepalen voor alle standaarden. Deze snijpunten (cyclusnummers), die in de software ‘crossing points’ genoemd worden, worden vervolgens uitgezet a.f.v. het logaritme van de concentratie (Figuur 4c). De concentratie targetsequentie in de stalen met onbekende concentratie (puntjeslijn) wordt bekomen door de crossing points te vergelijken met de crossing points van de standaarden. In dit voorbeeld bevatten de standaarden van 101 kopieën (30 pg DNA) tot 105 kopieën (300 ng DNA). De concentraties berekend door de software, worden weergegeven in Figuur 4d.
6.12.4 Voordelen van Real-time PCR Real-time PCR geeft correcte informatie over de startconcentratie van een welbepaalde targetsequentie. Groep T
E. De Herdt
p. 15
PCR Real-time PCR is veel minder omslachtig en bovendien ook specifieker, gevoeliger en accurater dan andere kwantificatieprocedures. Real-time PCR is erg tijdsbesparend. De mogelijkheden van Real-time PCR zijn veel groter dan die van conventionele PCRmethoden. Minder kans op contaminatie Grote reproduceerbaarheid Breed werkingsgebied
Groep T
E. De Herdt
p. 16
PCR
7 NASBA (nucleic acid sequence based amplification) RNA wordt hier isothermisch geamplificeerd. Via reverse transcriptase en primer 1 (uitgerust met een promotor) wordt cDNA aangemaakt en verder dsDNA met behulp van reverse transcriptase en RnaseH. Het RNA polymerase kan dan binden ter hoogte van de promotorplaats en honderden copyen RNA aanmaken, waarna de cyclus terug kan beginnen. Al de gebruikte enzymen (RT, RnaseH, RNApolymerase) werken bij dezelfde temperatuur (41°C). Het gaat hier dus om een isothermische reactie die geen gespecialiseerde toestellen vereist! Het bekomen versterkingsproduct is RNA.
NASBA amplification reaction NASBA amplification reaction with the P1 (anti-sense) – P2 (sense) oligonucleotide primer set. The overhang on the P1 encodes the promoter sequence for the T7 RNA polymerase. A molecular beacon with a fluorophore and a quencer with the NASBA amplification reaction generates a realtime detection system.
Groep T
E. De Herdt
p. 17
DNA replicatie
DNA replicatie De replicatie van het DNA moet zeer getrouw gebeuren gezien het feit dat het drager is van alle genetische informatie; daarenboven stelt er zich ook een mechanisch probleem gezien het DNA een sterke structurele organisatie vertoont (helix, supercoiling, binding met eiwitten (histonen) en een hogere driedimensionele organisatie (chromatine). Modificatie van nucleotiden na DNA synthese, voornamelijk methylatie, kan ook een informatieve functie vervullen en wordt ook overgeërfd. Dit komt later aan bod. Meselson en Stahl (1957) toonden aan dat DNA zich semi-conservatief repliceert waarbij één streng als template fungeert voor de bijsynthese van de nieuwe streng.
1 Procaryote DNA replicatie Zelfs bij een eenvoudige bacterie zoals E. coli ( één circulair dsDNA) zijn er heel wat genen en genproducten betrokken bij de DNA synthese van dit toch wel kleine genoom. Volgende componenten zijn hierbij betrokken: - template DNA; - oorsprong van replicatie (dwz. een specifieke sequentie van nucleotiden die fungeert als initiatieplaats); - eiwitten: - DnaA, DnaB en DnaC: noodzakelijk voor de herkenning van de initiatieplaats en om de ouderstrengen te scheiden; - Rep eiwit en SSB (‘single-strand binding proteins’) werken tezamen om het ouder DNA te ontpakken (Rep) en om de dubbele helix te ontwinden (SSB); hiervoor is ATP vereist als energiebron; - nucleotiden: dNTP’s - enzymen: - topoisomerasen: controleren de topologie van het DNA: supercoiling! - gyrasen: ontwinden het DNA opdat de helicasen kunnen inwerken; - helicasen: ontwinden de dubbele helix; - DNA afhankelijk RNA polymerase en primasen: synthetiseren de RNA primer; een noodzaak voor de synthese van DNA; - DNA afhankelijk DNA polymerase III: synthetiseert DNA; - DNA afhankelijk DNA polymerase I: verwijdert de RNA primer en vervangt het door DNA; het is ook het “proofreading” enzyme; - DNA ligase: verbindt de OKAZAKI fragmenten via een fosfodiësterbinding.
1.1 Template DNA Een template is noodzakelijk, want geen enkel DNA polymerase is gekend dat DNA ‘de novo’ kan synthetiseren en bv. nucleotiden kan plaatsen in een random orde. Elk nucleotide dat ingebouwd wordt, wordt geselecteerd ten overstaan van zijn template via de Chargaff baseparing. Groep T
E. De Herdt
p. 1
DNA replicatie
1.2 Oorsprong van replicatie E. coli, net als andere prokaryoten heeft één oorsprong van replicatie. Een sequentie van ongeveer 245 bp. Deze plaats wordt herkend, de duplex (waterstofbindingen) wordt verbroken en het helicase enzyme wordt gebonden. Bij eukaryoten schijnen er geen specifieke oorsprongen van replicatie te zijn. Wel start de replicatie op verscheidene plaatsen tegelijkertijd anders zouden de grote genomen van eukaryoten nooit tijdig af raken. Eens gestart, vindt DNA synthese bidirectioneel plaats, dwz de replicatievork schuift in twee richtingen op.
1.3 Eiwitten Het DnaA eiwit herkent in E. coli de initiatieplaats van DNA replicatie. Bemerk de nomenclatuur: deze combinatie van hoofd en kleine letters wordt gebruikt voor eiwitten die betrokken zijn bij de DNA synthese. Een complex bestaande uit DnaB en DnaC verzamelt zich met behulp van DnaA ter hoogte van de oorsprong van replicatie. DnaB heeft helicase activiteit en helpt bij de scheiding van de twee complementaire strengen. Eén streng wordt continu gesynthetiseerd (‘leading strand’), de andere wordt via Okazaki fragmenten gemaakt (‘lagging strand’). Beide syntheses gebeuren steeds in de 5’ → 3’ richting. Het Rep eiwit hecht zich aan de ouderstreng vast en beweegt in de 3’ → 5’ richting waarbij het 2 ATP’s verbruikt voor elk basepaar dat gescheiden wordt. SSB eiwitten zijn nodig om de twee strengen van elkaar te houden eens ze gescheiden werden. Ze hechten zich aan de ouderstrengen en voorkomen zo de hervorming van waterstofbruggen.
1.4 Nucleotiden Ze zijn noodzakelijk bij de DNA synthese omwille van: - bouwstenen van DNA en RNA; - de opeenvolging (sequentie) bevat de genetische informatie van het organisme; - energiebron voor de synthese. De vorming en afbraak hebben we besproken in het metabolisme. Tijdens DNA synthese wordt elke trifosfaat vlak voor de incorporatie omgevormd tot het monofosfaat. De vrijstelling van de twee fosfaten (pyrofosfaat) levert de energie om het monofosfaat vast te koppelen aan de groeiende nucleïnezuurketen.
Groep T
E. De Herdt
p. 2
DNA replicatie
1.5 Enzymen 1.5.1 Gyrasen Alvorens DNA synthese kan plaatsgrijpen dient het stevig opgewonden DNA (‘coiled’) ontwonden te worden (‘relaxed’). Deze opwinding was nodig om DNA zijn compacte vorm te geven. Ontpakking betekent in essentie de spanning in de helix verminderen vlak voor het punt van DNA synthese. Dit wordt bekomen door een tijdelijke breuk te introduceren in één van de ouderstrengen. Deze breuken kunnen voorkomen om de 10 nucleotiden.
1.5.2 Helicasen Dit zijn activiteiten geassociëerd met DnaB en Rep. Zij zorgen voor het verbreken van de helix structuur. Rep bindt met de ouderstreng die template is voor de ‘leading strand’. DnaB bindt met de ouderstreng die template is voor de ‘lagging strand’. DnaB beweegt dus in de 5’ → 3’ richting en is betrokken in de synthese van de Okazaki fragmenten.
1.5.3 DNA afhankelijk RNA polymerase en primase Een klein stukje RNA (2 - 10 nucleotiden) is noodzakelijk om de DNA synthese te starten. De ‘leading strand’ wordt éénmaal geprimed, de ‘lagging strand’ wordt meermaals geprimed. Primase en RNA polymerase catalyseren dezelfde reactie en kunnen beide binden met de template strand voor de ‘leading strand’. Het primase bindt daarenboven ook met de template strand voor de ‘lagging strand’. RNA synthese vindt enkel plaats in de 5’ → 3’ richting en vereist geen aangrijpingspunt; de template streng zorgt wel voor de juiste volgorde van nucleotiden.
1.5.4 DNA afhankelijk DNA polymerase III Dit is één van de twee enzymen die daadwerkelijk DNA synthetiseren. Het incorporeert de juiste base in de 5’ → 3’ richting en vertrekt hiervoor van het stukje RNA gemaakt door het RNA primase. Een correcte baseparing zorgt voor het meest stabiele substraat - enzyme complex. Het actieve enzyme is een multisubeenheid complex bestaande uit minstens 7 subeenheden.
1.5.5 DNA afhankelijk DNA polymerase I Dit is het andere enzyme dat DNA synthetiseert. Het ‘Kornberg’ enzyme (ontdekker), een andere naam voor dit enzyme, is betrokken in DNA synthese en herstel en bezit 3 activiteiten: - DNA polymerisatie; - depolymerisatie of exonuclease activiteit in de 5’ → 3’ richting; - depolymerisatie of exonuclease activiteit in de 3’ → 5’ richting (‘proofreading’ activiteit!). Van de Okazaki fragmenten, 1000-2000 nucleotiden (prokaryoot) en 100-200 nucleotiden (eukaryoot) lang, dient het RNA stukje immers verwijderd te worden, dit is de 5’ → 3’ exonuclease activiteit. Dit gebeurt dus samen met de additie van nieuwe nucleotiden, dit proces wordt ook wel ‘nick translation’ genoemd. Tevens zal dit enzyme de groeiende keten nakijken op de correctheid waarmee de laatste base telkens werd ingebouwd; was dit foutief dan zal de 3’ → 5’ exonuclease activiteit deze base verwijderen. Groep T
E. De Herdt
p. 3
DNA replicatie
1.5.6 DNA ligase Deze enzymen zorgen voor de verbinding tussen DNA segmenten tijdens replicatie, herstel en recombinatie processen. Zij verbinden telkens een 5’ fosfaatgroep met een 3’ hydroxylgroep. Voor deze reactie is er een energiebron noodzakelijk: ATP (eukaryoten), NAD (prokaryoten).
1.6 Replicatie van prokaryoot ds DNA Dit is een sterk gereguleerd proces dat éénmaal per celdeling voorkomt. Het molecule wordt gerepliceerd tegen een snelheid van ongeveer 1500 nucleotiden per seconde, waardoor het gehele chromosoom van E. coli gedupliceerd is op 40 min. Wat het proces juist in gang steekt is niet geweten, maar de beschikbaarheid van nutriënten (prokaryoten) of de aanwezigheid van groeifactoren (eukaryoten) speelt zeker een rol. De controle speelt op het proces van intitiatie en wat hiervoor zeker nodig is: - coördinatie met andere fysiologische en biochemische processen in het celmetabolisme en celdeling; - mag maar één maal optreden per celdeling; - enkel als groeicondities voordelig zijn en als het DNA niet beschadigd is of de cel zich in een terminaal gedifferentiëerd stadium bevindt. Het meest bestudeerde model van DNA replicatie is dit van E. coli: één circulair ds DNA van 1300 µm lang en bestaande uit 4.7x106 bp bevindt zich in een cel met als langste doormeter 3 µm en wordt gerepliceerd tegen een snelheid van 1500 nucleotiden per seconde. Het DNA is dus sterk opgewonden in deze kleine ruimte en moet vooraleer te repliceren eerst ontwonden worden en na replicatie terug opgewonden worden. Beschrijving: - DnaA bindt met oriC, waardoor lokaal een uitsmelting van 40 bp plaatsvindt; - hierdoor worden DnaB en DnaC aangetrokken die met de uitgesmolten regio binden; - De helicase enzymen, DnaB en Rep, samen met SSB en de gyrasen starten met de ontwinding en de scheiding van beide strengen; - Hierdoor kunnen het primase en het RNA polymerase binden met de template streng van de ‘leading strand’ en het primase alleen met de template voor de ‘lagging strand’. - Het primosoom is hiermee samengesteld: dit is het complex waar de RNA primer wordt gesynthetiseerd; - Synthese van DNA ( DNA polymerase III) kan dan continu geschieden wat de ‘leading strand’ betreft; de ‘lagging strand’ wordt in fragmenten gemaakt (Okazaki) van ongeveer 1000 tot 2000 nucleotiden waarna het DNA polymerase III dissociëert ter hoogte van een vorig Okazaki fragment. - Een nieuw primosoom wordt gevormd voor de intitiatie van een nieuw Okazaki fragment; - Twee Okazaki fragmenten worden aan elkaar gezet door de inwerking eerst van het DNA polymerase I en nadien van het DNA ligase. Bij E. coli gebeurt dit bi-directioneel, waardoor in een tussenstadium een theta (θ) vorm wordt waargenomen bij electronmicroscopische opnamen van replicerend DNA. Groep T
E. De Herdt
p. 4
DNA replicatie
2 Replicatie van eukaryoot DNA Men neemt aan dat dit sterk gelijkaardig is met de prokaryote DNA replicatie. We beperken ons tot een opsomming van een aantal verschilpunten: - meer en langere lineaire chromosomen; - duurt ongeveer 6 - 8 uur; - meervoudige oorsprongen van replicatie die ongeveer 20 kbp uit elkaar liggen; - bidirectionele replicatie gebeurt uit elke oorsprong tot de replicatievorken elkaar ontmoeten; - inbouw van nucleotiden gebeurt tegen een snelheid van 10 - 100 nucleotiden per seconde; - de beslissing om met de DNA synthese van start te gaan vindt plaats tijdens de G1 fase van de celcyclus; - de eigenlijke duplicatie van DNA gebeurt tijdens de S fase van de celcyclus; - minstens 5 verschillende DNA polymerasen zijn aangetroffen bij eukaryoten; - Telomerase zorgt ervoor dat het 3’ uiteinde niet steeds korter wordt doordat de ‘lagging strand’, die meestal onvolledig gerepliceerd wordt, terug verlengd wordt.
When cells divide, they undergo a series of orderly events known as the cell cycle. This cycle is divided into interphase and mitosis. Interphase begins as a cell from a previous division enter the G1 stage of interphase, a period of growth in which proteins and other cellular molecules are synthesized, but the DNA remains unreplicated (G refers to the gap or break in DNA synthesis). The initiation of DNA begins with the S period of interphase (S stands for DNA synthesis). During S the entire nuclear DNA is replicated. As replication is completed, S ends and the cell enters the final stage of interphase, G2. G2 is characterized by synthesis of a group of proteins necessary for progress through mitosis. Most cell types begin in G2 only briefly and the end of G2 marks the end of interphase and the beginning of mitosis. At the end of mitosis, two new cells are formed.
Groep T
E. De Herdt
p. 5
DNA replicatie
3 Correctheid van de DNA replicatie De getrouwheid van DNA replicatie is belangrijk om de soort in stand te houden. Anderzijds zorgen fouten voor een mogelijke evolutie of aanpassing aan veranderende omstandigheden. Teveel fouten zijn echter nefast voor de overleving. Bij E. coli schat men dat 1 op de 109 ingebouwde basen verkeerd wordt geïncorporeerd. Dit betekent één fout op 1000 cellen per generatie. Deze hoge getrouwheid wordt bekomen door:
- fouten te voorkomen: Het DNA polymerase III selecteert de juiste base vooraleer ze te incorporeren (deze stap draagt het meest bij tot de getrouwheid). Het DNA polymerase I heeft ‘proofreading’ activiteit.
- fouten te herstellen: Als er toch een fout geïntroduceerd werd in de nieuwe streng, zal deze hersteld worden via een herstelmechanisme. De mogelijkheid om een onderscheid te maken tussen de ouderstreng en de nieuw gesynthetiseerde streng is hierbij uiteraard cruciaal. De ouderstreng is gemethyleerd, de nieuwe nog niet. Er is immers een lag periode tussen de nieuwe DNA synthese en de methylatiereacties (veelal adenine) die nadien optreden. Tijdens deze tijdspanne kunnen dus fouten op de ongemethyleerde streng correct hersteld worden. Bij eukaryoten is dit nog niet echt geweten. Bij gist en drosophila wordt het DNA niet gemethyleerd. Bij andere eukaryoten is het meestal cytosine dat gemethyleerd wordt. Men suggereert dat de discontinue synthese zorgt voor herkenning van de nieuw gesynthetiseerde streng; vooral dan de gaten tussen de Okazaki fragmenten. ‘Mismatch repair’: herkenning dochterstreng, ss breuk, exonuclease, polymerase, ligase. ‘Excision repair’: zoekt lokaal naar abnormale structuren: T-T dimeren, chemische gemodifiëerde basen, …; knipt ongeveer een 12-tal bp weg en herstelt via bijsynthese. Het blijkt ook dat de grootste kans op introductie van fouten gebeurt tijdens de assemblage van de eerste nucleotiden. Dit is dus als de RNA primer gemaakt wordt. Herstel is dus eenvoudig aangezien de RNA primer later toch vervangen wordt door DNA (5’ → 3’ exonuclease en 5’ → 3’ polymerisatie activiteit).
Fouten introducerend herstelmechanisme ‘SOS repair’: Als fouten op beide strengen dicht bij elkaar voorkomen kunnen bovengenoemde mechanismen niet plaatsgrijpen. Het SOS herstelmechanisme kan deze alsnog herstellen; er worden echter wel enkele andere baseparen geïntroduceerd.
Groep T
E. De Herdt
p. 6
DNA replicatie
4 Replicatie van andere nucleïnezuren Hierboven werd enkel de replicatie besproken van dsDNA. De vier mogelijke nucleïnezuren die kunnen fungeren als genetisch materiaal (ds, ss DNA en ds, ss RNA) werden allen teruggevonden in één of ander virus. Daarenboven kunnen deze ook nog eens voorkomen als lineaire of circulaire vorm. Virussen kunnen relatief eenvoudig bestudeerd worden en gelden dus als voorbeeld voor de replicatiemethoden van deze andere nucleïnezuren. Alle virussen moeten door een aantal stadia gaan opdat ze zich kunnen repliceren: - vasthechting of adsorptie van het virus aan de gastcel; - penetratie van het gehele virus of van het genetisch materiaal; - aanpassing van het celmetabolisme ten bate van de virusreplicatie; - replicatie van viraal nucleïnezuur; - synthese van de eiwitmantel; - assemblage van de verschillende componenten; - vrijstelling van de nieuwe virussen.
4.1 Bacteriofaag ΦX 174 Eén van de kleinst gekende virussen is de ΦX 174 bacteriofaag van E. coli. Het heeft een icosahedrische vorm en het DNA zit vervat in een capside bestaande uit eiwit. Het genoom bestaat uit ss DNA van 5386 nucleotide en codeert voor 11 eiwitten. Het werd als eerste volledig gesequenced door Sanger en het bevat een aantal overlappende genen.
Replicatie: - ss DNA (+) → ds DNA (RF = replicatieve vorm) (1 min) - vermenigvuldiging RF via ‘rolling circle’ mechanisme (na 20 min: 35 copijen); - synthese van (+) via gebruik van (-) streng van de RF via ‘rolling circle’ (na 30 min: 500 nakomelingen). Er wordt geen parentaal DNA teruggevonden bij de nakomelingen. Het gaat hier dus om een conservatieve DNA replicatie.
4.2 Tabak mozaïek virus TMV Het TMV is een plant RNA virus dat als eerste virus gekristalliseerd werd. Het was ook de eerste gekende biologische structuur die zich via zelfassemblage vormde. Het ssRNA genooom bevat 6390 nucleotiden en codeert voor 4 genen. Het viruspartikel bevat 2130 identieke eiwitten die zich rond het RNA genoom bevinden als een rechtsdraaiende helix. Elk eiwit bindt met 3 nucleotiden. Het RNA replicase gen codeert voor het gelijknamige enzyme, een RNA afhankelijk RNA polymerase, dat een nieuwe RNA streng kan synthetiseren van 5’ → 3’. Er zijn hier geen correctiemechanismen actief wat de hoge mutatiesnelheid van RNA virussen verklaart.
Groep T
E. De Herdt
p. 7
DNA replicatie
Replicatie: - infectie, waarna RNA vrijstelling; - synthese van het RNA replicase + mantel eiwitten; - synthese van (-) streng (geen duplex RNA vorming!); - synthese van (+) streng; - eiwitplaat bindt met 5’ einde van RNA genoom (+) en groeit aan langsheen het RNA naar het 3’ einde.
4.3 HIV, een retrovirus De retrovirussen zijn een groep van dierlijke virussen die gekarakteriseerd worden door hun omgekeerde vorm van genetische overdracht: RNA → DNA. Het HIV bevat een genoom bestaande uit 2 ssRNA moleculen welke aan elkaar vastgehecht zijn via een cellulair tRNA molecule. Het codeert voor een tiental genen waarvan er 3 zeer goed gekend zijn: - gag: intern structureel eiwit; - env: omslag eiwit; - pol: reverse transcriptase + integrase Eén molecule van het reverse transcriptase is geassociëerd met het genoom.
Replicatie: - virus bindt CD4 lymfocyten; - ss RNA → ss DNA → ds DNA (reverse transcriptase); - integratie in gast genoom (integrase) waardoor een provirus ontstaat; - aanmaak van viraal RNA (fungeert als mRNA en als genoom) via cellulaire RNA polymerase; - assemblage + ontsnappen via de celmembraan (knopvorming) waardoor het virus voorzien wordt van een lipide omslag. Het reverse transcriptase bevat dus 3 activiteiten: - RNA afhankelijk DNA polymerase (de RNA primer is het tRNA) (synthese van eerste ssDNA streng); - DNA afhankelijk DNA polymerase (synthese van ds DNA); - ribonuclease H (afbraak van RNA deel) Men vraagt zich nog steeds af welke factoren een rol spelen in het op gang komen van de virale RNA synthese waardoor nakomelingen worden geproduceerd en een nieuwe infectiegolf start. Een modelorganisme hiervoor is faag lamda.
Groep T
E. De Herdt
p. 8
DNA replicatie
4.4 Faag lambda en lysogenie De meeste bacteriofagen, dierlijke- en plantvirussen hebben enkel een lytische levenscyclus. Na replicatie vernielen de meeste virussen hun gastcel (virulente virussen). Sommige virussen (lambda, HIV) kunnen hun genetisch materiaal integreren in het gastgenoom (profaag) en zo hun genetisch materiaal verschillende celgeneraties doorgeven totdat op een gegeven (geschikt) moment beslist wordt om over te schakelen naar een lytische levenscyclus. Faag lambda bestaat uit een icosahedrische kop en een flexiebele staart. Het genoom is een lineair ds DNA van 48502 bp coderend voor ongeveer 50 genen. Het bevat 5’ ssDNA uiteinden van 12 nucleotiden (‘cohesive ends = cos’). Na infectie wordt het lineaire DNA gecirculariseerd ter hoogte van de cos plaatsen door het DNA ligase, waarna het DNA gyrase zorgt voor ‘supercoiling’. Op dat ogenblik kunnen er twee wegen bewandeld worden: lytisch of lysogeen (vooral afhankelijk van de infectiegraad en de nutriënt aanwezigheid).
4.4.1 Lytische cyclus: - na infectie, treedt er circularisatie op van het lineaire DNA uit het faagpartikel; dan volgt er een bidirectionele replicatie volgens het theta model, waardoor er meer template voorhanden komt voor genexpressie, nadien gevolgd door een ‘rolling circle’ mechanisme dat een genoompolymeer oplevert (concatemeer) dat gekliefd wordt ter hoogte van de ‘cos’ plaatsen; - verpakking van het genoom in de eiwitmantel (spontaan); - lyse van de gastcel waardoor de circa 100 nakomelingen kunnen ontsnappen.
4.4.2 Lysogene cyclus Bij een lage concentratie aan nutriënten en/of een hoge multipliciteit van infectie is het in het voordeel van de faag om een ‘slapende’ toestand aan te nemen (profaag). Het virale DNA wordt geïntegreerd in het gastgenoom en de genen voor virale reproductie en cellyse worden onderdrukt. De insertie van het lambda genoom in de gastcel is plaatsspecifiek (lambda attachment site) (attB). Op het lambda genoom is dit (attP). Dit proces wordt gekatalyseerd door het faaggecodeerde enzyme: integrase). De keuze tussen lysogene en lytische weg is afhankelijk van de concentratie van een zeer onstabiel genproduct: cII. cII stimuleert de productie van: - cI: (repressor) onderdrukt praktisch de expressie van alle virale genen behalve zichzelf (het is dus zowel een positief als een negatief controle molecule); - Cro: stimuleert de expressie van de lytische genen en onderdrukt de expressie van cI. Als de concentratie aan voedingsstoffen laag is produceert de E. coli cel cAMP. De degradatie van cII gebeurt door een cAMP afhankelijk enzyme. Bij hoge cAMP concentratie blijkt de synthese van het cII afbrekende enzyme geïnhibeerd te zijn waardoor de
Groep T
E. De Herdt
p. 9
DNA replicatie concentratie aan cII stijgt en daardoor ook deze van cI en het virus de lysogene weg op gaat die onderhouden wordt door de zelfstimulatie van cI. Bij een hoge infectiegraad zijn er vele cII genen in de cel aanwezig waardoor er veel cII eiwit aanwezig is en de cel de lysogene weg opgaat vooraleer de lytische genen kunnen geactiveerd worden.
4.4.3 Inductie Bij DNA beschadiging (UV, X-stralen) start de E. coli cel een SOS herstelmechanisme waardoor verschillende E. coli genen gestimuleerd worden waaronder RecA: - breekt cI af; - stimuleert cro. Het Cro eiwit stimuleert op zijn beurt de lytische genen waardoor het integrase en excissie zorgen voor een dissociate van de profaag uit het gastgenoom. Hierdoor kan de replicatie aangevat worden die uiteindelijk zal resulteren in de lyse van de cel.
Groep T
E. De Herdt
p. 10
Moleculaire structuur van genen en chromosomen
Moleculaire structuur van genen en chromosomen 1 Moleculaire definitie van een gen Moleculair gezien wordt een gen gedefiniëerd als de volledige nucleotidesequentie die nodig is om een functioneel polypeptide te kunnen synthetiseren. Dit betekent dus niet enkel de coderende sequentie maar ook alle sequenties die nodig zijn om een bepaald RNA transcript te produceren. Bij sommige prokaryoten kunnen de sequenties die de initiatie van transcriptie regelen duizenden basen verwijderd zijn van de coderende regio. Bij eukaryoten liggen “enhancer” sequenties die de initiatie van transcriptie controleren soms meer dan 50 kb verwijderd van de aminozuurcoderende sequentie. Andere belangrijke sequenties bij eukaryoten zijn bv. de 3’ klievingsplaats, polyadenylatie signalen en splicing regio van het primaire RNA transcript. Mutaties in deze RNA ‘processing’ signalen verhinderen soms de expressie van functioneel mRNA en daardoor dus ook de synthese van het corresponderende eiwit. De meeste genen worden overgeschreven naar mRNA dat dan codeert voor eiwit. Sommige sequenties leveren enkel RNA op dat niet codeert voor eiwit (bv. tRNA, rRNA, regulatorische RNA moleculen, enz.). Ook deze sequenties worden als gen aanzien.
1.1 Structurele genen Dit zijn de sequenties die nodig zijn voor een eiwit of RNA molecule te kunnen maken.
1.1.1 Prokaryote genen De meeste prokaryote genen worden niet onderbroken door niet-coderende regio’s (uitzondering: sommige Eubacteria en Archaebacteria). De structurele genen van prokaryoten worden meestal geactiveerd in groep: polycistronische transcriptie eenheden. Deze coderen aldus voor meer dan één polypeptide. Het resulterende mRNA bevat een ‘leader’ sequentie, start sequentie, nucleotide sequentie voor het eiwit, een stopsequentie en een spacersequentie van 5 - 20 nucleotiden om het ene van het andere gen te scheiden. De aminozuurvolgorde die men terugvindt in de corresponderende eiwitten ligt continu weerspiegeld in het coderende deel van het structurele gen, daarom zeggen we dat het gen colineair is met het eiwit.
1.1.2 Eukaryote genen Eukaryote genen komen als individuele genen tot expressie (monocistronisch). Zij bevatten echter zowel coderende (exon) als niet-coderende (intron) regio’s en worden daarom gespleten genen genoemd. Gen en eiwit zijn dus niet-colineair. Een uitzondering hierop vormen de histongenen en het interferongen. Intronen variëren in grootte, aantal, locatie en nucleotide sequentie afhankelijk van gen tot gen. De totale lengte van intronen is meestal Groep T
E. De Herdt
p. 1
Moleculaire structuur van genen en chromosomen een factor 2 - 10 deze van de exonen voor een bepaald gen. Deze intronen komen niet voor ‘at random’ maar scheiden meestal structurele of functionele domeinen aanwezig in het afgewerkte eiwit. Daarenboven kunnen gespleten genen aanleiding geven tot verschillende transcripten waarin één of meerdere exonen al dan niet aanwezig zijn.
1.1.3 Overlappende genen Deze werden vroeger reeds besproken en komen meestal voor bij kleine virussen (MS2, F2, SV40, ФX174, enz.), maar werden ook aangetoond bij enkele eukaryote genen (factor VIII, thyroïd hormoon receptor gen). Elk gen heeft zijn eigen startplaats en reading frame. Een groot nadeel is dat een mutatie echter ook meestal een effect heeft op beide eiwitproducten.
1.1.4 Transposons zie later
1.2 Regulatorische sequenties Deze sequenties interageren met eiwitmoleculen of met eiwitmoleculen gekoppeld met nieteiwitmoleculen. De meeste ervan behoren tot de groep van de transcriptiefactoren
1.2.1 Promotor De promotor is een nucleotidesequentie (20 - 200 bp) die herkend wordt door het DNA afhankelijk RNA polymerase en gelegen is langs de 5’ zijde van het structurele gen. Bacteriële promotorplaatsen bevatten meestal twee bijna identieke sequenties: - TATAAT (Pribnow box) ( -10 regio) (bindingsplaats voor sigma subeenheid) - TTGACA (-35 regio) Bij eukaryoten is een gelijkaardige sequentie aanwezig: - TATAAA (Hogness box) (-19 - 27 bp) Ook andere eiwitten kunnen met de promotorplaats binden en zijn dan noodzakelijk om het RNA polymerase zelf effectief te laten binden. Zij stimuleren alzo de transcriptie.
1.2.2 Operator Deze sequenties liggen tussen promotor en het structurele gen. Het is de bindingplaats voor repressor eiwitten die hierdoor sterisch verhinderen dat het RNA polymerase vanop de promotorplaats hier voorbij kan schuiven. De transcriptie wordt hierdoor verhinderd.
1.2.3 Attenuator ‘Attenuator’ sequenties (veminderen) worden gevonden bij bacteriële genclusters die coderen voor enzymen betrokken bij de aminozuurbiosynthese. Ze zijn gelegen binnen de ‘leader’ sequentie, een +/-162 bp regio gesitueerd tussen promotor-operator en het begin van het eerste structurele gen. Afhankelijk van de aminozuurconcentratie in de cel wordt de transcriptieactiviteit bijgesteld. Hoge AZ concentraties leiden tot een vermindering van de transcriptie (10x) door een vroegtijdige beëindiging van de transcriptie. Dit fenomeen is enkel mogelijk bij prokaryoten Groep T
E. De Herdt
p. 2
Moleculaire structuur van genen en chromosomen omdat transcriptie en translatie zich hier practisch tegelijkertijd en gekoppeld afspeelt. Bij eukaryoten gebeurt transcriptie immers in de kern en de translatie in het cytoplasma.
1.2.4 Enhancer Deze sequenties werden eerst ontdekt bij DNA en RNA virussen, maar zijn veel aanwezig bij eukaryoten. Door de binding van sequentiespecifieke eiwitten wordt de bindingsefficiëntie van het RNA polymerase met de promotorplaats sterk gestimuleerd. Zij hebben geen welbepaalde plaats ten opzichte van de initiatieplaats van het structurele gen en kunnen zowel ‘up’ als ‘downstream’ gelegen zijn. ‘Enhancer’ sequenties spelen een rol in de weefselspecifieke expressie van genen en/of de regulatie van de transcriptie in de tijd bv. tijdens de embryonale ontwikkeling.
Groep T
E. De Herdt
p. 3
Moleculaire structuur van genen en chromosomen
2 Chromosomale organisatie van genen en niet-coderend DNA Bij gist zijn de coderende regio’s dicht bij elkaar gelegen, terwijl bv. bij hogere eukaryoten zoals de mens deze sterk verspreid liggen langsheen het chromosoom. Er is dus een grote hoeveelheid niet-functioneel DNA aanwezig in de meeste eukaryote genomen in tegenstelling tot bij prokaryoten. Waarschijnlijk is dit het gevolg van een verschillende evolutionaire selectiedruk. Microörganismen staan in kompetitie met elkaar voor een beperkte hoeveelheid nutriënten. Synthese van niet-functioneel DNA kost tijd en energie waardoor er een selectiedruk is om dit te verliezen. Bij vertebraten wordt natuurlijke selectie vooral bepaald door hun gedrag. De energie die moet geïnvesteerd worden in DNA synthese is verwaarloosbaar ten opzichte van deze die noodzakelijk is voor beweging; daarom is hier de selectiedruk om nietfunctioneel DNA te elimineren veel minder aanwezig.
2.1 Classificatie van eukaryoot DNA Binnen eukaryoten is er een grote verscheidenheid in genoomgrootte die zeker niet correleert met de complexiteit van het organisme. Dit komt door een enorme variabiliteit in de hoeveelheid niet-functioneel DNA.
2.1.1 Eiwitcoderende genen 2.1.1.1 Solitaire genen, genfamilies en pseudogenen 25-50 % van de eiwitcoderende genen komen maar één maal voor in het haploïde genoom. De overige behoren tot zogenaamde genfamilies bestaande uit twee of meer gelijkaardige genen. Deze zijn meestal ontstaan door genduplicatie. Ze coderen voor eiwitten met een gelijkaardige, maar niet identieke aminozuursamenstelling; zogenaamde homologe eiwitten. Sommige eiwitfamilies zoals de eiwitkinasen, transcriptie factoren en immunoglobulines bestaan uit honderden leden. De meeste families bestaan echter uit enkele tot een 30-tal leden zoals deze van de cytoskelet eiwitten, 70 kDa ‘heat-shock’ eiwitten, ovalbumines, Kglobulines en β-globulines. Sommige gedupliceerde genen worden niet meer afgeschreven en zijn aldus niet meer functioneel; we noemen ze pseudogenen. Dit komt doordat evolutionair gezien er zich bv. stopcodons hebben ontwikkeld of wijzigingen die interfereren met de mRNA processing. Aangezien deze pseudogenen niet schadelijk zijn voor het organisme, blijven ze behouden in het genoom en zijn ze een blijvende indicatie van een genduplicatie bij één van onze voorouders. 2.1.1.2 ‘Tandem’ herhaalde genen Bij invertebraten en sommige vertebraten, komen de genen voor o.a. rRNA’s, tRNA’s en histonen voor in een groot aantal copiën, gerangschikt achter elkaar (tandem). Zij verschillen van gedupliceerde genen in genfamilies door het feit dat het hier gaat om bijna identieke copiën. De coderende delen zijn identiek; in de spacer regio’s kunnen kleine verschillen aanwezig zijn. Groep T
E. De Herdt
p. 4
Moleculaire structuur van genen en chromosomen
Deze herhalingen zijn noodzakelijk omdat het hier gaat om genen wiens genproduct in hoge concentraties in de cel voorkomen. We kunnen dit illustreren aan de hand van volgende bedenking: Een embryonale cel heeft een verdubbelingstijd van ongeveer 24 u en bevat 5-10.106 ribosomen. Teneinde voldoende rRNA te produceren voor de vorming van dit groot aantal ribosomen heeft de cel een 100-tal copiën nodig van het rRNA gen, die dan allen nog een maximale transcriptionele activiteit moeten bezitten. Alle eukaryoten bevatten dan ook minstens 100 copiën van de rRNA genen en 10-100 copiën van de verschillende tRNA’s (kikkers bevatten 20 000 5S rRNA genen!!!).
2.1.2 Repetitief DNA Ongeveer 40% van het eukaryote genoom bestaat uit herhalingssequenties: - een beperkt aantal sequenties komen in een groot aantal voor: bv. Alu repeat: 300 bp, komt 100 000 x voor in het menselijk genoom; - sommige sequenties komen in een beperkt aantal voor: bv. gedupliceerde genen, mobiel DNA (transposons) - 10 - 15 % bestaat uit ‘simple-sequence’ DNA 2.1.2.1 ‘Simple-sequence’ DNA 10 tot 15 % van het repetitieve DNA bestaat uit ‘simple-sequence’ DNA: - long tandem repeat van 20-200 bp die zich uitstrekken over een gebied tot 105 bp noemen we ‘satelliet’ DNA omdat we ze experimenteel kunnen scheiden van het bulk DNA door evenwicht densiteitsgradiënt centrifugatie. Mini-satelliet DNA zijn kleinere regio’s 1-5 kb welke 20-50 herhalingen bevatten van een 15-100 bp sequentie; - indien de repeat korter is (5-20 bp) spreken we over een VNTR (variable number tandem repeat); - bedraagt de repeat eenheid (2-5 bp) dan noemen we dit een STR (short tandem repeat). Bij zoogdieren is veel ‘simple sequence DNA’ gelegen in de buurt van de centromeren waardoor ze een rol zouden kunnen spelen tijdens mitose en meiose. Bij Drosophila vinden we ze ook nog veel terug aan de chromosoomuiteinden (telomeren). Unieke herhalingsequenties kunnen gebruikt worden om via FISH (fluorescentie in situ hybridisatie) welbepaalde chromosomen te identificeren. Binnen een bepaalde soort is de sequentievolgorde van de herhalingseenheden (repeat) die we aantreffen in ‘simple sequence’ DNA sterk geconserveerd tussen de verschillende individuen. Verschillen in het aantal van de herhalingsequentie, dus de lengte van de tandem, zijn echter wel aanwezig tussen individuen. Deze worden veroorzaakt door ongelijke ‘crossing-over’ binnen deze tandem repeat regio’s. Zij vormen de basis voor o.a. persoonsidentificatietechnieken (DNA fingerprinting). 2.1.2.2 Mobiel DNA Mobiele DNA elementen werden eerst ontdekt bij eukaryoten (planten) (Barbara McClintock, 1940), maar komen ook voor bij prokaryoten. Het zijn elementen bestaande uit Groep T
E. De Herdt
p. 5
Moleculaire structuur van genen en chromosomen honderden tot enkele duizenden baseparen lang die instaat zijn zich ofwel te verplaatsen binnen het genoom of zich te copiëren naar andere locaties binnen het genoom. We noemen dit proces ‘transpositie’ en we gaan hier dieper op in tijdens het hoofdstuk over natuurlijke recombinatieprocessen. In essentie kan deze transpositie gebeuren onmiddellijk via DNA (transposon) of via een RNA intermediair (retrotransposon), waarbij de overeenkomst met het infectieproces van retrovirussen veelbetekenend is. Zij vervullen geen ogenschijnlijke rol en dienen uiteindelijk enkel hun eigen instandhouding; vandaar de term: moleculaire parasiet. Omdat hun eliminatie via deletie of via mutatie trager verloopt dan hun verspreiding, hebben ze zich kunnen accumuleren zodat ze nu een aanzienlijk deel uitmaken van het eukaryote genoom.
Groep T
E. De Herdt
p. 6
Moleculaire structuur van genen en chromosomen
3 Organisatie van DNA tot chromosoom Bij E.coli zorgen verschillende factoren ervoor dat het 1 mm lange DNA molecule compact verpakt wordt in een cel van 2 µm lang en 0.5 - 1 µm breed: - associatie met spermine en spermidine (sterk positief geladen polyamines), neutraliseert de negatieve lading van de fosfaatgroepen die verantwoordelijk is voor afstoting en het feit dat DNA (zonder polyamines) heel veel ruimte in beslag neemt; - associatie met een klein eiwit (H-NS), 20 000 per cel (dwz: één dimeer per 400 bp); - supercoiling. Als het DNA van eukaryoten wordt geïsoleerd in een isotone buffer is dit geassociëerd met ongeveer een gelijke hoeveelheid eiwit en vormt dit een relatieve compacte structuur: chromatine. We onderscheiden vooral een vijftal hoofdklassen onder de aanwezige eiwitten (histonen): H1, H2A, H2B, H3 en H4, die allen sterk positief geladen zijn (basische eiwitten) en dus goed kunnen binden met het negatief geladen DNA. In de meeste cellen kunnen deze histoneiwitten reversiebel gemodifiëerd worden via acetylatie, fosforylatie of methylatie waardoor de positieve lading geneutraliseerd of zelfs negatief kan worden. De condensatie en/of transcriptionele activiteit van het DNA kan hierdoor sterk beïnvloed worden. Onder lage ionenconcentratie komt chromatine voor als een parelsnoer (∅ 10 nm) waar de parels, nucleosomen, zijn afgewisseld met ‘linker’ DNA. Het nucleosoom bevat naast histonen ook een DNA segment van ongeveer 146 bp dat tweemaal rond de eiwitkern is gewikkeld. Het linker DNA variëert tussen soorten van 15 tot 55 bp. Het nucleosoom vormt zich onmiddellijk nadat de replicatievork voorbij is gekomen. Onder fysiologische zoutconcentraties worden de nucleosomen in een ‘solenoïde’ structuur (∅ 30 nm) gecondenseerd met 6 nucleosomen per draai.
Groep T
E. De Herdt
p. 7
Moleculaire structuur van genen en chromosomen
4 Morfologie en functionele elementen van eukaryote chromosomen In niet delende cellen zijn de chromosomen niet zichtbaar. Tijdens mitose en meiose condenseren de chromosomen en worden ze, na kleuring, zichtbaar onder het lichtmicroscoop. Het meeste cytogenetisch onderzoek gebeurt dan ook met gecondenseerde metafase chromosomen geïsoleerd uit delende cellen. Elk gecondenseerd chromosoom bevat twee zusterchromatiden en is het resultaat van verschillende opvouwingen van de chromatine structuur (solenoïde). Het aantal, de grootte en vorm van de metafase chromosomen vormen het karyotype, dat specifiek is voor elke soort. De hogere orden van opvouwing worden georchestreerd door niet-histon eiwitten die een ruggegraat vormen waarlangs de solenoïde zich kan opvouwen. Het DNA bindt met deze ruggegraateiwitten via specifieke sequenties die we ‘scaffold-associated regions’, SAR’s of ‘matrix-attachment regions’, MAR’s noemen. Bepaalde kleurstoffen kleuren de ene regio van het metafase chromosoom sterker dan de andere, waardoor een specifiek bandenpatroon wordt bekomen. - Quinacrine, produceert Q-banden; - Giemsa, produceert G-banden; - Giemsa kleuring na warme alkalische behandeling produceert R-banden; Via proben die specifiek binden met bepaalde sequenties die enkel op één welbepaald chromosoom verspreid voorkomen, kunnen we na hybridisatie, fluorescentiedetectie en software analyse, elk chromosoom een verschillende kleur geven (‘multicolor FISH’). Bepaalde chromosomale translocaties kunnen hierdoor zichtbaar gemaakt worden. Niettegenstaande chromosomen verschillen in lengte en aantal tussen soorten, gedragen ze zich allen gelijkaardig op een zelfde moment tijdens de celdeling. Teneinde zich correct te dupliceren en te verdelen over de dochtercellen zijn drie functionele elementen noodzakelijk: - initiatie oorsprongen voor de DNA replicatie (ARS); - het centromeer (CEN); - twee uiteinden: de telomeren (TEL). Dit leidde tot de constructie van artificiële gistchromosomen (YAC’s) waarin vreemd DNA tot 1Mb kan gecloneerd worden in gistcellen. Het volledige menselijke genoom is heden ten dage bijna volledig vertegenwoordigd in een reeks (bibliotheek) van overlappende YAC clonen.
Groep T
E. De Herdt
p. 8
Moleculaire structuur van genen en chromosomen
5 Organel DNA Het overgrote deel van het DNA bij eukaryoten wordt teruggevonden in de kern. Toch is er ook DNA aanwezig in de mitochondriën van plant-, dier- en fungicellen en in de chloroplasten van plantencellen. Deze organellen zijn de belangrijkste plaatsen van ATP vorming tijdens de oxidatieve fosforylatie (mitochondriën) en fotosynthese (chloroplasten). Er is veel bewijsmateriaal om te veronderstellen dat mitochondriën en chloroplasten geëvolueerd zijn uit bacteriën die via endocytose opgenomen werden door vooroudercellen met een eukaryote kern. Tijdens de evolutie werden de meeste bacteriële genen overgebracht naar de kern. Op dit ogenblik bezitten mitochondriën en chloroplasten een circulair DNA dat codeert voor sommige eiwitten met een essentiële organelfunctie en voor de ribosomale en transfer RNA’s nodig voor hun translatie. Het mtDNA repliceert ook tijdens de interfase en tijdens de navolgende mitose ontvangt elke dochtercel ongeveer evenveel mitochondriën. Er is echter geen mechanisme om ze exact te verdelen, zodat kort na mitose de ene cel meer mitochondriën zal bevatten dan de andere. De meeste mitochondriën van eukaryote cellen bevatten meerdere mtDNA moleculen. De totale hoeveelheid mtDNA is dus afhankelijk van het aantal mitochondriën in de cel, de grootte van het mtDNA en het aantal mtDNA moleculen per mitochondrium. Tijdens de vorming van het embryo bij de hogere dieren draagt de zaadcel geen cytoplasma over op de bevruchte eicel. Alle mitochondriën in het embryo zijn dus afkomstig van de eicel. Studies bij de muis hebben bewezen dat 99.99 % van het mtDNA maternaal overgeërfd wordt. Bij planten is dit voor 100% het geval. De meeste polypeptiden die in de mitochondriën gecodeerd en gemaakt worden, zijn subeenheden van multimere complexen actief in het electronentransport of de ATP synthese. De meeste eiwitten welke aangetroffen worden in de mitochondriën worden echter cytoplasmatisch aangemaakt en nadien getransporteerd naar het organel. Het menselijk mtDNA is een circulair molecule, één van de kleinst gekende mtDNA’s, bestaande uit 16 569 bp en coderend voor twee rRNA’s, 22 tRNA’s en het bevat 13 ‘open reading frames’ (ATG codon, stopcodon, lengte >50AZ). Het bevat geen introns noch lange niet-coderende sequenties. Gist mtDNA is bijna 5x zo groot (78 000 bp). Planten bevatten verschillende mtDNA moleculen die sterk kunnen variëren in grootte: (watermeloen: 330 000 bp; gewone meloen: 2 500 000 bp). De genetische code die gebruikt wordt door het mtDNA wijkt af van de standaard genetische code gebruikt door het nucleair DNA en verschilt zelfs tussen de verschillende soorten onderling. Een reden hiervoor is nog niet gevonden. Chloroplasten bevatten circulaire DNA moleculen (120 - 160 kb) afhankelijk van de soort coderend voor een aantal chloroplasteiwitten via de ‘standaard’ genetische code. Andere chloroplast eiwitten worden in het cytoplasma gemaakt en nadien geïmporteerd.
Groep T
E. De Herdt
p. 9
Transcriptie en regulatie
Transcriptie 1 Inleiding De werking en eigenschappen van een cel worden bepaald door de aanwezige eiwitten. De belangrijkste factoren die bepalen welke eiwitten er op een gegeven ogenblik in de cel aanwezig zijn, staan hieronder samengevat. De belangrijkste hiervan is echter de snelheid van gentranscriptie. Er is ook een groot verschil tussen prokaryoten, waar transcriptie en translatie tegelijkertijd en in hetzelfde compartiment gebeurt en eukaryoten waar de kernmembraan deze twee processen ruimtelijk van elkaar scheidt. - Chromatinestructuur: condensatiegraad, CpGmethylatie, (de)acetylatie, histonen bepalen de toegankelijkheid van het DNA voor het RNA polymerase en de verschillende transcriptiefactoren; - Initiatie van de transcriptie: promoter, enhancer, transcriptiefactoren (zie hieronder) - RNA processing en modificatie: polyadenylatie van het 3’ uiteinde, splicing (intronverwijdering), 5’CAP structuur; - RNA transport van kern naar cytoplasma; - Stabiliteit van mRNA; - Initiatie van translatie; - Post-translatie modificatie: acetylatie, glycosylatie, fosforylatie, disulfide bruggen; - Cellulair transport : het eiwit moet op zijn werkingsplaats terechtkomen - Eiwitstabiliteit. Op de verschillende niveau’s is er regulatie mogelijk. De belangrijkste stap is echter de controle op de initiatie van de transcriptie! In dit verband kunnen we in het algemeen spreken van regulatorische sequenties met een CIS werking (een sequentie die fungeert als DNA bindingsplaats voor regulatorische eiwitten, bv. enhancer, operator, promoter, die hierdoor de activiteit van genen op hetzelfde chromosoom beïnvloedt) en deze met een TRANS werking (meestal een repressor gen waarvan het eiwitproduct in staat is om de expressie van genen op een ander chromosoom te beïnvloeden)
2 Prokaryoten 2.1 Algemeen Vele bacteriële eiwitten zijn induceerbaar, d.w.z. dat de synthese functie is van de aanwezige nutriënten. De differentiële expressie van dergelijke genen wordt meestal gereguleerd op het niveau van de initiatie van transcriptie. Volgens het Jacob en Monod model voor de transcriptionele controle van het lac operon wordt de expressie van de drie induceerbare eiwitten onderdrukt door de binding van een lac repressor eiwit met de operator sequentie. Als lactose of een andere inducer aanwezig is wordt deze repressie opgeheven en wordt het lac operon afgeschreven. Groep T
E. De Herdt
p. 1
Transcriptie en regulatie Mutaties in de promotor (RNA polymerase bindingplaats) of de operator hebben een CIS werking (effect op genexpressie op hetzelfde DNA molecule). Mutaties in de operator met een verminderde repressor binding tot gevolg hebben een constitutieve transcriptie (cte transcriptiesnelheid) als resultaat. Mutaties in de promoter sequentie hebben een effect op de affiniteit waarmee het RNA polymerase zal binden. De transcriptiesnelheid kan hierdoor dalen (down-mutation) of verhogen (up-mutation). Repressor en activator eiwitten hebben een TRANS-werking: zij hebben een effect op de expressie van bepaalde genen onafhankelijk van op welk DNA molecule deze gelegen zijn.
2.2 Lactose operon Het Lac operon bestaat uit één regulatorisch gen (I) en drie structurele genen (Z, Y en A). Het I gen codeert voor het repressor eiwit van het lac operon. Het Z gen codeert voor βgalactosidase dat lactose hydrolyseert tot galactose en glucose. Het Y gen codeert voor een permease waardoor de permeabiliteit van de cel verhoogt voor β -galactosiden. Het A gen codeert voor een transacetylase. Onder normale omstandigheden, als glucose aanwezig is in het medium, is de lac repressor gebonden met de operator waardoor transcriptie verhinderd wordt. In de aanwezigheid van een inducer (allolactose, IPTG, …) bindt de repressor met de inducer waardoor de binding met de operator wordt verhinderd; transcriptie kan dus plaatsvinden. Indien echter nog steeds glucose in het medium aanwezig is, is de transcriptionele activiteit zeer gering. Deze C-katabole repressie is het gevolg van lage intracellulaire cAMP concentraties. Als de glucose concentratie in het medium daalt, stijgt de intracellulaire cAMP concentratie en verhoogt de transcriptionele activiteit van het lac operon. cAMP is immers in staat om te binden met een CAP eiwit (catabolite activator protein; ook CRP genoemd van: cAMP receptor protein). Het cAMP-CAP complex bindt met een regio van het lac operon even stroomopwaarts van de RNA polymerase bindingsplaats en stimuleert de RNA polymerase activiteit met een factor 20 à 50.
2.3 Experimentele technieken 2.3.1 Footprinting Een eiwit dat gebonden is met een bepaalde regio op het DNA molecule beschermt deze sequentie tegen Dnase I afbraak. Een gemerkt DNA fragment wordt enzymatisch behandeld in aan- en afwezigheid van het DNA bindend eiwit; na denaturatie en gelelectroforese is er een ‘gap’ in het bandenpatroon ter hoogte van de eiwitbindingsplaats. De Dnase I concentratie wordt zodanig gekozen dat er per DNA molecule gemiddeld maar éénmaal gekliefd wordt. Hierdoor ontstaat een ladder van fragmenten (mengsel van verschillende groottes!) Het DNA staal wordt tegelijkertijd aan een sequentiereactie onderworpen en op hetzelfde gel geanalyseerd waardoor de exacte bindingsequentie kan afgeleid worden.
2.3.2 Electrophoretic mobility shift assay (EMSA) Deze methode is meer geschikt voor een kwantitatieve analyse te doen van DNA - eiwit interacties. De electroforetische mobiliteit van een gemerkt DNA fragment wijzigt meestal Groep T
E. De Herdt
p. 2
Transcriptie en regulatie sterk wanneer er eiwit aan gebonden is. Zelfs indien maar een klein deel van het DNA gebonden wordt met eiwit wordt dit reeds zichtbaar met deze techniek (in tegenstelling tot footprinting).
2.4 Moleculaire processen
De σ70 subeenheid van het RNA polymerase bindt met de -10 (Pribnow box) en -35 regio van het gen en vormt een zogenaamd gesloten complex (basen blijven gepaard!). Dit moet overgaan in een open complex waarbij 10-12 baseparen verbroken worden en NTP’s kunnen aan elkaar gezet worden, waardoor de RNA keten verlengd kan worden in de 3’ richting. Na een tiental nucleotiden dissociëert de σ70 subeenheid van het core polymerase (2α, β’ en β). De repressor bindingsplaats overlapt een beetje met de promoter en bestaat meestal uit korte ‘inverted repeats’. Indien de repressor gebonden is met het DNA vermindert daardoor de bindingskans voor het RNA polymerase. De meeste bacteriële repressoren zijn dimeren welke α helixen bevatten die met de ‘major’ groeven van de DNA helix binden. Interactie met het DNA en met de andere subeenheid leiden tot een zeer hoge bindingsaffiniteit (10-8 - 10-11 M). De binding van bepaalde liganden met de repressor zorgen voor conformationele wijzigingen in het eiwit waardoor de DNA bindingsaffiniteit sterk kan wijzigen. - Lac repressor + allolactose of IPTG: bindingsaffiniteit daalt → inductie - Tryptofaan repressor + tryptofaan: bindingsaffiniteit stijgt → repressie cAMP-CAP activeert de transcriptie van het lac operon door coöperativiteit. Indien het RNA polymerase samen met cAMP-CAP aanwezig is, binden zij samen veel sterker met de promoter dan elk afzonderlijk. Activatoren in het algemeen verhogen dus de bindingskans van RNA polymerase met de promotor maar sommige werken ook via de stimulaite van de open complex vorming. Sommige groepen van genen worden afgeschreven via andere σ factoren en hebben dan ook andere herkenningssequenties. Sommige van deze herkenningssequenties kunnen enkele kb van elkaar liggen zoals het geval is bij de regulatie van de glnA promoter door NtrC en σ54.
2.5 Tryptofaan operon Het trp operon bevat de genen voor de tryptofaan biosynthese. De binding van de trp repressor met de operator sequentie wordt sterk verhoogd na binding met tryptofaan dat we in dit geval een corepressor noemen. Bij stijgende tryptofaanconcentraties wordt de transcriptiesnelheid aldus verminderd. De expressie wordt echter ook geregeld via ‘attenuation’. Deze ‘attenuatie’ sequenties worden gevonden aan het 5’ uiteinde van het getranscripteerde RNA dat we de ‘leader’ sequentie noemen. Deze is gelegen vlak voor de eigenlijke coderende regio van het eerste gen (trpE). De ‘leader’ sequentie codeert voor een klein ‘leader’ polypeptide dat verschillende tryptofaan codons bevat. Deze regio van het RNA is tevens in staat verschillende lusvormige structuren te vormen tussen de regio’s 1, 2, 3 en/of 4. Indien de tryptofaan concentratie hoog is, zal het ribosoom dat de ‘leader’ sequentie vertaalt zich snel kunnen verplaatsen zodat regio 1 en 2 bedekt zullen zijn. Er vormt zich een lus tussen regio Groep T
E. De Herdt
p. 3
Transcriptie en regulatie 3 en 4. Deze resulteert in een vroegtijdige terminatie van de transcriptie. De transcriptie wordt dus ‘geattenueerd’ (verminderd!). Bij lage tryptofaan concentraties vertraagt de vertaling van de leader sequentie door de ribosomen reeds in regio 1. Hierdoor kan er zich een lus vormen tussen regio 2 en 3 waardoor geen transcriptie beëindigende 3 - 4 lus kan gevormd worden. De transcriptie gaat dus gewoon door.
3 Eukaryoten De belangrijkste functie van de gencontrole bij multicellulaire organismen is er voor te zorgen dat de juiste genen tot expressie komen in de correcte cellen op een bepaald ogenblik van de ontwikkeling en cellulaire differentiatie. De regulatie van de transcriptie is hierbij het belangrijkste middel. Bij eukaryoten liggen de cis-werkende sequenties dikwijls vele kb verwijderd van de transcriptiestartplaats, dit in tegenstelling tot de prokaryoten waar deze meestal binnen de 60 bp gelegen zijn van de promoter die ze beïnvloeden. Eukaryoten bevatten drie typen nucleaire RNA polymerasen (multisubeenheden) met een relatief grote homologie met sommige subeenheden van de bacteriële RNA polymerasen. Het RNA polymerase I synthetiseert enkel pre-rRNA. RNA polymerase II synthetiseert de verschillende mRNA’s en sommige kleine nucleaire RNA’s die de RNA splicing katalyseren. RNA polymerase III synthetiseert tRNA’s, het 5S rRNA en verschillende kleine stabiele RNA’s.
3.1 Regulatorische sequenties 3.1.1 Promotor We onderscheiden verschillende promotor-achtige sequenties: 3.1.1.1 TATA box Genen die een hoge transcriptionele activiteit bezitten vertonen een sterk geconserveerde sequentie (TATA box) 25 à 35 bp stroomopwaarts van de initiatieplaats. Eén basepaarwijziging heeft een dramatisch effect op de initiatiefrequentie. Worden basen gedeleteerd tussen de TATA box en de initiatieplaats, dan zal deze laatste evenredig stroomafwaarts opschuiven. De TATA box speelt dus een rol voor de juiste positionering van het RNA polymerase II. 3.1.1.2 Initiator: Sommige genen bevatten een alternatief promotor element, de initiator. Deze kan sterk verschillen van gen tot gen. De volgende degeneratieve sequentie werd opgesteld: (5’)Y-Y-A+1-N-T/A-Y-Y-Y(3’) Initiatie start hier volgens de conventie ook op +1. Groep T
E. De Herdt
p. 4
Transcriptie en regulatie
3.1.1.3 CpG eilanden Transcriptie van genen met een initiator- of TATA-box sequentie start meestal op één welbepaalde plaats. Voor vele eiwitcoderende genen geldt echter dat de transcriptie kan starten op verschillende plaatsen binnen een regio van 20 - 200 bp, waardoor mRNA’s ontstaan met verschillende 5’ uiteinden. Deze genen met een relatief lage transcriptionele activiteit (coderend voor enzymen van het intermediair metabolisme = “housekeeping genes”) bevatten CG-rijke gebieden (20-50 bp) ongeveer 100 bp stroomopwaarts van de start regio. Deze CpG eilanden vormen een herkenningsplaats voor de SP1 transcriptiefactor.
3.1.2 Promoter-proximale elementen Deze bevinden zich ongeveer 200 bp verwijderd van de transcriptiestartplaats. Verschillende van deze elementen, elk +/- 20 bp groot, afzonderlijk of samen, beïnvloeden de transcriptie van het nabijgelegen gen.
3.1.3 Enhancer elementen Enhancer sequenties, meestal 100 - 200 bp groot, bevatten verschillende 8 - 20 bp controle elementen. Zij kunnen zich bevinden tot op tientallen kb verwijderd van de transcriptiestartplaats, zowel stroomop- als stroomafwaarts gelegen, binnen een intron of zelfs stroomafwaarts van het laatste exon van het gen.
3.2 Eukaryote transcriptie activatoren en repressoren Transcriptiefactoren zijn eiwitten welke binden met promoter-proximale elementen of enhancer sequenties; zij kunnen de transcriptie stimuleren (activatoren) of onderdrukken (repressors). Activatoren zijn modulaire eiwitten, welke één DNA-bindend domein bezitten en één of meerdere activatie domeinen. De verschillende domeinen zijn veelal met elkaar verbonden via flexiebele polypeptide segmenten; hierdoor kunnen activatie domeinen van verschillende activatoren met elkaar nog interageren zelfs als hun DNA bindend domein tientallen baseparen van elkaar verwijderd met het DNA gebonden zijn. Enhancersequenties bevatten meestal een cluster van bindingsplaatsen voor tal van transcriptiefactoren. De coöperatieve binding ervan zorgt voor de vorming van een “enhancesome”, waardoor het DNA meestal gebogen wordt. De meeste eukaryote repressors zijn ook modulair opgebouwd net als de activatoren. Ze bezitten ook een DNA bindend domein en één of meerdere repressor domeinen. Net als de activatoren kunnen ze een invloed hebben op de expressie van een gen, zelfs als dit verschillende kb verwijderd is van de repressor bindingsplaats. Meestal zal één of meerdere Q-helixen van het DNA bindend domein interageren met de ‘major’ groeve van de DNA helix. Vele transcriptiefactoren vormen trouwens heterodimeren waardoor het aantal regulatiemogelijkheden sterk toeneemt
Groep T
E. De Herdt
p. 5
Transcriptie en regulatie
De DNA bindende domeinen van transcriptiefactoren kunnen onderverdeeld worden in een beperkt aantal klassen: - homeodomein Het ‘homeodomein’ is een sterk geconserveerd domein bestaande uit 60 aminozuren dat teruggevonden wordt in een grote familie van transcriptiefactoren. Deze familie werd voor het eerst geïdentificeerd bij Drosophila als een groep van genen die wanneer ze ontregeld raken de transformatie veroorzaken van het ene lichaamsdeel in het andere (bv. poot i.p.v. antenne), een zogenaamde homeotische transformatie. Deze genklasse is zowel geïdentificeerd bij vertebraten als invertebraten en het homeodomein zelf bestaat uit een helix-turn-helix motief zoals ook reeds waargenomen bij bacteriële transcriptiefactoren. Alle homeodomein bevattende transcriptiefactoren zijn betrokken in de patroonaanleg van het organisme zoals bv. de ontwikkeling van de ruggegraat. - basic zipper (leucine zipper) Het leucine rits domein is noodzakelijk voor eiwitdimerisatie. Dit motief ontstaat doordat leucine residu’s voorkomen in een α helix regio met een tussenpauze van 7 aminozuren. De leucine zijketens kunnen op die manier interageren (hydrofobe interactie) met een ander leucine rits domein van een ander eiwit waardoor stabilisatie van homo- of heterodimerisatie optreedt. Het leucine rits domein is aanwezig in verschillende DNA bindende eiwitten waaronder c-Myc en C/EBP.
- helix-loop-helix (HLH) Het HLH domein is betrokken in eiwitdimerisatie en bestaat zelf uit twee α helix regio’s die gescheiden worden door een regio van variabele lengte die een lus vormt tussen de twee helixen. De helixen binden meestal met DNA sequenties die een tweevoudige symmetrie vertonen. Het HLH domein is hiervoor uitgerust met een N-terminale regio die veel basische aminozuren bevat (bHLH) waardoor interactie met het DNA versterkt wordt. Het HLH domein is eveneens noodzakelijk voor homo- en heterodimerisatie. HLH eiwitten die deze basische regio niet bevatten fungeren als repressor omdat ze wel heterodimeren kunnen vormen maar DNA binding inhiberen. Vb. repressor van het Tryp operon bij E. coli.
Groep T
E. De Herdt
p. 6
Transcriptie en regulatie
- zinkvingers Het zinkvinger domein is een DNA bindend motief dat via een ruimtelijke verdeling van cysteine en histidine residu’s toelaat dat de polypeptideketen een zink atoom bindt. Hierdoor ontstaat een vinger-achtige ruimtelijke structuur die zich kan nestelen in de grote groeve van de DNA helix. Eiwitten behorende tot deze klasse bevatten tussen de 2 en 10 dergelijke zinkvingers welke binden met het DNA. Het is het domein dat het meest aanwezig is bij DNA bindende eiwitten en er zijn dan ook meer dan 200 transcriptiefactoren gekend die dit motief bevatten. - Winged Helix Dit is een DNA bindend motief bestaande uit 3 N-terminale α helixen en een antiparallelle β sheet bestaande uit 3 ketens. Beide zijn zodanig over elkaar geplooid dat de helixen schijnbaar vleugels hebben gekregen, vandaar de benaming: winged-helix. Regulatory
Sequence
Protein
Recognized
(trans elememt)
(cis element)
Source
Motif* Genes regulated
ACF
Mammals
Serum albumin
Antennapedia
Drosphila
Homeotic gene
Mammals
MHC class 1, metallothionein, others
AP-3
Mammals
SV40 viral enhancer
AP-4
Mammals
Proenkephalin, others
APF
Mammals
Serum albumin
AP-2
CCCCAGGC
proenkephalin,
C/EBP
TGTGGAAG
Mammals
LZ
Serum albumin, alpha-globin
CREB (ATF)
TGACGTCA
Mammals
LZ
Somatostain, proenkephalin
Estrogen receptor GGTCANNNTGACC Birds, mammals ZnF
Vitellogenin, ovalbumin, others
Fos/Jun (AP-1)
Mammals
LZ
Growth regulation
GAL4
Yeast
ZnF
Enzymes of galactose metabolism
GCN4
Yeast
LZ
Genes encoding enzymes synthesizing amino acids
Znf
Prolactin, others
Glucocorticoid recptor
TGACTCA
GAACANNNTCTTC Mammals
GT-1
Plants
RuBP carboxylase, chlorophyl-binding protein
HSF
Mammals, others
Heat shock proteins
ITF
Mammals
Beta-interferon
MAT Proteins
Yeast
HTH
Mating type genes globin, serum proteins
albumin,
heat
NF-1 (CTF)
GCCAAT
Mammals
OCT-1 (OTF1)
ATTTGCAT
Mammals
HTH
snRNA, histone genes, others
OCT-2(OTF2)
ATTTGCAT
Mammals
HTH
Antibody genes
Pit-1
Mammals
HTH
Growth hormone
SP1
Vertebrates
ZnF
Wide variety
Groep T
E. De Herdt
shock
p. 7
Transcriptie en regulatie
3.3 Transcriptie initiatie complex van RNA polymerase II Het RNA polymerase II heeft nood aan verschillende algemene transcriptiefactoren om zich correct te kunnen positioneren en de transcriptie te initiëren (bv TFIID: nodig voor binding met TATA box). De helicase activiteit van de TFIIH subeenheid scheidt de twee DNA strengen, waardoor het Pol II de template streng kan transcripteren. Het carboxyterminale domein (CTD) van het Pol II wordt hierbij gefosforyleerd. Men schat dat er in vivo een 60-70 tal eiwitten betrokken zijn bij de vorming van het transcriptie initiatie complex, waardoor een geheel ontstaat ter grootte van een ribosoom.
3.4 Moleculair mechanisme van de transcriptie controle De eukaryote transcriptiecontrole werkt op drie niveau’s: - modulatie van de concentratie en/of activiteit van activatoren en repressoren; - wijziging van de chromatinestructuur gedirigeerd door activatoren en repressoren; - directe beïnvloeding van het transcriptie initiatie complex door activatoren en repressoren. Sterk gecondenseerde regio’s in het chromatine, waar het DNA moeilijk toegankelijk is voor transcriptiefactoren en er dus weinig genexpressie is, noemen we heterochromatine. Ter hoogte van de telomeren wordt heterochromatine gevormd onder invloed van de hypo geaceteyleerde N-termini van de histonen H3 en H4; ‘telomeer silencing’. Van sommige repressoren is bewezen dat zij deacetylase enzymen stimuleren; van activatoren kan men bewijzen dat deze acetylase enzymen stimuleren. De coöperatieve assemblage van het transcriptie initiatie complex vereist meestal verschillende activatoren. Elke cel moet zijn eigen specifieke set van activatoren bezitten om een bepaald gen te kunnen afschrijven. Sommige repressoren inhiberen de binding van activatoren op een competitieve wijze; andere interageren direct met algemene transcriptiefactoren of met activatoren. De activiteit van de superfamilie van de kernreceptoren wordt gereguleerd via vetoplosbare hormonen. De binding van deze receptoren met hun respectievelijk hormoon zorgt voor een conformatiewijziging waardoor de interactie met andere eiwitten wordt beïnvloed en er een translocatie plaatsvindt naar de kern waar het ligand-receptor complex zal binden met het responsieve element op het DNA (glucocorticoïde receptor, GR). Peptide en eiwithormonen kunnen niet doorheen de celmembraan migreren. Zij moeten eerst binden met een celoppervlakte receptor. Deze moet het bindingsignaal overbrengen naar eiwitten binnen in de cel. Dit proces noemen we signaal-transductie. Een veel gebruikt mechanisme hiervoor behelst fosforylatiereacties. Een voorbeeld wordt gegeven voor het effect dat γ-interferon (IFNγ ) binding veroorzaakt. Het JAK kinase wordt geactiveerd wanneer de IFNγ receptor dimerizeert door binding van IFNγ. Het geactiveerde JAK kinase fosforyleert een specifiek Tyrosine residu van het inactieve Stat1α monomeer in het cytoplasma. Het gefosforyleerde Stat1α dimerizeert op zijn beurt en transloceert naar de kern waar het bindt met responsieve elementen op het DNA waarbij de transcriptie van IFNγ gereguleerde genen bevorderd wordt.
Groep T
E. De Herdt
p. 8
RNA processing, - transport en translatie
RNA Processing, - transport en Translatie 1 Terminatie van de transcriptie De bacteriële RNA polymerasen beëindigen meestal de transcriptie op een Rhoonafhankelijke manier. Dit wil zeggen dat zij ter hoogte van een sequentie rijk aan U voorafgegaan door een stabiele stam-lus secundaire structuur de transcriptie zullen stoppen. Sommige terminatieplaatsen bij E.coli daarentegen vereisen het Rho eiwit dat via ATPase activiteit het 3' einde van de groeiende RNA keten losmaakt van het RNA polymerase. De drie verschillende eukaryote RNA polymerasen vertonen elk een verschillend terminatiemechanisme.: - RNA polymerase I (rRNA genen): stopt transcriptie wanneer een polymerasespecifieke terminatiefactor stroomopwaarts bindt; - RNA polymerase II (eiwitgenen): stopt 0.5-2 kb voorbij de poly(A) additieplaats, de terminatie is gekoppeld aan het proces waarbij het 3’ einde van het transcript geknipt en gepolyadenyleerd wordt; - RNA polymerase III (kleine RNA’s): stopt nadat een reeks U nucleotiden ingebouwd worden.
1.1 RNA processing Het pre-mRNA associëert zich met RNA bindende eiwitten waardoor hnRNP (heterogeen nucleair ribonucleoproteïnen) complexen ontstaan. Eukaryote mRNA precursoren worden gewijzigd via een 5' CAP-structuur, 3' klieving en polyadenylatie, en RNA splicing om introns te verwijderen. Nadien kan het rijpe mRNA getransporteerd worden naar het cytoplasma. Kort nadat de transcriptie van het eerste exon gestart is, wordt de CAP structuur snel op het pre-mRNA gezet. Een 7-methylguanosine residu wordt vastgehecht aan het 5' einde. Eerst wordt G vastgehecht, nadien volgen er één of meerder methylatiereacties waarbij Sadenosylmethionine als methylgroep donor fungeert. Bij de meeste eiwitcoderende genen is er 10-30 nucleotiden stroomopwaarts van de polyadenylatieplaats een geconserveerd polyadenylatiesignaal (AAUAAA) aanwezig. GUof U-rijke sequenties stroomafwaarts van de polyadenylatieplaats versterken de efficiëntie waarmee de 3' klieving en polyadenylatie zal gebeuren. De klieving en polyadenylatie wordt uitgevoerd door een multiproteïne complex waarvan het poly(A) polymerase (PAP) deel uitmaakt. Een nucleair poly(A)-bindend eiwit stimuleert het PAP en zorgt ervoor dat de reactie gestopt wordt nadat de staart ongeveer 200-250 adenine residu's bevat.
Groep T
E. De Herdt
p. 1
RNA processing, - transport en translatie De RNA splicing wordt uitgevoerd door een groot ribonucleoproteïne complex dat we het spliceosoom noemen. Verschillende snRNP's zijn hierbij betrokken die interageren met elkaar en met het pre-mRNA. Via twee transesterificatie reacties worden twee opeenvolgende exons aan elkaar gezet en het intron vrijgesteld als een lasso-structuur. Introns worden waarschijnlijk herkend door het feit dat zij allen bepaalde sequenties gemeenschappelijk hebben: - 5': GU - 3': AG - A ongeveer 20-50 b stroomopwaarts van het 3' einde; - een pyrimidinerijk (U, C) gebied van 15 b in een regio tussen 20-50 b stroomopwaarts van het 3' einde. Het zijn de aanwezige snRNA's (U1, U2, …) die waarschijnlijk via baseparing deze sequenties herkennen en de reactie catalyseren. Self-splicing introns van de groep II klasse worden teruggevonden in chloroplast - en mitochondriale genen van planten en fungi. Zij vertonen een sterk geconserveerde secundaire structuur die noodzakelijk is voor 'self-splicing'. De in het spliceosoom aanwezige snRNA's bezitten een gelijkaardige structuur en worden verondersteld evolutionair te zijn ontstaan uit deze groep II klasse.
1.2 Regulatie van de mRNA processing De expressie van genen wordt voornamelijk geregeld via beïnvloeding van de transcriptie door transcriptiefactoren (activatoren, inhibitoren) (zie vroeger!). Toch wordt in sommige gevallen de eiwitexpressie bijkomend geregeld via de beïnvloeding van RNA processing stappen. Deze vorm van regulatie komt vooral voor bij genen coderend voor eiwitten noodzakelijk voor de functionering van het zenuwstelsel bij vertebraten.
1.2.1 Beïnvloeding via 3' klieving en polyadenylatie De polyadenylatie van het pre-mRNA coderend voor het U1A eiwit wordt geïnhibeerd door binding van het U1A eiwit zelf met twee plaatsen stroomopwaarts van de poly(A) plaats in het U1A pre-mRNA. Hierdoor wordt het 3' uiteinde niet meer beschermd en wordt het premRNA snel afgebroken. Dit leidt op zijn beurt tot een verminderde synthese van het U1A eiwit, waardoor bovenvernoemde inhibitie van de polyadenylatie weer wordt opgeheven; er ontstaat terug functioneel mRNA en de expressie start terug. Deze vorm van aan/af schakelen van de expressie is vrij zeldzaam.
1.2.2 Beïnvloeding via splicing De alternatieve splicing van het pre-RNA geproduceerd door complexe transcriptie eenheden wordt veelal gereguleerd. Hierdoor kunnen, van éénzelfde gen, verschillende mRNA's gevormd worden, in verschillende gedifferentiëerde cellen of op verschillende tijdstippen. Dit is bv. het geval bij het 75 kb fibronectin gen. Bij fibroblasten worden andere exonen teruggevonden in het rijpe mRNA dan bij levercellen. Groep T
E. De Herdt
p. 2
RNA processing, - transport en translatie
1.2.3 Beïnvloeding via 'RNA editing' Tijdens 'RNA editing wordt de nucleotidesequentie van een pre-mRNA gewijzigd in de kern. Bij vertebraten gaat dit meestal om kleinschalige wijzigingen, bv de deaminatie van een base in de mRNA sequentie waardoor een ander aminozuur ingebouwd wordt of een ander eiwit ontstaat zoals in het geval van het Apo-B100 (lever) en Apo-B48 (darm). Beide eiwitten zijn betrokken in de transfer van vetten naar het serum. In de darm gaat het om de vorming van chylomicronen; in de lever van LDL partikels die door andere lichaamscellen kunnen opgenomen worden om aan hun behoefte aan vet en cholesterol te voldoen. Daarom bevat het Apo-B100 (lever) ook een domein dat kan binden met de LDL receptor aanwezig op de celmembraan. In de darm wordt in het primaire transcript een C gedeamineerd tot U waardoor een stopcodon ontstaat. Het LDL-receptor bindend domein is daardoor niet aanwezig in Apo-B48. Chylomicronen dienen immers enkel om de vetten van de darm naar de lever te transporteren. RNA editing komt veel voor in de mitochondria van protozoa en planten en in chloroplasten. In deze organellen wordt ruwweg de helft van de gesynthetiseerde mRNA moleculen sterk gewijzigd ten opzichte van het primaire transcript.
1.2.4 Beïnvloeding van de RNA stabiliteit De concentratie van een bepaald mRNA wordt bepaald door de synthesesnelheid en de degradatiesnelheid. Bij gelijke transcriptiesnelheid, zal de steady-state concentratie van een mRNA dat snel wordt afgebroken lager zijn dan van een stabiel mRNA. De stabiliteit van een mRNA bepaalt tevens hoe snel de synthese van het overeenkomstige eiwit kan stilgelegd worden. De meeste bacteriële mRNA's zijn erg onstabiel met een typische halfwaardetijd van enkele minuten. Hierdoor kan de bacteriecel snel inspelen op wisselende omgevingsfactoren. Cellen van multicellulaire organismen daarentegen leven in een vrij constante omgeving (extracellulair vocht, bloed) en voeren meestal een beperkte set van functies uit gedurende een bepaalde periode van dagen, maanden of zelfs levenslang (zenuwcellen). Daarom bezitten de mRNA's van de hogere eukaryoten halfwaardetijden van verschillende uren. De stabiliteit van verschillende mRNA's in het cytoplasma kan sterk variëren. Niettegenstaande vele eukaryote mRNA's vrij stabiel zijn, hebben sommige toch een zeer korte halfwaardetijd. Deze laatste mRNA's, meestal coderend voor eiwitten die kortstondig dienen aanwezig te zijn, bezitten veelal herhaalde copieën van een AUUUA sequentie in het 3' niet-getransleerde gedeelte. De manier waarop deze de afbraak stimuleren is niet geweten. Eukaryote cellen kunnen de degradatiesnelheid van sommige mRNA's regelen. Bijvoorbeeld in het geval van het transferrine-receptor mRNA zal een specifiek RNA bindend eiwit binden met het 3' niet-vertaalde deel en hierdoor wordt het mRNA beschermd tegen degradatie gecatalyseerd door AU rijke sequenties. De activiteit van dit eiwit wordt bepaald door de intracellulaire ijzer concentratie; is deze laag dan zal het eiwit binden met het mRNA en dit laatste beschermen, waardoor de transferrine receptor wordt bijgesynthetiseerd. Hierdoor zal de cel gemakkelijker transferrine kunnen opnemen als bron voor ijzer. Groep T
E. De Herdt
p. 3
RNA processing, - transport en translatie
1.3 Processing van rRNA en tRNA In snel groeiende zoogdiercellen bestaat 80 % van het geïsoleerd RNA uit rRNA en 15 % uit tRNA. Het eiwitcoderende mRNA is dus maar een kleine fractie van het totale RNA. Net zoals de pre-mRNA's worden de pre-rRNA's en pre-tRNA's uitgebreid gemodifiëerd na synthese. De pre-rRNA genen komen voor als tandem herhalingen, met tussenin nietgetranscripteerde regio's van variabele lengte (2kb: kikker / 30 kb: mens). De genomische regio's coderend voor de overeenkomstige rRNA moleculen zijn steeds op dezelfde manier georganiseerd: dwz van 5' →3': 18S, 5.8S en 28S. Het primaire transcript hiervan is veel langer dan de som van de individuele rijpe rRNA's. Er ligt namelijk, afhankelijk van het organisme, een wisselende hoeveelheid getranscripteerd spacer DNA tussen de individuele genen. Bij hogere eukaryoten gebeurt de synthese van een 45 S rRNA precursor door het RNA polymerase I en de navolgende processing in de nucleolus, een regio binnen de kern waar de rRNA genen (meestal verspreid over verschillende chromosomen) samen komen te liggen. Splicing en klieving van getranscripteerde spacer sequenties leidt tot volwassen 28S, 18S en 5.8S rRNA's die naar het cytoplasma getransporteerd worden om zich daar uiteindelijk te associëren met ribosomale eiwitten. De RNA processing wordt gecatalyseerd door snoRNA's (small nucleolaire RNA moleculen). Het 5S rRNA wordt gesynthetiseerd in de kern door het RNA polymerase III en hoeft niet veel gemodifiëerd te worden vooraleer het zich associëert met andere rRNA's en eiwitten ter vorming van de grote ribosomale subeenheid (60S). De eerste catalytische RNA moleculen (ribozymen) die ontdekt werden, waren de groep I introns in het rRNA van Tetrahymena. De zelf-splicing die optreedt bij de groep I en II introns en de intronsplicing die gecatalyseerd wordt door het spliceosoom behelst steeds twee gelijkaardige transestereficatie reacties. De transcriptie van de tRNA genen door het RNA polymerase III en de processing van het primaire transcript vindt plaats in het nucleoplasma (kern). Bij alle pre-tRNA's wordt een 5' sequentie verwijderd, wordt -CCA toegevoegd aan het 3' einde en worden verschillende interne basen gemodifiëerd. Sommige pre-tRNA's bevatten nog een klein intron ter hoogte van de anticodon lus dat ook nog moet verwijderd worden. De ribosomale subeenheden en de afgewerkte tRNA's worden, meestal gecomplexeerd met eiwitten, naar het cytoplasma getransporteerd doorheen de kernporiën.
Groep T
E. De Herdt
p. 4
RNA processing, - transport en translatie
1.4 Addendum over microRNA’s microRNA Technology News: microRNA: Tiny Yet Powerful Lynne Lederman BioTechniques® January 2006 Volume 40, Number 1: pp 23-25 http://www.biotechniques.com/default.asp?page=article_archive&subsection=article_displ ay&display=full&year=&issue=&id=112107&prevpage=current Tiny Yet Powerful microRNA (miRNA) are one of a group of small, noncoding, regulatory RNA; approximately 22 nucleotides (nt) in length, they regulate posttranscriptional gene expression by repressing or breaking down messenger RNA (mRNA). They occur in plants, invertebrates, and vertebrates, including humans. In a commentary in Cell last year, Gary Ruvkun, Bruce Wightman, and Ilho Ha described the technical roadblocks they and colleagues have faced along a 20-some year journey of identifying miRNA and determining their function. Overtime, the discovery and development of molecular techniques have revealed increasing numbers of miRNA families and are allowing researchers to identify their target genes, as well as the mechanism by which they are processed from larger precursor transcripts to their tiny, functional selves. Small Worms, Abundant Information The existence of a detailed analysis of Caenorhabditis elegans cell lineage and developmental genetics, along with a collection of mutants, including some that caused developmental timing defects, played a role in identifying the first miRNA. Victor Ambros was working on lin-4, a negative regulator of developmental timing, in Robert Horvitz' laboratory, while Gary Ruvkun was working on lin-14, a heterochronic gene, which temporally regulated the fate of cells during larval development. lin-4 encoded an RNA but did not appear to have an open reading frame. lin-14 looked like a protein-coding sequence (in fact, it encodes a novel transcription factor) with a long 3′ untranslated region. They eventually discovered that lin-4 RNA was complementary to a region in the lin-14 3′ region, which suggested that lin-4 might be binding to lin-14. lin-4, the first known miRNA, progressively represses the translation of lin-14 mRNA, the first miRNA target. Subsequently, Frank Slack, Associate Professor, Department of Molecular, Cellular, and Developmental Biology, Yale University, New Haven, CT, joined Ruvkun's lab and worked on let-7, which was the second miRNA and which, like lin-4, is involved in developmental timing. Although in the same pathway as lin4 and lin-14, conservation of the let-7 sequence in other organisms, including fruit flies and other invertebrates and humans, suggested that this system had wide-reaching importance beyond C. elegans. In animals, there may be sequence differences of seven to eight or more nucleotides between an miRNA and its targets, making target prediction difficult. In addition, a single miRNA could have several to hundreds of different targets. Slack says there may be 120 to 500 miRNA in C. elegans, "depending on who you believe. A lot is known about let-7, and there are validated targets in C. elegans." Slack suggests that looking for conserved regions can Groep T
E. De Herdt
p. 5
RNA processing, - transport en translatie allow one to design rules to identify new targets using a bioinformatics approach, "although not every miRNA works the same." The rules can be validated in C. elegans before the human or other homologues are examined. C. elegans shares 60% of genes with humans, and there are at least 30 to 40 C. elegans miRNA conserved in other organisms that have been around since the last common ancestor of C. elegans and the mouse. Looking at Trees miRNA in plants differs from those in other classes of organisms in key ways. Vincent Chiang, Professor, Department of Forestry, North Carolina State University, Raleigh, points out that although in animal systems one may detect both the precursor transcript and the mature miRNA, in plants, for reasons that are unknown, the precursor is transient, and only the mature 21-to 24-nt-long miRNA is detectable. Also, in plants, miRNA have almost perfect complementarity to their targets, so it is easier to predict targets through a computational approach. Chang notes "hybridization methods (e.g., microarrays and Northern blots) detect collective expression of an miRNA family, but you can't tell which family member contributes the most to expression." He and colleagues have developed a real-time PCR technique that detects mature miRNA in plants. "In principle, it is simple: add a poly(A) tail to make small sequences longer, then treat the longer molecule as usual in a quantitative PCR assay. Our technique varies the annealing temperature of the PCR, so it can distinguish miRNA differing by only one nucleotide in the sequence. It is very useful to determine quantitative expression of individual miRNA and can differentiate the most expressed family member. I think this is a very important step in the linear path from discovery to functional analysis," he concludes. The existence of many Arabidopsis mutants created for other purposes may be useful for determining which miRNA targets a particular mutated gene in this species. "Conservation is another issue," says Chiang, whose work focuses on trees. The poplar, Populus trichocarpa, is the only tree species with a fully sequenced genome. Half of the poplar miRNA are not present in Arabidopsis. Similarly, 50% of human miRNA are not conserved in other animals. Chiang expects even more species-specific miRNA will be identified as techniques continue to become more sophisticated. Slack concurs that miRNA have to be expressed at high enough level to be detectable. "If an miRNA is only in one cell type at a certain point in development, you won't see it unless you're looking for it." In trees, where there are no transgenic or mutant organisms, functions of miRNA are being predicted from the function of their target genes. The ones that have been identified are largely related to disease resistance (e.g., crown gall disease in pine, a species important for pulp and paper production). miRNA may also be involved in tree responses to mechanical stress, such as wind force and snow weight, as well as to the load pressure exerted by their own crowns. More Mouse and Man Markus Stoffel, Robert and Harriet Heilbrunn Professor, Rockefeller University, New York, NY, believes that most of the miRNA that are highly expressed have been identified. "The big question," he says, "is, what is their function? For most, it is a big black box, especially in mammals." Doing knockouts in this system is a "slow, expensive process, and tricky. miRNA affect many encoded genes, there is redundancy, they occur on more than one chromosome, some miRNA are intronic, and some are in polycistronic clusters. The precursor is one big Groep T
E. De Herdt
p. 6
RNA processing, - transport en translatie transcript that is cut into pieces, so it's hard to knock it out genetically and affect individual miRNA." His group's approach is to silence miRNA using antisense RNA, which they call antagomirs, stabilized by chemical modification to render them resistant to RNases and allow them to enter cells. They have shown that silencing miR-122, an abundant, liverspecific miRNA, appeared to down-regulate cholesterol synthesis genes. "This is proof of principle," Stoffel says. "miRNA look like perfect targets, but we still need to find out what they do. Their role in disease is still not clear, but I would be surprised if miRNA did not play a role in disease." Future Directions Chiang is looking at miRNA to understand how wood is formed in trees. With only one tree genomic sequence complete, "the pine people are working on getting support for sequencing for that species," he says. "They are hoping for an industry and government collaboration for more resources, because the pine genome is 50 times bigger than the human genome." He and collaborators are working on pine genomics based on expressed sequence tag (EST) sequences. There are about 400,000 ESTs available, although "they are not ideal to discover miRNA without a fully sequenced genome," he says, "so the field is moving slowly." Only eight or nine of the hundreds to thousands of plant miRNA have a proven function, so there is plenty to be discovered. Slack expects miRNA will eventually play a role in curing or at least alleviating symptoms of cancer and that this will draw on experience with both anti-sense and small interfering RNA (siRNA) techniques. Because miRNA are in essence natural products of the cell, "using miRNA to usurp the natural process instead of forcing unnatural antisense molecules" to do so will be more effective, he predicts. "miRNA microarrays are so hot because miRNA by nature are regulatory molecules, present in discrete places at discrete times. So, miRNA arrays may be better diagnostic tools to detect tissue types than standard microarrays, for example, to determine the tissue type of a metastatic tumor." Slack points out that in the early days of the antisense and monoclonal antibody revolution, there was excitement about their potential to treat many diseases. "Few therapeutics in these classes have made it into the clinic, but those that have are billion dollar drugs. Few miRNA-based therapeutics will probably make it. In 10 years, we may see the first drugs; in 20 years, they will be more common. However, the field changes so fast they might be successful earlier, or we may find they cause side effects." This is because miRNA, at least in animals, target many genes. Therefore, rather than use one miRNA to knockout one gene, one might be able to identify patients whose disease is due to deletions or low expression of miRNA resulting in altered regulation of the many different genes it controls. Whether miRNA will play a role in diagnostics, therapeutics, or possibly even gene therapy, remains to be seen.
Groep T
E. De Herdt
p. 7
RNA processing, - transport en translatie
2 Translatie of eiwitsynthese 2.1 Genetische code De genetische informatie van het DNA wordt via het transcriptieproces omgezet in mRNA. Ze wordt gelezen als een triplet code; het is dus erg belangrijk te weten welk van de drie mogelijke leesramen er gebruikt wordt, aangezien elk leesraam een totaal verschillende aminozuurvolgorde zal opleveren. De genetische code is praktisch universeel in alle gekende organismen wat er waarschijnlijk op wijst dat het leven op aarde slechts éénmaal ontstond. Sommige codons verschillen in vele mitochondriën, bij sommige protozoa en bij enkele andere organismen. Meestal betreft het echter een stopcode die gelezen wordt als een aminozuur en gaat het niet om een verwisseling van het ene aminozuur voor het andere. Men neemt aan dat deze uitzonderingen louter het gevolg zijn van evolutie; grootschalige wijzigingen in de genetische code kunnen immers niet getolereerd worden. AUG is de code voor Methionine, maar fungeert ook als startcodon. UAA, UAG en UGA zijn stopcodons. De genetische code is ook degeneratief, dwz elk aminozuur bezit meer dan één code (uitz. Met/Trp); ze is ook perfect, dwz elke code is uniek en codeert nooit voor twee verschillende aminozuren. Veel aminozuren bezitten meer dan één code, waarbij de grootste variatie gesitueerd is bij de derde base van het codon. We noemen deze de Wobble base (zie later). De correcte ontcijfering van de mRNA code naar een bepaalde aminozuurvolgorde is het gevolg van: - de koppeling van het juiste aminozuur met het juiste tRNA: deze reactie wordt gecatalyseerd door het aminoacyl-tRNA synthetase enzyme; - de binding tussen de mRNA triplet code en het anticodon van het opgeladen AZtRNA. Het aminoacyl-tRNA synthetase enzyme herkent het tRNA aan zijn unieke driedimensionele configuratie (L-vorm) en koppelt het juiste aminozuur aan het 3' -CCA uiteinde. Het aminozuur wordt hiervoor eerst geactiveerd door ATP tot een aminoacyladenylaat residu. De baseparing tussen codon en anticodon kan ter hoogte van de derde base van het codon afwijken van de klassieke. Indien de eerste base van het anticodon bijvoorbeeld een inosine is, kan deze baseparing aangaan met een C,A of U ter hoogte van de derde base van het codon. Het blijkt dus dat de baseparing tussen anticodon en codon hierdoor iets minder specifiek is dan verwacht kan worden. Dit heeft echter tot gevolg dat: - er een besparing kan zijn op het aantal benodigde tRNA moleculen; één tRNA kan immers meerdere codons herkennen; - één code eventueel kan gelezen worden door meer dan één tRNA; - de translatie sneller kan verlopen aangezien de binding tussen codon en anticodon minder sterk is en dus vlug kan dissociëren. Groep T
E. De Herdt
p. 8
RNA processing, - transport en translatie
2.2 Ribosomen De globale structuur van de ribosomen is gelijkaardig bij alle organismen. Ze bestaan steeds uit twee subeenheden: samenstelling prokaryoot: 70S eukaryoot: 80S
grote subeenheid 50S 23S rRNA (3000b) + 5S rRNA ~34 eiwitten 60S 28S rRNA (5000b) + 5S rRNA + 5,8S rRNA ~40 eiwitten
kleine subeenheid 30S 16S rRNA (1500b) ~21 eiwitten 40S 18S rRNA (1800b) ~30 eiwitten
De rRNA's bezitten een typische drie-dimensionele configuratie met verschillende stam-lus structuren en bindingplaatsen voor eiwitten, mRNA en tRNA.
2.3 Initiatie, elongatie en terminatie 2.3.1 Initiatie Elke cel bevat twee tRNA's voor Met. Eén ervan, tRNAiMet fungeert enkel voor de vorming van het initiatiecomplex: het wordt gekoppeld met methionine en bindt nadien met het initiatiecodon AUG ter hoogte van de P plaats op het ribosoom. Bij bacteriën wordt het tRNA gebonden methionine, geformyleerd (fMet- tRNAifMet ), waardoor het eerste aminozuur dat in elk eiwit ingebouwd wordt een fMet is. Het mechanisme waarbij de kleine ribosomale subeenheid het startcodon localiseert op het mRNA verschilt bij bacteriën en eukaryoten. Bij bacteriën is geweten dat de ShineDelgarno sequentie gelegen stroomopwaarts van het initiatiecodon op het polycistronische mRNA een rol speelt. Deze bindt met het 16S rRNA van de kleine ribosomale subeenheid. Bij eukaryoten wordt meestal het eerst tegengekomen AUG als startcodon aanzien. Soms helpt een bepaalde sequentiecontext: A/GCCA/GCCAUGA/G in de nabijheid van het AUG initiatiecodon met de juiste positionering van de ribosomale subeenheid. Initiatie kan dus samengevat worden als volgt: - een ribosoom dissociëert in zijn twee subeenheden; - een pre-initiatiecomplex wordt gevormd tussen: de kleine subeenheid - GTP initiatiefactor(en) - fMet- tRNAifMet - mRNA; - associatie met de grote ribosomale subeenheid. GTP hydrolyse en de betrokkenheid van verschillende initiatiefactoren is vereist tijdens de initiatie. Groep T
E. De Herdt
p. 9
RNA processing, - transport en translatie
2.3.2 Elongatie De elongatie van de eiwitketen verloopt in drie stappen die steeds herhaald worden. Een aminoacyl-tRNA bindt met de A-plaats op het ribosoom en gaat baseparing aan met het volgende codon in het mRNA. De groeiende peptideketen, die vastgehecht is aan het tRNA (gebonden op de P-plaats), wordt getransferreerd naar de aminogroep van het aminoacyltRNA (vastgehecht op de A-plaats). Dit proces noemen we de transpeptidase activiteit en deze zorgt dus voor de vorming van een nieuwe peptidebinding. De geëlongeerde eiwitketen bevindt zich nu op het tRNA gebonden met de A-plaats. Deze moet vrijgemaakt worden om het volgende aminoacyl-tRNA te kunnen ontvangen. Via translocatie verplaatst het ribosoom zich drie nucleotiden, het polypeptide-tRNA bevindt zich nu op de P-plaats. Het lege tRNA verplaatst zich naar de E-plaats en dissociëert van het ribosoom. Peptidevorming en translocatie vereisen de hydrolyse van GTP en de betrokkenheid van heel wat elongatiefactoren.
2.3.3 Terminatie Terminatie komt tot stand doordat terminatiefactoren binden met de stopcodons en het ribosoom vervolgens destabiliseren zodat de polypeptideketen vrijkomt. Opvouwing van de peptideketen tot zijn natieve 3-D structuur gebeurt met behulp van andere eiwitten: 'chaperon'-eiwitten genaamd.
2.3.4 Polysomen Het mRNA wordt meestal gelijktijdig gecomplexeerd met verschillende ribosomen en vormt daardoor een soort van ringvormige structuur: polysoom. Alle ribosomen vertalen het mRNA. Als een ribosoom het einde van het mRNA bereikt, dissociëert het, maar zal het zich snel terug assembleren ter hoogte van het 5' einde. Deze circulaire ribosoom pathway versnelt aanzienlijk de efficiëntie van eiwitsynthese.
2.4 Eiwitsynthese inhibitoren De werking van verschillende antibiotica en van een aantal toxines is gebaseerd op de inhibitie van de eiwitsynthese. Alle stadia gaande van initiatie tot terminatie zijn mogelijke doelwitten om te inhiberen.
Groep T
E. De Herdt
p. 10
Downloaded from bmj.com on 8 November 2005
RNA interference Julian Downward BMJ 2004;328;1245-1248 doi:10.1136/bmj.328.7450.1245
Updated information and services can be found at: http://bmj.com/cgi/content/full/328/7450/1245
These include:
References
This article cites 17 articles, 5 of which can be accessed free at: http://bmj.com/cgi/content/full/328/7450/1245#BIBL 4 online articles that cite this article can be accessed at: http://bmj.com/cgi/content/full/328/7450/1245#otherarticles
Rapid responses
2 rapid responses have been posted to this article, which you can access for free at: http://bmj.com/cgi/content/full/328/7450/1245#responses You can respond to this article at: http://bmj.com/cgi/eletter-submit/328/7450/1245
Email alerting service
Topic collections
Receive free email alerts when new articles cite this article - sign up in the box at the top right corner of the article
Articles on similar topics can be found in the following collections Pharmacology and toxicology (337 articles) Drugs: infections (268 articles) Genetics (3559 articles)
Notes
To order reprints of this article go to: http://www.bmjjournals.com/cgi/reprintform To subscribe to BMJ go to: http://bmj.bmjjournals.com/subscriptions/subscribe.shtml
Downloaded from bmj.com on 8 November 2005
Clinical review
Science, medicine, and the future RNA interference Julian Downward
Over the past decade “RNA interference” has emerged as a natural mechanism for silencing gene expression. This ancient cellular antiviral response can be harnessed to allow specific inhibition of the function of any chosen target genes, including those involved in causing diseases such as cancer, AIDS, and hepatitis. RNA interference is already proving to be an invaluable research tool, allowing much more rapid characterisation of the function of known genes. More importantly, the technology considerably bolsters functional genomics to aid in the identification of novel genes involved in disease processes. But can RNA interference be used as an effective therapeutic strategy? Many people in the biotechnology industry are betting that it can, but first considerable problems relating to delivery to target cells will have to be solved. This problem has proved the undoing of previous wonder technologies such as gene therapy and antisense. This review discusses the promises and pitfalls of RNA interference in research and treatment. This article is based on a review of the literature on RNA interference and post-transcriptional gene silencing appearing in the PubMed database, along with personal experience of working in this field for the past four years. It also draws on consensus views expressed at several international conferences on RNA interference in 2003.
Summary points RNA interference is an ancient natural antiviral mechanism that directs silencing of gene expression in a sequence specific manner RNA interference can be exploited artificially to inhibit the expression of any gene of interest
RNA interference systems could be used clinically to suppress gene expression as a therapeutic strategy in many diseases characterised by elevated gene function
The first hints of the existence of the gene silencing mechanism that is now called RNA interference emerged from work on the genetic modification of plants in the late 1980s. Attempts to deepen the violet hue of petunias by expressing higher levels of an enzyme involved in the synthesis of the pigment unexpectedly resulted in the appearance of many white flowers. The introduction of extra copies of the gene had somehow caused a decrease in its expression rather than the anticipated increase.1 2 For some time this remained an unexplained oddity. It was soon joined by similar observations in the filamentous fungus Neurospora crassa and then the nematode worm Caenorhabditis elegans. Once the large community of developmental biologists working on the worm became involved, the pace quickened. In 1998 the key observation was made that
An ancient antiviral mechanism Over the next few years the mechanism underlying RNA interference was established from work on diverse organisms, especially the worm and the fruit fly.4 RNA interference was considered to be an evolutionarily ancient mechanism for protecting organisms from viruses. Many viruses have RNA, rather than DNA, as their genetic material and go through at least one stage in their life cycle in which they make double stranded RNA. All multicellular organisms possess a conserved protein machinery that recognises double stranded RNA. An enzyme called dicer degrades this into small segments around 20 nucleotide pairs in length (fig 1). Not content with just degrading the viral double stranded RNA, the cell uses an enzyme complex called RISC (RNA induced silencing complex) to use the
bmj.com
BMJ 2004;328:1245–48
Libraries of RNA interference molecules have been constructed that allow the analysis of gene function on a genome-wide scale
Current understanding of RNA interference
22 MAY 2004
downward@ cancer.org.uk
The principal systems for achieving RNA interference are short synthetic double stranded RNA molecules and gene expression vectors that direct their production in the cell
led to the coining of the term “RNA interference.”3 Fire and Mello showed that double stranded RNA was able to direct the degradation of messenger RNA (mRNA) with sequence complementary to one or other strand.
BMJ VOLUME 328
Cancer Research UK London Research Institute, 44 Lincoln’s Inn Fields, London WC2A 3PX Julian Downward principal scientist
1245
Downloaded from bmj.com on 8 November 2005
Clinical review
Double stranded RNA (eg, viral genome) Dicer
Other antiviral responses (eg, interferon production)
Small interfering (si) RNA fragments
about 20 nucleotide pairs in length, when introduced into mammalian cells, directly engage RISC and promote silencing of the expression of genes with the same sequence (fig 1). Parsimonious nature had kept RNA interference as a back-up system even after the evolution of the interferon system.
RISC
RNA interference as a research tool
siRNA bound to RISC
Complementary mRNA (eg, transcribed from viral gene) Single strand of siRNA RISC degrades mRNA with complementary sequence to siRNA
Fig 1 Natural mechanism of RNA interference. The appearance of double stranded (ds) RNA within a cell—for example, as a result of viral infection—triggers an RNA interference response. The cellular enzyme dicer binds to the dsRNA and cuts it into short pieces of 20 or so nucleotide pairs in length known as small interfering RNAs or siRNAs. These bind to a cellular enzyme complex RISC (RNA induced silencing complex) that uses one strand of the siRNA to bind to single stranded RNA molecules such as mRNA of complementary sequence. RISC then degrades the mRNA, thus silencing expression of the viral gene. In mammals, other antiviral responses to dsRNA also exist
short pieces of RNA produced by dicer as a template to seek out and destroy single stranded RNA with the same sequence, such as mRNA copies used by the virus to direct synthesis of viral protein. Together, dicer and RISC make up the RNA interference system whereby double stranded RNA is recognised and used as a guide to prevent expression of similar sequences by destroying mRNA transcripts, a process sometimes termed post-transcriptional gene silencing. As well as being involved in battling viruses, RNA interference is also probably important in maintaining order in the genome by suppressing the movement of mobile genetic elements such as transposons and repetitive sequences. The RNA interference machinery may also have a role in fine tuning normal cellular gene expression.5 RNA interference in mammals Most of the work described above was done in invertebrates. Initial attempts to induce RNA interference responses in human cells were unsuccessful. Introduction of double stranded RNA into mammalian cells induces a powerful set of quite different antiviral responses characterised by production of interferons, resulting in inhibition of all gene expression and rapid cell death, limiting the ability of a virus to replicate and spread throughout the organism. It seemed that RNA interference might have been lost all together, replaced by the more recently evolved interferon system that is not found in invertebrates. However, there were hints that RNA interference might still exist in mammals. The breakthrough came when short, double stranded RNA molecules of less than about 30 nucleotide pairs long were shown to be unable to induce the interferon response. As the global shut down of gene expression no longer occurred with these “small interfering RNAs” (siRNAs), they could be seen to be capable of directing a sequence specific degradation of homologous mRNA in a manner very similar to that in plants, worms, and flies.6 siRNAs of 1246
Long before RNA interference had been established as operating in mammalian cells, researchers working on worms had recognised the great power that it promised as a research tool. The sequencing of the genomes of humans and most commonly studied model organisms has led to a situation in which the identities of very large numbers of genes are known but little is understood about their function. A cheap and easy way of ablating gene function holds out massive hope for improving our ability to untangle the complex regulatory pathways that control cellular behaviour in health and disease. RNA interference allows analysis in a matter of days of the effect of loss of gene function at the cellular level that would have taken several months or even years by previous methods such as homologous recombination. Targeting individual genes RNA interference is now commonly used in biological and biomedical research to study the effect of blocking expression of a given gene. This has proved particularly easy in C elegans, where simply feeding the worms with bacteria expressing the double stranded RNA has been found to cause RNA interference throughout the tissues of the worm. Researchers working on mammalian systems have had more difficulties. Most of the work has concentrated on introducing small interfering double stranded RNAs into cells in tissue culture. A popular method has been to make these synthetically in vitro. However, as mammalian cells will not readily take up naked nucleic acids, the RNAs have to be complexed with agents such as cationic lipids to allow them to enter the cells. Synthetic siRNAs can cause efficient inhibition of expression of homologous genes, although only for a few days. As the effect is rarely complete, it is generally termed a “knock down” to distinguish it from the “knock out” achieved by deletion of the gene. Another way of introducing siRNAs into cells is to use expression vectors such as engineered viruses to direct expression of short RNA sequences that will form hairpins owing to the presence of complementary sequences of about 20 nucleotide pairs (fig 2). These short hairpin RNAs are then processed within the cell to remove the loop and form siRNA duplexes. Viral vector mediated RNA interference can result in long term inhibition of target gene expression. Retroviruses, adenoviruses, and lentiviruses have all been used as vehicles for RNA interference constructs. Although a big improvement on previous methods, RNA interference has its limitations. Not every sequence works—most researchers get a success rate of about one in three. In addition, although the effects are generally thought to be highly sequence specific, some question marks remain as to whether or not some of BMJ VOLUME 328
22 MAY 2004
bmj.com
Downloaded from bmj.com on 8 November 2005
Clinical review the effects seen are “off target.” Some residual activation of the interferon system has been reported, as well as degradation of closely related, but non-identical, mRNAs.
Synthetic small interfering (si) RNA oligonucleotides
Pathological processes Cell membrane
RNA interference as a functional genomics tool DNA microarray technology has now enabled the level of expression of every gene in the genome to be determined under any condition. This has led to a vast accumulation of information about genes whose expression is significantly altered in various disease states. For example, huge databases have been established of genes that are aberrantly regulated in cancers. In a few cases this has resulted in the identification of key genes involved in the formation of the tumour and provided important new therapeutic targets. However, most of the time the pattern of gene expression is far too complex to allow identification of the relatively small number of misexpressed genes that are involved in causing or maintaining the disease rather than the much larger number that are innocent bystanders. The ability of RNA interference to provide relatively easy ablation of gene expression has opened up the possibility of using collections of siRNAs to analyse the significance of hundreds or thousands of different genes whose expression is known to be up-regulated in a disease, given an appropriate tissue culture model of that disease. Perhaps more important still is the possibility of using genome-wide collections of siRNAs, whether synthetic or in viral vectors, as screening tools. This has attracted much attention recently from both academic and industrial researchers. The libraries of RNA interference reagents can be used in one of two ways. One is in a high throughput manner, in which each gene in the genome is knocked down one at a time and the cells or organism scored for a desired outcome—for example, death of a cultured cancer cell but not a normal cell. Owing to the very large numbers of assays needed to look at the involvement of all 35 000 or so genes in the human genome, this approach is very labour intensive. The approach has been used successfully on a relatively small scale to investigate cell death signalling by TRAIL (tumour necrosis factor related apoptosis inducing ligand), an agent that might have therapeutic potential against various cancers.7 8 In addition, the approach was used to identify the familial cylindromatosis tumour suppressor gene (CYLD) as a de-ubiquitinating enzyme in the nuclear factor-B pathway.9 As aspirin is known to target this pathway, this work suggested a novel therapeutic approach to this rare inherited cancer. The other approach is to use large pools of RNA interference viral vectors and apply a selective pressure that only cells with the desired change in behaviour can survive. The identity of the genes knocked down in the surviving cells can then be identified by sequencing the RNA interference vectors that they carry. This method is being used to investigate genes involved in neurodegenerative diseases, diabetes, and cancer. It has recently been used successfully to identify several novel components of the p53 tumour suppressor gene signalling pathway.10 Both approaches show considerable promise in identifying novel genes that may make important therapeutic targets for inhibition either by BMJ VOLUME 328
22 MAY 2004
bmj.com
siRNA-RISC complex
siRNA
Protein
mRNA
Nucleus Short hairpin RNA
Gene that causes disease
Viral vector encoding short hairpin RNA
Fig 2 Targeting disease by RNA interference. Diseases caused by aberrant gene expression include viral diseases and cancer. A gene implicated in causing the disease state can be silenced by RNA interference. Two of the most commonly used methods for artificially inducing RNA interference are shown here. Synthetic small interfering RNA molecules can be introduced into cells by using reagents such as cationic lipids to promote uptake across the cell membrane. Alternatively, engineered viral vectors can be used to deliver an expression construct to the cell, which will direct the production of a short hairpin RNA. This is then processed within the cell to form an siRNA. The siRNAs from either route then use the cellular RNA machinery to degrade mRNA with complementary sequence, in this case chosen to target the gene that causes the disease
conventional drug discovery methods or, more controversially, by RNA interference itself.
RNA interference as a novel therapeutic agent RNA interference clearly has much promise in the laboratory, but how about in the clinic? In principle, RNA interference might be used to treat any disease that is linked to elevated expression of an identified gene. This might make it suitable for combating viral diseases, cancers, and inflammatory diseases, to name but three areas. Indeed, in tissue culture models, impressive results have been achieved against various cancer cells by using RNA interference to target oncogenes and against HIV, influenza, and polio viruses by targeting viral genes.11–14 However, a huge gap exists between achieving such results in vitro and in a whole animal or patient. Delivery problems The major challenge in turning RNA interference into an effective therapeutic strategy is the delivery of the RNA interference agents, whether they are synthetic short double stranded RNAs or viral vectors directing production of double stranded RNA, to the target cells within the body. Lessons can be learnt from two earlier technologies that held out much initial therapeutic promise but have ultimately failed to deliver effective treatments. One of these is antisense. This uses short pieces of single stranded DNA complementary to the mRNA that was to be targeted. The resulting RNA-DNA hybrids forming in the cell can block translation of the mRNA by the protein synthesis machinery and also 1247
Downloaded from bmj.com on 8 November 2005
Clinical review
Additional educational resources Journal articles Dykxhoorn DM, Novina CD, Sharp PA. Killing the messenger: short RNAs that silence gene expression. Nat Rev Mol Cell Biol 2003;4:457-67 Paddison PJ, Hannon GJ. RNA interference: the new somatic cell genetics? Cancer Cell 2002;2:17-23 Lau NC, Bartel DP. Censors of the genome. Sci Am 2003;Aug:34-41 Schmidt CW. Therapeutic interference. Modern Drug Discovery 2003;Jul:37-42 Websites Nature Publishing Group (www.nature.com/focus/ rnai/library/news_views.html)—A compendium of reviews and original articles on RNA interference Ambion (www.ambion.com/techlib/resources/ RNAi/)—A set of review and news articles on RNA interference, plus information about research tools, maintained by an RNA specialist company Qiagen (www1.qiagen.com/siRNA/references.aspx)— A compendium of literature and citations on RNA interference, plus information about research tools, maintained by an RNA specialist company Thomas Tuschl’s laboratory (www.rockefeller.edu/ labheads/tuschl/sirna.html)—An siRNA users guide: technical information on getting RNA interference to work
promote its degradation. Despite nearly two decades of work, antisense has failed to prove its efficacy in the clinic, although several clinical trials have been done. In part this reflects the fact that antisense in general provides a much less robust inhibition of gene expression than RNA interference, but also major difficulties arose in getting the antisense oligonucleotides to their target cells without them being degraded elsewhere in the body. Another technology we can learn from is gene therapy. Gene therapy aims to replace defective genes in target tissues by delivering correct versions of them in expression vectors. Like antisense, gene therapy has failed to make significant progress in the clinic, despite enormous early hype. The problems have again centred around how to deliver the new versions of the defective gene safely and efficiently. Recent high profile safety problems with two of the most commonly used viral delivery systems, adenoviruses and retroviruses, have been a major setback for this approach. RNA interference in vivo Despite the problems of delivery, RNA interference has been used effectively in the mouse to block expression of a hepatitis C virus protein in the liver.15 In addition, the same group has used specific RNA interference to block hepatitis B virus infection in mice.16 They achieved delivery by injecting large amounts of synthetic double stranded RNA or DNA encoding a short hairpin RNA into the portal vein. A similar approach was taken to target the Fas protein, an important inducer of programmed cell death, resulting in protection of mice from fulminant hepatitis caused by injection with agonistic Fas-specific antibodies.17 The problems seen with the use of viral vectors in gene therapy mean that many researchers in RNA 1248
interference are favouring the use of synthetic siRNA duplexes rather than gene expression vectors that will direct the production of such molecules within the target cell (fig 2). A large number of biotechnology companies have programmes to develop synthetic RNA interference therapies for various diseases. These include Sirna Therapeutics (Boulder, Colorado) for macular degeneration; Avocel (Sunnyvale, California) for hepatitis C; Alnylam Pharmaceuticals (Cambridge, Massachusetts) for Parkinson’s disease; CytRx (Los Angeles, California) for obesity, type 2 diabetes, and ALS; Acuity Pharmaceuticals (Philadelphia, Pennsylvania) for macular degeneration and diabetic retinopathy; and Sequitur (Natick, Massachusetts) for hepatic insufficiency, respiratory syncytial virus, asthma, and cancer. Given sufficient research into delivery methods, some of these diseases will probably eventually be treated effectively by RNA interference based therapeutics. Success is more likely in those diseases with a simple genetic basis rather than in complex multigene disorders such as cancer. Diseases involving sites where delivery of synthetic RNA is more straightforward will also be more likely to be effectively treated. The bitter experiences with antisense and gene therapy mean that the likely problems should not be underestimated, but perhaps this time the reality may—eventually—live up to the hype. Funding: Cancer Research UK. Competing interests: None declared.
1
2
3
4 5 6
7
8 9
10
11
12
13 14
15 16
17
Van der Krol AR, Mur LA, Beld M, Mol JN, Stuitje AR. Flavonoid genes in petunia: addition of a limited number of gene copies may lead to a suppression of gene expression. Plant Cell 1990;2:291-9. Napoli C, Lemieux C, Jorgensen R. Introduction of a chimeric chalcone synthase gene into petunia results in reversible co-suppression of homologous genes in trans. Plant Cell 1990;2:279-89. Fire A, Xu S, Montgomery MK, Kostas SA, Driver SE, Mello CC. Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans. Nature 1998;391:806-11. Hannon GJ. RNA interference. Nature 2002;418:244-51. Carrington JC, Ambros V. Role of microRNAs in plant and animal development. Science 2003;301:336-8. Elbashir SM, Harborth J, Lendeckel W, Yalcin A, Weber K, Tuschl T. Duplexes of 21-nucleotide RNAs mediate RNA interference in cultured mammalian cells. Nature 2001;411:494-8. Aza-Blanc P, Cooper CL, Wagner K, Batalov S, Deveraux QL, Cooke MP. Identification of modulators of TRAIL-induced apoptosis via RNAibased phenotypic screening. Mol Cell 2003;12:627-37. Tewari M, Vidal M. RNAi on the apoptosis TRAIL: the mammalian cell genetic screen comes of age. Dev Cell 2003;5:534-5. Brummelkamp TR, Nijman SM, Dirac AM, Bernards R. Loss of the cylindromatosis tumour suppressor inhibits apoptosis by activating NF-kappaB. Nature 2003;424:797-801. Berns K, Hijmans EM, Mullenders J, Brummelkamp TR, Velds A, Heinerikx M, et al. A large-scale RNAi screen in human cells identifies new components of the p53 pathways. Nature 2004;428:431-7. Damm-Welk C, Fuchs U, Wossmann W, Borkhardt A. Targeting oncogenic fusion genes in leukemias and lymphomas by RNA interference. Semin Cancer Biol 2003;13:283-92. Ge Q, McManus MT, Nguyen T, Shen CH, Sharp PA, Eisen HN, et al. RNA interference of influenza virus production by directly targeting mRNA for degradation and indirectly inhibiting all viral RNA transcription. Proc Natl Acad Sci U S A 2003;100:2718-23. Gitlin L, Karelsky S, Andino R. Short interfering RNA confers intracellular antiviral immunity in human cells. Nature 2002;418:430-4. Coburn GA, Cullen BR. Potent and specific inhibition of human immunodeficiency virus type 1 replication by RNA interference. J Virol 2002;76:9225-31. McCaffrey AP, Meuse L, Pham TT, Conklin DS, Hannon GJ, Kay MA. RNA interference in adult mice. Nature 2002;418:38-9. McCaffrey AP, Nakai H, Pandey K, Huang Z, Salazar FH, Xu H, et al. Inhibition of hepatitis B virus in mice by RNA interference. Nat Biotechnol 2003;21:639-44. Song E, Lee SK, Wang J, Ince N, Ouyang N, Min J, et al. RNA interference targeting Fas protects mice from fulminant hepatitis. Nat Med 2003;9:347-51.
BMJ VOLUME 328
22 MAY 2004
bmj.com
Natuurlijke recombinatieprocessen
NATUURLIJKE RECOMBINATIEPROCESSEN 1 Inleiding De overleving van een soort is afhankelijk van de mogelijkheid om een zo groot mogelijke genetische diversiteit te behouden zodat individuele organismen variëren in hun mogelijkheid om te reageren tegen onvoorzienbare veranderingen in hun omgeving. Diversiteit wordt gewaarborgd door mutatie (verandering van een gen of een groep van genen) en door recombinatie (herschikking van het genoom tussen verschillende individuen of binnen één individu). Recombinatie speelt een rol bij de: -sexuele voortplanting; -herstel van DNA beschadiging, integratie van bepaalde bacteriofaag-, viraal- en plasmide DNA in het gastgenoom van de geïnfecteerde cel; -in transpositie: verplaatsing van DNA segmenten (soms betrokken in genregulatie);
2 Mechanisme recombinatie
van
de
genetische
Verschillende mechanismen zijn mogelijk. Het eindresultaat is echter steeds de vorming van een nieuw DNA uit twee verschillende DNA strengen (ouderstrengen) zodat genetische informatie van beide ouderstrengen aanwezig is in de recombinante streng. Homologe recombinatie: Vereist een grote mate van nucleotide sequentie homologie tussen de ouderstrengen. bv.: meiötische recombinatie bij diploïde organismen, bij bacteriën: conjugatie, transformatie, transductie. Het "recA" eiwit of een eiwit met gelijkaardige functie is steeds vereist! Plaats-specifieke recombinatie: Vereist een beperkte mate van sequentie homologie (ca 15 bp), geen "recA" eiwit. Een plaatsspecifiek enzyme is nodig. DNA - eiwit interactie tussen enzyme en de recombinerende DNA moleculen bepaalt de integratieplaats. bv.: lysogenie (faag lambda), transpositie.
Groep T
E. De Herdt
p. 1
Natuurlijke recombinatieprocessen
2.1 Homologe recombinatie Het exacte mechanisme is waarschijnlijk verschillend naargelang het organisme. Het resultaat is echter steeds hetzelfde. - twee homologe DNA dubbele helixen worden gebroken en verkeerd terug aan elkaar gezet. - de uitwisselingsplaats kan zich overal bevinden in de homologe nucleotide sequentie. - op het uitwisselingspunt heeft één ketting van een helix een baseparing aangegaan met een ketting van de andere helix. Dit noemen we de "staggered joint" welke meer dan 1000 nucleotiden lang kan zijn. - De nucleotide sequentie wordt niet veranderd. Geen enkel nucleotide wordt veranderd, verloren of bijgewonnen! Door de sterke helicoïdale opwinding van DNA moet één ketting eerst geknipt worden, zodat een lang genoeg DNA stuk vrij kan komen om baseparing aan te gaan met zijn homologe sequentie. De meeste kennis over homologe recombinatie is verkregen via E. coli mutanten welke geen homologe recombinatie meer kunnen uitvoeren. Eén van de noodzakelijke eiwitten is het E. coli SSB eiwit, een helix destabilizerend eiwit, eveneens noodzakelijk voor DNA replicatie (MG 19000). Het bindt sterk en coöperatief met enkelstrengig DNA waardoor alle basen beter bereikbaar worden voor baseparing. In vitro versnelt het de renaturatie van gedenatureerd DNA. Een ander noodzakelijk eiwit is het RecA eiwit (MG 38000): - bindt sterk enkelstrengig DNA en kan een geknipte keten uit de dubbele helix trekken; - het kan tegelijkertijd binden met enkelstrengig en dubbelstrengig DNA waardoor een "triple" strand gevormd wordt. - het bezit een DNA afhankelijke ATPase activiteit waardoor conformatieveranderingen mogelijk zijn; hierdoor wordt het zoeken naar een correcte baseparing vergemakelijkt. Na het knippen en de eerste baseparing wordt een intermediaire structuur gevormd na ligatie: "cross-strand exchange". (= Holliday junction). - Het kruispunt kan snel voor- of achterwaarts migreren waardoor het aantal baseparen tussen de verschillende kettingen sterk kan stijgen. - De structuur kan isomeriseren waardoor de origineel gekruiste ketens niet meer kruisen en vice versa. Om uiteindelijk twee gescheiden DNA helixen te krijgen, moeten de twee kruisende ketens geknipt en geligeerd worden. Gebeurt dit voor isomerisatie: → uitwisseling van een kort stukje enkelstrengig DNA (heteroduplex) Gebeurt dit na isomerisatie: → een deel van elk origineel DNA molecule wordt verbonden met de andere DNA helix via een "staggered joint".
Groep T
E. De Herdt
p. 2
Natuurlijke recombinatieprocessen
2.2 Plaatsspecifieke recombinatie Het gehele proces (initiële herkenning + recombinatie) wordt geleid door een recombinatie enzyme. Uitgebreide baseparing is niet altijd essentiëel omdat het enzyme de specifieke nucleotide sequenties aanwezig op één of beide DNA moleculen herkent.
2.2.1 Lambda integrase: Dit enzyme maakt de incorporatie en excissie van het lambda chromosoom mogelijk in/uit het E.coli chromosoom. Het herkent een bepaalde plaats op het het E.coli chromosoom (att B) en één op het lambda chromosoom (att P). Het brengt beide chromosomen bij elkaar gebruik makend van een beperkte homologie (15 bp), knipt en hecht ze terug aan elkaar.
2.2.2 Cre eiwit Het Cre eiwit catalyseert de excissie van monomeer P1 faag DNA uit een multimere cirkel van dit genoom tijdens de faag P1 replicatiecyclus. Het doet dit via herkenning van de loxP sequentie op de multimere cirkel. Belangrijk is dat dit P1 recombinase systeen (loxP-Cre) ook in vitro werkzaam is en zelfs kan gebruikt worden om eukaryote genomen te behandelen (productie van weefselspecifieke gen-knockout muizen!)
3 Voorbeelden 3.1 Transformatie Hiermee bedoelen we de opname van naakt DNA door een cel. Meestal gaat het hierbij om dubbelstrengig DNA in de grootte orde van 0,5 - 15 kb. Het DNA dringt binnen ter hoogte van regionen van celwandsynthese. Hieruit volgt dat de capaciteit tot opname van DNA wijzigt in functie van de levenscyclus van de cel. Het opgenomen DNA kan stabiel overgeërfd worden indien het ofwel op zichzelf kan blijven bestaan (bezit oorsprong van replicatie, bv. plasmide) of indien het stabiel geïntegreerd wordt in het gastgenoom DNA (meestal door homologe recombinatie). De efficiëntie van opname is erg afhankelijk van de gastcel en het transformerende DNA (grootte, lineair, circulair). De eerste experimenten van Avery (1944) met pneumococci gebeurden met een efficiëntie van 10-4. Tegenwoordig kunnen cellen kunstmatig behandeld worden waardoor de efficiëntie kan stijgen tot >5%: Competente cellen, CaCl2 behandeling, electroporatie, enz. Transformatie kan experimenteel aangewend worden voor opname van in vitro gesynthetiseerd DNA of gemodificeerde plasmiden en viraal DNA zowel bij bacteriën als bij eukaryoten zoals gist en dierlijke cellen. Verder heeft het ook een belangrijke epidemiologische betekenis (ontstaan van recombinanten met verhoogde virulentie).
Groep T
E. De Herdt
p. 3
Natuurlijke recombinatieprocessen
3.2 Conjugatie Dit proces werd voor het eerst geobserveerd bij E.coli stammen. Sommige stammen bestaan in twee typen: F+ = genetische donor F- = genetische acceptor De letter F slaat op de al of niet aanwezigheid van een F plasmide of sex factor. Dit plasmide leidt tot de transfer van zichzelf (met een hoge frequentie) en eventueel ook tot de transfer van een deel van het chromosoom (met een veel lagere frequentie). Als men F+ en F- stammen samen laat opgroeien worden alle cellen F+ . Bij opslag van een cultuur in de stationaire fase gaat de F factor dikwijls verloren. Uit F+ stammen ontstaan soms zogenaamde Hfr stammen (high frequency recombination). Bij een Hfr stam is het F plasmide geïncorporeerd in het chromosoom zodat bij conjugatie de F factor gevolgd wordt door het chromosoom (althans een gedeelte ervan!). Onafhankelijk geïsoleerde Hfr stammen verschillen soms in de sequentie waarmee ze opeenvolgende genen transfereren. Dit komt omdat de F factor zich op verschillende plaatsen in het genoom kan integreren. F' plasmiden: de integratie in een Hfr is reversiebel met een lage frequentie waardoor de originele F+ terug ontstaat. Soms echter wordt de F factor onnauwkeurig uitgesneden en draagt hij een stuk van het DNA chromosoom met zich mee = hybride plasmide = F'.
3.2.1 Fysiologie van de conjugatie: F+ cellen bevatten enkele sex pili welke zich zeer sterk hechten aan bepaalde receptoren van F- cellen. De brug die ontstaat bestaat uit een fosfoproteïne, pilin (MG 11 800). Dit is de aanleiding voor het ontstaan van een cytoplasmatische brug. Tijdens het conjugatieproces wordt het plasmide asymmetrisch gerepliceerd ("rolling circle" mechanisme). Eén van de originele ketens wordt geknipt en gaat naar de brug. Eén enkele keten wordt overgebracht (= single strand). De gescheiden ketens worden nadien onmiddellijk gerepliceerd, één in de donor, de andere terwijl hij in de acceptor dringt. Dit mechanisme verklaart: - transferduur volledige chromosoom = 100 min (terwijl replicatie volledige genoom = 45 min, dit gebeurt immers bidirectionaal !) - hoe een F+ cel een F- kan infecteren zonder zelf F- te worden.
3.2.2 Kinetiek van de paring en transfer: Verschillende merkers kunnen geordend worden volgens een dalende transferefficiëntie. Dit wordt veroorzaakt door het feit dat de transfer start op een specifieke locus. Indien de conjugatie ongedaan gemaakt wordt via "interrupted mating" kan de volgorde van overdracht van specifieke merkers uitgedrukt worden op een tijdsschaal. Het in kaart brengen van de merkers op het genoom gebeurt dus aan de hand van tijdseenheden. Dit is alleen geschikt voor lange afstanden: Groep T
E. De Herdt
p. 4
Natuurlijke recombinatieprocessen Bij 37 °C wordt ongeveer 1% van het E.coli chromosoom overgedragen per min. = 15 µm of 50 kb.
3.3 Transductie 3.3.1 Algemene transductie: De infectie van een bacterie door een faag wordt gevolgd door de replicatie van het faag DNA en de vorming van faagcomponenten. Deze worden normaal geassembleerd tot nieuwe faagpartikels. Occasioneel kan echter de faagmantel in plaats van viraal DNA een fragment van het bacteriële gastgenoom omsluiten. Er ontstaat alzo een transducerend faagdeeltje, dat nog wel andere bacteriën kan infecteren (herkenning gebeurt door faagmantel en oppervlakte receptoren op de bacteriële membraan), maar geen nakomelingen meer kan hebben (ontbreken van faag DNA!). Een infectie met een transducerend faagpartikel kan via homologe recombinatie leiden tot de stabiele integratie van het binnengebrachte DNA. Tranductie werd vroeger aangewend voor het in kaart brengen van bacteriële genen. De cotransductie van twee merkers is immers groter naarmate deze dichter bij elkaar gelegen zijn. Anderzijds daalt de co-transductie van twee merkers snel met hun onderlinge afstand en wordt 0 zodra deze afstand groter wordt dan de lengte van het DNA dat kan getransfereerd worden. Tegenwoordig kunnen we in vitro naakt DNA verpakken in lege faagpartikels. Hierdoor wordt het DNA beter beschermd en kunnen we gebruik maken van de specifieke herkenning door de faagmantel van een bepaalde bacterie. Hierdoor stijgt de frequentie waarmede we deze bacterie kunnen transformeren! In dit geval praten we van transfectie.
3.3.2 Gespecialiseerde transductie: Bacteriofagen welke een lysogene levenscyclus kunnen ontwikkelen doen dit via de integratie van hun viraal DNA in het gastgenoom van de bacterie (= profaag). Indien op een bepaald ogenblik de lytische cyclus start, gebeurt dit door excissie van het virale DNA uit het gastgenoom waarna dit gerepliceerd wordt en virale componenten gesynthetiseerd worden. Met een lage frequentie wordt dit virale DNA echter foutief uitgesneden waardoor aan één zijde één of enkele genen van de bacterie meegenomen worden ten koste van virale genen aan de andere zijde van het virale genoom. Dit gewijzigde virale DNA kan dan verpakt worden en aanleiding geven tot transducerende deeltjes. - Sommige zijn infectief: de ontbrekende faaggenen zijn niet essentiëel voor de vegetatieve faag vermenigvuldiging.
Groep T
E. De Herdt
p. 5
Natuurlijke recombinatieprocessen -
Sommige zijn defectief: ze kunnen niet meer op zichzelf vermenigvuldigen omdat ze de ervoor benodigde genen verloren hebben.
3.4 Lysogenie Plaats-specifieke recombinatie werd voor het eerst bestudeerd in bacteriofaag lambda. Na recircularisatie kan het lambda chromosoom ofwel gerepliceerd worden wat leidt tot nieuwe virusdeeltjes of het kan zich integreren in het gastgenoom. Hierbij wordt gebruik gemaakt van het integrase enzyme (plaats specifieke recombinatie!). Dit is de lysogene toestand waarbij de meeste virale genen niet actief zijn. Op die manier kan het virus een niet-letale lange termijn relatie aangaan met zijn gastcel. Dergelijke fagen noemen we getemperde fagen in tegenstelling tot virulente fagen die steeds de gastcel lyseren na infectie.
3.5 Mobiel DNA Mobiele DNA elementen die zich verplaatsen als DNA noemen we transposons, deze die eerst afgeschreven worden tot RNA dat dan nadien via reverse transcriptase activiteit omgevormd wordt tot DNA noemen we retrotransposons. Beide typen genereren meestal korte directe herhalingssequenties ter hoogte van de insertieplaats. Retrotransposons komen veel meer voor bij hogere eukaryoten en de meeste herhalingssequenties die teruggevonden worden bij hogere eukaryoten schijnen afkomstig te zijn van mobiele DNA elementen. De meest voorkomende mobiele elementen bij vertebraten zijn twee typen van niet-virale retrotransposons: LINES ('long interspersed elements') en SINES ('short interspersed elements'). Beiden zijn betrokken bij het ontstaan van genetische ziekten. De meest voorkomende SINES bij mensen bevatten meestal een herkenningsplaats voor het AluI restrictieënzyme en worden daarom Alu sequenties genoemd. Deze 300 bp sequenties liggen verspreid over het menselijke genoom en beslaan ongeveer 5 % van het totale DNA.
3.5.1 Bacteriële transposons Transposeerbare genetische elementen zijn genen die geen vaste lokalisatie hebben in een genoom maar van plaats kunnen veranderen (lage frequentie). Dit werd voor het eerst waargenomen in de jaren '70 toen men vaststelde dat antibiotica resistentiegenen welke voorkomen op plasmiden met lage frequentie ook konden voorkomen op het bacteriële genoom of op faag DNA dat deze cel had geïnfecteerd (en dit niettegenstaande er geen sprake is van sequentiehomologie!!) Groep T
E. De Herdt
p. 6
Natuurlijke recombinatieprocessen Het bestaan van dergelijke "jumping genes" die op een ogenschijnlijke "at random" manier van het ene chromosoom naar een ander kunnen overgaan, heeft een drastische invloed gehad op onze opvattingen over genorganisatie en evolutie. Transposeerbare elementen zijn aangetoond bij verschillende eukaryoten: mais, Drosophila en gist. De hierna volgende kenmerken hebben echter betrekking op bacteriën waar de structuur en het mechanisme van transpositie goed gekend zijn. - Transpositie behoeft geen extensieve DNA sequentie homologie. - DNA synthese vindt plaats. Transpositie gaat steeds gepaard met verdubbeling van de target site (3 - 12 bp), daar waar het transposeerbare element ingebouwd wordt. Veelal wordt ook het transposeerbare element gerepliceerd waarbij één copy terecht komt in de nieuwe sequentie en één achterblijft in de donor sequentie. - Herstructurering van het gastgenoom kan plaatsvinden. Indien een transposeerbaar element zich binnen hetzelfde chromosoom verplaatst, kunnen er twee homologe sequenties binnen hetzelfde DNA ontstaan. Indien deze identiek of omgekeerd geöriënteerd zijn, kan eventuele homologe recombinatie leiden tot deletie of inversie. Transposeerbare elementen kunnen ook andere effecten veroorzaken bij het chromosoom waar ze in terecht komen: - inactivatie van elk gen waarin ze terechtkomen: insertie verstoort de codesequentie; - activatie van naburige genen: indien een promotor of transcriptie activator terecht komt in de onmiddellijke omgeving van een gen; - abortieve transpositie: veroorzaakt deleties of inversies in het chromosoom. Bij bacteriën onderscheiden we 3 klassen van transposeerbare elementen: - Klasse I transposons: (frequentie: 10-7 - 10-5 / generatie) - IS = insertiesequentie: bevat een transposasegen geflankeerd door twee korte "inverted repeats" ,15-15 bp. - "composite transposon": bevat een eiwitcoderend gen, bv. antibiotica resistentie geflankeerd door twee IS elementen in een identische of omgekeerde oriëntatie. - Klasse II transposons: (frequentie: 10-7 - 10-5 / generatie) Bevat één set korte herhalingssequenties + eiwitcoderend gen (antibiotica) + transposase gen + resolvase gen. - Klasse III transposons: (zijn in feite een kleine groep van bacteriofagen, bv. Mu) Het faag chromosoom integreert zich "at random" in het gastchromosoom via transpositie en het repliceert zich via transpositie. Het faaggenoom bevat: A gen (=transposase), B gen (versnelt transpositie), heleboel specifieke faaggenen (structurele eiwitten, enzymen). Het B gen zorgt voor een sterke verhoging van de transpositiefrequentie: faag Mu integreert zich ongeveer 100 x per lytische infectie! Bemerk dat de insertie van elk transposon gebeurt ter hoogte van een herkenningssequentie op het doelwit DNA van 5 - 9 bp. De insertie gaat gepaard met een duplicatie van deze regio waardoor twee kopyen van de targetsequentie ontstaan langs de flanken van het geïntegreerde element. Dit is het gevolg van het transposase enzyme dat de Groep T
E. De Herdt
p. 7
Natuurlijke recombinatieprocessen doelwitsequentie asymmetrisch klieft. Na integratie van het mobiele element worden de "gaps" opgevuld en geligeerd waardoor de directe repeats ontstaan aan de flanken.
3.5.2 Retrovirussen In eukaryote systemen vertoont transpositie veel gelijkenis en tevens een aantal typische verschillen met bacteriële transpositie: - Bij eukaryoten zijn integratie en excissie verschillende processen. Het transposeerbare element kan daarom in vrije vorm geïsoleerd worden, meestal een dubbelstrengig, circulair DNA. - Replicatie van dit DNA gaat meestal via een RNA intermediair. Deze twee eigenschappen zijn aanwezig bij de meest bestudeerde eukaryote transposeerbare elementen, nml. de vertebrate retrovirussen. Deze RNA virussen gebruiken het reverse transcriptase om een circulair dsDNA te synthetiseren dat zich op verschillende plaatsen in het gastchromosoom kan integreren. Het geïntegreerde retrovirale genoom vertoont veel gelijkenis met de bacteriële klasse II transposons. Het prototype van een retroviraal genoom bevat 3 structurele genen: - gag: een glycosaminoglycan dat de viruskern zal vormen; - pol: het reverse transcriptase; - env: glycoproteïne van de virusmantel. Deze genen worden geflankeerd door twee directe herhalingsequenties, LTR (250 tot 1400 bp). Elke LTR wordt op zijn beurt geflankeerd door korte inverse herhalingsequenties van 5 - 13 bp. Integratie gebeurt door een mechanisme waarbij de doelwitplaats gedupliceerd wordt. Hierdoor wordt het geïntegreerde virale genoom (provirus) tevens geflankeerd door cellulaire directe herhalingsequenties van 5 - 13 bp. Retrovirussen kunnen net als bacteriële transposons extra genen overdragen. Het eerst ontdekte retrovirus, Rous sarcoma virus (tumoren bij kippen), is drager van een oncogen (src-gen). Dit is een gen coderende voor een enzyme met een eiwitkinase functie. Een gelijkaardige, doch toch verschillende sequentie is ook aanwezig in het gastgenoom. Andere oncogene virussen bevatten hun oncogen geïntegreerd tussen, of in de plaats van de virale genen gag, pol en env. Aangezien hierdoor een essentiëel gen verloren gaat, kunnen deze virussen zich niet meer repliceren, tenzij de gastcel tevens gecoïnfecteerd werd met een helper virus (verwant virus dat het inactieve of ontbrekende gen wel bezit). De aanwezigheid van het oncogen in het virus is essentiëel voor de transformatie van de gastcel tot een kankercel. Omdat reeds elk ontdekt viraal oncogen verwant is met een cellulair gen, wordt verondersteld dat het virale oncogen vele generaties geleden ontstond in een cel waarna het na vele mutaties opgenomen werd door een viraal genoom. Vele oncogene producten bezitten een eiwitkinase activiteit. Dit kan erop wijzen dat het gemuteerde vormen zijn van normale cellulaire regulatorische eiwitten. Hun expressie kan dus leiden tot een abnormale groei die zo karakteristiek is voor tumor cellen. Een ander mechanisme kan verband houden met de activatie van cellulaire genen door insertie van proviraal DNA. De linkse LTR van een geïntegreerd provirus bevat de promotor voor de naastliggende gag, pol en env - genen. Aangezien de linkse en rechtse Groep T
E. De Herdt
p. 8
Natuurlijke recombinatieprocessen LTR's directe herhalingsequenties zijn, zou het kunnen dat de rechtse LTR de transcriptie activeert van cellulaire genen gelegen stroomafwaarts van de integratieplaats. Indien deze per toeval betrokken zijn bij de metabole regulatie, kan hun overexpressie het metabolisme dereguleren en zo een bijdrage leveren tot de oncogenese.
3.6 Genamplificatie Hiermee bedoelen we de selectieve vermeerdering van specifieke delen van het genoom. Het komt voor tijdens de normale ontwikkelingsprocessen van multicellulaire organismen, maar ook onder invloed van bepaalde metabolische stress situaties. bv. bij amfibiën: tijdens oögenese vermeerderen de rRNA genen zich met een faktor 2000 teneinde zich voor te bereiden op de grote hoeveelheid eiwit die gesynthetiseerd zal moeten worden. Twee mechanismen zijn gekend welke beide voorkomen tijdens de ontwikkeling van drugresistente zoogdiercellen. Het meest bestudeerd is de resistentie tegen de dihydrofolaat reductase inhibitor, methotrexaat (gebruikt bij de behandeling van leukemie). De overproductie van het target enzyme, dihydrofolaat reductase (DHFR) is het gevolg van een sterke vermenigvuldiging van een groot DNA fragment waarin het DHFR gen gelegen is. Ofwel ontstaat een extra groot chromosoom ofwel een aantal mini- chromosomen. Deze laatste blijven in de cel bestaan zolang de selectieve druk van methotrexaat aanwezig blijft. Het extra grote chromosoomfenotype is stabiel gedurende verschillende generaties van celgroei. De vermeerdering van genen onder welbepaalde stresscondities wordt veel waargenomen, o.a. ook bij de ontwikkeling van pesticide resistente insecten. Het juiste mechanisme is nog niet gekend. Het is echter waarschijnlijk dat elke regio van het genoom een kleine, maar bestaande kans heeft om zich extra te repliceren of zich af te scheiden tijdens het doorlopen van de celcyclus (misschien via homologe recombinatie). De aanwezigheid van de stress factor zorgt dan voor de selectieve overleving van deze cellen. Eens twee of meer kopijen van het gen aanwezig zijn, kan via abnormale replicatie of homologe recombinatie meerdere kopijen ontwikkeld worden. De ontwikkeling van een resistentie gebeurt dus in stappen en over verschillende generaties. Deze bevindingen hebben enorme implicaties op de manier van kankerbehandeling. Chemotherapie behelst immers meestal een lange-termijn behandeling met lage dosissen van een antimetaboliet - de ideale omstandigheden voor de ontwikkeling van resistentie. Recentelijk is ook ontdekt dat tijdens de klinische progressie van bepaalde humane tumoren specifieke oncogenen versterkt worden. Een ander voorbeeld vinden we in de speekselklieren van Drosophila, waar bepaalde delen van het X chromosoom sterk vermenigvuldigen zonder dat de dochterstrengen zich afscheiden met de vorming van een zogenaamde 'polyteen' chromosoom tot gevolg. Hierdoor stijgt het aantal copijen van een hele reeks van genen (speekseleiwitten, ribsomale genen) die sterk tot expressie komen in de belangrijke speekselklieren van Drosophila. Groep T
E. De Herdt
p. 9
Natuurlijke recombinatieprocessen Genamplificatie is aldus betrokken bij normale ontwikkelingsprocessen, bij de aanpassing aan bepaalde stressomstandigheden en betrokken in of de oorzaak van de evolutie naar abnormale ontwikkelingsprocessen.
3.7 Assemblage van het antilichaamgen Wens je wat meer uitleg over immunologie dan kan je onderstaande sites raadplegen: http://www.bmb.psu.edu/courses/bisci004a/immune/immunsys.htm
Elk vreemd macromolecule (antigen) kan specifiek de groei stimuleren van één type immunocyt (stamcel) welke een unieke cellijn (kloon) oplevert van allemaal identieke cellen welke één bepaald antilichaam produceren (B-lymfocyt = gedifferentieerde cel). Men heeft uitgerekend dat een mens 107 verschillende antilichamen kan produceren. Deze kunnen niet allemaal gecodeerd worden door individuele genen. Het menselijke genoom is daar veel te klein voor. De grote diversiteit is het resultaat van: Recombinatie van exons: Het genoom bevat een bibliotheek van exons welke verschillende stukken van het antilichaam coderen. Verschillende combinaties kunnen gemaakt worden tijdens de differentiatie van stamcel naar antilichaamproducerende cel. Somatische mutaties: De antilichaamgenen van de producerende cellen muteren op bepaalde plaatsen tegen een enorm grote snelheid. Deze mutaties zijn uiteraard niet overerfbaar, aangezien ze optreden in somatische cellen en niet in de geslachtscellen.
3.7.1 Struktuur: IgG: - 2 Heavy + 2 Light polypeptideketens, intra- en inter molekulaire S-S bruggen; - constante (C) en variabele (V) gedeelten binnen elke polypeptide keten; - 2 antigen bindingsplaatsen, (continue en discontinue epitopen op het antigen); - hypervariable lussen. Verschillende klassen en subklassen van antilichamen kunnen geproduceerd worden: IgM / IgG / IgA / IgD / IgE De klasse wordt bepaald door het Constant gedeelte van de L en H keten.
3.7.2 Genereren van grote verscheidenheid aan antilichamen De gensegmenten voor de assemblage van de antilichaamketen liggen verspreid over 3 chromosomen. Voor de muis is dit op chromosoom 12 voor de H keten, op chromosoom 6 voor de L keten met Cκ als constant segment en op chromosoom 16 voor de L keten met Cλ
Groep T
E. De Herdt
p. 10
Natuurlijke recombinatieprocessen als constant segment. Aangezien de mens diploïd is, betekent dit dat er kan gekozen worden tussen 4 chromosoomgedeelten voor de assemblage van L keten en tussen 2 voor de H keten. Wat de genexpressie betreft, vindt er aldus allelexclusie op. Dit wil zeggen dat maar één van beide allelen (gelegen op de homologe chromosomen) wordt geactiveerd. Dit is vrij enig aangezien normaal zowel de maternale als paternale genen tot expressie komen. De enige nog gekende uitzondering is het X chromosoom bij de vrouw. De verschillende chromosoomgedeelten kunnen ingedeeld worden in: voor de L keten: V / J / C segmenten; voor de H keten: V / J / D en C segmenten. Via transpositie processen wordt in elke B cel een andere potentiële combinatie gevormd van V, J, D en C segmenten. Hierdoor ontstaat een grote variatie aan B cellen met elke een eigen antilichaam van de klasse IgM of IgD, die dit antilichaam presenteren op hun celmembraan. Keuze tussen IgM of IgD is afhankelijk van verschillende splicing producten van het RNA transcript. Deze cellen liggen verscholen in de weefsels van het immuunsysteem: milt, lymfeknopen. Tijdens de primaire respons worden deze cellen met het best passende variabele deel voor het circulerende antigen geselecteerd en aangezet tot groei en differentiatie (geheugencel, antilichaamproducerende cel). Bij herhaaldelijke blootstelling aan hetzelfde antigen (secundaire respons) gebeuren er ook klasseveranderingen door de selectie van een ander constant gedeelte op DNA niveau: IgM (Cµ), IgD (Cδ) IgG (Cγ), IgE (Cε), IgA (Cα)
Diversiteit is dus het resultaat van: L keten: - 300 V met 4 J x 2,5 omdat cutting en splicing tussen V en J op 4 verschillende plaatsen kan gebeuren = 3000 - de laatste stap in de assemblage van de L keten gebeurt door de verbinding van de C en J segmenten. Dit gebeurt niet op DNA maar op RNA niveau. H keten: naar analogie tussen V/J/D en C = 5000 Totale diversiteit : 3000 x 5000 = 1,5 107 . Uitgaande van een beperkte hoeveelheid DNA in de stamcel kan dus een enorme variëteit gegenereerd worden in de antilichaam producerende cel. Bijkomende diversiteit ontstaat doordat: - verschillende V segmenten onderling stukjes DNA kunnen uitwisselen (recombinatie); - er een klasse verandering kan optreden bij herhaaldelijke blootstelling aan hetzelfde antigen; - de V sequentie in de producerende cel aan een hoge graad van mutatie onderhevig is (= somatische mutatie) ter hoogte van de "hot spots". Dit laatste zorgt voor een fijnafstemming van het antilichaam op het antigen.
Groep T
E. De Herdt
p. 11
Natuurlijke recombinatieprocessen Het totaal aantal mogelijke antilichamen wordt hierdoor ontelbaar!
Groep T
E. De Herdt
p. 12