MCB: Hoofdstuk 11: In vorige chapters hebben we gezien dat de acties en eigenschappen van elk celtype bepaald wordt door de proteïnen die het bevat. In deze en de volgende chapter beschouwen we hoe de soorten en hoeveelheden van de verschillende proteïnen geproduceerd door een bepaald celtype in een meercellig organisme gereguleerd wordt. De basisstappen in genexpressie, het gehele proces waarbij de informatie gecodeerd in een bepaald gen gedecodeerd wordt in een bepaald proteïne zijn bestudeerd in chapter4. De synthese van mRNA vereist dat een RNA polymerase de transcriptie initiëert, ribonucleosidetrifosfaten complementair aan de DNA coderende streng polymeriseert en dan de transcriptie beëindigt. Bij prokaryoten hebben ribosomen en translatie iniatiatie factoren onmiddelijk toegang tot de pas gevormde RNA-transcripten, die functioneren als mRNA zonder enige verdere modificatie. Bij eukaryoten wordt het initiële RNA transcript echter onderworpen aan processing die aan functioneel mRNA aflevert. Het mRNA wordt dan getransporteerd van zijn syntheseplaats in de nucleus naar het cytoplasma, waar het vertaald wordt in een eiwit met de hulp van ribosomen, tRNA’s en translatiefactoren. Theoretisch zou de regulatie van elk van de verschillende stappen in de genexpressie kunnen leiden tot de diffrentiële productie van eiwitten in verschillende celtypes of ontwikkelingsstadia of als antwoord op externe condities. Hoewel regulatie-voorbeelden in elk van de stappen van de genexpressie gevonden zijn, is de controle van de transcriptie-de eerste stap- hetbelangrijkste mechanisme voor de bepaling van de meeste genen of ze tot expressie komen en hoeveel coderende mRNA’s en bijgevolg ook hoeveel proteïnen er geproduceerd worden. De moleculaire mechanismen die de transcriptie initiatie reguleren zijn cruciaal voor vele biologische fenomenen, waaronder de ontwikkeling van een meercellig organisme uit één enkele bevruchte eicel, de immuunresponsen die ons beschermen tegen pathogene microorganismen en neurologische processeb zoals leren en geheugen. Wanneer deze regulatiemechanismen niet goed functioneren, kunnen pathologische processen zoals kanker en veroudering optreden. In deze chapter concentreren we ons op de moleculaire gebeurtenissen die bepalen wanneer transcriptie van eukaryote genen begonnen wordt en beschouwen we ook kort de controle van premature terminatie van de transcriptie. RNA processing en verschillende post-transcriptionele mechanismen voor de controle van eukaryote genexpressie worden in de volgende chapter behandeld. Latere chapters, in het bijzonder 13; 14 en 15 verlenen voorbeelden van hoe de transcriptie wordt gereguleerd door interacties tussen cellen en hoe de resulteren gen controle meewerkt aan de ontwikkeling en functionering van verschillende soorten cellen in de meercellige organismen.
11.1 overzicht van eukaryote gencontrole en RNA polymerasen Bij bacteriën dient de gencontrole voornamelijk om een enkele cel toe te laten zich aan te passen aan veranderingen in zijn omgeving zodat zijn groei en deling geoptimaliseerd kan worden. Bij meercellige orgaznismen induceren veranderingen in de omgeving ook veranderingen in de genexpressie. Een voorbeeld is de response op weinig zuurstof (hypoxia) die beschreven wordt in chapter15. Het meest typische en biologisch verreikende doel van gencontrole in meercellige organismen is echter de uitvoering van het genetische programma die de embryonale
ontwikkeling verklaart. De vorming van vele verschillende celtypes die tezamen een meercellig organisme vormen hangt af van dat de juiste genen geactiveerd worden in de juiste cellen op het juiste moment tijdens de ontwikkelingsperiode. De meeste gevallen wordt, eens een ontwikkelings stap genoemn is door een cel, deze niet meer omgekeerd. Dus zijn deze beslissingen fundamenteel verschillend van de reversibele activatie en repressie van bacteriële genen als antwoord op hun omgevings condities. Bij de uitvoering van hun genetische programma’s volgen vele gediffrentiëerde cellen (vb huidcellen, rbc en antilichaamproducerende cellen) een pad dat tenslotte tot celdood leidt, zonder een nageslacht achter te laten. De vaste patronen van gencontrole leidend tot diffrentiatie dient voor het gehele organisme en niet voor het overleven van een individuele cel. Ondanks de verschillen qua doel van de gencontrole bij bacteriën en eukaryoten zijn de twee sleutelkenmerken van transcriptie controle, die eerst ontdekt werden bij bacteriën en beschreven zijn in chapter4, ook van toepassing op eukaryote cellen. Ten eerste zijn proteïne-bindende regulatorische DNA sequenties of controle elementen verbonden met genen. Ten tweede bepalen specifieke proteïnen, die binden aan gen regulatorische sequenties wanneer de transcriptie zal beginnen en activeren of onderdrukken zijn transcriptie. Zoals voorgesteld in figuur 11-1 worden in meercellige eukaryoten inactieve genen geordend in gecondenseerd chromatine, wat de binding van RNA polymerasen en algemene transcriptie factoren, vereist voor de transcriptie iniatie, remt. Activator proteïnen binden aan controle elementen vlakbij de transcriptie start site van een gen of evengoed kilobasen ervan verwijderd en promoten de chromatine decondensatie en binding van RNA polymerase aan de promotor. Repressor proteïnen binden aan andere controle elementen, wat de condensatie van chromatine in inhibitie van polymerase binding veroorzaakt. In deze chapter beschouwen we hoe activatoren en repressoren de chromatine structuur controleren en de transcriptie initiatie door RNA polymerase remmen of stimuleren. De meeste genen bij hogere eukaryoten worden gereguleerd door de controle van hun transcriptie Directe metingen van de transcriptiesnelheden van meerdere genen in verschillende celtypes heeft aangetoond dat de regulatie van transcriptie initiatie de meest verspreide vorm van gencontrole bij eukaryoten, net als bij bacteriën, is. Nascentchain analyse is een gebruikelijke methode voor de bepaling van de relatieve snelheid van transcriptie van verschillende genen in gekweekte cellen. Bij deze methode, ook run-on transcription analysis genoemd, worden geïsoleerde nuclei geïncubeerd met 32P-gelabelde ribonucleoside trifosfaten voor een korte periode (vb 5min of minder). Tijdens deze incubatie periode bouwen RNA polymerase moleculen, die actief genen aan het afschrijven waren wanneer de nuclei geïsoleerd werden, enkele honderden gelabelde nucleotiden in in elke ontluikende (groeiende) RNA keten, maar slechts weinig initiatie van nieuwe ketens gebeurt. Het totaal van radioactieve label ingebouwd in het RNA is een maat voor de globale transcriptie snelheid. De fractie van het totale gelabelde RNA geproduceerd door de transcriptie van een bepaald gen –dat wil zeggen zijn relatieve transcriptiesnelheid- wordt bepaald door hybridisatie van het gelabelde RNA met het gekloneerde DNA van dat gen gehecht aan een membraan. De resultaten van run-on transcriptie analysen geïllustreerd in figuur 11-2 tonen dat de transcriptie van genen coderend voor proteïne die specifiek in hepatocyten (het
belangrijkste celtype in de lever van zoogdieren) gemakkelijk te detecteren is in de nuclei afkomstig van de lever, maar niet in de nuclei van de hersenen of de nier. Aangezien de run-on transcriptie analyse de RNA synthese meet, duiden deze resultaten aan dat de diffrentiële synthese van lever-specifieke proteïnen gereguleerd wordt door de controle van de transcriptie van de overeenkomstige genen in de verschillende weefsels. Gelijkaardige resultaten van run-on transcriptie analysen zijn bekomen met andere celtypes en een brede variëteit aan weefsel specifieke eiwitten, wat er wijst dat de transcriptionele controle het primaire mechanisme van gencontrole is bij complexe organismen. Regulatorische elementen in eukaryotisch DNA zijn vaak vele kilobasen van de startsites verwijderd Bij eukaryoten net als bij bacteriën wordt een DNA sequentie die bepaalt waar een RNA polymerase bindt en de transcriptie van een gen initiëert een promotor genoemd. De transcriptie van een bepaalde promotor wordt gecontroleerd door DNA-bindings proteïnen, transcriptie factoren genoemd, die evenwaardig zijn aan bacteriële repressoren en activatoren. De DNA controle elementen in eukaryote genomen die transcriptiefactoren binden zijn echter vaak veel verder van de promotor gelokaliseerd die ze reguleren dan het geval is in prokaryotische genomen. In sommige gevallen binden de transcriptie factoren die de expressie van proteïnecoderende genen in hogere eukaryoten aan regulatorische sites die tienduizende baseparen upstream (tegengestelde richting van transcriptie) of downstream (zelfde richting als transcriptie)van de promotor af liggen. Als resultaat van deze ordening kan de transcriptie van een enkele promotor geregeld worden door de binding van meerdere transcriptiefactoren aan alternatieve controle elementen, wat een complexe controle van de genexpressie toelaat. Bijvoorbeeld: alternatieve transcriptie-controle elementen reguleren de expressie van het zoogdier gen dat codeerd voor transthyretine (TTR), dat thyroid hormoon transporteert in het bloed en het cerebrospinale vocht dat de hersenen en het ruggemerg omgeeft Transthyretine komt tot uitdrukking in hepatocyten, die de meeste bloedserumproteïne synthetiseren en secreteren en in de choroïde plexus cellen in de hersenen, die cerebrospinaal vocht en zijn bijhorende proteïnen secreteren. De controle elementen vereist voor de transcriptie van het TTR gen werden geïdentificeerd door de procedure geschetst op figuur 11-3. Bij deze experimentele aanpak werden DNA fragmenten met variërende grootten van upstream (vd start site) sequenties gekloneerd voor een reportergen in een bacteriële plasmide gebruik makend van recombinant DNA technieken. Reporter genen brengen enzymen tot uitdrukking die gemakkelijk geanalyseerd worden in celextracten. Veel gebruikte reportergenen omvatten het E. Coli lacZ gen dat codeert voor β-galactosidase; het vuurvlieg gen coderend voor luciferase, dat energie van ATP hydrolyse omzet in licht en het kwal gen coderend voor groen fluorescent proteïne (GFP). Door de opbouw en analyse van 5’-deletie series upstream van het TTR gen identificeerden de onderzoekers twee controle elementen die de expressie van het reportergen stimuleerden in hepatocyten, maar niet in andere celtypes. Eén regio gelegen tussen +/-2,01 en 1,85 kb upstream van de TTR gen start site; de andere gelegen op tussen +/- 200 baseparen upstream en de startsite. Verdere studies toonden aan dat alternatieve DNA sequenties de TTR transcriptie in choroid plexus
cellen controleren. Dus reguleren de alternatieve controle elementen de transcriptie van het TTR gen in twee verschillende celtypes. We onderzoeken de basis moleculaire gebeurtenissen die onder deze eukaryotische transcriptionele controle liggen in latere secties. Drie eukaryote polymerasen katalyseren de vorming van verschillende RNA’s De nuclei van alle eukaryote cellen tot nu toe onderzocht (vb vertebraat, Drosophila, gist en plantencellen) bevatten drie verschilllende RNA polymerasen, aangeduid als I, II en III. Deze enzymen worden bij verschillende zoutconcentraties geëlueerd tijdens ionen-wisselaar chromatografie en verschillen ook in hun gevoeligheid voor αamanitine, een giftig cyclisch octapeptide geproduceerd door sommige paddestoelen. Polymerase I is zeer ongevoelig aan α-amanitine; polymerase II is zeer gevoelig en polymerase II heeft een middelmatige gevoeligheid. Elk eukaryotisch RNA polymerase katalyseert de transcriptie van genen coderend voor verschillende klassen van RNA. Rna polymerase I, gelokaliseerd in de nucleus, schrijft genen af coderend voor procursor rRNA (pre-rRNA), dat verwerkt wordt in 28S, 5,85S en 18S rRNA’s. RNApolymerase III schrijft genen af die coderen voor tRNA’s, 5S rRNA en een gamma aan kleine, stabiele RNA’s, waaronder één betrokken in RNA splicing (U6) en de RNA component van het signaal-herkennend partikel (SRP) betrokken in de sturing van ontluikende proteïnen naar het endoplasmatisch reticulum. RNA polymerase II schrijft alle proteïne-coderende genen af; dat wil zeggen dat het functioneert in de productie van mRNA’s. RNA polymerase II produceert ook vier van de vijf kleine nucleaire RNA’s die deelnemen in de RNA splicing. Elk van de drie eukaryote RNA polymerasen is complexer dan E. Coli RNA polymerase, hoewel hun structuren gelijkaardig zijn. Alle drie bevatten twee grote subeenheden en 10-14 kleinere subeenheden, waarvan sommigen aanwezig zijn in twee of alle drie de polymerasen. De best gekarakterisserde eukaryotische RNA polymerasen zijn deze van gist S. Cerevisiae. Elk van de gist genen coderend voor de polymerase subeenheden werd gekloond en de sequentie werd bepaald en de effecten van gen-knock-out mutaties werden gekarakteriseerd. Bovendien werd de driedimensionele structuur van gist RNA polymerase II, zonder twee nietessentiële subeenheden, bepaald. De drie nucleaire RNA polymerasen van alle eukaryoten tot nu toe onderzocht zijn zeer gelijkend op deze van gist. De twee grote subeenheden (RPB1 en RPB2) van de drie eukaryote RNA polymerasen zijn verwant aan elkaar en zijn gelijkend op respectievelijk de E. Coli β’ en β subeenheden. Elk van de eukaryotische polymerasen bevat ook een ω-achtige en twee niet-identieke α-achtige subeenheden. De grote gelijkaardigheid in de structuren van deze kern subeenheden in RNA polymerasen van verschillende bronnen duidt aan dat dit enzyme vroeg in de evolutie ontstond en grotendeels bewaard bleef. Dit lijkt logisch voor een enzyme dat een proces katalyseert dat zo basis is als het copiëren van RNA vanaf DNA. Naast hun kernsubeenheden verwant aan de E. Coli RNA polymerase subeenheden, bevatten alle drie gist RNA polymerasen vier bijkomende kleine subeenheden, gemeen aan elkaar(?????) maar niet aan het bacteriële RNA polymerase. Tenslotte heeft elke eukaryotisch polymerase verschillende enzyme-specifieke subeenheden die niet aanwezig zijn in de andere twee polymerasen. Gen-knockout experimenten in gist duiden aan dat de meeste van deze subeenheden essentiëel zijn voor de
leefbaarheid van de cel. Vernietiging van enkele polymerase subeenheid genen die niet absoluut essentiëel zijn voor de leefbaarheid resulteert des al niet te min in zeer zwak groeiende cellen. Dus lijkt het dat alle subeenheden noodzakelijk zijn opdat eukaryoot RNA polymerasen normaal functioneren. De grootste subeenheid in RNA polymerase II heeft een essentiële carboxylterminale herhaling Het carboxyl einde van de grootste subeenheid van RNA polymerase II (RPB1) bevat een stukje van zeven aminozuren op bijna precies herhaalde meerdere tijden. Noch RNA polymerase I noch III bevatten deze herhaarlde eenheden. Deze heptapeptide herhaling, met een consensus sequentie Tyr-Ser-Pro-Thr-Ser-Pro-Ser, is gekend als het carboxyl-terminale domein (CDT). Gist RNA polymerase II bevat 26 of meer herhalingen, het zoogdierlijke enzyme heeft 52 herhalingen en een tussenliggend aantal herhalingen komt voor in RNA polymerase II van bijna alle andere eukaryoten. Het CDT is cruciaal voor de leefbaarheid en tenminste 10kopie van de herhaling moeten aanwezig zijn opdat gist kan overleven. In vitro experimenten met model promotoren toonde eerst dat RNA polymerase II moleculen die de transcriptie initiëren een niet-gefosforyleerd CTD hebben. Eens het polymerase de transcriptie initiëert en weg begint te bewegen van de promotor, worden vele van de serine en sommige tyrosine residu’s in het CDT gefosforyleerd. Analyse van polyteen chromosomen van Drosophila speeksel klieren geprepareerd juist voor de popping van de larve duiden aan dat het CDT ook gefosforyleerd wordt tijdens in vivo transcriptie. De grote chromosomale “puffs” op dit moment in de ontwikkeling begonnen waar het genoom zeer actief afgeschreven wordt. (?????) Kleuring met antilichamen specifiek voor het gefosforyleerde of niet-gefosforyleerde CTD toonde aan dat RNA polymerase II geasscoieerd met de sterk afgeschreven opgeblazen(puffed) regio’s bevat een gefosforyleerd CTD. RNA polymerase II initieert de transcriptie aan DNA sequenties overeenkomend met de 5’cap van mRNA’s Verschillende experimentele benaderingen zijn gebruikt geweest om DNA sequenties te identificeren aan dewelke RNA polymerase II de transcriptie initiëert. Benaderende plaatsbepaling van de transcriptie start sit is mogelijk door de blootstelling van gekweekte cellen of geïsoleerde nuclei aan 32P-gelabelde ribonucleotiden voor zeer korte tijden, zoals vroeger beschreven. Nadat de resulterende gelabeld ontluikende transcripten gescheiden worden op basis van hun ketenlengte, wordt elke grootte fractie geïncubeerd onder hybridisatie condities met overlappende restrictie fragmenten die de DNA regio van interesse omgeven. Het restrictie fragment dat hybridiseert aan de korste gelabelde ontluikende keten, net als aan al de langere ketens, bevat de transcriptie start site. Eén van de eerste transcriptie eenheden om geanalyseerd te worden op deze manier was de belangrijke late (?) transcriptie eenheid van het adenovirus. Deze analyse duidde aan dat de transcriptie geïnitieerd werd in een regio ongeveer 6kb van het linker einde van het viraal genoom. Het precieze basepaar waar RNA polymerase II de transcriptie in de adenovirus late transcriptie eenheid initieerd werd bepaald door de analyse van de RNA’s gesynthetiseerd tijdens in vitro transcriptie van adenovirus DNA restrictie fragmenten die ietswat upstream en dowstream uitsteken van de benaderde initiatie regio bepaad door ontluikende-transcript analyse. Het grondgedachte van dit experiment
en de typische resultaten worden geïllustreerd in figuur 11-8. De RNA transcripten gesynthetiseerd in vitro door RNA polymerase II vanaf de start site bepaald in dit experiment bevatte een RNA cap structuur identiek aan deze aanwezig aan het 5’einde van bijna alle eukaryote mRNA’s. Deze 5’cap was toegevoegd door enzymen in het nucleaire extract, die enkel een cap kunnen toevoegen aan een RNA dat een 5’ tri- of difosfaat heeft. Vermits een 5’einde geleverd door klieving van een langer RNA een 5’monofosfaat zou hebben, zou het niet gecapt kunne worden. Bijgevolg besloten onderozkers dat het gecapte nucleotide voortgebracht bij de in vitro transcriptie reactie het nucleotide moest zijn met dewelke de transcriptie geïniteerd was. De bevinding dat de sequentie aan de 5’einden van de RNA transcripten geproduceerd in vitro dezelfde is als aan het 5’einde van late adenovirus mRNA’s geïsoleerd van cellen bevestigde dat het gecapte nucleotide van adenovirus late mRNA’s samenvalt met de transcriptie-initiatie site. Gelijkaardige in vitro transcriptie analysen met andere gekloneerde eukaryote genen hebben gelijkaardige resultaten opgeleverd. In elk geval was de start site gevonden gelijk aan de gecapte 5’sequentie van het overeenkomstige mRNA. Dus begint de synthese van eukaryote precursoren van mRNA’s door RNA polymerase II aan de DNA sequentie coderend voor het het gecapte 5’einde van het mRNA. Vandaag wordt dat de transcriptie start site voor een pas gekarakteriseerd mRNA gewoonlijk bepaald door simpelweg de DNA sequentie te identificeren die codeert voor het 5’einde van het mRNA. KEY CONCEPTS OF SECTION 11.1 Overzicht van eukaryote gen controle en RNA polymerasen Het primaire doel van gencontrole in meercellige organismen is de uitvoering van precieze ontwikkelings beslissingen zodat de gepaste genen tot uitdrukking komen in de juiste cellen tijdens de ontwikkeling en cellulaire diffrentiatie. Transcriptionele controle is het primaire middel voor de regulatie van genexpressie in eukaryoten, net als in bacteriën. In eukaryote genomen kunnen DNA transcriptie controle elementen vele kilobasen verwijderd van de promotor die ze reguleren verwijderd zijn. Verschillende controle regio’s kunnen de transcruiptie van het zelfde gen in verschillende celtypes controleren. Eukaryoten bevatten drie soorten nucleaire RNA polymerasen. Alle drie bevatten twee grote en drie kleinere kern subeenheden met homologie aan de β’, β, α en ω subeenheden van E. Coli RNA polymerase, net als verschillende bijkomende kleine subeenheden. RNA polymerase I synthetiseert enkel pre-rRNA. RNA polymerase II synthetiseert mRNA’s en bepaalde kleine nucleiare RNA’s die deelnemen in mRNA splicing. RNA polymerase III synthetiseert tRNA’s, 5S rRNA en verschillende andere relatief korte stabiele RNA’s. Het carboxyl-terminale domein (CTD) in de grootste subeenheid van RNA polymerase II wordt gefosforyleerd tijdens de transcriptie initiatie en blijft gefosforyleerd als het enzyme de matrijs afschrijft. RNA polymerase II initieert de transcriptie van genen aan de nucleotiden in de DNA matrijs die overeenkomt met de 5’nucleotide die gecapt wordt in het gecodeerde mRNA. (????)
11.2 Regulatorische sequenties in proteïne-coderende genen Zoals vermeld in de vorige sectie wordt de expressie van eukaryote proteïnecoderende genen gereguleerd door meerdere proteïne-bindende DNA sequenties, in het algemeen naar verwezen als transcriptie-controle regio’s. Deze omvatten promotoren en andere soorten van controle elementen gelokaliseerd nabij de transcriptie start siten, net als sequenties gelokaliseerd ver weg van de genen die ze reguleren. In deze sectie bekijken we de eigenschappen van de verschillende controle-elementen gevonden in eukaryote proteïne)coderende genen en bepaalde technieken die gebruikt worden om hen te identificeren. De TATA box, iniatoren en CpG eilanden functioneren als promotors in eukaryotisch DNA De eerste genen, waarvan de sequentie bepaald werd en die bestudeerd waren in in vitro transcriptie systemen, waren virale genen en cellulaire proteïne-coderende genen die zeer actief afgeschreven werden ofwel op welbepaalde momenten in de celcyclus ofwel in specifiek gediffrentiëerde celtypes. In al deze snel afgeschreven genen werd een bewaarde sequentie, de TATA-box genaamd, ongeveer 25-35 bp upstream van de startsite gevonden. Mutagenese studies hebben aangetoond dat een enkel-base verandering in deze nucleotide sequentiedrastische verlagingen in vitro transcriptie door RNA polymerase II van de genen grenzend aan een TATA-box teweeg brengt. In de meeste gevallen beïnvloeden sequentie veranderingen tussen de TATA-box en de startsite de transcriptie snelheid niet aanzienlijk. Als de bp tussen de TATA-box en de normale startsite verwijderd worden, begint de transcriptie van de gewijzigde, verkorte matrijs aan een nieuwe site ongeveer 25bp downstream van de TATA-box. Als gevolg werkt de TATA-box op een gelijkaardige manier als een E. Coli promotor om RNA polymerase II te positioneren voor de transcriptie initiatie. In plaats van een TATA-box bevatten bepaalde eukaryote genen een alternatief promotor element, een initiator genoemd. De meeste natuurlijk voorkomende initiator elementen hebben een cytosine (C) aan de –1 positie en een adenine (A) residu aan de transcriptie start site (+1).Gerichtte mutagenese van zoogdier genen met een initiator-bevattende promotor heeft onthuld dat de nucleotide sequentie die de start site onmiddelijk omgeeft de sterkte bepaalt van zulke promotoren. In tegenstelling tot de bewaarde TATA-box sequentie is er echter slechts een extreem gedegenereerde initiator consensus sequentie bepaald: (5’) Y-Y-A+1-N-T/A-Y-Y-Y(3’) waar A+1 de base is aan dewelke de transcriptie start, Y is een pyrimidine (C of T), N is één van de vier basen en T/A is T of A op positie +3. De transcriptie van genen met promotoren die een TATA-box of initiator element bevat, begint aan een welbepaalde initiatie site. De transcriptie van vele proteïnecoderende genen werd echter aangetoond te beginnen aan één van de meerdere mogelijke sites over een uitgestrekte regio, vaak 20-200 bp in lengte. Als resultaat geven zulke genen het ontstaan aan mRNA’s met meerdere alternatieve 5’einden. Deze genen, die in het algemeen aan lage snelheden worden afgeschreven (vb genen coderend voor enzymen van het intermediaire metabolisme, vaak ‘housekeeping’ genen genoemd) bevatten geen TATA-box of initiator. De meeste genen van deze soort bevatten een CG-rijk stuk van 20-50 nucleotiden binnen de +/100bp upstream van de startsite regio. Het dinucleotide CG wordt statistisch
ondervertegenwoordigd in vertebraat DNA’s en de aanwezigheid van een CG-rijke regio, of CpG eiland, juist upstream van een start site is een duidelijke nietwillekeurige distributie. Voor deze reden suggereert de aanwezigheid van een CpG eiland in genomisch DNA dat het een transcriptie-initiatie regio kan bevatten. Promotor-proximale elementen helpen eukaryote genen te reguleren Recombinant DNA technieken werden gebruikt de nucleotide sequenties upstream van de start siten van de verschillende eukaryote genen systematisch te muteren om de transcriptie-controle regio’s te identificeren. Tot nu toe werden honderden eukaryote genen geanalyseerd en scores(?) van transcriptie-controle regio’s werden geïdentificeerd. Naar deze controle-elementen, samen met de TATA-box of initiator wordt vaak naar verwezen als de promotor van het gen die ze reguleren. Wij verkiezen echter de term promotor te reserveren voor de TATA-box of de initiator sequenties die de initiatie site bepalen in de matrijs. We gebruiken de term promotor-proximale elementen voor de controle regio’s liggend binnen de 100-200 bp upstream van de startsite. In sommige gevallen zijn de promotor-proximale elementen cel-type specifiek; dat wil zeggen dat ze enkel functioneren in specifieke gediffrentiëerde celtypes. Eén frequent genomen aanpak om de upstream grens te bepalen van een transcriptie-controle regio voor een zoogdierlijk gen heeft betrekking op de constructie van een set van 5’deleties zoals vroeger besproken. Eens de 5’grens van een transcriptie-controle regio bepaald is, kan de analyse van linker scanning mutaties de sequenties met regulatorische functies die liggen tussen de grens en de transcriptie start-site uiterst precies aanduiden. Bij deze aanpak wordt een set van constructies met opeenvolgende overlappende mutaties geanalyseerd voor hun effect op de expressie van een reporter gen of de productie van een specifiek mRNA. Eén van de eerste gebruiken van dit soort analyse identificeerde de promotorproximale elementen van het thymidine kinase (tk) gen van het herpes simplex virus (HSV). De resultaten toonden aan dat de DNA regio upstream van het HSV tk gen drie gescheiden transcriptie-controle sequenties bevat: een TATA-box in het interval van –32 tot –16 en twee andere controle elementen verder upstream. Om de spatie beperkingen van de controle elementen in de HSV tk promotor regio geïdentificeerd door analyse van linker scanning mutaties te testen, vervaardigde en analyseerde de onderzoekers constructies die kleine deleties en inserties bevatten tussen de elementen. Veranderingen in de tussenliggende ruimten tussen de promotor en de promotor-proximale controle-elementen van 20 nucleotiden of minder hadden weinig effect. Inserties van 30 tot 50 bp tussen een promotor-proximaal element en de TATA box was echter gelijkwaardig aan de deletie van het element. Gelijkaardige analysen van andere eukaryote promotoren hebben ook aangeduid dat de aanzienlijke flexibiliteit in de tussenruimte tussen promotor-proximale elementen in het algemeen getolereerd wordt, maar scheidingen van verschillende tientallen bp kunnen de transcriptie verlagen (of verhogen bij remmers). Distant enhancers stimuleren vaak de transcriptie door RNA polymeraseII Zoals vroeger vermeld kan de transcriptie van vele eukaryote promotoren gestimuleerd worden door controle elementen 1000den bp van de start site verwijderd. Zulke lange afstands transcriptie-controle elementen, naar verwezen als enhancers, zijn gewoon in eukaryote genomen maar tamelijk zeldzaam in bacteriële
genomen. De eerst ontdekte enhancer die de transcriptie van eukaryote genen stimuleerde bevond zich in rrn 366-bp fragment van het simian virus 40 (SV40) genoom. Verdere analyse van deze regio van SV40 DNA onthulde dat een +/- 100bp sequentie +/- 100 bp upstream liggend van de SV40 vroege transcriptie start site verantwoordelijk was voor zijn vermogen de transcriptie te versterken. Bij SV40 functioneert deze enhancer sequentie om de transcriptie van virale promotoren te stimuleren. De SV40 enhancer stimuleert echter de transcriptie van alle zoogdierlijke promotoren die getest werden wanneer het geïnserteerd wordt in één van beide richtingen ergens in een plasmide dat de test promotor draagt, zelfs wanneer het duizenden bp van de start site verwijderd is. Een uitvoerige linker scanning mutationele analyse van de SV40 enhancer duidde aan dat hij samengesteld is uit meerdere individuele elementen, die elk bijdragen tot de totale activiteit van de enhancer. Zoals later bepsproken is elk van deze regulatorische elementen een proteïne bindende site. Snel na de ontdekking van de SV40 enhancer werden enhancers geïdentificeerd in andere virale genomen en in eukaryotisch cellulair DNA. Sommige van deze controle-elementen waren gelokaliseerd op 50 of meer kilobasen van de promotor die ze controleerden. Analysen van vele verschillende eukaryote cellulaire enhancers hebben aangetoond dat ze upstream van een promotor, downstream van een promotor, downstream van een promotor in een intron of zelfs downstream van het finale exon kunnen voorkomen. Zoals de promotor-proximale elementen zijn vele enhancers cel-soort-specifiek. Bijvoorbeeld: de genen coderend voor antilichamen (immunoglobulines) bevatten een enhancer binnen de tweede intron die de transcriptie kan stimuleren van alle getestte promotoren, maar enkel in B lymfocyten, het celtype dat normaal antilichamen tot uitdrukking brengt. Analysen van de effecten van deleties en linker scanning mutaties in cellulaire enhancers hebben aangetoond dat ze, zoals de SV40 enhancer, gewoonlijk samengesteld zijn uit meerdere elementen die bijdragen tot de globale activiteit van de enhancer. De meeste eukaryote genen worden gereguleerd door meerdere transcriptie-controle elementen Initieel dacht men dat enhancers en promotor-proximale elementen verschillende soorten transcriptie-controle elementen waren. Als meer enhancer en promotorproximale elementen geanalyseerd waren werden de verschillen tussen hen echter minder duidelijk. Bijvoorbeeld: beide soorten elementen kunnen in het algemeen de transcriptie stimuleren zelfs wanneer omgedraaid worden en beide soorten zijn vaak cel-type-specifiek.De generale consensus is nu dat een spectrum van controle elementen de transcriptie door RNA polymerase II reguleert. Aan het ene uiteinde vindt men de enhancers, die de transcriptie kunnen stimuleren van een promotor die 10duizenden bp verwijderd is (vb de SV40 enhancer). Aan het andere uiteinde vindt men de promotor-proximale elementen, zoals de upstream elementen die het HSV tk gen controleren, die hun invloed verliezen wanneer ze een 30-50bp verder verwiderd worden van de promotor. Onderzoekers hebben een groot aantal transcriptiecontrole elementen geïdentificeerd die de transcriptie kunnen stimuleren vanop afstanden tussen deze twee extremen. Figuur 11-12a vat de lokaties van transcriptie controle sequenties voor een hypothetisch zoogdierlijk gen samen. De start site aan de welke de transcriptie begint, codeert het eerste (5’) nucleotide van de eerste exon van een mRNA, het
nucleotide dat gecapt wordt. Voor vele genen, vooral deze die overvloedig uitgedrukte eiwitten coderen, dirigeert een TATA-box gelokaliseerd op ongeveer 2535 bp upstream van de start site het RNA polymerase II de transcriptie te beginnen aan het gepaste nucleotide. Promotor-proximale elementen, die relatief kort zijn (+/10-20bp) zijn gelokaliseerd binnen de eerste +/- 200bp upstream van de start site. In tegenstelling daarmee zijn enhancers gewoonlijk +/-100 bp lang en zijn ze samengesteld uit meerdere elementen van +/-10-20 bp. Enhancers kunnen gelokaliseerd zijn tot 50kilobasen upstream of downstream van de start site of binnen een intron. Vele zoogdierlijke genen worden gecontroleerd door meer dan één enhancer regio. Het S. Cerevisiae genoom bevat regulatorische elementen, upstream activating sequences (UAS’s) genoemd, die functioneren op een gelijkaardige manier als de enhancers en promotor-proximale elementen bij hogere eukaryoten. De meeste gistgenen bevat enkel één UAS, dat gewoonlijk binnen een weinig 100den bp van de start site ligt. Bovendien bevat S. Cerevisiae een TATA box +/-90 bp upstream van de transcriptie start site. KEY CONCEPS OF SECTION 11.2 Regulatorische sequenties in proteïne-coderende genen De expressie van eukaryotische proteïne-coderende genen wordt in het algemeen gereguleerd via meerdere proteïne-bindende controle regio’s die dicht of ver van de start site gelokaliseerd zijn. Promotoren dirigeren de binding van RNA polymerase II aan DNA, bepalen de site van transcriptie initiatie en beïnvloeden de transcriptie snelheid. De drie principiële types van promotor sequenties werden geïdentificeerd in ekaryotisch DNA. De TATA-box, de meest algemene, is overheersend aanwezig in snel afgescreven genen. Initiator promotoren worden gevonden in bepaalde genen en CpG eilanden zijn typisch voor genen die aan een lage snelheid afgeschreven worden. Promotor-proximale elementen komen voor binnen +/- 200bp upstream van een start site. Verschillende zulke elementen, zo’n 10-20 bp bevattend, kunnen een bepaald gen helpen reguleren. Enhancers, die meerdere korte controle elementen bevatten, kunnen gelokaliseerd zijn van 200bp tot tientallen kilobasen upstream of downstream van een promotor, in een intron of downstream van de finale exon van een gen. Promotor-proximale elementen en enehancers zijn vaak cel-type-specifiek, enkel functionerend in specifiek gediffrentieerde celtypes. Bp=baseparen
11.3 activatoren en repressoren van transcriptie De verschillende transcriptie-controle elementen gevonden in eukaryotisch DNA zijn bindings siten voor regulatorische proteïnen. In deze sectie bespreken we de identificatie, opzuivering en structuren van deze transcriptie factoren, die functioneren om de expressie van eukaryote proteïne-coderende genen te activeren of te onderdrukken. Footprinting en gel-shift analysen detecteren proteïne-DNA interacties
In gist, Drosophila en andere genetisch goed te bewerken eukaryoten werden reeds vele genen coderend voor transcriptionele activatoren en repressoren geïdentificeerd door klassieke genetische analyses zoals deze beschreven in chapter9. Bij zoogdieren en andere vertebraten, die minder ontvankelijk zijn voor zulke genetische analysen, werden de meeste transcriptie factoren eerst gedetecteerd en daarna opgezuiverd door biochemische technieken. In deze aanpak wordt een DNA regulatie element dat werd geïdentificeerd door de soorten mutationele analysen beschreven in de vorige sectie gebruikt om de cognate proteïnen te identificeren die er specifiek aan binden. Twee algemene technieken voor de opsporing van zulke cognate proteïnen zijn DNase I footprinting en de elektroforetische mobility shift analyse. DNase I footprinting neemt zijn voordeel uit het feit dat wanneer een eiwit gebonden is aan een regio van DNA, het de DNA regio beschermd tegen vertering door nucleasen. Zoals geïllustreerd in figuur 11-13, wanneer stalen van een DNa fragment die gelabeld is aan één einde worden verteerd in de aan- en afwezigheid van een DNA-bindings proteïne en dan gedenatureerd, geëlektroforeesd en de resulterende gel onderworpen aan autoradigrafie, de regio beschermd door het gebonden proteïne verschijnt als een gat of “footprint” in de serie van banden resulterend van de vertering in de afwezigheid van het proteïne. Wanneer footprinting wordt uitgevoerd met een DNA fragment dat een gekend DNA controle element bevat, duidt het verschijnen van een footprint op de aanwezigheid van een transcriptie factor, die bindt aan dat controle-element, in het proteïne staal dat geanalyseerd wordt. Footprinting identificeert ook de specifieke DNA sequentie waaraan de transcriptie factor bindt. De elektroforetische mobiliteit shift assay (EMSA), ook de gel-shift of band-shift analyse genoemd, is praktischer dan de footprint analyse voor de kwantitatieve analyse van DNA-bindende proteïnen. In het algemeen wordt de elektroforetische mobiliteit van een DNA fragment verlaagd wanneer het een complex gevormd heeft met een proteïne, wat een shift in de locatie van de fragment band veroorzaakt. Deze analyse kan gebruikt worden om een transcriptie factor in proteïne fracties geïncubeerd met een radiogelabelde DNA fragment (dat een gekend controle element bevat) op te sporen. Bij de biochemische isolatie van een transcriptie factor wordt een extract van celnucleus gewoonlijk opeenvolgend onderworpen aan verschillende soorten kolom chromatografie. Geëlueerde fracties van de kolommen worden geanalyseerd door DNase I footprinting of EMSA gebruik makend van DNA fragmenten die een geïdentificeerde regulatorisch element bevatten. Fracties die een proteïne bevatten dat bindt aan het regulatorische element in deze analysen bevatten waarschijnlijk een vermeende transcriptie factor. Een krachtige techniek meestal gebruikt voor de finale stap in de opzuivering van transcriptie factoren is de sequentiespecifieke DNA affiniteitchromatografie, een bepaalde soort van affiniteitchromatografie in dewelke lange DNA strengen die meerdere kopies van de transcriptie factorbinding site bevatten gekoppeld worden aan een kolommatrix. Als finale test dat een geïsoleerd proteïne in feite een transcriptie factor is, wordt zijn vermogen de transcriptie van een een matrijs die de overeenkomstige proteïne-bindings sites bevat geanalyseerd in een in vitro transcriptie reactie. Figuur 11-15 toont de resultaten van zulke analyse
voor SP1, een transcriptiefactor die bindt aan GC-rijke sequenties, daarbij de transcriptie activerend van nabijgelegen promotoren. Activatoren zijn modulaire proteïnen samengesteld uit verschillende functionele domeinen Studies met een gist transcriptie activator, GAL4 genoemd, leverde vroeg inzicht in de domein structuur van transcriptie factoren. Het gen coderend voor het GAL4 proteïne, dat de expressie van enzymen nodig om galactose te metaboliseren promoot, was geïdentificeerd door complementatie analyse van gal4 mutanten. Gestuurde mutagenese studies zoals deze vroeger beschreven identificeerde UAS’s voor de genen geactiveerd door GAL4. Elk van deze UAS’s bleek één of meer kopies van een verwante 17-bp sequentie, UAS GAL genoemd, te bevatten. DNase I footprinting analysen met recombinant GAL4 proteïne geproduceerd in E. coli vanaf het gist GAL4 gen toonde dat Gal4 proteïne bindt aan UAS GAL sequenties. Wanneer een kopie van UASGAL gekloneerd was upstream van een TATA-box gevolgd door een lacZ reporter gen, was de expressie van lacZ geactiveerd in galactose media in wild-type cellen, maar niet in gal4 mutanten. Deze resultaten toonde dat UAS GAL een transcriptiecontrole element is geactiveerd door het GAL4 proteïne in galactose media. Een opmerkelijke set van experimenten met gal4 deletie mutanten toonde aan dat de GAL4 transcriptie factor wordt samengesteld uit scheidbare functionele domeinen: een N-terminaal DNA-bindings domein, dat bindt aan specifieke DNA sequenties en een C-terminaal activatie domein, dat interageert met andere proteïnen om de transcriptie te stimuleren van een nabijgelegen promotor. Wanneer het N-terminale DNA-bindings domein van GAL4 direct gefuseerd werd aan verschillende van zijn Cterminale fragmenten, behielden de resulterende afgeknotte proteïnen het vermogen de expressie van een reporter gen te stimuleren in een in vivo analyse zoals datgene geschets in figuur 11-16. Dus is het interne deel van het eiwit niet vereist voor het functioneren van GAL4 als transcriptie factor. Gelijkaardige experimenten met een andere gist transcriptie factor, GCN4, die de genen reguleert die vereist zijn voor de synthese van vele aminozuren, duidde aan dat het een +/- 60-aa DNA bindings domein aan zijn C-terminus bevat en een +/- 20-aa activatie domein dicht bij het midden van zijn sequentie. Verder bewijs voor het bestaan van verschillende activatie domeinen in GAL4 en GCN4 kwamen van experimenten in dewelke hun activatie domeinen gefuseerd werden aan een DNA-bindingsdomein van een geheel onverwant E. coli DNAbindings proteïne. Wanneer deze fusie proteïnen geanalyseerd werden in vivo, activeerden ze de transcriptie van een reportergen dat de cognate site van het E. coli proteïne bevatte. Dus de functionele transcriptie factoren kunnen geconstrueerd worden van geheel nieuwe combinaties van prokaryote en eukaryote elementen. Studies zoals deze zijn uitgevoerd met vele eukaryote activatoren. Het structurele model van eukaryote activatoren dat afgeleid is van deze studies is een modulair model in dewelke één of meer activatie domeinen verbonden zijn met een sequentiespecifiek DNA-bindings domein via flexibele proteïne domeinen. In sommige gevallen dragen de aminozuren in het DNA-bindings domein ook bij tot de transcriptionele activatie. Zoals besproken in latere sectie dacht men dat activatie domeinen functioneerden door de binding van andere proteïnen betrokken in de transcriptie. De aanwezigheid van flexibele domeinen die de DNA-bindings domeinen
verbinden aan de activatie domeinen kunnen verklaren waarom veranderingen in de tussenruimte tussen controle elementen zo goed getolereerd worden in eukaryotische controle regio’s. Dus zelfs wanneer de posities van transcriptie factoren gebonden aan DNA verschoven worden ten opzichte van elkaar , kunnen hun activatie domeinen nog in staat zijn te interageren omdat ze vastgehecht zijn met hun DNA-bindings domeinen via flexibele proteïne regio’s. Repressoren zijn de functionele tegenhangers van activatoren De eukaryote transcriptie wordt gereguleerd door repressoren net als door activatoren. Bijvoorbeeld: genetici hebben mutaties in gist geïdentificeerd die resulteren in voortdurende hoge expressie van bepaalde genen. Deze soort van ongeregelde, abnormaal hoge expressie wordt constitutieve expressie genoemd en resulteert door de inactivatie van een repressor die normaal gezien de transcriptie van deze genen remt. Gelijkaardig zijn mutanten van Drosophila en C. elegans geïsoleerd die gebrekig zijn in de embryologische ontwikkeling omdat zegenen in embryologische cellen tot uitdrukking brengen waar ze normaal onderdrukt zijn. De mutaties in deze mutanten inactiveren repressoren, wat leidt tot abnormale ontwikkeling. Repressor-bindings sites in DNA werden geïdentificeerd door systematische linker scanning mutatie analysen gelijkaardig aan deze geschetst in figuur 11-10. IN dit soort analyse leidt de mutatie van een activator-bindings site tot een verlaagde expressie van een reporter gen. Repressor proteïnen die binden aan zulke sites kunnen opgezuiverd worden en geanalyseerd gebruik makend van dezelfde biochemische technieken als vroeger beschreven voor activator proteïnen. Eukaryotische transcriptie repressoren zijn de functionele tegenhangers van de activatoren. Ze kunnen de transcriptie van een gen inhibiteren dat ze normaal gezien niet reguleren wanneer hun cognate bindings sites geplaatst worden binnen enkele honderden bp van de startsite van het gen. Zoals activatoren zijn de meeste eukaryote repressoren modulaire proteïnen die twee functionele domeinen hebben: een DNA bindings domein en een repressie domein. Zoals activatie domeinen functioneren repressie domeinen verder wanneer ze gefuseerd worden aan een ander soort DNA bindings domein. Als bindings sites voor dit tweede DNA-bindings domein ingevoegd worden binnen enkele honderden bp van een promotor, remt de expressie van de fusie de transcriptie van de promotor. Ook zoals activatie domeinen functioneren repressie domeinen door interacties met andere proteïnen zoals later besproken zal worden. De afwezigheid van gepaste repressor activiteit kan verwoestende gevolgen hebben. Bijvoorbeeld: het proteïne gecodeerd door de Wilms’tumor (WT1) gen is een repressor die preferentieel uitgedrukt wordt in de ontwikkelende nier. Kinderen die mutaties in zowel de maternale als paternale WT1 genen erven, zodat ze geen functioneel WT1 proteïne produceren, ontwikkelen onveranderlijk niertumoren vroeg in hun leven. Het WT1 proteïne bindt aan de controle regio van het gen coderend voor een transcriptie activator, EGR-1 genoemd. Dit gen, zoals vele andere eukaryote genen, is onderwerp van zowel repressie als activatie. Binding door WT1 onderdrukt de transcriptie van het EGR-1 gen zonder de binding van activatoren te onderdrukken die normaal de expressie van dit gen stimuleren.
DNA-bindings domeinen kunnen opgedeeld worden in vele structurele soorten De DNA-bindings domeinen van eukaryote activatoren en repressoren bevatten een variëteit aan structurele motieven die binden aan specifieke DNA sequenties. Het vermogen van DNA-bindings proteïnen te binden aan specifieke DNA sequenties resulteert meestal van niet-covalente interacties tussen atomen in een α helix in de DNA-bindings domein en atomen aan de randen van de basen in een major groeve in het DNA. Interacties met suiker-fosfaat ruggegraat atomen en in sommige gevallen met atomen in een DNA minor groeve dragen ook bij tot de binding. De principes van specifieke proteïne-DNA interacties werden voor het eerst ontdekt tijdens de studie van bacteriële repressoren. Vele bacteriële repressoren zijn dimerische proteïnen in dewelke een α helix van elke monomeer invoegt in een major groeve in de DNA helix. Deze α helix wordt de recognitie helix of sequentiereading helix genoemd omdat de meeste van de aminozuurzijketens die contact hebben met DNA uit deze helix uitsteken. De herkennings helix die uitsteken van het oppervlak van bacteriële repressoren om de DNA major groeve binnen te treden en meerdere, specifieke interacties te maken met atomen in het DNA wordt gewoonlijk ondersteund in de proteïne structuur in deel door hydrofobe interacties met een tweede α helix er juist N-terminaal aan. (????) Dit structurele element, dat aanwezig is in vele bacteriële repressoren, wordt een helix-turn-helix motief genoemd. Vele bijkomende motieven die een α helix kan presenteren aan de major groeve van DNA worden gevonden in eukaryote transcriptie factoren, die vaak opgedeeld worden volgens het soort DNA-bindings domeinen die ze bevatten. Omdat de meeste van deze motieven karakteriserende consensus aminozuur sequenties hebben, kunnen vers gekarakteriseerde transcriptie factoren vaak geklasseerd worden eens de overeenkomstige genen of cDNA’s gekloneerd zijn en de sequentie bepaald is. De genomen van hogere eukaryoten coderen voor dozijnen klasses van DNA bindings domeinen en honderden tot duizenden transcriptie factoren. Het humane genoom, bijvoorbeeld, codeert voor +/- 2000 transcriptie factoren. Hier introduceren we enkele veel voorkomende klassen van DNA bindings proteïnen wiens driedimensionale structuren bepaald zijn. IN al deze voorbeelden en vele andere transcriptie factoren, is er tenminste één α helix ingevoegd in een major groeve van DNA. Sommige transcriptie factoren bevatten echter alternatieve structurele motieven (vb β strengen en lussen) die interageren met DNA. Homeodomein proteïnen Vele eukaryote transcriptie factoren die functioneren tijdens de ontwikkeling bevatten een bewaarde 60-residue DNA-bindings motief dat gelijkaardig is aan het helix-turn-helix motief van bacteriële repressoren. Homeodomein proteïnen genoemd waren deze transcriptie factoren de eerste geïdentificeerde in Drosofila mutanten in dewelke één lichaamsdeel getransformeerd was in een ander tijdens de ontwikkeling. De bewaarde homeodomezin sequentie werd ook gevonden in vertebraat transcriptie factoren, waaronder deze die een gelijkaardige master controle functie hebben in de menselijke ontwikkeling. Zink-vinger proteïnen Een aantal verschillende eukaryote proteïnen hebben regio’s die vouwen rond een centraal Zn2+ ion, een compact domein producerend van een
relatief korte lengte van de polypeptide keten. Een zinkvinger genoemd werd dit structurele motief voor het eerst herkend in DNA-bindings domeinen maar nu is gekend dat ze ook voorkomen in proteïnen die niet binden aan DNA. Hier beschrijven we twee van de verschillende klassen zinkvinger motieven die geïdentificeerd zijn in eukaryote transcriptie factoren. De C2H2 zinkvinger is het meest voorkomende DNA-bindings motief gecodeerd in het humane genoom en de genomen van de meeste andere meercellige dieren. Het is ook algemeen in meercellige planten, maar het is niet het dominante soort van DNA-bindings domein in planten zoals het is in dieren. Dit motief heeft een 23- tot 26 residue consensus sequenties die twee bewaarde cysteïne © en twee bewaarde histidine (H) residu’s bevat, wiens zijketen één Zn2+ ion binden. De naam “zinkvinger” was verzonnen omdat een tweedimensioneel diagram van de structuur op een vinger leek. Wanneer de driedimensionale structuur opgelost was, werd duidelijk dat de binding van het Zn2+ ion door de twee cysteïne en twee histidine residu’s het relatief korte polypeptide vouwt in een compact domein, dat kan een α helix ingevoegd in de major groeve van DNA zijn. Vele transcriptie factoren bevatten meerdere C2H2 zinkvingers, die interageren met opeenvolgende groepen van bp binnen de major groeve zoals de proteïnen de rond de DNA dubbele helix omgeslagen liggen. Een tweede soort zinkvinger structuur, aangeduid als de C4 zinkvinger (omdat het vier bewaarde cysteïne in contact staan met het Zn2+), wordt gevonden in +/- 50 humane transcriptie factoren. De eerste leden van deze klasse waren geïdentificeerd als specifieke intracellulaire hoge-affiniteits bindings proteïnen, of “receptoren”, voor steroïd hormonen, leiden tot de naam steroïd receptor superfamilie. Vermits gelijkaardige intracellulaire receptoren voor niet-steroïd hormonen later werden gevonden, worden deze transcriptie factoren nu gewoonlijke nucleaire receptoren genoemd. Het karakteristieke kenmerk van C4 zinkvingers is de aanwezigheid van twee groepen van vier cruciale cysteïnes, één naar elk einde van het 55- of 56-residu domein. Hoewel de C4 zinkvinger initiëel was genoemd naar de analogie met de C2H2zinkvinger, bleken de driedimensionale structuren van de proteïnen die deze bindingsmotieven bevatten nogal verschillend. Een bijzonder belangrijk verschil tussen de twee is dat de C2H2 zinkvinger proteïnen in het algemeen twee of meer herhaalde ving eenheden bevatten en binden als monomeren, terwijl C4 zinkervinger proteïnen gewoonlijk slechts twee vinger eenheden bevatten en in het algemeen binden aan DNA als homodimeren of heterodimeren. Homodimeren van de C4 zinkvinger DNA-bindings domeinen hebben een tweevoudige rotationele symmetrie. Als gevolg binden homodimerische nucleaire receptoren aan de consensus DNA sequenties die omgekeerde herhalingen zijn. Leucine-zipper proteïnen Een ander structureel motief aanwezig in de DNAbindings domeinen van een grote klasse van transcriptiefactoren bevat het hydrofobe aminozuur leucine aan elke zevende positie in de sequentie. Deze proteïnen binden aan DNA dimeren en mutagenese van de leucines toonde dat ze vereist waren voor de dimerisatie. Als gevolg was de naam leucine-zipper verzonnen om dit structurele motief aan te duiden. Het DNA-bindings domein van de gist GCN4 transcriptie factor vroeger vermeld is een leucine-zipper domein. X-ray kristallografie analyse van complexen tussen DNA
en het GCN4 DNA-bindings domein heeft getoond dat het dimerische proteïne twee uitstekende α helices bevat die het DNA molecule ‘vastgrijpen’, zoals de twee benen van een schaar, aan twee aangrenzende major groeves gescheiden door ongeveer een halve turn van de dubbele helix. De porties van de α helices die contact maken met het DNA omvatten positief geladen (basische) residu’s die interageren met fosfaten in de DNA ruggengraat en bijkomende residu’s die interageren met specifieke basen in de major groeve. GCN4 vormt dimeren via hydrofobe interacties tussen de C-terminale regio’s van de α helices, een coiled-coil structuur vormend. Deze structuur is gewoon in proteïnen die amfipathische α helices bevatten in dewelke hydrofobe aminozuur residu’s regelmatig geplaatst zijn afwisselend drie of vier posities uiteen in de sequentie, een lijn naar beneden aan één zijde van de α helix vormend. Deze hydrofobe stroken vormen de interagerende oppervlakken tussen de α helicale monomeren in een coiled-coil dimeer. Hoewel de eerste leucine-zipper transcriptie factors die geanalyseerd werden leucine residu’s bevatten aan elke zevende positie in de dimerisatie regio, werden daarna bijkomende DNA-bindings proteïnen geïdentificeerd die andere hydrofobe aminozuren in deze posities bevatten. Zoals leucine-zipper proteïnen vormen ze dimeren die een C-terminale coiled-coil dimerisatie regio en een N-terminaal DNAbindingsdomein bevatten. De term leucine-zipper (bZip) wordt nu frequent gebruikt om te verwijzen naar alle proteïnen met deze gemeenschappelijke kenmerken. Vele basic-zipper transcriptie factoren zijn heterodimeren van twee verschillende polypeptide ketens, die elk één basic-zipper domein bevatten. Basic Helix-Loop-Helix (bHLH) proteïnen Het DNA bindings domein van een andere klasse van dimerische transcriptie factoren bevat een structureel motief zeer gelijkend op het basic-zipper motief, met uitzondering dat een niet-helicale lus van de polypeptide keten twee α helicale regio’s scheidt in elke monomeer. Een basic helixloop-helix (bHLH) genoemd werd voorspeld dit motief uit de aminozuursequenties van deze proteïnen, die een N-terminale α helix met basische residu’s die interageren met DNA, een midden loop regio en een C-terminale regio met hydrofobe aminozuren geplaatst aan de intervallen karakteristiek voor een amfipatische α helix bevatten. Zoals bij de basic-zipper proteïnen kunnen verschillende bHLH proteïnen heterodimeren vormen. Transcriptie-factor interacties verhogen gen-controle opties Twee soorten van DNA-bindings proteïnen besporken in de vorige sectie –basiczipper proteïnen en bHLH proteïnen- bestaan vaak in alternatieve heterodimerische combinaties van monomeren. Andere klassen van transcriptie factoren (hier niet besproken) vormen ook heterodimerische proteïnen. Bij bepaalde heterodimerische transcriptiefactoren, heeft elke monomeer een DNA-bindings domein met evenwaardige sequentie specificiteit. In deze proteïnen beïnvloedt de vorming van alternatieve heterodimeren de DNA-bindings specificiteit niet, maar laat eerder toe dat de activatiedomeinen verbonden met elke monomeer bij elkaar gebracht worden in alternatieve combinaties in een enkele transcriptiefactor. Zoals we later zullen zien en in de volgende chapters kan de activiteit van individuele transcriptiefactoren gereguleerd worden door meerdere mechanismen. Als gevolg kan een enkel bZIP of bHLH DNA regulatorisch element in de controle regio van een gen verschillende
transcriptionele responsen teweeg brengen naar gelang welke bZIP of bHLH monomeren binden aan die site worden uitgedrukt in een bepaalde cel op een bepaald moment en hoe de activiteiten worden gereguleerd.(?????) Bij sommige heterodimerische transcriptiefactoren heeft elke monomeer echter een verschillende DNA-bindings specificiteit. De resulterende coimbinatie mogelijkheden verhogen het aantal van potentiële DNA sequenties die een familie transcriptiefactoren kan binden. Drie verschillende factor monomeren zouden theoretisch kunnen combineren om zes homo- en heterodimerische factoren te vormen, zoals geïllustreerd in figuur 11-23a. Vier verschillende factor monomeren zouden een totaal van 10 dimerische factoren vormen; vijf monomeren, 16 dimerische factoren; en zoverder. Bovendien zijn er inhibitorische factoren gekend die binden aan bepaalde basic-zipper en bHLH monomeren, daarbij hun binding aan DNA blokkerend. Wanneer deze inhibitie factoren uitgedrukt worden, onderdrukken ze transcriptionele activatie door de factoren waarmee ze interageren. De regels die de interacties van leden van een heterodimerische transcriptie-factor klasse bepalen zijn complex. Deze combinationele complexiteit breidt zowel het aantal DNA site vanwaar deze factoren de transcriptie activeren als de manieren waarop ze gereguleerd kunnen worden uit. Gelijkaardige combinationele transcriptionele regulatie wordt bereikt via de interactie van structureel onverwante transcriptie factoren gebonden aan dicht bij elkaar geplaatste bindings sites in DNA. Een voorbeeld is de interactie van de twee transcriptiefactoren, NFAT1 en AP1, die binden aan naburige sites in een samengesteld promotor-proximaal element dat het gen reguleerd dat codeert voor interleukon-2 (IL-2). De expressie van het IL-2 gen is cruciaal voor de immuunrespons, maar abnormale expressie van IL-2 kan leiden tot autoimmuun ziekten zoals rheumatoid arthritis. Noch NFAT noch AP1 binden aan zijn site in de IL2 controle regio in de afwezigheid van de ander. De affiniteiten van de factoren voor deze bepaalde NA sequenties zijn te laag opdat de individuele factoren een stabiel complex met DNA vormen. Wanneer echter zowel NFAT als AP1 aanwezig zijn, stabiliseren proteïne-proteïne interacties tussen hen het DNA ternaire complex samengesteld uit NFAT, AP1 en DNA. Zulke coöperatieve DNA binding van verschillende transcriptie factoren resulteert in een aanzienlijke combinatie complexiteit van de transcriptionele controle. Als resultaat kunnen de ongeveer 2000 transcriptiefactoren gecodeerd in het menselijke genoom binden aan DNA via een groter aantal coöperatieve interacties, resulterend in een unieke transcriptionele controle voor elk van de verschillende tienduizenden menselijke genen. In het geval van IL-2 gebeurt de transcriptie enkel wanneer NFAT geactiveerd wordt, resulterend in zijn transport van het cytoplasma naar de nucleus én de twee subeenheden van AP1 gesynthetiseerd worden. Deze gebeurtenissen worden gecontroleerd door gescheiden signaal trnasductie paden, wat de strenge controle van de IL-2 expressie toelaat. De coöperatieve binding door NFAT en AP1 gebeurt enkel wanneer hun zwakke bindings sites gelokaliseerd zijn aan op een precieze afstand, nogal dicht bij elkaar in het DNA. Recente studies hebben getoond dat de vereisten voor coöperatieve binding niet zo streng zijn in het geval van sommige andere transcriptie factoren en controle regio’s. Bijvoorbeeld: de EGR-1 controle regio bevat een samengestelde bindings site aan dewelke de SRF en TCF transcriptie factoren coöperatief binden.
Vermits een TCF een lang, flexibel domein heeft, dat interageert met SRF, kunnen de twee proteïnen coöperatief binden wanneer hun individuele sites in het DNA gescheiden zijn door eenders welke afstand tot 10bp of zijn omgekeerde relatieve van elkaar. Structureel diverse activatie en repressie domeinen reguleren de transcriptie Experimenten met fusie proteïnen samengesteld uit het GAL4 DNA-bindings domein en willekeurige segmenten van E. coli proteïnen toonde aan dat een diverse groep van aminozuursequenties kannen functioneren als activatie domeinen, ~1% van alle E. coli sequenties, zelfs als ze geëvolueerd zijn om andere functies te vervullen. Vele transcriptie factoren bevatten activatie domeinen gekenmerkt door een ongewoon hoog percentage van bepaalde aminozuren. GAL4, GCN4 en de meeste gist transcriptie factoren bijvoorbeeld hebben activatie domeinen die rijk zijn aan zure aminozuren (asparaginezuur en glutamine zuur). Deze zogenaamde zure activatie domeinen zijn in het algemeen in staat de transcriptie te stimuleren in bijna alle soorten eukaryote cellen -fungale, dierlijke en plantencellen. Activatiedomeinen van bepaalde Drosophila en zoogdierlijke transcriptiefactoren zijn glutamine-rijk en sommige zijn proline-rijk; nog andere zijn rijk aan de nauw verwante aminozuren serine en threonine, die beide hydroxylgroepen hebben. Bepaalde sterke activatie domeinen zijn echter niet bijzonder rijk aan enig specifiek aminozuur. Biofysische studies duiden aan dat zuren activatie domeinen een ongestructureerde, willekeurige coil conformatie hebben. Deze domeinen stimuleren de transcriptie wanneer ze gebonden zijn aan een proteïne co-activator. De interactie met een coactivator doet het activatie domein een meer gestructureerde α helix conformatie in het activatie domein-co-activator complex aannemen. Een goed-bestudeerd voorbeeld van transcriptie factor met een zuur activatie domein is het zoogdierlijk CREB proteïne, dat gefosforyleerd wordt als antwoord op verhoogde concentraties van cAMP. Deze gereguleerde fosforylatie is vereist om CREB te binden aan zijn coactivator CBP (CREB binding proteïne), wat resulteert in de transcriptie van genen wiens controle regio’s een CREB-bindings site bevatten. Wanneer het gefosforyleerde willekeurige coil activatie domein van CREB interageert met CBP, ondergaat het een conformationele verandering om twee α helices te vormen die rond het interagerende domein van CBP omgeslagen liggen. Bepaalde activatie domeinen zijn groten en meer gestructureerd dan zure activatie domeinen. Bijvoorbeeld: de ligand-bindings domeinen van nucleaire receptoren functioneren als activatie domeinen wanneer ze hun specifieke ligand binden. Binding van een ligand induceert een grote conformationele verandering die toelaat het ligand-bindings domein met gebonden hormoon te interageren met een korte α helix in nucleaire-receptor co-activatoren; het resulterende complex kan dan de transcriptie van de genen activeren wiens controle regio’s de nucleaire receptor binden. Dus vertegenwoordigen het zure activatie domein in CREB en het ligand-bindings activatie domein in nucleaire receptoren twee structurele uitersten. Het CREB zure activatie domein is een willekeurige coil die vouwt in twee α helices wanneer het bindt aan het oppervlak van een globulair domein in een co-activator. In tegenstelling is het nucleaire-receptor lingand-bindings activatie domein een gestructureerd globulair domein dat interageert met een korte α helix in een co-activator, die
waarschijnlijk een willekeurige coil is voordat het gebonden is. In beide gevallen laten specifieke proteïne-proteïne interacties tussen co-activatoren en de activatie domeinen de transcriptiefactoren toe de gen expressie te stimuleren. Op dit moment is er minder geweten over de structuur van de repressie domeinen. De globulaire ligand-bindings domeinen van bepaalde nucleaire receptoren functioneren als repressie domeinen in de afwezigheid van hun specifieke hormoon ligand. Zoals activatie domeinen kunnen repressie domeinen relatief kort zijn, 15 of minder aminozuren bevattend. Biochemische en genetische studies duiden aan dat repressie domeinen ook bemiddelen(?) proteïne-proteïne interacties en binden aan co-repressor proteïnen, een complex vormend dat de transcriptie initiatie verhinderd door mechanismen die later in de chapter besproken worden. Multiproteïne complexen vormen aan enhancers Zoals vroeger vermeld variëren enhancers gewoonlijk in lengte van ongeveer 50 tot 200 bp en omvatten bindingssiten voor verschillende transcriptiefactoren. De meerdere transcriptiefactoren die binden aan een enkele enhancer worden gedacht te interagen. Analysen van de +/-70-bp enhancer die de expressie van β-interferon, een belangrijk proteïne in de verdediging tegen virale infecties bij mensen, reguleert, verleent een goed voorbeeld van zulke transcriptie-factor interacties. De β-interferon enhancer bevat vier controle elementen die tegelijk vier verschillende transcriptiefactoren bindt. In de aanwezigheid van een klein, overvloedig aanwezig proteïne geassocieerd met chromatine HMGI genoemd, is de binding van de transcriptiefactoren sterk coöperatief, gelijkend op de binding van NFAT en AP1 aan de samengestelde promotor-proximale site in de IL-2 controle regio. Deze coöperatieve binding produceert een multiproteïne complex aan het β-interferon enhancer DNA. De term enhanccesoom werd verzonnen om zulke grote nucleoproteïne complexen te beschrijven die gevormd worden van transcriptiefactoren als ze coöperatief binden aan hun multiple bindings siten in een enhancer. HMGI bindt aan de minor groeve van DNA ongeacht de sequentie en buigt als resultaat het DNA molecule scherp. Deze buiging van het DNA laat de gebonden transcriptiefactoren toe gepast te interageren. De inherent zwakke, niet-covalente proteïne-proteïne interacties tussen transcriptiefactoren worden versterkt door hun binding aan naburige DNA siten, die de proteïnen aan zeer hoge relatieve concentraties houden. Vermits de aanwezigheid van flexibele regio’s die de DNA-bindings domeinen verbinden en activatie of repressie domeinen in transcriptiefactoren en het vermogen van gebonden proteïnen om het DNA te buigen is aanzienlijke speelruimte in de tussenruimte tussen de regulatorische elementen in transcriptie-controle regio’s toelaatbaar. Deze eigenschap is waarschijnlijk verleend door de snelle evolutie van gencontrole bij eukaryoten. Transposities van DNA sequenties en reconbinatie tussen herhaalde sequenties over evolutionaire tijd creëerde waarschijnlijk nieuwe combinaties van controle elementen die onderworpen waren aan natuurlijke selectie en behouden bleven als ze beneficial bleken. De speelruimte in tussenruimte tussen regulatorische elementen laat waarschijnlijk veel meer functionele combinaties toe om onderworpen te worden aan deze evolutionaire experimentaite dan het geval zou
zijn als de beperking omtrent de tussenruimten tussen regulatorische elementen strikt was. KEY CONCEPTS OF SECTION 11.3 activatoren en repressoren van transcriptie Trnascriptie factoren, die de transcriptie stimuleren of onderdrukken, binden aan promotor-proximale regulatorische elementen en enhancers in eukaryotisch DNA. Transcriptie activatoren en repressoren zijn in het algemeen modulaire proteïnen die een enkiel DNA-bindings domein bevatten en één of een weinig activatie domeinen (voor activatoren) of repressie domeinen (voor repressoren). De verschillende domeinen zijn vaak verbonden via flexibele polypeptide regio’s. Tussen de meest algemene structurele motieven gevonden in de DNA-bindings domeinen van eukaryote transcriptie factoren zijn de C2H2 zinkvinger, homeodomeinen, basis helix-loop-helix (bHLH) en basis zipper (leucine zipper). Al deze en vele andere DNA-bindings motieven bevatten één of meer α helices die interageren met major groeves in hun cognate site in DNA. De transcriptie-controle regio’s van de meeste genen bevatten bindings siten voor meerdere transcriptie factoren. De transcriptie van zulke genen varieert afhankelijk van het bepaalde repertoire van transcriptiefactoren die uitgedrukt en geactiveerd worden in een bepaalde cel op een bepaald ogenblik. Combinatie complexiteit in transcriptie controle resulteert van alternatieve combinaties van monomeren die heterodimerische transcriptie factoren vormen en van coöperatieve binding van transcriptiefactoren aan samengestelde controle sites. Activatie en repressie domeinen in trnascriptiefactoren vertonen een variëteit aan aminozuursequenties en driedimensionale structuren. In het algemeen interageren deze functionele domeinen met co-activatoren of co-repressoren, die cruciaal zijn voor het vermogen van transcriptiefactoren om de genexpressie te veranderen. De coöperatieve binding van meerdere activatoren aan nabijgelegen sites in een enhancer vormt een multiproteïne complex, een enhancesoom genoemd. De samenstelling van een enhancesoome vereist vaak kleine proteïnen die binden aan de DNA minor groeve en het DNA scherp buigen, wat de gebonden proteïnen aan beide zijden van de buiging toelaat gemakkelijker te interageren.
11.4 transcriptie initiatie door RNA polymerase II In vorige secties werden vele van de eukaryote proteïnen en DNA sequenties die deelnemen in de transcriptie en zijn controle geïntroduceerd. In deze sectie concentreren we ons op de samenstelling van transcriptie preinitiatie complexen met betrekking op RNA polymerase II (Pol II). Herinner dat dit eukaryotisch RNA polymerase de synthese van mRNA’s en enkele kleine nucleaire RNA’s (snRNA’s) katalyseert. De mechanismen die de assemblage van de Pol II transcriptie preinitiatie complexen controleren en vandaar de snelheid van de transcriptie van proteïnecoderende genen, worden beschouwd in de volgende sectie. De algemene transcriptiefactoren positioneren RNA polymerase II aan de startsites en assisteren bij de initiatie In vitro transcriptie door opzuiverd RNA polymerase II vereist de toevoeging van verschillende initiatiefactoren die gescheiden worden van het polymerase tijdens de opzuivering. Deze initiatie factoren, die polymerase moleculen positioneren aan transcriptie startsiten en helpen de DNA strengen te smelten zodat de matrijsstreng kan binnentreden in de actieve asite van het enzyme, worden algemene
transcriptiefactoren genoemd. In tegenstelling tot de transcriptie factoren besproken in de vorige sectie, die binden aan specifieke sites in een beperkt aantal genen, zijn algemene transcriptiefactoren vereist voor de synthese van RNA van de meeste genen. De algemene transcriptiefactoren die PolII assisteren bij de initiatie van de transcriptie van de meeste TATA-box promotoren in vitro werden geïsoleerd en gekarakteriseerd. Deze proteïnen worden aangeduid als TFIIA, TFIIB, enz en de meeste zijn multimerische proteïnen. Het grootste is TFIID, die bestaat uit een enkel 38-kDa TATA-box-bindings proteïne (TBP) en dertien TBP-geassocieerde factoren (TAF’s). Algemene transcriptiefactoren met gelijkaardige activiteiten werden geïsoleerd uit gekweekte mensencellen, ratlever, Drosophila embryo’s en gist. Van de genen die deze eiwitten coderen in gist werd de sequentie bepaald als deel van de volledige gist genoom sequentie en vele van de cDNA’s coderend voor humaan en Drosophila Pol II algemene transcriptie factoren werden gekloond en de sequenties werden bepaald. In alle gevallen waren de evenwaardige transcriptie factoren van verschillende eukaryoten sterk bewaard. Sequentiële samenstelling van proteïnen vormt het PolII transcriptie preïnitiatie complex in vitro Gedetailleerde biochemische studies onthulden hoe het Pol II preinitiatie complex, dat een Pol II molecule en algemene transcriptiefactoren gebonden aan een promotor regio van DNA bevat, gevormd wordt. In deze studies werden DNase I footprinting en elektroforetische mobility shift analysen gebruikt om de volgorde te bepalen waarin PolII en de algemene transcriptie factoren binden aan de TATA-box promotoren. Vermits het volledige, multisubeenheid TFIIC moeilijk op te zuiveren is, gebruikten de onderzoekers enkel de geïsoleerde TBP component van deze algemene transcriptiefactor in deze experimenten. PolII kan de transcriptie initiëren in vitro in de afwezigheid van de andere TFIID subeenheden. Figuur 11-27 vat ons huidige begrip van de stapsgewijze samenstelling van de PolII transcriptie preïnitiatie complex in vitro samen. TBP is het eerste proteïne dat bindt aan een TATA-box promotor. Alle geanalyseerde TBP’s om te dateren(?) hebben zeer gelijkaardige C-terminale domeinen van 180 residu’s. De sequentie van deze regio is 80% identiek in de gist en de humane proteïnen en de meeste verschillen zijn conservatieve vervangingen. Dit bewaarde C-terminale domein functioneert zoals het volledige lengte proteïne doet in in vitro transcripties. (Het N-terminale domein van TBP, dat sterk varieert in sequentie en lengte tussen verschillende eukaryoten, functioneert in de PolII-gekatalyseerde transcriptie van genen coderend voor snRNA’s.) TBP is een monomeer die vouwt in een zadelvormige structuur; de twee helften van het moleculen vertonen een globale dyade(?) symmetrie maar zijn niet identiek.Zoals het HMGI en andere DNA-buigings proteïnen die deelnemen in de vorming van enhancesomen, interageert TBP met de minor groeve in DNA, daarbij de helix aanzienlijk buigend. Het DNA bindings oppervlak van TBP is bewaard in alle eukaryoten, wat de sterke conservatie van de TATA-box promotor verklaart. Eens TBP gebonden is aan de TATA box, kan TFIIB binden. TBIIB is een monomerisch proteïne, een beetje kleiner dan TBP. Het C-terminale domein van TFIIB maakt contact met zowel TBP als met DNA aan één van beide zijden van de TATA-box, terwijl zijn N-terminaal domein uitsteekt richting de transcriptie start site.
Volgend op de TFIIB binding bindt een voorgevormd complex van tetramerisch TFIIF en PolII, het polymerase positionerend over de startsite. Aan de meeste promotoren moeten nog twee algemenetranscriptiefactoren binden voordat de DNA duplex kan gescheiden worden om de matrijsstreng bloot te stellen. De eerste om te binden is het tetramerische TFIIE, wat een ankersite creëert voor TFIIH, een ander multimerische factor die negen subeenheden bevat. De binding van THIIH vervolledigt de assemblage van het transcriptie preinitiatie complex in vitro. De helicase activiteit van één van de TFIIH subeenheden gebruikt energie van ATP hydrolyse om de DNA duplex te ontwinden aan de startsite, wat PolII toelaat een open complex te vormen in dewelke de DNA duplex die de startsite omgeeft gesmolten wordt en de matrijs streng gebonden is aan de polymerase actieve site. Als de overblijvende(?) ribonucleoside trifosfaten aanwezig zijn, begint PolII de matrijs streng af te schrijven. Als het polymerase afschrijft weg van de promotorregio, fosforyleert een andere subeenheid van TFIIH het PolII CTD op meerdere sites. In de minimale in vitro transcriptie analyse enkel deze algemene transcriptie factoren bevatten en opgezuiverd RNA polymerase II, blijft TBP gebonden aan de TATA-boc wanneer het polymerase wegschrijft van de promotor regio, maar de andere algemene transcriptie factoren dissociëren. De eerste subeenheden van TFIIH die gekloneerd werden van mensen werden geïdentificeerd, omdat mutaties in de genen coderend voor hen gebreken veroorzaakten in het herstel van beschadigd DNA. Bij normale individuen, wanneer een afschrijvend RNA polymerase opgehouden wordt aan een regio van beschadigd matrijs DNA, denkt men dat een subcomplex van TFIIH het opgehouden polymerase herkent en dan andere proteïnen recruteert die functioneren met TFIIH in het herstel van de beschadigde DNA regio. Iin de afwezigheid van functioneel TFIIH is zulk herstel van beschadigd DNA in transcriptioneel actieve genen benadeeld. Als resultaat hebben de getroffen individuen een extreme huidgevoeligheid voor zonlicht (een gemene oorzaak van DNA schade) en vertonen een hoge accidentie voor kanker. Afhankelijk van de ernst van het mankement in de TFIIH functie, kunnen deze individuen lijden aan ziekten zoals xeroderma pigmentosum en Cockayne’s syndroom. In vivo transcriptie initiatie door Pol II vereist bijkomende proteïnen Hoewel de algemene transcriptiefactoren hierboven besproken PolII toelaten de transcriptie te initiëren in vitro is een andere algemene transcriptie factor, TFIIA, vereist voor de initiatie door PolII in vivo. Opgezuiverd TFIIA vormt een complex met TBP en TATA-box DNA. X-ray kristallografie van dit complex toont dat TFIIA interageert met de zijde van TBP die upstream van de richting van de transcriptie ligt. Biochemische experimenten suggereren dat in cellen van hogere eukaryoten TFIIA en TFIID, met zijn meerdere TAF subeenheden, eerst binden aan TATA-box DNA en dan de andere algemene transcriptiefactoren opeenvolgend binden zoals aangeduid in figuur 11-27. De TAF subeenheden van TFIID lijken een rol te spelen in het initiëren van de transcriptie van promotoren die geen TATA box hebben. Bijvoorbeeld: bepaalde TAF subeenheden liggen in verbinding met het initiator element in promotoren waar dit gebeurt, waarschijnlijk verklarend hoe zulke sequenties een TATA-box kunnen vervangen. BijkomendeTFIID TAF subeenheden kunnen binden aan een consensus
sequentie A/G-G-A/T-C-G-T-G gecentreerd op +/_ 30bp downstream van de transcriptie startsite in vele genen die een TATA-box promotor ontbreken. Vanwege zijn positie wordt deze regulatorische sequentie het downstream promotor element (DPE) genoemd. Het DPE vergemakkelijkt de transcriptie van TATA_loze genen die het bevat door verhoogde TFIID binding. Naast de algemene transcriptie factoren reguleren specifieke activatoren en repressoren de transcriptie van genen door Pol II. In de volgende sectie zullen we onderzoeken hoe deze regulatorische proteïnen de PolII transcriptie initiatie beïnvloeden. KEYCONCEPTS OF SECTION 11.4 transcriptie initiatie door RNA polymerase II De transcriptie van proteïne-coderende genen door PolII kan geïnitieerd worden in vitro door sequentiële binding van de volgende in de aangeduide volgorde: TBP, die bindt aan het TATA-box DNA; TFIIB; een complex van PolII en TFIIF; TFIIE; en tenslotte TFIIH. De helicase activiteit van een TFIIH subeenheid scheidt de matrijsstrengen aan de start site in de meeste promotoren, een proces dat de hydrolyse van ATP vereist. Wanneer PolII begint af te schrijven weg van de start site, wordt zijn CTD gefosforyleerd door een andere TFIIH subeenheid. In vivo transcriptie initiatie door Pol II vereist ook TFIIA en in metazoa een volledig TFIID proteïne, waaronder zijn meerdere TAF subeenheden net als de TBP subeenheid.
11.5 moleculaire mechanismen van transcriptie activatie en repressie De activatoren en repressoren die binden aan specifieke sites in DNA en de expressie van geassocieerde proteïnecoderende genen reguleren doen dit door twee algemene mechanismen. Ten eerste werken deze regulatorische proteïnen in harmonie met andere proteïnen om de chromatine structuur te moduleren, daarbij het vermogen van de algemene transcriptiefactoren om te binden aan de promotoren beïnvloedend. Herinner van chapter10 dat het DNA in eukaryote cellen niet vrij is, maar verbonden wordt met een ongeveer gelijke massa van proteïnen in de vorm van chromatine. De basis structurele eenheid van chromatine is de nucleosoom, die samengesteld is uit +/- 147bp van DNA strak gewonden rond een discusvormige kern van histone proteïnen. Residu’s binnen de N-terminale regio van elk histone en de C-terminale regio van histone H2A, histone staarten genoemd, steken uit het oppervlak van de nucleosoom en kun omkeerbaar veranderd worden. Zulke veranderingen, vooral de acetylatie van histone H3 en H4 staarten, beïnvloeden de relatieve condensatie van chromatine en dus zijn toegankelijkeheid voor proteïnen vereist voor de transcriptie initiatie. Naast hun rol in zulke chromatine-gemediëerde transcriptie controle, interageren activatoren en repressoren met een groot multiproteïne complex, het mediator of transcription complex, of simpelweg mediator. Dit complex bindt op zijn beurt aan PolII en reguleert direct de assemblage van transcriptie preinitiatie complexen. In deze sectie herhalen we het huidige verstaan van hoe activatoren en repressoren de chromatine structuur en preinitiatie complex vorming controleren. In de volgende sectie van de chater bespreken we hoe de concentratie en activiteiten van de
activatoren en repressoren zelf gecontroleerd worden, zodat de genexpressie precief afgestemd wordt aan de noden van de cel en het organisme. De vorming van heterochromatine verstilt de genexpressie aan telomeren, nabij centromeren en in andere regio’s Het is reeds vele jaren duidelijk dat inactieve genen in eukaryote cellen vaak verbonden zijn met heterochromatine, regio’s van chromatine die sterker gecondenseerd zijn en donkerder kleuren met DNA verven dan euchromatine, waar de meeste afgeschreven genen gelokaliseerd zijn. Regio’s van chromosomen nabij de centromeren en de telomeren en bijkomende specifieke regio’s die variëren in verschillende celtypes worden georganiseerd in heterochromatine. Het DNA in heterochromatine is minder toegankelijk voor extern toegevoegde proteïnen dan DNA in euchromatine en bijgevolg wordt er vaak naar verwezen als “gesloten” chromatine. Bijvoorbeeld: in een experiment beschreven in de laatste chapter was er gevonden dat het DNA van inactieve genen veel resister was tegen vertering door DNaseI dan het DNA van afgeschreven genen. Studie van DNA regio’s in S. cerevisiae die zich gedragen als het heterochromatine in hogere eukaryoten verleende vroeg inzicht in de chromatine-gemedieerde repressie van transcriptie. Deze gist kan zowel in haploïde als in diploïde cellen groeien. Haploïde cellen vertonen één van de twee mogelijke paringssoorten, a en α genoemd. Cellen van verschillende paringssoort kunnen ‘paren’, of fuseren, om een diploïde cel te vormen. Wanneer een haploïde cel deelt door knopvorming, schakelt de grotere “moeder” cel zijn paringssoort om. Genetische en moleculaire analysen hebben onthuld dat drie genetische loci op gist chromosoomIII het paringssoort van de gistcellen controleren. Enkel het centrale paringssoort locus, MAT genaam, wordt actief afgeschreven. Hoe de proteïnen gecodeerd aan de MAT locus bepalen of een cel een a of een α fenotype heeft wordt verklaard in chapter22.De twee bijkomende loci, HML en HMR genaamd, respectievelijk nabij de links en de rechtse telomeer, bevatten “stille” (niet afgeschreven) copies van de a of α genen. Deze sequenties worden afwisselend(?) overgebracht van HMLα of HMRa in de MAT locus door een soort van niet-reciproke recombinatie tussen zusterchromatiden tijdens de celdeling. Wanneer de MAT locus de DNA sequentie voor HMLα bevat, gedragen de cellen zich als α cellen. Wanneer de MAT locus de DNA sequentie voor HMRa bevat, gedragen de cellen zich als a cellen. Onze interesse hier is hoe de transcriptie van de stille paringssoort loci aan HML en HMR onderdrukt worden. Als de genen aan deze loci tot uitdrukking komen, wanneer ze in gistmutanten zijn met gebreken aan het repressie mechanisme, komen zowel de a als de α proteïnen topt uitdrukking, wat maakt dat de cellen zich gedragen als diploïde cellen, die niet kunnen paren. De promotoren en UAS’s, die de transcriptie controleren van de a en α genen liggen nabij het centrum van de DNA sequentie die wordt overgebracht en identiek zijn of de sequenties aan de MAT locus zijn of aan één van de stille loci. Bijgevolg wordt de functie van de transcriptiefactoren die interageren met deze sequenties enigszins geblokkeerd aan HML en HMR. Deze repressie van de stille loci hangt af van silencer sequentiesn, gelokaliseerd naast de regio van getransfereerd DNA aan HML en HMR. Als de silencer verwijderd wordt, wordt de aangrenzende stille locus afgeschreven. Opmerkelijk: elk gen geplaatst nabijde gist paringssoort silencer sequentie door recombinant DNA
technieken wordt onderdrukt of “gesilenced”, zelfs een tRNA gen afgeschreven door RNA polymerase III, die een verschillende set van algemene transcriptiefactoren dan RNA polymerase II gebruikt. Verschillende lijnen van bewijs duiden aan dat de repressie van HML en HMR loci resulteert van een gecondenseerde chromatine structuur die sterically(??) transcriptiefactoren blokkeert van te interageren met het DNA. In één treffend experiment was het gen coderend voor een E. coli enzyme dat adenine residu’s in GATC sequenties methyleert geïntroduceerd in gist cellen onder de controle van een gistpromotor zodat het enzyme onderdrukt was. Onderzoekers vonden dat de GTAC sequenties binnen de MAT locus en de meeste andere regio’s in het genoom in deze cellen gemethyleerd waren, maar niet deze binnen de HML en HMR loci. Deze resultaten duiden aan dat het DNA van de stille loci ontoegankelijk is voor het E. coli methylase en waarschijnlijk voor proteïnen in het algemeen, waaronder transcriptiefactoren en RNA polymerase. Gelijkaardige experimenten uitgevoerd met verschillende gist histone mutanten duidde aan dat specifieke interacties met betrekking op de histone staarten van H3 en H4 vereist zijn voor de vorming van een volledig onderdrukkende chromatine structuur. Andere studies hebben getoond dat de telomeren van elke gist chromosoom zich ook gedragen als silencer sequenties. Bijvoorbeeld: wanneer een gen geplaatst wordt binnen enkele kilobasen van een gist telomeer, wordt zijn expressie onderdrukt. Bovendien wordt deze repressie relieved door dezelfde mutaties in de H3 en H4 histone staarten die interfereren met de repressie aan de stille paringssoort loci. Genetische studies hebben geleid tot de identificatie van verschillende proteïnen, RAP1 en drie SIr1 proteïnen, die vereist zijn voor de repressie van de stille paringssoort loci en de telomeren in gist. RAP blijkt te binden binnen de DNA silencer sequenties verbonden met HML en HMR en aan een sequentie die meerdere keren herhaald is aan elke gist chromosoom telomeer. Verdere biochemische studies toonde dat de SIR proteïnen aan elkaar binden en dat er twee binden aan de Nterminale staarten van de histonen H3 en H4 die behouden blijven in een grotendeels nietgeacetyleerde toestand door de deacetylase activiteit van SIR2. Verschillende experimenten gebruikmakend van fluorescence confocale microscopie van gistcellen ofwel gekleurd met fluorescent gelabelde antilichamen aan elk van de SIR proteïnen of RAP1 of gehybridiseerd aan een gelabeld telomeer-specifieke DNA probe onthulde dat deze proteïnen grote, gecondenseerde telomerische nucleoproteïnen structuren vormen lijkend op het heterochromatine gevonden in hogere eukaryoten. Figuur 11-30 schetst een model voor de chromatinegemedieerde silencing aan gist telomeren gebaseerd op deze van andere studies. De vorming van heterochromatine aan telomeren wordt nucleated(??) door meerdere RAP1 proteïnen gebonden aan herhaalde sequenties in een nucleosoom-vrije regio aan het uiterste einde van een telomeer. Een netwerk van proteïne-proteïne interacties met betrekking op telomeer gebonden RAP1, drie SIR proteïnen (2,3&4) en hypo-geacetyleerde histonen H3 en H4 vormt een stabiel hogere-orde complex dat verschillende telomeren omvat en in dewelke het DNA grotendeels ontoegankelijk is voor externe proteïnen. Eén bijkomend proteïne, SIR1, is ook vereist voor de silencing van de stille paringssoort loci. Hoewel de functie van SIR1 nog niet goed begrepen is, is het wel gekend te associëren met de silencer regio, waar men denkt dat het de verdere assemblage van het multiproteïne telomerisch
silencing complex veroorzaakt zodat het zich verder spreidt van het einde van het chromosoom, HML en HMR omvattend. Een belangrijke eigenschap van dit model is de afhankelijkheid van silencing op de hypoacetylatie van de histonestaarten. Deze was getoond in experimenten met gistmutanten die histonen tot uitdrukking brachten in dewelke lysines in de histone Ntermini vervangen waren door arginines of glutamines. Arginine is positief geladen zoals lysine, maar kan niet geacetyleerd worden. Men denkt dat het functioneert in histone N-terminale staarten zoals een niet-geacetyleerd lysine. Glutamine aan de andere kant bootst een geacetyleerd lysine na. De repressie aan telomeren en aan stille paringssoort loci was gebrekig in de mutanten met glutamine vervangingen, maar niet in de mutanten met arginine vervangingen. Hyperacetylatie van opeenvolgend(?) de H3 en H4 staarten bleek te interfereren met de binding door SIR3 en SIR4. Hoewel de chromatine-gemedieerde repressie van transcriptie ook belangrijk is in meercellige eukaryoten, wordt het mechanisme van deze repressie nog uitgewerkt. Genetische en biochemische analysen in Drosophila hebben onthuld dat meerdere proteïnen geassocieerd in grote multiproteïne complexen deelnemen in dit proces. Deze Polycomb complexen worden verder besproken in chapter 15. Zoals in het geval van SIR proteïnen bindend aan gist telomeren, kunnen deze Drosophila Polycomb proteïnen zichtbaar gemaakt worden bindend aan de genen die ze onderdrukken aan meerdere specifieke lokaties in het genoom door in situ binding van specifiek-gelabelde antilichamen aan speekselklies polytene chromosomen. (???) Repressoren kunnen histone deacetylatie aan specifieke genen sturen Het belang van de histone deacetylatie in chromatine gemedieerde gen repressie werd verder ondersteund door studies op eukaryote repressoren die genen reguleren op interne chromosomale posities. Deze proteïnen zijn gekend gedeeltelijk te werken door de deacetylatie te veroorzaken van histonestaarten in nucleosomen die binden aan de TATAbox en aan de promotor-proximale regio van de gen die ze onderdrukken. In vitro studies hebben getoond dat wanneer promotor DNA samengebracht is aan een nucleosoom met niet-geacetyleerde histonen, kunnen de algemenen transcriptiefactoren niet binden aan de TATA-box en de initiatie regio. In niet-geacetyleerde histonen zijn de N-terminale lysines positief geladen en interageren sterk met DNA fosfaten. De niet-geacetyleerde histone staarten interageren ook met naburige histone octameren, de vouwing van chromatine bevoordelend in gecondenseerde hogere-orde structuren wiens precieze conformatie niet goed begrepen is. Het netto effect is dat algemene transcriptiefactoren niet kunnen samengebracht worden in een preinitiatie complex aan een promotor geassocieerd met hypogeacetyleerde histonen. In tegenstelling wordt de binding van algemene transcriptiefactoren veel minder onderdrukt door histonen met hypergeacetyleerde staarten in dewelke positief geladen lysine’s geneutraliseerd worden en elektrostatische interacties met DNA fosfaten geëlemineerd worden. Het verband tussen histone deacetylatie en repressie van de transcriptie aan nabijgelegen gistpromotoren werd duidelijker wanneer het cDNA coderend voor een menselijk histone deacetylase een sterke homologie met het gist RPD3 gen bleek te hebben. Dit gist gen is gekend vereist te zijn voor de normale repressie van een aantal gistgenen. Verder werk toonde dat RPD3 proteïne een histone deacetylase
activiteit heeft. Het vermogen van RPD3 om histonen te deacetyleren aan een aantal promotoren hangt af van twee andere proteïnen: UME6, een repressor die bindt aan een specifieke upstream regulatorische sequentie (URS1) en SIN3, die een deel is van een groot, multiproteïne complex dat ook RPD3 bevat. SIN3 bindt aan aan het repressie domein van UME6, dus het RPD3 histone deacetylase positionerend in het complex zodat het kan interageren met nabijgelegen promotor-geassocieerde nucleosomen en acetylgroepen kan verwijderen van histone N-terminale lysine’s. Bijkolende experimenten, gebruik makend van de chromatine immunoprecipitation techniek geschetst in figuur 11-31, toonde aan dat in wild)type gist, één of twee nucleosomen in de onmiddelijke nabijheid van de UME6-bindings sites hypogeacetyleerd zijn. Deze DNA regio’s omvatten de promotoren van genen onderdrukt door UME6. Bij sin3 en rpd3 deletiue mutanten, waren niet enkel deze promotoren niet langer onderdrukt, maar de nucleosomen nabij de nucleosomen nabij de UME6-bindingssiten waren hypergeacetyleerd. Al deze bevindingen verleenden een aanzienlijke ondersteuning voor het model van repressor-gestuurde deacetylatie getoond in figuur 11-32a. IN dit model functioneert het SIN3-RPD3 complex als een co-repressor. Co-repressor complexen, die histone deacetylasen bevatten, zijn ook gevonden verbonden met vele repressoren van zoogdierlijke cellen. Sommige van deze complexen bevatten het zoogdierlijke homoloog van SIN3 (mSin3), dat interageert met het repressor proteïne. Andere histone deacetylase complexen geïdentificeerd in zoogdiercellen lijken bijkomende of verschillende repressor-bindings proteïnen te bevatten. Deze verschillende repressor en co-repressor combinaties worden gedachtde histone deacetylatie te bemiddelen aan specifieke promotoren door een mechnaisme gelijkaardig aan het gist mechanisme. De observatie dat een aantal eukaryote repressor proteïnen in vitro transcriptie verhinderen in de afwezigheid van histonen duidt echt aan dat directere repressie mechanismen, zonder betrekking op de histone deacetylatie, ook werkzaam zijn. De ontdekking van mSin3-bevattende deacetylase complexen levert een verklaring voor de vroegere observaties dat in vertebraten transcriptioneel inactieve DNA regio’s vaak het veranderde cysteïne residu 5-methylcytidine (mC) bevatten onmiddelijk gevolgd door een G, terwijl transcriptioneel actief DNA regio’s mC residu’s ontbreken. DNA, dat 5-methylcytidine bevat, bleek te binden aan een specifiek proteïne dat op zijn beurt interageert specifiek met mSin3. Deze bevinding suggereert dat de associatie van mSin3-bevattende co-repressoren met gemethyleerde sites in DNA leidt tot de deacetylatie van histonen in naburige nucleosomen, wat deze regio’s ontoegankelijk maakt voor algemene transcriptie factoren en PolII en vandaar transcriptioneel inactief. Activatoren kunnen histone acetylatie sturen aan specifieke genen Genetische en biochemische studies in gist leidde tot de ontdekking van een groot multiproteïne complex dat het proteïne GCN5 bevat, dat een histone acetylase activiteit heeft. Een andere subeenheid van dit histone acetylase complex bindt aan zure activatie domeinen in gist activator proteïnen zoals GCN4. Maximale transcriptie activatie door GCN4 hangt af van deze histone acetylase complexen, die dus functioneren als co-activatoren. Het model getoond in figuur 11-32b komt overeen met de observatie dat dat nucleosomen nabij de promotor regio van een gen gereguleerd door de GDN4 activator specifiek hypergeacetyleerd zijn, zoals bepaald
door de chromatine immunoprecipitatie methode. De activator-gestuurde hyperacetylatie van nucleosomen nabij een promotor regio verandert (“opent”) de chromatine structuur zodat de binding van andere proteïnen vereist voor de transcriptie initiatie vergemakkelijken. Een gelijkaardig activatie mechanisme werkt in hogere eukaryoten. Bijvoorbeeld: zoogdieren brengen twee verwante +/-400-kD, multidomein proteïnen, CBP en P300 genoemd, tot uitdrukking waarvan men denkt dat ze op een gelijkaardige manier functioneren. Zoals vroeger vermeld bindt één domein van CBP het gefosforyleerde zure activatie domein in de CREB transcriptiefactor. Andere domeinen van CBP interageren met verschillende activatie domeinen in andere transcriptiefactoren. Nog een ander domein van CBP heeft histone aceylase activiteit en een ander CBP domein associeert met een multiproteïne histone acetylase complex dat homoloog is aan het het gist GCN5-bevattend complex. CREB en vele andere zoogdierlijke activatoren worden gedacht ten dele te functioneren door de sturing van CBP en het geassocieerde histone acetylase complex naar specifieke nucleosomen, waar ze histone staarten acetyleren, daarbij de interactie vergemakkelijkend van algemene transcriptiefactoren met promotor DNA. Bovendien heeft de grootste TFIID subeenheid ook een histone acetylase activiteit en kan functioneren als een coactivator door het acetyleren van histone N-terminale staarten in de nabijheid van de TATAbox. Modificaties van specifieke residu’s in histone staarten controleren de chromatine condensatie Naast de reversibele acetylatie kunnen histone staarten in chromatine reversibele fosforylatie ondergaan van serine en threonine residu’s, reversibele monoubiquitinatie van een lysine residue in de H2A C-terminale staart en irreversibele methylatie van lysine residu’s. Bewijs stapelt zich op dat het niet simpelwel de globale graad van acetylatie is die de condensatie controleert van chromatine en vandaar ook de toegankelijkheid van het DNA. Eerder de precieze aminozuren in de staarten die geacetyleerd zijn of anders gemodificeerd zijn, kunnen een ‘histone code’ instellen die de condensatie van chromatine helpt controleren. Bijvoorbeeld: het lysine op positie 9 in histone H3 is vaak gemethyleerd in heterochromatine. De histone code wordt ‘gelezen’ door proteïnen die binden aan deze specifieke modificaties en op hun beurt de condensatie of decondensatie van chromatine promoten, daarbij ‘gesloten’ of ‘open’ chromatine structuren vormend. Bijvoorbeeld: hogere eukaryoten brengen een aantal heterochromatine-geassocieerde proteïnen tot uitdrukking, die een zogenaamd chromodomein bevatten, dat bindt aan de histone H3 staart wanneer deze gemethyleerd is aan lysine 9. Deze proteïnen worden voorondersteld bij te dragen aan de hogere-orde vouwing typisch voor heterochromatine, enigszins zoals de SIR proteïnen aan gist telomeren. Alternatief bindt het bromodomein gevonden in een aantal euchromatine geassocieerde proteïnen aan geacetyleerde histone staarten. De grootste subeenheid van TFIID, bijvoorbeeld, bevat twee dicht bij elkaar gelegen bromodomeinen, die het kunnen helpen te associeren met chromatine, dat een actieve code bevat, terwijl de histone acetylase activiteit van dezelfde subeenheid het chromatine in een hypergeacetyleerde toestand houdt.
Chromatine-omvormende factoren helpen bepaalde genen te activeren of te onderdrukken Naast de histone acetylase complexen is er een ander type multiproteïne complex, SWI/SNF chromatine remodeling complex, vereist voor de activatie van bepaalde gist promotoren. Verscheidene van de SWI/SNF subeenheden vertonen een homologie met DNA helicasen, enzymen die energie gebruiken van ATP hydrolyse om interacties tussen gebasepaarde nucleïnezuren of tussen nucleïnezuren en proteïnen te verstoren. Men denkt dat het SWI/SNF complex vergankelijk DNA dissocieert van het oppervlak van de nucleosomen, wat de nucleosomen toelaat te ‘glijden’ langsheen het DNA en de ontvouwing van gecondenseerde, hogere-orde chromatine structuren te promoten. Het netto resultaat van zulke chromatine omvorming is het vergemakkelijken van de binding van transcriptiefactoren aan DNA in chromatine. Bepaalde activatiedomeinen hebben getoond te binden aan het SWI/SNF complex en deze binding stimuleert in vitro transcriptie van chromatine matrijzen (DNA gebonden aan nucleosomen). Dus vertegenwoordigt het SWI/SNF complex een ander soort co-activator complex. Andere multi-proteïne complexen met gelijkaardige chromatine-omvormings activiteiten werden geïdentificeerd in gist, wat de mogelijkheid doet ontstaan dat verschillende chromatine-omvormings complexen vereist kunnen zijn door verschillende activatoren families. Hogere eukaryoten bevatten ook multiproteïne complexen met homologie aan het gist SWI/SNF complex. Deze complexen geïsoleerd van nucleaire extracten van zoogdier- en Drosophila cellen bleken de binding van transcriptiefactoren aan hun cognate sites in nucleosomaal DNA te helpen in een ATP-vereisend proces. Het experiment getoond in figuur 11-34 toont dramatisch aan hoe een activatiedomein de decondensatie van een regio van chromatine kan veroorzaken. Men denkt dat dis resulteert van de interactie van het activatiedomein met chromatine omvorming en histone acetylase complexen. (?) Verbazend is dat SWI/SNF complexen ook vereist zijn voor de repressie van bepaalde genen, misschien omdat ze histonestaarten helpen blootstellen aan deacetylasen of omdat ze helpen in de vouwing van chromatine tot gecondenseerde, hogere-orde structuren. Er moet nog veel geleerd worden over hoe deze belangrijke klasse van co-activatoren en co-repressoren de chromatine structuur veranderen om de genexpressie te beïnvloeden. Het mediator complex vormt een moleculaire brug tussen activatiedomeinen en PolII Nog een ander soort co-activator, het multiproteïne mediator complex, assisteert meer direct in de assemblage van PolII preinitiatie complexen. Sommige van de +/20 mediator complexen binden aan RNA polymeraseII en andere mediator subeenheden binden aan activatie domeine in verschillende activator proteïnen. Dus kan de mediator een moleculaire brug vormen tussen een activator gebonden aan zijn cognate site in DNA en PolII aan een promotor. Bovendien heeft één van de mediator subeenheden histone acetylase activiteit en kan functioenren om een promotor regio en een hypergeacetyleerde toestand te houden. Experimenten met temperatuur-gevoelige gist mutanten duiden aan dat sommige mediator subeenheden vereist zijn voor de transcriptie van bijna alle genen. Deze subeenheden helpen waarschijnlijk de globale structuur van het mediator complex te
behouden of binden aan PolII en zijn daarom vereist voor de activatie door alle activatoren. In tegenstelling zijn andere mediator subeenheden vereist voor de activatie van specifieke ondergroepen van genen. DNA microarray analyse van genexpressie in mutanten met gebreken in deze mediator subeenheden duiden aan dat elke subeenheid de transcriptie van +/-3-10% van alle genen beïnvloed. Men denkt dat deze mediator subeenheden interageren met specifieke activatie domeinen; dus wanneer één subeenheid gebrekig is, wordt de transcriptie van genen gereguleerd door activatoren die binden aan die subeenheid serieus verlaagd maar de transcriptie van andere genen is niet getroffen. Overeenkomend met deze verklaring zijn de bindingd studies tonend dat bepaalde activatiedomeinen inderdaad interageren met specifieke mediator subeenheden. Grote mediator complexen, geïsoleerd van gekweekte zoogdiercellen, zijn vereist voor zoogdierlijke activatoren de transcriptie door PolII in vitro stimuleren. Aangezien genen coderend voor homologen van de zoogdierlijke mediator subeenheden geïdentificeerd zijn in de genoomsequenties van C. Elegans en Drosophila, lijkt het dat de meeste meercellige dieren (metazoa) homologe mediator complexen hebben. Ongeveer een derde van de metazoa mediator subeenheden zijn duidelijk homoloog met de gist mediator subeenheden. Maar de oveblijvende subeenheden, die lijken te verschillen van alle gist proteïnen, kunnen interageren met activatie domeinen die niet gevonden worden in gist. Zoals met gist mediator is er aangetoond dat sommige van deze zoogdierlijke mediator subeenheden interageren met specifieke activatiedomeinen. Bijvoorbeeld: de Sur2 subeenheid van de zoogdierlijke mediator bindt aan het activatiedomein van een TCF transcriptiefactor die de expressie van het EGR-1 gen controleert. De functie van deze TFC activator in vivo wordt normaal gereguleerd in respons op specifieke proteïne hormanen aanwezig in serum. Muis embryologische stamcellen met een knockout van het sur2 gen faalt erin de expressie te induceren van het EGR-1 proteïne als repsons op serum, terwijl meerdere andere activatoren normaal functioenren in de mutantcellen. Deze bevinding brengt met zich mee dat de mediator Sur2 subeenheid in de activatie functioneert van TCF.(??) De verschillende experimentele resultaten aanduidend dat individuele mediator subeenheden binden aan specifieke activatie domeinen suggereert dat meerdere activatoren de transcriptie van een enkele promotor beïnvloeden door tegenlijk te interageren met een mediator complex. Activatoren gebonden aan enhancers of promotor-proxiimale elementen kunnen intergageren met een mediator geassocieerd met een promotor omdat DNA flexibel is en een lus kan vorming waarbij de regulatorische regio’s en de promotor dicht bij elkaar gebracht kunnen worden. Zulke lussen werden geobserveerd in experimenten met de E. Coli NtrC activator en σ54-RNA polymerase. De multiproteïne nucleoproteïne complexen die aan eukaryote promotoren vormen kunnen zoveel als 100 polypeptiden bevatten met een totale massa van +/- 3 megadalton (Mda), zo groot als een ribosoom. Transcriptie van vele genen vereist een geordende binding van activatoren en de actie van co-activatoren We kunnen nu het model van PolII transcriptie initiatie in figuur 11-27 uitbereiden door de rol in rekening te nemen van activatoren en co-activatoren. Deze bijkomende proteïnen functioneren niet enkel om genen binnen nucleosomaal DNA toegankelijk
te maken voor algemene transcriptiefactoren en PolII maar recruteren ook direct PolII aan promotor regio’s. Recente studies hebben de volgorde in welke activatoren binden aan een transcriptie-controle regio en interageren met co-activatoren als een gen geïnduceerd is(?) geanalyseerd. Zulke studies tonen dat de samenstelling van preinitiatie complexen afhangt van meerdere proteïne-DNA en proteïne-proteïne interacties, zoals geïllustreerd in figuur 11-37 (schets van de activatie van het gist HO gen). Dit gen codeert voor een sequentie-specifiek nuclease dat paringssoort omschakeling in haploide gistcellen initieert. De activatie van het HO gen begint met de binding van de SW15 activator aan een upstream enhancer. Gebonden SWI5 interageert dan met het SWI/SNF chromatine-omvormings complex en het GCN5bevattend histone acetylase complex. Eens het chromatine in de HO controle regio gedecondenseerd en hypergeacetyleerd is, kan een tweede activator, SBF, binden aan verscheidene sites in de promotor-proximale regio. Daaropvolgende binding van het mediator complex door SBF leidt dan tot de vorming van het transcriptie preinitiatie complex dat PolII en de algemene transcriptiefactoren bevat (zie fig 1136). We kunnen nu zien dat de assemblage van een preinitiatie complex en stimulatie van de transcriptie aan een promotor resulteert van de interactie van verschillende activatoren met verschillende multi-proteïne co-activatoren complexen. Deze omvatten chromatine-omvormings complexen, histone acetylase complexen en een mediator complex. Terwijl er nog veel geleerd moet worden omtrent deze processen, is het duidelijk dat het netto resultaat van deze multiple moleculaire gebeurtenissen is dat de activatie van de transcriptie aan een promotor afhangt van sterk coöperatieve interacties geïnitieerd door verscheidene activatoren. Dit laat genen toe gereguleerd te worden op een celtype specifieke manier door specifieke combinaties van transcriptiefactoren. Het TTR gen, dat codeert voor transthyretine in zoogdieren, is een goed voorbeeld hiervan. Zoals vroeger vermeld wordt transthyretine uitgedrukt in hepatocyten en in choid plexus cellen. De transcriptie van het TTR gen in hepatocyten wordt gecontroleerd door tenminste vijf verschillende transcriptionele activatoren. Niettegenstaande drie van deze activatoren-HNF4, C/EBP en AP1- ook tot uitdrukking komen in cellen van de darm en de nier, gebeurt de TTR transcriptie niet in deze cellen, omdat alle vijf de activatoren vereist zijn maar HNF1 en HNF3 ontbreken. Andere hepatocyten specifieke enhancers en promotor-proximale regio’s die bijkomende genen reguleren die enkel uitgedrukt worden in hepatocyten bevatten bindings siten voor andere specifieke combinaties van transcriptiefactoren enkel gevonden in deze cellen, samen met ubiquitously(???) uitgedrukt. Het gist twee-hybride systeem maakt gebruik van activator flexibiliteit om cDNA’s te detecteren die coderen voor interagerende proteïnen Een krachtige moleculaire genetische methode, de gist two-hybrid system genoemd, maakt gebruik van de flexibiliteit in activator structuren om genen te identificeren wiens producten binden aan een specifiek proteïne van interesse. Omwille van het belang van proteïne-proteïne interacties in bijna alle biologische processen, wordt het gist two-hybrid system wijd gebruikt in biologisch onderzoek. Deze methode gebruikt een gist vektor voor de uitdrukking van een DNA-bindings domein en een flexible linker regio zonder het geassocieerde activatie domein, zoals het verwijderde GAL4 dat aminozuren 1-692 bevat. (???) Een cDNA sequentie
coderend voor een proteïne of proteïne domein van interesse, het bait domein genoemd, wordt gefuseerd in het kader met de flexibele linker regio zodat de vektor een hybride proteïne zal uitdrukken samengesteld uit het DNA bindingssomein, linker regio en bait domein. Een cDNA bibliotheek wordt gekloneerd in meerdere copies van een tweede gistvektor die codeert voor een sterk activatiedomein en flexibele linker om een vector bibliotheek te produceren die meerdere hybride proteïnen tot uitdrukking brengt, elk een verschillend fish domein bevatten. De bait vector en de bibliotheek aan fish vectoren worden dan getransfecteerd in ontworpen gistcellen in dewelk de enige kopie van een gen vereist voor histidine synthese (HIS) onder controle is van een UAS met bindings siten voor het DNAbindings domein van het hybride bait proteïne. De transcriptie van het HIS gen vereist de activatie door proteïnen gebonden aan het UAS. Getransformeerde cellen die het bait hybride en een interagerend fish hybride tot uitdrukking brengen zullen in staat zijn de transcriptie van het HIS gen te activeren. Dit systeem werkt omwille van de flexibiliteit in de tussenruimte tussen het DNA-bindingsdomein en de activatiedomeinen van eukaryote activatoren. Een twee-staps selectie proces wordt gebruikt. De bait vektor drukt ook een wild-type TRP gen uit en de hybride vector drukt een wild-type LEU gen uit. Getransfecteerde cellen worden eerst gekweekt in een medium dat tryptofaan en leucine ontbreekt, maar histidine bevat. Enkel cellen die de bait vector en één van de fish plasmiden hebben opgenomen zullen overleven in dit medium. De overlevende cellen worden dan geplaatst in een medium dat histidine ontbreekt. Deze cellen die een fish hybride tot uitdrukking brengen dat niet bindt aan de bait hybride kunnen het HIS gen niet afschrijven en zullen bijgebolg geen kolonie vormen op een medium dat geen histidine bevat. De weinige celln die een baitbinding fish hybride tot uitdrukking brengen zullen groeien en kolonies vormen in de afwezigheid van histidine. Het terugvinden van de fish vectoren van deze kolonies levert de cDNA’s coderend voor proteïne domeinen die interageren met het bait domein. KEY CONCEPTS OF SECTION 11.5 moleculaire mechanismen van transcriptie activatie en repressie Eukaryote transcriptie activatoren en repressoren oefenen hun effecten grotendeels uit door de binding aan multisubeenheid co-activatoren of co-repressoren die de assemblage van PolII transcriptie proeinitiatie complexen beïnvleoden ofwel door de modulatie van de chromatine structuur (indirect) of door de interactie met Pol II en de algemene transcriptie factoren (direct). Het DNA in gecondenseerde regio’s van chromatine (heterochromatine) is relatief ontegankelijk voor transcriptiefactoren en andere proteïnen, zodat de genexpressie onderdrukt wordt. De interacties van verscheidene proteïnen met elkaar en met de hypogeacetyleerde N-terminale staarten van histonen H3 en H4 zijn verantwoordelijk voor de chromatine-gemedieerde repressie van de transcriptie die gebeurt in de telomeren en de stille paringssoort loci in S. Cerevisiae. Sommige repressie domeinen functioenren door interactie met co-repressoren die histone deacetylase complexen zijn. De daaropvolgende deacetylatie van histone Nterminale staarten in nucleosomen nabij de repressor-bindings site verhindert de interactie tussen het promotor DNA en de algemene transcriptie factoren, daarbij de transcriptie initiatie onderdrukkend.
Bepaalde activatie domeinen functioenren door binding van multiproteïne coactivator complexen zoals histone acetylase complexen. De daaropvolgende hyperacetylatie van histone N-terminale staarten in nucleosomen nabij de activatorbindings site vergemakkelijkt de interacties tussen het promotor DNA en de algemene transcriptie factoren, daarbij de transcriptie initiatie stimulerend. SWI/SNF chromatine omvormings factoren vertegenwoordigen een ander soort coactivator. Deze multisubeenheid complexen kunnen vergankelijk DNA dissociëren van de histone kernen in een ATP-afhankelijke reactie en kunnen ook regio’s van chromatine decondenseren, daarbij de binding bevorderend van DNA-bindings proteïnen die nodig zijn opdat de initiatie aan bepaalde promotoren zou gebeuren. Een mediator, een ander soort co-activator, is een +/-20-subeenheid complex dat een moleculaire brug vormt tussen activatiedomeinen en RNA polymerase II door binding direct aan het polymerase en de activatie domeinen. Door binding aan verscheidene verschillende activatoren tegelijk, helpt de mediator waarschijnlijk de effecten van de meerdere activatoren op een enkele promotor te integreren. Activatoren gebonden aan een afgelegen enhancer kan interageren met transcriptiefactoren gebonden aan een promotor omdat DNA flexibel is en het tussenliggende DNA een grote lus kan vormen. De sterk coöperatieve assemblage van preinitiatie complexen in vivo vereist gewoonlijk verscheidene activatoren. Een cel moet de specifieke set van activatoren vereist voor de transcriptie van een bepaald gen produceren opdat dat gen tot uitdrukking komt. Het gist two-hybride systeem wordt wijd gebruikt om cDNA op te sporen die coderen voor proteïne domeinen die binden aan een specifiek proteïne van interesse.
11.6 regulatie van transcriptiefactor activiteit We hebben gezien in de voorgaande discussie hoe combinaties van activatoren en repressoren die binden aan specifieke DNA regulatorische sequenties de transcriptie van eukaryote genen controleren. Of een speciek gen in een meercellig organisme al dan niet tot uitdrukking komt in een bepaalde cel op een bepaald ogenblik is grotendeels het gevolg van de concentraties en activiteiten van de transcriptiefactoren die interageren met de regulatorische sequenties van dat gen. Welke transcriptiefactoren tot uitdrukking gebracht worden in een bepaald celtype en de geproduceerde hoeveelheden, wordt bepaald door meerdere regulatorische interacties tussen transcriptiefactor genen die voorkomen tijdens de ontwikkeling en diffrentiatie van een bepaald celtype. In chapter 15 en 22 introduceren we voorbeelden van zulke regulatorische interacties tijdens de ontwikkeling en bespreken we de principes van ontwikkeling en diffrentiatie die hebben geleid tot deze voorbeelden. Niet enkel de expressie van transcriptiefactoren door een cel wordt gereguleerd, maar de activiteiten van deze uitgedrukte factoren in een bepaald celtype worden gewoonlijk verder indirect gecontroleerd als resultaat van interacties tussen proteïnen aan de oppervlakken van de naburige cellen en door extracellulaire hormonen en groeifactoren. In meercellige organismen worden deze laatstgenoemde signaal moleculen gesecreteerd van één celtype en beïnvloeden de functie van cellen die nabij kunnen liggen of op een verschillende lokatie in het organisme. Eén belangrijke groep van extracellulaire signalen omvat peptiden en proteïnen, die binden aan receptoren in het plasmamembraan. Lingand binding aan deze receptoren veroorzaakt intracellulaire signaal-transductie paden. In chapters 14 en
15 beschrijven we de belangrijkste soorten cel-oppervlak receptoren en intracellulaire singaal paden die de transcriptiefactor activiteit reguleren. In deze sectie bespreken we de tweede belangrijke groep van extracellulaire signalen, de kleine, lipide-oplosbare hormonen –thyroid hormonen- die kunnen diffuseren doorheen plasma en nucleaire membranen en direct interageren met de transcriptiefactoren die ze controleren. Zoals vroeger vermeld functioenren de intracellulaire receptoren voor de meeste van deze lipide-oplosbare hormonen, die de nucleaire-receptor superfamilie vormen, als transcriptie activatoren wanneer ze gebonden zijn aan hun liganden. Alle nucelaire receptoren delen een gemeenschappelijke domein structuur De klonering en sequentie bepaling van de genen coderend voor verschillende nucleaire receptoren onthulde een opmerkelijke observatie in hun aminozuursequenties en drie functionele regio’s. Al de nbucleaire receptoren hebben een unieke N-terminale regio van variabele lengte (100-500 aminozuren). Delen van deze variabele regio functioneren als activatiedomeinen in bepaalde nucleaire receptoren. Het DNA-bindings domein afgebeeldt nabij het centrum van de primaire sequentie en heeft een herhaling van het C4 zinkvinger motief. Het hormoonbindings domein, gelokaliseerd nabij het C-terminale einde, bevat een hormoon afhankelijk activatie domein. Bij sommige nucleaire receptoren, functioneert het hormoon-bindings domein als een repressie domein in de afwezigheid van het ligand. Nucleaire-receptor response elementen bevat omgekeerde of direct repeats De karakteristieke nucleotide sequenties van de DNA sites, response elementen genoemd, die binden aan verscheidene nucleaire receptoren werden bepaald. De sequentie van de consensus response elementen voor de glucocorticois en estrogeen receptoren zijn 6-bp inverted repeats gescheiden door om het even welke drie bp. Deze bevinding suggereert dat de cognate steroid hormoon receptoren zouden binden aan DNA als symmetrische dimeren, zoals later getoond was door xray kristallografie analysen van het homodimerisch glucocorticoid receptor’s C4 zinkvinger DNA-bindings domein. Bepaalde nucleaire-receptor response elementen, zoals deze van de receptoren die vitamine D3, thyroid hormoon, en retinoic zuur binden, zijn direct repeats van dezelfde sequentie herkend door de oestrogeen receptor, gescheiden door drie tot vijf bp. De specificiteit van antwoord op deze verschillende hormonen doorde binding van verschillende receptoren wordt bepaald door de tussenruimte tussen de repeats. De receptoren die binden aan zulke direct-repeat response elementen doen dit als heterodimeren met een gemeenschappelijke nucleaire-receptor monomeer, RXR genoemd. Het vitamine D3 response element, bijvoorbeeld, wordt gebonden door het RXR-VDR heterodimeer en het retinoic zuur response element wordt gebonden door RXR-RAR. De monomeren, die deze heterodimeren samenstelle, interageren met elkaar op zulke manier dat de twee DNA-bindings domeinen eerder in dezelfde dan in de omgekeerde oriëntatie liggen, wat toelaat de RXR heterodimeren te binden aan direct repeats van de bindingssite van elk monomeer. In tegenstelling hebben de monomeren in homodimerische nucleaire receptoren (vb GRE en ERE) een omgekeerde oriëntatie.
Hormoon binding aan een nucleaire receptor reguleert zijn activiteit als transcriptie factor Het mechanisme waarbij hormoonbinding de activiteit van nucleaire receptoren controleert verschilt voor heterodimerische en homodimerische receptoren. Heterodimerische nucleaire receptoren (vb RXR-VDR, RXR-TR en RXR-RAR) zijn enkel gelokaliseerd in de nucleus. In de afwezigheid van hun hormoon ligand, onderdrukken ze de transcriptie wanneer gebonden aan hun cognate sites in DNA. Ze doen dit door de sturing van histone deacetylatie aan nabijgelegen nucleosomen door het vroeger beschreven mechanisme. Zoals we eerder zagen ondergaat het ligand-bindings domein van de RAR monomeer in de aanwezigheid van hormoon een dramtische conformationele vergeleken met het ligand-bindings domein van een nucleaire receptor in de afwezigheid van het hormoon. In de ligand-gebonden conformatie kunnen heterodimerische nucleaire receptoren die RXR bevatten de hyperacetylatie van de histonen in nabijgelegen nucleosomen sturen, daarbij de repressie effecten van het vrije ligand-bindingsdomein omkerend. In de aanwezigheid van ligand, binden ligand-bindings domeinen van nucleaire receptoren ook mediator, wat de vorming van preinitiatie complex stimuleert. In tegenstelling tot heterodimerische nucleiare receptoren, worden homodimerische receptoren gevonden in het cytoplasma in de afwezigheid van hun liganden. Hormoon binding aan deze receptoren leidt tot hun translocatie naar de nucleus. De hormoonafhankelijke translocatie van de homodimerische glucocorticoid receptor (GR) werd aangetoond in de transfectie experimenten getoond in figuur 11-43. Het GR hormoon bindings domein alleen bemiddelt dit transport. Daaropvolgende studies toonde dat, in de afwezigheid van hormoon, GR verankerd is in het cytoplasma als een groot proteïne aggregaat gecomplexeerd met inhibitor proteïnen, waaronder Hsp90, een proteïne verwant aan Hsp70, de belangrijkste warmte-shock chaperon in eukaryote cellen. Zolang als de receptor opgesloten is in het cytoplasma, kan het niet interageren met doelwitgenen en vandaar de transcriptie niet activeren. Hormoon binding aan een homodimerisch nucleaire receptor stelt de inhibitor proteïnen vrij, wat de receptor toelaat binnen te treden in de nucleus, waar het kan binden aan response elementen verbonden met doelwit genen. Eens de receptor gebonden is aan een response element, activeert het de transcriptie door interactie met chromatine-omvormings en histone acetylase complexen en mediator. KEY CONCEPTS OF SECTION 11.6 regulatie van transcriptiefactor activiteit De activiteiten van vele transcriptie factoren worden indirect gereguleerd door binding van extracellulaire proteïnen en peptiden aan celoppervlak receptoren. Deze receptoren activeren intracellulaire signaal transductie paden die specifieke transcriptie factoren reguleren via een variëteit aan mechanismen besproken in chapter 13 en 14. Nucleaire receptoren vormen een superfamilie van dimerische C4 zinkvinger transcriptiefactoren die lipide-oplosbare hormonen binden en interageren met specifieke response elementen in DNA. Hormoon binding aan nucleaire receptoren induceert conformationele veranderingen die hun interacties met andere proteïnen veranderen. Heterodimerische nucleaire receptoren (vb deze voor retinoiden, vitamine D en thyroid hormoon) worden enkel gevonden in de nucleus. In de afwezigheid van
hormoon, onderdrukken ze de transcriptie van doelwit genen met het overeenkomstige response element. Wanneer ze gebonden zijn aan hun liganden, activeren ze de transcriptie. Steroid hormoon receptoren zijn homodimerische nucleaire receptoren. In de afwezigheid van hormoon, zitten ze vast in het cytoplasma door inhibitor proteïnen. Wanneer gebonden aan hun liganden, kunnen ze zich verplaatsen naar de nucleus en de transcriptie van de doelwitgenen activeren.
11.7 Gereguleerde elongatie en terminatie van de transcriptie In eukaryoten verschillen de mechanismen voor de terminatie van de transcriptie door de drie RNA polymerasen van elkaar.De transcriptie van pre-rRNA genen door RNA polymerase I wordt beëindigd door een mechanisme dat een polymerasespecifieke terminatie factor vereist. Dit DNA bindings proteïne bindt aan een specifieke DNA sequenties downstream van de transcriptie eenheid. Efficiënte terminatie vereist dat de terminatie factor vindt aan het matrijs DNA in de juiste richting. Opgezuiverd RNA polymerase III beëindigt na polymerisering een serie van U residu’s. Het deoxy(A) n-ribo(U)n DNA-RNA hybride dat resulteert wanneer een stukje van U’s gesynthetiseerd worden is bijzonder instabiel in vergelijking met alle andere gebasepaarde sequenties. Het gemak waarmee deze hybride gesmolten kan worden, draagt waarschijnlijk bij tot het mechanisme van terminatie door RNA polymerase III. In de meeste zoogdierlijke proteïne coderende genen afgeschreven door RNA polymerase II, eens het polymerase meer dan ongeveer 50 basen afgeschreven heeft, is verdere elongatie sterk processief en eindigt niet tot na een sequentie is afgeschreven die de klieving en polyadenylatie van het RNA stuurt aan de sequentie die het 3’einde van het gecodeerde mRNA vormt. RNA polymerase II kan dan stoppen aan verschillende sites geplaatst over een afstand van 0,5-2kb achter deze poly(A) additie site. Experimenten met mutant genen tonen dat terminatie gekoppeld is aan het proces dat het 3’einde van een transcript klief en polyadenyleert, wat besproken is in de volgende chapter. Biochemische en chromatine immunoprecipitatie experimenten suggeren dat het proteïne complex dat het ontluikende mRNA transcript klieft en polyadenyleert aan specifieke sequenties associeert met het gefosforyleerde carboxyl-terminale domein (CDT) van RNA polymerase II, de initiatie volgend. Dit klieving/polyadenylatie complex kan de terminatie door RNA polymerase II onderdrukken totdat de sequentie signaal klieving en polyadenylatie afschreven is door het polymerase. Terwijl transcriptie terminatie ongereguleerd is voor de meeste genen wordt er voor sommige genen een keuze gemaakt tussen elongatie en terminatir of pauzering binnen enkele tientallen basen van de transcriptie start site. Deze keuze tussen elongatie en terminatie of pauzering kan gereguleerd worden; dus wordt de expressie van het gecodeerde proteïne niet enkel gecontroleerd door transcriptie initiatie, maar ook door controle van transcriptie elongatie vroeg in de transcriptie eenheid. We bespreken twee voorbeelden van zulke regulatie. De transcriptie van het HIV genoom wordt gereguleerd door een antiterminatie mechanisme Tegenwoordig levert de transcriptie van het humaan immunodefiency virus (HIV) genoom door RNA polymerase II het best-begrepen voorbeeld van gereguleerde
transcriptie terminatie in eukaryoten. De efficiente expressie van HIV genen vereist een klein viraal proteïnen gecodeerd aan de tat locus. Cellen geïnfecteerd met tatmutanten produceren korte virale transcripten dat hybridieren aan restrictiefragmenten die promotor-proximale regio’s van het HIV DNA bevatten maar niet aan restrictiefragmenten verder downstream van de promotor. In tegenstelling synthetiseren cellen geïnfecteerd met wild-type HIV lange virale transcripten die hybridiseren aan restrictie fragmenten door heel de enkele HIV transcriptie eenheid. Dus functioneert het Tat proteïne als een antiterminatie factor, wat RNA polymerase II toelaat te lezen doorheen een transcriptionele blokkering. Aangezien antiterminatie door Tat proteïne vereist is voor HIV replicatie, kan verder begrip van dit gencontrolerend mechanisme mogelijkheden leveren voor het ontwerp van effectieve behandelingen voor acquired immunodeficiency syndrome (AIDS). Tat is een sequentie-specifiek RNA-bindings proteïne. Het bindt aan de RNA kopie van een sequentie (TAR genoemd), die gelokaliseerd is nabij het 5’einde van het HIV transcript. De TAR sequentie vouwt in een RNA haarspeld met een bobbel in het midden van de stam. TAR bevat twee bindingssiten: één die interageert met Tat en één die interageert met een cellulair proteïne, cycline T genoemd. Zoals geschets in figuur 11-45 binden het HIV Tat proteïne en cellulair cycline T elk aan TAR RNA en interageren ook direct met elkaar zodat ze coöperatief binden, veel zoals de coöperatieve binding van DNA-bindings transcriptie factoren. De interactie van cycline T met een proteïne kinase, CDK9 genoemd, activeert het klinase, wiens substraat het CDT van RNA polymerase II is. In vitro transcriptie studies gebruik makend van een specifieke inhibitor van CDK9 suggereert dat RNA polymerase II moleculen die de transcriptie aan de HIV promotor initiëren eindigen na het afschrijven van +/-50 basen tenzij het CDT hypergefosforyleerd is door CDKp. Coöperatieve binding van cycline T en Tat aan de Tar sequentie aan het 5’einde van het HIV trascript plaatst CDK9 zodat het het CTD kan fosforyleren, daarbij de terminatie voorkomend en toelatend dat het polymerase de ketenelongatie verderzet. Verscheidene bijkomende cellulaire proteïnen, waaronder Spt4 en Spt5 en het NELF complex, nemen deel in het proces waardoor HIV Tat de elongatie versus de terminatie controleert. Expermimenten met de specifieke inhibitor van CDK9 hierboven vermeld en met spt4 en spt5 gist mutanten duiden aan dat deze cellulaire proteïne vereist zijn voor de transcriptie elongatie achter +/- 50 basen voor de meeste cellulaire genen. Maar voor de meeste genen, lijken deze proteïnen te constitutief functioneren, dat wil zeggen zonder gereguleerd te worden. Zoals besproken in chapter 12 denkt men dat RNA polymerase II pauzering uitgelokt door Spt4/5 en NELF om de elongatie te vertragen totdat mRNA processing factoren associëren met het gefosforyleerde CTD. Verdere fosforylatie van het CTD door cycline T-CDK9 (ook gekend als pTEDFb) lijkt deze pauze om te keren en laat de elongatie toe verder te gaan. Tegenwoordig is het onduidelijk waarom dit proces niet constitutief is voor de HIV promotor, waar coöperatieve bindng van HIV Tat en cycline T aan de TAR RNA sequentie vereist zijn voor efficiënte elongatie. Promotor-proximale pauzering van RNA polymerase II komt voor in bepaalde snel geïnduceerde genen De warmte-shock genen (vb hsp70) illustreren een ander mechanisme voor de regulering van RNA keten elongatie in eukaryoten. Tijdens de transcriptie van deze
genen, pauzeert RNA polymerase II na +/- 25 nucleotiden afgeschreven te hebben maar beëindigt de transcriptie niet (zoals het doet wanneer het HIV genoom afgeschreven wordt in afwezigheid van het Tat proteïne). Het gepauzeerde polymerase blijft geassocieerd met het ontluikende RNA en het matrijs DNA, totdat de condities zich voordoen die leiden tot de activatie van HSTF (heat-shock transcriptiefactor). Daaropvolgende binding van geactiveerd HSTF aan specifieke siten in de promotor-proximale regio van warmte-shock genen stimuleren het gepauzeerde polymerase de keten elongatie verder te zetten en promoten snelle reïnitiatie door bijkomende RNA polymerase II moleculen. De pauzering tijdens de replicatie van warmte-shock genen werd voor het eerst ontdekt bij Drosophila, maar een gelijkaardig mechanisme komt waarschijnlijk ook voor in andere eukaryoten. Warmte-shock genen worden geïnduceerd door intracellulaire condities die proteïnen denaturen (zoals verhoogde temperatuur: warmte shock). Sommige coderen proteïnen die relatief resistent zijn tegen denaturende condities en werken om andere proteïnen tegen denaturatie te beschermen; andere zijn chaperonines die de gedenatureerde proteïnen hervouwen. Het mechanisme van transcriptionele controle die betrokken is om de expressie van deze genen te reguleren laat een snelle respons toe: deze genen zijn reeds gepauzeerd in een toestand van uitgestelde transcriptie en daarom, wanneer een onverwachtte gebeurtenis zich voordoet, vereisen ze geen tijd om chromatine om te vormen en te acetyleren over de promotor en een transcriptie preinitiatie complex te vormen. KEY CONCEPTS FOR SECTION 11.7 Gereguleerde elongatie en terminatie van de transcriptie Verschillende mechanismen van transcriptie terminatie worden gebruikt door elk van de eukaryote nucleaire RNA polymerasen. De transcriptie van de meeste proteïnecoderende genen wordt niet beëindigd totdat een RNA sequentie wordt gesynthetiseerd die een site voor klieving en polyadenylatie bepaald. De transcriptie van het HIV genoom door RNA polymerase II wordt gereguleerd door een antiterminatie mechanisme dat coöperatieve binding vereist door het virusgecodeerde Tat proteïne en cycline T aan de TAR sequentie nabij het 5’einde van het HIV RNA. Tijdens de transcriptie van Drosophila warmte shock genen pauzeert het RNA polymerase II binnen de downstream promotor-proximale regio; deze onderbreking in de transcriptie wordt opgeheven wanneer de HSTF transcriptiefactor geactiveerd wordt, resulterend in zeer snelle transcriptie van de warmte shock genen als antwoord op de opstapeling van gedenatureerde proteïnen.
11.8 andere eukaryote transcriptie systemen We sluiten deze chapter af met een korte bespreking omtrent de transcriptie initiatie door de andere twee nucleaire RNA polymerasen, PolI en PolIII en door de verschillende polylmerasen die mitochondriaal en chloroplast DNA afschrijven. Hoewel deze systemen, vooral hun regulatie, minder door en door begrepen zijn ddan de transcriptie door RNA polymerase II, zijn ze ook fundamenteel in het leven van eukaryote cellen. Transcriptie initiatie door Pol I en Pol III is analoog aan deze door Pol II
De vorming van transcriptie-initiatie complexen waarin Pol I en Pol III betrokken zijn is gelijkaardig in sommige opzichten aan de assemblage van Pol II intiatie complexen. Elk van de drie eukaryotische nucleaire RNA polymerasen vereisen echter hun eigen polymerase-specifieke algemenen transcriptie factoren en herkennen verschillende DNA controle elementen. Bovendien vereist noch Pol I noch Pol III ATP hydrolyse om de transcriptie te initiëren, waar Pol II dit wel doet. Transcriptie initiatie door Pol I, dat pre-rRNA synthetiseert en door Pol III, dat tRNA’s, 5S rRNA en andere korte, stabiele RNA’s synthetiseert, werd vooral in S. Cerevisiae gekarakteriseerd gebruik makend van zowel biochemisch als genetische methoden. Het is duidelijk dat de synthese van tRNA en van rRNA’s, die ingebouwd worden in ribosomen, sterk gekoppeld is aan de snelheid van celgroei en proliferatie. Veel moet er echter nog geleerd worden over hoe transcriptie initiatie door Pol I en Pol III gereguleerd wordt zodat de synthese van pre-rRNA, 5S rRNA en tRNA’s gecoördineerd wordt met de groei en replicatie van cellen. Initiatie door Pol I De regulatorische elementen die Pol I initiatie sturen zijn gelijkaardig gelokaliseerd ten opzichte van de transcriptionele start site in zowel gist als zoogdieren. Een kern element, dat de startsite van –40 tot +5 overspant, is essentiëel voor Pol I transcriptie. Een bijkomend upstream element uitstekend van ruwweg –155 tot –60 stimuleert tienvoudig de in vitro Pol I transcriptie. De assmeblage van een volledig actief Pol I initiatie complex begint met de binding van een multimerische upstream activerende factor (UAF° aan het upstream element. Twee van de zes subeenheden die UAF samenstellen zijn histonen, die waarschijnlijk deelnemen aan de DNA binding. Daaropvolgend bindt een trimerische kern factor aan het kern element samen met TBP, die contact maakt met zowel het gebonden UAF als met de kern factor. Tenslotte associeert een voorgevormd complex van Pol I en Rrn3p met de gebonden proteïnen, Pol I nabij de start site plaatsend.Bij mensencellen is TBP stabiel gebonden aan drie andere polypeptiden, een initatie factor, SL1 genoemd, vormend die bindt aan de kern promotor element en functioneel equivalent is aan gist kern factor plus TBP. Initiatie door Pol III In tegenstelling tot proteïne-coderende genen en pre-rRNA genen liggen de promotor regio’s van tRNA en 5S-rRNA genen geheel binnen de afgeschreven sequentie.Twee zulke interne promotor elementen, de A box en de B box genaamd, zijn aanwezig in alle tRNA genen. Deze sterk bewaarde sequenties functioneren niet enkel als promotoren maar coderen ook twee invariante delen van eukaryote tRNA’s die vereist zijn voor de proteïne synthese. In 5S-rRNA genen werkt een enkele interne controle regio, de C box, als promotor. Drie algemene transcriptie factoren zijn vereist voor Pol III om de transcriptie van tRNA en 5S-rRNA genen te initiëren in vitro. Twee multimerische factoren, TFIIIC en TFIIIB, nemen deel aan de initiatie bij zowel tRNA als 5S-rRNA promotoren; een derde factor, TFIIIA, is vereist voor de initiatie aan 5S-rRNA promotoren. Zoals bij de assemblage van Pol I en Pol II initiatie complexen binden de Pol III algemene transcriptiefactoren aan promotor DNA in een bepaalde sequentie. De N-terminale helft van één TFIII subeenheid, BRF genoemd (voor TFIIB-verwante factor), gelijkt in sequentie op TFIIB (een PolII factor). Deze gelijkaardigheid
suggereert dat BRF en TFIIB een gelijkaardige functie uitvoeren in de initiatie, namelijk het sturen van het polymerase nar de correcte start site. Eens TFIIIB gebonden is aan ofwel een tRNA ofwel een 5S-rRNA gen, kan Pol III binden en de transcriptie initiëren in de aanwezigheid van ribonucleoside trifosfaten. De BRF subeenheid van TFIIIB interageert specifiek met één van de polymerase subeenheden uniek aan Pol II, verantwoordelijk voor de initiatie door deze specifieke nucleaire RNA polymerase. Een andere van de drie subeenheden waaruit TFIIIB bestaat is TBP, die we nu kunnen zien als een component van een algemene transcriptiefactor voor alle drie de eukaryote nucleaire RNA polymerasen. De bevinding dat TBP deelneemt in de transcriptie initiatie door Pol I en Pol III was verbazingwekkend, aangezine de promotoren herkend door deze enzymen vaak geen TATAboxen bevatten. Niettemin duiden recente studies aan dat de TBP subeenheid van TFIIIB interageert met DNA op een gelijkaardige manier als het interageert met TATAboxen. Mitochondriale en chloroplast DNA’s worden afgeschreven door organel-specifieke RNA polymerasen Zoals besproken in chapter 10 evolueerden mito’s en chloroplasten waarschijnlijk van bacteriën die geëndocytoseerd waren in voorouderlijke cellen die een eukaryote nucleus bevat. In hedendaagse eukaryoten bevatten beide organellen verschillende circulaire DNA’s die coderen voor sommige van de proteïnen essentieel aan hun specifieke functies. De RNA polymerasen die mitochondriaal (mt) DNA en chloroplast DNA afschrijven zijn gelijkaardig aan de polymerasen van bacteriën en bacteriofagen. Mitochondriaal RNA polymerase Het RNA polymerase dat mtDNA afschrijft wordt gecodeerd in nucleair DNA. Na de synthese van het enzyme in het cytosol wordt het geïmporteerd in de mitochondriale matrix door mechanismen beschreven in chpater 16. De mitochondriale RNA polymerasen van S. Cerevisiae en de kikker Xenopus laevis bestaan beide uit een grote subeenheid met ribonucleotide-polymerisering activiteit en een kleine subeenheid, of specificiteits factor, essentieel vaan het initiëren van de transcriptie aan de startsites in mtDNA gebruikt in de cel. De grote subeenheid van gist mitochondriaal RNA polymerase is duidelijk verwant aan de monomerische RNA polymerasen van bacteriofaag T7 en gelijkaardige bacteriofagen. Het mitochondriale enzyme is echter functioneel verschillend van het bacteriofaag enzyme in zijn afhaneklijkheid van de kleine subeenheid voor transcriptie aan de gepaste start sites. Deze kleine subeenheid is verwant aan de σ factoren in bacterieële RNA polymerasen, die interageren met promotor DNA en functioneren als initiatie factoren. Dus lijkt mitochondriaal RNA polymerase een hybride te zijn van de eenvoudige bacteriofaag RNA polymerasen en de multisubeenheid bacteriële RNA polymerasen van tussenliggende complexiteit. De promotor sequenties herkend door mitochondriale RNA polymerasen omvat de transcriptie start site. Deze promotor sequenties, die rijk zijn aan A residu’s, werden gekarakteriseerd in het mtDNA van gist, planten en dieren. Het circulaire, humane mitochondriale genoom bevat twee verwante 15-bp promotor sequenties, één voor de transcriptie van elke streng. Elke streng wordt in zijn geheel afgeschreven; de lange primaire transcripten worden dan verwerkt om mitochondriale mRNA’s, rRNA’s en tRNA’s te leveren.Een klein basis proteïnen, mtTF1 genoemd, dat onmiddelijk
upstream bindt van twee mitochondriale promotoren, stimuleert de transcriptie sterk. Een homoloog proteïne gevonden in gist mito’s is vereist voor het behoud van mtDNA en vervult waarschijnlijk een gelijkaardige functie. Chloroplast RNA polymerase ni interessant KEY CONCEPTS OF SECTION 11.8 andere eukaryote transcriptie systemen Het proces van transcriptie initiatie door Pol I en Pol III gelijkt op dat door Pol II maar vereist andere algemene transcriptiefactoren, wordt gestuurd door andere promotor elementen en vereist geen ATP hydrolyse. Mitochondriaal DNA wordt afgeschreven door een nucleair-coderend RNA polymerase samengesteld uit twee subeenheden. Eén subeenheid is homoloog aan het monomerische RNA polymerase van bacteriofaag T7; de andere lijkt op bacteriële σ factoren. Chloroplast DNA wordt afgeschreven door een chloroplast gecodeerd RNA polymerase homoloog aan bacteriële RNA polymerasen, met uitzondering dat het een σ factor ontbreekt.
FIGUREN H11: Figuur 11-1 Overzicht van transcriptie controle in meercellige eukaryoten Activator proteïnen binden aan specifieke DNA controle elemtnen in het chromatine en interageren met multiproteïne co-activator machines, zoals mediator, om chromatine te decondenseren en RNA polymerase en algemene transcriptie factoren te verzamelen aan promotoren. Inactieve genen worden verzameld in regio’s van gecondenseerd chromatine die RNA polymerasen en hun geassocieerde algemene transcripite factoren (GTF’s) inhiberen te interageren met promotoren. Alternatief binden repressor proteïnen aan andere controle elementen om de initiatie door RNA polymerase te verhinderen en te interageren met multiproteïne co-repressor complexen om chromatine te condenseren. Figuur 11-3 5’-deletie analyse kan transcriptie-controle sequenties in DNA upstream van een eukaryoot gen identificeren Stap1: Recombinant DNA technieken worden gebruikt om een serie van DNA frafmanten die uitsteken van de 5’-niet-vertaalde regio van een gen met verschillende upstream afstanden klaar te maken. Stap2: De DNA fragmenten worden geligeerd in een receptor plasmide upstream van een gemakkelijk analyseerbaar reportergen. Stap3: Het DNA wordt getransformeerd in E. Coli om plasmiden te isoleren met deleties van verschillende lengte 5’ aan de transcriptie start site. Stap4: Elk plasmide wordt dan getransfecteerd in gekweekte cellen (of gebruikt om transgenetische organismen te bereiden(5)). De resultaten van dit hypothetische voorbeeld (bodem) duidt aan dat het testfragment twee controle elementen bevat. Het 5’einde van het ene ligt tussen deleties 2 en 3; het 5’einde van het andere ligt tussen deleties 4 en 5. Figuur 11-101 Linker scanning mutaties identificeren transcriptie-controle elementen (a) Een regio van eukaryoot DNA (oranje) die hoge concentratie van een reporter gen (licht blauw) ondersteunt wordt gekloneerd in een plasmide vektor zoals
bovenaan voorgesteld. Overlappende linker scanning (LS) mutaties (crosshatch) worden geintroduceerd van één einde van de regio die geanalyseerd wordt naar de andere. Deze mutaties resulteren van scrambling de nucleotide sequentie in een korte streng van het DNA. Nadat de mutant plasmiden gescheiden getransfecteerd zijn in gekweekte cellen, wordt de activiteit van het reporter-gen geanalyseerd. In het hypothetische voorbeeld hier getoond hebben LS mutaties 1, 4, 6, 7 en 9 weinig of geen invloed op de expressie van het reporter gen, aanduidend dat de regio’s veranderd in deze mutanten geen controle elementen bevatten. Reporter gen expressie wordt aanzienlijk gereduceerd un mutanten 2, 3, 5 en 8, aanduidend dat de controle elementen (bruin) liggen in de intervallen getoond beneden. (b) De analyse van LS mutaties in de transcriptie-controle regio van het thymine kinase (tk) gen van herpes simplex virus (HSV) identificeerde een TATA box en twee promotorproximale elementen (PE-1 en PE-2). Figuur 11-12 Het algemene patroon van controle elementen die de genexpressie reguleren in meercellige eukaryoten en gist (a) Genen van meercellige organismen bevatten zowel promotoer-proximale elementen als enhancers, net als een TATA box of een ander promoter element. De promotor elementen positioneren RNA polymerase II om de transcriptie te initiëren aan de start site en de snelheid van transcriptie te beïnvloeden. Enhancers kunnen ofwel upstream ofwel downstream en zover als 50 kb van de transcriptie start site liggen. In sommige gevallen leggen de enhanceren binnen intronen. Voor bepaalde genen komen promoter-proximale elementen downstream voor van de start site net als upstream. (b) De meeste S. Cerevisiae genen bevatten enkel één regulatorische regio, een upstream activerende sequenties (UAS) genoemd en een TATA box, die +/-90 bp upstream van de start site ligt. Figuur 11-13 Dnase I vingerprinting onthult controle element sequenties en kan gebruikt worden als een analyse in transcriptie factor opzuivering (a) Dnase I footprinting kan controle element sequenties identificeren. Een DNA fragment, waarvan men weet dat het controle element bevat, wordt gelabeld aan één einde met 32P (rode bol). Delen van het gelabelde DNA staal worden dan verteerd door Dnase I in de aanwezigheid en afwezigheid van proteïne stalen waarvan men denkt dat ze een overeenkomste proteïne bevatten. Dnase I hydrolyseert willekeurig de fosfodiester bindingen van DNA tussen het 3’zuurstof aan het deoxyribose van één nucleotide en de 5’fosfaat aan de volgende nucleotide. Een lage concentratie van Dnase I wordt gebruikt zodat gemiddeld elk DNA molecule juist één keer geklieft is (verticale pijlen). Als het proteïne staal een niet-overeenkomstig DNA-bindings proteïne bevat, wordt het DNA fragment gekliefd op meerdere posities tussen het gelabelde en niet-labelde einde van het oorspronkelijke fragment, zoals in staal A links. Als het proteïne staal het overeenkomstige proteïne bevat, zoals in staal B rechts, kan het proteïne binden aan het DNA, daarbij een deel van het fragment beschermend tegen vertering. Na de Dnase behandeling wordt het DNA gescheiden van proteïne, gedenatureerd om de strengen te scheiden en elektroforese uitgevoerd. Autoradiografie van de resulterende gel detecteert enkel gelabelde strengen en onthult fragmenten uitstekend van de gelabelde einde tot aan de site van klieving door Dnase I. Klievings fragmenten, die de controle sequentie bevatten, worden zichtbaar op de gel voor staal A, maar ontbreken ins taal B omdat het
gebonden overeenkomstige proteïne klievingen binnen die sequentie blokkeert en dus de productie van de overeenkomstige fragmenten. De ontbrekende banden aan de gel vormen een footprint. (b) Een proteïne fractie, die een sequentie-specifiek DNA-bindings domein bevat, kan opgezuiverd worden door kolom chromatografe. Dnase I footprinting kan dan identificeren welke van de geëlueerde fracties het overeenkomstige proteïne bevatten. In de afwezigheid van toegevoegd proteïne (NE, geen extract) klieft Dnase I aan meerdere sites, vele banden producerend op de gel getoond hier. Een overeenkomstig proteïne aanwezig in het nucleaire extract toegepast op de kolom (O, onput) genereerde een footprint. Dit proteïne was gebonden aan de kolom, aangezien footprinting activiteit niet gedetecteerd was in de doorstromende proteïne fractie (FT). Na toepassing van een zout-gradiënt over de kolom, elueerde het meeste van het overeenkomstig proteïne in fracties 9-12, zoals aangetoond door de ontbrekende banden (footprints). De sequentie van de proteïnebindings regio kan bepaald worden door vergelijking met merker DNA fragmenten van gekende lengte geanalyseerd op het zelfde gen (M). Figuur 11-16 In vivo transfectie analyse meten de transcriptie activiteit om proteïnen te evalueren waarvan men geloofd dat het transcriptie factoren zijn Het analyse systeem vereist twee plasmiden. Eén plasmide bevat het gen coderend voor de vermeende transcriptie factor (proteïne X). Het tweede plasmide bevat een reporter gen (vb lacZ) en één of meer bindings site voor proteïne X. Beide plasmiden worden tegelijk geïntroduceerd incellen die het gen ontbreken dat codeert voor proteïne X. De productie van reporter-gen RNA transcripten wordt gemeten; alternatief kan de activiteit van het gecodeerde proteïne geanalyseerd worden. Als reproter-gen transcriptie groter is in de aanwezigheid van het X-coderend plasmide, dan is het proteïne een activator; als de transcriptie minder is, dan is het een repressor. Door gebruik van plasmiden coderend voor een gemuteerde of herschikte transcriptie factor, kunnen belangrijke domeinen van het proteïne geïdentificeerd worden. Figuur 11-20 Interactie van bacteriofaag 434 repressor met DNA (a)Linten diagram van de 434 repressor gebonden aan zijn specifieke operator DNA. De repressor monomeren zijn in het geel en groen. De herkennings helicesworden aangeduid door *. Een ruimte vullend model van het repressor-operator comples (b) toont goe het proteïne innig interageert met één zijde van het DNA molecule over een lengte van 1.5 draaiingen. Figuur 11-21 Interactie tussen DNA en proteïnen bevattende zink vingers (a) GL1 is een monomerisch proteïne dat vijf C2H2 zinkvingers bevat. Α-helices worden getoond als cilinders, Zn+2 ionen als bollen. Vinger 1 interageert niet met het DNA, terwijl de andere vier vingers dit wel doen. (b) De glucocorticoid receptor is een homodimerische C4 zink-vinger proteïne. Α-helices worden getoond als paarse linten, β-strengen als groene pijlen, Zn+2 ionen als bollen. Twee α helices (donkere tint), één in elke monomeer, interageren met het DNA. Zoals alle C4 zink-vinger homodimeren, heeft deze transcriptie factor een tweevoudige rotationele symmetrie; het centrum van de symmetrie wordt getoond door de gele ellips. In tegenstelling vertonen heterodimerische nucleaire receptoren geen rotationele symmetrie.
Figuur 11-22 Interactie van homodimerische leucine-zipper en basisch helix-lus-helic (bHLH) proteïnen met DNA (a) In leucinezipper proteïnen interageren basische residu’s in de uitstekende αhelicale regio’s van de monomeren met de DNA ruggegraat aan de aangrenzende major groeve’s. Het coiled-coil dimerisatie domein wordt gestabiliseerd door hydrofobe interacties tussen de monomeren. (b) In bHLH proteïnen zijn de DNAbindings helices aan de bodem (N-termini van de monomeren) gescheiden door niethelicale lussen van een leucine-zipper-achtige regio die een coiled-coil dimerisatie domein bevat. Figuur 11-23 Combinationele mogelijkheden te wijten aan de vorming van heterodimerische transcriptie factoren (a) IN het hypothetische voorbeeld getoond kunnen transcriptie factoren A, B en C allen interageren met elkaar, wat toelaat dat de drie factoren binden aan zes verschillende DNA sequenties (sites 1-6) en zes combinaties van activatie domeinen creëren. Elke composiet samenstelling is verdeeld in twee half-sites en elke hetrodimerische factor bevat de activatie domeinen van zijn twee vervangings monomeren. (b) Expressie van een inhibitorische factor (groen) die interageert enkel met factor A verhindt binding; vandaar dat de transcriptionele activatie aan sites 1, 4 en 5 verhinderd is, maar de activatie aan sites 2, 3 en 6 is niet beïnvloed. Figuur 11-27 In vitro vorming van RNA polymerase II preinitiatie complex De aangeduidde algemene transcriptie factoren en opgezuiverd RNA polymerase II (PolII) binden opeenvolgend aan TATA-box DNA om een preinitiatie complex te vormen. ATP hydrolyse verleent dan de energie voor het ontwinden van DNA aan de start site door een TFIIH subeenheid. Als Pol II de transcriptie initieert in het resulterende open complex, beweegt het polymerase weg van de promoter en wordt zijn CTD gefosforyleerd. In vitro dissocieren de algemene transcriptie factoren (uitz voor TBP) van het TBP-promoter complex, maar het is nog niet geweten welke factoren gebonden blijven met de promoter regio’s volgend op elke ronde van transcriptie initiatie in vivo. Figuur 11-28 Ordening van mating-type loci op chromosoom III in de gist S. Cerevisiae Stille (niet-uitgedrukte) mating-type genen (a of α, afhankelijk van de streng) zijn gelokaliseerd aan de HML locus. De tegengestelde mating-type genen zijn aanwezig aan de MAT locus, ze kunnen afgeschreven worden in mRNA’s wiens gecodeerde proteïnen het mating-type fenotype van de cel bepalen. De silencer sequenties nabij HML en HMR binden proteïnen die cruciaal zijn voor de repressie van deze stille loci. Haploïde cellen kunnen veranderen van mating type in een proces dat de DNA sequentie van HML of HMR overdraagt naar de transcriptioneel active MAT locus. Figuur 11-30 Schematisch model van silencing mechanisme aan gist telomeren Meerdere kopies van RAP1 binden aan een eenvoudige herhaalde sequentie aan elke telomeer regio, die nucleosomen ontbreekt (boven). Dit nucleates(??) de
vorming van een multiproteïne complex (beneden) via proteïne-proteïne interacties tussen RAP1, SIR2, SIR3, SIR4 en de hypogeacetyleerde N-terminale staarten van histonen H3 en H4 van de nabijgelegen nucleosomen. SIR2 deacetyleert de histone staarten. De heterochromatine structuur aan elk telomeer omvat +/- 4 kb van DNA naast de RAP1-bindings sites, ongeacht zijn sequentie. De associatie van verscheidene gecondenseerde telomeren vormt hogere orde heterochromatine complexen, zoals deze getoond in figuur 11-29, die sterisch andere proteïnen blokkeren van te interageren met het DNA. Figuur 11-31 De chromatine immunoprecipitatie methode kan de acetylatie toestand van histonen in chromatine onthullen Histonen worden zwak gecrosslinked aan DNA in vivo gebruik makend van een celpermeabele, reversibele, chemische cross-linkende stof. Nucleosomen met geacetyleerde histone staarten worden getoond in het groen. Stap 1: Cross-linked chromatine wordt dan geïsoleerd en gedeeld aan een gemiddelde lengte van twee tot drie nucleosomen. Step 2: een antilichaam tegen een bepaalde geacetyleerde histone staart sequenties wordt toegevoegd en (3) gebonden nucleosomen worden immuno neergeslagen. Stap 4: DNA in de immuno neergeslagen fragmenten wordt vrijgesteld door het omzetten van de cross-link en dan kwantificieel bepaald gebruik makend van een gevoelige PCR methode. De methode kan gebruik worden om de in vivo associatie te analyseren van elk proteïne met een specifieke sequentie van DNA door gebruik van een antilichaam tegen het proteïne van interesse in stap 2. Figuur 11-32 Voorgesteld mechanisme van histone deacetylatie en hyperacetylatie in gist transcriptie controle (a) Repressor-gestuurde deacetylatie van histone N-terminale staarten. Het DNAbindings domein (DBD) van de repressor UME6 interageert met een specifiek upstream controle element (URS1) van de genen die het reguleert. Het UME6 repressie domein (RD) bindt SIN3, een subeenheid van een multiproteïne complex, dat RPD3, een histone deacetylase, omvat. Deacetylatie van histone N-terminale staarten aan nucleosomen in de regio van de UME6-bindings site verhindert de binding van algemene transcriptie factoren aan de TATA box, daarbij de genexpressie onderdrukkend. (b) Activator-gestuurde hyperacetylatie van histone Nterminale staarten. Het DNA-bindings domein van de activator GCN4 interageert met specifieke upstream activerende sequenties (UAS) van de genen die het reguleert. Het GCN4 activatie domein (AD) interageert dan met een multiproteïne histone acetylase complex dat de GCN5 katalytische subeenheid omvat. Daaropvolgende hyperacetylatie van histone N-terminale staarten aan nucleosomen in de nabijheid van de algemene transcriptie factoren vereist voor initiatie. Repressie en activatie van vele genen in hogere eukaryoten gebeurt door gelijkaardige mechanismen. Figuur 11-39 Het gist twee-hybride systeem verleent een manier om een cDNA bibliotheek te screenen voor klonen coderend voor proteïnen die interageren met een specifiek proteïne van interesse Dit is een algemene techniek voor het doorzoeken van een cDNA bibliotheek naar klonen coderend voor proteïnen die interageren met een specifiek proteïne van interesse. (a) Twee vectoren worden geconstrueerd die genen bevatten die coderen
voor hybride (chimerische) proteïnen. In één vektor (links) wordt de coderende sequentie voor het DNA-bindings domein van een transcriptie factor gefuseerd met de sequenties van een gekend proteïne, naar verwezen als het ‘aas’ (bait) domein (licht blauw). De twee vektor (rechts) drukt een activatie domein uit gefuseerd met een ‘vis’ domein (groen) dat interageert met het aas domein. (b) Als gistcellen getransformeerd worden met vektoren die beide hybride’s uitdrukking, interageren de aas en fish delen van de chimerische proteïnen om een functionele transcriptionele activator te produceren. IN dit voorbeeld promoot de activator de transcriptie van een HIS gen. Eén einde van dit proteïne complex bindt aan de upstream activerende sequentie (UAS) van het HIS3 gen; het andere einde, bestaande uit het activatie domein, stimuleert de vorming van het preïnitiatie complex (oranje) aan de promotor (geel). (c) Om een cDNA bibliotheek te doorzoeken voor klonen coderend voor proteïnen die interageren met een bepaald aas proteïne van interesse, wordt de bibliotheek gekloneerd in de vektor coderend voor het activatie domein zodat hybride proteïnen uitgedrukt worden. De aas vektor en de vis vektoren bevatten wild-type selecteerbare genen (vb een TRP of een LEU gen). De enige getransformeerde cellen die het aangeduidde selectie schema overleven zijn deze die het aas hybride uitdrukken en een vis hybride dat ermee interageert. Figuur 11-44 Model van hormoon-afhankelijk gen activatie door een homodimerische nucleaire receptor In de afwezigheid van hormaan wordt de receptor in het cytoplasmagehouden door interactie tussen zijn ligand-bindings domein (LBD) en inhibitor proteïnen. Wanneer hormoon aanwezig is, diffuseert het doorheen het plasmamembraanen bindt aan het ligand-bindings domein, wat een conformationele verandering veroorzaakt die de receptor vrijstelt van de inhibitor proteïnen. De receptor met gebonden ligand wordt dan verplaatst naar de nucleus, waar zijn DNA-bindings domein (DBD) bindt aan response elementen, wat het ligand-bindings domein en een bijkomend activatie domein (AD) toelaat aan de N-terminus om de transcriptie van doelwit genen te stimuleren.