Zrání pre-mRNA Posttranskripční modifikace
Vytvoření čepičky (capping) Polyadenylace Sestřih Editace
Svět RNA a bílkovin SESTŘIH pre-mRNA
Sestřih pre-mRNA
Sestřih pre-mRNA
Spliceosomální sestřih
Spliceosomální sestřih
Mechanismus sestřihu snRNA a snRNP Spliceosom
Mechanismus sestřihu snRNA a snRNP Spliceosom
Alternativní sestřih
Alternativní sestřih
Trans-sestřih
Trans-sestřih
Samosestřih
Samosestřih
Introny II. typu Introny I. typu Twintrony
Introny II. typu Introny I. typu Twintrony
1
Typické geny a rekordy
Sestřih (splicing) Vystřižení intervenujících sekvencí (intronů) následované spojením odpovídajících částí kódující oblasti (exonů) Kvasinky Introny v 235 z 6000 genů
Savci
E
Delší introny: Často několik kb 3-10 intronů / gen ozprostřených v oblasti 2 000-10 000 nt Kratší exony: cca 300 nt
C
Rostliny
H
Kratší introny: 60-10 000 nt, průměrně 150 nt Může být až 40 / gen Delší exony
M
A Obratlovci a rostliny Introny v 80 - 85 % všech genů
N I
Lidský gen pro dystrofin
78 intronů: 99.4 % délky genu Pre-mRNA: 2 500 000 nt / 79 exonů mRNA: 14 000 nt
S Alternativní sestřih Významný podíl na regulaci genové exprese Lidské buňky - 40% genů Rostliny - zatím asi 5% genů
Rozpoznání místa sestřihu Sestřihové signály
Nutné kroky při sestřihu: 1. Rozpoznání místa sestřihu 2. Excize intronu Pravidlo GT-AG 3. Ligace exonů
M
Alternativní sestřih Drosophila; gen pro Down syndrome cell adhesion molecule: teoreticky až 38 000 isoforem
U S
Rozpoznání místa sestřihu Sestřihové signály
Obratlovci
Pravidlo GT-AG
Konsensus 5’-místa sestřihu ¾ Dinukleotid GU ¾ 5’-CAG|GUAAGUA-3’ ¾ Rozpoznán U1 snRNA Konsensus místa větvení ¾ Většinou nukleotid A ¾ 5’-UACUAAC-3’ ¾ Nejprve rozpoznáno SF1 (BBP) ¾ Vazba U2 snRNA
Konsensus 3’-místa sestřihu ¾ Nejméně konzervovaný ¾ 5’-C/U/AAG|G-3’ ¾ Pyrimidinový trakt
¾rozpoznán U2AF ¾ kooperativní rozpoznávání místa větvení (SF1) a 3’-SS (U2AF)
¾ Účast tří konsensus sekvencí – místa větvení, pyrimidinového traktu a 3’-SS
2
Rozpoznání místa sestřihu - Sestřihové signály
Nekonsensuální introny Odchylky od pravidla GT-AG: Introny AT-AC Konsensus sekvence • 5’-SS: 5’-|ATATCCTT-3’ • Místo větvení: 5’-CCTTRACCY-3’ • 3’-SS: 5’-YAC|-3’
Rostliny • nižší míra konsensu 5’SS, 3’SS a místa větvení • polypyrimidonový trakt nahrazen sekvencemi bohatými UA • U důležitější než A
• Rozdílné zastoupení bazí: Introny bohaté AU, exony bohaté GC
Sestřih minoritními U12 spliceosomy • Mechanismus analogický klasickému sestřihu • Homology: • U1 snRNA – U11 snRNA • U2 snRNA – U12 snRNA • U4 snRNA – U4atac snRNA • U6 snRNA – U6atac snRNA • U5 snRNA v obou typech Existuje částečná funkční zastupitelnost obou typů spliceosomů
Pomocné sestřihové signály mimo vlastní místa sestřihu Konsensus sekvence krátké a nedokonale komplementární •Pomocné signály – zesilovače, supresory, nukleotidové složení intronů a exonů Zesilovače (enhancers) • Stimulují sestřih, 40-200 nt od míst sestřihu • Exonové i intronové • Rozpoznávány SR proteiny (splicing factor-related proteins) • Dvě „RS“ domény – Arg-Ser dipeptidové repetice Zeslabovače (suppressors) • Váží hnRNP bílkoviny - PTB (polypyrimidine tract-binding proteins) či hnRNP A Nukleotidové složení intronů a exonů • Dvouděložné rostliny • Obsah AT: exony (50%) X introny (>70%) • Oligo(U) řetězce v intronech • Savci - Oligo(G) řetězce v intronech
Rozpoznány minoritními snRNP • snRNP U11 a U12
Nutnost • nalézt všechny introny a exony • vystřihnout introny na správných místech
Definice exonů a intronů
Chybné rozpoznání signálů: • nevystřižení intronu • intron skipping • přeskočení exonu • exon skipping • použití kryptického 5’-SS
Rozpoznávání intronů/exonů jako párů správně vzdálených vzájemně odpovídajících míst sestřihu • Párování SS přes intron • Párování SS přes exon
3
Definice exonů a intronů
Definice exonů a intronů
Čepička - analog 5’-SS prvního exonu ¾ CBP (20+80 kDa) interaguje s U1 snRNP Poly(A) řetězec - analog 3’-SS posledního exonu ¾ PABP (33 kDa) interaguje s U5 snRNP
Predikce sestřihu in silico • odhalí cca 80% míst sestřihu
snRNP Bílkovinné faktory ¾ U1 snRNP ¾ U2AF (U2 association factor) ¾ U2 snRNP ¾ SR bílkoviny ¾ 70K hnRNP protein ¾ BBP/SF1 (Branching point-binding protein) ¾ UBP (Uridylate-specific RNA-binding hnRNP-like protein)
Sestřih pre-mRNA
snRNA a snRNP Malé jaderné RNA a RNP
Spliceosomální sestřih Mechanismus sestřihu snRNA a snRNP Spliceosom
Alternativní sestřih
Trans-sestřih Samosestřih Introny II. typu Introny I. typu Twintrony
Obecné funkce ¾ Interakce s pre-mRNA a spolu navzájem prostřednictvím interakcí RNA-RNA ¾ Kostra pro přepravu a asociaci specifických spliceosomálních bílkovin ¾ Katalytické centrum spliceosomu
4
Primární a sekundární struktura snRNA Obecně krátké: 60 - 300 nt
Primární a sekundární struktura snRNA Dvě skupiny snRNA 1) U1, U2, U4, U5, U11, U12 a U4atac snRNA
Primární sekvence vysoce konzervativní
2) U6 a U6atac snRNA
Sekundární strukturní elementy ještě konzervativnější Určité úseky primární sekvence téměř 100% konzervativní jednořetězcové úseky 1) RNA-RNA interakce (snRNA:mRNA a snRNA:snRNA) 2) vazebná místa bílkovin
RNA-RNA interakce ve spliceosomu
Bílkovinné sestřihové faktory mimo snRNP
Klíčové pro správné zformování a funkci spliceosomu 4 typy interakcí 1. Intramolekulární interakce v rámci jedné U snRNA 2. Intermolekulární interakce snRNA / pre-mRNA U1 snRNA - 5’-SS U2 snRNA - Místo větvení U6 snRNA - 5’-SS U5 snRNA - konce exonů
CBP (cap-binding protein) ¾ 2 podjednotly, 20 + 80 kDa
¾ usnadnění navázání U1 snRNP k 5’-místu sestřihu ¾ definice prvního (5’-) exonu PABP (poly(A)-binding protein) ¾ 33 kDa ¾ interakce s U5 snRNA ¾ definice posledního (3’-) exonu
3. Intermolekulární interakce snRNA / snRNA U4/U6 snRNA U6 snRNA - U2 snRNA
DExD/H-box RNA helikasy ¾ řada bílkovin ¾ změna konformace RNA
4. Intramolekulární interakce v rámci pre-mRNA
5
DExD/H-box ATP-dependentní RNA helikasy
Bílkovinné sestřihové faktory mimo snRNP U2AF (U2 auxiliary factor) - esenciální sestřihový faktor; 65 + 35 kDa ¾ p65: N-terminální RS doména, 3 RRM domény, vazba k polypyrimidin. traktu ¾ p35: neváže se k RNA, nejasná úloha BBP (kvasinky) / SF1 (člověk) ¾ 75 kDa, vazba k místu větvení a U2AF ¾ N-terminální KH doména (RNA-protein) ¾ C-konec bohatý prolinem (protein-protein) SR bílkoviny ¾ jedna či více N-terminálních RRM domén ¾ C-terminální RS (Arg-Ser) doména ¾ regulace fosforylací serinu ¾ vazba k zesilovačům sestřihu
Součást U5 snRNA 8 různých RNA helikas potřebných pro správný průběh jediného procesu důkaz důležitosti strukturálních změn RNA během sestřihu pre-mRNA
UBP1 (Uridylate-specific RNA-binding hnRNP-like protein), rostliny ¾ vazba k AU-bohaté oblasti intronu ¾ 3 RBD domény ¾ definice intronu, zprostředkování vazby U snRNP k intronu
Tri-snRNP model asociace/disociace spliceosomu
Sestřih pre-mRNA Spliceosomální sestřih Mechanismus sestřihu snRNA a snRNP Spliceosom
Komplex E commitment complex
Alternativní sestřih
Trans-sestřih Samosestřih Introny II. typu Introny I. typu Twintrony
fosforylace defosforylace
6
Modely formování spliceosomu Spliceosomální cyklus
Tri-snRNP model
¾ Původní a obecně přijímaný
Tetra-snRNP model
¾ HeLa buňky – isolován komplex U2/U4/U6 snRNP ¾ párování U2/U6 stabilizuje vazbu U4/U6 ¾ U2 součástí komplexu E savců isolovanéha za jemných podmínek
Penta-snRNP (Holospliceosome) model (2002)
¾ holospliceosom isolován z kvasinkového extraktu při nízkých koncentracích solí
Katalytické jádro spliceosomu
Katalytické jádro spliceosomu
Spliceosom velice pravděpodobně ribozym Fosfát vážící Mg++
Přímé důkazy neexistují
U6 intramolecular stem-loop
Místo 2’,3’,5’-fosfotriesterové vazby s A v místě větvení
Nepřímé indicie: 1) Závislost první i druhé transesterifikační reakce na kovovém iontu (Mg++)
Párování k 5’-SS
2) Popsání slabé katalytické aktivity in vitro v trimolekulárním komplexu (2001) • Jen RNA: U2 snRNA, U6 snRNA, fragment RNA hoologní k místu větvení • Reakce analogická první transesterifikační reakci • 0.15% za 24 hodin při plné saturaci U2 i U6 snRNA
3) Větvící A tvoří 2’,3’,5’-fosfotriesterovou vazbu s A a G u 5‘-konce U6 ISL 4) Uracil U80 v U6 ISL (intramolecular stem-loop) váže hořečnatý ion
Párování k místu větvení
Formování terciálních interakcí mezi U6 a U2 snRNA (pseudoknot)
7
Sestřih pre-mRNA Spliceosomální sestřih Mechanismus sestřihu snRNA a snRNP Spliceosom
Alternativní sestřih Sestřih pre-mRNA • Nezbytná součást genové exprese • Významný regulační krok Člověk - 40 % genů
( podle 5 000 000 EST / 33 000 genů )
Arabidopsis - zatím asi 5 % genů
( podle 179 000 EST / 27 000 genů )
Variabilní užití potenciálních míst setřihu Komplexní transkripční jednotka • Jedna pre-mRNA může dát vzniknout mnoha zralým mRNA • Mnoho bílkovin může být kódovanáno jedním genem
Alternativní sestřih
Trans-sestřih Samosestřih Introny II. typu Introny I. typu Twintrony
Základní typy alternativního sestřihu
Mechanismus alternativního sestřihu Neexistuje jednotný mechanismus
Zapomenutý intron Konkurující 3’ místa sestřihu Konkurující 5’ místa sestřihu
Rozpoznání konstitutivních a alternativních míst sestřihu • nízký stupeň konzervace • regulační sekvence i sekvence míst sestřihu krátké a degenerované • malý informační obsah • snad čím blíže konsensu, tím silnější místa sestřihu Sestřihové zesilovače/supresory
Alternativní promotory Alternativní polyadenylační místa Kazetovité exony Vzájemně se vylučující exony
SR bílkoviny - definice exonů, vazba k zesilovačům sestřihu hnRNP bílkoviny (PTB, hnRNP A1) - většinou inhibitory sestřihu Sekundární struktura pre-mRNA Poměr koncentrací a aktivit jednotlivých obecných a specifických sestřihových faktorů Komplexní proces - kombinace pozitivně a negativně působících faktorů
8
Alternativní sestřih Sestřih pre-mRNA • Nezbytná součást genové exprese • Významný regulační krok Člověk - 40 % genů
( podle 5 000 000 EST / 33 000 genů )
Arabidopsis - zatím asi 5 % genů
( podle 179 000 EST / 27 000 genů )
Alternativní sestřih genu pro Dscam
Variabilní užití potenciálních míst setřihu Komplexní transkripční jednotka • Jedna pre-mRNA může dát vzniknout mnoha zralým mRNA • Mnoho bílkovin může být kódovanáno jedním genem
Drosophila
¾ gen pro DS cell adhesion molecule (DSCAM): ¾ teoreticky až 38 016 isoforem
Funkční kategorizace alternativně stříhaných genů Člověk (75 % genů) • Signalizace • Stres • Regulace genové exprese • Receptory • Přenos signálů • Transkripční faktory
Arabidopsis (většina genů) • Regulace genové exprese • Receptory • Přenos signálů • Transkripční faktory • Stres Příklady rostlinných alternativně sestříhaných stresových genů
Funkční důležitost alternativního sestřihu
Produkce zcela rozdílných produktů jednoho genu • Člověk: calcitonin (CT) X calcitonin gene-related peptide (CGRP) • Alternativní sestřih a polyadenylace CT/CGRP genu • Štítná žláza - exon 4 -> 32 aa CT (hormon, hladina Ca v krvi) • Neurony - Vystřižení exonu 4 -> 37 aa CGRP (vasodilatátor)
Rýže: dvě mitochondriální bílkoviny • Společný exon 1 - mitochondriální lokalizační signál • Exon 2 - mt ribosomální protein S14 (RPS14) • Exon 3 - podjednotka B mt sukcinát dehydrogenasy (SDHB) • vznik: integrace původně mitochondriálního genu rps14 do intronu jaderného genu sdhB
9
Funkční důležitost alternativního sestřihu
Alternativní sestřih genu slo
Vyjmutí či náhrada funkčních domén bílkovin • Modulární struktura bílkovin, různé domény s různou funkcí • Transkripční faktory - DNA vazebná a aktivační doména Lokalizace bílkovin • Rozdílná buněčná lokalizace stejné bílkoviny Změna nepřekládaných oblastí (UTR) • ovlivnění translatability, stability a lokalizace mRNA v cytoplasmě • Drosophila: mRNA pro ferritin - přítomnost / absence IRE Zpětnovazebná smyčka • kvasinková ribosomální bílkovina L32 • vazba k vlastní pre-mRNA, inhibice sestřihu, narušení ORF, syntéza nefunkční bílkoviny
Alternativní sestřih genů pro neurexiny
Další příklady komplexních transkripčních jednotek Fibroblast growth factor receptor 2 (savci) Vzájemně se vylučující exony mění vazebnou specificitu
Neural cell adhesion molecule (mozek krys) Variable alternatively spliced exon (VASE)
RUBISCO activase (rostliny) Obě aktivují RUBISCO, jen delší je regulována změnou redox potenciálu
α-Tropomyosin (krysy) 9 isoforem s rozdílnou buněčnou specificitou 2 alternativní promotory (A), 2 páry vzájemně se vylučujících exonů (B), řada alternativních míst polyadenylace (C)
10
Trans-sestřih
Sestřih pre-mRNA Spliceosomální sestřih Mechanismus sestřihu snRNA a snRNP Spliceosom
Alternativní sestřih
Trans-sestřih Samosestřih Introny II. typu Introny I. typu Twintrony
Široce rozšířený ¾ zejména organely ¾ Protista (Kinetoplastida, Euglena) ¾ Hlísti, ploštěnci, obratlovci Každý exon kódován jinou RNA ¾ pre-mRNA ¾ PTM (pre-transsplicing molecule)
¾ dříve SL RNA (spliceleader RNA) ¾=
Často spolu s alternativním sestřihem ¾ Časté u parazitů; vznik různých antigenních determinant
Introny II. typu
Sestřih pre-mRNA
Mitochondriální genom:
Fylogeneticky značně rozšířené
Spliceosomální sestřih Mechanismus sestřihu snRNA a snRNP Spliceosom
1) rRNA, tRNA, mRNA • Mitochondrie, plastidy • Protista, houby, rostliny 2) mRNA • Eubacteria Dosud neobjeveny u Archebakterií
Arabidopsis – 23 Marchantia – 25
Chloroplastový genom Euglena – 155 (40% genomu)
Alternativní sestřih
Trans-sestřih Samosestřih Introny II. typu Introny I. typu Twintrony
Délka intronů: • Variabilní; 389 nt - 3.4 kb bez ORF • většinou 0.6 – 2.5 kb (dle přítomnosti ORF) • ORF cca 500-800 nt
Samosestřih - ribozymy Mobilní genetické elementy
Mechanismus sestřihu stejný jako u spliceosomů • snad jejich evoluční předchůdci • teorie vzniku snRNA rozpadem intronů II. typu
11
Mechanismus sestřihu intronů II. typu Transesterifikace
Kofaktor
Hydrolýza Součást katalytickéha jádra
Definice míst sestřihu
ORF
Nejkonzervovanější, Ribozym?
Obsahuje nukleofil (A)
Hydrolýza - alternativní způsob • prvním nukleofilem voda, výsledkem lineární intron • snad evoluční předchůdce transesterifikace
Bílkoviny účastnící se sestřihu intronů II. typu
Kódované intronem (doména IV)
Kódované jádrem
¾ maturasa
¾ RNA vazebné bílkoviny ¾ RNA helikasa
¾ stabilizace konformace intronu
¾ reversní transkriptasa ¾ endonukleasa ¾ twintrony
¾ RNA chaperony ¾ aa-tRNA synthetasy
¾ sestřihové faktory
¾ často společné se spliceosomálním sestřihem
Sekundární struktura intronů II. typu
Introny II. typu – mobilní genetické elementy
Retrohoming
Retrotransposice
Bílkovina kódovaná intronovým ORF • reversní transkriptasa • endonukleasa Ribozym (intronová RNA)
12
Introny II. typu – mobilní genetické elementy
Introny II. typu – mobilní genetické elementy
Sestřih pre-mRNA
Introny I. typu
Spliceosomální sestřih Mechanismus sestřihu snRNA a snRNP Spliceosom
Alternativní sestřih
Fylogeneticky značně rozšířené • Eukaryota,viry, Eubakterie, bakteriofágy • Dosud neobjeveny u Archebakterií • Abundantní zejména v mtDNA hub
Trans-sestřih
1) rRNA, tRNA, mRNA • Mitochondrie, plastidy • Protista, houby, rostliny 2) tRNA, mRNA • Eubacteria, bakteriofágy 3) rRNA • jádro • Protista, houby 4) mRNA • Mitochondrie • Živočichové (Žahavci)
Samosestřih Introny II. typu Introny I. typu Twintrony
Jederná pre-23S rRNA z Tetrahymena thermophila (413 nt)
Samosestřih - ribozymy zrychlení reakce 1011-krát
Mobilní genetické elementy
13
Primární a sekundární struktura intronů I. typu
Sekundární struktura intronů I. typu
Velice jednotná a komplexní sekundární a terciální struktura Délka 200-400 nt Mohou obsahovat ORF • Maturasa • Stabilizace terciální struktury • Endonukleasa • Mobilita intronů Takřka žádná konzervace primární nukleotidové sekvence • Upstream exon končí U • Intron končí G • Čtyři téměř konzervované oblasti: P, Q, R a S
Substrátová doména • Vlásenky P1, P10 (začátek a konec intronu) a P2 • IGS - internal guide sequence, párování s konci exonů
Extrémní konzervace sekundární struktury • Vlásenky (P) se smyčkami (L), pseudoknoty, jednořetězcové oblasti (J)
Katalytické jádro • Domény P4-P6 a P3-P7 • Dvě téměř rovnoběžbé dvoušroubovice, mezi nimi substrátová doména
Intron I. typu
Mechanismus sestřihu intronů I. typu Mechanismus podobný klasickému spliceosomu • Dvě transesterifikační reakce Prvním nukleofilem volný guanosin • Nevzniká laso, ale lineární intron • První a druhý krok představují přímý a zpětný chod téže reakce (i intron končí G) • Jen jedno katalytické jádro • Jen jedna funkční konformace • Statická struktura • Cirkularizace intronu • Mobilita - nejen vystřižení, ale i homing Závislost na přítomnosti dvojmocných kovových iontů • Zaujetí správné funkční konformace (folding) • Mg++, Mn++, Ca++, Sr++ • Účast při vlastní sestřihové reakci (donor/akceptor protonů) • Takřka výhradně Mg++
14
Další reakce katalyzované ribozymy I. typu Retrohoming Reverzní sestřih -> reverzní transkripce -> rekombinace (integrace do genomu) Transesterifikace či hydrolýza fosfoesterových vazeb Analogie I. kroku: Cirkularizace intronu
Endonukleolytické štěpení RNA a DNA (endonukleasa)
Sestřih pre-mRNA Spliceosomální sestřih Mechanismus sestřihu snRNA a snRNP Spliceosom
Alternativní sestřih
Hydrolýza aminoacylesterů (aminoacylester hydrolasa) není hydrolýza fosfoesterové vazby !
Trans-sestřih
Analogie II. kroku:
Introny II. typu Introny I. typu Twintrony
Ligace RNA (ligasa)
Polymerace RNA (polymerasa)
Samosestřih
Přenos nukleotidů (nukleotidyltransferasa)
Twintrony I. typu Didymium iridis (Myxomycetes)
Naegleria gruberi (Amoeboflagellata)
Podobnost: životní cyklus, buněčná morfologie, organizace rDNA (extrachromozomální, Di 20 kb lineární, Ng 14 kb cirkulární)
Twintrony v rRNA genech v konzervovaných částech rDNA
Twintrony I. typu Intron I (160-190 mt) • Nejmenší známý ribozym I. typu • Hydrolytické štěpení dvou interních míst v RNA • Ne sestřih, ale vyštěpení ORF z twintronu Intron II • Klasický ribozym I. Typu • Sestřih twintronu ORF - homing endonukleasa • Mobilita twintronu
Intron ribozym I. typu
1.3-1.4 kb
ORF (75O nt) homing endonukleasa
Horizontální přenos: • Přítomnost v tak evolučně vzdálených organismech jen v extrachromozomální DNA
15