DISTANČNÍ OPORY PRO KOMBINOVANÉ STUDIUM BIOLOGIE
MOLEKULÁRNÍ A BUNĚČNÁ BIOLOGIE Jan Malý
UNIVERZITA JANA EVANGELISTY PURKYNĚ PŘÍRODOVĚDECKÁ FAKULTA katedra biologie
Ústí nad Labem 2006
Anotace opory Molekulární biologie je povinným kurzem studijního oboru učitelství pro střední školy a nově připraveného distančního bakalářského studia jednooborové biologie na katedře biologie přírodovědecké fakulty UJEP. Cílem tohoto kurzu je především poskytnout základní, ucelené informace o principech života na molekulární úrovni. Smyslem této dvoudílné opory bylo především ujednotit a vymezit základní obsah kurzu, tj. vyčlenit nejdůležitější pojmy a stručně je charakterizovat. V tomto pojetí tedy nelze text chápat jako skripta, či učebnici do podrobností objasňující všechny detaily. Text je spíše určitým vodítkem k dalšímu samostudiu z doporučené odborné literatury a popř. vlastních přednášek. Jako doplněk textu jsou uvedeny číslované odkazy na obrázky, které každý student obdrží na samostatném CD disku. Tyto obrázky slouží k snažšímu pochopení složitých molekulárně-biologických dějů a efektivnímu samostudiu.
OBSAH 1.
STRUKTURA A FUNKCE PROTEINŮ 1.1. Obecné vlastnosti aminokyselin 1.2. Peptidická vazba 1.3. Klasifikace a charakteristika vlastností aminokyselin 1.4. Nestandardní aminokyseliny 1.5. Specializované funkce aminokyselin 1.6. Sekundární struktura proteinů 1.7. Fibrilární proteiny 1.8. Globulární proteiny 1.9. Stabilita proteinů 1.10. Denaturace proteinů 1.11. Kvarterní struktura proteinů 2. STRUKTURA A FUNKCE NUKLEOVÝCH KYSELIN 2.1. Vlastnosti nukleotidů 2.2. Struktura DNA s nadšroubovicovým vinutím 2.3. Denaturace a renaturace nukleových kyselin 3. REPLIKACE DNA 3.1. Obecný princip replikace 3.2. Replikační enzymy 3.3. Replikace prokaryot a bakteriofágů 3.4. Replikace eukaryotního chromozómu 4. REPARACE DNA 4.1. Přímá oprava poškození nukleotidů 4.2. Excisní reparace 4.3. Mismatch reparace 4.4. SOS odpověď 4.5. Reparace dvojřetězcových zlomů 4.6. Identifikace karcinogenních látek 5. TRANSKRIPCE 5.1. Role RNA v syntéze proteinů 5.2. RNA polymeráza 5.3. Vazba templátu 5.4. Iniciace transkripce 5.5. Elongace 5.6. Terminace transkripce 5.7. Eukaryotní RNA polymerázy 5.8. Struktura promotorových sekvencí eukaryot 6. REGULACE EXPRESE GENŮ NA ÚROVNI TRANSKRIPCE U PROKARYOT 6.1 Regulace transkripčními faktory 6.2 Regulace katabolickou represí 6.3 Regulace sekvenčně specifickými protein-DNA interakcemi 6.4 Regulace araBAD operonu 6.5 Regulace tryptofanového (trp) operonu atenuací 6.6 Regulace syntézy rRNA za přísných podmínek (stringent response) 7. POSTRANSKRIPČNÍ ÚPRAVY PRIMÁRNÍHO TRANSKRIPTU 7.1 Úpravy mRNA čepičkou a polyA koncem 7.2 Molekulární sestřih mRNA (splicing)
…. 3
…. 15
…. 22
…. 35
…. 40
…. 50
…. 57
Studijní opory biologie
Malý J.:Molekulární biologie
1.
STRUKTURA A FUNKCE PROTEINŮ
1.1.
Obecné vlastnosti aminokyselin
Aminokyseliny (amino acids, aa) jsou základními stavebními kameny proteinů. Analýzou obrovského množství proteinů bylo prokázáno, že jsou vždy tvořeny 20 základními aminokyselinami (Obr 1 a 2). Tyto molekuly jsou označovány jako tzv. α-aminokyseliny, tzn. jsou tvořeny primární aminoskupinou a karboxyskupinou navázanou na stejném, centrálním atomu uhlíku (s vyjímkou prolinu) (Obr.3). Jelikož hodnoty pK α-aminoskupiny a αkarboxyskupiny aminokyselin leží v rozsahu pH 8,0-9,4 respektive pH 2,2 – 3,5; při fyziologickém pH jsou obě skupiny kompletně ionizovány (Obr.4). Z tohoto důvodu jsou aminokyseliny amfolyty, tj. chovají se současně jako báze i kyselina. Aminokyseliny jsou rovněž zwitteriony, tj. jsou současnými nositely kladného a záporného náboje. Tato vlastnost výrazně zvyšuje teplotu tání (300°C) a způsobuje velmi dobrou rozpustnost v polárních rozpouštědlech
(voda).
Aminokyseliny
jsou
většinou
nerozpustné
v nepolárních
rozpouštědlech. 1.2.
Peptidická vazba
α-aminokyseliny mohou polymerizovat kovaletní vazbou mezi amino a karboxy skupinou za vzniku tzv. peptidické vazby CO-NH a uvolnění molekuly vody (1902 Emil Fisher a Franz Hofmeister) (Obr.5). Dle počtu zpolymerovaných jednotek aminokyselin rozeznáváme dipeptidy (2 aa), tripeptidy (3 aa), oligopeptidy (do 10 aa) a polypeptidy. Proteiny jsou molekuly, které se skládají z jednoho či více polypeptidů. Tzv. primární struktura proteinu je determinována pořadím aminokyselin v řetězci. Typický protein se skládá z polypeptidu o 40-33,000 aminokyselin, tj. jejich molekulová váha se pohybuje v rozpětí 4-3600 kD. Polypeptidy jsou lineární polymery. Tento fakt je důležitým faktorem který umožňuje přenos strukturální informace z pořadí lineárně uspořádaných nukleotidů v DNA do jednoznačného pořadí aminokyselin v řetězci polypeptidu. Toto pořadí určuje výsledné vlastnosti proteinů. Vzhledem k obrovskému množství kombinací, které je z 20 aminokyselin možné při typické velikosti proteinů vytvořit (pro protein o pouhých 100 jednotkách je to 20×10100, tj. 1.27×10130 kombinací), je zřejmé, že existují téměř nevyčerpatelné možnosti generování výsledných vlastností. Především z tohoto důvodu se při evolučním vývoji proteiny uplatnily jako základní stavební a funkční jednotky garantující základní životní funkce organismů.
Strana 4
Studijní opory biologie 1.2.
Malý J.:Molekulární biologie
Klasifikace a charakteristika vlastností aminokyselin
Klasifikace aminokyselin je zpravidla založená na polaritě jejich postraních řetězců (-R). Ta do značné míry rozhoduje o celkových vlastnostech, tj. prostorové konfiguraci vznikajícího peptidického řetězce. Obecně je tedy možné vyčlenit s určitým zjednodušením aminokyseliny s (i) nepolárními postranními řetězci (ii) nenabitými postranními řetězci a (iii) polárními postranními řetězci. Mezi aminokyseliny s nepolárními postranními řetězci patří alanin, valin, glycin, leucin, isoleucin, methionin, prolin, phenylalanin, tryptofan. Postranní řetězec jev tomto případě tvořen alifatickými uhlovodíkovými řetězci, thiolovým éterem, phenylovou a indolovou aromatickou strukturou (Obr.1). Aminokyseliny s nenabitými postranními skupinami obsahují hydroxylovou, amidovou či thiolovou skupinu v –R řetězci (serin, threonin, asparagin, glutamin, tyrosin, cystein) (Obr.1). Aminokyselina cystein je charakteristická tvorbou dimerů, svázaných skrze disulfidický můstek (S-S), převládající v oxidačních podmínkách prostředí (Obr.6) Tato vazba je důležitým předpokladem ustavení správné prostorové konformace řady proteinů a její rozštěpení zpravidla vede k jejich denaturaci. Ve starší literatuře se někdy tento dimer označuje pojmem cystin. Aminokyseliny s nabitými –R řetězci mohou nést kladný či záporný náboj. Za běžných fyziologických podmínek jsou –R řetězce lysinu a argininu protonovány a jsou tedy nositely bazických vlastností. Histidin jako jedinná aminokyselina je při pH ≈ 6 neutrální. Z tohoto důvodu je histidin často přítomen v aktivních místech enzymů, kde se podílí na přenosu náboje. Negativně nabité jsou –R zbytky kyseliny asparagové (aspartátu) a glutamové (aspartátu). Asparagin a glutamin jsou amidy těchto dvou kyselin. Titrační křivky aminokyselin jsou obecně komplikované, v důsledku existence dvou a více nabitých funkčních skupin (Obr.7). Aminokyseliny jsou ve vodném prostředí vždy nositely náboje. pH, při kterém je výsledný náboj aminokyseliny nulový (součet všech nábojů) se označuje jako izoelektrický bod (pI). Z Handerson-Hasselbalch vztahu plyne, že: pI = 0.5(pKi + pKj) kde Ki a Kj značí disociační konstanty nabitých párů, které se účastní vzájemné eliminace náboje v izoelektrickém bodě. Výsledná hodnota pI je výrazně ovlivněná nabitými skupinami v postranních řetězcích, obsahem solí v roztoku atp. Proteiny vykazují velmi komplexní titrační křivky. Jejich výsledný tvar je dán součtem křivek jednotlivých aminokyselin zapojených v řetězci a je výrazně ovlivněn prostorovou konfigurací proteinu. Aminokyseliny vyjma glycinu jsou opticky aktivní, tj. stáčí rovinu polarizovaného světla. Tato vlastnost je způsobena existencí chirálního atomu uhlíku (α-uhlík), tj. uhlíku se čtyřmi odlišnými substituenty. Obecnou vlastností těchto typů molekul je existence dvou Strana 5
Studijní opory biologie
Malý J.:Molekulární biologie
zrcadlově symetrických, prostorových konfigurací – enantiomerů (stereoizomerů). Tyto dvě formy jsou zpravidla chemicky či fyzikálně neodlišitelné. Liší se pouze směrem stáčení roviny polarizovaného světla – stáčí buď ve směru hodinových ručiček (pravotočivost, znaménko +) či proti směru hodinových ručiček (levotočivost, znaménko -) z pohledu pozorovatele (Obr.8). Všechny α-aminokyseliny, které se vyskytují v proteinech, jsou L formy enantiomerů, tj. L-α-aminokyseliny (dle Fischerovy konvence, forma shodná s uspořádáním L-glyceradehydu) (Obr.9). Některé aminokyseliny (threonin a isoleucin) mají dva chirální uhlíky, tj. celkem 4 možné stereoizomery. Přirozeně se opět vyskytují L-formy (zrcadlem je D-forma), zbývající dvě formy se nazývají diastereomery (L-allo a D-allo formy). Tyto dvě formy jsou odlišné jak po stránce fyzikální, tak po stránce chemické od L a D-formy. Běžná chemická syntéza aminokyselin vede ke vzniku tzv. racemické směsi, která je složena ze směsi stereoizomerů. Jedinečnost života spočívá v syntéze pouze jedné L-formy, D-forma není běžnou součástí proteinů. Důvod a příčiny, proč se evoluce života vydala tímto směrem a ne opačným (D-formou) není dosud uspokojivě objasněna.
1.3.
Nestandardní aminokyseliny
V biologických systémech se přirozeně nevyskytuje pouze výše zmíněných 20 základních aminokyselin, ale i řada aminokyselin tzv. „nestandardních“ (Obr.10). Řada z nich není součástí proteinů, přesto však často hrají velmi důležitou roli v metabolismu. Ve všech případech (až na jednu vyjímku) se jedná o modifikované aminokyseliny, přičemž jejich vznik není kódován genetickým kódem. Tyto aminokyseliny často vznikají dodatečnou enzymaticky katalizovanou modifikací –R zbytků polypeptidů. Např. 4-hydroxyprolin a 5hydroxylysin jsou důležitými konstituenty fibrilárního proteinu kolagenu. Velmi často jsou modifikovány proteiny, které jsou součástí komplexů s nukleovými kyselinami, jako např. histony (metylace, acetylace, fosforylace aminokyselin). N-formylmethionin je typickou aminokyselinou, která se vyskytuje vždy při zahájení translace u prokaryotních organismů na N-konci vznikajícího polypeptidového řetězce. D-aminokyseliny jsou součástí některých krátkých polypeptidů, které se vyskytují zejména u bakterií. Tyto polypeptidy jsou však syntetizovány enzymatickou cestou a nejsou kódovány v DNA. Jsou součástí buněčných stěn bakterií a zvyšují jejich odolnost vůči přirozeně se vyskytujícím proteázám (součást obranných mechanismů hostitele), které mají schopnost štěpit přednostně L-formu aminokyselin. D-aminokyseliny jsou součástí peptidických antibiotik jako je valinomycin, gramicidin A a aktinomycin D, produkovaných opět bakteriemi.
Strana 6
Studijní opory biologie 1.4.
Malý J.:Molekulární biologie
Specializované funkce aminokyselin
Role aminokyselin v organismu není jen role konstituční, tj. výstavba proteinů. Aminokyseliny často zastupují i jiné, biologicky významné funkce (Obr.11). Například γaminomáselná kyselina (GABA) a dopamin jsou důležité neurotransmitery, histamin je významným lokálním zprostředkovatelem alergických reakcí, thyroxin je živočišný hormon. Některé z aminokyselin jsou významné intermediáty v metabolických procesech, např. citrulin a ornitin (biosyntéza močoviny), homocystein (syntéza aminokyselin) a Sadenosylmethionin
(metylace
molekul).
Celkový
počet
dosud
zdokumentovaných
aminokyselin nalezených ve všech organismech se blíží číslu 700.
1.5.
Sekundární struktura proteinů
Vlastnosti proteinů jsou dány jejich třídimenzionální prostorovou strukturou v nativním (tj. fyziologicky relevantním) stavu. Unikátní prostorová struktura jednotlivých typů proteinů je přitom založena na jejich primární struktuře, tj. na pořadí aminokyselin v polypeptidickém řetězci. Sekundární struktura proteinů je definována jako lokální prostorové uspořádání polypeptidického řetězce. Tyto sekundární struktury jsou determinovány geometrickými vlastnostmi peptidické skupiny v řetězci. Studiem konformace peptidické vazby se zabýval ve 40 letech minulého století fyzik Linus Pauling a Robert Corey. Rentgenovou analýzou aminokyselin a krátkých peptidů odvodili, že peptidická skupina je rigidní, planární struktury (Obr.12). V naprosté většině případů jsu peptidické skupiny uspořádány v trans konformaci, tzn. 2 Cα uhlíky navázané na peptidickou skupinu jsou orientovány planárně na obrácené straně peptidických vazeb, které je spojují (Obr.13). Tato konformace je stabilnější oproti cis konformaci především ze sterických důvodů, tj. objemnosti –R řetězců, které by v této (cis) konformaci musely být přiloženy k sobě (Obr.14). Tento fakt vysvětluje, proč je polypeptid tvořen pospojovanými sekvencemi planárních peptidických skupin, které mohou nabývat různých konformací v důsledku vzájemného natočení, tj. tzv. torzních úhlů (tyto úhly se značí jako φ pro případ vazby Cα-N a ψ pro vazbu Cα-C) (Obr.15). Např. pokud oba úhly jsou rovné 180°C, pak kostra polypeptidu je tvořena peptidickými vazbami orientované v jedné rovině. Tyto úhly (natočení) však nemohou být libovolné, ale mohou nabývat vždy pouze určitých hodnot, které jsou energeticky přípustné. Studiem možných konformací (natočení vazeb) v polypeptidech se zabýval G.N.Ramachandran. Vyjádřil informaci o možných kombinaci obou uhlů do konformační mapy, tzv. Ramachandranova diagramu (Obr.16). V tomoto diagramu jsou zobrazeny pouze ty kombinace úhlů, které jsou uskutečnitelné, tj. vzdálenost libovolných vzájemně kovalentně nevázaných atomů nepřekračuje tzv. van der Strana 7
Studijní opory biologie
Malý J.:Molekulární biologie
Waalsovu vzdálenost. Z tohoto diagramu vyplývá, že pouze tři oblasti kombinací jsou z hlediska reálných konformací pravděpodobné a skutečně byly potvrzeny rentgenovou analýzou některých proteinů (Obr.17). Určitou vyjímkou je nejjednoduší aminokyselina glycin, u která je volnost natočení vazeb vysoká. Z tohoto důvodu se glycin často vyskytuje v oblastech, kde dochází k ostrému zatočení polypeptidického řetězce. Helikální sekundární struktura je jednou z nejběžnějších sekundárních struktur proteinů. Helix vzniká tehdy, když řetězec je na Cα vždy natočen o stejný úhel. Namísto ψ a φ úhlů se v tomto případě vyjadřuje míra natočení indexem n, který značí, kolik aminokyselin v řetězci se nachází na jednu celou otočku helixu a indexem p – prostorovou vzdáleností mezi aminokyselinami, které odděluje jedna celá otočka (Obr.18). Helix může být v principu pravotočivý či levotočivý. Pouze jedna z možných konformací (kombinací n a p) je umožňuje vznik helixu a jeho stabilizaci pomocí vodíkových můstků – tzv. α-helix. Objev této struktury L. Paulingem v roce 1951 se pokládá za jeden z mezníků dalšího výzkumu v oblasti strukturální biochemie. α-helix je pravotočivá šroubovice s n=3.6 (3.6 aminokyseliny na 1 otáčku) a d = 5.4Å (Obr.19). Postranní –R zbytky aminokyselin jsou lokalizovány vně helixu a nejsou ted překážkou ke stabilizaci polymeru. α-helix je běžnou sekundární strukturou u fibrilárních a globulárních proteinů, s průměrnou délkou helixu 18Å (12 aminokyselin, tj. cca 3 otáčky). Zřídka jsou pozorovány u nativních i umělých polypeptidů další možné varianty helixů, které jsou stabilizované vodíkovými můstky, ale které se liší hodnotou indexů n a p. Mezi tyto helixy patří např. tzv. 310 helix, π helix a polyproline II helix (Obr.20). Ve stejném roce jako byl navržena struktura α-helixu, navrhli Pauling a Corey další možnou sekundární strukturu – tzv. strukturu skládaného listu (β-sheet). I zde vycházeli z konformace s opakujícími se úhly ψ a φ, které spadají do povolených oblastí Ramanchandranova diagramu. Zásadní rozdíl mezi α-helixem a strukturu skládaného listu je v tom, že skládaný list je tvořen mezi dvěma navzájem sousedícími polypeptidovými řetězci. Ty mohou být uspořádány paralelně a antiparalelně (dle směru od N k C konci polypeptidu) (Obr.21). β-listy jsou obvyklým stukturálním motivem v řadě proteinů. U globulárních proteinů je typicky tvořen z 2-15 řetězců, s průměrnou šířkou plochy cca 25Å a délkou okolo 21Å (15 aminokyselin) (Obr.22). Často dochází k vzájemné kombinaci paralelních a antiparalelních β-listů. β-listy jsou také ve většině případů mírně pravotočivě zakřivené, což je jednou z důležitých vlastností zaručující specifické funkce zejména v aktivních centrech některých enzymů (Obr.23). Topologie (konektivita) β-listů je poměrně komplexní s řadou možností. Zpravidla jsou spojky mezi jednotlivými β-listy tvořeny helixy, popř. tzv.
Strana 8
Studijní opory biologie
Malý J.:Molekulární biologie
vlásenkami (uplatňují se zejména u antiparalelních β-listů), které mohou mít povahu pravotočivého či levotočivého helixu (Obr.24). Sekundární stuktury ve formě α-helixu a β-listu zpravidla tvoří až 50% polypeptidického řetězce globulárních proteinů. Ostatní část existuje ve formě tzv. smyček úseků s nepravidelně uspořádánými úhly φ a ψ, které neposkytují definovanou strukturu. Nejedná se však v žádném případě o náhodnou a neuspořádanou sturukturu, jakou je možné popsat např. u denaturovaných proteinů. Jedná se pouze o těžko popsatelnou nerepetetivní strukturu, která však zásadním způsobem ovlivňuje konečnou třidimenzionální strukturu proteinu. Tzv. obrácené smyčky např. propojují jednotlivé úseky polypeptidu, které vytvářejí β-listy – tyto úseky se téměř vždy nalézají na povrchu proteinu a ovlivňují tak jeho vlastnosti. Řada větších globulárních proteinů obsahuje zvláštní struktury, tzv. Ω-smyčky (Obr.25), které se vyskytují výhradně na povrchu proteinu a hrají důležitou roli při biologických rekogničních procesech.
1.6.
Fibrilární proteiny
Fibrilární proteiny jsou dlouhé polypeptidy, jejichž sekundární struktura se vymyká běžným strukturálním motivům a je pro ně typická. Řada fibrilárních proteinů se nachází v tkáních s mechanickou či pohybovou funkcí (kůže, svaly, kosti atd.). Jelikož fibrilární proteiny je velmi obtížné připravit ve formě krystalů, nelze v protikladu s globulárními proteiny provádět rentgenovou strukturní analýzu. Z tohoto důvodu je struktura fibrilárních proteinů dosud málo prozkoumána. Keratin je mechanicky odolný a chemicky nereaktivní protein, který se nachází u všech vyšších obratlovců. Je součástí zrohovatělé pokožky (epidermis), nehtů, vlasů, chlupů a peří přičemž tvoří až 85% buněčných proteinů. Keratiny jsou dále členěny na tzv. α-keratiny, které se vyskytují u savců a β-keratiny, které se vyskytují u plazů a ptáků. Keratiny, které vytváří lidský vlas, jsou hiearchicky uspořádány. Vlas je tvořen z mrtvých buněk s makrofibrilami, které se skládají z tzv. mikrofibril, obsahující α-keratin a amorfní proteinovou matrix s vysokým obsahem síry (Obr.26). Molekuly α-keratinu jsou tvořeny dimery dvou polypeptidů, které se navzájem obtáčí a vytváří strukturu podobnou α-helixu. Tato struktura je tvořena jedním vláknem tzv. typu I (kyselé vlastnosti) a typu II (zásadité vlastnosti). Výsledný dimer je združen do vláken tzv. protofilament, která se sdružují do tzv. protofibril a ty tvoří vlastní mikrofibrily (Obr.27). Díky vysokému obsahu cysteinu a tím i disulfidových můstků ve vláknech je α-keratin odolný proti tahu. Redukční činidla, jako jsou
Strana 9
Studijní opory biologie
Malý J.:Molekulární biologie
merkaptany mohou redukovat disulfidické vazby a tím i zvláčnit vlas. Oxidační činidla naopak vlas ztuží vznikem disulfidických můstků. Defekty ve struktuře keratinu mohou způsobit závažná onemocnění, např. ztrátu integrity kůže. Kolagen je přítomen u všech živočichů a je jeden z nejvíce rozšířených proteinů mezi obratlovci. Jedná se o extracelulární protein existující ve formě nerozpustných vláken s vysokou odolností v tahu. Je součástí pojivových tkání, jako je kost, zub, chrupavka, ligamenty atd. U savců je známo až 20 odlišných forem kolagenů přítomných v rámci různých tkání u jednoho jedince (Obr.28). Kolagen má velmi specifické složení aminokyselin – více jak z 30% je tvořen glycinem a dalších 15-30% je tvořeno prolinem a 4hydroxyprolylem (Hyp) (Obr.29). Nejznámější struktura kolagenu je struktura popsaná pro bovinní kolagen α1(I), který se skládá z opakujících se sekvencí Gly-Pro-Hyp. Prostorovou strukturu kolagenu navrhl již v roce 1955 F. Crick a A. Rich. Jedná se o paralelní trojřetězcovou strukturu navzájem se pravotočivě ovíjejících vláken kolagenu (Obr.30). Struktura je jako celek stabilizována vodíkovými můstky. Toto uspořádání vláken je zodpovědné za charakteristickou odolnost vlákna v tahu. Podélné napětí v tahu je přenášeno do kompresního působení jednotlivých řetězců kolmo na osu vlákna. Vlákna kolagenu jsou uspořádána do tzv. fibril, které jsou v mikroskopickém pohledu příčně pruhované (Obr.30). Tyto fibrily se skládají ze symetricky uspořádaných šestic kolagenních vláken, odhalujících každých 400Å tmavší strukturu tvořenou v místě „děr“, tj. vzájemného přiložení vláken v řadě. Kolagenní vlákna jsou jak intramolekulárně, tak intermolekulárně zesítěná kovalentní vazbou mezi aminokyselinami Lys a His činností enzymu lysyl oxidázy (Obr.31). Defekty ve struktuře kolagenu jsou příčinou řady lidských onemocnění.
1.7.
Globulární proteiny
Globulární proteiny tvoří velmi různorodou skupinu proteinů, pro které je typická jejich existence v kompaktním sférickém nativním tvaru. Většina globulárních proteinů vytváří enzymy, transportní a receptorové proteiny. Naprostá většina poznatků o tercierní struktuře proteinů byla získána jejich studiem využitím rengenové strukturní analýzy a nukleární magnetické resonance (NMR). Rentgenová strukturní analýza je metodikou, která podává informace o struktuře molekul na atomární úrovni. Rengenové záření je podmínkou k získání této informace vzhledem k velmi malé vlnové délce (λ ≈ 1.5Å), která se blíží vzdálenosti kovalentní vazby v molekulách. Vzorek ve formě krystalu je osvícen zářením z zdroje rengenového záření (např. synchrotron) a vzniklý difrakční obrazec zviditelněn na fotografické desce. Ten je Strana 10
Studijní opory biologie
Malý J.:Molekulární biologie
podkladem k matematické rekonstrukci třídimenzionální struktury molekul (Obr.32). Difrakční obrazec je ve své podstatě obraz prostorově rozložené elektronové hustoty molekul. V dnešní době lze snadno vytvářet pomocí počítačové rekonstrukce 3D obrazy elektronových hustot proteinů (Obr.33). Krystaly proteinů jsou zpravidla méně uspořádané a rigidní struktury než krystaly anorganických látek. Zejména v důsledku vysoké míry hydratace polypeptidických řetězců, která je nutná pro udržení správné prostorové konformace. Z tohoto důvodu není prakticky možné získat rozlišení jejich struktury pod 1.5Å, jako je tomu u běžných krystalů. Získání dostatečně čistého a uspořádaného krystalu proteinů je v řadě případů hlavní překážkou ke strukturální analýze s vysokým rozlišením (Obr.34). Přesnější představu o architektuře proteinu je zpravidla možné získat pouze kombinací znalostí primární struktury polypeptidu a výsledku strukturní analýzy. Struktura proteinů získaná analýzou krystalů je zpravidla vždy stejná, jako je jejich nativní struktura. Tento fakt je podpořen řadou argumentů, např. některé enzymy přetrvávají v aktivním stavu i ve formě krystalu, tj. jejich aktivní místa nejsou uspořádáním v mřížce krystalu nijak ovlivněna. Třídimenzionální strukturu proteinů v nativním stavu ve vodném roztoku je možné získat metodou dvourozměrné (2D) a nověji i 3 a 4D NMR spektroskopie. Tato metodika dovoluje stanovit meziatomovou vzdálenost díky přítomnosti specifických protonů, které jsou u známých polypeptidových sekvencí vzdálené méně jak 5Å. Tyto určené vzdálenosti jsou využity k výpočtům 3D struktury proteinů kombinací znalostí o chiralitě, van der Waalsově vzdálenosti, skupinové planaritě atd. Tato metodika nedovoluje určit jednoznačnou strukturu proteinu, spíše poskytuje určité množství možných řešení, která jsou si vzájemně velmi blízká (Obr.35). Výhodou NMR oproti rengenové strukturní analýze je možnost stanovit strukturu bez nutnosti získání krystalu proteinu, což je v některých případech velmi obtížné. Navíc, tato metodika je využívána ke studiu sbalování proteinů (protein folding) a jejich dynamiky, neboť NMR analýzu je možné provádět v širokém časovém rozmezí. V důsledku velmi komplikovaných struktur je prakticky nemožné zobrazit protein se všemi atomy, které se účastní jeho stavby. Z tohoto důvodu se zpravidla využívá zobrazení pouze polypeptidické uhlíkové kostry, přičemž se zobrazují pouze některé hlavní řetězce (Obr.36). Jiná zobrazení využívají vyobrazení typických sekundárních struktur, především αhelixů, β-listů a smyček (Obr.37). V současné době existuje řada počítačových programů, které poskytují informace v zjednodušených, ale i komplikovaných 3D projekcích. Terciární struktura proteinů značí skutečné prostorové uspořádání sekundárních struktur polypeptidického řetězce. Pvním globulárním proteinem, u kterého byla zjištěna 3D struktura rengenovou krystalografií, byl myoglobin (Obr.38). Do dnešní doby je známa 3D Strana 11
Studijní opory biologie
Malý J.:Molekulární biologie
struktura přibližně 18.000 proteinů. Ačkoliv jsou tyto dosud charakterizované struktury unikátní, jsou nositely některých společných znaků a vlastností. V řadě globulárních proteinů jsou přítomny jak α-helixy tak β-listy (v průměru 31% a 28%). Globulární struktury velmi zřídka obsahují periodické motivy v primární struktuře, jako je tomu u fibrilárních proteinů. Nepolární rezidua aminokyselin, jako jsou Val, Leu, Ile, Met a Phe, jsou velmi často lokalizovány dovnitř proteinu, mimo kontakt s vodným prostředím obklopující protein. Nabité polární skupiny aminokyselin jako je Arg, His, Lys, Asp a Glu jsou lokalizovány především na povrchu proteinů, tj. obrácené do vodného prostředí. Tyto skupiny velmi často váží enzymové kofaktory a učastní se katalytické funkce enzymu. Nepolární skupiny aminokyselin jako je Ser, Thr, Asn, Gln, Tyr a Trp jsou běžně orientovány na povrchu i ve vnitřku proteinů, téměř vždy jsou svázány vodíkovými můstky s jinými fukčními skupinami. Typickým příkladem je struktura cytochromu c (Obr.39). Vnitřek proteinů, tvořený těsně nahloučenými nepolárními skupinami je téměř bezvodý a připomíná tak uspořádání podobné molekulárnímu krystalu. Proteiny, které jsou delší jak ≈ 200 aminokyselin zpravidla vytváří dva nebo více vzájemně propojených globulárních shluků, tzv. domén. Domény jsou strukturálně nezávislé jednotky, které mají každá o sobě charakter malého globulárního proteinů. Pro ilustraci lze uvést např. složení enzymu glyceraldehyd-3-fosfát dehydrogenázy (Obr.40). Polypeptidické spojky mezi doménami jsou často místem, kde dochází k enzymatické proteolýze proteinu. Ta však nutně nemusí ovlivnit konformaci a funkci propojených domén. Každá doména se skládá vždy z několika vrstev sekundárních struktur a má specifickou funkci. Příkladem je NAD+ vazebná doména glyceraldehyd-3-fosfát dehydrogenázy. V řadě i strukturálně nepříbuzných proteinů se vyskytují tzv. proteinové motivy (supersekundární struktury), specifická uskupení sekundárních stuktur. Nejznámější je tzv. βαβ motiv, β-vlásenkový motiv, αα motiv a motiv řeckého klíče (Greek key motif) (Obr.41). Skupiny proteinových motivů vytváří strukturu jednotlivých domén. Doménové struktury jsou zpravidla členěny na tzv. α a β domény a α /β domény. Reprezentativním příkladem α domény je globinová doména, 4-helixový svazek u cytochromu b562 a lidský růstový hormon (Obr.42). α domény jsou nedílnou součástí transmembránových proteinů. β domény se skládají z 4 až 10 převážně antiparalelních β-listů ve dvou rovinách, tvořících sendvičové uspořádání. Příkladem je doména imunoglobulinů (Obr.43) a retinol-vázajícího proteinu (Obr.44). α /β domény jsou tvořeny centrálním paralelním uspořádáním β-listů pospojovaných α-helixy (Obr.45). Tyto struktury jsou často součástí aktivních center enzymů a jsou evolučně příbuzné i u funkčně vzdálených enzymů. Je tedy pravděpodobné, že vznikly z jedné původní domény divergenční evolucí. Naproti
Strana 12
Studijní opory biologie
Malý J.:Molekulární biologie
tomu, jejich optimální uspořádání v aktivním centru enzymu mohlo vést i ke konvergentní evoluci z původně nepříbuzných struktur. Získávání, zpracování a uchování informací o struktuře proteinů je v současné době neodmyslitelně spjato s rozvojem tzv. strukturální bioinformatiky. Bioinformatika je vědní obor, který se zabývá využitím moderních výpočetních postupů v analýze sekvencí proteinů a nukleových kyselin stejně jako způsoby, jakými mohou být zobrazovány a srovnávány makromolekulární struktury jako jsou proteiny. Znalosti o atomární struktuře proteinů jsou shromažďovány v tzv. proteinové bance (Protein Data Bank, PDB, http//www.rcsb.org/pdp/). Do dnešní doby je v této databázi shromážděno až 20 tis. biomolekulárních struktur získaných NMR a rentgenovou strukturní analýzou. Databáze nukleových kyselin (Nucleic Acid Database, NDP, http://ndbserver.rutgers.edu/NDB/ndb.thml) poskytuje informace o struktuře biomolekul obsahující nukleové kyseliny. Existuje řada počítačových programů, které umožňují třídimenzionální zobrazení prostorových struktur proteinů (např. RasMol, VRML atd.), popř. programy umožňující provádět klasifikaci či srovnávací analýzy 3D struktur proteinů (např. kategorizace CATH, CE, SCOP atd.).
1.8.
Stabilita proteinů
Z termodynamických měření vyplývá, že nativní proteiny, tj. jejich správná prostorová konformace je ve fyziologických podmínkách velmi křehká, neboť je garantována pouze slabými interakcemi. Ze srovnání např. plyne, že typický protein o 100 aminokyselinách je držen ve správné konformaci energií cca 40 kJ.mol-1. V protikladu k tomu je např. energie potřebná k rozštěpení vodíkové vazby rovna cca 20 kJ.mol-1. Denaturaci proteinu je tedy zabráněno pouze velmi citlivě balancovanými vnitřními a vnějšími silami působícími na protein ve fyziologickém prostředí. Elektrostatické síly, tj. coulombovské interakce, výrazně přispívají zejména k mezimolekulárním vazbám mezi proteiny, nukleovými kyselinami a substrátem. Současné počítačové postupy dovolují realizovat např. výpočty prostorového rozložení povrchového náboje proteinů, které do značné míry ovlivňují mechanismus enzymové aktivity (Obr.46). Iontové páry (solné můstky) přispívají ke stabilizaci proteinů pouze malou měrou, zejména díky jejich solvataci. Daleko větší měrou se uplatňují tzv. van der Waalsovy síly, které mají svůj původ v dipól-dipólových interakcích (ať již permanentních či dočasných dipólů) (Obr.47). Např. karbonylová a amidová skupina peptidické vazby mají formu permanentních dipólů. Přestože jejich energie je vzhledem k iontovým interakcím slabá, v důsledku jejich superpozice a zesílení hrají velmi důležitou roli při stabilizaci proteinů. Londonovy disperzní síly, které mají svůj původ v elektronových Strana 13
Studijní opory biologie
Malý J.:Molekulární biologie
fluktuacích jinak nepolárních molekul, jsou stabilizační silou zejména v těsně nahloučených vnitřních prostorách globulárních proteinů. Výrazným způsobem stabilizují protein vodíkové můstky. Správně zbalené proteiny nabírají takové konformace, ve které dosáhnou maximální počet intermolekulárních vodíkových můstků. Nezbalené proteiny vytvářejí vodíkové můstky s molekulami rozpouštědla. Důležitými stabilizačními silami jsou hydrofóbní síly. Hydrofobní síly jsou síly, které vedou k minimalizaci kontaktu nepolárních molekul s vodou či amfipatickými molekulami, jejichž výsledkem je např. vznik micelárních struktur. Jelikož proteiny jsou do určité míry podobné micelárním strukturám (hydrofobní zbytky aminokyselin lokalizovány do jádra proteinu), je jisté, že podíl těchto sil na stabilizaci proteinu je významný. Disulfidové můstky vznikající spojením dvou cysteinových zbytků jsou výrazným stabilizátorem tercierní struktury proteinů. Relativně redoxní povaha cytoplasmy řady buněk však snižuje stabilitu disulfidických můstků v nativních podmínkách. Tato vazba je zasílena při exkreci proteinů do extracelulárních prostor, kde převažují oxidační podmínky.
1.9.
Denaturace proteinů
Povaha slabých stabilizačních sil, které zaručují správnou konformaci proteinů je příčinou snadné denaturace proteinů v podmínkách, kdy tyto vazby jsou narušeny. V případě, že je protein postupně zahříván, dochází k skokovým změnám jeho vlastností, jako je aktivita a konformačně závislé charakteristiky, UV absorpce, viskozita atd. Rychlost těchto změn napovídá, že ztráta konformace probíhá kooperačním způsobem, tj. částečná ztráta struktury navozuje rychlou destabilizaci proteinu jako celku. Tato změna vyvolá kolaps struktury do náhodného klubka polypeptidu, tj. denaturovaného proteinu. Tzv. teplota tání proteinu (Tm) je obdoba veličiny, která charakterizuje tepotu tání pevných látek. U naprosté většiny proteinů je Tm menší jak 100°C (Obr.48). Mimo teplotní denaturace, proteiny mohou podléhat ztrátě konformace např. změnou pH; působením detergentů či vysokou koncentrací organických, ve vodě rozpustných látek (např. alifatických alkoholů). Tzv. chaotropní činidla jsou soli, které ve zvýšené koncentraci mohou navodit denaturaci proteinů (např. I-, ClO4-, SCN-, Li+). 1.10. Kvarterní struktura proteinů
Díky existenci prostorových povrchových nábojů proteinů je obecnou vlastností jejich vazba na jakékoliv jiné molekuly. Toto však neplatí o jiných proteinech. Zde je tato vazba pro funkčnost nežádoucí a proto byla evolucí u funkčně nesourodých proteinů vyloučena. Vyjímku tvoří polypeptidy, které spoluvytvářejí funkční celek – kvarterní strukturu proteinů. Strana 14
Studijní opory biologie
Malý J.:Molekulární biologie
Jednotlivé polypeptidy, které tuto strukturu vytvářejí se nazvývají proteinové podjednotky. Naprostá většina funkčních proteinů je složena z několika podjednotek. Existuje několik důvodů pro tento fakt. U řady strukturně i funkčně složitých proteinů je snažší vytvářet vyšší celky samovolným skládáním menších podjednotek (self-assembling process), které mohou být v případě potřeby vyměněny za jiné. Místo vzniku, úprav a konečného složení funčního celku může být lokalizováno v různých částech buňky. U řady komplikovaných enzymů vzniká aktivní místo na pomezí jeho podjednotek. Multikomponentní stavba umožňuje snažší regulaci funkce proteinů atd. Proteiny, které se skládají ze stejných, často mnohokrát opakovaných podjednotek, se nazývají oligomery. Jednotlivé podjednotky tohoto typu se pak nazývají protomery. Protomer se pak muže skládat buď z jednoho polypeptidického řetězce nebo z více, vzájemně odlišných řetězců. V tomto pohledu je např. hemoglobin dimer složený z protomeru α a β (Obr.49). V převážné většině oligomerních proteinů jsou protomery symetricky uspořádané, tj. nachází se v pravidelné geometrické pozici v rámci oligomeru. Z tohoto důvodu vznikají prostorově ohraničené definované struktury, které jsou charakterizovány tzv. bodovou symetrií. Tyto struktury jsou dále charakterizovány rotační symetrií, tj. lze nalézt osu rotace, podle které je tvar proteinu symetrický (Obr.50). Nejjednoduším typem rotační symetrie je symetrie cyklická (Cn, kde n značí počet protomerů), která je tvořena pouze jednou osou symetrie. Dihedrální symetrie (Dn) je více komplikovaná symetrie, s dvou- a vícesymetrickými, dvěma navzájem kolmo orientovanými osami. Příkladem je hemoglobin. Složitější útvary mohou nabývat tetrahedrickou (T), kubickou či oktahedrickou (O) symetrii. Některé oligomerní proteiny nabývají tzv. helikální symetrie (Obr.51). Příkladem je aktin a tubulin.
Strana 15
Studijní opory biologie
2.
STRUKTURA A FUNKCE NUKLEOVÝCH KYSELIN
2.1.
Vlastnosti nukleotidů
Malý J.:Molekulární biologie
Nukleotidy a jejich deriváty jsou biologicky nazastupitelné molekuly, které participují takřka ve všech biochemických procesech. Vyvářejí monomerní jednotky nukleových kyselin a sehrávají tak centrální roli při uschování a expresi genetické informace. Nukleosid-trifosfáty (NTP) jsou energeticky bohaté molekuly, které se účastní většiny metabolických pochodů v buňce jako zásobárna okamžitě využitelné energie. Řada metabolických pochodů je regulována přítomností/nepřítomností dostatečného množství ATP, některé NTP se účastní přenosu informací v buňce. Některé nukleotidové deriváty, jako je nikotinamid adenin dinukleotid (NAD či NADP), flavin adenin dinukleotid (FAD) nebo coenzym A (CoA) jsou přímími účastníky řady enzymatických reakcí. Některé nukleotidy mají katalytickou aktivitu, zejména pokud jsou součástí tzv. ribozymů, tj. nukleových kyselin s enzymatickou aktivitou. Nukleotidy jsou fosfátovými estery pětiuhlíkatých cukrů, ve kterých je dusíková báze vázána v poloze C1´ na cukerném zbytku (Obr.52). Tzv. ribonukleotidy,
které jsou
monomery ribonukleových kyselin (RNA) jsou tvořeny pentózou D-ribózou, kdežto deoxyribonukleotidy, součást deoxyribonukleových kyselin (DNA), jsou tvořeny 2´-deoxy-Dribózou. Fosfátová skupina je navázaná buď na C5´uhlík pentózy a vytváří tak 5´-nukleotid, popř. je vázána na C3´uhlík pentózy a vytváří tak 3´-nukleotid. Pokud není fosfát na pentóze navázán vůbec, molekula se nazývá nukleosid. Je tedy možné 5´-nukleotid označit také za nukleosid-5´-fosfát. Ve všech známých přirozeně se vyskytujících nukleotidech je dusíkatá báze vázána na C1´uhlíku s kovalentní vazbou (glykosidickou vazbou) orientovanou do stejné roviny, jako vazba mezi C4´a C5´uhlíkem pentózy (β-konfigurace). Fosfátový zbytek je za fyziologických podmínek dvakrát ionizován, tj. má poměrně silné kyselé vlastnosti. Dusíkaté báze jsou planární, aromatické a heterocyklické molekuly, které jsou v zásadě odvozeny od struktury purinu a pyrimidinu (Obr.53). Nejdůležitější purinovou bází je adenin a guanin, v případě pyrimidinových bazí se jedná o cytozin, uracil a thymin (5-methyluracil) (Obr.54). Purinové báze se váží na pentózu skrze jejich N9 atom, pyrimidinové báze skrze N1 atom. Nukleové kyseliny jsou lineární polymery nukleotidů, které vznikají spojení skrze fosfátové skupiny na 3´a 5´atomu uhlíku po sobě jdoucích pentóz (Obr.55). Fosfátové zbytky těchto polynukleotidů jsou za fyziologických podmínek kyselé, tzn. že nukleové kyseliny jsou polyanionty. Nukleové kyseliny jsou směrově orientovatelné, každá má 3´konec (C3´atom není spojen s dalším nukleotidem) a 5´konec (C5´atom není spojen s dalším nukleotidem).
Strana 16
Studijní opory biologie
Malý J.:Molekulární biologie
DNA má vždy stejný počet adeninu a thyminu (A = T) a guaninu a cytosinu (G =C). Toto tzv. Chargaffovo pravidlo bylo objeveno ve 40. letech 20. st. díky rozvoji kvantitativních metod separace a analýzy hydrolyzované DNA. Podstatou tohoto jevu je existence genomové DNA ve formě dvoušroubovice (dsDNA – double stranded DNA), složené ze dvou, navzájem komplementárních řetězců nukleových kyselin (ssDNA – single stranded DNA), stabilizovaných vodíkovými můstky mezi páry A-T a G-C. Obsah GC je velmi proměnlivý z hlediska organismů (od 25-75%), v rámci příbuzných skupin je však poměrně ustálený (např. savci mají rozsah GC obsahu v rozpětí 39-46%). RNA se vyskytuje v převážné většině v jednořetězcové (ssRNA – single stranded RNA) formě. U některých virů, ve kterých je přítomna dvouřetězcová forma RNA (dsRNA – double stranded RNA) podléhá Chargaffovým pravidlům, jen místo párování A-T je párování A-U. Struktura nativní DNA byla stanovena v roce 1953 Watsonem a Crickem. Jejich objev byl později oceněn Nobelovou cenou. Watson-Crickova struktura DNA patří k základním pilířům a mezníkům rozvoje molekulární biologie. Jejímu objevu napomohlo několik v té době známých faktů o povaze a vlastnostech DNA: (i) Chargaffovy pravidla; (ii) znalost správných tautomerních forem dusíkatých basí potvrzených jejich NMR, spektroskopickou a rentgenovou strukturální analýzou; (iii) informace o helikální struktuře DNA získaná rentgenovou difrakcí (R. Franklin) (Obr.56). Na základě těchto faktů navrhl Watson a Crick strukturu dvouřetězcové šroubovice, která se velmi rychle ujala mezi vědeckou veřejností zejména díky jednoduchosti a jasné interpretaci z ní vyplývajících biologických principů. Tzv. B-DNA (Obr.57), popsaná Watsonem a Crickem je považována za nativní (biologicky aktivní) konformaci DNA. Tato struktura je popsána několika následujícími charakteristickými znaky. Skládá se ze dvou řetězců polynukleotidů, které se navzájem obtáčí do pravotočivé dvoušroubovice s průměrem ≈ 20Å. Tyto řetězce jsou navzájem antiparalelní, přičemž báze jsou směřovány dovnitř šroubovice. Roviny bazí jsou téměř kolmé na osu šroubovice. Každá z bazí je svázána vodíkovými můstky s protilehlou komplementární bazí (tzv. párování bazí). Ideální B-DNA je tvořena 10 páry bází (bp – base pair) na 1 otočku helixu, přičemž délka vlákna na 1 otočku je 34Å. Jednou z důležitých vlastností B-DNA je vzájemné párování pouze adeninu s thyminem a guaninu s cytosinem, tj. existence tzv. Watson-Crickových párů bazí (Obr.58). Tyto páry jsou vzájemně zaměnitelné, tj. nezáleží, na kterém vlákně DNA se daný člen dvojice nachází. Naopak v případě nekomplementárních bazí (např. párování A-G, A-C atd.) by došlo k párování, které by výrazným způsobem deformovalo cukerný řetězec polynukleotidu a narušovalo uspořádanost struktury DNA. BDNA je tvořena dvěma externími tzv. žlábky - úzkým (minor groove) a širokým žlábkem Strana 17
Studijní opory biologie
Malý J.:Molekulární biologie
(major groove). Skutečná struktura B-DNA se od teoretické v několika aspektech liší. Např. je známo, že skutečná struktura je sekvenčně závislá, tj. určité kombinace sekvencí (pořadí nukleotidů v řetězci) vnáší do B-DNA deformace, které zesilují či zeslabují vazbu obou řetězců. Tyto sekvence jsou důležité např. pro sekvenčně specifické interakce DNA s proteiny, které zpracovávají genetickou informaci. Zejména v souvislosti s rozvoje umělých syntéz oligonukleotidů a jejich rentgenovou difrakční analýzou bylo zjištěno, že B-DNA není jedinou konformací dvouřetězcových nukleových kyselin. Existuje celá řada konformací, které mohou zaujímat dsDNA, dsRNA či DNA-RNA hybridní molekuly, v závislosti na přítomnosti iontů kovů či vlhkosti prostředí. Charakteristiky dvou typických konformací – A-DNA a Z-DNA jsou uvedeny na Obr.59. V okamžiku, kdy je vlhkost prostředí snížena z 90 na 75%, přechází B-DNA struktura samovolně na tzv. A-DNA strukturu (Obr.60). Opět se jedná o dvouřetězcovou pravotočivou šroubovici, avšak podstatně širší, s 11.6 bp na 1 otáčku a délkou 34Å s centrální dutinou. Rovina bazí je pootočena vzhledem k ose šroubovice asi o cca 20°. Široký žlábek je hluboce zaříznutý do helixu, úzký žlábek je velmi mělký. V nativních podmínkách byla tato struktura popsána např. v aktivním vazném místě DNA-polymerázy (≈ 3bp segment) a u bakteriálních spór, kde jejich existence zaručuje odolnost spór proti UV záření, tj. vzniku kovalentní vazby mezi dvěma sousedními thyminy (tzv. thyminových dimerů). 20 let po objevu B-DNA byla popsána velmi neobvyklá struktura levotočivého dvojřetězcového helixu (Wang a Rich) u syntetického oligonukleotidu d(CGCGCG) a označena jako Z-DNA (Obr.61). Helix je tvořen 12 bp na 1 otáčku s délkou 44Å. Je pro něj charakteristický velmi hluboký úzký žlábek a zanedbatelný široký žlábek. Studiem syntetických oligonukleotidů bylo zjištěno, že Z-DNA vzniká především na segmentech s alternujícími purinovými a pyrimidinovými bázemi v přítomnosti vysokých koncentrací solí. In vivo existence Z-DNA byla prokázána teprve nedávno, jako tzv. Zα-protein vázající doména lokalizovaná ve specifických nukleotidových sekvencích na řetězci B-DNA (Obr.62). Dvouřetězcové dsRNA, které jsou běžné u některých virů, nemohou vytvářet strukturu obdobnou B-DNA v důsledku sterických zábran 2´-OH skupin. Ve většině případů nabývají konformace blízké A-DNA, které se označují jako A-RNA či RNA-11. Tato struktura má 11bp na 1 otočku, dlouhou 30.9Å. Hybridní dvouřetězcové komplexy, tj. komplexy DNARNA nabývají opět struktury podobné A-RNA (Obr.63). Tyto struktury jsou in vivo běžné, neboť jsou principiálně součástí hybridní DNA-RNA vznikající při transkripci a při iniciaci (primerování) replikace. V tomto případě je tato struktura (RNA) substrátem pro RnasuH, která specificky hydrolyzuje RNA hybridního helixu. Strana 18
Studijní opory biologie
Malý J.:Molekulární biologie
Dvouřetězcová DNA je ve srovnání s terciérní strukturou proteinů daleko méně komplexní, tj. existuje pouze limitovaný počet možných konformací, ve kterých je tato struktura stabilní. Tento fakt je způsoben podstatně menší diverzitou nukleotidů ve srovnání s aminokyselinami. Stejně jako v případě proteinů, i zde se uplatňují stabilizační síly různé povahy. Základem stabilizace dvou řetězců nukleové kyseliny je poměrně omezená konformační volnost cukerné kostry nukleové kyseliny, která může nabývat pouze několik stabilních prostorových uspořádání a párování Watson-Crickových bazí obou protichůdných řetězců. Vzhledem k velmi nízké stabilitě se v rámci dsDNA nevyskytují párování bazí jiného než komplementárního typu. Vodíkové vazby přispívají ke stabilizaci dsDNA pouze omezeně a to i přes to, že jsou zodpovědné za párování komplementárních bazí. Lze se o tom přesvědčit např. snadnější denaturací DNA v nevodném rozpouštědle (např. ethanolu), který zeslabuje vodíkové můstky a snižuje tak teplotu tání (Tm) dsDNA. Po denaturaci jsou báze stabilizovány vodíkovými můstky s molekulami vody. Z analýzy krystalů DNA je známo, že důležitou stabilizační silou dsDNA je tzv. base stacking, tj. van der Waalsovy interakce planárních paralelních molekul purinových a pyrimidinových basí v řetězci nukleové kyseliny (Obr.64). Tyto interakce jsou ve vodném prostředí nejčastěji způsobeny hydrofobními silami působícími mezi bázemi nukleotidů. V důsledku polyiontové povahy nukleových kyselin (negativně nabité fosfáty nukleotidů) se stabilizace účastní rovněž i iontové síly. Přítomnost kationtů v roztoku (zejména divalentních, např. Mg+2) stabilizuje dsDNA (zvyšuje Tm).
2.2.
Struktura DNA s nadšroubovicovým vinutím
Genetické analýzy prokazují, že naprostá většina bakterií a virů obsahuje genomovou DNA ve formě uzavřených kruhových DNA. Tato skutečnost byla prokázána jak molekulárněbiologickými přístupy, tak např. elektronovou mikroskopií (Obr.65). Řada těchto kruhových DNA se nachází ve stočeném stavu, který se nazývá superhelikální, či nadšroubovicové vinutí. Tato topologická struktura se občas označuje i za tercierní strukturu DNA a má pro tyto organismy důležitou roli v řadě životních projevů. Schematický diagram základní struktury cirkulární DNA je znázorněn na Obr.66. Výsledné geometrické uspořádání této struktury je závislé na počtu otáček, kterými se obě vlákna DNA vzájemně obtáčí. Změnu v počtu otáček není možné provést jiným způsobem, než přestřihnutím a provlečením jednoho z vláken okolo vlákna druhého. Matematicky se dá vyjádřit tento fakt vztahem: L = T + W; kde L značí tzv. spojovací číslo označující počet otáček jednoho vlákna kolem vlákna druhého; T číslo celkových otáček DNA kolem osy vlákna v dané konformaci a W je počet otáček duplexu DNA kolem osy dvojšroubovice. W je Strana 19
Studijní opory biologie
Malý J.:Molekulární biologie
měřítkem nadšroubovicového vinutí (superhelicity) DNA. Rozdíl mezi T a W je prezentován na Obr.67., příklad zavedení nadšroubovicového vinutí do cirkulární DNA na Obr.68. Superhelikální DNA s negativním W může existovat ve dvou odlišných formách – tzv. toroidním helixu a v stočeném helixu (Obr.69). V toroidním helixu je osa duplexu omotána ve formě cylindru, v případě stočeného helixu se duplex stáčí okolo sebe. Superhelikální DNA může být převedena in vitro do relaxované podoby, tj. cirkulární formy s W=0 pomocí štěpení jednoho řetězce v duplexu pankreatickou DNasou I (endonukleáza, štěpící v určité sekvenci pouze 1 vlákno duplexu). Dojde k protočení jednoho vlákna okolo druhého a uvolnění nahromaděného napětí. Topologii, tj. prostorové uspořádání cirkulární DNA se superhelicitou lze laboratorně studovat a měřit. Dosud pozorované nativní formy těchto duplexů byly případem stočeného helixu. Tento jev byl mnohokrát potvrzen využitím interkalárních molekul, jako je ethidium bromid (EtBr) (Obr.70). EtBr je planární molekula, která má schopnost se vmezeřit mezi vlákna duplexu (Obr.71) a přitom mění stupeň pootočení vláken (≈ 26°) a tím i superhelicitu duplexu. Postupným zvyšováním koncentrace EtBr je možné dosáhnout postupnou změnu superhelicity od negativní superhelicity (W < 0), přes relaxovanou kruhovou DNA až po pozitivní superhelicitu (W > 0) (Obr.72). Hodnota superhelicity (W) je pak vyhodnocena odlišnou sedimentační rychlostí jednotlivých typů duplexů. Jinou metodikou, schopnou odlišit navzájem odlišné struktury s různou superhelicitou je agarózová elektroforéza (Obr.73). I zde dochází k separaci, tj. nestejně rychlé migraci, superhelikálních DNA v elektickém poli a polymerním sítu agarózového gelu. Správná biologická funkce cirkulrání DNA je zaručena pouze v případě správné topologie, tj. prostorovém uspořádání helixu. V procesech transkripce a translace vyžadují enzymy jako je RNA polymeráza či DNA polymeráza lokální rozpletení duplexu DNA a odhalení sekvence bazí. Negativní superhelicita cirkulární DNA napomáhá odtrhnutí obou vláken duplexu v určitých sekvencích a sestavení funkčních polymeráz. Pokud je DNA relaxována, pak výše zmíněné procesy buď probíhají velmi pomalu, či neprobíhají vůbec. Superhelicita je kontrolována početnou skupinou enzymů, které se nazývají topoisomerázy. Jejich název je odvozen z faktu, že tyto enzymy pouze mění topologii DNA, avšak nikoliv její kovalentní strukturu. Topoisomerázy se člení na 2 skupiny, tzv. topoisomerázy typu I se subtypy IA a IB (na základě jejich primární struktury a reakčního mechanismu) a topoisomerázy typu II (způsobující dvouřetězcové zlomy DNA).
Strana 20
Studijní opory biologie
Malý J.:Molekulární biologie
Typ I topoisomeráz katalyzují úplnou relaxaci superhelikální DNA změnou jejich počtu otáček (L) v jednootáčkovém krokování. Typ IA se nachází ve všech typech buněk a provádí relaxaci pouze u negativní superhelikální DNA, typ IB se nachází jak u prokaryot tak i eukaryot a provádí relaxaci negativní i pozitivní superhelikální DNA. Podstatou funkce typu IA je rozštěpení jednoho řetězce duplexu DNA, jeho akivní provlečení (spotřeba energie) okolo druhého řetězce a opětovného spojení (strand passage mechanism) (Obr.74). Příkladem je činnost topoisomerázy I a III bakterie E.Coli (Obr.75). Tyto enzymy mají schopnost restrikce v určitých specifických sekvencích duplexu DNA za současného navázání rozštěpených konců řetězce pomocí tzv. 5´-fosfotyrozinové vazby na aktivní tyrozin enzymu (Obr.76). Pravděpodobný proces a jeho jednotlivé fáze jsou prezentovány na Obr.77. Typ IB pracuje na základě kontroly rotace duplexu. Příkladem je lidská topoisomeráza I (topo I) (Obr.77). I zde dochází k rozštěpení jednoho řetězce duplexu DNA a jeho vazbě na tyrozin, avšak skrze 3´-fosfotyrozinovou vazbu. Následuje relaxace duplexu, která je však prováděna odlišným mechanismem od typu IA, tj. kontrolovanou rotací přestřiženého vlákna DNA kolem zafixovaného komplementárního řetezce. Tento proces nevyžaduje dodání další energie enzymem, neboť jeho rotace je způsobena uvolněním negativního napětí v duplexu (Obr.78). Typ II topoisomeráz prokaryot se označují jako enzym gyráza. Gyráza je A2B2 heterotetramer, který se skládá z podjednotek GyrA a GyrB. Tento enzym katalyzuje krokové zvyšování negativní superhelicity duplexu DNA za současné hydrolýzy ATP. Gyráza může rozpojovat a spojovat jeden i oba řetězce duplexu DNA. Ostatní topoisomerázy typu II prokaryot a eukaryot (vyjma gyrázy) naopak provádí relaxaci DNA, avšak opět za spotřeby ATP. DNA gyrázy mohou být inhibovány řadou látek, jako je např. novobicin, antibiotika izolovaného z streptomycet (patří ke kumarinovým typům antibiotik) či ciprofloxacin (obchodní značka Cipro) pařící k chinolinovým typům antibiotik (Obr.79). Tyto antibiotika inhibují procesy replikace a transkripce v bakteriích, v důsledku navození relaxace DNA (nečinnost gyráz). Funkce gyrázy spočívá v přestřižení obou vláken duplexu, protlačení vlákna duplexu přes dvojřetězcový zlom a jeho opětovné spojení (Obr.80). Dobře prostudovanou topoisomerázou typu II je enzym izolovaný z kvasinek (Saccharomyces cerevisiae, topoII) (Obr.81). Tyto enzymy pracují mechanismem obdobným strand passage mechanismu topoisomeráz IA. Po rozstřižení jednoho řetězce v duplexu je 5´-konec zachycen kovalentní vazbou na tyrozinu a následně je mezi vzniklým zlomem provlečeno celistvé vlákno (Obr.82). Na závěr dochází k opětovnému spojení vlákna a uvolnění duplexu DNA. Je známa řada látek, které inhibují činnost eukaryotních topoisomeráz typu II a jsou hojně Strana 21
Studijní opory biologie
Malý J.:Molekulární biologie
využívána v nádorových chemoterapiích. Příkladem je doxorubicin a etoposid (Obr.83). V kontrastu s inhibitory gyráz, tyto molekuly zvyšují rychlost štěpení duplexů, nebo inhibují religační schopnost. Dochází tak k masivnímu nárůstu jedno a dvou-řetězcových zlomů DNA v buňce a následní zánik především rychle se replikujících, nádorových buněk.
2.3.
Denaturace a renaturace nukleových kyselin
Pokud je roztok duplexu DNA zahříván na určitu teplotu, dochází ke kolapsu nativní dvojřetězcové struktury, oddělení komplementárních řetězců DNA a jejich sbalení do náhodného uspořádání. Tento proces se nazývá denaturace (Obr.84). Denaturace je doprovázena změnou fyzikálně-chemických vlastností roztoku DNA, zejména viskozity či absorpčního spektra (Obr.85). Nejspolehlivější metodou, jako monitorovat denaturaci DNA, je sledování změn absorpce v UV oblasti, kde jsou lokalizována charakteristická absorpční maxima. Během procesu denaturace dochází k ≈ 40% nárůstu absorpce v důsledku uvolnění aromatických bazí, které jsou odpovědné za absorpci v UV oblasti. Tento jev, který se nazývá hyperchromní efekt, je možné pozorovat např. při konstantní vlnové délce λ = 260nm jako závislost na teplotě roztoku (Obr.86). Získaná závislost se nazývá křivka tání a její střední hodnota odpovídá teplotě tání Tm (melting point). Teplota tání duplexu je závislá na celé řadě faktorů, jako je povaha solventu, concentrace a typ přítomných iontů, pH, popř. obsah GC a AT párů. Obecně platí pravidlo, že vyšší obsah GC zvyšuje Tm v důsledku existence tří vodíkových můstků mezi komplementárními bazemi, kdežto vyšší obsah AT naopak snižuje Tm (2 vodíkové můstky). Stanovení Tm u genomové DNA je jednou z metod, jak se dá odhadout tzv. sekvenční komplexita genomu (obsah GC). Pokud je roztok obsahující denaturovanou DNA rychle schlazen pod hodnotu Tm, výsledná DNA bude pouze částěčně spárovaná (Obr.87), neboť oba řetězce nemají dostatek času k nalezení komplementárních sekvencí před tím, než je struktura definitivně „zmražena“. Pokud je však teplota roztoku ponechána po určitou dobu ≈ 25°C pod Tm, terrmální energie je stále dostatečná k tomu, aby se vlákna DNA navzájem pohybovala a reorganizovala s cílem nalézt komplementární oblasti. Za těchto podmínek je možné kompletně renaturovat DNA v původní formě. Obdobně lze například získat i dvouřetězcovou hybridní DNA-RNA molekulu procesem, který se nazývá hybridizace. Ta je základem moderních metod v molekulární biologii a genovém inženýrství (např. polymerázová řetězová reakce, PCR).
Strana 22
Studijní opory biologie
3.
REPLIKACE DNA
3.1.
Obecný princip replikace
Malý J.:Molekulární biologie
V roce 1958 nastínil Crick schéma přenosu a realizace genetické informace v organismech, které se později označilo za tzv. centrální dogma molekulární biologie. DNA řídí vlastní replikaci (zdvojení obsahu DNA), zatímco její transkripce (tj. přepis) poskytuje RNA, která je podkladem pro translaci (tj. překlad) genetické informace do pořadí aminokyselin v proteinech (Obr.88). Replikace přitom zajišťuje kontinuitu existence genové informace v čase a prostoru, tj. zaručuje její mezigenerační přenos. Transkripce a translace jsou nástrojem, které realizují genetickou informaci uloženou v DNA v daném konkrétním organismu. Přestože role a existence replikačního mechanismu byla známa již v koncem 50.let min. stolení, její detailní popis se podařilo uskutečnit až mnohem později, v průběhu 70.let 20.st. Důvodem byl především fakt, že replikace se vždy účastní pouze několik málo kopií enzymů v jedné buňce, které bylo nutné izolovat a popsat. DNA je replikována pomocí enzymu, který se nazývá DNA polymeráza (DNAP), popř. DNA specifická DNAP (označující typ nukleové kyseliny, který replikuje). Tyto enzymy využívají jednořetezcový templát DNA k syntéze komplementárního vlákna z příslušných s templátem párujících se nukleotidů (Obr.89). Jednotlivé nukleotidy komplementárního řetězce jsou přísně kontrolovány tak, aby nedocházelo k vzniku chybného párování. Vzniká tak dsDNA s typickou helikální strukturou. Téměř všechny známé DNAP jsou schopny připojit nový nukleotid do vznikajícího řetězce na volnou 3´-OH skupinu syntetizovaného vlákna. Důsledkem je směrovost syntézy (replikace), která probíhá vždy jen ve směru 5´-3´vznikajícího vlákna DNA. Dovouřetězcová DNA je kopírována tím způsobem, že dochází k postupujícímu rozštepění dsDNA vlákna v určitém místě (sekvenci) a odhalení volných bazí nukleotidů, které slouží jako templát k syntéze komplementárního řetězce kopie DNA. Vzniká tak tzv. semikonzervativní dceřiná kopie dsDNA (Obr. 90), tj. každé vzniklé vlákno dsDNA obsahuje jedno vlákno z původní dsDNA a druhé nově nasyntetizované, komplementární vlákno. Poprvé byl tento proces pozorovnán J. Cairnem jako replikace cirkulárního chromozómu a vzniklé struktury označeny řeckým písmenem theta (θ) a nazvány jako tzv. replikační očko (Obr.91). Část replikačního očka, ve kterém je syntetizována dceřiná dsDNA se nazývá replikační vidlička (Obr.92). Replikační očko může obsahovat jednu či dvě replikační vidličky, v závislosti na počtu DNAP, které se replikace účastní (jednosměrná či dvousměrná replikace). Místo, kde na vlákně dsDNA je zahájena replikace, se nazývá
Strana 23
Studijní opory biologie
Malý J.:Molekulární biologie
replikační počátek. Prokaryotní a bakteriofágová DNA je charakterizovaná pouze jedním replikačním počátkem, eukaryotní chromozóm obsahuje zpravidla více replikačních počátků. Požadavek na rozpletení DNA v místě replikačního počátku přináší poměrně závažný topologický problém. Například chromozóm bakterie E. Coli je replikován rychlostí ≈ 1000 nukleotidů za 1s, tzv. že rozpletení šroubovice by bylo spojené s jejím točením kolem osy s rychlostí cca 100 otáček za 1s, popř. akumulaci (tj. hrnutí) otáček ve směru replikace. Z různých důvodů tento proces není možný a je ošetřen enzymatickou aktivitou např. topoisomeráz.
V přirozené
formě
je
bakteriální
chromozóm cirkulární
s negativní
superhelicitou, který napomáhá rozvinutí duplexu DNA. U prokaryot je tato topologie udržována aktivitou topoisomeráz II, které vzniklé napětí v cirkulární DNA uvolňují. Ze struktury replikační vidličky vyplývá, že DNAP, které je ve vidličce přítomná popojíždí jedním směrem a syntetizuje semikonzervativní kopie dsDNA. Jelikož však všechny známé kopie DNAP mohou polymerizovat komplementární vlákno pouze ve směru 5´-3´vznikajícího řetězce, tj. ve směru pohybu DNAP po 3´-5´ templátovém řetězci, vyvstává otázka, jak je možné tímto způsobem replikovat i druhé templátové vlákno původního řetězce, které je orientováno opačně, tj. ve směru 5´-3´. Tato problematika byla objasněna v roce 1968 výzkumem R. Okazakiho, který popsal tvorbu krátkých nukleotidových polymerů, dnes nazývaných jako Okazakiho fragmenty (Obr.93). Tyto fragmenty jsou dlouhé 1-2 tisíce nukleotidů, jsou komplementární k druhému rodičovskému řetězci DNA, který je orientován ve směru 5´-3´. Jejich existence umožnila formulovat tzv. semidiskontinuální replikační model, ve kterém jsou oba mateřské řetězce DNA replikovány odlišným způsobem. Tzv. vedoucí řetězec (leading strand) je templátový řetězec orientovaný ve směru 3´-5´, tj. syntéza komplementárního řetězce probíhá v souladu se směrem pohybu DNAP. Naproti tomu tzv. zpožďující se řetězec (lagging strand) je také syntetizován ve směru 5´-3´ narůstajícího komplementárního řetězce, ale diskontinuálně, tj. tvorbou Okazakiho fragmentů. Okazakiho fragmenty jsou pospojovány až následně činností enzymu DNA ligázy. Existence diskontinuálního procesu syntézy DNA je mimo jiné potvrzena elektronovou mikroskopií existencí jednořetězcových úseků DNA v replikační vidličce (Obr.94). U replikačních oček se dvěma replikačními vidličkami jsou navíc Okazakiho fragmenty syntetizovány na protilehlých řetězcích v jednotlivých vidličkách (tj. mění se poloha lagging a leading řetězce). Již z faktu, že DNAP je shopná pouze připojit nový nukleotid k 3´-OH skupině předchozího nukleotidu v řetězci vyplývá, že nutně musí existovat nejaký specifický mechanismus zahájení replikace. Analýzou Okazakiho fragmentů bylo prokázáno, že jejich 5´-konce jsou tvořeny krátkými úseky RNA, koplementárními k templátové DNA. Tyto úseky Strana 24
Studijní opory biologie
Malý J.:Molekulární biologie
se nazývají RNA primery. Např. v bakterii E. Coli existují dva enzymy, které mají schopnost syntetizovat RNA primery – tzv. RNA polymeráza (RNAP) a tzv. primáza, která je podstatně menším enzymem, než RNAP. Primáza není citlivá k inhibitoru RNAP rifampicinu. Fakt, že rifampicin inhibuje pouze syntézu vedoucího řetězce (a tedy jeho primerování je zaručeno RNAP) dokazuje, že primáza se účastí zahájení (iniciace) tvorby Okazakiho fragmentů (Obr.95). Jelikož zralá dsDNA neobsahuje RNA, je pochopitelné, že v určité fázi musí docházet k odstranění primerů a jejich nahrazení komplementární DNA (o mechanismu viz dále).
3.2.
Replikační enzymy
DNA replikace je složitým procesem zahrnující celou řadu enzymů. V souhrnu lze jmenovat následující: (i) DNA topoisomerázy; (ii) tzv. helikázy, tj. enzymy, které separují jednotlivé řetězce dsDNA v replikační vidličce; (iii) proteiny, které zabraňují jejich zpětnému spárování dle komplementárních bazí; (iv) enzym, které syntetizují RNA primery; (v) DNA polymeráza; (vi) enzym, který odstraňuje RNA primery; (vii) enzym, který kovalentně spojuje Okazakiho fragmenty. V následujícím textu jsou podány informace o struktuře a funkci jednotlivých proteinů. DNA polymeráza I (DNAP I nebo Pol I) byla objevena v roce 1957 A. Kornbergem jako enzym, který v buněčném extraktu bakterie E. Coli syntetizoval DNA. Dalším výzkumem bylo zjištěno, že Pol I spojuje deoxynukleosid trifosfáty nasedlé na DNA templátu mechanismem nukleofilního ataku 3´-OH skupin narůstajícího řetězce α-fosforylovou skupinou připojovaného nukleosid trifosfátu. Reakce je doprovázena uvolněním dvou fosfátů (PPi) a jejich následným rozštěpením pyrofosfatázou. Reakce se velmi podobá aktivitě RNAP, avšak s tím zásadním rozdílem, že nutně vyžaduje přítomnost správně spárované komplementární báze s templátovou DNA. DNAP I tak pracuje s velmi vysokou přesností, tj. do vznikajícího dsDNA je chybně inkorporována pouze 1 nukleotid na každých 10 milionů zpolymerovaných nukleotidů. Pol I je pracuje tzv, processingem, tj. provádí série polymerizačních kroků (typicky 20 a více), aniž by opustila templát. Pol I může za určitých okolností pracovat i obráceným směrem, tj. odštěpovat nukleotidy od narůstajícího řetězce. Tento proces však není přirozený a nemá závažný fyziologický význam. Požadavek na polymeraci Watson-Crickovy báze spočívá spíše než v schopnosti rozpoznání příslušné báze v požadavku na jejím dokonalém zpárování s templátem. Tento fakt byl potrzen např. inkorporací molekul mimikujících elektronovou strukturu bazí, ale neposkytujících vodíkovou vazbu (např. 2,4.difluorotoulen) (Obr.96). Mimo schopnosti polymerizace, Pol I Strana 25
Studijní opory biologie
Malý J.:Molekulární biologie
má schopnost odštěpovat nukleotidy z řetězce, tj. vlastní 3´-5´a 5´-3´ exonukleázovou aktivitu. 3´-5´exonukleázová aktivita se projeví v okamžiku, kdy se do řetězce vznikající DNA začlení špatná (nespárovaná) báze. V tomto případě převládne exonukleázová aktivita a špatně spárovaná báze je zpět odštěpena a její místo může obsadit báze komplementární. Tato aktivita Pol I se nazývá proofreading nebo také tzv. editační aktivita. Tato aktivita umožňuje efektivně eliminovat chyby při čtení a replikaci templátu. Cena za tuto aktivitu je určitá ztráta energie, neboť takto je vytřiženo cca 3% všech inkorporovaných nukleotidů. Pol I 5´-3´ exonukleázová aktivita se projevuje především v jednořetězcovém zlomu DNA, kde Pol I odštepuje jednu či několik málo bazí od 5´konce nezávisle na typu přítomné báze. Pol I je tvořena tzv. Klenowovým fragmentem, tj. strukturální částí, která je zodpovědná za 3´5´exonukleázovou aktivitu a polymerázovou aktivitu a zbylou částí, zodpovědnou za 5´3´exonukleázovou aktivitu (Obr.97). Podrobně prostudovanou DNAP I je polymeráza izolovaná z termofilní bakterie Thermus aquaticus (Taq), označovaná jako Klentaq1. Tento enzym byl krystalizován a jeho struktura společně s krátkými oligonukleotidovými řetězci duplexu B-DNA charakterizována rentgenovou krystalografickou analýzou (Obr.98). Klentaq 1 je funkčně i strukturálně podobný Klenowovu fragmentu Pol I bakterie E. Coli. Aktivní místo této polymerázy naznačuje, že správný nukleotid je rozpoznán ne základě sekvenčně nezávislé interakce s přiházejícím dNTP, přičemž aktivní místo mimikuje komplementární tvar správné báze. Nukleotidylový transfer (spojení nukleotidů) je umožněn přítomností dvou iontů kovů, zpravidla Mg2+ , které jsou přítomné v aktivním místu (Obr.99). Pol I se výraznou měrou podílí na reparačních procesech poškozené DNA (např. chemickými mutageny). Pokud se vyskytne poškozená DNA (např. modifikovaná báze), pak je řetězec v tomto místě rozštěpen endonukleázou a stává se přístupným k 5´-3´exonukleázové aktivitě Pol I. Ta v tomto místě nejen odstraní několik nukleotidů, ale zárověn syntetizuje vlákno nové a tím opravuje poškozenou dsDNA. Praktické využití této aktivity Pol I je např. při syntéze radioaktivně značených dsDNA, kdy 5´-úsek vlákna v uměle navozeném jednořetězcovém zlomu je v přítomnosti Pol I a radioaktivně značených nukleotidů odstraněn (tzv. nick translation) a nahrazen značenými nukleotidy (Obr.100). 5´-3´exonukleázová aktivita Pol I se uplatňuje in vivo také
v případě odstranění RNA primerů na 5´-konci nově
syntetizovaného vlákna ds DNA, přičemž polymerázová aktivita vyplňuje vznikající mezery. Mimo DNAP I byly objeveny další typy polymeráz, které se z hlediska morfologie a struktury liší od DNAP I. Jsou jimi především DNA polymeráza II (DNAP II, popř. Pol II) a DNA polymeráza III (DNAP III, resp. Pol III). Srovnání vlastností jednotlivých polymeráz je provedeno na Obr.101. Aktivita těchto polymeráz je ve srovnání s Pol I nízká (cca 5% Strana 26
Studijní opory biologie
Malý J.:Molekulární biologie
v normální buňce). DNAP II se uplatňuje především při reparačních procesech ds DNA skrze tzv. SOS odezvu. Podobnou funkci mají i nedávno objevené DNAP IV (Pol IV) a DNAP V (Pol V). Pol III je DNA replikáza v bakterii E. Coli. Skládá se z tzv. Pol II jádra (Obr.102), které je funčně velmi podobné Pol I (s vyjímkou např. nick translace) a které je v nativní podobě součástí komplikované struktury Pol III holoenzymu, skládajícího se nejméně z 10 podjednotek (Obr.103). Nejvýznamější součástí je tzv. β a λ podjednotka s vysoce organizovaným procesem sestavení na primerovaném templátu DNA (viz dále). β odjednotka vytváří prstenec, kterým prochází vlákno DNA - struktura známá jako pohyblivá β-svorka (Obr.104), která je schopna „popojíždět“ po templátovém vlákně DNA. Význam této funkce bude objasněn v dalším textu. Pol III holoenzym bakterie E. coli nemá schopnost rozvinout dsDNA, jako např. Pol I. Tuto roli přebírají u této bakterie tři speciální proteiny - DnaB protein ( produkt dnaB genu), Rep helikáza a tzv. SSB protein (single-strand binding protein), které společnou činností za spotřeby energie ve formě hydrolýzy ATP rozplétají dsDNA v replikační vidličce a připravují ji tak na replikaci. Charakteristické vlastnosti těchto proteinů jsou popsány na Obr.105. Enzymy, které poskytují přístup dsDNA k procesům replikace, transkripce atd. rozvolněním jejich struktury na dva ssDNA řetězce se obecně nazývají helikázy. Helikázy jsou velmi širokou a početnou skupinou enzymů, např. v E. Coli je známo celkem 12 různých helikáz. Helikázy pracují většinou tak, že postupují navázané na jednom vlákně DNA a před sebou rozplétají dsDNA za spotřeby NTP. Helikázy se zpravidla člení na několik typů např. podle morfologie (hexamer, dimer) či směru rozplétání (ve směru 3´-5´ či 5´-3´vázaného vlákna). DnaB protein E. coli patří mezi hexamerní helikázy, pohybující se po zpožďujícím se řetězci ve směru 5´-3´ za současné hydrolýzy ATP (Obr.106). Jiným příkladem je helikáza-primáza bakteriofága T7 (produkt genu 4) napadající E. coli (Obr.107 a 108), popř. Rep helikáza nebo PriA protein jiných bakteriofágů napadajících rovněž E.coli (Obr.109). Pokud by rozvinuté ssDNA vlákna v replikační vidličce byla ponechána bez další ochrany, došlo by k jejich zpětnému a rychlému spojení do dsDNA. Tomuto procesu zabraňují SSB proteiny. Rovněž zabraňují tvorbě nejrůznějších náhodných intramolekulárních sekundárních struktur ssDNA a chrání ji proti nukleázám. Jednotlivé SSB proteiny jsou na vlákně ssDNA nahloučeny jako korálky. Před replikací Pol III holoenzymem však musí být rychle odstraněny. Struktura SSB homotetrameru z E. coli je známa a je zobrazena na Obr.110. Jak již bylo popsáno, Pol I odstraňuje primery Okazakiho fragmentů a syntetizuje komplementární DNA procesem tzv. nick translace. Vznikají tak jednořetězcové niky
Strana 27
Studijní opory biologie
Malý J.:Molekulární biologie
(nespojitosti) mezi Okazakiho fragmenty, stejně jako nick na vedoucím řetězci po ukončení replikace cirkulární DNA, které jsou pospojovány tzv. DNA ligázou za využití energie ve formě ATP a NAD+ (Obr.111). DNA ligáza spojuje sousední nukleotidy vytvořením fosfodiesterové vazby mezi jejich 3´-OH a 5´-P volnými skupinami a za současného uvolnění AMP. Primázy bakterií a některých bakteriofágů sledují pohyb replikační vidličky v asociaci s některými proteiny DNA helikázy. Např. bakterie E.coli disponuje tzv. DnaG primázou (produkt genu dna G), která je v nativním stavu asociována s helikázou DnaB. Jelikož tato helikáza se pohybuje po zpožďujícím řetězci ve směru 5´-3´, musí se tato primáza pohybovat dočasně opačným směrem, aby byla schopná syntetizovat RNA primer pro Okazakiho fragment ve směru 5´-3´vznikajícího RNA primeru. Ačkoliv in vitro je DnaG primáza schopna syntetizovat primery až ze 60 nukleotidů, v in vivo procesu se jedná pouze o 11 nukleotidů, kdy vzhledem k rychlosti replikace dochází k syntéze cca 1 primeru za 1s. Struktura DnaG primázy byla získána teprve nedávno (Obr.112).
3.3.
Replikace prokaryot a bakteriofágů
Bakteriofágy jsou jedny z nejjednodušších nebuněčných organismů a způsob (tj. relativní jednoduchost) jejich replikace tento fakt do značné míry odráží. Řada poznatků o principech replikace byla získána studiem bakteriofágů. Nejběžněji studovanými fágy jsou kolifág M13 a φX174 (bakteriofág napadající bakterii E.coli). Nejvíce prostudovaným zástupcem replikace prokaryot je pak samotná bakterie E. coli. Bakteriofág M13 je tvořen 6408-bp cirkulární virovou (+) ssDNA (zanaménko plus značí, že DNA je zároveň templátem pro transkripci). Jakmile dojde k infekci E. coli, dojde k sysntéze komplementárního (-) vlákna DNA a vytváří se cirkulární duplex, tzv. replikativní forma (RF), která může být jak přerušena nickem (relaxována) (RF II) či se nachází v nadšroubovicové formě (RF I). Jakmile M13 (+) ssDNA pronikne do bakterie, je stabilizována pomocí SSB proteinů vyjma krátké sekvence 57 nukleotidů, které vytváří vlásenku na základě intermolekulární komplementarity, tj. palindromatických sekvencí (Obr.113). RNA primáza syntetizuje RNA primer 6 nukleotidů před počátkem vlásenky a vzniká DNA-RNA heterodimer procházející dalších 20 až 30 nukleotidů do samotné vlásenky. Pol III holoenzym pak syntetizuje (-) DNA. Primer je odstraněn činností Pol I, tj. nick translací. Vzniká RF II, která je transformována do RF I činností gyrázy a DNA ligázy. Bakteriofág φX174 je tvořen obdobně jako M13 jednořetězcovou cirkulární DNA. In vivo konverze tohoto bakteriofága je však daleko komplikovanější než v případě M13, Strana 28
Studijní opory biologie
Malý J.:Molekulární biologie
především účastí proteinu tzv. primosomu (Obr.114). Syntéza komplementárního (-) řetězce probíhá celkem v 6 fázích a je modelem pro objasnění syntézy zpožďujícího se řetězce (lagging strand) (Obr.115). (1) Reakce začíná obdobně jako u M13, tj. (+) ssDNA vlákno je po infekci obaleno SSB proteiny, mimo 44 bp vlásenku. Sekvence vlásenky je známa jako tzv. místo pas (primosome assembly site), které je rozpoznáno podjednotkami primosomu PriA, PriB a PriC. (2) Na sestavené proteiny v míst pas se váží proteiny DnaB a DnaC s pomocí proteinu DnaT přičemž po spotřebě ATP a uvolnění DnaC vzniká tzv. preprimosom. Ten váže primázu a vzniká vlastní primosom. (3) Primosom se pohybuje ve směru 5´-3´ (+) řetězce a vytěsňuje SSB proteiny za spotřeby ATP (obrácený směr pohybu než směr čtení templátu). (4) V náhodných místech dojde k zpětnému pohybu primosomu po (+) vlákně, přičemž primáza syntetizuje RNA primer. (5) Pol III holoenzym prodlužuje primery do formy Okazakiho fragmentů. (6) Pol I vyštěpí primery a nahradí je DNA. Fragmenty jsou pospojovány pomocí DNA ligázy a činností DNA gyrázy je na něj zavedená superhelicita. Primosom nadále zůstává spojen s dsDNA a podílý se na syntéze nových (+) ssDNA (replikaci viru). Syntéza (+) ssDNA vlákna slouží jako model pro replikaci vedoucího řetězce (leading strand). Jedno vlákno cirkulární dsDNA může být kopírováno systémem tzv. valivé kružnice (nebo tzv. σ-replikace, v důsledku podobnosti replikační struktury řeckému písmenu sigma) (Obr.116). Pozitivní (+) ssDNA bakteriofága φX174 je kopírováno modifikací tohoto mechanismu, tzv. loop mechanismem (loop mód valivé kružnice) z RF I templátu (Obr.117). Celý proces se dá popsat 4 kroky. (1) (+) dsDNA vlákno s navázaným primosomem je svázáno s proteinem genu A, který specificky rozštěpí (+) vlákno a kovalentně se naváže na 5´-P skupinu DNA řetězce. (2) Rep helikáza se přiloží k (-) řetězci v místě navázaného proteinu genu A s pomocí stále navázaného primosomu rozplétá dsDNA od 5´-konce (+) řetězce. Vytěsněný (+) řetězec je dále obalen SSB proteiny a stabilizován. Pol III holoenzym syntetizuje (+) řetězec dle (-) templátu. (3) V průběhu syntézy narůstá (+) řetězec loop (smyčka) procesem, přičemž druhý konec je neustále spojen s proteinem genu A. (4) Po ukončení jednoho cyklu je (+) řetězec uvolněn a celý cyklus se může opakovat. Tento proces se vyskytuje v pozdních stádiích infekce, kde vznikající (+) vlákna jsou zabalena do fágových hlav. Bakterie E. coli replikuje svůj chromozóm pomocí dvousměrného theta θ intermediátu, který vzniká v jednom místě na chromozómu, tzv. replikačním počátku. Většina modelů popisujících replikaci této bakterie byla vytvořena na základě jednodušších modelů, jako jsou kolifágy M13 a φX174. Schéma replikace je na Obr.118. DnaB helikáza rozplétá
Strana 29
Studijní opory biologie
Malý J.:Molekulární biologie
dsDNA, přčemž vznikající ssDNA řetězce jsou ihned obaleny SSB proteiny. Syntéza vedoucího řetězce je zajištěna Pol III holoenzymem, přičemž primer je syntetizován primázou primosomu. Stejná primáza syntetizuje i
RNA primery Okazakiho fragmentů. Syntéza
vedoucího i váznoucího řetězce je zajištena tzv. replisomem, tj. složitým komplexem skládajícím se z podjednotek – dvou jader Pol III (podjednotky αεθ), které jsou spojené skrze podjednotky τ. Zpožďující řetězec tedy vytváří smyčku. Jakmile je dokončena syntéza jednoho Okazakiho fragmentu, holoenzym Pol III zpožďujícího se řetězce se přesouvá do místa v replikační vidličce, kde vznikl nový primer pro následující Okazakiho fragment. Primery Okazakiho fragmentů jsou nahrazeny DNA pomocí Pol I katalyzované nick translace a následně jsou jednotlivé fragmenty spojeny DNA ligázou. Replikační počátek chromozómu E.coli tvoří unikátní 245-bp segment, známý jako tzv. oriC místo (lokus). Tato sekvence je velmi konzervativní mezi gram-negativními bakteriemi. Proces iniciace je zahájen vazbou DnaA proteinů, které rozpoznají specifické sekvence na oriC, tzv. DnaA boxy (obsahují vysoce konservovanou sekvenci 5´TTATCCACA-3´) přičemž jejich vazbou vzniká negativní závit na oriC a stočení dsDNA kolem přítomných pěti DnaA proteinů (Obr.119). Tento ohyb dsDNA je zesílen vazbou DNA vázajících proteinů – tzv. HU proteinu a IHF (integration host factor). Tento ohyb způsobí rozštěpení dsDNA v místě specifické 13-bp sekvence oriC, která je bohatá na AT. Vazbou DnaB proteinů na odhalené ssDNA vzniká tzv. preprimerový komplex. V přítomnosti SSB proteinů, DNA gyrázy a DnaB helikázy dochází k dalšímu rozšiřování preprimerového komplexu tak, že se umožní vznik replikačních vidliček se sestavenou primázou a RNA polymerázou. Replikace chromozómu E. coli se vyskytuje vždy jen jednou na jedno dělení buňky, tzn. že tento proces musí být striktně kontrolován. Doba zdvojení E. coli je v závislosti na vnějších podmínkách od 20 min do 10 hodin (37°C, dostatek substrátu). Porovnání rychlosti replikace (1000 n/s) a velikosti genomu bakterie (4.6 × 106 bp) poskytuje replikační čas (tj. doba zdvojení chromozómu) ≈ 40 min. Z porovnání doby zdvojení a replikačního času plyne logický závěr, že buňka musí zahájit replikaci jěště před ukončením předchozího cyklu dělení. Výsledkem je chromozóm s více replikačními vidličkami, které zaručují vznik nové kopie chromozómu vždy těsně před následujícím buněčným dělením (Obr.120). Ačkoliv každý chromozóm tak obsahuje více oriC počátků, přesto v rámci jedné generace buňky dochází k zahájení vždy jen jedné replikace. Chromozomy jsou separovány do dceřinných buněk vazbou na membránu bakterie. Přednostně se na membránu vážou tzv. hemimethylované
Strana 30
Studijní opory biologie
Malý J.:Molekulární biologie
oriC. OriC přitom obsahuje methylační sekvence GATC přístupné pro tzv. Dam methyltransferázu, která methyluje A v této sekvenci. U čerstvě zreplikovaných dsDNA je jeden A v sekvenci GATC v oriC nemetylován, tj. vlákno je tzv. hemimethylované. Právě vazba těchto hemimethylovaných oriC na membránu zabraňuje iniciaci další replikace a zároveň garantuje rozchod čerstvě zreplikovaných chromozómů do dceřinných bakterií. Vazba chromozómu na membránu je zprotředkována proteinem SeqA, produktem tzv. seqA genu. Replikace je ukončena v místě, které se označuje jako tzv. terminus. Jedná se o nepalindromické 23-bp sekvence, které se označují jako TerE, TerD a TerA na jedné straně a TerG, TerF, Ter B a TerC (Obr.121). Replikační vidlička směřující proti směru hodinových ručiček a vznikající v oriC na opačném pólu chromozómu se zastavuje přednostně na TerA, popř. na TerD a TerE (nejspíše zálohují TerA). Druhá replikační vidlička se naopak zastavuje na TerC, popř. na TerB. Tento systém zaručuje setkání obou replikačních vidliček v jednom místě na chromozómu. Zastavení vidličky v místě terminus je umožněné díky speciálnímu proteinu Tus (produkt genu tus), který zabraňuje DnaB helikáze rozplétat vlákno dsDNA.
3.4.
Replikace eukaryotního chromozómu
Replikace eukaryotního chromozómu je v řadě aspektů velmi podobná relikaci prokaryot. Přesto existují zásadní rozdíly, které jsou podmíněny zejména vysokou komplexitou eukaryot v porovnání s prokaryoty. Například eukaryotní chromozóm je složitý organizovaný komplex dsDNA a proteinů, a replikační mechanismy musí tedy být s těmito komplexy synchronizovány. Buněčný cyklus eukaryotní buňky je členěn na čtyři odlišné fáze (Obr.122). (1) mitóza a dělení buňky se objevují v relativně krátké M fázi. (2) G1 fáze (gap phase) patří mezi nejdelší fáze buněčného cyklu. Jedná se o hlavní období buněčného růstu. (3) S fáze (synthesis) je jedinnou fází, kde dochází k syntéze (replikaci) DNA. (4) G2 fáze, která je poměrně krátká a charakterizuje přípravu buňky k mitóze. Buněčný cyklus buněk v in vitro kulturách se pohybuje okolo 24 h na 1 dělení, v nativních podmínkách v rozsahu cca 8h až více jak 100 dní. Některé buňky (např. neurony) se nedělí vůbec a zůstavají tak v tzv G0 fázi. Rozhodnutí buňky k dělení je učiněno v G1 fázi v důsledku řady faktorů, včetně patogenních (karcinogenní látky či nádorové viry navozující nekontrolovatelné dělení, ravinové bujení). Ve zdravé buňce je přechod buňky mezi jednotlivými fázemi je regulován proteiny, tzv. cykliny a cyklin-dependentními protein kinázami (Cdks). Cykliny jsou vždy tvořeny v průběhu jedné fáze buněčného cyklu ale kompletně degradovány v následující fázi. Cykliny aktivují příslušné Cdks (vážou se na ně), které aktivují cílové proteiny jejich fosforylací. Tyto Strana 31
Studijní opory biologie
Malý J.:Molekulární biologie
proteiny zaručují nezbytné funkce buňky v daném fázi buněčného cyklu. Aby bylo možné přejít z jedné fáze do druhé, musí buňka splnit určité kontrolní body (např. vznik mitotického vřeténka musí předcházet mitóze atd.). Pokud tyto body nejsou splněny, buňka setrvává v jedné fázi, nebo se přechod do další fáze výrazně zpožďuje. Naprostá většina poznatků o eukaryontní DNA replikaci byla získána studiem kvasinek (Saccharomyces cerevisiae), viru SV40 a metazoí jako je Drosophila a Xenopus laevis. Eukaryotní buňky obsahují celou řadu DNA polymeráz, které mohou být rozděleny do 6 rodin na základě jejich fylogenetické příbuznosti: rodina A (příbuzná Pol I), rodina B (příbuzná Pol II), rodina C (příbuzná Pol III) a rodiny D,X, a Y. Buňky živočichů obsahují 4 DNAP, které se účastí replikace. Jedná se o polymerázy označené jako (Pol) α, γ, δ a ε popř. jako POL A, POL G, POL D1, POL E (Obr.122). Pol α se nachází v jádře buňky a podílí se na replikaci chromozomální DNA. Lze ji specificky inhibovat aphidicolinem (Obr.123). Obdobně jako jiné DNAP i tato syntetizuje nové vlákno DNA dle ssDNA templátu ve směru 5´-3´ templátu. Nemá exonukleázovu aktivitu, avšak je velmi těsně asociován s primázou a vytváří tak protein, nazvaný pol α/primáza. Struktura tohoto typu DNAP byla získána studiem DNAP bakteriofága RB69 (Obr.124).
Pol δ je opět jaderná DNAP, která však nemá
primázovou aktivitu a projevuje korekturní 3´-5´ exonukleázovou aktivitu. Tato DNAP je schopná replikovat templát jakékoliv délky, pokud je v komplexu s proteinem, který se nazývá proliferační buněčný nukleární antigen (PCNA). Ten funguje pravděpodobně stejně jako tzv. β-svorka u DNAP E. coli (Obr.125). Pol ε je velmi podobná Pol δ, avšak je charakterizována velkou procesivitou i bez navázaného proteinu PCNA. Pol γ se nachází výhradně v mitochodriích a replikuje tedy mitochondriální DNA. Obdobná DNAP je přítomná i v chloroplastech. Mimo tyto základní typy DNAP existují další, které se však účastní spíše reparačních mechanismů (POL B, POL H, POL I atd.). Eukaryotní a prokaryotní DNA replikační systémy se liší především ve faktu, že eukaryotní chromozóm obsahuje celou řadu replikačních počátků, na rozdíl od bakteriálního chromozómu, který obsahuje pouze jeden (Obr.126). Replikace eukarytního chromozómu je také daleko pomalejší, tj. okolo 50 nukleotidů za 1s (oproto 1000 nukleotidů u bakterií). Pokud by tedy byl přítomen pouze 1 replikační počátek, replikace chromozómu by trvala řadu týdnů. Proto se tyto počátky vyskytují hojně na přibližně každých 300 kb úseku dsDNA. Replikace se tak zkrátí na potřebnou hodnotu do několika málo hodin. Úsek DNA, která se replikuje z jednoho počátku, se nazývá replikon. Zpravidla dochází k aktivaci a současné
Strana 32
Studijní opory biologie
Malý J.:Molekulární biologie
syntéze klastrů až 80 replikonů v S fázi. Nově nasyntetizovaná DNA je buňkou rozpoznána a není tedy možné provést v jednom buněčném cyklu více replikací stejného replikonu. Sestavení replikačního komplexu na replikačním počátku chromozómu eukaryot se odehrává ve dvou fázích. V první fázi dochází k sestavení tzv. pre-replikativního komplexu (pre-RC) v každém replikačním počátku v průběhu G1 fáze. Jedná se o tzv. licenční proces, neboť pouze v této fázi cyklu může pre-RC komplex vzniknout. Vznik pre-RC komplexu je nutnou podmínkou k replikaci replikonu, avšak nikoliv podmínkou postačující. K tomu aby došlo k replikaci, musí být tento komplex aktivován v S fázi buněčného cyklu. Tímto způsobem je vyloučena další iniciace replikace na nově vzniklém dsDNA vlákně v S-fázi a tím i jedna kopie každého replikonu v jednom buněčném cyklu. Výzkum licenčního procesu je teprve v počátcích. Sestavení pre-RC komplexu je zahájeno v pozdní M či na počátku G1 fáze cyklu vazbou tzv. komplexu rozpoznávající replikační počátek (ORC, origin recognition complex) (Obr.127), hexameru který se skládá z podjednotek Orc1-Orc6 do počátku replikace. ORC je funkční analog DnaA proteinu E.coli a ve spolupráci s dalšími proteiny (Cdc6-18) umožňuje vazbu tzv. MCM komplexu, který zakončuje vznik licencovaného preRC komplexu. MCM komplex je ATP helikázou obdobnou DnaB helikáze E. coli. V S-fázi dochází ke konverzi pre-RC licencovaného komplexu na iniciační replikační komplex vazbou pol α/primázy, pol ε, replikačního proteinu A (obdoba SSB proteinů E. coli) a několika dalších proteinových podjednotek. Po zahájení replikace dochází k syntéze nových dsDNA v replikačních vidličkách (dvě na jedno replikační očko) dokud se replikační vidličky sousedních replikonů na chromozómu nesetkají. Eukaryota neobsahují terminační místa replikace jako bakteriální chromozóm. Dalším ze způsobů, kterým se zabraňuje dvojí replikaci téhož replikonu v jednom buněčném cyklu je aktivita cyklin dependentních kináz (Cdks), princip této regulace však ještě není dostatečně znám. Buňky, které se nedělí, tj. setrvávají v tzv. Go fázi cyklu nemají aktivní Cdk a neobsahují MCM komplex. Z tohoto důvodu nejsou schopny sestavit pre-RC komplex. Nádorové buňky, které jsou charakterizované rychlým a nekotrolovatelným dělením buněk obsahují velké množství MCM komplexu. Z toho důvodu je tedy MCM komplex důležitým potenciálním diagnostickým markerem nádorového onemocnění. RNA primery eukaryotních Okazakiho fragmentů jsou odstraněny enzymem RNázou H1, která ponechává pouze 5´ribonukleotid – ten je následně odstraněn tzv. flap endonukleázou-1 (FEN1). Mitochondriální DNA je replikována pomocí tzv. D-loop mechanismu (D-loop displacement mechanism) (Obr.128). Vedoucí řetězec vytěsňuje v průběhu syntézy váznoucí řetězec formou tzv. D-smyčky. D-smyčka je přechodná trojřetězcová struktura DNA, která se Strana 33
Studijní opory biologie
Malý J.:Molekulární biologie
v mitochondriálním cirkulárním chromozómu vyskytuje jako nestálý, 500-600 nukleotidů dlouhý úsek. V průběhu replikace se tato smyčka prodlužuje. Jakmile dosáhne přibližně dvou třetin délky obvodu kruhu chromozómu, odhalí se replikační počátek pro váznoucí řetězec a je započatá syntéza jeho komplementárního vlákna, avšak v obráceném směru. Váznoucí řetězec je tedy nasyntetizován pouze z jedné třetiny, v okamžiku, kdy syntéza vedoucího řetězce je ukončena. Retroviry, které patří mezi RNA eukaryotní viry a jsou často odpovědné za virově aktivované nádorové změny buněk či za onemocnění, jakým je syndrom získaného selhání imunity (onemocnění AIDS, původce HIV, human immunodeficiency virus) obsahují speciální DNAP, tzv. RNA dependentní DNA polymerázu (nebo také reverzní transkriptázu, RT). Tento enzym byl objeven v roce 1970 H.Teminem a D. Baltimorem a popsán jako enzym, který syntetizuje DNA ve směru 5´-3´ primerovaného templátu. Templátem ale není DNA, nýbrž RNA. Reverzní transkriptáza přepisuje RNA genom retroviru do dsDNA v několika fázích (Obr.129). (1) Retrovirová RNA slouží jako templát pro syntézu komplementárního vlákna DNA (pomocí RT) za vzniku RNA-DNA hybridního helixu. DNA syntéze je primerována tRNA hostující buňky, resp. jejím částečně rozpleteným 3´-koncem. (2) RNA vlákno hybridu RNA-DNA je odstraněno pomocí aktivity enzymu RNázy H. (3) vzniklé ssDNA vlákno je templátem pro syntézu komplementárního vlákna DNA a vzniku dsDNA. Následně je dsDNA integrována do hostujícího genomu. RT je využívána v genovém inženýrství,
neboť
je
schopná
transkribovat
mRNA
izolované
z organismu
do
komplementární DNA (tzv. copy DNA, tj. cDNA). Vzniklou genomovou knihovnu (soubor cDNA) je možné využít např. k identifikaci genu zodpovědného za kódování příslušné mRNA, popř. k sekvencování jejich struktury. Struktura modelové RT, reprezentované HIV1 reverzní transkriptázou byla stanovena teprve nedávno (Obr.130). Jedná se o dimerní protein skládající se z podjednotek p66 a p51 (dle velikosti v kD). Na základě znalosti prostorového uspořádání těchto podjednotek byly připraveny inhibitory HIV-1 RT, které jsou využity k léčbě AIDS (Obr.131). Problémem, který se vyskytuje u lineárních řetězců dsDNA a tedy i u chromozómů eukaryot je především nebezpečí zkracování konců jako důsledek replikace. Tento problém je způsoben faktem, že RNA primer na 5´-konci templátové DNA váznoucího řetězce nemůže být nahrazen DNA (primer na dosyntetizování tohoto konce by se neměl na čem uchytit). Z tohoto důvodu existuje speciální mechanismus, který mi jsou konce lineárních chromozómů eukaryot, tj. telomery replikovány. Telomery DNA mají neobvyklé sekvence. Ta se skládá z mnohatisíců tandemových opakování jednoduché, na G bohaté a druhově odlišné sekvence Strana 34
Studijní opory biologie
Malý J.:Molekulární biologie
nukleotidů (obratlovci TTAGGG), ukončující každý 3´-konec chromozómu. Telomery jsou syntetizovány jiným mechanismem, než zbylá dsDNA. Za syntézu jsou odpovědné speciální enzymy, tzv. telomerázy, která nezávisle na povaze templátu neustále přidávají tandemové sekvence na 3´-konec telomerního oligonukleotidu. Tato syntéza je umožněna faktem, že telomerázy jsou ribonukleoproteiny, které obsahují ve své RNA složce komponenty s komplementárními úseky k opakující se telomerické sekvenci. Tato sekvence tedy působí jako templát pro syntézu telomér principem reverzní transkripce, tj. dosyntetizováním telomér ve formě ssDNA (Obr.132). Bez existence telomeráz by docházelo ke zkrácení 3´-konců chromozómu o 50-100 bazí na jeden replikační cyklus. Navíc, volné 3´-konce ve formě ssDNA by mohly být přístupné k exonukleázám a mohly by být jednoduše degradovány. Aby ted tento mechanismus splňoval svou funkci, musí být telomery chráněny před jejich aktivitou pomocí tzv. čepičky (Obr.133). Čepička je tvořena telomerní DNA ve vazbě na speciální proteiny. Telomerázy mohou vytvářet cyklický tetramer, tzv. G-kvartet. Na tuto strukturu se váží proteiny, které vytváří čepičku, jako je např. TRF1 a TRF2 savců (telomere repeat binding factor). Ze studií telomér savců byla potvrzena existence tzv. T-smyček (T-loops) – dimerních forem telomér s navázaným proteinem TRF2 (Obr.134). V případě neexistence čepičky, popř. ztrátě funkce telomerázy dochází po několika generacích dělení buněk k jejich smrti v důsledku postupné eliminace telomeráz. Telomerázy se tedy podílí na procesech stárnutí buňky a mnohobuněčných organismů. Např. somatické buňky izolované z mnohobuněčných organismů zpravidla neobsahují aktivní telomerázu a v in vitro kulturách přežívají pouze 20-60 dělení. Vztah mezi délkou telomér a počtem dělení buněk v těchto kulturách byl jednoznačně potvrzen. Jedním z důvodů stárnutí buněk (zkracovní telomér) může být ochrana organismu před nádorovným bujením. Rakovinové buňky jsou charakteristické nekontrolovatelným dělením a ve své podstatě neomezeným počtem buněčných generací. Smrtelnost běžných buněk je způsobena neaktivní telomerázou. Pokud by telomeráza zůstávala aktivní i u somatických buněk, výrazně se zvyšuje riziko jejich maligní transformace, tj. ztráty kontroly nad činností telomerázy a tím i zajištění podmínky nekontrolovaného dělení. Z tohoto důvodu se jako potenciální protinádorové léky mohou uplatnit inhibitory telomeráz.
Strana 35
Studijní opory biologie
4.
Malý J.:Molekulární biologie
REPARACE DNA
DNA v organismu není neměná, rigidní struktura. V prostředí buňky musí čelit řadě negativních vlivů (chemické látky, záření, působení enzymů), které mohou vést k jejímu poškození jako je např. chemická modifikace bazí či cukerné kostry, pořípadě přerušení řetězce (např. v lidské buňce dojde denně k ≈ 10 tis. přerušení glykosidických vazeb v DNA) Tyto poškození musí být opraveny (reparovány), tak aby genetická informace zanesená v genomu nebyla poškozena a byla tak zajištena její neměnnost (integrita). Tato oprava je možná z toho důvodu, že informace o pořadí nukleotidů je kódována dvěma rětězci dsDNA, tj. pokud dojde k porušení jednoho z řetězců, může být informace obnovena na základě řetězce komplementárního. Důležitost reparace DNA je potvrzena existencí více jako 300 genů, kódující v lidském genomu proteiny účatnící se reparačních pochodů. Podstata těctho podchodů je přitom velmi podobná s pochody, které jsou zdokumentovány pro bakterii E.coli.
4.1.
Přímá oprava poškození nukleotidů
UV záření o vlnové délce v rozsahu 200-300 nm způsobuje kovalentní vazbu mezi dvěma v řetězci sousedícími thyminy, tj. vznik tzv. thyminových dimerů (Obr.135). Obdobně mohou vznikat i vazby mezi thyminem-cytosinem popř. mezi dvěma cytosiny. Tyto pyrimidinové dimery způsobují lokální deformaci dsDNA, která zabraňuje replikaci a transkripci řetězce DNA.
Reparace
pyrimidinových
dimerů
je
umožněna
existencí
enzymů,
tzv.
fotoreaktivačních enzymů, jako je DNA fotolyáza (přítomná jak v prokaryotech tak i eukarytech). Tento enzym se váže ve tmě ve formě dimeru (55 a 65 kD) na pyrimidinový dimer. Chromofore, nejčastěji tzv. MTHF nebo 5-deazaflavin (Obr.136) absorbuje v oblasti 300-500 nm a přenáší excitační energii na FADH-, který redukuje thyminový dimer a způsobí jeho reparaci na dva nesvázané thyminy (Obr.137). Chemické látky, tzv. alkylační činidla (např. tzv. NMNG – viz Obr.138) mají schopnost alkylovat (přenášet alkylovou skupinu) dusíkaté báze (např. guanin za vzniku O6alkylguaninu). Tyto chemické změny jsou velmi mutagenní, neboť vnášejí při replikaci do vznikajícího řetězce špatné báze v důsledku nesprávného párování (např. thymin místo cytozinu). Příkladem enzymu, který umí odstranit tyto alkylované báze je vzniku O6alkylguanin-DNA-alkyltransferáza, která je však po této reakci sama zničena a není tedy klasickým enzymem. Tento protein se v případě bakterie E.Coli nazývá Ada protein. Struktura Ada proteinu byla analyzována s atomárním rozlišením (Obr.139).
Strana 36
Studijní opory biologie
4.2.
Malý J.:Molekulární biologie
Excisní reparace
Existují dva typy této reparace: (1) tzv. nukleotidová excizní reparace (NER), která reparuje poměrně větší poškození DNA a (2) tzv. excisní reparace bazí (BER), reparující malá poškození včetně jednoduchých bazí. NER je typ reparace, který se nachází u všech organismů, které eliminují poškození dsDNA vystřižením celých poškozených úseků (oligonukleotidů) a následným nahrazením novou DNA. Tento systém je zpravidla aktivován v místě, kdy dochází k porušení struktury helixu v důsledku přítomnosti nesprávných či modifikovaných nukleotidů (bazí) (Obr.140). U člověka je tento způsob reparace hlavním mechanismem, jak dochází k boji proti karcinogenům, nadměrnému UV ozáření a toxickému působení cigaretového kouře. NER systémy prokaryot a eukaryot si jsou velmi podobné (až na počet podjednotek enzymu tj. 3 u prokaryot a 6 u eukaryot), avšak pravděpodobně vznikly konvergentní evolucí. U E.coli se jedná o ATP dependentní proces, na němž se podílí podjednotky UvrA, UvrB a UvrC. Celý tento systém se nazývá UvrABC endonukleáza. Ta štěpí 4. a 7. fosfodiesterovou vazbu na 5´a 3´konci od místa poškození DNA. Do vzniklé ssDNA je navázána UvrD známá také jako tzv helikáza II a komplementární vlákno je nasyntetizováno činností enzymu Pol I a spojeno DNA ligázou. Geneticky kódovaná porucha obdobného reparačního systému u člověka způsobuje velmi závažné onemocnění, nazývané xeroderma pigmentosum, charakterizovaná extrémní citlivostí na světelné záření a brzkým vývoje rozsáhlé rakoviny pokožky. Obdobné onemocnění, které však nezpůsobuje rakovinové bujení je tzv. Cockayneův syndrom (CS). Báze nukleových kyselin jsou často modifikovány reakcemi, které probíhají za normálních fyziologických podmínek, ale i skrze nejrůznější toxické působení polutantů. Vznikají tak modifikované báze jako je např. 7-methylguanin, 3-methyladenin atd. Ionizující záření může způsobit otevření heterocyklů bazí. Tyto změny mohou způsobit změnu párování bazí. BER mechanismus napomáhá tyto pozměněné báze odstranit. Buňky obsahují řadu tzv. DNA glykosiláz, které mají schopnost rozpoznat specificky modifikovanou bázi a rozštěpit glykosidickou vazbu bezi bazí a cukrem a ponechat tak pouze cukernou část nukleotidu v řetězci DNA (Obr.141). V následném kroku je tzv. bezbázové místo (apurinic nebo apyrimidinic site, AP-site) odstraněno naštěpením AP endonukleázou a nahrazeno pomocí DNAP a DNA ligázy správným nukleotidem. I přes znalost faktu, že uracil zastupuje v RNA thymin, nebyl tento fakt dlouhou dobu uspokojivě objasněn. Teprve s výzkumem reparací bylo zjištěno, že tento fakt je esenciální pro správné uchování genetické informace. V normálních fyziologických podmínkách může Strana 37
Studijní opory biologie
Malý J.:Molekulární biologie
totiž docházet k deaminačnímu procesu, kdy báze cytosin je konvertována na uracil. Pokud by uracil byl normální součástí DNA, nebylo by možné rozhodnout, zda daný uracil je správný, či vznikl z cytozinu touto reakcí. Nutně by to znamenalo postupnou ztrátu informace uložené v DNA. Pokud se tedy U vyskytne v DNA, pak nutně vznikl deaminací cytosinu a musí být odstraněn. Tuto funkci zastávají enzymy, které se nazývají uracil-DNA glykosylázy (UDG). Tyto enzymy pracují mechanismem BER, tedy obdobně, jako bylo zmíněno výše.
4.3.
Mismatch reparace
Jakákoliv chyba párování, která není opravena v průběhu replikace (tj. editační aktivitou DNAP) může být opravena pomocí mechaismu tzv. mismatch reparace (MMR – mismatch repair). Např. chyba replikace Pol I a Pol III u E. coli se pohybuje v rozsahu 10-7 do 10-6 na jednu bázi. Navíc, MMR systém umí opravit úseky, které mohou vznikat tzv. sklouznutím DNAP (slippage mechanismus), tj. nespárované úseky až 4 nukleotidů. Důležitost tohoto reparačního mechanismu vyplývá i z faktu, že defekt v lidském MMR systému způsobuje vyskou incidenci rakovin, především tzv. dědičné nonpolypózní kolorektální rakoviny (HNPCC). Aby MMR systém mohl rozlišit, které z vláken dsDNA je správné, musí existovat systém, který určí správné, tedy templátové vlákno. Např. u E.coli je tento systém tvořen tzv. DAM methylázou, která methyluje sekvenci GATC u nově vzniklých vláken avšak s určitou časovou prodlevou. Vlákno, které je dceřiné zůstává tedy po určitou dobu nemethylováno. Tato doba je dostatečná k tomu, aby byly odhaleny nespárované úseky a opraveny MMR systémem. MMR systém byl nejlépe prostudován opět na bakterii E.coli (Obr.142). Protein MutS se váže ve formě homodimeru na nespárovanou bázi. MutS-DNA komplex váže homodimer MutL. MutS-MutL komplex vytváří na dsDNA smyčku za spotřeby ATP. Za pomocí MutH je rozpoznáno nemethylované vlákno DNA a rozstřiženo endonukleázou na 5´konci nemetylované sekvence GATC. Tato sekvence může být až 1000 bazí vzdálená od místa nespárovaných bazí. Po vzniku nicku (nastřižení) odstraní exonukleáza ve spojení s proteinem UvrD (helikáza) nastřižené vlákno až po 3´-konec nespárovné sekvence. Odstraněné vlákno je znovu syntetizováno dle templátové methylované DNA Pol III a spojeno pomocí DNA ligázy.
MMR systém eukaryot je mnohem komplikovanější než
popsaný systém, především z ohledu na počet zůčastněných proteinů.
4.4.
SOS odpověď
Fyzikálně-chemické vlivy (alkylační činidla, UV záření, zesíťovací činidla atd), které v buňkách vyvolávají modifikace DNA, způsobují v buňkách bakterie E.coli řadu procesů, Strana 38
Studijní opory biologie
Malý J.:Molekulární biologie
které jsou známy jako tzv. SOS odpověď. V tomto stavu se bakterie přestane dělit a spustí se řada reparačních mechanismů. Podstatou této reakce buněk je dána funkcí tzv. proteinu RecA, který se za normálních podmínkách podílí na procesech rekombinace DNA. V případě zvýšené dávky výše zmíněných stresorů, které modifikují či poškozují DNA, způsobuje tento protein rozštěpení specifické sekvence proteinu LexA. Tento krok je zahájen vazbou RecA na ssDNA, která se v případě poškození DNA může v buňce objevit. LexA je represorem 43 genů, které kódují proteiny důležité pro reparační mechanismy DNA a kontrolují dělení buňky. Všechty tyto geny obsahují tzv. SOS box, 20 nukleotidovou sekvenci bazí, která funguje jako operátor (tj. váže represor a blokuje/zahajuje transkripci) (Obr.143). LexA tedy za normálních okolností inhibuje expresi SOS genů vazbou na SOS box a inhibicí činnosti RNAP. Jakmile se však v buňce objeví ssDNA zlomy, dojde k vyvázání a aktivaci proteinu RecA, který aktivuje rozštěpení a tím i deaktivaci proteinu LexA. Dodjde tak k uvolnění operátorů a zahájení transkripce SOS genů. Po reparaci poškozené DNA činností SOS proteinů RecA přestane navozovat lýzy LexA, ten nasedne a blokuje SOS box a celý proces se může opakovat.
4.5.
Reparace dvojřetězcových zlomů (double strand breaks repair, DSB repair)
Dvojřetezcové zlomy DNA (DSB) vznikají expozicí DNA ionizujícímu záření a volnými radikály, které vznikají jako vedlejší produkt metabolismu buňky.
Navíc, DSB jsou
normálními intermediáty DNA v přirozených procesech, jako je meióza a tzv. V(D)J rekombinace v lymfatických buňkách, která napomáhá vytvářet rozsáhlou diverzitu antigenvázajících míst protilátek a receptorů T-buněk. Neopravené DSB mohou být pro buňku letální, či mohou způsobovat vznik rakoviny. Z tohoto důvodu jsou opravné mechanismy DSB
esenciální
pro
život
buňky.
Buňky
mají
ve
své
podstatě
dvě
odlišné
strategie/mechanismy reparace DSB. Tzv. rekombinační reparace a tzv. non-homologní rekombinace konců (NHEJ – nonhomologous end-joining repair). Homologní rekombinace je diskutována v samostatné kapitole. V případě NHEJ mechanismu se jedná o způsob ligace DSB, ve kterém musí být nejdříve konce přerušené DNA nalezeny, jejich konce nastaveny do správné, tj. komplementární polohy, či zanořeny do sebe tak, aby byly nalezeny komplementární sekvence a následně musí dojít k ligaci (Obr.144). U eukaryot je celý proces zahájen pomocí proteinu Ku, který se nachází v buňce v hojném množství a má schopnost vazby do místa DSB na poškozené DNA (Obr.155). Komplex Ku-DNA má schopnost
Strana 39
Studijní opory biologie
Malý J.:Molekulární biologie
dimerizace, tj. spojení obou konců DSB. Toto spojení poskytuje možnost opětovného spojení řetězců díky činnosti DNA ligázy IV a proteinu Xrcc4.
4.6.
Identifikace karcinogenních látek
Řada forem rakoviny je způsobena expozicí organismů skupině látek, která je známa pod názvem karcinogeny. Odhaduje se, že přibližně 80% forem lidské rakoviny je způsobeno právě těmito látkami. Existuje řada důkazů, že primárním účinkem těchto látek je poškození DNA. U bakterií tyto látky velmi často způsobují navození SOS reakce a vznik mutací. Existuje velmi úzká souvislost mezi mutagenezí a karcinogenezí. V současnosti je známo více jak 60 tisíc chemických látek, které se využívají v průmyslu. Jelikož není technicky možné toto množství látek prozkoumat na mutagenní a karcinogenní účinky standardními metodikami, jako je např. testování na zvířatech, využívají se často testy na mutagenní účinky pomocí jednodušších organismů, jako je bakterie Salmonella typhimurium. Z míry mutagenních účinků je pak odhadnuta i míra potenciálních karcinogenních účinků, které se u dané látky mohou objevit. Nejběžnejší je tzv. Amesův test, kdy tato bakterie, která je tzv. his-, tj. nemá schopnost syntézy histidinu a nemůže tedy růst na médiu bez přítomnosti histidinu, je kultivována v přítomnosti potenciálního mutagenu. Pokud daná látka projevuje mutagenní účinky, dochází k změně bakterií z his- na his+ a tím i schopnosti těchto buněk růst na médiu bez dodaného histidinu. Množství revertantů, tj. množství narostlých kolonií na petriho misce v porovnání s množstvím spontánních revertantů poskytuje informaci o míře mutagenicity stanovené látky (Obr.155). Řada látek, u kterých byla pomocí Amesova testu identifikována vysoká mutageneze, byla později ověřena i pro vysoké karcinogenní účinky na testech se zvířaty. Patří sem nejen látky, které jsou synteticky připravené, ale i řada velmi nebezpečných přírodních látek, jako je např. aflatoxin a celá řada dalších mykotoxinů (Obr.166).
Strana 40
Studijní opory biologie
5.
Malý J.:Molekulární biologie
TRANSKRIPCE
Exsitují tři druhy RNA, které se účastní translace. Ribozomální RNA (rRNA), transferová RNA (tRNA) a mediátorová RNA (mRNA). Všechny tyto RNA jsou syntetizovány na základě DNA templátu procesem transkripce (přepisu). Centrální role RNA ve spojení s nukleo-proteinovými komplexy - ribozómy při překladu informace v proteosyntéze byla navržena již ve 30.letech 20.st. J. Brachetem. Tato hypotéza byla stvrzena formulací tzv. centrálního dogmatu molekulární biologie F. Crickem v roce 1958.
5.1.
Role RNA v syntéze proteinů
Role mRNA v proteosyntéze byla navržena na základě studia indukce exprese proteinů u jednoduchých organismů – bakterií. V následujícím textu jsou shrnuty některé klasické experimenty, které vedly k objevu mRNA. Na těchto pokusech bylo ukázáno, že indukce tvorby proteinů je důsledkem regulace syntézy mRNA pomocí proteinů, která se specificky váží na templátovou DNA, ve které je mRNA kódována. Bakterie E.coli je schopná syntetizovat okolo 4300 různých polypeptidů v obrovském počtu kopií (např. ribozomální proteiny i v 10tis. kopiích v 1 buňce), popř. i ve velmi malém počtu kopií (regulační proteiny, i méně jak 10 kopií na 1 buňku). Tzv. konstitutivní proteiny jsou syntetizovány neustále ve stejném množství, neboť zajišťují základní životní funkce buňky, tj. patří mezi skupinu tzv. „housekeeping genes“. Naproti tomu enzymy, které jsou syntetizovány v proměnlivém množství, se nazávají inducibilní, či adaptabilní enzymy. Ty jsou syntetizovány pouze za určitých okolností, tj. dle aktuální potřeby buňky. Bakterie jako E. coli syntetizují enzym pro příjem substrátů pouze tehdy, pokuď tento substrát je přítomen v médiu. Např. enzym β-galaktozidáza je syntetizován pouze v případě, že v kultivačním médiu se nachází substrát tohoto enzymu, disacharid (např. laktóza). Pokud se tak stane, enzym rozštěpí tento disacharid na dva monosacharidy, galaktózu a glukózu (Obr.177). Jiné proteiny, tzv. galaktosid permeáza (nebo také laktóza premeáza) transportuje laktózu do buňky. E. coli, která roste bez laktózy v médiu, obsahuje pouze minimální (< 5) těchto přenašečů v membráně. Jakmile však je do média laktóza přidána, během několika málo minut dojde k obrovskému nárůstu syntézy těchto proteinů (až 1000krát) a udržuje tento stav dokud není laktóza z média vyčerpána. Následuje návrat hodnot počtu a aktivit těchto
Strana 41
Studijní opory biologie
Malý J.:Molekulární biologie
enzymů na tzv. bazální hladinu (úroveň) (Obr.178). Tato obecná vlastnost bakterií – schopnost syntetizovat enzymy a proteiny ke zpracování substrátu jen v jeho přítomnosti – jsou důležitou adaptací bakterií na velmi proměnlivé podmínky jejich životního prostředí. Umožňuje jim provádět syntézu jen skutečně potřebných enzymů a proteinů v daném místě a čase. Laktóza tedy musí nějakým mechanismem indukovat syntézu příslušných enzymů. Tento typ molekul se také nazývá induktor. Přirozený induktor laktózového systému je laktózový izomer, 1,6-allolaktóza, která se vždy vyskytuje v roztoku laktózy v určitém, avšak minimálním množství. V umělých podmínkách se jako induktor využívá především syntetický analog laktózy, tzv. isopropylthiogalaktosid (IPTG), který není metabolizován βgalaktozidázou. Geny zodpovědné za kódování a regulaci produkce β-galaktozidázy, galaktóza permeázy a thiogalaktosid transacetylázy (další protein, jehož funkce však není známa) se označují jako Z+, Y+ a A+. Tyto geny, společně s kontrolními elementy P a O vytváří genetickou jednotku, označovanou jako operon, konkrétně lac operon (Obr.179). Důležitými experimenty, které vedly k objasnění struktury a funkce lac operonu E. coli byly provedeny tzv. konstitutivní mutací. Tato mutace způsobuje nadměrnou syntézu lac proteinů bez přítomnosti induktoru. Tato mutace mutace je provedena v úseku I, která je lokalizovaná blízko lac enzymových kódujícícho oblastí na DNA. Povaha tohoto úseku byla objasněna tzv. PaJaMo experimentem (Obr.180), který provedl A. Pardee, F. Jacob a J. Monod v roce 1959 a který využil jevu tzv. bakteriální konjugace (vysvětlení pojmu viz Maly J.: Opory studia mikrobiologie) (Obr.181). V tomto experimentu byly Hfr bakterie s genotypem I+Z+ skříženy s F- kmenem s genotypem I-Z- v nepřítomnosti induktoru pro βgalaktozidázu. Do 1 hodiny po zkřížení bakterií bylo možné v F- kmenu zaznamenat vysoké množství aktivní β-galaktozidázy, přestože nebyl přítomen induktor. Tento jev lze vysvětlit tak, že Z+ gen, který se dostane do I- buňky, začne ihned syntetizovat β-galaktozidázu v konstitutivním množství. Teprve po určité době, kdy I+ pocházející z F+ buňky měl dostatek času pro svou expresi, došlo k inhibici tvorby β-galaktozidázy v F- buňkách. Závěr z tohoto experimentu byl takový, že I+ je zodpovědný za syntézu difuzibilního produktu, který funguje jako tzv. lac represor (v tomto případě se jedná o protein), tj. inhibuje tvorbu β-galaktozidázy (a tedy transkripci lac operonu). Induktory jako je IPTG dočasně inaktivují lac represor. Ibuňky využité v experimentu produkovaly konstitutivně β-galaktozidázu, neboť neobsahovaly represor. Obdobně jako byl objeven lac represor, byl objeven i tzv. O gen, který má schopnost kontrolovat expresi Z genu na jenom chromozómu.
Strana 42
Studijní opory biologie
Malý J.:Molekulární biologie
Popsané experimenty vedly k vytvoření hypotézy, že strukturální geny DNA jsou transkribovány do komplementárních řetězců mRNA. Ta je pak v součinnosti s ribosomy odpovědná za syntézu polypeptidických řetězců. Tyto hypotézy vysvětlovaly působení induktoru a represoru lac systému. Koordinovaná (simultánní) syntéza všech lac enzymů spočívá ve faktu, že jsou kontrolovány jedním operátorem, tj. vzniká tzv. polycistronická mRNA, která obsahuje všechny transribované lac geny (cistron je zastaralé označení genu). Kontrolní sekvence, jako je např. O gen, mohou kontrolovat pouze geny na téže DNA, na které se nachází. Tento typ sekvencí se nazývá cis-působící elementy. Geny jako gen I, které produkují difusibilní regulační produkty a které mohu ovlivňovat i různé vlákna DNA, se nazávají trans-působící faktory.
5.2.
RNA polymeráza
RNA polymeráza (RNAP) je enzym zodpovědný za DNA-dependentní syntézu RNA (tj. templátem je DNA), který byl nezávisle objeven v roce 1960 S. Weissem aj. Hurwitzem. Enzym navzájem spojuje ribonukleosid trifosfáty ATP, CTP, GTP a UTP na podkladě DNA templátu v reakci, která je poháněna energií uvolněnou při hydrolýze PPi. Všechny buňky obsahují RNAP. V bakterií jeden typ RNAP syntetizuje všechny RNA (vyjma RNA primerů pro replikaci DNA). Mnoho bakteriofágů kóduje specifické RNA polymerázy, které jsou fágově specifické. Eukarytní buňky obsahují 4-5 RNAP, které syntetizují rozdílné skupiny RNA. RNAP bakterie E.coli je tvořena tzv. holoenzymem, skládajícím se z podjednotek α2ββ´ωσ (Obr.182). Jakmile dojde k iniciaci transkripce, sigma (σ) podjednotka, která se také označuje jako tzv. sigma (σ) faktor oddisociuje od jádra enzymu, kterým je α2ββ´ω a které je zodpovědné za samotnou polymeraci. Holoenzym se na DNA váže v několika fázích, které zahrnují vazbu templátu; iniciaci transkripce; elongaci a terminaci.
5.3.
Vazba templátu
Syntéza RNA je zahájena vždy jen na specifickém místě DNA, zvané promotor. Ten je rozpoznán specifickým sigma faktorem. Existence promotorů byla objevena studiem sekvencí v okolí některých genů
(např. pro lac enzymy), přičemž mutace v těchto sekvencích
ovlivňuje úroveň transkripce enzymů. Genetické mapování těchto sekvencí ukazuje, že se jedná o přibližně 40-bp úseky lokalizované na 5´- konci od startu transkripce (konvencí bylo dohodnuto, že nukleotid, od kterého začíná transkripce se označuje indexem +1, přičemž znaménko plus označuje směr transkripce, tedy pohybu RNAP. Promotor se nachází nalevo od +1 sekvence a je značen indexem se záporným znaménkem, např. -35). Holoenzym vytváří Strana 43
Studijní opory biologie
Malý J.:Molekulární biologie
velmi pevné komplexy s promotory (disociační konstanta K ≈ 10-14 M) přibližně v oblasti od -20 do +20, kde jej brání působení DNázy I. Sekvenací promotorů v těchto oblastech byly získány tzv. konsensus sekvence E.coli (Obr.183). Nejvíce konzervované (tj. opakující se u různých promotorů) sekvence se nachází v oblasti -10 nukleotidu ve formě hexameru, tzv. Pribnowův box (D. Pribnow 1975). Jedná se o sekvenci TATAAT. Další oblast s konservovanými sekvencemi je tzv. -35 oblast, která je charakterizovaná sekvencí TTGACA. Sekvence mezi -10 a -35 není důležitá z hlediska sklatby, ale kritická je její délka (16-19 bp). V určitých případech je iniciační nukleotid v +1 místě tvořen A nebo G. U některých promotorů je navíc přítomný tzv. upstream promotorový element (UP) v oblasti -40 až -60, který váže C-terminální doménu α-podjednotky RNAP. Tento element se nachází nejčastěji v blízkosti genů pro ribozomální RNA. Míra (rychlost) s jakou je transripce prováděna je závislá na stabilitě komplexu RNAP holoenzymu a promotoru. Mutace, které způsobí změny v síle této vazby se nazývají jako „up“ a „down“ mutace. Vazbou holoenzymu na promotor a alkylací nevázané DNA (metoda DMS footprinting) bylo možné odhalit sekvence promotoru, které RNAP překrývá. Ve většině případů se jedná o -10 a -35 sekvenci na stejné straně B-DNA, tzn. že holoenzym váže DNA z jedné strany. Dále bylo prokázáno, že činností holoenzymu dochází k rozštěpení dsDNA vlákna v 14 bp sekvenci se symetrií kolem -10 sekvence, tj. s přesahem do transkribované oblasti. Jádro RNAP váže nespecificky velmi silně dsDNA nezávisle na sekvenci (K = 5 × 10-7 M). Teprve navázání příslušného sigma-faktoru (tj. sestavení holoenzymu) způsobí snížení této nespecifické vazby (K ≈ 10-7 M) a zvýšení specifické vazby k promotoru. Sigma faktor tak napomáhá RNAP nalézt správný promotor popojížděním holoenzymu po dsDNA a jeho zastavením na správném místě. Jakmile je sigma faktor po zahájení transkripce uvolněn, jádro nabude opět silné nespecifické vazby na dsDNA a tím dojde ke stabilizaci RNAP na transkribované DNA.
5.4.
Iniciace transkripce
5´-konec prokaryotní RNA je téměř vždy tvořen purinem, přičemž nejčastěji jde o A (následuje v četnosti G). Iniciace transkripce je vpodstatě založena na spojení dvou nukleosid trifosfátů fosfodiesterovou vazbou. Na rozdíl od DNA replikace tedy iniciace nevyžaduje přítomnost primeru. Bakteriální RNA tedy obsahují na 5´- konci trifosfátovou skupinu. Obtížnost s rozštěpením dsDNA vlákna holoenzymem povrzuje fakt, že velmi často se po 212 nasyntetizovaných nukleotidech jejich další syntéza přeruší a z enzymu odchází krátké oligonukleotidy. Holoenzym se však neodpoutá od komplexu s promotorem a znovu se
Strana 44
Studijní opory biologie
Malý J.:Molekulární biologie
pokouší o iniciaci. Tento jev se nazývá abortivní transkripce. Pokud se rozštěpení dsDNA podaří, je zahájena kontinuální (procesivní) transkripce, která vede k prodlužování vlákna RNA. V tomto okamžiku oddisocijuje σ faktor z holoenzymu a může vytvořit nový iniciační komplex s dalším jádrem RNAP. RNAP je velmi komplexní struktury. U E.coli dosud nebyla definitivně určena. Krystalografické studie však byly provedeny v jiném případě – na holoenzymu a jádře RNAP Thermus aquaticus (Taq) (Obr.184). Rentgenová krystalografie komplexu DNA-RNAP ukazují složitý mechanismus vazby nukleové kyseliny, které se účastní několik podjednotek holoenzymu za aktivní účasti iontů Mg2+ a Zn2+ (Obr.185 a 186). Antibiotikum rifamycin B produkovaný Streptomyces mediterranei a syntetický derivát rifampicin specificky inhibují prokaryotní RNAP (ale nikoliv eukaryotní RNAP). Tato antibiotika jsou velmi účinná a využívají se k léčbě infekcí gram-pozitivními bakteriemi a tuberkulózy. Rifamycin se váže do podjednotky β, příčemž brání přechodu RNAP z fáze iniciace do elongace. Navázaná RNAP na promotoru brání ostatním RNAP zahájení transkripce a tím dochází k poškození funkce buňky. Mechnismus inhibice je znám. Antibiotikum navázané do podjednotky β ze sterických důvodů zabraňuje elongaci – prodlužování syntetizované RNA. Místo jeho účinku je sekvenčně odlišné od stejných podjednotek na RNAP eukaryot, což vysvětluje specifitu inhibice.
5.5.
Elongace
Studie s přídavky radioaktivně značených nukleotidů a sledování jejich fixace v narůstajících řetězcích RNA potvrdila, že směr syntézy RNA je orientován ve směru 5´-3´ vznikajícího řetězce, tj. obdobně, jako v případě replikace DNA. Toto zjištění bylo dále potvrzeno faktem, že antibiotikum cordycepin, analog adenosinu postrádající 3´-OH skupinu inhibuje RNA syntézu. Pokud je tato molekula začleněna do řetězce (v případě syntézy ve směru 5´-3´) je zamezena další elongace RNA v důsledku nemožnosti napojení dalšího nukleotidu. Elongace RNA vyžaduje, aby dsDNA řetězec byl rozevřen z důvodu odhalení bazí templátové DNA pro syntézu komplementární RNA. V průběhu elongace je tak tvořen na přechodnou dobu heteroduplex RNA-DNA v tzv. transkripční bublině. Tato struktura, která vzniká v průběhu iniciace v holoenzymu RNAP, je posouvána ve směru pohybu současně s RNAP (Obr.187). Teoreticky se toto může uskutečnit dvěma možnými způsoby. V prvním případě dochází k pohybu RNAP po vlákně dsDNA tak, že RNAP se obtáčí souhlasně s templátovým vláknem, tj. shodně s orientací helixu. Vzniklá RNA se obtáčí kolem dsDNA a
Strana 45
Studijní opory biologie
Malý J.:Molekulární biologie
na templátové DNA nedochází k vzniku superhelicity. Tento model je nepravděpodobný, neboť vzniklá RNA by se nemohla od dsDNA samovolně oddělit. Druhá možnost spočívá v principu, kdy RNAP se neotáčí kolem dsDNA, ale naopak, RNAP svým dopředným pohybem před sebou hrne otáčky DNA, která rotuje. Rotaci se podařilo experimentálně povrdit v umělých podmínkách. Je pochopitelné, že namísto skutečné rotace v in vivo je navozená superhelicita relaxována pomocí topoisomeráz a gyráz. RNA je v tomto případě elongována volně do prostoru a není navinuta na dsDNA. V případě selhání funkce těchto enzymů dochází k zastavení transkripce nahromaděním otáček dsDNA, které vytváří přílišné negativní napětí na vlákně DNA zamezující postupu transkripční bubliny a zastavení transkripce. Rychlost transkripce in vivo je přibližně 20 až 50 nukleotidů za sekundu při 37°C u bakteri E.coli. Jakmile je zahájena elongace transkripce a promotor je tedy uvolněn, dojde inhed k sestavení nové RNAP a proces iniciace a elongace se může opakovat. V případě RNA, které je třeba syntetizovat ve velkém množství, jako např. rRNA, dochází k opakované iniciaci přibližně jedenkrát za sekundu (Obr.188). RNAP na rozdíl od DNAP nemá korekturní aktivitu, tj. nemá schopnost štěpit nasyntetizované vlákno RNA v případě vazby nesprávného nukleotidu do řetězce exonukleázovou aktivitou. Tento fakt je příčinou daleko vyššího počtu chyb vnášených do RNA – přibližně 1 špatně vložená báze na ≈ 104 transkribovaných bazí. Zvýšení chyb se z hlediska funkce buňky zpravidla vůbec neprojeví v důsledku několika faktů – každý gen je opakovaně transkribován; genetický kód obsahuje řadu synonymních kodonů (kodony kódující stejnou aminokyselinu); záměna jedné aminokyseliny se na funkci proteinu většinou neprojeví; velká část eukaryotních RNA je po transkripci vystřižena (úprava primárního traskriptu, tzv. splicing).
5.6.
Terminace transkripce
DNA obsahuje specifická místa, kde je transkripce terminována. Transkripční terminační sekvence genů E. coli jsou typické mnoha společnými rysy. Obsahují 4-10 sekvencí AT na templátovém řetězci. RNA je terminována na této sekvenci nebo těsně za ní. Za AT sekvencí proti směru transkripce se nachází palindromická (dvoustranně souměrná) GC sekvence. Transkribovaná RNA tak může na svém konci vytvořit vlásenkovitou strukturu zakončenou krátkou sekvencí několika U (Obr.189). Stabilita této vlásenky na syntetizované RNA a velmi slabá vazba sekvence uracilů k templátové AT sekvenci je pravděpodobně velmi důležitým faktorem, který způsobuje ukončení (terminaci) transkripce. Vytvoření vlásenky na RNA způsobí krátké zastavení (několik sekund) RNAP na terminačním místě. Tento okamžik Strana 46
Studijní opory biologie
Malý J.:Molekulární biologie
zřejmně napomůže vytlačení RNA vázané oligo(U) koncem na templátové DNA pomocí komplementární DNA v transkripční bublině a tím terminaci. Tuto hypotézu potvrzují výsledky studia bodových mutací v sekvencích vlásenky, či krátkého oligo(U) řetězce, které téměř vždy vedou k neschopnosti ukončit trankripci na terminační sekvenci templátové DNA. Jiný model předpokládá, že terminace je umožněna především povahou interakce RNARNAP. RNA je pravděpodobně svázána s RNAP ve dvou místech a právě vytvoření terminační vlásenky jednu z těchto vazeb porušuje, což v důsledku znamená odpojení RNA od templátové DNA a terminaci. Výše zmíněné způsoby terminace jsou spontánní a závislé na existenci terminačních sekvencí. Ve skutečnosti pouze přibližně polovina terminačních mít kóduje vlásenku a oligo (U) řetězce. V těchto případech je k terminaci vyžadována aktivita tzv. proteinu Rho (Rho faktor). Rho faktor, hexamerní protein se známou strukturou (Obr.190), zvyšuje efektivitu spontánní terminace a zároveň je zodpovědný za terminaci transkriptů bez terminační vlásenky. Rho protein je ve své podstatě helikáza, schopná oddělovat helixy RNA-DNA a RNA-RNA za spotřeby ATP. Genetické studie ukázaly nutnost existence speciálních rozpoznávacích sekvencí (80-100 nukleotidů, vysoký obsah C, nízký G) na RNA před terminačním místem, které jsou nutné k Rho dependetní terminaci. Rho faktor se tedy pravděpodobně váže na nascentní (právě vznikající) RNA v místě rozpoznávací sekvence, migruje po RNA ve směru 5´-3´, tj. směrem k RNAP, dokud RNAP nedostihne v okamžiku, kdy transkripční komplex je zastaven na terminačním místě. Rho protein následně rozvine RNA-DNA duplex v transkripční bublině RNAP a uvolní RNA transkript. Trankripce je tedy ukončena.
5.7.
Eukaryotní RNA polymerázy
Jádro eukaryotní buňky obsahuje tři různé typy RNA polymeráz, které se liší způsobem, jakým syntetizují RNA. RNA polymeráza I (RNAP I, RNAP A) se nachází v jadérku (hustá struktura v buněčném jádře, která obsahuje ribozomální geny) a syntetizuje většinu prekurzorů ribozomálních RNA (rRNA). RNA polymeráza II (RNAP II, RNAP B) se nachází v nukleoplazmě a syntetizuje mRNA. RNA polymeráza III (RNAP III, RNAP C) se rovněž nachází v nukleoplazmě a syntetizuje prekurzory 5S ribozomální RNA, tRNA, řadu malých jaderných RNA (snRNA) a cytozolických RNA. Mimo klasické jaderné RNAP se v eukarytní buňce nachází RNAP i v mitochodriích a chloroplastech (u rostlinných buněk). Tyto RNAP jsou velmi jednoduché a podobají se RNAP některých bakteriofágů. Eukaryotní RNAP jsou daleko komplexnější než polymerázy prokaryot, o čemž svědčí i vysoká variabilita a počet Strana 47
Studijní opory biologie funkčních
pojednotek (Obr.191).
Malý J.:Molekulární biologie Některé z těchto podjednotek
jsou
homologické
k podjednotkám α,β, a ω prokaryotní RNAP, avšak k nim se přidávají další, u prokaryot chybějící proteiny. Z celkem 12 podjednotek RNAP II je 10 sekvenčně velmi podobných podjednotkám RNAP I a III a navíc, sekvence těchto 10 podjednotek je vysoce kozervována od kvasinek až po člověka (Obr.192). Aktivaci RNAP II (tj. přechodu z iniciace do elongace) předchází fosforylace C-terminální domény podjednotky β´ (tzv. CTD doména). CTD může být reverzibilně fosforylována/defosforylována pomocí CTD kináz/fosfatáz. Na rozdíl od RNAP holoenzymů prokaryot, RNAP eukaryot nejsou samy o sobě vázány těsně na dsDNA. Tato vazba je jim propůjčena až po utvoření mediátorového komplexu s transkripčními faktory, které řídí sestavení RNAP na promotoru transkribovaného genu. Krystalografická studie eukaryotní RNAP izolované z kvasinek a provedená R. Kornbergem potvrdila vysokou míru podobnosti s již zmíněnou Taq RNAP. RNAP II je o trochu větší komplex z více podjednotek, který váže dva Mg2+ ionty v aktivním místě, které jsou pravděpodobně zodpovědné za katalýzu elongace RNA vlákna, obdobně jako u DNAP. Povrch RNAP II je negativně nabit, vyjma pozitivně nabitého žlábku, do kterého se váže DNA. Mechanismus translokace RNA-DNA duplexu v průběhu elongace je zobrazen na Obr.193 a 194. dsDNA je vnořena do RNAP tunelem mezi tzv. „můstkem“ a „svorkou“ a unvitř se stáčí v 90° úhlu, a vychází místem „exit“. V místě stočení dochází ke vzniku RNADNA duplexu a syntéze RNA řetězce v aktivním místě s Mg2+. Translokace (posun řetězce dsDNA o 1 nukleotid k umožnění čtení následujícího nukleotidu) je pravděpodobně způsobena pravidelnými konformačními změnami helixu podjednotky Rpb1, která vytváří „můstek“ nespecificky interagující s templátovou DNA. Známým inhibitorem transkripce, tj RNAP III a RNAP III je skupina toxinů, které se nazývají amatoxiny (na ostatní RNAP nepůsobí). Tyto toxiny jsou přítomné v jedovaté houbě Amanita phalloides (5-6 mg amanitinu je letální dávka pro člověka). Nejběžnější z nich, tzv α-amanitin má schopnost mnohotisíckrát zpomalovat transkripci vazbou a inhibicí RNAP (transkripce pouze jednotky nukleotidů za minutu). Krystalografickou analýzou bylo identifikováno místo vazby α-amanitinu v tzv. „trychtýři“, tj. části RNAP, kudy se do aktivního místa dostávají NTP k syntéze RNA. Inhibiční účinek však pravděpodobně spočívá v inhibici konformačních změn „můstku“, tj. zpomalení nebo zastavení translokace a nikoliv ve snížení průchodnosti či změnou afinity pro NTP.
5.8.
Struktura promotorových sekvencí eukaryot
Strana 48
Studijní opory biologie
Malý J.:Molekulární biologie
Jelikož valná většina sekvencí rRNA v eukaryotním chromozómu si je velmi podobná, RNAP I rozpoznává pouze jeden promotor, tj. tento enzym rozpoznává pouze tento jeden specifický promotor a z tohoto důvodu není RNAP I schopná provádět transkripci jiných něž rRNA. Mutační studie (studium vlivu mutací v promotoru) ukázaly, že pro vazbu RNAP I do promotorů genu pr rRNA je nezbytně nutná existence tzv. jaderného promotorového elementu, který se nachází mezi -31 až +6 nukleotidem. Navíc, k zvýšení úrovně transkripce je vyžadována sekvence (horní kontrolní sekvence) bohatá na G a C lokalizována daleko před vlastním promotorem (-187 až -107) (upstream promotor element). Tyto sekvence jsou místem vazby traksripčních faktorů, který dirigují sestavení funkční RNAP I na promotoru. Promotory RNAP II jsou mnohem delší a více diverzifikované, než v případě prokaryot. Navíc, jejich struktura ještě nebyla detailně popsána. Strukturální geny, které kódují tzv. housekeeping genes, tj. geny, které jsou exprimovány ve všech typech buněk v organismu a které jsou zodpovědné za udržení základních životních funkcí buňky, mají vždy jednu nebo více kopií GGGCGG sekvence (GC box), lokalizované před +1 nukleotidem. Mutační analýzou bylo zjištěno, že tyto GC boxy fungují obdobně jako prokaryotní promotory. Naproti tomu strukturální geny, které jsou syntetizovány pouze za určitých okolností (pouze u určitých typů buněk) obsahují spíše AT bohaté sekvence lokalizované 25 až 30 bp před +1 nukleotidem. Tento tzv. TATA box je velmi podobný -10 sekvenci prokaryot (TATAAT). Role TATA boxu však na rozdíl od prokaryot není naprosto esenciální pro zahájení transkripce, jeho delece vede k zpomalení, nikoliv k úplnému zastavení transkripce genu (Obr. 193). Mimo TATA box se na těchto typech promotorů vyskytují i další regulační sekvence, tentokráte v oblasti -50 až -110. Například globinové geny obsahují konsensus sekvenci, tzv. CCAAT box, v oblasti vymezené -70 a -90 nukleotidem a dále další horní kontrolní sekvenci – CACCC box lokalizovanou ještě před ní. Je evidentní, že tyto sekvence se výraznou měrou podílejí na sestavení funkční RNAP II. Jedním ze zajímavých a dosud neobjasněných faktů je existence kontrolních elementů, které nemají fixovanou pozici vzhledem k počátku transkripce a vyskytují se na řetězci poměrně v náhodné poloze, často velmi vzdálené od +1 (i několik tisíc bp). Tyto elementy nejsou nezbytné pro vlastní transkripci – jejich delece sice ovlivní míru činnosti RNAP, ale nezastaví ji úplně. Z tohoto důvodu se tyto genové elementy nazávají enhancery (zesilovače). Tyto zesilovače jsou nezbytné pro zajištění maximální aktivity příslušných promotorů. Je prokázáno, že tyto genetické elementy jsou rozpoznávány řadou transkripčních faktorů, jejichž vazba stimuluje sestavení funkční RNAP II na příslušném promotoru. Tato funkce je zajištěna vytvářením smyček dsDNA mezi promotorem a enhancerem, přičemž Strana 49
Studijní opory biologie
Malý J.:Molekulární biologie
jejich vazba a fixace se vznikající RNAP II je zprostředkována pomocí transkripčních faktorů. Enhancery tedy do značné míry ovlivňují selektivní expresi genů v eukaryotních organismech.
Strana 50
Studijní opory biologie
6.
Malý J.:Molekulární biologie
REGULACE EXPRESE GENŮ NA ÚROVNI TRANSKRIPCE U PROKARYOT
Prokaryta musí být schopny rychle reagovat na skokové změny vnějšího prostředí, jako je například tok živin, rychlou syntézou příslušných přenašečových proteinů a enzymů. Tento proces přitom trvá pouze několik málo minut, neboť proces transkripce a translace je velmi těsně spjat (Obr.194). Ribozómy začíjí translatovat vznikající mRNA od 5´-konce v okamžiku, jakmile je tento konec vlákna uvolněn z RNAP. Navíc, většina mRNA prokaryt je velmi rychle (do 1-3 min. po syntéze) degradována nukleázami, aby nedocházelo k tvorbě nepotřebných proteinů a zbytečné spotřebě energie. 5´-konec mRNA je tak často degradován dříve, než dojde k dosyntetizování 3´-konce řetězce. V kontrastu s prokaryoty, eukaryotní buňky syntetizují nové proteiny velmi pomalu (hodiny až dny), zejména v důsledku odděleného místa transkripce (jádro) a translace (cytoplasma), kdy vznikající mRNA musí být dopravena skrze jaderné póry do místa translace. Navíc, eukaryotní buňky většiny mnohobuněčných organismů jsou obklopeny stabilním prostředím a nejbouřlivější transkripce probíhá v průběhu dělení buňky či její diferenciace. Regulace genové exprese se může odehrávat na několika úrovních, z nichž regulace na úrovni transkripce je nejefektivnější. Jelikož je tato regulace u eukaryot velmi složitá, v následujícím textu je věnována pozornost pouze prokarytní regulaci. Regulace exprese u eukaryot bude součástí samostatné kapitoly.
6.1.
Regulace transkripčními faktory
V přítomnosti vysoké koncentrace induktoru, dochází k rychlé transkripci lac operonu (viz předchozí kap.). Lac represor, produkc lac I genu E.coli, je v konstrastu syntetizován ve velmi malém množství, nepřevyšující 10 jednotek na 1 buňku. Příčinou tohoto stavu je velmi málo efektivní (slabý) promotor genu lac I. Naproti tomu geny, které jsou transkribovány ve velkém množství (intezitě) mají silný promotor a obsahují konsensus sekvence. Regulace exprese u prokaryot je dobře prostudována v differenčních pochodech. V průběhu differeciace buňky dochází k řízené změně exprese genů, která je kontrolována pomocí speciálních proteinů, tzv. sigma faktorů (součást RNAP holoenzymu). Jedním z modelových systémů je model bakteriofág-bakterie. Fág obsahuje soubor genů, které se mohou dělit na tzv. ranné, střední a pozdní geny. Tzv. ranné geny se dostanou do bakterií inhed na počátku infekce. Ty navodí v buňce řadu změn, které dále podpoří expresi středních genů fága. V nich jsou kódovány proteiny, které umožňují expresi pozdních genů. Sekvenční exprese těchto genů je umožněna pomocí syntézy tzv. kaskády sigma faktorů. Např. po
Strana 51
Studijní opory biologie
Malý J.:Molekulární biologie
infekce bakterie Bacillus subtilis bakteriofágem SP01 dojde nejdříve k transkripci ranných genů bakteriofága pomocí RNAP holoenzymu bakterie. Mezi proteiny těchto ranný genů je i gen 28, která dává vznik sigma faktoru, označeného jako σgp28. Ten nahradí σ faktor bakterie, který je přítomný v RNAP holoenzymu a zvyšuje tak afinitu RNAP k promotoru středních genů bakteriofága. Obdobně, genový produkt středních genů, sigma faktor 33/34 (σgp33/34) způsobuje po vazbě na RNAP transkripci pozdních genů bakteriofága. Bakterie B. subtilis obsahuje mimo obvyklý sigma faktor σ70 i jiné sigma faktory, které jsou zodpovědné za proces sporulace. V případě navození sporulace tak dochází v důsledku sekvenčních změn v expresi navozených působením kaskádou příslušných sigma faktorů k přestavbě metabolismu bakterie a vzniku spóry. Ta se jak morfologicky, tak z hlediska metabolismu liší od normální vegetativní buňky. Lac represor je tetramerní protein s vysokou afinitiou k IPTG (K = 10-6M). V nepřítomnosti induktoru projevuje nejen nespecifickou afinitu k dsDNA, ale především mnohem silnější specificku vazbu k lac operátoru. Je velmi pravděpodobné, že represor hledá operátor popojížděním po dsDNA, na kterou se nespecificky váže. V případě, že narazí na operátor, dojde k jeho zastavení a blokaci promotoru. Lac operátor je tvořen palidnromatickou sekvencí 26 nukleotidů, který je společným znakem pro vazebné interakce řady proteinů s dsDNA (Obr.195). Operátor se nachází mezi -7 a +28 sekvencí lac operonu. Jelikož RNAP iniciační komplex je pevně vázán mezi -20 až +20 sekvencí, dochází k překryvu vazebného místa s represorem. Navázaný represor způsobuje zvýšení kinetické bariéry pro přechod RNAP z abortivní transkripce do procesivní transkripce (elongace).
6.2.
Regulace katabolickou represí
Glukóza je jedním z nejdůležitějších substrátů bakterie E.coli. Její dostatek v médiu zamezuje (inhibuje) expresi více jak 100 genů, které jsou zodpovědné za fermentaci mnoha látek, jako je laktóza, arabinóza, galaktóza atd. Tento jev, kdy přítomnost jednoho substrátu navozuje inhibici příjmu jiného substrátu se nazývá katabolická represe. Princip tohoto jevu byl studován na souvislosti mezi hladinou cAMP v buňce E.coli a přídavky glukózy do média (Obr.196). Zvýšení koncentrace glukózy má za následek pokles vnitrobuněčné koncentrace cAMP, který je znám jako tzv. druhý posel v přenosu informace v živočišných buňkách. U mutatntních buněk, postrádajících tento typ odezvy na přídavek glukózy, není přítomen tzv. genový aktivační protein (CAP), který má schopnost vazby an cAMP za vzniku komplexu CAP-cAMP. Jak bylo později prokázáno, komplex CAP-cAMP se váže na lac operon a
Strana 52
Studijní opory biologie
Malý J.:Molekulární biologie
stimuluje transkripci v nepřítomnosti lac represoru. CAP je tedy příkladem pozitivní regulace laktózového operonu, v protikladu k negativní regulaci navozenou lac represorem. Struktura a funkce vazby CAP-cAMP na operon byla objasněna na molekulární úrovni (Obr.197). CAP interaguje přímo s RNAP skrze C-koncovou sekvenci tzv. α-CTD podjednotky. Tato vazba stimuluje zahájení iniciace RNAP na nejbližším promotoru. Navíc, α-CTD podjednotka se nespecificky váže na dsDNA, zejména v oblastech se zvýšenou přítomností AT sekvencí. Promotory, vážící CAP-cAMP komplex mohou být děleny do tří skupin. Třída I promotorů, jakým ja např. lac operon, které vyžadují pouze vazbu CAP-cAMP k aktivaci transkripce. Třída II promotorů, které rovněž vyžadují pouze přítomnost CAP-cAMP. Na rozdíl od předchozí třídy však je jednoznačně definována poloha vazby CAP, tj. v oblasti -35 promotoru, tj. překryvem s vazbým místem pro RNAP (u přechozí třídy je místo vazby různé). Třída III promotorů vyžaduje spolupůsobení více aktivátorů současně k maximální stimulaci transkripce.
6.3.
Regulace sekvenčně specifickými protein-DNA interakcemi
Jelikož genová exprese je regulována proteiny jako je CAP nebo lac represor, je velká pozornost věnována otázce, jak tyto proteiny rozpoznávají jejich cílovou sekvenci na DNA. Jelikož tyto proteiny zpravidla nemají schopnost rozštěpit dsDNA, jejich rozpoznávací schopnost musí být determinována pouze těmi funkčními skupinami bazí, které přečnívají do úzkého či širokého žlábku helixu dsDNA. Ze sterických důvodů se však uplatňuje především široký žlábek, neboť úzký žlábek je těžko přístupný pro sekundární strukturu proteinů. CAP dimer je tvořen dvěma symetricky uspořádánými helixy, které vycházejí z proteinu a jsou vsazeny do dsDNA v místě širokého žlábku. Tyto dva helixy CAP proteinu vytváří tzv. helix-turn-helix motiv (HTH motiv), který je konformačně blízký jiným HTH motivům přítomným v bakteriálních represorů, jako je lac represor, trp represor, cI represor a Cro proteiny bakteriofága λ. Všechny tyto typy HTH motivů jsou evolučně spjaté a váží dsDNA podobným způsobem. Jedná se o cca 20 aminokyselinový polypeptid ve formě dvou α-helixů, které jsou zkřížené ve 120° úhlu. Interakce mezi HTH a dsDNA je zprostředkována pomocí postraních helixů vycházejících z druhého helixu HTH motivu, který se nazývá rozpoznávací helix. Vazba HTH motivu na dsDNA a způsob rozeznání sekvence je velmi komplexního charakteru, při které se uplatňuje řada strukturálních interakcí různé povahy, především pak vodíkové můstky, solné můstky a van der Waalsovy interakce (Obr.198, 199). Neexistují jednotná pravidla, která by ovlivňovala způsob interakce jednotlivých
Strana 53
Studijní opory biologie
Malý J.:Molekulární biologie
aminokyselinových zbytků a bazí. Rekognice sekvence DNA je tedy dána souhrnem faktorů a interakcí, které se podílí na vzájemné vysoké vazebné afinitě HTH motivu a DNA. Jiným příkladem protein-DNA interakce je tzv. met represor (MetJ), který po vytvoření komplexu s S-adenosylmethioninem (SAM) reprimuje tvorbu sebe sama a genů, zodpovědných za syntézu methioninu a SAM. Krystalizací komplexu MetJ-SAM s dsDNA bylo zjištěno, že tento represor se váže na palindromatickou sekvenci DNA pomocí symetricky uspořádaných dvouřetězcových antiparalelních β-listů, které jsou vloženy do širokých žlábků rozpoznávané dsDNA. Velká většina prokaryotních transkripčních regulátorů obsahuje stuktury obdobné HTH motivu či podobné β-listu MetJ represoru. Naproti tomu eukaryotní stukturální motivy jsou daleko více variabilní a řada z nich neobsahuje prvky symetrie, jako prokaryotních motivů. Tyto motivy budou diskutovány v kapitole věnující se regulaci transkripce u eukaryot.
6.4.
Regulace araBAD operonu
Bakterie E. coli má schopnost metabolizovat pentózový cukr L-arabinózu. Tři z pěti enzymů, které jsou využitelné k jejímu metabolickému zpracování jsou produkty operonu araBAD, který podléhá katabolické represi. Tento operon obsahuje v horních sekvencích od +1 nukleotidu kontrolní místa, tzv. araI, araO1 a araO2 (Obr.200). AraI (místo pro vazbu induktoru) se skládá ze dvou 17 bp míst, araI1 a araI2, které jsou lokalizovány v blízkosti -35 regulační sekvence promotoru. Obdobně i araO1 je složeno ze dvou sekvecí L a R. AraO2 je lokalizována v nekódující oblasti -270, v blízkosti tzv. araC genu. Transkripce araBAD operonu je regulována jak systémem CAP-cAMP, tak i tzv. proteinem vázajícím arabinózu, AraC. Regulace araBAD operonu probíhá v několika stupních (Obr.201). V nepřítomnosti AraC, RNAP provádí transkripci genu araC, zatímco araBAD operon je transkribován pouze na bazální (konstitutivní) úrovni. Jakmile je přítomný AraC (ale zároveň je nepřítomná arabinóza a CAP-cAMP), dojde k vazbě proteinu AraC na sekvenci araO2 a araI1 a zamezení transkripce araBAD operonu (negativní kontrola). Vzdálenost obou regulačních sekvencí napovídá, že dsDNA mezi nimi je vazbou proteinu AraC ohnutá do smyčky, což je pravděpodobně příčinou zamezení transkripce. V případě přítomnosti arabinózy v médiu, dojde k eliminaci vazby AraC na araI1 za současného zachování vazby na araO2. Tento fakt dovolí rozvolnit smyčku a je zahájena transkripce araBAD operonu (pozitivní kontrola). V případě nízkého obsahu glukózy v substrátu (velké množsví CAP-cAMP), dojde k k vazbě CAP-cAMP na sekvenci mezi araO2 a araI1 a tím i snadnějšímu rozpletení smyčky. Zvyšuje se tak afinita AraC k místu araI2. Vazba AraC-arabinóza komplexu do místa araO1 Strana 54
Studijní opory biologie
Malý J.:Molekulární biologie
v nadbytku arabinózy blokuje přístup RNAP do do promotoru araC, tj. dochází k represi tvorby AraC.
6.5.
Regulace tryptofanového (trp) operonu atenuací
Atenuace je způsob regulace exprese na úrovni transkripce, který využívají některé bakterie k regulaci operonů, zúčastňujících se biosyntézy aminokyselin. Tento způsob byl popsán na příkladu tryptofanového operonu bakterie E. coli. Trp operon kóduje pět polypeptidů, které se účastní syntézy tryptofanu. Tyto geny jsou kontrolovány trp represorem, dimerickým proteinem genového produktu trpR (Obr.202). Trp represor váže L-tryptofan, přičemž vzniká komplex, který se specificky váže na trp operátor (trpO) a snižuje tak míru transkripce až o 70 krát. Tryptofan tedy funguje jako tzv. korepresor, tj. jeho nadbytek jako koněčný produkt biosyntézy negativně reguluje jeho vlastní syntézu. Trp represor navíc reguluje další dva operony, trpR operon a aroH operon. Působení trp represoru není jediným regulačním mechanismem transkripce tryptofanového operonu. Ze sekvenčních analýz vyplývá, že trpE, prvnímu z genů v operonu, předchází 162 nukleotidová sekvence, tzv. vedoucí sekvence (leader), označovaná jako trpL. V případě, že množství tryptofanu je v buňce malé, dochází k syntéze polycistronické mRNA včetně trypL sekvence. S nárůstem koncentrace tryptofanu je transkripce trp operonu postupně inhibiována pomocí trp represoru-korepresoru. Přesto ale dochází k neustálé produkci sekvence obsahující trpL. Nedochází tedy k naprostému zamezení transkripce, ale k vytváření a terminaci nehotových transkriptů, které neobsahují geny pro translaci enzymů. Tomuto způsobu kontroly transkripce se říká atenuace a kontrolnímu elementu, který ji způsobuje atenuátor. Transkript atenuátoru obsahuje čtyři komplemenární segmenty, které mohou vytvářet dva typy odlišných vlásenek (Obr.203). Tzv. segmenty 3 a 4 vytváří společně normální, rho-nezávislý (viz rho závislá terminace terminace transkripce) transkripční terminátor. Transkripce pokračuje velmi zřídka i za tuto terminační vlásenku. Přesto je část segmentu 1 translatována za vzniku krátkého, z 14 aminokyselin tvořeného polypeptidu, který obsahuje dva za sebou jdoucí tryptofany. Pozice těchto dvou aminokyselin ve vzniklém řetězci je důležitým faktorem v mechanismu atenuace (Obr.204). Ten je započat RNAP, která syntetizuje trpL mRNA. Jakmile dojde k syntéze tohoto krátkého řetězce mRNA, ihned dochází k sestaven ribozomu na jejím 5´-konci a zahájení translace. V případě, že v buňce je dostatek tryptofanu, je i dostatek tryptofanyl-tRNATrp (transferová RNA pro tryptofan s navázaným Trp reziduem) a ribosom pokračuje v syntéze na segmentu 2, tj. blízko RNAP přičemž blokuje vznik 2-3 antiterminační vlásenky a způsobuje vznik 3-4 terminační Strana 55
Studijní opory biologie
Malý J.:Molekulární biologie
vlásenky, která ukončí transkripci. Jakmile však není v buňce dostatek tryptofanu a tedy ani tryptofanyl-tRNATrp, ribozom se zastaví na kodonu UGG pro tryptofan a umožní vznik antiterminační vlásenky 2-3. RNAP tak není zastavena a pokračuje dále v transkripci trp operonu, tedy všech genů nutných pro syntézu tryptofanu. Mimo tryptofanu se podobným způsobem reguluje i syntéza histidinu, v tzv. his operonu a syntéza isoleucinu, leucinu a valinu pomocí tzv. ilv operonu v bakterii E. coli. Oba tyto případy obsahují sekvence bohaté na regulované aminokyseliny, které jsou kódovány v leaderových sekvencích peptidu. Mechanismus atenuace je tedy velmi podobný (Obr.205).
6.6.
Regulace syntézy rRNA za přísných podmínek (stringent response)
Buňky bakterie E.coli se za optimálních podmínek dělí každých 20min, což mimo jiné znamená, že musí být schopna nasyntetizovat až 35 000 ribozomů na jeden buněčný cyklus. RNAP je schopná zahájit transkripci ribozomální rRNA nejrychleji jednou za 1 s. Pokud by tak buňky obsahovala pouze jednu kopii genu pro každou s ribozomálních RNA, nebyla by schopna nasyntetizovat více jak 1200 kopíí jednoho typu. Z tohoto důvodu obsahuje genom batekterie sedm samostatně lokalizovaných operonů pro rRNA, přičemž každý obsahuje po jedné kopii všech rRNA. Navíc, rychle se dělící bakterie obsahují více částečných kopií chromozómu, takže ve výsledku jsou schopny dosáhnout požadované rychlosti syntézy ribozomů a potažmo i proteinů důležitých pro buněčné dělení. Buňky mají schopnost koordinovat míru translace potřebný proteinů s počtem ribozómů. Zamezuje se tak nadbytečné a neefektivní syntéze, která by buňkám odebírala zbytečnou energii. Míra syntézy rRNA je tak srovnatelná s mírou translace, tj. syntézy proteinů. Jedním ze způsobů, jak se tato kontrola realizuje je tzv. regulace za přísných podmínek (stringent response). Nedostatek některé z aminokyselin, který se může objevit za nedostatečné míry její syntézy, se projeví vznikem tzv. „nenabité“ příslušné tRNA pro tuto aminokyselinu. Následuje odpověď buňky, kdy dochází k potlačení celé řady syntetických pochodů na úkor zvýšení syntézy enzymů, zodpovědných za tvorbu aminokyselin. Buňka se tak připravuje na hladovění za nedostatku živin. Mechanismus této regulace spočívá v akumulaci neobvyklých nukleotidů, jako je ppGpp a pppGpp (dohromady pojmenované jako (p)ppGpp (guanosin pentafosfát) a jejich rychlé degradaci v okamžiku dostatku všech aminokyselin. Tyto nukleotidy mají schopnost měnit afinitu RNAP k promotorům a snižují rychlost elongace transkripce určitých genů. Syntéza pppGpp spočívá v enzymaticky řízené rekaci ATP a GTP za vzniku nukleosid pentafosfátu a AMP, katalyzované enzymem ReIA (stringent factor). (p)ppGpp vzniká v okamžiku, kdy se v ribozómu na patřičném kodonu pro Strana 56
Studijní opory biologie
Malý J.:Molekulární biologie
chybějící aminokyselinu vyskytne neobsazené místo (v důsledku absence příslušné tRNA). Tím je odhalen nedostatek aminokyseliny v buňce a vznikající (p)ppGpp působí jako difuzibilní efektor, navozující následné změny ve transkripci příslušných genů regulací pomocí stringent mechanismu. Opětovná degradace (p)ppGpp je navozena genovým produktem spoT.
Strana 57
Studijní opory biologie
7.
Malý J.:Molekulární biologie
POSTRANSKRIPČNÍ ÚPRAVY PRIMÁRNÍHO TRANSKRIPTU
Ribonukleová kyselina, která vzniká ihned po syntéze RNAP, tzv. primární transkript, memusí být nutně konečnou funkční RNA. S cílem nabýt konečné, biologicky aktivní konformace musí řada těchto primárních transkriptů projít následnými, tzv. postranskripčními úpravami, jakou je např. exonukleázové či endonukleázové odštěpení polynukleotidových segmentů; připojení specifických nukleotidových sekvencí na 3´a 5´konec RNA a modifikace specifických nukleosidů. Těmto úpravám podléhají zejména mRNA, rRNA a tRNA.
7.1.
Úpravy mRNA čepičkou a polyA koncem
V prokaryotních buňkách je většina syntetizované mRNA translatována bez jakýchkoliv úprav, zejména z důvodu potřeby jejich rychlé translace ribozómy. U eukaryt je ale RNA syntetizována v jádře a translatována v cytozolu. Eukarytní mRNA tedy provází řada postranskripčních úprav a to ještě před opuštěním samotného jádra buňky. Eukaryotní mRNA je opatřena enzymaticky syntetizovanou tzv. čepičkou, která je tvořena 7-methylguanosinem navázaným na původní 5´nukleosid 5´-5´ trifosfátovým můstkem (Obr.206). Čepička je navázána na nascentní mRNA, jakmile je odhaleno prvních 30 nukleotidů a definuje startovní místo eukaryotní translace. Mimo základní úpravu koncového nukleotidu mohou být provedeny i úpravy další, např. O2´-methylace prvního nukleosidu, který vede k tzv. cap-1 čepičce (typická pro mnohobuněčné organismy). Dle může být tento typ methylace proveden i na druhém (cap-2) popř. ani na jednom (cap-0) z nukleosidů. Pokudje prvním nukleosidem adenosin, je metylován v poloze N6. Vytvoření čepičky je provedeno několika postupnými kroky s účastí několika enzymů: (1) odstranění 5´terminální trifosfátové skupiny RNA trifosfatázou; (2) guanylace mRNA čepičku tvořícím enzymem za vzniku 5´-5´ trifosfátového můstku; (3) metylace guaninu guanin-7metyltransferázou (metyl dodává S-adenosylmethionin, SAM); (4) O2´metylace prvního popř. durhého nukleosidu 2´-O-metyltransferázou. Eukaryotní
mRNA
v konstrastu
s prokaryotní
mRNA
jsou
téměř
vždy
monocistronické. Z tohoto důvodu nebyly u těchto organismů identifikovány terminační sekvence. Výsledkem tohoto faktu je heterogenita 3´-konců primárních transkriptů eukaryot. Naproti tomu, zralé mRNA, vzniklé úpravou těchto primárních traskriptů mají vždy velmi dobře definované 3´-konce. Tyto konce jsou např. u savců vždy tvořeny 3´-polyA koncem o délce až 250 nukleotidů. PolyA konce jsou enzymaticky připojeny k primárnímu transkriptu
Strana 58
Studijní opory biologie
Malý J.:Molekulární biologie
ve dvoustupňové reakci katalyzované komplexem z přibližně 6 proteinů. V prvním kroku dochází k odštěpení 3´-konce primárního transkriptu ve specifické sekvenci zhruba 20 nukleotidů vzdálené od sekvence AAUAAA, která je vysoce konzervovaná u všech eukaryot (vyjma kvasinek). Na štěpení RNA se podílí tzv. restrikční faktor I a II (CFI a CFII). Problém heterogenních konců primárních transkriptů je tak vyřešen. V druhém kroku je syntetizován polyA konec z ATP činností enzymu poly(A) polymerázy (PAP). Ten s pomocí dalšího faktoru (tzv. CPSF faktor) rozpoznává sekvenci AAUAAA a na jejím podkladě zahajuje syntézu polyA konce. Délka polyA konce je rozpoznávána a regulována prostřednictvím vazby proteinu poly(A) – vázajícího proteinu (PAB II) na vznikající polyA konec. Jeho přítomnost na polA reguluje činost PAP. PAP je RNAP, kteráje nezávislá na existenci templátu a prodlužuje mRNA primer od 3´-OH konce. Její struktura byla popsána rentgenovou analýzou (Obr.207). PolyA konec nemá kostitutivní funkci, tj. není translatován. Jeho funkce spočívá v protekci 3´-konce mRNA před působením exonukleáz, přítomných v cytoplazmě. Tento fakt je potvrzen dlouhou dobou existence polyA modifikovaných mRNA v cytoplasmě (hodiny) oproti mRNA bez polyA konce (např. RNA pro histony, 30 minut) a postupnému zkracování 3´-konců mRNA s polyA koncem v průběhu jejich přítomnosti v cytoplasmě. PolyA konec je v nativních podmínkách v cytoplazmě kompletován s tzv. poly(A) vazebným proteinem (PABP), který se výraznou měrou podílý na prodloužení doby života mRNA.
7.2.
Molekulární sestřih mRNA (splicing)
Jedním z největších rozdílů mezi strukturálními geny prokaryot a eukaryot je že, v druhém jmenovaném případě je gen tvořen kodujícími sekvencemi, které jsou přerušeny sekvencemi, které nic nekódují. Objev tohoto typu kódování souvisel s faktem, že původně indentifikovaná RNA v jádře, tzv. heterogenní nukleární RNA (hnRNA) byla jen na výjímky jejích 5´- a 3´konců pozorována v cytozolu, kde dochází k translaci. Vysvětlení tohoto jevu přinesly výzkumy P.Sharpa a R. Robertse, kteří dokázali, že hnRNA podléhá ještě v jádře výrazným změnám, které vedou k vystřižení dlouhých úseků a spojení zbylých úseků. hnRNA je tedy složena z úseků, tzv. intronů, které jsou z hlediska délky velmi variabilní a které nic nekódují (jsou vystřiženy) a kódujících úseků, nazývaných exony (Obr.208). Průměrný počet intronů na jeden gen je ≈ 8, přičemž charakteristická délka je ≈ 3500 nukleotidů. Jejich sekvence je v každém intronu téměř unikátní a nahodilá. Exony jsou zpravidla podstatně kratší s průměrnou délkou nepřesahující 300 nukleotidů. Na počátku je vždy syntetizována mRNA jako ucelená kopie jaderného genu, včetně intronů. Po nasyntetizování čepičky jsou introny Strana 59
Studijní opory biologie
Malý J.:Molekulární biologie
vyštěpeny a exony po stranách vystřiženého intronu navzájem spojeny (Obr.209). Tento proces se nazývá molekulární sestřih, nebo také splicing (genový splicing), který se často provádí kotranslačně, tj. ještě na nehotové, avšak čepičkou opatřené mRNA v jádře. Tento proces je charakteristický vysokou přesností. Každý špatný sestřih, byť by znamenal jen posunutí jednoho nukleotidu, by poskytl zcela jiný protein po translaci. Nedochází ani ke změně pořadí exonů – ve zralé mRNA zcela kopírují jejich polohu na templátové DNA. Srovnávací studie sekvencí v oblasti uzlu mezi exony a introny ukazují, že tyto spoje projevují vysokou míru homologie. Na 5´ konci intronu se vždy nachází invariantní sekvence GU a na 3´konci itronu sekvence AG. Tato struktura začátku a konce intronu je nepostradatelná pro vytvoření struktury, která je nepostradatelná pro proces splicingu (Obr.210). Studie provedené A.Efstradiadisem a T. Maniatisem objasnily mechanismus ekcise (vystřižení) intronu, který probíhá pomocí transesterifikačních reakcí a je obecné povahy u organismů (Obr.211). Excise je započatá vytvořením 2´,5´-fosfodiesterové vazby mezi adenosinem intronu a jeho 5´-koncové fosfátové skupiny (intronu) za současného uvolnění 3´-OH skupiny exonu. Intron tak utvoří novou lasovitou strukturu. Adenosinový zbytek intronu se nachází přibližně 50 bází od 3´-konce štěpeného intronu a často je obklopen konzervovanou sekvencí UACUAAC. V následujícím kroku vytváří volná 3-OH skupina uvolněného exonu fosfodiesterovou vazbu s 5´-terminální fosfátem následujícího exonu, prozatím vázaného s intronem s lasovitou strukturou. Vzniká tak spojení dvou exonů, přičemž vystřižený intron linearizuje a je rychle degradován. Celý proces splicingu nevyžaduje dodání volné energie, neboť se jedná o transesterifikaci, tzn. jedna vazba zaniká ale místo ní vzniká vazba nová. Introny jsou rozděleny dle stuktury a mechanismu do osmi rozdílných skupin, z nichž sedm se vyskytuje u eukaryot (Obr.212). Skupina I intronů se vyskytuje v jádře, michondriích a chloroplastech široké skupiny eukaryot, vyjma obratlovců. Studium těchto typů intronů na prvoku Tetrahymena thermophila vedla T. Cecha k velmi důležitému objevu tzv. selfsplicingu (samosestřih) (Obr.213). U izolovaného primárního transkriptu rRNA, který byl inkubován s guanosinem nebo s GMP, GDP popř. GTP došlo v nepřítomnosti proteinů k samovolnému vystřižení intronu a s spojení příslušných exonů do jednoho řetězce. Tento objev potvrdil, že za určitých okolností se RNA může chovat jako enzym a katalyzovat nejrůznější reakce. Tento proces probíhá ve třech krocích (Obr.214). 3´-OH skupina volného guanosinu vytváří fosfodiesterovou vazbu s 5´-koncem intronu a uvolňuje levý (tj. na 5´konci situovaný) exon. 3´-OH skupina uvolněného levého exonu vytváří fosfodiesterovou vazbu s 5´-terminálním fosfátem pravého (ted na 3´ konci RNA orientovaného) exonu. Dochází tak Strana 60
Studijní opory biologie
Malý J.:Molekulární biologie
ke spojení levého a pravého exonu do jednoho vlákna RNA a uvolnění intronu. 3´-OH skupina intronu vytváří fosfodiesterovou vazbu s fosfátem nukleotidu na 15 pozici intronu od jeho 5´-konce. Dojde tak k vyštěpení krátkého lineárního vlákna a cyklizaci velké části intronu. Tento self-splicing je opět tvořen sledem transesterifikačních reakcí a nevyžaduje dodání volné energie. Další studium vlastností intronu potvrdilo jeho katalytické schopnosti. Ty byly demonstrovány na jeho schopnosti štěpit in vitro poly(C) s urychlením jeho hydrolýzy na C s faktorem 1010. Navíc, kinetika této katalyzované reakce podléhala závislostem Michaelise-Mentenové. Podobné RNA enzymy se dnes označují jako ribozymy. Skupina II intronů se nachází zejména v mitochondriích hub a rostlin a zahrnuje většinu intronů v chloroplastech. I tento typ intronů projevuje self-splicing. Na rozdíl od předchozí skupiny však splicing probíhá přes lasovitou strukturu (viz výše) a nevyžaduje dodání externího nukleotidu. Tyto introny tak procházejí splicingem, který je velmi podobný sestřihu jaderné mRNA. V případě mRNA v jádře je však k sestřihu využit tzv. spliceosom, který je ribonukleotidovou částicí, katalyzující sestřih. Podobnost mechanismu sestřihu se skupinou II intronů vede k teorii, že spliceosom není nic jiného, než původní self-splicing RNA doplněná o proteiny, které její funkci a strukturu upevňují. Podobné úvahy platí i o struktuře a funkci ribozómu. Všechny tyto poznatky vedou k hypotéze, že původním biologicky aktivním katalyzátorem na počátku evoluce života, tj. ještě v před vznikem buňky, nebyly proteiny, ale molekuly RNA. Proteiny byly jako stavební kameny a katalyzátory organismů uplatněny až v pozdějších fázích evoluce makromolekul a života jako takového. Ribozymů bylo do dnešní doby nalezeno a po strukturní stránce charakterizováno několik typů. Příkladem je již výše zmíněný ribozymu ve formě intronu skupiny I (Obr.215). Tento ribozym se skládá z devíti dvojřetězcových segmentů, přičemž aktivní místo vzniká protkáním několika řetězců v centrální oblasti. Jinými typy ribozymů, které jsou dobře popsány jsou ribozymy s kladivovou strukturou (hammerhead ribozymes), vyskytující se u některých rostlinných virů. Název spočívá v charakteristickém uspořádání trojrozměrné struktury, připomínající kladivo. Tyto ribozymy katalyzují transesterifikační reakci, při které je rozštěpena 3´,5´-fosfodiesterová vazba mezi nukleotidy C a A, za vzniku cyklické intramolekulární 2´,3´-fosfodisterové vazby (Obr.216). Jádro eukaryotních buněk obsahuje řadu kopií několika vysoce konzervovaných 60300 nukleotidových RNA, které se nazývají malé jaderné RNA (snRNA, small nuclear RNA). Tyto RNA tvoří komplexy s proteiny, které se nazývají malé jaderné ribonukleoproteiny (snRNP, small nuclear ribonucleoproteins). 5´-konec jedné z těchto RNA, tzv. U1-snRNA (patří do skupiny snRNA s vysokým obsahem U) je částečně komplementární ke konsensus Strana 61
Studijní opory biologie
Malý J.:Molekulární biologie
sekvenci mezi intronem a exonem na 5´-konci vlákna mRNA. Obdobné vlastnosti projevují i U2-snRNP, U4-U6-snRNP (U4 a U6-snRNA jsou spárovány komlementárními bázemi) a U5snRNP. Všechny tyto ribonukleoproteiny se tedy účastní samotného splicingu mRNA v jádře eukaryot a jsou součástí tzv. spliceosomu, tedy struktury, jejíž činností ke splicingu dochází. Spliceosom je ≈ 45 S velká částice, která se skládá z primárního mRNA transkriptu, čtyřech snRNP a nedefinovaného počtu mRNA-vázajících proteinů (dohromady cca 65 proteinů (Obr.217). Funkce spliceosomu je poměrně komplikovaná (Obr.218). Spliceosom se pravděpodobně sestavuje již jako funkční molekula ještě než nasedne na mRNA. Její štěpení je doprovázeno spotřebou ATP. Vznik lasovité struktury transesterifikací v prvním stupni reakce je doprovázen změnou prostorové struktury spliceosomu, která probíhá v šesti stupních. K obdobně rozsáhlým strukturálním změnám spliceosomu dochází i při druhé transesterifikaci a regeneraci spliceosomu. Existuje řada proteinů, které nejsou přímou součástí spliceosomu, avšak na procesu splicingu se nepřímo podílí. Mezi tyto tzv. splicing faktory patří např. splicing faktor 1 (SF1, nebo také BBP) nebo tzv. U2-snRNP přídavný faktor (U2AF). Oba tyto proteiny napomáhají nalézt hranici intronu. Analýzou genomu řady organismů bylo zdokumentováno, že introny se takřka nevyskytují u prokaryotní DNA, jsou přítomné pouze v nevýrazném množství u taxonomicky nižších eukaryot avšak velmi hojné u vyšších eukaryot (vyjímkou jsou geny pro histony a interferony u obratlovců). Z tohoto důvodu je až 80% typického genu obratlovců tvořeno oblastmi, které se neexprimují, tj. obsahují nekódující oblasti ve formě intronů. Jedna z teorií, která se k existenci intronů váže, říká, že intron je ve své podstatě „molekulárním parazitem“ (tzv. junk DNA, junk = odpad). Tato teorie se však zdá být nepravděpodobná, neboť bylo prokázáno, že molekulární sestřih RNA přináší buňce některé podstatné výhody. Splicing je například významným mechanismem pro rychlou evoluci proteinů (viz dále). Druhou výhodou je tzv. alternativní splicing, který umožňuje kódování funkčně i morfologicky zcela odlišných proteinů jedním genem. Tyto mechanismy jsou diskutovány v následujících odstavcích. Mnoho eukaryotních proteinů se skládá z modulů, které se nachází i v jiných proteinech. Příkladem může být tzv. LDL receptor v plazmatické membráně, který váže lipoproteiny s nízkou hustotou (LDL, low-density lipoprotein) a umožňuje jejich transport do buňky endocytózou. Gen pro tento receptor se skládá z 18 exonů, které kódují specifické funkční domény proteinu. 13 těchto exonů je navíc podobných polypeptidickým segmentům jiných proteinů. Např. 5 z těchto exonů kódují sekvenci, která se vyskytuje i u tzv. komplementu C9 (protein, který je součástí imunosystému). Tři exony jsou podobné exonům Strana 62
Studijní opory biologie
Malý J.:Molekulární biologie
v genu pro epidermální růstový faktor (EGF) atd. Je tedy evidentní, že LDL receptor se skládá modulárně uspořádaných exonů, které se vyskytují i v jiných typech proteinů. Podobné uspořádání je typické pro celou řadu dalších eukaryotních proteinů. Je tedy pravděpodobné, že geny, které kódují tyto modulární proteiny, byly vytvořeny postupnou kombinací z různých exonů rekombinací mezi jejich sousedními introny. Tento způsob vytváření nových proteinů přináší velkou výhodu v kombinaci evolučně osvědčených modulů. Evoluce nových proteinů tak nutně nemusí začínat „de novo“, tj. optimalizací jejich primární struktury, ale skládáním funkčních částí v nový celek. Exprese řady buněčných genů je modulována selekcí alternativních míst či způsobů splicingu. Určitý typ exonu v jedné diferencované buňce tak může být součástí intronu v buňce jiné. Klasickým příkladem je krysí gen pro svalový protein α-tropomyosin, který poskytuje 7 rozdílných tkáňově-specifických variant skrze alternativní splicing pre-mRNA (Obr.219). Obdobný mechanismus alternativního splicingu je typický pro všechny mnohobuněčné organismy, obzvláště pro obratlovce. Např. původní odhady počtu strukturálních genů pro člověka (50-140 tis. genů) se ukázaly být nepravdivé, neboť sekvenací bylo zjištěno „pouze“ 30 tis. těchto genů. Rozdíl je dán mechanismem alternativního splicingu, který je prováděn odhadem až v 60% všech lidských strukturálních genů. Mechanismus alternativního splicingu je velmi rozmanitý. Může se jednat o vložení či naopak vystřižení celých funkčních domén, jednotlivých aminokyselin, nebo např. vložení stop kodonu a předčasnou terminaci translace. Výsledkem těchto rozmanitých změn splicingu může být ovlivnění takových vlastností proteinu, jako je jeho rozpustnost v cytoplazmě či naopak vazba v membráně, zda bude podléhat fosforylaci specifickou kinázou či nikoliv, do jakého místa v buňce bude protein lokalizován, zda bude vázat určitý typ alosterického faktoru, jaká bude afinita receptoru ke specifickému ligandu atd. Jelikož je typ splicingu tkáňově či orgánově specifický, musí existovat dokonalá regulace. Častá geneticky kódovaná onemocnění člověka (≈ 15%) jsou způsobena změnou splicingu pre-mRNA v dané tkáni. Pokud dojde např. ke změně místa splicingu bodovou mutací, odhalí se jiné místo splicingu, které poskytne funkčně a morfologicky odlišný protein. Dobře zdokumentované změny splicingu jsou i v případě růstu rakovinového nádoru. Mechanismus alternativního splicingu je dobře popsán pro případ proteinů ovlivňujících pohlaví mušky octomilky (Drosophila) (Obr.220). Jedná se o dva samostatné mechanismy. V prvním případě obsahuje primární transkript proteinu tra (transformer) dvě alternativní místa splicingu na 3´-konci exonu 2. V případě využití tzv. proximálního místa splicingu, který je blíže 5´-konci exonu 1 dojde ke determinaci samčího pohlaví, v případě Strana 63
Studijní opory biologie
Malý J.:Molekulární biologie
využití druhého místa splicingu, které je blíže k 3-konci exonu 2 je determinováno samičí pohlaví octomilky. Princip odlišného štěpení spočívá v existenci stop kodonu UAG mezi těmito dvěma místy splicingu. V případě samečka dojde k vazbě splicingového faktoru U2AF a odhalení stop kodonu, přičemž dojde k předčasné terminaci nefunkčního proteinu. Protein tra tak nevzniká. V případě samiček je však první místo splicingu blokováno vazbou tzv. SXL proteinu (produkt tzv. sex-lethal genu sxl, který je funkční jen u samiček), který blokuje vazbu U2AF. Ten se váže do druhého místa splicingu a zamezuje tak čtení výše zmíněného stop kodonu. Vzniká tak funkční protein tra. V druhém případě se jedná o regulaci splicingu tzv. doublesex (dsx) pre-mRNA. První tři exony jsou vždy konstitutivně tvořeny nezávisle na pohlaví. U samečků však dochází k vystřižení exonu 4 a vzniká tak tzv. DSX-M protein (male specific DSX protein). U samiček však dochází v přítomnosti funkčního proteinu tra (viz předchozí regulační mechanismus) k jeho vazbě do specifických míst v exonu 4, který zaručuje aktivaci alternativního místa splicingu a ponechání tohoto exonu v translatovaném řetezci mRNA. Vzniká tak DSX-F protein (female specific DSX protein). Ten funguje jako represor specifických samčích genů. Obdobné mechanismy alternativního splicingu byly popsány i v případě obratlovců. Dosud popsané mechanismy splicingu se týkaly úprav jednoho vlákna pre-mRNA, tj. jednalo se o tzv. cis-splicing. Naproti tomu existuje způsob splicingu, který probíhá mezi odlišnými vlákny pre-mRNA za účasti spliceosomu tzv. trans-splicingem. Tento způsob je doložen u trypanozóm (zástupce protozoí, způsobují spavou nemoc) (Obr.221). Všechny mRNA tohoto organismu obsahují tzv. leaderovou sekvenci (SL)RNA, která však v genech pro tyto mRNA chybí. (SL)RNA je kódována v samostatném genu a k mRNA každého genu připojena mechanismem trans-splicingu. Tento mechanismus je velmi podobný cis-splicingu, neboť samotná (SL)RNA obsahuje na 5´a 3´-konci konsensus sekvence obdobné těm, které se nachází na koncích intronu a jsou nezbytné pro vazbu spliceosomu. Ten tato místa rozpozná a váže tak vlákno (SL)RNA na pre-mRNA příslušného genu. Obdobný mechanismus se pravděpodobně vyskytuje u nematod a některých zástupců vyšších eukaryot, vč. obratlovců. Dalšími možnými úpravami, který mi může RNA procházet, je záměna nebo vymazání některých bazí v řetězci. Tento proces, který se nazývá editování RNA (RNA editing), zahrnuje např. výměnu jednoho typu báze za jiný typ (např. C za U, U za C), deleci báze (např. U) a inzerci opakujících se G a C zbytků. Příkladem je lidský protein apolipoprotein B (apoB):apoB-48 a apoB-100. Oba proteiny jsou kódovány stejným genem, avšak jejich funkce (transport lipidů a lipoproteinů) a místo tvorby je však zcela jiné. Důvodem je odlišnost jednotlivých mRNA v záměně C za U a vznik nového stop kodonou Strana 64
Studijní opory biologie
Malý J.:Molekulární biologie
UAA na apoB-100 mRNA a tím odlišného produktu. Editační aktivita je zaručena specifickou aktivitou enzymu citidin deaminázy, transformující C na U deaminací. Tento způsob editace se nazývá substituční. Obdobný mechanismus je zdokumentován např. pro glutamátový receptor v nervové tkáni (záměna A na I deaminací , I je modifikovaná báze inosin, viz. další kap., která je překládána jako G). Enzymy, které provádějí tuto substituci se nazývají ADAR1 a 2 (adenosine deaminases acting on RNA). Tyto enzymy se váží pouze do specifických míst, které jsou tvořeny dsRNA vznikající mezi komplementárními sekvencemi exonu a intronu (Obr.222). Tento způsob editace výrazně zvyšuje variabilitu proteinů a napomáhá existenci řady izoforem stejného proteinu.
Strana 65