Struktura proteinů a funkce enzymů RNDr. Tomáš Obšil, PhD. Katedra fyzikální a makromolekulární chemie Přírodovědecká fakulta UK v Praze
[email protected]
HT
TH
1. Struktura proteinů Proteiny se skládají z jednoho či více polypeptidových řetězců, což jsou lineární polymery aminokyselinových zbytků. Prostorovou strukturu proteinů můžeme rozdělit do několika úrovní: primární, sekundární, terciární (super-sekundární a doménová) a kvartérní. Primární struktura: je dána chemickou povahou polypeptidového řetězce proteinu, tzn. počtem a pořadím aminokyselinových zbytků spojených navzájem peptidovou vazbou. Sekundární struktura: Sbalení polypeptidového řetězce v důsledku vytváření vodíkových vazeb mezi karbonylovými a imidovými skupinami hlavního řetězce proteinu. Terciární struktura: Prostorové uspořádání všech atomů v jednom polypeptidovém řetězci. Dále se dělí na supersekundární strukturu (strukturní motivy) což je spojení několika málo elementů sekundární struktury skrze interakce postraních řetězců; a domény což jsou shluky strukturních motivů. Kvartérní struktura: Agregace jednotlivých polypeptidových řetězců při vytváření funkčního proteinu. 1.1 Primární struktura V proteinech se přirozeně vyskytuje 20 různých aminokyselin. Pořadí aminokyselin v polypeptidovém řetězci představuje tzv. primární strukturu proteinu. Tato primární struktura obsahuje veškerou informaci nutnou pro vytvoření 3D struktury.
Téměř všechny aminokyseliny, které vytvářejí přirozené proteiny mají L-formu. Písmeno L- znamená, že amino skupina je nalevo (L-eft side) ve Fisherově projekci sloučeniny. Jediná aminokyselina, která není v L-formě je glycin. Tato aminokyselina má místo vedlejšího řetězce atom vodíku. Proto Cα atom této aminokyseliny není chirální (tzn. aminokyselina nevytváří stereoisomery). 1
Centrální atom aminokyseliny, který je chirálním
centrem je označen Cα. Všechny aminokyseliny, které se vyskytují v bílkovinách mají L-konfiguraci na tomto chirálním atomu.Tato konfigurace se také označuje jako zákon „CORN“. Představte si, že se díváte ve směru H−Cα vazby tak, aby H atom byl blíže k pozorovateli. Když budeme postupně ve směru hodinových ručiček „číst“ skupiny navázané na Cα atomu, tak získáme slovo CORN.
U
aminokyselin s D-konfigurací slovo CORN získáme čtením proti směru hodinových ručiček.
Aminokyseliny můžeme rozdělit podle jejich fyzikálně-chemických vlastností do několika skupin: Alifatické: alanin (Ala, A), glycin (Gly, G), isoleucin (Ile, I), leucin (Leu, L), prolin (Pro, P), valin (Val, V) Aromatické: fenylalanin (Phe, F), tryptofan (Trp, W), tyrosin (Tyr, Y) Kyselé: kyselina asparágová (Asp, D), kyselina glutamová (Glu, E) Zásadité: arginin (Arg, R), histidin (His, H), lysin (Lys, K) Obsahující hydroxylovou skupinu: serin (Ser, S), threonin (Thr, T) Obsahující síru: cystein (Cys, C), methionin (Met, M) Amidické: asparagin (Asn, N), glutamin (Gln, Q) Dvě aminokyseliny spolu mohou reagovat za vzniku větší molekuly (dipeptidu) a uvolnění molekuly vody jako vedlejšího produktu. Vazba C−N, která se vytvořila mezi dvěmi aminokyselinami se nazývá peptidová vazba. Termín „peptidová vazba“ značí přítomnost peptidové skupiny −CONH−.
2 Jednotlivé aminokyseliny jsou v proteinech spojeny prostřednictvím peptidových vazeb.
Lineární polypeptidový řetězec se „sbaluje“ do určitého 3D uspořádání (struktury). Proteiny, které „rozbalíme“ in vitro se za vhodných podmínek mohou opět sbalit do své původní 3D struktury. Zdá se tedy, že všechny informace o tom jak má 3D struktura vypadat jsou obsaženy v primární struktuře. Proteiny se proto mohou sbalovat zcela samostatně (existují však výjimky - některé proteiny pro své sbalení in vivo potřebují pomoc dalších molekul tzv. molekulových chaperonů). Geometrii peptidové vazby definujeme pomocí tzv. torzních úhlů. Obrázek č. 3 ukazuje tři hlavní torzní úhly polypeptidového řetězce. Jsou to úhly phi, psi a omega. Planarita peptidové vazby je dána úhlem omega, který má hodnotu 180 stupňů u většiny peptidových vazeb. Ve vzácných případech je omega = 0 stupňů pro tzv. cis peptidové vazby, které se většinou vyskytují u aminokyseliny prolinu (Pro, P). 3
Tři hlavní torzní úhly polypeptidového řetězce.
1.2 Sekundární struktura Sekundární strukturou označujeme lokální sbalení polypeptidového řetězce v důsledku vytváření vodíkových vazeb mezi karbonylovými a imidovými skupinami hlavního řetězce proteinu. V proteinech se běžně vyskytují tři typy sekundární struktury: alfa helixy, beta listy a ohyby. Uspořádání, která nemohou být klasifikovány ani jedním z těchto tří základních typů sekundární struktury se označují jako tzv. struktury náhodného klubka.
Helixy. V helikálním uspořádání je prostorový vztah mezi dvěmi po sobě jdoucími peptidovými jednotkami stejný pro všechny Cα atomy. To znamená, že dvojice dihedrálních úhlů phi a psi je stejná pro všechny aminokyselinové zbytky v helixu. Helixy jsou klasifikovány jako repetitivní sekundární struktura. protože dihedrální úhly hlavního řetězce se neustále opakují (pro ideální pravotočivý alfa helix je phi = -57,8 a psi = -47 stupňů). Nejčastější helikální konformace je alfa helix (viz. obrázek č. 4). Průměrná délka alfa helixu je 10 zbytků a průměrné dihedrální úhly jsou phi = -64 ± 7 a psi = -41 ± 7 stupně. 4
4. Dvě různé grafické reprezentace alfa helixu. Vlevo je tzv. tyčinkový
model, kde každá tyčinka reprezentuje jednu chemickou vazbu. Atomy uhlíku jsou žluté, kyslíku červené a dusíku modré. Vpravo je stužkový diagram, který znázorňuje průběh hlavního řetězce.
Skládaný list. Struktura skládaného listu (beta struktura) je také druh repetitivní sekundární struktury. Základním stavebním kamenem beta listu je beta vlákno s dihedrálními úhly přibližně phi = -120 a psi = +120 stupňů. Jedná se o nata-ženou strukturu, která není stabilizována vnitřními vodí-kovými vazbami. Tato struktura je stabilní pouze jako součást beta listu, který je stabilizován vodíkovými vazbami a van der Waalsovými interakcemi mezi sousedními vlákny. Beta listy nalézáme ve dvou formách antiparalelní a paralelní podle relativní orientace jednotlivých vláken. 5
Stužkový model struktury proteinu thioredoxinu, který
obsahuje beta list s pěti vlákny přičemž tři vlákna jsou paralelní a tři antiparalelní. Beta struktura je žlutá, alfa helixy jsou červené.
Ohyby. Ohyby jsou další druh sekundární struktury, který často nalézáme u globulárních proteinů v místech, kde je nutné obrátit směr polypeptidového řetězce. Ohyby se nejčastěji nalézají na povrchu proteinů a obsahují převážně polární a nabité aminokyseliny. Na ohybech často nalézáme místa pro fosforylaci, glykosylaci, hydroxylaci, nebo vazbu protilátek. Přibližně 80-90% aminokyselinových zbytků globulárních proteinů lze přiřadit jeden z typů sekundární struktury: alfa helix, beta list, nebo ohyb.
1.3 Terciární struktura Historická definice terciární struktury ji definuje jako popis prostorového uspořádání elementů sekundární struktury v rámci jednoho polypeptidového řetězce. I když je tato definice stále platná, byly definovány detailnější úrovně terciární struktury. Byl zaveden termín supersekundární struktura, protože bylo zjištěno, že určitá uspořádání po sobě jdoucích elementů sekundární struktury (alfa helixů a beta vláken) jsou přítomna v řadě různých proteinových struktur i se zcela různými sekvencemi. Mezi klasické příklady supersekundární struktury patří např. alfa-alfa motiv (dva protiběžné alfa helixy spojené smyčkou, která mění směr polypeptidového řetězce o 180 stupňů), beta-beta motiv (dvě protiběžná beta vlákna spojená smyčkou), beta-alfa-beta motiv (dvě rovnoběžná beta vlákna oddělená alfa helixem, který je vůči nim kolmý). Motivy supersekundární struktury opět mohou vytvářet kombinace, které se opakovaně vyskytují ve struktuře různých proteinů. Tyto uspořádání nazýváme domény (nebo také tzv. sbalení). Příkladem může být svazek čtyř helixů skládající se ze dvou alfa-alfa motivů spojených smyčkou, nebo tzv. Rossmanovo sbalení což jsou dva beta-alfa-beta motivy, které sdílejí alfa helix. Domény mohou být také chápány jako navzájem propojené více či méně strukturně a funkčně nezávislé jednotky. Každá z domén může být popsána podle typu sbalení. Zatímco některé proteiny se skládají pouze z jedné domény, jiné mohou obsahovat několik domén. Terciární struktura tedy popisuje strukturu vzniklou spojením domén (vše v rámci jednoho polypeptidového řetězce).
6
(A) Terciární struktura DNA-vazebné domény transkripčního faktoru FoxO4. Jedná se o tzv. „sbalení
okřídleného helixu“. Písmeno N označuje konec s volnou amino skupinou, písmeno C konec s volnou karboxylovou skupinou. Alfa helixy jsou znázorněny červeně, beta vlákna žlutě a ohyby zeleně. (B) Terciární struktura enzymu triosafosfátisomerasy. Jedná se o skládaný list s osmi vlákny , které vytvářejí válcovou strukturu známou jako beta soudek. Spojky jednotlivých beta vláken obsahují alfa helixy.
1.4 Kvartérní struktura Některé proteiny, např. myoglobin, se skládají pouze z jednoho polypeptidového řetězce. U jiných proteinů biologicky funkční jednotku představuje agregát několika kopií stejného řetězce. Např. kvartérní struktura hemoglobinu se skládá ze čtyř řetězců. Existují i proteiny obsahující jednu či více kopií různých řetězců. 2. Rentgenová krystalografie Ke studiu struktury proteinů se používá celá řada experimentálních technik. Ke studiu terciární struktury proteinů se hlavně používají dvě metody: rentgenová krystalografie a nukleární magnetická rezonance (NMR). Rentgenová krystalografie je experimentální technika, která využívá difrakce rentgenového záření na krystalech. Rentgenové záření o vlnové délce ~ 10-10 m je rozptylováno elektronovými obaly atomů, které mají podobnou velikost. Ze získaného difrakčního obrazu krystalu lze vypočítat elektronovou hustotu molekul či atomů ze kterých se krystal skládá. Pro výpočet map elektronové hustoty je však nutné vyřešit fázový problém což znamená určit fázové posuvy difraktovaných vln. Jakmile získáme mapu elektronové hustoty můžeme začít vytvářet model struktury molekuly. V průběhu stavby modelu probíhá neustálé porovnávání s experimentálními daty. Výsledkem je poměrně přesná molekulární struktura. 2.1 Princip metody Nejběžnější způsob krystalizace proteinů je metoda visící kapky. Experiment probíhá tak, že kapku (o objemu 1-5 µl) obsahující různé množství solí, alkoholů a proteinu umístíme na malé sklíčko. Sklíčko (a s ním i kapka) je umístěno nad roztok (o objemu 1 ml), který obsahuje kromě proteinu ty samé komponenty jako kapka, ale ve větší koncentraci. Celý systém se utěsní a uskladní se při konstantní teplotě (např. 4 C nebo 23 C). Díky rozdílné koncentraci solí v kapce a roztoku dochází k pomalé difůzi par z kapky do roztoku a tím i k pomalému zahušťování roztoku proteinu v kapce. Během tohoto zahušťování doufáme, že se dostaneme do podmínek vhodných pro nukleaci a růst krystalu. Hledání vhodných podmínek pro krystalizaci proteinu může trvat dny, měsíce ale i roky…
Dalším krokem je příprava krystalu pro vlastní difrakční měření. Při těchto měřeních je ale krystal vystaven extrémně intenzivnímu rentgenovému záření, které velmi účinně krystal ničí. Pro potlačení radiačního poškození je proto nutné měřit difrakci při velmi nízké teplotě 100 K nebo méně a voda v okolí a uvnitř krystalu se musí aspoň částečně nahradit kryoprotekční látkou, která zabrání vzniku ledových krystalů. Proto musíme připravené krystaly opatrně přenést do roztoku jednoho či více kryo-protektantů: alkoholů, cukrů atd. Při difrakčním experimentu je malý proteinový krystal (velikost kolem 0,1 mm) umístěn do velmi intenzivního paprsku rentgenového záření. Difraktované paprsky jsou detekovány pomocí plošného detektoru. Během měření je krystal většinou chlazen na teplotu přibližně 100 K pro omezení radiačního poškození. Difrakční obrazec se skládá ze skvrn (tzv. reflexí) o různé intenzitě. Během experimentu krystal pomalu rotuje a pro každou orientaci je změřen samostatný difrakční obraz. Intenzita a poloha skvrn je následně zpracována a výsledkem je seznam indexovaných skvrn a jejich intenzit. Rentgenové paprsky jsou krystalem rozptylovány pod určitými úhly. Čím větší je odklon rozptýlených paprsků od původního směru tím větší je tzv. rozlišení získaných dat. Toto rozlišení určuje jak velké detaily budeme schopni rozlišit v konečném modelu struktury proteinu. Čím větší rozlišení tím lépe, protože budeme schopni vytvořit detailnější model. Jednotlivé reflexe vznikají v důsledku interference vln rozptýlených rovnoběžnými rovinami krystalu. W. L. Bragg ukázal, že množina rovnoběžných rovin krystalu navzájem vzdálených na vzdálenost d difraktuje paprsek jestliže rentgenové záření o vlnové délce λ dopadá a odráží se pod úhlem θ, který splňuje podmínku: 2d sinθ = nλ, kde n je celé číslo. Pomocí difrakčního experimentu získáme intenzity difraktovaných paprsků. Tato informace však nestačí k rekonstrukci „obrazu“ molekuly (tzn. její elektronové hustoty). Difrakce nám poskytuje fourierovu transformaci obrazu elektronové hustoty uvnitř krystalu. Pro získání mapy elektronové hustoty proto musíme aplikovat inverzní fourierovu transformaci a interpretací mapy elektronové hustoty vytvořit model molekuly. Problém je však v tom, že to co měříme jsou pouze intenzity (přesněji amplitudy rozptýlených vln) a fáze rozptýlených vln jsou ztraceny. Tento problém se v krystalografii nazývá fázový problém. Pro získání fázové informace je zapotřebí použít speciální metody. V posledních 50 letech byly vyvinuty 4 základní metody řešení fázového problému: Molekulové nahrazení. Pravděpodobně nejjednodušší a nejrychlejší metoda řešení fázového problému. Nicméně musíme mít k dispozici známou strukturu podobné bílkoviny. Tato podobná struktura je pak použita jako tzv. vyhledávací model. Správné umístění vyhledávacího modelu umožní výpočet fází a tím i vyřešení struktury.
Přímé metody (ab inicio). Tyto metody se snaží odvodit fázovou informaci využitím vztahů mezi fázemi na základě pozorovaných intenzit. Tyto metody fungují velmi dobře při řešení struktur malých molekul (nízkomolekulární látky nebo velmi malé proteiny). Isomorfní nahrazení (a velmi podobná metoda anomální disperse). Často používaná metoda. Tato metoda vyžaduje vložení těžkých atomů (např. U, Hg, W, Xe) do krystalové struktury, který způsobí malé, ale signifikantní změny intenzit jednotlivých reflexí. Rozdíly mezi daty naměřenými u nativního a modifikovaného krystalu umožňují určit přesnou polohu těžkých atomů a na základě této polohy vypočítat fáze těžkých atomů. V případě, že budeme mít k dispozici data alespoň ze dvou různých derivátů, můžeme z fází těžkých atomů určit celkovou fázovou informaci. Anomální rozdíl.
Tato metoda je v podstatě velmi podobná metodě isomorfního
nahrazení. V tomto případě však rozdíly v intenzitách reflexí pocházejí z difrakce, která se provádí v blízkosti absorpční čáry určitých atomů krystalu. Během takového měření dochází k porušení symetrie tzv. Friedelových párů (symetricky související reflexe). Změnou energie rentgenových paprsků (tzn. změnou vlnové délky) také můžeme ovlivnit difrakční vlastnosti určitých atomů, což umožňuje získat velmi přesnou fázovou informaci. Tato metoda má celou řadu výhod, např. v principu umožňuje získat všechny potřebné informace z jednoho krystalu a proto zde nejsou problémy s neisomorfností mezi nativním a derivovaným krystalem. Další výhodou je, že jako těžké atomy můžeme použít přirozeně se vyskytující atomy jako Se a S a nemusíme provádět žádnou dodatečnou inkorporaci těžkých atomů. Jakmile se nám podaří vyřešit fázový problém můžeme vypočítat mapu elektronové hustoty. V této 3D mapě se poté vytváří model struktury proteinu, přičemž neustále probíhá srovnávání modelu s experimentálními daty (tzn. porovnáváme teoretický difrakční obraz vypočtený na základě modelu s experimentálním). Po vyřešení struktury proteiny můžeme začít s interpretací struktury např. dedukovat možný mechanismus funkce proteinu (enzymu), navrhovat strukturu inhibitoru, objasnit mechanismus disfunkce atd.
7
(A) Mapa elektronové hustoty. (B) Mapa
elektronové hustoty s modelem struktury proteinu. Atomy uhlíku jsou žluté, kyslíku červené a dusíku modré.
3. Interpretace struktury – dedukce mechanismu funkce enzymů 3.1 Princip katalýzy Katalyzátor je látka, která urychluje chemickou reakci aniž by byla spotřebovávána v průběhu reakce. Katalyzátor snižuje aktivační energii reakce čímž vytváří novou reakční cestu umožňující urychlení reakce beze změny teploty. Katalyzátor neovlivňuje rovnovážnou konstantu reakce, pouze ovlivňuje rychlost dosažení rovnováhy. Enzymy jsou proteiny, které katalyzují chemické reakce. Hlavní rozdíly mezi anorganickými katalyzátory a enzymy jsou: Větší urychlení reakční rychlosti (103 – 1017 x). „Normálnější“ reakční podmínky (teplota, pH, tlak). Podstatně větší specifičnost pro substrát a mechanismus reakce. Podléhají regulaci. Řada enzymů potřebuje pro svoji katalytickou činnost nebílkovinnou složku (kofaktor). Kofaktorem mohou být anorganické ionty nebo organické látky, tzv. koenzymy. V případě, že se kofaktor váže na enzym reverzibilně nazýváme ho kosubstrátem. V případě nereverzibilní vazby se jedná o prostetickou skupinu. Rozdíl standardní Gibbsovy energie reaktantů a produktů (∆G°) reakce určuje rovnovážnou konstantu reakce podle vztahu: ln K = −
∆G ο
RT ,
kde K je rovnovážná konstanta, R univerzální plynová konstanta a T absolutní teplota. Rozdíl mezi Gibbsovou energií reaktantů a přechodného stavu (aktivovaného komplexu) odpovídá tzv. aktivační energii (∆Gact) a určuje rychlost reakce (tzn. jak rychle je dosaženo rovnováhy). Vztah mezi ∆Gact a rychlostní konstantou reakce k’ je:
k' =
kT − ∆G act / RT e h ,
kde k je Boltzmanova konstanta a h Planckova konstanta. Z tohoto vztahu plyne, že rychlost chemické reakce závisí na ∆Gact exponenciálně. Proto i malé snížení ∆Gact může dramaticky
zvětšit reakční rychlost. Enzymy jsou schopny urychlit chemickou reakci řádově 107-1014 x, ale v některých případech to může být i 1017 x. 3.2 Příklad navržení katalytického mechanismu enzymu na základě 3D struktury Existuje mnoho enzymů jejichž katalytický mechanismus byl objasněn na základě vyřešení 3D struktury. Příkladem může být enzym serotonin N-acetyltransferasa. Tento enzym katalyzuje přenos acetylové skupiny z AcCoA na serotonin za vzniku N-acetylserotoninu, který je prekurzorem neurohormonu melatoninu. V roce 1999 byla publikována krystalová struktura tohoto enzymu s navázaným inhibitorem (Obr. č. 8). Tento inhibitor je svojí chemickou strukturou velmi podobný reakčnímu meziproduktu. 8
Struktura serotonin N-acetyltransferasy s navázaným
inhibitorem.
Na základě této struktury byl navržen katalytický mechanismus reakce. Jedná se o příklad obecné acido-basické katalýzy. Primární amino skupina alkylaminů jako je serotonin nebo tryptamin má kyselou disociační konstantu pKa ~10, tzn. že za fyziologických podmínek je tato skupina protonizována. Přenos acetylové skupiny však může proběhnout pouze na deprotonizovanou amino skupinu. Proto byla intenzivně hledána skupina, která v tomto případě slouží jako akceptor protonu, tedy tzv. obecná base (např. aminokyselina histidin). Až vyřešení krystalové struktury komplexu s inhibitorem ukázalo, že akceptorem protonu není aminokyselina, ale molekula vody, která je prostřednictvím tří vodíkových můstků fixována v těsné blízkosti atomu dusíku amino skupiny (obrázek č. 9). Hydroxylová skupina tyrosinu 168 potom funguje jako obecná kyselina a podílí se na vzniku SH skupiny CoA (koenzym A). 9
Detailní pohled do aktivního centra enzymu
serotonin N-acetyltransferasy. Šipky označují molekulu vody a hydroxylovou skupinu tyrosinu 168, které jsou klíčové pro funkci enzymu. Atomy uhlíku jsou žluté (nebo zelené v případě inhibitoru), kyslíku červené, dusíku modré a síry oranžové.