NMR biomakromolekul Typy biomakromolekul a možnosti studia pomocí NMR ●
●
●
●
proteiny a peptidy – rozmanité složení, omezení jen velikostí molekul nukleové kyseliny (RNA, DNA) a oligonukleotidy – omezení malou rozmanitostí chemického složení polysacharidy a oligosacharidy – omezení malou rozmanitostí chemického složení
RCSB PDB
kombinace výše uvedených
RCSB PDB Progr. NMR
NMR Proteinů • • • • • • • • • •
α
ř
Stavba a struktura proteinů
Ala
Leu
Asp
Lys
Asn
Met
Arg
Phe
Cys
Pro
Glu
Ser
Gln
Gly
Thr
Trp
His
Ile
Tyr
Vznik peptidové vazby: + Ala1
+ Ala2
Ala1–Ala2
H2O
Val
Struktura proteinů
Struktura proteinů U proteinů rozlišujeme čtyři pojmy: primární, sekundární, terciární a kvartérní struktura. ●
Primární struktura udává pořadí aminokyselin v řetězci (sekvence). Píšeme vždy ve směru od N k C konci.
●
Sekundární struktura udává konformaci hlavního řetězce v určitém úseku. Nejčastějšími prvky pravidelné sekundární struktury jsou helikální a extendovaná struktura, které jsou stabilizovány sítí vodíkových vazeb.
helikální struktura (α-helix)
extendovaná struktura (β-sheet)
náhodné klubko (random coil)
●
Terciární struktura je prostorové uspořádání všech atomů proteinu.
●
Kvartérní struktura popisuje strukturu nadmolekulového uspořádání více proteinů.
Využívaná jádra v biomakromolekulách 1H
+ vysoké přirozené zastoupení + vysoká citlivost (1,00) − malá disperse chemických posunů (cca. 15 ppm)
13C
+ velká disperse chemických posunů (cca. 210 ppm) − nízké přirozené zastoupení (1,11 %) − nízká citlivost (1,76.10−4); po 100% isotopovém obohacení 1,59.10−2
15N
• střední disperse chemických posunů (cca. 30 ppm) − nízké přirozené zastoupení (0,37 %) − nízká citlivost (3,85.10−6); po 100% isotopovém obohacení 1,04.10−3
2H
• speciální účely
Zdroje Proteinů • Původní organismus • + přirozená forma včetně všech modifikací • - malé množství, drahé, nemožnost izotopového značení, etické problémy, složitá izolace,…. • Syntéza proteinu v mikroorganismech (E. coli, P. pastoris) • + levné, velký výtěžek proteinu, snadné uniformní izotopové značení • - možné problémy s modifikacemi postranních řetězců • Chemická syntéza • + velké možnosti izotopového značení, rychlé, vhodné pro toxické proteiny • - drahé, menší výtěžky, omezení maximální velikosti, problémy se správným sbalením proteinu • In-vitro translace • + vhodné pro toxické proteiny, možnost selektivního izotopového značení • - drahé, posttranslační modifikace
Specifika řešení struktury proteinů pomocí NMR ●
měření ve fyziologickém prostředí, možnost úpravy fyzikálně-chemických vlastností prostředí
●
sledování průběhu biochemických dějů
●
vysoce selektivní odezva na úrovni atomů
Čím jsme omezeni: ●
velikost molekuly (ovlivnění T2) – do 10 kDa (≡10 kg mol−1) [< 70 AA] □
lze řešit přímo kombinací COSY, TOCSY a NOESY experimentů
– do 20 kDa [< 180 AA] □
nutné 100% isotopové obohacení
13
Ca
15
N
– do ~100 kDa □
100% isotopové obohacení 13C, 15N a částečné nebo úplné obohacení 2H (odstranění 1H jako hlavního zdroje rychlé relaxace 13C)
– větší proteiny □
●
přístupný pouze hrubý „náhled“ na celkovou strukturu, sekundární struktura
koncentrace vzorku – alespoň 0,2 mM
●
dlouhodobá stabilita vzorku – několik týdnů
Vzorek proteinu pro NMR měření ●
nutno dosáhnout koncentrace proteinu alespoň 0,2– 0,5 mmol l−1 (obecně více = lépe) – používá se filtrace přes membrány s mikropóry (protein zadržen) nebo lyofilizace a opětovné rozpuštění
●
úprava pH pufrem (pH typicky 4–8) – vyšší pH by způsobilo rychlou výměnu amidických vodíků s molekulami vody a ztrátu signálů
●
přidání redukčních činidel (R–SH) – zabránění oxidace cysteinů a následného vysrážení vzorku
●
přidání 5–10 % D2O – referenční jádro pro spektrometr (lock)
roztok vzorku 250–300 µl
Obecný postup řešení struktury proteinu pomocí NMR příprava vzorku
✓
obecné informace o molekule (primární struktura, S–S vazby,...)
naměření NMR spekter
výpočet souboru počátečních struktur
přiřazení signálů atomům v molekule
přiřazení NMR parametrů pro výpočet struktury
vyhodnocení kvality struktur oprava přiřazení výpočet souboru struktur validace struktur
1. publikované NMR spektrum proteinu ●
spektrum proteinu RNasy A, měřeno 40 MHz spektrometrem, 1957
Saunders M., Wishnia A. and Kirkwood J.G. (1957) J. Am. Chem. Soc. 79, 3289.
●
40 MHz CW spektrometr
První 1GHz NMR spektrometr ●
1H
instalován firmou Bruker v Centre de RMN à Très Hauts Champs, Lyon, France
NMR spektrum proteinu měřené tímto spektrometrem
Nutný krok – potlačení signálu vody ●
jako rozpouštědlo se používá H2O, ne D2O z těchto důvodů: – jde o fysiologické prostředí – při použití D2O by došlo k výměně amidických vodíků za deuterium
●
●
tím pádem je nutné potlačit dominantní signál H2O, protože její signál je 104– 105krát intensivnější než signály měřené látky spektrum proteinu bez potlačení H2O:
Potlačení signálu H2O – metoda presaturace π/2 selektivní CW-ozařování H2O během relaxační periody
1H
Δ
NMR spektrum proteinu po presaturaci vody
zbytkový signál H2O
Potlačení signálu H2O – metoda WATERGATE ●
spinové echo s pulsními gradienty magnetického pole (π/2)
πy
x
(π/2)-y Δ
1
sel.
(π/2)-y sel.
Δ
H Gz 1H
NMR spektrum proteinu po WATERGATE
zbytkový signál H2O
excitační profil selektivního π/2 pulsu
Jednodimensionální 1H NMR spektrum proteinu charakteristické oblasti výskytu jednotlivých typů 1H signálů aminokyselin – kuřecí lysozym (129 AA, M = 14,6 kDa)
CH3
H aromatické HN peptidické HN postranní
O
H N
C R1 AA1
C H
R2
H N H
C
C O
AA2
H N
O
●
C R3 AA3
C
H alifatické
Hα
●
●
H ●
1H
spinové systémy (3J) jednotlivých aminokyselin jsou odděleny C=O skupinami
1D 1H spektrum tedy obsahuje superposice spekter jednotlivých aminokyselin v daném proteinu a k sekvenčnímu propojení a přiřazení signálů se používají všechna jádra: 1H, 13C a 15N
Vícedimensionální NMR experimenty ●
rozlišení informací obsažených v 1D spektrech – korelace chemických posunů 1H –
13C
–
15N
– propojení spinových systémů jednotlivých aminokyselin – pro dostatečnou citlivost experimentů je nutné použít isotopové obohacení
http://www.protein-nmr.org.uk
1H-15N ●
HSQC – „otisk palce“ proteinu
ověření dobré terciární struktury proteinu, sledování lokálních strukturních změn, interakcí s jinými molekulami, … sbalený protein
nesbalený protein
(ppm)
15N (ppm)
15 N (ppm)
1H
1H
(ppm)
Obecný postup řešení struktury proteinu pomocí NMR příprava vzorku
✓
obecné informace o molekule (primární struktura, S–S vazby,...)
naměření NMR spekter
✓
výpočet souboru počátečních struktur
přiřazení signálů atomům v molekule
přiřazení NMR parametrů pro výpočet struktury
vyhodnocení kvality struktur oprava přiřazení výpočet souboru struktur validace struktur
Interpretace NMR spekter – přiřazení resonancí přiřazení NMR signálů jednotlivým atomům v molekule
●
postup:
1.přiřazení hlavního řetězce (HN, N, Hα, Cα, CO) 2.přiřazení postranních řetězců (především 1H a
●
H
R1
N H
C
C O
H N
C R3
C H
O C
C
H
N
CO
Cα
O
H N
R2
13C)
HN
O
●
je nutné znát sekvenci aminokyselin daného proteinu
α Cβ H
Hβ označení jednotlivých atomů v aminokyselině
Přiřazení resonancí – atomy hlavního řetězce ●
pro přiřazení 1H, 13C a 15N se používá soubor komplementárních třídimensionálních korelačních experimentů – přenos magnetizace pomocí skalárních inerakcí (1J, 2J) základní experimenty (je mnoho dalších kombinací):
C
H
H C
N
C
N H
C O
H C
O
C
H C
C H
N
H N H
CBCANH
C H
H N H
C
C
O
HN(CO)CA
HNCA H
C
C
C H
C
C O
H N
C
H C
C
H
C
H
O
O
N
H
C H
H
H
O
●
H N H
C H C
CBCA(CO)NH
modrá: jádra excitovaná i detekovaná zelená: jádra detekovaná vývojem magnetizace (chemického posunu) červená: jádra použitá pro přenos magnetizace, bez vývoje magnetizace
C O
Přiřazení resonancí – experimenty HNCA a HN(CO)CA 13Cγ 1H
O
15N
55 13C' 15 13Cα 1H
13Cβ
i−1
13Cγ
13Cβ
140 13Cα
15N
7
1H
35
90
55 13C'
11
<1
1H
O
HNCA – po excitaci HiN je magnetizace přenesena na Ni (1JHN,N) a dále současně na Ciα (1JN,Cα) a Cαi−1 (2JN,Cα) – vývoj chemických posunů nastává pro HN, N a Cα – každá H–N skupina dává dva signály o frekvencích {ω(HiN), ω(Ni), ω(Ciα)} a {ω(HiN), ω(Ni), ω(Cαi−1)}
i 13Cγ
HN(CO)CA – po excitaci HiN je magnetizace je přenesena na Ni (1JHN,N), dále na Ci−1 (1JN,C ) a na Ci−1α (1JC ,Cα) – vývoj chemických posunů nastává pro HN, N a Cα – každá H – N skupina dává jeden signál o frekvenci {ω(HiN), ω(Ni), ω(Cαi−1)}
1H
13Cβ
O
1H
35 55 13C' 15
15N
13Cα 1H
13Cβ
i−1
13Cγ
13Cα
15N
7 90
140 55 13C'
11 <1
1H
O
i interakční konstanty J v Hz
Sekvenční propojení hlavního řetězce – HNCA a HN(CO)CA ●
2D řezy spektry HNCA a HN(CO)CA v rovině H–C na frekvencích jednotlivých amidických N HN(CO)CA
HNCA
HN(CO)CA
C N H
někdy chybí pík…
HNCA
HN(CO)CA
HNCA
HN(CO)CA
HNCA
Přiřazení signálů postranních řetězců ●
různé implementace experimentů TOCSY a COSY HC(CCO)NH-TOCSY
H(C)CH-COSY
H H
O
N
C' Cα
H
H
H Cγ
Cβ
H
C' O
Cβ H
H
Cα N
H
Cγ
H
Obecný postup řešení struktury proteinu pomocí NMR příprava vzorku
✓
obecné informace o molekule (primární struktura, S–S vazby,...)
naměření NMR spekter
✓
výpočet souboru počátečních struktur
✓
přiřazení signálů atomům v molekule
přiřazení NMR parametrů pro výpočet struktury
vyhodnocení kvality struktur oprava přiřazení výpočet souboru struktur validace struktur
Interpretace NMR spekter – přiřazení strukturních parametrů NOE ≡ meziatomová vzdálenost skalární interakční konstanta ≡ dihedrální úhel
chemický posun ≡ chemické okolí residuální dipolární interakce ≡ vzájemná orientace vazeb vodíkové vazby ≡ detailní lokální struktura
Nukleární Overhauserův efekt (NOE) ●
přímá dipól-dipólová interakce mezi atomy I a S vlivem křížové relaxace
●
rychlostní konstanta křížové relaxace mezi dvěma jádry 1H, σIS:
γH τc ω
rIS
... ... ... ...
gyromagnetická konstanta 1H korelační čas molekuly Larmorova frekvence vzdálenost interagujících jader
NOE je hlavní zdroj informace o struktuře proteinu. Cílem je nalézt co největší počet NOE interakcí a jednoznačně je přiřadit dvojicím konkrétních vodíkových atomů v molekule. ●Pravidelné prvky sekundární struktury tvoří charakteristické sítě NOE kontaktů. ●Z NOE se nepočítají přesné vzdálenosti vodíků, ale rozdělí se do pásem podle intenzity. ●Např. (1,8–2,5) Å; (1,8–3,5) Å; (1,8–5) Å. ●
dosah interakce do 5–6 Å
H H
X-editované NOESY experimenty ●
excitace pouze 1H atomů vázaných na atomy 15N nebo 13C, přenos magnetizace vlivem NOE na blízké atomy 1H, detekce
1
H
řez 3D spektrem v rovině 1HN–1H na pozici 122 ppm v 15N doméně = signál Tyr66
1H N
Skalární interakce – zjištění dihedrálních úhlů ●
peptidová vazba tvoří rovinu definovanou atomy O–Cα–N–HN
●
vzájemná orientace dvou sousedních peptidových vazeb, a tedy i konformace páteře proteinu je určena dihedrálními úhly φaψ – φ (C
–N–Cα–C
)aψ
(N–Cα–C
Karplusova rovnice
●
– závislost velikosti interakce 3J na dihedrálním úhlu (θ) – konstanty A a B zjištěny pro různé kombinace interagujících jader problém: jedné hodnotě 3J mohou odpovídat až čtyři hodnoty dihedrálního úhlu
●
–N)
3J
H–N–Cα–H
10
8
N
H–N–Cα–CO
H–N–Cα–Cβ
6
C '
4 2
C
N
C '
0 [Hz]
-120 0 CO–N–Cα–H
60
120
θ [deg]
Chemický posun ●
chemický posun některých jader je charakteristicky závislý na sekundární struktuře
chemický posun
α-helix
přiřazení resonancí hlavního řetězce (Hα, Cα a C') výpočet indexů chemického posunu (CSI)
odhad sekundární struktury podle lokální hustoty CSI
δ(Hα)
klesá
roste
náhodné klubko
β-sheet
Histogram indexu chemického posunu jader Hα, Cα a C' −1 0 +1
sekvence proteinu C
N
helix I
helix II
helix III
helix IV
Residuální dipolární interakce (RDC) ●
přímá dipól–dipólová interakce dvou jader – v isotropním roztoku nedetekovatelná – pozorovatelná v neisotropním prostředí u molekul částečně orientovaných vůči magnetickému poli
●
tvorba neisotropního prostředí – kapalné krystaly [fosfolipidy, PEG, proteiny (virové částice, bakteriorhodopsin)], zmáčknutý polyakrylamidový gel – samotné vnější magnetické pole
●
●
příspěvek ke skalární interakci ⇒ snadná měřitelnost velikost interakce DIS závisí na orientaci vazby vůči směru B0
Θ
S I
rIS
Θ...úhel mezi vektorem I–S a B0
fosfolipidové bicely orientované v magnetickém poli
Vodíkové vazby ●
identifikace: – výměnné experimenty H ↔ D – teplotní závislosti chemických posunů
●
charakterizace: – měření skalární interakce (J) přes H-vazbu
●
stabilizace pravidelných sekundárních struktur vodíkovými vazbami
Obecný postup řešení struktury proteinu pomocí NMR příprava vzorku
✓
obecné informace o molekule (primární struktura, S–S vazby,...)
naměření NMR spekter
✓
výpočet souboru počátečních struktur
✓
přiřazení signálů atomům v molekule
přiřazení NMR parametrů pro výpočet struktury
✓
vyhodnocení kvality struktur oprava přiřazení výpočet souboru struktur validace struktur
Přiřazení resonancí a) páteř b) postranní řetězce
Strukturní omezení z NMR parametrů vzdálenosti z NOE kontaktů (intra- a interresiduální) ✔
dihedrální úhly ze skalárních interakčních konstant ✔
relativní orientace vazeb z dipolárních kaplingů ✔
případně další omezení
✔
Identifikace prvků sekundární struktury
Výpočet trojrozměrné struktury molekulová mechanika + simulované žíhání
Výpočet struktury proteinu ●
molekulová mechanika v prostoru kartézských souřadnic (Newtonovy pohybové rovnice) nebo torsních úhlů (Lagrangeovy rovnice)
použití všech dostupných experimentálních omezení, minimalizace celkové energie systému –simulované žíhání: molekula se ohřeje na vysokou teplotu (103 K) a nechá se postupně chladnout. Po každém ochlazení se vypočítá nová energie systému. Cílem je překonat lokální energetická minima a najít (nejlépe) to globální. –přidáme nové energetické členy pro experimentální omezení: čím bližší bude shoda vypočítané struktury s experimentálními údaji, tím nižší bude celková energie –například pro NOE: ●
energetická plocha v závislosti na dvou dihedrálních úhlech v disacharidu
V případě proteinu se jedná o plochu závislou na n proměnných (n je počet optimalizovaných souřadnich/úhlů).
Vypočítané struktury
●
obdržíme soubor velice podobných struktur s minimálními energiemi – Nejedná se o jedinou strukturu jako v případě rentgenové krystalografie, ale o soubor struktur. NOE omezení se totiž nezadává jako fixní vzdálenost, ale jako interval vzdálenosti. Souboru NOE tedy bude vyhovovat více struktur, které by se ovšem měly lišit jen nepatrně.
– Větší rozptyl struktur v určité oblasti může být způsoben nedostatkem experimentálních dat nebo zvýšenou pohyblivostí dané části proteinu.
●
struktura matrixového proteinu Masonova-Pfizerova opičího viru
soubor struktur RMSD = 1,3 Å (jen helikální oblasti)
vybraná reprezentativní struktura
Interakce proteinu s ligandem • • • •
Protein-protein, protein-NK, protein-malá molekula, oligomerace Interaguje specificky? Kde interaguje? Síla interakce (vhodné i pro slabší interakci)
• •
Farmaceutický průmysl Proteomické studie
• • • • • • •
Metody pro měření interakce pomocí NMR Sledování změn chemických posunů Intermolekulární NOE Transferred NOESY Mapování H-D chemické výměny NH skupin Mapování pomocí paramagnetické látky Sledování změny dynamiky proteinu
Změny chemických posunů • Titrace proteinu ligandem • Sledování změn chemických posunů skupin (nejčastěji HN) • Interakční povrch • Disociační konstanta
STD – Saturation transfer difference • • • • •
Interakce protein-malá molekula Ozáření proteinu a přenos magnetizace na ligand během interakce Přebytek ligandu Zjistíme, která část ligandu interaguje Odhad KD
STD – Saturation transfer difference
Transferred NOESY H r<5Å
H • Princip: •
H NOE
chemická výměna
r>5Å
H
informace o struktuře ligandu ve vázaném stavu je pomocí chemické výměny přenesena na ligand ve volném stavu, kde je detekována
• Uspořádání: „malý“ ligand, který je viditelný NMR spektroskopií a velký • Podmínka • Využití: • •
substrát (Mw > 40 kDa) neviditelný pro NMR
vhodná kinetika systému 10-8 > Kd > 10-3 M-1 - struktura ligandu - nepřímo struktura vazebného místa - způsob vazby
•Peptid antikolagulační kaskády •Inhibitor trombinu
Interakce fragmentu trombomodulinu s trombinem • 18 aminokyselin z vazebného místa trombomodulinu
NOESY spektrum fragmentu trombomodulinu za přítomnosti trombinu
NOESY spektrum samotného fragmentu trombomodulinu
Důležité NOE interakce dalekého dosahu ligandu TM52+5C v komplexu s thrombinem
Struktura komplexu thrombinu Complex between thrombin and TM52+5C a ligandu TM52+5C
Intermolekulární NOE • NOE efekt mezi dvěma molekulami • U složitějších systémů vhodné odfiltrovat intermolekulární NOE • Rozdílné izotopové značení • 13C filtrované 13C editované NOESY
13C
filtrované 13C editované NOESY
• Vychází z 13C editovaného NOESY • Obsahuje filtr, na NOE mezi 1H na 13C • Projeví se NOE jen mezi 1H na 13C a 1H na 12C
Neznačený ligand
protein (13C značený)
13C 13C
filtrované 13C editované NOESY
editované NOESY
13C
filtrované 13C editované NOESY
1H
1H
1H
Studium dynamického chování molekul ●
molekuly nejsou statické, pohybují se v různých časových škálách – různě rychlé pohyby se vzájemně doplňují
●
funkce mnoha biomolekul závisí na jejich flexibilitě – regulace dějů, interakce molekul, oligomerizace
●
vypočítaná struktura je někdy průměrem více konformerů – možnost charakterizace časové škály pohybů
– různé relaxační mechanismy postihují různé časové škály molekulárních pohybů lokální pohyby globální pohyby příklady jevů
pohyb N–H rotace CH3
ps
pohyb smyček
ns
relaxace R1, R2, het. NOE
metody studia
pohyb domén
μs
transport, katalýza, další biologické děje...
ms
s
relaxace R1ρ, CPMG analýza tvaru signálu saturation transfer, NOESY výměna H/D
>s