Řešení struktury proteinů pomocí NMR spektroskopie
Využití NMR spektroskopie v jednotlivých oborech podle nositele Nobelovy ceny za chemii Prof. Richarda Ernsta:
Medicine Biochemistry Chemistry
Physics
J.W. Emsley: “NMR started as the plaything of the physicists, became the favourite toy of the chemists and finally went on to seduce biochemists.”
Důvody pro využití NMR spektroskopie ke studiu biomolekul
fyziologické prostředí jednoduchá příprava vzorku
vysoce selektivní odezva široký rozsah fyzikálně-chemických vlastností protože se zabýváme NMR spektroskopií
1. Jaké typy biologicky aktivních molekul ?
peptidy a proteiny
nukleové kyseliny
oligosacharidy
2. Jaký typ informace může být pomocí NMR získán?
identifikace substrátu
prostorová struktura molekuly
studium dynamického chování systému
prostorová struktura komplexu
zkoumání vazby ligandu a substrátu
Strategie pro určování struktur biomolekul NMR vzorek NMR spektra
Přiřazení signálů
NMR experimenty
Přiřazení experimentálních NMR parametrů (NOE…)
Obecné informace o molekule (primární struktura, kovalentní vazby…)
Odhad přibližné struktury
Zhodnocení kvality struktur
Oprava přiřazení NMR parametrů, signálů
Výpočet souboru struktur
Výpočet statistických údajů pro soubor konečných struktur
Porovnání s databázemi (Procheck, Whatif….)
Výpočet NOESY spekter
Požadavky na vzorek pro NMR experimenty
Úspěšné řešení proteinových struktur bezpodmínečně vyžaduje kvalitní spolupráci mezi NMR specialisty a biochemiky !
Vzorek musí zůstat aktivní a nedenaturovaný během NMR experimentů !!! rozpouštědlo H2O + 5-10% D2O (časová stabilizace magnetického pole) pufr
nejběžnější je fosfátový pufr, neobsahuje žádné protony acetátový pufr (lze pořídit deuterovaný)
teplota
podle požadavků studovaného materiálu (15 – 40C)
aditiva
nutná aditiva je možné někdy zaměnit za deuterovaná analoga
koncentrace pro NMR experimenty musí být v rozsahu alespoň 0.1-1.0 mM, vzorek nesmí podléhat agregaci, koagulaci, sebezničení v tomto konc. rozmezí stabilita nutná dlouhodobá stabilita v rozsahu minimálně několika týdnů
Příprava vzorku proteinu pro NMR měření 1. Získání DNA proteinu 2. Příprava plasmidové DNA 3. Exprese rekombinantního proteinu, např. v E.Coli 4. Izolace a čištění 5. Zakoncentrování vzorku
6. Zopakování procesu se značeným médiem
Příprava vzorků se zvýšeným obsahem
13C/15N
C C
H
C
H CO
C CO
N
C
H
H
H
Exprese proteinů: - v minimálním médiu (15NH4Cl, 15NH4SO4 - jediný zdroj 15N ) (13C-glukosa, 13C-glycerol - jediný zdroj - izotopově obohacené růstové médium
13C)
Segmentové izotopové obohacení
Capsidový protein HIV-1 N-terminální doména
C-terminální doména
Segmentové izotopové obohacení
1. Obě domény se exprimují zvlášť
N-term Intein N-term
Tag
Cys
C-term
2. Intein se odštěpí thiolem a Tag proteasou
N-term
Intein N-term
Tag
Cys
C-term
3. Domény se spojí vytvořením peptidové vazby
N-term
Cys
C-term
Segmentové izotopové obohacení 15N
1 doména obohacena (15N)
1H
celý protein obohacen (15N)
„Cell-free“ expresní systém
Zdroj: propagační materiál firmy Promega
Přehled metod pro izotopové obohacení proteinů
http://www.protein-nmr.org.uk/labelling.html
Postup přípravy izotopově obohaceného vzorku • Příprava neznačeného vzorku proteinu o příslušné koncentraci kontrola správného sbalení proteinu kontrola dostatečně vysoké koncentrace
sledování dlouhodobé stability • Příprava 15N obohaceného vzorku proteinu kontrola čistoty proteinu kontrola správného sbalení proteinu kontrola dostatečně vysoké koncentrace
• Příprava 13C/15N (13C/15N/2H) obohaceného vzorku proteinu vlastní strukturní studie
Zakoncentrování vzorku Koncentrace měřeného vzorku v případě využití chlazené sondy Objem roztoku
~ 0,5 – 1,0 mM ~ 0,1 – 0,5 mM 250 - 500 l
Srovnání NMR spekter sbalené a nesbalené struktury proteinu správně sbalená forma proteinu nesbalená forma téhož proteinu 83 AA (9 kDa)
(1H)
1H- 15N
10.5
10.0
WVQPI
107 AA (12 kDa)
IMMCS
WVQPI
107 AA (12 kDa)
IMMCS
9.5
9.0
8.5
8.0
7.5
7.0
6.5
ppm
korelace v oblasti amidických vodíků (vzorek nespecificky obohacen 15N) (15N)
čerstvě připravený 108 110 vzorek
vzorek po 5 dnech
112 114 116 118 120 122 124 126 128 (1H) 9.5
9.0
8.5
8.0
7.5
7.0
ppm
9.5
9.0
8.5
8.0
7.5
7.0
ppm
Strategie pro určování struktur biomolekul NMR vzorek NMR spektra
Přiřazení signálů
NMR experimenty
Přiřazení experimentálních NMR parametrů (NOE…)
Obecné informace o molekule (primární struktura, kovalentní vazby…)
Odhad přibližné struktury
Zhodnocení kvality struktur
Oprava přiřazení NMR parametrů, signálů
Výpočet souboru struktur
Výpočet statistických údajů pro soubor konečných struktur
Porovnání s databázemi (Procheck, Whatif….)
Výpočet NOESY spekter
Biomolekulární NMR spektroskopie: měřená jádra
1H
vysoké přirozené zastoupení (99.98%) vysoká citlivost (1.00) malá disperze chemických posunů NMR signálů (~15.0 ppm)
13C
velká disperze chemických posunů NMR signálů (~200.0 ppm) nízké přirozené zastoupení (1.108%), možné uměle navýšit až na 100% nízká citlivost (1.76x10-4), po 100%ním izotopovém obohacení (1.59x10-2)
15N
střední disperze chemických posunů NMR signálů (~30.0 ppm) (oproti 13C nezávislost na typu aminokyseliny) nízké přirozené zastoupení (0.37%), možné uměle navýšit až na 100% velmi nízká citlivost (3.85x10-6), po 100%ním izotopovém obohacení (1.04x10-3)
2H
používá se pro speciální účely
Potlačení signálu vody Proč H2O? 1. Voda je fyziologické prostředí 2. Nelze použít D2O z důvodů chemické výměny s amidickými protony.
Signál H2O je 104-105 násobně intenzivnější než odezva měřené molekuly.
Potlačení signálu vody: metoda presaturace 90° CW-ozařování
Během relaxační doby ozařujeme signál vody slabým RF polem. 1H
spektrum proteinu po presaturaci H2O
zbytkový signál H2O
Potlačení signálu vody: metoda WATERGATE Selektivní manipulace se signály vody a rozpuštěné látky doplněná o čistící gradientní echo.
90° 180°
t
1H
G
t G
G Selektivní 180° puls
Potlačení signálu vody: metoda WATERGATE
Multidimensionální NMR spektroskopie
F2(13C)
F1(15N) F3(1H)
H 1H
- spektrum H
H
H
H
8.5
8.0
7.5
7.0
ppm
6.5
H
H
N
6.0
5.5
1D 1H spektrum proteinu kuřecí lysozym 129 AA, Mw = 14.6 kDa methyl H
aromatic H NH-backbone aliphatic H NH-SC CH
Odezva více jader v jednom spektru 13
C
pN (0 ≤ pN ≤ 1)
35Hz
13
C
H
13
C130HzH
35Hz
35Hz
C55Hz 13C’ 15Hz 15N 11Hz 13C 55Hz 13C’
13
140Hz 7Hz
H pH (0 ≤ pH ≤ 1)
<1Hz
90Hz
HN
H
pravděpodobnost překryvu
při zobrazení jednoho jádra pH(H),pN(N) a pC(C) při zobrazení dvou jader (H-N) najednou P = pH . pN při zobrazení tří jader (H-N-C) najednou P = pH . pN . pC
pC (0 ≤ pC ≤ 1)
Korelační spektroskopie jako nástroj pro zjednodušení NMR spekter 1D
3D
F1(1H) F2(X)
2D
F2(1H)
F1(1H/X) F3(1H) F3(X)
4D
Lepší rozlišení je ve vícedimenzionálních spektrech zajištěno využitím izotopového obohacení 15N a 13C.
F2(X)
F4(1H)
F1(1H/X)
F1(1H)
Přiřazování rezonancí • NMR experimenty pro přiřazení signálů pracují se dvěma nebo třemi různými jádry najednou (experimenty s trojnásobnou rezonancí), chemické posuny těchto jáder jsou navzájem zkorelovány. • Názvy takovýchto experimentů se tvoří podle typu jader, která korelují: HNCA koreluje amidický vodík s příslušným dusíkem a uhlíkem v pozici . HN(CO)CA koreluje stejné typy atomů (jader) jako HNCA, ale přes CO. To naznačuje směr korelace, tj. H a N i-té aminokyseliny a C aminokyseliny v pozici i-1. • Směr přenosu magnetizace je v případě těchto experimentů H N C a zpět. Experimenty se nazývají „out and back“ • Naproti tomu přenos magnetizace u experimentů např. CBCA(CO)NH začíná na atomu CB (i-1) aminokyseliny a končí na amidickém H aminokyseliny následující, tj. experimenty „out and stay“.
Strategie pro určování struktur biomolekul NMR vzorek NMR spektra
Přiřazení signálů
NMR experimenty
Přiřazení experimentálních NMR parametrů (NOE…)
Obecné informace o molekule (primární struktura, kovalentní vazby…)
Odhad přibližné struktury
Zhodnocení kvality struktur
Oprava přiřazení NMR parametrů, signálů
Výpočet souboru struktur
Výpočet statistických údajů pro soubor konečných struktur
Porovnání s databázemi (Procheck, Whatif….)
Výpočet NOESY spekter
Přiřazování rezonancí 13
C
HNCA experiment
35Hz
13
C
H
13
35Hz aminokyselinový zbytek I-1
13
C
55Hz
C’
13
11Hz 13
15Hz 15
N
130Hz
C
aminokyselinový zbytek I
35Hz
C
H
90Hz
N
H
H
C’
55Hz 13
140Hz 7Hz
H
<1Hz
Konstrukce multidimensionálních NMR spekter 3D HNCA
F2(15N )
I F1(13C) F2(15N ) I-1
F3(1HN) F1(13C) F3(1HN)
Přiřazování rezonancí 13
C
HN(CO)CA experiment
35Hz
13
C
H
13
35Hz
13
C
55Hz
130Hz
C
35Hz
C’
13
11Hz 13
15Hz 15
N
C
7Hz
90Hz
N
H
H
C’
55Hz 13
140Hz
H
H
<1Hz
Konstrukce multidimensionálních NMR spekter 3D HNCA/HN(CO)CA
F2(15N )
F2(15N )
I F1(13C) F2(15N ) I-1
F3(1HN) F1(13C) F3(1HN)
I-1
Sekvenční přiřazení hlavního řetězce HN(CO)CA
missing crosspík
HNCA
Přiřazování rezonancí Využití atomů uhlíku C
HNCACB experiment 13
C
Výhoda: chemický posun C je charakteristický pro typ aminokyselinového zbytku
35Hz
13
C
H
13
35Hz aminokyselinový zbytek I-1
13
C
55Hz
C’
13
11Hz 13
15Hz 15
N
130Hz
C
35Hz aminokyselinový zbytek I
C
H
90Hz
N
H
H
C’
55Hz 13
140Hz 7Hz
H
<1Hz
Přiřazování rezonancí Využití atomů uhlíku C 13
HN(CO)CACB experiment
C 35Hz
13
C
H
13
35Hz
13
C
55Hz
130Hz
C
35Hz
C’
13
11Hz 13
15Hz 15
N
C
7Hz
90Hz
N
H
H
C’
55Hz 13
140Hz
H
H
<1Hz
Přiřazování rezonancí Využití atomů uhlíku C
HNCACB/HN(CO)CACB experiment Ser11
L eu12
Thr13
L eu14
Trp15
25
30
35
40
13
( C)
45
50
55
60
65
70 (15N) 114.9 ppm (1H)
(15N) 123.7 ppm (1H)
(15N) 126.8 ppm (1H)
(15N) 124.7 ppm (1H)
(15N) 119.9 ppm (1H)
Přiřazování rezonancí postranních řetězců
H C H
H
C
H
C
H
H
C
H
C
C’
N
C
C’
H
H
H
N
H
Přiřazování rezonancí postranních řetězců H
H
Kompletní přiřazení Prolinu 4 proteázy M-PMV pomocí hCCH-COSY spektra
H H: 4.296 ppm ppm
H: 1.818 ppm Pro4CG-CB-HB2
30 Pro4CB-CA-HA
Pro4CB-CB-HB2
H: 2.185 ppm
H: 1.913 ppm
Pro4CG-CB-HB3
Pro4CG-CG-HG
Pro4CB-CB-HB3
Pro4CB-CG-HG
H: 3.589 ppm
H: 3.715 ppm
Pro4CG-CD-HD2
30
H
O
H3C
O
3D
13
( C)
40
N
H
Pro4CG-CD-HD3
40
H
H
Pro4CD-CG-HG
50
Pro4CD-CD-HD3
Pro4CD-CD-HD2
50
F2(1H) 60
60 Pro4CA-CA-HA
Pro4CA-CB-HB2
Pro4CA-CB-HB3
F1(13C) 65
60
35
30
35
30
30 (13C)
25
55
50
55
50
ppm
F3(13C)
Práce s extra velkými molekulami Mw> 25 kDa Práce s velkými molekulami způsobuje dvojí komplikaci • velmi komplikovaná spektra • rychlá spin-spinová relaxace
R2
2 2 H ( D) C 6 CH
8r
[ J ' s.... f (t )] c
H/ D ~ 6.6 Řešení: výměna atomů vodíku za deuterium
Práce s extra velkými molekulami Mw> 25 kDa Exprese proteinu v růstovém médiu obohaceném o 13C/ 15N/ 2H
13
C
13
C
H D
35Hz
CD3
CD3
35Hz
13
C130HzHD 35Hz
C55Hz 13C’ 15Hz 15N 11Hz 13C 55Hz 13C’
C
D
N
C
CO
H
D
13
140Hz 7Hz
H D
<1Hz
90Hz
N
H
H D
Teoreticky může být R2 snížen až 44 násobně, prakticky většinou maximálně 15x.
Fully protonated versus perdeuterated EIN protein
Fully protonated versus perdeuterated EIN protein
Missing crosspeaks are marked
Praktické návody-jak na to? www.protein-nmr.org.uk
Strategie pro určování struktur biomolekul NMR vzorek NMR spektra
Přiřazení signálů
NMR experimenty
Přiřazení experimentálních NMR parametrů (NOE…)
Obecné informace o molekule (primární struktura, kovalentní vazby…)
Odhad přibližné struktury
Zhodnocení kvality struktur
Oprava přiřazení NMR parametrů, signálů
Výpočet souboru struktur
Výpočet statistických údajů pro soubor konečných struktur
Porovnání s databázemi (Procheck, Whatif….)
Výpočet NOESY spekter
Získání experimentálních parametrů z NMR spekter.
chemický posun (chemické okolí jádra) NOE interakce (meziatomová vzdálenost)
interakční konstanta (dihedrální úhel) zbytková dipolární interakce (orientace) vodíková vazba (vzdálenost, vazebný úhel)
Chemický posun
Výpočet indexu chemického posunu Změna chemického posunu indukovaná sekundární strukturou
Chemické posuny některých jader jsou ovlivněny typem pravidelné sekundární struktury, do které jsou zahrnuty!!!
(H) -sheet „random coil“ -helix
Přiřazení rezonancí hlavního řetězce: H,C, C’
Histogram indexu chemického posunu jader H, C a C‘. +1 0 -1
Výpočet indexů chemického posunu, tzv. CSI
Odhad sekundární struktury na základě „lokální hustoty“ těchto indexů
C
N helix I
helix II
Sekvence aminokyselin
helix III helix IV
-1
CSI 0
1
Secondary structure of M-PMV PR from CSI
10
20
30
40
50
60
70
80
90
100
Nukleární Overhauserův efekt NOE Experimentální omezení vzdáleností • přímá spin-spinová interakce mezi jádry • interakce mezi dipóly interagujících jader
rIS < 5-6 Ǻ
• relaxační jev
• výměna energie mezi oběma jádry
H
H
• charakterizuje vzdálenost mezi oběma jádry
2
2 4 h IS 4 10
6t c 6 t c rIS 1 4 t 2 c
IS - rychlost nárustu NOE tc - korelační čas rIS - meziatomová vzdálenost - pracovní frekvence
IS f r
6
Převod intenzity NOE krospíků na vzdálenost mezi atomy. 1.8 Ǻ r 2.5 Ǻ
1.8 Ǻ r 3.5 Ǻ
Dolní mez :1.8 Ǻ Jedná se o součet vzdáleností van der Waalsovských poloměrů dvou interagujících atomů vodíku Horní mez : Nastavuje se podle intenzity příslušného krospíku. Pro větší molekuly se používá max. vzdálenost až 6 Å. 1.8 Ǻ r 5.0 Ǻ
Editovaná NOESY spektra 4D 13C/ 15N-editované NOESY
15N
NOE 1H
JHN
1H
15N
13C
13C
JHC
1H 1H
3D 15N-editované NOESY 15N=
106.4 ppm
4D 13C/15N-editované NOESY 15N=
106.4 ppm 13C= 45.8 ppm
G78HN-G78H
15N= 13C=
106.4 ppm 56.1 ppm
G78HN-S77H
Nepřímá spin-spinová interakční konstanta Experimentální omezení dihedrálních úhlů
O
C
y
Karplusova rovnice 3J = A cos2Q B cosQ C
H H C
Vztah mezi interakční konstantou a dihedrálními úhly peptidu
c2 f
C
c1
H H
N
C
3J H-NC-H
10
C
O
H-NC-CO
8
H-NC-C
CO-NC-H 6 4 2 0
[Hz]
-120
0
60
120
Q deg
Typické hodnoty interakčních konstant 3JHH pro dihedrální úhel f -helix f ~ 60 deg J 6 Hz
typické nastavení pro úhel f: 110 f 10 deg
-struktura skládaného listu f ~ 10 6 J 9 Hz typické nastavení pro úhel f: 170 f 70 deg
Residual dipolar couplings RDC Long-range constraint
- experiments for measurement J constants - IPAP experiments (better resolution)
15N
Principal axis system Bo
Azz
122.0
120.0
118.0
NMR experiments:
H 8.8
8.7 119.0
8.9
120.0
Janiso 121.0
Jiso
8.86
8.84
1H
q f
15N
D
122.0
9.0
N N
1H
Dresid Janiso Jiso
Axx Ayy
Stretched polyacrylamide gel
– ~ 6% polyacrylamide gel (crosslinked with bisacrylamide) – protein diffuses into dried gel – axial stretching (radial compression) of the gel
squeeze
alignment of protein in oblate pores
NMR tube
Vodíkové vazby v pravidelných strukturách Další omezení vzdáleností
C
-helix
Měření: - výměnné experimenty s D2O - teplotní závislost labilních protonů (NH, OH…) Z NMR experimentů je možné získat pouze informaci o donoru! Informaci o příslušném akceptoru lze získat až z vypočtených struktur
-sheet-antiparalelní
N
N
C
Strategie pro určování struktur biomolekul NMR vzorek NMR spektra
Přiřazení signálů
NMR experimenty
Přiřazení experimentálních NMR parametrů (NOE…)
Obecné informace o molekule (primární struktura, kovalentní vazby…)
Odhad přibližné struktury
Zhodnocení kvality struktur
Oprava přiřazení NMR parametrů, signálů
Výpočet souboru struktur
Výpočet statistických údajů pro soubor konečných struktur
Porovnání s databázemi (Procheck, Whatif….)
Výpočet NOESY spekter
Jak vše poskládat dohromady ???? Omezení vzdáleností (NOEs)
Info o kovalentní struktuře
Omezení dihedrálních úhlů (interakční konst.)
Cray T3E
Etot Ekin E pot Výpočetní algoritmus: Molekulární mechanika simulované žíhání s experimentálními omezeními (vzdálenosti, dihedrální úhly…) - molekula se ohřeje na vysokou teplotu (2000 – 50 000 K) - pomalu se ochladí na teplotu blízkou nule
simulované žíhání v Kartézském prostoru (Newtonovy pohybové rovnice) simulované žíhání v prostoru torsních úhlů (Lagrangeovy rovnice)
Simulované žíhání (simulated annealing) typický průběh
teplota [K]
vysokoteplotní perioda
perioda postupného ochlazování minimalizace potenciálové energie
časová osa [ns]
Jak vše poskládat dohromady ???? Etot Ekin E pot E pot kvdW D 2 k kov D 2 k NOE D 2 k DIH D 2 ..... vdW
D 2 (d exp d 0 ) 2
kov
NOE
DIH
dexp je experimentální nebo aktuální hodnota d0 je ideální hodnota
Ekin je kinetická energie vypočítávaná v každém kroku z teploty molekuly Epot je součet energií produkovaných penalizačními funkcemi Molekulární parametry (hmotnost atomů, délka vazby, vazebné úhly… vstupují do výpočtu ve formě tzv „force fields“ Př: penalizační fukce pro NOE:
ENOE
dolní mez (1,8 Å) horní mez (< 6 Å)
Cílem je minimalizovat Epot 0
d
Soubor struktur vyhovující nejlépe získaným experimentálním omezením
Prezentace vypočtených struktur helix III
helix II
helix IV
helix I
C
N
C
N
N C
N
C
Strategie pro určování struktur biomolekul NMR vzorek NMR spektra
Přiřazení signálů
NMR experimenty
Přiřazení experimentálních NMR parametrů (NOE…)
Obecné informace o molekule (primární struktura, kovalentní vazby…)
Odhad přibližné struktury
Zhodnocení kvality struktur
Oprava přiřazení NMR parametrů, signálů
Výpočet souboru struktur
Výpočet statistických údajů pro soubor konečných struktur
Porovnání s databázemi (Procheck, Whatif….)
Výpočet NOESY spekter
Charakterizace vypočtených struktur 1. Shoda vypočtených struktur s experimentálními daty - velikost potenciálová energie - počet a velikost neshod s experimentálními parametry (NOE, dihedrální úhly…. - počet a velikost špatných kontaktů mezi atomy (van der Waalsovský příspěvek) - počet a velikost neshod s ideálními hodnotami kovalentních parametrů (délky vazeb, vazebné úhly, planarita aromatických kruhů…)
2. Rozptyl struktur v souboru n
RMSD
2 x x i i 1
n
- mezi jednotlivými strukturami a průměrnou strukturou (mean) - mezi jednotlivými strukturami navzájem - počítá se buď pro celou molekulu, jednotlivé části nebo jednotlivé aminokyseliny
Charakterizace vypočtených struktur 3. Porovnání strukturních parametrů vypočtených struktur s parametry v databázích software Procheck, Whatif… http://biotech.embl-heidelberg.de:8400 Ramachandranův diagram
f/y diagram je charakteristický pro konformaci páteře proteinu - takto lze porovnávat i ostatní dihedrální úhly, vazebné úhly, délky vazeb… - lze vytypovat problémové oblasti
Malate synthase, 723 AA, 82 kDa
Tugarinov V., Choy W.Y., Orekhov, V.Y., Kay L.E.(2005) PNAS, 102, 622-627