Biológiai molekulák számítógépes szimulációja
Balog Erika Semmelweis Egyetem, Biofizikai és Sugárbiológiai Intézet
Miért?
SZEKVENCIA ALA THR SER THR LYS LYS LEU HSD LYS GLU PRO ALA ILE LEU LYS ALA ILE ASP ASP THR TYR VAL LYS PRO MET PHE THR ARG LYS VAL LEU ASP THR GLU VAL MET ILE THR ILE PHE VAL TYR LYS ILE GLU VAL PHE ASP LYS GLY GLN ARG THR ASP LYS ARG TYR GLY ILE THR ALA GLY ASN ASN THR HSD GLU GLN HSD LEU LYS ARG SER GLU PRO LEU ILE TRPSER GLU GLN HSD ASN ALA SER GLY GLN
folding → SZERKEZET
Tanulmányozhatjuk:
dinamika → FUNKCIÓ
- fehérjék, DNS, membrámok belső mozgását - konformációs átalakulásokat - enzimreakció dinamikáját - spektroszkópiai mennyiségeket, értelmezés - diffrakciós adatok, NOE, NMR - szabad energia változások, gyógyszertervezés
Hogyan?
- kvantum algoritmusokon alapuló dinamikai szimulációkkal nem lehet fehérje méretű rendszereket kezelni → klasszikus algoritmusokat használnak
Hogyan?
Dinamikai szimulációk Molekuláris dinamika (MD)
Normál módus analízis (NM)
- valós potenciál felület
- harmonikus potenciál
- időlépésenkénti mozgásegyenlet
- analitikus mozgásegyenlet
megoldás (numerikus)
- normál módusok
trajektória q2 idő
koordináta
koordináták
q1
koordináta
- ~10ns trajektória ω1 frekvencia
idő ω2 frekvencia
idő
Molekuláris kinematika
Monte Carlo (MC)
- reakcióutak meghatározása
- konformációs tér mintavételezése
Dinamikai szimulációk Molekuláris dinamika (MD)
Normál módus analízis (NM)
- valós potenciál felület
- harmonikus potenciál
- időlépésenkénti mozgásegyenlet
- analitikus mozgásegyenlet
megoldás (numerikus)
- normál módusok
- ~10ns trajektória
Előny: a teljen anharmonikus
Előny: egyszerű koncepció, nincs
potenciált használja
szimulációs időkorlát
Hátrány: komplikált analízis,
Hátrány: nem veszi figyelembe az
időkorlát
anharmonicitást
Molekuláris Dinamika (MD) Newton-törvény:
Modell rendszer
d 2ri ∂Vtotal mi 2 = F = − dt ∂ri Kölcsönhatási potenciál
V=
∑ k (b − b ) + ∑ kθ (θ − θ ) 2
bonds
+
2
0
b
0
+
angles N
∑ ∑ Kφ( )[1 + cos(nφ − δ )] + ∑ Kω (ω − ω )
2
n
0
dihedrals n =1
impropers
⎡⎛ σ ⎞12 ⎛ σ ⎞6 ⎤ ⎛qq ⎞ + ∑ 4ε ij ⎢⎜ ij ⎟ − ⎜ ij ⎟ ⎥ + ∑ ⎜ i j ⎟ ⎢⎜⎝ rij ⎟⎠ ⎜⎝ rij ⎟⎠ ⎥ i , j ⎜⎝ Drij ⎟⎠ i, j ⎦ ⎣
- röntgen diffrakció - NMR - szerkezet predikció
V=
∑ kb (b − b0 )
2
bonds
+
∑ kθ (θ − θ 0 )
2
angles
+
∑
N
(n ) K ∑ φ [1 + cos(nφ − δ )]
dihedrals n =1
+
∑ Kω (ω − ω0 )
2
impropers
⎛ qi q j + ∑⎜ ⎜ i , j ⎝ Drij
⎞ ⎟ ⎟ ⎠
⎡⎛ σ ij + ∑ 4ε ij ⎢⎜ ⎢⎜⎝ rij i, j ⎣
⎞ ⎛ σ ij ⎞ ⎤ ⎟ −⎜ ⎟ ⎥ ⎟ ⎜r ⎟ ⎥ ⎠ ⎝ ij ⎠ ⎦ 12
6
Molekuláris Dinamika (MD) Newton-törvény:
Modell rendszer
d 2ri ∂Vtotal mi 2 = F = − dt ∂ri Kölcsönhatási potenciál
V=
∑ k (b − b ) + ∑ kθ (θ − θ ) 2
bonds
+
2
0
b
0
+
angles N
∑ ∑ Kφ( )[1 + cos(nφ − δ )] + ∑ Kω (ω − ω )
2
n
0
dihedrals n =1
impropers
⎡⎛ σ ⎞12 ⎛ σ ⎞6 ⎤ ⎛qq ⎞ + ∑ 4ε ij ⎢⎜ ij ⎟ − ⎜ ij ⎟ ⎥ + ∑ ⎜ i j ⎟ ⎢⎜⎝ rij ⎟⎠ ⎜⎝ rij ⎟⎠ ⎥ i , j ⎜⎝ Drij ⎟⎠ i, j ⎦ ⎣
- röntgen diffrakció - NMR - szerkezet predikció
Newton egyenlet integrálása - Verlet algoritmus: a részecskék koordinátáinak Taylor sorfejtése t idő körül:
⎛ ∂ 2 ri ⎞ Δt 2 ⎛ ∂ 3ri ⎞ Δt 3 ⎛ ∂ri ⎞ ri (t + Δt ) = ri (t ) + ⎜ ⎟ Δt + ⎜⎜ 2 ⎟⎟ + ⎜⎜ 3 ⎟⎟ + O (q 4 ) ⎝ ∂t ⎠t ⎝ ∂t ⎠t 2! ⎝ ∂t ⎠t 3! ⎛ ∂ 2 ri ⎞ Δt 2 ⎛ ∂ 3ri ⎞ Δt 3 ⎛ ∂ri ⎞ ri (t − Δt ) = ri (t ) − ⎜ ⎟ Δt + ⎜⎜ 2 ⎟⎟ − ⎜⎜ 3 ⎟⎟ + O (q 4 ) ⎝ ∂t ⎠t ⎝ ∂t ⎠t 2! ⎝ ∂t ⎠t 3! ⎛ ∂ 2 ri ⎞ 2 ri (t + Δt ) + ri (t − Δt ) = 2 ri (t ) + ⎜⎜ 2 ⎟⎟ Δt ⎝ ∂t ⎠t ⎛ F (t )i ri (t + Δ t ) = 2 ri (t ) − ri (t − Δ t ) + ⎜⎜ ⎝ mi
sebesség:
r (t + Δt ) − ri (t − Δt ) vi (t ) = i 2 Δt
⎞ 2 ⎟⎟ Δ t ⎠t
d 2 ri ∂V mi 2 = F = − ∂ri dt Verlet
hőmérséklet:
1 T (t ) = (3N − n )k B
N
2 m v ∑ i i (t ) i =1
MD protokol:
Kezdeti szerkezet
1. szerkezet beolvasás (~0K) Energia minimalizáció
3. dinamika indítás:
Fűtés
- Boltzmann sebesség kiosztás (véletlen-szám generátor)
Ekvilibráció
- Verlet algoritmus időlépés ~1fs - sebesség ujrakiosztás ~200 lépésként (fokozatos
Dinamika
fűtés ~5ps) - ekvilibrálás 300K - ha T<290K vagy T>300K
Analízis
sebesség újrakiosztás
∑ (r i −rrefi ) N
RMSD =
2. energia minimalizáció (V)
2
i =1
N
- ~20ps után RMSD ellenőrzés - “production run” = folytatás, ujabb sebességkiosztás nélkül
Trajektória analízis:
átlag:
A =
1
ttotal
ttotal
∑A t =1
∑ (xi (t j )− xi ) T
atomi elmozdulások fluktuációja:
korrelációs együttható:
autokorrelációs függvény:
RMSF =
Cij = Δri Δrj =
t
2
t j =1
T
(ri − ri )(rj − rj ) (ri − ri )2 (rj − rj )2
Ci (τ ) = Δri (t )Δri (t + τ )
Korlátozó tényezők: - atomszám (~ 40 000) - lépésköz – Δt ~ 1fs
ns időtartomány Altix 350 – 8 proc Itanium 1.4 GHz, 8 Gb RAM 1ns = 3 nap gépidő
Példa: foszfoglicerát kináz (PGK)
apo ADP-bPG 39
distance (Å)
38
37
36
35
34 0
2
4
6
8
10
12
14
16
18
20
time (ns)
-0.8
400
-0.6 -0.4
350
-0.2 0 0.2
residue number
300
korrelációs együttható:
0.4 0.6
250
0.8 1
200 150 100 50
50
100
150
200
250
residue number
300
350
400
C ij =
(ri − ri )(r j − r j ) (ri − ri )2 (r j − r j )2
8
mn
7
RMS fluct (Å)
6 5
op 9-10a
4
1a B2
3
J12
3 12K 13L
2 1 0 0
50
100
150
200
250
residue number
300
350
400
ϕr
a)
b)
208 -60
204
396
-180 -140
392
-40
-100 -20
388
residue number
apo
residue number
200
0
196
20
192
40
-20.0
384
0
Thr393
20.0
380
60.0
60
188
Asn383
-60.0
376
100
80 140
184
372
90
180
180
368 2
4
6
8
10
12
14
16
18
20
2
4
6
8
10
time(ns)
a)
14
16
18
20
time(ns)
b)
208
Ser202
396
-180
-100
204
-140
392
-80.0
-100
-60.0
200
-20.0
196
0
192
20.0 40.0
188
60.0 80.0
184
-60.0
388
-40.0
residue number
residue number
ADP•bPG
12
-20.0
384
20.0
380
60.0
376
100 140
372
180
100
180
Gly372
0
368 2
4
6
8
10
12
time(ns)
14
16
18
20
2
4
6
8
10
12
time(ns)
14
16
18
20
Pro203
apo a
b
400
350
350
} 12,K,13
300
300
}
250
} 9-10a
residue number
residue number
400
250 200 150 100 50
200 150 100 50
50 100 150 200 250 300 350 400
50 100 150 200 250 300 350 400
residue number
residue number
a
b
400
400
350
350
300
300
residue number
residue number
ADP•bPG
o,p,q
-0.5 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1
250 2004 150
50
mn
residue number
11J
150
50
α
} 11 o,p,q
200
100
K,13,L
}
250
100
50 100 150 200 250 300 350 400
}
50 100 150 200 250 300 350 400
residue number
-0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1
ADP•bPG a
b
400
350
350
300
300
residue number
residue number
400
250 2004 150
50
mn
residue number
11J
150
50
α
} 11
200
100
K,13,L
} o,p,q
250
100
50 100 150 200 250 300 350 400
}
50 100 150 200 250 300 350 400
residue number
-0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1
Dinamikai szimulációk Molekuláris dinamika (MD)
Normál módus analízis (NM)
- valós potenciál felület
- harmonikus potenciál
- időlépésenkénti mozgásegyenlet
- analitikus mozgásegyenlet
megoldás (numerikus)
- normál módusok
- ~ns trajektória
Előny: a teljen anharmonikus
Előny: egyszerű koncepció, nincs
potenciált használja
szimulációs időkorlát
Hátrány: komplikált analízis,
Hátrány: nem veszi figyelembe az
időkorlát
anharmonicitást
Normál módus analízis (NM)
V Taylor sorfejtése q elmozdulás függvényében:
⎛ ∂V ⎞ 1 3 N ⎛ ∂ 2V ⎞ ⎟⎟ qi + ∑ ⎜⎜ ⎟⎟ qi q j + O (q 3 ) V = V0 + ∑ ⎜⎜ 2 i , j =1⎝ ∂qi ∂qi ⎠0 i =1 ⎝ ∂qi ⎠ 0 3N
harmonikus közelítés:
1 3 N ⎛ ∂ 2V ⎞ ⎟⎟ qi q j V = ∑ ⎜⎜ 2 i , j =1⎝ ∂qi ∂qi ⎠0
d ∂T ∂V + =0 dt ∂q&i ∂q j
mozgásegyenlet:
3N
q&&j + ∑ f ij q j = 0 j =1
megoldás:
ri =
∑C
j =1, 3 N
j
cos(ω j t + ϕ j )
formában keressük
behelyettesítvén:
∑(f 3N
j =1
ij
− δ ijωi )Ai = 0
mátrix diagon.→ sajátérték, sajátvektor
... normál módusok → a trajektória 3N-6 fügetlen vibrációs módus szuperpozíciójaként írható
Normál módus analízis (NM) – egyszerű analitikai egyenletek atomi elmozdulások fluktuációja:
Δri 2 = k BT
3 N −6
i-dik sajátvektor k módusra eső vetülete
2 ik 2 k
a
∑ω k =1
k-dik módus frekvenciája
Boltzman állandó
atomi elmozdulások korrelációja:
Δri Δrj = k BT
3 N −6
∑ k =1
aik a jk
ωk2
autokorrelációs függvény:
Δri (t )Δri (t + τ ) = k BT
3 N −6
∑ k =1
aik2 cos(ωkτ )
ωk2
Vibrációs termodinamika: ∞
Zi = ∑ e
állapotösszeg:
⎛ 1 ⎞ hω −⎜ n + ⎟ i ⎝ 2 ⎠ kT
n =0
szabad energia:
∏Z i =1
i
Gvib = − kT ln Z vib
Gvib =
3 N −6
∑ i =1
⎫ ⎧⎡ ⎤ ⎡ hω i ⎤ ⎛ ⎞ ⎪ ⎪⎢ 1 hωi ⎥ ⎢ hωi 1 kT ⎟ ⎥ ⎜ ω − − − + h ln 1 e kT ⎨ i hω i hω i ⎜ ⎟⎥ ⎬ ⎥ ⎢ ⎢ 2 kT ⎝ ⎠⎦ ⎪⎭ ⎪⎩⎣ e kT − 1 e kT − 1⎦ ⎣
entalpia:
H vib =
Z vib =
3 N −6
entrópia:
1 ∂Z vib Z vib ∂β
β=
1 kT
S vib = (H vib − Gvib ) / T
S vib =
3 N −6
∑ n =1
hω ⎡ 1 hω − i ⎛ i ⎢ − k ln ⎜⎜ 1 − e kT hω i ⎢ T kT ⎝ ⎣ e −1
⎞⎤ ⎟⎟ ⎥ ⎠ ⎥⎦
Biológiailag fontos: alacsony frekveniájú módusok - globálisak – a fehérje minden részét magába foglalja - kollektívek – a fehérje nagy kitejedésű részei együtt mozognak - gyenge kölcsönhatások következményei - dominálják a fluktuációt - dominálják a termodinamikát → ΔSvib - funkcionális mozgásokat írnak le pl. “hinge-bending”
Példa1: foszfoglicerát kináz (PGK)
Példa2: dihodrofolát reduktáz (DHFR)
DHFR - dihydrofolate reductase NADPH - nicotinamide adenin dinucleotide MTX - methotrexate
Experiment 7
d dm
-1
G( ω) (mode/cm )
6
5 1.5
4 1.0
3 2
0.5
1
0.0 0
2
4
6
8
10
12
14
16
18
20
0 0
20
40
60
80
100
120
140
-1
ω (cm )
NM only of the protein Prot+30% wat was taken from powder sim - shift 7 6
g(ω)
5 4 3 2 1 0 0
20
40
60
80 -1
ω (cm )
100
120
140
NM only of the protein Prot+30% wat was taken from powder sim - shift 7 6
g(ω)
5 4 3 2 1 0 0
20
40
60
80 -1
ω (cm )
100
120
140
MODELL RENDSZER RENDSZER MODELL
KVANTUM KVANTUM MECHANIKA MECHANIKA
KÍSÉRLETEK KÍSÉRLETEK
POTENCIÁLIS ENERGIA POTENCIÁLIS ENERGIA
SZIMULÁCIÓ SZIMULÁCIÓ
ANALÍZIS ANALÍZIS
SZERKEZET SZERKEZET
DINAMIKA DINAMIKA TERMODINAMIKA TERMODINAMIKA
KÍSÉRLETEK KÍSÉRLETEK