Roentgenova krystalografie X-ray Crystallography - Krystal - Roentgenovo záření - Difrakce, rozptyl - Strukturní analýza - Strukturní model
William Henry Bragg a Max von Laue Max von Laue – Nobelova cena za fyziku in 1914 (difrakce) W.H. Bragg a W. Lawrence Bragg - Nobelova cena za fyziku 1915 (NaCl)
W.H.B
M.v.L.
SCHEMATIC ILLUSTRATING BRANCHES OF MODERN CRYSTALLOGRAPHY, THEIR APPLICATIONS, AND THE RELATION OF CRYSTALLOGRAPHY TO THE NATURAL SCIENCES
“Heart”of this scheme
Strukturní analýza malých molekul Difrakce na krystalech – měření intenzit Redukce dat. Matematické výpočty Elektronová hustota. Atomy – jejich polohy Geometrie molekul. Chemické vazby. Tepelné kmity atomů
Standardní schéma RTG krystalografie je experimentální technika, která využívá difrakce Xpaprsků na krystalech. Na základě difrakčního obrazce získaného z periodického uspořádání molekul nebo atomů v krystalu, je možné rekonstruovat elektronovou hustotu a tím určit uspořádání atomů.
Data Processing
Structure Solution and Refinement
X-ray source X-ray preparation
Diffraction
Detection
Výběr a montáž krystalu Velikost - Asi mezi 0.1 – 0.5 mm Tvar - Musí být monokrystal (single crystal) - čím kulatejší, tím lepší Mosaicita
Goniometrická hlavička umožní aby krystal zůstal v paprsku RTG záření v každé orientaci
Experimentální data Vlnová délka: λ Mřížkové parametry: a, b, c, α, β, γ Symetrie: možné prostorové grupy Orientace krystalu, krystalové plochy Intenzity: (h, k, l), I, σ(I), 2θ, profil Empirická absorpce Hustota krystalu Chemické složení, sekvence Redukce, korekce, konverze na (h, k, l), F
Určování struktur • Teorie u proteinové krystalografie • Počítačové programy SHELXS, SHELXL, SIR (Il millione), SnB • Grafika ORTEP, MERCURY, DIAMOND • Polohy atomu, teplotní kmity • Meziatomové vzdálenosti, úhly, torzní uhly • Vodíkové vazby
Struktura [Co(cmasp)(en)] monoclinic_H-M Cc, Z 4 (x, y, z),(x, -y, z+1/2) (x+1/2, y+1/2, z) (x+1/2, -y+1/2, z+1/2) a=11.626(1) α=90.0 b=14.546(1) β=122.4(1) c=10.056(1) γ= 90.0 Co1 O6 1.885(2) O6 Co1 O2 90.16(8) N14 Co1 O2 C2 156(4) D H A D-H H...A D...A D-H...A symm O11 H11W O5 0.95(7) 1.84(2) 2.742(5) 156.21 5_555
Deformační hustoty Neutronová difrakce - jádra RTG difrakce – elektrony Deformační (rozdílová) hustota – elektronová hustota chemické vazby. Nejpřesnější a nejkvalitnější analýzy
Proteinová krystalografie • Co je (bio)makromolekulová krystalografie • Bernal → Strukturní genomika Penicilín, vitamín B12, DNA, proteiny, tRNA,viry, ribosomy. • Krystalografie. Molekulová biologie a genetika. Přístrojová technika, elektronika, počítače. • Drug design.
A Brief History of Macromolecular Diffraction 1895: W. C. Roentgen discovers X rays. 1912: Max von Laue discovers X-ray diffraction by crystals. 1913: W. L. Bragg reports the crystal structure of NaCl, providing the first experimental evidence for the absence of salt "molecules". 1949-57: Dorothy Crowfoot Hodgkin et al. solved the structures of penicillin (1949) and vitamin B-12 (1957). 1958: Structures of myoglobin (Kendrew) and hemoglobin (Perutz). 1965: Structure of the first enzyme (lysozyme) by Phillips et al. 1974: Transfer RNA structure determined by Klug and Rich. 1985: Photosynthetic reaction center (first membrane protein) by Huber. 1990s: Structures of the ribosome (Steitz, Ramakrishnan, Noller) (Nobel p. – 2009] Structures of ion channels (MacKinnon)
Protein model I
Protein model II
Protein model III
t-RNA
30S r-RNA
50S r-RNA
B-DNA
Nucleosome
Protein structure determination Crystallization Purified protein
Phase problem Crystal
X-ray Diffraction Electron density Biological interpretation
3D structure
První krok: Krystalizace - přírodní materiál & genové inženýrství - protein: purifikace, koncentrace 10mg/ml - pH, srážecí roztoky PEG, NaCl, (NH4)2SO4 - nativní krystal, 30-80% voda - difuzní kanály - izomorfní deriváty [HgI4]2-, UO22+, Xe - selenometionín, RbBr - buňky 5-10 nm, 20-100nm - flash cooling, cryocrystallography, cryoprotectant - magie, umění - velikost 0.1 mm
Proteinové krystaly Sperm whale myoglobin
See Hampton Research: http://www.hamptonresearch.com) their Photo Gallery.
Kryo-metoda
Druhý krok: RTG difrakce Experimentální uspořádání Monochromatické záření nebo několik vlnových délek, případně polychromatické záření
Zdroj RTG
Páry kapalného N2
beam stop
detektor goniometr
Difraktometrie- experiment - Synchrotronové zdroje. Konvenční RTG zdroje. - Monochromátory - RTG kolimace, fokusace, zrcadla - Difraktometr - Detektory klasická fotografie imaging plate (1980) charge-coupled device (CCD, 1990) - Kryosystem (chlazení) - Software na sběr dat (Data Collection) - DENZO, MOSFILM
Výhody Synchrotronů • Vysoká Intensita – Bílé RTG záření – x 106 – Monochromatizované – x 102-5
• Více dat z radiačně citlivých krystalů – Rozklad zářením závisí na • Celkové radiační dávce – ta se nemění • Na čase účinku volných radikálů – čas je kratší při intensivní expozici
• Rozlišení blízkých difrakčních stop – Větší molekuly Æ jemnější stopy • Virusy, ribozomy…
• Nastavitelné λ → určování fází pomocí"MAD".
Filters,Monochromators Collimators and Mirrors To obtain the best results, the X-ray beam used in the diffraction experiment should all be of a single wavelength and they should be as parallel as possible. To accomplish this in practice, we use filters, monochromators and collimators.
More information can be found at: http://www.msg.ku.edu/~xraylab/no tes/xray.html
Filters. • Absorption depends on wavelength – Overall: µm ∝ λ3. – Discontinuities a.k.a. “absorption edges” • Just enough energy to expel e- from orbital • Same wavelengths as characteristic lines
• Absorption edges depend on atomic number. – Kα Ni (At#28) slightly less than Kα Cu(At#29) – CuKβ at maximum of Ni μm. – CuKα near minimum.
• Ni foil allows CuKα at ~100 x intensity of any other wavelength.
Monochromators. • Crystals: nλ = 2dsinθ (Bragg's law). • Consider – (1) polychromatic incident beam – (2) single reflection.
• • • •
Direction of diffraction (2θ) ∝ λ Narrow window → highly monochromatic. Inefficient: I(1 reflection) << I(incident). Stable single crystal commonly graphite.
Collimation. • • • • •
X-rays diverge from source. A collimator is a tube with smaller tubes (0.5 mm) that attempts to reduce the dispersion of the X-ray beam and limits the diameter of the beam. Fine || beam required for spatial resolution of diffraction pattern. Collimator: 2 pinholes mounted in long cylinder – Prealigned. Slits: 1 pair horizontal; 2nd pair vertical. – Adjustable, but requires alignment.
Mirrors. • • • •
Reflect off "bent" mirrors. Divergent beam → || or convergent. Focus at sample or detector. Low refractive index → beam nearly || mirror (1/3°). – Filtering: Can be set close to critical angle, so that Kα reflected, but Kβ refracted (lost). • One mirror to focus horizontally, one vertically. – Until 15 years ago… Alignment difficult • only when fine, intense beam needed (e.g. viruses).
• Modern optics – Multilayer coated lenses – Alignment stable – Now in many laboratories
Difraktometr
Lab
Detektory RTG záření RTG záření může být detekováno pomocí různých zařízení (http://xdb.lbl.gov/). Pro většinu použití, hlavní rozdíl mezi různými detektory je daný počtem reflexí, které mohou být měřeny v daném čase. Bodové detektory mohou měřit pouze jednu reflexi v daném čase a k vůli tomuto nedostatku se už nepoužívaní v běžné krystalografii. Tento nedostatek se projevuje v dlouhých časech měření od několika dní do několika týdnů. Plošné detektory mohou měřit mnoho reflexí současně a proto se jim dává přednost v rutinním sběru dat. Příkladem takových detektorů jsou CCD, „Image Plates“, a také RTG-film (v minulosti).
Detektory
Difrakční snímek
Diffraction image
Diffuse scattering (from the fibre loop) Water ring Direct beam Beam stop
reciprocal lattice (this case hexagonal)
Reflections (h,k,l) with I(h,k,l) Increasing resolution
DNA vlákno
Sběr dat. Data collection Pomalá rotace (oscilace) krystalu okolo osy, měření jednoho „image“ na každý ~1o rotace. ~ 100 images with ~100-1000 reflections each = ~ 104 – 105 reflections Extreme – 106 reflections
Indexování a integrace 1. 2. 3. 4.
Přiřazení indexů h,k,l každé reflexi Určení intensity každé reflexe Integrace Odečtení pozadí
h=8 k = 12 l = 13 I = 12345 -> F = 111.2
Kvalita. Krystalografické rozlišení 1.2 Å 2Å 3Å
- Resolution dmin = λ/(2sin θmax) - R-factor = Σ [|Fobs| - |Fcal|]/|Fobs|
(0.15-0.25 dobrá zhoda)
Třetí krok: Určení Fází • Difraktovaný paprsek: – Amplituda a fáze
• Oba údaje potřebujeme na rekonstrukci krystalové struktury: – Amplituda: odmocnina intensity – Fáze?
Každá reflexe nese informaci o všech atomech Strukturní faktory F(hkl) a elektronová hustota ρ(xyz) jsou propojeny přes Fourieru Transformaci v 1 ρ ( x, y, z ) = ∑ F (hkl) exp{−2πi(hx + ky + lz )} V hkl v F (hkl ) = V
∫ ∫ ∫ ρ ( x, y, z) exp{2πi(hx + ky + lz)}dxdydz
unit cell
Fázový Problém • Pokud známe αhkl a strukturní faktory F(hkl) potom:
v 1 ρ ( x, y, z ) = ∑ F (hkl ) exp{−2πi(hx + ky + lz )} V hkl v 1 = ∑ F (hkl ) exp{iα hkl }exp{−2πi (hx + ky + lz )} V hkl
• můžeme počítat elektronovou hustotu ρ(x,y,z) – do elektronové hustotu stavíme 3D atomový model • Bohužel, αhkl neznáme na začátku řešení struktury!
Strukturní faktory a Fourier Transformace
Kevin Cowtan – Fourier duck
Krystal a FT
How important are these phases ?? •
Fourier transform photo’s of Karle (top left) and Hauptman (top right) (two crystallography pioneers)
•
Combine amplitudes FK with phase αH and inverse-fourier transform
•
Combine amplitudes FH with phase αK and inverse-fourier transform
(Taken from: Randy J. Read)
FK, αK
FK, αH
FH, αH
FH, αK
Jak můžeme řešit fázový problém? • Přímé metody. Direct Methods – malé molekuly až po menší proteiny • Patterson Methods – malé molekuly až po menší proteiny small molecules. Metoda těžkého atomu. Použití v metodách MIR, SAD, MAD … • Diferenční methody s využitím těžkých atomů –multiple isomorphous replacement (MIR). Izomorfní záměna –anomalous scattering (AS). Anomální roztyl –combinations (SIRAS,MIRAS) • Differenční methody s využitím několika vlnových délek –Multiple wavelength anomalous diffraction (MAD) –single wavelength anomalous dispersion (SAD) • Použití homologické structury –molecular replacement AMORE. Molekulové nahrazování • Fázování v nízkém rozlišení. Elektronová difrakce
Direct Methods - Ab initio needs atomic resolution data (d < 1.2 Å) - Density modification - Random phases
- Shake-and-Bake (SnB) - Half Bake (SHELXD, SHELXE) - Structure seimiinvariants SIR - Pattterson based methods (XFPA, SIR) - ACORN (York, UK)
Pattersonova funkce I P(r)= Σ|F|2.cos(2πH.r) - Čtverce strukturních faktorů (žádné fáze) - mezi-atomové vektory místo poloh atomů - Funkce je centro-symetrická -A.L. (Lindo) Patterson (1934) -David Harker. Symmetry. Harker sections -Dorothy Wrich. Image theory -Martin Buerger. Implication theory. -Martin Buerger. Image-seeking function -W.N. Lipscomb. SMF symmetry minimum function
Pattersonova funkce II Pattersonova funkce obsahuje meziatomové vektory. N atomů davá N2 vektorů, z kterých N je v počátku 2 1
23
21 31
3 13
32 12
Krystal
Patterson 11, 22, 33 – v počátku
Molecular replacement Molekulová náhrada AMoRe (Automatic Molecular Replacement) PHASER Homologous protein Rotační funkce Translační funkce Rafinace
Determination of the Orientation • Patterson • Compare – Vectors w/in molecule – Vectors between molecules • “Self-vectors” shorter – Depend only on internal structure – Not on position w/in unit cell – Orientation depends on molecular orientation
Crystal
Patterson
Orientation from Patterson. Overlap • Rotate Patterson – Assess overlap
• Rotate again – Is the overlap better?
• Repeat for all orientations – Stepping over 3 angles
Patterson
MIR - Patterson methods Localization of heavy atoms Isomorphous Replacement difference Patterson (FPH-FP)2 P - protein, PH - protein with heavy atoms Anomalous Scattering difference Patterson (F+-F-)2 F(h,k,l), F(-h,-k,-l)
Multiple isomorphous replacement • •
• • • • • • • •
1. Soak a heavy atom (U, Hg, Pt, Au, Ag…) into your crystal 2. Hope that (a) the heavy atom is specifically binding to a few positions on the protein and (b) the binding does not change the protein conformation or crystal cell parameters (‘isomorphism’) 3. Collect a new diffraction data set from the derivatized crystal -> FPH1 4. Repeat for at least one another derivative -> FPH2 5. Then there is a computation procedure that yields an estimate of protein (‘native’) phases: FP (native protein crystal) FPH1 (derivative 1) -> φP (estimate) FPH2 (derivative 2) 6. Do a Fourier synthesis with FP and φ P
Fázování IR FP
FH
FP+FH=FPH FPH
Fázování MIR
f” (electrons)
6
Δf (electrons)
Anomalous scattering
0
0
• Se K edge • 30 electrons – Max 30% change
-10 1.0
0.98
0.97 λ(Å)
Multi-wavelength Anomalous Dispersion (MAD) Se, Hg, Yb, Ho, etc… XAFS – x-ray absorption fine structure, measure by fluorescence intensity off of protein crystal as a function of x-ray energy
Heavy Atom Structure Factors • Imaginary f” rotates structure factor anti-clockwise • FH(+h) ≠ FH(-h) – Different directions • FPH(+) = FP + FH(+) ≠ FPH(-) = FP + FH(-) – Friedel’s law breaks • Can use |FPH(+)|, |FPH(-)| as 2 derivatives – As slightly different – As know αP(+) = -αP(-)
i
f”
Fanom(+)
ΔF Fregular(+) R
Fanom(-) Fregular(-)
Anomální rozptyl
Poslední krok: Mapa elektronové hustoty • Výpočet mapy elektronové-hustoty – Metoda FFT • Možnost postavit proteinovou strukturu: – Rozlišení ~5Å: • Pozorujeme pouze Alfa-spirálu – Rozlišení ~3Å: • Vidíme hlavní řetězec, a některé boční řetězce – Rozlišení ~2Å: • Obyčejně dostatečné na postavení modelu – Rozlišení ~1Å: • Atomy jsou diskrétní koule
Model (Model building) Mapy elektronové hustoty - 5.5 Å α-spirála - 3.5 Ǻ tryptofán, tyrozín - 2.0-2.5Å Cα-N-CO-Cα -.1.2 Å atom - hlavní řetězec, aminokyseliny, - počítačová grafika FRODO, O, Coot, Quanta - ARP/wARP 2 2 Vypřesnění modelu (Refinement) Rfree ∑ w Fo − Fc
(
- CNS (XPLOR), REFMAC, SHELXL - reciproký prostor, reálny prostor - fixovaná geometrie, energie
)
2
Building a protein model • Find structural elements: – α-helices, β-strands
• Fit amino-acid sequence
Building a protein model • Find structural elements: – α-helices, β-strands
• Fit amino-acid sequence
Effects of resolution on electron density d=4Å
Note: map calculated with perfect phases
Effects of resolution on electron density d=3Å
Note: map calculated with perfect phases
Effects of resolution on electron density d=2Å
Note: map calculated with perfect phases
Effects of resolution on electron density d=1Å
Note: map calculated with perfect phases
Map fitting as a function of resolution
1.0Å
2.5Å
3.0Å
4.0Å
At 1.0Å, there is no problem fitting individual atoms (and the N atom is bigger than the carbons). At 2.5Å the ring is easily fitted, at 3.0Å less easily, and at 4Å the fit is very uncertain. The size of the fitted objects depends on the resolution: * High resolution: atoms * Medium resolution: residues, side-chains * Low resolution: secondary structure elements, molecules
Solvent. Tlumivý roztok.
Protein Solvent
Mapa elektronové hustoty v 4 Å rozlišení
Skeleton
Refinement. Upřesňování • Cíl: získat spolehlivý model proteinové struktury pro daná difrakční data. Měníme postupně parametry struktury (souřadnice atomů) aby shoda mezi experimentálními intenzitami a vypočítanými z modelu byla co nejlepší.
Etarget = wgeometry Egeometry + wX −ray EX −ray
Musí vypadat jako protein (constrains)
musí fitovat naše data
Refinement process • Bad phases → poor electron density map → errors in the protein model • Interpretation of the electron density map → improved model → improved phases → improved map → even better model … iterative process of refinement
Refinement programs •
Least-squares
(
M = ∑ whkl Fo − Fc 2
)
2 2
hkl
•
Maximum likelihood
• •
REFMAC (CCP4) CNS (XPLOR)
M = ∑ whkl ( Fo − Fc )
2
hkl
•
Real space refinement
M = ∑ whkl ( ρ o − ρ c )
2
hkl
R-factor, Rfree-factor Vážený a konvenční R-faktor. Kriteria správnosti. Čím menší tím lepší.
⎡ ∑ w(F − F wR = ⎢ 2 wF ⎢⎣ ∑ o 2 o
• •
• •
) ⎤⎥
1/ 2 2 2 c
⎥⎦
R=
∑| F
obs
hkl
(hkl ) − kFcalc (hkl ) |
∑| F
obs
(hkl ) |
hkl
Test sada is se vytvoří náhodným výběrem 5 až 10% reflexí. Tato se použije pouze na výpočet R(free). Zbývající reflexe, Pracovní sada, se použije na vlastní rafinaci struktury. Rfree may not exceed Rwork too much (~5%) Rwork must be lower than ~resolution*10 %
Ilustrace, verifikace, analýza - RASMOL, MOLSCRIPT SwissPDBViewer, Raster3D - PROCHECK - Ramachandran plot
Software. Academic. CCP4 www.ccp4.ac.uk PDB - Protein Database
www.rcsb.org/pdb
Validation •
• •
•
Free R-factor (cross validation) – Number of parameters/ observations Ramachandran plot Chemically likely (WhatCheck, PROCHECK) – Hydrophobic inside, hydrophilic outside – Binding sites of ligands, metals, ions – Hydrogen-bonds satisfied – Chemistry in order Final B-factor values
Art I
Art II
Výpočet struktur - shrnutí Redukce dat Fázování strukturních faktorů Výpočet elektronové hustoty, DM, obálka, skeleton
Budování modelu Rafinace struktury, váhy, maximum likelihood Verifikace
Sumár
Protein crystals • Regular arrays of protein molecules • ‘Wet’: 20-80% solvent • Few crystal contacts • Protein crystals contain active protein • Enzyme turnover • Ligand binding
Example of crystal packing
Problematic proteins •
Multiple domains
•
Similarly, floppy ends may hamper crystallization: change construct
•
Membrane proteins
Flexible
hydrophilic Lipid bilayer
hydrophobic hydrophilic
•
Glycoproteins Flexible and heterogeneous!!
Examples of crystal packing
Acetylcholinesterase ~68% solvent
β2 Glycoprotein I ~90% solvent (extremely high!)
Molekuly života
Remarks • Time consuming • Don’t work for all proteins – But if do, favored over NMR
• H-atoms don’t scatter much (too few electron) • Usual resolution ~2Å