OPVK CZ.1.07/2.2.00/28.0184
Drug-design - racionální návrh léčiv KFC/DD 05 – dokování RNDr. Karel Berka, Ph.D. ZS 2012/2013
Motto
… a my dnes ten klíč budeme hledat…
Osnova • Structure-based drug design (SBDD) – Dokování a de novo design • proč? – hledání molekul, které se váží do aktivních míst • čeho? – knihovny léčiv • jak? – generování konformací ligandů – skórovací funkce • a hlavně rychle!
Racionální návrh léčiv – možnosti Ligand–based DD
Structure–based DD
Hledání podobných ligandů QSAR Farmakofor
Dokování Virtual screening De novo design
Co je dokování?
V dokování se snažíme najít co nejlepší „fit“ mezi dvěma molekulami Bill Watterson: Calvin a Hobbes
Protein-ligand docking Výpočetní metoda, která mimikuje vazbu ligandu na protein
• Predikuje • pózu molekuly ve vazebném místě =geometrie • Vazebnou afinitu (skóre) reprezentující sílu vazby =energie Image credit: Charaka Goonatilake, Glen Group, University of Cambridge. http://wwwucc.ch.cam.ac.uk/research/cg369research.html
Protein-ligand docking II Dokování má 2 hlavní kroky: 1. Algoritmus hledání – Vytvoří se velké množství póz ve vazebném místě
2. Skórovací funkce – Vypočítá skóre, nebo vazebnou afinitu pro partikulární pózu
• Problémy - komplexita problému – Translace a rotace ligandu k pokrytí pokud možno celého prostoru, konformace ligandu a flexibilita proteinu, role solventu, čas…
Problém dokování I: Flexibilita • První krok – prohledání možných rotačních a translačních možností ligandu
• Flexibilita ligandu – tvorba ensemble všech možných konformací ligandu – vkládání do proteinu – protein jako rigidní
9
Konformace ligandu • Konformace – rotace kolem torzních úhlů rotovatelných molekul • Pro molekulu s N rotovatelnými vazbami, kdy je každý torzní úhel s rotacemi o θ stupňů (typicky 5°) • Počet konformací je pak (360º/ θ)N • Question – If the torsion angles are incremented in steps of 30º, how many conformations does a molecule with 5 rotatable bonds have, compared to one with 4 rotatable bonds?
• Having too many rotatable bonds results in “combinatorial explosion” • Also ring conformations Taxol
Image: IUPAC Gold Book
Lakdawala et al. BMC Chemical Biology 2001 1:2
Algoritmy hledání • Monte Carlo – Náhodný výběr – hledání globálního minima
• Genetické algoritmy – Učení se z předchozích generací
• Simulované žíhání – Ohřev - překonání bariér – Chlazení – hledání minim
• Postupný růst – Výstavba ze základního skeletu 11
Příprava na docking • • • •
identifikace relevantní struktury proteinu příprava struktury proteinu příprava ligandu rozhodnout co s dalšími jevy – voda – flexibilita receptoru
H. Jhoti & A.R. Leach (eds) Springer 2007, chapter 8 Structure based drug discovery
12
Příprava receptoru • Kam? – identifikace vazebného místa
• Dobrá struktura – nízké rozlišení (přesnost) – nízké B-faktory (flexibilita) – nízké R-free (pravdivost)
• Flexibilita – dokování do více struktur – vybrat nejlepší – dokování do struktury s největším vazebným místem – použít flexible docking 13
Konformace proteinu • Většina dokovacích programů bere protein jako rigidní
– Rigid Receptor Approximation • Ale… – Protein se může lehce deformovat, aby přijal různé ligandy (ligand-induced fit) – Aminokyseliny v aktivním místě mohou přijmout různé konformace • Flexible Receptor docking: – Vedlejší řetězce aminokyselin mohou rotovat kolem necyklických vazeb – Zvětšuje to prohledávaný prostor! • Větší pohyby proteinu mohou být brány v potaz jen samostatným dokováním do několika konformací proteinů
Image: Cláudio M. Soares, Protein Modelling Laboratory, http://www.itqb.unl.pt/labs/proteinmodelling/activities/psccip-pf
Příprava receptoru • protonace residuí – His (pKa ~ 6.04) – záleží na okolí (HIV proteáza)
• tautomerizace • rotamery
• výběr změní výsledky! 15
Příprava ligandu • Náboj a tautomerizace – Vytvořit všechny a pak je dokovat? – jak pak vybrat nejvyšší skore • každý stav bude mít jinou relativní energii.
– Ask an expert! (organičtí chemici)
• flexibilita – rotace kolem C-C vazeb, ale ne kolem C=C – úhly jsou fixovány (což může být problém) 16
Skórovací funkce 1. Ohodnocení jednotlivých póz v průběhu dockingu – objective function 2. Identifikace nejnižší volné energie 3. Seřadí vazebné volné energie mezi různými ligandy – Pro všechny kroky nemusí být vždy použita stejná funkce
17
Energetika vaznosti • Vazebná konstanta Kd = [P...L] / [P][L] odpovídá volné energii: ΔGbind = -RT ln Kd = -RT ln 1/IC50 Volná energie je kombinace enthalpie a entropie ΔGbind = ΔHbind - TΔSbind 18
Molekulární interakce - chemie Enthalpie: • Elektrostatika – (dielektrická konstanta)
• Vodíkové vazby • van der Waals
Entropie • Konformace • Solvatace – (hydrofobní efekt)
– (disperze a repulze)
• Desolvatace
19
Scoring function • Funkce, která ohodnotí vazebnou afinitu
• Funkce by měla lépe oskórovat správnou pózu, a lépe se vázající ligand • Parametrizovány proti známým vazebným volným energiím a známým správným pózám. • Většinou jsou nepříliš spolehlivé, ale rychlé 20
Typy scoring function • Force-field – parametrizovány dle molekulárně mechanických silových polí – Goldscore, DOCK, Autodock
• empirical – parametrizovány proti experimentálním vazebným afinitám(Kd,IC50) – různé členy (H-vazby, hydrofobní kontakty) – nutné trénování, rychlé – ChemScore, PLP, Glide SP/XP
• knowledge based – vycházejí ze znalostí komplexů protein-ligand – Boltzmannova hypotéza – co se často vyskytuje, to má silnou vazebnou volnou energii – PMF, DrugScore, ASP 21
Force-field scoring functions • Silové pole pro docking E = Ebond + Eangle + Edih + Ecoulomb + Evdw + Esolv
• časté použití gridu – šetří čas – vyhledání v tabulce je jednodušší, než znovu počítat interakční energie – receptor je často jeden a dokovaných látek je mnoho
22
Empirical scoring function • Rozložení vazebné energie do chemicky odpovídajících členů • Zachycuje specifické interakce – H vazby, π-π stacking
Linearizace členů je oblíbená DGbind = DGsolvent + DGconf + DGrot + DGt + DGr + DGvib
23
Böhm’s empirical scoring function • lineární suma jednotlivých příspěvků k vazbě • Bohm’s scoring function • vodíková vazba, interakce iontů, lipofilické interakce a konformační člen •
• •
•
•
Vodíková vazba a interakce iontů – závislé na geometrii interakce – velké odchylky jsou penalizovány (ideal distance R, ideal angle α) being penalised. Lipofilní člen – proporční k ploše dotyku povrchů mezi proteinem a ligandem (Alipo) Konformační entropický člen – penalizace za zmražení interních rotací ligandu - entropie – proporční k množství rotovatelných vazeb ligandu (NROT) ∆G hodnoty přiřazené jednotlivým členům jsou konstanty získané lineární regresí na experimentálních vazebných datech pro 45 protein–ligand complexů
Bohm, J. Comput.-Aided Mol. Des., 1994, 8, 243
Chemscore
25
Chemscore
26
Chemscore úspěšnost Korelační koefficient – r r2 <-1, 0, 1>
27
Problémy empirických skórovacích funkcí • Záleží na testovacím setu • chybějící interakční členy – metal-ion
• Parametrizovány na úspěch – Většinou se při parametrizaci používají jen molekuly, které se váží => takže pak se váže skoro všechno
28
Knowledge-based funkce Korelace strukturních dat z komplexů s volnou energií vazby A = -kT ln g(r) – Platí pro soubor částic v plynu – NE! nutně pak pro proteiny
29
Drugscore
30
Programy • DOCK (I. D. Kuntz, UCSF) • AUTODOCK (Arthur Olson, The Scripps Research Institute) • Vina (Arthur Olson, The Scripps Research Institute) • RosettaDOCK (Baker, Washington Univ., Gray, Johns Hopkins Univ.) • ArgusLabs • GOLD • FlexX • Hex • Glide (Schrodinger) 31
de novo dokování 1) Určení povrchu (SASA - Connelly) valením kuličky o velikosti molekuly vody po povrchu
2) Tvorba "negativního" obrazu receptoru z kuliček na povrchu z kroku 1 3) Určení vzdáleností mezi jednotlivými kuličkami 4) Konverze vzdáleností mezi kuličkami možné vazebné vzdálenosti mezi atomy 5) Srovnání nalezených vzdáleností mezi atomy se vzdálenostmi z databáze molekul 6) Výběr ligandů, které mají největší překryv 7) Spočítání ligand-receptor interakčních energií pomocí skórovací funkce
Dostavování (Groupbuild) • Stavění nových sloučenin komplementárních k cílovému vazebnému místu náhodnými kombinacemi jednotlivých fragmentů • Příklady fragmentů: – kyselina mravenčí, formaldehyd, formamid, amin, benzen, cyklohexan, cyklopentan, ethan, ethylen, voda, methanol, methan, sulfan, thiofen
Procedura: 1) Tvorba gridu pro vazební místo 2) Generování struktury 1) 2) 3) 4)
3)
Dokování základního "core" fragmentu Dostavování (rozšiřování jádra o jednotlivé fragmenty) Náhodně vybrat několik nejlepších struktur Iterovat přes kroky 2 a 3 (i.e. pokračovat ve stavbě) dokud nejsou splněna finální kritéria (počet kroků, minimální energie, energie na atom, apod.)
Výběr struktur pro syntézu a analýzu
FlexX, AutoGrow
Groupbuild procedura
CH3 N
init ial core f ragment
f ragment t o be added
C O N CH2
C
C
C
O
O
O
N
N
C O N
CH2
C O N
CH2
Analýza nalezených struktur A) Visuální zkoumání vzniklých struktur, zda se dají „uvařit“ B) Identifikace specifických pozic některých skupni, které by mohly odpovídat známému farmakoforu C) Prohledání databáze pro podobné molekuly
Ukázka dostavby pro hypotetický receptor O H
H N
Greceptor
Gsolution
-8
-10
-30
-80
-30
-20
O H O H N
O O H O H3C
O
H N
G = Geq,2 – Geq,1 = Greceptor - Gsolution
Kontrola kvality • Redocking zpátky do krystalu – RMSD < 2A – flexible ligand docking ~70% – nutno otestovat, který docking program dává pózu dobře
• test sety – validace programů – GOLD test set, Astex set – decoys – ZINC, DUD (podobné fyz.chemické vlastnosti, odlišné struktury)
• VS: obohacení – Enrichment factor – (BED)ROC křivky – ΔGeff
a/n EF = ----A/N
- top (např. top10) a – aktivní n - celkem - total
ΔGeff = ΔGeff/NnonHatoms 37
Kvalita virtuálního screeningu
38
Metody na řazení • ROC – receiver operating characteristic curve
• AUAC – area under the accumulation curve
• average rank of actives • EF – enrichment factor
• RIE – robust initial enhancement
• BEDROC – Boltzmann-enhanced discrimination of receiver operating characteristic Published in: Jean-François Truchon; Christopher I. Bayly; J. Chem. Inf. Model. 2007, 47, 488-508. DOI: 10.1021/ci600426e Copyright © 2007 American Chemical Society
Figure 9 Different accumulation curves from sampling (n = 50, N = 25000) shown together with the corresponding ROC and BEDROC values where α = 20.0. An exact CDF with λ = 20 is also shown to highlight the fact that the BEDROC metric returns a value of 1/2 for a curve close to this CDF.
Příklady použití
40
Příklady použití
41
Příště: • Cvičení QSAR, dokování