Farkas Ödön és Gáspári Zoltán
Molecular Informatics lecture
T.O.C. 1. 2. 3. 4. 5.
Introduction, History; Representation of molecules I. Representation of molecules II. Representation of molecules and their reactions Databases in Chemistry I. Databases in Chemistry II. Search in databases
6. 7. 8. 9. 10.
Modeling I. Modeling, docking II. Data management Structure/activity relationship Drug discovery
Introduction february, 12, 2014
ELTE, Institute of Chemistry, Department of Organic Chemistry
1
Farkas Ödön és Gáspári Zoltán
Molecular Informatics gyakorlat
Tematika 1. 2.
Data available on the internet, databases; Representation, file formats Programing environment for chemical informatics
3. 4.
Modeling in practice Data mining, building and validating models
Introduction february, 12, 2014
ELTE, Institute of Chemistry, Department of Organic Chemistry
2
Molecular Informatics Location
Experimental Chemistry
Preparative Chemistry Spectroscopy Structure determination Separation Reaction kinetics Biochemistry Drug design, etc.
Introduction february, 12, 2014
C h e m i c a l
i n f o r m a t I c s ELTE, Institute of Chemistry, Department of Organic Chemistry
Computational, theoretical chemistry
Theory Quantum Chrmistry Theoretical structural studies Molecular modeling, etc. Optimization algorithm for molecular mechanics - Newton-Raphson step
The basis of the most commonly used quasi-Newton related
optimization methods is the Newton-Raphson step. It has the following form with the projected MM Hessian:
q H q f q B B t H MM B B t f q B B t H MM B f x
x B t H MM B f x PTR B t H MM B
SC
fx
We need a bit complicated way for calculating the established
force change related to the actual internal coordinate step (q΄):
B H t
MM
B Bt B
SC
Bt q f x
3
Molecular Informatics Locating
Quantum chemistry, computational chemistry
Chemistry Quantum mechanics Kémiai informatika Biology
Introduction february, 12, 2014
Bioinformatics
ELTE, Institute of Chemistry, Department of Organic Chemistry
4
Molecular informatics Why „molecular”?
Number of known compunds Organic
Inorganic
1900 80 000 1937 470 000 30 000 1970 3 000 000 50 000 2000 ~15 000 000 ? 2007 ~50 000 000 ? The number of possible carbon containing compunds with separate “identities” is practically infinit, most of molecular chemistry is under the umbrella of organic chemistry. Introduction february, 12, 2014
ELTE, Institute of Chemistry, Department of Organic Chemistry
5
Locating molecular chemistry in terms of temperature T (K) 15 0 0 0 00 0
The core of Sun
Molekuláris kémia 7 00 0 60 0 0
The surface of Sun
50 0 0
The core of Earth
40 0 0 30 00 20 00 10 00
The surface of Earth Space
0 Introduction february, 12, 2014
ELTE, Institute of Chemistry, Department of Organic Chemistry
6
Molecular chemistry Athe cause of variability: extremly complicated potential energy surface Transitional states Stable structures
Introduction february, 12, 2014
ELTE, Institute of Chemistry, Department of Organic Chemistry
7
Insight into the history of organic chemistry Idő
Személy
1661-80 ~1790 1803-08
Boyle Lavoisier Dalton
1824
Liebig Wöhler Berzelius Liebig, Wöhler Dumas Pasteur
1830 1832 1838 1848 1853
1854 1858-65 1865 1874
Anyagismeret
Reakciók, technikák
korpuszkula-elmélet kémiai elem atom hipotézis ezüst-cianát ezüst-fulmiát „izomeria”
optikailag tiszta borkősav
benzaldehid átalakítása szubsztitúciós reakciók enantiomerek elválasztása
Gerhardt, Laurent Frankland Kekulé Kekulé, Couper, Butlerov Kekulé van’t Hoff, Le Bel Introduction february, 12, 2014
Elmélet
azonos összegképlet, különböző kapcsolódási sorrend dualista gyökelmélet dualista gyökelmélet optikai aktivitás oka a molekuláris disszimetria típuselmélet vegyértékfogalom képletírás, struktúratan, szerkezeti képlet
benzol szerkezete tetraéderes vegyértékek, sztereokémia ELTE, Institute of Chemistry, Department of Organic Chemistry
8
Insight into the history of organic chemistry Type theory Idő
Személy
1661-80 ~1790 1803-08
Boyle Lavoisier Dalton
1824
Liebig Wöhler Berzelius Liebig, Wöhler Dumas Pasteur
1830 1832 1838 1848 1853
1854 1858-65 1865 1874
Gerhardt, Laurent Frankland Kekulé Kekulé, Couper, Butlerov Kekulé van’t Hoff, Le Bel Introduction february, 12, 2014
Reakciók, technikák
Anyagismeret
H H ezüst-cianát
H Cl
ezüst-fulmiát „izomeria”
H H O
hidrogén sósav optikailag tiszta borkősav
Kekulé:
benzol szerkezete
H H N H
víz
ammónia
benzaldehid átalakítása szubsztitúciós reakciók enantiomerek elválasztása
H H C H H
metán
Elmélet korpuszkula-elmélet kémiai elem atom hipotézis azonos összegképlet, különböző kapcsolódási sorrend dualista gyökelmélet dualista gyökelmélet optikai aktivitás oka a molekuláris disszimetria típuselmélet vegyértékfogalom képletírás, struktúratan, szerkezeti képlet tetraéderes vegyértékek, sztereokémia
ELTE, Institute of Chemistry, Department of Organic Chemistry
9
Insight into the history of organic chemistry Idő
Személy
1661-80 ~1790 1803-08
Boyle Lavoisier Dalton
1824 1830 1832 1838 1848 1853
1854 1858-65 1865 1874
Anyagismeret C
O
Formula writing Reakciók, technikák
H
CH3 CH2 O H
H2
Liebig Wöhler Berzelius Liebig, Wöhler Dumas Pasteur Gerhardt, Laurent Frankland Kekulé Kekulé, Couper, Butlerov Kekulé van’t Hoff, Le Bel Introduction february, 12, 2014
ezüst-cianát C H3 ezüst-fulmiát „izomeria” Couper
Kekulé
Butlerov
benzaldehid átalakítása szubsztitúciós reakciók enantiomerek elválasztása
Elmélet korpuszkula-elmélet kémiai H elem H atom hipotézis H
C
C
O
H
azonos összegképlet, különböző H Hkapcsolódási sorrend 1870-től dualista gyökelmélet dualista gyökelmélet optikai aktivitás oka a molekuláris disszimetria 6 típuselmélet
The changes of the structural formula of the ethanol optikailag tiszta borkősav with chemical formula C2H O vegyértékfogalom
képletírás, struktúratan, szerkezeti képlet benzol szerkezete tetraéderes vegyértékek, sztereokémia ELTE, Institute of Chemistry, Department of Organic Chemistry
10
Insight into the history of Kekulé’s dream: the structure of benzene organic chemistry Idő
Személy
1661-80 ~1790 1803-08
Boyle Lavoisier Dalton
1824
Liebig Wöhler Berzelius Liebig, Wöhler Dumas Pasteur
1830 1832 1838 1848 1853
1854 1858-65 1865 1874
Anyagismeret H H
ezüst-cianát ezüst-fulmiát „izomeria”
C C
H
optikailag tiszta borkősav
Introduction february, 12, 2014
C
Elmélet H
korpuszkula-elmélet kémiai elem atom hipotézis
H
H C
C
Gerhardt, Laurent Frankland Kekulé Kekulé, Couper, Butlerov Kekulé van’t Hoff, Le Bel
Reakciók, technikák Which one is correct?
C
H
Cazonos összegképlet, C
különböző kapcsolódási sorrend Cdualista gyökelmélet C dualista gyökelmélet C H optikai aktivitás oka a molekuláris disszimetria típuselmélet H
Melyik az igazi?
benzaldehid átalakítása C szubsztitúciós reakciók H H enantiomerek elválasztása
H
vegyértékfogalom képletírás, struktúratan, szerkezeti képlet benzol szerkezete tetraéderes vegyértékek, 6 sztereokémia
Structural formulas for benzene, C6H ELTE, Institute of Chemistry, Department of Organic Chemistry
11
Insight into the history of organic chemistry Idő
Személy
1661-80 ~1790 1803-08
Boyle Lavoisier Dalton
1824
Liebig Wöhler Berzelius Liebig, Wöhler Dumas H Pasteur
1830 1832 1838 1848 1853
1854 1858-65 1865 1874
Gerhardt, C Laurent HFrankland Kekulé
Reakciók, technikák
Anyagismeret
Elmélet korpuszkula-elmélet kémiai elem atom hipotézis
H H
Kekulé, Couper, metán Butlerov Kekulé van’t Hoff, Le Bel
methane
Introduction february, 12, 2014
ezüst-cianát ezüst-fulmiát „izomeria”
optikailag tiszta borkősav
Stereochemistry benzaldehid átalakítása szubsztitúciós reakciók Q enantiomerek elválasztása
Q
Y
R
X
Y X
enantiomer pár benzol szerkezete
enatiomeric pair
R
azonos összegképlet, különböző kapcsolódási sorrend dualista gyökelmélet dualista gyökelmélet Q optikai aktivitás oka a molekuláris disszimetria típuselmélet
X
vegyértékfogalom R
Y
képletírás, struktúratan, szerkezeti képlet tetraéderes vegyértékek, sztereokémia
ELTE, Institute of Chemistry, Department of Organic Chemistry
12
Insight into the history of organic chemistry Idő
Személy
1661-80 ~1790 1803-08
Boyle Lavoisier Dalton
1824
Liebig Wöhler Berzelius Liebig, Wöhler Dumas Pasteur
1830 1832 1838 1848 1853
1854 1858-65 1865 1874
Anyagismeret
Reakciók, technikák
Stereochemistry
ezüst-cianát ezüst-fulmiát „izomeria”
optikailag tiszta borkősav
benzaldehid átalakítása szubsztitúciós reakciók enantiomerek elválasztása
Gerhardt, Laurent Frankland Kekulé Kekulé, Couper, Butlerov Kekulé van’t Hoff, Le Bel Introduction february, 12, 2014
Elmélet korpuszkula-elmélet kémiai elem atom hipotézis azonos összegképlet, különböző kapcsolódási sorrend dualista gyökelmélet dualista gyökelmélet optikai aktivitás oka a molekuláris disszimetria típuselmélet vegyértékfogalom
Heptahelicene, conformational enantiomers
képletírás, struktúratan, szerkezeti képlet
benzol szerkezete tetraéderes vegyértékek, sztereokémia ELTE, Institute of Chemistry, Department of Organic Chemistry
13
Insight into the history of Tautomerization organic chemistry Idő
isomerism based on the placement SzemélyConstitutional Anyagismeret Reakciók, technikák of Hydrogens Elmélet
1661-80 ~1790 1803-08
Boyle Lavoisier Dalton
1824
Liebig Wöhler Berzelius Liebig, Wöhler Dumas Pasteur
1830 1832 1838 1848 1853
1854 1858-65 1865 1874
korpuszkula-elmélet kémiai elem atom hipotézis ezüst-cianát ezüst-fulmiát „izomeria”
more stable
optikailag tiszta borkősav
benzaldehid átalakítása szubsztitúciós reakciók enantiomerek elválasztása
Gerhardt, Laurent Frankland Kekulé
vegyértékfogalom
Kekulé, Couper, Butlerov Kekulé benzol szerkezete van’t Hoff, Dynamic equilibrium of constitutional Le Bel Introduction february, 12, 2014
azonos összegképlet, különböző kapcsolódási sorrend dualista gyökelmélet dualista gyökelmélet optikai aktivitás oka a molekuláris disszimetria típuselmélet
More
képletírás, struktúratan, stableszerkezeti képlet tetraéderes vegyértékek,
izomers (like keto ↔ enol tautomerism): sztereokémia
ELTE, Institute of Chemistry, Department of Organic Chemistry
14
What is the molecule How to visualize? - X-ray eyes:
Methane
Ammonia
Water
- Eyes of the chemist:
Introduction february, 12, 2014
ELTE, Institute of Chemistry, Department of Organic Chemistry
15
What is this molecule?
Ethanol Introduction february, 12, 2014
ELTE, Institute of Chemistry, Department of Organic Chemistry
16
Molecular informatics Ways of treating problems
1. The theoretical foundation of molecular chemistry is quantum mechanics but the direct use of quantum mechanics for solving real-life chemical problems is usually not practical. However, quantum chemistry and molecular modeling with the use of approximations can expand the limits of theoretical treatment of chemical problems. (deductive approach) 2. Chemical systems, problems are not easy to be trated via the tools of informatics. Currently, the most efficent way is using analogies instead of building theories. However, this needs the collection, storage and management of a huge amount data. (inductive approach) Introduction february, 12, 2014
ELTE, Institute of Chemistry, Department of Organic Chemistry
17
Molecular informatics Challenges
The primary task for a chemist is to synthesize compounds with the required properties. property
→
structure
structure-, activity, property relationship (Q)SAR, (Q)SPR
structure
→
reactants
reaction design
synthesis
→
product
structure determination Introduction february, 12, 2014
ELTE, Institute of Chemistry, Department of Organic Chemistry
18
Molecular informatics History • Structural databases • The National Bureau of Standards develops a method for finding matching molecular structures based on a substructure (substructure search). • NSF supports Chemical Abstracts Service (CAS) from 1960 to work out methods for storing, managing data related to chemical structures and information. • Companies in the chemical and drug industry starts up their own databases.
• Structure-activity relationships • Hammet and Taft (1950s), Hansh (1964-), Free-Wilson (1964). The primary goal is to predict biological activities. Drug industry…
• Molecular modeling • End of 1960s: visualization of 3D structures on display, the first molecular mechanics forcefields appear.
• Structure determination • 1964- Stanford, DENDREL project for mass spectorscopy.
• Reaction design • 1967 reaction database, University of Sheffield • 1969- computer aided reaction design, Harvard University Introduction february, 12, 2014
ELTE, Institute of Chemistry, Department of Organic Chemistry
19
Molecular informatics Some locally accessible computer program • ChemAxon (http://www.chemaxon.com), independent of operating system • MarvinSketch
• Drawing molecules • Computations are through plugins • MarvinView
• Display molecules • MarvinSpace
• Display structure, biomolecular applications • JChem / Instant JChem
• Database management for chamical structures, reactions • Reaction design • CambridgeSoft ChemOffice, Windows applications • Integrated chemical informatics applications
• Gaussian • Quantum chemical program package Introduction february, 12, 2014
ELTE, Institute of Chemistry, Department of Organic Chemistry
20