UMĚLÉ NEURONOVÉ SÍTĚ V CHEMII doc. RNDr. Vlastimil Dohnal, Ph.D.
Podpora přednášky kurzu Mezioborové dimenze vědy
doc. RNDr. Vlastimil Dohnal, Ph.D. Katedra chemie PřF UHK
Příklady aplikací ANN QSAR a QSPR studie Modelování retenčních faktorů kvarterních pyridiniových oximů v tenkovrstvé chromatografii. Reaktivační účinnosti pyridiniových oximů vůči enzymu acetylcholinesteráze inhibované širokým spektrem bojových látek. Optimalizace podmínek separačních metod Optimalizace separace chirálních látek Dekonvoluce píků v separačních metodách Klasifikace Modelování distribuce uranu ve zlatých dolech v Jihoafrické republice. Klasifikace vín dle původu (Kanárské ostrovy) Hodnocení stavu biosenzoru
Použití umělých neuronových sítí Dvě fáze Adaptace
Hledání optimálních hodnot váhových koeficientů, prahových hodnot a dalších proměnných. Adaptační algoritmus Rozdělení dat do několika skupin (trénovací, testovací, verifikační). Minimalizace rozdílu mezi vypočtenými a požadovanými výstupy.
Predikce
Využití adaptované umělé neuronové sítě pro výpočet
Příprava dat
DATA TRÉNOVACÍ DATA
VERIFIKAČNÍ DATA
TESTOVACÍ DATA
Molekulové deskriptory
Dragon Professional v5.5 1664 molekulových deskriptorů!!!
Redukce počtu proměnných „Statistická analýza“ Genetické algoritmy Latentní proměnné (metoda hlavních komponent) Offline (PCA) Online (Sanger, Oja)
Hybridní neuronové sítě MD1 MD2 y1
MD3
PCA
MD1664 VSTUPNÍ VRSTVA
SKRYTÁ VRSTVA (latentní proměnné)
y2
SKRYTÁ VRSTVA
VÝSTUPNÍ VRSTVA
Fyz.-chem. vlastnosti Biologický účinek Toxicita Apod.
Modelování retenčních faktorů Vstupní data Molekulové struktury kvartérních pyridiniových oximů (1644 deskriptorů, 21 látek)
Vyloučení konstantních deskriptorů, MD (295) Celkem použito pro umělou neuronovou síť 634 MD Normalizace dat (interval 0 – 1)
Výstupní data Retenční faktory těchto oximů získané chromatografií na tenké vrstvě (1) Rozdělení dat do skupin Tréninkový data set (16) Verifikační data set (5) Testovací data set (4 nově syntetizované látky)
Pyridiniové oximy NOH NOH
NOH
N N
+
N
CH3
+
N
CH2
X-
CH2 N
N
O
+
2X
CH2
NOH
NOH
+
N
CH2
2 Cl
NOH
NOH
+
+
HON
NOH
+
+
N
N
N
CH2 CH CH CH2
CH2
2 Br -
-
O O
H2N
NOH
+
N
N
CH2 CH2 CH2 CH2
2 Br-
CH2
+
-
NH2 HON
+
O
H2N
+
N
CH2
2 Br-
O
N
N
CH2 O CH2
+
NOH
CH2
NOH
+
+
2X-
NOH
2 Cl-
NOH
O
H2N
2 Br +
+
HON
NOH
N
N
HON
CH2 CH2 CH2 CH2
+
N
N
CH2 CH2 CH2
+
N
CH2 CH2
N
CH2 CH2 CH2
CH2 CH2
2 Br
N
CH CH
+
CH2
NOH 2X-
N
+
CH3
N NOH
+
CH3
I-
N
N
NOH
I-
CH3
+
CH3
2 Br-
-
NOH
NOH
O
H2N
+
CH2
N
N
+
O
H2N
+
+
NOH
+
N
N
+
CH2
I-
N O
+
CH2
NOH 2X-
Retenční faktor
Reaktivátory acetylcholinesterázy
Modelování retenčních faktorů Hybridní umělá neuronová síť Optimální architektura 634:8:3:1 Genetický adaptační algoritmus Evaluace modelů
Pearsonův korelační koeficient RMSD (root mean square deviation)
RMSD
1 N
N i 1
R calc F
R Ftarget
2
Výsledky modelování 1
Vypočtené hodnoty
0,75
0,5
0,25
y = 1,0012x + 0,0142 R² = 0,8042
0
0
0,25
0,5
0,75
Experimentální hodnoty
1
QSPR pyridiniových oximů Vstupní data Molekulové struktury kvartérních pyridiniových oximů (10 deskriptorů, 17 látek)
Normalizace dat (interval 0 – 1)
Výstupní data Reaktivační účinnosti použitých oximů vůči 4 bojovým látkám (4) Rozdělení dat do skupin Tréninkový data set (13) Verifikační data set (4) Testovací data set (0)
Pyridiniové oximy NOH
NOH
O
H2N
O
H2N
NOH
O
H2N
CH3
+
N +
+
N
N
CH2
O
CH2
NOH
CH2
CH2
+
+
O
CH2
CH2
+
N
CH2
CH CH
2X-
+
+
CH3
N
NOH
I-
CH2
2 Cl
+
N
NOH
CH3
CH2
X-
2X-
-
NOH
+
+
N
N
CH2
O
CH2
2 Cl
-
NOH
+
CH2 N
HON
NOH
NOH
I-
2X
HON
+
N
CH3
O
NOH
N
N
N
CH2
2 Br -
CH3
+
N
NOH
+
NOH
N
+
N
O
H2N
N
CH2
+
N
2X-
O
H2N
+
N
+
CH2
NOH
I-
+
N
N CH2
CH2
O
H2N
-
NOH
2 Br -
+
N
CH2 CH2
+
N
CH2 CH2
2 Br -
Molekulové deskriptory
H2N
1
3
2
N
Deskriptor
Hodnoty
1 Substituent
0–H 1 – aldoxim 2 – ketoxim 0–H 1 – aldoxim 2 – ketoxim
6 Délka můstku
Počet atomů
7 Substituent
0–H 1 – pyridinium 2 – fenyl 3 – methyl 0 – nepolární 1 – polární
8 Substituent
0–H 1 – pyridinium 2 – fenyl 3 – methyl 0–H 1 – aldoxim 2 – ketoxim
8
+
N
+
3 Substituent 7
NOH 9
CH2
Hodnoty
2 Substituent
NOH
O
Deskriptor
O
CH2 4,5,6
2X-
4 Polarita spojovacího můstku 5 0 – ne Přítomnost 1 – ano dvojné vazby na můstku
9 Substituent
0–H 1 – aldoxim 2 – ketoxim
Umělá neuronová síť 2
1
9 3
2
1
8
+
+
N
CH2
Dopředná neuronová síť
NOH
O
H2N
N O
7
CH2
4,5,6
NOH
9
2X-
Adaptační algoritmus
1
4
%reaktivace 100
100 a0 ar a0 ai
back-propagation Optimální architektura 9:4:4 Adaptováno 5 sítí Průměrná hodnota chyby výpočtu 7 % (rozpětí od 0,21 do 22,45 %) Predikce nových látek
Optimalizace separačních metod Optimalizace podmínek separace chirálních látek
metodou kapilární zónové elektroforézy
Chirální látky („chiros“ = ruka) Chiralita = asymetrie
prostorového rozložení molekuly Chirální objekt Není totožný se svým
zrcadlovým obrazem Nemá střed Nemá rovinu symetrie
Chirální molekuly =
enantiomery http://cs.wikipedia.org/wiki/Soubor:Chirality_with_hands.jpg
Objev chirality Louis Pasteur (1822-1895) Kyselina vinná ve vinném
kameni (r. 1848)
http://cs.wikipedia.org/wiki/Soubor:Louis_Pasteur.jpg
Chiralita v přírodě
Enantiomery Stejné fyzikálně
chemické vlastnosti Liší se stáčením roviny polarizovaného světla Liší se tvarem
Senzorické vlastnosti enantiomerů Vůně Linalool
(R)-(-)-linalool – květinová vůně do levandulova (S)-(+)-linalool – hořce pomerančová vůně
Limonen (-)-limonen – terpenická vůně (+)-limonen – citrusová vůně Karvon (-)-karvon – peprmintová vůně (+)-karvon – kmínová vůně
Chuť Asparagin
(S)-asparagin – hořký (R)-asparagin - sladký Při tepelné úpravě hořkne
Toxikologické vlastnosti enantiomerů (S)-thalidomid - teratogen
(R)-thalidomid - sedativum
Kapilární zónová elektrofréza Separace závisí na Složení elektrolytu Napětí pH elektrolytu Modifikátorech Teplotě Apod. http://www.beckmancoulter.co.jp/images/product/product01/capzone_07.gif
Separace enantiomerů Trp a Phe
cyklodextrin
látka
komplex
Různé stability komplexů s cyklodextrinem vedou k separaci
Plánování pokusů Relaxační metoda
Experimentální design CCD
Měření koncentrace -CD
pH elektrolytu
koncentrace elektrolytu
Modelování pomocí SRM
Modelování pomocí ANN
Optimalizovaná separace Pořadí L-, D-tryptofan L-, D-fenylalanin
Dekonvoluce píků
Dekonvoluce píků
Central composite design
Klasifikace distribuce uranu
Klasifikace distribuce uranu
Místa odběru vzorků
Vstupní data
Korelační matice
PCA
Kohonenova SOM
Váhy vybraných faktorů v SOM uran – vysoký!!!
pH – kyselé!!
sírany – vysoké!!!
Klasifikace vín dle původu
Kanárské ostrovy
Carracedo et al.: Journal of Volcanology and Geothermal Research 94 (1999) 169-190.
Klasifikace vín dle původu
Klastrová analýza
SOM a váhy pro jednotlivé kovy
Srovnání LDA a ANN
Verifikace původu balené vody Neva Grošelj, Grishja van
der Veer, Marjan Tušar, Marjan Vračko, Marjana Novič Verification of the geological origin of bottled mineral water using artificial neural networks Original Research Article Food Chemistry, Volume 118, Issue 4, 15 February 2010, Pages 941-947
Experiment Stanovení obsahu Ca,
Mg, Na, K, HCO3-, SO42-, Cl, F a pH 145 vod Counter-propagation ANN Vztah mezi složením vody a geologickým podložím
Klasifikace signálu biosenzoru
Biosenzor na bázi acetylcholinesterázy
Klasifikace signálu biosenzoru tv ts tA
Vzorkování dat tA – přídavek acetylthiocholinu tV – přídavek vzorku tS – přídavek syntostigminu
Vektor navzorkovaných dat I
f
t A t A 3t A ; ; ;t A;t A 4 2 4 tV ; tV
tv
tA 8
tS
tv 4
; tV
tv
;t A
tA 4
tS
tv 2
; tV
;t A
3 tv
tA 8
3 tS
tv 4
;t A
;tS ;tS
tv
tA 2
tk
tS 4
;t A
;tS
5 tv
tA 8
tk
tS 2
;tS
;t A
3 tv
tA 4
3 tk
tS 4
;tk
;t A
7 tv
tA 8
;
Dataset
Vektor navzorkovaných dat 45,5
16,6
9,3
7,2
526
571
607
638
662
678
689
Dataset
690
614
593
568
545
492
437
387
347
Kódovaní charakteristických vlastností
10,4
12,1
7,3
…
71,5
1
0
0
0
0
0
0
6,9
4,1
3,0
…
34,7
0
0
0
1
0
0
0
6,8
3,4
2,4
…
22,5
0
0
0
1
0
0
1
134
132
134
…
286
0
0
1
0
1
0
0
3,2
2,7
2,2
…
20,6
0
0
1
1
0
0
0
8,6
7,6
5,1
…
31,4
0
0
0
1
0
0
1
45,5
16,6
9,3
...
347
1
0
0
0
0
0
0
… … …
Promítnutí dat 45,5
16,6
9,3
7,2
526
571
607
638
662
678
689
690
614
593
568
545
492
437
387
347
Kohonenova mapa
Expertní systémy Určení chemické struktury látek Odhad toxicity Odhad ADME
Určení chemické struktury
UV/VIS spektrum
1H-NMR
spektrum
IČ spektrum
13C-NMR
spektrum
MS spektrum
Orální absorpce léčiv A. Guerra, N.E. Campillo,
J.A. Páez Neural computational prediction of oral drug absorption based on CODES 2D descriptors Original Research Article European Journal of Medicinal Chemistry, Volume 45, Issue 3, March 2010, Pages 930-940
Aplikace ANN v toxikologii I absorpce, distribuce, metabolismu a exkrece (ADME) toxicity látek vůči konkrétnímu živému organismu rozpustnosti rozdělovací koeficienty oktanol-voda mutagenecita kancerogenecita atd.
Aplikace ANN v toxikologii II ANN jsou součástí některých komerčních programů
(hybridní expertní systémy) pro odhad toxicity HyTEx – hybrid toxicological expert system
Závěr Možnost využití ANN Klasifikační problémy
Místo původu potraviny Identifikace výrobce, šarže atd. Vyhodnocení signálu biosenzoru
Modelování
QSAR – vztah struktura – aktivita chemické látky Drug design Hledání optimálních podmínek separačních metod
Děkuji za pozornost