UMĚLÉ NEURONOVÉ SÍTĚ V CHEMII KAM KRÁČÍ ANALYTICKÁ CHEMIE? doc. RNDr. Vlastimil Dohnal, Ph.D.
studijní materiál ke kurzu Mezioborové dimenze vědy
Fakulta informatiky a managementu Univerzity Hradec Králové
Projekt Informační, kognitivní a interdisciplinární podpora výzkumu je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky.
1. Úvod Umělé neuronové sítě (artificial neural networks, ANN) jsou matematickým nástrojem, který napodobuje funkci mozku. Přes všechny útrapy v průběhu vývoje adaptačních a výpočetních algoritmů, jsou v současné době ANN sofistikovaným nelineárním výpočetním nástrojem schopným modelovat prakticky jakkoliv složitou funkci. Jsou schopny se „učit“, tedy hledat optimální strukturu, na základě již známých dat a následně mohou být použity k predikci (předpovědi) průběhu funkce i v bodech, pro které nebyly ANN předloženy hodnoty. ANN pronikají do celé řady oborů a také přístrojů všedního života, počínaje některými domácími spotřebiči a ekonomikou či přírodovědnými obory konče. Jedním z oborů, kde se ANN uplatňují již delší dobu je i chemie [1]. Jednou z prvních obsáhlejších monografií zabývající se perspektivou využití ANN v chemii byla kniha „Neural networks for chemists: An introduction“ autorů Jure Zupana a Johanna Gasteigera [2], která vyšla na počátku 90. let 20. století. Od té doby nastal ohromný rozvoj aplikací ANN v tomto vědním oboru. ANN patří mezi významné nástroje mezioborového vědního oboru zvaného chemometrie. Své uplatnění nacházejí umělé neuronové sítě zejména v oblasti modelování vztahu mezi strukturou chemické látky a jejími fyzikálně-chemickými, farmakologickými a farmakodynamickými vlastnostmi, jako jsou například disociační konstanta [3] či bod varu [4]. Také jsou využívány v odhadu biokoncentrace [5] či toxického účinku látky či kombinace látek [6]. Všeobecná snaha o minimalizaci počtu nutných experimentů na zvířatech a snížení finančních výdajů při testování chemických látek vede, zvláště nyní, v době registrace chemických látek do systému REACH, k tomu, že jsou vyhledávány alternativní metody testování toxicity. Vedle různých statistických metod jsou využívány různé QSAR (quantitative structure-activity relationship) či QSPR (quantitative structure-property relationship) modely, často i na bázi umělých neuronových sítí [7] respektive expertních a fuzzy systémů [8]. Je možné využít obě skupiny ANN a to jak supervised, tak i unsupervised. 2. Molekulové deskriptory Tradiční zápis chemické struktury sloučenin je zpravidla uváděn v symbolické podobě (strukturními chemickými vzorci). Výpočetní nástroje, jako jsou různé statistické metody či ANN však vyžadují konverzi tohoto zápisu do formy numerické. K vyjádření struktury molekuly se tak používá celá řada parametrů, které v numerické podobě popisují či charakterizují danou strukturu. Volba vhodného parametru či kombinace parametrů není zcela triviální záležitostí a neustále jsou vyvíjeny nové parametry s cílem ještě věrněji a lépe popsat danou molekulu. Souhrnně se tyto charakteristiky, převádějící symbolický zápis na číselné veličiny matematicky či pomocí standardizovaných experimentů, nazývají molekulovými deskriptory (MD) [9]. Tyto deskriptory se dělí do dvou základních skupin a to na teoretické a experimentální. První skupinou jsou teoretické deskriptory. Ty se tvoří matematickou či logickou transformací chemické informace zakódované ve strukturním vzorci. Tuto skupinu deskriptorů lze ještě rozdělit podle dimensionality na 0 až 4-rozměrné. Do skupiny 0-rozměrných jsou řazeny ty informace, které jsou odvozeny přímo z chemického vzorce. Jsou to například molekulová hmotnost, zastoupení jednotlivých prvků 1
či počet atomů těchto prvků v molekule, van der Waalsovy objemy atomů a podobně. Jednorozměrné deskriptory již vypovídají o substrukturách a fragmentech, ze kterých se daná molekula skládá. Jedná se tedy o počet a druh funkčních skupin, cyklů, vazeb a substituentů. Tyto skupiny MD jsou často souhrnně nazývány jako konstituční MD. Dvourozměrné deskriptory, tzv. topologické MD, popisují vlastní uspořádání atomů v molekule, to jakým způsobem jsou mezi sebou propojeny. Mohou částečně popisovat i interakce mezi nimi. Patří mezi ně například Weinerova matice vzdáleností atomů, Randićovy indexy, Kier-Hallova konektivita, Balabánův J-index apod. Další skupinou jsou 3D deskriptory. Jak již název vyjadřuje, jedná o ty, které jsou odvozeny z prostorového či geometrického uspořádání molekuly. Jedná se například o molekulový povrch apod. Poslední skupinou, 4D, jsou deskriptory odvozené od stereo-elektronové reprezentace molekuly. Jedná se o výsledky kvantově-mechanických výpočtů parciálních níbojů atomů v molekule, dipólového momentu, polarizovatelnosti, uspořádání elektronů v orbitalech, energie molekulových orbitalů, řád vazby, solvatací energie aj. Využívané jsou i termodynamické MD, jako jsou vibrační, rotační a translační energie. Experimentální molekulové deskriptory se získávají mnohem obtížněji než teoretické. Mezi experimentální molekulové deskriptory patří různé fyzikálně-chemické vlastnosti látek, naměřené za přesně definovaných podmínek. Jsou to například rozdělovací koeficienty či jejich logaritmy, teploty tání, varu, rozpustnost a podobně. Dále se mezi ně řadí různé konstanty enzymových reakcí, například reaktivační účinnost, inhibiční a rychlostní konstanty. Získávání experimentálních MD je zpravidla časově, instrumentálně i finančně náročné. Každá z výše uvedených skupin MD obsahuje navíc i celou řadu deskriptorů odvozených od těch původních. Do dnešního dne jich bylo publikováno již několik tisíc a tento počet zcela jistě není konečný. Stále jsou vyvíjeny další, s cílem co nejlépe vystihnout strukturu molekuly a také co nejvíce zjednodušit QSAR modely. Ne každý deskriptor je však vhodný pro konstrukci modelu konkrétní biologické aktivity molekuly. Pro výpočet MD jsou k dispozici různé specializované programy, jako jsou Dragon (Talete srl., Itálie), který je v omezené verzi dostupný i on-line jako e-Dragon (http://www.vcclab.org/lab/edragon/). Programy, které jsou určené přímo pro QSAR či QSPR studie zpravidla obsahují výpočet MD. Příkladem je CODESSA (Semichem, USA). Aktuální přehled nejběžnějších programů naleznete na http://www.moleculardescriptors.eu/softwares/softwares.htm. 3. Selekce vhodných deskriptorů Hlavním problémem budování QSAR či QSPR modelu není ani tak nedostatek teoretických a experimentálních molekulových deskriptorů, ale spíše výběr těch nejvhodnějších. Každý deskriptor použitý v modelu sebou přináší i potřebu zvýšení počtu vstupních dat (molekul), nutných pro vybudování modelu s určitou přesností predikce. To je v naprostém kontrastu s požadavkem praxe, kde je naopak cílem syntéza a testování co nejmenšího počtu látek. Nezbývá tedy nic jiného než redukce počtu deskriptorů, které budou použity pro sestavení QSAR modelu a to za požadavku minimální ztráty chemické informace. K tomuto kroku je využíváno několika různých postupů. A to buď selekce těch nejvýznamnějších deskriptorů pomocí korelační analýzy, kdy vzájemně korelované MD jsou vyloučeny, neboť do systému nepřinášejí žádnou novou informaci, pouze obsahují redundantní informaci a tím komplikují výpočetní proces. Jinými metodami aplikova2
nými pro redukci počtu MD jsou krokové multilineární regrese (MLR), genetické algoritmy (GA) či metody hlavních komponent (PCA). Z hlediska implementace lze tyto algoritmy zařadit on-line či offline. 4. Tvorba modelu – výběr molekulových deskriptorů Je-li k dispozici dostatečný počet dat, lze přistoupit k tvorbě modelu vztahu struktura látky – její biologická aktivita nebo některá její fyzikálně-chemická vlastnost. Pro modelování je však nutné vybrat vhodné MD. Korelační analýza je vhodnou metodou, je-li očekávána lineární závislost mezi deskriptorem a biologickou aktivitou (BA) ve formě BA = a + bx, kde BA je biologická aktivita, x molekulární deskriptor a hodnoty a, b jsou regresními koeficienty. Výstupem je tzv. korelační matice, která vyjadřuje míru lineární vzájemné statistické závislosti dvou proměnných, vyjádřené jako korelační koeficient r. Ten nabývá hodnot v intervalu od – 1 do 1. Hodnota r = 0 znamená, že proměnné jsou vzájemně nekorelované. Čím více se blíží hodnota r k ±1, tím lépe lze jejich vzájemný vztah popsat lineární rovnicí. Předpokládá-li se, že BA bude lineárně záviset na více deskriptorech, je vhodné použít krokovou MLR. Jak název napovídá, jednotlivé proměnné jsou vybírány v krocích. Ty, které mají ze statistického hlediska v daném kroku nejzřetelnější vliv na BA. Výběr je ukončen, není-li již nalezen další statisticky významný deskriptor. Výsledkem je QSAR model ve formě funkce, kde biologická aktivita je vyjádřena jako lineární kombinace vybraných deskriptorů. Kvalita modelu je opět hodnocena korelačním koeficientem r, či jeho druhou mocninou r2. Nevýhodou krokové metody výběru je, že v přítomnosti skupiny silně korelovaných deskriptorů je vybrán jeden reprezentant a může tak být „ignorován“ mnohem vhodnější deskriptor. V těchto případech s vysoce korelovanými proměnnými je vhodnější nalézt vhodné reprezentanty skupin pomocí metody hlavních komponent (PCA). Zde jsou deskriptory reprezentovány latentními proměnnými. Latentní proměnné, v PCA nazývané hlavní komponenty, jsou lineárními kombinacemi původních proměnných deskriptorů. Je jich výrazně méně než původních deskriptorů, jsou vzájemně nekorelované a vystihují téměř celou variabilitu souboru dat. Jejich pořadí je dáno velikostí popisované variability dat. První hlavní komponenta je tedy lineární kombinací vstupních proměnných, která zahrnuje největší proměnlivost mezi všemi lineárními kombinacemi. Touto metodou je možné snížit počet deskriptorů o jeden či více řádů bez významné ztráty informace v nich obsažených. Nejběžnějším je zřejmě předzpracování dat pomocí PCA. Další metodou výběru vhodných deskriptorů jsou genetické algoritmy. Ty jsou založeny na základních evolučních principech, jako je selekce, křížení, mutace a eventuelně elitářství. Na začátku výpočtu je vygenerována populace tzv. chromozomů složených z „genů“ kódujících hodnoty jednotlivých proměnných a vypočteny hodnoty účelové funkce (například kvalita proložení modelu QSAR). Dále jsou aplikovány evoluční principy, což vede k vytvoření nové populace. Další generace jsou tvořeny vždy, pokud jsou či nejsou splněna kriteria k ukončení procesu. Kriteriem může být maximální počet generací, průměrná či nejlepší hodnota účelové funkce (kvalita modelu) apod. Aplikace GA výrazně zvyšuje možnost nalezení globálního minima/maxima účelové funkce a tím i nejlepšího QSAR modelu. Zde platí, že algoritmus může být aplikován na data ještě před použitím ANN nebo jej může mít ANN v sobě přímo implementována.
3
Z hlediska uživatele jsou však zajímavější on-line metody, nejčastěji různé druhy unsupervised ANN, jako například Kohonenovy samoorganizující se mapy (selforganising maps, SOM). SOM algoritmus se používá k projekci mnohorozměrných dat do méně dimensionálního prostoru (D), zpravidla 1-3 D. Algoritmus byl vyvinut finským vědcem Teuvo Kohonenem v roce 1982 [10]. Jedná se opět o unsupervised algoritmus (bez znalosti výstupní informace). ANN implementující SOM má dvě plně propojené vrstvy, vstupní a výstupní. Umělé neurony ve výstupní vrstvě ANN bývají v 2D uspořádány plošně zpravidla do mřížky. Adaptace ANN probíhá kompetitivním způsobem. Výsledkem aplikace Kohonenovy ANN je mapa, kde jsou podobná data projektována do topologicky blízkých AN. Vzdálenost mezi AN ve výstupní vrstvě udává „blízkost“ či podobnost. Tímto způsobem je opět možné vyloučit z QSAR modelování deskriptory, které by jinak vnášely do modelu duplicitní informaci. 5. Tvorba modelu Práce s ANN má dvě fáze – adaptační a predikční. V průběhu adaptace je za použití molekulových deskriptorů a biologických aktivit vytvářen model. Pro zaručení správnosti modelu je nutné rozdělit data do dvou respektive tří skupin. Při vytváření modelu za použití pouze jednoho data setu totiž může dojít k situaci, kdy model bude velmi dobře interpretovat data použitá k adaptaci, ale výpočty pro data jiná než v adaptačním data setu budou dávat mylné výsledky (= špatný model). První skupina – adaptační - slouží k vlastnímu budování modelu, druhá eventuelně třetí (verifikační respektive testovací) k ověření správnosti modelu. Na závěr je třeba QSAR model statisticky ověřit, eventuelně validovat. Pro tento účel se vyhodnocuje korelace mezi vypočtenými a experimentálně získanými hodnotami, r2, dále F-test a podobně. Soubor dat (molekulární deskriptory a příslušné BA) bývá rozdělen do dvou či tří podskupin, kde jedna je použita k vytvoření modelu, druhá pak k jeho verifikaci a v některých případech je třetí skupina testovací. Vysoké hodnoty r2 pro všechny data sety jsou podmínkou pro dobrý model. Na rozdíl od tradičních metod (lineární či kvadratické rovnice, multilineární regrese) užívaných k modelování QSAR, vedoucích k vyjádření vztahu struktury a aktivity látky exaktně ve formě rovnice, aplikace ANN z principu toto nedovoluje. Tento jev je způsoben paralelní distribucí výpočtů, kdy hodnota každého deskriptoru je distribuována v ANN mezi umělými neurony jednotlivých vrstev váženými spoji. Pouze důkladným zkoumáním modelu, velikostí jednotlivých vah, lze odhadnout některé závislosti a eventuelně extrahovat informace o významnosti jednotlivých deskriptorů. 6. Aplikace ANN v QSPR a QSAR ANN jsou využívány jak v modelování vztahu struktura – biologická aktivita látky tak i vztahu k vlastnostem látek. V případě QSPR se jedná zejména o vliv struktury látky na její rozdělovací koeficient n-oktanol-voda [11], rozpustnost [12] a retenční faktor v chromatografických metodách [13] či migrační čas a tím i rozlišení píků v elektroforéze [14]. V QSAR ANN jsou velmi často aplikovány při modelování afinity různých látek, léčiv a jejich analogů k receptorům či transportérům [15]. V biochemii slouží k predikci průběhu enzymových reakcí – modelování inhibice enzymu. Farmaceutické aplikace se zaměřují na vývoj nových léčiv, hledání tzv. „lead“ struktur, sledování adsorpce léčiv, biokoncentračního faktoru [16]. Toxikologické aplikace jsou zaměřeny hlavně na cytotoxicitu a mutagenicitu [17]. 4
6.1. Optimalizace podmínek separačních metod Optimalizace podmínek různých separačních metod patří mezi nejvýznamnější aplikace ANN v analytické chemii. Hledání optima, vyjádřeno matematicky, spočívá v hledání extrému funkce více proměnných. V případě optimalizace separačních metod jsou těmito proměnnými podmínky měření, funkcí, která charakterizuje např. kvalitu separace, může být například rozlišení píků. S touto problematikou souvisí i modelování retenčních časů v chromatografii [18]. Hledání nejlepších podmínek se může provést několika způsoby, které lze rozdělit do dvou základních skupin. 1) Přístup teoretický Tento způsob je založen na úplné znalosti fyzikálně-chemických dějů ve zkoumaném systému. V tomto případě je možno optimální separační podmínky vypočítat a není nutné provádět žádné experimenty, bohužel v praxi se tento případ vyskytuje velice zřídka. 2) Přístup experimentální Jak již název napovídá, jsou informace získávány z výsledků provedených pokusů. Při jejich provádění se dá jít dvěma cestami a. relaxační metoda („single variable approach“, SVA), kdy hledáme optimální hodnotu každého parametru zvlášť, zatímco všechny ostatní parametry jsou v dané chvíli konstantní. Tento postup je nejen v chemii bohužel dosud velmi často používaný, může vést k cíli, ale je principielně nesprávný a často zdlouhavý. Nalezení optima přitom velmi silně závisí na podmínkách výchozího pokusu. b. multivariační přístup („multivariable approach“, MVA). Hodnoty všech parametrů se mění současně. Do této skupiny patří například simplexová metoda. 6.2. Metoda plánování pokusů (experimentální design) Experimenty není vhodné provádět náhodně, nýbrž je preferováno jejich pečlivé plánování. Je prokázané, že při použití metody plánování pokusů a při stejném počtu experimentů je možno daný systém popsat lépe než při použití relaxační metody (SVA). Podmínky analytických procesů bývají většinou ve vzájemné dosti složité interakci. Experimenty je proto třeba volit tak, aby jich bylo nutné provést pouze minimální počet a zároveň bylo dosaženo předpokladu maximální informační obsažnosti těchto pokusů, týkajících se „optimalizovaného systému“. Toho lze docílit pečlivým plánováním pokusů. Existuje celá řada metod, které se souhrnně označují jako metody plánování pokusů („experimental design“, ED) [19]. Plán experimentů, získaný jejich užitím, je založen na statistických principech a zaručuje, že systém bude za použití daného počtu pokusů popsán co nejlépe. Existuje celá řada ED, vhodných např. pro určování významnosti jednotlivých faktorů (Plackett-Burman), pro konstrukci hyperploch („central composite design“), které jsou, ve spojení s chemometrickými metodami (obecná regrese, metoda parciálních nejmenších čtverců či umělé neuronové sítě), účinným nástrojem pro predikci optimálních podmínek separace.
5
7. Příklady aplikací 7.1. Separace morfinových antagonik [20] Látky nalorfin, naloxon a naltrexon patří do skupiny látek, které jsou strukturně podobné morfinu. Váží se sice na stejné receptory v mozku, ale na rozdíl od něj mají nulovou nebo zcela zanedbatelnou biologickou aktivitu. Proto se používají zejména jako antidota při otravách opiáty ať již přírodními (zaschlá šťáva z nezralých plodů máku setého – opium – obsahuje až 10 % bezvodého morfinu), či syntetickými jako je heroin. Separované látky patří do skupiny kompetitivních antagonik. Byl použit nový přístup k optimalizaci – ED + ANN. Jako metody plánování pokusů byly vyzkoušeny dvě varianty a to „central composite“ plán pokusů a dvouhladinový faktorový plán. K adaptaci umělé neuronové sítě byly použity jako vstupní data podmínky měření – separační napětí, doba dávkování vzorku koncentrace základního elektrolytu, výstupní data pak parametry píků a separace – rozlišení píků naloxonu a naltrexonu, které bylo nejkritičtějším parametrem, a k zamezení náhodné variability výsledků též výšky, migrační čas a počty teoretických pater píků látek. Dva naměřené náhodně vybrané experimenty byly vybrány a použity jako testovací data. Adaptace začala s jedním neuronem ve skryté vrstvě. Bylo provedeno několik spuštění výpočtu (pokaždé s náhodným nastavením váhových koeficientů a prahových hodnot a s různou rychlostí učení). Ukázalo-li se, že výpočet nekonverguje k nule, bylo přistoupeno ke zvýšení počtu neuronů ve skryté vrstvě. Tento proces se opakoval tak dlouho, dokud nebyla daná umělá neuronová síť schopna predikovat trénovací i testovací data s přesností na 0,1 %. Pro data získaná měřením pokusů „central composite“ plánu byla vhodnou ANN síť s architekturou 3: 14: 10 (3 neurony ve vstupní vrstvě, 14 neuronů ve skryté a 10 neuronů ve výstupní vrstvě). Pro dvouhladinový faktorový plán byla vhodná ANN se strukturou 3: 7: 10. Adaptovaných ANN bylo použito k predikci chování jednotlivých parametrů v celém rozsahu experimentálních podmínek. Jako kritérium optimální separace byla zvolena největší hodnota počtu teoretických pater (nejvyšší účinnost) a rozlišení píků naloxonu a naltrexonu. Optimální podmínky nalezené pomocí obou plánů pokusů se prakticky nelišily. 7.2. Optimalizace separace chirálních látek [21] Enantiomery, též optické izomery, jsou dvě molekuly jedné látky, mající k sobě navzájem stejný vztah jako předmět a jeho zrcadlový obraz, který s ním není ztotožnitelný. Chirální je každá molekula enantiomeru. Chiralita je vlastnost. Enantiomery mají stejné fyzikálně-chemické vlastnosti, kromě prostorové struktury. Chirální látky mohou být separovány různými analytickými postupy, např. krystalizací, ale využívají se hlavně chromatografické metody, jako je tenkovrstvá, plynová či vysokoúčinná kapalinová chromatografie. Výběr vhodné metody závisí na faktorech, jako jsou fyzikálně-chemické vlastnosti látky (těkavost, rozpustnost, apod.), doba a cena analýzy, její citlivost. Jednou z nejuniverzálnějších metod je kapilární elektroforéza. Výhodou, kromě malé spotřeby vzorku, je i možnost rychlé změny separačního média (v kapalinové chromatografii je třeba kolonu ekvilibrovat asi 1 hodinu) během vývoje nové metody a použití 6
velice malého množství drahých chirálních selektorů. Jednoduchost učinila z CE velmi progresívní metodou v oblasti analýzy chirálních látek. Protože oba enantiomery mají stejné fyzikálně-chemické vlastnosti, je k jejich rozdělení nutné použít stereospecifických interakcí s tzv. chirálními selektory. Jedněmi z chirálních selektorů jsou i cyklodextriny (CD). Rozdělení enantiomerů může být vysvětleno interakcemi mezi CD, který má mnoho center chirality a analytem. Mechanismus separace je založen na stereospecifické inkluzi analytu do dutiny CD, kde jeden optický izomer je vázán silněji než druhý. Za nízkého pH je elektroosmotický tok minimální a nederivatizované cyklodextriny nemigrují. Naopak bazické látky jsou protonovány a migrují směrem k záporné elektrodě. Jakmile je však analyt komplexován zasunutím do dutiny CD, jeho mobilita se zmenší v závislosti na síle interakce. Pokud konstanty stability obou enantiomerů s CD jsou rozdílné, je možné dosáhnout jejich rozdělení. Separace je samozřejmě možná i při vysokém pH, kde je analyt nositelem negativního náboje. 7.3. Dekonvoluce píků [22] Kromě optimalizace separace byly ANN využity i k řešení dalšího častého problému a to dekonvoluci signálů – píků. Ne vždy je možné dosáhnout separace dvou látek ze 100 %, proto je nutné najít řešení pro jejich kvantifikaci i při částečné separaci. K tomuto úkolu je možné využít ANN. V experimentu byl naměřen data set, sestávající z měření s různým rozlišením píků, různými koncentracemi obou enantiomerů ve směsi. Po adaptaci byla ANN použita k výpočtu zastoupení jednotlivých enantiomerů ve vzorku. 7.4. Modelování retenčních faktorů oximů [23] Pyridiniové oximy jsou skupinou látek, která má schopnost reaktivovat enzym acetylcholinesterázu. Tento enzym bývá inhibován především nervově paralytickými látkami a také některými pesticidy, jako jsou organofosfáty. Pro kontrolu čistoty těchto látek slouží běžně tenkovrstvá chromatografie (TLC). Látka je identifikována na základě svého tzv. retenčního faktoru. Programem Dragon bylo vypočteno 1664 molekulových deskriptorů, kterých po vyloučení konstantních, téměř konstantních a vzájemně korelovaných bylo použito 634. K modelování vztahu chemická struktura látky – retenční faktor byla využita prvně tzv. hybridní ANN, která sestávala ze vstupní Sangerovy vrstvy s následným třívrstvým perceptronem. V první části ANN dochází k redukci počtu proměnných on-line. Sangerův algoritmus provádí metodu hlavních komponent a tím výrazně redukuje dimensionalitu vstupních dat. V uvedeném případě byl počáteční počet 634 vstupních neuronů promítnut do pouhých 8 neuronů. Výsledná ANN s architekturou 634:8:3:1 byla schopna velmi dobře popsat závislost retenčních faktorů sledovaných oximů na jejich chemické struktuře. Jelikož biologický účinek látek závisí na jejich fyzikálně-chemických vlastnostech, otvírá modelování retenčních faktorů cestu k modelování například rozdělovacího koeficientu logP, který pak souvisí s distribucí látek v organismech. 7.5. Autentizace potravin [24] Vzhledem k prakticky neomezené variabilitě ve své struktuře, jsou ANN využívány při hodnocení potravin na základě různých chemických dat, které byly získány jednotlivými analýzami či s využitím například pole senzorů, které emuluje funkci lidského čichu či chuti. Výsledky pak slouží například k potvrzení místa původu potraviny respektive k vyvinutí chuti potraviny co nejlépe odpovídající senzorickým preferencím spotřebitele. 7
Pro tyto účely jsou ANN využívány k modelování a identifikaci korelací mezi jednotlivými či více proměnnými a vlastnostmi jednotlivých skupin vzorů (patterns). ANN nahrazují běžné jedno či vícerozměrné statistické metody a stejně jako ony umožňují zpravidla projekci mnohorozměrného prostoru do méně rozměrného prostoru s malými ztrátami chemické informace. Zvláště nelinearita ANN je výhodou oproti standardním nástrojům, mezi něž patří například metoda hlavních komponent. Velmi často jsou využívány Kohonenovy samoorganizující se mapy (Self-organisisng maps, SOM), kde n-rozměrný prostor je redukován zpravidla do 1 či 2-rozměrného. Analýza získaných „map“ umožňuje vyhledávání skupin podobných dat (klastrování) eventuelně odlehlých výsledků. Vzdálenost projekce dvou vzorů je nepřímo úměrná jejich podobnosti. SOM tak mohou sloužit ke klasifikaci dat a jejich řazení do různých skupin [25]. Příkladem využití SOM je klasifikace vín dle místa původu na základě chemické analýzy, kdy byl zjištěn obsah vybraných kovů v analyzovaných vzorcích [26,27]. Celkem 11 prvků (K, Na, Ca, Mg, Fe, Cu, Zn, Mn, Sr, Li a Rb) bylo stanoveno ve vzorcích suchých a sladkých vín pocházejících ze tří Kanárských ostrovů – El Hierro, La Palma a Lanzarote. Analýzou vah jednotlivých spojení mezi neurony bylo zjištěno, že vína pocházející z ostrova Lanzarote mají nejvyšší obsah Na a Li, zatímco obsah Sr a Rb byl nejnižší ze všech zkoumaných vzorků. Obsah Sr a Rb byl nejvyšší u vzorků z ostrova La Palma. U vín z tohoto ostrova byl navíc patrný rozdíl mezi sladkými a suchými víny, kdy sladká vína obsahovala vyšší koncentrace téměř všech sledovaných kovů než suchá. Tato skutečnost je dána tím, že sladká vína jsou vyráběna z přezrálých hroznů. Obdobné výsledky byly získány i clusterovou analýzou. Vína z ostrova El Hierro jsou zřejmě z geografických důvodů více podobná vínům z ostrova La Palma v porovnání s víny z Lanzarote. Pro klasifikace vín dle místa původu byl využit i třívrstvý perceptron. Vytvořený model byl v klasifikaci vín úspěšnější v porovnání s lineární diskriminační analýzou. Jiní autoři využili ke klasifikaci vín výsledky analýzy polyfenolů kapilární elektroforézou [28]. Dalšími aplikacemi jsou například klasifikace kultivarů rýže, olejů dle místa původu, transferu kontaminantů v potravním řetězci v závislosti na potravním chování, zpracování dat senzorů, identifikace bakterií apod. 7.6. Klasifikace distribuce uranu [29] Jinou možností využití ANN v chemii je modelování chemických pochodů v přírodě. Pro modelování chemických procesů v jihoafrickém zlatém dole byla využita data o obsahu jednotlivých iontů v různých částech dolu, jako jsou tůňky, potůčky, jezírka, výsypky apod. Následným modelováním pomocí Kohonenových SOM byla získána projekce do 2D prostoru a z vah jednotlivých spojení pak odvozena chemická podstata pohybu uranu, který je doprovodným prvkem zlata. Zejména nižší pH, a vyšší obsah síranových iontů vedl ke zvýšenému obsahu uranu. Podle distribučnch diagramů je migrace uranu především ve formě rozpustných uranylových solí, které vznikají právě za těchto podmínek. 7.7. Klasifikace signálu biosenzoru [30] Pro klasifikaci signálu biosenzoru byla též využita SOM. Biosenzor byl na bázi imobilizovaného enzymu acetylcholinesterázy. Počátek měření byl odstartován přídavkem substrátu, acetylthiocholinu, po určité době byl přidán inhibitor a pak i syntostigmin. Celý průběh signálu byl zaznamenáván. Pro ANN byl tento průběh navzorkován s přihlédnutím ke klíčovým bodům, kterými byly přídavky jednotlivých látek. Takovýto 8
data set byl poté předložen SOM a následně došlo k promítnutí signálů do 2D SOM. Z výsledků vyplynulo, že je možné rozlišit některé poruchy signálu. 7.8. Další aplikace Určení chemické struktury na základě spekter z UV/VIS, IČ, NMR, MS apod., stanovení toxicity látek [31]. 8. Závěr Umělé neuronové sítě patří mezi standardně využívané chemometrické metody v různých oblastech chemie. Nacházejí své uplatnění při hledání optimálních podmínek separačních procesů, klasifikaci potravin dle místa původu, vývoji nových léčiv, modelování environmentálních problémů či řízení chemických procesů. Velký důraz je kladen zejména na výběr vhodných molekulových deskriptorů a na minimalizaci počtu prováděných experimentů. ANN jsou perspektivním a účinným nástrojem v řešení složitých chemických problémů. Literatura [1]
F. MARINI, R. BUCCI, A.L. MAGRÌ, A.D. MAGRÌ: Artificial neural networks in chemometrics: History, examples and perspectives. Microchem. J. 88 (2008) 178-185.
[2]
J. ZUPAN, J. GASTEIGER: Neural Networks for Chemists; An Introduction. VCH Publishers New York, NY, USA, 1993. G. STOJKOVIĆ, M. NOVIČ, I. KUZMANOVSKI: Counter-propagation artificial neural networks as a tool for prediction of pKBH+ for series of amides. Chemom. Intell. Lab. Syst. 102 (2010) 123-129. S. ARUPJYOTI, S. IRAGAVARAPU: New electrotopological descriptor for prediction of boiling points of alkanes and aliphatic alcohols through artificial neural network and multiple linear regression analysis. Computers & Chemistry 22 (1998) 515-522. M.H. FATEMI, M. JALALI-HERAVI, E. KONUZE: Prediction of bioconcentration factor using genetic algorithm and artificial neural network. Anal. Chim. Acta 486 (2003) 101-108. F. GAGNÉ, C. BLAISE: Predicting the toxicity of complex mixtures using artificial neural network. Chemosphere 35 (1997) 1343-1363. S.P. NICULESCU: Artificial neural networks and genetic algorithms in QSAR. J. Mol. Struct. THEOCHEM 622 (2003) 71-83. T.WAYNE SCHULTZ, MARK T.D. CRONIN, TATIANA I. NETZEVA: The present status of QSAR in toxicology. J. Mol. Struct. THEOCHEM 62 (2003) 23-38.
[3]
[4]
[5]
[6] [7] [8]
[9] R. TODESCHINI, V. CONSONNI: Handbook of Molecular Descriptors. WILEY-VCH, 2000. [10] T. KOHONEN: Self-organized formation of topologically correct feature maps. Biol. Cyber. 43 (1982) 59-69. [11] L. MOLNÁR, G.M. KESERŰ, Á. PAPP, Z. GULYÁS, F. DARVAS: A neural network based prediction of octanol–water partition coefficients using atomic fragmental descriptors. Bioorg. Med. Chem. Lett. 14 (2004) 851-853. [12] A. JOUYBAN, M. MAJIDI, H. JALILZADEH, K. ASADPOUR-ZEYNALI: Modeling drug solubility in water–cosolvent mixtures using an artificial neural network. Il Farmaco 59 (2004) 505-512. 9
[13] Y.L. LOUKAS: Artificial neural networks in liquid chromatography: efficient and improved quantitative structure–retention relationship models. J. Chromatogr. A 904 (2000) 119-129. [14] A. BEN HAMEDA, S. ELOSTA, J. HAVEL: Optimization of the capillary zone electrophoresis method for Huperzine A determination using experimental design and artificial neural network. J. Chromatogr. A 1084 (2005) 7-12. [15] R. HUANG, Q. DU, Y. WEI, Z. PANG, H. WEI, K. CHOU: Physics and chemistry-driven artificial neural network for predicting bioactivity of peptides and proteins and their design. J. Theor. Biol. 256 (2009) 428-435. [16] S. AGATONOVIC-KUSTRIN, R. BERESFORD: Basic concepts of artificial neural network (ANN) modeling and its application in pharmaceutical research. J. Pharm. Biomed. Anal. 22 (2000) 717-727. [17] I. VALKOVA, M. VRAČKO, S.C. BASAK: Modeling of structure–mutagenicity relationships: counter propagation neural network approach using calculated structural descriptors. Anal. Chim. Acta 509 (2004) 179-186. [18] R.H. ZHAO, B.F. YUE, J.Y. NI, H.F. ZHOU, Y.K. ZHANG: Application of an artificial neural network in chromatography—retention behavior prediction and pattern recognition. Chemom. Intell. Lab. Sys. 45 (1999) 163-170. [19] D.C. MONTGOMERY: Design and Analysis of Experiments. John Wiley & Sons, 2007. [20] V. DOHNAL: Artificial neural networks for optimization in the capillary zone electrophoresis. Chem. Listy 92 (1998) 669-672. [21] V. DOHNAL, M. FARKOVÁ, J. HAVEL: Prediction of chiral separations using a combination of experimental design and artificial neural network. Chirality 11 (1999) 616-621. [22] V. DOHNAL, F. ZHANG, H. LI, J. HAVEL: Quantitative chiral analysis in capillary electrophoresis from unresolved peaks using derivative electropherograms, experimental design, and artificial neural network. Electrophoresis 24 (2003) 2462-2468. [23] V. DOHNAL, V. RAČÁKOVÁ, K. KUČA: Use of hybrid artificial neural network for prediction of pyridinium oxime retention factors. Manuskript v přípravě. [24] B. DĘBSKA, B. GUZOWSKA-ŚWIDER: Application of artificial neural network in food classification. Anal. Chim. Acta 705 (2011) 283-291. [25] J. ZUPAN, M. NOVIČ, I. RUISÁNCHEZ: Kohonen and counterpropagation artificial neural networks in analytical chemismy. Chemom. Intell. Lab. Syst. 38 (1997) 1-23. [26] D. KRUZLICOVA, J. MOCAK, B. BALLA, J. PETKA, M. FARKOVA, J. HAVEL: Classification of Slovak white wines using artificial neural networks and discriminant techniques. Food Chem. 112 (2009) 1046-1052. [27] S. FRÍAS, J.E. CONDE, M.A. RODRÍGUEZ, V. DOHNAL, J.P. PÉREZ-TRUJILLO: Metallic content of wines from Canary Islands (Spain). Application of artificial neural networks to the data analysis. Nahrung 46 (2002) 370-375. [28] J. PAZOUREK, D. GAJDOŠOVÁ, M. SPANILÁ, M. FARKOVÁ, K. NOVOTNÁ, J. HAVEL: Analysis of polyphenols in wines: Correlation between total polyphenolic content and antioxidant potential from photometric measurements: Prediction of cultivars and vintage from capillary zone electrophoresis fingerprints using artificial neural network. J. Chromatogr. A 1081 (2005) 48-54. 10
[29] H. TUTU, E.M. CUKROWSKA, V. DOHNAL, J. HAVEL: Application of artificial neural networks for classification of uranium distribution in the Central Rand goldfield, South Africa. Environ. Model. Assess. 10 (2005) 143-152. [30] V. DOHNAL, L. PODLOUCKÁ, Z. GROSMANOVÁ, J. KREJČÍ: Využití umělých neuronových sítí pro klasifikaci signálů biosenzorů. Acta Universitatis Agriculturae et Silviculturae Mendelianae Brunensis 2 (2008) 73-79. [31] M. ALVAREZ-GUERRA, D. BALLABIO, J.M. AMIGO, R. BRO, J.R. VIGURI: Development of models for predicting toxicity from sediment chemistry by partial least squaresdiscriminant analysis and counter-propagation artificial neural network. Environ. Poll. 158 (2010) 607-614. doc. RNDr. Vlastimil Dohnal, Ph.D. Univerzita Hradec Králové, Přírodovědecká fakulta Rokitanského 62, 500 03 Hradec Králové, Česká republika e-mail:
[email protected]
11