Bankovní institut vysoká škola Praha Katedra informačních technologií a elektronického obchodování
Možnosti aplikace umělých neuronových sítí. Bakalářská práce
Autor:
Dinara Yestayeva Informační technologie, AIS
Vedoucí práce:
Praha
doc. Ing. Stanislav Horný, Csc.
Duben, 2009
Prohlášení: Prohlašuji, že jsem bakalářskou práci zpracovala samostatně a s použitím uvedené literatury.
......... V Praze dne 15 dubna 2009
Dinara Yestayeva
Poděkování Děkují svému vedoucímu této práce panu doc. Ing. Stanislavu Hornému,Csc. za vedení a podporu. Chtěla bych taky poděkovat mé rodině a mým kamarádkám za jejich velkou podporu během mého studia a při psaní bakalářské práce. .
Anotace V bakalářské práci jsou projednány základy teorie neuronových sítí, dovolujících soustředit se dále ke konkrétním strukturám, algoritmům a ideologii praktického použití v počítačových aplikacích. Jsou interpretovány základy teorie umělých neuronových sítí. Je vysvětlen prostor neuronových sítí v evoluci inteligentních systémů. Jsou zde pojednány všeobecné otázky použití umělých neuronových sítí v systémech řízení a komunikací. Jsou zde vyznačeny výhody, které poskytuje použití technologie neuronových formací při řešení mnohých netradičních, ale i tradičních úloh řízení a komunikací. V bakalářské práci jsou pojednány různé oblasti používání i využití umělých neuronových sítí, ale také jejich způsobilost ke studiu ( k procesu nastavení architektury sítě a významu synoptických přenosů) pro efektivní řešení vytčeného úkolu. V současné době umělé neuronové sítě jsou významné pro rozšíření koncepcí výpočtů. Klíčová slova: neuronová sit', umělá intelegence, neuron, perceptron.
Abstract
The diploma thesis describes the basic theory of neural networks, which further dealt with specific structures, algorithms, and adaptation of these networks in computer applications.
Describes the basis of artificial neural networks. Shows the neural networks’ place in intelligent systems evaluation. Considers the general issues of applying artificial neural networks in communication and system control. Outlines the benefits of using neuroinformational technology to solve as unconventional or conventional problems of management and communication. Gives the examples of application both of nanoengineering and neural networks. The diploma thesis makes out different areas of application and using artificial neural networks, as well as their ability to learn the process of setting network architecture and weights of synaptic connections for the effective solution of the problem. Nowadays, the artificial neural networks are an important extension of the notion of computation. Keywords: neural network, artificial intelligence, neuron.
Obsah Úvod ................................................................................................................... 6 1. Pojem a vlastnosti neuronových sítí ............................................................... 10 1.1 Metoda mikrobiologie. Biologický neuron ................................................ 10 1.2 Umělé neuronové sítě. Pojem formálního neuronu a vícevrstvového perceptronu .................................................................................................... 14 1.3 Typy neuronových sítí .............................................................................. 19 1.4 Konekcionismus ....................................................................................... 24 2. Nanotechnologie .......................................................................................... 26 2.1 Pojem, historie ......................................................................................... 26 2.2 Předmět, cíle a hlavní směry v oblasti nanotechnologií. ............................ 26 2.3 Uplatnění nanoinženerii a neuronových sítí .............................................. 28 2.3.1 Špionáž a potlačení bolesti pomocí neurotechnologií. ..................... 29 2.3.2 Lékařství ........................................................................................ 30 2.4 Rizika ...................................................................................................... 31 3. Možnosti použití neuronových sítí ................................................................................. 33 3.1 Místo neuronových sítí mezi jinými metodami řešení úloh ....................... 33 3.2 Robotika jako směr UI ............................................................................. 40 4. Perspektivy. .................................................................................................................... 42 4.1 Budoucnost ............................................................................................. 42 4.2 Výsledky ................................................................................................. 43 Závěr ................................................................................................................ 44 Seznam použitých obrázků .............................................................................. 46 Seznam použité literatury. ............................................................................. 47 Přílohy ............................................................................................................. 49
Úvod. Není to dávno, kdy lidstvo vstoupilo do nového XXI. století. Uplynulé století pro lidstvo znamenalo událostí různé povahy (pozitivní i negativní): dvě světové války, vynález jaderných zbraní, vynález personálního počítače (PC), projektování a následné vytvoření mezinárodní počítačové sítě Internet, apod. XXI. století. Na co se můžeme těšit? Zkusme zobecnit nejnerealističtější předpovědí i když všechny jsou založeny na existujících projektech. Zde jsou hlavní technologie, které budou určovat naši budoucnost v příštím století. • Nanotechnologie. Jedná se o kvalitativní změnu na novou technologickou úroveň „je to skok od manipulace s látkou k manipulaci s jednotlivými atomy“. Manipulace budou provedeny pomocí nanostrojů „ mechanismů a robotů o velikosti molekul“. Které budou pracovat s atomy a molekulami ze kterých budou vytvářet všechno, co existuje „stejně jako budova se staví z cihel“1. • Umělá inteligence. Je to vynalez člověka, který již brzy překoná člověka v jeho schopnostech (dokonce i v tvořivosti). „Protože na rozdíl od lidí, bude mít příležitost nejen poznávat, ale také se zlepšovat. Umělá inteligence bude schopná změnit architekturu svého umělého mozku, pokud to budou vyžadovat nové dovednosti. Na rozdíl od kyborga člověk, který snadno operuje trojrozměrnými objekty, nikdy nedokáže pochopit, řekněme pětiměrné objekty“.2 • Robotizace. Roboty budou plnit úkoly, které jsou obtížné nebo vůbec nejsou možné pro nanostroje, například výstavba velkých staveb, jako jsou domy. • Genetické inženýrství. • Početné vesmírné lety. Lidstvo začne dobývat vesmír. • Nanotechnologie vyřeší problém hladu, protože potraviny budou k dispozici téměř z čehokoliv. • Zmizí ekonomika (v současném slova smyslu) a to kvůli bezvýznamnosti rozdělení bohatství. • Bude vyřešen problém chudoby. • Gerontologie. „Dosažení osobní nesmrtelnosti lidí, zavedením do organizmu molekulárních robotů, které zabraní stárnutí buněk, jakož i restrukturalizaci a „vylepšení“ 1
Galcov, Maxim. Nanotechnologie: zachránění nebo uhynutí?[online] c2003[cit. 2009-02-17] dostupný z http://zhurnal.lib.ru/g/galxcow_m_a/nano.shtml 2 Ladikov, Pavel. Cesta k umělému intelektu. [online]c1998 [cit.2009-02-17 ]Chap. 25 dostupný z http://www.softholm.com/articles/windows.html
6
tkaní lidského těla. Oživení a vyléčení beznadějně nemocných lidí, kteří byli zmražení v současné době metodami kryoniky“.3 Toto všechno velmi silně zapůsobí na lidskou psychiku. Konec konců, člověk nebude muset spěchat. Protože bude mít před sebou celou věčnost. • Dojde ke zmizení trestné činnosti, protože nebude existovat k ní důvod. • Dojde ke zmizení průmyslu. „Náhrada tradiční metody výroby za výrobu molekulárními roboty veškerých předmětů spotřeby přímo z atomů a molekul. Až do osobních syntetizérů a kopírovacích zařízení, umožňujících výrobu jakéhokoli objektu“4. To by vyřešilo problém znečištění životního prostředí. • Globální telekomunikace poskytnou příležitost k vytvoření skutečné demokracie, protože se každý bude podílet na všech rozhodnutích týkajících se veřejnosti. V dané bakalářské práci zkusme rozebrat co to je umělé neuronové sítě. V posledních desetiletích se ve světě bouřlivě rozvíjí nová oblast aplikované matematiky, specializující se na umělé neuronové sítě (UNS). Naléhavost výzkumu v tomto směru je potvrzena spoustou různých aplikací UNS. Je to automatizace
procesů
rozeznávání
obrazů,
adaptivní
řízení,
aproximace
funkcionálů, prognózování, tvorba expertních systémů, organizace asociativní paměti a mnohá další uplatnění. S pomocí UNS můžeme, například, předpovídat ukazatele burzovního trhu, uskutečňovat odhalování optických nebo zvukových signálů, vytvářet učící se systémy, schopné řídit automobil při zaparkování nebo syntetizovat řeč dle textu. Teorie neuronových sítí nastoluje obsáhlý okruh otázek z různých oblastí vědy: biofyziky, matematiky, informatiky, techniky integrovaných obvodů a technologie. Proto je pojem „neuronové sítě“ složité přesně definovat. Umělé neuronové sítě (UNS). 5 Znamenají síť prvků – umělých neuronů – propojených mezi sebou synoptickými přenosy. Síť zpracovává vstupní informaci a v procesu změny stavu dočasně formuje soubor výstupních signálů.
3 4
, Yagodin, S. Nanotechnologie.perspektivy vývoje.[online]c2007[cit. 2009-02-18] dostupný z http://popnano.ru/studies/index.php?task=view&id=162 5
Umělá neuronová sít’ (UNS) – je struktura určena pro distribuované paralelní zpracování dat. Zdroj: http://cs.wikipedia.org/wiki/Neuronov%C3%A1_s%C3%AD%C5%A5
7
Práce sítě sestává v přeměně vstupních signálů, výsledkem čehož je se mění vnitřní stav sítě a formují se výstupní účinky. Obvykle UNS operují s číselnými, nikoliv symbolickými hodnotami. Většina modelů UNS vyžaduje zaškolení. Ve většině případů zaškolení – takový výběr parametrů sítě, při kterých síť zdolává určený problém. Zaškolení to je úloha vícenásobné optimalizace a pro její řešení existuje množství algoritmů. Umělé neuronové sítě – sada matematických a algoritmických metod pro řešení rozsáhlého okruhu úloh. Vyčlením charakteristické rysy umělých neurosítí jako univerzálního nástroje pro řešení úloh: 1. UNS poskytují možnost lépe pochopit organizaci nervového systému člověka zvířat na středních úrovních: paměť, zpracování senzorových informací, motoriky. UNS – prostředek zpracování informace: a) pružný model pro nelineární aproximaci vícenásobných funkcí; b)prostředek
prognózování
v
čase
pro
procesy
závisící
na
mnoha
proměnných; c)třídič mnohých příznaků, způsobující rozbití vstupního prostoru na oblasti; d)prostředek odhalování obrazů; e)nástroj pro hledání asociací; f)model pro vyhledávání zákonitostí v množství údajů. 2. UNS jsou nezávislé na omezení obyčejných počítačů díky paralelnímu zpracování a silné provázanosti neuronů. 3. V perspektivě UNS musíme pomoci pochopit principy, na kterých jsou postaveny vyšší funkce nervového systému: vědomí, emoce, myšlení. Cílem
bakalářské
práce
je
studium
základních
konceptů
umělých
neuronových sítí a možnost jejich použití. V souladu s vytčeným cílem byly určeny základní úkoly výzkumu: 1.objasnit neuronové sítě; 2.posoudit pojem a vlastnosti biologického neuronu; 3. posoudit vzájemné vztahy neuronových sítí a nanotechnologií; 4.posoudit pojem umělých neuronových sítí a jejich historický rozvoj; 5.vysvětlit pojem formálního neuronu a vícevrstvového perceptronu; 6.posoudit druhy neuronových sítí;
8
7.prozkoumat jevy konekcionismu; 8.určit místo neuronových sítí mezi jinými metodami řešení úloh; 9.udělat přehled základních sfér použití neuronových sítí; 10.prozkoumat robotiku jako směr umělé inteligence.
9
1. Pojem a vlastnosti neuronových sítí 1.1 Metoda mikrobiologie. Biologický neuron Umělé neuronové sítě jsou indukované biologií, protože sestávají z prvků, jejichž funkční možnosti jsou analogické většině základních funkcí biologického neuronu. Tyto prvky potom uspořádají způsobem, který může odpovídat (nebo neodpovídat) anatomii mozku. K předmětu neurobiologie patří studium nervového systému a jejího hlavního orgánu – mozku. Principiální otázkou pro tuto nauku je vyjasnění vztahů mezi skladbou nervového systému a jeho funkcí. Průzkum se provádí na několika úrovních: molekulární, buněčné, na úrovni jednotlivého orgánu, celého organizmu a
dále
na
úrovni
společenské
skupiny.
Tímto
způsobem
se
klasický
neurobiologický přístup skládá v postupný posuv od elementárních forem směrem k jejich složitosti. Pro naše praktické cíle bude východiskem buněčná úroveň. Podle současného názoru,
jmenovitě
na
souhrnu
elementárních
molekulárních
chemicko
–
biologických procesech, probíhajících v izolované buňce, formuje jí jako elementární procesor, schopný jednoduchého přepracování informace. Modelování biologických neuronových sítí je opodstatněné a perspektivní. Ale podle výzkumu UNS je nevyhnutelné mít matematický model biologického neuronu a biologické neuronové sítě. Centrální nervová soustava má buněčnou stavbu. Jednotka – nervová buňka, neuron. Neuron má následující základní vlastnosti: 1.
Zúčastňuje se látkové výměny a rozptyluje energii. Mění vnitřní
stavbu s průběhem času, reaguje na vstupní signály a formuje výstupní účinky a proto je aktivním dynamickým systémem. 2.
Má množství synapse – kontaktů pro přenos informace.
3.
Neuron spolupůsobí cestou výměny elektrochemických signálů dvou
typů: elektrotonické (s útlumem) a nervovými impulzy (zátavami), rozšiřujícími se bez útlumu.
10
Existují dva způsoby pro vytvoření umělých neuronových sítí. Informační způsob: je lhostejno, jaké mechanizmy spočívají na pracovním základu umělých neuronových sítí, důležité je pouze, aby při řešení úloh informační procesy v UNS podobné biologickým. Biologický: při modelování je důležitá biopodobnost a nevyhnutelně detailně studovat práci biologického neuronu. Největší práce ve výzkumu biologických neuronových sítí vykonali Andrew Haxley, Alan Hodgin, Bernard Kats, John Ekkles, Steven Kuffler. Neurony jsou velmi různorodé podle tvaru, který závisí na jejich výskytu v nervovém systému a zvláštností působení. Na obrázku 1 je zobrazeno schéma stavby „typického“ neuronu.
Obrázek 1. Obecné schéma stavby biologického neuronu Zdroj: http://dev.emcelettronica.com/files/u4/Fig0052.png
Tělo buňky obsahuje množství rozvětvených výhonků dvou typů. Výhonky prvního typu, nazývané dendrity pro jejich podobu s korunou rozkošatého stromu, slouží jako vstupní kanály nervových impulzů od druhých neuronů. Tyto impulzy vstupují do somy nebo těla buňky o rozměru od 3 do 100 mikronů, vyvolávaje její vybuzení, které se prozatím rozšiřuje po výstupním výhonku druhého typu, axonu. Délka axonů znatelně předčí rozměry dendritů, ve zvláštních případech dostihuje centimetrů a dokonce metrů. Gigantický axon kalmara má tloušťku asi milimetr, ale právě jeho pozorování posloužilo k vyjasnění mechanizmu přenosu nervových impulzů mezi neurony. Tělo neuronu, vyplněné vodivým iontovým roztokem, je obaleno membránou tloušťky 75 angströmů 6, vyznačující se nízkou vodivostí. Mezi vnitřním povrchem 6
Ångström (symbol Å) je jednotka délky. Hodnota jednoho angstromu je rovna 0,1 nm neboli 10-10 m. Často se používá při vyjadřování velikostí atomů, délek chemických vazeb nebo vlnových délek spektrálních čar.
11
membrány axonu a vnějším prostředím je podporována různost elektrických potenciálů. To se uskutečňuje pomocí molekulárního mechanizmu iontových čerpadel, vytvářejících rozdílnou koncentraci kladných iontů K+ a Na + uvnitř a vně buňky. Propustnost membrány neuronu je selektivní pro tyto ionty. Uvnitř axonu buňky, nacházející se ve stavu klidu, se aktivní pohyb iontů snaží podporovat koncentraci iontů draslíku vyšší, než iontů sodíku, tedy v kapalině, obklopující axon, se objevuje vyšší koncentrace iontů Na+. Pasivní difúze pohyblivějších iontů draslíku je přivádí k intenzivnímu výstupu z buňky, což podmiňuje jeho celkově záporný klidový potenciál vnějšího prostředí, činící asi 65 milivoltů. Při působení stimulujících signálů od druhých neuronů mění membrána axonu dynamicky svoji vodivost. Toto se děje, když sumární vnitřní potenciál převyšuje prahovou hodnotu rozsahu -50mV. Membrána na krátkou dobu, trvající asi 2 milisekundy, mění svoji polaritu (depolarizuje se) a dosahuje potenciálu působnosti asi +40 mV. Na mikroúrovni se to vysvětluje jako krátkodobé zvýšení propustnosti membrány pro ionty Na+ a jejich aktivním vstupem do axonu. Později, podle výstupu iontů draslíku, se kladný náboj z vnitřní strany membrány přemění na záporný a nastává tzv. refrakce, která trvá asi 200 milisekund. V průběhu této doby je neuron zcela pasivní, prakticky beze změny zachovává potenciál uvnitř axonu na hladině asi -70 mV. Impuls depolarizace buněčné membrány, se rozšiřuje podél axonu prakticky bez útlumu, jsouce
podporován lokálními iontovými
gradienty.
Rychlost
přemísťování impulzu je poměrně malá a činí 100 až 1000 centimetrů za vteřinu. Vybuzení neuronu impulzem se přenese na druhé neurony, které jsou tímto způsobem nasyceny vodivou sítí nervových impulzů. Části membrány na axonu, kde jsou rozmístěny oblasti kontaktu axonu daného neuronu s dendrity jiných neuronů se nazývají synapsi. V oblasti synapse, vyznačujícího se složitou stavbou, probíhá výměna informací o vybuzení mezi neurony. Mechanizmy synoptického přenosu jsou dost složité a různorodé. Mohou mít chemickou i elektrickou podstatu. V chemické synapsi se v přenosu impulzů účastní specifické chemické látky
-
neuromediátory,
vyvolávající
změny
propustnosti
lokální
oblasti
membrány. V závislosti na typu vyráběného mediátoru může synapse disponovat budící (efektivně vodící vybuzení) nebo brzdící působností. Obvykle na všech výhoncích jednoho neuronu se vyrábí jeden a tentýž mediátor, u proto se neuron 12
celkově chová jako brzdící nebo budící. Toto důležité pozorování přítomnosti neuronů různých typů v následujících kapitolách se bude zásadně používat při projektování umělých systémů. Biologický neuron obsahuje následující elementární články (obrázek 2):
Obrázek 2. Biologický neuron. Zdroj:http://www.utexas.edu/courses/bio365r/Images/neuron.JPG
Tělo buňky
– soma: obsahuje jádro, mitochondrii (zabezpečuje buňky
energií), jiné orgány, podporující životní činnost buňky. Dendrity – vstupní vlákna, přijímají informaci od jiných neuronů. Aktivita v dendritech se mění plynule. Jejich délka není obvykle větší než 1 mm. Membrána – udržuje stálé složení cytoplazmy uvnitř buňky, zabezpečuje přenos nervových impulzů. Cytoplazma – vnitřní prostředí buňky. Odlišuje se koncentrací iontů K+, Na+, Ca ++ a jiných látek ve srovnání s mimobuněčným prostředím. Axon , jeden nebo žádný v každé buňce, - dlouhý, někdy více než metr, výstupní nervové vlákno buňky. Impulz se generuje v axonovém pahrbku. Axon zabezpečuje převedení impulzu a přenos působení na jiné neurony nebo svalová vlákna. Na konci se axon často větví.
13
Synapse (zápoj) – místo kontaktu nervových vláken – předává vzruch od buňky k buňce. Přenos přes synapsi je téměř vždy jednosměrný. Rozlišují se presynaptické a postsynaptické buňky – podle směru přenosu impulzu. Schwannovy buňky. Specifické buňky, téměř celkově sestávající z myelinu, organického izolantu. Těsně „ovinují“ nervové vlákno 250 vrstvami (myelinová pochva). Neizolovaná místa nervového vlákna mezi Schwannovými buňkami se jmenují zářezy Ranvierovy. Na úkor myelinové izolace vzrůstá rychlost šíření nervových impulzů na 5 – 10 násobek a zmenšují se ztráty energie při vedení impulzů. Myelinovaná vlákna se vyskytují pouze u vyšších zvířat. V centrální nervové soustavě člověka se nachází 100 až 1000 typů nervových buněk v závislosti na zvoleném stupni rozlišení. Odlišují se tvarem dendritů, výskytem a délkou axonů a rozlišením synapsí okolo buňky. Buňky jsou mezi sebou silně svázány. U neuronu může být více než 1000 synapsí. Funkčně podobné buňky vytvářejí shluky, kulovité nebo paralelně vrstvené. V mozku jsou vyčleněny stovky shluků. Kůra hlavního mozku – také shluk. Tloušťka kůry – 2 mm, plocha – okolo čtvereční stopy.
1.2 Umělé neuronové sítě. Pojem formálního neuronu a vícevrstvového perceptronu Umělé neuronové sítě (UNS) se stavějí na principech organizace a fungování biologických analogů. Jsou schopny řešit široký okruh úkolů rozeznávání obrazů, identifikace, prognózování, optimalizace, řízení složitých objektů. Další zvýšení kapacity (výkonnosti) počítačů závisí ve velké míře na UNS, konkrétně na neurokomputerech (NK), jejichž základe tvoří neuronová síť. Termín „neuronové sítě“ byl zformulován uprostřed 50-tých let 20. století. Základní výsledky jsou spojeny se jmény U.McCullocha, D.Hebba, F. Rosenblatta, M. Minského, J. Hopfielda. Uvedu krátkou historickou informaci. Roku 1943 W. McCulloch a W.Pitts navrhli model neuronu a zformulovali základní poučky teorie fungování mozku. Roku 1949 D. Hebb vyslovil myšlenky o charakteru spojení neuronů mozku a jejich součinnost (buněčné soubory, synoptická tvárnost). Jako první navrhl pravidla studia neuronové sítě.
14
Roku 1957 F. Rosenblatt vypracoval principy uspořádání a fungování perceptronů, navrhla variantu na světě prvního neurokomputeru Mark. Roku 1959 D. Hubei a T. Wiesel předvedli rozložený a rovnoběžný charakter uchování a zpracování informací v biologických neuronových sítích. V letech 1960 – 1968 Aktivní výzkumy v oblasti umělých neuronových sítí, například ADALINA a MADALINA W. Widrow (roky 1960 – 1962), asociační matrice K. Steinbucha (1961). Roku 1969 Publikace knihy M. Minského a S. Paperta „Perceptrony“, ve které se prokazuje principiální omezenost možností perceptronů. Vyhasínání zájmu o umělé neuronové sítě. V létech 1970 – 1976 Aktivní vypracování v oblasti perceptronů v SSSR (hlavní zákazníci – vojenské rezorty). Konec 90-tých let Obnovení zájmu o umělé neuronové sítě jako následek nahromadění nových znalostí o činnosti mozku, ale také významného vývoje mikroelektroniky a výpočetní techniky. V létech 1982 – 1985 J. Hopfield navrhl soustavu optimalizujících neuronových sítí, modelující asociační paměť. Roku 1985 Příchod prvních komerčních neurokomputerů, např. Mark III firmy TRW (USA). Roku 1987 Začátek rozsáhlého financování návrhů v oblasti UNS a NK v USA, Japonsku a Západní Evropě (japonský program „Human Frontiers“ a evropský
program
„Basic
Research
in
Adaptive
Intelligence
and
Neurocomputing“). Roku 1989 Projektování a výzkumy v oblasti UNS a NK jsou prováděny prakticky všemi velkými elektrotechnickými firmami. Neurokomputery se stávají jedním z největších sektorů trhu (za dva roky vyrostl objem prodeje pětinásobně). Agenturou DARPA (Defense Advanced Research Projects Agency) ministerstva obrany USA bylo započato financování programu výroby velmi rychle pracujících vzorů NK pro různá použití. Roku 1992 Práce v oblasti UNS se nacházejí ve stádiu intenzivního rozvoje. Každoročně se konají desítky mezinárodních konferencí a fór o neuronových sítích, počet specializovaných periodických vědeckých publikací uvedené tématiky dosáhlo dvou desítek názvů. Roku 1996 Počet mezinárodních konferencí o UNS a NK dosáhlo sta. 15
Roku 1997 Roční objem prodeje na trhu UNS a NK převýšil 2 miliardy dolarů, ale každoroční nárůst tvořil 50%. 2000 -cí roky. Přechod na submikronové a nanotechnologie, ale také úspěchy molekulární a biomolekulární technologie přináší principiálně nové architektury a technologie v konstrukci tvorby neurokomputerů. Neuronovými sítěmi se myslí výpočetní struktury, které modelují jednoduché biologické procesy, obvykle asociujících s procesy lidského mozku. Představují samostatné i paralelní systémy, schopné adaptivního studia cestou analýzy kladných a záporných působení. Základním invertorem v daných sítích je umělý neuron nebo jednoduše neuron, nazvaný analogicky s biologickým prototypem . Posoudíme osnovy stavby umělých neuronových sítí. Biologický neuron – složitý systém, jehož matematický model není dodnes postaven. Bylo uvedeno množství modelůvyznačujících se složitostí výpočtů a shodou s reálným neuronem. Jeden z důležitých – formální neuron (FN, obrázek 3). Nehledě na jednoduchost FN, sítě, postavené z takových neuronů mohou zformovat libovolnou vícerozměrnou funkci na výstupu.
Obrázek 3 – Formální neuron 7 Osnovu každé NS tvoří poměrně jednoduché, ve většině případů identické prvky (buňky), imitující práci neuronů mozku. Dále se neuronem bude chápat umělý neuron, tj. buňka NS. Každý neuron je charakterizován svým současným stavem analogicky s nervovými buňkami mozku, které mohou být vybuzeny a nebo zabrzděny. Má mnoho synapsí – jednosměrných vstupních vazeb, spojených s výstupy jiných neuronů, ale má také axon – výstupní vazbu daného neuronu, ze které signál (vybuzení nebo brzdění) přestupuje na synapse následujících neuronů. Celkový vzhled neuronu uveden na obrázku 4.
7
Zajencev I.V. Neuronové sítě: základní modely. Učební pomůcka pro kurz „Neuronové sítě“ pro studenty 5 kurzu magisterského studia katedry elektroniky fyzikální fakulty Voroněžské Státní univerzity. Voroněž,1999,str.21
16
Neuron sestává z váženého sumátoru a nelineárního prvku. Každá synapse je charakterizována velikostí synoptické vazby nebo její váhou wi, která je ve fyzickém smyslu ekvivalentem vodivosti. Probíhající synapse neuronu se určuje jako vážená suma vstupů: n
NET = ∑ xi ⋅ wi i =1
(1)
Obrázek 4 – Umělý neuron 8 Výstup neuronu je funkcí jeho stavu:
kde xi – vstupní signály, souhrn všech vstupních signálů neuronu tvoří vektor x; wi - hmotnostní koeficienty, souhrn hmotnostních koeficientů tvoří vektor vah w; NET - zvážená suma vstupních signálů, význam NET se předává na nelineární prvek; Q - prahová úroveň daného neuronu; F - nelineární funkce, nazývaná funkce aktivace. Neuron má několik vstupních signálů x a jeden výstupní signál OUT. Parametry neuronu, určujícími jeho činnost, jsou: vektor vah w, prahová hladina Q a druh aktivace F. Nelineární funkce f se jmenuje aktivační a může být rozličného druhu. (přesněji je to vysvětleno v příloze č. 1)
8
Kudrin R. Tvoření umělé inteligence// Komputeru,2003,č.21,str.25 (upraveno autorem)
17
Čili
model
matematické
formálního
neuronu
abstrakci, nežli
živému
není
biopodobný
neuronu.
a
spíše
Proto podivněji
podobný prokazuje
mnohotvárnost úloh, řešených s pomocí těchto neuronů a univerzálnost obdržených algoritmů. Formální
neurony
se
mohou
sjednocovat
v
síti
různým
způsobem.
Nejrozšířenějším typem sítě se stal vícevrstvový perceptron (obrázek 5).
Obrázek 5. Vícevrstvový perceptron 9
Síť sestává z libovolného množství vrstev neuronů. Neurony každé vrstvy se sjednocují s neurony předcházející a následující vrstvy podle principu „každý s každým“. První vrstva (zleva) se nazývá senzorová nebo vstupní, vnitřní vrstvy se jmenují skryté nebo asociativní, poslední (nejvíce napravo, na obrázku sestává z jednoho neuronu) – výstupní nebo výslednicová. Množství neuronů ve vrstvách může být libovolné. Obvykle je ve všech skrytých vrstvách stejné množství neuronů. Označíme množství vrstev a neuronů ve vrstvě. Vstupní vrstva: NI neuronů; NH neuronů v každé skryté vrstvě; NO výstupních neuronů. x – vektor vstupních signálů sítě, y – vektor výstupních signálů. Existuje chaos s výpočtem vrstev v síti. Vstupní vrstva nedělá žádné výpočty, ale pouze rozděluje vstupní signály, proto ho občas sčítají, někdy ne. Označíme za NL plné množství vrstev v síti počítaje vstupní.
9
Zajencev I.V. Neuronové sítě: základní modely. Učební pomůcka pro kurz „Neuronové sítě“ pro studenty 5 kurzu magisterského studia katedry elektroniky fyzikální fakulty Voroněžské Státní univerzity. - Voroněž, 1999,str.24
18
Ve vícevrstvovém perceptronu není zpětných vazeb. Takové modely se nazývají sítěmi přímého šíření. Ony nemají vnitřní stavbu a nedovolují bez přídavných příjmů modelovat vývoj dynamických systémů.
1.3 Typy neuronových sítí Široký okruh úloh, řešený NS, nedovoluje v současné době vytvářet univerzální, výkonné sítě, což vynucuje rozpracovávat specializované NS, fungujících podle různých algoritmů. Modely NS mohou být programového i přístrojového provedení. Nehledě na podstatné rozdíly, jednotlivé typy NS mají něklik společných rysů. Za prvé, osnovu každé neuronové sítě tvoří poměrně jednoduché, většinou jednotypové prvky (buňky), imitující práci neuronů mozku. Podotýkáme, za druhé, že princip paralelního zpracování signálů, které se dosahuje cestou sjednocení velkého množství neuronů v tzv. vrstvě a spojení určitým vzorem neuronů různých vrstev, ale také, v některých konfiguracích, i neuronů jedné vrstvy mezi sebou, přičemž zpracování vzájemného působení všech neuronů probíhá ve vrstvách. 10 Jako vzor jednoduché NS prozkoumáme tříneuronový perceptron (obrázek 6), tj. Takovou síť, jejíž neurony mají aktivační funkci ve formě jednotkového skoku. Někdy se perceptronem nazývá libovolná vrstvová struktura, avšak se i dále perceptronem chápe jenom síť, sestávající z neuronů s aktivačními funkcemi jednotkového skoku. (binární síť). Na n vstupů přicházejí nějaké signály, přecházející po synapsích na 3 neurony, vytvářející jednotkovou vrstvu této NS a význačné 3 signály: n y j = f ∑ xi ⋅ wij i =1 j=1...3
10
(2)
KudrinG. Tvoření umělého intelektu// Kompjutry, 2003,č.21,str.26
19
obrázek 6: jednovrstvový perceptron 11
Je očividné, že všechny váhové koeficienty signálů synapsí vrstvy neuronů je možno zavést do matrice W, ve které každý prvek Wij definuje veličinu i-té vazby j-tého neuronu. Tímto způsobem proces, probíhající v NS, může být zapsán v matriční formě:
Y=F(XW)
(3)
kde X a Y – patří vstupním a výstupním signálním vektorům, F (V) – aktivační funkce, používaná po částech ke komponentům vektoru V. Teoreticky počet vrstev a počet neuronů může být v každé vrstvě libovolný, nicméně je fakticky omezen kapacitou komputeru nebo specializovanými čipy, kterými jsou realizovány NS. Čím složitější je NS, tím rozsáhlejší úlohy jí podřízené. Výběr struktury NS se uskutečňuje v souladu se zvláštnostmi a složitostí úlohy. Pro řešení některých jednotlivých typů úloh už existují z dnešního hlediska optimální konfigurace, popsané například v
12
a v jiných publikacích, sepsaných na konci článku.
Pokud však úloha nemůže být srovnána ani s jedním ze známých typů, zpracovateli nezbývá než řešit složitý problém syntézy novou konfigurací.
11
Kudrin R. Tvorba umělé inteligence// Komputery,2003,č.21,str.26 Richard P. Lippmann, An Introduction to Computing withNeural Nets, IEEE Acoustics, Speech, and Signal ProcessingMagazine, April 1987 12
20
Obrázek 7. Dvouvrstvý perceptron13
Přitom se řídí několika stěžejními principy: možnosti sítě vzrůstají se zvětšením počtu buněk v síti, těsnosti vazeb mezi nimi a počtem vyhrazených vrstev ( vliv počtu vrstev na schopnost sítě splňovat klasifikaci plochých obrazců je uvedeno na obrázku 8 z 14
; zavedení zpětných vazeb zároveň se zvětšením možností sítě zvedá otázku o dynamické
odolnosti sítě; složitost algoritmů fungování sítě (včetně, například, zavedení několika typů synapsí – budících, brzdících aj.) také pomáhá síle NS. Otázka nevyhnutelnosti dostatečných vlastností sítě pro řešení toho nebo jiného druhu úloh představuje celý směr neurokompjuterové vědy. Ačkoliv problém syntézy NS silně závisí na řešené úloze, dát obecná a podrobná doporučení je obtížné. Ve většině případů je optimální varianta získatelná na základě intuice. Je očividné, že proces fungování NS, tj. podstaty činnosti, které je schopna plnit, závisí na kapacitě synaptických vazeb, proto zadání určité struktury NS, odpovídající jakémukoliv úkolu, zadavatel úkolu musí najít optimální význam všech proměnných váhových koeficientů ( některé synaptické vazby mohou být konstantní). Tato etapa se nazývá studiem NS, podle toho, do jaké míry bude kvalitně splněn, závisí schopnost sítě řešit vytčené problémy v době expluatace. V etapě studia kromě parametru kvality výběru vah hraje důležitou roli doba studia. Zpravidla jsou tyto dva parametry svázány nepřímou závislostí a je nutno je volit na základě kompromisu. Studium NS může probíhat s učitelem a nebo bez něj. V prvním případě se sítě předkládají jako vstupní, tak i žádané výstupní signály, a ona podle některého vnitřního 13
Kudrin R. Tvorba umělé inteligence// Komputery, 2003,č.21, str.26 Richard P. Lippmann, An Introduction to Computing withNeural Nets, IEEE Acoustics, Speech, and Signal ProcessingMagazine, April 1987 14
21
algoritmu dolaďuje váhy svých synaptických vazeb. Ve druhém případě se výstupy NS formují samostatně, ale váhy se mění podle algoritmu a respektují pouze vstupní od nich odvozené signály. Existuje velké množství různých algoritmů studia, které se rovněž dělí na dvě velké třídy: deterministický a stochastický. V prvním u nich dolaďování vah představuje pevnou posloupnost činností, podřizující se náhodnému procesu. Rozvíjej další otázku o případné klasifikaci NS, je důležité zmínit existenci binárních a analogových sítí. První z nich operují s dvojkovými signály a výstup neuronu může nabývat pouze dvou hodnot: logickou nulu („zabrzděný“ stav) a logickou jedničku („vybuzený“ stav). Do této třídy sítí patří i výše posouzený perceptron, protože výstupy jeho neuronů, formované funkcí jednotkového skoku, jsou rovny buď 0 nebo 1. V analogových sítích jsou výstupní hodnoty neuronů schopny přijímat spojité hodnoty, což by mohlo znamenat přeměnu aktivační funkce neuronů perceptronu na sigmoid. Ještě jedna klasifikace dělí NS synchronní a asynchronní. V prvním případě v každém čase mění svůj stav jenom jeden neuron. Ve druhém- stav se mění najednou v celé skupině neuronů zpravidla v celé vrstvě. Algoritmicky se časový sled v NS zadává iteračním vykonáním identických činností neuronů. Dále budou zkoumány pouze synchronní NS. Sítě je také možno klasifikovat podle počtu vrstev. Na obrázku 4 je představen dvouvrstvý perceptron, vzniklý z perceptronu z obrázku 3 a doplněním druhé vrstvy, složeného ze dvou neuronů. Tady je vhodné upozornit na důležitou roli nelineárnosti aktivační funkce, protože pokud ona nemá danou vlastnost nebo nevstoupila do algoritmu práce každého neuronu, výsledek fungování jakékoliv r-vrstvé NS s váhovými matricemi W(i), i = 1,2,...r pro každou vrstvu i by spočíval v násobení vstupního vektoru signálů X na matrici W(Σ)=W(1)⋅W(2) ⋅...⋅W(p)
(4)
to znamená fakticky by byla taková r-vrstvová NS ekvivalentní jednovrstvové NS s váhovou matricí jediné vrstvy W(Σ) : Y=XW(Σ) (5) Pokračujíc v rozhovoru o nelineárnosti je možné poznamenat, že se někdy zavádí i do synaptických vazeb. Většina NS dodnes poznaných se používá pro nalezení vzorce (1) rozptýlené sumy vstupů neuronu, avšak v některých uplatněních NS je užitečné zavést jiný zápis, například:
22
n
s = ∑ xi2 ⋅ wi
(6)
i =1
nebo dokonce n
s = ∑ xi ⋅ x (( i +1) mod n ) ⋅ wi i =1
(7)
Otázka tkví v tom, jestli zpracovatel NS jasně pochopil, pro co to dělá, jakými významnými vlastnostmi tímto dodatečně nadal neuron a jakých se zbavil. Zavedení takového druhu nelineárnosti, obecně řečeno, zvětšuje výpočetní sílu sítě, tzn. Dovoluje z menšího počtu neuronů s „nelineárními“ synapsemi zkonstruovat NS, konající práci obyčejné NS s velkým počtem standardních neuronů a složitější konfigurací. 15 Nyní prozkoumáme jednu nuanci, dříve záměrně vynechanou. Z obrázku funkce jednotkového skoku vidíme, že prahová hodnota T, v obecném případě, může nabývat libovolné hodnoty. Nejenom to, ona může přijímat nějakou libovolnou, předem neznámou hodnotu, která se zahrnuje ve stadiu studia do váhového keoficientu. Totéž patří k centrálnímu bodu sigmoidní závislosti, která se může posunovat po ose X napravo i nalevo, ale také ke všem jiným aktivačním funkcím. Toto nicméně není odraženo ve vzorci (1), který by musel být upraven takto: n
s = ∑ xi ⋅ wi − T
(8)
i =1
Věc je v tom, že se takový posun obyčejně zavádí cestou doplnění vrstvy neuronů ještě jedním vstupem, vybuzující dodatečnou synapsi každého z neuronů, jehož hodnota se vždy rovná 1. Udělíme tomuto vstupu číslo 0. Potom n
s = ∑ xi ⋅ wi i =0
(9)
kde wo = -T, xo = 1.
Je vidět, že rozdíl vzorců (1) a (9) pozůstává pouze ve způsobu číslování vstupů. Jaké úlohy může řešit NS? Zhruba řečeno, práce všech sítí je omezena klasifikací (zobecnění) vstupních signálů, náležejících n – rozměrnému hyperprostoru, podle nějakého množství tříd. Z matematického pohledu se to provádí rozdělením hyperprostoru hyperrovinami (zápis pro případ jednovrstvého perceptronu) 15
Artificial Neural Networks: Concepts and Theory, IEEE Computer Society Press, 1992
23
n
∑x
i
⋅ wik = Tk , k=1...m
(10)
i =1
Každá získaná oblast je oblastí definování jedné třídy. Počet takových tříd pro jednu NS perceptronového typu nepřevyšuje 2 , kde m – počet výstupů sítě. Avšak ne všechny mohou být rozděleny danou NS.
1.4 Konekcionismus Neuronové sítě jsou sítě, sestávající z jednoduchých prvků formálních neuronů spojených mezi sebou. Neurony se modelují poměrně jednoduchými automaty, ale všechna složitost, pružnost fungování a jiné důležité vlastnosti jsou definovány vazbami mezi neurony. Každá vazba je znázorňována jako celkem jednoduchý prvek sloužící přenosu signálu. Souhrn ideí, určující popsanou reprezentaci mozku, nese název konekcionalismus (anglicky connection – vazba,spojení). Konekcionismus operuje řadou jednoduchých ideí, zahrnujících pojem homogennosti (stejnorodosti) systému (prvky jsou stejné a neobyčejně jednoduché, všechny jsou určeny strukturou vazeb), spolehlivosti systému proti nespolehlivým prvkům, „holografičnosti“ systému – při porušení náhodně vybrané části systému zachovává svoje užitné vlastnosti.16 S konekcionismem je pevně svázán následující blok ideí: 1.stejnorodost systému (prvky jsou shodné a neobyčejně prosté, všechny jsou určeny strukturou vazeb); 2.spolehlivé systémy z nespolehlivých prvků a „analogová renezance“ - použití jednoduchých analogových prvků; 3.„holografické“ systémy – při poruše náhodně zvolené části systému zachovává užitné vlastnosti. Existuje veliká třída úloh: neuronové systémy asociační paměti, statistické zpracování, filtrace a jiné, pro kteréžto vazby se vytvářejí podle zřejmých vzorců. Ale ještě více úloh ( dle rozsahu dosavadních použití) potřebuje nerozvinutý proces. Dle analogie s výzkumem zvířat nebo člověka tento proces také nazývají studiem. Studium se obvykle dělá takto: existuje úlohář – sada příkladů se zadanými odpověďmi. Tyto příklady předpokládají systém. Neurony dostávají podle vstupních vazeb 16
Komašinskyj V., Smirnov D. Neuronové sítě a jejich použití v systémech řízení a spojů.-M.: Horká linka – Telekom,2002.-str.4
24
signály - „podmínky příkladu“, přemění je, několikrát obměňují přetvořenými signály a nakonec dají odpověď – rovněž soubor signálů. Odchylka od správné odpovědi se pokutuje. Studium sestává z minimalizace pokuty jako (skryté) funkce vazeb. Latentní studium přivádí k tomu, že struktura vazeb se stává „nepochopitelná“ neexistuje jiný způsob jí přečíst, kromě vypuštění funkce sítě. Je velice složité odpovědět na otázku: „Jak neuronová síť dostává výsledek?“ - tj. postavit pro člověka logickou konstrukci, reprodukující činnost sítě. Tento jev je možno nazvat „logickou neprůhledností“ neuronových sití, studovaných podle nejasných pravidel. Na druhé straně při použití neuronových sítí v expertních systémech vzniká potřeba pročíst a logicky zinterpretovat znalosti, zpracované sítí. Pro to slouží metody kontrastování – zisk logicky průhledných neuronových sítí implicitními metodami.
25
2.
Nanotechnologie
2.1 Pojem, historie K tomu abychom začali analýzu a konsolidaci neuronových sítí a nanotechnologií rozebereme poslední (nanotechnologie) protože tak či onak neuronové sítě byly prezentovány v předchozích a následujících kapitolách. Co je to nanotechnologie? Čemu se podobá fulleren a čím je unikátní nanotrubice? Pojem nanotechnologie jako souboru metod pro práci s objekty menšími než 10 nm nedostatečně přesně popsuje jak předmět, tak i její rozdíl od tradičních technologií a vědeckých oborů. Na jedné straně objekty nanotechnologií mohou mít charakteristickou velikost uvedeného rozsahu: • nanočástice, nanoprašky (objekty, u nichž tři charakteristické velikosti v rozmezí až do 100 nm); • nanotrubice, nanovlákna (objekty, které mají dvě charakteristické velikosti v rozmezí až do 100 nm); • nanofolie (objekty, které mají jeden charakteristický parametr v rozmezí až do 100 17
nm).
Na druhé straně předmětem nanotechnologie mohou být makroskopické objekty, kontrolovaná atomová struktura kterých je vytvořena s rozlišením na úrovni jednotlivých atomů. S myšlenkou o vytvoření technologií v měřítku nanometrů poprvé přišel laureát Nobelovy ceny Richard Feynman, který v roce 1959 mluvil o problematice kontrolování a řízení struktury látky v intervalu velmi malých rozměrů - Přednáška „There is plenty of space on the botám“: „žádný fyzikální nebo chemický zákon nebrání nám měnit vzájemnou polohu atomů“. Pojem „nanotechnologie“ byl zaveden japonem Norio Taniguchi v roce 1974, kdy navrhl takto nazývat techniků a nástroje, které jsou menší než jeden mikron, stejně jako dal stručně definici nanotechnologie: jako interdisciplinární, tvořící technologii, která umožňuje „technologicky“ (reprodukovatelně, dle uvedených postupů) zkoumat, provádět manipulaci a zpracování materiálu v rozsahu a tolerancí 0,1 / 100 nm. V roce 1985 Richard Smalley objevil fullereny - molekuly uhlíku ve tvaru koule (molekula S60, v niž atomy uhlíku jsou umístěny v rozích pětiúhelníků a hexagonů a tvoří
17
http://ru.wikipedia.org/wiki/nanotechnologie
26
tvar koule). V roce 1991 Suomi Iiyama zaměstnanec společnosti NEC objevil uhlíkové nanotrubice. Nanotechnologie mohou pomoci lidstvu dosáhnout velmi náročných (i fantastických) úkolů: • vytvořit moderní průmyslové technologií na atomární a molekulární úrovni; • vytvořit pevné látky a povrchy (materiály a folií) s modifikovanou molekulární strukturou, které budou základem velmi pevných kovů, textilů, plastů, autoregeneračních materiálů; • nových chemických látek a to cestou komponování molekul, tj. bez chemických reakcí; • logických nanoelementů a nanopočítačů (miniaturizace a zvyšování výkonu počítačů) a nových typů supravodičů (mimořádně studených); • výpočetních zařízení na základě bílkovinných molekul; • umělých analogů živých organismů (rostlin a živočichů); • nanorobotů, nanostrojů (nanomotorů), precizních (přesných) nanomanipulátorů; • lékařských robotů pro implantaci do těla (za účelem odstranění genetických a fyziologických poškození na buněčné úrovni a vyšší úrovní); • vytvoření automaticky množících se systémů založených na principech biologických analogů - bakterií, virů, prvoků.
První prostředky nanotechniky vynalezli v IBM. V roce 1982, Gerd Binnig a Genirh Rorer, kteří postavili rastrový tunelový mikroskop, za což obdrželi Nobelovu cenu, a již v roce 1986 - atomové sílový mikroskop, který umožňuje zkoumat atomy nejen kovů.18
2.2 Předmět, cíle a hlavní směry v oblasti nanotechnologií. Zvláštním rysem nanotechnologií je to, že veškeré procesy a úkony probíhají v pásmu nanometrů. V tomto rozmezí surovinami jsou jednotlivé atomy, molekuly, molekulární systémy, na rozdíl od obvyklých v tradiční technologií mikroné nebo mikroskopické množství materiálu, které obsahují alespoň miliardu atomů a molekul. Na rozdíl od tradiční technologie, nanotechnologie má individuální přístup, diky kterému vnější řízení dosahuje jednotlivých atomů a molekul, které umožňuje vytvořit bezvadný 18
Kobayasi, N. Úvod do nanotechnologií. Binom : laboratoř znalosti. 2008. s. 21
27
materiál s novými fyzikálně-chemickými a biologickými vlastnostmi a také novou třídu strojů s charakteristickými nanomerovymi rozměry. Analýza současného stavu umožňuje určit v nanotechnologie řadu důležitých směrů. 1. Molekulární design. Preparace molekul a syntéza nových molekul v silně nehomogenních (různorodých) elektromagnetických polích. 2. Nanomateriálovedení. Vytvoření bezvadných vysoce-pevných materiálů, materiálů s vysokou vodivostí. 3. Nanostrojírenství. Vytvoření skenujících tunelových mikroskopů, atomových silových mikroskopů (AFM), magnetických mikroskopů, více-hrotových
systémů pro
molekulární projektování, miniaturních dokonalé citlivých senzorů, nanorobotů. 4. Nanoelektronika. Konstruování nanometrických součástek počítačů budoucí generace, nanospojů, polních tranzistorů, usměrňovačů, displejů, akustických systémů. 5.
Nanooptika. Vytvoření nanolaserů, syntéza více-hrotových
systémů s
nanolasery. 6. Nanokatalýza. Vývoj katalyzátoru s nanostrukturami pro třídy reakcí selektivní katalýzy. 7. Nanolékařství. Projektování nanonástrojů pro ničení virů, lokální opravy orgánů, transportu velmi přesných dávek léků na určená místa živého organismu. 8. Nanotribologie. Zjištění připojení nanostruktury materiálů a třecích sil a využití těchto znalostí k výrobě perspektivných párů tření. 9. Řízené jaderné reakce. Nanourychlovače částic, nestatistické jaderné reakce.19
2.3 Uplatnění nanoinženerii a neuronových sítí Z výše uvedeného materiálu je zřejmé, že nanotechnologii je určená ohromující role ve vývoji lidstva. Základní propojení neuronových sítí a nanotechnologii je vidět v nanostrojírenství, nanolékařství. Vzhledem k tomu, že primární roli nanorobotů s UI na základě neuronových sítí výstavby je vhodné v těchto oborech vědy vývoj budoucích bioneurosítí a nano uplatnění. Díky nanotechnologiím v posledních letech neurovědy se vyvíjí doopravdy rycjle. Existují neurony na křemíkových čipech, umělá synaptická spojení, a dokonce i celé nervové systémy, kombinované s logickými klíči.
19
http://popnano.ru/studies/index.php?ctg=3
28
Malá společnost Nantero oznámila o stvoření nového experimentálního modelu elektronické paměti fungujícího na principu uhlíkových nanotrubic. Inženýrům se podařilo umístit na křemíkové desce standardní velikosti 10 miliard paměťových buněk, z nichž každá se skládá z několika nanotrubic. Za účelem výroby paměti se používají standardní fotolitografický proces: za prvé, na substrát z oxidu křemičitého se nanáší nanotrubice, a při dalším zpracování chybně orientované trubice se odstraňují. To znamená, že vývojářům se podařilo překonat komplikacím při umístění jednotně orientovaných v prostoru nanotrubic. Schéma paměti představuje sebou dvě desky z oxidu křemičitého, umístěné nad sebou ve vzdálenosti cca 100 nm. Nanotrubice jakoby se zavěšení na horní desce. Při podání elektrického proudu na dolní desku, trubice mění svou aktuální polohu a spojují obě desky. Tento stav buňky odpovídá bitu o hodnotě „1“. Pokud trubice nezamýká desky, toto odpovídá logické „0“. Poloha nanotrubice se určuje působením sil Van der Waalse, které působí nezávisle na výskytu elektrické energie. Elektrický impuls je zapotřebí pouze pro změnu polohy trubek. Toto přepnutí trvá asi 0,5 ns na rozdíl od 10 ns v moderních operačních pamětích. Hustota záznamů informací v buňce NRAM neustále roste a nejlepší je již srovnatelná s hustotou záznamů informací na čipech operační paměti. V budoucnu, hustota záznamu dat by mohla dosáhnout bilión bitů na čtvereční centimetr, což je o 1000 krát větší, než moderní operační paměť. V budoucnu se společnost rozhodla pro vytvoření neuronové sítě s vysokou stabilitou a vysokou rychlost zpracování a přenosu dat na co nejmenším počtu kanálů. Nicméně, úvod na trh nové paměť je stále ještě daleko. Uhlíkové nanotrubice jsou stále drahý a exotický materiál a výroba NRAM, i když založené na tradiční fotolitografii, vyžaduje implementaci do průmyslu. Nicméně řešení nabízené NRAM by se mohlo v perspektivě ukázat jako žádané na počítačovém trhu.20
2.3.1 Špionáž a potlačení bolesti pomocí neurotechnologií. Vojensko-průmyslový komplex. Zejména potřeby obrany, geopolitické ambice, zápas za životně důležité zdroje a reálie závodů ve zbrojení mezi přední supervelmocí, jsou hnací silou vývoje nových technologií v oblasti vyzbrojování. Nanotechnologie není výjimkou, naopak, možností kontroly látky na úrovni jednotlivých atomů a molekul, určují pro ni 20
http://216.71.164.3/NFP/vb/upload/printthread.php?s=768271a8197a31efcf80e54828f074f3&threadid=1399 &perpage=1044
29
zvláštní postavení. Analýza této oblasti je obtížná protože vojenský vývoj v oblasti nanotechnologií je utajeným. Je možné uvést jen pár obecných směrů a údajů, únik kterých sankcionuje ve vlastním zájmu vojenské rezorty. Špionáž a potlačení bolesti pomocí neurotechnologií. Studií jsou směrované na oblasti neuronových technologií, vývoj kterých povede ke vzniku bojového nanozařízení, určených pro špionáž, nebo převzetí kontroly nad funkcí lidského organizmu, pomocí připojení přes nanovybavení na nervový systém. V laboratořích NASA je stvořen model zařízení pro zachycení vnitřní řeči. Fotonové komponenty nanostruktur, které mohou přijímat a zpracovávat obrovské množství informací budou tvořit základ vesmírného monitorovacího systému, pozemního sledování a špionáže. S pomocí nanovybavení implantovaného do mozku je možno získat „umělé“ (technické) vidění s rozšířeným rozsahem vnímání, ve srovnání s biologickým zrakem. Systém potlačení bolesti u vojáků, pomoci implantace do těla a mozku, tzv. NanoNeuron Synthetic Neural Circuit Device, který je vyvinut v texaské universitě a předpokládá použití speciálních neuročipů. Špionáže pro přípravu útočných operací je realizován v systému senzorů „chytrý prach“ a nebo Smart dust. Vývojem takových nanometrických senzorů se zabývá skupina vědců pod vedením profesora chemie a biochemie Michaele Sailora z kalifornijské university v San Diegu (University of California, San Diego).21
2.3.2 Lékařství Vývoj nanoneuroceutických přípravků. Dalším směrem nanolékařství je perspektiva vývoje nanoneuroceutiků, přípravku působících na duševní stav osoby na molekulární úrovni. Neuroceutici otevírají perspektivu pro intracelulární regulaci biochemie nervové systémy člověka, a to bez vedlejších účinků moderních léků, které určeny k udržení duševního, citového a smyslového zdraví.
21
http://popnano.ru/studies/index.php?task=view&id=162&limitstart=0
30
2.4 Rizika Rozvoj nanotechnologií přináší několik velmi důležitých otázek. V první řadě filosofického rázu. Molekulární nanotechnologie, které mohou zničit civilizaci na druhou stranu mají velký tvořivý potenciál. Tím se odlišuje, např. od jaderné energetiky, neodolatelná sila, která je mnohem vhodnější pro ničení. Stále zůstává riziko nepředvídatelného chování nanosystémů a jejich vyváznutí z pod kontroly člověka. Je napsáno dost článků a povídek o vzpouře počítačů proti člověku. Ale praxe vývoje počítačových systémů ukazuje, že se nic takového nestává a do budoucna se nestane. Nebezpečí tohoto druhu se vyskytne pouze v případě, pokud si systém sám sebe pozná a kdy u něj vzniknou vlastní cíle. V současné fázi vývoje chování počítačových systémů jsou příliš úzce omezeno algoritmickými programy. Navíc, tyto algoritmy jsou jen slabě spojené s životním prostředím, počítače teprve nyní začínají být vybavení audio vizuálními prostředky v podobě mikrofonů a kamer, a nemají prakticky žádné organy vlivu na okolní objekty. Vývoj nanopočítačů nevyhnutelně bude spojen s vytvořením neuronových sítí, které umožňují náhodné reakce na vnější vlivy, a růstem součinnosti (vztahů) počítač – okolní svět. Spolu s obrovským zvýšením rychlosti a paměti v těchto systémech lze očekávat spontánní abiogenezi vědomí. Avšak k odmítnutí plnit vůli člověka může dojít nejen kvůli tomu, že nanosistémy začnou projevovat svou vůli, které vzdoruje vůli člověka, ale z důvodu nedostatku pochopení lidmi následků výkonu vlastních přání nanosistémy. Člověk nemůže předvídat všechny dopady činností nanosystémů kvůli jejich velmi vysoké komplikovanosti. Kromě spontánního nepodřízení systémů v důsledku vlastní vůli nebo hlouposti člověka, existuje mnoho příležitostí k poruchám nanosistemů splnit vůli člověka. Některé části těchto poruch je možno, teoreticky předejít, další části se vyhnout v zásadě nelze. Je téměř nemožné, aby se zabránilo vzpoře nanosystému pokud přání několika osob jsou vzájemně vylučující. V tomto případě nanosystém, během provádění příkazů jednoho člověka nebude poslouchat ostatních. Však těmito otázky se zabývá teorie systémů. Nanoroboty v tomto ohledu nebudou se lišit od současných a budoucích robotů, ledaže neuroprocesorem. Jenže chování neurosystémů, navzdory nedostatku hardwarových implementací jsou dostatečně dobře vyvinuté a prozkoumané.
31
Připomínám - téměř vše, co dnes nám slibuje nanotechnologie je možno pocítit dnes prostřednictvím souvisejícího technologického vývoje. Je možno bydlet v intelektuálním technologickém prostředí – již teď jsou vyvinutý chytré intelektuální domy, nacpané inteligentními přístrojí, včetně nechvalně proslulých chladniček s přístupem na internet. Samozřejmě, že tyto konstrukce jsou příliš velké, aby odpovídaly nanostrojům, ale již teď můžeme ocenit to, jak budeme žít v budoucnu, dokonce nepříliš vzdáleném.
32
3. Možnosti použití neuronových sítí 3.1 Místo neuronových sítí mezi jinými metodami řešení úloh Neuronové sítě překonávají sériové stroje v řešení těch úkolů, u kterých stroj překonává člověk. Úlohy vyžadující velké množství výpočtů nebo vysokou přesnost lépe zdolávají EČP. K úlohám, úspěšně řešených UNS v této etapě jejich rozvoje patří: • rozeznávání optických, sluchových obrazů; obrovská oblast použití: od rozeznávání
textu a cílů na obrazovce radaru po systémy hlasového řízení; • asociativní vyhledávání informací a tvorba asociativních modelů; syntéza řeči;
tvorba přirozeného jazyka; • formování modelů a různých nelineárních a těžko popsatelných matematických
systémů, prognózování rozvoje těchto systémů v čase: použití ve výrobě; prognózování rozvoje cyklonů a jiných přírodních procesů, prognózování změn kurzů valut a jiných finančních procesů; • systémy řízení a regulace s předpovědí; řízení robotů a dalších složitých zařízení; • nejrůznější
finální
automaty;
systémy
hromadné
obsluhy
a
komutace,
telekomunikační systémy; • přijetí rozhodnutí a diagnostika, vylučující logický výstup; především v oblastech,
kde nejsou početné logické modely: v medicíně, kriminalistice, finanční sféře. Unikátní vlastnosti neurosítí – univerzalita. Ačkoliv téměř pro všechny vyjmenované úlohy existují efektivní matematické metody řešení a nehledě k tomu, že UNS prohrávají se specializovanými metodami pro konkrétní úlohy, díky univerzálnosti a perspektivitě pro řešení globálních úloh, například vytvoření UI a modelování procesu myšlení, ony jsou důležitým směrem výzkumu, potřebujícím důkladné studium. slouží jako teoretická osnova použití UNS. V pozdější variantě teorému tkví možnost znázornění vícerozměrné funkce prostřednictvím superpozice funkcí jedné proměnné při zadání finální přesnosti. To dovoluje používat UNS pro řešení úloh aproximace vícerozměrových funkcí ve všech případech, pokud obvyklé metody přiblížení nemohou být použity a nebo nedávají dostatečně přesné výsledky. Emulátory UNS – jsou počítačové programy, základem jejichž použití je studium na příkladech. Oni představují nějaké množství „neuronů“, každý z nich je elementárním procesorem, realizujícím nějakou matematickou funkci. Počet „neuronů“ může být různé, jejich jedna část může být svázána s druhými, ale druhá část ne. UNS mohou být často 33
představeny v podobě „neuronů“, sjednocených ve vrstvu. Neurony jedné vrstvy nejsou spojeny mezi sebou, ale mají vazbu s neurony předcházejících a následujících vrstev na principu „každý s každým“. Vstupní údaje jdou do první vrstvy, poté do druhé a tak dále. O průchodu každou vrstvou se informace se informace mění v souladu se synoptickými váhami každého neuronu a jeho matematickou funkcí. Synoptické váhy odrážejí přínos každého výpočtu, prováděného neuronem v konečný výsledek. Úloha studia neuronové sítě sestává ze stanovení takových synoptických vah, při kterých vstupní údaje budou správně zobrazovat dříve známé výstupní údaje. Báze údajů pro studium UNS může být zformována za pomoci reálných experimentálních hodnot nebo číselných hodnot dříve známého experimentu. UNS jsou univerzálním experimentem pro stavby číslicových modelů typu „černá skříňka“ realizujících nelineární závislosti na základě diskrétních údajů (sadě dvojic vstupních a výstupních charakteristik, které mohou posuzovat beztak vícerozměrné vektory). UNS jsou také způsobilé v některých případech, získat analyticky modely reálných komplexních systémů bezprostředně z experimentálních údajů. Proto se mohou UNS používat pro získávání vícefaktorových kvantitativních prognóz. Technologii UNS nezavrhují, ale zahrnují do sebe a rozšiřují možnosti následujících metod: statistické metody, metody matematického modelování (analytické a číselné), metody plánování experimentu, expertní systémy, základny znalostí, metody regulérnosti řešení. Ony řeší problémy klasifikace, klastrizace, prognózy, asociační paměti, optimalizace a řízení. Základní předností technologií UNS – modelování záleží na tom, že se ony mohou používat při řešení problémů, které nemají algoritmického řešení. UNS dovolují projevovat zákonitosti chování systému na základě „nepřesných údajů“ ( neúplné informace) o charakteristikách systému. To je důležité zejména pokud je systém charakterizován mnohými parametry a definování jejich části je technicky nemožné. UNS mají takové vlastnosti, jako možnost paralelního zpracování informace, adaptabilita na různé podmínky (schopnost k učení a samovzdělávání), dobrá stabilita výpočtů, spolehlivost ( potenciální bezporuchovost následkem přebytečnosti architektury UNS), což je velmi důležité v systémech řízení. UNS mají přednosti před obyčejnými matematickými metodami ve třech případech: 1.Když
úloha
nemůže
být
adekvátně
formulována,
protože
obsahuje
nejednoznačnosti 2.Když úloha může být formulována, ale chybí matematický aparát pro její řešení 34
3.Když úloha může být formulována a nechybí matematický aparát, ale provedení výpočtů pomocí dostupných systémů neodpovídá potřebám získání řešení v čase, prostoru, nákladech, využitelném výkonu atd. Základní podmínka úspěšného použití technologií UNS – kvalita základny údajů, použité pro studium. Ale ovšem jsou také jiné podmínky úspěšného použití(architektura UNS, metodika studia UNS a některé další metodické zvláštnosti používání UNS). Hluboké studium UNS vyžaduje znalosti neurofyziologie, vědy o poznání, psychologie, fyziky (statické mechaniky), teorie řízení, teorie výpočtů, problémů umělé inteligence, statistiky/matematiky, rozeznávání obrazů, kompjuterového vidění, paralelních výpočtů a přístrojových prostředků (číslicových a analogových). Na druhé straně UNS naopak stimulují tyto disciplíny jejich zabezpečením instrumenty a reprezentací. Tato symbióza je životně důležitá pro výzkum neuronových sítí. Představíme některé problémy, řešené umělými neuronovými sítěmi. 1.Klasifikace obrazů. Úloha sestává z udání příslušenství vstupního obrazu, reprezentovaného vektorem příznaků, jednomu nebo několika předběžně definovaným třídám. Ke známým přílohám patří rozeznávání písmen, rozeznávání řeči, klasifikace signálu elektrokardiogramu, klasifikace buněk krve. 2.Klasterizace/kategorizace. Při řešení úlohy klasterizace, která je známá také jako klasifikace bez učitele, chybí vyučovací výběr s označením tříd. Algoritmus klasterizace je založen na podobnosti obrazů a umísťuje blízké obrazy do jednoho klastru. Známé jsou případy použití klasterizace pro vytěžování znalostí, zkomprimování údajů a výzkum vlastností údajů. 3.Předpověď/prognóza. 4.Optimalizace. Bezpočetné problémy v matematice, statistice, technice, vědě, medicíně, a ekonomice se mohou prozkoumávat jako problémy optimalizace. Úkolem optimalizace je nalezení řešení, které uvolňuje systému omezení a maximalizuje nebo minimalizuje cílovou funkci. 5.Paměť, adresovatelná podle obsahu. V modelu vypočítaný Neumannův fón má přístup k paměti pouze prostřednictvím adresy, který není závislý na obsahu paměti. Nejen to, pokud je dovolená chyba v určení adresy, tak může být nakonec nalezena jiná informace. Paměť, adresovatelná podle obsahu, nebo asociační paměť, je dostupná podle příkazu předepsaného obsahu. Obsah paměti může být vyvolán dokonce podle částečného nebo zkresleného obsahu. Asociační paměť je neobyčejně žádaná při vytváření perspektivních informačně – výpočetních systémů. 35
Tímto způsobem neuronová síť řeší všechny tyto často nedefinovatelné nebo těžko definovatelné úlohy. Jak známo, pro řešení takových úloh se tradičně používají základní přístupy. První, založený na pravidlech (rule – based), je charakteristický pro expertní systémy. Opírá se o popis předmětné oblasti v podobě souboru pravidel (axiom) „když..., tak...“ i pravidel výstupu. Hledaná znalost se představuje v tomto případě teorémem, jehož pravdivost se dokazuje prostřednictvím stavby obvodem výstupu. Při tomto přístupu je však nevyhnutelné znát celý soubor zákonitostí, popisující předmětnou oblast. Při použití druhého přístupu, založeného na příkladech (case – based), je pouze nutno mít dostatečné množství příkladů pro nastavení adaptivního systému se stanoveným stupněm hodnověrnosti. Neuronové sítě představují klasický příklad takového přístupu.22 Už dnes se umělé neuronové sítě využívají v mnohých oblastech, ale především je bude možno používat tam, kde jsou na mapu dány lidské životy nebo významné materiálové zdroje, musí se řešit důležité otázky, týkající se spolehlivosti jejich práce. Proto úroveň dovolených chyb je nutno určovat vycházeje z podstaty samotného úkolu. Některé problémy s analýzou otázek spolehlivosti vznikají kvůli předpokladu bezchybnosti komputerů, ačkoliv umělé neuronové sítě mohou být nepřesné dokonce při správném fungování. Zrovna tak jako komputery, i lidé také mohou být chybující. První – okolnostmi různých technických problémů nebo chyb v programech, druzí – kvůli nepozornosti, únavě nebo neprofesionalitě. A tak je zvláště pro kritické úlohy nevyhnutelné, aby tyto systémy zálohovaly a jistily jeden druhého. A to znamená, že při řešení takových úloh musí vystupovat neuronové sítě ne jenom v kvalitě jednotlivých prostředků, ale i dodatečných, předpokládajících zvláštní situace nebo ujímajících se řízení, když se problém neřeší standardním způsobem a jakékoliv průtahy mohou vést ke katastrofě. Druhá potíž využití neuronových sítí spočívá v tom, že tradiční neuronové sítě nejsou schopné vysvětlit, jakým způsobem řeší úlohu. Vnitřní znázornění výsledků studia je často natolik složité, že ho není možno zanalyzovat, vyjímaje některé jednoduché příklady, které jsou obvykle nezajímavé. V poslední době jsou podnikány aktivní pokusy o slučování umělých neuronových sítí u expertních systémů. V takovém systému umělá neuronová síť může reagovat na většinu poměrně jednoduchých případů, ale všechny ostatní jsou předány k prozkoumání
22
Kruglov V.V., Borisov V.V. Umělé neuronové sítě. Teorie a praxe.-M.: Horká linka – Telekom,2001. s.10
36
expertnímu systému. Výsledkem je přijetí složitých případů na nejvyšší úrovni, není důležité, jestli shromážděním doplňkových údajů nebo přizváním expertů. Neurosíťové aplikované balíčky, vypracované řadou společností, umožňují uživatelům pracovat s různými druhy neuronových sítí a rozličnými způsoby jejich výuky. Ony mohou být jak specializované ( například předpovědi kurzů akcií), tak i dostatečně univerzální. Oblasti použití neuronových sítí jsou velmi různorodé – rozeznávání textu a řeči, sémantické vyhledávání, expertní systémy pro podporu přijetí rozhodnutí, předpovědi kurzů akcií, systémy pro bezpečnost, analýzy textů. Prozkoumáme několik zvlášť jasných a zajímavých příkladů využití neuronových sítí v různých oblastech. Je nutno poznamenat, že jsme se snažili podle možnosti vybírat nejrannější příklady použití neuronových sítí pro řešení odpovídající úlohy. Technika a telekomunikace. V roce 1996 byl firmou „Accurate Automation Corp“23, Chattanooga, TN na zakázku NASA a „Air Force“ vypracován experimentální autopilotní nadzvukový letoun – vyzvědač LoFLYTE ( Low – Observable Flight Test Experiment). Letadlo mělo délku celkem 2,5 m a váhu 32 kg a bylo určeno pro vývoj nových principů pilotování. LoFLYTE využíval neuronové sítě, dovolující autopilotovi učit se způsobu pilotování letce. Jelikož byl letoun určen pro lety rychlostí 4 – 5 Machů, tak rychlost reakcí pilota – člověka nemusela být dostatečná pro adekvátní odezvu na změnu režimu letu. V tomto případě přišly na pomoc neuronové sítě, které přejímaly zkušenost v řízení od letce a díky vysoké rychlosti zpracování informací umožňovaly nalézat únik z havarijních a extrémních situací.24 Jedna z důležitých úloh v oblasti telekomunikací, která spočívá v nalezení optimální cesty provozu mezi uzly, může být úspěšně řešena pomocí neuronových sítí. V daném případě je nutno dát pozor na to, že za prvé – navržené řešení musí respektovat běžný stav sítě, kvalitu spojů a přítomnost poruchových úseků, a za druhé – hledání optimálního řešení se musí provádět v reálném čase. Neuronové sítě dobře vyhovují pro řešení úloh takového druhu. Kromě řízení směrování toků se mohou neuronové sítě využívat i při projektování nových telekomunikačních sítí, umožňujíce docilovat velmi efektivní řešení.
23
http://www.accurate-automtion.com/Technology/Loflyte/loflyte.html Zdroj: http://www.designation-systems.net/dusrm/app4/loflyte.html
24
37
Informační technologie. Stanovení tématiky textových zpráv - ještě jeden příklad úspěšného využití umělých neuronových sítí. Třeba server novin Conventis ( produkt společnosti „Aptex Software, Inc.“) byl vybrán roku 1997 společností „PointCast, Inc.“, se stal lídrem osobních dodávek novin po Internetu, pro heslové třídění zpráv podle kategorií. Stanovené významy klíčových slov podle kontextu, server Conventis bych schopen v reálném čase rozeznávat témata a automaticky zařazovat do rubrik ohromné toky textových zpráv, předávaných takovými informačními sítěmi, jako Reuters, NBC a CBS.25 Neurosíťový produkt „SelectCast“ od „Aptex Software, Inc.“ umožňoval určit oblast zájmů uživatelů Internetu a předkládal jim reklamu odpovídající tématiky. V létě 1997 společnost „Excite, Inc.“ licencovala toto rozpracování pro využití ve svých vyhledávacích serverech. Po instalaci na serverech Excite a Infoseek bylo neurosíťovou reklamou v tu chvíli uchváceno okolo třetiny všech uživatelů sítě. Provedené výzkumy zjistily, že ohlas na takovou tématickou reklamu byl v průměru dvakrát vyšší, než obvykle, ale pro některé její typy se efektivita zvětšila až pětkrát. Ekonomika a finance. Neuronové sítě se aktivně používají na finančních trzích. Například americký Citybank využívá neurosíťové předpovědi od roku 1990, a už dva roky po jejich zavedení, podle svědectví časopisu „The Economist“, automatické podnikatelské styky vykázal roční výnos 25%. Chemical Bank používá neurosíťový systém firmy „Neural Data“ pro předběžná zpracování transakcí na valutových burzách řady zemí, sledujíce podezřelé transakce. Automatizované systémy vedení portfolií s využitím neurosítí ve výzbroji i u „Deere & Co LBS Capital“, přičemž expertní systém se sjednocuje s přibližně 900 neuronovými sítěmi. Před několika lety velká kanadská banka CIBC pro správu rizik a identifikaci zlomyslníků zřídil program „KnowledgeSeeker“ firmy „Angoss“.26 S její pomocí specialisté banky řešili objasňování, kdo z jejich klientů v budoucnu bude s vysokou pravděpodobností zdržovat platby proti zástavě. Zezačátku se předpokládalo, že v první řadě se jimi prokáží ti, kdo i předtím zdržovali svoje platby o několik dní. Nicméně výzkumy ukázaly, že příště problémy s platbami vzniknou u těch klientů banky, kteří na
25
Neuronové sítě. STATISTICA Neural Networks.//M.: Horká linka – Telekom, 2000,str.182
26
Krysilov, V., Oleško, D., Trutněv A.V.. Použití neuronových sítí v úlohách intelektuální analýzy informace.//Práce Oděsské politechnické univerzity,Vyp.21999,s.134
38
základě pravidelných plateb jakoby zapomínali platit. Jak se ukázalo, podobná „zapomnětlivost“ byla spojena s vážnými finančními těžkostmi. Reklama a marketing. Společnost „Neural Innovation Ltd“ využívala při práci a marketingovými společnostmi strategii přímé expedice. Nejprve prováděla expedici 25% z celkového počtu nabídek a sbírala informace o ohlasech a reakcích spotřebitelů. Potom tyto údaje předali na vstup neuronové sítě, s jejíž pomocí provedli nález optimálního segmentu spotřebitelského trhu pro každý výrobek. Potom ostatních 75% nabídek expedovali už s ohledem na nalezené zákonitosti do určeného segmentu, a efektivita druhé expedice znatelně vzrostla ve srovnání s prvopočáteční. Při vedení byznysu v podmínkách konkurence společnosti musely udržovat stálý kontakt se spotřebiteli, zabezpečujíce zpětnou vazbu. Proto některé společnosti provádějí ankety spotřebitelů, umožňující ujasnit, jaké faktory jsou rozhodující při nákupu daného zboží nebo služeb. Analýza výsledků podobného průzkumu – nelehký úkol, poněvadž je nutné zkoumat velké množství mezi sebou provázaných parametrů a zjistit faktory, vykazující největší vliv na poptávku. Existující neurosíťové metody dovolují toto objasnit a prognózovat chování spotřebitelů při změně marketingové politiky, ale znamená to nacházet optimální strategie práce společnosti. Zdravotnictví. V medicínské diagnostice se neuronové sítě mnohdy využívají společně s expertními systémy. Společností „NeuroProjekt“ byl vytvořen systém objektivní diagnostiky sluchu u hluchých dětí. Obecně používaná metodika diagnostiky spočívá v tom, že se v procesu lékařské prohlídky registrují odezvy mozku jako odpověď na zvukové podráždění, projevující se v erupce na elektroencefalogramu. Pro diagnostiku sluchu děcka je nutno i pro zkušeného audiologa provést okolo 2 tisíc testů, neuronová síť je schopná při stejné hodnověrnosti určit úroveň sluchu už po 200 pozorováních v průběhu několika minut, navíc bez účasti specialisty. Uvedené příklady ukazují, že technologii neuronových sítí jsou použitelné prakticky v jakékoliv oblasti, ale při takových úlohách, jako je rozeznávání obrazů a prognózování kótování akcií se staly obvyklým širocepoužívaným instrumentem. Povšechné proniknutí neuronových technologií do jiných oblastí je jenom otázkou času. Konečně, pronikání nových vědecky náročných technologií je složitý proces, avšak praxe dokazuje, že se investice nejenom vyplácejí a přinášejí výhody, ale i dávají těm, kdo je používají, hmatatelné výhody.
39
3.2 Robotika jako směr UI Všechna intelektuální činnost člověka je směrována v konečném výsledku na aktivní součinnost s vnějším světem pomocí pohybu. Přesně tak prvky intelektu slouží, především pro organizaci cílevědomých pohybů. Zároveň základní určení čistě komputerových systémů UI spočívá v řešení intelektuálních úloh, mající abstraktní nebo pomocný charakter a obvykle nespojených s vnímáním okolního prostředí s pomocí umělých orgánů smyslů, ne s organizací pohybu výkonných mechanizmů. První roboti se těžko mohou nazývat inteligentními. Jenom v 60-tých letech se ukázaly exempláře s orgány smyslů, řízené univerzálními komputery. Na příklad v roce 1969 v Elektrotechnické laboratoři (Japonsko) začalo konstruování průmyslového inteligentního robota. Jeho cílem bylo – vytvoření „cítícího“ manipulačního robota s prvky umělé inteligence pro montážní práce s vizuální kontrolou. Robot Elektrotechnické laboratoře uměl rozeznávat jednoduché předměty, ohraničené plochami a válcovými povrchy při speciálním osvětlení. Cena experimentálního vzorku byla přibližně 400 tisíc dolarů. Postupně se roboti zdokonalovali, ale dodnes jsou vzdáleni učenlivosti člověka, ačkoliv některé operace už umějí na úrovni lepších žonglérů. Například udrží na ostří nože míček pro stolní tenis.
Obrázek 8 – Expertní systémy na základě UI27 Umělá inteligence přinesla užitečné tržní vlastnosti. Trh neurosítí je mohutný; bankéři si váží svých technických analytiků, ale ti bez neurosítí neudělají ani krok. Kde je neurosíť – tam je i genetický algoritmus – tam je i umělý život.
27
Kudrin P. Tvorba umělé inteligence//Komputery, 2003,č.21,s. 25
40
Expertní systémy (ES)28 – jsou širokánská a složitá disciplína. Abychom nechodili kolem horké kaše, budeme vycházet z následující definice: expertní systém je program (na současné úrovni rozvoje technologií), který nahrazuje experta v té nebo oné oblasti. Odtud vychází prostý závěr: vše, co jsme posuzovali výše co se týče systémů UI, hovoří pro stavbu ES. ES jsou především určeny pro řešení praktických úkolů, vznikajících ve slabě strukturované a těžko přesně definované oblasti. ES byly prvními systémy, které přivedly pozornost potenciálních uživatelů produkce UI. S ES jsou spojeny některé rozšířené omyly. Omyl první: ES nebude dělat více (a spíš méně) toho, co může dělat expert, který vytvořil daný systém. Pro vyvrácení tohoto postulátu je možné postavit učící se ES v oblasti, ve které obecně nejsou experti, nebo spojit do jednoho ES znalosti expertů a obdržet systém, který může umět vše, čeho není schopen ani jeden z tvůrců. Omyl druhý: ES nikdy nenahradí člověka – experta. Na závěr zmíníme důležité expertní systémy, využívající algoritmy UI29: • MICIN – expertní systém pro medicínskou diagnostiku. Byla vypracována
skupinou pro infekční onemocnění Stanfordské univerzity. Stanovuje diagnózy, vycházeje z jejích obecných symptomů a doporučuje směr medikace kterékoliv z diagnostikovaných infekcí. Základ údajů tvoří 450 pravidel; • PUFF – analyzuje poruchy dýchání. Tento systém je vlastně MICIN, ze kterého
odstranili údaje o infekcích a vložili údaje o plicních onemocněních; • DENDRAL – slouží pro rozlišování chemických struktur. Nejstarší z expertních
systémů. Jeho první verze se objevily ještě v roce 1965 ve zmíněné Stanfordské univerzitě. Uživatel zavádí do systému nějakou informaci o látce, ale také údaje spektrometrie (infračervené, nukleární magnetické rezonance a hmotové spektrometrie), a on zároveň s tím pojmenuje chemickou strukturu vyhovující těmto podmínkám; • PROSPEKTOR – expertní systém vytvořený pro podporu hledání nalezišť nerostů,
jehož vypracování je komerčně výhodné.
28
Expertní systém je počítačový program, který má za úkol poskytovat expertní rady, rozhodnutí nebo doporučit řešení v konkrétní situaci,jsou navrženy tak, aby mohly zpracovávat nenumerické a neurčité informace. Zdroj:http://cs.wikipedia.org/wiki/Expertn%C3%AD_syst%C3%A9m 29
Kudrin P. Tvorba umělé inteligence//Komputery, 2003,č.21,s. 25
41
4. Perspektivy. 4.1 Budoucnost V současné době jsou umělé neuronové sítě důležitým rozšířením koncepce výpočtů. Už umožnily zdolat s řadou nejednoduchých problémů a slibují vytvoření nových programů a instalací, schopných řešit úkoly, které jsou zatím nadlidské. Současné neurokomputery se využívají převážně v programových produktech a proto málokdy využijí svůj potenciál „paralelizmu“. Epocha současných neurovýpočtů započne s příchodem na trh velkého množství přístrojových realizací – specializovaných neuročipů a plošných spojů, určených pro zpracování řeči, video, statických zobrazení a jiných typů obrazové informace. Mnoho nadějí týkajících se neuronových sítí je dnes svázáno s přístrojovými aplikacemi, ale zatím doba jejich masivního vstupu na trh, jak je vidět, ještě nepřišla. Buď se vyrábějí jako specializovaná zařízení, nebo hodně drahé, ale nejčastěji obojí. Na jejich vypracování je zapotřebí hodně času, za který programové realizace nejposlednějších komputerů jsou řádově méně výkonné, což činí používání neuroprocesorů nerentabilními. Ale to všechno je jenom otázka času – neuronovým sítím je předurčeno projít stejnou cestou, kterou ještě nedávno prošly počítače, zvětšujíce svoje možnosti a výkonnost, obsazujíce nové sféry použití podle vzniku nových úkolů a rozvoje technické základny pro jejich zpracování. Změnit se musí i interface součinnosti uživatele se sítí, který bude zakládán na inteligentních agentech30 – novém druhu programového zabezpečení, který dostal název „Agentware“. Agenti budou spolupracovat nejenom se svým uživatelem, ale i s druhými obdobnými agenty a se speciálními servisy. Následkem toho se v síti objeví svého druhu nové socium s učícími se agenty, kteří budou konat rozhodování jménem uživatele, ale dosud je těžko říci, k čemu to povede.
30
Inteligentní agenti sémantického Webu// Vědecký časopis KubGAU,č.10,2006
42
4.2 Výsledky Při hodnocení výsledků by se chtělo říci, že dnes neuronové sítě už nejsou údělem nevelké skupiny teoretiků. K neurosíťovým aplikacím se připojují inženýři a výzkumníci různých specializací. Zejména těší rozvoj ve stavbě vydařených neurosíťových modelů zkoumaných jevů, hlavně na základě experimentálních údajů. Zde se zcela projevily pozoruhodné vlastnosti umělých neuronových systémů: masivní paralelní zpracování informace, asociativnost paměti a schopnost studia podle zkušeností. To otevírá nové perspektivy pro systematizaci nevyčíslitelné experimentální informace v takových oblastech vědomostí, kde se tradičně těžce ujímá matematický formalizmus, například v medicíně, psychologii a historii.
43
Závěr Umělé neuronové sítě, podobné biologickým, jsou výpočetním systémem s ohromným počtem paralelně pracujících procesů s množstvím vazeb. Nehledě na to, že při postavení takových sítí se obvykle dělá řada předpokladů a zjednodušení, odlišujících je od biologických analogů, umělé neuronové sítě demonstrují překvapivé množství vlastností, patřících mozku, - to je učení se na základě zkušenosti, zobecnění, vytažení podstatných údajů z přebytečných informací. Umělé neuronové sítě indikované biologií, ačkoliv sestávají z prvků, jejich funkční možnosti jsou analogické většině elementárních funkcí biologického neuronu. Tyto prvky potom organizují způsobem, který může odpovídat ( nebo neodpovídat) anatomii mozku. Nehledě na takovou povrchovou shodu, umělé neuronové sítě demonstrují překvapivé množství možností přisuzovaným mozku. Například se učí na základě zkušenosti, zobecňují předcházející precedenty na nové případy a vytahují důležité vlastnosti z informace, která měla zbytečné údaje. Nehledě na takovou funkční shodu, dokonce jejich nejoptimističtější přívrženec nemohl doložit, jestli budou moci v blízké budoucnosti umělé neuronové sítě kopírovat funkci lidského mozku. Reálný „intelekt“, který představují složitější neuronové sítě, se nachází na nižší úrovni než dešťovka a entuziasmus musí být zdrženlivý ohledně odpovídajících současných reálií. Rovněž by bylo nesprávné ignorovat pozorovatelnou shodu ve funkci některých neuronových sítí s lidským mozkem. Tyto možnosti, kdyby nebyly dnes omezeny, navozují myšlenku, že hluboký průnik do lidského intelektu, ale také veliké množství revolučních inovací nejsou za horami. Jednou ze základních předností neuronových sítí se jeví to, že mají širokou oblast použití. Naproti tomu jsou stromy řešení ohraničeny rámcem klasifikace a je nutno poznamenat, že existují algoritmy řešící úlohy prognózování, ale znatelně ustupují neuronovým sítím. Neuronové sítě ze své přirozenosti jsou univerzálními aproximátory a umožňují modelovat velice složité zákonitosti, což, říkám, není dostupné regresním modelům. Není nevyhnutelné předem znát aproximativní funkci, neuronová síť může být lehce přiučená nově doplněnými údaji, pro stromy řešení je to dneska veliký problém, poněvadž není vypracována metodika „dostavení“ stromu, musí se stavět strom od nuly, nerespektovat dříve postavené, existují neurosíťová paradigmata, například Kohonenovy mapy, ve kterých je proces učení prováděn bez učitele, tzn. samotná síť probírá strukturu
44
údajů a druhé neurosíťové paradigma RBF – velmi rychle se učící sítě, ačkoliv je nutno poznamenat, že tzv. „čertovské dimenze“ se jich vysoce týkají. Jako hodnocení závěrů se chce říci, že dnes neuronové sítě už nejsou údělem nevelké skupiny teoretiků. K neurosíťovým aplikacím se připojují inženýři a výzkumníci různých odborností. Zvlášť těší progres ve stavbě vydařených neurosíťových modelů sledujících jevy, plně bazírujících na experimentálních údajích. Zde se nejvíce projevují významné vlastnosti umělých neuronových sítí: mohutná paralelnost zpracování informace, asociační paměti a schopnost učit se ze zkušenosti. Tohle odkrývá nové perspektivy pro systemizaci nesčíslné experimentální informace v takových oblastech znalostí, kde se tradičně těžce ujímá matematický formalizmus, například v medicíně, psychologii a historii.
45
Seznam použitých obrázků. Obrázek č. 1. Obecné schéma stavby biologického neuronu Zdroj: http://dev.emcelettronica.com/files/u4/Fig0052.png Obrázek č. 2. Biologický neuron. Zdroj: http://www.utexas.edu/courses/bio365r/Images/neuron.JPG Obrázek č. 3 – Formální neuron Zdroj: Zajencev I.V. Neuronové sítě: základní modely. Učební pomůcka pro kurz „Neuronové sítě“ pro studenty 5 kurzu magisterského studia katedry elektroniky fyzikální fakulty Voroněžské Státní univerzity. Voroněž,1999,str.21 Obrázek č. 4 – Umělý neuron Zdroj: obrázek: Kudrin R. Tvoření umělé inteligence// Komputeru,2003,č.21,str.25 (upraveno autorem) Obrázek č. 5. Vícevrstvový perceptron Zdroj: Zajencev I.V. Neuronové sítě: základní modely. Učební pomůcka pro kurz „Neuronové sítě“ pro studenty 5 kurzu magisterského studia katedry elektroniky fyzikální fakulty Voroněžské Státní univerzity. - Voroněž, 1999,str.24 Obrázek č. 6: jednovrstvový perceptron zdroj: Kudrin R. Tvorba umělé inteligence// Komputery,2003,č.21,str.26 Obrázek č. 7. Dvouvrstvý perceptron Zdroj: Kudrin R. Tvorba umělé inteligence// Komputery, 2003,č.21, str.26 Obrázek č. 8 – Expertní systémy na základě UI Zdroj: Kudrin P. Tvorba umělé inteligence//Komputery, 2003,č.21,s. 25 Obrázek č. 9 – Typy funkcí aktivace Zdroj: Zajencev I.V. Neuronové sítě: základní modely. Učební pomůcka pro kurz „Neuronové sítě“ pro studenty 5 kurzu magisterského studia katedry elektroniky fyzikální fakulty Voroněžské Státní univerzity. - Voroněž, 1999,str.23
46
Seznam použité literatury. 1. JAIN, Anil K.; MAO, Jianchang; MOHIUDDIN, K. Úvod do umělých neuronových sítí.Otevřené systémy, 1997.č 4. s 16-24. ISSN:0018-9162 2. BESTENS, D.; VAN DEN BERG, B., WOOD, D. Neuronové sítě a finanční trhy: Přijetí rozhodnutí v tržních operacích.. M.: TVP,1997. s. 235.ISBN 5-85484-028-6 3. BOGOSLAVSKYJ, S. Oblast použití umělých neuronových sítí a perspektivy jejich rozvoje. Vědecký časopis KubGAU, č.27(3),březen 2007 4. BURNŠTEJN, E.; LUNDKVIST, S. „Tunelní jevy v pevných látkách.“. M : Mir, 1973. 421 s. 5. DJAČKOV, P.„Uhlíkové nanotrubice. Materiály pro počítače XXI století‘ [online] [2009-01-05] dostupný z http://vivovoco.rsl.ru/VV/JOURNAL/NATURE/11_00/NANOTUBE.HTM
6. GALCOV, Maxim. Nanotechnologie: zachránění nebo uhynutí?[online] c2003[cit. 2003-02-17] dostupný z http://zhurnal.lib.ru/g/galxcow_m_a/nano.shtml 7. GORBANˇ, A.; DUNIN – BARKOVSKYJ, V; MIRKES, E. a další. Neuroinformatika. Novosibirsk: Věda.1998. 296 s. ISBN: 5020314102 8. KALLAN, R. Základní koncepce neuronových sítí.Williams,2003. 288 s. ISBN: 5-8459-0210-X 9. KOBAYASI, N. Úvod do nanotechnologií. Binom : laboratoř znalosti. 2008. 134 s. ISBN: 978-5-94774-841-3 10. KOMAŠINSKYJ, V.; SMIRNOV, D. Neuronové sítě a jejich použití v systémech řízení a spojů. M.: Horká linka – Telekom, 2003.s.94. ISBN: 978-5-93517-094-3 11. KRUMLOV, V.; DLI, M.;GOLUNOV, R. Nepřesná logika a umělé neuronové sítě. M : Fizmatlit, 2001.221 s. Dostupný z http://neuroschool.narod.ru/books/fuznnmlb.html#top 12. KRUMLOV, V.;BORISOV, V. Umělé neuronové sítě. Teorie a praxe.M.: Horká linka – Telekom,2001.-str.382 ISBN: 5-93517-031-0 13. KURAVSKYJ, L. Neuronové sítě v příkladech prognózování, diagnostiky a analýzy údajů,M.: RUSAVIA,2003. ISBN 5-900078-19-1 14. LADIKOV, Pavel. Cesta k umělému intelektu. [online]c1998 [cit.2009-02-17 ]Chap. 25 dostupný z http://www.softholm.com/articles/windows.html 15. LOGOVSKYJ, A. Zahraniční neurobalíčky: současný stav a srovnatelné charakteristiky//Neurokomputer.-1998.č.1.
47
16. LUGER, Georgie F. Umělá inteligence: strategie a metody řešení složitých problémů, 4-té vydání.Překlad z angličtiny.-M.:Vydavatelský dům „William“,2003. 864 s. ISBN: 5-8459-0437-4, 978-5-8459-0437-9 17. MIRKES, E. Návrh normy. Novosibirsk: Věda,1998. 190 s ISBN: 5-02-031409-9 18. OSOVSKYJ, S. Neuronové sítě pro zpracovávání informací.M.: Finance a statistika,2004. 343 s. ISBN:5-279-02567-4 19. PODNĚBENNYJ, I. Použití neurosíťového modelu v logistickém kontrolingu. Elektronický časopis: „Logistika dnes“, vyd.č. 3,2008.[online][cit. 2009-02-06] dostupný z http://grebennikon.ru/article-tid5-225.html 20. RAMBIDI, N. „Nanotechnologie a molekulární počítače“. M.: Fizmatlit, 2007. ISBN: 978-5-9221-0869-0 21. RATNER, M.; RATNER, D. „Nanotechnology: A Gentle Introduction to the Next Big Idea“ . M : Williams. 2006. 240 s. ISBN 5-8459-0699-7 22. ROMANOV, V. Inteligentní informační systémy v ekonomice,M.: Zkouška,2003 ISBN 5-94692-194-0 23. SUROVCEV, I.; KLJUKYN, V.; PIVOVAROVA, R.. Neuronové sítě – Voroněž:VGU,1994. str.224 ISBN: 5858130135 24. ŠEVČENKO, V. M.: LKI 2008. „Bílá kniha o nanotechnologii 25. TERECHOV, S. Lekce teorie a aplikací umělých neuronových sítí. 1998[online] [cit.2008-12-15] dostupný z http://alife.narod.ru/lectures/neural/Neu_ch04.htm 26. TRET’JAKOVA, Y. (Ed.). „Nanotechnologie. „Abeceda pro všechny.“ M.: Fizmatlit, 2008 27. USKOV, A.; KUZMIN, A.. Inteligentní technologie řízení. Mělé neuronové sítě a nepřesné logika.-M.: Horká linka-Telekom,2004.-str.143.ISBN 5-93517-181-3 28. WASSERMAN, P. Neurokomputerová technika: teorie a praxe.-M.: Svět,1992. ISBN 5-03-002115 29. YAGODIN, S. Nanotechnologie.perspektivy vývoje.[online]c2007[cit. 2009-0218] dostupný z http://popnano.ru/studies/index.php?task=view&id=162 30. ZAJENCEV, I. Neuronové sítě: základní modely. Učební pomůcka pro kurzy „ Neuronové sítě“ pro studenty 5 kurzu magisterského studia katedry elektroniky fyzikální fakulty Voroněžské Státní univerzity. - Voroněž,1999,str.76 Dostupný z http://www.nglib.ru/annotation.jsp?book=006740
48
Příloha č.1
Přílohy Základní druhy funkcí aktivace Vysvětlíme základní druhy funkcí aktivace, získavše rozšíření v UNS. 31 1.
Pevný stupínek:
Používá se v klasickém formálním neuronu. Je rozvinuta celá teorie, dovolující shrnovat libovolné logické obvody na základě FN s takovou nelineárností. Funkce se vyjadřuje dvěma – třemi strojovými instrukcemi, proto neurony s takovou nelineárností potřebují malých výpočtových nákladů. Tato funkce je přespříliš zjednodušena a nedovoluje modelovat obvody se spojitými signály. Nedostatek první derivace ztěžuje použití gradientových metod pro studium těchto neuronů. Sítě na klasických FN se nejčastěji vytvářejí, syntezují, tj. jejich parametry se vypočítávají dle vzorců, oproti školení, když parametry se dolaďují interakčně. 2. Logická funkce (sigmoida, Fermiho funkce):
Velmi často se používá pro vícevrstvové perceptrony u jiných sítí se spojitými signály. Hladkost, spojitost funkce – důležité kladné vlastnosti. Spojitost první derivace dovoluje studovat síť gradientovými metodami ( například metoda zpětného šíření chyby). Funkce je symetrická (NET =0, OUT =1/2), to jí dělá rovnoprávnou významu OUT=0 a OUT=1, což je podstatné v práci sítě. Nicméně pásmo výstupních hodnot od 0 do 1 není symetrické, kvůli tomu se studium významně zpomaluje. Definovaná funkce - je stlačená, tj. Pro malé hodnoty NET je koeficient přenosu K=OUT/NET veliký, pro velké hodnoty se snižuje. Proto pásmo signálů, se kterými neuron pracuje bez nasycení je široký
31
Zajencev I.V. Neuronové sítě: základní modely. Učební pomůcka pro kurz „Neuronové sítě“ pro studenty 5 kurzu magisterského studia katedry elektroniky fyzikální fakulty Voroněžské Státní univerzity. - Voroněž,1999,str.22
49
Příloha č.1 Hodnota derivace se snadno vyjadřuje přes samotnou funkci. Rychlý výpočet derivace urychluje studium. 3. Hyperbolický tangens:
Také se často používá sítí se spojitými signály. Funkce je symetrická vzhledem k desetinné čárce (0,0), to je přednost ve srovnání se sigmoidou. Derivace je také spojitá a vyjadřuje se přes samotnou funkci. 4. Plochý stupínek:
Tady se sumarizace provádí pro všechny neurony vrstvy sítě. Takový výběr funkce zabezpečuje sumarizaci výstupů vrstvy, rovnou jedné za libovolných hodnot signálů NETi dané vrstvy. Toto dovoluje interpretovat OUTi jako pravděpodobnost jevů, jejichž souhrn (všech výstupů vrstvy) vytváří ucelenou skupinu. Tato užitečná vlastnost umožňuje používat SOFTMAX funkci v úlohách klasifikace, prověrky hypotéz, rozeznávání obrazů a všech dalších, kde se vyžadují výstupy pravděpodobnosti. 7. Intervaly sinusoidy:
8. Gaussova křivka:
Používá se v případech, když reakce neuronu musí být maximální pro některou určenou hodnotu NET. 9. Lineární funkce OUT = K NET, K=konst. Používá se pro ty modely sítí, kde není třeba postupné řazení vrstev neuronů jedné za druhou. Výběr funkcí aktivace se určuje (obrázek 5):
50
Příloha č.1
Plochý stupínek Sigmoida (logická křivka) Hyperbolický tangens)
Stupínek s lineární částí
Gaussova křivka
Obrázek 9 – Typy funkcí aktivace 32 1.
Specifikace úlohy
2.
Komfort realizace PC v podobě elektrického obvodu čili jiným
způsobem. 3.
Algoritmem studia: některé algoritmy ukládají omezení pro typ
funkce aktivace, je nutno je respektovat. Nejčastěji typ nelineárnosti neposkytuje principiální vliv na řešení úlohy. Rovněž vydařený výběr může zkrátit čas cvičení několikanásobně. Určené modely neuronu 1.
Výpočty výstupu neuronu jsou okamžité, nezpůsobují zdržení.
Bezprostředně modelovat dynamické systémy, mající „vnitřní stavbu“ s pomocí takových neuronů nelze. 2.
V modelu chybějí nervové impulzy. Není modulace úrovně signálu
hustotou impulzů jako v nervovém systému. Nejeví se efekty synchronizace, pokud shluky neuronů zpracovávají informaci synchronně, řízené periodickými vlnami vybuzení brzdění. 3.
Nejsou výrazné algoritmy pro výběr funkce aktivace.
32
Zajencev I.V. Neuronové sítě: základní modely. Učební pomůcka pro kurz „Neuronové sítě“ pro studenty 5 kurzu magisterského studia katedry elektroniky fyzikální fakulty Voroněžské Státní univerzity. - Voroněž, 1999,str.23
51
Příloha č.1 4.
Nejsou mechanizmy regulující celkovou práci sítě (příklad –
hormonální regulace aktivity v biologických nervových sítích). 5.
Nadměrný formalizmus pojmů: „práh“, „váhové koeficienty“. V
reálných neuronech není číselný práh, tento se mění dynamicky v závislosti na aktivitě neuronu a celkového stavu sítě. Váhové koeficienty synapsí také nejsou stálé. „Živé“ synapse se vyznačují plastičností a stabilitou: váhové koeficienty se nastavují v závislosti na signálech, procházejících synapsí. 6.
Existuje veliká různost biologických synapsí. Střetávají se v různých
částech buňky a plní různé funkce. Brzdění a buzení synapse realizují podle určitého modelu ve tvaru váhových koeficientů opačného znaménka, ale různost synapsí se tím neomezuje. Dendro – dendritní, axo – axonální synapse se nerealizují v modelu FN. 7.
V modelu se nepátrá po rozdílu mezi graduálními potenciály a
nervovými impulzy. Libovolný signál je zobrazen formou čísla.
52
Příloha č. 2
Práce vícevrstvového perceptronu Práce vícevrstvového perceptronu (VVP) je opsána vzorci:
Kde indexem i vždycky budeme označovat číslo vstupu, j – číslo neuronu ve vrstvě, l - číslo vrstvy. xijl – vstupní signál j-neuronu ve vrstvě 1; wijl – váhový koeficient i-tého vstupu neuronu vstupu číslo j ve vrstvě 1; NETjl – signál j-tého neuronu ve vrstvě 1; OUTjl – výstupní signál neuronu; θjl – prahová úroveň neuronu j ve vrstvě 1;
Uvedeme označení: wjl – vektor sloupců vah pro všechny vstupy neuronu j ve vrstvě 1; Wl – matrice vah neuronů ve vrstvě 1. Ve sloupcích matrice jsou umístěny vektory wjl. Analogicky xjl – vstupní vektor – sloupec vrstvy 1. Každá vrstva vypočítává nelineární přeměnu z lineární kombinace signálů předcházející vrstvy. Odtud vidíme, že lineární funkce aktivace se může používat jenom pro ty modely sítí, kde není potřeba posloupné spojení vrstev jedné za druhou. Pro vícevrstvové sítě funkce aktivace musí být nelineární, jinak je možno postavit ekvivalentní jednovrstvovou síť a vícevrstvost není nutná. Pokud je použitá lineární funkce aktivace, tak každá vrstva bude dávat na výstupu lineární kombinaci vstupů. Další vrstva dá lineární kombinaci výstupů předcházející, ale to je ekvivalentní jedné lineární kombinaci s jinými koeficienty, a může být realizována ve formě jedné vrstvy neuronů. Vícevrstvová síť může formovat na výstupu libovolnou vícerozměrnou funkci při odpovídajícím výběru množství vrstev, rozsahu změn signálů a parametrů neuronů. Jako i řady jsou vícevrstvové sítě univerzálním instrumentem aproximace funkcí. Je vidět odlišnost práce neuronové sítě od rozkladu funkce v řadu:
53
Příloha č. 2
Řada:
Neuronová síť
Na
úkor
postupného
vyčíslení
lineárních
kombinací
a
nelineárních
transformací se dociluje aproximace libovolné vícerozměrové funkce při odpovídajícím výběru parametrů sítě.
54