In: Kognice a umělý život V (J. Kelemen a kol., sest.). Slezská univerzita, Opava, 2005, s. 195-216
Kouzlo a síla interakce1 Jana Horáková* a Jozef Kelemen** *Ústav pro studium divadla a interaktivních médií Masarykova univerzita, Brno **Ústav informatiky, Slezská univerzita, Opava a Gratex International, a. s., Bratislava E-mail:
[email protected],
[email protected] Abstrakt: Příspěvek načrtává některá východiska a vyústění uměleckého a vědeckého zájmu o interaktivitu v souvislosti se vztahem člověka a stroje v interaktivním umění, v teoretické informatice a v kognitivní vědě.
1. Úvod Tato studie je volným pokračováním v úvahách z (Horáková, Kelemen, 2004) o vývoji a vzájemném ovlivňování různých idejí stroje majících svůj původ v různých etapách a v různých oblastech vývoje evropské kultury, počínaje mytologií, přes mechaniku 17. a 18. století, až po divadlo, techniku a ryze matematické výzkumy výpočtů a počítačů a zkoumání hranic možností jejich využití ve 20. století a v současnosti. V (Horáková, Kelemen, 2004) jsme naznačili, jak mohla v evropském kulturním kontextu a v konkrétní evropské společenské, politické a umělecké situaci na začátku 20. století vzniknout – díky dílu bratří Čapků – představa robota. Připomněli jsme, jaká tato původní představa byla a jako se původní podoba robotů díky putování divadelní hry R. U. R. světem postupně měnila v závislosti na místě její inscenace. Článek (Horáková 2004a) je věnován prostorové analýze hry R. U. R.. Ukazuje, jak neobvyklá formální kompozice umožnila autorovi tematizovat ve hře dobovou vlnu sociálních nepokojů, živených společensko-reformními vizemi a ideologiemi, a současně postavit proti aktuálnímu motivickému plánu argumenty v podobě poukazů k věčně distančnímu – někdy dialogickému, ale často i konfliktnímu – vztahu mezi tím, co nazýváme realitou, a jiným, ideálním místem, místem utopií. Tak jako Čapek dává ve hře R. U. R. až kubistickým způsobem do vzájemných vztahů různé prostory (prostor utopie a prostor reality moderní společnosti), dostávají se ve hře do konfrontace také dva póly postavy robota: S reálnou politickou situací související metafora odcizeného, zmechanizovaného a simplifikovaného dělníka jako produktu továrního systému na jedné straně. Na druhé straně utopická představa umělého člověka – ideálního sluhy a nástroje, uskutečnění prvku utopické společnosti, jak se s ní setkáme v celé historii naší civilizace, v moderní industriální společnosti ovšem uměle vyráběného v továrně. Umělí dělníci se v díle bratří Čapků nejdříve presentují jako 1
Vznik tohoto článku byl částečně podpořen granty GAČR č. 408/04/1370 a 201/04/0528.
roboti-dělníci (v jejich společné povídce Systém z roku 1908). V samotné hře R. U. R. pak nejdříve jako roboti-stroje, které se postupně vyvinou v jakýsi nový druh života, jak se o tom podrobněji zmiňujeme v (Horáková, 2004b). Taková představa robota pak nemohla pochopitelně nechat nevšímavými ani specialisty, kteří se vyzbrojeni zkušeností s překvapivě dovednými stroji – s počítači – dali na hledání cest jako dovednost těchto strojů ve zpracování informací zvýšit a vložit je coby umělé, hardwarové mozky (nebo softwarové mysli) do ocelových těl silných člověku podobných strojů. Oblast zájmu těchto nadšenců pojmenoval Isaac Asimov v roce 1942 v povídce Runaround slovem robotics2, které se objevuje v češtině jako robotika.
2. Stroj jako interaktivní médium Stroj se v dějinách kultury stal nejen metaforickou pomůckou pro literární, divadelní nebo kinematografickou tematizaci určitých společenských jevů, problémů, názorů, hodnot a estetických koncepcí. Stal se i něčím jiným – stal se médiem na poli umění, zejména v oblasti tvorby výtvarných objektů založených na reálném pohybu, tzv. mobilů (třeba v tvorbě Alexandra Caldera, Jeana Tinguelyho, ale již v části tvorby Marcela Duchampa). V díle mnoha výtvarníků se setkáváme s chápáním stroje jako autonomního mechanismu, se kterým můžeme vstupovat do interakce za účelem vytvoření uměleckého zážitku. Pokusíme se nastínit, jak stroj obstál v této roli Obecně platí, že informace může nabýt smyslu jenom tehdy, když existuje médium, které je schopné ji interpretovat. Interpretace pak může proběhnout jenom v případě, když dojde k interakci mezi zdrojem a adresátem informace. Přitom je nepodstatné, jeli adresátem resp. zdrojem informace uměle vytvořený nebo přirozený systém, člověk, jiná živá bytost nebo stroj. Z tohoto obecného faktu plyne, že interakce adresáta s uměleckým dílem je i v oblasti umělecké komunikace asi stejně starým jevem, jako umění samo. Bez toho, aby artefakt oslovil, nestane se uměleckým dílem.3 Na druhé straně si jenom stěží – je otázkou zda vůbec! – dovedeme představit artefakt oslovující důsledně pasivního adresáta. Na obraz se musíme dívat, knihu musíme číst, kolem sochy se musíme projít. Musíme být aktivní, chceme-li, aby nás tyto artefakty nějak oslovovaly. Definice interaktivního umění jako části umění, která nějakým způsobem zahrnuje pozorovatele… (kterou poskytuje např. internetová encyklopedie www.wikipedia.org) se tedy může zdát málo výstižná. Vždyť součástí porozumění každému uměleckému dílu je jeho adresát4. Definice možná získá na své výstižnosti, přidáme-li k požadavku zahrnování pozorovatele uměleckým dílem požadavek přímé intervence pozorovatele do uměleckého díla. Socha se tím, že jí obcházím, pro jiného, který jí obchází spolu se mnou, nestává jinou. Interaktivní umělecké dílo by se tím, že zahrne adresáta, jiným stát mělo i pro jiného adresáta, a to právě díky intervenci do něj. 2
Povídku pak zařadil jako v pořadí druhou do své později proslulé sbírky I, Robot (1950). V českém překladu (1981) se slovo robotika vyskytuje na s. 41. 3 Podrobněji o sémiotických aspektech uměleckých děl viz např. (Eco, 2004). 4 Toto je velice obecný sémiotický princip, uplatňující se i daleko za hranicemi umění. V souvislosti s funkcí genetického kódu pro utváření se organizmu a počítačového softwaru pro výkon jím řízeného robota o něm píšeme např. v (Markoš, Kelemen, 2004).
Obr. 1: Mobily A. Caldera (Jižní kříž) a J. Tinguelyho (Fatamorgána).
Tak se dostáváme k hledání vymezení toho, co pokládat za interaktivní médium. Je to takové médium, které je přiměřené intervencím. Intervencí by samozřejmě bylo třeba mlácení kladivem do Piety (což se žel stalo), Michelangelo však své sochy nepokládal za interaktivní umělecká díla ve smyslu našeho vymezení a tudíž mohl k jejich ztvárnění použít jako materiál mramor. Pokus o interakci s touto sochou se tak neproměnil ani v myslích nejavantgardnějších teoretiků umění ve formu uměleckého sebevyjádření, kladoucího důraz na živé předvedení děje, tedy v performanci, ani v tzv. event, který ani nevyžaduje nevyhnutně realizaci děje před publikem, ale zůstal tím, čím je v očích každého soudného kulturního Evropana – odsouzeníhodným činem psychopata. Na druhé straně i banální počítačová hra interaktivním (snad ne vždy a nevyhnutně i uměleckým) dílem je, a to i proto, že po svých intervencích ji adresát (hráč) může dle své libovůle nechat ve stavu do jakého se hra dostala, nebo znovu restartovat v původním stavu. Dovedeme naštěstí intuitivně rozeznávat, co je a co není interaktivní médium. Je to zřejmě takové médium, které se hodí k vytváření uměleckých děl určených pro interaktivní intervence a současně tematizujících v sobě tuto interaktivnost a zákonitosti interaktivních médií. V protikladu k tradiční představě uměleckého díla jako jedinečného a neopakovatelného objektu a k chápání umělce jako geniálního tvůrce, staví umění využívající interaktivní média – interaktivní umění – zcela protikladné principy: takové umělecké dílo má potencionálně nekonečnou řadu podob, které nabývá skrze interaktivitu. Proti jedinému autorovi staví kolektivní, kolaborativní autorství. Tyto principy, které jsou analogické anti-uměleckému hnutí 60. let, nejsou pouhou deklarací určitých preferencí umělců, nýbrž vycházejí ze samotných principů tvořících základ interaktivního (digitálního) média jak je analyzuje americký umělec a teoretik nových médií Lev Manovich (2001). V prostředí interaktivních digitálních médií můžeme vysledovat od 2. světové války paralelní tendence s vývojem moderního umění. Tento paralelismus změnil vztah mezi uměním a technologií. V posledních několika desetiletích 20. století technologie interaktivních médií realizovaly některé klíčové vize a projekty moderního umění přibližně ve stejné době, kdy byly tyto vize formulovány. Výsledkem je, že nové technologie – interaktivní digitální média – se samy staly nejúžasnějším uměleckým dílem dneška. Nejrozšířenějším dílem interaktivního umění je z tohoto hlediska interface člověk-počítač. Paralelismus vývoje umění a interaktivních médií zahrnuje nejen myšlenky, ale i formy, v kterých jsou tyto myšlenky sdělovány. Ve 20. století umělci charakteristicky prezentovali své myšlenky buď psaním manifestů nebo vytvářením aktuálních uměleckých děl. V případě počítačových expertů máme k dispozici buď teoretické články, které rozvíjejí návrhy konkrétních softwarů nebo/a hardwarů (což jsou jakési analogie k manifestům), nebo více popisné články o již vytvořených prototypech nebo již fungujících systémech (což můžeme chápat jako pandant k aktuální umělecké tvorbě). Jednoduchým, současně však výjimečně podmanivým příkladem použití interaktivního média byl projekt Kinoautomat Radúze Činčery, žnoucí obrovský a zasloužený úspěch na světové výstavě Expo ’67 v kanadském Montrealu. Šlo o filmový příběh s nádechem černého humoru postavený na sérii flashbacků muže, který se činí zodpovědným za požár svého bytu. Po každé ucelenější sekvenci filmu se před plátnem objevila osoba a požádala diváky, aby hlasovali o tom, jakým ze dvou nabízených možností má příběh
pokračovat. Hlasovalo se tlačítky spojenými se zelenými a červenými světly obklopujícími promítací plátno. Výsledek hlasování byl takto viditelný a většina rozhodla o pokračování děje, který uskutečňoval kino-operatér obsluhující dvě synchronizované promítací aparatury. Děj se však ve skutečnosti nevětvil jako binární strom. Jakkoli se totiž diváci rozhodli, k následujícímu hlasování došlo v situaci, která byla stejná pro obě dříve volitelné alternativní pokračování. Zážitek aktivní spoluúčasti na vývoji děje, který měli zakoušet diváci v hledišti, se tak jeví jako iluzorní důsledek spíše triku než jako projev aktivní participace na podobě zážitku. Technicky bylo celé představení realizováno bez použití počítače. Ty byly v časech Kinoautomatu ještě pro takovéto použití příliš veliké a (zejména v československých podmínkách) příliš nákladné. Nic to však nemění na skutečnosti, že někteří teoretici umění interaktivních médií, jmenovitě např. Michael Naimark (1998), pokládají Kinoautomat za jedno z doposud nejzdařilejších děl v této oblasti.
Obr. 2: Pohled na Kinoautomat.
a
b
Obr. 3: Zdánlivý (a) a skutečný (b) výsledek posloupnosti tří demokratických voleb v Kinoautomatu.
Počítač se stal poprvé nástrojem interaktivního uměleckého projevu pravděpodobně v díle Američana Myrona Kruegera, který začal v roce 1969 se svými spolupracovníky na Wisconsinské univerzitě vytvářet interaktivní dílo Glowflow. Bylo to prostředí místnosti, ve které snímaly pohyb návštěvníků senzory vbudované do podlahy a citlivé na tlak. V rozích místnosti byly umístěny reproduktory a po stěnách trubice naplněné suspenzemi různých barev. Pohyb návštěvníků byl vyhodnocován počítačem a výsledky vyhodnocení rozhodovaly o tom, jaké zvuky budou vydávat reproduktory a které trubice se rozsvítí5.
3. Kouzlo interakce Pokoušíme-li se postihnout, co dává interaktivním uměleckým projektům nebo dílům jejich zvláštní působivost, čím nás oslovují, co jim dává jejich zvláštní kouzlo, možná mnozí budeme souhlasit s tím, že je to právě jejich připravenost k interakcím s námi. Je to jejich specifická „neukončenost“, nebo „neuzavřenost“, která je neustálým příslibem, že se v rámci interakce adresáta s dílem může něco nepředvídatelně „přihodit“, že může každý adresát zažít individuální a možná nikdy jindy se již nevynořící zážitek, který právě svou jedinečností může v konkrétním pozorovateli vyvolat zcela individuální estetické, etické, emotivní, nebo kognitivní prožitky. Jako příklad uvedeme "starý ale dobrý" interaktivní video-projekt Američana Bena Pipera, se kterým jsem se setkali na retrospektivní výběrové výstavě video-umění Origins v galerii Art Interactive v massachusettském Cambridge ve dnech 26. 4. - 6. 7. 2003, v rámci Bostonského festivalu kyberumění: Kamera snímá na bílém pozadí se pohybující postavy pozorující obrazovku, na kterou se snímané sekvence promítají. Náhodně vybírané sekvence jsou pak viditelné spolu s právě aktuálními. Čím delší dobu je sekvence uchovávána v paměti, tím je "slabší", až se stane "neviditelnou". Celá instalace funguje tedy jako jakási “paměť”, která pomalu ale jistě “zapomíná”, a současně jako jakýsi prostor imaginace, podobný prostoru naší mysli, odpoutaný od zákonitostí konsensuálního času našeho tzv. reálného světa, ve kterém se mohou propojit záznamy prožitků, obrazy osob, které by se v rámci omezení kauzální příčinnosti časoprostoru, ve které žijeme, nikdy nemohly setkat... Jiným dobrým příkladem interaktivní instalace je projektu A-Volve Christy Sommererové a Laurenta Mignonneaua s vodní hladinou, pod kterou je instalována obrazovka počítače s živým rybám podobnými virtuálními kreaturami a technické zařízení na zjištění poloh předmětů ponořených do vody. Kreatury mají individuální chování, v jehož rámci reagují na adresátovy pohyby rukou ponořenou do vody nad obrazovkou. Vzniká dokonalá iluze interakce kreatur s pozorovatelem. Systém umožňuje si kreatury i vytvářet dle vlastních figurativních a behaviorálních představ a interagovat pak i s vlastními výtvory6. Interakce s A-Volve jsme měli možnost vychutnat v září 2000, v rámci specializovaného tutoriálu Christy Sommererové na konferenci ALIFE VII v oregonském Portlandu na tamní Reed College.
5
Více o zkušenostech M. Kruegera s projektem Glowflow viz v (Krueger, 2003).
6
Umělěcko-kritický rozbor a hodnocení projektu A-Volve nabízí (Whitelaw, 2004, s. 64-71).
V současnosti se nové způsoby interakcí lidí s strojů stávají předmětem výzkumu v oblasti vývoje tzv. zábavné elektroniky s prvky pokročilé robotiky nebo umělého života. Zde se touto problematikou podrobněji nebudeme zabývat, čtenáře odkazujeme na (Brooks, 2002) nebo (Dorin, 2004).
Obr. 4: Interakce v rámci projektu A-Volve.
4. Kognitivní věda Fakt, že se ze stroje stalo médium interagující s člověkem, představuje výzvu nejenom pro ty, kdo stroje resp. možnosti jejich interakce s lidmi využívají jako prostředek pro zkvalitnění některých lidských činností, schopností nebo prožitků, nýbrž i pro ty, kteří zkoumají a uskutečňují možnosti a způsoby zdokonalování strojů. Podstatným však pro nás teď bude třetí pohled – pohled těch, kteří hledají způsob, jak zkoumat interakce stroje a člověka tak, abychom se pokud možná nejméně soustřeďovali na odlišnosti mezi člověkem a strojem a co nejvíce zdůrazňovali, co je v rámci jejich interakcí spojuje nebo může spojovat. Takto se člověk, stroj a jejich interakce stávají předmětem kognitivní vědy. V průběhu druhé poloviny 20. století se důležitou oblastí zdokonalování strojů stalo – jak jsme se o tom již zmínili – jejich přibližování schopnostem a dovednostem člověka, zejména v oblasti umělé inteligence a pokročilé robotiky. V těchto oblastech jsme svědky postupného přijetí základního předpokladu dialogu, tedy uspokojující interakce člověka a stroje, kterým je přijmutí autonomie partnera v dialogu a tedy i připuštění autonomie inteligence stroje. Problém jak odstranit propast mezi strojem a člověkem však zřejmě nemůže být řešen pouze zdokonalováním strojů, nýbrž musí být veden
z obou stran. To znamená, že i vlastnosti člověka musí být podrobeny novému druhu zkoumání. Takovéto zkoumání musí být vedeno tak, aby umožňovalo vyjadřovat se o lidských schopnostech a dovednostech a o dovednostech a schopnostech strojů ve stejném pojmovém rámci. Znovu se tak dostáváme na pozici, kterou vhodně vymezuje kognitivní věda. Vlastní introspekce každého z nás a výsledky některých výzkumů psychologie, logiky, některých odnoží filozofie a snad i dalších oblastí vědy nás přesvědčují, že člověk je bytost, která si kdesi ve svém vnitřku vytváří modely svého prostředí, a že jeho chování tudíž můžeme chápat nejenom jako jeho přímé reakce na vnější podněty, nýbrž i na tyto vnitřní modely. Osvojení si tohoto přesvědčení přivedlo v oblasti vědeckého zájmu o kognitivnost k výzkumné aktivitě, která se zvykne označovat jako první kognitivní revoluce. V následujících – především filozofických – diskusích o tom, co na poli autonomní racionality a kognitivnost dokáží lidé a co (ne)dokáží stroje, se postupně zpřesňovaly významy několika klíčových pojmů, se kterými se v těchto diskusích operovalo. Především se zpřesňoval význam pojmu stroj, ale i pojmů jako inteligence, racionalita, poznatek a jeho reprezentace, uvažování, učení (se) a v současnosti dokonce i pojmů jako socializace nebo emotivita. Mnohé z toho, co se v umělé inteligenci a v oblasti pokročilé robotiky podařilo částečně přetransformovat do podoby technicky fungujících a aplikovatelných řešení, mělo svůj původ či alespoň inspiraci ve výsledcích výzkumu nejen matematiků, logiků a informatiků, nýbrž i kognitivních a inženýrských psychologů, lingvistů a z nezanedbatelné části i úvah filozofů. Vlivem výpočetní techniky a teorie, která se rozvinula v druhé polovině minulého století kolem výpočtů, a také některých úvah vedených v oblasti filozofie mysli došlo k tzv. druhé kognitivní revoluci, charakterizované nejlépe právě vznikem a rozvojem kognitivní vědy7. Zřetelně se kognitivní věda začala z výzkumů umělé inteligence vyčleňovat ve druhé polovině minulého století. V té době koexistovaly v umělé inteligenci dva směry, které se zdály být nesmiřitelné a které nejlépe charakterizují aktivity v oblasti automatického dokazování logických teorémů na jedné straně a aktivity v oblasti napodobování psychických procesů předpokládaných při řešení problémů u člověka. Klasickým příkladem úspěšného projektu „psychologického“ směru byly aktivity kolektivu proměnlivého složení seskupeného kolem dvou vůdčích osobností – Herberta A. Simona a Allena Newella – zaměřené na výpočetně uskutečnitelné (programovatelné) postupy řešení problémů. Představa o tom, co jsou vlastně problémy a „mechanizmus“ nacházení jejich řešení, kterou postupně výpočetně realizovali, je ve stručnosti následující: Problém se nám objevuje, je-li stav C, který si přejeme dosáhnout, odlišný od stavu E, který právě existuje. Tuto odlišnost si uvědomujeme tak, že si uvědomíme konečný počet, třeba n, různých diferencí D(C,E) = {d1(C,E), d2(C,E), … dn(C,E)} mezi stavy C 7
Úvod do takto chápané kognitivní vědy nabízí vysokoškolská učebnice (Thagard, 2001).
a E. (Neexistují-li mezi dvěma stavy žádné diference, pak jsou z hlediska našeho problému nerozlišitelné.) Intuitivně cítíme, že ne všechny rozdíly mají stejnou důležitost. Proto budeme předpokládat, že z množiny D(C,E) můžeme vždy jednoznačně vybrat tu nejdůležitější odlišnost, kterou (pro stavy C a E) označíme dnej(C,E). K ničemu by nám však byla jakkoliv precizní znalost problémů a odlišností mezi dvojicemi stavů, kterými jsou problémy určeny, kdybychom neměli možnost se určitými operacemi dostávat postupně do stavů, které budou stále méně odlišné od cílového stavu. Budeme tedy předpokládat, že máme k dispozici konečnou množinu takovýchto operací F = {f1, f2, … fm}, kde libovolná operace fi z F je z matematického hlediska funkce (přiřazuje tedy danému stavu, na který je aplikována, jediný nový stav, který vznikne její aplikací). Řešení problému je pak konečná posloupnost operací z F, které krok za krokem transformují počáteční stav E na cílový stav C. Jak takovou postupnost najít? Uvědomíme-li si, že konečných posloupností sestavených z jediného prvku je nekonečně mnoho, přirozeně se nabízí otázka, jak z tohoto množství nějak „mechanicky“ (a v poměrně krátkém čase) vybrat právě tu posloupnost, která je řešením našeho problému. Jak asi postupujeme my, lidé? V našich myslích jsou operace, které známe a umíme vykonat, spjaté s příslušnými odlišnostmi. Poznáme-li odlišnost dnej(X,Y) stavů X a Y, pak k ní najdeme operaci z F, která je schopna ji redukovat. Víme třeba, že krátkou vzdálenost překonáme chůzí, několikakilometrovou ve městech městskou dopravou, několikasetkilometrovou vlakem, a mezikontinentální letadlem. Sedí-li jeden z nás, když píše tyto řádky, v pokoji hotelu Tremont v bostonské divadelní čtvrti a řeší-li problém, jak se dostat domů na adresu svého bydliště, vynoří se mu řada odlišností, ze kterých (protože má s řešením problémů kolem cestování určité zkušenosti!) jako nejdůležitější odlišnost, tedy dnej(Boston-hotel, doma) vybere mezikontinentální vzdálenost (a nezabývá se třeba tím, využije-li z vlakového nádraží ve svém městě domů na adresu svého bydliště městskou dopravu, taxík, nebo půjde-li pěšky i když i tato odlišnost mezi stavem, ve kterém je, a tím, ve kterém chce být, existuje a bude jí jednou zapotřebí odstranit). Na základě zkušeností však ví, že by ho tato úvaha odvedla od efektivního řešení problému. Jako operátor k eliminaci nejdůležitější odlišnosti se mu v jeho mysli vynoří let letadlem. Takovouto znalost je možné vyjádřit tabulkou, dávající do souvislosti odlišnosti a operace schopné je odstraňovat. Pak stačí pokusit se vybraný operátor aplikovat na stav, ve kterém se právě nacházíme, nebo si stanovit – postupujíc podle jedné z představ kognitivních psychologů o podobě obecné strategii, které se při hledání řešení problémů přidržují lidé – nový problém: dostat se použijíc znovu stejný mechanismus, jaký jsme doposud popisovali, do takového stavu, ve kterém je výše zvolený operátor aplikovatelný. Popsaný obecný postup řešení problémů je výpočetně realizovatelný a stal se základem k vytvoření systému pro automatické řešení problémů, známého v literatuře o umělé inteligenci jako systém GPS (z angl. General Problem Solver). Jeho specifikou je, že pro řešení konkrétního typu problémů se do něj vždy dostane i „kousek“ ze zkušeností toho, kdo ho programuje. Je na programátorovi, jak popíše stavy, jak zvolí odlišnosti, které se rozhodne si všímat a jak je uspořádá, jaké operátory si zvolí a jak bude vypadat tabulka odlišností a operátorů. Proto se GPS stalo výpočtově realizovaným systémem,
který umožnil psychologům experimentovat s jejich hypotézami, a stal se tak první vlaštovkou v oblasti rozvoje kognitivní vědy; viz např. (Newell, Simon, 1972)8.
5. Kooperace a komunikace Systém GPS ztělesňoval něco z našich představ o tom, jak přemýšlíme. Jedna okolnost, kterou neztělesňoval, byla lidmi při řešení problémů obvykle hojně využívaná možnost – možnost ptát se zkušenějších, možnost interakce a komunikace s jinými řešiteli problémů v zájmu vyřešení individuálního problému. Druhou okolností, při konstrukci GPS zcela ignorovanou bylo, že problémy většinou úspěšně řeší kolektivy lidí, které mohou být tvořeny různými specialisty pro řešení různých typů podproblémů a mohou být v čase proměnlivé. Řešení problému pak vzniká rozkladem původního problému a řešením jednodušších problémů, jeho přesouváním jiným týmům specialistů, tedy využitím kooperace. Takovéto představy však samozřejmě nezůstaly rozvojem kognitivní vědy nereflektovány a byly zahrnuty do širšího diskurzu decentralizace. Poprvé se idea decentralizace objevila implicitně u snah napodobit neuronovou architekturu přirozené nervové soustavy v naději, že chování takovéto napodobeniny bude podobné chování originálu. V čase svých studií na Princetonské univerzitě se začal seznamovat s tehdy intelektuálně mimořádně vzrušující interdisciplinární oblastí – s kybernetikou – i jeden z pozdějších průkopníků umělé inteligence a kognitivní vědy – Marvin Minsky. V Cambridgi (Mass.) se na seminářích Norberta Wienera často a mnoho diskutovalo o problematice neuronů a neuronových sítí, o možnostech jejich matematicky precizního popisu a technického napodobení9. Inspirován částečně i těmito diskusemi sestavil v roce 1951 Minsky první umělou neurální síť schopnou učit se a nazval ji SNARC (z angl. Stochastic Neural-Analog Reinforcement Computer). Dnes je potřebné zvlášť zdůraznit, že šlo o hardwarovou realizaci jednotlivých neuronů i celé sítě, ne o počítačovou digitální simulaci nebo emulaci. V srpnu 1956 se Minsky účastnil, spolu např. s Herbertem Simonem a Allenem Newellem, dnes již proslulého semináře na Darthmouth College v Hanoveru (stát New Hempshire, USA). Byl to první seminář věnovaný problematice oblasti, která právě tam dostala svůj – jak se později ukázalo poněkud provokativní – název umělá inteligence. Na tomto setkání mladých nadšenců, kteří měli do té doby umělou inteligenci spíše za koníčka, než za seriozní vědeckou a technickou disciplínu, navíc se jí zabývali izolovaně, znamenal seminář nejenom konstituci jejich oboru a jeho profesionalizaci, nýbrž i možnost začít s koordinovanými aktivitami. Minsky distribuoval na setkání první verzi své sumarizace dosavadních pokusů programovat počítače tak, aby bylo jejich chování k nerozeznání od inteligentního chování lidí. Načrtl i svou vizi, co a jak dělat v nově vzniklé oblasti. Rozvoj umělé inteligence byl pak po celá 60. léta minulého století výrazně ovlivněn touto statí, publikované jako Steps Towards Artificial Intelligence v prvním knižním sborníku z umělé inteligence (Feigenbaum, Feldman, 1963).
8
Monografické zpracování ucelenější teorie kognitivnosti, která má svoje počátky v experimentech se systémem GPS, představuje (Newell, 1990). 9 Působivou a obsažnou intelektuální biografií N. Wienera je (Conway, Siegelman, 2005).
Vedle dominující představy, že mysl je možné technicky dostatečně výstižně popsat jako soustavu procedur zpracovávajících vhodné struktury symbolů (vhodně strukturovaná data), žilo v 60. letech minulého století i to, čím se Minsky zabýval na počátku své vědecké kariéry – touha vytvořit technickou napodobeninu mozku jako struktury sestávající z neuronů, tedy síť z umělých neuronů. První zkušenosti s takovými sítěmi byly vesměs povzbudivé. To mělo za následek nekritický růst nadšení pro jejich konstrukci i pro finanční podporu příslušných projektů. V pozadí vládnoucí univerzalistické představy spojené s umělými neuronovými sítěmi bylo přesvědčení, že každý smysly vnímatelný celek lze rekonstruovat výlučně na základě lokálního pozorování jeho částí. Například k tomu, abychom rozeznali znak 2 od znaku 10, že postačují lokální vzruchy nervových zakončení na sítnici oka, které vyvolá dopadající světlo, když se na tyto znaky díváme. Minsky se svým kolegou z Laboratoře umělé inteligence MIT Seymourem Papertem podrobili tuto zjednodušující představu kritice ve společné monografii (Minsky, Papert, 1969). Položili si otázku, jestli lze pravdivost libovolného tvrzení o geometrických objektech zjistit pomocí dané umělé neuronové sítě. Třeba tvrzení „obrazec jde nakreslit jedním tahem“ (tedy bez toho, abychom museli zvednou tužku z papíru). Obrázek 5 ukazuje, že to nejde! Pozorujme lokálně (třeba jenom v šesti segmentech) papír se znakem 2 (obr. 5, a). Rozstříhejme papír s dvojkou na šest kousků, které odpovídají pozorováním v jednotlivých segmentech. Vzniklé kousky papíru (obr. 5, b) teď obsahují výsledky našich lokálních pozorování, informace o původním obraze se z nich však vytratila: Jde z nich sestavit mnoho jiných obrázků, třeba i takový znak, který jedním tahem nakreslit nejde (obr. 5, c). V mnohem obecnější podobě matematicky exaktně dokázali, že v daném typu neuronových sítí nelze zjistit pravdivost libovolného tvrzení.
a
b
c
Obr. 5: Ilustrace problému (ne)rekonstruovatelnosti celku z izolovaných dat.
O tom je kniha (Minsky, Papert, 1969). Záhy vyvolala pozitivní ohlas, ale i nepřiměřeně negativní reakce. Mnozí jí (a její autorům) přiřkli podíl na tom, že přestala masivní finanční podpora výzkumu umělých neuronových sítí. Přitom se tak trochu zapomnělo na to, že ani počítače nejsou při řešení problémů úplně všemocné. Teoretickým informatikům je přeci již od konce 30. let minulého století důvěrně známý pojem nevypočitatelnosti a v matematice lze najít příklady nevypočitatelných funkcí. O těchto limitech se samozřejmě zmínil i Minsky již v učebnici (Minsky, 1967). S vývojem počítačů se však nepřestalo. Reakce na odhalení limitů umělých neuronových sítí byla odlišná, na SNARC si nikdo nevzpomněl a Minsky získal pověst hrobaře výzkumu
umělých neuronových sítí. Téma se do umělé inteligence plnokrevně vrátilo až v průběhu 80. let v obecnější podobě tzv. konekcionismu. Uvedený příklad dokládá, co je každému programátorovi jasné: Při počítání s daty hrají struktury, v jakých je ukládáme do pamětí počítačů, podstatnou roli. Uložíme-li vstupní údaj z obr. 5 (a) do počítače v podobě množiny údajů viditelných na obr. 5 (b), sebedokonalejším výpočtem již nikdy nezjistíme, byl-li výchozí obrázek takový, jako na obr. 5 (a) nebo třeba takový, jaký je vidět na obr. 5 (c). Rozvoj umělé inteligence v 70. letech minulého století byl ve znamení úsilí najít tu nejvhodnější strukturu, v jaké je nejpřiměřenější ukládat do pamětí počítačů specifická data, kterým – jsou-li uloženy v myslích lidí – říkáme jejich poznatky. Řešení tohoto problému – problému reprezentace poznatků – bylo ve významné míře aktualizováno úvahou, kterou Minsky pod názvem Matter, Mind, and Models publikoval v jím sestaveném knižním sborníku (Minsky, 1968, s. 425-432). Sborník je prvním publikačním výstupem problematizujícím původní spoléhání se výzkumníků v oblasti umělé inteligence na „hrubou sílu“ stále výkonnějších počítačů a na hypotézu inteligence jako jediného integrálního principu řídícího (lidské) jednání. Tajemství inteligence jsme přestali hledat v podobě univerzální výpočetní procedury a svůj zájem jsme začali přesouvat k mnohotvárnosti inteligence. To vedlo ke hledání specifických reprezentačních struktur pro zapamatování poznatků a specifických souborů procedur pro jednotlivé intelektuální aktivity (např. pro porozumění přirozenému jazyku, plánování postupů, řešení problémů, vidění). Za vyvrcholení snahy, která dominovala umělé inteligenci 70. let minulého století – najít pokud možno univerzální a efektivně zpracovatelné struktury reprezentace poznatků, můžeme bez rozpaků pokládat návrh tzv. rámcové (frame) reprezentace. Minsky jí předložil v roce 1974 jako technickou zprávu Laboratoře umělé inteligence MIT s názvem Frame Systems – A Framework for Representing Knowledge. Návrh okamžitě zaujal specialisty na problematiku reprezentace poznatků a široké pozornosti komunity pracující v umělé inteligenci se mu dostalo poté, co ji Patrick H. Winston zahrnul do proslulého sborníku (Winston, 1975, s. 211-277). Minsky navrhl ve zmíněné studii mnohem komplexnější, tzv. tvarovou (gestalt) psychologií motivované chápání toho, co jsou a jak jsou asi v mysli organizovány poznatky, než to bylo do té doby v umělé inteligenci obvyklé. Kromě pamatování vztahů mezi reprezentovanými entitami – např. sousedností obrázků (b), na které se na obr. 13 rozložil obrázek (a) – upozornil na důležitost reprezentace různých očekávání, které pokládal za atributy poznatků (třeba bychom při rekonstrukci (a) z (b) mohli předpokládat, že výsledkem má být jedna arabská číslice). Živou reakci v kruzích logiků vyvolala ta část jeho studie, ve které podrobil nelítostné kritice monotónnost tradičních logických systémů. Za principiální vlastnost inteligence pokládá nemonotónnost lidského uvažování: naše mysl je výjimečná právě tím, že se dokážeme zříct včera odvozených pravd a nahradit je těmi, které jsme odvodili dnes. V monotonní logice však zůstává dokázána pravda již navždy pravdou a logické kalkuly dlouho nenabízely způsob, který by na tomto cokoli změnil. Až toto kritika přivedla uvnitř logiky ke studiu různých nemonotónních formálních systémů. V oblasti informatiky se návrhy tzv.
rámcové reprezentace poznatků zřetelně promítly např. do prostředků a metodiky objektového programování. V 80. letech minulého století se začala prosazovat snaha inspirovat se při volbě architektury inteligentních strojů předpokládanou architekturou lidské mysli jakožto vysoce decentralizovaného resp. distribuovaného systému. Částečně to znamenalo renesanci výzkumu neuronových sítí, vždyť tento názor je rozvinutím a zobecněním chápání mysli jako neuronové sítě dle představ kybernetiky 50. let. Zdrojem názorového posunu byla však i reakce na nové způsoby využívání výpočetní techniky – na enormní rozvoj počítačových sítí. Psychologové i neurofyziologové navíc dospěli k představě rozložitelnosti mysli (tedy toho, co dělá mozek) na funkčně specializované vzájemně komunikující moduly. Minsky se pokusil tuto představu precizovat a rozvinout v pojmosloví teorie výpočtů. Jeho záměrem bylo dát strukturám používaným při rámcové reprezentaci poznatků mnohem větší autonomnost, než tomu bylo v původní koncepci. Z jednotek rámcové reprezentace se měly stát autonomně se chovající a vzájemně komunikující softwarové celky uzpůsobené vzájemným interakcím a vytvářením složitějších celků svého vlastního typu. Měly tedy nabýt podobu agentů schopných seskupovat se do větších celků – agentur – které by za určitých okolností samy fungovaly jako agenty.
6. Mysl jako společenství První článek o mysli jako společenství specializovaných výpočetních agentů publikoval Minsky v roce 1980 (Minsky, 1980). Uceleně pak předložil svou teorii ve zvláštně koncipované knize (Minsky, 1986), sestávající z 270 jednostránkových, srozumitelných a vzájemně na sebe odkazujících esejí10. Se svou teorií pak udělal to, o čem již byla zmínka výše: Spolu s Harrym Harrisonem napsali technothriller (Harrison, Minsky, 1992). Na pozadí detektivní zápletky z roku 2023 odehrávající se převážně ve vývojové laboratoři inteligentních robotů, se objeví nutnost (re)konstruovat poškozenou mysl jednoho klíčového specialisty. To otevírá autorům možnost předvést všechny zásadní myšlenky societní teorie mysli, mnoho z jiných teorií umělé inteligence, dokonce četné klíčové projekty Laboratoře umělé inteligence a Laboratoře médií MIT a dokonce i něco z organizačního pozadí a někdy dost komplikovaných vztahů mezi dnešními centry výzkumu a předními výzkumníky (jména jsou pochopitelně pozměněna). V knize jsou přítomny i první náznaky problematiky emotivity lidí a strojů, které Minsky věnoval svou avizovanou monografii The Emotion Machine. Pocit bezvýchodnosti může z výpočetního hlediska vznikat třeba takto: V mysli řešitele (nebo umělého řešiče) problémů se postupně naplňují nějaké pomocné paměti specifikacemi problémů, které vznikají a čekají na řešení v procesu, jež jsme naznačili v souvislosti se systémem GPS. V mysli existuje nějaký specializovaný agent, který má za úkol sledovat stav naplněnosti těchto pomocných pamětí a v případě jejich přeplňování aktivovat agent, jehož úkolem je zamezit dalšímu generování podúkolů 10
S dopady a rozvojem Minskyho societní teorie mysli po vydání The Society of Mind seznamuje v přehledné podobě (Singh, 2003).
programem GPS. Třeba právě aktivaci tohoto agenta vnímá možná naše vědomí způsobem, který jsme nazvali bezvýchodnost. V takovémto stavu vědomí se pak mohou aktivovat jiné strategie řešení problémů (třeba rozhodnutí na základě náhody nebo třeba použití jiných operátorů, než jaká byla v procesu původně při hledání řešení problémů systémem GPS uplatňována…). Často vznikají tyto situace jako následek tlaku reálného prostředí na řešitele (prozatím méně často na řešič) problémů. Např. člověk rozhodující se o volbě vhodné restaurace je čím dál hladovější, člověk hledající odpovídající zaměstnání má stále méně peněz na obživu apod. A možná to platí dokonce celé i obráceně: Uvědomujeme si problémy proto, neboť naše interakce s prostředím v nás vyvolává vznik velice prvoplánových (až v biochemii našich organizmů ukotvených) problémů (třeba potřeba doplňovat v organizmu hladinu vody nebo cukrů, tuků a bílkovin), které jsme nuceni řešit v prostředích určité komplikovanosti. Interakce s prostředím je tedy možná velmi aktivním prvkem fungování přirozených i umělých myslí, který je třeba brát v potaz, pokoušíme-li se hledat jakési (výpočetně formulovatelné) vysvětlení nastávání emotivních stavů a jejich souvislost s kognitivní složkou myslí. Jaká je však síla interakce z pohledu teoretické informatiky?
7. Síla interakce V našem pokusu o analýzu stroje jsme jej uviděli v mnoha podobách, ve kterých posloužil rozvoji naší představivosti, našeho materiálního světa, naší (sebe)reflexi v uměleckých dílech rozmanitého druhu, i našemu chápání procesů určitých druhů, především výpočetních procesů. Za předpokladu formálně precizního chápání stroje – třeba v podobě tzv. Turingova stroje (Turing, 1936) – existují hranice toho, co je takovýmto strojem (tedy v tzv. turingovském smyslu) vypočitatelné. V Turingově původním smyslu z jeho výše uvedené publikace jsou vypočitatelná (angl. computable) taková reálná čísla, decimály kterých jsou vypočitatelné konečným počtem kroků, tedy které dokáže postupně napsat stroj. Právě podoba tohoto stroje – v Turingově původním označení tzv. a-stroje (angl. a-machine), který pak Emil Post pojmenoval Turingovým strojem – byla v (Turing, 1936) podrobně specifikována. Turing upozorňuje, že i když jsou objektem jeho zájmu čísla, pojem vypočitatelnosti dokáže bez obtíží rozšířit i na vypočitatelnost funkcí definovaných na reálných proměnných, nebo na predikáty, apod. Právě ve vztahu k funkcím (a predikátům) se pak pojem vypočitatelnosti stal jedním ze základních pojmů teoretické informatiky 20. století. Koncem 20. století se představa univerzálního výpočetního zařízení Alana Turinga – Turignova stroje – postupně problematizovala. Jedním z důvodů bylo zjištění, že ne vždy je nejvýstižnější představou o fungování reálných počítačů jejich chápání jako zařízení transformujících vstupní hodnoty proměnných matematicky definovaných funkcí konečným počtem elementárních operací na příslušné výstupní funkční hodnoty. Reálné výpočetní systémy se postupně stávaly mnohem otevřenějšími vnějším vlivům, různým interakcím, což původní představu o počítání zčásti zpochybňovalo; viz např. (Wegner, Goldin, 2003), (Wegner, 1997)11.
11
K tomuto tématu s akcentem na jeho souvislost s problematikou umělého života viz taky (Wiedermann, 2001).
Pochybnosti vznikaly i pokud jde o přiměřenost konceptuálního modelu reálných počítačů v podobě Turignova stroje jejich fyzikálně (technicky) uskutečněným podobám. Objevily se názory, že práve ztělěsněnost (angl. embodiment) reálných počítačů může podstatným způsobem měnit jejich schopnosti ve srovnání s těmi, na které usuzujeme ze schopností Turingova stroje a s ním ekvivalentních formálních modelů; podrobněji viz např. (Sloman, 2002). V průběhu našeho výkladu jsme se soustředili na problematiku interakce stroje a jeho prostředí resp. na problematiku interakce strojů navzájem. Viděli jsme, jak může důraz na interaktivitu posunout hranice uměleckého sebevyjádření. Viděli jsme i to, jak může představa jednoduchých interagujících strojů (agentů) ovlivnit představy o našich vlastních mentálních schopnostech. Zůstává už jenom položit si otázku, může-li interaktivita ovlivnit výpočetní sílu našich (abstraktních) strojů. Dnes se postupně objevují formální modely výpočtů, nabízející rozšíření tradičního pojímání výpočtů v podobném smyslu, v jakém se fyzice podařilo „rozšířit“ tradiční newtonovskou mechaniku do podoby relativistické a kvantové mechaniky. Takovéto pokusy o „rozšíření“ pojmu vypočitatelnosti se dnes dějí v různých směrech.12 V zásadě jsou však takovéto snahy postaveny na tom, že do modelu výpočtu v nějaké podobě zahrnou i cosi nevypočitatelného, ale teoreticky dobře formulovatelného a zkoumatelného. Bývá to třeba obecnější představa o počítání s reálnými čísly, než tomu bylo v (Turing, 1936), nebo představa zařízení, které je schopno v některých momentech výpočtu zodpovědět určitý typ otázek – tzv. orákula – apod. My uvedeme příklad, který staví na předpokladu, že výpočetní zařízení sestává z více agentů, které mají individuálně každý nanejvýš tradiční výpočetní sílu Turingova stroje a které se mohou v průběhu výpočtu seskupovat z různých důvodů – třeba proto, že mají svoje těla, které jim brání vstupovat kdykoliv do procesu výpočtu – do různých „týmů“ a počítat pak týmově, ve skupinkách s měnícím se počtem členů. Takovýto předpoklad vykonávání výpočtů se nám jeví jako velmi blízký realitě zpracovávání informace různými společenstvími agentů v běžném životě. Proto se nám otázka stanovení výpočetní síly takovýchto multiagentových systémů jeví jako zajímavá. Formalizovaný model, který výše naznačenou představu zčásti vyjadřuje, byl předložen v (Csuhaj-Varjú et al., 1994) v podobě systému formálních gramatik pracujících se společným řetězcem, který se mění nejenom následkem propisování podle pravidel těchto gramatik, nýbrž i následkem vlastní dynamiky (vyjádřené speciálním typem gramatiky – tzv. Lindenmayerovým nebo L systémem). Model jsem nazvali ekogramatický (zkráceně EG) systém. Podařilo se v něm vyjádřit některé vlastnosti, se kterými se setkáváme i u živých bytostí, podíváme-li se na ně z informatického hlediska. V (Csuhaj-Varjú et al., 1997) jsme definovali ekogramatický systém Σ jako systém sestávající z abecedy V symbolů, z fixovaného počtu (třeba z n) agentů a z prostředí. Prostředí daného EG systému se mění v krocích, ze kterých každý má dvě fáze: 12
Přehled takových přístupů poskytuje např. časopis Theoretical Computer Science 317 (2004) No. 1-3, pp. 1-267 sestavený M. Burginem a A. Klingerem.
V první fázi kroku EG systému agenty propisují symboly ve sdíleném prostředí tvaru řetězce wE symbolů z množiny V. Dělají to sekvenčně (v jednom kroku propisuje jediný agent jediný symbol) a každý podle vlastní konečné množiny propisovacích pravidel, seskupených do zodpovídajících množin R1, R2, ..., Rn. Stav prostředí na začátku práce systému agentů označíme w0. Ve druhé fázi kroku EG systému se prostředí (řetězec) wE mění podle vlastních zákonitostí prostředí (řetězce wE). Tyto zákonitosti jsou vyjádřeny taky propisovacími pravidly, a to z konečné množiny PE. Pravidla jsou aplikována paralelně, podobně jako je tomu v tzv. Lindenmayerových (nebo L-) systémech.13 K jejich aplikaci tedy dochází až poté, co žádný z agentů již nemá co v řetězci wE propisovat. Paralelní propis symbolů se přitom smí vykonat pouze v případě, je-li možné pomocí pravidel z množiny PE přepsat všechny symboly vyskytující se v řetězci wE, které nebyly v daném kroku propisování daným EG systémem přepsány agenty.
Obr. 6.: Schematické znázornění ekogramatického systému. Převzaté z (Csuhaj-Varjú et al., 1997)
Takto vzniká krok za krokem postupným vykonáváním dvoufázového přepisování množina řetězců {w0, w1, w2, …}, kterou nazýváme jazykem generovaným daným EG systémem. Ve zmíněném článku jsme ukázali, kromě jiných vlastností EG systémů, i vcelku očekávatelný fakt, že takto chápané EG systémy jsou schopny generovat právě ty jazyky, které jsou schopné generovat (resp. akceptovat) Turingovy stroje, tedy že náš model a Turingův stroj jsou – pokud jde o jejich „výpočetní sílu“ – ekvivalentní. V (Csuhaj-Varjú, Kelemenová, 1998) byla navržena speciální varianta EG systémů, která generuje jazyky skupinami agentů – tzv. teamů. Daným kladným celým číslem k, přidruženým k danému EG systému, je určen počet agentů v teamu. Které agenty budou členy teamu není podstatné, musí jich však být přesně k a v průběhu vykonání první 13
Trojice (V, PE , wE) tedy představuje L-systém ve smyslu (Rozenberg, Salomaa, 1980).
fáze daného kroku přepisování se nemohou měnit. Pro daný krok přepisování se tím určí množina agentů, které budou v první fázy kroku přepisování prostředí participovat. Po vykonání druhé fáze se může team změnit, musí však mít opět přesně k prvků. Wätjen (2003) navrhl fixovaný počet agentů z (Csuhaj-Varjú, Kelemenová, 1998) nahradit představou dynamicky se měnícího počtu agentů v teamu. Jako rekonfigurační mechanizmus navrhl použít funkci f definovanou na množině všech kladných celých čísel N s hodnotami v množině {0, 1, 2, … n}, kde n je počet agentů daného EG systému Σ. Pro i-tý krok přepisování tohoto EG systému udává pak funkce f číslo f(i)∈ {0, 1, 2, … n}. Pro vykonání první fáze tohoto kroku přepisování pak bude použita libovolná podmnožina množiny všech agentů daného EG systému Σ s počtem prvků právě f(1), ve druhém s počtem prvků právě f(2) atd. Ve (Wätjen, 2003) je dokázáno, že existují takové EG systémy s jeho typem teamů, pro které platí: Je-li f v Turingově smyslu nevypočitatelná funkce, pak existuje jazyk definovaný takovýmto EG systémem, který je Turingovým strojem neakceptovatelný (nerekurzivní), tj. nedá se Turingovým strojem pro libovolné slovo zjistit (vypočítat), patří-li do tohoto jazyka, nebo do něj nepatří. Myšlenka matematického důkazu tohoto tvrzení není příliš komplikovaná. Mějme tedy EG systém Σ = (V, PE, R1, R2,..., Rn, wE ), kde V = {a, b , b1, b2, ..., bn}, PE = {a→ a2, b→ b2 } ∪ { bi → b2 i = 1, 2,…, n}, Ri = {b → bbi }, 1 ≤ i ≤ n, w0 = a2b2n+3m , m, n∈ N. Nechť f je libovolná funkce definovaná na množině na množině všech přirozených čísel N s hodnotami v množině {0, 1, 2, … n}. Nechť EG systém Σ začíná propisovat ze startovacího řetězce w0 = a2b2n+3m. Pak generuje následující poněkud obtížně představitelný jazyk:
{
}
L ( Σ, f ) = a 2 b 2 n + 3 m ∪ k +1 a 2 perm bbi1 ,… , bbi f ( k ) , b 2 ,................., b 2 ∪ ∪ k∈N 1≤ i1 ,…,i f ( k ) ≤ n 2k −1 ( 2 n + 3 m ) − f ( k ) krát ′ ′ i i j j j j f k ( ≠ , ≠ ,1 ≤ , ≤ ( )) j j′
{ }
Existuje Turingův stroj, který tento jazyk akceptuje, je-li funkce f vypočitatelná. Pro každého, kdo je dostatečně obeznámen s teorií formálních jazyků resp. problematikou vypočitatelnosti, je toto tvrzení poměrně evidentně pravdivé. Předpokládejme však, že f je nevypočitatelná funkce. Takovýto předpoklad je zcela přijatelný, zvážíme-li, že funkce f vyjadřuje počet agentů v teamu, které jsou v daném kroku odvozování slova aktivní a že tuto množinu může určovat zcela reálně třeba náhoda!14 Předpokládejme dále, že jazyk L(Σ,f) je akceptovaný nějakým Turingovým strojem. Akceptovatelnost jazyka implikuje pravdivost tvrzení, že existuje nějaký 14
Podrobnější zdůvodnění viz v (Kelemen, 2005).
efektivně sestavitelný výčet všech slov jazyka L(Σ,f). Vezměme libovolné číslo k∈ N. Pak tedy musí existovat slovo wk ∈ L s prefixem a2exp(k+1)b, které se ve výčtu slov jazyka L(Σ,f) vyskytuje po konečném počtu předcházejících slov, jinak by totiž výčet nebyl efektivně sestavitelný. Analyzujíc jazyk L(Σ,f) Wätjen ukázal, že pak ale můžeme vypočítat hodnotu f(k) pro to slovo wk a tedy i pro libovolné slovo z jazyka L(Σ,f). To nás však dostává do sporu s počátečním předpokladem, že je funkce f nevypočitatelná. Jazyk L(Σ,f) nemůže být tudíž akceptovaný žádným Turingovým strojem. Podařilo se nám ho však definovat pomocí formalizmu určité varianty EG systémů, obsahujících nevypočitatelnou funkci. Proto má Wätjenův typ EG systémů – ze předpokladu, že je jeho součástí nevypočitatelná funkce – větší výpočetní sílu než jakou disponuje univerzální Turingův stroj. Síla výpočetně velice jednoduchých strojů jakými jsou agenty, jejichž formální modely vystupují v EG systémech, tedy z výpočetního hlediska velice významně narůstá třeba díky jejich seskupování a jejich jednoduchým interakcí s jednoduchým prostředím tvořeným řetězcem symbolů.
8. Závěr Když jsme v (Horáková, Kelemen, 2004) sledovali vývoj představ o tom, co je stroj a čím by se mohl stát, a v té souvislosti psali o Turingových úvahách o inteligenci, zformulovali jsme hypotézu, tzv. druhou Turingovu hypotézu, podle níž je inteligence redukovatelná na soubor turingovsky vypočitatelných funkcí. Známý Turingův test (Turing, 1950)15 byl navržen ke zjišťování toho, je-li v nějakém konkrétním případě souboru počítačových programů – ve smyslu první Turingovy hypotézy (tzv. Churchovy a Turingovy hypotézy) ekvivalentních turingovsky vypočitatelným funkcím – tato redukce provedena pro lidského pozorovatele dostatečně přesvědčivě. Postupně jsme se dostali k odůvodněnému tušení, že výpočetní síla, kterou Alan Turing a Alonzo Church stanovil v Churchově a Turingově hypotéze za hraniční pro abstraktní univerzální stroj, je překonatelná. V kontextu EG systémů se jí podařilo překonat zejména díky tomu, že do formálního modelu výpočtu byla zahrnuta i možnost nepředvídatelného (ale třeba díky náhodě možného!) seskupování výpočetních zařízení do proměnlivých teamů a možnost práce těchto teamů v prostředí, které sdílejí. Pokusíme-li se promítnout tuto zkušenost do našich hypotéz týkajících se intelektuálních schopností našich strojů, můžeme dospět k následujícímu názoru: Inteligence může vzniknout na bázi turingovsky vypočitatelných funkcí, na které je redukovatelná schopnost agentů zpracovávat symbolické reprezentace jejich prostředí, a na bázi možnosti seskupování těchto agentů a jejich aktivit ve sdíleném prostředí. Inteligence se takto stává výsostně kolektivním fenoménem vyvstávajícím (emergujícím) ve společenstvích aktivních subjektů, které na ni individuálně nedosahují. Možná právě v tomto tkví důvod, proč se tak stěží daří inteligenci obsahově vymezit, snažíme-li se ji vztahovat na jednotlivce a vyhnout se tomu, abychom při vymezování odkazovali i na jeho vazby na jiné jednotlivce. Možná právě v tomto spočívá i příčina, proč bylo zapotřebí přesunout v oblasti umělé inteligence 15
Sestavovateli mírně krácenou podobou tohoto Turingova článku je (Turing, 1992).
orientaci výzkumu z hledání způsobů jak programovat jednotlivé izolované systémy, aby prošly Turingovým testem, na oblast zkoumání významu interakcí mezi agenty, na problematiku multiagentových systémů a na oblast kolektivní robotiky. Nabízí se dost obecná otázka, kam takovýto vývoj stroje a zejména strojově lidské společnosti povede. Francouzský filozof Jean-François Lyotard kritizoval např. vývoj názorů ve 20. století na společnost jakožto na samoregulující systém, především Parsonsovy názory o společnosti jakožto kybernetickém systému. Napsal: … opravdovým účelem systému, tím, k čemu sám sebe programuje jako jakýsi inteligentní stroj, je optimalizace celkového vztahu mezi jeho imputy a outputy, to znamená jeho perfromativita „ (Lyotard, 1993, s. 110-111). Je tu však jeden aspekt „kybernetického“ pohledu na člověka a jeho společnost, pohled, který nabízí rozvinutí kybernetických myšlenek a představ do podoby současné umělé inteligence. Ve výše naznačeném kontextu snad nebude tento aspekt nezajímavý. Málokdy a málokde je o něm zmínka. Snad i proto, že v záplavě opačných názorových proudů působí poněkud paradoxně. Explicitně se však o něm zmínila např. Margaret Boden, když napsala, že jí …umělá inteligence přitahuje především pro možnosti, které skýtá pro potírání dehumanizačního vlivu přírodních věd (Boden, 1977, s. 4). My dodáváme, že nejenom věd, nýbrž i techniky. Koncept stroje se tak postupně rozšiřuje přes hranice nejrůznějších disciplín a součástí tohoto procesu, který začal nejpozději na začátku 20.století, je znejasnění chápání stroje, jeho definice, jeho podstaty a významu. Stejně jako v případě pojmu interaktivita, kterému jsme se věnovali na začátku příspěvku, můžeme její definici rozšířit daleko za hranice tzv. interaktivních technologií, i v případě konceptu stroje se musíme vždy ptát, jaký typ stroje má řečník na mysli, jestli jde o představu parního stroje nebo o informační technologie napodobující a rozšiřující schopnosti lidské mysli. Nový význam, kterým – i pod vlivem oblasti umělé inteligence a kognitivní vědy – v současnosti naplňujeme pojem stroj, se zčásti překrývá nejenom s významy mnoha pojmů ve fyzice, elektrotechnice a v informatice, nýbrž postupně i s významy pojmů z psychologie, sociologie, obecně humanitních věd, kultury a umění. Stroje postupně opouštějí oblast fyzikálního světa a přibližují se ke stále méně zřetelným hranicím světa živých bytostí a lidí, protože i my lidé jim vycházíme vstříc. Prozatím však obecně zdaleka není zcela jasné, bude-li výsledkem tohoto přibližování humanizace strojů, dehumanizace člověka, nebo konstituce nějakého nového humanizmu… Jde jen o to – píše Egon Bondy (1993, s. 112) – jak brzo si člověk uvědomí, že nejde o výrobu jeho „služebníka“, ale o jeho vlastní sebepřekročení jako biologicky vázané bytosti, která se v rámci biologična nemůže už kvalitativně výše rozvinout, tj. nemůže rozvinout všechno to, na co intencionálně poukazuje svou lidskou existencí. Katherine Hayles je ještě přímočařejší. Ve své knize mapuje vývoj konceptu člověka jako stroje ve smyslu stroje informační společnosti. Poukazuje na dominanci mysli a inteligence v konceptu člověka (lidské bytosti) ustavenou po 2. světové válce kybernetikou a Turingovým testem a popularizovanou v literatuře kyberpunku. Připomíná nutnost zapojit do této koncepce také tělo a individuální zkušenost tělesné
existence – interakce s naším okolím, která náš individuální obraz světa spolutvoří. Přesto však nezpochybňuje skutečnost, že … čím dál, tím méně je otázkou, jestli jsme se již stali posthumánními, protože naše posthumánnost je již skutečností. Raději se ptejme, jakým druhem posthumánních bytostí budeme (Hayles, 1999, s. 246).
Literatura Asimov, I.: I, Robot. Doubleday, New York, 1950 (česky např. Odeon, Praha, 1981) Bondy, E.: Filosofické eseje sv. 2 (Juliiny otázky, Doslov). Dharma Gaia, Praha, 1993 Brooks, R. A.: Flesh and Machines – How Robots Will Change Us. Pantheon Books, New York, 2002 Conway, F., Siegelman, J.: Dark Hero of the Information Age – In Search of Norbert Wiener, the Father of Cybernetics. Basic Books, New York, 2005 Csuhaj-Varjú, E., Kelemen, J., Kelemenová, A., Paun, Gh.: Eco(grammar)systems – a preview. In: Cybernetics and Systems '94 (R. Trappl, Ed.). World Scientific, Singapore, 1994, s. 941-948 Csuhaj-Varjú, E., Kelemen, J., Kelemenová, A., Paun, Gh.: Eco-grammar systems – a grammatical framework for studying life-like interactions. Artificial Life 3 (1997) 1-28 Csuhaj-Varjú, E., Kelemenová, A.: Team behaviour in eco-grammar systems. Theoretical Computer Science 209 (1998) 213-224 Čapkové K. a J.: Systém. In: Krakonošova zahrada. Levné knihy KMa, Praha, 2000, s. 19-27 Dorin, A.: Building artificial life for play. Artificial Life 10 (2004) 99-112 Eberbach, E., Wegner, P.: Beyond Turing machines. Bulletin of the EATCS 81 (2003) 279-304 Eco, U.: Teorie sémiotiky. Janáčkova akademie múzických umění, Brno, 2004 Feigenbaum, E., Feldman, J. (eds.): Computers and Though. McGraw-Hill, New York, 1963 Geržová, J. (zost.): Slovník svetového a slovenského výtvarného umenia druhej polovice 20. storočia. Kruh súčasného umenia Profil, Bratislava, 1999 Harrison, H., Minsky, M.: The Turing Option. Werner Books, New York, 1992 Hayles, N. K.: How We Became Posthuman. The Chicago University Press, Chicago, Ill., 1999 Horáková, J.: Rossum’s Universal Robots – továrna utopie. Disk 8 (2004a) 96-110 Horáková, J.: RUR – komedie o robotech. Disk 10 (2004b) 71-86 Horáková, J., Kelemen, J.: Stroj ve 20. století. In: Kognice a umělý život IV (J. Kelemen, V. Kvasnička, sest.). Slezská univerzita, Opava, 2004, s. 179-198 Kac, E.: Beyond the screen – new directions in interactive art. Blimp – Film Magazine No. 40, 1999, s. 49-54 Kelemen, J.: On the computational power of herds. In: Proc. IEEE 3rd International Conference on Computational Cybernetics (I. Rudas, Ed.). Budapest Tech, Budapest, 2005a, pp. 269-273 Krueger. M. W.: Responsive environments. In: The New Media Reader (N. WardishFruin, N. Montfort, eds.). The MIT Press, Cambridge, Mass., 2003, s. 379-389 Lyotard, J.-F.: O postmodernismu. Filosofický ústav AV ČR, Praha, 1993 Manovich, L.: The Language of New Media. The MIT Press, Cambridge, Mass., 2001 Markoš, A., Kelemen, J.: Berušky, andělé a stroje. Dokořán, Praha, 2004
Mignonneau, L., Sommerer, Ch.: Creating artificial life for interactive art and entertainment. Leonardo 34 (2001) 303-307 Minsky, M. (Ed.): Semantic Information Processing. The MIT Press, Cabmbridge, Mass., 1968 Minsky, M.: K-lines – a theory of memory. Cognitive Science 4 (1980) 117-133 Minsky, M.: The Society of Mind. Simon and Schuster, New York, 1986 Minsky, M., Papert, S.: Perceptrons. The MIT Press, Cambridge, Mass., 1969 Naimark, M.: Interactive art – maybe it’s a bad idea. Cyberarts International Compendium Prix Ars Electronica. Springer, Wien, 1998 Newell, A.: Unified Theories of Cognition. Harvard University Press, Cambridge, Mass., 1990 Newell, A., Simon, H. A.: Human Problem Solving. Prentice-Hall, Englewood Cliffs, NJ, 1972 Newell, A., Simon, H. A.: Computer science as an empirical inquiry – symbols and search. Communication of the ACM 19 (1976) 113-126 Rozenberg, G., Salomaa, A.: The Mathematical Theory of L Systems. Academic Press, New York, 1980 Singh, P.: Examining the society of mind. Computing and Informatics 22 (2003) 521543 Sloman, A.: The irrelevance of Turing machines to artificial intelligence. In: Computationalism (M. Scheutz, Ed.). The MIT Press, Cambridge, Mass., 2002, s. 87-127 Thagard, P.: Úvod do kognitivní vědy. Portál, Praha, 2001 Turing, A. M.: On computable numbers, with an application to the Entscheidungsproblem. Proc. London Mathematical Society 42 (1936) 230-265; corrections in 43 (1937) 544-546 Turing, A. M.: Computing machinery and intelligence. Mind 59 (1950) 433-460 Turing, A. M.: Počítacie stroje a inteligencia. In: Myseľ, telo, stroj (E. Gál, J. Kelemen, zost.). Bradlo, Bratislava, 1992, s. 18-36 Wätjen, D.: Function-dependent teams in eco-grammar systems. Theoretical Computer Science 306 (2003) 39-53 Wegner, P.: Why interaction is more powerful than algorithms. Communications of the ACM 40 (1997) No. 5, 81-91 Wegner, P., Goldin, D.: Computation beyond Turing machines. Communication of the ACM 46 (2003) No. 4, 100-102 Wiedermann, J.: Superturingovský výpočetní potenciál kognitivních a evolučních systémů. In: Kognice a umělý život (J. Kelemen a kol., sest.). Slezská univerzita, Opava, 2001, s. 315-334 Whitelaw, M.: Metacreation – Art and Artificial Life. The MIT Press, Cambridge, Mass., 2004 Winston, P. H. (Ed.): The Psychology of Computer Vision. McGraw-Hill, New York, 1975