1
Reprezentace znalost´ı jako jeden ze z´ akl. probl´ em˚ u AI
Historicky vyv´ıjeny soustavy rep. znalost´ı jako podklad pro syst´emy ˇclenˇen´ı probl´em˚ u, hled´an´ı informac´ı, rozbor dotaz˚ u. V 60. letech vznikaj´ı datab´ azov´ e syst´ emy. Rozd´ıly RZ od datab´aze: 1. Repr. znalost´ı m´ a m´ıt v´ıc moˇznost´ı inference (odvozov´an´ı), to v DB nejde; + klasifikace dat, ovˇeˇren´ı platnosti, dekompozice 2. Tehdy DB ch´ ap´ any jako ”´ upln´ y popis svˇeta”, RZ ne 3. Syst´em mus´ı s´ am vˇedˇet, k ˇcemu je, co dˇel´ a V´ ychoz´ı teze: ”AI bez pˇrir. jazyka neexistuje.” Spojen´ı AI s pˇrir jazykem – uplatnˇen´ı: • Univerz´ alnost (+): je moˇzn´e mluvit o vˇsem • V´ıceznaˇcnost (-) – napˇr. bank = bˇreh, banka, existuj´ı kontexty, kde i ˇclovˇek tˇeˇzko rozezn´a – jeˇstˇe horˇs´ı – slovn´ı spojen´ı, struktura: ˇr´ızen´ı naˇseho u ´stavu (´ ustav ˇr´ıd´ı nebo je ˇr´ızen?) • Pragmatick´ a v´ agnost (-): Chce se oˇzenit s ameriˇcankou (jednou urˇcitou?, ˇcistˇe kv˚ uli z´ısk´an´ı pasu?) • Reference (-): Dˇeti mˇely radost. Dostaly vl´ aˇcek (kdo dostal?) • Bohatstv´ı jazyka (+): korpusov´ a lingvistika, slovn´ıky nab´ız´ı materi´al k ˇreˇsen´ı, ˇc´ım v´ıc ho je, t´ım l´ıp. Nilsson (Stanford, US 1980) v definici AI zahrnuje jazyk (aˇc s´am nebyl lingvista), d´av´a porozumˇen´ı jazyku na 1. m´ısto. Jeho definice ukazuje vztah lingvistiky a AI – v aplikac´ıch, v zachycen´ı svˇeta (pamatovat si podobnˇe jako ˇclovˇek).
2
Taxonomie reprezentaˇ cn´ıch sch´ emat
Jak´e jsou typy reprezentac´ı znalost´ı? Co m˚ uˇze b´ yt vyuˇzito v syst´emech komunikace s AI? Ivan Havel (1977) rozliˇsuje 2 typy: 1. S pouˇzit´ım predik´ atov´e logiky ˇ ı r´amce a s´ıtˇe dohromady, aˇc se v lecˇcems liˇs´ı. 2. Relaˇcn´ı struktury (grafy, s´ıtˇe, r´ amce). Rad´ Mylopoulos (1980) – teoretiˇctˇejˇs´ı, pˇredstavuje si reprezentaci jako individiua, vztahy mezi nimi; stav syst´emu konstituuje soubor individu´ı a vztah˚ u. Zmˇeny stavu jsou transformace vztah˚ u. Podle toho rozliˇsuje s´emantick´e s´ıtˇe (kde jsou hlavn´ı individua a vztahy), logick´ a sch´emata (kde jsou hlavn´ı pravdiv´e v´ yroky o stavech), procedur´ aln´ı sch´emata (kde jsou hlavn´ı transformace stav˚ u) a jako zvl´aˇstn´ı typ r´amcov´a sch´emata.
2.1
S´ emantick´ e s´ıtˇ e
Hlavn´ı – individua a vztahy, tj. uzly a ohodnocen´e hrany. Vztahy – r˚ uzn´e typy: abstraktum x konkr´etum, ˇc´ ast x celek, typ x instance. M˚ uˇzu podle toho definovat r˚ uzn´e organizaˇcn´ı principy, coˇz u logick´ ych sch´emat moc nem´ am. D´ıky asociac´ım se informace hledaj´ı snadno, probl´em je m´alo formalismu.
2.2
Logick´ a sch´ emata
Soubor logick´ ych pravdiv´ yh formul´ı o stavech. Nejsou uzly a hrany, ale formule. To je v´ yhoda, prvn´ı syst´emy na tom st´ aly, pro logiku m´ ame odvozovac´ı pravidla, takˇze nemus´ıme vym´ yˇslet vlastn´ı. Probl´em: chyb´ı org. princip (to v s´ıt´ıch je), tˇeˇzko se zachycuj´ı procedur´ aln´ı znalosti (znalosti postupu pr´ace). PROLOG vych´ az´ı z logick´ ych sch´emat, ale pˇrid´av´a i procedur´alno, proto m˚ uˇze b´ yt docela dobˇre pouˇziteln´ y.
2.3
Procedur´ aln´ı sch´ emata
Sv´eho ˇcasu velmi popul´ arn´ı. Stavov´ e transformace, z´asoba znalost´ı jako soubor procedur v programovac´ım jazyce (napˇr. LISP). Proti logice v´ yhoda – reprezentace procedur (”vˇedˇet jak”), efektivita syt´emu. Default reasoning – na z´ akladˇe ”default” situac´ı se m˚ uˇze rozhodovat i s ne´ uplnou informac´ı o svˇetˇe. M˚ uˇze automaticky akutalizovat data, se kter´ ymi pracuje. Nev´ yhody – chyb´ı nˇejak´ y univerz´ aln´ı podklad (to v logice je), chyb´ı konzistence pˇri default reasoning, obt´ıˇze pˇri zmˇen´ ach: kdyˇz se nˇekde nˇeco zmˇen´ı, zmˇena se propaguje vˇsude, nekontrolovatelnˇe. 1
2.4
R´ amcov´ a sch´ emata
Kombinace pˇredchoz´ıch 3, vyuˇzit´ı i logiky, i procedur, i s´ıt´ı.
3
Porozumˇ en´ı a poˇ c´ıtaˇ ce, ELIZA
A. M. Turing (1947, 50): Tvrd´ı, ˇze pˇreklad pomoc´ı poˇc´ıtaˇc˚ u je moˇzn´ y, chce odpovˇedˇet na ot´azku, zda je moˇzn´e porozumˇen´ı, definuje Turing˚ uv test na z´ akladˇe lidsk´eho pozn´an´ı, zda reaguje ˇclovˇek nebo poˇc´ıtaˇc. Test byl sporn´ y, vyvr´ atil ho Weizenbaum(1966) s programem ELIZA (n´azev podle Pygmalionu – reakce na u ´rovni spoleˇcensk´e konverzace). ELIZA proˇsla testem, i kdyˇz inteligentn´ı v˚ ubec nen´ı, jen simuluje inteligenci r˚ uzn´ ymi triky. Pracuje v omezen´em prostˇred´ı (psychiatr). Zahrnuje: • Soubor kl´ıˇc. slov, usp. podle d˚ uleˇzitosti – reaguje se na 1 prioritn´ı kl´ıˇc. slovo • Pro kaˇzd´e kl´ıˇc. slovo – seznam reakc´ı, uspoˇr´adan´ y, co se uˇz pouˇzilo, jde na konec (a cykl´ı se) – Pro obecn´e reakce (neurˇcit´ a slova) v´ yzva, aby jmenoval zvl´aˇstn´ı pˇr´ıpad – Ot´ azky na ”rozpov´ıd´ an´ı se”, typu ”In what way?” – Pro popisy ˇspatn´e duˇsevn´ıho stavu se pt´a, jak m˚ uˇze pomoct – Pokud se vyˇcerpaj´ı moˇznosti, pouˇzije se ”Go on.”, nebo ”Say me more about ...”, pˇr´ıp. ”That is interesting.” • Nen´ı-li v reakci kl´ıˇcov´e slovo, vrac´ı se k posledn´ımu pouˇzit´emu, pˇr´ıpadnˇe opˇet neurˇcit´a reakce, zopakov´ an´ı pacientovy v´ ypovˇedi. Trv´ a to, neˇz si ˇclovˇek uvˇedom´ı, ˇze se poˇc´ıtaˇc opakuje a nev´ı, o ˇcem mluv´ı.
4
Winograd˚ uv syst´ em ovl´ ad´ an´ı robota (SHRDLU)
Terry Winograd (Stanford 1972, pozd. Edinbourgh) – prvn´ı opravdu v´aˇzn´ y pokus o komunikaci s poˇc´ıtaˇcem. Na omezen´em prostoru zkouˇsel vlastnosti porozumˇen´ı: simulace robota v omezen´em svˇetˇe s nˇekolika objekty, kter´e mohl pˇresouvat (neˇslo o fyzicky existuj´ıc´ıho robota, jen poˇc´ıtaˇcovou simulaci jeho akc´ı).
4.1
Sloˇ zen´ı syst´ emu
• Obsahuje autoreference – robot v´ı, v jak´em je stavu, co zrovna dˇel´a. • Procedur´ aln´ı reprezentace znalost´ı (jazyk PLANNER) – seznam pouˇziteln´ ych u ´daj˚ u a uskuteˇcniteln´ ych instrukc´ı + dodan´e u ´daje • Rozloˇzil syst´em na nˇekolik model˚ u, ale ˇslo mu i o celek – Hlavn´ı ovl´ ad´ an´ı: MONITOR – Pod n´ım INPUT (pro ˇcten´ı vstupu, morfologick´a anal´ yza), GRAMMAR (zpracov´an´ı vstupu), SEMANTICS (interpretace), ANSWER (zajiˇstˇen´ı v´ ystupu: vytvoˇren´ı odpovˇedi a jej´ı proveden´ı, tj posouv´an´ı beden) – Pro ˇcten´ı vstupu pouˇz´ıv´ an DICTIONARY, PROGRAMMAR (pomoc gramatice – syntaktick´e stromy), SEMANTIC FEATURES, jazyk PLANNER, BLOCKS (v PLANNERU napsan´a robotova znalost svˇeta) + DATA, MOVER (visualizace)
4.2
V´ ysledek pokusu
Winogradovi se pokus zdaˇril, zaloˇzil cel´e odvˇetv´ı box systems. Neˇslo ale o nijak pˇr´ıliˇs vyspˇel´ y syst´em, dost profitoval z omezen´ı svˇeta – napˇr. lexik´ aln´ı anal´ yza mˇela hodnˇe malou slovn´ı z´asobu, v syntaxi ˇslo vˇetˇs. o jednoduch´ y imperativ apod. Syst´em nav´ıc neformuloval moc odpovˇedi (negeneroval vlastn´ı), v ANSWER mˇel zabudovan´e matice, kam vkl´ adal slova od oper´ atora (tj. nebylo to moc daleko od ELIZY ;-)). N´ azev SHRDLU byl libovolnˇe vybr´ an Winogradem, aby se nepletl s ˇz´adn´ ym existuj´ıc´ım slovem (nen´ı to zkratka). Winograd˚ uv syst´em chtˇeli m´ıt hned na vˇsech univerzit´ach – i na MFF 1980 syst´em NALCOM (Natural Language Communicator, autor Hajiˇc).
5
S´ emantick´ e s´ıtˇ e, Quillian˚ uv model pamˇ eti, rozˇ clenˇ en´ı s´ıt´ı (Hendrix)
Nˇekteˇr´ı nedˇelaj´ı mezi nimi a r´ amci rozd´ıl, ale Hajiˇcov´a ho v tom vid´ı.
2
5.1
S´ emantick´ e s´ıtˇ e
Jin´e n´ azvy: kognitivn´ı, konceptu´ aln´ı s´ıt’. Snaha reprezentovat znalosti podobnˇe jako v lidsk´em mozku. Motivace: centralizace fakt˚ u z urˇc. oboru na jednom m´ıstˇe a jejich logick´e propojen´ı. Reprezentace: deklarativn´ı z´ apis, procedura k vybaven´ı znalosti. Z´avislosti paradigmatick´e (z´amˇeny napˇr. konkr´etnˇejˇs´ıho pojmu za nadˇr´ızen´ y) i syntagmatick´e (kombinace, spojov´an´ı). Moˇzn´e interpretace s´ıtˇe: 1. Hrany pointry, uzly jako m´ısta, kam smˇeˇruj´ı 2. Uzly jako predik´ aty, hrany jako logick´e vztahy 3. Uzly jako v´ yznamy slov, hrany jako konceptu´aln´ı vztahy mezi nimi Probl´emy: • Pˇrekˇr´ıˇzen´ı vztah˚ u (d´ a se tomu zabr´ anit duplikac´ı uzl˚ u) – Napˇr.: Bakterie odol´ avaj´ı n´ızk´ym teplot´ am. + Kaktusy odol´ avaj´ı nedostatku vody = Bakterie odol´ avaj´ı nedostatku vody atp. • Ztr´ ata kvantifik´ ator˚ u pˇri ztr´ atˇe poˇrad´ı slov ve vˇetˇe, aktu´aln´ı ˇclenˇen´ı vˇety – Napˇr.: Nepˇriˇsel, protoˇze prˇselo. x Protoˇze prˇselo, nepˇriˇsel Zast´ ance s´ıt´ı Hermann Helbig – do sv´ ych model˚ u zaˇcleˇ noval i jazykov´e vztahy typu ”nositel vlastnosti”, ”konatel”, ˇreˇs´ı i aktu´ aln´ı ˇclenˇen´ı vˇetn´e, jeho pˇr´ıstup je br´an jako jeden z nejlepˇs´ıch. Pˇr´ıklad s´ıtˇe: Wordnet – zobrazen´ı slovn´ıku (odpov´ıd´a Quillianovu modelu). Dneˇsn´ı s´ıtˇe se vˇetˇsinou naz´ yvaj´ı kognitivn´ı a maj´ı klasifikaci hran, vztah˚ u. 5.1.1
Quillian˚ uv model
ˇ o modelov´an´ı uspoˇr´ad´an´ı znalost´ı v lid. mozku, ne pˇr´ımo Prvn´ı koncepce na t´ema s´emantick´e s´ıtˇe, Quillian (1968). Slo o komunikaci s poˇc´ıtaˇcem. • Uzly jako pojmy, vyj´ adˇriteln´e slovem nebo souslov´ım 1. Typov´e uzly (hlavn´ı uzly, z nich vedou hrany k ostatn´ım uzl˚ um) – pˇredstavuj´ı jednu ”typovou oblast” (znalosti o tom jednom pojmu) 2. Z´ astupn´e uzly (zastupuj´ı jin´ y typov´ y uzel s jin´ ym okruhem hran) – z nich vedou ”asociaˇcn´ı hrany” do zastupovan´eho uzlu • Pro kaˇzd´ y v´ yznam dan´eho slova je jin´ y typov´ y uzel • V´ yznam pojmu = mnoˇzina vˇsech uzl˚ u, kter´e lze z´ıskat pr˚ uchodem po hran´ach z typov´eho uzlu • D´ a se pouˇz´ıt na porovn´ av´ an´ı v´ yznam˚ u slov 5.1.2
Rozˇ clenˇ en´ e s´ em. s´ıtˇ e (partitioned networks)
Hendrix (Stanford, 1978) vymyslel pro s´em. s´ıtˇe ˇreˇsen´ı proti ztr´atˇe vztah˚ u, amorfnosti s´ıt´ı. Vylepˇsen´ı: • Hranice mezi v´ yroky, syntagmaty – spaces, • ohodnocen´ı hran (v Quillianovˇe modelu nen´ı, dnes m´a podobn´e vˇeci Helbig) podle druhu vztahu (ˇc´ ast-celek apod.), • Pr˚ uhledy (vistas) – spojov´ an´ı nˇekolika spaces, pˇr´ıstupn´a je jen informace obsaˇzen´a v nˇekter´em ze spojen´ ych spaces. ˇ o uspoˇr´ Slo ad´ an´ı znalost´ı, rozˇclenˇen´ı i podle dosahu kvantifik´ator˚ u, spr´avn´e pˇripojen´ı k jin´ ym vztah˚ um s kvantifik´ atory. Zachov´ avaj´ı se poˇrad´ı slov ve vˇetˇe, hranice vˇet. C´ılem byla komunikace s poˇc´ıtaˇcem, Hendrix chtˇel udˇelat re´alnˇe pouˇziteln´ y syst´em. Zaloˇzil na tom pozdˇeji komerˇcn´ı projekt Q/A, kter´ y pom´ ahal s vyplnˇen´ım daˇ nov´eho pˇrizn´an´ı (a mˇel s n´ım docela u ´spˇech, aˇc byl taky ”zadr´ atovan´ y natvrdo”).
3
6
R´ amce, syst´ em GUS, konceptu´ aln´ı z´ avislosti
V AI pˇriˇsel s n´ apadem r´ amc˚ u prvn´ı Minsky (Stanford, 1975), kter´emu ˇslo o prostorov´e vidˇen´ı. V lingvistice existuj´ı de facto od Fillmora a jeho pr´ ace o argumentech slovesa (valenˇcn´ıch r´amc´ıch, 1968). Ty se dodnes pouˇz´ıvaj´ı pˇri anotac´ıch korpusu atd. Fillmore vytvoˇril i projekt FrameNet, kter´ y zahrnuje s´emantick´ y pˇr´ıstup k doplnˇen´ım slovesa, coˇz je dnes bˇeˇzn´ y pˇr´ıstup. Minsky uvaˇzoval pˇredstavu vstupu ˇclovˇeka do m´ıstnosti: ˇclovˇek m´a pˇredem pˇredstavu, jak bude m´ıstnost vypadat. Voln´e r´ amce pro stˇeny, strop apod., ty se zaplˇ nuj´ı: m´ısto abstrakta si doplˇ nuji konkr´etn´ı vjem z m´ıstnosti. V dlouhodob´e pamˇeti ˇclovˇeka jsou stereotypy: defaultn´ı hodnoty, ˇclovˇek m´ a v pamˇeti r´ amce. • R´ amec = pevn´ y ”horn´ı” uzel, obsahuj´ıc´ı slots • Slot = voln´e rubriky v r´ amci, kter´e se mohou zaplnit Pro konkr´etn´ı dˇej / vˇec mus´ım m´ıt pˇredem r´amec se sloty, kter´e pak z informac´ı o svˇetˇe (z textu na vstupu) zaplˇ nuju. Nˇekter´e mohou z˚ ustat pr´ azdn´e. Oproti s´ıt´ım jsou tedy pˇredem organizovan´e. V´ ytky r´ amc˚ um: neschopnost dynamick´eho zpracov´an´ı (jen deklarativn´ı).
6.1
Syst´ em GUS (Genial – ”duchapln´ y” Understanding System)
Prvn´ı syst´em, kter´ y pouˇzil r´ amce: Stanford (Bobrow, Kaplan, Kay, Norman, Thompson, 1977). Mˇelo fungovat jako rezervace letenek, modelovat cestovn´ı kancel´ aˇr. Mˇel pod´avat rozumn´e doplˇ nuj´ıc´ı ot´azky a dalˇs´ı nab´ıdky. Pokusili se spojit r´ amce a dynamiˇcnost (nov´ a myˇslenka). Zahrnovalo: • V´ yznamov´ y z´ apis pomoc´ı r´ amc˚ u • B´ aze znalost´ı (letov´ y ˇr´ ad) ve vnˇejˇs´ı pamˇeti • Matice odpovˇed´ı (negeneruje se inteligentn´ı odpovˇed’) R´ amce v GUS: • kaˇzd´ a rubrika m´ a jm´eno, hodnotu, pˇr´ıp. soubor pˇriˇrazen´ ych procedur – hodnotou m˚ uˇze b´ yt i jin´ y r´ amec – procedury slouˇz´ı jako spojen´ı procedur´aln´ı a deklarativn´ı s´emantiky • procedury - dva druhy (chytr´e): – sluhov´e – aktivuj´ı se, kdyˇz jsou potˇreba; tj. jen kdyˇz klient specifikuje netypick´ y poˇzadavek, pˇrep´ıˇse se default – d´emoni – aktivuj´ı se, jakmile je vloˇzena hodnota; napˇr. za u ´ˇcelem dopoˇc´ıt´an´ı dalˇs´ı informace z vloˇzen´eho (den v t´ ydnu)
6.2
Konceptu´ aln´ı z´ avislosti
R´ amce mˇely hlavnˇe v teorii velkou odezvu, i ve spojen´ı s lingvistikou. Zaˇcal s t´ım Roger Schank (USA, 1969), v nˇeˇcem vych´ az´ı ze z´ avislostn´ıho popisu P. Sgalla z MFF. Prezentoval na COLINGu syst´em konceptu´ aln´ıch z´ avislost´ı – vztahy (hrany) mezi koncepty, podobn´e z´ avislostn´ım vztah˚ um mezi vˇetn´ ymi ˇcleny (ˇcerp´a z Fillmora). Shankova koncepce: • M´ ame nomin´ aln´ı koncepty a dˇejov´e koncepty (primitivn´ı dˇeje), pro nomin´aln´ı koncepty m´ame z´avislostn´ı vztahy stavov´e, pro dˇejov´e z´ avislostn´ı vztahy specifikaˇcn´ı. • 5 konceptu´ aln´ıch p´ ad˚ u: agens, patiens, objekt, smˇer, n´ astroj • Primitivn´ı dˇeje (celkem 11): j´ıt, vidˇet, d´ at (pˇrenos nˇeˇceho nˇekam, nˇekomu), pohyb, zaˇz´ıv´ an´ı, vlastnˇen´ı, obsahov´ an´ı (specifikaˇcn´ı vztahy, vlastnick´e vztahy) • To vˇse se d´ a spojovat do kauz´ aln´ıch ˇretˇezc˚ u: dˇeje mohou mˇenit stavy, stavy mohou ovlivˇ novat dˇeje atd. Pomoc´ı toho chtˇel reprezentovat vˇsechny vˇety jazyka (vliv s´emantiˇcky Vˇ erˇ zbick´ e, kter´a propagovala koncepci sloˇzen´ı vˇseho z nˇekolika m´ alo prvk˚ u). Vztahy se daly rekurzivnˇe do sebe zapouˇstˇet. R´ amce pojmenoval obecn´e informace o skuteˇcnostech, byly 2 typ˚ u: • sc´en´ aˇre (standardn´ı situace, napˇr. ”restaurace”) • pl´ any (standardn´ı posloupnosti lidsk´ ych akc´ı, pˇr´ıˇcinn´e vztahy mezi sc´en´aˇri, napˇr. ”host odejde bez placen´ı”) 4
7
Lingvistick´ a koncepce, z´ avislostn´ı stromy
Pˇrednost´ı pˇrirozen´eho jazyka je moˇznost popsat cokoliv (s pˇr´ıpadn´ ym vytvoˇren´ım nov´ ych pojmenov´an´ı). Pˇri vyuˇzit´ı z´ apisu hloubkov´e struktury lze odstranit i homonymie a synonymie. Lze se domn´ıvat, ˇze uspoˇr´ad´an´ı informac´ı v lidsk´e pamˇeti je podobn´e. Zat´ım pˇrevl´ adaj´ı syst´emy s omezen´ ym pohledem na svˇet, pro typick´e situace – nevych´az´ı se tedy z povahy jazyka, ale ze situac´ı. Lingvisticky ale lze doj´ıt k obecn´emu invent´aˇri znak˚ u i operac´ı nad nimi. Pro kaˇzd´ y zp˚ usob reprezentace (s´ıtˇe, r´ amce atp.) je tˇreba zachytit vztahy dˇeje (slovesa) a jeho u ´ˇcastn´ık˚ u (jm´ena) – napˇr. Schank rozpozn´av´ a na 70 r˚ uzn´ ych vztah˚ u, rozliˇsiteln´ ych pˇr´ımo podle lex. v´ yznamu slova.
7.1
V´ yznamov´ y z´ apis vˇ ety
V´ yznamov´ y z´ apis vˇety m˚ uˇze b´ yt podkladem pro s´ıt’ znalost´ı. V´yznam lze vztahovat nejen na jednotliv´a slova ve vˇetˇe, ale i na cel´e vˇety (lze zjiˇst’ovat, jestli tvrd´ı to sam´e). Lze ˇr´ıct, ˇze dva v´ yrazy maj´ı ten sam´ y v´ yznam, pokud se daj´ı zamˇenit kdekoliv kromˇe metajazykov´ ych kontext˚ u (tedy pˇri pouˇzit´ı jak v intenzion´aln´ım, tak v extenzion´ aln´ım smyslu). Vˇety potom maj´ı stejn´ y v´ yznam, pokud v nich jsou na stejn´ ych pozic´ıch v´ yrazy o stejn´em v´ yznamu. Takov´ yto v´ yznam odpov´ıd´ a tektogramatick´emu z´ apisu vˇety. Je ale v´az´an jen na jazyk, bez vztahu k objekt˚ um mimojazykov´e reality, pokud v´ yznam vzt´ ahneme k realitˇe, dostaneme smysl vˇety. Kromˇe smyslu si posluchaˇc z vˇety odvod´ı dalˇs´ı d˚ usledky, inference, jazykov´e ekvivalenty vˇety. V´ yznamov´ y z´ apis vych´ az´ı ze z´ avislostn´ıho popisu, jde o ˇctveˇrici M, D, W, T , kde: • M je mnoˇzina uzl˚ u (v´ yraz˚ u pouˇzit´ ych ve vˇetˇe v jednotl. pozic´ıch), • D je relace, vytv´ aˇrej´ıc´ı graf – strom nad objekty z M , • W je relace uspoˇr´ ad´ an´ı uzl˚ u, splˇ nuj´ıc´ı podm´ınku projektivity; hloubkov´ y slovosled, • T je zobrazen´ı mnoˇziny M do mnoˇziny A (slovn´ıku tektogramatick´e roviny). Prvky slovn´ıku tektogramatick´e roviny A potom sest´avaj´ı z: • lexik´ aln´ıho v´ yznamu v´ yrazu; • gramat´em˚ u – morfologick´ ych u ´daj˚ u (”v´ yznamov´ y” slovn´ı druh, tj. napˇr. ”pouˇz´ıt” a ”pouˇzit´ı” jsou s´emantick´ ymi slovesy), rozliˇsuje se tu i aktu´ aln´ı ˇclenˇen´ı; • funktoru – druhu z´ avislosti na nadˇr´ızen´em ˇclenu (aktor, patiens, p˚ uvod apod.) Tektogramatick´ ym slov˚ um pˇriˇrazujeme valenˇcn´ı r´amce a doplˇ nujeme dalˇs´ı slova jako doplnˇen´ı. K tomuto je nutn´e pˇridat jeˇstˇe vztah souˇradn´eho spojen´ı, aby bylo moˇzn´e zapsat vˇsechny vˇety. Probl´emem je tak´e zachycen´ı mezivˇetn´ ych vztah˚ u – m˚ uˇzeme vych´azet ze z´apisu jednotliv´ ych vˇet, je ale nutn´e spojit odkazov´ an´ı se na stejn´e objekty, pˇr´ıpadnˇe vztahy mezi nimi (ˇc´ast-celek, druh-instance). Nejsloˇzitˇejˇs´ı je postarat se o odkazovac´ı z´ ajmena – odkazov´ an´ı dopˇredu, zpˇet, zvratnost, odliˇsnosti na z´akladˇe akt. ˇclenˇen´ı.
7.2
Metoda TIBAQ: Text and Inference Based Answering of Questions
Projekt vypracovan´ y na KAM MFF s pomoc´ı v´ yznamov´ ych z´apis˚ u vˇet a porozumˇen´ı jazyku s inferenˇcn´ımi pravidly. Porozumˇen´ı se ovˇeˇruje schopnost´ı vyhledat odpovˇed’ na ot´azku v pˇrirozen´em jazyce. Nejde aˇz tolik o zodpov´ıd´ an´ı ot´ azek, d˚ uleˇzit´ y je zp˚ usob pr´ ace s jazykem. Syst´em obsahuje: • Morfologickou a syntakticko-s´emantickou anal´ yzu vˇety (pˇreveden´ı do v´ yznamov´eho z´apisu) • Soubor znalost´ı (kam jsou ukl´ ad´ any v´ yznamov´e z´apisy oznamovac´ıch vˇet) • Syst´em v´ ybˇeru relevantn´ıch znalost´ı, aplikace inferenˇcn´ıch pravidel (a vytvoˇren´ı z´asoby relevantn´ıch / rozˇs´ıˇren´ ych znalost´ı) pro ot´ azky na vstupu • Syst´em v´ ybˇeru a synt´ezy odpovˇedi (vybere se z rozˇs´ıˇren´ ych znalost´ı takov´a, kter´a m´a stejnou lex. hodnotu vrcholu a cestu ve stromˇe aˇz k t´ azac´ımu slovu jako ot´azka) Zkouˇselo se na ˇcl´ anku o operaˇcn´ım zesilovaˇci, bylo zjednoduˇsen´ı (napˇr. nemˇelo schopnost instanciace typu). Mˇelo to inferenˇcn´ı pravidla typu ”m˚ uˇze dˇelat” –¿ ”dˇel´ a”, odvozov´an´ı typu ”X je Y” a ”X dˇel´a Z” –¿ ”X je Y, kter´e dˇel´ a Z”.
5
8
Probl´ emy syntaktick´ e anal´ yzy
8.1
Druhy syntaktick´ e anal´ yzy
Rozliˇsuj´ı se dvˇe z´ akladn´ı strategie: • Shora dol˚ u – pravou stranou pravidla se pˇrepisuje lev´a strana, vych´az´ı se od symbolu S pro vˇetu. Podob´ a se generativn´ı gramatice. • Zdola nahoru – zaˇc´ın´ a se od slov, postupnˇe se nahrazuj´ı synt. kategoriemi aˇz do S. Tj. najdu-li pravidla, kter´ a dojdou aˇz k S, pak je vˇsechno v poˇr´ adku, jinak backtrackuju. D´ıv´ am se, ke kter´ ym kategori´ım patˇr´ı slova ve slovn´ıku. U obou strategi´ı je bˇeˇzn´ y zp˚ usob z´apisu strom. Kromˇe shora dol˚ u a zdola nahoru existuje i zp˚ usob pr˚ uchodu middle-out – najdu sloveso a zjiˇst’uju doplnˇen´ı. Jde vlastnˇe o z´ avislostn´ı pˇr´ıstup k probl´emu, de facto tak dnes pracuj´ı anal´ yzy ˇceˇstiny. Jinou moˇznost´ı z´ apisu bˇehem hled´ an´ı je pˇ rechodov´ a s´ıt’ (transition network). To je vyn´alez Woodse (1978), idea Kaye (chart parser). Jde o pˇrechod zleva doprava vˇetou s pomoc´ı pˇrepisovac´ıch pravidel, na z´akladˇe koneˇcn´eho automatu se schopnost´ı backtrackingu (pˇrechody pˇredstavuj´ı hrany). V 80. letech se opravdu pouˇz´ıvalo, bylo to povaˇzov´ ano za u ´spˇech. Kay tvrdil, ˇze kromˇe fr´ azov´ ych to bude fungovat i pro z´avislostn´ı gramatiky. Hlavn´ı probl´em ale nastal pro jazyky s voln´ ym slovosledem (napˇr. na zaˇc´atku vˇety mus´ı b´ yt pravidla u ´plnˇe pro vˇsechno, takˇze se to stane ne´ unosnˇe n´ aroˇcn´ ym na v´ ypoˇcet), coˇz uk´ azal Sgall. Ani morfologick´a anal´ yza tomu nepomohla. Podobn´e probl´emy se slovosledem mˇeli i pˇri pouˇz´ıv´ an´ı v Polsku. ˇ ek vˇetˇsinou pˇri porozumˇen´ı vˇety pouˇz´ıv´ Clovˇ a zn´am´e informace, neˇcemu d´av´a pˇrednost, jde smˇerem k determinismu.
8.2
V´ıceznaˇ cnost a jej´ı ˇ reˇ sen´ı
ˇ sen´ı: Probl´em – syntaktick´ a v´ıceznaˇcnost (napˇr. Majitel drˇzel psa v domˇe: ”drˇzel v domˇe”, nebo ”pes v domˇe”?). Reˇ 8.2.1
Strategie ”Minimal attachment”
Chci co nejmenˇs´ı poˇcet uzl˚ u v bezprostˇredn´ıch sloˇzk´ach, nebo co nejmenˇs´ı poˇcet u ´rovn´ı v z´avislostn´ım stromˇe (tam nem´ am meziuzly). Tato strategie byla od˚ uvodˇ novan´a podobn´ ymi pochody v mysli ˇclovˇeka (”We painted all the walls with cracks.” – vˇetˇsinou ˇclovˇek ˇrekne ”painted with cracks”, i kdyˇz je to blbost). 8.2.2
Strategie pˇ ripojen´ı zprava
Jin´ a strategie, zast´ avan´ a jin´ ymi lingvisty. Nov´e sloˇzky se pˇrednostnˇe pˇripoj´ı k nejbliˇzˇs´ı (pr´avˇe objeven´e) sloˇzce, ne k nˇejak´e objeven´e dˇr´ıve. N´ ahodnˇe se m˚ uˇze shodovat s pˇredchoz´ı. U z´avislostn´ıch strom˚ u se vyb´ır´a sp´ıˇs konstrukce, kter´ a je projektivn´ı (ale ne vˇzdy to plat´ı). 8.2.3
Lexik´ aln´ı preference
Kontrola pro spojen´ı, tj. pokud se rozhodnu pro nˇejak´e spojen´ı podle libovoln´e z pˇredchoz´ıch strategi´ı, zkontroluju, jestli to d´ av´ a smysl podle lexik´ aln´ıch spojen´ı (napˇr. ”vyndat kn´ıˇzku z poliˇcky” x ”ˇc´ıst kn´ıˇzku z poliˇcky”). Nˇekdy ale stejnˇe nestaˇc´ı (”kreslit tuˇzkou na oboˇc´ı”).
8.3
Garden path sentences
Jsou vˇety, kter´e je tˇeˇzk´e zanalyzovat, kter´e klamou. Nev´ım hned, ˇze m´am r˚ uzn´e moˇznosti syntaktick´e anal´ yzy. Napˇr. ”The horse raced past the barn fell.” Slovo raced vypad´a jako ˇcasovan´e sloveso, ale je particip. V angliˇctinˇe je probl´em kategori´ aln´ı v´ıceznaˇcnosti, vˇetˇs. se dˇelaj´ı heuristiky na z´akl. shody podmˇetu s pˇr´ısudkem apod. ˇ ek je zˇrejmˇe neˇreˇs´ı zkouˇsen´ım vˇsech moˇznost´ı, m´a nˇejak´ Clovˇ y look-ahead, ale ne aˇz do konce vˇety. Nev´ı se kolik, 1-2-3 jednotky? Slova nebo struktury? Za magickou hranici se povaˇzuje 7 slov / struktur dopˇredu. Pokus o ˇreˇsen´ı – Mitch Markus (Pennsylvania Univ., ˇz´ ak Chomsk´eho, 1980) – analyz´ator Parsifal se z´asobn´ıkov´ ym look-aheadem (na 3 struktury), nˇejak to fungovalo, ale stejnˇe mˇelo probl´emy.
8.4
Probl´ emy zpracov´ an´ı pˇ rir. jazyka
• Jazykov´e v´ yrazy se vˇzdy vztahuj´ı k situaci, mluvˇc´ı vyj´adˇren´ım rozum´ı v´ıce, neˇz ˇreknou: – V´ yznam slova nebo slovn´ıho spojen´ı je z´avisl´ y na kontextu, kter´ y pˇredch´az´ı nebo n´asleduje (a hlavnˇe n´ aslednost je probl´em). – V´ yznam textu nen´ı jen sloˇzen´ım slov nebo vˇet, ze kter´ ych se skl´ad´a, ale i situace, ve kter´e je uˇzit´ y. Tedy pˇri porozumˇen´ı textu ˇclovˇek hled´ a i ve vlastn´ı hlavˇe, um´ı interpretovat. Poˇc´ıtaˇc potˇrebuje ”vˇedˇet”, nebo m´ıt ”model svˇeta”. 6
– Slovn´ı spojen´ı v r˚ uzn´ ych jazyc´ıch si neodpov´ıdaj´ı, specifick´a pouˇzit´ı slov si neodpov´ıdaj´ı (napˇr. ”loose ice” - ”offenes Eis” - ”rozt´ at´ y led”, ”validate a ticket” - ”Karte entwerten”) • V´ ybˇer adekv´ atn´ıho ekvivalentu v jin´em jazyce je probl´em (v pˇredch. se d´a jeˇstˇe naj´ıt): – nˇekter´e jazyky rozliˇsuj´ı, jin´e ne. Napˇr. ”fish” -¿ ”pescado” / ”pez”, ”go” -¿ ”j´ıt” / ”jet” apod. – V nˇekter´ ych jazyc´ıch jsou nˇekt. gramatick´e kategorie, jinde ne, mus´ı se h´adat. • Co je jeˇstˇe pˇreklad a co uˇz v´ yklad? Kdy si ˇclovˇek mus´ı text pˇri pˇrekladu vyloˇzit? • Nejednoznaˇcnosti v jazyce – nejlepˇs´ı je je zachovat i ve v´ ystupu: – Lexik´ aln´ı (”All of the expressions are typed.”) – Syntaktick´e (”Attach the amplifier to the output terminal with the red dot.” x ”Attach the amplifier to the output terminal with the red wire”).
9
Probl´ emy s´ emantick´ e interpretace, reference
9.1
S´ emantick´ a interpretace
Je nutn´e odliˇsovat jazykov´ y v´ yznam a kognitivn´ı obsah (ten je d´an mimojazykovˇe, ”v´ yznam je obsah v zrcadlen´ı formy, vyj´ adˇren´ım obsahu formou se projev´ı rozd´ıly ve v´ yznamu”). Pro v´ yznam staˇc´ı odstranˇen´ı lexik´aln´ı a syntaktick´e v´ıceznaˇcnosti. Pro obsah je nutn´e m´ıt znalost svˇeta a situaci. Pˇrirozen´e inference ze slov, kter´e ˇclovˇek udˇel´ a, se daj´ı vyj´adˇrit ve slovn´ıku. Slovn´ık pak obsahuje: • s´ emantick´ e rysy – to, co slovo samo o sobˇe obsahuje (napˇr.: prezident: muˇz, ˇclovˇek, st´atn´ık) • selekˇ cn´ı omezen´ı – do jak´eho kontextu se m˚ uˇze slovo vloˇzit (napˇr.: ˇzr´at: subjekt - ˇzivotn´e, nelidsk´e + pˇredmˇet - jedl´ y; plat´ı jen pro jeden v´ yznam) Sloveso a jeho doplnˇen´ı se d´ a taky interpretovat na rovinˇe v´ yznamu nebo obsahu: • Z hlediska v´ yznamu je ”stroj bˇeˇzel” a ”Honza bˇeˇzel” a ”potok bˇeˇzel” to sam´e, jde o agens • Z hlediska obsahu z´ avis´ı s´emantick´e role na konkr´etn´ım slovese, nelze dˇelat moc pˇresun˚ u (”koupit” nelze beze vˇseho pˇrev´est na ”prodat”) Pˇri interpretaci by se nemˇela vynech´ avat gram. struktura, napˇr. kv˚ uli negac´ım, kvantifikaci apod., kv˚ uli aktu´ aln´ımu ˇclenˇen´ı.
9.2
Probl´ emy referenc´ı
Reference jsou z´ aleˇzitost´ı roviny obsahu. Druhy: • anaforick´ a (koreference) – odkazy k pˇredchoz´ımu textu – v r´ amci jedn´e vˇety, mezivˇetn´ a – jak daleko se lze odkazovat? 98 • neanaforick´ a – odkazy u ´plnˇe mimo text (to co se jeˇstˇe v textu neobjevilo). Probl´emy: • Odkazov´ an´ı k pˇr´ıbuzn´ym prvk˚ um – dvˇe moˇznosti ˇreˇsen´ı: bud’ zav´adˇet do b´aze znalost´ı asociovan´e prvky hned, nebo aˇz budou potˇreba, je hledat. Hajiˇcov´a doporuˇcuje nˇeco mezi t´ım, h´adat, jestli bude asociovan´ y prvek potˇreba. • Odkazov´ an´ı k prvk˚ um mnoˇziny, odkazov´ an´ı k dˇej˚ um – podobn´e. • Rozd´ıl odkazov´ an´ı v atributivn´ım a referenˇcn´ım smyslu (”Potkal jsem pˇredsedu.” x ”Chci b´ yt zvolen pˇredsedou.”) • Odkazov´ an´ı vpˇred.
7
10
Historick´ y pohled na strojov´ y pˇ reklad
Prvn´ı myˇslenka strojov´eho pˇrekladu – Warren Weaver (1946, v dopise N. Wienerovi) na z´akladˇe deˇsifrace Enigmy (mysl´ı, ˇze je to stejn´ y proces). V roce 1949 pak v USA vyˇslo memorandum Translation, kter´e odstartovalo pr´ ace, hl. v podnikov´ ych u ´stavech. Prvn´ı sympozium se uskuteˇcnilo 1952 (jeˇstˇe pˇred Chomsk´eho disertac´ı, Chomsky s´am pop´ır´ a souvislost sv´e pr´ ace s poˇc´ıtaˇci). 1954 prvn´ı projekt – Geoergetown Univ. (Washington) + IBM: Rusko-anglick´ y pˇreklad 250-slovn´eho textu (vybran´ ych vˇet z jednoho konkr´etn´ıho ˇcl´ anku) podle 6 syntaktick´ ych pravidel. Rusko-anglick´ y – na z´akladˇe studen´e v´ alky. Vznik´ a ˇcasopis Machine Translation. V SSSR se t´ım taky zaˇcli zab´ yvat – pˇreklad anglicko-rusk´ y, skupiny v Moskvˇe a Leningradˇe; nemˇeli poˇc´ıtaˇce, ˇslo o teoretick´ y popis, ale ten byl dost dobr´ y. Dalˇs´ı centra pˇrekladu – Cambridge (Margaret Masterman, Martin Kay), Grenoble (Bernard Vaquois) – tam spolupracovali s Moskvou. Kanada – Alain Colmerauer, Richard Kittridge – vytvoˇrili syst´em Q-jazyk (vyuˇz´ıvaj´ıc´ı unifikace nad vˇetami reprezentovan´ ymi acyklick´ ymi grafy) a na nˇem postaven´e syst´emy TAUM METEO (1978, dodnes se pouˇz´ıv´a). V Praze 1959 prvn´ı pokus o pˇreklad 4 vˇet z angliˇctiny, taky 6-8 pravidel, dˇelalo se na 1. ˇcesk´em poˇc´ıtaˇci Prof. Svobody. Zaloˇzeno oddˇelen´ı algebraick´e lingvistiky a teorie pˇrekladu na FF. Susumu Kuno vytvoˇril na Harvardu prediktivn´ı anal´yzu – parsov´an´ı vˇety odleva s backtrackingem, vyb´ıral si v kaˇzd´em kroku nˇejak´e predikce. Proti tomu Rusov´e shlukuj´ı dohromady vˇeci, co jsou vedle sebe – origin´aln´ı pˇr´ıstup, je na tom vidˇet charakter ruˇstiny proti angliˇctinˇe. Hajiˇcov´a, Jel´ınek v Praze 1962 chtˇeli prediktivn´ı anal´ yzu vyuˇz´ıt, ale pak doˇslo k organizaˇcn´ım obt´ıˇz´ım. 1960 prohl´ asil Yehoshua Bar-Hillel, ˇze ”fully automatic high quality” strojov´ y pˇreklad je nemoˇzn´ y, coˇz zvedlo skepsi. Na z´ akladˇe jeho prohl´ aˇsen´ı vytvoˇren v´ ybor ALPAC (Automatic Language Processing Advisory Committee), ˇ sloˇzen´ y z ekonom˚ u, technik˚ u, informatik˚ u, jednoho lingvisty. Ten vydal 1965 zpr´avu – tzv. Cernou knihu, kde postuluje: 1. d˚ uraz na rychlost a ekonomiˇcnost ruˇcn´ıho pˇrekladu, 2. podporu projekt˚ u komputaˇcn´ı lingvistiky, 3. podporu lingvistick´eho v´ yzkumu, bez ohledu na aplikace. Zpr´ ava neznˇela u ´plnˇe pesimisticky, ale bez ohledu na doporuˇcov´an´ı se spousta ambic´ı, projekt˚ u zavˇrela. Lidi na tom d´ al nepracovali, skonˇcila finanˇcn´ı podpora. Nˇekter´a pracoviˇstˇe (hl. mimo USA) pˇreˇzila. Se vznikem EU – potˇreba mnohojazyˇcnosti, pouˇzit´ı nemoˇzn´eho SYSTRANu (1973), vytvoˇren´ı projektu EUROTRAN (1983) pro pˇreklad ze vˇsech jazyk˚ u. Ten byl u ´spˇeˇsn´ y jen pap´ırovˇe, vzbudil ale z´ajem o pˇreklady, dalˇs´ı v´ yzkum. D˚ uvod ne´ uspˇechu EUROTRANU – decentralizace v´ yzkumu, nepouˇzit´ı pˇrevodn´ıho jazyka. Udˇelalo se ale dost pr´ ace na dvoujazyˇcn´ ych pˇrekladech.
10.1
Mnohojazykov´ y pˇ reklad
R˚ uzn´e pˇr´ıstupy: • Bˇeˇznˇe pro kaˇzd´e dva jazyky pˇr´ımo ze zdroje k c´ıli • Pˇres interlinguu – pˇrevodn´ı jazyk, kter´ y je univerz´aln´ı. Pak existuje pro kaˇzd´ y jazyk jen jedna anal´ yza a jedna synt´eza. • Nˇeco mezi t´ım – pˇres transfer – mal´ y, ale jazykovˇe z´avisl´ y modul Metoda pˇres transfer je obvykl´ y pˇr´ıstup, i Vaquois˚ uv. V anal´ yze se pˇrestane, kdyˇz uˇz d´al nem˚ uˇzu abstrahovat bez ztr´ aty v´ yznamu.
11 11.1
R˚ uzn´ e pˇ r´ıstupy ke strojov´ emu pˇ rekladu Example-based
Zaloˇzen´ y na dvojjazyˇcn´ ych korpusech (Nagao), poˇc´ıt´a pravdˇepodobnosti, kter´e ˇc´asti korpusu pouˇz´ıt (exact match, partial match), probl´em je udˇelat spr´ avnou metriku podobnosti vˇet, vytvoˇrit dost velk´ y korpus. Dodnes se v Japonsku pouˇz´ıv´ a.
11.2
Knowledge-based
ˇ adalo se po tom sp´ıˇse znalost vnˇejˇs´ıho svˇeta neˇz znalost pˇreklad˚ Z´ u fr´az´ı, mˇelo obsahovat odvozov´an´ı. Nedoˇslo se s t´ım daleko, hodnˇe pr´ ace a m´ alo v´ ysledk˚ u. Probl´em: nutn´e zn´at ”vˇsechno”.
8
11.3
Translation by negotiation
V mnohojazyˇcn´em pˇrekladu, vych´ az´ı z myˇslenky pˇribl´ıˇzen´ı se interlingue, vyr´abˇel M. Kay. Jednotliv´e moduly by se mˇely mezi sebou domluvit, kdyˇz anal´ yza dojde k maxim´aln´ı moˇzn´e abstrakci, hlavnˇe na nejednoznaˇcnostech ve vstupu (a jejich interpretaci nebo ponech´ an´ı). Nejde tedy jen o pˇrevod do transferu. Jde jen o teoretick´e myˇslenky, podle Hajiˇcov´e slibn´e.
11.4
Praˇ zsk´ y pˇ r´ıstup
Plnˇe automatick´ y: Z. Kirschner, A. Rosen. Z´ avislostn´ı, mnohovrstevn´ y, lingvisticky zaloˇzen´ y pˇreklad z angliˇctiny do ˇceˇstiny, s jazykem Q (TAUM METEO). Nemˇel ˇz´adn´ y transfer, probl´emy hlavnˇe v rozd´ılech obou jazyk˚ u. Vesel´ a historka, kdy m´ alem selhalo pˇredveden´ı kontrole z ministerstva kv˚ uli nedoplnˇen´e teˇcce za vˇetou. Poloautomatick´ y: P. Strossa – spec. typ text. editoru.
12
Statistick´ y strojov´ y pˇ reklad
Pˇredpokl´ ad´ a se jazykov´y model P (E) a pˇrekladov´y model P (F |E), kde F symbolizuje francouzsk´ y text a E anglick´ y. Potom c´ılem je naj´ıt co nejlepˇs´ı F pro E s pomoc´ı jazykov´eho a pˇrekladov´eho modelu, o coˇz se star´a search procedure. Chyby mohou nastat v obou modelech i pˇri hled´an´ı (hlavnˇe pro pˇr´ıliˇs sloˇzit´e search procedury). Jazykov´ y model se typicky dˇel´ a s pomoc´ı trigram˚ u nebo rozhodovac´ıch strom˚ u, ˇcehokoliv, co jde pak nasadit na hled´an´ı. Mnohem lepˇs´ı model se dostane s pomoc´ı morfologick´e anal´ yzy, teoreticky i se syntaktickou anal´ yzou, ale ta v praxi vˇetˇsinou zat´ım moc nepom´ ah´ a. Lze udˇelat drastick´e zjednoduˇsen´ı modelu na odpov´ıd´an´ı si slovo od slova. Je to hodnˇe pˇribliˇzn´e, ale poˇr´ ad jeˇstˇe relevantn´ı – pˇreklad je (mimo jin´e) d´ an slovem. Teoreticky by ˇslo dˇelat z´avislosti na slovn´ıch spojen´ıch, ale na to b´ yv´ a m´ alo dat. Aby se vyrovnal poˇcet slov v obou vˇet´ ach, prov´ad´ı se alignment (p´ arov´ an´ı). Tak m˚ uˇzou tˇreba nˇekter´ a slova i vypadnout, sp´ aruj´ı se s nulov´ym slovem. . And the program has been implemented / / / / / / | \ . Le programme a ´ et´ e mis en application Kv˚ uli search proceduˇre m˚ uˇze z francouzˇstiny pro kaˇzd´e slovo jen jeden spoj (opaˇcnˇe to nevad´ı) – jinak by bylo pro |F | = m a |E| = l aˇz 2l·m spojen´ı, takhle z´ısk´ame jenom (l + 1)m , coˇz je o dost m´enˇe. Tohle se d´a ale ˇreˇsit pˇredzpracov´ an´ım, protoˇze pokud by mˇelo z francouzˇstiny v´est v´ıce spoj˚ u, p˚ ujde vˇetˇsinou o odborn´e term´ıny. Ty se daj´ı potom povaˇzovat za jednolit´ y celek. Alignment je potˇreba natr´enovat, nejl´epe ruˇcnˇe, coˇz ale vzhledem k objem˚ um dat nen´ı moc provediteln´e. Pouˇz´ıv´ a se na to strojov´e uˇcen´ı. Kdybychom pˇridali alignmenty do modelu, museli bychom ho cel´ y pˇrepoˇc´ıtat pˇres pravdˇepodobnost vˇsech moˇzn´ ych alignment˚ u, coˇz by bylo moc sloˇ z it´ e . Proto se vol´ ı jeden alignment a povaˇ z uje za spr´ a vn´ y . Potom plat´ ı Qm j−1 P (F, A|E) = P (m|E) j=1 P (aj |aj−1 , m, E)P (fj |aj1 , f1j−1 , m, E) 1 , f1 Alignment je funkce, m´ a tedy jen jednu hodnotu, takˇze jde spoˇc´ıtat. Kaˇzd´e slovo v c´ılov´em jazyce je tak urˇceno z alignment˚ u od nˇej vlevo a ze slova v p˚ uvodn´ım jazyce. Tohle je poˇr´ ad moc sloˇzit´e – v praxi se udˇel´a jeden hodnˇe jednoduch´ y model a podle nˇej se ˇr´ıd´ı vyˇsˇs´ı a vyˇsˇs´ı modely. Celkovˇe dost´ av´ am pˇetistupˇ novou hierarchii (podle prvn´ıho pouˇzit´ı v IBM, stupnˇe jsou ust´alen´e): • Model 1 poˇc´ıt´ a pravdˇepodobnost d´elky angl. vˇety v z´avislosti na franc. vˇetˇe (aby nedovoloval pˇreloˇzit dlouhou angl. jako kr´ atkou franc. a naopak). Slova jsou na sobˇe nez´avisl´a. • Model 2 podporuje svisl´ y alignment (ve smˇeru pomˇeru d´elek vˇet), tj. preferuje se shodn´ y slovosled. • Model 3 se d´ıv´ a, kolik spoj˚ u vede z angliˇctiny k francouzˇstinˇe (tj. poˇcet spoj˚ u z jednoho slova) a zjiˇst’uje pravdˇepodobnosti poˇctu v z´ avislosti na slovˇe. Sniˇzuj´ı se pravdˇepodobnosti pro alignmenty, kter´e se hodnˇe kˇr´ıˇz´ı ve vˇetˇe (distortion). • Model 4 opˇet zv´ yˇs´ı pravdˇepodobnosti pro distortion cel´ ych fr´az´ı (aby se daly pˇresouvat ve vˇetˇe). • Model 5 odstran´ı deficiency, tj. zaˇr´ıd´ı, aby nenulovou pravdˇepodobnost nedostalo nˇeco, co nen´ı ˇretˇezec (m´ a m´ıt dvˇe slova na stejn´e pozici). M˚ uˇze ale b´ yt vypuˇstˇen, v´ ysledek vˇetˇsinou uˇz moc neovlivn´ı. Po natr´enov´ an´ı vˇsech model˚ u (postupnˇe vyˇsˇs´ı nad niˇzˇs´ım) uˇz m´am jen nejvyˇsˇs´ı a ten pouˇz´ıv´am. Search procedura pro dan´ y v´ ystup ve francouzˇstinˇe najde odpov´ıdaj´ıc´ı vstup v angliˇctinˇe (tj. hled´a ”obr´ acenˇe”). Proch´ az´ı vˇetu postupnˇe, alignuje a podle pravdˇepodobnost´ı z modelu si pamatuje n nejlepˇs´ıch a zbytek zahazuje (A*-algoritmus). Je tu nutn´e porovn´ avat pravdˇepodobnosti jen pro prefixy stejn´e d´elky!
9
Pˇredem se mohou udˇelat (nejl´epe pro oba jazyky) nˇekter´a vylepˇsen´ı – tagov´an´ı, lematizace a disambiguizace v´ yznam˚ u slov (na z´ akladˇe kontextu). Mohou se lepit i nˇekter´e term´ıny, aby se pˇrekl´adaly pˇresnˇe. V´ ysledek pˇr´ıpravy pak povaˇzuju za ”slova” a search procedura s nimi norm´alnˇe pracuje. Hlavn´ım probl´emem tˇechto typ˚ u pˇreklad˚ u jsou ”sparse data” – paraleln´ıch dat je m´alo a typicky nepotk´am dvakr´ at stejnou vˇetu. Nejv´ıc dat existuje pr´ avˇe pro angliˇctinu a francouzˇstinu d´ıky kanadsk´e dvojjazyˇcnosti. Pro ˇceˇstinu a angliˇctinu je dat m´ alo a nav´ıc jsou probl´emy s pr´avy je pouˇz´ıvat.
13
Textovˇ e lingvistick´ y pˇ r´ıstup – aktivovanost prvk˚ u v textu
Zaj´ım´ ame se o n´ avaznost vˇec´ı na sebe, o aktu´ aln´ı ˇclenˇen´ı. Pˇredpokl´ad´ame pˇri zaˇc´atku komunikace (textu): • Sd´ılenou z´ asobu znalost´ı (stock of shared knowledge) – z´asoby znalost´ı producenta i adres´ata se ˇc´asteˇcnˇe pˇrekr´ yvaj´ı, c´ılem je pˇrekryv zv´ yˇsit. • Ve sd´ılen´e z´ asobˇe znalost´ı je od zaˇc´ atku hierarchie aktivovanosti – nˇekter´e objekty jsou v´ıce v popˇred´ı neˇz jin´e. V pr˚ ubˇehu komunikace se aktivovanost m˚ uˇze mˇenit, hovor ji ovlivˇ nuje. Pˇri stanoven´ı pravidel zmˇeny aktivovanosti vych´ az´ıme z akt. ˇclenˇen´ı vˇety. Dost´ av´ ame pˇet heuristik (pˇribliˇzn´ ych): 1. Pˇri vstupu do textu je poˇrad´ı topic-focus (ˇr´ık´am o nˇeˇcem nˇeco), tedy pˇredpokl´ad´ame, ˇze aktivovanost prvk˚ uv z´ akladu je vysok´ a, ale ne tak vysok´ a, aby focus nepˇrekryl topic. 2. Potom focus pˇrekryje topic – je jeˇstˇe aktivovanˇejˇs´ı. 3. To, o ˇcem nemluv´ım, aktivovanost ztr´ ac´ı. 4. Rychlost ztr´ acen´ı aktivovanosti z´ avis´ı na tom, jak moc a jak dlouho byl objekt aktivovan´ y pˇredt´ım. 5. Kdyˇz m´ a nˇeco urˇc. stupeˇ n aktivovanosti, ovlivˇ nuje to i ”asociovan´e” prvky (Tenhle bod je dost sloˇzit´ y, je obt´ıˇzn´e se j´ım zab´ yvat). Aktivovanost se d´ a vyj´ adˇrit ˇc´ısly (stupeˇ n aktivovanosti je ˇc´ıslo), z´avis´ı ale hlavnˇe na jejich pomˇeru, ne na konkr´etn´ıch hodnot´ ach. De facto se aktivovanost chov´ a jako z´asobn´ık, nahoˇre jsou aktivovan´e koncepty, neaktivovan´e klesaj´ı. D´ a se nakreslit graf aktivovanosti, vytv´ aˇr´ı zvl´aˇstn´ı patterny – ˇc´ary ”kooperuj´ı”, dlouho z˚ ust´av´a v popˇred´ı jeden koncept, ˇc´ımˇz se daj´ı nal´ezt segmenty textu. M˚ uˇzu podle aktivovan´ ych prvk˚ u ˇr´ıct, ”o ˇcem to je”, tedy domyslet si t´ema ˇcl´ anku, aˇc nen´ı v nadpisu – napˇr. podle r´ amc˚ u situac´ı. Podle toho je moˇzn´e hodnotit i kvalitu pˇrekladu textu. Text se m˚ uˇze ted’ segmentovat nejen ”horizont´alnˇe” na odstavce, ale i ”vertik´alnˇe” – jak daleko klesl prvek v aktivovanosti? To je d˚ uleˇzit´e pro z´ ajmenn´e reference. Hranice toho, co jeˇstˇe m˚ uˇze b´ yt odk´az´ano z´ajmenem, se asi ned´ a ˇc´ıselnˇe vyj´ adˇrit pˇresnˇe, ale odhadnout na konkr´etn´ım textu jde. Podle toho by se moˇzn´a dalo vyrobit i pravidla odkazov´ an´ı. Mnohem sloˇzitˇejˇs´ı je zaznamenat takhle dialog – nev´ıme, zda je lepˇs´ı br´at mluvˇc´ı oddˇelenˇe nebo dohromady. Pro automatick´e vyr´ abˇen´ı anal´ yzy aktivovanosti by bylo potˇreba vyˇreˇsit koreference, odkazov´an´ı na ˇc´ast celku apod.
10