SEGÉDKÖNYVEK A NYELVÉSZET TANULMÁNYOZÁSÁHOZ 150.
FOGALMI RENDSZEREK ÉS LEXIKAI HÁLÓZATOK A MENTÁLIS LEXIKONBAN
KOVÁCS LÁSZLÓ
TINTA KÖNYVKIADÓ
FOGALMI RENDSZEREK ÉS LEXIKAI HÁLÓZATOK A MENTÁLIS LEXIKONBAN
SEGÉDKÖNYVEK A NYELVÉSZET TANULMÁNYOZÁSÁHOZ 150.
FOGALMI RENDSZEREK ÉS LEXIKAI HÁLÓZATOK A MENTÁLIS LEXIKONBAN 2. átdolgozott, bővített kiadás
KOVÁCS LÁSZLÓ
TINTA KÖNYVKIADÓ BUDAPEST 2013
SEGÉDKÖNYVEK A NYELVÉSZET TANULMÁNYOZÁSÁHOZ 150. Sorozatszerkesztő: KISS GÁBOR
A második kiadást lektorálta: LENGYEL ZSOLT
Az első kiadást lektorálta: BALASKÓ MÁRIA LENGYEL ZSOLT NAVRACSICS JUDIT
ISSN 1419-6603 ISBN 978-615-5219-35-1
© A szerző, 2013 2. átdolgozott, bővített kiadás Felelős kiadó a Tinta Könyvkiadó igazgatója
Nyomdai munkák:
TARTALOM Előszó az első kiadáshoz ..................................................................................... 7 Előszó a második kiadáshoz ................................................................................ 9 1. Bevezetés....................................................................................................... 11 2. Fogalmi szerveződés és mentális lexikon...................................................... 21 2.1 A mentális lexikon.................................................................................. 22 2.1.1 Tárolás a mentális lexikonban........................................................ 25 2.1.2 Fogalmak rendszerezése a mentális lexikonban............................. 27 2.1.3 Szemantikai hálók .......................................................................... 30 2.2 A mentális lexikon vizsgálata: szóasszociációk .................................... 34 2.2.1 A szóasszociációs vizsgálatok módszertana................................... 34 2.2.2 Szóasszociációs kutatások eredményei .......................................... 41 2.3 A mentális lexikon néhány vizsgálati aspektusa .................................... 44 2.3.1 Gyermekek fogalmi elsajátítása ..................................................... 44 2.3.2 Kétnyelvű mentális lexikon............................................................ 46 2.4 Fogalmi rendszerek és kognitív nyelvészet ............................................ 50 2.4.1 Fogalmi szerveződés kognitív megközelítésben: a prototípus-elmélet................................................................................. 51 2.4.2 A fogalmi szerveződések további megközelítései a kognitív nyelvészetben .......................................................................................... 56 2.5 Kitekintés: szómezőkutatás .................................................................... 58 2.6 Összegzés ............................................................................................... 60 3. Hálózatkutatás ............................................................................................... 61 3.1 A hálózatkutatás mint diszciplína........................................................... 61 3.2 Hálózatok felépítése ............................................................................... 65 3.2.1 A hálózaton belüli kapcsolatok jellemzői ...................................... 68 3.2.2 Skálafüggetlen hálózatok belső struktúrája.................................... 70 3.3 Hálózatok kisvilág-karaktere.................................................................. 71 3.4 Hálózatok dinamikus vizsgálata ............................................................. 72 3.4.1 Hálózatok kialakulása és fejlődése................................................. 73 3.4.2 Hálózatok működése ...................................................................... 73 3.4.3 Hálózatok sebezhetősége................................................................ 75 3.5 Hálózatkutatási eredmények alkalmazási lehetőségei............................ 75 3.6 Összegzés ............................................................................................... 77 4. Hálózatkutatás és nyelvészet ......................................................................... 79 4.1 Szintaktikai hálózatok ............................................................................ 80 4.2 Szemantikai hálózatok............................................................................ 85 4.3 Nyelvi hálózatok további kérdései ......................................................... 93 4.4 Összegzés ............................................................................................... 96
5. Az Agykapocs-kutatás................................................................................... 99 5.1 Internet-felhasználók segítségével végzett kutatások............................. 99 5.2 Az Agykapocs-projekt.......................................................................... 103 5.3 A projekt során felmerülő problémák, kérdések .................................. 114 5.3.1 Közösségi asszociáció .................................................................. 114 5.3.2 Megbízhatóság ............................................................................. 114 5.3.3 Szavak ellenőrzése ....................................................................... 118 5.3.4 Nyelv/kódlap ................................................................................ 119 5.3.5 A kutatásban résztvevők............................................................... 120 5.3.6 A munka nagysága ....................................................................... 121 5.3.7 Toldalékolt hívószavak................................................................. 121 5.3.8 Az adatbázis lezárása, a projekt vége ........................................... 122 5.4 Az Agykapocs-rendszerhez hasonlítható rendszerek ........................... 123 5.5 Az Agykapocs-rendszer értékelése....................................................... 128 5.6 Fejlesztési irányok és lehetőségek........................................................ 129 6. Az Agykapocs-rendszer alkalmazási lehetőségei: szaknyelv és mentális lexikon összefüggései........................................ 133 6.1 Fogalmi rendszerek a terminológiában és a szaknyelvekben ............... 133 6.1.1 Terminológiai osztályozások........................................................ 136 6.1.2 Gazdasági szaknyelv .................................................................... 142 6.2 Szaknyelv és mentális lexikon.............................................................. 145 6.2.1 Szaknyelvi asszociációk a mentális lexikonban ........................... 145 6.2.2 Szóasszociációk és terminológiai kutatások................................. 155 6.2.2.1 A hitelek csoportosítása ....................................................... 156 6.2.2.2 Az adók csoportosítása......................................................... 160 6.3 Összegzés ............................................................................................. 164 7. Hálózatok a mentális lexikonban................................................................. 169 7.1 Súlyozott kapcsolatok a mentális lexikonban....................................... 169 7.2 Irányított kapcsolatok a mentális lexikonban ....................................... 171 7.3 Kisvilágok a mentális lexikonban ........................................................ 178 7.4 Skálafüggetlen hálózat a mentális lexikonban...................................... 181 7.5 A mentális lexikon hálózatainak további összefüggései ...................... 184 7.6 Fogalmi rendszerek, nyelvi hálózatok.................................................. 186 7.7 Nyelvi hálózatok alkalmazási lehetőségei............................................ 198 8. Összefoglalás............................................................................................... 205 Irodalom .......................................................................................................... 209 Mellékletek ...................................................................................................... 241
ELŐSZÓ AZ ELSŐ KIADÁSHOZ A nyelv tanulmányozása mindig érdekes kihívás. Különösen érdekfeszítő a feladat, ha hagyományos nyelvészeti, és új, nem nyelvészetből kiinduló kutatási módszerek összekapcsolása, a közös kapcsolódási pontok megtalálása a cél. Új utakat járva a lehetőségek kecsegtetőek: különböző tudományos diszciplínák öszszekapcsolása mindig magában rejti új összefüggések felfedezésének lehetőségét. Az új megközelítési módok alkalmazása természetesen veszélyekkel is jár: elkerülhetetlen, hogy bizonyos gondolatokat spekulatív módon fogalmazzunk meg, illetve hogy a tudomány jelenlegi állásánál nem, vagy csak részben bizonyított (esetleg jelenlegi állásánál nem is bizonyítható) feltételezéseket írjunk le, abban bízva, hogy a közeljövőben lehetőség nyílik ezek empirikus adatokkal történő alátámasztására. Fel kell készülni arra is, hogy az új, felfedezendő út zsákutcának bizonyul, vagy hogy a megfogalmazottakat – mivel nem mindenben illeszkednek a hagyományos nyelvészeti paradigmákba – esetleg több kritika is éri. Az Olvasó által kézben tartott kötet két – egy hagyományos és egy újszerű – szemléletmód határán egyensúlyoz. A mentális lexikont egyrészt hagyományos, pszicholingvisztikai szempontból vizsgálja – ahogyan tették már sokan mások. Másrészt megpróbál a mentális lexikonhoz, mint hálózathoz közelíteni, a kibontakozóban lévő hálózatelmélet eredményeinek felhasználásával és továbbgondolásával. Ezzel a megközelítéssel új utakat derítünk fel – annak minden szépségével és veszélyével. Mindezek mellett a kötet – nem utolsó sorban – új kutatásmódszertani eszközt, illetve megközelítést is kínál a nyelvészek számára. A nyelvészet és hálózatelmélet kínálta lehetőségek, a felfedezendő és felfedezhető összefüggések annyira szerteágazóak, hogy a kötet végére pontot tenni nem lehet, csak az írást abbahagyni; már e sorokat írva is a lehetséges folytatás(ok)on gondolkodva. * * * Egy kötet természetesen soha nem kizárólag egy szerző munkája, akkor sem, ha csak egy szerző neve szerepel a kötet címe felett. Így van ez e kötet esetében is. Számtalan impulzus ért különböző szakmai fórumokon, szakmai-baráti beszélgetéseken. Az így kapott ötletek gyakran csak egy-egy elejtett, akár mellé-
8
Előszó
kesnek szánt félmondatot takarnak, amelyeket később továbbgondolva összefüggések kezdtek kirajzolódni. Hasonlóan termékenynek bizonyult az a számtalan szeminárium és előadás, amelyeket a Nyugat-magyarországi Egyetem (korábban Berzsenyi Dániel Főiskola) Alkalmazott Nyelvészeti Tanszékének oktatójaként tartottam. A lelkes (és néha kevésbé lelkes) hallgatók kérdéseikkel, megjegyzéseikkel szintén hozzájárultak a kötetben leírtakhoz. Ez úton köszönöm tehát a segítséget mindazoknak, akik akarva-akaratlanul ötleteikkel, gondolataikkal és nem utolsó sorban asszociációs adataikkal hozzájárultak a kötet létrejöttéhez. Néhány nevet ugyanakkor fontosnak tartok kiemelni. Egyrészt köszönöm Kohn Jánosnak, hogy a nyelvészet, Lengyel Zsoltnak, hogy a szóasszociációk és a kisvilágok felé mozdította el kutatásaimat. Másrészt köszönöm a Tanszéken dolgozó kollegák, Balázs Géza és Balaskó Mária bizalmát és támogatását. Harmadrészt köszönöm Kiss Gábornak, hogy felvette a kötetet a Tinta Kiadó sorozatába. Külön köszönet illeti lektoraimat, valamint a kötet alapjául szolgáló doktori értekezés opponenseit (Navracsics Juditot, Kis Balázst, Prószéky Gábort), akik megjegyzéseikkel, észrevételeikkel segítették a kézirat pontosítását. Természetesen egy kötet létrejöttekor nemcsak a szakmai impulzusok fontosak, hanem mindazok segítsége is, akik a munkához a hátteret biztosítják; ezért külön – és a legnagyobb – köszönet illeti Szüleimet és Páromat türelmükért, segítségükért, önzetlen támogatásukért. Szombathely, 2011. május Kovács László
ELŐSZÓ A MÁSODIK KIADÁSHOZ Jelen könyv első kiadása 2011 tavaszán látott napvilágot, egy doktori értekezés eredményeként. A kötet ugyan egy hosszú kutatás eredménye – ennek ellenére mégsem jelenti az út végét, hanem sokkal inkább egy utazás kezdete: a szerző első, – talán helyenként bizonytalan – lépéseit mutatja a mentális lexikon szerveződésének megismerése felé. A kötet megjelenése óta eltelt két év sok új eredményt hozott a mentális lexikon hálózatainak kutatásában. Az új eredmények egy része nem magyar nyelvű asszociációs adatbázisok elemzéséből keletkezett; más részük viszont pontosan a kötet alapjául szolgáló, magyar asszociációkat gyűjtő Agykapocs-adatbázis vizsgálatának eredménye. Az új eredmények fényében a mentális lexikon hálózatairól ma már pontosabb képet alkothatunk, mint akár két évvel ezelőtt. Az akkor még részben spekulatív megfogalmazások egy része igazolódott – ezzel együtt azonban természetesen további kérdések is felmerültek. Tovább folytatjuk tehát az egyensúlyozást a mentális lexikon hagyományos – asszociációs –, és újszerű – hálózatos – megismerése között. A témában a közelmúltban megjelent publikációk, illetve az újabb eredmények arra engednek következtetni, hogy a több éve választott megközelítés helyes, mivel új irányokat nyithat a mentális lexikon megismerésében. Habár az út vége még mindig homályba vész, annyit már elmondhatunk, hogy az úton járni érdemes – akkor is, ha nem tudjuk, mi lesz a végállomás. Az új eredmények sarkallták a szerzőt a kötet újragondolására és részben újraírására. Az elméleti hátteret – ahol szükséges volt – aktualizáltuk és bővítettük. A lényegi átdolgozás a 7. fejezetet (az első kiadásban 6. fejezet) érinti – az új kutatási eredmények tükrében a fejezetet részben újraírtuk. * * * Természetesen egy kötetből sem maradhat ki a köszönetnyilvánítás. Köszönöm mindazoknak, akik a kötet első kiadása alapján változtatásokat javasoltak, illetve akik szakmai-baráti beszélgetések és levelezések során megfogalmazták a kötettel és a témával kapcsolatos észrevételeiket; így köszönetet mondok Balázs Gézának, Csomai Lídiának, Lengyel Zsoltnak, Muráth Juditnak. Szintén köszönet
10
Előszó
illeti Pusztay Jánost, aki baráti beszélgetéseken bátorított a kötet mindkét kiadásának megjelentetésére. A magyar asszociációs adatbázis alapján kimutatható hálózatos eredmények nagy része Orosz Katalin és Pollner Péter munkájának eredménye; közös kutatásunk és publikációink jó bizonyítékot szolgáltatnak arra, hogy hasznos más területekről is impulzusokat merítenünk: mindkét kutató az ELTE Biológiai Fizika tanszékének munkatársa. A kötet átdolgozásához nagy segítséget nyújtottak azon végtelen órák, amelyeket DAAD-ösztöndíjasként Göttingenben, a Georg-August-Universität könyvtárában a szakirodalom tanulmányozásával tölthettem. A könyv „fizikai megvalósítását” illetően köszönet illeti Kiss Gábort, hogy a kötetet – ismét – felvette a Tinta Könyvkiadó sorozatába, a nyomdai munkákért pedig az Elanders Hungary Kft.-t, valamint az Elanders Hungary Kft. munkatársait, Detlef Giebelt és Berki Gabriellát. A szakmai impulzusok mellett a legfontosabb azok segítsége, akik a munkához a hátteret biztosítják; így ismét köszönet illeti Szüleimet és Páromat türelmükért, segítségükért, önzetlen támogatásukért és azért, hogy – immár másodszor – segítettek a kézirat javításában. * * * Tudományos eredmények nem születhetnek reakcióktól mentes, „légüres” térben, ezért szerzőként örülnék minden építő és kritikai megjegyzésnek a könyvben leírtakkal kapcsolatban. A közös gondolkodás, az új nézőpontok mindig segítenek az eredmények jobb, illetve pontosabb megértésében, az elméletek továbbgondolásában. Egyben szeretném felajánlani együttműködésemet és segítségemet is a mentális lexikon, illetve annak hálózatos szerveződése iránt érdeklődőknek: a kötetben leírt szóasszociációs adatbázis, a gyűjtött adatok kutatási célra nyitva állnak a (leendő) kutatók számára. Jó szórakozást kívánok azoknak, akik önként, és türelmet azoknak, akik „nem saját indíttatásból” olvassák a kötetet. Szombathely, 2013. március Kovács László
[email protected] [email protected]
1. BEVEZETÉS A 20-21. század bölcsészettudományi és természettudományi kutatásai gyakran multi-, inter- és transzdiszciplináris jellegűek. A közös kapcsolódási pontok lehetővé teszik különböző diszciplínák együttműködését és egymásra hatását: egy tudomány eredményeit/módszereit átvéve más tudományágakban is áttörésekre kerülhet sor, illetve eddig nem alkalmazott módszerekkel, új megközelítésben vizsgálhatunk hipotéziseket. A 21. század elején egy új kutatási terület és egyben módszer, a hálózatkutatás (hálózatelmélet) kezd körvonalazódni, amely új szemszögből közelít számos, komplex rendszerekkel kapcsolatos kérdéshez. A hálózatkutatás alapfeltételezése, hogy a komplex hálózatok (pl. társadalmi kapcsolatok hálója, Internet, sejtek hálózata) felépítése, valamint működése hasonlít egymáshoz, továbbá, hogy ezek a közös jellemzők matematikailag leírhatók. Hálózatokkal, hálózatok kutatásával természetesen korábban is foglalkoztak mind a bölcsészettudományok, mind a természettudományok területén. Az ilyen jellegű kutatások eredményeit ugyanakkor korábban csak adott tudományon belül értelmezték, és nem vontak le olyan következtetéseket, amelyek általánosságban a hálózatokra lennének igazak. A megközelítés tehát inkább hálózatalapú (network-based), és nem hálózatközpontú (network-driven) volt. A két módszer („-based” és „-driven”) szétválasztása a korpuszlingvisztika esetében már megtörtént (Balaskó 2004). Balaskó Mária korpuszalapúnak azon kutatásokat veszi, ahol már meglévő hipotézist korpuszlingvisztikai eszközök segítségével igazolunk. Korpuszközpontú a megközelítés viszont, ha a korpuszokból nyert adatok a kutatás kiindulópontjai, és a kapott adatokból alkotunk új hipotéziseket. Hálózatok esetében a kettősség a következőképpen jelenik meg: hálózatalapú kutatáson olyan kutatásokat értünk, amelyek hálózatok segítségével, hálózati jellegű megoldásokkal valamilyen elméletet állítanak fel és/vagy tesztelnek (pl. Collins–Quillian 1969). Hálózatközpontú kutatás esetében kiindulási pontnak az általános, hálózatokkal kapcsolatos jelenségek tekintendők (pl. Barabási 2003), amelyek meglétét és megjelenési formáját adott diszciplína keretein belül vizsgáljuk. Jelen kötet a mentális lexikon nyelvészeti szemszögből történő tárgyalásánál (2. fejezet) hálózatalapú, míg a fogalmi rendszerek, a mentális lexikon hálózatos szerveződésének vizsgálata során (4. fejezet) hálózatközpontú megközelítést alkalmaz.
12
Bevezetés
A kötet célja A kötetben bemutatott vizsgálatok elsősorban a Kovács László által tervezett és megvalósított internet-felhasználóktól szóasszociációs adatokat gyűjtő Agykapocs-rendszer (2008b, illetve 5. fejezet) adatait használják fel. A mentális lexikon összefüggéseinek pontosabb tanulmányozására megalkotott többnyelvű elektronikus szóasszociációs adatbázis az asszociációs adatok komplex vizsgálati lehetőségét kínálva empirikus adatok gyűjtését és elemzését könnyíti meg, illetve nyelvi hálózatokkal kapcsolatos hipotézisalkotást tesz lehetővé. A kötet céljai három pontban foglalhatók össze: 1. A mentális lexikon szaknyelvi szerveződésének vizsgálata A megalkotott Agykapocs-rendszer segítségével a szóasszociációs adatok elemzése olyan mélységben és részletességgel történhet, amely hagyományos úton gyűjtött (és feldolgozott) adatok esetében nem lehetséges. Nemcsak az összegyűjtött asszociációs adatok mennyisége – jelenleg magyar nyelvre közel 160.000 szópéldány és több, mint 21.000 szóalak (a toldalékolt alakokkal együtt) – jelentős: a válaszadók által megadott információk (kor, nem, végzettség típusa, szintje, anyanyelv) a mentális lexikon kutatásának új lehetőségeit nyitják meg. Lehetőség nyílik így többek között arra, hogy megvizsgáljuk, milyen különbségeket mutat szakemberek és nem szakemberek mentális lexikonjának szerveződése szakmai jellegű hívószavak esetében. A szakemberek/nem szakemberek asszociációinak elemzését egy harmadik dimenzió, adott szaknyelv terminológiai jellegű vizsgálata teszi teljessé. Így képet kapunk arról, hogy adott szakmai fogalmak hálózata milyen módon jelenik meg a terminológiában és a szakmai közösség, valamint a laikusok asszociációiban. 2. A mentális lexikon hálózatelméleti vizsgálata Az adatbázis felépítésénél, valamint az összegyűjtött adatok mennyiségénél fogva alkalmas arra, hogy a vizsgálatba hálózatkutatási szempontokat vonjunk be. Lehetséges az asszociációs adatbázisban a szavak közötti legrövidebb út kimutatása, vagyis annak kimutatása, hogy milyen asszociációs útvonalon jutunk el például a hajó szótól a telefon szóig. Az adatbázisban szereplő szavak közötti átlagos úthossz kiszámítása lehetővé teszi annak vizsgálatát, hogy a mentális lexikon rendezettsége kisvilág-karaktert mutat-e; vagyis hálózatelméleti összefüggéseket vizsgálunk a mentális lexikonra vonatkoztatva. Célunk továbbá megmutatni, hogy a mentális lexikon kapcsolatai irányítottak és súlyozottak, tehát irányuk és erősségük szerepet játszik a mentális lexikon szerveződésében. Az empirikus adatok alapján hipotéziseket alkotunk a nyelvi hálózatok valószínű felépítéséről.
Bevezetés
13
3. Új adatgyűjtési és feldolgozási módszerek bemutatása (szóasszociációs adatok internet-felhasználóktól történő gyűjtésének lehetőségei) Módszertani szempontból célunk megmutatni, hogyan lehetséges internetfelhasználók segítségével nagy mennyiségű szóasszociációs adatot elektronikus úton (adatbázisban) gyűjteni és feldolgozni. A nagy mennyiségű adat ilyen formában történő gyűjtése viszonylag kis idő alatt, viszonylag kis költséggel történhet. Az adatok elemzése azonnal lehetséges előre meghatározott szempontok szerint, illetve a program megfelelő bővítésével új elemzési szempontok is létrehozhatók. Tudomásunk szerint nyelvészeti kutatás céljából a rendszer elkészültéig hasonló módon még nem gyűjtöttek adatokat, ezért – a tervtől a gyakorlati megvalósításig, az adatfelvétel megtervezésétől az adatfeldolgozásig – a kutatás úttörő jellegűnek számít. A célokból adódóan kutatásunk három területre koncentrálódik: a.) pszicholingvisztika – mentális lexikonnal kapcsolatos kutatások; b.) terminológia és szaknyelv – fogalmi rendszerek a terminológiában; c.) hálózatkutatás – nyelvi hálózatok. A kötet négy kérdéskörrel foglalkozik részletesen. Ezek közül az első kettő hipotézis, illetve azok igazolása, a harmadik kérdéskör módszertani jellegű, míg a negyedik a magyar nyelvi asszociációs adatbázisra vonatkozó eredményeket közöl. 1. A mentális lexikon szaknyelvi szerveződése szakemberek és nem szakemberek esetében eltérő mintát követ. Ezek a különbségek szóasszociációs tesztekkel kimutathatók. 2. A mentális lexikon hálózatos felépítése skálafüggetlen karaktert és kisvilág szerveződést mutat, így a mentális lexikon hálózatelméleti módszerekkel vizsgálható. 3. Igazolni szeretnénk, hogy megfelelő szoftver segítségével internetfelhasználóktól nagy mennyiségű asszociációs adat gyűjthető, majd dolgozható fel részben automatikusan. 4. Egy szóasszociációs adatbázis (Agykapocs) alapján bemutatjuk a (magyar) mentális lexikon általános hálózatos jellemzőit. A kutatás célja részben tehát bizonyos feltételezések igazolása. Új megközelítés esetében ugyanakkor nem várható el, hogy egy kötet minden aspektust vizsgáljon, illetve minden kérdésre választ adjon. Ez jelen kötet esetében sincs másként. A kutatás végén nemcsak válaszokat fogalmazunk meg, hanem – az eddigi eredmények alapján – kérdéseket és hipotéziseket is, amelyek a jövőben megválaszolásra, illetve igazolásra várnak.
14
Bevezetés
A kutatás aktualitása A fogalmi hálózatok és a fogalmi rendszerek a nyelvészeten belül és a nyelvészeten kívül is számos tudomány(terület) vizsgálatának tárgyai. Fogalmi rendszerekkel (is) foglalkozó tudományágak, illetve -területek a következők: pszicholingvisztika, szemantika, terminológia, szómező-elméletek, lexikográfia, tudásreprezentáció, tudásmenedzsment, nyelvtechnológia, informatika. A korábbi, elméleti vizsgálatokkal szemben a jelenlegi megközelítések legtöbb esetben gyakorlati indíttatásúak. A cél tehát az eredmények informatikai alkalmazása, például fogalmi rendszerek szövegekből történő automatikus megalkotásával, illetve kivonatolásával. Jelenlegi elképzelések szerint amennyiben sikerülne a fogalmakat és az általuk alkotott rendszereket a számítógépek által értelmezhető formában megjeleníteni, kézzelfogható közelségbe kerülne különböző nyelvtechnológiai jellegű számítógépes rendszerek és alkalmazások (pl. tudásmenedzsmentrendszerek, automatikus döntéshozó rendszerek, szemantikus webek, szövegbányászati szoftverek, automatikus fordító- és tolmácsrendszerek) megvalósításának lehetősége. Tágabb összefüggésben a fogalmi rendszerek tanulmányozása a tudás szervezésének, a tudásreprezentációnak több szempontú vizsgálatával egy összetett, multidiszciplináris tudományág létrejöttét is elősegítheti (Dahlberg 2006). A tudás reprezentálása a számítógépes nyelvészetben is aktuális kérdés, az alábbi területeken. a.) Automatikus fordítás területe: a jelenlegi minta/szabály alapú rendszerek hibája, hogy a szavak közötti kapcsolatokat (fogalmi rendszereket) általában nem veszik figyelembe. b.) Szemantikus web törekvések: az interneten elszórtan és „véletlenszerűen” található információt a szemantikus webekkel (is) próbálják rendszerbe foglalni. Az információ ilyen rendszerezése (fogalmak kapcsolatát leíró és számítógép által értelmezhető rendszere) intelligensebb keresőprogramok megalkotását teszi lehetővé. c.) Jelenleg egyre több keresőrendszer próbálja szemantikai úton, vagyis a szó jelentéséből elindulva tökéletesíteni a keresést. A pontosabb keresési eredményeket többek között úgy próbálják elérni, hogy az adott keresés (begépelt szó) esetében megvizsgálják a szó előfordulását különböző szövegekben és egyéb keresésekben, majd a talált kapcsolatok alapján szűkítik a kapott eredményhalmazt (Yebol), vagy további keresési javaslatokat jelenítenek meg (Google). (A keresőszoftverek működési alapjaként szolgáló algoritmusok többnyire titkosak, így részben csak a találati eredményekből tudunk azok működésére következtetni.)
Bevezetés
15
A fogalmi rendszereket jelenleg különböző tudományágak eltérő szempontok szerint vizsgálják és írják le: – az agyban/az elmében/a gondolkodásban „létező” fogalmi rendszerezési elméletekkel foglalkozó tudományágak: a pszicholingvisztika, a kognitív nyelvészet, a neurolingvisztika és a szemantika – a kutatások nyelvészeti, illetve nyelvészetifiziológiai jellegűek; – fogalmak rendszerezésének, ill. kapcsolatainak meglévő rendszereit vizsgáló megközelítések: terminológiai rendszerek, ontológiák – nyelvészeti és adott szakterületi kutatások, pl. adott terület terminológiájának feltérképezése; – fogalmi rendszerek gyakorlati felhasználásával, megvalósíthatóságával, leképzésével foglalkozó tudományok: számítógépes nyelvészet, tudásmenedzsment, mesterséges intelligencia-kutatások, ontológiai jellegű kutatások – a kutatások inkább gyakorlati jellegűek (alkalmazott kutatások); feladat sok esetben a gondolkodásbeli fogalmi rendszerek (pl. alá-, fölérendeltségi kapcsolatok) számítógép számára érthető módon történő leírása. A nyelvi jelenségek hálózatos tulajdonságainak kutatása, ezen tulajdonságok feltérképezése, illetve kvantifikálása – hálózatelméleti összefüggések segítségével – összekapcsolhatja a fenti három kutatási területet, valamint segíthet olyan modellek (és alkalmazások) megalkotásában, amelyek segítségével informatikai eszközökkel jobban modellezhető a mentális lexikon (és ezzel együtt a nyelv) működése.
A kötet felépítése A kötet két nagy egységre osztható. A kötet első része (2-4. fejezet) elméleti alapozásnak tekintendő, míg második része az empirikus kutatás eredményeit mutatja be (5-7. fejezet). Az első részben a mentális lexikont pszicholingvisztikai és kognitív nyelvészeti megközelítésben mutatjuk be. Külön hangsúlyt kap az asszociáció-kutatások bemutatása, ugyanis a kötet empirikus részében asszociációs adatokat elemzünk. Kitérünk a mentális lexikon szerveződésének két sajátos aspektusára: a gyermeknyelvre, valamint a kétnyelvű mentális lexikonra is. A harmadik fejezetben hálózatközpontú megközelítést alkalmazunk: a hálózattudomány, vagyis a komplex hálózatok általános törvényszerűségei felől közelítünk a mentális lexikonhoz. Ehhez először bemutatjuk a hálózatkutatás aktuális kérdéseit – azokat az összefüggéseket, amelyek valós hálózatok vizsgálata során a hálózat felépítését és működését jellemzik. Az általános hálózatelmélet eredményeinek bemutatásakor megközelítésünk nem matematikai/gráfelméleti: tudatosan törekedtünk arra, hogy
16
Bevezetés
a hálózatok jellemzőit nem matematikusok számára is érhetően prezentáljuk – az összefüggéseket tartottuk szem előtt, és nem azok matematikai leírását. A következő, negyedik fejezetben mutatjuk be a hálózatközpontú megközelítés nyelvi hálózatokkal kapcsolatos eddigi eredményeit és hipotéziseit. Az ötödik fejezetben a kutatás céljára kifejlesztett Agykapocs-rendszert mutatjuk be, amely internet-felhasználóktól gyűjt szóasszociációs adatokat több nyelven, majd részben automatikusan összegzi azokat. Az így létrejövő adatbázis lehetővé teszi asszociációs adatok közötti összefüggések differenciált vizsgálatát. A rendszer egy új eszközzel és módszerrel gyarapít(hat)ja a pszicholingvisztika (és a nyelvészet) kutatási repertoárját. A hatodik fejezet az Agykapocs-rendszerből gyűjtött adatok segítségével a mentális lexikon szaknyelvi szerveződését vizsgálja, bemutatva a szóasszociációs adatok felhasználhatóságának számos lehetőségét. Ehhez először a szaknyelv és a terminológia összefüggéseit vizsgáljuk, majd a gazdasági szaknyelvet mutatjuk be, kitérve fogalmak szakmai rendszerezésének lehetőségeire. A gazdasági szaknyelv bemutatása azért szükséges, mivel a mentális lexikon szerveződését szakemberek és nem szakemberek esetében a gazdasági szaknyelvből vett példán keresztül mutatjuk be. A fejezet a továbbiakban empirikus kutatást tartalmaz: gazdasági szakemberek és nem szakemberek gazdasági jellegű hívószavakra adott szóasszociációit vetjük össze egymással, majd két fogalom esetében (hitel, adó) az elemzést azok terminológiai felosztási lehetőségeinek vizsgálatával is bővítjük. A kötet empirikus kutatásának második része (7. fejezet) a mentális lexikon hálózatos tulajdonságainak meglétét vizsgálja a szóasszociációs adatbázis segítségével. Az eredmények alapján hipotéziseket fogalmazunk meg a nyelvi hálózatok felépítésével kapcsolatban, valamint felsoroljuk, milyen alkalmazott kutatásokban hasznosíthatók a mentális lexikon hálózatos felépítéséből következő törvényszerűségek.
Fogalmak A fent említett célokhoz a mentális lexikonban tárolt egységek kapcsolatait szükséges vizsgálni, tehát fogalmi rendszerekkel foglalkozunk. A fogalmi rendszerekkel kapcsolatos kérdések a 21. század alkalmazott nyelvészeti kutatásaiban kiemelten fontos szerepet kapnak. Fogalmi rendszerek segítenek a megismerésben, valamint lehetővé teszik következtetések levonását. „A tárgyak kategóriákba történő csoportosítása – mentális kategória címke adása – lehetőséget ad arra, hogy amikor látunk egy dolgot, akkor ki tudjuk következtetni bizonyos tulajdonságait, amelyeket közvetlenül nem tudunk megtapasztalni” (Pinker 2006: 152).
Bevezetés
17
Fontos, hogy a kötet elején definiáljunk néhány fogalmat. Ezek közül legfontosabb a fogalom, mint fogalom definiálása. Jelen kötetben fogalom alatt lexikai fogalmat értünk (vö. Evans 2006). Terminológiai szempontból az ISO 1087-1 szabvány használata indokolt lehetne, mely szerint a fogalom (concept) a tudás egyedi jellemzőkkel bíró egysége: „unit of knowledge created by a unique combination of characteristics” (ISO 1087-1 2000: 3.2.1). A megfogalmazás ugyanakkor viszonylag tág mozgásteret ad: a definíció elemeinek (unit, knowledge) további definiálása nélkül nehezen értelmezhető. Egy ISO szabvány nem jelent szükségszerűen hibátlan dokumentumot, így többek között a terminológiával foglalkozó szabványok is ellentmondásosak (Pozzi 2007). Meglátásunk szerint a fogalom (concept) korábbi ISO definíciója pontosabb volt a jelenleginél, mivel az a fogalmakat a gondolkodás absztrakt egységeként írta le: „A unit of thought constituted through abstraction on the basis of properties common to a set of objects”. „Note - Concepts are not bound to particular languages. They are, however, influenced by the social or cultural background” (ISO 1087: 1990). Elfogadható lehetne Sager (1990) megközelítése, amely a fogalmat definíció nélküli axiómának tekinti: „we propose […] ’concept’ be considered another axiomatic primitive, like ’word’ or ’sentence’, conveniently left undefined” (Sager 1990: 23). Sager ezen álláspontját Pozzi (1999) is osztja; egyúttal 18 fogalom-definíció elemzése kapcsán utal arra, hogy a fogalom, valamint a fogalom definíciója évszázadok óta filozófusok, pszichológusok, nyelvészek vitájának középpontjában áll, és a mai napig nem született a fogalomnak elfogadott meghatározása. Ezért Pozzi szerint a fogalom (mivel máig nem egyértelmű a jelentése) nem lehet a terminológiai munka alapja – a terminológiai munka feltétele ugyanis a pontos definíció. A fenti, 2000-es ISO definíció is a különböző terminológiai fogalom-definíciók eredményének és ötvözetének (javaslatok kompromisszumának) tekinthető (több korábbi definíciót, illetve definíció-javaslatot leír pl. Sager 1990, Pozzi 1999), ugyanakkor véleményünk szerint a kompromisszum eredményeként a létrejött definíció nem elég pontos. Fogalom-definícióként ezért jelen kötetben Sager egy korábbi javaslatát fogadjuk el – mivel Sager definíció nélküli axiómája elfogadható és indokolható, viszont nem visz minket közelebb a fogalom fogalmához. A fogalmak értelmezésünkben tehát olyan egységek, amelyek az emberi gondolkodás során, absztrakció útján jönnek létre, és lehetővé teszik különböző entitások osztályozását. Ez a meghatározás Sager definíciójához áll közel: „[Concepts are] constructs of human cognition processes which assist in the classification of objects by way of systematic or arbitrary abstraction” (Sager 1990: 22).
18
Bevezetés
A fogalmi rendszer meghatározásához az ISO definícióját vesszük alapul, amely szerint a fogalmi rendszereket egymással különböző fajta kapcsolatban lévő fogalmak alkotják. „[A concept system is a] set of concepts structured according to the relations among them” (ISO 1087-1 2000: 3.2.11). A mentális lexikon leírása során, illetve a hálózatos vizsgálatoknál is több esetben gráfokról fogunk beszélni. Mivel gráfokkal a nyelvészetben (viszonylag) ritkábban találkozunk, fontosnak tartjuk, hogy már a bevezetőben bemutassuk a gráfokat. Gráfok a matematikában használatosak és egy hálózat matematikai leírását és ábrázolását teszik lehetővé. Egy hálózat pontokból és kapcsolatokból áll. A gráfok, mivel pontokból és azokat összekötő kapcsolatokból állnak, alkalmasak a hálózatok reprezentálására, illetve bármilyen hálózatos jellegű rendszer ábrázolására. Gráfok esetén a pontokat csúcsoknak, a kapcsolatokat éleknek nevezzük. Az 1. ábra a gráfok három fajtáját mutatja. Az A gráf egy egyszerű hálózat, ahol pontokat és kapcsolatokat (csúcsokat és éleket) látunk. A B gráf esetében a kapcsolatok irányítottak, vagyis van egy kiindulási és végpontjuk (nyilak). A C gráf egy irányított, súlyozott gráf, ahol a nyilak a kapcsolatok irányát, a vonalak vastagsága a kapcsolatok erősségét jelzik.
A
B
C
1. ábra. Gráfok fajtái
Módszerek A kutatás során a szóasszociációs adatok gyűjtése és lekérdezése a saját tervezésű Agykapocs-rendszer segítségével történt, amelyet részletesen az 5. fejezetben mutatunk be. Az Agykapocs-rendszer szóasszociációs adatokat gyűjt internet-felhasználóktól több nyelven, valamint lehetővé teszi a gyűjtött adatok gyors, különböző szempontok szerinti lekérdezését és értékelését. A rendszer alkalmas továbbá a szóasszociációs adatbázisban a szavak közötti legrövidebb utak kimutatására. A rendszer tervezése és megalkotása során szem előtt tartottuk: a.) a hagyományos szóasszociációs tesztek felépítését, logikáját; b.) a hagyományos szóasszociációs tesztek kidolgozásának módszertanát és a gyűjtött asszociációk elemzési lehetőségeit;
Bevezetés
19
c.) az informatikai eszközök adatgyűjtésre való használatát más tudományágak esetében; d.) az elektronikus tárolás kínálta kiegészítő lehetőségeket (legrövidebb út lekérdezése); e.) a rendszer lehetőleg moduláris-jellegű tervezését, a későbbi bővítések megkönnyítése céljából (pl. a szavak közötti kapcsolatok típusa a későbbiekben megnevezhető és kereshető lehet). A mentális lexikon vizsgálatát egyrészt hagyományosan, szóasszociációs elemzéssel végezzük, másrészt hálózatelméleti megközelítést és módszereket alkalmazunk. A hálózatelméleti megközelítés esetén tudatosan nem a szigorúan matematikai alapokat emeljük ki és helyezzük előtérbe, hanem azon megközelítési lehetőségeket, amelyeket a mentális lexikon hálózatelméleti vizsgálata kínálhat.
2. FOGALMI SZERVEZŐDÉS ÉS MENTÁLIS LEXIKON A mentális lexikon kutatása a pszicholingvisztika kutatási területei közé tartozik. A pszicholingvisztikáról mint tudományról 1951 után beszélhetünk: ebben az évben tartottak a Cornell Egyetemen olyan nyári szemináriumot, amelynek témája a nyelvészet és a pszichológia kapcsolódási pontjai voltak (Gósy 2005). Habár a két terület közös kérdései hívták életre az új tudományágat, viszonylag rövid időn belül nemcsak pszichológiai és nyelvészeti, hanem információelméleti kutatások is a kialakulóban lévő új tudományág részévé váltak. Gósy Mária (2005: 23) a pszicholingvisztikának öt alapterületét határozza meg: 1. beszédprodukció; 2. beszédészlelés és beszédmegértés; 3. anyanyelv-elsajátítás; 4. beszédzavarok, nyelvi zavarok; 5. írott nyelv elsajátítása [és] az olvasás. Minden további terület, amellyel a pszicholingvisztika foglalkozik – például kétés többnyelvűség, második nyelv elsajátítása, mesterséges intelligencia-kutatások – csak ezen alapterületek ismeretanyagának elsajátítása után tanulmányozható (Gósy 2005: 23). Dietrich véleménye szerint a pszicholingvisztika arra a kérdésre keresi a választ, hogy milyen kognitív rendszerek, illetve milyen tudás hozza létre az emberi beszédet: „Welches Wissen und welche kognitiven Verbreitungssysteme machen die Sprachfähigkeit des Menschen aus?” (Dietrich 2002: 8). Gósy Mária megfogalmazása a pszicholingvisztika tárgyköréről nagyban hasonlít Dietrichére: „A pszicholingvisztika a nyelvhasználat közben végbemenő folyamatokat kívánja megismerni” (Gósy 2005: 23). A fejezetben először a mentális lexikont, mint a fogalmak (szavak) tárolórendszerét vizsgáljuk meg, nem kizárólag egy egység esetében: a mentális lexikonban tárolt egységek kapcsolatait, az egységekből alkotott rendszereket is elemezzük – feltételezve, hogy az egységek rendszerét hálózatként jellemezhetjük. A mentális lexikon vizsgálatában külön hangsúlyt kap a szóasszociációs kutatások ismertetése, a további fejezetekben ugyanis – empirikus kutatatásunk keretében – szóasszociációs vizsgálatokat (is) végzünk. A mentális lexikon vizsgálatának két lehetséges tárgyát mutatjuk be: a gyermekek fogalmi elsajátítását, valamint a kétnyelvűek mentális lexikonjának szerveződését.
22
Fogalmi szerveződés és mentális lexikon
A pszicholingvisztikai áttekintés mellett fontosnak tartjuk bemutatni a kognitív nyelvészet fogalmi rendszereit, ugyanis a mentális lexikont skálafüggetlen hálózatként értelmezve a kognitív nyelvészet bizonyos elméletei (pl. prototípuselmélet) hálózatelméleti megközelítésben is magyarázhatóak.
2.1 A mentális lexikon A pszicholingvisztika egyik kiemelt kutatási területe a mentális lexikon (agyi szótár), amelynek a beszédprodukciós és beszédpercepciós folyamatokban egyaránt szerepe van. Vizsgálata kiterjedhet többek között szóasszociációs kutatásokra (Balló 1983, Jagusztinné 1985, Lengyel 2008, Postman–Keppel 1970), a szavak feldolgozásának különböző aspektusaira (Huszár 2005, Magyari 2008, Pléh 2000), valamint több nyelv reprezentációjának megismerésére (Navracsics 2007). A mentális lexikon – habár elfogadott agyi szótárként való jellemzése – nehezen definiálható. Pinker megfogalmazásában: „A nyelv tehát úgy működik, hogy minden ember agyában van egy szótár és egy fogalomtár, melynek tagjaira a szavak vonatkoznak (mentális lexikon), valamint egy szabályhalmaz, mely meghatározza, hogy a szótár elemei hogyan kapcsolódnak össze, és miként fejezik ki a fogalmak közötti viszonyokat (mentális grammatika)” (Pinker 2006: 83). Gósy Mária (2005) Aitchison (1987) alapján nem ért teljesen egyet a mentális lexikon mint szótár meghatározásával, mivel egy szótár használata és a mentális lexikon működése különböző elveket követ. Jarema és Libben (2007) szerint a mentális lexikon nem egy meghatározandó fogalom, sokkal inkább egy metafora, és mint ilyen, a meghatározása akár félrevezető is lehet. További probléma, hogy a mentális lexikon kutatása többnyire nem önmagában történik, hanem valamilyen aktivitással (szóelőhívás, beszéd) kapcsolatban, ezért a lexikon kifejezés vagy a szótárként való meghatározás félrevezető: a szótár nem aktív, hanem egy passzív tárgy. Miller (1991) a lexikon, illetve mentális lexikon (angol lexicon) hármas jelentésére utal: – egy szótár, amely többnyire alfabetikus sorrendben tartalmaz szavakat; – egy nyelv teljes szókincse; – az egyes emberek által ismert szavak összessége, absztrakt szókincsük. Az absztrakt lexikon tehát minden egyes szó, amelyet az emberek ismerhetnek, azaz mentális lexikonjaink összessége: senki sem ismerhet minden egyes szót, de minden szót ismernie kell valakinek. A mentális lexikon (mental lexicon, más szerzőknél semantic lexicon; Huszárnál konceptuális lexikon, vö. Huszár 2005: 73) megnevezés (metafora) azért
Fogalmi szerveződés és mentális lexikon
23
sem tükrözi jól a mentális lexikon lényegét, mert ezen megnevezés statikusságra utal. Amennyiben mentális lexikonról beszélünk, ki kell emelnünk, hogy a mentális lexikon változik; sem a benne tárolt egységek, sem az egységek közötti kapcsolatok nem statikusak: új fogalmakat tanulunk, a tárolt egységek között új kapcsolatok jönnek létre, bizonyos kapcsolatok megszűnnek. A mentális lexikonnal kapcsolatban tehát fontos annak dinamikusságát, időbeni változását is hangsúlyoznunk (vö. Aitchison 2003, Knipf–Rada–Bernáth 2006). A mentális lexikon esetében a dinamikusság másképp is értelmezhető: Elman (2004) felfogása szerint a mentális lexikon nem a szavakat tárolja, a szavak sokkal inkább olyan stimulusok, amelyek a mentális állapot változását idézik elő: önmagukban nem hordoznak jelentést, hanem előhívják azt. A mentális lexikon leírására számtalan analógiát alkalmaztak (Aitchison 2003: 29-37, Gósy 2005: 193-198, Huszár 2005: 73-74). Fent említett szerzők hagyományait követve említjük meg ezeket a korai analógiákat, utalnunk kell ugyanakkor arra, hogy ezek a hasonlatok nem magát a mentális lexikont írják le, hanem inkább a tudatról alkotott elképzelésként értelmezendők. Platón tudatunkat olyan madárkalitkához hasonlítja, amely kalitkában madarak repülnek egyedül, kisebb és nagyobb csapatokban. Ezek a madarak jelképezik a tudást. Születésünkkor a kalitka üres, csak fokozatosan töltődik fel fogalmakkal (tudással). Platónhoz hasonló megfogalmazást alkalmaz Sherlock Holmes tolmácsolásában Conan Doyle, aki üres padláshoz hasonlítja a tudatunkat, amelyet fokozatosan rendezünk be gondolatainkkal. Cicero minden dolgok kincsestárának nevezi, Kant pedig egy olyan könyvtárhoz hasonlítja a tudatot, ahol a könyvek a különböző témák szerint vannak csoportosítva. Érdekes párhuzam, hogy szaknyelvek esetében a szaknyelvek egyik osztályozási módszere pontosan az a könyvtárakban használt Egyetemes Tizedes Osztályozás, amely alapján a könyvtárak a könyveket napjainkban is rendszerezik (vö. Kurtán 2003). Wüster (1968) szintén ezt a logikát követve szerkeszti műszaki fogalmi szótárát. Aitchison (2003) azonban utal rá, hogy a könyvtár analógia sok esetben már idejétmúltnak tűnhet, illetve a könyvek (írott szövegek) és azok keresése, elérése már nem hagyományos módon történik, hanem számítógépek segítségével. Az emberi gondolkodásról (és a mentális lexikonról) alkotott modellek nem konkrétak: „[they] are somewhere in between the concrete models of spacecraft and the abstract models of economists” (Aitchison 2003: 31). Aitchison (2003) és Baddeley (2001: 25) a londoni metró térképéhez hasonlítja a mentális lexikon működését. A metróvonal is különböző pontokat köt össze egymással (fogalmak a mentális lexikonban), bizonyos rendszer szerint. Az analógia Aitchison szerint viszont sántít, mivel a metróvonal pontos térképét ismerjük, ezzel szemben a
24
Fogalmi szerveződés és mentális lexikon
pszicholingvisták nem (vagy csak részben) ismerik a mentális lexikon kapcsolatait. Így munkájuk ahhoz hasonlítható, mintha a metróhálózat felépítését úgy próbálnák meg leírni, hogy csak a metróállomásokra bemenő és onnan kijövő embereket látják: a föld alatt történő események (merre haladnak a vonalak, ki hány állomást érintett, hány helyen szállt át) nem érzékelhetőek számukra. Az analógia nem lehet teljes, mert a metrótérkép azt feltételezi, hogy a föld alatt csak metrók közlekednek. Elképzelhető viszont, hogy bizonyos vonalakon buszok, lovas kocsik viszik az embereket (lassabban), vagy, hogy bizonyos emberek a leghatékonyabb közlekedés helyett más útvonalakat, közlekedési eszközöket preferálnak – így a következtetések könnyen tévesek is lehetnek. „[… I]t reminds us that logical thinking is not necessarily going to lead us to the right conlusions, since the mind may work in a way that is quite counter-intuitive” (Aitchison 2003: 32). Ez a megállapítás véleményünk szerint minden mentális lexikonnal kapcsolatos kutatásra igaz: mivel – a jelenlegi eszközökkel és módszerekkel – nem tudjuk pontosan leírni és mérni a mentális lexikon működését, ezért bármely következtetés, analógia (legyen az bár empirikus adatokkal megalapozott) hibás is lehet. Kérdésként merül fel a mentális lexikon nagysága, vagyis hogy hány elemet tartalmaz a mentális lexikon. A mentális lexikon szóasszociációs vizsgálata tudomásunk szerint a mai napig nem tűzte ki célul egy egyén mentális lexikonjának teljes feltérképezését, így annak nagyságát csak hozzávetőlegesen tudjuk megbecsülni: Egyesült Államokban, egy egyetemi hallgató esetében kb. 150.000 szó (vö. Gósy 2005). A kérdés megválaszolása megfelelő módszertani eszközök birtokában sem lenne egyszerű, ugyanis nem tisztázott, mi számít egy egységnek a mentális lexikonban (Dittmann 2002, Gósy 2005). – Ha minden szám külön szóként értelmezendő, akkor a mentális lexikon nagysága végtelen. – Külön számoljuk-e az összetett szavakat? – Külön számoljuk-e a képzett szavakat? – A mentális lexikon vizsgálatakor szavakat vagy fogalmakat vizsgálunk? Például a zöld szó is, fogalom is lehet egyben. Ha egy színmegnevezési tesztben ugyanakkor valaki katonai zöld vagy lilás-barnás (Navracsics 2007) kifejezéssel nevez meg egy színt, az azt jelzi, hogy a színt felfogta, érzékelte, csak a megfelelő szó hiányzik a szókészletéből (vö. Collins–Loftus 1975, Dittmann 2002). Jelen esetben tehát a katonai zöld egy egység (mivel egy színre utal, ami egy fogalomként van a mentális lexikonban) vagy két egység (szó forma, katonai + zöld)? Zechmeister et al. (1993) a mentális lexikon nagyságának laikusok általi megbecsültetésével egy sokkal kisebb, kb. 40.000 egységet tartalmazó lexikont feltételez, amelynek aktív részét 20.000 egységre becsüli.
Fogalmi szerveződés és mentális lexikon
25
2.1.1 Tárolás a mentális lexikonban A mentális lexikonban tehát az egységek nem függetlenek egymástól, hanem egymáshoz kapcsolódnak. A klasszikus felosztás szerint a mentális lexikon egyrészt fogalmi-szemantikai kapcsolatokat (fogalmak között jönnek létre, pl. hajó-víz), valamint lexikai és fonetikai kapcsolatokat (szavak között jönnek létre, pl. szép-kép) tartalmaz (utóbbival kapcsolatban vö. Lengyel 2012a, 2012b). A felosztás és elméleti különbségtétel szó és fogalom között viszont a mentális lexikon vizsgálata szempontjából nem mindig teljesen egyértelmű (vö. Fellbaum 1998: 9). A fogalmi és lexikális szint elkülönültnek tekinthető (vö. Navracsics 2007), ugyanakkor a mentális lexikon vizsgálatánál nem tudjuk csak a fogalmakat vizsgálni, hiszen amint kimondásra vagy leírásra került a fogalom, már lexikalizált, tehát a fogalmi szint, mint a kutatás tárgya nem megragadható (vö. Murphy 2003). A szóasszociációkkal foglalkozó irodalom is utal erre a kettősségre (Cramer 1968), illetve sok esetben szóasszociációs adatokat elemezve nem tisztázzák, mely szintet is vizsgálják. Huszár Ágnes (2005) a mentális lexikonban három szintet különít el: a konceptus (nyelvfüggetlen fogalom), a lemma (konkrét nyelvhez köthető, de absztrakt szó) és a lexéma (konkrét nyelvi szó, annak fonológiai alakjával) szintjét. Habár egyetértünk a fenti felosztással, valamint Navracsics Judittal (2007), hogy valószínűleg létezik egy nyelvfüggetlen fogalmi (konceptuális) szint, ahol az ismeretek nyelvfüggetlenül tárolódnak, a kutatás során a mentális lexikon ezen aspektusát nem kívánjuk vizsgálni. A szintek vizsgálata számos kérdést vet fel, többek között a szemantikai és konceptuális rendszerek elkülönülésével és a szó – mentális szó – lemma – lexéma – fogalom – lexikai fogalom összefüggéseivel kapcsolatban (vö. pl. Dittmann 2002, Jarvis 2009, Lang 1994, Pléh–Lukács–Kas 2008, Schwarz 1994). Kérdéses, továbbá, hogy a fogalmi szint hogyan vizsgálható, illetve lehet-e elkülönülten vizsgálni. Anélkül, hogy a kérdésben ezen a helyen állást foglalnánk, előrevetítjük, hogy kutatásunk eredménye pontosan egy olyan rendszer megalkotása, amely ezen kérdés megválaszolását feltehetően feleslegessé teszi (lásd 7.6 fejezet). A mentális lexikonban tárolt elemeket a továbbiakban ezért olyan egységként kezeljük, amelyek jelentést, szintaktikai, morfológiai és fonetikai információt tartalmaznak (Levelt 1989: 182, 2. ábra). Nem vizsgáljuk, hogy ezek az információk mikor, mely szinten jelennek meg, illetve az egyes szintek interakcióját sem elemezzük.
26
Fogalmi szerveződés és mentális lexikon
jelentés
szintaktikai információ
morfológiai információ
fonológiai információ
2. ábra. A mentális lexikon egy egységének felépítése (Levelt 1989: 182 alapján)
Levelt szerint a mentális lexikonban minden egység tartalmazza a jelentést, szintaktikai információkat (szófaj, azon belül pl. tárgyas ige), morfológiai információkat (pl. a jó középfoka jobb, vagy a tó többes száma tavak és nem *tók), valamint fonológiai információkat (kiejtés, hangsúly). Az egyes elemek valószínűleg további információkat is tárolnak. „There are, probably, additional properties stored with an item. It may have particular pragmatic, stylistic and affective features to make it fit one context of discourse better than other” (Levelt 1989: 183). Hasonlóan írja le a mentális lexikon egy elemének felépítését Bonin, azzal a különbséggel, hogy ő fonológiai, szemantikai, morfológiai és ortográfiai reprezentációt feltételez (Bonin 2004: viii). Az így tárolt információk egy része univerzális, másik része nyelvfüggő, vagyis egy-egy egység felépítése nyelvenként eltérhet. Pléh Csaba és munkatársai szerint a mentális lexikonban (náluk mentális szótár) a szavak nyelvtani, szóalakkal kapcsolatos, a világra utaló, valamint képekhez és fogalmakhoz köthető információkat tárolnak, illetve kapcsolatokat létesítenek más szavakkal (Pléh–Lukács–Kas 2008: 791). A mentális lexikonban nemcsak a szavak tárolódnak, hanem a világról alkotott enciklopédikus tudásunk is (Kay 1989): például a víz szóról tudjuk az alakját, jelentését, szintaktikáját, de tudjuk azt is, ha szilárd vízről beszélünk, az már jég, hogy víz borítja a Föld felszínének nagy részét, valamint azt, hogy a víz az élethez nélkülözhetetlen. Az egyes tárolt egységek esetében léteznek egységen belüli és egységek közötti kapcsolatok. Egységeken belüli kapcsolat van például a szó egyes ragozott alakjai között, míg az egyes egységek között többek között asszociatív (hajó – víz) és fonetikai (pár – szár) kapcsolatok jöhetnek létre. A tárolást vizsgálhatjuk egyrészt statikusan, másrészt a lexikális elérés (beszédértés, beszéd) folyamatában (Gósy 2005). A beszédprodukció során egy lexikai előkészítést (a kutya fogalma) követi a lexikai fogalom aktiválása (kutya), a lexikai válogatás (kutya, kutyus, eb), a lemma kiválasztása (kutyus), a morfológiai kódolása során a lexéma megalkotása (kutyust), a fonológiai kódolás és végül az artikuláció (Levelt alapján Gósy 2005: 209). A fogalmi előkészítés nem szükség-
Fogalmi szerveződés és mentális lexikon
27
szerűen nyelvi, lehet egy vizuális élmény, mentális kép is. A lexikai válogatás szintjén a beszélő a lehetséges nyelvi jelekből válogat, majd adott egységet megfelelő alakra hozza (morfológiai kódolás), végül kiejti a szót. A beszéd és a beszédértés közben lezajló folyamatok elemzése nem tartozik vizsgálatunk tárgykörébe; részletesen magyar nyelven többek között Gósy (2005) és Huszár (2005) foglalkozik a kérdéskörrel.
2.1.2 Fogalmak rendszerezése a mentális lexikonban A mentális lexikon felépítését többféleképpen próbálták leírni, azonban a mai napig nem létezik egységes, a működését, a felépítését, a pszicholingvisztikai kutatások során tapasztalt összes jelenséget magyarázó modell. Gósy Mária (2005) – Aitchison (2003) alapján – a mentális lexikon két alapvető reprezentációs modelljét nevezi meg: az atomgömb-elméletet és a háló-elméletet (Aitchisonnál human word-web). Az atomgömb-elmélet szerint a mentális lexikon különböző méretű szemantikai mezőket tartalmaz, ahol a mezők egyes elemei egyszerre több mező részét is képezhetik. A háló-elmélet (Gósy Máriánál pókháló-elmélet, vö. Gósy 2005) szerint viszont az egyes elemek egymással létesítenek kapcsolatot, ahol egy egységnek több másik egységgel lehet kapcsolata. A jelenlegi kutatások a háló-elméletet (3. ábra) látszanak igazolni (Aitchison 2003, Gósy 2005). Hall és Waxman (2004) kötetükben a gyermeki (és felnőtt) tanulásra is a háló szövése (weaving) metaforát használják: „we invoke the metaphor of weaving to consider the acquisition of the lexicon” (Hall–Waxman 2004: xi). A hálózatként való értelmezés megfelel Quillian (1968), később kifejtendő elgondolásának is.
3. ábra. A mentális lexikon hálósezrű felépítése (Aitchison 1987 és Gósy 2005: 198 alapján)
28
Fogalmi szerveződés és mentális lexikon
Kovács László (2007, 2008a) ezzel szemben azt feltételezi, hogy a hálómodell még mindig egyszerűsített: sok jelenséget ugyanis nem magyaráz meg, ha az egyes egységek között egyenrangúnak ábrázolt kapcsolatok vannak. Az egyenrangúnak tekintett kapcsolatok problémájára utal Aitchison (2003) is, mivel véleménye szerint számos szóasszociációs kutatás eredménye mutatja, hogy a kapcsolatok milyensége és erőssége nem azonos – ha nem lennének „preferált” kapcsolatok, akkor nem jöhetnének létre szóasszociációs normák. A háló-modell továbbfejlesztéseként a kapcsolatokat nem egyenrangúan ábrázoljuk, hanem azok irányítottak és súlyozottak lehetnek. A mentális lexikon felépítésének ábrázolása így gráfokkal történhet (4. ábra). Habár a modell eredetileg fogalmi domainek (adott fogalmi körbe tartozó szavak) ábrázolására jött létre (Kovács 2007, Lengyel 2008c), feltételezésünk szerint a modell alkalmas a mentális lexikon komplexebb összefüggéseinek bemutatására is. Az ábrán a nyilak a kapcsolatok irányát jelölik, a vonalak vastagsága a kapcsolatok erősségére utal.
4. ábra. A mentális lexikon felépítése domainekbe rendezetten, irányított, súlyozott gráfokkal (Kovács 2007: 147)
Az így megalkotott modell előnyei Kovács László (2007: 147) szerint: – a jelenleg legelfogadottabbnak tekinthető háló-modell továbbfejlesztéseként tovább finomítja a mentális lexikonról alkotott képünket; – megkönnyíti a mentális lexikon felépítésének kutatását; – alkalmas lehet több kutatás eredményeinek egy modellben történő egyesítésére, így magyarázhatja: a háló-elméletet (a mentális lexikon fogalmi kapcsolatainak kimutatása); a prototípus-elméleteket (vö. Rosch 1975, Kiefer 2007, Gósy 2000b);
Fogalmi szerveződés és mentális lexikon
29
a kollokációk (vö. Hoey 2005) összefüggéseit (valószínűsíthető, hogy a gráfokkal ábrázolt mentális lexikonban a „kollokáló szavak” erősebben és kölcsönösen kapcsolódnak egymáshoz); – alkalmas a különböző típusú (fonetikai, szemantikai stb.) kapcsolatok egyidejű jelölésére (pl. különböző színekkel vagy vonalfajtákkal). A modell a hálózatalapú és hálózatközpontú megközelítések metszéspontjában jött létre, így a modell egyaránt tekinthető hálózatalapúnak és hálózatközpontúnak. Hasonló modellt javasol Spitzer (1996), habár modelljénél nem beszél gráfokról, csak hálózatokról és pontokról. Fosmire (1965) és Pollio (1966) szóasszociációs adatokban kapcsolatok meglétének, illetve a kapcsolat irányának ábrázolására használnak gráfokat. Szóasszociációs adatokat szintén gráfként értelmez Kiss (1968, 1975), aki a gráfelmélet bizonyos elemeinek átvételét javasolja asszociációs struktúrák elemzésekor. Ezen alapul Kiss et al. (1973) angol nyelvű szóasszociációs adatbázisa (ma Edinburgh Associative Thesaurusként ismert), amely adatbázisban azonban a kétirányú kapcsolatok kezelése és ábrázolása nem egyértelmű. Emellet utal a kapcsolatok irányának fontosságára (Kiss 1975): adott szóból kiinduló, és a szóra irányuló asszociációk nem azonosak. A mentális lexikon gráfokkal történő ábrázolására már Fodor (1983: 80) is javaslatot tett: „[we] suppose the mental lexicon is a sort of connected graph, with lexical items at the nodes and with paths from each item to several other”, ugyanakkor Fodor nem definiálja a gráfok pontos fajtáját. Fillenbaum és Rapoport (1971) azonos szemantikai domainekben a szavak hasonlóságának leírását képzelik el gráfok segítségével. A mentális lexikont egy különleges gráfhoz, a hipertexthez hasonlítja Umamoto (1998). A hipertext a World Wide Web „nyelve” (hypertext markup language – html), amely lehetővé teszi, hogy a különböző weblapokról linkek mutassanak egy másik lapra, egy zeneszámra, egy videóra stb. A mentális lexikon hálózatától abban különbözik, hogy a WWW (World Wide Web) esetében egy objektumból csak egyetlen link indulhat ki, tehát pl. adott képről vagy egy másik lapra mutatok, vagy egy dokumentumra, de mindkettőre egyszerre nem. Egy honlapon belül viszont természetesen végtelen számú link helyezhető el. Umamoto a mentális lexikon hálózatos analógiájából kiindulva arra a következtetésre jut, hogy a mentális lexikon hipertexthez való hasonlítása hatékony nyelvoktatási módszerrel gazdagíthatja a szókincs oktatását. Az általa megalkotott My Mental Lexicon (MML) honlaprendszer elképzelése szerint nyelvtanulók mentális lexikon adatait (vagyis szóasszociációit) gyűjtené és rendszerezné: a szavak és az egyes tanulók asszociációi egymással kapcsolatban állnak, így az egyes személyek asszociációi külön-külön elemezhetőek. A kísérletként elkészített rendszer – 39 nyelvtanuló saját készítésű MML honlapja – alapján:
30
Fogalmi szerveződés és mentális lexikon
1.) segít a szavak közötti kapcsolatok vizualizálásában (ezáltal erősítve a tanulási folyamatot); 2.) multimediális karakterének köszönhetően (pl. képek is csatolhatók) ösztönzi a tanulót saját MML honlapja elkészítésére, ezzel mintegy játékká téve a szótanulást, valamint; 3.) a saját lapok létrehozása és mások lapjainak tanulmányozása során egy adott szóról szerzett nyelvi (szemantikai) információk az adott szó pontosabb beillesztését teszi lehetővé a mentális lexikon hálózatába. A mentális lexikon a fogalmakat (egységeket) tehát nem önállóan, egymástól függetlenül, hanem valamilyen rendszerben tárolja. Az így kialakuló fogalmi rendszerek a fogalmak egymáshoz való viszonyát is leírják (Harley 2001). A fogalmak egymáshoz való viszonyának megállapításához szükséges a fogalmak jellemzőinek feltérképezése, majd a jellemzők alapján történő csoportosítás. A szemantikai megközelítések a fogalmakat szemantikai jellemzők kombinációjaként írják le, amely jellemzők egyértelműen meghatározzák a fogalmat (terminológiai megközelítésben szükséges és elégséges kritériumok). Katz és Fodor (1963) rendszerében az adott fogalomhoz nyelvtani és szemantikai jelzők (grammatic markers, semantic markers) tartoznak: „Grammatical markers mark the formal differences on which the distinction between well-formed and ill-formed strings of morphemes rests, while semantic markers give each well-formed string the conceptual content that permits it to be a means of genuine verbal communication” (Katz–Fodor 1963: 210). Ezek a jelzők (melyek ugyan hipotetikusak, ennek ellenére a fogalmi rendszerezésben nagy szerepet kapnak) segítenek differenciálni az adott fogalom jelentéseit. Lowe (1997) a hasonló jelentésű szavak kapcsolatait elemezte: a szövegekben gyakran együtt szereplő szavakat (kollokációk) rögzítette, majd a kollokációkból alkotott topográfiai leképezés (egyfajta térkép) segítségével kimutatta, hogy a hasonló jelentésű szavak leképezése hasonló topográfiai képet eredményez. Eredményei magyarázattal szolgálhatnak a szavak megkülönböztetésének folyamatára, illetve a szemantikai előfeszítés (priming) jelenségére.
2.1.3 Szemantikai hálók A mentális lexikon tárolási elképzelései közül részletesebben a hálózatszerű megközelítéseket elemezzük. A hálózatszerű elképzelések esetén a mentális lexikon elemzése többnyire nem statikusan történik, vagyis a vizsgálatok és modellek a mentális lexikon működését is modellezni kívánják. Szemantikai hálók-
Fogalmi szerveződés és mentális lexikon
31
kal kapcsolatban, illetve kognitív nyelvészeti szempontból a szerzők egy része szemantikai memóriáról beszél. Különbségként meg kell jegyeznünk, hogy a szemantikai memóriával kapcsolatos kutatások általában csak a szemantikai kapcsolatokat (pontosabban a tudás reprezentálását) vizsgálják, míg a mentális lexikon vizsgálata során fonetikai kapcsolatok megléte is elfogadott. Collins és Loftus (1975) publikációjukban egy szemantikai és egy lexikai hálózatot különítenek el: a szemantikai hálóban a kapcsolatok szemantikai hasonlóságon, míg a lexikai hálóban fonológiai, illetve helyesírási hasonlóságon alapulnak. A szemantikai hálóban a kapcsolatok véleményük szerint annál erősebbek, minél több közös tulajdonsága van két tárolt egységnek. A szemantikai memória és mentális lexikon viszonyát explicit módon kifejtő publikáció számunkra nem ismert. A szemantikai memória Quillian (1968) szerint bejegyzésekből (entry) áll, ezekhez értékek (value) tartoznak. A bejegyzés és az érték közötti kapcsolat megnevezhető (attribute label). Az 5. ábrán a kanári (entry) értéke (value) sárga, a két információ között lévő kapcsolat (attribute label) pedig a szín. Az egyik összefüggésben értékként vagy kapcsolatként szereplő információ egy másik összefüggésben bejegyzés (entry) lehet. Az így létrejövő szemantikai hálózatok segítségével többek között modellezhető a szavak aktiválása/megtalálása beszéd közben. Ez a rendszerben terjedő aktiválással képzelhető el: a központi elemtől kiindulva mintegy hullámként/gömbként aktiváljuk a vele kapcsolatban lévő elemeket, egészen addig, amíg meg nem találtuk a megfelelő bejegyzést. szín (attribute label) kanári (entry)
sárga (value) hely (attribute label) test (value)
szín telítettsége (attribute label) világos (value)
5. ábra. Quillian szemantikai memória elképzelése (Ober–Shenaut 2006 alapján)
Quillian eredeti elképzelése alapján összetett fogalmi rendszereket is létrehozhatunk (Collins–Quillian 1969), amelyben a fogalmak egyfajta kapcsolati hálót alkotnak (vö. Baddeley 2001: 37).
32
Fogalmi szerveződés és mentális lexikon
Quillian modellje magába foglalja még a kognitív ökonómia feltevését, amely szerint a fogalmak egyes tulajdonságai hierarchikusan, annál a magasabb hierarchiai fokon álló fogalomnál tárolódnak, amelyre még igazak (tehát az ugat a kutya fogalomnál tárolódik, és nem a német juhásznál). A kognitív ökonómia elképzelés egyértelműen se nem cáfolható, se nem igazolható: azon kísérletek eredményei, amelyek az elvet igazolni látszanak, más magyarázatokkal is indokolhatók, például a szemantikus összetartozás elvével (Baddeley 2001). Collins és Loftus (1975) továbbfejlesztette Quillian eredeti elméletét, viszont rendszerük kevésbé szigorúan hierarchikus. Lexikai (fonológiai) és szemantikai (jelentés-alapú) kapcsolatokat egyaránt feltételeznek, ez utóbbiak erőssége is változó. Az eredeti és a továbbfejlesztett modellekre jellemző a terjedő aktiváció, vagyis elérés: szóelőhívás közben az aktivált elemmel kapcsolatban álló elemek különböző aktivációs szinteken vannak. Quillian, valamint Collins és Loftus elméletét a pszicholingvisztikai megközelítések közé soroltuk Ober–Shenaut (2006) alapján, ugyanakkor más szerzők (pl. Evans 2011) a kognitív megközelítések között tárgyalják őket. Rogers és McClelland (2003, 2004) kiindulási alapja szintén Quillian hálózati elképzelése, pontosabban annak Rumelhart által adaptált változata. Hálózatukban a szemantikai feladatok végrehajtása esetén az egyes (szemantikai) információk között irányított, súlyozott (de ezen túl nem definiált) kapcsolatok meglétét feltételezik. A szemantikai tudás kialakulása megközelítésükben kapcsolatok létrejöttét, illetve az információk közötti kapcsolatok erősségének változását jelenti tanulás vagy tapasztalat alapján. Rogers és McClelland modellje a PDP (Parallel Distributed Processing; párhuzamos megosztott feldolgozás) modellek közé tartozik. Ezen modellek elsősorban konnekcionistának tekinthetők (Huszár 2005). Az ilyen modellek esetében a feldolgozás párhuzamosan zajló folyamatok összessége és nem tartalmaz különböző reprezentációs szinteket. A PDP elmélet átfogó áttekintése és kritikája magyar nyelven a Pléh Csaba (1997) által szerkesztett kötetben olvasható. Az aktivációs (vagy aktivációterjedéses) modellek legfontosabb jellemzője, hogy a mentális lexikont csomópontok és az azokat összekötő kapcsolatok hálózataként írják le. A modellek szerint a hálózat elemei különböző aktivációs szintekre kerülnek beszéd, illetve beszédértés közben. Levelt, Roelofs és Meyer (1999) modelljében a csomópontok három formában (fogalmak, lemmák és szóformák) vannak jelen. A fogalmak szintjén a szavak szemantikáját tároljuk, alatta a lemma szinten a csomópont szintaktikai információt tartalmaz, míg a legalsó szint morfémákat és fonémákat. Ez a rendszer képezi az alapját Roelofs WEAVER (Wordform Encoding by Activation and VERification), majd WEAVER++ számítógépes programjának, mely az aktiválást modellezi. Levelt és Roelofs elképzelésének
Fogalmi szerveződés és mentális lexikon
33
alapjául Dell aktivációs modellje szolgál, amely a beszédszervezésben a szemantikai, a mondattani, a morfológiai és a fonológiai szintet különbözteti meg. Roelofs (1992) a beszédben a megfelelő szavak megtalálását hálózaton keresztüli aktiválásként értelmezi: rendszerében egy adott szó hallásakor a vele kapcsolatban lévő szavak egy magasabb aktivációs szintre kerülnek, tehát könnyebben előhívhatók. Az oroszlán szó hallatán az Afrika, szavanna, üvölt szavak könynyebben, míg a kutya vagy bádogtető szavak (viszonylag) nehezebben hívhatók elő, mivel utóbbiak nem kerülnek magasabb aktivációs szintre. Az aktivációs modellek jelenleg a legelfogadottabb modellek közé tartoznak. Ellenük szól viszont a mentális lexikonban létrejövő nagy számú kapcsolat. Ha feltételezzük, hogy egy egység 20 másik tárolt egységgel van kapcsolatban, akkor ez egy többszintű aktiválás esetén 20x20x20=8000 egység aktiválását jelenti. Ezen szám csökkenthető, amennyiben feltételezzük, hogy bizonyos aktiválási folyamatok erősebbek, mások gyengébbek, tehát nem aktiváljuk egyszerre az összes kapcsolatot (Huszár 2005: 63-64). Aktiválás közben blokkolási folyamatok is működ(het)nek, amelyek csökkentik az aktivált egységek számát, illetve akadályozzák az aktiváció terjedését (vö: Kiss 1975, Gósy 2005). A mentális lexikon kapcsolatainak erőssége, valamint az adott feladat döntheti el, hogy mely kapcsolatokra terjed, vagy nem terjed ki az aktiválás. A kapcsolatok feltételezett erősségére (amelyet aktiválás közben jelenleg nem tudunk mérni) a szóasszociációs kutatások deríthetnek fényt – természetesen nem egy adott személy, hanem egy „általánosabb” modell esetében, pl. egy adott nyelvre vagy egy viszonylag homogén szociológiai csoportra vonatkozóan. Az aktiválás terjedését biztosan befolyásolja az adott feladat: ha verset kell írnunk, akkor rímek keresésekor a fonetikai kapcsolatokat aktiváljuk, míg ha levelet írunk, akkor a szintaktikai és szemantikai kapcsolatok fontosabbak. A mentális lexikonnal kapcsolatos legújabb elméletek is tartalmaznak hálózatokkal kapcsolatos megállapításokat. Baayen (2007) véleménye szerint a konnekcionista elméletekkel szemben több empirikus adatot tud megválaszolni a hierarchikus temporális memória (Hierarchical Temporal Memory) elmélet. Az elmélet szerint a mentális lexikon aktív memória-csomópontokból (memory nodes) épül fel. „Each node is itself a network that learns causes from its child nodes and forms beliefs that it propagates to its parent nodes” (Baayen 2007: 97). A rendszer lentről felfelé haladva osztályozó funkciót is ellát. A modell nem nyelvfeldolgozásra született, ugyanakkor lehetőséget ad a mentális lexikon pontosabb számítógépes modellezésére. A közeljövő kutatásainak azonban összetettebb célja is kell, hogy legyen: az eddig egymástól függetlenül elemzett jelenségeket ismét szintetizálni kell ahhoz, hogy a nyelv (és a mentális lexikon) működését jobban megérthessük (vö.
34
Fogalmi szerveződés és mentális lexikon
Westbury–Hollis 2007: 28). De Boot (2012) is utal rá, hogy a jelenlegi pszicholingvisztikai modellek nem minden beszéddel és gondolkodással kapcsolatos jelenségre adnak magyarázatot, ezért szükséges lenne olyan komplex modell(ek) megalkotása, amely(ek) figyelembe veszi(k) az aktuális kutatások eredményeit. Ezen modellekre akkor is – illetve annál inkább – szükség van, ha ezen új modellek szakítanak az eddigi hagyományos modellekkel és új megoldásokat keresve szemléletváltást idéznek elő a mentális-kognitív folyamatok megismerésében.
2.2 A mentális lexikon vizsgálata: szóasszociációk A mentális lexikon vizsgálata szóasszociációs tesztek segítségével történhet. Szóasszociációs kísérletek esetében a kísérletvezető által szóban vagy írásban megadott hívószóra a kísérleti alany leírja (kimondja) az első válaszszót, amely eszébe jut, majd az így összegyűjtött adatokból vonnak le a kutatók következtetéseket a mentális lexikon felépítésére, az egyes szavak közötti kapcsolatokra vonatkozóan. Szósszociációs teszteket végezhetünk egy nyelven (pl. Postman– Keppel 1970), de vizsgálhatjuk vele a kétnyelvű mentális lexikont is (Navracsics 2007, Meara 2009).
2.2.1 A szóasszociációs vizsgálatok módszertana Az asszociációkkal kapcsolatos kutatások az ókorig nyúlnak vissza: a klasszikus asszociációs elméletek felállítói között szerepel például Platón és Arisztotelész (Esper 1973). A következő nagy fellendülése az asszociációs kutatásoknak a 17. századtól kezdődik, amikor brit filozófusok – pl. Locke, Hume, Mill – próbálták az asszociáció módszerével az elmét feltérképezni (részletesen Deese 1965, illetve vö. Esper 1973, Szalay–Deese 1978). A szóasszociációk modern kori kutatása Galton nevéhez fűződik, aki az asszociációt, mint módszert saját magán alkalmazva próbált többet megtudni az elme működéséről (Galton 1879, 1883). Cramer (1968) szóasszociációkról szóló összefoglaló művében több mint 300 – 1950 és 1965 között végzett – szóasszociációs kísérlet eredményét rendszerezi és foglalja össze. Az ókori görögök arra kerestek választ, milyen folyamatok eredményeként jutnak eszünkbe különböző dolgok. Ebből a korból származik az asszociációs törvények első csoportja, mely szerint az asszociációk többek között hasonlóságon vagy kontraszton alapulnak: „associations between ideas are based
Fogalmi szerveződés és mentális lexikon
35
on contiguity, similarity or contrast” (Cramer 1968: 3). A 18-19. század folyamán ezeket az első törvényeket bővítették a brit kutatók, melynek eredményeként létrejöttek a másodlagos asszociációs törvények. A másodlagos törvények szerint az asszociatív kapcsolatokra hatással van a stimulus intenzitása és időtartama, gyakorisága, illetve az asszociáció azonnalisága (feladat változói és környezeti változók), valamint többek között a kísérleti alany érzelmi állapotának változása és múltbeli tapasztalatai (kísérleti alany változói). Ennek fényében a korai asszociációs kutatások is két nagy csoportra bonthatók: egy részük az elsődleges törvényekkel és az asszociációk létrejöttével kapcsolatos: többnyire pszichológusok és a nyelvelsajátításban valamint tanulási folyamatokban érdekelt kutatók vizsgálatai tartoznak ide. A másodlagos törvényekkel foglalkozók ezzel szemben a már létező asszociációk változásait, módosulását vizsgálták. Jellemző továbbá, hogy a korai szóasszociációs kutatások nagyobb figyelmet fordítottak az asszociációs válaszok idejére, tehát a stimulus és válasz között eltelt időtartamra. A asszociációs tesztek csoportosítása Cramer alapján: 1. szabad asszociációk; 1.1 egyszavas asszociációk: bármely egyszavas válasz elfogadott; 1.2 ismételt asszociáció: a hívószót ismételve (többször hallott/olvasott) adott asszociációk (esetenként kikötve, hogy nem lehet ugyanaz a válasz); 1.2.1 ismételt asszociációs listák: egy többszavas lista kerül ismétlésre; 1.3 folyamatos asszociáció: hívószó egyszer hallott/olvasott, az asszociációk maximális száma vagy a rendelkezésre álló idő adott; 1.4 láncszerű asszociáció: a hívószóra adott válaszszó lesz a következő hívószó; 1.5 többszavas válaszok: a hívószóra csak többszavas válaszok megengedettek; 2. kontrollált asszociációk; 2.1 csak adott választípust megengedő asszociációk: az asszociációknak meg kell felelniük bizonyos előre meghatározott kritériumnak; 2.1.1 logikai összefüggést kérő asszociációk: pl. fölé vagy alárendelt fogalmat várnak; 2.1.2 szemantikai mezőből várt válaszok: pl. a válasz csak egy szín lehet; 2.2 választásos asszociáció: előre megadott válaszokból kell kiválasztani a legmegfelelőbb asszociációt;
36
Fogalmi szerveződés és mentális lexikon 2.3 több hívószavas asszociáció: több hívószót hallva azt az asszociációt kell megadni, amely minden hívószóra „válasz”; 2.4 fordított asszociáció: a kísérleti alany a válaszszavakat kapja meg, a hívószót kell kitalálnia; 2.5 folyamatos kontrollált asszociáció: a kísérleti alany nevezzen meg adott kategóriából minél több egyedet, például nevezzen meg annyi madarat, amennyit tud 15 perc alatt (Cramer 1968: 11-16).
Az ismételt asszociációs vizsgálat (1.2.1) esetén két adatfelvétel között eltelhet rövidebb vagy hosszabb (akár több hónapos) idő is. Kísérletek eredményeként egy-két héttel később, a megismételt teszt esetében nagyjából az esetek 50%ban más válaszszót kaptak a kutatók, mint az első teszt esetében. Folyamatos aszszociációnál (1.3) nem tudni, hogy a 2., 3., 4. stb. válaszszót mely szó hívta elő: az eredeti hívószó, vagy valamely, már válaszszóként megadott szó. Fosmire (1965) ezt a jelenséget alkalmazta a kísérleti alany asszociációs hálózatának jobb megismerésére: a hívószóra megadott válaszszó lett a következő hívószó, majd az arra adott válasz a következő hívószó stb. Hasonlóan jártunk el az Agykapocs rendszer esetében, ahol a kezdeti 100 szavas hívószó-listára adott válaszszavak bekerültek egy adatbázisba, és maguk a válaszszók is hívószavak lehettek a továbbiakban (részletesen lásd később). Gósy Mária (2005) az asszociációs tesztek egy egyszerűbb csoportosítását mutatja be: 1. szabad asszociáció; – első válaszszó; – meghatározott számú válaszszó; – meghatározott ideig tartó válaszok; – megkötés nélkül, azt ír/mond ami eszébe jut; 2. szűkített asszociáció – adott kategóriából válasz, pl. ellentét, hasonló hangzás; 3. nyitott tesztek – egy jelentéskategórián belül (pl. állat) bármennyi válaszszó (Gósy 2005: 203-204). A fent említetteken kívül további lehetőség a teljesen szabad asszociáció, ahol minden megkötés nélkül adott időkorlát alatt kell szavakat előhívni. Ezt a módszert alkalmazta többek között Cser János (1939) is. Az általunk (Cramer alapján) kontrollált asszociációnak nevezett asszociáció mint láttuk Gósy Máriánál (2005: 204) szűkített asszociációként, míg Pléh Csabánál és munkatársainál kötött asszociáció néven szerepel (Pléh–Lukács–Kas 2008). Asszociációs feladatok egy másik felosztási lehetősége a stimulus formája (írott vagy hangzó), illetve a válasz formája szerint lehetséges (írott vagy hangzó) (vö. Cramer 1968). Ritkább esetben képi stimulusra vár „választ” a kísérlet veze-
Fogalmi szerveződés és mentális lexikon
37
tője, illetve rajzolt vagy kimondott hívószóra válaszként rajz elkészítése is elfogadott lehet (Szalay–Deese 1978). A lehetőségekbe a hordozó médiumot is bevonva a hívószó és a válaszszó megadására a következő felosztást tehetjük: 1. hívószó képként, papír alapon, vagy számítógépen; – válasz írásban, papír alapon, vagy számítógépen; – válasz szóban; – válasz rajzolva (kép); 2. hívószó írásban, papír alapon, vagy számítógépen; – válasz írásban, papír alapon vagy számítógépen; – válasz szóban; – válasz rajzolva (kép); 3. hívószó szóban, előre rögzítetten vagy élőszóban; – válasz írásban, papír alapon vagy számítógépen; – válasz szóban; – válasz rajzolva (kép). Már a korai kutatások is foglalkoztak a szemantikai előfeszítés (priming) kérdésével: megállapították, hogy a szóasszociációs teszt elvégzése előtti bármilyen esemény (pl. beszélgetés egy témáról) hatására a válaszszavak is megváltozhatnak. Storms figyelte meg tesztek során, hogy adott (egyébként ritka) hívószó megjelenhet később egy másik hívószóra válaszként is (idézi Cramer 1968). Írásbeli vagy szóbeli tesztelés során (stimulus formája (írott, hangzó) vagy az elvárt válasz (írott, hangzó)) a különböző változatok esetén a válaszszavakban kimutatható esetleges különbségek nem egyértelműen köthetők mindig csak az adott módszerhez, ugyanis a legtöbb ilyen jellegű kutatás figyelmen kívül hagyja a szociális faktort, vagyis hogy szóbeli teszt esetében az adatfelvétel általában egy kísérleti személy és egy kutató részvételével történik, míg írásbeli tesztek esetében a válaszadás csoportos. Ugyanígy befolyással lehet a tesztekre a kísérletvezető távol- vagy jelenléte is (Cramer 1968). A szóasszociációs vizsgálatok eredményeit befolyásolhatja a hívószó kategóriája (pl. hogy pozitív vagy negatív jelentésű, köznyelvi szó vagy szakszó), gyakorisága, ismertsége (Cramer 1968). A válaszadók szempontjából különbségeket figyelhetünk meg a válaszadó kora (Libárdi 2001, Gósy 2000a, Gósy 2001), neme (Cser 1939, Kegyesné 2002, Rosenzweig 1970), képzettsége (szintje, szakterülete) (Cramer 1968, Rosenzweig 1970), a nyelvismeret szintje (Södermann 1993), kultúrkörhöz való tartozása (Cramer 1968, Navracsics 2007, Szalay–Deese 1978), intelligenciája és verbális képessége, értékei, érdeklődési köre (Cramer 1968); gyerekek esetében többek között a szülők által használt nyelv(ek), és a
38
Fogalmi szerveződés és mentális lexikon
szülők végzettsége (Bátyi 2010) szerint. Mindezen változók nem aktuális, de legátfogóbb, összetett elemzését Cramer (1968) adja. Szintén az 1960-as évekig foglalja össze a főbb szóasszociációs kutatásokat Creelman (1966), aki a jelentés megismerésével kapcsolatban látja a szóasszociációk jelentőségét: az asszociációkkal kapcsolatos fontosabb mérőszámokat mutatja be, illetve azon változókat, amelyek az asszociációkat befolyásolhatják. Esper (1973) az asszociációs kutatások korai történetét mutatja be részletesebben, kitér ugyanakkor a válaszok besorolásának és a válaszadási idő kérdéskörére is. Deese (1965) összefoglaló műve az asszociációs kutatások történetét és módszereit írja le, illetve bemutatja saját kutatásainak eredményét. Ez utóbbi alapján egy asszociációs szótárt is tartalmaz kötete. Magyar nyelven orosz és magyar szóasszociációk több szempontból történő összevetését Papp Ferenc publikációjában (1984/2006) olvashatjuk. Lengyel Zsolt (2012b) kötetében magyar anyagon végzett szóasszociációs kutatások eredményeit prezentálja, elemezve a paradigmatikus/szintagmatikus, illetve fonetikaifonológiai kapcsolatok motiváltságát, a szófajmegőrzés és szófajváltás kérdését. Az annotációval kapcsolatos kérdések mellett konkrét példákon keresztül mutatja be asszociációk komplex elemzésének lehetőségeit is. A magyar szóasszociációs kutatások kapcsán meg kell említenünk Cser János (1939) kutatásait, aki 10-14 évesek szabad asszociációit vizsgálta (15 percen keresztül szabad aktiválás írásban) összesen 4483 gyermek esetében (szógyakorisági feldolgozást azonban csak 1000 gyermek válaszain végeztek). A kapott adatokból Cser János összeállította a 10-14 éves gyermekek szótárát, külön feldolgozva a fiúk és lányok által adott válaszokat, valamint szótárában jelölve a kort is (év), amelyben a szó a gyermek szókincsében biztosan megjelenik. A nemek szerinti különbségeket elemezve megállapítja, hogy a fiúk a harccal, technikával, fémekkel, mezőgazdasággal, míg a lányok az emberekkel, ételekkel, virágokkal, színekkel kapcsolatban aktiváltak lényegesen több szót (részletesen Cser 1939: 20-28). A kutatás eredményeinek alkalmazott nyelvészeti és nyelvpedagógiai jelentősége is kiemelkedő: az asszociációk alapján adott korban ismertnek tekinthető szavak segíthetnek abban, hogy tankönyvek szövegeiben az adott korosztály által ismert szavak azonosíthatók legyenek (vö. Cser 1939: 28-29). A szóasszociációs stratégiák, illetve a szóasszociációs eredmények korszakfüggők is: Gósy Mária és Kovács Magdolna szóasszociációs kutatásuk eredményeit egy 60 évvel korábbi kísérlet (Cser 1939) eredményeivel vetik össze, habár elemzésük mélysége nem azonos Cser János (1939) elemzésének mélységével – Cser János többek között külföldi kísérletek eredményeivel is összeveti a magyar eredményeket, illetve a 10-14 éves kor szótárát is publikálja. A feladat (15 perces szabad aktiválás írásban), illetve az adatközlésben részt vevő szemé-
Fogalmi szerveződés és mentális lexikon
39
lyek kora és száma is azonos volt a két kísérletben; azonban meg kell jegyeznünk, hogy Gósy Mária és Kovács Magdolna csak a 12-13 évesek körében végeztek adatfelvételt, és ezen korosztály adatait vetik össze Cser azonos korosztályának adataival. Míg 1939-ben a feladat során a vizsgálatban résztvevő gyerekek 37.912 szót aktiváltak, addig a 60 évvel később megismételt kísérlet esetében ez a szám 52.225. A nagy számbeli különbség okaként a kézírás sebességének változása is felmerült, de ez csak részben magyarázhatja a lényegesen több aktivált szót. „El kell fogadnunk, hogy – ha nem is az abszolút értékek mentén –, de a mai 12 és 13 évesek szókincse feltehetően nagyobb, mint (déd)nagyszüleiké, és/vagy a hozzáférési út gyorsabb. Felmerülhet még a stratégia esetleges különbözősége is” (Gósy–Kovács 2001: 351). Meg kell ugyanakkor jegyeznünk, hogy Cser János (1939: 14-15) kísérletét akkori amerikai (sic!) és genfi kísérletekkel összevetve azt találta, hogy az eredményeket összehasonlítva a magyar gyermekek átlagban a leglassabbak: ennek okát a szavak hosszúságára és az írás sebességére vezeti viszsza, ugyanakkor rámutat arra is, hogy ezen különbségek nem magyaráznak minden eltérést. Lengyel Zsolt 2000-től újra megismételte a Cser-féle kutatást, 3000 vidéki és budapesti alannyal. Eddig 400 alany adatát dolgozta fel és elemezte Csomai Lídia (2012). A 400 alany összesen 45.572 szót aktivált, amely alátámasztja Gósy–Kovács (2001) eredményeit, miszerint napjainkban sokkal több szót aktiválnak az alanyok, mint Cser kutatásai esetében. (Cser Jánosnál a 10-14 év közötti alanyok – 1000 fő – összesen 89.705 szót aktiváltak; Lengyel Zsolt és Csomai Lídia 400 fős adatait 1000 főre vetítve kb. 114.000 aktivált szót kapunk.) Csomai Lídia elemzése részben arra is rámutat, hogy az elmúlt 70 évben a Cser által vizsgált kategóriákon belül (lásd feljebb) milyen változások történtek: például az étkezés kategóriában sokkal több szót aktiváltak; a harc kategória aktiválása napjainkban szinte teljesen hiányzik és szintén lényegesen kisebb az aktivált cselekvések száma is. Az egyes kategóriákon belül a fiúk és a lányok aktiválása is nagy mértékben változott az 1939-es adatokhoz képest: ma már nem olyan egyértelműen mutathatók ki fiú és lány kategóriák: például a technika kategória szavai ma már nem csak a fiúkhoz, míg az iskola szavai nem csak lányokhoz köthetőek (részletesen Csomai 2012). Folyamatos asszociációknál kérdéses az asszociációs válaszok súlyozása is: Szalay és Deese (1978) hívószavakra egy percig várt szabad asszociációt. A válaszokat azok sorrendje szerint is súlyozták, majd a kísérletet (azonos alanyokkal) egy héttel később megismételték. Eredményeik szerint az első kísérlet első helyén érkező válaszoknak 61%-a az ismételt kísérletben is aktiválásra került; ezzel szemben az eredeti kísérlet 11. helyén aktivált szavaknak csak 12,5%-a aktiválódott a megismételt kísérlet során.
40
Fogalmi szerveződés és mentális lexikon
Szóasszociációs kutatások során a hívószavakra kapott asszociációkkal kapcsolatban kvantitatív és kvalitatív vizsgálatokat végezhetünk. Kvantitatív például a kapcsolatok erőssége: mely szó volt a leggyakoribb (első) válaszszó. Szintén kvantitatív a válaszok száma és konzisztenciája, vagyis hogy egy hívószóra hány válaszszó jött és ezek mennyire azonosak, illetve eltérőek. Kvalitatív megállapítások vonatkozhatnak többek között a hívószó és a válaszszó kapcsolatára: paradigmatikus-szintagmatikus, alá-, fölérendelt, ellentét, szinonima, fogalmi közelség. További lehetőségként kínálkozik két vagy több stimulus összevetése, vagyis a rájuk adott válaszszavak összehasonlítása. Vizsgálhatók továbbá különböző egyének által adott válaszok közti egyezések vagy eltérések is (vö. pl. Lengyel 2005, Navracsics 2007). Gósy Mária és Kovács Magdolna (2001) alapján példaként bemutatjuk a hívószóra adott válaszok egy lehetséges (viszonylag egyszerűbb) besorolását. 1. Hangzási (fonetikai) összefüggés a) homonímia, b) részleges fonetikai azonosság. 2. Szerkezeti összefüggés a) szóképzés, b) szóösszetétel, c) szószerkezet. 3. Szemantikai összefüggés a) koordináció, b) alárendeltségi, ill. fölérendeltségi kapcsolat, c) szófaji azonosság. Az asszociációs válaszok besorolása a klasszikusnak tekinthető megközelítés szerint lehet fonetikai vagy szemantikai, illetve paradigmatikus vagy szintagmatikus (vö. pl. Fitzpatrick 2006, Gósy 2005, a paradigmatikusszintagmatikus besorolás történetével kapcsolatban vö. Esper 1973: 131-133). Kent és Rosanoff (1910) osztályozásában a válaszok lehettek általános (várt, normaszerű) válaszok, kétséges válaszok (az előzőek képzett szavai) és egyéni válaszok. Ez utóbbiba tartoznak többek között a fonetikai válaszok (sound reactions), vagy az aktuális hívószót megelőző hívó- vagy válaszszóra adott reakciók. A különböző válaszok osztályozása számos módon lehetséges (pl. Cramer 1968, Lengyel 2008c, Lengyel 2010, Lengyel 2012a, Lengyel 2012b, Markowitz 1988, Navracsics 2007), ugyanakkor a besorolási lehetőségeket az adott kutatási cél is befolyásolhatja. Szalay és Deese (1978: 145) utalnak rá, hogy a kapcsolatok besorolása nem mindig egyértelmű és nem automatizálható: mindig tudatos dön-
Fogalmi szerveződés és mentális lexikon
41
tés eredménye, amely döntés során figyelembe kell venni az adott kultúrát, valamint azon csoport jellemzőit, amely csoport tagja az asszociációt adta. A besorolások nem mindig egyértelműek: szemantikai kapcsolatok besorolásának nehézségeit és lehetőségeit Chaffin és Herrmann (1988) fejti ki bővebben. A klasszikus felosztás helyett jelentésen alapuló (szinonimák, fogalmi kapcsolat, alá-, fölérendelt viszony), mondatbeli pozíción alapuló (kollokáció), formán alapuló (ragozás, alaktani hasonlóság) és hibás asszociációkat (nem magyarázható kapcsolat vagy nincs válasz) különböztet meg Fitzpatrick (2006). Válaszok lehetséges besorolásának összefoglalását, illetve a hívószóválaszszó kapcsolatrendszerét, annak motiváltságát Lengyel Zsolt (2012b) írja le részletesen.
2.2.2 Szóasszociációs kutatások eredményei Az egyik ma is legtöbbet idézett asszociációs kutatás Kent és Rosanoff (1910) nevéhez fűződik, akik asszociációs tesztek eredményeivel különböző mentális betegségekre jellemző asszociációkat próbáltak kimutatni. Publikációjuk jelentőségét inkább a nem beteg egyénektől (mintegy kontrollcsoporttól) begyűjtött asszociációs normák (100 hívószóra a válaszok 1000 (!) alanytól), mintsem nyelvpatológiai eredményeik adják. A 20. század második feléből fontos megemlítenünk Postman és Keppel szóasszociációs normákat tartalmazó kötetét (Postman–Keppel 1970). A kötet 15 év vizsgálataiból mutat be asszociációs normákat, kutatásonként önálló fejezetbe foglalva. A kötet publikációinak többsége a Kent–Rosanoff-féle (1910) asszociációs teszt hívószólistáját használja fel az újabb normák megalkotásához. Az eredeti teszt eredményei Kent–Rosanoff asszociációs normákként (Kent–Rosanoff norms) az asszociációs kutatások széles körét inspirálták. Postman és Keppel kötetének érdekessége, hogy a kutatások nem egy országban, illetve egy nyelven történtek: Jenkins (1970) a tesztet amerikai, Miller (1970) angol és ausztrál, Russel (1970) német, Rosenzweig (1970) francia alanyokkal végezte el. A tesztek eredményeinek összehasonlítása (pl. Kovács 2009c) megmutatja, hogy nem csupán azon hívószavaknál mutathatók ki különbségek a válaszszavakban, amelyek reáliának („kultúrára sajátosan jellemző jeltárgy”; Klaudy 1999: 163) tekinthetők, ellenkezőleg, a leghétköznapibb szavak is (pl. ház) más asszociációs normákat eredményeznek különböző nyelveken. Hadley (1997) megfogalmazásában a szavak kulturális töltettel is rendelkeznek: „Core words are full of cultural connotations, if not unique prototypical representaions” (Hadley 1997: 490). A megoldás véleménye szerint az, ha a lexikai egységeket kulturális proto-
42
Fogalmi szerveződés és mentális lexikon
típusnak tekintjük: „viewing words and lexical items as cultural prototypes” (Hadley 1997: 491). Hasonlóképpen Malt, Sloman és Gennari (2003) szerint különböző nyelvek esetében a fogalmak megnevezését több (pl. kulturális, nyelvspecifikus) tényező befolyásolja, ezért a megnevezések nem fedik egymást, vagyis a szavak jelentése a különböző nyelveken még egyszerűbb szavaknál sem szükségszerűen feleltethető meg egymásnak egyértelműen (vö. továbbá Malt– Gennari–Imai 2010; magyar és angol nyelvre Oláh-Nagy Noémi 2012 – ez utóbbit részletesen lásd 4.2 fejezet). Fordításokkal kapcsolatban említi Eco ezt a problémát: amerikai detektívregények angol uptown/downtown kifejezéseinek olaszra fordítása città bassa és città alta-ként teljesen más képzeteket kelt az olasz olvasóban, mint az angol eredeti. A fogalmak helyes fordítása általánosan nem meghatározható, minden egyes esetben meg kell fontolni a helyes fordítást, hiszen az függ attól, melyik amerikai városról van szó, ott mit neveznek up- illetve downtownnak (Eco 1999: 335-336). Aitchison (1997: 68) példaként angol-francia összehasonlítást hoz: az angol nyelvben csak az számít közlekedési eszköznek (vehicle), aminek kereke van, ezzel szemben a francia nyelvben a sí is a közlekedési eszközökhöz sorolható. A Postman és Keppel kötetében publikált kutatásokból három fontos általános megállapítás született: 1. a válaszok többnyire a hívószóval kapcsolatos tárgykörből származtak: a tű szóra a varrással kapcsolatos válaszok aktivizálódtak, pl. varrni; 2. az esetek nagy többségében a párok egymást hívták elő, pl. férj – feleség, nagy – kicsi; 3. felnőttek esetében a válaszszónak legtöbbször ugyanaz volt a szófaja, mint a hívószónak, vagyis a főnév általában főnevet hívott elő (Aitchison 2003). Fontos megjegyeznünk, hogy ez utóbbi (szinte minden szóaszszociációs kísérletben megfigyelt) eredmény a szóasszociációs kísérletek felépítésétől és adott nyelvtől is függhet: a kísérletek nagy többségében a hívószavak nem toldalékoltak, hanem szótári alakok. Az Agykapocs-kutatásban (lásd 5. fejezet) a hívószó bármilyen nyelvtani alakban szerepelhet (mivel a hívószavak a korábbi válaszszavakból kerülnek ki), tehát bármilyen raggal, jellel stb. ellátva. Az adatbázis elemzésekor azt tapasztaltuk, hogy a szótári alakú hívószavak legtöbb esetben szintén szótári alakú, azonos szófajú válaszszavakat hívnak elő. Toldalékolt alakok viszont nagyobb százalékban aktiváltak más szófajú szavakat, többnyire szintagmatikus kapcsolatok formájában. Példák az Agykapocs-rendszerből: boltban – vagyok, boltban – vásárol, vízben – úszik, könyvet – vett, könyvet – olvas. Wilks, Meara és Wolter (2005) kísérletükben nem aktív asszociációkat alkalmaztak, vagyis nem hívószavakra vártak válaszokat, hanem az asszociációk passzív (nem produktív) felismerése volt a cél: adott szavakat látva a kísérleti alanyoknak meg kellett nevezniük azt a kapcsolatot, amely szerintük a legerősebb. Az eredmények arra engedtek következtetni, hogy az így kapott passzív asszociá-
Fogalmi szerveződés és mentális lexikon
43
ciók esetében sok esetben nem közvetlen, hanem csupán közvetett kapcsolat volt a két szó között: a repülőgép és a madár (legerősebbnek vélt kapcsolat) szavak esetében a közös, közvetett kapcsolat, hogy mind a repülőnek, mind a madárnak szárnya van és mindkettő repül – ugyanakkor hagyományos (aktív) asszociációk esetében se a madár hívószó nem hívja elő válaszként a repülőgép szót, se a repülőgép a madarat. A tapasztalt problémák az asszociációkutatás alapjait is megkérdőjelezhetik: „[…] it also suggests that previous work on L2 word associations may have been very naive in assuming that word association behaviour was a direct reflection of the immediate connections between words” (Wilks–Meara– Wolter 2005: 371). Az asszociációs kísérletekkel kapcsolatban az eddig bemutatott kérdéseken túl számos kritika is megfogalmazódott. Szóasszociáció során szókincsünk bizonyos elemét hívjuk elő, de a műveletnek nincsen köze sem a beszéléshez, sem a megértéshez (Gósy 2001), tulajdonképpen a kísérlet maga egy „beszédidegen” folyamat. Aitchison szintén hasonló megállapítást tesz: hívószóra válasz adása szerinte sem reprezentálja megfelelően a beszédfolyamat során végbemenő tevékenységeket. „[T]hinking up immediate responses to just one word is a somewhat unnatural kind of activity, so may not reflect ordinary speech processes” (Aitchison 2003: 85). Coleman 1964-es kutatásai szerint az asszociációs eredmények drasztikusan megváltoznak, ha a szavakat nem önmagukban, hanem más szavakkal együtt jelenítjük meg: a hold hívószó a nap, éjszaka, csillag szavakat hívja elő, de amennyiben együtt áll az elefánt, stadion, bálna hívószavakkal, akkor a válaszszó már a nagy lesz (idézi Aitchison 2003). Aitchison végeredményben az asszociációt, mint módszert vonja kétségbe: véleménye szerint az asszociációk valószínűleg csak keveset árulnak el a mentális lexikon hálózatáról. Úgy gondolja, az adott hívószóra adott válaszok sokfélesége (Aitchison a koordinációt (só – bors), kollokációt (só – víz), fölérendelt viszonyt (kék, piros – szín) és a szinonim kapcsolatot (vásárol – vesz) nevezi meg) nem magyarázza a lexikon működését, hanem inkább kérdéseket vet fel, hogy hogyan tudja a mentális lexikon ezeket az erősebb (koordináció, kollokáció) és gyengébb (fölérendelt viszony, szinonimitás) kapcsolatokat egyszerre kezelni (vö. Aitchison 2003: 84-101). A szóasszociációs vizsgálatok tehát több mint egy évszázada használatosak pszichológiai és nyelvészeti módszerként. A hívószavakra adott válaszok besorolási lehetőségei nem egyértelműek, a vizsgálati módszert több kritika is érte a közelmúltban is. A kritikák és bizonytalanságok ellenére a módszer fontos eszköze a pszicholingvisztikai kutatásoknak, mivel jelenleg nem ismerünk elfogadottabb módszert a mentális lexikon kapcsolatainak tanulmányozására.
44
Fogalmi szerveződés és mentális lexikon
2.3 A mentális lexikon néhány vizsgálati aspektusa A mentális lexikon vizsgálatának konkrét eredményeit a gyerekek fogalmi szerveződésének kialakulása során és a kétnyelvű mentális lexikon kialakulásával kapcsolatban vizsgáljuk, bemutatva a mentális lexikon egységei közötti kapcsolatok kialakulását, illetve a már létrejött kapcsolatok változásának folyamatát. Az elemzés egy része átdolgozott formában (Kovács 2009a, 2009b) már publikálásra került.
2.3.1 Gyermekek fogalmi elsajátítása Bármely új szó elsajátítása során az adott szót egy már meglévő rendszerbe kell beillesztenünk. A szavak nem önállóan léteznek, a jelentésüket a más szavakkal való kapcsolataik határozzák meg. „Words do not exist in isolation: their meanings are defined through sense relations they have with other words” (Carter 1992: 186). „[… T]he meanings of words must be understood in relation to other words that shape a given semantic domain” (Zareva 2007: 126). Mindez igaz az anyanyelv (L1) elsajátítása során (itt nem kitérve az első szavak kérdéskörére), valamint idegen nyelvek (L2) tanulásakor. Mentális lexikonunkban a szavakat bizonyos elvek szerint rendezzük, azok között kapcsolatokat hozunk létre. A kapcsolatok kialakulása és milyensége nagy mértékben befolyásolhatja a nyelvelsajátítás folyamatát (Keil 1994). Gyermekek nyelvtanulása esetén kiemelt szerephez jut a szavak jelentésének elsajátítása. A gyerek által alkalmazott (velünk született, általános és sajátlagos) nyelvi „stratégiák” megismerése a második (idegen) nyelv tanulását is megkönnyítheti. Markman (1994) és Echols–Marti (2004) hívják fel a figyelmet arra, hogy amennyiben a gyermekek új fogalmat hallanak, azt először inkább adott tárgy mint egész megnevezésének, és nem a tárgy egy részének, valamely tulajdonságának vélik (whole-object assumption). További fontos jellemzője az első szavak rendszerbe foglalásának, hogy a gyerekek a taxonómiai kapcsolatokat és rendszereket (sárgarépa – paradicsom) is viszonylag gyorsan létrehozzák (Markman 1994). Whitmore, Shore és Smith (2004) általánosságban vizsgálva a taxonómiai (paradicsom – sárgarépa) és a tematikus (sárgarépa – nyúl) kapcsolatokat szintén arra a megállapításra jutnak, hogy új szavak tanulása esetében a taxonómiai besorolás a jellemzőbb, illetve, hogy a taxonómiai kapcsolat könynyebben és gyorsabban kialakul. Landau (2004) kutatásai szerint a gyerekek már a beszéd megjelenése előtt képesek alak és struktúra (felszín) alapján tárgyakat/élőlényeket csoportokba so-
Fogalmi szerveződés és mentális lexikon
45
rolni, valamint a tárgyra jellemző tulajdonság(ok)at általánosítani. Ez a képességük megmarad, sőt fejlődik – ha bármilyen új tárgyat látnak, azt egyfajta prototípusként értelmezik, a hozzá hasonló tárgyakat később ebbe a csoportba sorolják. Fontos megjegyezni, hogy a felnőttek ugyanígy járnak el, különösen abban az esetben, ha az új tárgyról semmi további információ nem áll rendelkezésre (vö. Landau 2004, illetve a kacsacsőrű emlős példája Eco 1999 esetében). Gyerekek esetében az új tárgy alakja a legfontosabb ismérv, míg felnőttek (illetve 5 éves kornál idősebb gyerekek) az alak helyett sokszor a funkciót találják a legfontosabb jellemzőnek. Szintén kora gyerekkorban (18-24 hónap) kimutatható a típuspéldány szétválasztásának képessége (típus – type – (egy) kutya, példány – token – a (az adott, konkrét) kutya). A 2-3 éves angol anyanyelvű gyerekek a szó nyelvtani formáját is segítségként használják fogalmi rendszerük kiépítésekor: tárgyak és kategóriák esetében megszámlálható főneveket, anyagnevek esetében többes számban nem használatos főneveket (fa, víz), tárgyak tulajdonságainál melléknevet „várnak” (Waxman 1994). Snedeker és Gleitman (2004) kutatása is szófajok szempontjából közelít a gyerekek nyelvtanulásához: a gyerekek első szavai a nyelvek többségében főnevek, ezt követik a konkrét jelentésű igék (futni vs. tudni). Kísérletileg igazolták, hogy a gyermekek nyelvtanulásához hasonló környezetet teremtve a felnőttek (a kísérletben egyetemisták) sokkal nagyobb százalékban „ismerik fel” helyesen a főnevek jelentését, mint az igékét. Mindez megfelel Lengyel Zsolt (1981) megállapításainak, amely szerint az igék önmagukban is kis „világot” alkotnak, amely „világ” (vonzat, tárgy stb.) elsajátítása sokkal bonyolultabb mentális működést feltételez, mint a főneveké. A főnevek túlsúlya nemcsak egynyelvűek, hanem többnyelvűek esetében is megfigyelhető: Navracsics Judit (2009) háromnyelvű gyerekekkel végzett kutatása során arra a megállapításra jut, hogy a harmadik nyelvben (L3 magyar) is a főnevek vannak túlsúlyban, számban a melléknevek majd az igék követik őket. Waxman (2004) a főnevek elsősége mellett megjegyzi, hogy a gyerekek ezeket már a nyelvtanulás kezdeti szakaszában is kategóriákba sorolják. A legfontosabb (univerzális) tény viszont, hogy a gyerekek képesek a (hallott) szavak és a fogalmak között kapcsolatot teremteni, ugyanis ez a képesség teszi lehetővé nyelvek elsajátítását. A mentális lexikon rendszerének kialakulása természetesen nem áll meg kisgyerekkorban: Neuberger Tilda (2012) óvodásokkal, alsó- és felsőtagozatos általános iskolásokkal végzett kutatásaival bizonyítja, hogy az idősebb gyerekek gyorsabban és több szót képesek előhívni, mint fiatalabb társaik, illetve rámutat, hogy a gyermekek asszociációs stratégiája is változik az életkor függvényében.
46
Fogalmi szerveződés és mentális lexikon
2.3.2 Kétnyelvű mentális lexikon A kétnyelvűség vizsgálata esetén utalnunk kell rá, hogy a kétnyelvűségnek több definíciója ismert. Bloomfield maximalista megközelítésétől (két nyelv anyanyelvi kontrollja), többek között Haugen-ig, aki szerint már az is kétnyelvűnek tekinthető, aki adott idegen nyelven jelentéssel bíró, érthető kijelentéseket tud tenni (vö. Bartha 1999). Két-, illetve többnyelvű egyének esetén a nyelvek agyi reprezentációjával Weinreich (1953) foglalkozott, megkülönböztetve az összetett kétnyelvűt (a kétnyelvű a két nyelvet egy rendszerbe szervezi), a koordinált kétnyelvűt (a két nyelv külön kerül tárolásra) és az alárendelt kétnyelvűt (a második nyelv csak az első nyelven keresztül érhető el) (magyar nyelven vö. Navracsics 2007). A kétnyelvűséggel foglalkozó publikációk egy része a kétnyelvűséget szociolingvisztikai szempontból vizsgálja (pl. Bartha 2010). Pszicholingvisztikai megközelítésben Navracsics Judit a kétnyelvű gyermekekkel (Navracsics 1999) és a kétnyelvű mentális lexikonnal (Navracsics 2001a, 2004, 2007) foglalkozik. Kérdésként merül fel, hogy hogyan viszonyul egymáshoz a két nyelv a mentális lexikonban. Potter et al. (1984) kísérletekkel vizsgálták, hogy a többnyelvű mentális lexikon a szóasszociációs modellt, vagy a fogalmi modellt követi-e. (Szóasszociációs modell – word association model: az L2 új szava az L1 fordításával kerül kapcsolatba, vagyis az L2 az L1-en keresztül érhető el. Fogalmi modell – concept mediation model: a fogalmak közvetlenül a L2-ből aktiválhatók, az L1 aktiválása nélkül. L1=első nyelv, L2=második nyelv.) Eredményeik a fogalmi modellt igazolták a nyelvtudás szintjétől függetlenül, vagyis szerintük már a nyelvtanulás viszonylag korai szakaszában kimutatható, hogy adott nyelv fogalmai egymással teremtenek kapcsolatot. További kutatások viszont módosították megállapításukat: jelenlegi elképzelések szerint a nyelvtanulás kezdeti szakaszában a szóasszociációs modell a helytálló, majd a nyelvtanulás egy bizonyos (közelebbről meg nem határozott) szintjén a L2 újabb szavait már nem a L1-hez, hanem a L2 már ismert szavaihoz kapcsoljuk, vagyis a szóasszociációs modell helyébe a fogalmi modell lép (Kroll–Sunderman 2003). Harmadik nyelv (L3) bevonása esetében a kapcsolódások még összetettebb képet mutatnak (Chlopek 2009). Háromnyelvű (L1 lengyel, L2 német, L3 angol) egyén esetében az L2 és az L3 közötti transzfer erősebb, mint L1 és L2 közötti; pontosabban L2 és L3 között alaki (nyelvtani), L1 és L3 között jelentésbeli transzfer volt a jellemzőbb. Fontos megjegyeznünk azonban, hogy a transzfer a vizsgált nyelvek rokonságára is viszszavezethető lehet (Chlopek 2009). Kroll és Stewart hierarchikus modellje (1994) szerint adott nyelv szava a másik nyelv szavával is és a fogalommal is kapcsolatban áll (6. ábra). Modelljüket Altaribba és Mathis (1997) is igazolják, valamint hangsúlyozzák, hogy a szószemantikának fontos szerepe van a szavak elsajátítá-
Fogalmi szerveződés és mentális lexikon
47
sában és az asszociációk létrehozásában, vagyis a nyelvelsajátítás során lényegesek szemantikai információk. Lexikai kapcsolat
L2
L1 Fogalmi kapcsolat
Fogalmi kapcsolat
Fogalmak 6. ábra. Kroll–Stewart (1994) modellje
Kroll és Sunderman (2003) említett hipotézise (L1 és L2 kapcsolódásának változása) empirikus úton is igazolható (fordítási feladatok L1 és L2 között, mindkét irányba, különböző nyelvtudási szinten lévő alanyokkal; Kroll et al. 2002). Singleton (1999) is kimutatja az első és második nyelv közötti kapcsolatot a mentális lexikonban, azonban megfogalmazásában két, egymással összefüggő, különböző nyelvű mentális lexikont feltételez, viszonylag gyenge kapcsolatokkal a két lexikon között. Fogalmi reprezentálásra napjainkban a Kroll–Stewart-féle modell továbbfejlesztett változatai a legelfogadottabbak, többek között a Pavlenko (2009) által javasolt módosított hierarchikus modell (MHM, Modified Hierarchical Model). Habár kétnyelvűek vizsgálata során nagy figyelmet fordítottak a második nyelvet haladó vagy jobb szinten beszélők elemzésére, a kezdő nyelvtanulók pszicholingvisztikai vizsgálata a mai napig háttérbe szorul. Kroll–Sunderman (2003) fontosnak tartja a kezdő nyelvtanulók mentális lexikonjának vizsgálatát is, ugyanis az így nyert adatok segítségével (többek között) a nyelvoktatási módszerek sikeressége (akár egyénenként is) jobban predesztinálható. Navracsics Judit (2007) saját kutatásaiból származó empirikus adatok felhasználásával vizsgálja a kétnyelvűek nyelvi tárolását. Színmegnevezési tesztek segítségével kimutatja, hogy a fogalmi (konceptuális) szint kétnyelvű személyek esetében közös: „ […] a nyelvi megfogalmazásra hatással van a kultúra, de a konceptuális szint közös[,] függetlenül attól, hogy az adott fogalmat nyelvileg hogyan manifesztáljuk” (Navracsics 2007: 71), képmegnevezési tesztekkel pedig igazolja, hogy ezen közös fogalmi szintnek része a szemantikai tudás, vagyis közös a szemantikai reprezentáció is. Megállapításaival többek között Schwanenflugel és Rey (1986) eredményeit támasztja alá, akik spanyol-angol kétnyelvűek esetében azt vizsgálták, hogy van-e szerepe a szófelismerés sebességében az előfeszítés
48
Fogalmi szerveződés és mentális lexikon
nyelvének. A szófelismerés sebessége nem tért el azonos nyelvű (angol-angol) és idegen nyelvű (spanyol-angol) előfeszítés esetében, ami igazolni látszik, hogy két nyelv esetében a konceptuális szint közös. Fogalmi szerveződés szempontjából hangsúlyos kérdés, hogy a tárolás (és előhívás) egynyelvű és kétnyelvű személyek esetében azonos módon történik-e. Ullman (2001a) a procedurális és deklaratív memóriarendszereket különíti el: előbbi tartalmi tudást, tényeket, valamint lexikai ismereteket tárol (vagyis ez a mentális lexikon), utóbbi már meglévő, motoros kognitív folyamatokat, nyelvtani rendszereket (mentális nyelvtan) rögzít. Korai kétnyelvűek esetében mindkét nyelvet mindkét rendszer kiszolgálja, késői kétnyelvűek és nyelvtanulók esetén a második nyelv esetében nemcsak a mentális lexikont, hanem a mentális nyelvtant is a deklaratív memória szolgálja ki, esetükben tehát a két nyelv nyelvtani kiszolgálása eltérő (Ullman 2001b, Navracsics 2007). Szóasszociációs kutatások során kimutatták, hogy a gyerekek inkább a fonetikai és szintagmatikus, míg a felnőttek a paradigmatikus asszociációkat részesítik előnyben (Lengyel 1997). Söderman (1993) hasonló változást figyelt meg nyelvtanulók esetében is: a kezdeti, sokszor hangzás utáni vagy szintagmatikus asszociációk helyett a nyelvtudás mélyülésével a paradigmatikus asszociációk kerülnek túlsúlyba, ugyanakkor megmaradnak az előbbi típusok is, különösen abban az esetben, ha a nyelvtanuló egy számára (még) ismeretlen szóra ad asszociációt. Hasonló megállapításra jut perzsa-svéd kétnyelvűeket egynyelvűekkel összehasonlítva Namei (2004): kevésbé ismert szavak hangzás utáni, részben ismert szavak szintagmatikus, ismert szavak paradigmatikus asszociációkat hívnak elő. Az asszociációk kategorizálása és szétválasztása ugyanakkor (például fonetikai és a szemantikai elv szerint) nem indokolható minden esetben (Garman 1990). Anyanyelvűek és nyelvtanulók asszociációs eredményeit veti össze egymással Zareva (2007). A különbségek inkább mennyiségiek, mint minőségiek: a kezdő nyelvtanulók mentális lexikonjában lényegesen kevesebb kapcsolat van a tanult nyelv szavai között, mint a haladó nyelvtanulók vagy az anyanyelvi beszélők esetében: „The quantitative differences were most noticeable in the intermediate learner group, who differed from the other groups in the overall number, stability and diversity of meaning connections among words they are already familiar with” (Zareva 2007: 149). Vasiljević (2008) utal arra, hogy a szóasszociációkon alapuló nyelvoktatás eredményeit viszonylag kevés empirikus kutatás tárgyalja. Az asszociációk segítségével a szavak nem önállóan, hanem egy nagyobb lexikai hálózat részeként (lennének) oktathatók, így már az oktatás folyamatában figyelembe vehetjük (vehetnénk) azokat a szempontokat, amelyek szerint a nyelvtanuló a szavakat mentális lexikonjában tárolja.
Fogalmi szerveződés és mentális lexikon
49
Meara (2009) nyelvtanulók szóasszociációs vizsgálati lehetőségeit bemutató és hasonló vizsgálatokra inspiráló monográfiája is hozzájárulhat ahhoz, hogy jobban megismerjük a nyelvtanulók mentális lexikonját: több kutatást összefoglaló kötetének tanulmányai nyelvtanulók és anyanyelvi beszélők asszociációit vetik össze több szempontból. Vizsgálatai arra engednek következtetni, hogy míg az anyanyelvi beszélők asszociációi viszonylag stabilak, addig a nyelvtanulók asszociációi folyamatosan változnak. Egyúttal arra is felhívja a figyelmet, hogy egy asszociációs válasz nem jelenti azt, hogy ismerjük is a szó pontos jelentését, helyes használatának minden aspektusát. A szerző a szókincset hálózatként képzeli el, amely hálózatban a kapcsolatok irányítottak: a csak kimenő kapcsolatokkal rendelkező szavak (tehát amelyek asszociációkban válaszként nem jelennek meg) véleménye szerint a passzív szókincs részét képezik. A különböző nyelvek asszociációs struktúrái ugyanakkor eltéréseket mutatnak: spanyol és angol anyanyelvi beszélők és nyelvtanulók vizsgálata alapján feltételezhető, hogy a két nyelv aszszociációs struktúrája eltér egymástól. Lehrer és Kittay (1992) szerint a mentális lexikon rendezettsége megkönynyítheti az oktatást, ugyanis bizonyos egységeket célszerű (és könnyebb) lehet együtt, és nem önállóan oktatni. „If the mental lexicon is in fact organized, there should be interesting repercussions in making predictions about language acqusition. It should be easier to reach related terms than unrelated ones, and it should be easier to teach terms in a contextual frame rather than individually” (Lehrer–Kittay 1992: 24). Meara (2009) ugyanakkor arra hívja fel a figyelmet, hogy az anyanyelvi beszélők asszociációi szintén felhasználhatók és felhasználandók nyelvoktatási célokra: nem az L1 egységeinek kapcsolatait kell idegen nyelven „reprodukálni” (L2-re fordítani), hanem – amennyire lehetséges – az L2 anyanyelvi beszélőinek asszociációit kell a nyelvtanulókban tudatosítani. A korábban említett, a klasszikustól eltérő válaszszó-besorolás eredményeként Fitzpatrick (2006) megállapítja, hogy anyanyelvi beszélők asszociációi között sokkal gyakoribbak a kollokációk, valamint a szinonimák, mint nem anyanyelvi beszélők esetében. Fitzpatrick (2007) ugyanakkor utal rá, hogy a szóasszociációs kutatások során valószínűleg az eddigieknél differenciáltabban kell az eredményeket értelmezni. Kutatásai azt a tényt látszanak bizonyítani, hogy minden egyénnek megvan a saját asszociációs „stratégiája”: van, aki inkább szintagmatikus, más inkább paradigmatikus válaszokat ad meg asszociációs tesztekben. Idegen nyelv esetében kimutatható ugyan kezdők és haladók között változás az asszociációs stratégiában, ez – véleménye szerint – viszont nem általános elveket követ: a nyelvtanuló az idegen nyelvben tudása gyarapodásával nem valamilyen „univerzális” asszociációs stratégia felé mozdul el, hanem valószínűleg a
50
Fogalmi szerveződés és mentális lexikon
saját, az anyanyelvében is jellemző asszociációs stratégiáját „veszi át” az idegen nyelvben is. Navracsics Judit (2007) megfigyelése szerint a paradigmatikus (hajó – csónak) kapcsolatok száma általában nagyobb, mint a szintagmatikus (hajó – úszik), illetve asszociatív (hajó – sziget) összefüggések. A szintagmatikusparadigmatikus kapcsolatok aránya nyelvenként különbözik, de általában jellemzőbb a paradigmatikus viszony. A kapcsolatok erőssége a második nyelv elsajátításának idejével is összefügg: a korai kétnyelvűek a paradigmatikus, míg a késői kétnyelvűek a szintagmatikus kapcsolatokat részesítik előnyben. Kétnyelvűek asszociációit egynyelvű és kétnyelvű módban vizsgálva a kísérletek kimutatták, hogy kétnyelvű módban a kísérleti személyek több szót hívnak elő. Wilks és Meara (2007) anyanyelvi beszélőkön és nyelvtanulókon vizsgálják, hogy a mentális lexikon szervezettségét jól írja-e le a hálózat metafora. Vizsgálatukat gráfelméleti megfontolások indíttatják, ugyanakkor eredményeikben és módszereikben nem hálózatközpontú módszereket alkalmaznak, hanem a hálózatokat (gráfokat) csak kiindulási pontként használják. Eredményeiknek nincsenek hálózatelméleti összefüggései, inkább módszertani javaslatokat tartalmaznak. Javasolják többek között, hogy az asszociációs kutatásoknál az egyének (és nem az egész csoport, pl. nyelvtanulók) eredményeit is részletesebben kell vizsgálni, illetve az egyének asszociációit egymással összehasonlítva kell elemezni ahhoz, hogy pontosabban tudjuk azonosítani a kapcsolatokat a mentális lexikonban. Mind a gyermekek, mind a kétnyelvűek esetében láthattuk, hogy a mentális lexikon egységei nem önállóan, egymástól függetlenül léteznek: kapcsolatot teremtenek más egységekkel, illetve kapcsolataikat – azok irányát és erősségét – a fogalmak elsajátítása (a nyelvtanulás folyamata) során változtatják.
2.4 Fogalmi rendszerek és kognitív nyelvészet A következő alfejezet a fogalmi rendszereket a kognitív nyelvészet megközelítéséből mutatja be, így teljesebb képet kaphatunk a fogalmi rendszerekkel kapcsolatos nyelvészeti kutatásokról. A kognitív jelző – habár Kant óta használják tudományos megközelítésekre – az 1960-as évek óta éli virágkorát. Pléh Csaba (1996) két fontos szakaszt különít el a kognitív elméletekben, egyrészt a pszichológiában a kognitív pszichológia kialakulását, másrészt a több tudomány (logika, nyelvészet, matematika, pszichológia, biológia) metszéspontjában létrejövő kognitív tudomány létrejöttét (Pléh 1996: 9-13, részletesebben Pléh 1998). A kognitív tudományok célja a megismerés (valóságos vagy elvont, gépi vagy emberi) vizsgálata és megértése, a kognitív
Fogalmi szerveződés és mentális lexikon
51
viselkedés interpretációja. Börner és Vogel (1994) megfogalmazásában a kognitív tudományok célja: „Struktur- und Prozessaspekte menschlicher Kognition zu erklären” (Börner–Vogel 1994: XI). Nyelvészeti szempontból Bańczerowski Januszt idézzük: „A kognitív nyelvészek azt vallják, hogy az emberi nyelv megértésének kulcsa az emberi megismerés folyamatainak a megértésében és modellállásában rejlik” (Bańczerowski 1999: 79). A kognitív nyelvészeti megközelítésnek is fontos kérdését képezik a fogalmi rendszerek és fogalmi szerveződések: „Any adequate theory of human conceptual system will have to give an account how concepts are (1) grounded, (2) structured, (3) related to each other, and (4) defined” (Lakoff–Johnson 1980: 106). Kognitív megközelítésben gyakran találkozunk reprezentációs megközelítésekkel és modellekkel (vö. Pléh 1998). A reprezentáció Markman (1999: 8) felfogásában a következő elemeket tartalmazza: – amit leképezünk (represented world; pl. külső világ); – amire leképezzük, tehát maga a leképezés (representing world); – a szabályok, amelyek szerint leképezzük (representing rules); – maga a folyamat, amiben a leképezést felhasználjuk (process). Kognitív szempontból a nyelv, illetve bizonyos nyelvi tevékenységek is felfoghatók reprezentációként (vö. Pléh–Lukács 2003). A kognitív megközelítéseket vizsgálva heterogén (sokszor nehezen áttekinthető) kép tárul elénk, amelyet két okra vezethetünk vissza: egyrészt a nagy számú elméleti megközelítésre – amelyek rendszerezése is szinte lehetetlen –, másrészt az egyes elméletek alapelemeinek (pl. fogalmak) hiányos, vagy nem kontrasztív (más elméletekkel összevetett) definíciójára (vö. Tóth 2007: 175). A megközelítések lehetnek modulárisak vagy holisztikusak: a modulárisak esetében szemantikai és fogalmi reprezentációs szint külön létezik. A szemantikai szint lexikai egységekhez kötött és a nyelvi rendszer határozza meg, míg a fogalmi reprezentációs szint nyelvtől független és az ember tapasztalatainak keretét képezi. A holisztikus megközelítés szerint a nyelvi jelenségek komplex mentális folyamatok eredményei. A szemantikai és fogalmi rendszer összefügg egymással és maga a beszéd sem választható el egyéb kognitív folyamatoktól (Tóth 2007). 2.4.1 Fogalmi szerveződés kognitív megközelítésben: a prototípus-elmélet A fogalmak kategorizálása hosszú múltra tekint vissza a nyelvtudományban (vö. pl. Aarts 2006). Ezek közül a kognitív nyelvészetben a prototípus-elmélet kiemelését és bemutatását tartjuk a legfontosabbnak. A prototípusok mintegy az Arisztotelész-féle kategorizálás ellenpontjaiként érthetők meg legkönnyebben.
52
Fogalmi szerveződés és mentális lexikon
Arisztotelész felfogásában a kategorizálásra jellemző: – éles határok az egyes kategóriák között; – egy egyed vagy tagja, vagy nem tagja egy kategóriának (a besorolás egyértelműen eldönthető); – minden tagnak azonos a státusza (vö. Kleiber 1998). Wittgenstein ezzel szemben – a prototípus-elmélet előzményeként – a családi hasonlóság elvét fogalmazta meg. Wittgensteinre hivatkozva Kiefer a következőképp fogalmaz: „A családi hasonlóság alapgondolata a következő: egy család tagjait gyakran annak alapján azonosíthatjuk, hogy a család minden egyes tagja ugyanannak a családnak legalább egy másik tagjára emlékeztet, ugyanakkor nem feltétel, hogy az egész család közös tulajdonságokkal legyen jellemezhető” (Kiefer 2007: 95). Wittgenstein ezen elv alapján a játékokat próbálta csoportosítani és kategóriákba rendezni. Elképzelése szerint a játékoknak sok közös tulajdonsága van, de nehezen lehetséges olyan tulajdonságcsoportok kiválasztása, amelyek minden játékra jellemzőek. Ebből következik, hogy bizonyos játékokra sok közös tulajdonság jellemző, másokra viszont csak a tulajdonságok egy része igaz (vö. Aitchison 1997, Baddeley 2001, Löbner 2003). A klasszikus kategorizálási rendszer és a családi hasonlóság elvének együttes működése is elképzelhető (vö. Pinker–Prince 1999). A prototípus-elmélet másik kiindulási pontja Berlin és Kay (1969) kutatása, akik fokális (központi (fókusz), pl. kék, piros) színek – más kutatóknál alapvető színek (pl. Kiefer 2007: 21), vagy alapszínnevek (Kövecses– Benczes 2010: 35) – vizsgálatát végezték el közel száz nyelven. Eredményeik közül lényeges, hogy a fokális színek nyelvtől függetlenek, vagyis a pirosnak ugyanazt a színárnyalatát gondolták legjobb piros színnek a különböző nyelvű beszélők. A nyelvek többsége esetén 11 fokális színt tudtak megkülönböztetni, a színek száma kettő (fekete/fehér illetve sötét/világos) és tizenkettő között változik. Fontos megjegyeznünk, hogy a színek megnevezése és érzékelése az agy más területeinek bevonásával történik, illetve hogy a nyelv (nyelvi megnevezés) nagy valószínűséggel nem befolyásolja a színek érzékelését (vö. Roberson–Hanley 2010). Az egyik legfontosabb kategorizálással és prototípusokkal foglalkozó tanulmány Labov (1973) nevéhez fűződik (vö. pl. Kiefer 2007). Kísérletében különböző csészék, tálak és vázák, valamint ezekhez hasonlatos tárolóeszközök (szélesebb-szűkebb, magasabb-alacsonyabb, füllel rendelkező-fül nélküli) képei alapján próbálták megállapítani a csésze, tál, váza kategória jellemzőit. Az eredmények azt mutatták, hogy a három fő kategóriába sorolás (tál, váza, csésze) azon tárgyak esetén egyértelmű volt, amelyeknek klasszikus tál (széles, alacsony), csésze (kb. olyan magas, mint széles, füle van) és váza (magasabb, viszonylag szűk) alakja volt. A besorolás viszont bizonytalan lett, amint az adott tárgy eltért a
Fogalmi szerveződés és mentális lexikon
53
klasszikus formáktól, pl. magas, szűk edény kis füllel. Ezen nem tipikus edények besorolása viszont egységesebb lett, amint a kísérletvezető a besorolás megkönynyítése céljából azt kérte, hogy képzeljék el az adott, nehezen besorolható tárgyat használat közben, pl. virágokkal vagy kávéval. A kísérlet alapján megállapítható, hogy vannak olyan edények, amelyekről könnyebb megállapítani, hogy a kategóriába (pl. váza) tartoznak-e. Ezeket, vagyis egy kategória leginkább jellemző példányait prototípusnak nevezhetjük: „The best member, called the prototype member or most prominent member of a category is the subtype that first comes to mind when we think of that category” (Dirven–Verspoor 2004: 17). A prototípus maga soha nem egy konkrét egyed, hanem maga is kategória, azaz nem egy konkrét alma, hanem az az alma, amit elképzelünk, ha almára gondolunk. Felmerül a kérdés, hogy habár nem azonos például a madár prototípusa két embernél, mégis mindketten tudják, mi a madár (Kleiber 1998). A prototípus-elmélet hagyományosan Rosch (1975) nevéhez fűződik. Ismert kísérletében arra kért diákokat, hogy ítéljék meg egy kategória tagjairól, hogy az mennyire jellemző, tipikus tagjai az adott kategóriának. Tíz kategória (madár, jármű, gyümölcs, zöldség, sport, szerszám, játék, bútor, fegyver, ruha) esetén kategóriánként nagyjából 50 elemről (pl. rigó, kanári, galamb; narancs, alma, banán stb.) kellett egy hétfokozatú skálán megítélni, mennyire tipikus tagja az egyed a kategóriának. Az eredmények azt mutatták, hogy az egyedek nem mindig sorolhatók egyértelműen kategóriákba. A kategóriák központjai a prototípusok, a kategória széle felé haladva viszont a határok (és így a besorolások) egyre bizonytalanabbak. A prototípusok legfontosabb jellemzői a következőképpen foglalhatók össze: – prototypical categories cannot be defined by means of a single set of criterial (necessary and sufficiant) attributes; – prototypical categories exhibit a family resemblance structure, or more generally, their semantic structure takes the form of a radial set of clustered and overlapping meanings; – prototypical categories exhibit degrees of category membership; not every member is equally representative for a category; – prototypical categories are blurred at the edges (Geeraerts–Grondelaers– Bakema 1994: 45-46). A prototípust és adott kategória széle felé haladva a prototipikalitás elvesztését Ungerer és Schmid (1996: 27) mutatják be (7. ábra). Rendszerükben a vándorrigó, mint központi elem (prototípus) és egyéb madárfajok közös tulajdonságait jellemzik.
54
Fogalmi szerveződés és mentális lexikon
Kategóriára jellemző tulajdonságok (a) tojást tojik (b) csőre van (c) két szárnya és két lába van (d) tolla van
Családi hasonlóság tulajdonságai (e) tud repülni (f) kicsi és könnyű (g) csipog/énekel (h) lábai vékonyak/rövidek (i) ketrecben tartják (j) húsa, tojása vagy tollai miatt tartják (k) hosszú nyaka van (l) díszes tolla van (m) egzotikus színe van
7. ábra. Prototipikus és kevésbé prototipikus madarak közös jellemzői (Ungerer–Schmid 1996: 27)
Csoportosításukban jól látható, hogy a nem prototipikus madaraknak is lehetnek közös, csak egy kisebb csoportra jellemző tulajdonságaik; például a flamingónak, a struccnak és a gólyának hosszú nyaka van. A prototípus-elméletben a kategorizálás jellemzői (Kleiber 1998 alapján): – a kategóriának belső prototipikus szerkezete van; – kategóriájára minél jellemzőbb egy tag, annál egyértelműbben besorolható egy kategóriába; – a fogalmak/kategóriák közti határok elmosódnak;
Fogalmi szerveződés és mentális lexikon
55
– a kategória tagjainak nincsenek olyan közös tulajdonságaik, amelyek minden tagra jellemzőek; – a kategóriához tartozás a prototípushoz való hasonlóság fokától függ; – a kategóriába tartozásról való döntés nem analitikusan, hanem globálisan történik. A prototípus-elmélet fenti jellemzőin kívül fontos, hogy a kategorizálásban különböző szintek meglétét prognosztizálta. A kutatások azt mutatták, hogy a főnevek hierarchikus kategorizálásában egy szintnek kiemelt szerep jut, ez a bázis szint (1. táblázat). Kiefer (2007: 23) alapneveknek, Pléh–Lukács–Kas (2008) alapkategóriák, Kövecses Zoltán és Benczes Réka (2010) alapszintű kategóriáknak nevezi a szint tagjait. Fölérendelt szint Bázis szint Alárendelt szint
állat madár vörösbegy
bútor asztal dohányzóasztal
ruha nadrág rövidnadrág
1. táblázat. A bázis szint, valamint a fölé- és alárendelt szintek
A bázis szint az, amelyet kommunikációnk során a legtöbbször használunk: egy madár van az ágon, és nem egy állat/egy vörösbegy. A hierarchia alárendelt szintekkel nem bontható a végtelenségig – a lehetséges további felosztás az adott szakterület ismeretétől is függ: az első alárendelt szint az a szint, amely a nem szakember számára még ismert, de már ez a szint is tartalmazhat az átlagember számára ismeretlen egyedeket (Löbner 2003). A bázisszint esetén a kategóriákba sorolás gyorsabb, ez a szint tartalmazza a legtöbb rendszerezett tudást. Ezen a szinten még sok közös tulajdonsága van az egyedeknek (pl. madár kategória), a kategória absztrakt és gyorsan azonosítható, a szókincs ezen „szintjét” tanuljuk meg először és ez az a szint, amelyen a prototípusok legkönnyebben azonosíthatók. A hierarchikus szinteken a tulajdonságok öröklődnek (pl. a spániel a kutya tulajdonságait örökli) (vö. Fodor 1983, Kiefer 2007, Kleiber 1998, Löbner 2003, Murphy 2002). Pléh, Lukács és Kas (2008) arra is utal, hogy ezen alapszint szavai gyermekek nyelvtanulásában is kiemelt szerepet kapnak: a gyermekek első szavai általában ezen szintből kerülnek ki. A prototípus-elméletet és a benne megfogalmazottakat természetesen számos kritika érte (vö. Kleiber 1998, Löbner 2003): – a kategóriák bázis (alapnevek) szintje a szófajok közül a főnevekre jellemző, mivel a főneveknek van hierarchiájuk (madár/veréb, de az oktatni/tanítani esetében nincs ilyen viszony);
56
Fogalmi szerveződés és mentális lexikon
– a prototipikusság főnevek esetében határozható meg, más szófajoknál nehézségekbe ütközünk: mi a nagy prototípusa; igénél (fut): a fut miért „prototipikusabb” mint a szalad vagy a rohan; – szó szint felett nem egyértelmű, mi a prototípus: sárga kutya: nem a sárga és a kutya prototípusainak összessége, hanem egy új prototípus; – a kategóriák nem mindig tartalmaznak prototípust és a határok sem mindig elmosódottak: pl. a kerék prototípusát meg lehet határozni, viszont a határok egyértelműek (nem elmosódottak); az állat esetében nincs prototípus, illetve egyénenként nagy eltérést mutathat. Rosch későbbi prototípus-elmélettel foglalkozó tanulmánya (Rosch 1978) megpróbál bizonyos pontokat magyarázni, de ezen kiegészítések nem voltak nagy hatással az eredeti prototípus-elméletre és annak fejlődésére. A kategóriaalkotás egy harmadik modellje a példaalapú modell (Kövecses– Benczes 2010). Ezen modellek esetében nincs prototipikus elem, hanem a példák emlékképeiből hozzuk létre a kategóriákat. A kategorizálás fontosságát, a prototípus-elmélet fejlődését, valamint az inspirált kognitív modelleket Lakoff (1987) mutatja be, valamint összefoglalja a kognitív megközelítések közös tulajdonságait úgy, hogy egyben további kutatási irányokat is kitűz. Magyar nyelven Kiefer Ferenc (2007), valamint Kövecses Zoltán és Benczes Réka (2010) foglalkoznak mélyebben a kategóriákkal, illetve a prototípusokkal.
2.4.2 A fogalmi szerveződések további megközelítései a kognitív nyelvészetben A kognitív megközelítés további fogalmi szervezési vonatkozásait rövidebben említjük. Lakoff és Johnson elmélete a metaforákból indul ki: „We claim that most of our normal conceptual system is metaphorically structured; that is, most concepts are partially understood in terms of other concepts” (Lakoff–Johnson 1980: 56). Metafora például a közelmúlt „war on terror” „szlogenje”, ahol a háború szó az Egyesült Államok polgárai számára eleve bizonyos kapcsolatokat hív elő: enemy, threat to national security, setting targets, reorganizing priorities, establishing a new chain of command, plotting new strategy, gathering intelligence, marshaling forces, imposing sanctions, calling for sacrifices (Lakoff– Johnson 1980: 152-153 alapján). Metaforáról tehát akkor beszélünk, „ha egy fogalmi tartományt egy másik fogalmi tartományon keresztül értünk meg” (Kövecses 2002: 246). A két tartomány között fogalmi kapcsolatok vannak, amiket megfeleléseknek (leképezéseknek) nevezünk. A szerelem – utazás példával a
Fogalmi szerveződés és mentális lexikon
57
szerelem és utazás képei között vonunk párhuzamot (utasok – szerelmesek; utazás – szerelmi kapcsolat) (Kövecses 2002). Fogalmak között tehát metaforikus kapcsolati viszony is fennállhat. Fillmore szemantikus keretei – a magyar szakirodalomban frame vagy fogalmi keret (utóbbi Kövecses–Benczes 2010) – a tudás, illetve a tapasztalat egységei, amelyek egy adott (prototipikus) szituációt jellemeznek (vö. Fillmore– Atkins 1992). A vásárlás keretben jelen van a vevő, az eladó, az áru és a pénz. Ugyanaz a keret több kijelentés modellje is lehet: a vásárlás keret ugyanazon elemekből áll, mint az eladás keret, csak a nézőpont változik. A keret egyben egy ige szintaktikai leírását is megkönnyíti. Keretekhez hasonlók a forgatókönyvek (script), amelyek egy adott folyamatot írnak le, például az étterem forgatókönyve a következő: belépés, asztal keresése, leülés, pincér hívása, rendelés (Ungerer– Schmid 1996). Elképzelhető, hogy a keretekbe és/vagy forgatókönyvekbe rendezett tudás asszociációs kísérletekkel (pl. erősebb kapcsolatok a keret elemei között) is kimutatható. Minsky (1974) tudásreprezentációs elképzelése hasonlít Fillmore elgondolásához. Minskynél a keretek már ismert, sztereotipikus szituációk, amelyek információt tartalmaznak magáról a szituációról, valamint – többek között – a szituációban valószínű történésekről. A keret tehát egy pontokból és a köztük lévő kapcsolatokból álló rendszer, amelyben a hierarchia felső részén lévő pontok a szituációban állandóak, a hierarchia alsó része viszont változik a sztereotipikus szituáció adott megvalósulása szerint. Talmy rendszerében nyelvtan és jelentés egy rendszerben létezik: nyílt szófaji osztályba tartozó (lexikai) és zárt szófaji osztályba tartozó (grammatikai) elemeket feltételez, melyek külön fogalmi alrendszereket képeznek (Evans 2011, Wildgen 2008). Langacker kognitív nyelvtanában ezzel szemben a tudás reprezentálása összetettebb. Pontokból és kapcsolatokból álló rendszerek létezését feltételezi: a kapcsolat (a pontok közötti viszony) is egyfajta egységet képezhet és maga is csomópont lehet, vagyis a modell hasonlít Quillian eredeti elképzeléseire (vö. Langacker 1987: 162-163). Ezen hálózatban létező egységek (entity) a hálózat elérési pontjainak (point of access) tekinthetők, ahol az egyes egységek szemantikai értékét (jelentését) pontosan kapcsolati rendszerük adja – amely egyben kategorizálást is jelent (Langacker 1987: 378-383). Fillmore és Langacker rendszere is feltételezi, hogy a tudás enciklopedikus továbbá, hogy az egyes elemek nem érthetők meg egy nagyobb tudásrendszer ismerete nélkül (Evans 2011). Lakoff ICM (Idealized Cognitive Models) modellje ezzel szemben a kategorizálás fontosságát emeli ki: a kategóriák egy prototípus körül épülnek fel és egy kognitív modellt vetnek össze az aktuális szituációval, majd ennek alapján történik a megfelelő fogalom kiválasztása. Lakoff példája az
58
Fogalmi szerveződés és mentális lexikon
agglegény (bachelor), ahol a fogalom kognitív modellje tartalmazza a házasság szokását és a házasság (közösség által elfogadott) időpontját. Ezért a gyerek, illetve a pápa nem esik az agglegény fogalomkörébe. A pápa ugyanis a katolikus egyház fogalomkörébe tartozik, funkciójánál fogva nem is házasodhat: habár szigorúan véve agglegény, de mégsem prototípusa az agglegénynek. Lakoff a lexikai elemeket tehát komplex kategóriaként értelmezi, amelyekre bevezeti a radiális kategória (radial category) fogalmát. Az ilyen kategóriák a prototípus körül jönnek létre, inkább közös megegyezés és nem szabályok mentén (Lakoff 1987). Barsalou (1992) elméletének alapjai szintén a keretek. Véleménye szerint a fogalom eleve egy kategóriát jelöl, tehát nem egy egyedet. Barsalou rendszerében fogalmak, attribútumok és értékek szerepelnek. Az attribútum (attribute): olyan fogalom, amely egy kategória egy tagjának legalább egy tulajdonságát leírja, pl. szín, hely. Az érték (value): egy attribútum alárendelt fogalma, amely örökli az attribútum tulajdonságát. Elképzelése eddig hasonlít az eredeti, Quillian-féle elképzeléshez, viszont az elemekből létrejövő hálózatokat komplex keretekben képzeli el – vagyis a nyaralás komplex keret része az utazás, a hely és a nyaralási tevékenység (önálló) keretek, amelyek kapcsolatban vannak egymással. Az egyes keretek alkeretei szintén keretek: egy hely, a síelés vagy a repülés kerete, különböző jellemzőkkel. Barsalou keretei leginkább különböző vonatkoztatási rendszerekként értelmezhetők. Elmélete magába foglalja a prototipikalitás jelenségét is, amelyet szintén keretekkel jelenít meg (Barsalou 1992: 52). Rendszerei éppígy alkalmasak nemcsak egy fogalom vagy fogalmi relációk, hanem forgatókönyvek ábrázolására is (Barsalou 1992: 56). Ziem (2008) a kereteket szintén nem önálló egységként értelmezi: a keretek elmélete szerint egymással kapcsolatban állnak, hálózatot hoznak létre. A kognitív nyelvészetről rövidebb összefoglalót ad többek között Evans (Evans 2011, Evans–Bergen–Zinken 2007), bővebben általánosságban Ungerer és Schmid (1996), a kognitív nyelvtanokról Wildgen (2008), az aktuális keretkutatásokról Ziem (2008). Magyar nyelven Kiefer Ferenc (2007) és Kövecses Zoltán – Benczes Réka (2010) kötetei tekintik át a kognitív megközelítéseket.
2.5 Kitekintés: szómezőkutatás A szavakat jelentésük alapján természetesen nem csupán az eddig megismert kutatási irányzatok/módszerek sorolják rendszerekbe. A következőkben röviden a szómezőkutatásokat jellemezzük Tóth József (2001) alapján. A szómezőkutatások céljai röviden a következőképpen foglalhatók össze: – a szókincs rendszerezése nyelvtanulók számára;
Fogalmi szerveződés és mentális lexikon
59
– a szókincs szemantikai sokszínűségének bemutatása; – a szókincs finom rétegzettségének bemutatása. A szómezőkutatások J. Trier: Der deutsche Wortschatz im Sinnbezirk des Verstandes (1931) kötetét tekintik kiindulási alapnak. Trier esetében a Wortfeld (szómező) egy nagyjából zárt fogalmi rendszert jelent, amely tartalmilag összetartozó szavakat foglal magába. A szómezőkben a szavak jelentése egymásmellettiségükből is fakad, a szavak egymást határozzák meg. Triernél a sprachliches Feld (nyelvi mező) és Wortfeld (szómező) kifejezés is szerepel egymás mellett, azonos jelentéssel. A sprachliches Feld kifejezés találóbb, mivel nemcsak szavak, hanem kifejezések is beletartozhatnak. Weisgerber felfogásában a Wortfeld a nyelvi világ kiragadott részét jelenti, a szavak egymásra ható csoportjának rendezett felosztását. Porzig tartalmi és szintaktikai mezőket különböztet meg: a tartalmi mezők mellérendelt szavakból állnak (pl. színek), míg a szintaktikai mezők szintagmatikus jellegű kapcsolatokat jelölnek (ige+főnév; fog/harapni). Schippan asszociációs mezők létezését is feltételezte a szómezőkutatásban: egy központi fogalomból (pl. tanár) kiindulva próbált szemantikai hálózatokat létrehozni (Tóth 2001). A szómező-elméletek felsorolását kronológiai sorrendben hat csoportra osztva Tóth József (2003), a szómező-fogalom alakulását az elmúlt évtizedekben többek között Hundsnurscher (2003) mutatja be részletesebben. A fontosabb különbségeket asszociációs kutatások és szómezőkutatások között három pontban foglalhatjuk össze. 1. A szómezőkutatás valamilyen kategóriából (színek) vagy központi elemből (iskola) indul ki. Az asszociációknak viszont nincs középpontja (hacsak a hívószót nem tekintjük annak), hanem kapcsolatok vannak, erősebbek vagy gyengébbek. 2. Szómezőkutatások esetében mesterségesek a megalkotott kapcsolatok/csoportok. A kapcsolat megléte nem utal az adott szavak közti kapcsolat erősségére vagy minőségére. Ebből a szempontból inkább a pszicholingvisztikai atomgömb-elméletre hasonlít mesterséges kapcsolatokkal, ugyanakkor párhuzamosságok fedezhetők fel a terminológiai rendszerekkel is. Asszociációk esetében a kapcsolatok „természetesek”, vagyis ilyenkor nem mesterségesen létrehozott mezőket, hanem a tényleges mentális kapcsolatokat vizsgálunk. 3. A szómező-elmélet legtöbb esetben csak a szemantikai kapcsolatokat elemzi, míg a mentális lexikon (szóasszociációk) a szemantikai kapcsolatok mellett többek között fonetikai kapcsolatokat is tartalmaz.
60
Fogalmi szerveződés és mentális lexikon
2.6 Összegzés A fejezet célja a mentális lexikon fogalmi szerveződéséről alkotott nézetek bemutatása volt, egyrészt hagyományos pszicholingvisztikai megközelítésben, másrészt kognitív nyelvészeti szempontokat is érintve. Az összefoglaló természetesen nem térhet ki a mentális lexikon kutatásának, valamint a reprezentációknak minden aspektusára, ezért csak a fontosabb, kutatásunk szempontjából lényeges elemeket emeltük ki. A prototípus-elmélet részletesebb bemutatását azért tartottuk fontosnak, mivel a hagyományos pszicholingvisztikai elméletek mellett kognitív szempontból vizsgálja a fogalmak kategorizálását. A mentális lexikonról tehát elmondhatjuk, hogy egy olyan tároló rendszer, amelyben valószínűleg hálózatszerűen rendszerezzük az egységeket. A hálózat egyes elemei (pontjai) működés közben információt továbbítanak egymás felé. A prototípus-elmélet, a mentális lexikon fejlődése, a kétnyelvűséggel kapcsolatos vizsgálatok és a szóasszociációs vizsgálatok eredményei alapján elmondhatjuk, hogy a mentális lexikonban (amennyiben a hálózat-analógiánál maradunk) az egységek között a kapcsolatok különböző erősségűek. Azt is kijelenthetjük, hogy a kapcsolatok nem állandóak – új kapcsolatok jöhetnek létre, kapcsolatok szűnhetnek meg, és a már meglévő kapcsolatok erőssége is változhat. A fejezet a mentális lexikont hálózatalapú megközelítéssel vizsgálta, vagyis a mentális lexikon szerveződését és bizonyos jelenségeit hálózatos szerveződéssel illetve hálózatok működésével magyarázta. A következő fejezetben a nézőpontot megváltoztatjuk: kiindulási alapunk nem a nyelvészet, hanem az általános hálózatelmélet (hálózatkutatás) lesz: a komplex rendszerek tanulmányozására kialakult hálózatelmélet szemszögéből vizsgáljuk a mentális lexikont, azaz szemléletmódunk hálózatközpontú lesz. Ehhez először a hálózatkutatás releváns eredményeit ismertetjük, majd a 4. fejezetben annak (eddigi) fontosabb nyelvészeti vonatkozásait mutatjuk be.
3. HÁLÓZATKUTATÁS A fejezet a hálózatelmélet (hálózatkutatás) bemutatását tűzte ki célul, mivel úgy gondoljuk, hogy a mentális lexikon vizsgálata új szempontokkal bővülhet, ha komplex hálózatként közelítünk hozzá. A mentális lexikon hálózatként való értelmezése nem új a nyelvészetben (vö. előző fejezet), azonban a megközelítések eddig hálózatalapúak voltak, vagyis kiindulási alapjuk nyelvészeti volt. Jelen esetben a kiindulási alap a hálózat lesz, a hálózatos rendszerekre jellemző közös és specifikus tulajdonságok, amely tulajdonságok meglétét a mentális lexikonon kívánjuk vizsgálni. A fejezet ezért a hálózatok általános jellemzőire fókuszál, vagyis az általános hálózatelmélet eredményeit kívánja bemutatni. A hálózatelmélet és a nyelvészeti kutatások összekapcsolhatóságát a 4., míg a mentális lexikon hálózatos jellemzőit – empirikus kutatásunk alapján – a 7. fejezet tárgyalja.
3.1 A hálózatkutatás mint diszciplína „Hálózatok mindenhol vannak. Az agy axonok által összekötött idegsejtek hálózata, maguk a sejtek pedig biokémiai reakciók által összekötött molekulák hálózatai. A társadalmak szintén hálózatok, olyan emberek hálózatai, akiket a barátság, a családi kapcsolatok és szakmai kötelékek kötnek össze. Magasabb szinten a táplálékláncok és ökoszisztémák a fajok hálózataiként ábrázolhatók. A hálózatok átjárják a technológiát is: az internet, az elektromos hálózatok, valamint a szállítási rendszerek csupán néhány példa erre. Még a nyelv is, amit gondolataink közvetítésre használunk, önmagában véve nem más, mint szintaktikai kapcsolatokkal összekötött szavak hálózata” (Barabási 2006: 1298). Hálózatokat tehát mindenhol találunk, hálózatok alkotják természetes és mesterséges környezetünket. A hálózatelmélet feltételezése szerint ezeknek az egymástól független, komplex rendszereknek vannak közös tulajdonságaik, amely közös tulajdonságok matematikailag leírhatók. A fejezet célja, hogy bemutassa az általános hálózatkutatás főbb irányait, összefoglalja röviden a hálózatok fontosabb jellemzőit. A hálózatok bemutatásánál tudatosan csak a szükséges és legegyszerűbb matematikai összefüggésekre térünk ki: a hálózatokkal kapcsolatos jelenségeket írjuk le, és nem azok matema-
62
Hálózatkutatás
tikai megközelítését. Ezzel Barabási Albert-László (2003), Csermely Péter (2005) és Watts (2004b) példáját követjük, akik szintén arra törekedtek, hogy a jelenségek és magyarázatuk a laikus (pl. matematikai gráfelméletben nem jártas) olvasó számára is érthető legyen. A jelenségek matematikai háttere a hivatkozott publikációkban olvasható, illetve összefoglalóan többek között Barrat–Barthélemy– Vespignani (2008), Lewis (2009) és Watts (1999) ad áttekintést róluk. A nyelvi hálózatokkal kapcsolatos kutatásokat a 4. fejezetben ismertetjük. Fejezetünk hálózatközpontú megközelítésű, de fontos utalnunk rá, hogy a 20. század végén nemcsak hálózatközpontú, hanem fontos hálózatalapú kutatások is napvilágot láttak, többek között a társadalomtudományok területén (pl. Castells 2000). A hálózatkutatás néhány alapfogalmának rövid magyarázatát itt szükségesnek tartjuk (Csermely 2005 alapján), ugyanis ezen fogalmak a nyelvészetben ritká(bba)n, vagy más néven használatosak. Hálózat: egymással összekapcsolt elemek összessége. Pont: a hálózat egy eleme. Csomópont: azon eleme a hálózatnak, amely (a hálózat többi eleméhez képest) sok kapcsolattal rendelkezik. Kapcsolat: a hálózat elemeit köti össze. Fokszám: adott hálózati elem kapcsolatainak száma. Irányított/nem irányított kapcsolatok: irányított a kapcsolat, ha fontos a kapcsolat iránya (pl. A→B); nem irányított, ha csak a kapcsolat megléte fontos (A–B). Súlyozott/nem súlyozott kapcsolatok: súlyozott kapcsolatok esetén a kapcsolat erősségét figyelembe vesszük, tehát vannak erősebb és gyengébb kapcsolatok, nem súlyozott kapcsolatoknál minden kapcsolat egyenértékű. Robusztusság: egy hálózat akkor robusztus, ha a környezet változásaira kis érzékenységgel reagál. A hálózatokat matematikailag gráfokkal ábrázolhatjuk (8. ábra). Gráfok esetében a pontokat csúcsoknak, míg a kapcsolatokat éleknek nevezzük. Gráf: összekötött élek (kapcsolat) és csúcsok (pontok) rendszere. Irányított gráf: a kapcsolatok irányítottak; nyilakkal jelöljük. Súlyozott gráf: a kapcsolatok erőssége nem azonos, vannak erősebbek és gyengébbek; vastagabb-vékonyabb vonallal jelöljük. Pszeudográf: adott pontból kapcsolat irányulhat saját magára (pl. az apa hívószóra az apa válaszszó érkezik).
Hálózatkutatás
63
Hálózatelméleti szakkifejezések bővebb listája magyarázatokkal, valamint angol nyelvű ekvivalenssel a 8. Mellékletben olvasható, míg angol-magyar nyelvű listát a 9. Melléklet tartalmaz.
8. ábra. A család érzelmi-szociális világ ábrázolása irányított, súlyozott pszeudográf segítségével. A kapcsolatok erősségét nem a vonalak vastagsága, hanem a mellé írt %-os arányok jelzik, amelyek utalnak rá, hogy adott hívószó milyen százalékban hívta elő a válaszszót. CS=család, GY=gyerek, SZ=szülő. Az ábrázolt asszociációs adatok Lengyel Zsolt kutatásaiból származnak. (Kovács 2007: 145)
A hálózatkutatás mint tudományos megközelítés létrejöttét a 20. század végére – 21. század elejére datálhatjuk, habár hálózatokkal kapcsolatos vizsgálatokat sokkal hosszabb ideje végeznek a kutatók (vö. Lewis 2009, Barabási 2005). Lewis (2009) felosztásában megkülönbözteti a korai hálózatkutatást (Pre-Network Period 1736-1966), a modern hálózatkutatás kezdeteit (Meso-Network Period 1967-1998) és a modern hálózatkutatást (Modern Period 1998-). A korai szakasz a gráfelmélet megalapozásával kezdődik (Königsbergi hidak problémája, Leonhard Euler, vö. Barabási 2003) és a matematikai gráfelmélet kidolgozásával folytatódik. A modern hálózatkutatás kezdeteit Milgram szociológiai kísérlete jelenti (hat lépés távolság az emberek között, Milgram 1967, Barabási 2003), a modern szakasz pedig többek között a kisvilág-karakter (Watts–Strogatz 1998) és a skálafüggetlenség (Barabási–Jeong–Albert 1999 és Albert–Jeong–Barabási 1999) felismeréséhez köthető. Jelenleg kérdéses, hogy hálózatkutatás, hálózatelmélet, illetve hálózattudomány, mint önálló diszciplína létezik-e (vö. Lewis 2009). Az elmúlt évtizedek hálózatokkal kapcsolatos kutatásai, az elért eredmé-
64
Hálózatkutatás
nyek (részletesen Lewis 2009: 1-22) alapján hálózatkutatásról és hálózatelméletről beszélhetünk, kérdéses azonban, hogy a hálózatokkal kapcsolatos elméletekkel és kutatásokkal foglalkozó megközelítések nevezhetők-e összefoglalóan hálózattudománynak (vö. Lewis 2009). Ezért a kötetben a hálózatelmélet és hálózatkutatás kifejezéseket használjuk, utalva rá, hogy a hálózatokkal kapcsolatos kutatások hálózattudomány néven önálló diszciplínává fejlődhetnek. Az 1990-es évek végén jutnak tehát a kutatók először arra a felismerésre, hogy az eddig egymástól függetlennek tűnő hálózatos rendszereknek (pl. úthálózat, WWW (Internet), emberi kapcsolatok hálózata stb.) közös tulajdonságaik vannak, ezen tulajdonságok matematikailag leírhatók és elemezhetők (Barrat– Barthélemy–Vespignani 2008, Watts 1999, 2004a). A közös tulajdonságok felismerése és leírása lehetővé tette, hogy egyre több rendszerben fedezzék fel ezeket a hálózatos tulajdonságokat (Barabási 2009), valamint, hogy hálózatok működését bizonyos határok között előre jósolják. Newman (2003) a modern hálózatkutatás három fő irányát különbözteti meg: – a hálózatok viselkedésére és felépítésére vonatkozó karakterisztikus statisztikai jellemzők elemzése és mérése, valamint az adatok mérésének továbbfejlesztése; – a hálózati jellemzők létrejöttének és összefüggéseinek magyarázata, valamint hálózati modellek megalkotása; – a hálózatok viselkedésének előrejelzése adott szerkezeti jellemzők alapján, valamint a hálózat felépítésének hatása az egész rendszer viselkedésére. A kutatásoknak szintén három célját nevezi meg Vicsek Tamás (2006: 1297): – az általános törvényszerűségek feltárása; – hálózatok tulajdonságait feltérképező módszerek kidolgozása; – meglévő módszerek konkrét hálózatokra történő alkalmazása. A felsorolást kiegészíthetjük két további lehetséges kutatási irányvonallal: – különböző hálózatok (pl. úthálózat) egyedi tulajdonságainak megismerése; – hálózatos ismeretek gyakorlati alkalmazása (alkalmazott hálózatkutatás megnevezéssel). A hálózatkutatás vizsgálatának tárgyai tehát a hálózatok, legyenek azok természetesek (sejtek) vagy mesterségesek (úthálózat), valósak vagy modellezettek. A hálózatok (legalábbis azok matematikai vagy informatikai leírása) a valóság modelljeiként vagy reprezentációjaként, vagyis a valóság absztrakciójaként értel-
Hálózatkutatás
65
mezendőek (National Research Council 2005, Lewis 2009). Hálózatok tanulmányozásához fontos megismerni a hálózatok felépítését, a hálózaton belüli kapcsolatok milyenségét, a hálózat kisvilág-karakterét, a hálózat belső rendezettségét, az elemek csoportosulásait, a hálózatok működését, valamint a hálózatok sebezhetőségét.
3.2 Hálózatok felépítése A komplex hálózatok felépítését az 1960-as évektől fogva random (véletlen) hálózatként képzelték el, melyek leírásában Erdős Pál és Rényi Alfréd tették meg az első lépéseket (vö. Barabási 2003). A random hálózatok esetében a hálózat létrejöttét a véletlen vezérli, vagyis adott számú elemet és adott számú kapcsolatot véve a kapcsolatokat véletlenszerűen osztjuk el az elemek között (pl. dobókockát feldobva). Az így létrejövő hálózat demokratikusnak tekinthető, vagyis minden egyes elemnek egyforma esélye van arra, hogy kapcsolódjon egy másik elemhez. Az egyes hálózati elemek fokeloszlását ebben az esetben a Poissoneloszlás írja le, amely grafikonként ábrázolva haranggörbét eredményez (vö. Barabási 2003, 2006, Watts 2004a) (9. ábra). Ez az eloszlás írja le például az autópálya-hálózat eloszlását nagyvárosok között az Egyesült Államokban (a városok a hálózat elemei, az utak az összekötő kapcsolatok). Ha hálózatokat jellemzünk hasonló módon, akkor olyan hálózatot kell elképzelnünk, ahol az elemek többsége átlagos számú kapcsolattal rendelkezik (pl. 10), ehhez képest kapcsolatszámban csak kis eltérések lehetségesek (pl. 8, 9, illetve 11, 12), de extrém helyzetek (0 kapcsolat, 50 kapcsolat) szinte kizártnak tekinthetők.
9. ábra. Haranggörbe és hatványfüggvény-eloszlás (Barabási 2003: 99 alapján)
66
Hálózatkutatás
A hálózatok második véglete a teljesen rendezett hálózat, ahol az összes elemnek pontosan ugyanannyi kapcsolata van, tehát pl. minden elem pontosan 10 kapcsolattal rendelkezik. Ilyen hálózatok könnyen alkothatók és vizsgálhatók, viselkedésük könnyen megjósolható, ellenben természetes kialakulásuk nem valószínű. A valós hálózatok felépítése valahol e kettő lehetőség között helyezkedik el: mindkét hálózati forma tulajdonságait tartalmazzák bizonyos fokig (Watts– Strogatz 1998, Watts 2004), működésüket sok esetben a hatványfüggvény írja le (9. ábra). A hatványtörvénnyel leírt hálózatok esetében az elemek fokszámeloszlása szintén szabályszerű: van kis számú elem, amelynek nagyon sok kapcsolata van (pl. 2 db 100 kapcsolattal rendelkező), majd a kapcsolatok számának csökkenésével növekszik az adott kapcsolattal rendelkező elemek száma (pl. 4 db 80 kapcsolattal, 10 db 50 kapcsolattal, 30 db 20 kapcsolattal 80 db 5 kapcsolattal, 130 db 4 kapcsolattal stb.). Azon hálózatokat, amelyeknél az elemek fokszámeloszlása a hatványfüggvényt követi, skálafüggetlen hálózatoknak nevezzük (Barabási 2003, Newman 2005). Hatványfüggvény írja le a világ számtalan, egymással nem összefüggő jelenségét, többek között a szógyakoriságot, a tudományos cikkek idézettségének számát, a könyvek eladási listáját, a telefonhívások eloszlását az USA-ban, a földrengések nagyságát, a Hold krátereinek átmérőjét, a háborúk intenzitását, családnevek gyakoriságát (Newman 2005). A hatványfüggvény, illetve a hatványfüggvények által leírt hálózatok tanulmányozása és elemzése azért fontos, mivel feltételezhető, hogy ezen hálózatok megfelelő leírása más, hasonló elven szerveződő valós hálózatok pontosabb megismerését teszi lehetővé. A továbbiakban vizsgálatunk tárgya elsősorban a skálafüggetlen hálózat, mivel jelenlegi ismereteink szerint a nyelvben a skálafüggetlen hálózatok mutathatók ki (lásd 4. fejezet). Hagyományosan a nyelvészetben is ismert a hatványfüggvény, pontosabban annak egy speciális fajtája, Zipf-törvény néven. Zipf törvénye szerint amenynyiben gyakoriság szerint csökkenő sorrendbe rendezzük egy korpusz szavait, akkor adott szó előfordulási számának (hányadik a gyakorisági sorban) és gyakoriságának szorzata állandó. Korpuszokban szavak Zipf-törvény (illetve annak változatai, vö. Schroeder 2002, Fóris 2007a) szerinti eloszlása több nyelv esetében igazolt. A Zipf-törvényt más nyelvészeti (Montemurro–Zanette 2002) és nem nyelvészeti (Wheeler 2002, Li 2003) jelenségekre is kiterjesztették – olyan jelenségekkel összefüggésben vizsgálták, amelyek jelenleg a hálózatelmélet kutatási területét képezik. A Zipf-törvényt magyar nyelvű korpuszokon is kimutatták: Papp Ferenc szóvégmutató szótár anyagán, Nagy Ferenc tulajdonnevek előfordulása kapcsán irodalmi szövegekben, Köhler diplomamunkák anyagán és szótárakban (vö. Fóris 2007a).
Hálózatkutatás
67
A hálózatok felépítésében nemcsak a véletlenszerűség vagy a skálafüggetlenség, hanem egyéb hálózatalakító tényezők is szerepet játszanak. Skálafüggetlen hálózatok felépítése esetében kimutatható, hogy a hálózatok egy része hierarchikus felépítésű, vagyis vannak egymással összefüggő moduljai. A modulokon belül a kapcsolatok erősebbek, a modulok egymás között kevesebb kapcsolattal rendelkeznek. Modul lehet emberek közötti hálózatban például munkatársak egy csoportja, vagy színészek által alkotott hálózatokban adott műfaj színészei (Ravasz–Barabási 2003). Hálózatokra jellemző az egymásbaágyazottság is, vagyis a felbontással változik a háló szerkezete: kis felbontással nézve ami csak egy pontnak látszik, arról nagyobb felbontásban kiderülhet, hogy maga a pont is egy öszszetett hálózat (Csermely 2005). Hálózatok olyan fajtája is elképzelhető, ahol véletlen és skálafüggetlen hálózatok tulajdonságai egyszerre vannak jelen: a hálózat elemeinek kimenő kapcsolatai skálafüggetlen eloszlást, míg a bejövők random eloszlást mutatnak (Itzkovitz et al. 2003). Palla Gergely et al. (2005) feltételezik, hogy a hálózatok belső felépítése nem tekinthető egységesnek, vagyis vannak a hálózatokon belül olyan kisebb egységek, amelyeknek pontjai egymás között – az egész hálózat kapcsolatszámával összevetve – viszonylag sok kapcsolattal rendelkeznek. A kapcsolatok ezen kis egységeken belül szorosabbak, azonban más (hasonló) egységekhez ezek a kis egységek kevésbé kapcsolódnak. Az ilyen, sok kapcsolattal rendelkező hálózaton belüli csoportosulásokat közösségeknek, összetartozó csoportoknak vagy moduloknak hívhatjuk. (Derényi et al. (2006) megfogalmazásában csomósodások, csoportosulások, klaszterek, modulok, community-k.) Ilyen csoportok megléte korábban is ismert volt, azonban eddig ezeket a csoportokat egymástól viszonylag függetlennek gondolták. Palla Gergely et al. ezzel szemben bizonyítják, hogy ezek a csoportok átfedhetik egymást, a csoportok tagjai tehát egyszerre több csoporthoz is tartozhatnak. Az egymást átfedő csoportok megfelelő algoritmusokkal kimutathatók (Zhang, S.,–Whang–Zhang, X.-S. 2007). Valószínűsíthető, hogy a komplex hálózatok struktúrája sokkal bonyolultabb az eddig feltételezettnél. Ghoshal et al. (2009) például olyan hálózatokat ír le, amelyekben három különböző fajta elemet köt össze egy kapcsolat (10. ábra). Példájuk a Flickr internetes képmegosztó rendszer, ahol a felhasználók feltölthetik képeiket, és a képeket (akár másokét is) rövid kulcsszavakkal láthatják el. Tehát három fajta elem létezik a hálózatban: kép, kulcsszó (ami jellemzi a képet) és felhasználó (aki feltölti, megnézi, vagy kulcsszóval látja el a képet). Nyelvész szemszögből egyszerre a szemiotikai háromszög juthat eszünkbe, a jel, jelölő, jelölt hármas. Habár a megegyezés természetesen nem teljes (vö. jelölő) a párhuzam a két rendszer között nyilvánvaló. Ezen hármas ábrázolására vezetik be Ghoshal et al. a hipergráf elnevezést, ahol egy kapcsolatban nem két elem van (A
68
Hálózatkutatás
és B pont), hanem egy kapcsolat három elem között jön létre (tripartite hypergraph).
10. ábra. Hipergáf Ghoshal et al. (2009: 2) alapján. A kör, a négyzet és az ötszög a gráf csúcsai, a halványabb háromszögek azok a (hiper)élek, amelyek ezeket (egyszerre három pontot) összekapcsolják
Az így megalkotott és elemzett elméleti gráfokból nyert adatokat valós rendszerekkel (Flickr) összehasonlítva azok viselkedése sok esetben pontosan, más esetekben kevésbé pontosan jósolható meg, az eredmények ugyanakkor pontosabbak, mint az ilyen rendszerek egyszerű gráfokkal (két csúcs között egy él) történő modellezése esetén.
3.2.1 A hálózaton belüli kapcsolatok jellemzői Hálózatokon belül a kapcsolatok minőségét többféleképpen is meghatározhatjuk. Egyik felosztás szerint beszélhetünk gyenge és erős kapcsolatokról (Csermely 2005). Akkor gyenge egy kapcsolat, ha „a kapcsolat elvétele, vagy hozzáadása statisztikailag mérhető módon nem befolyásolja a hálózat jellemző tulajdonságának átlagát” (Csermely 2005: 363), vagyis a gyenge kapcsolatok azok, amelyeknek megszűnése (látszólag) nincs hatással a hálózat működésére. A gyenge kapcsolatok fontosságát Granovetter (1973) tanulmányozta szociológiai hálózatokban: a szoros csoporton belüli (pl. munkaközösség, szűk baráti kör, család) kapcsolatok álláskeresés esetében kevésbé fontosak, mint a szoros csoportból kimutató, sokkal gyengébb kapcsolatok (pl. egy alkalmi ismerőshöz, régi évfolyamtárshoz). Csermely Péter szerint a gyenge kapcsolatok alapvetően hozzájárulnak a hálózatok megfelelő működéséhez: ezek hozzák létre a kisvilágokat, összehangolják az alhálózatokat, lehetővé teszik a hálózaton belüli gyors kommunikációt, hozzájárulnak a hálózat egységes egészként való működéséhez, ugyanakkor az esetleges zavarokat és hibákat izolálják, ezáltal stabilizálják a hálózatokat (Csermely 2005: 103).
Hálózatkutatás
69
Hálózatok kapcsolatait nemcsak gyenge és erős kapcsolatként jellemezhetjük, hanem súlyozott és nem súlyozott kapcsolatként is. Súlyozott kapcsolatokról beszélve szintén vannak erősebb és gyengébb kapcsolatok, de itt nem a hálózat stabilitásában betöltött szerep határozza meg a kapcsolat erősségét, hanem a kapcsolat számmal kifejezett erőssége (Newman 2004). A kapcsolatok erősségét is figyelembe veszi keresési eredményeinek megadásában többek között a Google kereső algoritmusa (vö. Benczúr et al. 2006, Brin–Page 1998, Vise–Malseed 2006). A kapcsolatok meghatározhatók egyéb jellemzők alapján is, nem csupán gyengeség és erősség szerint. Emberek közötti hálózat esetében felmerül a kérdés, hogy mit nevezzünk kapcsolatnak – például ha valaki ismer valakit arcról és tudja a nevét (ami lehet akár egyirányú is, hiszen filmszínészeket többnyire csak egyoldalúan ismerünk), ha beszélő viszony van közöttük, vagy ha tegezik egymást (Watts 2004b). Amennyiben (bármilyen definíció alapján) megalkottuk a kapcsolatok hálózatát, nehéz lenne erős és gyenge kapcsolatként definiálni az egyes emberekhez fűződő viszonyunkat, a kapcsolat (természetesen nem egzakt számokban kifejezhető) típusa inkább lehetne a családtag, munkatárs, barát, haver stb., ami egy külön dimenzió az erős és a gyenge kapcsolatok mellett. A kettő nem azonosítható, ugyanis nem biztos, hogy a családtagokkal van a legerősebb kapcsolatunk (vö. Letenyei 2005). A kapcsolatokat másik megközelítésben vehetjük irányítottnak vagy nem irányítottnak. Nem irányított kapcsolatok esetében két elem között kapcsolat van, annak viszont nincs jelentősége, hogy a kapcsolat melyik elemből indul ki és melyik elem irányába mutat (két város közötti útnak nincs „iránya”, az mindkét irányba egyaránt járható). Irányított kapcsolatokat tartalmaz ellenben például a World Wide Web, ahol a linkek csak egy irányban követhetők (Barabási 2006). Az irányított kapcsolatokat tartalmazó hálózatok felépítése, növekedése és az elemek közötti útvonalak lényegesen összetettebb, mint a nem irányított kapcsolatokat feltételező hálózatoké (Bianconi–Gulbahce–Motter 2008). Az irányított hálózati kapcsolatok esetén jöhetnek létre az aciklikus hálózatok, amelyek nem engedik meg, hogy adott elem kiindulási pontja és végpontja is legyen a kapcsolatok hálójának, vagyis nem engedik meg, hogy zárt kapcsolati hálózat alakuljon ki, amelyben a kapcsolatok csak egy irányba mutatnak (Karrer– Newman 2009). Ilyen hálózatok pl. a családfák vagy az idézettségi hálózatok tudományos publikációk esetében (itt a hivatkozott forrás mindig a rá hivatkozó előtt jött létre, az irány nem megfordítható). Kevéssé kutatott a multiplex kapcsolatok témája. Multiplex (többrétegű, vö. Szántó–Tóth 1993: 36) kapcsolatok akkor jöhetnek létre, ha két hálózati elem között egyszerre két (vagy több), különböző kapcsolat is létezik (Koehly–Pattison
70
Hálózatkutatás
2005). A két elem közötti többfajta kapcsolat a szociolingvisztikában a szociális hálózatokban már kimutatásra került (vö. Milroy 1987, Milroy–Gordon 2003, Wardhaugh 2002). Ilyen multiplex kapcsolat lehet szociológiai hálózatban, ha egy apa a fiával együtt dolgozik egy közös vállalkozásban (vö. Szántó–Tóth 1993). Így közöttük a kapcsolat egyszerre háromfajta: egyrészt családi (rokonsági) kapcsolat, másrészről munkatársi kapcsolat, harmadrészről gazdasági kapcsolat. A multiplex kapcsolatokat tartalmazó rendszerek (pl. egy kisebb közösség (falu) társadalmi rendszere) jobban ellenállnak külső befolyásoló tényezőknek, kevésbé vesznek át innovációkat (Milroy–Gordon 2003). A multiplex kapcsolatok megengedése hálózatokban egyrészt a hálózatok pontosabb megismerését teszi lehetővé, másrészt lényegesen komplexebbé teszi a hálózatok felépítését, ezzel megnehezítve leírásukat és modellezésüket. Egy egyszerű kapcsolati hálózat ismerősöket feltételező egyszerű ismerem/nem ismerem (van kapcsolat/nincs kapcsolat) kapcsolatrendszere helyett egy számtalan szinten és módon egymást átfedő és egymással együttműködő többszörös komplex hálózati kapcsolatrendszer jön létre.
3.2.2 Skálafüggetlen hálózatok belső struktúrája A hálózatok elemei nem egyenrangúak. A skálafüggetlen hálózatok felépítéséből adódik, hogy vannak olyan elemek, amelyek különösen sok kapcsolattal rendelkeznek. Ezek központi elemek (konnektorok, csomópontok), amelyek sok kapcsolatuknál fogva hozzájárulnak ahhoz is, hogy a hálózat kevésbé összefüggő részeit összekapcsolják egymással (Barabási 2003). Ke és Yao (2008) a középponti elemek két fajtáját különíti el: a vezérlőket (hub) és a gyűjtőket (authorities). A vezérlők (hub) olyan központok, amelyeknek sok kimenő linkje van, vagyis amelyekből sok kapcsolat indul ki. A gyűjtők (authorities) viszont sok bejövő kapcsolattal rendelkeznek. Más megfogalmazásban a vezérlőknek nagyobb a befolyása (Letenyei 2005: 220), a gyűjtőknek pedig nagy a presztízse (vö. Letenyei 2005: 220, illetve Szántó–Tóth 1993: 43). A központi elemek e két fajtájáról csak akkor beszélhetünk, ha a hálózatunk irányított kapcsolatokat tartalmaz. A középpontok szerepe, a középponti szerep megállapítása természetesen nem ilyen egyszerű. Ahogy Ke és Yao (2008) is utal rá, adott elem esetében nem kizárólag a kimenő, illetve bejövő kapcsolatok mennyisége határozza meg, hogy az adott elem középpont-e. Egy hálózatban, amely átlagosan öt-tíz kapcsolattal rendelkező elemeket tartalmaz, a 100 bejövő kapcsolattal rendelkező elem esetében csupán ez a szám nem biztos, hogy megfelelően jellemzi az elem központi szerepét, ugyanis nemcsak azt kell figyelembe vennünk, hogy hány bejövő (vagy
Hálózatkutatás
71
kimenő) kapcsolattal rendelkezik az elem, hanem azt is, hogy ezek a kapcsolatok fontos vagy nem fontos elemekből mutatnak rá. Példánkban, ha a 100 kapcsolat olyan elemből érkezett, amelyekre magukra is pl. 30-40 kapcsolat mutat, akkor az elem ténylegesen is központi elemnek tekinthető, míg abban az esetben, ha ezek a kapcsolatok olyan elemekből érkeznek, amelyekre csak 1-2 kapcsolat mutat, akkor a központi szerep már nem ilyen egyértelmű. Hasonló elven működik a Google PageRank algoritmusa (Brin–Page 1998), amely nemcsak az adott oldalra mutató linkek számát, hanem (fentihez hasonló módon) azok minőségét is vizsgálja. A hálózatok tartalmazhatnak kisebb csoportosulásokat is, amely csoportosulások felépítése az átlagosnál gyakrabban ismétlődik hálózaton belül, vagyis a csoportosulások jellemzők a hálózatra. Ezeket a csoportosulásokat motívumoknak nevezzük (Kertész 2006). Az ilyen motívumok maguk is bonyolult alhálózatokat képezhetnek a hálózaton belül, ezért azonosításuk nem mindig egyszerű. Motívumként foghatunk fel nagyon kis, csak három elemből álló egységeket, triádokat is (Milo et al. 2002, 2004). Az ilyen kis csoportok esetében könnyen leírható azok összes lehetséges struktúrája, ezen struktúrák azonosítása is viszonylag egyszerű, illetve az ilyen kis struktúrában az egyes csomópontok szerepe is leírható. Habár sok hálózat mutat skálafüggetlen jellemzőket, feltételezhető, hogy ezen kisebb építőelemek (motívumok) hálózatra jellemzőek: ezek azonosítása és a funkcióik leírása nagyban elősegítheti az adott hálózat funkcióinak és működésének pontosabb megértését.
3.3 Hálózatok kisvilág-karaktere A kisvilágok eredeti elképzelése Stanley Milgram szociológus nevéhez fűződik, aki 1967-ben megpróbálta kideríteni, mekkora virtuális távolság (hány másik ember) választ el egymástól két embert az Egyesült Államokban. Kísérletében véletlenszerűen kiválasztott embereknek adott át leveleket, hogy azt juttassák el egy adott személynek úgy, hogy a levelet csak egy ismerősüknek adhatják át, aki szintén csak egy ismerősének adhatja tovább stb. A kísérlet eredményeként megállapították, hogy a levelek átlagosan hat „kézbesítőn” keresztül (six degrees of separation) értek el a célszemélyhez (Milgram 1967, Barabási 2003). A kísérletet később megismételték (Small World Project), hasonló eredménnyel. Ezt az eredeti elképzelést bővítette ki Watts és Strogatz (1998), akik a hálózatok egy részét kisvilág tulajdonságúnak írták le. A kisvilág-karaktert a hálózatokban két jellemzőhöz kötötték: egyrészt viszonylag kicsi az átlagos távolság az egyes elemek között (vagyis kevesebb lépésben jutunk el átlagosan egy elemtől
72
Hálózatkutatás
egy másik elemig, mint véletlen hálózatokban), másrészt az ilyen hálózatokban nagy a klaszterezési (vagy csoporterősségi) együttható. A klaszterezési együttható azt mutatja meg, mennyire strukturált a hálózat lokálisan, vagyis hogy mennyire szorosan kapcsolódnak össze az elemek. Hogy a hálózat kisvilág-karakterű-e, úgy vizsgáljuk, hogy vesszük az eredeti hálózatot, majd generálunk egy random hálózatot ugyanannyi elemmel és kapcsolattal. Ezt követően a kapcsolatokat az elemek között véletlenszerűen osztjuk el. Mindkét hálózatra kiszámítjuk a legkisebb átlagos útvonalhosszt és a klaszterezési együtthatót. Ha a hálózat kisvilágkarakterű, akkor az átlagos útvonalhossz kisebb, a klaszterezési együttható pedig lényegesen nagyobb, mint a random hálózatban (vö. Watts 1999, Dominich– Kiezer 2005). Watts és Strogatz elképzelését módosítja Kleinberg (2000), aki szerint nem elég, ha egy hálózat kisvilág-karakterű. Az ilyen hálózatok akkor működnek jól, ha ez a kisvilág-karakter „ismert” a hálózat elemei számára, vagyis tudják, hogy adott másik elemet valószínűleg melyik irányba találják. Milgram kísérletét alapul véve tehát nem elég, hogy az emberek (elvileg) hat lépésnyi távolságra vannak egymástól, a hatékony hálózati működésnek feltétele az is, hogy tudjuk, kinek célszerű odaadni a levelet: nem elég, ha létezik egy legrövidebb útvonal, azt meg is kell találni. A közelmúltban az emberek közötti távolság és a kapcsolatok kisvilágkaraktere részben mérhetővé is vált az olyan szociális média oldalak, mint pl. a Facebook segítségével. Backstrom et al. (2011) mérései szerint a Facebookfelhasználók átlagos távolsága egymástól 4,74 lépés, vagyis kevesebb, mint azt Milgram eredményei mutatták.
3.4 Hálózatok dinamikus vizsgálata A hálózatok kialakulásának folyamata sokszor nehezen térképezhető fel utólag. A hálózat kiindulási pontja sokszor egy kis mag néhány elemmel: a World Wide Web kialakulása egy oldal létrejöttével kezdődött (vö. Berners-Lee– Fischetti 1999), a színészek kapcsolati hálózata egy kis csoportból indult el az 1800-as évek végén (Barabási 2003). A hálózatokra jellemző tulajdonság a növekedés (új kapcsolatok hozzáadása, új pontok integrálása), illetve a csökkenés (pontok vagy kapcsolatok megszűnése), esetleg a hálózat teljes összeomlása. A hálózatok felépítése szorosan összefügg kialakulásukkal, a kettő egymástól függetlenül nehezen tanulmányozható (Barabási 2009).
Hálózatkutatás
73
3.4.1 Hálózatok kialakulása és fejlődése A növekedés random módon könnyen modellezhető: véletlenszerűen adunk a hálózathoz elemeket. Az első elemek természetesen így egy adott időpontban több kapcsolattal rendelkeznek, mint a későbbiek, hiszen már a rendszer kialakulásának kezdetén is kaptak kapcsolatokat, amikor még kevés elemet tartalmazott a hálózat. Az elmélet viszont nem magyarázza a skálafüggetlen hálózatok létrejöttét, mivel a modellben valós hálózatokhoz képest túl kevés központi elem keletkezett, viszonylag kis fokszámmal. A következő elképzelés a preferenciális (népszerűségi) kapcsolódás, vagyis a régi elemek között vannak népszerűek, amelyekhez nagyobb valószínűséggel kapcsolódnak új elemek. A népszerűségi kapcsolódás kimutatható többek között tudományos idézettségi hálózatokban és az internet kapcsolódási szervezettségében (Jeong–Néda–Barabási 2003). Ez a modell magyarázza skálafüggetlen hálózatok létrejöttét, így jelenleg ez a legelfogadottabb hálózatnövekedési modell. A preferenciális kapcsolódás nem állandó érvényű: egy bizonyos pontnál a népszerű elemek elvesztik képességüket, hogy új elemeket vonzzanak (a jelenség könnyen elképzelhető, gondoljunk például a divatra) (Barabási 2003). A sebesség, amellyel hálózatok felépítése változik, nagyon eltérő lehet: a kapcsolatok sokszor lassan rendeződnek át, más esetekben, például internetes hírportálok esetében nagyon gyorsan, akár percek-órák alatt változhat a hálózat felépítése (vö. Dezső et al. 2006). Aktuális kutatások sem találtak egyértelmű magyarázatot a kapcsolatok kialakulásának dinamikájára, azonban elképzelhető, hogy a kapcsolatok kialakulásában egyfajta hasonlósági elv is működik, vagyis egy hálózat pontjai azon nagy kapcsolatszámú ponthoz kapcsolódnak, amely (valamilyen szempontból) hasonlít hozzájuk (Papadopoulos et al. 2012). A hálózati kapcsolatok létrejöttének dinamikája és ezen dinamika vizsgálata során további kérdésként merül fel, hogy mekkora szerepet kap a véletlenszerűség és az optimalizáció a hálózati kapcsolatok kialakulásában (Barabási 2012).
3.4.2 Hálózatok működése A hálózatok természetesen mindig valamilyen funkciót látnak el, ezért nemcsak felépítésüket, hanem működésüket is fontos tanulmányozni. A működés jelenthet pl. információ-áramlást az emberi kapcsolati hálózatokban vagy az agyban, de jelentheti az áram továbbítását is vezetékek hálózatában. Hálózatok működése esetében az egyes elemek, valamint a kapcsolatok működését egyaránt vizsgálhatjuk (Barabási et al. 2004). Néhány elem és kapcsolat esetén a működés
74
Hálózatkutatás
vizsgálata könnyen kivitelezhető, amennyiben azonban egy hálózat több ezer elemet és kapcsolatok tízezreit tartalmazza, akkor a működés vizsgálata sokkal bonyolultabb. Hálózatok működésének vizsgálata legalább két módon történhet. Egyrészt vizsgálhatjuk a „rendes” információáramlást, például azonos szakos, egyetemi hallgatókból álló csoport esetében azt, hogy milyen gyakorisággal leveleznek/telefonálnak egymással. Másrészt nézhetjük az információáramlást olyan esetekben, amikor valamilyen váratlan esemény hatására a kommunikációs szokások megváltoznak: például egy hallgató megtudja, hogy a csoport másnap zárthelyi dolgozatot ír. A két esetben a kommunikációs szokások és az információ áramlása eltérő lesz, így mindkét eset tanulmányozása fontos lehet a hálózati működés pontos feltérképezéséhez. A hálózatok működésének vizsgálata történhet tehát többek között egy kiváltó eseményre történő reakciók vizsgálatával. Dooley és Corman (2004) a 2001 szeptember 11-én történt terrortámadás után a Reuters hírek címszavait vizsgálták, majd a címszavakból állítottak össze hálózatokat. A vizsgálatok ebben az esetben esemény-vezéreltek (event-driven) (Kossinets–Kleinberg–Watts 2008). Hasonlóan vizsgálhatjuk például e-mailek láncszerű terjedését (Küldje el ezt a levelet 10 ismerősének…). Ilyenkor az információ-terjedés viszont eltér a hálózatos rendszerek „normális” kommunikációjától, ami különleges kiváltó esemény nélkül is zajlik. Kossinets, Kleinberg és Watts (2008) a kommunikációt és az információterjedést a kiváltó esemény nélküli, „normális” szituációban vizsgálták. Eredményeik szerint elképzelhető, hogy a hálózatoknak vannak olyan gyakrabban használt gerincvonalai, amelyek az információt továbbítják, akkor is, ha lennének rövidebb, de kevésbé „bejáratott” útvonalak. Szintén fontos tényező az információ-áramlás ideje, vagyis hogy az információ mikor melyik ponthoz jut el. Ehhez az információáramlás idejét is rögzíthetjük (vector-clocks), így megkapjuk, mikor, milyen útvonalon haladt az információ, mely elemek voltak adott pillanatban „informáltak”, és melyek információja volt elavult. Az információ természetesen nem áramlik mindig, illetve nem minden információ ér el minden pontot. Ahhoz, hogy az információ átlépjen egyik elemről a másikra, át kell lépnie egy bizonyos küszöbszintet, vagyis elég fontosnak/érdekesnek kell lennie ahhoz, hogy továbbadják (Watts 2004b). Ez nagyban hasonlít a mentális lexikonból ismert aktivációs potenciálra, amely meghatározza, hogy a mentális lexikon mely elemei kerülnek magasabb aktivációs szintre. Hálózatok működésével kapcsolatban utalnunk kell azok működési dinamikájának egy másik jellemzőjére: a hálózatokban sok tevékenység nem állandóan, hanem szakaszosan, azaz villanásszerűen történik (vö. Barabási 2010). A gyakorlatban ez azt jelenti, hogy a viszonylag hosszabb információáramlás-mentes szü-
Hálózatkutatás
75
neteket olyan rövidebb szakaszok váltják fel, amikor nagyon gyorsan sok információ áramlik a hálózatban; majd ezt a villanásszerű információáramlást ismét egy szünet váltja fel, amikor nem áramlik információ. Orosz Katalin, Vicsek András és Pollner Péter (2010) is felhívják a figyelmet az információterjedés ezen aspektusára: információ terjedését bloghálózatokban vizsgálva arra a következtetésre jutnak, hogy az információ nem folyamatosan, hanem hullámszerűen terjed: az aktív terjedés időszakait a lecsengés időszakai követik.
3.4.3 Hálózatok sebezhetősége Hálózatok szempontjából fontos kérdés azok sebezhetősége, azaz ellenállásuk egy olyan támadással szemben, ami kapcsolatokat (vagy elemeket) zavar vagy semmisít meg. A támadásokat és a hálózatok támadásokkal szembeni ellenállását tesztelve fontos szerep jut a korábban említett központi elemeknek. Skálafüggetlen hálózatok esetében, ha a központi elemeket éri támadás, akkor a hálózat már néhány központ kiesése esetén összeomlik és nem tudja ellátni feladatát. Ez a tulajdonság a skálafüggetlen hálózatok megléte ellen szól, ugyanis első megközelítésben a hálózat sebezhetőnek tűnik. További kutatások azonban kimutatták, hogy ez a sebezhetőség csak kismértékben jelent veszélyt a hálózatokra. Amennyiben a hálózatok elleni támadást úgy modellezték, ahogyan az egy valós, például biológiai hálózatot érne – vagyis nem a központokat támadták, hanem véletlenszerűen kiválasztott elemeket –, a hálózat meglepő ellenállást tanúsított: a központi elemek megléte biztosította, hogy a hálózat aránylag sok elem elvesztése esetén is működőképes maradjon (Albert–Jeong–Barabási 2000, Barabási 2003, 2006). Random hálózatokat ért hasonló támadás esetén a hálózat nem volt ellenálló a támadással szemben, véletlenszerűen támadott elemek esetén már viszonylag kevés elem kiesése is a hálózat fragmentálódásához vezetett (Barabási–Bonabeau 2003). Valószínűsíthető, hogy a skálafüggetlen felépítés a leghatékonyabb topológia, ami szavatolni tudja a hálózat nagy ellenállóképességét véletlenszerű támadások ellen.
3.5 Hálózatkutatási eredmények alkalmazási lehetőségei A hálózatokról szerzett ismereteink, illetve az általános hálózatelméleti modellek megalkotása egyre több tudományterületet inspirálnak a hálózatokkal kapcsolatos kutatásokra, ahol a hálózatelmélet gyakorlati alkalmazásának lehetőségei egyre inkább előtérbe kerülnek. A gyakorlati alkalmazások bizonyos terüle-
76
Hálózatkutatás
teken még gyerekcipőben járnak, sok esetben inkább javaslat jellegűek. Más területeken (pl. szociológiai hálózatok vizsgálata) ellenben az alkalmazott módszerek és a hálózatkutatás gyakorlati alkalmazási lehetőségei kiforrtak (vö. pl. Hannemann–Riddle 2005). A hálózati ismeretek gyakorlatban nagyon sok területen alkalmazhatók, itt csak néhány lehetőséget sorolunk fel. Az Egyesült Államok hadserege hálózatkutató szakemberek (Barabási, Watts) és katonai szakértők segítségével kutatta a hálózatok katonai jelentőségét, majd több lehetséges vizsgálati területet jelölnek meg: döntéshozatali kérdések hálózatos harci környezetben, szenzorrendszerek hálózatos együttműködése, járványok terjedésének jellemzői a hadsereg mobilitásának függvényében (National Research Council 2005). Benedek Gábor, Lublóy Ágnes és Szenes Márk (2007) hálózatok banki alkalmazási területeit vizsgálja, modellezve az ügyfélmegtartást, az ügyfélszerzést, valamint a szolgáltatások terjesztését mikro-, kis- és középvállalatok esetében. A hálózatkutatás több területen nyújthat fontos információkat bankok működéséhez: a bank ügyfél-kapcsolathálózatának feltérképezésével azonosíthatók az esetlegesen elvándorló ügyfelek, valamint megállapítható az is, hogyan lehet banki szolgáltatásokat hatékonyan terjeszteni. Feltérképezhető továbbá, milyen hatással lehet egy vállalat bezárása a vele kapcsolatban álló ügyfelekre, illetve egész gazdasági ágazatok válsága a bank (adott ágazathoz tartozó) ügyfeleire. Gráfelméleti és hálózatos megközelítések segítségével bankok elszámolási rendszerének topológiája is elemezhető, a kulcsfontosságú intézmények azonosíthatók (Lublóy 2006). A gazdaságtudomány és hálózatok komplex összefüggéseit Easley és Kleinberg (2010; magyar ismertetése Kovács 2010c), valamint Takács (2010) mutatják be. Letenyei László (2005) a településkutatás során tartja fontosnak a hálózatok elemzését, például egyetemek között kapcsolathálókat, önkormányzati együttműködést, régión belüli mobilitást vizsgálva. Szőke Viktória (2012) a közgazdaságtan és a földrajztudomány metszéspontjában, a kis- és középvállalkozások gazdaságföldrajzi kapcsolatainak tanulmányozásában látja lehetségesnek hálózatelméleti módszerek alkalmazását. A Maven 7 Hálózatkutató Kft. üzleti hálózatok, szervezeti hálózatok és médiahálózatok vizsgálatát végzi. Szervezeti hálózatok vizsgálata esetében az alkalmazott módszerek segítenek többek között a szervezeten belüli hatékonyabb kommunikáció kifejlesztésében, a csoporton belüli és a csoportok közötti együttműködésének javításában, a kulcsemberek azonosításában (Maven 7). Médiahálózatok esetén blog- és fórumbejegyzések alapján kulcsszavak hálózata térképezhető fel. A hálózat alapján a kutatók a megbízó bankról a médiában kialakult képet
Hálózatkutatás
77
értékelték, utalva a kép kettősségére: a médiában a bank megjelenése pozitív, ugyanakkor a fórumbejegyzések esetében a kép differenciáltabb (Maven 7). A hálózatok társadalomra, gazdaságra és politikára kifejtett hatásait Castells (2000) és Benkler (2006) is elemzi, ugyanakkor megközelítésükben nem a hálózatos tulajdonságok és elméletek, hanem azok hatásai kerülnek előtérbe.
3.6 Összegzés A fejezet röviden összefoglalta a hálózatkutatás fontosabb eredményeit és kutatási területeit. Jelenleg (a körülbelül tíz éves múlt ellenére) valószínűleg még mindig a hálózatkutatás kezdeti szakaszában járunk (vö. Barabási 2009). Az eddigi modellekről egyre több esetben derül ki, hogy azok túlságosan egyszerűsítettek: a valós, komplex hálózatok felépítése és dinamikája lényegesen összetettebb. A hálózatok vizsgálatában napjainkban egyre nagyobb szerepet kap többek között az irányított, súlyozott kapcsolatok vizsgálata, illetve a hálózaton belüli, kisebb csoportosulások kimutatása. A hálózatkutatás kialakulását az informatikai eszközök fejlődése is lehetővé tette, ugyanis a nagy számú (több ezer vagy millió) elemet és kapcsolatot tartalmazó rendszerek modellezése, azokban az útvonalak és a fokszámok számolása modern informatikai eszközökkel is erőforrásigényes feladat. Miközben egyre jobban megismerjük, illetve egyre több területen vizsgáljuk a hálózatokat, a hálózatkutatás elmélete és megközelítési módszerei sem egységesek. Milgram (1967) eredeti, szociális kisvilágokat bizonyító kísérletével kapcsolatban is felmerült, hogy a leírt eredmények nem teljesen helytállóak (vö. Kleinfeld 2002). Sokan azt is kétségbe vonják létezik-e, létezhet-e egyáltalán hálózatkutatás, illetve hálózattudomány önálló diszciplínaként (vö. National Research Council 2005). A kutatott hálózatok annyira eltérőek, hogy azokat sikerrel csak a szakterület szakértője (pl. neurobiológus, szociológus) tanulmányozhatja, aki emellett a hálózatkutatásban is jártas. Sokszor azonban olyan kutatók tanulmányoznak hálózatokat (többnyire fizikusok, matematikusok), akiknek hálózatelméleti ismereteik megalapozottak, szakmai (pl. biológiai, nyelvészeti) ismereteik viszont nem. Így kutatási eredményeik sok esetben legalábbis nem egyértelműek, vagy kétségbe is vonhatók. Mindezek alapján jelenleg nehéz megjósolni, hogy a hálózatkutatás mint önálló tudományág megállhatja-e a helyét, vagy csupán komplex rendszerek egyfajta módszertani megközelítése, illetve vizsgálati módszere marad.
78
Hálózatkutatás
4. HÁLÓZATKUTATÁS ÉS NYELVÉSZET
Miért tartjuk fontosnak az új megközelítést, vagyis a nyelvi-nyelvészeti jelenségek hálózatok szempontjából történő vizsgálatát? A 2. fejezetben láttuk, hogy a mentális lexikont sok szerző jellemzi hálózatként, illetve hogy a tudás reprezentálását sokan szemantikai hálókban képzelik el. A megközelítések ugyanakkor különbözőek is: nem egységes, hogy hány reprezentációs szintet képzelünk el (vagyis miből áll a mentális lexikon), nem tudjuk milyen információk, milyen formában tárolódnak benne. Sok esetben a megközelítések hasonlóak, csak a használt fogalmak térnek el (vö. pl. a pszicholingvisztikai és a kognitív megközelítést). Mindegyik megközelítésről/feltételezésről elmondható, hogy azt empirikus adatok is alátámasztják. Fenti megközelítésekben közös pontnak a lexikon hálózatos jellegű szerveződését mondhatjuk. Ezért kézenfekvőnek látszik a jelenség „ellenkező oldalról” történő megközelítése: a mentális lexikont és a nyelvet hálózatként értelmezzük, vagyis mint komplex hálózatot vizsgáljuk, kutatásunkhoz a hálózatelmélet szempontjait és módszereit felhasználva. Ezen hálózatközpontú megközelítés több szempontból is ígéretes. Mivel – mint láttuk – a hagyományos, nyelvészeti megközelítés sem módszertanában, sem terminológiájában nem egységes, a hálózatelméleti megközelítés segíthet a rendszerezésben, vagyis a különböző részdiszciplínák által elért eredmények egységesítésében. Ugyanakkor új eszközöket is ad a kutatók kezébe: a hálózatos rendszereken elvégzett vizsgálatok (megfelelően adaptálva) a mentális lexikonon is elvégezhetők, így a mentális lexikon hálózatos jellemzői empirikusan is megragadhatók. Azért is fontos lehet a hálózatok szempontjából történő közelítés, mivel így a mentális lexikon felépítésének jellemzői esetlegesen kvantifikálhatóak, vagyis elképzelhető, hogy olyan matematikai összefüggések mutathatók ki, amelyek a mentális lexikon működését (legalábbis részben) leírják/prognosztizálják. Ezek az összefüggések lehetővé tennék (többek között) pontosabb nyelvtechnológiai alkalmazások kifejlesztését is, tehát gyakorlati (alkalmazott nyelvészeti) hasznuk is jelentős. Az ebben a fejezetben leírt összefüggések egy részét átdolgozott formában már publikáltuk (Kovács 2010a).
80
Hálózatkutatás és nyelvészet
A nyelv, a nyelvi jelenségek hálózatközpontú (network-driven, vagyis általános hálózatkutatásból kiinduló) vizsgálata viszonylag új kutatási terület. A kevés, a területen megjelent publikáció többsége nem nyelvészek, hanem matematikusok és fizikusok hálózatelméleti-nyelvészeti kutatásának eredménye. A tanulmányokat sok esetben nem a nyelvészet, hanem más tudományterületek periodikáiban publikálják. Ezen „külső” szemléletmód (esetleges) következményei: – a hagyományos nyelvészeti gondolkodásmódtól eltérő szemléletmód új paradigmákat nyithat a nyelvészetben; – a megalapozott matematikai/hálózatelméleti tudással rendelkező kutatók nyelvészeti tudása nem mindig elég mély, ezért következtetéseik hibásak lehetnek; – a publikációk (megjelenési helyük miatt) nem jutnak el a nyelvészekhez; – a hagyományos nyelvészeti paradigmákba csak nehezen illeszthetőek be bizonyos jelenségek, új megközelítési lehetőségek. (Viszont sokszor pontosan a bevált paradigmákhoz/szemléletmódhoz való ragaszkodás zárhatja el a lehetőséget az újabb kutatási irányok elől.) A fejezetben röviden összefoglaljuk a fontosabb, hálózatelméleti megközelítésből végzett, nyelvi jelenségekkel és nyelvekkel kapcsolatos kutatásokat, utalva azok hiányosságaira is. A nyelvi hálózatok legalább két formában mutathatóak ki a nyelvben: egyrészt lineáris megnyilatkozásokban, vagyis összefüggő mondatokban, szövegekben, közvetlenül egymás mellett álló vagy egymáshoz közel álló szavakat vizsgálva (pl. Ferrer i Cancho–Solé 2001a, magyar nyelvre Dominich–Kiezer 2005), másrészt a mentális lexikonban (pl. Steyvers–Tenenbaum 2005, Vitevitch 2008). Ke (2007) megfogalmazásában a kutatások egy része a grammatikai, másik része szemantikai jellegű kapcsolatokat feltételez a nyelvben.
4.1 Szintaktikai hálózatok Ferrer i Cancho–Solé (2001a) tanulmányukban először említik a nyelvi kisvilágok létezését. A szavak közötti kapcsolatokat mondatokban vizsgálva a Zipftörvény segítségével bizonyítják a nyelvben (mondaton belül) létező kisvilágokat. Kutatásaikban két szó között akkor van kapcsolat, ha azok egy mondatban egymás után állnak. Ez a megközelítés alkalmas bizonyos kapcsolatok kimutatására, sok kapcsolat ugyanakkor ezen megközelítéssel nem kimutatható: például a helyes, karcsú, barna hajú lány kifejezésben a helyes és a karcsú is a lány-ra vonatkozott, habár a mondatban nem állt közvetlenül előtte. Ugyanígy a német nyelvben a Nehmen Sie bitte hier Platz! mondatban a legszorosabb (kollokációs) kap-
Hálózatkutatás és nyelvészet
81
csolat a nehmen és a Platz között van, amelyek mondaton belül a legtávolabb állnak egymástól. A Ferrer i Cancho és Solé (2001a) által létrehozott hálózat alapja a British National Corpus, amelyben hálózatok két fajtáját hozták létre: az egyik minden kapcsolatot (közös előfordulás) figyelembe vesz, a másik viszont csak azokat, amelyek gyakoribbak véletlenszerű előfordulási valószínűségüknél. Mindkét hálózat kisvilág-karaktert mutat, vagyis bármely szótól viszonylag kevés lépéssel eljutunk bármely más szóig. A hálózatok rendezettsége sokkal nagyobb, mint egy véletlenszerű hálózat esetében. A szerzők egy központi (mag) szókincs (kernel lexicon) meglétét is feltételezik, amely szerintük az 5000 legtöbb kapcsolattal rendelkező szóból áll (vö. Ferrer i Cancho–Solé 2001a). Feltételezik továbbá, hogy a kisvilág-karakter és a skálafüggetlen hálózat a nyelvi evolúció eredménye. Véleményük szerint pontosan ez a kapcsolati eloszlás teszi lehetővé a beszéd közbeni gyors szóelőhívást, illetve ez az eloszlás biztosítja, hogy a folyamat a lehető legkisebb erőfeszítést igényelje. Kutatási eredményeik az angol nyelvre elfogadhatóak lehetnek, külön vizsgálandó ugyanakkor, hogy a magyar nyelvvel kapcsolatban helytállóak-e megállapításaik. Ferrer i Cancho és Solé (2001a) valószínűsítik, hogy az új szavak hálózatba kapcsolása preferencia alapján történik, vagyis egy már sok kapcsolattal rendelkező szóhoz nagyobb valószínűséggel kapcsolódik az új szó. Ez az elképzelés cáfolható, hiszen ilyen alapon az első szavainknak (pl. mama, baba) kellene a legtöbb kapcsolattal rendelkezniük, ugyanis az első szavakhoz kapcsolódnak az utánuk elsajátított szavak – így az első szavaknak viszonylag korán sok kapcsolata lenne, amely tendencia az elsajátított szavak számának növekedésével folytatódna. Ha viszont Ferrer i Cancho és Solé eredeti megközelítését vesszük alapul (mondatbeli együttes előfordulás jelenti a kapcsolatot), akkor a leggyakrabban előforduló szavak lesznek a legtöbb kapcsolattal rendelkező elemek – azaz a zárt szófaji osztályt alkotó szavak, mint például a névelők, kötőszavak. Új fogalom elsajátítása esetén a kapcsolatok természetesen ezekhez is kialakulnak (ebből a szempontból tehát igaz, hogy a már sok kapcsolattal rendelkező szavak, mint pl. a névelő, sokkal több kapcsolatot tudnak begyűjteni), de ezek szigorúan grammatikai kapcsolatok, amelyek a szó szemantikai értékéről csak keveset árulnak el. Jelentés szempontjából sokkal fontosabb, hogy mely nyílt szófaji osztályba tartozó szavakkal teremt kapcsolatot az új szó, mivel az így létrejövő kapcsolatok fogják a szót a mentális lexikonban „pozícionálni”, vagyis adják meg a jelentését. Kérdéses természetesen, hogy gyermekek és felnőttek nyelv-, illetve szótanulása mennyiben hasonlít egymásra, vagy tér el egymástól. Ferrer i Cancho és Solé további kutatásaikban (Ferrer i Cancho–Solé 2001b, Ferrer i Cancho–Solé 2002, Ferrer i Cancho–Solé 2003) a Zipf-törvény és
82
Hálózatkutatás és nyelvészet
a skálafüggetlenség felé fordulnak. A Zipf-törvény létjogosultságát vizsgálják: a Zipf-törvény magyarázattal szolgálhat arra, hogyan tudja a beszélő és a hallgató megérteni egymást. A beszélő célja, hogy a lehető legkisebb erőfeszítéssel írja le a világot; a hallgatóé pedig, hogy a lehető legjobban megértse a szöveget, azaz a kétértelműséget – amennyire lehetséges – kizárja (vö. Ferrer i Cancho 2005, Pléh–Lukács–Kas 2008, Solé 2006). A Zipf-törvény arra is felhasználható lehet, hogy segítségével leírjuk a skizofréniás betegek nyelvi hálózatának változását (Ferrer i Cancho 2006). Függőségi nyelvtanokból kiindulva vizsgál német, román és cseh nyelvű korpuszokat Ferrer i Cancho, Solé és Köhler (2004). A hálózatuk pontjai szavak, kapcsolat adott szó és tőle függő másik szó között jöhet létre. Mindhárom nyelv mondatai kisvilág-karaktert mutattak. „The analysis shows that syntax is a small world and suggests other potentially broad patterns for languages on Earth” (Ferrer i Cancho–Solé–Köhler 2004: 6). Megállapításuk túlságosan általános, ezért (legalábbis véleményünk szerint) nem teljesen értelmezhető. Dorogovtsev és Mendes (2001) kutatásaikban a nyelvet mondaton belül egymással kapcsolatban lévő szavak komplex hálózataként írják le. A nyelv fejlődése (változása) közben ez a komplex hálózat önszervező módon fogad be új szavakat úgy, hogy azok a már meglévőkkel kerülnek kapcsolatba. A kapcsolódás preferenciáját, tehát hogy minek alapján választanak kapcsolatot az új egységek, nem definiálják. Ezen önszerveződés hozza létre a (szókincs többi részéhez képest) több kapcsolattal rendelkező, Ferrer i Cancho és Solé (2001a) által kimutatott központi (mag) szókincset (kernel lexicon), melynek nagyságát kb. 5000 szóra becsülik és amely számát tekintve viszonylag állandónak tekinthető. Nem tudjuk meg viszont, hogy mely (milyen jellegű) szavak, milyen szerveződés alapján alkotják a központi szókincset. Markošová (2008) a nyelvet és a nyelvi funkciókat nagymértékben egyszerűsítve Dorogovtsev és Mendes önszerveződő modelljét bővíti tovább. Modelljével a szavak jelentésváltozását próbálja leírni, de nyelvészeti szempontból nem teljesen egyértelmű, miben áll megközelítésének újdonsága. A szavak jelentésének változása, új jelentések hozzáadása ismert folyamat. Markošová modellje se nem magyarázza, se nem teszi jobban kutathatóvá ezen jelenségeket. Masucci és Rodgers (2008) Orwell 1984 című regényét elemezték, a szövegben egymás mellett előforduló szavak között kapcsolatot feltételezve. A korpuszt vizsgálva és Dorogovtsev és Mendes növekedési modelljét alapul véve egy újabb növekedési modellt hoztak létre, ahol a növekedést három tényező befolyásolja: a sok kapcsolattal rendelkező szavak nagyobb eséllyel létesítenek új kapcsolatokat; helyi kapcsolódási preferenciák, illetve bizonyos pontok véletlenszerű növekedése (jelen esetben pl. névelők kapcsolatai). Az így létrehozott hálózatnö-
Hálózatkutatás és nyelvészet
83
vekedési modell a szerzők véleménye szerint képes rá, hogy magyarázza mondatszerű struktúrák létrejöttét a nyelvben. Csermely Péter (2005) nyelvi hálózatokkal kapcsolatos kijelentéseihez főként Ferrer i Cancho és Solé kutatásait veszi alapul. A nyelvet (hálózati) modulokként (nyelvi elemek és mondatszerkesztési szabályok) értelmezve központi modulként egy párszáz szavas központot feltételez, amely köré a szókincs többi része rendeződik. Modulnak fogja fel többek között a tudományos nyelvet és a szlenget is, de a modulok működését, mibenlétét tovább nem definiálja. Fontosnak tartja továbbá a nyelvi kifejezések többértelműségét – azonban nem határozza meg, mit is ért többértelműségen (vö. Csermely 2005: 223-229). Hálózat Motter et al 2002 (szinon., angol thesaur.) Sigman–Cecchi 2002 (WordNet, főnevek) hiperonim hiperonim+meronim hiperonim+poliszém hiper+meron+polisz Steyvers–Tenenbaum 2005 (WordNet összes szó) Ferrer–Solé 2001a (Brit. Nat. Corp., kollok.) gyakoriak összes Ferrer–Solé–Köhler 2004 cseh német román Dominich–Kiezer 2005 Arany J. korpusz Biblia korpusz Jókai korpusz Pallas korpusz
N 30224
E
60
L 3,16
Lrandom 2,5
C 0,53
Crandom 0,002
10 7,6 7,2 10,61
0,002 0,010 0,080 0,081 0,029
0,00012 0,00012 0,00012 0,00012 0,0001
66025
122005
2,6
11,9 7,4 7 6 10,56
460902 478773
70 74
2,67 2,63
3,06 3,03
0,437 0,687
0,000155 0,000155
33336 6789 5563
13,4 4,6 5,1
3,5 3,8 3,4
4 5,7 5,2
0,1 0,02 0,09
0,0004 0,0006 0,00092
3,089 2,763 2,858 3,0057
5,891 5,352 5,227 6,496
0,299 0,535 0,507 0,467
0,001 0,0002 0,00005 0,00001
31909 29360 200022 605358
185493 200630 2065672 4699505
2. táblázat. Vizsgált nyelvi hálózatok kisvilág jellemzői Ke (2007) és Dominich–Kiezer (2005: 18) alapján. N csúcsok száma, E élek száma, átlagos fokszám, L átlagos útvonal, Lrandom átlagos útvonal random gráfban, C klaszterezési együttható, Crandom klaszterezési együttható random gráfban
Dominich Sándor és Kiezer Tamás (2005), valamint Dominich Sándor (2006) a magyar nyelvvel kapcsolatban vizsgálja a kisvilágok meglétét. A szerzők a Zipf-féle hatványfüggvényt alkalmazzák a magyar nyelvre, eközben kisvilág-
84
Hálózatkutatás és nyelvészet
ként az egymás mellett lévő szavakat értelmezik. A választott korpuszok (Arany János korpusz, Jókai korpusz, Biblia korpusz, Pallas Nagy Lexikon korpusz és Magyar web korpusz) különbözősége – keletkezési idő, nagyság (60 ezer szó – 11,5 millió szó), nyelv (szépirodalom, szaknyelv, „fordított nyelv”, ismeretlen tartalmú (web) korpusz) – miatt a vizsgálat során levont általános jellegű megállapítások nem vonatkoztathatók a magyar nyelv egészére. A kutatás során problémának tekinthető, hogy a szövegben szereplő írásjeleket figyelmen kívül hagyják, így az A mondat utolsó és B mondat első szava a vizsgálatban egymás mellé kerül, habár közöttük mondathatár van. Az egyes korpuszokban a legrövidebb átlagos utak, illetve a klaszterezési együtthatók a következők, összehasonlítva hasonló kutatások eredményeivel (2. táblázat; a táblázatban szereplő első három kutatást a fejezet későbbi részében mutatjuk be, mivel azok szemantikai hálózatokat vizsgálnak). Dominich és Kiezer a magyar nyelvű korpuszok gyakorisági szólistáját (nyelvi mag) is elkészítették. Az eredmények szintén arra utalnak, hogy fenti korpuszok nem biztos, hogy alkalmasak a magyar nyelvre vonatkozó általános következtetések levonására. A Biblia-korpuszban a szólista 20 leggyakoribb eleme között szerepel a fia, az isten, az úr, amely gyakoriság biztosan nem lenne jellemző általános nyelvi korpuszokra. Kétségbe vonhatók további megállapításaik, vagyis hogy az ő megléte négy korpusz leggyakoribb szavai között és eltűnése a web korpusz leggyakoribb szavai közül a nyelvhasználat változására (harmadik személy háttérbe szorulása) utal, valamint hogy a the és az of megjelenése a web korpusz első húsz szava között a „globalizáció (amerikanizáció) konkrét nyelvi megnyilvánulása” (Dominich– Kiezer 2005: 14). A web korpusz ugyanis a .hu domainek 18 millió magyar weblapjának szavait tartalmazza. Weblapokon azonban szinte alig fordulnak elő szépirodalmi művek, tehát az ő eltűnése a gyakorisági listából azzal is magyarázható, hogy a web korpusz inkább szakszöveg jellegű (reklámszöveg, cégek bemutatkozása, szolgáltatások leírása stb.), ahol az ő hátrébb kerülése a gyakorisági sorban természetesnek vehető. A the és of megjelenése a gyakorisági sorban szintén egyszerűen magyarázható: a .hu domain végződés semmit nem árul el a honlapok nyelvéről, csak azt rögzíti, hogy a honlap bejegyzési helye Magyarország. Ha előbbi gondolatmenetünket folytatjuk és körülnézünk magyar weblapokon, azt találjuk, hogy a magyar lapok mellett sokszor azok angol fordítása is szerepel az interneten (cég, intézmény honlapján), természetesen .hu domain alatt. Ez egyszerre magyarázhatja, miért kerültek be angol szavak is a magyar gyakorisági szólistába: a web korpuszban egy ismeretlen nagyságú magyar, egy viszonylag nagy szószámú angol és valószínűleg kisebb szószámú német, francia, olasz stb. korpuszok keverednek. Amennyiben az angol szavak megjelenésének ez az oka,
Hálózatkutatás és nyelvészet
85
akkor a web korpusz leggyakoribb szavának (a) előfordulási száma sem egyértelmű, hiszen az a éppúgy lehet magyar határozott névelő mint angol határozatlan névelő. Dominich Sándor és Kiezer Tamás munkája a módszertani hibák és nem helyesen levont következtetések ellenére úttörő jellegűnek tekinthető a magyar nyelvre, vizsgálatuk eredményeinek általánosításához viszont szükséges lenne a vizsgálat megismétlése más korpuszokkal. Szintén szövegek hálózatainak bemutatására és elemzésére indította el Solé, Corominas és Valverde a WIENER (Word Interactions: Exploring NEtwork Robustness) projekt honlapját. A projekt célja, hogy különböző nyelvű korpuszokon elemezzék a szövegek skálafüggetlen hálózatait.
4.2 Szemantikai hálózatok Szemantikai hálózatok vizsgálatára az első javaslatot Watts teszi, aki szóasszociációs adatok kisvilág-karakterének vizsgálatát javasolja, mivel az asszociációs adatokból alkotott gráfok a nyelv jobb megértését segíthetik elő (Watts 1999: 160). Szalay és Deese (1978: 22; 152) is utalnak rá, hogy az asszociációs adatok mélyebb információt tartalmaznak a mentális reprezentációról, mint más nyelvi megnyilatkozások (pl. egy szöveg): az asszociációk esetében a mentális reakció nincs alárendelve kommunikációs célnak. Sigman és Cecchi (2002) a WordNet adatbázis (lásd 5.4 fejezet) szemantikus kapcsolatait elemezve kisvilág jelenséget, illetve skálafüggetlen hálózatok létezését vizsgálja. A négy vizsgált kapcsolatfajta: 1. hiperonim – hiponim; 2. antonim; 3. meronim – holonim; 4. poliszém. A kapcsolatok szerkezetét nemcsak együtt (1-4.), hanem egyenként is tanulmányozták, a hiperonim – hiponim hálózathoz adva hozzá a további kapcsolatfajtákat. A poliszém kapcsolatok hozzáadása után a hálózatok kisvilág-karaktert mutattak. „Our investigation […] shows that inclusion of polysemy drastically reorganizes the semantic web so as to render it a small-world network, where meanings are typically closer to each other and central concepts (which are the most polysemous, and also the most familiar) become the center of more trajectories, the hubs of the lexicon. This finding formalizes the proposal that polysemy may be crucial for metaphoric thinking, imagery, and generalization” (Sigman–Cecchi 2002: 1747). Szavakból álló olyan hálózatot vizsgál Motter (Motter et al. 2002), ahol szavak között akkor jöhet létre kapcsolat, ha a szavak jelentése hasonló: pl. letter – character, actor – character, universe – world. A szerzők nem definiálják, hogy pontosan mit is értenek hasonló jelentésen, csak arra utalnak, hogy adataik forrása
86
Hálózatkutatás és nyelvészet
egy 30.000 szavas on-line thesaurus. Az általuk megállapított átlagos legrövidebb távolság a szavak között 3,2 lépés, ami közel azonos Steyvers és Tenenbaum (2005) nem irányított asszociáció hálózatának 3,04 lépéses eredményével (vö. később). Motter et al. (2002) szerint a kisvilág felépítés hatékonnyá teszi az információ keresését a memóriában. Az asszociatív memória gráfokkal történő ábrázolását vizsgálja Pomi és Mizraji (2004). Modelljükben az asszociációs válaszokat gráfokkal ábrázolják, a gráfok irányítottak. Feltételezésük szerint az ábrázolás két hálózati modell, a neurális hálózat és a szemantikus hálózat közti űrt tölti ki. Az így létrejövő hálózat egy része minden, azonos nyelvet beszélő ember esetében hasonló, ami megmagyarázhatja, hogy miért értik meg egymást az emberek asszociációs hálójuk sokfélesége ellenére. Véleményük szerint eredményeik felhasználása feltérképezhetővé (és esetleg a későbbiekben befolyásolhatóvá) teszi az agy neurális hálózatának működését is. Palla Gergely et al. (2005) korábban említett egymást átfedő csoportosulásait a szerzők a nyelvben is kimutatták. A mentális lexikon kisebb csoportokra, domainekre felosztását és a domaineken belüli kapcsolatok kiemelt kezelését javasolta Kovács László (2008a) is, de kutatásaiban nem vette figyelembe azt, hogy ezek a domainek átfedhetik egymást. Palla et al. a Nelson–McEvoy– Schreiber-féle (1998) asszociációs tesztekből vett példákkal bizonyítják, hogy a gold szó esetében a szó részét képezi az olimpiával kapcsolatos szócsoportnak, az ékszerekkel és a jóléttel kapcsolatos csoportoknak (Palla et al. 2005, Supplementary Information). Magyar nyelven az arany szó körül így létrejövő, egymást átfedő hálózatok Derényi Imre et al. (2006) publikációjában tanulmányozhatók. Fontos megjegyezni, hogy a szerzők nem végezték el magyar nyelvre is a kutatást, csak az angol asszociációkból alkotott hálózatot fordították magyarra. Mivel az asszociációkat a nyelv és a kultúra befolyásolja (vö. pl. Cramer 1968), a magyarra fordított hálózat Derényi et al. kutatásainak szemléltetésére hasznos lehet, ugyanakkor az arany szó köré épült magyar hálózatot/csoportosulásokat nagy valószínűséggel nem helyesen modellezi. Oláh-Nagy Noémi (2012) be is bizonyította, hogy fenti, ezen kötet első kiadásában (Kovács 2011b) megfogalmazott feltételezésünk helytálló. A 100 főtől 100 hívószóra felvett magyar adatok alapján kimutatható, hogy az angol gold, illetve a magyar arany szóra más gyakori asszociációk, illetve más klaszterek jöttek létre: a négy angol klaszterrel (olimpia, fémek, ékszerek, jólét) szemben a magyar arany szó körül csak egy, nagy méretű klaszter volt kimutatható. A klaszterek méretének csökkentésével a magyar adatbázisban is kimutathatóvá váltak kisebb klaszterek, a fémekkel és a jóléttel kapcsolatosan. Az angol adatbázisban a gold, illetve a magyar adatfelvétel során az arany szóra érkezett válaszok
Hálózatkutatás és nyelvészet
87
más szempontból is eltérnek: míg az angol asszociációkban válaszként a silver dominál (közel 50%), amit a money és a jewel követ (kb. 10-10%), addig a magyar válaszokban az ékszer és az érem a leggyakoribb válaszok; mindkettő 9%ban érkezett válaszként. Számos olyan válasz is érkezett a magyar adatfelvétel során, amely az angol asszociációk közül hiányzik, például: érem, János, bánya, rúd, bulla. Az 1995-2005 között megjelent, szemantikai hálózatokkal foglalkozó publikációkat hálózatelméleti megközelítésből vizsgálja Bales és Johnson (2006) különböző kvantitatív mutatók (pl. bizonyos kulcsszavak előfordulása) alapján. Az általános hálózatelméleti bevezetést is tartalmazó publikáció következtetése szerint a hálózati jellegű megközelítések többek között a szakszótárak szerkesztésében nyújthatnak segítséget: hálózatok segítségével könnyebben reprezentálhatók az egyes szótári lemmák közötti kapcsolatok, illetve gráfok segítségével jobban megjeleníthető a szótár tartalma. Hasonlóságot vélnek felfedezni a szótári keresés és a beszéd közben történő szólehívás között is: amennyiben a szótárak esetében megoldható, hogy a lemmák közötti hivatkozások kisvilág felépítésűek legyenek, abban az esetben a szótár használója könnyebben találhat meg bizonyos fogalmakat. A hálózatok adott téma áttekintésében is segíthetnek: a korpuszokból kinyert fogalmi hálók segítségével könnyebben áttekinthetők és megérthetők adott témakör fontosabb jellemzői. Steyvers és Tenenbaum (Steyvers–Tenenbaum 2005) szemantikai hálózatok hálózatközpontú statisztikai elemzését, valamint a szemantikai hálózatok növekedésének egy lehetséges modelljét mutatják be. Vizsgálatuk alapját három adatbázis képezte: – a Dél-Floridai Egyetem szóasszociációs adatbázisának egy része (The University of South Florida Word Association, Rhyme and Word Fragment Norms) (Nelson–McEvoy–Schreiber 1998); – a Miller-féle WordNet (pl. Miller et al. 1990); – a Roget-féle thesaurus (1911-es kiadás). A három különböző szemantikai háló a következő tulajdonságokat mutatta: – kisvilág-karakter (bármely elemtől bármely másik elem nagyon kevés lépésben elérhető); – skálafüggetlenség (kevés elem nagyon sok kapcsolattal rendelkezik, míg nagyon sok elem van, amely csak néhánnyal); – központi (sok kapcsolattal rendelkező) elemek megléte. Mivel mindhárom hálózat fenti tulajdonságokat mutatja, feltételezhető, hogy ezek a tulajdonságok (legalább részben) a fogalmak szemantikai szervező-
88
Hálózatkutatás és nyelvészet
désének általános jellemzői. A szerzők azonban utalnak arra is, hogy ez a hálózatok közötti hasonlóság a vizsgálati módszer hibájából is eredhet: a kutatás során a hálózatokat egyszerűsítették, a gráfok pontjait összekötő gráféleket nem súlyozták, illetve nem nevezték meg. Ezzel szemben az Agykapocs-kutatás már súlyozott gráfokat vizsgál és lehetővé teszi a gráfélek megnevezését is (lásd 5. fejezet). A Steyvers–Tenenbaum által megállapított átlagos legrövidebb út (átlagosan hány lépésben érek el egyik szótól egy másik szóig) két szó között: – az asszociációs hálózatra 3,04 lépés nem irányított esetben (vagyis ha két szó között csak a kapcsolat van jelezve, annak iránya nem); – asszociációs hálózatra 4,27 lépés irányított esetben (vagyis a kapcsolat irányát is figyelembe veszik); – a WordNetre 10,56 lépés; – a Roget-féle thesaurusra 5,6 lépés. Az asszociációs hálózat 3,04 illetve 4,27 lépés távolsága meglepően rövid, azonban nem szabad figyelmen kívül hagynunk, hogy a vizsgált adatbázis „csupán” 5018 szót tartalmazott. Steyvers és Tenenbaum a továbbiakban modellezik a szemantikai hálózatok növekedését is. Vizsgálatuk eredményeként hálózatközpontú hálózatnövekedési modelleket alkalmazva új hipotézisek állíthatók fel többek között új szavak tanulásával kapcsolatban. Feltételezésük szerint a szemantikai hálózat skálafüggetlensége és kisvilág-karaktere a mentális lexikonban való szókeresést is befolyásolhatja. Az internet mint skálafüggetlen, kisvilág-karakterű hálózat és a mentális lexikon hasonlóságát vizsgálja Griffiths, Steyvers és Firl (2007): a Google kereső algoritmusának (vö. Brin–Page 1998) eredményeit vetik össze szóasszociációs kísérletek eredményeivel. Elemzésük szerint a szemantikai memória működése (szóelőhívás) és a vizsgált számítógépes algoritmus meglepő azonosságokat mutat, így a memória szemantikai hozzáférésének kutatása informatikai szempontból is sok új eredményt hozhat (pl. jobb keresőrendszerek megalkotása). Coronges, Valente és Stacy (2007) asszociatív hálókat vizsgál két csoport esetében, korábbi asszociációs kutatások eredményeinek felhasználásával. A két csoport (college students, seventh graders) asszociációinak összehasonlítása azt mutatja, hogy a hallgatók asszociációi esetében a létrejövő szemantikai rendszer több elemet tartalmaz és centralizáltabb, míg több jellemző (pl. átlagos útvonal hossza) közel azonos. A kutatás viszonylag kis mennyiségű adatot dolgozott fel: összesen 16 hívószó, hívószavanként és csoportonként 140-150 válaszadó. A létrejövő hálózatban az átlagos útvonalhossz válasz és válasz között 2,6. Szavak fonetikai hasonlóságát Vitevitch (2008) vizsgálja. Két szó között akkor hozott létre nem irányított, nem súlyozott kapcsolatot, ha a két szó között
Hálózatkutatás és nyelvészet
89
egy fonéma az eltérés (pl. cat: hat, cap, at). Megállapítása szerint az így létrejövő fonológiai hálózatban nagyobb az egyes pontok közötti távolság, mint a szemantikai hálózatban, valamint gyakoriak az olyan szavak, amelyek – fonológiai szempontból – nem „szomszédjai” egyetlen másik szónak sem. Megfigyelhető emellett, hogy a létrejövő hálózatban a sok fonológiai szomszéddal rendelkező szavak kapcsolatai többnyire szintén sok szomszéddal rendelkező szavakhoz irányulnak. Az eredmények arra is engednek következtetni, hogy a régebben elsajátított szavak több (fonológiai) kapcsolatot hoznak létre. (Az angol nyelvben Storkel (2004) mutatta ki, hogy az először megtanult szavaknak több fonológiai szomszédja van, mint a később elsajátítottaknak.) Vitevitch a mentális lexikon multidiszciplináris vizsgálatát javasolja, mivel a mentális lexikon hálózatos felépítésével kapcsolatos új felfedezések a hálózatokkal kapcsolatos általános ismereteinket is formálhatják: elősegíthetik többek között más (dinamikus, időben változó) hálózatok pontosabb megértését, illetve új hálózatosztályozási szempontokat is bevezethetnek. Schur (2007) az első és második nyelv vizsgálatában alkalmaz hálózatközpontú megközelítést. Egynyelvű és kétnyelvű, angol anyanyelvű beszélőket, illetve nem anyanyelvi beszélőket vizsgált szóasszociációs tesztekkel, hogy megállapítsa, a mentális lexikon kisvilágként szerveződik-e. Feltételezése szerint bizonyos szavak (pl. névelők) sok másik szóval vannak kapcsolatban, mintegy központi elemként szolgálva. A négy csoportban, csoportonként 32 fővel (anyanyelvi angol; L1 kínai L2 angol; L1 angol L2 héber; L1 héber L2 angol) folytatott kísérletben egy 50 igéből álló listán kellett a lehető legjobb párokat megtalálni (a „hívószó” és a „válaszszó” is ugyanaz az 50 ige volt). Schur az eredményeket hálózatként, irányított kapcsolatokkal ábrázolta, majd vizsgálta az így létrejött hálózatokban többek között az elemek számát és a kétirányú kapcsolatok számát. A négy csoport asszociációs stratégiái között különbségek mutatkoztak: a nem anyanyelvűek hálózatai esetében több volt a csak két tagból álló „hálózat”, valamint a kétirányú kapcsolat, így hálózatuk nagy mértékben eltért az angol anyanyelvűek hálózatától. Schur a különbségeket a nyelvtanulás módjára vezeti vissza (Schur 2007: 194-195), a létrehozott hálózatok felépítése viszont egyértelműen nem a véletlenszerűen, számítógéppel generált (random) hálózatok jellemzőit mutatta. Schur eredményei esetében kérdéses, hogy mennyire kapunk valós képet a mentális lexikonról, amennyiben a válaszlehetőségek is adottak, tehát passzív asszociáció zajlik és a kapcsolatok erősségének vizsgálata sem történt meg. A mentális lexikon kisvilág-karakterének bizonyításához Schur elképzelése szerint négy feltételnek kell teljesülnie:
90
Hálózatkutatás és nyelvészet
1. a hálózatban a lehetséges kapcsolatokhoz képest viszonylag kevés kapcsolat legyen; 2. legyenek központi, sok kapcsolattal rendelkező elemek; 3. a csomópontokat viszonylag kevés pont válassza el egymástól; 4. skálafüggetlen csomóponteloszlás. Schur szerint a viszonylag kevés adat nem alkalmas arra, hogy bizonyítsuk a mentális lexikon skálafüggetlen felépítését; ugyanakkor az adatok ezt a feltételezést látszanak igazolni. A kutatás prognosztizálja (ha nem is bizonyítja) a mentális lexikon kisvilág jellegét. A kutatása során a minden egyes személyre külön megalkotott igei hálózatok mélyebb betekintést engednek az egyének mentális lexikonjának szerveződésébe. Fóris Ágota (2007a) tanulmányában általános bevezetést ad a hálózatelméletbe (vö. Barabási 2003, Csermely 2005, Watts 2004b), jelezve, hogy sem a hálózatok, sem a skálafüggetlenség feltételeként megadott hatványfüggvény nem új gondolat a nyelvészetben: Zipf-törvénye hatványfüggvény-összefüggést ír le nyelvi korpuszok esetében, illetve tulajdonnevek előfordulása korpuszokban szintén skálafüggetlen eloszlást mutat. Fóris Ágota a nyelvi háló létét bizonyítottnak veszi (Fóris 2007a: 118), ugyanakkor más kutatások a hálót sokszor inkább metaforaként, illetve modellként, és nem tényként kezelik (vö. pl. Wilks–Meara 2007). Fóris Ágota nem fejti ki, hogy a mentális lexikonban milyen reprezentációs szinten, milyen jellegű skálafüggetlen háló létezik, milyen elemekkel, illetve mi mivel hoz létre kapcsolatot. A mentális lexikon skálafüggetlen és/vagy kisvilágkarakterének meglétét feltételezte empirikus adatok alapján magyar nyelvre többek között Kovács László (2007, 2008a) és Lengyel Zsolt (2008c), de hangsúlyozták, hogy ezen tulajdonságok meglétének igazolásához további kutatások szükségesek. (Ezen kutatások időközben részben lezajlottak; az eredményeket a 7. fejezetben fejtjük ki.) De Deyne és Storms (2008b) részben elektronikusan (interneten) gyűjtött szóasszociációs adatokat elemezve kimutatták, hogy – a hívószó szófajától függetlenül – a főnév a leggyakoribb szófaj a válaszszavak esetében. Az egy hívószóra három választ megengedő adatfelvétel asszociációiból létrehozott hálózat kisvilág-karaktert mutat, ugyanakkor a hálózat sűrűbb, mint a csak egy válaszszót megengedő kutatások eredményeiből létrejövő hálózatok. Megállapították továbbá, hogy az átlagos távolság a szavak között négy lépés; az egyik leggyorsabban elérhető információ a kategóriába sorolás, illetve hogy a sok kapcsolattal rendelkező szavak többnyire melléknevek. De Deyne és munkatársai (De Deyne– Storms 2008a, De Deyne et al. megjelenés alatt) utalnak rá, hogy a több választ váró folyamatos asszociáció (esetükben három válasz megadására volt lehetőség) eredményei pontosabban írják le a mentális lexikon felépítését – különösen a
Hálózatkutatás és nyelvészet
91
gyengébb kapcsolatokat –, mint a csak egyszavas asszociációból származó adatok. Gravino et al. (2012) két adatbázist, a South Florida adatbázisát (Nelson– McEvoy–Schreiber 1998; lásd 5.4 fejezet) és a Human Brain Cloud (HBC részletesebben lásd 5.4 fejezet) nevű internetes – a könyv írásakor nem működő – adatbázist hasonlítják össze egymással. A HBC nem kutatási céllal készült, hanem olyan játékként működött, amely asszociációk megadását tűzte ki célul. A HBC elemzett adatbázisa 90.000 pontot és körülbelül 6.000.000 asszociációt tartalmaz, az átlagos útvonalhossz az adatbázisban 5 lépés. A legjellemzőbb kapcsolatok a szinonima, holonima, hiperonima, de a szerzők kiemelik az ok-okozati kapcsolatok viszonylag nagy számát is. A ki- és bemenő kapcsolatok számának eloszlása a két adatbázisban (South Florida és HBC) hasonló, a ki- és bemenő kapcsolatok erőssége viszont eltérést mutat. A gyerekek nyelvfejlődését, valamint gyerekek és édesanyjuk nyelvhasználatát hálózatok szempontjából vizsgálja Ke és Yao (2008). Elképzelésük szerint a gyerekek nyelvelsajátítása hálózat létrejötteként modellezhető, ahol az egyes szavak a hálózat pontjai. A szavak között kollokációs kapcsolat jön létre. Ke és Yao akkor hoztak létre irányított kapcsolatokat szavak között, ha azok a gyerekek beszédében egymás után következtek. A 12 gyerek nyelvfejlődését (szavak, kapcsolatok száma) 34 alkalommal rögzítették. A folyamat minden gyerek esetében különbözik, ezért a létrejövő hálózatok is más ütemben fejlődnek és más jellemzőket mutatnak. Hálózatelméleti módszereket alkalmazva ezek a különbségek kvantifikálhatóak, ami a nyelvfejlődés tanulmányozásának új lehetőségeit kínálja. A hálózat-feltételezés véleményük szerint azt is implikálja, hogy a szavak jelentése és megfelelő környezetben történő használata nem függ a nyelvtan ismeretétől. A gyerekek adatait egymással összevetve az egyes gyerekek adatai szignifikánsan különböztek egymástól mind a szavak számát, mind az egyes szavak kapcsolatainak számát tekintve. A gyerekek nyelvfejlődését természetesen nem vizsgálhatjuk csak növekedés szempontjából: a kapcsolatok erőssége és minősége is változik a nyelvelsajátítás folyamán, ezért a központi elemek (központok) vizsgálata különösen fontos. Ke és Yao vezérlőnek (hub; nagy befolyással rendelkező elem, lásd 3.3.3 alfejezet) fogják fel azokat a szavakat, amelyek után sokfajta szó következhet (sok kimenő kapcsolat), gyűjtőnek (authorities; nagy presztízsű elem), amelyek sokfajta szót követhetnek (sok bemenő kapcsolat). A vezérlőket és a gyűjtőket az egész hálózat felépítése határozza meg – amennyiben változás következik be bennük, az az egész nyelvi hálózat változását eredményezheti, illetve ennek következtében maga a nyelv is átalakulhat. A gyerekek nyelvelsajátítása közben megfigyelhető, hogy a legfontosabb vezérlők és gyűjtők először nyílt szóosztálybeli, tartalmas
92
Hálózatkutatás és nyelvészet
szavak (pl. chair), majd fokozatosan veszik át helyüket a zárt szóosztály szavai. A kétfajta központ értelmezése azonban nem ennyire egyértelmű, ugyanis nem mindegy a kapcsolatok minősége sem: a központok szerepe csak a hálózat egészének szemszögéből vizsgálható. Ke és Yao kutatásának külön eredménye, hogy a gyerekek és nevelőik nyelvét összevetve azt tapasztalták, hogy a gyerekek és édesanyjuk nyelvhasználatában kvantitatív szempontból hasonlóságok mutathatók ki: ha az anya nyelvi hálózata sok csúcsot (szót) tartalmazott, de pontonként kevés kapcsolattal, akkor gyereke esetében hasonló tulajdonságokkal rendelkező hálózat volt megfigyelhető. Ugyanez ellenkező irányban is igaz volt: ha kevés csúcsot (szót), de sok kapcsolatot tartalmazó hálózat volt jellemző az anya nyelvében, akkor ugyanez volt igaz gyereke nyelvére is. Ahogy Ke és Yao is utal rá, az általuk elképzelt hálózatalapú modell egyszerűsített, mivel a kapcsolatokat a szavak között azonos erősségűnek feltételezték. „The other solution is to adopt more complex representations of the nodes and the links, such as adding semantic encoding to the nodes, and using weighted links to allow long distance collocation to be maintained” (Ke– Yao 2008: 96). Lengyel Zsolt (2007a, 2008c) utal a mentális lexikonban valószínűleg fellelhető és asszociációs kísérletekkel kimutatható kisvilág jelenségre, de nem részletezi a továbbiakban ezen kisvilágok jellemzőit. Kovács László szintén a mentális lexikon kisvilág-karakterét feltételezi (2007, 2008a) és javasolja a mentális lexikon kapcsolatainak gráfokkal történő ábrázolását. Elképzelése szerint az ábrázolásra az irányított, súlyozott gráfok alkalmasak – tehát mind a kapcsolatok erősségének, mind irányának szerepe van. Bemutatja az Agykapocs-kutatást, amely segítségével asszociációs adatokat gyűjt és elemez kisvilágok szempontjából (2008b), majd az Agykapocs-kutatás eredményeiből kiindulva bizonyítja, hogy a kapcsolatok iránya a mentális lexikonban kiemelt fontosságú (2009a). Hírműsorok szövegéből alkotott szemantikai hálózatok skálafüggetlenségét Liu (2009) igazolja a kínai nyelvre. A hálózat zárt osztálybeli szavakat nem tartalmaz, mivel azok a szintaktikai hálózatok felépítésében játszanak szerepet. A vizsgálat kimutatja, hogy a szemantikai hálózatok hálózatos jellemzői eltérnek a szintaktikai hálózatok jellemzőitől. Az eddig megismert szintaktikai és szemantikai hálózatok között helyezkedik el az együttes előfordulásokat vizsgáló hálózat. Az ilyen hálózatokban szavakat akkor kötünk össze kapcsolatokkal, ha azok egy mondaton belül fordulnak elő (Solé et al. 2005).
Hálózatkutatás és nyelvészet
93
4.3 Nyelvi hálózatok további kérdései Nyelvi hálózatok kialakulása és változása legalább két összefüggésben tanulmányozható: egyrészt az egyéni nyelvelsajátítás folyamata során, másrészt közösségi szinten, vagyis egy nyelv kialakulása, illetve átvétele esetén (Solé et al. 2005). Gyerekek esetén a nyelvi hálózatok kialakulásának tanulmányozása még kevéssé vizsgált terület, a társadalmi nyelvváltozások esetén viszont már folynak kutatások. Ezen kutatások egy része szükségszerűen a nyelvet beszélők hálózatával hozza összefüggésbe a nyelv változásait. A nyelvet beszélők hálózatát hagyományos megközelítésben a szociolingvisztika vizsgálja. Hálózatelméleti megközelítésben külön hangsúlyt kap a nyelvváltozás vizsgálata, amit Ke (2007) számítógéppel modellez, a modellhez egyre több valós tényezőt (pl. beszélők öregedése, tanulási képességének változása stb.) adva. Eredményei alapján a nyelvváltozás kiindulópontja nagy valószínűséggel egy olyan központi, sok kapcsolattal rendelkező egyén, akinek hatására a változás viszonylag gyorsan az egész beszélőközösségben elterjed (vö. Milroy–Gordon 2003). A nyelvváltozás modelljét tovább pontosítva Ke–Gong– Wang (2008) következtetése: „as long as the population contains a small number of statistical learners who can learn and use both linguistic variants statistically according to the impact of these variants in the input, there is a very high probability for a linguistic innovation with only a small functional advantage to diffuse. This may in part explain why language changes are so prevalent” (Ke– Gong–Wang 2008: 948). Abrams és Strogatz (2003) a nyelvhalált matematikailag modellezve jutnak arra az eredményre, hogy a nyelvek fennmaradása szempontjából a nyelv státusza a legfontosabb jellemző, így a veszélyeztetett nyelvek megőrzését legjobban nyelvpolitikai intézkedések (pl. oktatás) segíthetik elő. A szociolingvisztika és a hálózatkutatás kapcsolatát részletesebben Kovács László (2011) mutatja be. Nyelv és hálózatok kapcsolatában további kérdésként merül fel a nyelvet „tároló” agy hálózatainak milyensége. Neuroanatómiai adatbázisok alapján kortikális kapcsolatokat vizsgálva Sporns és Zwi (2004) az agy kortikális felépítését kisvilág-karakterűnek, Eguíluz et al. (2005) pedig skálafüggetlennek írják le. Bassett és Bullmore (2006) szintén az agy kortikális kapcsolatainak kisvilágkarakterét vizsgálják, utalva arra, hogy ez a felépítés egyrészt ellenállóvá teszi az agyat különböző támadásokkal (betegségekkel) szemben, másrészt hatékony információ-áramlást tesz lehetővé. Supekar et al. (2008) Alzheimer-kórban szenvedő betegek és egészséges emberek agyi felépítésének kisvilág-karakterét fMRIvel vizsgálva kimutatják, hogy a betegek esetében kevésbé jellemző az agy felépítésére a kisvilág-karakter, mint egészséges emberek esetében. Hasonlóan a
94
Hálózatkutatás és nyelvészet
neurális kapcsolatok kisvilág-karakterének bizonyos átszerveződése mutatható ki sclerosis multiplex esetében is (He et al. 2009, He–Chen–Evans 2007). Kollektív és egyedi hálózatok Az eddig vizsgált jelenségekre jellemző, hogy nem egy beszélő nyelvi hálózatát jellemzik, hanem egyfajta kollektív hálózatot (vö. Ke 2007): azaz a korpuszok nem egy egyén szemantikai/grammatikai hálózatát írják le, hanem egy közösségét. Hasonlóképpen a szótárak is egy beszélőközösség, illetve beszélők egy csoportjának adatain alapulnak. Az így létrejött korpuszok és szótárak, valamint az azok elemzéséből nyert adatok tehát nem egy egyénre, hanem egy közösségre vonatkoznak. Az egyes beszélők mentális lexikonjának szervezettsége nem mutat ennyire egységes képet: egyesek a szintagmatikus, mások a paradigmatikus kapcsolatokat részesítik előnyben. Szerepet játszik továbbá a nem, a kor és a képzettség is (vö. 2. fejezet). Ezért további kutatási cél lehet az egyének hálózatait egymással öszszevetni, illetve az egyéni és kollektív hálózatokat kontrasztív módon vizsgálni. Egyensúly A nyelv mint rendszer egyensúlyi helyzetben kell hogy legyen ahhoz, hogy hatékony kommunikációs eszközként szolgálhasson. Egyrészt kifejezőnek és rugalmasnak kell lennie, ugyanakkor tanulhatónak kell maradnia (Bales–Johnson 2006). A nyelv ezt a két tulajdonságát matematikailag Allegrini, Grigolini és Palatella (2004a) modellezik olasz írott korpusz alapján. A rugalmasságot bizonyos szempontból robosztusságként is felfoghatjuk, vagyis megfelelően kell tudnia reagálnia a legkülönbözőbb, véletlenszerű külső hatásokra. Ez a tulajdonság jellemzi a skálafüggetlen hálózatokat (vö. Barabási 2003). Amennyiben elég nagy számú a kapcsolat a nyelvi elemek között, feltételezhető, hogy a nyelv skálafüggetlen kapcsolati hálózatot alkot. Ezt látszik alátámasztani, hogy a különböző, nyelvhasználatot is érintő betegségek esetén (pl. Alzheimer-kór) a nyelvi hálózat „összeomlásának” folyamata hasonlít a skálafüggetlen hálózatok összeomlása során megfigyelt jelenségekhez (Chan–Salmon–Butters 1998). Ha viszont túl nagy a kapcsolatok száma, akkor az egyensúly szintén nincs meg: nehéz új szavakat vagy az egész nyelvet elsajátítani. Az elképzelések összefüggésbe hozhatók Zipf legkisebb erőfeszítés elgondolásával, illetve a nyelvi ökonómia további kérdéseivel (vö. Roelcke 2002). Gyakorlati alkalmazások A nyelvi kisvilágok kutatása gyakorlati célokat is szolgálhat: Mengxiao, Zhi és Qingsheng (2003) angol nyelvű korpuszokban talált kisvilágokból kiindul-
Hálózatkutatás és nyelvészet
95
va kínai nyelvű dokumentumokat elemeztek. Az együtt előforduló szavakból kapcsolati hálózatot hoztak létre, amely kisvilág tulajdonságokat mutatott. A hálózat egyes pontjainak vizsgálatával (a pont szerepe a hálózatban kisvilágok szempontjából) kulcsszavakat azonosítottak. Az eredeti dokumentumokkal való összehasonlítás kimutatta, hogy a kulcsszavak helyesen adták vissza a dokumentumok tartalmát, vagyis írott szövegek kisvilág-karakteréből kiindulva jól működő tartalomkivonatoló és adatbányász algoritmusok alkothatók. Hasonló eljárást alkalmaz Zhang, Cheng és Qu (2007) akik számítógépes (szemantikus web) ontológiák kisvilág-karakterét (vö. Zhang 2008) elemezve foglalják össze az ontológiák tartalmát. Allegrini, Grigolini és Palatella (2004b) Zipf törvényét és skálafüggetlen hálózatok felőli megközelítést alkalmazva, adott szövegeket általános olasz nyelvi korpuszból nyert adatokkal összevetve sikeresen azonosítottak szövegekben tartalomra utaló szavakat. Antiqueira et al. (2007) hallgatók által írt szövegeket vizsgálnak egyrészt hálózatelméleti módszerekkel (egymást követő szavak hálózataként, többek között ki- és bemenő kapcsolatokat elemezve), majd ugyanezen szövegeket szövegnyelvészeti (kohézió, koherencia) megközelítésben is elemzik. Eredményeik szerint a hálózatelméleti megközelítésből nyert kvantitatív adatok viszonylag pontosan jelzik a szöveg minőségét. Fordítási feladatok megoldásában is segítségünkre lehetnek szavakból alkotott hálózatok: az egyes fordítandó szavak előfordulási környezetét gráfként ábrázolva megalkotható olyan algoritmus, amely a célnyelvi szavak környezetét hasonlóképpen feltérképezve a lehetséges fordítási alternatívák közül kiválasztja a legmegfelelőbb célnyelvi szót (Dorow 2006). Fóris Ágota (2009) a fordításra vonatkozó skálafüggetlen modellje szintén hasonló elképzeléseket fogalmaz meg: hálózatok működését feltételezi terminológiai egységek, valamint szövegek fordítása során is. További lehetőségek A hálózatelmélet és nyelvészet kapcsolódási lehetőségei nem korlátozódnak az itt felsoroltakra: a Balaskó Mária, Balázs Géza és Kovács László (Balaskó–Balázs–Kovács 2010) és a Balázs Géza, Kovács László és Szőke Viktória (Balázs–Kovács–Szőke 2012) szerkesztette Hálózatkutatás kötetek a hálózatelmélet, a nyelvészet és a társadalomtudományok számos kapcsolódási pontját mutatják be. Balázs Géza (2010) nyelvi alakzatokat és hálózatkutatást összekapcsolva utal rá, hogy az alakzatoknak nemcsak a nyelvben, hanem a társadalomban és a természetben is kiemelt szerepe lehet. Gangl Andrea (2010) diskurzuselemzési módszereket kapcsol össze hálózatos megközelítésekkel. Ennek során bemutatja, hogyan lehet diskurzusok elemzésével szociális hálózatokat feltérképezni. Nagy Levente (2010) az igazságügyi nyelvészeti profilalkotásban tartja használhatónak a hálózatos megközelítéseket. Imrényi András (2012) a mondatot értel-
96
Hálózatkutatás és nyelvészet
mezi multiplex hálózatként, Balázs Géza (2012) pedig a szövegek hálózatos jellemzőit emeli ki publikációjában.
4.4 Összegzés A fejezet összefoglalta a nyelvi hálózatok hálózatelméleti szempontú megközelítésének irodalmát. Az áttekintés nem lehet teljes körű, mivel – mint említettük – ezen publikációk részben nem nyelvészeti periodikákban, hanem más tudományterületeken jelennek meg. A publikációk egy részében közös, hogy a nyelvet (sokszor a végtelenségig) leegyszerűsítve tárgyalják és modellezik. A megközelítések sokszor a nyelvészek számára nem követhetőek, valamint nem mindig egyértelmű, hogy egy-egy megalkotott modell miért lehet fontos a nyelv pontosabb megismerése szempontjából. A publikációk másik része ezzel szemben megalapozott nyelvészeti ismeretekről árulkodik és (az új megközelítési módnak köszönhetően) új ismeretekkel is szolgál(hat) a nyelvről. Korábban megmutattuk, hogy nyelvi jelenségek hálózatokkal történő vizsgálata, hálózatok feltételezése a nyelvben nemcsak a 20. század végének kutatási területe. A megközelítés viszont megváltozott (megváltozhat) a hálózatkutatás hatására. Korábban a hálózatalapú megközelítés volt jellemző, vagyis adott nyelvi jelenséget valamilyen hálózattal magyaráztak (pl. szemantikai hálózat, aktivációs hálózat). Ezeket a hálózatokat egymástól függetlenül vizsgálták, az adott kutatásnak legmegfelelőbb szempontból és módszerrel. Az egyes hálózatokat csak egyszerűsítve jellemezték, terminológiai szempontból pedig a nyelvhasználat nem volt egységes. Az új megközelítés a hálózatokból, az általános hálózatelméleti kutatásokból indul ki, és az általános jellemzők alapján próbálja a nyelvi hálózatokat feltérképezni. A hálózatkutatás biztosít(hat)ja a közös terminológiát, a más tudományterületeken már bevált módszereket, a jelenségek matematikai modellezhetőségét. A kutatásoknak nyelvészeti szempontból az alábbi átfogó céljai lehetnek: – az általános hálózatkutatási eredmények alapján a nyelvi hálózatok feltérképezése; – más hálózatokkal közös tulajdonságok alapján a nyelv és a nyelvhasználat számos területének az eddigieknél pontosabb leírása, modellezése és megértése; – a nyelvi hálózatok egyedi, általános hálózatelmélettel nem magyarázható jelenségeinek megismerése; – a nyelvi hálózatok egyedi tulajdonságainak általánosítása, ezáltal az általános hálózatkutatási módszerek fejlesztése.
Hálózatkutatás és nyelvészet
97
A nyelven belüli hálózatok kutatásának további célja irányított és súlyozott kapcsolatok vizsgálata az eddigi egyenrangú és nem irányított kapcsolatok helyett (Ke 2007). A kapcsolatok ilyen komplex (súlyozott, irányított) vizsgálata a mentális lexikonban az Agykapocs-rendszer segítségével megvalósul (lásd 5. fejezet). Hálózatok a jelenlegi kutatások szerint tehát valószínűleg több területen találhatók a nyelvben, illetve a nyelvvel összefüggésben (Kovács 2010a). 1. Nyelvtani hálózatok: összefüggő szövegekben (mondatokban) mutathatók ki és elemezhetők. A kapcsolatok az egymást követő szavak illetve mondatok között jönnek létre. Az így létrejövő hálózatok skálafüggetlen tulajdonságokat mutatnak. 2. Szemantikai hálózatok: elsősorban a mentális lexikonban találhatók és többek között asszociációs tesztekkel vizsgálhatók. Szemantikai hálózatot alkothatnak még szótárak, illetve szövegek kulcsszavai. A szemantikai hálózatok szintén skálafüggetlen tulajdonságokat, valamint kisvilág-karaktert mutatnak. 3. A beszélők között létrejövő hálózatok: a hálózaton keresztül a nyelv, a különböző nyelvi formák, divatok terjedhetnek. A hálózatok ezen fajtájának elemzése elsősorban szociológiai kutatások tárgya. A társadalmi hálózatok skálafüggetlenek és kisvilág-karaktert mutatnak. A nyelvi hálózatok ezen irányú kutatása nem magáról a nyelv felépítéséről, hanem a nyelv változásáról, a nyelvterjedésről és a nyelvhalálról, illetve az újítások átvételének sebességéről nyújthat információt (vö. Kovács 2011a). A kutatások esetében viszont nem elég csak az emberek kapcsolataiból kialakuló hálózatot vizsgálni, ugyanúgy vizsgálni kell a médiumok, a (nyelv)politika, a szabályozások stb. szerepét és helyét ilyen hálózatokban, ahhoz, hogy fent említett jelenségekről teljes(ebb) képet kapjunk. 4. Az agyban kimutatható neurális hálózatok: a neurális hálózatok felépítése kisvilág-karaktert és skálafüggetlen hálózatok tulajdonságait mutatja. Amennyiben feltételezhető, hogy az agy által tárolt információk az agy struktúrájához hasonló módon rendszereződnek, vagyis hogy az információ tárolási struktúrája mintegy leképezi az agy felépítését, akkor a neurolingvisztika hálózatkutatási eredményei fontos betekintést engedhetnek a mentális lexikon felépítésébe is. A következő fejezet a szóasszociációs adatok gyűjtésére és részben automatikus feldolgozására kifejlesztett, továbbá a mentális lexikon hálózatos jellemzőinek kimutatására is alkalmas Agykapocs-rendszert mutatja be.
98
Hálózatkutatás és nyelvészet
5. AZ AGYKAPOCS-KUTATÁS Az Agykapocs-rendszert szóasszociációs adatok gyűjtésére, valamint a mentális lexikon hálózatos szerveződésének vizsgálatára alkottuk meg 2008-ban (Kovács 2008b). Az elsődleges cél a szóasszociációs adatok gyűjtésének és feldolgozásának megkönnyítése volt, a mentális lexikon hálózatos vizsgálata a projekt első fázisában nem volt kiemelt fontosságú. A második fázisban megkezdődött olyan modulok tervezése, amelyek a mentális lexikon hálózatainak kimutatásában is szerepet játszhatnak. A projekt megalkotása, az elektronikus adatgyűjtés megtervezése azért volt szükséges, mivel hagyományos módon gyűjtött szóasszociációs adatok esetében azok komplex feldolgozása és elemzése lényegesen több időt és/vagy pénzt igényel. Emellett a különböző diszciplínák hálózatokkal kapcsolatos kutatásai (pl. Barabási 2003, Csermely 2005, Strogatz 2003) egyértelműen rámutatnak, hogy hálózatos jelenségek (pl. kisvilág jelenség) csak nagy menynyiségű adat segítségével mutathatók ki. A nagy mennyiségű adat feldolgozása számítógépek felhasználásával felgyorsítható, noha az adatok gyűjtése nyelvészeti kutatások esetében többnyire ma is hagyományos úton történik. Az Agykapocsrendszer leírása részben már megjelent tanulmányként (Kovács 2008b). Jelen fejezet a tanulmány átdolgozott, bővített, aktualizált változatát tartalmazza. Az Agykapocs-rendszer leírása részben egy szoftver leírása, ezért több helyen informatikai szakkifejezéseket is tartalmaz (MySQL, UTF, RDF), a fejezet azonban (reményeink szerint) informatikai háttértudás nélkül is érthető. Az Agykapocs-rendszer internet-felhasználóktól gyűjt szóasszociációs adatokat, ezért fontosnak tartjuk, röviden bemutasni, hogy internet-felhasználók milyen módon vonhatók be kutatási feladatokba.
5.1 Internet-felhasználók segítségével végzett kutatások A 20-21. század fordulóján az internet, a World Wide Web, majd később a web 2.0 lehetőségeit és trendjeit kihasználva laikusokat vonhatunk be különböző tudományos, illetve profitorientált kutatásokba. Az internet-felhasználók „tudását” igénylő kutatások négy irányvonalát különíthetjük el.
100
Az Agykapocs-kutatás
1. Hagyományos kutatási feladatok interneten keresztül megbízásként történő kiadása szakembereknek (InnoCentive). A gazdasági versenyszférában területükön vezető szerepet betöltő (főként kozmetikai, illetve gyógyszeripari, genetikai kutatásokkal foglalkozó) cégek ma versenyképességük megőrzéséhez a hagyományos kutatás mellett felhasználják az internet-felhasználók tudását is: aktuális K+F(+I) projektjüket, megoldásra váró problémáikat az internet segítségével (akár erre szakosodott portálokon, pl. InnoCentive) közzéteszik. A kutatásban/probléma megoldásában bárki részt vehet, sikeres együttműködés esetén a cég előre meghatározott összeget fizet. Az ilyen jellegű, az utóbbi 5-10 évben elterjedt megoldások a megbízást adó cég számára előnyösek, ugyanis nemcsak saját alkalmazásban lévő kutatóik dolgoznak (rendkívül magas bér- és költségvonzattal) egy adott problémán, hanem a világ bármely részén élő (akár „amatőr”, pl. még egyetemi hallgató) kutatók potenciális megoldásai is a cég rendelkezésére állnak. A most kialakulóban lévő megoldások hosszú távon a K+F minden területét megváltoztathatják (vö. Szabó– Hámori 2006, Tapscott–Williams 2007). 2. Internet-felhasználók szabad gépidejének ingyenes felhasználása kutatási célokra (Seti@Home). A kifejezetten kutatási céllal kifejlesztett számítógépes programok egyik fajtája a felhasználók szabad gépidejét (a számítógép be van kapcsolva, de senki nem dolgozik rajta) használja fel sikeresen. A kutatásba bekapcsolódott felhasználó otthoni számítógépére egy programot letöltve, majd azt képernyőkímélőként „futtatva” a számítógép nagy mennyiségű adatot képes feldolgozni anélkül, hogy a felhasználónak bármilyen tennivalója lenne az adatokkal. Amint a feldolgozás megtörtént, a felhasználó elküldi a már feldolgozott adatokat és új „nyers” adatcsomagot tölthet le – az egész folyamathoz csak minimális informatikai ismeretekre (program telepítése, illetve feldolgozott adatok elküldése/nyers adatok fogadása egy-egy kattintással) van szükség. A kutatók által írt (megrendelt) program biztosítja, hogy az adatok pontosan az elvárt formában, mélységben kerüljenek elemzésre. Ilyenek pl. a Berkeley egyetem által üzemeltetett Seti@Home és BOINC programok. A projektek nagyságrendjére jellemző, hogy a BOINC kb. 260 ezer önkéntes „kutatót” és közel 360 ezer számítógépet „foglalkoztat” (2013. január).
Az Agykapocs-kutatás
101
3. Nem szakember internet-felhasználók aktív (ingyenes) közreműködését megkövetelő egyszerű, de idő- és munkaigényes kutatási feladatok közzététele (GalaxyZoo). Az internet-felhasználók segítségét ilyen módon veszi igénybe a NASA Stardust@home kutatása, valamint a GalaxyZoo és az eBird projekt. Ezen esetekben nem automatikus, a számítógép által elvégzendő feladatokról van szó; ellenkezőleg, a kutatók az internet-felhasználók aktív közreműködését kérik. Az angol nyelvben az ilyen jellegű projektekre megalkották a „citizen science” (önkéntes laikusok bevonása kutatásokba), valamint az outsourcing (kihelyezés/kiszervezés) mintájára a „crowdsourcing” (tömegek bevonása) fogalmakat. A több egyén bevonásával („groupthink”) véghezvitt projektek a legtöbb esetben eredményesek, legyen szó lexikonok megalkotásáról (Wikipedia) vagy választási eredmények előrejelzéséről (Iowa Electronic Market) (Sunstein 2006). A projektek többségében a részvételhez semmilyen szakmai előképzettségre nincs szükség, a bekapcsolódó laikusoknak valamely egyszerű, inkább idő-, mint szaktudásigényes feladatot kell elvégezniük. A GalaxyZoo projekt esetében brit és egyesült államokbeli egyetemek kutatói a Sloan Digital Sky Survey rádióteleszkóppal távoli galaxisokról készített képek osztályozását tűzték ki célul (Lintott et al. 2008). A feladat laikusok számára is érthető: el kell dönteni, hogy egy galaxis gömb- vagy spirálgalaxis. Rövid tréning után (a weboldalak mindenki számára érthetően elmagyarázzák az elvégzendő feladatot, közben interaktív módon tesztelik is a leendő projektrésztvevőt) az önkéntes résztvevő elkezdheti a galaxisok osztályozását a megadott szempontok szerint. A feladatot bárki el tudja végezni, ugyanakkor a feladat nem gépesíthető – vagyis célszerű a nem szakértő önkéntesek bevonása. A kutatók által kitűzött cél (minden galaxist legalább 20 alkalommal osztályozzanak, így biztosítva a viszonylag megbízható eredményeket) hetek alatt (!) teljesült, ezért megszületett GalaxyZoo 2 projekt, ahol galaxisokkal kapcsolatban kértek további osztályozásokat – például spirálgalaxisok karjainak számát kellett megadni. A laikusoktól kapott eredmények (galaxis-besorolások) megegyeznek a szakértő csillagászok által végzett besorolásokkal (Lintott et al. 2008, Land et al. 2008, Bamford et al. 2008), viszont ezzel a módszerrel nagyságrendekkel több besorolás végezhető el, lényegesen rövidebb idő alatt (vö. Raddick et al. 2010). A projekt első részében közel 1 millió galaxist osztályozott 100.000 önkéntes. A kapott adatok (osztályozások) száma kb. 40 millió volt 2008-ban (Lintott et al. 2008). Külön érdekesség, hogy a laikusok által azonosítani nem tudott objektumok egy részéről kiderült, hogy ismeretlen fajtájú galaxis (Cardamone et al. 2009). A projekt megbízhatóságáról, az önkéntesek bevonásáról a kutatásba Raddick et al. (2010) ad összefoglaló tájékoztatót.
102
Az Agykapocs-kutatás
4. Internet-felhasználókat kísérleti alanyként, adatok forrásaként (kérdőívek kitöltése, tesztek elvégzése interneten) felhasználó kutatások. Egyre gyakoribb, hogy kutatók is az internet-felhasználók segítségét veszik igénybe kutatási projektjükhöz. Több tudományos – főleg szociológiai, illetve pszichológiai jellegű (vö. Kraut et al. 2004) – kutatás, illetve piacorientált marketingkutatás használ fel interneten keresztül kitöltött kérdőíveket, on-line felméréseket (vö. Bryman–Bell 2007). Az ilyen jellegű felmérések előnye, hogy a kutatók nagy mennyiségű adathoz jutnak viszonylag kis anyagi (és idő-) ráfordítással, illetve olyan mennyiségű adatot képesek összegyűjteni, amely hagyományos úton nem lehetséges (Schmidt 2005). Internet-felhasználókkal végzett pszichológiai kutatások esetében Reips (2000, 2002) alapján előny: – a populáció teljessége elérhető (elvileg), nemcsak egy kisebb csoport (pl. egyetemi hallgatók); – időben nem korlátozott (munkanap stb.); – a fizikai környezet kevésbé befolyásol (a kísérlet alanya otthon van); – valószínűsíthetően kevesebb hibás adat: önkéntes részvétel, saját motiváció; – olcsóbb (nincs laboratóriumi költség). Hátrányk: – ellenőrzés hiánya (nem követhető, hogy mennyire valós adatokat ad meg a résztvevő); – technikai problémák; – a résztvevők és a kísérlet vezetője közt nincs interakció; – nehezen összehasonlítható más módon gyűjtött eredményekkel (labor kísérletekkel nem mindig célszerű); – korlátok (nem minden oldható meg számítógépes környezettel). Az internet mint adatok forrása, illetve mint adatgyűjtésben felhasznált eszköz nemcsak módszertani, hanem olyan etikai kérdéseket is felvet, amelyeket (az internet illetve a WWW természetéből adódóan) nem lehet jelenleg egyértelműen megválaszolni (Bryman–Bell 2007). A számítógép nyelvészeti kutatásokra számos módon felhasználható (korpuszelemzés; vö. Balaskó 2004, automatikus fordítás stb.), de ezen felhasználásokat itt nem kívánjuk részletezni. Internetről származó adatok is sok formában felhasználhatók nyelvészeti alkalmazásokra. Itt csak a Linguee és a Glosbe szótároldalakat említjük, amelyek az interneten található párhuzamos szövegek segítségével adja meg angol, német stb. szavak lehetséges fordításait (ekvivalensét).
Az Agykapocs-kutatás
103
A nyelvi hálózatok kutatása, hipotézisek felállítása és (legalább részleges) igazolása elképzelhetetlen (viszonylag) nagy mennyiségű adat nélkül. Fenti projektek megfontolásaiból, valamint kutatásaink kitűzött céljából (mentális lexikon hálózatos jelenségeinek megismerése, Kovács 2007, Kovács 2008a) kiindulva jött létre a magyar Agykapocs (11. ábra), illetve angol nyelven a ConnectYourMind projekt.
11. ábra. Az Agykapocs-projekt kezdőlapja
5.2 Az Agykapocs-projekt Az Agykapocs-kutatás célja minél több adatot tartalmazó, többnyelvű szóasszociációs adatbázis kialakítása, amely adatbázisban a szavak hálózatot alkotnak. A szavak a hálózat pontjai, közöttük a kapcsolatot irányított, súlyozott gráfok jelzik a kapcsolat irányának és erősségének megfelelően. A projekt jelenleg az interneten elérhető, az asszociációk megadásában bárki részt vehet. Az adatbázis elektronikus formában kerül tárolásra (MySQL adatbázis). Az asszociációk megadása előtt a felhasználóknak regisztrálni kell a rendszerben. A regisztrálásnál (Részvétel/Regisztráció menüpont) a kutatásban résztvevők felhasználónevet, jelszót, valamint statisztikai adatokat (kor, nem, anyanyelv, nyelvismeret, végzettség szintje, végzettség fajtája) adnak meg, amelyek segítségével később szűkíthetőek a szavakra adott asszociációk (pl. milyen
104
Az Agykapocs-kutatás
választ adtak a gazdaság hívószóra a 25-35 év közötti, gazdasági egyetemet vagy főiskolát végzett nők). Regisztrálás után a felhasználó a megjelenő hívószavakra gépeli be az első eszébe jutó szót, majd az Enter billentyű lenyomása után továbblép a következő szóra. Ha nem jut eszébe semmi, a megfelelő gomb (Nincs ötletem/No idea) megnyomásával lép a következő szóra (12. ábra). A program az egyes szavakra adott válaszok idejét is rögzíti. A programból a résztvevő bármikor kiléphet, illetve bármikor folytathatja az asszociációk megadását. A program sajátossága, hogy a hívószó és a válaszszó lehet szótári szó, toldalékolt szó, tulajdonnév, esetleg szókapcsolat is, vagyis a potenciális hívószavak részben eltérnek a hagyományosan szóasszociációs kutatásokban használt hívószavaktól. (A programban szereplő adatokkal kapcsolatban kizárólag a „szó” megnevezést használjuk, itt utalva rá, hogy a „szó” a rendszerben szócsoportot (vagyis több szót, öszszesen legfeljebb 255 karakter hosszúságig) is takarhat. Több szóból álló választ engedélyez asszociációk során például Kiss (1975) is. Az adatok elemzése során természetesen – az elemzés céljának függvényében – figyelembe vehetjük, hogy adott válasz egy szó vagy több szóból álló szócsoport.)
12. ábra. Az Agykapocs-projekt hívószót adó és válaszszót váró oldala
Az adatok felvételének módszere tehát hasonlít a hagyományos, írásban kitöltött asszociációs tesztekéhez. A program a hívószavakat és a rájuk adott válaszokat egy adatbázisban rögzíti. Egy példával illusztrálva: a kutya hívószóra a kísérleti személy a macska
Az Agykapocs-kutatás
105
válaszszót gépeli be. Amennyiben nem volt kapcsolat a két szó között (tehát senki nem adta meg a hívószóra ezt a válaszszót) létrejön egy 1-es erősségű kapcsolat kutya→macska iránnyal. Ha már létezett a kapcsolat, pl. 5-ös erősséggel (tehát már öt személy adta a kutya szóra a macska választ), akkor a rendszer a meglévő kapcsolat erősségét növeli 1-gyel, vagyis a kapcsolat erőssége 6 lesz. (A rendszer tényleges működése az itt leírtnál bonyolultabb, pl. szavak ellenőrzése, nyelvi besorolás, parkolópálya. A működés részleteit az egyes funkciók alapjául szolgáló módszertani megfontolásokkal együtt a fejezet folyamatosan mutatja be.) A felhasználó tehát szabad asszociációs tesztet végez, ahol olvasott szavakra írásban ad választ. A szóasszociációs tesztek adatfelvételének másik formája – amikor hallott szóra szóban válaszol a kísérletben résztvevő személy – számos technikai nehézséget okoz, vagyis pontosan nagy mennyiségű adat automatikus gyűjtését tenné lehetetlenné. Ebben az esetben ugyanis minden egyes, csak egy kicsit is másképp kiejtett szót a számítógép új szóként értelmezne – ez a probléma gépelt válaszok esetében csak sokkal kisebb mértékben jelentkezik (pl. elgépelések). A szóasszociációs teszt írásbeli formája természetesen ismert (Cramer 1968), ezzel a módszerrel nagyméretű szóasszociációs adatbázisok hozhatók létre (Kiss et al 1973, Kiss 1975, Nelson–McEvoy–Schreiber 1998). A rendszer jelenleg 11 nyelven (angol, francia, holland, lengyel, lett, magyar, német, olasz, orosz, spanyol, szlovák) képes asszociációkat gyűjteni, vagyis ilyen nyelvű hívószavak szerepelnek a rendszerben. Természetesen az adatbázis magyar nyelven tartalmazza jelenleg messze a legtöbb szóasszociációt (lásd később). A programban a megjelenő hívószavak két úton kerülhetnek a rendszerbe. 1. Egyrészt a rendszer tartalmazza minden nyelvre ugyanazt a 100 szavas kezdeti hívószó listát (továbbiakban fix lista, 1. Melléklet). Ezek a hívószavak mindig ugyanabban a sorrendben jelennek meg az egyes felhasználóknak, és ezekre ad először választ a kutatásban részt vevő személy. Ez a kezdeti lista a kísérlet vezetője által bővíthető, változtatható: ebben az esetben a következő regisztráló felhasználónak már ezen új szólista hívószavai jelennek meg. A kezdeti hívószólistát 2008-ban 134 szavasra bővítettük, majd 2012 novemberében egy gazdasági szaknyelvi kutatás céljait szem előtt tartva azt ismét módosítottuk. Az aktuális hívószólistát a 2. Melléklet tartalmazza. 2. Minden egyes válaszszóként megadott asszociáció szintén hívószóvá válhat. Ehhez annyi szükséges, hogy a kísérlet vezetője a szavakat (helyesírás, nyelv) elfogadja, vagyis egy kattintással engedélyezze, hogy adott válaszszó maga is hívószóvá válhasson. Ily módon az adatbázis „automatikusan” bővül további hívószavakkal (ez részben hasonlít Kiss et al. (1973, illetve Kiss 1975) adatgyűjtés-
106
Az Agykapocs-kutatás
éhez, ugyanakkor ők a hívószavak szelektálásának szempontjait és menetét tudomásunk szerint nem publikálták). A kutatásban részt vevők először a fix szólistára (1) válaszolnak. Utána a rendszerben lévő további, már elfogadott szavak (2) jelennek meg hívószóként, véletlenszerű sorrendben. A fix szólista biztosítja, hogy (kutatási céltól függően) bármilyen sorrendben bármely hívószóra adott válaszok vizsgálhatók legyenek (tehát pl. bármely szakterület asszociációi, szemantikai előfeszítés stb.). A fix lista után a véletlenszerűen megjelenő szavak az adatbázist további asszociációkkal bővítik. Válaszként a rendszer (szintén technikai és módszertani megfontolásból) nemcsak egy szót fogad el, hanem több szóból álló szócsoportot, kifejezést, mondatot maximum 255 karakter hosszúságig. A válaszként megadott szó – mint láttuk – vagy szerepel már a rendszerben (pontosan a megadott formában), vagy még nem. Ha szerepel, akkor a hívó- és válaszszó közötti kapcsolat erőssége növekszik 1-gyel (lásd fentebb), ezzel együtt az új kapcsolat minden statisztikai lekérdezés része lesz. Ha a szó új a rendszerben, akkor parkolópályára kerül. A parkolópálya köztes tárolást jelent, tehát a szót a rendszer már rögzítette, de a szó még nem „teljes jogú” tagja az adatbázisnak, vagyis nem válik automatikusan hívószóvá. A parkolópálya funkciója, hogy tárolja a szavakat, amíg a kutatás vezetője (vagy megfelelő jogosultsággal bíró személy) nem ellenőrizte az új szót. Az ellenőrzés azt jelenti, hogy ellenőrizzük a szó helyesírását és nyelvi besorolását. A helytelen helyesírású (elgépelt) szavakat javítjuk (ezzel Moss–Older 1996 példáját követtük), a nyelvi ellenőrzés funkciója pedig, hogy megadjuk milyen nyelvű a válaszszó. Amennyiben a szót ellenőriztük és elfogadtuk, nyelvét megadtuk, a szó része lesz a rendszer adatbázisának, tehát minden statisztikai és egyéb lekérdezésnek, valamint ezzel egyben azt is elfogadjuk, hogy a szó a felhasználók számára hívószó legyen. A parkolópályáról válaszszavak törölhetők is, ha egyértelmű, hogy a válaszadó nem szót adott meg, hanem csak véletlenszerűen gépelt be karaktereket (pl. fffggg válaszszó). A parkolópályán bármeddig tarthatók a válaszszavak: ezek a szavak ugyan a statisztikák és lekérdezések részei lesznek (kivéve a nyelvi besorolással kapcsolatos lekérdezéseket), de nem jelenhetnek meg hívószóként más felhasználóknak. A kísérlet kezdetekor nem terveztük, hogy parkolópályán tartsuk hosszabb ideig a szavakat, azonban ezt a megoldást kellett választanunk, ha válaszszóként trágárságokat, nemiségre utaló kifejezéseket kaptunk – ugyanis nem szerettük volna, ha ezek a szavak hívószóként jelennek meg a felhasználóknak. A program a szavakat, illetve a köztük lévő kapcsolatokat egy (MySQL, relációs) adatbázisban tárolja. Rögzíti tehát az egyes hívó- és válaszszavak közötti
Az Agykapocs-kutatás
107
kapcsolatot, a kapcsolat irányát, valamint rögzíti a kapcsolatok erősségét – tehát ugyanazt teszi, amit asszociációs adatok manuális elemzésénél, a nyers adatok első feldolgozása (válaszok összeszámlálása) során tennénk. A szoftver természetesen megkönnyíti az adatbázisban rögzített adatok lekérdezését is. Az adatbázis lekérdezésének jelenleg a következő lehetőségei vannak (részletesen lásd alább): 1. statisztikai adatok lekérdezése; 2. kapcsolatok lekérdezése: a) adott hívószó kapcsolatainak egyszerű lekérdezése; b) adott hívószó kapcsolatainak részletes lekérdezése, vagyis szűkítve pl. kor, nem (azaz a megadott statisztikai paraméterek közül bármely) szerint; 3. legrövidebb útvonal lekérdezése: a) irányított formában; b) nem irányított formában.
13. ábra. Az Agykapocs adminisztrációs felületén látható statisztikai paraméterek: szavak száma, adatok száma, kapcsolatok száma (2013. február 27.)
108
Az Agykapocs-kutatás
A következőkben az egyes lekérdezéseket mutatjuk be részletesen. 1. Statisztikai paraméterek lekérdezése. Statisztikai paramétereket automatikusan számol a program (13., 14. ábra): – felhasználók száma a rendszerben (nem, kor, képzettség stb. szerinti megoszlásban); – szavak száma a rendszerben (nyelvenként és összesítve); – kapcsolatok száma (alma→körte kapcsolat: egy kapcsolat, a válaszadók számától függetlenül, ha van körte→alma kapcsolat is, akkor két kapcsolat); – adatok száma az egész rendszerben, minden hívó- és válaszszó figyelembevételével (pl. ha a rendszerben csak az alma és körte szavak szerepelnének: alma→körte összesen 15 válasz ilyen irányban – tehát 15 felhasználó nevezte meg az alma hívószóra a körte hívószót, majd külön számolva körte→alma irányban pl. összesen 10 válasz, akkor a két kapcsolatból az adatok száma öszszesen 25); – 100 legerősebb kapcsolat a rendszerben, vagyis az összes adatot nézve mely kapcsolatok a legerősebbek; – 100 legtöbb bejövő kapcsolattal rendelkező szó; – 100 legtöbb kimenő kapcsolattal rendelkező szó.
14. ábra. Az Agykapocs adminisztrációs felületén látható statisztikai adatok: legerősebb kapcsolatok (2013. február 27)
Az Agykapocs-kutatás
109
2. Kapcsolatok lekérdezése. a.) Adott szó kapcsolatai egyszerű lekérdezéssel. Lekérdezhető az egy hívószóra adott válaszok száma (a 15. ábrán: milyen válaszokat adtak az ember hívószóra), valamint egyidejűleg azon szavak, amelyre a hívószó válaszként jelent meg – pl. jelzi, hogy az ember szóra hányszor volt állat a válasz, valamint azt is, ha az állat hívószóra a válaszszó volt az ember (15. ábra). A lekérdezés bal oldalán látjuk a kapcsolatokat a hívószó → válaszszó irányban, mellette zárójelben a válaszok számát: adott hívószó-válaszszó asszociációinak száma/összes asszociáció száma az adott hívószóra. A jobb oldal (válasz szó oszlop) az ellentétes irányú kapcsolatokat mutatja, tehát jelen esetben az állat → ember irányt, szintén számokkal jelezve az asszociáció erősségét. Az ábrán bemutatott adatok esetében tehát az ember hívószóra összesen 495 válasz érkezett, ebből 109 az állat volt; ez a legerősebb kapcsolat, a válaszok 22%-a. A kapcsolat létezik fordított irányban is: az állat hívószóra összesen 473 válasz érkezett, ebből 33 volt az ember (7%). A válasz szó oszlopban az élőlény, férfi, fehér szavak mellett nem szerepel semmilyen adat. Ez mutatja, hogy az élőlény → ember, férfi → ember, fehér → ember párokra ebben az irányban nem volt kapcsolat. A táblázatban szerepel még a no_idea váasz: ez azon esetek száma, amikor a felhasználó nem tudott vagy nem akart választ megadni a hívószóra, és ezért megnyomta a Nincs ötletem gombot (12. ábra). A jobb oldali Szűrő(k) részen lehet a lekérdezést indítani, illetve a lekérdezés jellemzőit beállítani. A melléklet tartalmaz egy teljes példát lekérdezésre: az autó hívószóra adott válaszok olvashatók az 5. Mellékletben. A lekérdezés első része egyszerű válasz-összesítés, amelyet asszociációs kutatások során is megkapunk (vö. Lengyel 2005, 2007a, 2007b, 2008a, 2008b, 2008c, Navracsics 2007, Postman–Keppel 1970), vagyis a lekérdezés a szóból kimenő kapcsolatokat vizsgálja. A lekérdezés másik része (mely szavakra volt válasz az ember szó) lehetővé teszi az kapcsolódások mélyebb kutatását – vagyis a szóba bejövő kapcsolatokat is vizsgáljuk. Eddig kevés olyan adatbázis készült, amely egyszerre mutatja a szóból kimenő, valamint bemenő kapcsolatokat. Kétirányú visszakeresést tesz lehetővé az ugyan nem aktuális adatokat (1970-es évek eleje) tartalmazó, de a részben az Internen is elérhető Edinburgh Associative Thesaurus (EAT), amelyben adott szó esetén mind a bejövő, mind a kimenő kapcsolatok lekérdezhetők (vö. Kiss et al. 1973, Kiss 1975). Keppel és Strand (1970) a Palermo-Jenkins normákat két irányba vizsgálták, egyrészt hívószó-leggyakoribb válasz, másrészt a leggyakoribb válasz-hívószó irányokban, elkülönítve. 200 szavas vizsgálatuk szerint a kapcsolatok 43%-a kétirányú, 57%-a egyirányú. Magyar nyelvre Lengyel Zsolt (2008c) enciklopédiájában kereshetők vissza válasz alapján
110
Az Agykapocs-kutatás
a hívószavak. A bejövő kapcsolatokra példát a 6. Melléklet tartalmaz: mely hívószavakra volt válasz az autó szó.
15. ábra Asszociációk mutatása a rendszerben
b.) Adott szó kapcsolatai részletes lekérdezéssel. A rendszerben adott szó kimenő kapcsolatai különböző, a regisztrációnál megadott statisztikai paraméterek figyelembevételével/szűkítésével is lekérdezhetők, pl. milyen válaszokat adtak nem/korosztály/végzettség szerint. (Például milyen válaszokat adtak az alma hívószóra a 30-35 év közötti, felsőfokú végzettségű nők?) Tudomásunk szerint ilyen mélységig „differenciáló” és ilyen szempontok szerint visszakereshető asszociációs adatbázis eddig nem készült. Természetesen bizonyos korcsoportok esetében részletes adatokkal rendelkezünk (vö. pl. 10-14 évesek asszociációi, Lengyel 2008c). 3. Legrövidebb útvonal lekérdezése. A programban megadható bármely a rendszerben szereplő szó kiindulási pontként, valamint bármely a rendszerben szereplő szó célszóként. A rendszer automatikusan kiszámolja két szó között a legrövidebb útvonalat az asszociációs adatok alapján (pl. autó kiindulás, hajó célszó egy lehetséges útja, 16. ábra). A 16. ábrán látjuk, hogy az autó kiinduló szó és a hajó célszó között van az adatbázis asszociációt követve útvonal. A legrövidebb útvonal, amit a rendszer megtalált: autó→ajtó→dísz→hajó. Ugyanez természetesen bármely hagyományos úton gyűjtött asszociációs adatbázisban is megkereshető, csak sokkal lassabban. Az
Az Agykapocs-kutatás
111
Agykapocs-rendszer viszont az útvonalat másodpercek alatt kalkulálja, vagy jelzi, ha nincs ilyen útvonal. Mindez két formában történik: egyrészt figyelembe véve a kapcsolatok irányát, másrészt a kapcsolatok irányát figyelmen kívül hagyva (vö. Kovács 2009a). Ez a funkció segíthet a szókincs kisvilág szerveződésének igazolásában.
16. ábra. Legrövidebb út mutatása a rendszerben
a.) Az útvonal kimutatása történhet nem irányítottan. Ebben az esetben a rendszer az adatbázisban nem veszi figyelembe a kapcsolatok irányát, vagyis feltételezi, hogy ha egyik irányban van csak kapcsolat, a két pont között akkor is van útvonal. b.) Az útvonal kimutatása történhet irányítottan. Irányított lekérdezés esetén fontos a kapcsolat iránya, tehát csak akkor létezik útvonal, ha adott irányban van útvonal. A 17. ábra grafikusan mutatja a két lekérdezés közötti különbséget. Feltételezzük, hogy A, B stb. szavak, közöttük (asszociációkkal kimutatható) kapcsolat van. A kapcsolat fajtájának (paradigmatikus, szintagmatikus stb.) a példa szempontjából nincs jelentősége. Az asszociációk struktúráját a jobb oldali ábra mutatja: a kapcsolat a hívószóból mutat a válasz irányába. Ahol egyszerre van jelölve mindkét irány, az azt jelenti, hogy a szavak kölcsönösen előhívhatják egymást (macska–kutya). A cél, hogy A és G szavak közötti lehető legrövidebb utat megtaláljuk. a.) Amennyiben nem irányított lekérdezést alkalmazunk – bal oldali ábra –, akkor az útvonal A-B-G lesz, és kimutathatjuk, hogy a két szót két lépés (egy köztes szó) választja el egymástól. b.) A kapcsolatok irányának fontosságát feltételezve végezhetünk irányított lekérdezést – jobb oldali ábra. Ilyenkor csak az az útvonal „járható”, amely a nyíl irányát követi. Így a mentális lexikonban irányított kapcsolatokat feltételezve az útvonal A-B-E-F-G lesz, vagyis négy kapcsolaton (és három köztes szón) keresztül juthatunk csak el A-ból G-be. A két lekérdezéssel igazolható, hogy a mentális lexikon kapcsolatait irányított kapcsolatként kell ábrázolni (lásd 7. fejezet).
112
Az Agykapocs-kutatás G
D
G
D
F
F
E
E
B
B C
A nem irányított
C A irányított
17. ábra. Nem irányított és irányított lekérdezés közötti különbség
Tudomásunk szerint ehhez hasonló, és ilyen méretű magyar nyelvű kutatás (szavak „távolsága” a mentális lexikonban) eddig nem zajlott. A mentális lexikon hasonló (csak az átlagos legrövidebb utat számoló) feltérképezésére angol nyelven Steyvers és Tenenbaum (2005) kutatása ismert (lásd 4. fejezet), a Dél-Floridai Egyetem szóasszociációs adatbázisának (Nelson–McEvoy–Schreiber 1998) segítségével. Esetükben viszont csak az átlagos útvonalhossz számolása történt, az egyes konkrét útvonalakat (érintett szavak) nem vizsgálták (lásd 4. fejezet). Meara (2009) szintén elemzett asszociációs láncokat („juss el asszociációkkal adott szótól egy másik szóig”), az így kapott asszociációk valódiságát (pl. asszociációs normákkal való összevetés) szintén nem vizsgálta. Hasonlóan a már említett Edinburgh Associative Thesaurus (EAT) is tud kapcsolatokat vizsgálni, ugyanakkor ennek pontos menete csak részben került publikálásra (az eredeti szoftverrel kapcsolatban vö. Kiss et al. 1973, Kiss 1975). Kipróbálható ugyanakkor az EAT adataiból készített, letölthető szoftver (Liang 2010), amely bármely két, az EAT adatbázisban szereplő szó között akár a kimenő, akár a bemenő kapcsolatokat végigkövetve képes a két szó közötti útvonalat vizsgálni és az eredményt (érintett szavakat) megjeleníteni. (Az említett kutatásokat részletesebben lásd a 5.4 alfejezetben.) Az Agykapocs-projekt 2008 áprilisában indult a nyelvenként összesen 100 szóból álló fix szólistával (1. Melléklet). Tesztelés, javítások után a felhasználók, a szavak és a kapcsolatok száma a projekt első fázisában lassan növekedett (részletesen Kovács 2008b); a jelenlegi felhasználói számokat a 3. táblázat mutatja.
Az Agykapocs-kutatás
Regisztrált felhasználók (fő) 0-10 éves 10-14 éves 15-18 éves 19-24 éves 25-35 éves 36-50 éves 51-65 éves 66 év felett Férfi Nő Felsőfokú végzettségű Középfokú végzettségű Alapfokú végzettségű
2010. március 673 2 23 80 282 174 72 34 6 249 424 245 330 98
113 2013. február 1029 2 23 111 525 230 92 40 6 388 641 343 586 100
3. táblázat. A felhasználók megoszlása az Agykapocs-rendszerben (2013. február)
Az adatok megoszlását az Agykapocs-rendszerben a 4. táblázat mutatja: Összes szó nyelvenként nyelv
magyar
Összes adat (asszociáció) nyelvenként
szavak száma (db)
21090
Összes kapcsolat nyelvenként
nyelv
asszociációk száma (db)
nyelv
kapcsolatok száma (db)
magyar
158290
magyar
75645
angol
1092
angol
1472
angol
1340
német
655
német
916
német
775
lett
199
lengyel
161
lengyel
161
olasz
121
lett
145
lett
145
francia
109
olasz
114
olasz
111
spanyol
102
orosz
95
orosz
95
orosz
99
spanyol
45
spanyol
45
holland
99
francia
11
francia
11
lengyel
99
szlovák
3
szlovák
3
97
Összesen
szlovák Összesen
161252
Összesen
78331
23762
4. táblázat. Az adatok megoszlása az Agykapocs-rendszerben (2013. március)
A projekt jelenlegi fázisában magyar nyelvre tehát 21.090 szóalak (toldalékolt alakokat is beleszámítva), összesen 158.290 szópéldány szerepel az adatbá-
114
Az Agykapocs-kutatás
zisban. Az adatok mennyisége nagyságrendileg Lengyel Zsolt asszociációs normáihoz hasonlítható, aki 10-14 évesek esetében több, összesen 212.655 szópéldányt, viszont kevesebb, 10.086 szótípust kapott (Lengyel 2008c: 27). A kapcsolatok száma adott nyelvnél mindig az adott nyelvű hívószóból kiinduló kapcsolatot jelöli; tehát ha a hívószó vám (magyar) a válaszszó Zoll (német), akkor a kapcsolat magyarként kerül rögzítésre. A projekt vége, illetve nagysága nyitott, az adatok (számítógépes, illetve anyagi erőforrások függvényében) szinte bármilyen számú felhasználótól, bármilyen nyelven gyűjthetők. A leírtak tehát egy későbbi, sokkal nagyobb adatbázis megvalósításának és egy szélesebb körű (reményeink szerint nemzetközi) kutatásnak az első lépései. A 2013. február végi statisztikai adatok egy része (a legerősebb kapcsolatok a rendszerben, illetve a legtöbb bejövő kapcsolattal rendelkező szavak) a 3. és a 4. Mellékletben olvashatóak.
5.3 A projekt során felmerülő problémák, kérdések A projekt tervezése, a megvalósítás, illetve részben a projekt futása során számos technikai, illetve módszertani kérdés merült fel. A következő oldalakon ezen kérdések közül részletezzük a fontosabbakat.
5.3.1 Közösségi asszociáció Jelen projekt nem egy személy mentális lexikonjának feltérképezését tűzte ki célul, hanem a kutatásban részt vevő személyek hívószavakra adott asszociációiból próbál általános következtetéseket levonni a mentális lexikon felépítésére vonatkozóan (vö. Moss–Older 1996). Ez megfelel az asszociációs vizsgálatok során követett gyakorlatnak (pl. asszociációs normák Lengyel 2008c).
5.3.2 Megbízhatóság A kutatás során gyűjtött adatok megbízhatósága döntő fontosságú. Az adatok gyűjtésével kapcsolatban a megbízhatósági kérdések egy része magából a szóasszociációs vizsgálatból mint módszerből származik. A szóasszociációs vizsgálatot mint módszert mentális lexikon kutatásoknál elfogadottnak tekintjük, a módszert a 2. fejezetben részletesen ismertettük.
Az Agykapocs-kutatás
115
Kérdéses, hogy milyen mértékben változtatja meg az eredményeket az a tény, hogy a válaszadás olvasott szavakra történik és a válaszokat számítógép előtt, írásban adják az alanyok. Időkorlát beiktatása a válaszoknál megoldható lett volna, ebben az esetben viszont az adatok egy része elveszett volna, mert például lassú az internet-kapcsolat; lassabban gépel a felhasználó; rövidebb/hosszabb szavak gépelése más időt igényel. Ezért megoldásként a válaszoknál az idő rögzítését választottuk, így részletes lekérdezésnél – amennyiben szükséges – csak azokat az adatokat jelenítjük meg, amelyek adott időn – pl. 5 másodpercen – belül érkeztek. 100 szóval, 10 fővel papír alapon végzett kontrollvizsgálat során a projekt tesztelési fázisában eredményként nagyságrendileg hasonló válaszokat kaptunk, mint a gép előtt végzett tesztekkel. A nagyságrendileg hasonló válaszok azt jelentik, hogy amennyiben adott szóra gyakori volt egy adott válasz írásban (alma→körte jelen esetben 18,9%), körülbelül hasonló nagyságrendben érkezett ugyanaz a válasz a kontrollvizsgálat során szóban is (alma→körte, 20%). Hangsúlyoznunk kell, hogy egyértelműen nem igazolható (tudomásunk szerint nem igazolták) sem eltérés, sem teljes azonosság szóban, írásban, illetve számítógép előtt végrehajtott asszociációs teszteknél. Ennek oka egyrészt, hogy az asszociációs válaszokat az egyén legutóbbi tapasztalatai is befolyásolhatják (tehát a hívószóra adott válaszszó ugyanazon személynél más és más lehet, amennyiben többször vizsgáljuk). Másrészt, a szóban adott válaszok esetében sem tudjuk igazolni, hogy a kísérleti alany az első eszébe jutó választ adta. Jelen kutatásban hangsúlyozzuk, hogy olvasott szóra írásban kértünk választ, ugyanakkor a kontrollkísérlet alapján, fent említett okokból, valamint feltételezésünket megcáfoló kutatások hiányában feltételezzük, hogy az eredmények hasonlóan elemezhetők, mint a hallott szóra szóban adott válaszok (vö. Cramer 1968). Problémát jelenthet, hogy az asszociációs tesztet számítógép előtt töltik ki a kísérleti alanyok. Kérdéses, mennyire befolyásolja a nyelvhasználó személyiségét az internetes kommunikáció. Szintén kérdéses, hogy a számítógép előtt ülve, a teszt kitöltése közben milyen más tevékenységet végez a teszt kitöltője: más programot is használ (pl. MSN), rádiót hallgat, tv-t néz stb. Mindezek befolyásolhatják a válaszadást, ugyanakkor a válaszadás közben végzett egyéb tevékenységek nem ismertek, illetve nem mérhetők. (Köszönjük Gangl Andreának, hogy erre az öszszefüggésre felhívta figyelmünket.) Az internet-felhasználók nyelvhasználatát általánosságban Balázs Géza (2005) és Bódi Zoltán (2004, 2005), a chat nyelvezetét Balaskó Mária (2005) elemezte. Domonkosi Ágnes (2005: 156) az internet nyelvhasználatának empirikus megismerésére három lehetőséget lát: „1. a nyelvhasználót, a nyelvhasználat forrását problematizáló kérdőívezés; 2. a nyelvhasználatot mint produkciót, dina-
116
Az Agykapocs-kutatás
mikát vizsgáló megfigyelés, 3. illetve a nyelvhasználatot mint produktumot vizsgáló nyelvi elemzés”. Ezek közül a harmadik kérdés releváns kutatásunk szempontjából. Feltételezzük, hogy a módszer (interneten gyűjtött adatok) a szóasszociációs kutatás minőségét nem befolyásolja, mivel a kapott adatok eloszlása csak minimális eltéréseket mutat a hagyományos asszociációs tesztek eredményeivel szemben. Ugyanakkor asszociációs kutatásoknál az elektronikus kitöltés papír alapútól eltérő hatása további vizsgálatok tárgya kell, hogy legyen. A jelenleg létrejövő adatbázis az ilyen jellegű kutatásoknak is forrása lehet. A szólistába bekerült, a papír alapútól eltérő nyelvhasználatra utaló, további kutatások szükségességét prognosztizáló asszociációs példák: Hívószó PIN-kód mosoly nevetés freemail kukac csapatszellem e-mail kiakasztó e-mail
Válaszszó → → → → → → → → →
**** :) :-D :) @ @@ .hu @freemail.hu; @citromail.hu ez a kérdőív:) kukac
Módszertani szempontból – mivel tudomásunk szerint hasonló jellegű internetes nyelvészeti kutatás még nem zajlott – teljesen új területet térképezünk fel. Segítséget nyújthat az adatok megbízhatóságának megállapításában, hogy a korábban említett internetes kutatások esetében a kutatók az internet-felhasználóktól kapott adatokat megbízhatónak tekintik (Lintott et al. 2008, Land et al. 2008, Bamford et al. 2008). Telefonos kérdőívek és web alapú kérdőívek összevetésének eredményeként kimutatatták, hogy a web alapú felmérésekkel kapott adatok megbízhatóbbak, a felmérések olcsóbbak (telefonos felmérések költségének 1030%-a) és gyorsabbak (Roster et al. 2004, Braunsberger–Wybenga–Gates 2007). Hagyományos és web alapú pszichológiai kutatások eredményeinek összevetése esetében az eredmények nem mondanak ellent egymásnak, a web alapú eredmények és a laboratóriumi eredmények között nincs szignifikáns eltérés (Krantz– Dalal 2000). A részvétel a kutatásban önkéntes, így valószínűsíthető, hogy egy résztvevőnek sem célja az adatok meghamisítása (illetve nem nagyobb mértékben kell a
Az Agykapocs-kutatás
117
problémával számolnunk, mint a hasonló jellegű hagyományos (pl. kérdőíves) felmérések esetében) (Reips 2000, 2002). Az adatfelvétellel kapcsolatban felmerülhetnek hasonló jellegű módszertani kérdések, mint Labov „r” kiejtési kísérletével kapcsolatban (vö. Schlobinski 1996, Wardhaugh 2002), ezért megpróbáltuk a módszertani hibák lehetőségét minimálisra csökkenteni. Mivel új módszerről van szó, illetve a kísérletben résztvevőkkel nincs személyes kapcsolatunk, nem zárható ki, hogy az asszociációk egyes esetekben „hibásak” lehetnek (vagyis pl. nem az első válaszszót adták meg a résztvevők). Ezek kiszűrése azonban hagyományos adatfelvételi módszerek használata esetén sem megoldható. Kent és Rosanoff (1910) szintén felhívják rá a figyelmet arra, hogy a kimondott válaszszó nem szükségszerűen „igaz”, illetve arra, hogy a kimondott szó nem a legelső (mentálisan) asszociált válaszszó – ugyanakkor az eredményeket mindettől függetlenül elemezhetőnek tekintik. Sutherland (1913) azon eseteket elemzi, amikor a hívószóra nem érkezett válasz. Véleménye szerint a „nincs válasz” esetek számos okra, például a szó több jelentésére, a hívószó félreértésére, a szó nem-ismeretére vezethetők vissza. Lengyel Zsolt (2007b) a „nincs válasz” kategóriát vizsgálva megállapítja, hogy főnevek és melléknevek könnyebben aktiválnak válaszszavakat, míg igéknél gyakoribb eset, hogy a hívószóra nem érkezik válasz. A „nincs válasz” kategóra a hívószó konkrétságával, illetve elvontságával is összefügg: minél elvontabb adott hívószó, annál valószínűbb, hogy nem érkezik rá asszociáció (Lengyel 2007b). Asszociációs tesztek esetében – az asszociáció, mint vizsgálati módszer jellemezői alapján – nem megoldás a kérdések megismétlése, vagy a bevitt asszociációk utólagos javításának felkínálása (vö. Nosek–Banaji–Greenwald 2002), ezáltal a hibás asszociációs válaszok ilyen formában történő kiszűrése. Szintén nem kiszűrhető a Gósy Mária és Kovács Magdolna (2001) által zsákutcának nevezett jelenség, vagyis amikor egy válaszadó folymatos asszociációs feladatban esetlegesen nem asszociál, hanem véletlenszerűen nevez meg dolgokat, például azon szoba tárgyait sorolva fel, ahol az adatfelvétel zajlik. Jelen esetben ezen jelenséggel nagy valószínűséggel nem kell számolnunk, mivel nem folyamatos asszociáció zajlott. Fontos azonban megjegyeznünk, hogy ezek az esetleges „hamis” adatok a kutatás eredményeit szignifikánsan nem befolyásolják. Amennyiben egy szóra 200 válasz érkezett, az esetleges néhány „hamis” válasz nem változtatja meg szignifikánsan az eredményeket. További kutatást igényel, hogy hibásnak lehet-e tekinteni bármilyen asszociációt válaszként (vö. Umamoto 1998) – természetesen eltekintve az olyan egyértelmű esetektől, ahol minden hívószóra következetesen például xxx vagy kutya a válasz.
118
Az Agykapocs-kutatás
Az esetleges hamis válaszokat figyelembe véve a „legrövidebb út” számolása esetében automatikusan a legtöbb kapcsolatú utat keresi a program. Vagyis amennyiben alma→pite→étel→etet→macska út létezik, 1-1-1-1 erősségű kapcsolatokkal, és létezik az alma→gyümölcs→növény→állat→macska azonos hosszúságú útvonal, 3-5-5-3 erősségű kapcsolatokkal, a rendszer utóbbit fogja megjeleníteni. Így az esetleg a rendszerbe hibásan bekerült adatok nem (illetve kisebb mértékben) befolyásolják az eredményeket.
5.3.3 Szavak ellenőrzése A felhasználó által a hívószóra adott válasz gépelt formában, nagy- és kisbetűket, szóközöket, írásjeleket figyelembe véve kerül rögzítésre. A szavakat a végleges rendszerbe kerülés előtt (ahogy feljebb jeleztük) manuálisan ellenőrizni kell. – Amennyiben a válaszszó adott formában szerepel már az adatbázisban, a kapcsolatok hozzáadása a hívó- és válaszszóhoz automatikusan történik. – Új szó akkor kerülhet be az adatbázisba, ha (adminisztrátori jogosultsággal bíró) kutató manuálisan ellenőrizte a szót, valamint rögzítette, hogy a szó milyen nyelvű. A szó ellenőrzés előtt az egyszerű és részletes lekérdezésben már szerepel, de még nem kerül felvételre a szólistába, vagyis a szó nem jelenhet meg hívószóként más felhasználóknak (lásd parkolópálya). Amennyiben a szó helyes, az ellenőrző személy a szót egyszerűen elfogadja, így a szó bekerül az adatbázisba. Ettől az időponttól a szó (és a létrejött kapcsolat) szerepel minden statisztikában, egyszerű és részletes lekérdezésben, legrövidebb útvonal keresésében, továbbá az elfogadott szó része a szólistának is, vagyis a felhasználóknak megjelenhet hívószóként. A szó ellenőrzésénél javításra, törlésre az alábbi esetekben kerülhet sor: – hibásan írt (elgépelt) szó, amennyiben az elírás egyértelmű (kutya helyett kuyta) (vö. Moss–Older 1996); – helyesírási egységesítés (pl. minden tulajdonnév nagy kezdőbetűvel szerepeljen); – hibás a szóhoz rendelt nyelv (A magyar asztal szóra a német Tisch szó érkezik válaszként. A rendszer alapértelmezésben magyar szóra magyar szót vár, azaz feltételezi, hogy a Tisch szó magyar. Itt az ellenőrzésnél, a nyelv megadásánál a legördülő menüből a magyar helyett kiválasztjuk a „német” besorolást); – egyértelműen hibás válaszok törlése (pl. hívószóra xxxyyy a válasz); – nem eldönthető, hogy a válaszadó milyen választ kívánt megadni: kutya hívószóra akcsa válasz. Ebben az esetben az asszociáció lehet kacsa de macs-
Az Agykapocs-kutatás
119
ka is, ami az elgépelt válaszból nem eldönthető. Ilyenkor (az adat elvesztését tudomásul véve) a válaszszót töröljük. Szóasszociációs adatok kezelésének komplex lehetőségeit és módját (annotáció, válaszszavak kezelése, adatok összevonása, besorolási nehézségek) Lengyel Zsolt (2008c: 20-26, illetve 2012b) részletezi. Lehetőségként szerepel a szó korábban említett parkolópályára állítása, vagyis a szó ellenőrizetlenül marad. Így az a későbbiekben ellenőrizhető, a lekérdezésekben szerepel, ugyanakkor a szó hívószóként nem kerül be a szólistába. A válaszszavak egy részénél (a projekt jelenlegi fázisában) ezt a megoldást alkalmaztuk, gyakorlati megfontolásból: mivel az oldalnak nem célja hogy korhatárhoz kösse a felhasználókat, ugyanakkor válaszként több esetben nemiségre utaló (durva) kifejezések, trágárságok jelentek meg, ezért ezeket a szavakat (jogi és adatvédelmi előírásokat szem előtt tartva) nem tettük be a szólistába, azokat ellenőrizetlenül, parkolópályán hagytuk, ugyanis nem tudjuk garantálni, hogy ezen szavak ne kiskorúaknak jelenjenek meg hívószóként. Az adatbázisban tehát ezek a szavak rögzítésre kerülnek (a statisztikák, lekérdezések részét képezik), de nem jelennek meg hívószóként. Felülbírálásra került továbbá a csak helyesen leírt szavak rögzítése. A kezdeti szakaszban is több esetben találkoztunk olyan adatokkal, melyek következetesen, nagy számban helytelen helyesírással érkeztek. Néhány esetben azonban engedélyeztük, hogy a szó (elvileg) hibásan kerüljön a rendszerbe (EU helyett eu). Helyesírási szempontból ez nem indokolható, ugyanakkor módszertani szempontból igen – a hibásan írt asszociációkból is levonhatók tanulságok. A helyesírással kapcsolatos eredeti elképzelésünket tovább bonyolítja a nyelvhasználati szabályok „fellazulása”: hibásan írt alakok gyakran jelennek meg különböző médiumokban. Több esetben adott szóról nem volt eldönthető, hogy mi a helyes magyar írásmód, mivel a gyakorlatban több alak honosodott meg (menedzser, manager) így mindkét alak a rendszerbe került. Más esetben a magyar helyesírás nem egyértelmű, illetve az elvi helyesírási szabály tudatosan kerül megszegésre: e-mail helyett ímél – mely utóbbi alak nem helyes, ugyanakkor nem tekinthető egyértelműen hibásnak sem (tudatosan alkotott, „kreatív”, fonetikus alak).
5.3.4 Nyelv/kódlap A projekt során probléma a nyelvek betűinek (karaktereinek) számítógépes kezelése. Sajnos jelenleg nincs olyan informatikai megoldás, amely minden esetben problémamentesen kezelné a különböző nyelvek karaktereit. A projektben az
120
Az Agykapocs-kutatás
UTF-8 (Unicode Transformational Format) kódolást választottuk. Az egyes nyelvek kódolása és helyes karakter-megjelenítése így (legallábbis az UTF határain belül) egységes. Nem találtunk megoldást annak a problémának a kezelésére, ha valaki nem adott nyelvű billentyűzetről viszi be a szavakat, és így bizonyos karaktereket más karakterekkel helyettesít (pl. orosz nyelvű szavakat magyar billentyűzetről, latin betűkkel gépel). Ilyen esetekben megoldásként egyelőre csak a megfelelő szavak manuális átírását találtuk. Nyelvi, illetve nyelvi ellenőrzési problémát jelent, hogy a különböző nyelvű válaszszók esetében a szót ellenőrző személy ideális esetben az adott nyelv anyanyelvi beszélője, lehetőleg nyelvész (alkalmazott nyelvész), pszicholingvisztikai ismeretekkel. Jelenleg ez anyagi okokból – mivel a projekt teljes egészében magán-finanszírozású bármilyen intézményi vagy pályázati támogatás nélkül – nem megoldható. Ezért (habár az adatbázisban több nyelv szerepel) három nyelv – magyar, német, angol – prioritást élvez. A kutatás jelenlegi fázisában (előbb említett okból) csak a magyar nyelvű asszociációkat elemezzük (pl. Kovács 2009a). Az adatbázis használhatósága és értéke megsokszorozódik, amennyiben sikerül – a magyar mellett – több nyelven nagy mennyiségű, megbízható adatot összegyűjteni.
5.3.5 A kutatásban résztvevők A kutatás résztvevői önkéntesek, tehát a részvételnél például kor, nem, végzettség nem kizáró ok, a kutatási módszer ezért nem alkalmas kvótás vagy többlépcsős csoportos mintavétel lefolytatására (vö. Freedman–Pisani–Purves 2005). Mivel a kutatás internetet használók szóasszociációit rögzíti, a résztvevők többsége a fiatalok, illetve fiatal felnőttek köréből kerül ki, így az ő szóasszociációik lényegesen nagyobb számban lesznek reprezentálva az adatbázisban (a kérdéssel kapcsolatban vö. Skitka–Sargis 2006). Külön fel kell hívnunk a figyelmet arra, hogy adatokat a módszerrel elsősorban internet-felhasználóktól tudunk gyűjteni. A fiatalok/fiatal felnőttek túlreprezentáltságának kérdését a lekérdezés korosztályonkénti szűkítésének lehetősége részben megoldja. Az adatbázis természetesen „manuális úton”, internetet nem használók adataival is bővíthető. Ez az asszociációs teszt (pl. első 100, fix szavának) írásban, papír alapon való kitöltetésével majd az adatok manuális úton (megfelelő adatokkal felhasználó regisztrálása) történő rendszerbe vitelével történhet. Jelenleg viszont semmilyen módszert nem ismerünk annak biztosítására, hogy az adatbázis – akár csak egy nyelv esetében is – reprezentatív mintaként (minden korosztályból,
Az Agykapocs-kutatás
121
végzettség stb. szerint a népesség eloszlásnak megfelelő arány) szolgáljon – ugyanakkor hangsúlyozzuk, hogy ez nem is célunk. A végzettség esetén természetesen az adatfelvétel nem lehet pontos. Hova sorolja magát egy utolsó éves, hetek múlva diplomázó egyetemista, illetve egy első éves egyetemi hallgató? A végzettségük (papír szerint) azonos, ugyanakkor a (szakmai) mentális lexikon szerveződése szempontjából természetesen a két alany különbözik egymástól. Mivel nem volt lehetőség olyan adatfelvételi módszert tervezni, amely egy, maximum két zárt kérdésre adott válasz alapján kereshetővé teszi ezt az összefüggést is, a végzettség szerint lekérdezett adatok elővigyázatosan kezelendők.
5.3.6 A munka nagysága A létrejövő adatbázis nagysága és bizonyos (előre nem tervezhetett) a projekt nyitottságából eredő sajátosságok néhány esetben az eredeti elképzelések felülbírálását tették szükségessé (vö. parkolópályán tartás). Szemléltetésként egy adat: egy-egy szó ellenőrzése (ha nincs javítás, ha a helyesírás nem ellenőriztük) legalább 20 másodperc (ebből kb. 10 másodperc csak a szükséges kattintások, 10 másodperc amíg a rendszer az adatokat lehívja és elmenti). Ez 21.000 szó esetében, 420.000 másodperc idő, ami kb. 115 óra, tehát három teljes munkahét, napi 8 óra folyamatos „kattintgatással” – ami önmagában is kivitelezhetetlen. Természetesen a szavak egy részénél az elgépelések javítandók, a helyesírást ellenőrizni és javítan kell stb. Habár az adatok ellenőrzésének idejéről statisztika nem készül, de jelenleg legalább egy személy több hónapnyi munkaidejéről beszélhetünk. Ez természetesen csak viszonylagosan hosszú idő: ugyanez a munka manuálisan, csak az adatok felvételét és összesítését számolva is több hónap (vagy évek) munkája lenne. Cser János (1939: 10) 2. fejezetben ismertetett kísérlete kapcsán utal az adatfeldolgozás idejére: az általa felvett adatokat közel egy évig dolgozták fel legalább 16 személy bevonásával.
5.3.7 Toldalékolt hívószavak Az Agykapocs-rendszer jellegzetessége, hogy a válaszszóként (asszociációként) megadott szavak a rendszerbe kerülve (a folyamatot korábban részleteztük) más felhasználóknak hívószóként is megjelenhetnek. Kérdés, hogy a toldalékolt alakok hívószóként történő megjelenése (pl. boltba hívószó) megváltoztatja-e az eredményeket, esetleg hamis képet ad-e a mentális lexikonról, ugyanis várható,
122
Az Agykapocs-kutatás
hogy a toldalékolt szavak szintagmatikus kapcsolatokat hívnak elő, a nem toldalékoltak jellemzően paradigmatikus kapcsolataihoz képest. (Az alapformájú alakokra érkező toldalékolt válaszokat Lengyel Zsolt (2012b) elemzi részletesen.) A toldalékolt és nem toldalékolt alakokra mint hívószavakra adott válaszok közti különbségeket bemutató, empirikus adatokat tartalmazó publikációt a szakirodalomban nem találunk. Az ilyen kutatások hiányának oka lehet, hogy az aszszociációs kutatások gyökerei az angol nyelvterületen keresendők (pl. Kent– Rosanoff teszt), így természetesnek tekinthető, hogy a használt szólisták nem tartalmaztak toldalékolt alakokat. A későbbi kutatások részben a Kent–Rosanoffféle teszt más nyelvre fordításából születtek (vö. pl. Postman–Keppel 1970), illetve nem volt céljuk toldalékolt alakok vizsgálata. A toldalékolt alakok hívószóként való megjelenése számos kérdést vet fel, ugyanakkor a toldalékolt hívószavakra adott válaszok pontosan a mentális lexikon vizsgálatában új dimenzió feltárását teszik lehetővé. Toldalékolt alakokat hívószóként használ az Edinburgh Associative Thesaurus (EAT) is, de a toldalékolt hívószavak problémájára, illetve az ilyen alakokra mint hívószavakra kapott válaszok elemzésére a kutatók nem térnek ki (vö. Kiss et al 1973). A toldalékolt szavak hívószóként való megjelenése az Agykapocs-rendszer működését nem befolyásolja: nem toldalékolt hívószavakra adott válaszok a rendszerben minden esetben függetlenül lekérdezhetők. Amennyiben tehát nem toldalékolt szavakat kívánunk lekérdezni, akkor a bolt szó kapcsolatait kérdezzük le, amennyiben viszont össze kívánjuk vetni a toldalékolt és nem toldalékolt szavakra adott válaszokat, a bolt mellett lekérdezzük a boltba, boltból hívószavakra adott válaszokat is. Így a mentális lexikon szerveződése különböző szempontok szerint vizsgálható. (Megjegyzendő, hogy sokkal kevesebb a toldalékolt alakra, mint hívószóra adott válasz, ugyanis a rendszer kezdeti hívószavai természetesen mind szótári alakúak.) A mentális lexikon ily módon vizsgált szerveződése pontosan nyelvtechnológiai alkalmazások által generált szövegek minőségét javíthatja: a bolt szóra adott leggyakoribb válasz (áruház) „csak” szinonimaként használható szöveg alkotására. Ellenben ha a boltba szóra a menni a leggyakoribb válasz, akkor az így létrejövő kifejezés (boltba menni) egyben illeszthető be egy szövegbe. A toldalékolt szavakra adott válaszok tehát nem csökkentik az adatbázis használhatóságát, ellenkezőleg: bővítik az elemzési lehetőségeket és új vizsgálati szempontokat adnak a kutatók kezébe.
5.3.8 Az adatbázis lezárása, a projekt vége Kérdés, hogy a projekt mondható-e bármely szakaszában lezártnak, illetve célszerű-e lezárni az adatbázist egy adott adatmennyiségnél/időpontban. Amenynyiben a cél egy adott helyzetkép rögzítése (pl. asszociációk 2008-ban), az adatbázis lezárása látszik célszerűnek. (Asszociációs adatbázisok létrehozásakor több-
Az Agykapocs-kutatás
123
nyire a kitűzött cél elérése után a projekt befejezése jellemző.) Ugyanakkor jelen módszer alkalmas az asszociációk „folyamatos” vizsgálatára, vagyis egy folyamatosan bővülő adatbázis megalkotása is lehetséges – így létrejön egy folyamatosan épülő hálózat (accumulative network, vö. Ke–Yao 2008). Problémaként meg kell említenünk, hogy (amennyiben a projekt hosszabb ideig fut), a statisztikai adatok (végzettség, kor) csak részben lesznek igazak: a 2008-ban 14 éves és 2018-ban az akkori 14 éves alany hívószavakra adott válaszai egymás mellett fognak szerepelni, vagyis 2018-ban a projekt nem fogja tudni kimutatni az akkori (2018-as) leggyakoribb asszociációkat, hiszen az adatbázis 2008-tól folyamatosan bővül, vagyis az előző 10 év adatai is szerepelni fognak benne. Ez a probléma megoldható pl. az állapot évenkénti rögzítésével, vagyis az adatbázis részleges lezárásával (és az adatok külön tárolásával). Az adatok ekkor évente elemezhetők, a változások jobban követhetők (staged network, vö. Ke–Yao 2008). Így egyszerre válik lehetővé az asszociációk statikusabb (egy adott időszakban) és dinamikusabb, változó (pl. 10 évig folyamatos) vizsgálata. Az asszociációk ebben az esetben szinkrón és diakrón módon egyaránt vizsgálhatók.
5.4 Az Agykapocs-rendszerhez hasonlítható rendszerek Szükségesnek tartjuk röviden összevetni rendszerünket hasonló, szóasszociációs adatokat elektronikusan kezelő rendszerekkel. Az összehasonlításban megpróbálunk utalni a különbségekre, amennyiben ezek számunkra ismertek. A WordNet lexikális szemantikai adatbázis rövid leírását is szükségesnek tartjuk, mivel pszicholingvisztikai alapokon nyugszik, ugyanakkor részletes elemzésére nem térünk ki, mivel nem szóasszociációs adatokat tartalmaz. Edinburgh Associative Thesaurus Az Edinburgh Associative Thesaurus (EAT) talán az Agykapocsrendszerhez legközelebb álló elektronikus asszociációs adatbázis. Szoftverünk tervezése során az EAT rendszer jellemzőit nem vettük figyelembe: egyrészt, mivel az adatgyűjtés menete nagyban eltér, másrészt mivel az EAT eredeti szoftvereinek működési leírása (a felhasznált algoritmusok) nem volt számunkra hozzáférhető (ha az egyáltalán publikálásra került). 2010-ben elkészült ugyan az EAT adatbázisának internetről letölthető Windows alapú szoftveres változata (Liang 2010), ez viszont csak jóval az Agykapocs-rendszer tervezése és megalkotása (2007 vége, illetve 2008 eleje) után vált elérhetővé. Az EAT adatbázisát Kiss et al. (1973), Kiss (1975) és a Windows alapú szoftver (Liang 2010) alapján jellemezzük.
124
Az Agykapocs-kutatás
Az EAT adatbázisa egy szóasszociációs adatbázis több mint 55.000 angol nyelvű szóval. Az adatbázis építkezése hasonló az Agykapocs-rendszeréhez: egy kiinduló központi szólistából (a publikációkból sem a szavak pontos száma (kb. 1000, Kiss et al. 1973: 161), sem a konkrét szavak nem ismertek) építkezett az adatbázis, a válaszokat is (részben) hívószóként használva fel. A hívószavak listája a projekt végén 8.400 volt. Nem ismeretes, hogy az eredeti hívószavakra kapott válaszokból mely szavak lehettek maguk is hívószavak. „Only a minimal amount of selection of stimuli was applied in each cycle of the data collection. Effectively all responses which were English words or meaningful verbal units were included, including some phrasal forms and numerals. The data cover a wide range of grammatical form classes and inflexional forms” (Kiss et al. 1973: 156). Az elektronikus adatbázis (Liang 2010) adatait lekérdezve kiderül, hogy a hívószavak tulajdonnevek is lehettek: válaszokat kapunk többek között a London, Wilson, Thames, U.S.A., Chicago hívószavakra. Szintén lehet a hívószó (elméletileg) bármely szóalak: a go hívószó mellett hívószó (a teljesség igénye nélkül) a went, a going, a gone és a goes is. A hívószavakra a válaszokat papír alapon gyűjtötték, minden hívószó esetében 100 személytől. A kutatásban résztvevő személyek pontos száma nem ismert, azt tudjuk azonban, hogy koruk 17 és 22 év közötti, 64% férfi, 36% nő. A megkérdezés során figyelembe vették a megkérdezettek földrajzi eloszlását, illetve azt, hogy a válaszadók mely egyetem milyen szakos hallgatói. Az adatok feldolgozása elektronikusan történt: a szavakat lyukkártya segítségével vitték számítógépre, majd akkor használatos gépekre írt programokkal elemezték. A programokat ugyan röviden leírják (vö. Kiss et al. 1973: 158, Kiss 1975), ténylegesen kipróbálni viszont csak a fent említett (Liang 2010) újabb szoftvert lehet, amely be- és kimenő kapcsolatokat mutat, valamint két adott szó között a legrövidebb asszociációs útvonalat jeleníti meg, hívószó → válaszszó, valamint válaszszó → hívószó irányban. Lényeges, hogy Kiss et al. a mentális lexikont gráfként értelmezik, amelyben a kapcsolatoknak iránya hívószó → válaszszó. Fontos továbbá, hogy az eredeti programmal is, ugyanúgy mint a 2010-es szoftverrel a ki- és bemenő kapcsolatok egyaránt megjeleníthetők (ezen lekérdezés webes alapon, az EAT honlapján is megtehető), valamint hogy két tetszőleges, az adatbázisban szereplő szó között az útvonal megjeleníthető. Az adatfelvétel ugyanakkor hagyományosan, papír alapon történt, illetve maga a módszertan (az adatgyűjtés pontos menete, a hívószavak kiválasztása stb.) csak részben ismert. Az Agykapocs-rendszer ezzel szemben adatokat internet-felhasználóktól kvázi-automatikusan gyűjt és dolgoz fel, a módszerek és a szoftver működése is
Az Agykapocs-kutatás
125
ismertek. A ki- és bemenő kapcsolatok, valamint az útvonal mutatása mellett lehetőség van a szóasszociációs adatok pontosabb (nem, kor, végzettség stb. szerinti) lekérdezésére is. További különbség, hogy az Agykapocs adatbázisa nem egy, hanem többnyelvű. The University of South Florida Word Association, Rhyme and Word Fragment Norms Az Egyesült Államok legnagyobb szóasszociációs adatbázisa 5019 hívószóra tartalmaz közel 750.000 választ 6000 alanytól (Nelson–McEvoy– Schreiber 1998). Az adatbázis gyűjtése és az adatok feldolgozása hagyományosan, papír alapon kezdődött az 1970-es években, majd az 1990-es évektől az adatok feldolgozására számítógépet is felhasználtak. Az adatbázis elektronikusan az interneten elérhető (Nelson–McEvoy– Schreiber 1998), nyolc önálló szöveges fájlként tölthető le. Az egyes hívószavakra adott válaszszavak mellett azoknak további (közel húsz) jellemzője is olvasható, így például az összes válasz száma; a kapcsolat erőssége; adott párra a kapcsolat létezik-e fordított irányban is, illetve hogy adott szó mennyire tekinthető konkrétnak. Az adatbázis mai szemmel nem mondható „felhasználóbarátnak”, habár adatok természetesen kikereshetők belőle. A kikeresés (adatlekérdezés) mikéntje azonban nem szabályozható; egy fix (feldolgozott) szólistából keresünk, amelyhez ugyan számos statisztikai és egyéb jellemző adott – viszont sokszor pontosan az adatokhoz tartozó jellemzők nagy száma nehezíti meg a felhasználást. A feldolgozás részben számítógéppel történt és az adatok számítógéppel olvashatók, ennek ellenére az adatfelvétel hagyományosnak tekinthető. Az Agykapocs-adatbázis ezzel szemben kifejezetten felhasználóbarát, az adatok bármikor lekérdezhetők: az eredmények az adatbázis lekérdezésekor generálódnak, a lekérdezés szempontjai szerint. A kapott adatok excel formátumúak, ami mind az olvasást, mind a további felhasználást megkönnyíti. _lognostics szoftverek Szóasszociációs kutatásokra több szoftvert fejlesztett ki Paul Meara. A szoftverek a _lognostics honlapjáról letölthetők, működésüket részben az egyes programoknál olvashatjuk, illetve részben Meara (2009) is bemutatja őket kötetében. Itt az elérhető szoftverek közül a három legrelevánsabbat mutatjuk be röviden. A V_Links szoftverrel a megjelenő angol nyelvű szavak esetén adhatjuk meg, hogy létezik-e kapcsolat a szavak között, és ha igen, akkor a kapcsolat erősebb vagy gyengébb. Továbbfejlesztése a V_Six, amely már webes alapon fut: itt egy ötven kérdéses tesztet végez a felhasználó, ahol minden egyes tesztkérdésnél
126
Az Agykapocs-kutatás
hat szóból kell kiválasztania két szót, amelyek egymással (szerinte) kapcsolatban állnak. A teszt a kapott párokat anyanyelvi beszélők eredményével (szópárjaival) veti össze és pontozza a teszt alanyát. A Lex30 (v. 3.0) program, amely nem anyanyelvi beszélők angol nyelvi szókincsét becsüli meg asszociációk alapján. A program 30 szóra kér asszociációt (legfeljebb 4 darabot), majd a helyes (szótárban megtalálható, illetve a tanár által elfogadott) válaszok számának megfelelően pontot ad a tesztalanynak, amiből következtetni lehet szókincsének nagyságára. A WA_Sorter segítségével megfelelő formára hozott asszociációs adatok elemezhetők (dolgozhatók fel) viszonylag egyszerűen; de ehhez az adatok „manuális”, adott formátumban történő begépelése szükséges. A Meara által kifejlesztett szoftverek ugyan szóasszociációs kutatások célját szolgálják, ennek ellenére saját rendszerünkkel csak annyiban rokoníthatók, hogy mindegyik szóasszociációs adatokat kezelő szoftvernek tekinthető. Mivel az adatfelvétel, az adatok feldolgozása és a kutatás célja esetünkben és Meara esetében eltérő, ezért rendszerünk Meara szoftvereivel nem összehasonlítható. A _lognostics szoftverek ingyenesek és nagyon könnyen kezelhetők, Meara kutatásaihoz hasonló vizsgálatok esetén kiválóan használhatók. Human Brain Cloud A Human Brain Cloud (HBC) egy internetes, asszociációkat gyűjtő játék. Jelenleg (2013. február) az oldal nem üzemel, így az oldalt – egyéb információ hiányában – Gravinora (Gravino et al. 2012) támaszkodva jellemezzük. A HBC 2007-2008-ban működött, egy éves működése során összesen 600.000 szót és mintegy 7.000.000 asszociációt gyűjtött. Az eredeti hívószólistát egy közelebbről nem definiált szótár tartalmazta. A rendszerbe egyfajta „minőségellenőrzés” is működött: a nagyobb számban érkező asszociációkat (szavakat) a rendszer helyes szónak fogadta el; illetve a felhasználók jelezni tudták, ha egy szó hibás helyesírású, vagy „nem megfelelő” szó, pl. szitokszó. Az adatbázis nem csak szótári alakokat tartalmaz, hanem ragozott alakokat is – például többes számokat. A rendszer sok asszociációt gyűjtött ugyan, de nem kutatási céllal, így nem teljesen egyértelmű, hogy a gyűjtött adatok mennyire megbízhatóak. Mivel bármilyen szót elfogadott válaszként, és a válaszokat később sem ellenőrzték manuálisan, a rendszer nagy mennyiségű hibás szót tartalmaz. Gravino et al. (2012) az adatok tisztítása után körülbelül 90.000 szóról, 6.000.000 asszociációról, illetve 3.000.000 kapcsolatról számol be. A rendszer működése, a gyűjtött adatok minősége a valós rendszer kipróbálása nélkül nehezen ítélhető meg. A rendszer, és a gyűjtött asszociációkkal végzett
Az Agykapocs-kutatás
127
kutatások azonban bizonyítja, hogy internetes oldalakkal/programokkal megoldható nagy mennyiségű szóasszociációs adat automatikus gyűjtése. Dutch Word Association Database – Leuven Database Eredetileg holland, illetve jelenleg kiterjesztetten külön angol és német hívószavakra gyűjtenek asszociációkat a Leuveni Egyetem munkatársai (Dutch Word Association Database). Az adatgyűjtés interneten folyik, az asszociációk megadásában bárki részt vehet: a feladat egy több ezer hívószó közül megjelenített hívószólistára megadni az első három asszociációt, ami eszünkbe jut. Az aszszociációk a holland adatbázisra visszakereshetők. A három asszociáció megadása elősegítheti a mentális lexikon gyengébb kapcsolatainak tanulmányozását (De Deyne–Storms 2008a), illetve a rendszer részben igazolta a kisvilág-karakter meglétét a holland adatbázisban (De Deyne–Storms 2008b, De Deyne–Navarro– Storms, megjelenés alatt). Az Agykapocs-rendszertől több szempontból is eltér. Jelen esetben az első három első asszociáció megadását várják el a felhasználótól, míg az Agykapocsrendszerben csak egy asszociáció adható meg. Különbség továbbá, hogy az Agykapocs rendszer hívószólistája folyamatosan bővül, illetve a rendszer lehetővé teszi az adatok részletes (nem, kor, végzettség stb. szerinti) lekérdezését is. WordNet Mint említettük, az Agykapocs-rendszerben szereplő egyes szavak további jellemzőkkel bővíthetők (definíció, nyelvtani információk stb.), így a rendszer és a létrejövő adatbázis ebben is hasonlítható a több országban is elindított WordNet projekthez. Alapvető különbség, hogy (habár pszicholingvisztikai alapokon nyugszik) a WordNet nem empirikus szóasszociációs adatokat dolgoz fel. A George A. Miller által létrehozott (Miller et al. 1990, Miller 1998, Fellbaum 1998) és azóta egyfolytában bővülő (jelenleg kb. 50 nyelven, köztük magyar nyelven is működő) WordNetet Miller a következőképpen írja le: „[WordNet] is an on-line lexical reference system whose design is inspired by current psycholinguistic theories of human lexical memory. English nouns, verbs, and adjectives are organized into synonym sets, each representing one underlying lexical concept. Different relations link the synonym sets” (Miller et al. 1990: 235). A WordNet alapegységei a szavak, pontosabban a synsetek, azaz azonos értelmű szavak (szinonimák) halmazai. Az egyes synsetekhez szöveges definíciók tartoznak. A synseteket kapcsolatok (élek) kötik össze egymással, amelyek szemantikai relációt fejeznek ki, pl. antonima, meronima. A meghatározott kapcsolatok szófajfüggőek (részletesen vö. Prószéky–Miháltz 2008).
128
Az Agykapocs-kutatás
A hierarchikusan felépített főnévi rendszer tetején olyan egyedi kezdő fogalmak (unique beginners) állnak, amelyeknek nincs fölérendelt fogalma, pl. event, entity, abstraction (Miller 1998). A WordNetet tehát hálózatként alkották meg, mivel valószínűleg a beszélők mentális lexikonjának felépítése is hasonló szerveződést mutat (vö. Fellbaum 1998). A WordNet szoftver verziója az internetről is letölthető. A WordNet nemcsak egy programot és egy rendszert, hanem az eredeti elképzelés alapján nyelvi ontológiák olyan rendszerét jelenti, amelyeket azonos vagy hasonló elvek alapján dolgoztak ki (EuroWordnet, BalkaNet). Magyar nyelvre Prószéky Gábor (2001) kezdeményezte a Morphologic munkatársaival a magyar WordNet (HuWN) létrehozását. A HuWN fejlesztése során nyelvspecifikus problémák megoldása is szükséges volt (vö. Kuti et al. 2007), továbbá a HuWN gazdasági szaknyelvi (üzleti nyelvi) ontológiával is bővítették (Miháltz et al. 2007, Prószéky–Miháltz 2008). A HuWN több célra is felhasználható, többek között információkinyerésre is (Miháltz et al. 2007).
5.5 Az Agykapocs-rendszer értékelése Korlátok A fentebb röviden vázolt Agykapocs-rendszer asszociációs adatok gyűjtésére és elemzésére készült. Automatizálható vele az adatok gyűjtése: olyan felhasználók érhetők el, akik más módon nem lennének bevonhatók kutatásokba. Segítségével gyorsan és differenciáltan elemezhetők az összegyűjtött asszociációs adatok. A rendszer az adatgyűjtés és feldolgozás pontosan azon funkcióit automatizálja, amelyekhez nem szükséges szakmai tudás (pl. hívószóra adott asszociációk összesítése), ugyanakkor manuális feldolgozás esetén rendkívül idő- és erőforrásigényes feladatok lennének. További előny, hogy az asszociációk több szempont szerint is lekérdezhetők, pl. végzettség, kor, nem szerint, illetve nemcsak a kimenő, hanem a bejövő kapcsolatok is analizálhatók. Mindez manuális feldolgozással is megoldható lenne – de csak elméletileg. Gyakorlatilag ez azt jelenti, hogy a nyers adatokat többször kellene különböző szempontok szerint – hetek-hónapok munkájával – feldolgozni. Itt ez másodpercek alatt megtörténhet. Ügyeltünk arra is, hogy szükség esetén a rendszer további modulokkal is bővíthető legyen. A rendszer ilyen szempontból egy hasznos adatfelvevő és feldolgozó eszköz. A rendszer ugyanakkor nem alkalmas arra, hogy a kutatók feladatát átvegye, vagy a kutatót helyettesítse. Nem tudja megmondani, milyen kapcsolat van adott hívószó és asszociáció között, nem tudja, miért van közöttük kapcsolat. Nem tudja az asszociációk komplex összefüggéseit indokolni, a rejtett összefüg-
Az Agykapocs-kutatás
129
géseket feltárni – ez nem is volt (természetesen nem is lehetett) célunk: ez az adatokat elemző kutató feladata marad. Az Agykapocs-rendszer jelentősége Az Agykapocs-rendszer – korlátai ellenére – új lehetőségeket nyithat az asszociáció-kutatásban. A hagyományos projektekkel szemben az Agykapocs-rendszer: – olyan szóasszociációs adatbázis amely a jelenlegi adatbázisokkal szemben: – folyamatosan bővül; – gyors, differenciált lekérdezéseket tesz lehetővé; – segítségével az asszociációk a jelenlegi kutatásoknál mélyebben elemezhetőek; – nagy adatmennyiséggel, több nyelvvel dolgozik; – segítségével a mentális lexikonban kimutatható a hálózatos jelenségek bizonyos megjelenése, így többek között annak kisvilág-karaktere; – segítségével igazolható, hogy „[…] a mentális lexikon tulajdonképpen a szavak közötti dinamikus hálózat, melynek egyes elemei változó erősségű potenciállal rendelkeznek az aktiválást illetően” (Lengyel 2007b: 55). További várható eredmények: – nagy mennyiségű anonim nyelvészeti adat felvétele viszonylag kis anyagi és időráfordítással (a korábbi, hasonló jellegű anonim felmérések, például Labov adatgyűjtés kritikáinak (vö. pl. Schlobinski 1996) kikerülésével); – új nyelvészeti kutatásmódszertani (adatgyűjtési és feldolgozási) eljárás alapjainak megalkotása.
5.6 Fejlesztési irányok és lehetőségek A jelenleg összegyűjtött (és részben elemzett) adatok csak az első lépését jelentik egy összetett asszociációs adatbázis megalkotásának. A rendszer jelenleg is képes adatok több nyelven történő gyűjtésére, az adatbázis ugyanakkor bármely további nyelvvel is bővíthető. Megfelelő nemzetközi kutatói támogatottsággal egy olyan soknyelvű asszociációs mega-adatbázis jöhet létre, amely több (akár 10-20) nyelven tartalmazza asszociációs adatok tíz- vagy százezreit. Így bármely nyelv asszociációi összevethetők más nyelvek asszociációival. A rendszer lehetővé teszi kutatók számára a különböző szintű hozzáféréseket (pl. asszociációkat kérdezhet le, vagy a válaszszavakat ellenőrizheti). Lehetséges továbbá az egyes szavakat további jellemzőkkel (pl. szófaj, definíció stb.) ellátni és így az asszociációkat további szempontok szerint is elemezni.
130
Az Agykapocs-kutatás
Nyelvtechnológiai lehetőségek A rendszer a fent említett, jelenleg működő elemeken túl további funkciókkal bővíthető. Quillian (Collins–Quillian 1969), illetve a WordNet (Miller et al. 1990, Miller 1998, Fellbaum 1998) elképzeléseit követve a rendszerben a kapcsolatok milyensége definiálható (pl. madár – szárny kapcsolatnál rész-egész viszony, apa – anya esetében egyenrangú viszony stb.). A munka ezen része (ismét erőforrás hiányában) nem kezdődött meg. A kapcsolatok milyenségének definiálása több módon képzelhető el: – valamely korábbi, a szavak közötti kapcsolatokat osztályozó szerző alapján (pl. Quillian ISA, HASA stb. kapcsolata, Collins–Quillian 1969); – a szemantikus webek számára kifejlesztett RDF (Resource Description Framework) nyelv parancsait és logikáját követve (vö. Gottdank 2006, Szeredi–Lukácsy–Benkő 2005); – a WordNet osztályozásának és kapcsolatainak átvételével; – teljesen új, lehetőleg számítógéppel értelmezhető, de nem az RDF elveit követő kapcsolati kategorizálással. Az első megoldás mellett a nyelvészeti/pszicholingvisztikai hagyományok szólnak, ugyanakkor az ehhez hasonló kapcsolati rendszereket nem dolgozták ki teljes mélységben – adott szerzők inkább (a teljesség igénye nélkül) példákat hoznak a lehetséges osztályozásra. Az RDF-ben alkalmazott osztályozás mellett szól, hogy a kapcsolatok számítógéppel értelmezhetők. Az RDF informatikai megközelítésben kezeli a különböző fogalmi (adat-) viszonyokat. Az RDF előnye (számítógéppel értelmezhető) egyben hátrány is: csak olyan kapcsolatokat (viszonyokat) enged meg és definiál, amelyek számítógépes értelmezése a nyelv kifejlesztésénél megoldható volt. Az RDF elleni érv lehet továbbá, hogy jelenlegi szemantikai analizálók nem kizárólag az RDF nyelven alapulnak. A WordNet rendszerének átvétele mellett szól, hogy a WordNet nyelvészeti, pontosabban pszicholingvisztikai indíttatású, több nyelvre létező rendszer. A WordNetben definiált kapcsolatok azonban nem minden esetben feleltethetők meg szóasszociációs kutatások eredményeként kapott válaszoknak: a fonetikai válaszok (pincér – cincér) a WordNet alapján nem lennének értelmezhetőek. A kapcsolati rendszer különbségének komplex elemzésére itt nem térhetünk ki, mivel ez önmagában is egy hosszabb fejezetet ölelne fel. A szemléletbeli különbségek már Lengyel Zsolt (2008c) asszociációs válaszok besorolását is részletező publikációjának, illetve Prószéky Gábor és Miháltz Márton (2008) a WordNet relációit is bemutató tanulmányának összevetésével is felfedezhetők. A legcélszerűbb megoldás egy az RDF-en és/vagy a WordNeten, valamint logikai/nyelvészeti és asszociációs kutatásokon alapuló új kapcsolatrendszer ki-
Az Agykapocs-kutatás
131
alakítása és a számítógép számára értelmezhető módon történő megvalósítása. A projektnek jelenleg nem célja ezen kapcsolatrendszer alapjainak letétele, az elgondolások megvalósítása, csupán utalni kívánunk a rendszerben rejlő lehetőségekre. A szoftver elsősorban szóasszociációs adatok gyűjtésére és feldolgozására készült. Megfelelő komponensekkel bővítve hálózatelemzési feladatok ellátására is alkalmas (vö. legrövidebb út). Hálózatok elemzésére, illetve a kapcsolatok grafikus megjelenítésére jelenleg ugyanakkor célszerűbb olyan szoftverek használata, amelyeket kifejezetten erre a célra fejlesztettek ki. Ilyen többek között a viszonylag széles körben hálózatelemzésre használt Pajek (Batagelj–Mrvar 1998, 2003), valamint az összetettebb funkciókat is kezelni tudó Graphviz és Yed. Szociológiai hálózatok elemzésére számos szoftver áll rendelkezésre, különböző elemzési súlypontokkal, mint például a vizualizáció (vö. Duijn 2005, illetve Letenyei 2005). Magyar fejlesztésű a Vicsek Tamáshoz és kutatócsoportjához köthető FirmNet szoftver, amely komplex hálózatelemzési feladatok ellátására, valamint a hálózati kapcsolatok megjelenítésére is alkalmas.
132
Az Agykapocs-kutatás
6. AZ AGYKAPOCS-RENDSZER ALKALMAZÁSI LEHETŐSÉGEI: SZAKNYELV ÉS MENTÁLIS LEXIKON ÖSSZEFÜGGÉSEI
A fejezet egy példán keresztül szeretné bemutatni, milyen vizsgálatok végezhetők az Agykapocs-kutatás eredményeinek felhasználásával. A kutatásban a mentális lexikon szakmai szerveződését vizsgáljuk a gazdasági szaknyelv példáján keresztül. Mivel elemzésünk során szakszavak terminológiai vizsgálatát is elvégezzük, ezért tárgyalunk bizonyos elméleti kérdéseket is a szaknyelvekkel és a terminológiával kapcsolatban.
6.1 Fogalmi rendszerek a terminológiában és a szaknyelvekben A mentális lexikon fogalmi rendszereit és a mentális lexikonban lévő fogalmak közötti kapcsolatokat nem elegendő önmagukban vizsgálni, hanem azokat célszerű összehasonlítani más fogalmi rendszerekkel is. Ezért a mentális lexikon fogalmi rendszerét terminológiai, illetve szaknyelvi fogalmi rendszerekkel kívánjuk összevetni. A két fogalmi rendszer létrejötte és funkciója eltér egymástól: a fogalmak a mentális lexikonba kerülésükkor alakítanak ki kapcsolatot a már meglévő fogalmakkal, tehát a fogalmi rendszer bizonyos szabályok mentén ugyan, de „spontán” módon jön létre. A mentális lexikon esetében nem fontos az adott fogalom pontos definíciója, illetve az egyéb, hasonló fogalmaktól való pontos elhatárolása. Gondoljunk például a sólyom – héja párosra: az átlagember tudja, hogy a két szó jelentése között különbség van, ugyanakkor a laikus számára lényegtelen a két élőlény külseje, szokásai közötti pontos különbség. A két élőlényről a laikus csupán annyi információt tárol, amennyi a mindennapokban szükséges lehet, például, hogy mindkettő ragadozó madár – megkülönböztetni viszont valószínűleg nem tudná őket egymástól. Ezzel szemben a terminológia (a szaknyelvek) esetében a létrejövő fogalmi rendszerek egyik fontos eleme, hogy elkülönítse egymástól a fogalmakat, jelezze egymáshoz való viszonyukat, leírja a fogalmak közötti kapcsolatokat, valamint rendszerezze azokat. Adott szakma fogalmi rendszerének kialakításakor, illetve leírásakor tehát fontos szerepet kap a fogalmak egymáshoz való viszonya, valamint a fogalmak pontos definíciója.
134
Szaknyelv és mentális lexikon
A terminológia Fóris Ágota meghatározása szerint „(1) terminusok, fogalmak és azok viszonyának vizsgálata; (2) terminusok gyűjtésére, leírására, bemutatására, valamint osztályozására és képzésére alkalmazott eljárások és módszerek összessége; (3) egy meghatározott tárgykör logikai rendszeréhez illeszkedő rendszerezett terminusok összessége” (Fóris 2005: 37 vö. Bessé et al. 1997). A definíció mindhárom pontja utal rá, hogy a terminológia a fogalmakat nem önmagukban, hanem valamilyen rendszer részeként vizsgálja. Cabré (1999) szerint a terminológia három fő területe közül (tudás megszerzése, fogalmak alkotása, fogalmak rendszerezése) a fogalmak rendszerezésével kapcsolatos a legtöbb terminológiai jellegű kutatás, mivel nemcsak a terminológusok, hanem az egyes szakterületek szakemberei is érdekeltek voltak az adott szakterület terminológiai rendszerének tanulmányozásában. A terminológia egyik célja tehát a terminusok osztályozása. A terminus fogalom maga is számtalan kérdést vet fel (Fóris 2005, 2007b Sager 2000). Jelenleg a fogalom használata még a terminológián belül sem egységes. Terminuson a továbbiakban adott tárgykörhöz tartozó (szaknyelvi) definiált fogalmat értünk, ellentétben az ISO 1087-1 szabvánnyal, amely szerint a terminus egy szakterület fogalma: „verbal designation of a general concept in a specific subject field” (ISO 1087-1 2000: 3.4.3). A definiált jelzőt azért tartjuk fontosnak, mivel definíció hiányában a terminusok nehezen különböztethetők meg egyéb köznyelvi és szaknyelvi szavaktól, illetve definíció hiányában a terminusok (terminológia) egységessége sem biztosítható. A definíció megléte, illetve a definíció mint feltétel természetesen számos további kérdést vet fel: például ki definiálhat; milyen definíció „helyes”; ha adott fogalomra több definíció van, akkor melyik érvényes; létezhet-e egyáltalán adott fogalomra egységes definíció, ami nyelvtől és (szakmai) beszélőközösségtől független. A definíció (mint feltétel) hiánya ugyanakkor sokkal több félreértésre ad okot. A definíció szükségességét és fontosságát többek között az is alátámasztja, hogy a terminológiai monográfiák kiemelt szerepet tulajdonítanak a definíciónak (vö. Cabré 1999, Sager 1990, Wüster 1985, valamint a definícióval kapcsolatos történeti-filozófiaelméleti megfontolások szempontjából Sager 2000). Fóris Ágota (2005: 34) is jelzi, hogy a terminus két részből, a jelölőből, valamint az azt értelmező definícióból áll. A definíció segítségével lesz a terminus terminussá, vagyis a definíció segítségével tudjuk adott fogalom jellemzőit megadni, azt egyéb fogalmaktól elhatárolni (Sager 2000). Ezért terminus, terminológia és terminológiai munka definíciók nélkül nem elképzelhető. A terminus tehát (legegyszerűbben fogalmazva) egy fogalom, annak megnevezése és a hozzá tartotó definíció. Fontos, hogy a terminus mindig valamilyen fogalmi/terminológiai rendszer része.
Szaknyelv és mentális lexikon
135
A terminológiai és szaknyelvi szakirodalom pontosan a terminus fogalom nem pontos definíciója miatt nem egységes: sok esetben olvashatunk terminológiai tárgyú cikkeket (x tárgykör/szakma terminológiája), amelyek nem terminusokkal, hanem szakszavakkal foglalkoznak. Terminus és szakszó közötti különbségtétel fontos része a szaknyelvi (és terminológiai) kutatásoknak, amennyiben ugyanis a két fogalmat egyenrangúként kezeljük, (paradox módon) terminológiai problémákba ütközünk. Terminusok esetében a fogalom a kiindulási alap, és a fogalomtól haladunk a szóalak (megnevezés) felé (Muráth 2005). Lexikográfiai és terminológiai megközelítésben, vagyis egy szakszótár és egy terminológiai szótár esetében tehát (elvileg) pontosan ismerjük a két szótár közötti alapvető különbséget: a szakszótár a szóból kiindulva (szemasziológiai elven), míg a terminológiai szótár a fogalomból kiindulva (onomasziológiai elven) végzi a szavak rendezését, az információk összegyűjtését (Fóris 2005). Itt nem részletezzük azt a problémát, hogy mikor és minek alapján neveznek egyes szótárakat helyesen vagy helytelenül szakszótárnak – a gyakorlatban a legtöbb szakszavakat tartalmazó szótár megnevezése szakszótár kiindulási alaptól függetlenül. A terminus és a szakszó közötti különbséget pontosan a definiáltság adja meg. Felber és Schaeder (1999) felfogásából kiindulva: Szakkifejezés
+ terminologizált
+ szabványosított – szabványosított
– terminologizált
+ elfogadott / bejáratódott
– elfogadott / bejáratódott
18. ábra. A szakkifejezések felosztása Felber–Schaeder (1999: 1735-1736) alapján; magyar fordítása: Muráth Judit (2007: 158).
A 18. ábrán a terminologizált azt jelenti, hogy a fogalom definiált és a szóalakhoz egyértelműen hozzárendelt; a szabványosított azt, hogy valamely jogosult intézmény (pl. német DIN, ISO) azt meghatározta; az elfogadott pedig, hogy a fogalom részben definiált és a szóalakhoz hozzárendelt (nem preskriptív módon, hanem adott szakmai közösség által). Felber és Schaeder felfogása értelmében tehát a szaknyelvek jellemzője a szakszókincs, amely szakszókincsnek bizonyos része terminus. Terminologizált szakkifejezés és terminus jelentése a korábbi
136
Szaknyelv és mentális lexikon
megfontolások alapján azonosnak tekinthető, habár Felber és Schaeder ezt a megfeleltetést explicit módon nem teszik meg. A köznyelv szavaiból a terminusok létrejöttének (terminologizáció), illetve az ellentétes folyamatnak (determinologizáció) rövid leírását Fischer Márta (2010) adja. Fischer utal rá, hogy egy szó nem szükségszerűen csak köznyelvi szó vagy csak terminus: egyazon szó egyszerre lehet köznyelvi szó és terminus is.
6.1.1 Terminológiai osztályozások Természetesen a terminusok sem egymástól függetlenül léteznek, hanem rendszereket alkotnak. Wüster (1985) fogalmak rendszerezése esetén a fogalmak között logikai kapcsolatokat és ontológiai kapcsolatokat feltételez. A logikai kapcsolat két elem között hasonlóságon alapul, lehet mellé- vagy alárendelés (körte – alma, gyümölcs – alma), valamint vegyes kapcsolat (Diagonalbeziehung). Ez utóbbi két alárendelt fogalom között létezik, ha ezek sem mellérendelő, sem alárendelő kapcsolatban nem állnak egymással (emlős – csiga: mindkettő állat). Az ontológiai kapcsolatok esetén az egymással kapcsolatban lévő elemek között térbeli vagy időbeli és okokozati kapcsolat lehet. A fogalmak közötti kapcsolatokat Cabré (1999) – valószínűleg Wüster rendszerét átvéve, de rá nem hivatkozva – szintén logikai és ontológiai kapcsolatként jelöli (Cabré 1999). A logikai kapcsolat a fogalmak valamilyen hasonlóságán alapul, míg az ontológiai kapcsolat a fogalmak időbeni vagy térbeni közelsége/kapcsolata alapján jön létre. Az ontológiai kapcsolat lehet koordinációs kapcsolat (rész-egész) vagy ok-okozati kapcsolat. Sager (1990) a fogalmak közötti kapcsolatokat három egyszerű összefüggéssel próbálja leírni: alá-fölérendelési viszonnyal, rész-egész viszonnyal és polivalens viszonnyal. Jelzi ugyanakkor, hogy nem minden kapcsolat írható le ilyen módon, ezért rendszere komplex kapcsolatokat is tartalmaz. Ezek esetében a kapcsolat fajtája lehet többek között: ok-okozat (robbanás – tűz), anyagtulajdonság (üveg – átlátszó), folyamat-termék (szövés – ruha), alapanyag-termék (vas – rács), tevékenység-hely (bányászat – bánya), vagy tárgy-minőség (benzin – magas oktánszámú) (vö. Sager 1990: 34-35). Kageura (2002) fő kapcsolati típusnak az alá-fölérendelt viszonyt tekinti, de nem foglalkozik a kapcsolatok lehetséges rendszerével, csupán az adott terminuson belüli (intra-term) kapcsolatokat vizsgálja. Terminuson belüli kapcsolatok esetében hierarchikus viszonyt fedezhetünk fel. Ez azt jelenti, hogy egy központi
Szaknyelv és mentális lexikon
137
elemet határoz meg közelebbről egy determináns: golyóscsapágy, ahol a determináns a golyós a központi elem a csapágy. Az egyes fogalmak nem kizárólag egy másik fogalommal lehetnek kapcsolatban: a fogalmak összetett rendszereket is alkothatnak. A terminusok rendszerezése esetén a terminológiai szakirodalom a rendszerezés három formáját különbözteti meg: osztályozás, taxonómia, ontológia. Van Rees (2003) a három fogalmat egymással összevetve a következőképpen fogalmazza meg a különbségeket: – osztályozás: kategóriákba vagy csoportokba rendezés adott (külső) szempont alapján (pl. állatok: ehető, nem ehető); – taxonómia: az elemek saját (belső, inherens) jellemzői, egymáshoz való viszonyuk alapján létrehozott hierarchikus fogalmi rendszer (pl. Linné-féle rendszer); – ontológia: adott szakterület (domain) fogalmait tartalmazza definíciókkal, valamint a fogalmak egymáshoz való viszonyának pontos megadásával. Fóris Ágota (2005: 33) az ontológiát szintén hasonlóképpen határozza meg: az ontológiák célja egy fogalmi terület feldolgozása; terminusokat, azok jelentését, valamint a köztük lévő kapcsolatokat tartalmazzák. Az osztályozás és taxonómia között viszont nem tesz különbséget, ugyanakkor utal rá, hogy a taxonómia „egy tudomány ismeretanyagát saját rendszerező elvei alapján osztályozza” (Fóris 2005: 32). Cabré szintén definiálja az ontológiát: „[it] deals with analysing objects of the real world, their location and the relationships they have with each other” (Cabré 1999: 39). Az ontológia nem egyedül a terminológia keretein belül használt fogalom. Guarino és Giretta (1999) az ontológia szó hét lehetséges jelentését adja meg (pl. filozófiai diszciplína) a különböző jelentések közötti kapcsolatokat vizsgálva. Smith és Welty (2001) az ontológiát filozófiai és informatikai szempontból (mesterséges intelligencia és szemantikus web-kutatások) vizsgálják, kapcsolatot keresve a fogalom filozófiai gyökerei és jelenlegi, informatikában használt jelentése között. Meglátásuk szerint az informatika ontológia-fogalma közelebb áll a tudásmenedzsmenthez, mint a klasszikus filozófia ontológia-fogalmához. Munn és Smith (2008) alkalmazott ontológiákról beszélve az ontológiák gyakorlati felhasználásának lehetőségeit vizsgálják. Gillam, Tariq és Ahmad (2005) az ontológiákat a valóság egyfajta reprezentációjának tartják, amelyek gyakorlati eszközként használva fordítási, tudásmenedzsmenttel kapcsolatos és egyéb tudásalapú tevékenységek kérdéseinek megoldásában segíthetnek. Az ontológia szó jelentésének napjainkban tehát informatikai aspektusa kerül előtérbe: az ontológia „az ember gondolkodási képességeinek szimulálását kitűző alkalmazások jelentéstani
138
Szaknyelv és mentális lexikon
adatbázisa megnevezéseként jelent meg a nyelvtechnológia területén” (Prószéky– Miháltz 2008: 44). Kérdés, hogy a Miller-féle WordNet (vö. Miller et al. 1990) ontológiának tekinthető-e. Sowa (2000) terminológiai ontológiának, Prószéky Gábor (Prószéky–Miháltz 2008) nyelvi ontológiának tekinti. Ezzel szemben Gillam, Tariq és Ahmad (2005) a WordNetet nem tekinti ontológiának hivatkozva arra, hogy az ontológiák mindig valamely szakterülethez tartoznak, a WordNet viszont nem tartalmaz adott szakterülethez tartozó terminológiát. A magyar nyelvű WordNet üzleti adatbázist (ontológiát) is tartalmaz (vö. Miháltz et al. 2007), így Gillam, Tariq és Ahmad értelmezésében is (legalábbis részben) ontológiának tekinthető. Használható és teljes(ségre törekvő) ontológiák kidolgozása munka- és költségigényes feladat, a rendszerbe besorolandó terminusok száma (akár csak egy szakterület kis részén) akár több ezer lehet. További probléma, hogy adott terminus egyszerre több rendszer része is lehet, így egy „kétdimenziós”, papír alapú ontológia megalkotása nehézségekbe ütközhet. A gazdasági szaknyelv fuvarparitásai (Incoterms) egyszerre jogi, kereskedelmi és logisztikai terület terminusai, ugyanakkor részei lehetnek különböző szerződéseknek is. Maguk a paritások is osztályozhatók számos szempont szerint, pl. a szállítás formája (szárazföldi, vízi), a felelősségvállalás (vevő, eladó), vagy a fuvarköltség szerint (vevő, eladó). Amennyiben célunk adott szakterület ontológiájának megalkotása, a több osztályba való besorolás lehetőségét informatikai megoldások tehetik lehetővé, mint a hipertext (html nyelv), illetve a relációs adatbázisok. Segítségükkel megalkothatók (és jobban bemutathatók) azon kapcsolati rendszerek, amelyek hagyományos (papíralapú) megközelítéssel csak nehezen: adatbázisokból történő lekérdezés esetén külön-külön kérdezhetők le például az egyes kapcsolati típusok, illetve külön lekérdezés tartozhat (a fent említett példa esetében) a fuvarparitások különböző jellemzőihez. Ilyen bonyolult kapcsolati összefüggéseket értelmezni tudó rendszert mutat be Gamper, Nejdl és Wolpers (1999) akik a KBS Hyperbook rendszerrel hipertext formában elemzik a német GmbH (Kft) fogalom kapcsolati rendszereit. A kapcsolatoknak három típusát különböztetik meg: fölérendelt fogalom (ez megfelel az egyszerűbb terminológiai fáknak, lásd később), funkció, szerv. Az így létrejött rendszer bonyolult, de a kapcsolatok megnevezése hozzásegít, hogy rendszerük egy egyszerű definíciónál részletesebben (és érthetőbben) mutassa be a GmbH helyét a gazdasági társaságok között. Az informatikai eszközök nem kizárólag a kivonatolt adatok (terminológiai rendszer) tárolásában és elérésében lehetnek segítségünkre. Jelenleg a terminológiai kutatások egyik célja, hogy terminológiai rendszerek megalkotását automati-
Szaknyelv és mentális lexikon
139
zálja (vö. pl. Kis 2007). Az egyik fontos lépés a terminusok kivonatolása, vagyis a terminusok megtalálása adott szakszövegben: terminusok szoftverek segítségével, automatikusan is kinyerhetőek szakszövegekből, szakszótárakból és/vagy korpuszokból. Automatikus terminuskivonatoló rendszerek gyakorlatban is felhasználhatók többek között fordítói rendszerek (fordítási környezetek) létrehozásakor (Kis–Mohácsi-Gorove 2008). A jelenleg létező automatikus terminuskivonatoló rendszerek nem dolgoznak teljes pontossággal; vagyis az általuk generált listákból maradhatnak ki terminusok, illetve a listába belekerülhetnek olyan szavak, amelyek nem tekinthetők terminusnak. Terminuskivonatoló szoftverek esetében a megfelelően működő szoftver megalkotása (illetve a legmegfelelőbb szoftver kiválasztása) alapvető problémákba ütközik: sokszor adott terület szakértői között sincs egyetértés arról, mely szó tekinthető terminusnak és mely nem, illetve nem léteznek olyan sztenderdizált eljárások, amelyek segítségével a különböző elveken, különböző forrásokból dolgozó rendszerek eredményei összemérhetők lennének egymással (Vivaldi–Rodríguez 2007). A terminuskivonatoló rendszerek jelenleg fejlesztés alatt álló változatai nemcsak a kivonatolás nagyobb pontosságát célozzák meg, hanem az egyes terminusok közötti kapcsolatot is automatikusan (a szövegkörnyezet és természetes nyelv feldolgozó módszerek segítségével) próbálják meghatározni (vö. Auger– Barrière 2008, Aussenac-Gilles–Jacques 2008, Halskov–Barrière 2008, Marshman 2008, Sierra et al. 2008, Soler–Alcina 2008). Terminusok osztályozása természetesen nem kizárólag komplex ontológiák segítségével képzelhető el. Wüster (1968) szótárában a terminusok nem alfabetikus sorrendben, hanem az Egyetemes Tizedes Osztályozás elveit követve (ETO, UDC) kerülnek egymás mellé. Szótárának bejegyzései esetében a kiindulási pont mindig egy fogalom, amely köré rendezve találjuk az azzal kapcsolatba hozható terminusokat. A felosztás segítségével a szakemberek könnyebben igazodnak el adott terület terminológiájában, hiszen a szótár logikája a szakma (pontosabban jelen esetben az ETO) logikáját követi, vagyis (elvileg) a szakmát úgy képezi le, ahogyan az a szakember „tudásában” létezik. Fogalmak rendszerezésének egy egyszerű formájaként terminológiai fákat alkothatunk. Terminológiai fák (19. ábra) esetében különböző szinteket látunk. A szintek adott szempont szerinti osztályozás esetén alárendelést, többnyire a felettes terminus további fajtákra bontását jelölik. Fóris Ágota (2005) a gyémánt fogalmat négy szempont szerint osztályozza és helyezi el terminológiai fákon: 1. szénhez való viszony; 2. felhasználási terület; 3. ékszerek közötti szerep; 4. ásványokhoz való viszony. Ahogy Fóris Ágota is utal rá, a gyémánt szó teljes jelentése és terminológiai rendszerekben betöltött szerepe csak (legalább) ezen négy terminológiai fa ismeretében határozható meg teljességgel. Amennyiben csak egy szak-
140
Szaknyelv és mentális lexikon
terület terminológiáját vizsgáljuk, akkor a felosztás félrevezető is lehet: az 1. és 4. szerep ásványtani/kőzettani szerepekkel kapcsolatos, míg a 2. és 3. gyakorlati alkalmazásokkal. A két terület természetesen összefügg egymással (a gyémántot felépítése teszi alkalmassá a gyakorlati felhasználásra adott területen), ugyanakkor a geológus szempontjából nincs jelentősége a gyémánt ékszerek közötti szerepének (3.), mint ahogy az ékszerész (vagy a vásárló) szempontjából is lényegtelen a gyémánt szénhez való viszonya (1.). A terminológiai fák tehát egyszerűsített, könnyen áttekinthető (laikusok számára is érthető) rendszert hoznak létre, hátrányuk azonban, hogy nehéz egy terminus összes szerepét egy fán elhelyezni. Hasonló ábrázolást alkalmaz Cruse (2001: 260), aki szintén ágrajzzal kategorizál hierarchikus elrendezésben szavakat, taxonómiai felosztásnak nevezve a rendszert. Cruse szerint a kategorizálás még szócsaládokkal (szép – szépség – szebb) és domain-specifikus kategóriákkal is történhet. Utóbbi egy adott szituáció szókincsét tartalmazza (lóverseny-fogadás-nyertes) (Cruse 2001). A fa és a faszerű kategorizálás komplex lehetőségeit Cruse (1986) mutatja be. Fényképezőgép
digitális
tükörreflexes
bridge
analóg (filmes)
kompakt
tükörreflexes
kompakt
19. ábra. Terminológiai fa, fényképezőgépek osztályozása
Adott horizontális szinten belüli rendezés esetében a rendszerezés táblázatos formában is elképzelhető (vö. Fóris 2005). A 5. táblázat a fényképezőgépek osztályozásának lehetőségeit mutatja. A táblázat nem tartalmazza a digitális fényképezőgépek osztályozásának összes lehetőségét (és jellemzőjét), csupán a rendszerezés módszerét mutatja be, a teljesség igénye nélkül.
cserélhető / fix objektív nagy / kis fényerejű objektív manuális élességállítási lehetőség van / nincs olcsó / drága
tükörreflexes +/+ - / + -* +/-
bridge -/+ +-/+-* + - / + -*
kompakt -/+ -/+ + - / + -*
-/+
+-/+-*
+/-
5. táblázat. A digitális fényképezőgépek osztályozási lehetőségei *=típusfüggő
Szaknyelv és mentális lexikon
141
A táblázatban az osztályozandó fogalmak és az osztályozási szempontok szerepelnek. Adott tulajdonság megléte vagy nem megléte jelezhető egyszerű + vagy - jellel, illetve a táblázat adott cellájába szöveges formában is szerepelhet. Az ilyen rendszerek azonos osztályba tartozó, azonos szinten lévő fogalmak esetében használhatók. Tehát míg a terminológiai fa vertikális (osztály-fajta) osztályozást tesz lehetővé, addig a mátrixszerű elrendezés horizontálisan, vagyis azonos szinten lévő terminusok esetében használható. Az eljárás hasonlít a komponenses elemzésre, illetve a bináris szemantikai jegyeken (binäre Merkmalsemantik) alapuló osztályozásra. Ezeknél adott fogalom osztályozása két jeggyel történik, amelyeknek adott fogalom vagy megfelel (+), vagy nem (-): a fiú fogalom pl. a nőnemű/hímnemű jegypáros esetében +hímnemű és –nőnemű (vö. pl. Kiefer 2007: 63-71, Löbner 2003: 201-203, Tóth 2001: 112). A terminológiai fához hasonló módszert használ a Concepto rendszer, ahol a terminológiai rendszert gráfként értelmezik, vagyis adott fogalom a gráf egy pontja, a pontokat pedig élek kötik össze (vö. Rahmstorf 1999). Nem teljesen egyértelmű, hogy a rendszer csak osztályozásra alkalmas-e (fölérendelt fogalom, alatta a fogalom egy fajtája), vagy egyéb kapcsolatok is létrejöhetnek. A szerző által bemutatott példa ugyan csak fölérendelt fogalom-fajta kapcsolatokat tartalmaz, ugyanakkor semmi nem utal rá, hogy csak ez a fajta kapcsolat lenne megengedett. Sowa (1979) fogalmi gráf rendszerét Antia (2000) fogalmazza újra: fogalmi gráfok esetében a fogalmakat (gráf pontjai) élek kötik össze, amelyeket megnevezünk. A megnevezés a kapcsolat típusára utal. Antia fogalmi gráfjai irányítottak, vagyis a két fogalom közti kapcsolat iránya is lényeges. vágóeszköz
típus
kés
Az így létrejövő rendszer sok hasonlóságot mutat Quillian (1968) korábban bemutatott fogalmi rendszerével, azzal a különbséggel, hogy ott a kapcsolat típusa bármi lehetett, vagyis maga a kapcsolat is egy jellemző volt (a példában kanári, sárga, a kapcsolat típusa: szín) míg jelen esetben a kapcsolat típusai inkább logikai jellegűek. Sowa eredeti fogalmi gráfja jobban hasonlított Quillian elképzelésére, mivel a fogalmak között bármilyen kapcsolatot megengedett. Sowa (2008) rendszerének alapját gráf alapú szemantikai kutatások képezik: célja egy olyan rendszer megalkotása volt, amely a természetes nyelv és a számítógépes relációs adatbázisok között helyezkedik el. A terminológiai osztályozás, illetve az egyes fogalmak közötti kapcsolatok meghatározása nem mindig egyszerű és egyértelmű feladat. Dancette (2007) a gazdasági szaknyelv területén az értékesítéssel kapcsolatos terminusokat kutatta
142
Szaknyelv és mentális lexikon
terminusok szakszótári (Dictionnaire analitique de la distribution/Analytical Dictionary of Retailing) vizsgálatával. Megállapítása szerint a fogalmak közötti kapcsolatok leírása, illetve a kapcsolat adott kapcsolatfajtába sorolása nem egyszerű feladat, sokszor egyszerű kapcsolatok meghatározása is nehézségbe ütközik: „Even simple hierarchical relations such as generic-specific are not universally agreed upon…” (Dancette 2007: 217). Amennyiben a fogalmak viszonyát szövegből (mondatokból) nyerjük ki, további nehézségekbe ütközünk: különböző mondatokat alapul véve a fogalmak között feltárt viszony is különbözhet. A fogalmak közötti viszonyok kutatása ugyanakkor fontos feladat: „identifying classes of relations is part of the knowledge acquisition and organisation process” (Dancette 2007: 217). A viszonyok megismerésének tehát a tanulásban, az új tudás elsajátításában is szerepe van.
6.1.2 Gazdasági szaknyelv A mentális lexikon rendezettsége és egy szakterület szakszókincsének (terminológiai) rendszere közti különbséget a gazdasági szaknyelvből vett példán keresztül kívánjuk bemutatni, ezért röviden bemutatjuk a gazdasági szaknyelvet. Ezek után két, a szaknyelvben is ismert szó – adó, hitel – kettős vizsgálatát végezzük el. Vizsgáljuk egyrészt a két szó terminológiai osztályozási lehetőségeit, másrészt kapcsolataikat a mentális lexikonban. A mentális lexikon elemzését szóasszociációs vizsgálattal végezzük három csoport esetében: középfokú gazdasági végzettséggel rendelkezők, felsőfokú gazdasági végzettséggel rendelkezők és gazdasági végzettséggel nem rendelkezők körében. A szaknyelv értelmezhető csoportnyelvként (Möhn 1999), variánsként (Adamzik 1999), alnyelvként (Hoffmann 1999) vagy funkcionális stílusként (Gläser 1999) vagy regiszterként (Hess-Lüttich 1999) is (vö. Kurtán 2003, Becker–Hundt 1999). A szaknyelv szó mellett gyakrabban az átfogóbb szakmai kommunikáció kifejezést is használja többek között Hoffmann (idézi Kalverkämper 1999). A szaknyelvek legfőképp szókincsükben különböznek a köznyelvtől (Kennedy–Bolitho 1994, Kurtán 2003, Muráth 2002), ugyanakkor a szaknyelvi szövegek szerkesztésmódja, a használt nyelvtani szerkezetek is eltérhetnek a köznyelvtől (Kurtán 2003). A szaknyelvek felosztása több szempont szerint történhet: a horizontális felosztás alapját a tudományágak (szakmák) rendszere képezi. A rendszerezés ebben az esetben a Dewey-féle Egyetemes Tizedes Osztályozás (ETO) felosztását követi (Kurtán 2003). A horizontális felosztás természetesen nem statikus: új
Szaknyelv és mentális lexikon
143
szakmák/tudományágak létrejöttével új szaknyelvek jönnek létre, illetve bizonyos szakmák háttérbe szorulásával szaknyelvek tűnhetnek el (Fluck 1974). A szaknyelvek mind kisebb egységekre való osztása is lehetséges: gazdasági szaknyelv – pénzügyi szaknyelv – könyvelés szaknyelve. Az egyes szaknyelvek között természetesen szükségszerűen átfedések is lesznek, vagyis adott szókincs több szaknyelv részét is képezheti: például a cégek alapításához szükséges társasági szerződés nyelvezete egyszerre sorolható a gazdasági szaknyelv és a jogi szaknyelv területéhez. A szaknyelvek vertikális felosztásában Hoffmann (1985) öt szintet különböztet meg (magyarul idézi Kurtán 2003: 46): 1. az elméleti alaptudományok nyelve; 2. a kísérleti tudományok nyelve; 3. az alkalmazott tudományok és a technika nyelve; 4. az anyagi termelés nyelve; 5. a fogyasztás nyelve. Ezekhez a szintekhez rendelhetők a szintek további jellemzői: az absztrakció foka, a nyelvi forma és a kommunikációban résztvevők (Kurtán 2003). Az absztrakciós szintekre történő felosztás természetesen a gyakorlati nyelvhasználatban is kaphat funkciót – például a szaknyelv használatának kirekesztő funkciója is lehet: orvos-orvos beszélgetése beteg előtt, csak latin nyelven megnevezve a betegséget. A gazdasági szaknyelv besorolása a szaknyelvek között különleges helyet foglal el. „A gazdasági szaknyelv rendkívül bonyolult, sokrétű, szinte parttalan kategória. Vele szemben a műszaki, orvosi, természettudományi szaknyelvek viszonylag jól meghatározhatók, tehát jellegzetességeik leírhatók, lajstromba szedhetők” (Jónás 1999: 164). Muráth Judit (2002), Horst (1998) és Hundt (1998) is utal rá, hogy a gazdasági szaknyelv maga is több szaknyelv összessége, ahogy a gazdaság is szakterületek sokaságát foglalja magába (vö. Bolten 1991). Ablonczyné Mihályka Lívia (2010: 245-246) azon területeket is felsorolja, amelyek a nemzetközi gyakorlatnak megfelelően a gazdasági szaknyelvvel kapcsolatba hozhatók. Buhlmann-Fearns (1987) szerint a német gazdasági szaknyelv (Wirtschftsdeutch) kifejezés számos kisebb szaknyelv gyűjtőfogalma. Ezeket a szaknyelveket különböző tevékenységek során, különböző kommunikációs célokra használják. Hundt (1999: 1301) a gazdasági szaknyelvet „terra incognita”-nak nevezi, mivel a gazdasági szaknyelvek (Hundt a fogalmat eleve többes számban használja) ellentétben más szaknyelvekkel nem képezték átfogó, szisztematikus kutatások alapját.
144
Szaknyelv és mentális lexikon
Ezen sokrétűség mellett „a gazdasági szaknyelv talán legközelebb áll a köznyelvhez” (Ablonczyné 2006: 36). A szaknyelvek közül a gazdasági szaknyelv az átlagembert is érinti, ugyanis mindenkinek van bankszámlája, munkaszerződése, sokan vesznek fel hitelt, mindenki fizet adót. Hasonlóan a politika nyelve is mindennapjaink része: a politika nyelvhasználata ezért sokféle funkciót tölthet be, ami széles stílusrepertoár alkalmazását követeli meg (vö. Mihalovics 2006). A szaknyelvi és a köznyelvi fogalmak azonban nem törvényszerűen ugyanazt jelentik, vagyis a szaknyelvi (szakmai) és a köznyelvi fogalom jelentése eltérhet egymástól, ahogy arra Hundt (1999) is felhívja a figyelmet. Adott szaknyelvek – többek között a közgazdasági, pénzügyi szaknyelv – bizonyos szintű ismerete ugyanakkor a mai világban elengedhetetlen: „Az, aki nem sajátítja el a megfelelő szaknyelvet, az adott szakmai közösség határain és végső soron a civilizációs világon kívül marad” (Bańczerowski 2003: 279). A gazdasági szaknyelv „terjedéséhez” nagy mértékben hozzájárult a 2008as évben kezdődő gazdasági válság. 2008 őszétől minden médium (televízió, nyomtatott és elektronikus sajtó) kiemelten foglalkozott a gazdasági válság okaival, aktuális eseményeivel, következményeivel. A gazdasági szaknyelv bizonyos területeinek szókincse így bekerült a köznyelvi szókincsbe, valamint az átlagember szókincsébe is. (A folyamat valószínűleg a szakszókincs → média szókincse (hírek a válságról) → köznyelv sorrenddel írható le.) Ennek következménye, hogy a gazdasági szaknyelv szókincse és a köznyelvi szókincs határai a közelmúltban fokozottan elmosódtak. A pénz, adó stb. szavak eddig is egyaránt a szak- és köznyelv részét képezték, a közelmúlt eseményeinek hatására viszont olyan szaknyelvi szavak is bekerültek a köznyelvi szavak közé mint a kamattámogatás, vagy a svájci frank alapú hitel. A gazdasági szaknyelv és a köznyelv ilyen jellegű változása ígéretes kutatási téma lehetne napjainkban. Kiindulási pont lehet többek között a média szerepe ebben a folyamatban, mivel egy ilyen jellegű kutatás a kvalitatív változást kvantitatív adatokkal támaszthatná alá – például ha 2008 első és második félévében a gazdasággal foglalkozó cikkek számát vizsgálnánk egy adott napilapban. A válsággal kapcsolatos kutatásokat magyar nyelvre Muráth Judit és Bagó Péter (2011, 2012), illetve Bagó Péter és Muráth Judit (2012) végeztek. A gazdasági szaknyelv horizontális (szakterület szerinti) felosztására hozza példaként Muráth Judit Ihle-Schmidt felosztását, ahol a gazdaság szaknyelvén belül (a német hagyományoknak megfelelően) megkülönböztetik a közgazdaságtan (Volkswirtschaftslehre) és az üzemgazdaságtan (Betriebswirtschaftslehre) szaknyelvét. Ezen szaknyelvek természetesen tovább bonthatók kisebb szaknyelvekre: pl. az üzemgazdaságtan – a termelés – a raktározás szaknyelvére (IhleSchmidt, idézi Muráth 2002: 88). A szaknyelvek ilyen jellegű további felosztásá-
Szaknyelv és mentális lexikon
145
nak mikéntjét befolyásolhatják a szakmai konvenciók, amelyek országonként (kultúránként) eltérhetnek. A következő alfejezetben a mentális lexikon és a szaknyelv kapcsolatát vizsgáljuk.
6.2 Szaknyelv és mentális lexikon A mentális lexikon szerveződését – mint láttuk – több tényező befolyásolja, többek között a kor, a nem, a nyelv ismeretének szintje (vö. 2. fejezet). A mentális lexikonban a fogalmak szerveződését a képzettség (szint, szakterület) is befolyásolja (Cramer 1968, Rosenzweig 1970). A mentális lexikonban a szaknyelvi elemek tárolása valószínűleg nem egyezik meg a többi elem tárolásával. Mivel valószínűsíthető, hogy a szaknyelvi elemek elsajátítása csak az anyanyelvi tudás elsajátítása után kezdődhet, feltételezhető, hogy a szakmai nyelv elemei részben hasonló módon kerülnek tárolásra, mint a második (tanult) idegen nyelv elemei, vagyis valószínűleg nem a procedurális, hanem a deklaratív memóriától függnek. (A deklaratív és procedurális memória közti különbséget a 2. fejezetben fejtettük ki röviden.)
6.2.1 Szaknyelvi asszociációk a mentális lexikonban Kis mintán kívánjuk megvizsgálni, kimutathatók-e szakemberek és nem szakemberek – jelen esetben gazdasági végzettségűek és nem gazdasági végzettségűek – mentális lexikonjának szerveződésében különbségek. A gazdasági végzettség természetesen nem garantálja, hogy az adatközlő a gazdaság területén dolgozik. A végzettség szerinti elkülönítés ennek ellenére objektívebb mérést tesz lehetővé, ugyanis a munkahely/munkakör szerinti besorolás kevésbé egyértelmű: egy multinacionális cég műszaki végzettségű beszerzője is gazdasági területen tevékenykedik, míg egy gazdasági végzettségű, középiskolában tanító tanár besorolása megkérdőjelezhető. A vizsgálathoz az Agykapocs-kutatás eredményeit használjuk fel. Jelen kutatás teljes egészében a kötet első kiadásában megjelent kutatást tartalmazza; az adatokat nem aktualizáltuk és nem egészítettük ki új asszociációkkal és elemzéssel – habár adataink száma a könyv előző megjelenéséhez képest közel megduplázódott. Ennek oka, hogy az adó- és hitelrendszerek Magyarországon (többek között a válság hatására) a mai napig átalakulóban vannak; így bármely elemzés félrevezető lehet. Az új adónemek megnevezései, illetve a hitelek
146
Szaknyelv és mentális lexikon
nevei napjainkban épülnek csak be kognitív struktúránkba (és mindennapi életünkbe), így nem látjuk biztosítottnak, hogy az új adatok elemzése pontos, illetve hiteles képet adhat a mentális lexikon szakmai szerveződéséről. Az adatok új elemzésével kapcsolatos kérdésként merülnének fel többek között az alábbiak. – Hogyan értékeljünk olyan kifejezéseket, amelyek mindennapjaink részei lettek, tehát a szaknyelvi kifejezésből köznyelvi kifejezéssé váltak? Az adatfelvétel 2008. óta folyamatosan történik; azóta megéltünk több gazdasági válságot, amelynek következtében számos szaknyelvi szó (pl. svájci frank alapú hitel) már nem egyértelműen csak a szaknyelv része. – Hogyan értékeljünk az asszociációk között egy olyan adófajtát, vagy egy intézménynevet, amely adott néven jelenleg (2013) már nem él (vö. pl. APEH – NAV)? – Folyamatosan (és jelenleg gyorsan) átalakuló rendszerekben (adó, hitel) menynyire van értelme a terminológiai viszonyok vizsgálatának? Ezen okokból új elemzések helyett a korábbi eredmények ismételt közreadása mellett döntöttünk; természetesen nem elvetve a mentális lexikon szakmai szerveződésének újabb elemzését egy későbbi időpontban. Az elmúlt években a gazdaságban és annak szókincsében bekövetkezett (felgyorsult) változások természetesen nem csak a mentális lexikon kutatásával kapcsolatban érdekesek: Muráth Judit (2011) fordítási-terminológia kérdésekkel kapcsolatos publikációjában fordítói szemszögből mutatja be, hogy a gazdasági válság, és annak szakszókincse milyen kihívások elé állítja a fordítókat. Kutatásunkban a gazdasággal összefüggő 19 szó kapcsolatait vizsgáljuk meg, közülük két szót részletesebben is elemzünk. A vizsgálathoz olyan köznyelvi szavakat választottunk, amelyek a gazdasági szaknyelvnek is részei. Valószínűsíthető, hogy olyan szavak esetében mutatható ki egyértelműen a különbség az asszociációk között, amelyeket szakemberek és nem szakemberek egyaránt ismernek. Amennyiben a vizsgálat tárgya olyan szó lenne, ami kifejezetten gazdasági szakszó (pl. fuvarparitás, inkasszó), a nem szakemberek esetében valószínűleg nem kapnánk választ. Sporttal kapcsolatos kifejezések esetében ez részben igazolást nyert (vö. Osvald 2009). Amennyiben a vizsgált szavak gazdasághoz nem köthető szavak lennének, nem lenne kimutató különbség szakemberek és nem szakemberek asszociációi között. Két szó esetében (adó, hitel) a szóasszociációk elemzése mellett a terminológiai osztályozási lehetőségeket is részletesen megvizsgáljuk, így egy újabb dimenziót, a szakma elméleti felosztását is bevonva kutatásunkba. A vizsgálati anyag 19 szava (adó, áfa, ár, bank, bankkártya, biztonság, drága, fizetés, gazdag, gazdaság, hitel, kereskedelem, manager, marketing, olcsó, reklám, tőzsde, vállalkozás, vám) valamint a nem vizsgált euró szó (lásd később)
Szaknyelv és mentális lexikon
147
az Agykapocs-rendszer első, fix 100 hívószavának részét képezi (1. Melléklet). A további 80 szó nagy többsége tág értelemben sem tekinthető gazdasági szakszónak (pl. alma, könyv, zöld). A gazdasági szakszavak véletlenszerűen kerültek elosztásra a 100 hívószó között, így csökkentve a szemantikai előfeszítés hatását. A kutatás résztvevői az Agykapocs-rendszerben regisztrált felhasználók (részletesen lásd 5. fejezet). A kutatás során azt vizsgáljuk, hogy a gazdasági jellegű hívószavakra adott válaszok esetében van-e kimutatható különbség középfokú gazdasági végzetséggel rendelkező, felsőfokú gazdasági végzetséggel rendelkező, illetve gazdasági végzettséggel nem rendelkező válaszadók válaszai között. Ehhez a válaszok kvalitatív besorolása szükséges, vagyis minden válaszszó esetében el kell dönteni, hogy az (adott összefüggésben) gazdasági jellegű válaszszónak tekinthető-e. Ezek után az eredményeket kvantitatív módon elemezzük, vagyis öszszegezzük és csoportonként összehasonlítjuk a gazdasági jellegű válaszszavak arányát. Korábban láttuk, hogy a gazdasági szaknyelvnek szintjei vannak. A vizsgált szavak egyike sem elméleti közgazdaságtani fogalom, ugyanakkor egy részük (adó, hitel, bank, marketing, reklám, tőzsde) a közgazdaságtanban is használatos. Ennek ellenére Ablonczyné Mihályka Lívia (2006) alapján a szavakat a gazdasági szaknyelv absztrakciós foka szerint nagyon alacsony, illetve alacsony absztrakciós szinthez soroljuk be. Szintén utaltunk rá, hogy a köznyelvi szókincs – szakszókincs határai elmosódottak (vö. Fóris 2005). Ez különösen igaz a gazdasági szaknyelv esetében, mivel a gazdasági szókincs egy része mindennapi szókincsünk részét képezi. A gazdasági hívószavakra adott válaszok esetében ezért különösen nehéz megállapítani, melyik szó gazdasági szaknyelvi válaszszó. Lehetőségként felmerül, hogy azon szavakat tekintjük szakszónak, amelyek valamely gazdasági szakszótár (pl. Bárányné–Mihalik 2002, Chikán–Wimmer 2003, Gazdaságpolitikai 1983) szókincsének részét képezik. Az ilyen módon történő szakszó/nem szakszó elkülönítés ugyanakkor szintén nem teljesen egyértelmű: Chikán Attila és Wimmer Ágnes fogalomtárában kb. 100 fogalmat magyaráz részletesen, míg Bárányné Szabadkai Éva és Mihalik István kötete több ezer szó helyesírását tartalmazza, pl. a pénz, bank stb. szavakat is. Ezen szavak kizárólag gazdasági szaknyelvhez történő sorolását semmi nem indokolja, ugyanakkor a gazdasági szaknyelvnek is részei, besorolásuk tehát kettős. Tovább nehezíti az adatok értékelését, hogy bizonyos válaszszavakról csak az asszociáció függvényében állapítható meg, gazdasági jellegűeke. Az adó hívószóra válaszként érkező ellenőr önmagában nem tekinthető gazdasági szakszónak, viszont adóellenőrként értelmezve a besorolás gazdasági szakszó lenne. Hasonlóan a kulcs szó nem szakszó, áfa hívószóra adott válaszként (teljes válaszszavak 6%-a) viszont gazdasági szakszó (áfa – kulcs). Ezzel szem-
148
Szaknyelv és mentális lexikon
ben a bank hívószóra a kulcs válaszszó már nem lenne gazdasági szakszóként értelmezhető. A besorolás nehézségét egy további példán keresztül szeretnénk érzékeltetni. Az euró hívószót nem elemeztük a gazdasági hívószavak között, mivel a kapott válaszszavak gazdasági besorolása különösen nehezen végezhető el: egyetlen döntés nagyságrendekkel változtatja meg az eredményeket. Amennyiben az euró hívószóra érkező összes válaszszót, amely szintén pénznem (frank, dollár, forint stb.), gazdasági válaszszónak tekintjük – ekkor gazdasági válaszszónak kell tekintenünk a pénznem válaszszót is – ezáltal a gazdasági jellegű válaszok száma a rendszerben összesen 177 (590-ből). Amennyiben a pénznemeket nem tekintjük gazdasági válaszszónak, a gazdasági jellegű válaszok száma 37. Az első esetben az arány 30%, míg a másodikban 6,2%. (Válaszszóként a pénz szót egyik esetben sem tekintjük gazdasági fogalomnak.) Szakmai szempontból mindkét besorolás indokolható. Egyértelmű besorolási szabályok hiányában a gazdasági szakszóként történő besorolást minden egyes hívószó és válaszszó esetén külön mérlegelni kell. Az ilyen módon történő besorolás természetesen nem tekinthető objektívnek, ugyanakkor a viszonylag objektív kritériumok szerinti besorolás sem teljesen egyértelmű, mint fentebb utaltunk rá. A besorolás azonban nem tekinthető véletlenszerűnek sem. A szerző több éve oktat gazdasági szaknyelvet, gazdasági végzettséggel is rendelkezik. Emellett a gazdasági szaknyelvbe történő besorolás ellenőrzését közgazdászok is elvégezték. A besorolásoknál egységességre törekedtünk, ezért bizonyos köznyelvi szavakat eleve, semmilyen összefüggésben nem tekintettünk válaszként gazdasági szakszónak. A besorolások egy-egy hívószóra adott válaszok esetében természetesen nem változtak, tehát amit gazdasági jellegű válasznak fogadtunk el laikusoktól, azt szintén gazdasági jellegű válasznak tekintettük szakemberek esetében. A besorolási probléma megfelel az asszociációk kvalitatív besorolási problémájának. Cramer (1968) szintén jelzi, hogy kvalitatív besorolás (pl. fogalmi hasonlóság/eltérés) nem történhet objektív kritériumok alapján. Ilyen esetekben a besorolást a kísérlet vezetője, a kísérlet alanya, vagy független személyek (szakértők) tehetik meg. Jelen besorolás esetében a besorolást a kísérlet vezetője végezte, majd a besorolást független személyek (köztük gazdasági szakember) ellenőrizték. Az adatok kvantifikálása során felhasználtuk Császár Róbert (2009) számításait és Excel makróit. A gazdasági szakszó válaszszavak esetén nem a konkrét számokkal, hanem a válaszok arányával (százalékos adatok) dolgoztunk. Az arányokat minden esetben a gazdasági szakszó/összes válaszszó x 100 képlettel kaptuk meg. Azért szükséges a százalékos adatokkal történő számolás, mivel az Agykapocs-rendszerben
Szaknyelv és mentális lexikon
149
(az önkéntes részvétel miatt) nem volt biztosítható, hogy minden adatközlő csoportból ugyanannyi válaszadót kérdezzünk meg. Válaszokat törölni is kénytelenek voltunk, így a válaszszavak száma minden egyes hívószó esetében eltérő (pl. a válaszadó egyik hívószóra rendes választ ad, míg egy másikra a válasz ttttt – ez utóbbi törlésre került). A vázolt probléma részben írásbeli asszociációk esetén is tapasztalható (vö. Postman–Keppel 1970). Az adatok száma és a kutatásban résztvevők jellemzői: Felsőfokú gazdasági végzettségűek Nem: nő 73%, férfi 27% Kor: 19-65 év Válaszok száma: 60-65 db Középfokú gazdasági végzettségűek Nem: nő 69%, férfi 31% Kor: 19-50 év Válaszok száma: 35-38 db Nem gazdasági végzettségűek Nem: nő 57%, férfi 43% Kor: 10-66+ év Válaszok száma: 460-490 db A nem gazdasági végzettségűek válaszainak kiszámítása = Összes válasz – (felsőfokú gazdasági végzettségűek válaszai + középfokú gazdasági végzettségűek válaszai). A hívószavakat három csoportra osztjuk, amelyekkel megpróbáljuk meghatározni, hogy adott szó mennyire tekinthető gazdasági szakszónak. A három csoport: – köznyelvben használt szavak, amelyek a gazdasági élethez minimálisan kapcsolódnak, inkább köznyelvi szavaknak tekintendők (K): biztonság, drága, gazdag, olcsó; – köznyelvben és gazdasági szaknyelvben használt szavak, melyek a gazdasági életben is használatosak, de a köznyelvnek is részei, a mindennapokban használjuk (GK): adó, ár, bank, bankkártya, fizetés, gazdaság, hitel, reklám; – inkább gazdasági szakszó, mint köznyelvi szó (ettől függetlenül a köznyelvben is ismert) (G): áfa, kereskedelem, manager, marketing, tőzsde, vállalkozás, vám. Az Agykapocs-rendszer részletes lekérdezés funkciójával az adatokat lekérdeztük, majd a hívószavakra kapott válaszokat elemeztük. A válaszszavak
150
Szaknyelv és mentális lexikon
eloszlását az adatok előzetes vizsgálata alapján három csoportba osztottuk, vagyis külön kezeljük a 10% alatti, a 10-25 % közötti és a 25 % feletti válaszarányt. 1. A gazdasági jellegűnek tekinthető válaszok arányai, felsőfokú gazdasági végzettségűeknél, csökkenő sorrendben: Hívószó Áfa Tőzsde Vállalkozás Kereskedelem Ár Hitel Bank Adó Vám Marketing Gazdaság Bankkártya Reklám Manager Olcsó Biztonság Fizetés Gazdag Drága
Gazd. jell. válaszok 61,11 % 53,96 % 47,54 % 37,50 % 33,93 % 31,25 % 30,65 % 28,81 % 28,07 % 23,26 % 21,43 % 14,29 % 13,11 % 8,51 % 6,48 % 3,17 % 1,75 % 1,69 % 1,67 %
Kategória G G G G GK GK GK GK G G GK GK GK G K K GK K K
6. táblázat. A gazdasági jellegűnek tekinthető válaszok arányai, felsőfokú gazdasági végzettségűeknél, csökkenő sorrendben
A táblázatból kiolvasható, hogy a köznyelvi szavak (K) esetén csak kevés kapcsolat volt kimutatható szaknyelvi szavakkal. A GK és G csoportokra adott válaszok eloszlása nem mutat egyöntetű képet: a G csoportra adott válaszok között ugyan több a szaknyelvinek tekinthető asszociáció, ugyanakkor van olyan G csoportbeli szó (manager) amire a gazdasági jellegű válaszok aránya 10% alatti. Gazdasági jellegű válaszok megoszlása: 25% felett: 9 10-25% között: 4 10% alatt: 6
Szaknyelv és mentális lexikon
151
2. A gazdasági jellegűnek tekinthető válaszok arányai, középfokú gazdasági végzettségűeknél csökkenő sorrendben: Hívószó Áfa Bank Tőzsde Vállalkozás Kereskedelem Ár Vám Gazdaság Adó Hitel Marketing Bankkártya Manager Reklám Drága Olcsó Fizetés Biztonság Gazdag
Gazd. jell. válaszok 61,11 % 43,24 % 43,24 % 37,84 % 33,33 % 30,56 % 27,03 % 25,00 % 24,32 % 24,30 % 24,32 % 16,22 % 13,51 % 13,51 % 5,56 % 5,41 % 2,70 % 0% 0%
Kategória G GK G G G GK G GK GK GK G GK G GK K K GK K K
7. táblázat. A gazdasági jellegűnek tekinthető válaszok arányai, középfokú gazdasági végzettségűeknél, csökkenő sorrendben
Középfokú végzettségűek válaszainak megoszlása a felsőfokú gazdasági végzettségűekhez hasonló mintát mutat: a K csoport esetében a szaknyelvi szavakra történő asszociációk száma 0-5,56%. A G és a GK csoportokra adott válaszok nem mutatnak egységes képet: több esetben a GK csoportba sorolt hívószavak inkább hívtak elő gazdasági szakszavakat, mint a G csoport szavai. Gazdasági jellegű válaszok megoszlása: 25% felett: 8 10-25% között: 6 10% alatt: 5
152
Szaknyelv és mentális lexikon
3. A gazdasági jellegűnek tekinthető válaszok arányai nem gazdasági végzettségűeknél, csökkenő sorrendben: Hívószó Tőzsde Bank Kereskedelem Marketing Áfa Hitel Adó Vállalkozás Bankkártya Vám Ár Manager Olcsó Fizetés Gazdag Drága Gazdaság Biztonság Reklám
Gazd. jell. válaszok 33,00 % 30,26 % 28,99 % 23,30 % 21,04 % 16,91 % 16,39 % 16,11 % 15,15 % 12,67 % 9,01 % 6,55 % 3,37 % 3,02 % 2,77 % 1,21 % 0,64 % 0,20 % 0,20 %
Kategória G GK G G G GK GK G GK G GK G K GK K K GK K GK
8. táblázat. A gazdasági jellegűnek tekinthető válaszok arányai nem gazdasági végzettségűeknél, csökkenő sorrendben
A nem gazdasági végzettségűek esetén az eredmények eloszlása kisebb mértékben követi az előző mintát: a legkevesebb gazdasági válaszszót előhívó szó a GK kategóriába tartozik. A K csoport szavai ugyan többnyire kevés gazdasági jellegű asszociációt hívtak elő, a G és GK csoportokra adott válaszok viszont vegyes képet mutatnak. A vegyes kép mellett számszerű eltérést is megfigyelhetünk: a gazdasági szaknyelvi jellegű válaszok száma kevesebb, mint a gazdasági végzettségűek esetében. Gazdasági jellegű válaszok megoszlása: 25% felett: 3 10-25% között: 7 10% alatt: 9
Szaknyelv és mentális lexikon
153
A 9. táblázat a felsőfokú, illetve középfokú gazdasági végzettségűek, és a nem gazdasági végzettségűek válaszainak különbségét mutatja: Hívószó
Felsőf. Nem gazd. végz. végz. Áfa 61,11% 21,04% Vállalkozás 47,54% 16,11% Ár 33,93% 9,01% Tőzsde 53,96% 33,00% Gazdaság 21,43% 0,64% Vám 28,07% 12,67% Hitel 31,25% 16,91% Reklám 13,11% 0,20% Adó 28,81% 16,39% Kereskedelem 37,50% 28,99% Olcsó 6,48% 3,37% Biztonság 3,17% 0,20% Manager 8,51% 6,55% Drága 1,67% 1,21% Bank 30,65% 30,26% Marketing 23,26% 23,30% Bankkártya 14,29% 15,15% Gazdag 1,69% 2,77% Fizetés 1,75% 3,02%
Eltérés 40,07% 31,43% 24,92% 20,96% 20,79% 15,40% 14,34% 12,91% 12,42% 8,51% 3,11% 2,97% 1,96% 0,46% 0,39% -0,04% -0,86% -1,08% -1,27%
Hívószó
Középf. Nem gazd. végz.. végz. Áfa 61,11% 21,04% Gazdaság 25,00% 0,64% Vállalkozás 37,84% 16,11% Ár 30,56% 9,01% Vám 27,03% 12,67% Reklám 13,51% 0,20% Bank 43,24% 30,26% Tőzsde 43,24% 33,00% Adó 24,32% 16,39% Hitel 24,30% 16,91% Manager 13,51% 6,55% Drága 5,56% 1,21% Kereskedelem 33,33% 28,99% Olcsó 5,41% 3,37% Bankkártya 16,22% 15,15% Marketing 24,32% 23,30% Biztonság 0% 0,20% Fizetés 2,70% 3,02% Gazdag 0% 2,77%
Eltérés 40,07% 24,36% 21,73% 21,55% 14,36% 13,31% 12,98% 10,24% 7,93% 7,39% 6,96% 4,35% 4,34% 2,04% 1,07% 1,02% -0,20% -0,32% -2,77%
9. táblázat. A felsőfokú, illetve a középfokú gazdasági végzettségűek, és a nem gazdasági végzettségűek válaszainak különbsége gazdasági hívószavak esetében
A legnagyobb eltérések mindkét csoport esetében a GK és G kategória szavai között mutathatók ki. Az eltérések egyértelműen azt mutatják, hogy gazdasági végzettségű válaszadók nagyobb számban asszociálnak szakszavakra, mint nem gazdasági végzettségűek. Az eltérés általában annál nagyobb, minél inkább gazdasági jellegű hívószóról van szó. Közép- és felsőfokú végzettségűek asszociációi között nem mutathatók ki ilyen egyértelmű különbségek. Ez utóbbi eredményt – vagyis azt, hogy nem sikerült különbséget kimutatnunk – két tényező is befolyásolhatta. Egyrészt a gazdasági végzettség nem szükségszerűen jelent gazdasági jellegű munkát, vagyis elképzelhető, hogy a válaszadó évek óta nem a gazdaság területén dolgozik. Így – habár végzettsége gazdasági – mentális lexikonjának szerveződésében életének jelen szakaszában nem elsősorban gazdasági végzettsége, hanem például aktuális munkájának befolyása érhető tetten. Másrészt – mint már utaltunk rá – a végzettség megadott szintje nem történhetett egzakt, pontos formában. Az asszociációs válaszokat megadók egy része középfokú gazdasági
154
Szaknyelv és mentális lexikon
végzettségű, ugyanakkor az adatfelvétel idején valamely felsőoktatási intézmény gazdálkodási szakos hallgatója volt. Az általuk megadott asszociációk – habár a középfokú végzettségűekével együtt jelennek meg a felmérésben – valószínűleg egy átmeneti állapotot tükröznek, amennyiben elfogadjuk, hogy felsőoktatási tanulmányok eredményeként a szakmaspecifikus fogalmak közötti kapcsolatok átrendeződnek. Habár az eredmények megfelelnek a vártaknak, utalnunk kell rá, hogy viszonylag kevés a hasonló jellegű, a mentális lexikon szakmai szerveződését vizsgáló empirikus kutatás, ezért az eredmények (bármennyire is „logikusak” és prognosztizálhatóak) újdonságnak számítanak. Ahogy korábban utaltunk rá, a prototípus-elmélet kapcsán feltételezte Rosch a bázis szint meglétét. A bázis szint alatti szint az a szint, amely a nem szakemberek számára még részben ismert, a hierarchia további szintjei többnyire csak szakemberek számára ismertek (Löbner 2003). Jelen asszociációs tesztben az adó hívószó feltételezhetően a bázis szintet képviseli, míg az áfa hívószó a bázis szint alatti szint tagja. A bázis és alárendelt szintek szaktudással kapcsolatos öszszefüggéseit az asszociációs válaszok is mutatják: szakemberek körében az áfa hívószó 61-61%-ban hív elő gazdasági válaszszavakat, míg az adó csak lényegesen kisebb, 24, illetve 28 százalékban. A nem gazdasági végzettségűek válaszait is figyelembe véve a sorrend megmarad ugyan, viszont a különbség lényegesen kisebb lesz: 21% az áfa-ra, 16% az adó-ra. Az adat azt látszik alátámasztani, hogy a bázis szint alatt elhelyezkedő szó esetében a kapcsolatok a szakmai szavakhoz lényegesen erősebbek, mint a bázis szint szavai esetében. További kérdés a bázis szint érvényességének hatóköre, ugyanis elképzelhető, hogy a bázis szint különbözik szakemberek és nem szakemberek esetében. Ezzel kapcsolatban Kövecses Zoltán és Benczes Réka (2010) leírják, hogy más lesz a bázis kategóriája egy növényre egy városi embernek (fa), és egy természethez közelebb álló embernek (tölgy, bükk). Valószínűleg ugyanezen tényezők szerepet játszanak a szakmai tudás szerveződésében is: minél mélyebb a szaktudás, annál specifikusabb szavakat tartalmaz a bázis szint; illetve feltételezhetjük, hogy annál több kapcsolat alakulhat ki bázis szintű szavak között is. Szakemberek és nem szakemberek mentális lexikonjának vizsgálatát sportolók körében végezte el Osvald Mária (2009): szóasszociációs vizsgálatokkal a sportolók és nem sportolók válaszaiban kimutatható különbségeket kutatta. A vizsgálat négy, egyenként 25 fős csoportban történt: 1. sportolók (akik egy sportágat versenyszerűen űznek); 2. nem sportolók (sportegyesületben nem sportolnak); 3. edzők; 4. tanárok (nem sportolnak, nem edzők). A hívószavak egy része sporttal szorosan kapcsolatban lévő, egyértelműen sportszakszó (pl. EPO, pást, cukahara), egy része a köznapi nyelvben is használt
Szaknyelv és mentális lexikon
155
szó (pl. verseny, fáradtság, csavar). A kísérlet során a szavak között szemantikai előfeszítés valószínűsíthető, mivel a 100 hívószó mindegyike vagy sport szakkifejezés, vagy sportban és köznyelvben egyaránt használt szó. Osvald Mária szakdolgozata keretében 20 hívószó (10 sport szakszó, és 10 köznyelvben is használt szó) válaszainak elemzését végezte el. A sport szakszavak esetében hat szónál (EPO, bukóforduló, hazafutás, tatami, pást, cukahara) a sportolók és az edzők válaszszóként több sporttal kapcsolatos szakkifejezést adtak meg, míg négy szó esetében (Wimbledon, repülőrajt, asszó, rittberger) nem volt kimutatható különbség. A köznyelvben is használatos, sporttal kapcsolatos szavak esetében nem volt releváns eltérés: három esetben (táplálékkiegészítő, torony, verseny) a nem sportolók/tanárok adtak több sportszaknyelvi válaszszót; két esetben (fáradtság, csavar) a sportolók/edzők; öt esetben (zsákol, 7 méteres, óvni, KO, drukker) nem volt kimutatható különbség. A korosztályok válaszait egymással összevetve további összefüggések is megállapíthatók: a tatami és rittberger hívószavaknál különbségek voltak kimutathatók kor függvényében, nem kizárólag „szakmaiság” alapján. Az idősebb korosztály (tanárok, edzők, átlagéletkor 43 év) lényegesen több (tatami 45, rittberger 44) sporttal kapcsolatos válaszszót aktiváltak, mint a fiatalok (sportolók, nem sportolók, átlagéletkor 25,5 év; tatami 28, rittberger 29). A nincs válasz „kategória” összes hívószót figyelembe vevő elemzése szintén rámutat, hogy a szaknyelvi szókincs a korral is összefügg: nem sportolóknál 344 db, sportolóknál 275 db, tanárokál 137 db, edzőknél 79 db esetben nem érkezett válasz a hívószóra (részletesebben Kovács–Osvald 2010). Osvald Mária kutatásában a hívószavak között szerepeltek kifejezetten sport szakszavak (asszó, rittberger – továbbiakban erős szaknyelvi szavak) és olyan gyenge szaknyelvi szavak, amelyek a köznyelvnek is részei (KO, drukker). A válaszok eloszlását valószínűleg szemantikai előfeszítés befolyásolta. Jelen kutatásban (más szakterületen) gyenge szaknyelvi szavak (adó, hitel) és köznyelvi szavak (drága, olcsó) szerepeltek, szemantikai előfeszítés valószínűleg nem befolyásolta a válaszokat.
6.2.2 Szóasszociációk és terminológiai kutatások A két, részletesebben elemzendő szó (adó, hitel) esetében elvégeztük a bejövő kapcsolatok vizsgálatát is, vagyis megnéztük, mely hívószavak tekinthetők gazdasági hívószónak azok közül, amelyekre a válaszszó az adó, illetve a hitel volt.
156
Szaknyelv és mentális lexikon
Az adó szó válaszként összesen 358 esetben fordult elő, ebből gazdasági hívószó 292 db: a gazdasági hívószavak aránya 81,2%. Gazdasági jellegű hívószónak tekintettük többek között a járulék, az APEH és az áfa szavakat. A hitel szó válaszként összesen 195 esetben fordult elő, ebből gazdasági hívószó 154 db: a gazdasági hívószavak aránya 78,9%. Gazdasági jellegű hívószónak tekintettük többek között a tőzsde, a bankkártya és a törlesztés szavakat. A szóasszociációs kutatások adatait két szó esetében (hitel, bank) terminológiai rendszerekkel is összehasonlítjuk. A terminológiai megközelítést szükségesnek tartjuk, mivel a terminológia felosztás a gazdaságelmélet szakmai felosztásának feleltethető meg, tehát az eddigi pszicholingvisztikai elemzés mellett a szakma felosztását is bevonjuk a vizsgálatba.
6.2.2.1 A hitelek csoportosítása A hitel szó felosztása esetén több esetben kölcsönöket hozunk példának. A kölcsön és a hitel sok szempontból megfeleltethető egymásnak, a kölcsönöket a gyakorlatban a hitelek felosztásába sorolják be. A két szó jelentése ugyanakkor sokszor a szaknyelvben is összemosódik (vö. Wirtschaft 2004: 390, 399). Hitel: - pénz rendelkezésre tartása - a fel nem használt összeg után nem kamatot fizetünk, hanem rendelkezésre tartási jutalékot
Kölcsön: - tényleges pénzfolyósítás - kamatot fizetünk a teljes összeg után, amennyiben a szerződés kamatot ír elő - általában egy összegben folyósítják
A csoportosítások a hitel esetében a vezető bankok honlapjai alapján történt. Az itt leírtakon kívül természetesen más felosztások is elképzelhetőek. (A felhasznált honlapok listája az irodalomjegyzékben található.) 1. Hitelfelvevők köre szerint: hitelfelvevők köre szerint vállalati hitel
rulírozó hitel
forgóeszköz hitel
lakossági hitel
beruházási hitel
áthidalási hitel
fogyasztói hitel
áruvásárlási kölcsön
Szaknyelv és mentális lexikon
157
2. Lejárat szerint: lejárat szerint rövid lejáratú hitel (éven belüli)
közép lejáratú hitel (1-5 év lejáratú)
Például: - forgóeszközhitel - folyószámlahitel
- beruházási hitel - személyi kölcsön
hosszú lejáratú hitel (5 év < lejáratú)
- beruházási hitel - személyi kölcsön
3. Fedezet szerint: fedezet szerint
fedezet nélküli (bianko) hitel
fedezettel bíró hitel
személyi biztosítékkal rendelkező hitel
dologi biztosítékkal rendelkező hitel
Például: - kártya-típusú hitelek - személyi kölcsön
- beruházási hitelek - bankgarancia
- óvadék - követelés engedményezés - folyószámlahitel - személyi kölcsön - jelzáloghitelek - beruházási hitelek (Személyi biztosíték: az adós helyett más személy vállal fizetést, pl. kezesség, garancia.)
4. Hitelek tartalma szerint: hitel tartalma szerint
pénzhitel személyi hitel Például: - bianko hitel
reálhitel
- lombard hitel - jelzáloghitel
kötelezettségvállalási hitelek kauciós hitelek
akkreditív
bankgarancia
158
Szaknyelv és mentális lexikon
5. Hiteltörlesztés ideje alapján: törlesztés alapján
egy összegben a futamidő végén
annuitásos törlesztés
szerződéses feltételeknek megfelelően változó
6. Visszafizetés forrása szerint: visszafizetés forrása
árbevétel
egyéb
jövedelem
7. Hitel folyósítása szerint: folyósítás módja szerint
készpénzben
jóváírás pénzforgalmi számlán
hitellevél kiadása
közvetlenül a tartozás kiegyenlítése
- személyi kölcsön - beruházási hitel
- bankgarancia
- hitelkiváltás
Például:
8. Hiteltörlesztés módja szerint: törlesztés módja szerint
készpénzben
utalással
csoportos beszedéssel
Szaknyelv és mentális lexikon
159
9. Hiteltörlesztés gyakorisága szerint: törlesztés gyakorisága szerint
havonta
negyedévente
félévente
évente
szerződéses feltételeknek megfelelően
10. Törlesztés formái szerint: törlesztés formája szerint
előtörlesztés
szerződésben előírt feltételek szerint
prolongáció
A hitelfajták vertikálisan, a korábban ismertetett módszerrel táblázatban is rendszerezhetők a bináris szemantikai jegyeken alapuló osztályozás (binäre Merkmalsemantik) mintájára.
lakossági / vállalati
rövid / közép / hosszú lejáratú
pénzhitel / fedezet támogatott / kötelezettségnélkül / nem támovállalási fedezettel gatott hitelek
rulírozó hitel
-/+
+/-/-
+/+
+/-
+/+
forgóeszközhitel
-/+
+/-/-
-/+
+/-
+/+
beruházási hitel áthidalási kölcsön
-/+
-/+/+
-/+
+/-
+/+
-/+
+/+/+
-/+
+/-
+/+
fogyasztói hitel áruvásárlási kölcsön
+/-
+/+/+
-/+
+/-
+/+
+/-
+/+/+
+/+
+/-
-/+
hitelkártya
+/+
+/+/-
+/+
+/-
-/+
jelzáloghitel
+/+
+/+/+
-/+
+/-
+/+
akkreditív
-/+
+/+/+
-/+
-/+
-/+
bankgarancia
-/+
+/+/+
-/+
-/+
-/+
10. táblázat. A hitelek osztályozása
160
Szaknyelv és mentális lexikon
A szóasszociációs válaszok közül a felosztásoknak megfelelő válaszok száma, vagyis hitelfajtára utaló asszociáció összesen 10 db jelzálog (3 db), lakás (3 db), Széchenyi (2 db), lízing (1 db), banki (1 db). A Széchenyi válaszszó esetében a hitelfajtára utalás (Széchenyi-hitel) nem egyértelmű, mivel utalhat Szécheny Istvánra mint személyre is, a Hitel c. könyv szerzőjére. A 10 db válaszból kettő érkezett gazdasági végzettségűektől (felsőfok): jelzálog (1 db), banki (1 db).
6.2.2.2 Az adók csoportosítása Adók csoportosítását szintén honlapok segítségével végeztük el. Az adók aktuális, pontos csoportosítása, az egyes kategóriákba sorolás, esetleg maga az adó megléte és/vagy elnevezése elképzelhető, hogy változott a közelmúltban. A felosztás, illetve besorolás tehát nem tekintendő abszolút érvényűnek, inkább pillanatfelvételnek egy állandóan változó rendszerben. Mivel azonban nem az adók mikro-, vagy makroökonómiai vizsgálata, illetve közgazdaságtani elemzése a célunk, csupán példaként említjük csoportosítási lehetőségeiket, ezért úgy gondoljuk az aktuális, adott napon érvényes „adótérkép” pontos visszaadása nem feladatunk. Az elemzett asszociációs adatok felvétele, valamint az alább olvasható csoportosítások megalkotása ugyanarra az időszakra (2008-2009) esett. A gazdasági életben jellemző szakmai besorolás alapján nemcsak az adókat, hanem sok esetben járulékokat, díjakat is az adók közé soroltunk példaként. 1. Tárgyuk szerint: tárgya szerint
vagyont terhelő adó
Például: - gépjárműadó - építményadó - luxusadó - telekadó
fogyasztást terhelő adó
- általános forgalmi adó - jövedéki adó - játékadó
jövedelmet terhelő adó
- szja - társasági adó - EVA
Szaknyelv és mentális lexikon
161
2. Terhelési jellegük szerint: terhelési jellegük szerint
közvetett / indirekt adók
közvetlen / direkt adók
Például: - személyi jövedelemadó - társasági adó - vagyoni típusú adók
- általános forgalmi adó - jövedéki adó
3. Jogosultságuk szerint: jogosultságuk szerint
központi adók
helyi adók
vegyes adók
Például: - általános forgalmi adó - jövedéki adó - személyi jövedelemadó - egyszerűsített vállalkozói adó
vagyoni típusú adók
Például: - gépjárműadó - építményadó - luxusadó - telekadó
kommunális jellegű adók
- magánszemélyek kommunális adója - vállalkozók kommunális adója
helyi iparűzési adó
idegenforgalmi adók
162
Szaknyelv és mentális lexikon
4. Rendeltetésük szerint: rendeltetésük szerint
általános adók
céladók
- személyi jövedelemadó - társasági adó - fogyasztási adók
- szakképzési hozzájárulás - rehabilitációs hozzájárulás - innovációs járulék - környezetterhelési díj - kulturális járulék - vízkészlet járulék - erdőfenntartási járulék
Például:
5. Adóalanyok szerint: adóalanyok szerint
természetes személyeket terhelő adó
jogi személyek, egyéb szervezetek által fizetendő adó
Például: - személyi jövedelemadó - magánszemélyek kommunális adója - munkavállalói járulék
- társasági adó - vállalkozók kommunális adója
6. Adómegállapítás módja szerint: adómegállapítás módja szerint
önadózással
kivetéssel
levonással
beszedéssel
Szaknyelv és mentális lexikon
163
7. Adórendszerben betöltött szerepük alapján: folyósítás módja szerint rendkívüli adók
rendes adók
8. Üzemgazdasági hatásuk szerint: üzemgazdasági hatásuk szerint
költségeket befolyásoló adók
árbevételt érintő adók
jövedelemre, nyereségre ható adók
visszamaradó nyereség felhasználását alakító adók
Például: - cégautóadó - energiaadó
- általános forgalmi adó - jövedéki adó
- társasági adó - osztalékadó - személyi jövedelemadó
9. Adóztatás jogereje szerint: adózás jogereje szerint fakultatív
kötelező
10. Adókulcs alapján: adókulcs alapján
progresszív adó lineáris
proporcionális adó
sávos
Például: - személyi jövedelemadó
- általános forgalmi adó
degresszív adó
164
Szaknyelv és mentális lexikon
11. Adó fizetési szakaszai alapján: fizetés szakaszai alapján
egyfázisú
többfázisú
összfázisú
A szóasszociációs válaszok közül a felosztásoknak megfelelő válaszok száma, vagyis adófajtára utaló asszociáció összesen 32 db: áfa (25 db), szja (4 db: szja, személyi jövedelem, személy jövedelemadó formában), súlyadó (1 db), EVA (1 db), kamat (1 db, kamatadóként értelmezve). A 32 db válaszból kilenc érkezett gazdasági végzettségűektől: felsőfok: áfa (3 db); középfok: áfa (3 db) szja (3 db). A lehetséges, gazdaságelméletben elfogadott osztályozások elemei a két fogalom esetében a hívószavakra adott válaszokban nem voltak kimutathatók. Az adó hívószóra adott válaszokban a számos létező adófajta és besorolása közül csupán kettő jelenik meg, a hitel szó esetében szintén csak két hitelfajta jelent meg szakemberek asszociációiban (nem szakemberek esetében összesen öt-öt hitel, illetve adófajta jelent meg). Az eredmények arra engednek következtetni, hogy a fogalmak szakmai, elméleti csoportosítása nem minden esetben felel meg a fogalmak mentális lexikonban történő csoportosításának. Az elméleti felosztás semmit nem árul el a felosztásban szereplő szempontok gyakorlati hasznáról, arról, hogy az egyes csoportokba sorolt fogalmak közül melyek ismertebbek vagy nem ismertek, melyeknek van több és melyeknek kevesebb gyakorlati jelentősége. Az elméleti rendszerek és azok „mentális” leképezése között kimutatott különbség további vizsgálatokat igényel.
6.3 Összegzés Fenti kutatás, valamint Osvald (2009) vizsgálatának eredményeként valószínűsíthető, hogy a mentális lexikonban a szakszavak kapcsolataikat tekintve egyfajta kontinuum mentén helyezkednek el: – a köznyelvi szavak többnyire köznyelvi szavakat hívnak elő; – a köznyelvhez és szaknyelvhez egyaránt köthető szavak (gyenge szakszavak) mintegy átmenetet képeznek, azaz egyaránt kapcsolódnak szakmai fogalmak-
Szaknyelv és mentális lexikon
165
hoz és köznyelvi szavakhoz, amelyek közül a kontextus (előfeszítés) határozza meg, hogy szakmai szavakra vagy köznyelvi szavakra asszociálunk-e; – a szinte kizárólag szaknyelvhez köthető szavak (erős szakszavak) esetében a kapcsolatok a szakszókincsen belül erősebbek. A két kutatás alapján kijelenthető, hogy a mentális lexikon rendezettségét a szakmai tudás befolyásolja: a szaktudás mélyülésével a szakszókincsen belül is változnak a kapcsolatok: több kapcsolat alakul ki a szaknyelven belül, illetve a kapcsolatok erősebbek lesznek. A kapcsolatok felépítését a szakszókincsen belül a válaszadó élettapasztalata (kora) is befolyásolja. A szakmai ismeretek bővülésével együtt természetesen nemcsak a szakszókincs, hanem a szakma enciklopedikus ismerete is bővül. Kijelenthetjük továbbá a két szó terminológiai besorolási lehetőségeinek vizsgálata alapján, hogy – pszicholingvisztikai megközelítésben – a szaknyelvek oktatásához és kutatásához nem elégséges csak a szaknyelvi szavak terminológiai jellegű vizsgálata és rendszerezése: a szaknyelvi kutatásoknak része kell, hogy legyen szaknyelv és köznyelv kapcsolatának vizsgálata, ami többek között szóaszszociációs vizsgálatokkal végezhető el. A szaknyelv és köznyelv közös területeinek kutatása azért szükséges, mivel a szakmai szókincset (többnyire) a már meglévő köznyelvi szókincsbe kell beilleszteni. Szaknyelv oktatása során tehát az oktatás célszerű sorrendje a következő: – a gyenge szakszavak meglétének tudatosítása; – szaknyelvi és köznyelvi jelentésük és használatbeli eltéréseik bemutatása; – a gyenge szakszavak szaknyelven belüli kapcsolatainak kialakítása; – erős szakszavak bevezetése, definiálása; – az erős szakszavak gyenge szakszavakhoz és köznyelvhez kapcsolása; – erős szakszavak közötti kapcsolatok kialakítása. A 20. ábra a szakszavak Felber–Schaeder-féle (1999) felosztásának módosítási lehetőségét mutatja a szóasszociációs kutatások eredményei alapján. Az eredmények arra is utalnak, mennyire fontos szakmai ismeretek oktatása közben a szakszókincs megfelelő szintű elsajátítása. A szakmai ismeretek a szakszókincs (előzetes) ismeretében már középiskolai, vagy felsőfokú tanulmányok során összefüggőbb rendszert alkothat(ná)nak, így nemcsak a korral, a szakmai tapasztalatok bővülésének hatására alakulnának ki a megfelelő (szakemberre jellemző) kapcsolatok a „szakmai” mentális lexikonban.
166
Szaknyelv és mentális lexikon
20. ábra. Szakszavak egy lehetséges osztályozása Felber–Schaeder 1999: 1735 és Muráth Judit 2007: 158 felosztásának módosításával
Szaknyelv és mentális lexikon
167
Jelenleg a szakmai képzések esetében nem jellemző, hogy a magyar nyelvű szakszókincset oktatnák hallgatóknak/tanulóknak. A szakmai szókincs elsajátítása legfeljebb egy-egy tanóra/szeminárium keretein belül, adott óra anyaga alapján történik, a szisztematikus rendszerezés, az összefüggések bemutatása többnyire elmarad. A szakmai ismeretek mindennapi ismeretekhez kapcsolása (pl. egyszerű, gyakorlati példákkal) szintén nem jellemző. Szaknyelvi kutatások és a mentális lexikon szakmai szerveződésének vizsgálata alapján valószínűsíthető, hogy a szakmai mentális lexikon szervezettsége eltér a mentális lexikon „általános” szerveződésétől: jelen esetben ugyanis tanult elemek egymáshoz rendelése történik, többnyire logikai kapcsolatok alapján (Navracsics Judit szíves szóbeli közlése). Valószínűsíthető továbbá, hogy a szaknyelvi elemek tárolása esetén a deklaratív memóriának jut nagyobb szerep. A jelenség hasonló lehet, mint a második nyelvet tanulók esetében. Ahogy korábban jeleztük, fogalmi szerveződés szempontjából hangsúlyos kérdés, hogy a tárolás (és az előhívás) az egynyelvű és a kétnyelvű személyek esetében azonos módon történik-e. Mint említettük, Ullman (2001a, 2001b) a procedurális és deklaratív memóriarendszereket különíti el: előbbi tartalmi tudást, tényeket, valamint lexikai ismereteket tárol, utóbbi motoros kognitív folyamatokat, nyelvtani rendszereket rögzít. Korai kétnyelvűek esetében mindkét nyelvet mindkét rendszer kiszolgálja, ellenben késői kétnyelvűeknél és nyelvtanulóknál a második nyelv esetében nemcsak a mentális lexikont, hanem a mentális nyelvtant is a deklaratív memória szolgálja ki, esetükben tehát a két nyelv nyelvtani kiszolgálása eltérő (Navracsics 2007). Szaknyelvek tárolása valószínűleg hasonló módon történik, mint a késői nyelvtanulók esetében, azaz valószínűsíthető, hogy a deklaratív memória kap kiemelt szerepet a logikai kapcsolatokkal egymáshoz rendelt elemek tárolásában (Navracsics Judit szíves szóbeli közlése).
168
Szaknyelv és mentális lexikon
7. HÁLÓZATOK A MENTÁLIS LEXIKONBAN Az Agykapocs-kutatás, valamint a kutatásból nyert adatok egy lehetséges felhasználásának bemutatása után a mentális lexikon hálózatos tulajdonságait kívánjuk vizsgálni. A fejezetben a mentális lexikon hálózatos felépítését több szempontból elemezzük. Először igazoljuk, hogy a mentális lexikon kapcsolatainak súlyozott és irányított gráfokkal történő ábrázolása helyesen mutatja be a mentális lexikon felépítését, ezt követően a mentális lexikon kisvilág-karakterét jellemezzük, majd megvizsgáljuk, hogy a mentális lexikon kapcsolatainak eloszlását a skálafüggetlen hálózatok jellemzik-e a legjobban. Ezek után a mentális lexikon összetett, hálózatos felépítésével kapcsolatban hipotéziseket fogalmazunk meg, valamint megemlítünk olyan gyakorlati alkalmazási lehetőségeket, amelyek a mentális lexikon hálózatos felépítésének eredményeit használhatják fel. Az irányított kapcsolatok esetében hozott példák, illetve az irányított kapcsolatokkal összefüggő bizonyos következtetések, valamint a mentális lexikon hálózatos tulajdonságait (skálafüggetlenség és kisvilág-karakter) leíró következtetések egy része átdolgozott formában korábban publikálásra kerültek (Kovács 2009a, Kovács 2010b). A komplex hálózatos vizsgálatok eredményei nagyrészt Orosz Katalin és Pollner Péter munkáját dicsérik; az eredmények egy részét már megjelentettük (Kovács–Orosz–Pollner 2012, Orosz–Kovács–Pollner 2012)
7.1 Súlyozott kapcsolatok a mentális lexikonban A mentális lexikon kapcsolatai esetén a súlyozott kapcsolatok megléte elfogadható. A szóasszociációs normák megléte eleve feltételezi, hogy a hívószavak és a válaszszavak esetén bizonyos kapcsolatok erősebbek, más kapcsolatok gyengébbek: az erősebb kapcsolatok eredményezik a normák kialakulását A kapcsolatok erőssége és gyengesége a kapcsolat fajtájától is függhet (Cruse 2004). Lengyel (2009a) a kapcsolat erőssége és fajtája közötti összefüggéseket az édes hívószó esetében három szinten határozza meg: az első, legerősebb kapcsolati szint a közvetlen percepcióval kapcsolatos (cukor, csoki) a második legerősebb kapcsolati szint az általánosítás (íz, édesség) a harmadik a szociokulturális alapokon nyugvó kapcsolatok (anya, csók).
170
Hálózatok a mentális lexikonban
Az asszociációk egy része anyanyelvi beszélők esetében (kortól, nemtől függetlenül) előrejelezhető, ezekből szóasszociációs normák állíthatók fel (Postman–Keppel 1970, magyar nyelvre Balló 1983, Jagusztinné 1985, Lengyel 2008c). A normák egy adott szólista esetében (általában 100-1000 szó) tartalmazzák az előhívott válaszokat, gyakorisági sorrendben. A normák hátránya, hogy viszonylag kevés hívószó normáit tartalmazzák, illetve, hogy az asszociációs normákat egy adott időpontban rögzítik. Az adott időpontban leggyakoribb válaszok valamilyen formában a társadalom, az aktuális világ képét is tükrözik. Az 1983-ban és a 2004-ben, 18-24 éves alanyokkal végzett szóasszociációs kutatások eredményeit összevetve jól láthatóak a különbségek. 1983-ban a kalapács hívószóra a sarló, a szombatra a szabad, a termelésre a munka, az ünnepre a május elseje volt a leggyakoribb válasz, míg 2004-ben a kalapácsra a szög, a szombatra a vasárnap, a termelésre a gazdaság és az ünnepre a Karácsony volt a válasz (vö. Lengyel 2005). Még nagyobb eltéréseket láthatunk az asszociációkban tükröződő világképről, ha hosszabb idő telik el két adatfelvétel között, illetve ha nem normákat vizsgálunk, hanem szabad asszociációk adatait elemezzük (vö. Csomai 2012). A normák ugyan egy közösség asszociációinak tekinthetők, ugyanakkor a normák leggyakoribb elemei utalnak arra is, mely kapcsolatok lehetnek a legerősebbek (átlagosan) az egyén mentális lexikonjában. A normák (habár fontos kiindulási pontok kutatásokban) oktatási és egyéb célra viszonylag nehezen használhatók, hiszen jellegükből adódóan csak kis számú szóra tartalmazzák az adott időpontban leggyakoribb asszociációkat. Gyakorlati célokra jobban használhatók a szóasszociációs szótárak (vö. Lengyel 2010), ezek viszont jelenleg csak kevés nyelven léteznek. Nagyobb (20.000-80.000) mennyiségű szót tartalmaznak és szintén egy rövid (100-200) listából kiindulva építkeznek: minden a hívószóra adott válaszszó a későbbiekben maga is hívószó lehet. A szóasszociációs szótárak aktuális informatikai problémák megoldásában is segíthetnek, mint pl. szemantikus webek létrehozása (Sinopalnikova–Smrź 2004). Az Agykapocs-projekt szintén alkalmas szóasszociációs szótár létrehozására. A hálózati kapcsolatok erőssége az egyén mentális lexikonjában nehezen mérhető. Szóasszociációs tesztekkel – például folyamatos asszociációval – feljegyezhető ugyan az előhívott szavak sorrendje, de a sorrend nem jelent egyben erősséget is. Az első szó (pl. a normákban is megadott válasz) valószínűleg viszonylag erősen kapcsolódik a hívószóhoz, míg az 5. előhívott szó viszonylag gyengé(bbe)n; de a pontos erősséget nem tudjuk mérni (konkrét példával, normákat alapul véve a hitel hívószó esetén a leggyakoribb asszociáció erőssége 33%,
Hálózatok a mentális lexikonban
171
míg az 5. leggyakoribb esetén már csak 5,6%). Jelenleg nem ismert olyan módszer, amellyel egy egyén mentális lexikonját, a kapcsolatok összességét, erősségét, irányát feltérképezhetnénk. Az asszociációk ugyan adhatnak betekintést az egyén mentális lexikonjának rendezettségébe, azonban – mivel a vizsgálati alany a vizsgálatok ismétlése esetén sok esetben eltérő választ hív elő (vö. Cramer 1968) – az egyéni mentális lexikonra vonatkozó mérések nem adnak pontos eredményeket. Az egyéni mentális lexikon kapcsolatainak erősségének feltételezésére aszszociációkon kívül más, közvetett módszerek is alkalmasak lehetnek. Pléh és munkatársai összefoglaló tanulmányukban leírják, hogy magyar nyelvre is összefüggés mutatható ki a szófelismerés sebessége és a szó gyakorisága között: minél gyakoribb egy szó, annál gyorsabban ismerjük fel (vö. Pléh–Lukács–Kas 2008). Elképzelhető tehát, hogy a gyakori szavak eleve más módon raktározódnak a mentális lexikonban (pl. több, erősebb kapcsolattal), így azok gyorsabban előhívhatók: a tárolásban és a kapcsolatok kialakításában tehát általános, adott nyelvre karakterisztikus szógyakorisági jellemzők is szerepet játszhatnak. Kutatásaink tehát normákat állítanak fel, vagyis normák alapján próbáljuk az egyéni mentális lexikon hálózatos felépítését jellemezni. Feltételezzük, hogy amennyiben egy hívószóra egy válaszszó gyakori (norma, pl. fehér–fekete), akkor a kapcsolat erősebb az egyén mentális lexikonjában is. Amennyiben a kapcsolat gyengébb (fekete–szén) feltételezzük, hogy a kapcsolat az egyén mentális lexikonján belül is gyengébb. Természetesen nem minden egyén esetén azonos erősségűek a kapcsolatok. Az asszociáció mint módszer, illetve egy egyén asszociációinak vizsgálata természetesen kétségbe vonható (vö. 2. fejezet, illetve pl. Osgood–Suci– Tannenbaum 1957), ugyanakkor a mentális lexikonban tárolt egységek közti kapcsolatok vizsgálata jelenleg más módon nem képzelhető el – ahogyan erre már utaltunk.
7.2 Irányított kapcsolatok a mentális lexikonban Az Agykapocs-rendszerben lekérdezéssel kimutatható bármely két, az adatbázisban szereplő szó közötti útvonal – amennyiben az az adott két szó között létezik. A funkció két szempontból fontos: egyrészt segítségével igazolható, hogy a mentális lexikon irányított gráfokkal történő ábrázolása pontosabb, mint a hagyományos, hálózatos elképzelés, másrészt az irányított kapcsolatok segítenek a mentális lexikon kisvilág-karakterének bizonyításában is.
172
Hálózatok a mentális lexikonban
Az adatbázisban a legrövidebb út lekérdezése – ahogy azt már korábban bemutattuk, lásd 5. fejezet – két módon végezhető el. a.) Irányított lekérdezéssel: a lekérdezésnél a rendszer figyelembe veszi a kapcsolatok irányát. Vagyis a kutya–macska–egér út akkor jelenik meg, ha kutya→macska, valamint a macska→egér kapcsolat ezen irányokban létezik. Ha a kapcsolat kizárólag pl. egér→macska irányban fordul elő, akkor ez az útvonal nem szerepel a lekérdezés eredményeként. b.) Nem irányított lekérdezéssel: a rendszer a lekérdezés esetén nem veszi figyelembe a kapcsolatok irányát. Tehát pl. a ló→állat→kutya útvonal jelenik meg, akkor is, ha ló→állat, de akkor is, ha csak állat→ló irány szerepel az adatbázisban Az adatbázisból a két lekérdezés segítségével véleményünk szerint kimutatható, hogy a mentális lexikonban nemcsak a kapcsolatoknak, hanem azok irányának is kiemelt jelentősége van, vagyis a háló modell helyett (vö. Aitchison 2003) a gráfokkal ábrázolt modell (Kovács 2007, 2008a) helytállóbb. Amennyiben az Agykapocs-adatbázisban ugyanarra a szópárra mindkét lekérdezést elvégezzük, két lehetséges eredményt kaphatunk. a.) A kétfajta lekérdezés esetén a legrövidebb útvonal hossza bármely szópárra minden esetben közel azonos. Amennyiben ezt tapasztaljuk, a mentális lexikon szerveződését az egyszerű hálózatos felépítés jellemzi, vagyis a kapcsolatok irányának nincs szerepe. b.) A kétfajta lekérdezés eltérő úthosszt eredményez: az irányított lekérdezés útja hosszabb, mint a nem irányított lekérdezésé. Ebben az esetben viszont bizonyítottnak tekinthetjük, hogy az irányított gráfokkal történő ábrázolás (vö. Kovács 2007) mutatja helyesen a mentális lexikon szerveződését, vagyis a kapcsolatok irányának jelentősége van a mentális lexikon szerveződésében. Példák az irányított és nem irányított lekérdezések és kapcsolatok különbözőségére. Agykapocs-kutatás, 2008. december 3. – magyar nyelvre vonatkozóan 83.400 adat, 40.000 kapcsolat, 14.300 szó (kifejezés) a rendszerben. A nyíl (→) jelzi, hogy a nyíl előtti szóból kapcsolat mutat a nyíl utáni szóba (kifejezésbe). ember – inni irányított kapcsolatok: ember → szegény → gazdag → inni nem irányított kapcsolatok: ember → élet → inni
Hálózatok a mentális lexikonban ajtó – fut irányított kapcsolatok: ajtó → üveg → sör → alkohol → inni → egészség → sport → fut nem irányított kapcsolatok: ajtó → szabad → kereskedelem → fut Obama – Tesco irányított kapcsolatok: Obama → választás → vásárlás → Tesco nem irányított kapcsolatok: Obama → cég → global rt → Tesco villám – kutya irányított kapcsolatok: nincs találat nem irányított kapcsolatok: villám → villamos → autó → szamár → kutya szivárvány – enni irányított kapcsolatok: szivárvány → szín → pénz → venni → enni nem irányított kapcsolatok: szivárvány → szín → alma → enni sajt – vas irányított kapcsolatok: sajt → Hollandia → ország → határ → környezet → piszkos → vas nem irányított kapcsolatok: sajt → bolt → határ → megye → vas jó – globális irányított kapcsolatok: jó → kevés → ember → világ → globális nem irányított kapcsolatok: jó → világ → globális hallgató – Obama irányított kapcsolatok: hallgató → egyetem → diploma → pénz → politikus → Obama nem irányított kapcsolatok: hallgató → jogviszony → állam → választás → Obama
173
174
Hálózatok a mentális lexikonban
hajó – ablak irányított kapcsolatok: hajó → víz → levegő → friss → új → tiszta → ablak nem irányított kapcsolatok: hajó → dísz → ajtó → ablak egy – BMW irányított kapcsolatok: egy → szám → zene → zaj → faj → állat → motoros → motor → BMW nem irányított kapcsolatok: egy → szám → szín → kocsi → BMW sok – hajó irányított kapcsolatok: sok → zöld → szép → hajó nem irányított kapcsolatok: sok → víz → hajó
Fenti kapcsolatokat és útvonalakat az adatbázis aktuális verziójában is lekérdeztük. Agykapocs-kutatás, 2013. február 24., magyar nyelvre vonatkozóan 158.200 adat, 75.600 kapcsolat, 21.100 szó (kifejezés) a rendszerben. ember – inni irányított kapcsolatok: ember → szegény → gazdag → inni nem irányított kapcsolatok: ember → élet → inni ajtó – fut irányított kapcsolatok: ajtó → bejöhetsz → szabad → sport → fut nem irányított kapcsolatok: ajtó → bolt → fut Obama – Tesco irányított kapcsolatok: Obama → választás → vásárlás → Tesco nem irányított kapcsolatok: Obama → cég → global rt → Tesco
Hálózatok a mentális lexikonban villám – kutya irányított kapcsolatok: villám → Verdák → könyv → drága → kutya nem irányított kapcsolatok: villám → gyorsan → futtában → kutya szivárvány – enni irányított kapcsolatok: szivárvány → ég → bolt → venni → enni nem irányított kapcsolatok: szivárvány → szín → érzés → enni sajt – vas irányított kapcsolatok: sajt → hold → fehér → tiszta → piszkos → vas nem irányított kapcsolatok: sajt → hold → hangulat → elem → vas jó – globális irányított kapcsolatok: jó → kevés → ember → világ → globális nem irányított kapcsolatok: jó → világ → globális hallgató – Obama irányított kapcsolatok: hallgató → egyetem → diploma → pénz → politikus → Obama nem irányított kapcsolatok: hallgató → jogviszony → állam → választás → Obama hajó – ablak irányított kapcsolatok: hajó → repülő → nyár → virág → ablak nem irányított kapcsolatok: hajó → dísz → ablak egy – BMW irányított kapcsolatok: egy → szám → 100 → kerek → alma → drága → motor → BMW nem irányított kapcsolatok: egy → szerelem → Ferrari → BMW
175
176
Hálózatok a mentális lexikonban
sok – hajó irányított kapcsolatok: sok → pénz → kereskedelem → hajó nem irányított kapcsolatok: sok → víz → hajó
Mint látjuk, az adatbázis növekedésével sok helyen az útvonalak is rövidültek. Megfigyelhetjük, hogy az adatbázis körülbelül kétszeresére növekedése csak az esetek egy részében eredményezte az útvonalak rövidülését. Az útvonalak ezen esetekben sem lettek lényegesen rövidebbek: többnyire csak egy köztes pont esett ki az asszociációkból. A 2008-as lekérdezéssel azonos hosszúságú, de más szavakat tartalmazó útvonalak magyarázata, hogy a rendszer a legrövidebb útvonalak közül mindig a legerősebbet (legerősebb kapcsolatokat tartalmazót) jeleníti meg; azaz a jelenlegi adatbázisban ezen – a korábbiakkal azonos hosszúság – útvonalak kapcsolatai a legerősebbek. A véletlenszerűen vizsgált példák esetében jól látható, hogy irányított lekérdezés esetén (vagyis amikor figyelembe vettük a kapcsolatok irányát) két adott szó között az útvonal hosszabb, mint nem irányított lekérdezés esetében. Az eredmények egyértelműen igazolják, hogy a mentális lexikonban a kapcsolatok irányának fontos szerepe van. Eredményeink, valamint Steyvers és Tenenbaum (2005) kutatása alapján valószínűsíthető, hogy a mentális lexikon irányított, súlyozott gráfokkal történő ábrázolása pontosabban adja vissza a mentális lexikon felépítését, mint a pókhálóelmélet (Kovács 2007, 2008a). Hasonlóképpen a kapcsolatok irányának fontosságát feltételezi Kiss (1968), Kiss et al. (1973), Kiss (1975), Meara (2009) és Spitzer (1996) is. Az utolsó két példa (egy – BMW, illetve sok – hajó) rávilágít, miért szükséges külön tanulmányozni a szövegekben, mondatokon belül létrejövő kapcsolatokat és a mentális lexikon felépítését. Fenti szavak egymás mellett is előfordulhatnának folyamatos szövegben, az itt vizsgált sorrendben. Amennyiben a szövegeket speciális korpuszból nyerjük ki (pl. autós magazin, utazási magazin), szinte biztosan meg fogjuk találni a két szó együttes, egymás utáni előfordulását. A mentális lexikon vizsgálata viszont azt látszik bizonyítani, hogy az ilyen jellegű kapcsolatok – asszociációs vizsgálatok alapján – nem jellemzőek a mentális lexikon felépítésére (ugyanakkor a nyelv felépítésében, szövegek alkotásában természetesen kiemelt szerepet kapnak). A Palla Gergely et al. (2005) által feltételezett, egymást átfedő csoportok megléte (egy fogalom több domainhez is tartozhat) szintén elfogadható, illetve a gold szó esetében a több domainhez tartozást Palla Gergely et al. bizonyították is.
Hálózatok a mentális lexikonban
177
Az egymást átfedő csoportok gondolata sokban hasonlít a mentális lexikon atomgömb elméletéhez. Kovács László (2007, 2008a) feltételezéséből, mely szerint a mentális lexikon gráfokkal ábrázolható, valamint Palla Gergely et al. (2005) átfedő csoportjaiból kiindulva elképzelhetőnek tartjuk, hogy a mentális lexikon egy az eddiginél is pontosabb modellje az atomgömb-elmélet és a hálózat-elmélet ötvözéséből születhetne. Az új modellben az egyes elemek hálózatszerű rendszert alkotnak, ezzel egy időben az elemek csoportoknak is részei, az elemek közötti kapcsolatok erősségének függvényében (21. ábra).
21. ábra. A mentális lexikon súlyozott, irányított gráfokkal, valamint csoportokat képző atomgömbökkel egyszerre történő ábrázolása
Az ábrával ellentétben a létrejött csoportok (az ábrán a színes mezők) nem tekinthetők homogénnek: egyes elemek erősebben, mások gyengébben csatlakoznak a csoportokhoz, ahogyan ezt az egyes elemek között futó nyilak erőssége is jelzi. A mentális lexikon ezen modellje ugyan statikusságra utal, ugyanakkor a mentális lexikonon belül a kapcsolatok, azok iránya, erőssége, illetve maguk a csoportok állandóan változ(hat)nak a nyelvi vagy az enciklopedikus információk gyarapodásával. A változás valószínűleg sokkal jellemzőbb (és gyorsabb) az anyanyelv elsajátításának kezdeti szakaszában, illetve idegen nyelvek elsajátítása esetén, habár bizonyos kapcsolatok stabilnak tekinthetők. A hálózatok hasonló jellegű, folyamatos változása kapcsolati hálózatok esetében bizonyított (Palla– Barabási–Vicsek 2007).
178
Hálózatok a mentális lexikonban
7.3 Kisvilágok a mentális lexikonban Kisvilágok kimutatásához szükséges a hálózaton belüli átlagos legrövidebb útvonalak kiszámolása (vö. 3. fejezet). A mentális lexikon kapcsolatai esetén bemutattuk, hogy azok irányítottnak tekinthetők, ugyanakkor a 4. fejezetben említett kutatások esetében a kapcsolatok irányát nem minden esetben vették figyelembe. Ezért a legrövidebb átlagos út hosszát szükségesnek tarjuk irányított és nem irányított kapcsolatok esetében is kiszámolni. Az Agykapocs-projekt első 100 magyar szavának (fix lista) egymás közötti kapcsolatát vizsgálva, nem irányított lekérdezéssel az adatbázis 2010-es stádiumában (kb. 14.000 pont): nincs útvonal: 0 eset; átlagos távolság: 1,84 lépés. Az első 100 magyar szó (fix lista) egymás közötti kapcsolatát vizsgálva, irányított lekérdezéssel: nincs útvonal: 198 eset; átlagos távolság: 2,36 lépés. A teljes magyar adatbázisra a lekérdezés lefuttatását technikai okok miatt akkor nem tudtuk elvégezni. Ennek oka, hogy a lekérdezés során a kapcsolatok meglétének (és a legrövidebb útnak), illetve a kapcsolatok meg nem létének számolása több másodpercet, esetenként egy percet vesz igénybe. Az első 100 szóra, minden egyes szónak elvileg 99 kapcsolatát kell vizsgálni, ez 9900 kapcsolat vizsgálata. Csak ezen kapcsolatok lekérdezése 12-14 órát vett igénybe. A magyar adatbázis 14.620 szavas állapotában a lekérdezések során összesen 213 millió (!) kapcsolatot kellett volna vizsgálni, ami az akkor rendelkezésre álló eszközökkel nem volt megoldható. A teljes adatbázisra vonatkozóan tehát a kötet korábbi kiadásában csak részeredményekről tudunk beszámolni, mivel a lekérdezéseket pár tízezer kapcsolat vizsgálata (és a lekérdezés több napos futtatása) után megszakítottuk. A részeredmények alább olvashatók. A magyar adatbázis egészét vizsgálva (14.620 szó), nem irányított lekérdezéssel: átlagos távolság: 3,6 lépés. A magyar adatbázis egészét vizsgálva (14.620 szó), irányított lekérdezéssel: átlagos távolság: 5,1 lépés. A teljes adatbázist, minden nyelvet vizsgálva, (16.500 szó/kifejezés állapotban,) nem irányított kapcsolatok esetén (12 óra futás után): átlagos távolság: 9 lépés.
Hálózatok a mentális lexikonban
179
A teljes adatbázis viszonylag nagy átlagos távolságát magyarázza, hogy a nyelvek között többnyire nincsen kapcsolat, vagyis számos „zsákutca” van. Ennek oka, hogy a nyelvek egymáshoz kapcsolása (nyelvek közötti kapcsolatok kialakítása) a rendszerben kétféleképpen történhet meg: – manuális úton, tehát a kutató által létrehozva egy kapcsolatot a német rot – magyar piros szó között; – a kapcsolatot maguk a kutatásban részt vevők hozzák létre, asszociációk segítségével (pl. a magyar vám hívószóra a német Zoll szó a válasz). Egyelőre ez utóbbi megoldást választottuk, vagyis egy szó és lexikai ekvivalense (vagyis két nyelv) között akkor van kapcsolat, ha valaki az ekvivalenst adta meg a hívószóra válaszként, illetve ha egy magyar hívószóra más nyelvi szóval válaszolt. Mivel jelenleg az adatbázis magyar nyelvű asszociációs adatokkal történő feltöltése a cél, sok nyelvhez nincs, vagy csak minimális számú (100150) asszociációnk van. Ez azt eredményezi, hogy az adatbázis jelenlegi állapotában a nyelvek között magyar-német és magyar-angol viszonyban sok kapcsolat található, de vannak olyan nyelvek, amelyek nincsenek kapcsolatban a magyarral, illetve másik nyelvekkel (pl. lengyel, holland). Az elmúlt két évben lehetőség nyílt a kisvilág-karakterrel kapcsolatos pontosabb számítások elvégzésére. Ezen számítások az ELTE Biológiai Fizika tanszék munkatársainak, Pollner Péternek és Orosz Katalinnak köszönhetőek. Az eredményeket időközben publikáltuk (Kovács–Orosz–Pollner 2012, Orosz– Kovács–Pollner 2012), amely publikációkat reményeink szerint továbbiak követnek. Itt a megjelent eredményeket foglaljuk össze. Az Agykapocs-hálózatot 2011-es állapotában vizsgáltuk; ekkor – adattisztítás után – a háló 16.562 csúcsot és 43.702 irányított élt tartalmazott. A magyar hálózatra az átlagos legrövidebb útvonalhossz hat lépés, amely hosszabb, mint a más asszociációs hálózatokra mért négy illetve öt lépéses útvonalhossz (vö. De Deyne–Storms 2008b, Gravino 2012). Ennek oka részben a viszonylag sok hívószó lehet; illetve a fenti adatbázisokhoz képest viszonylagosan kis adatmenynyiség. A legrövidebb útvonalak közül a leghosszabb 21 lépésből áll – ennek oka valószínűleg szintén a még viszonylag ritka hálózatban keresendő. A Florida-hálózattal (Nelson–McEvoy–Schreiber 1998) összevetve a két adatbázisban az útvonalak eloszlása eltér ugyan egymástól, de hasonló képet mutat (22. ábra). A szigorúan összefüggő komponens (azon pontok halmaza, amelyekből kettőt tetszőlegesen kiválasztva irányított útvonal létezik a két pont között mindkét irányba) az Agykapocs-hálózat csúcspontjainak 56%-át foglalja magában.
180
Hálózatok a mentális lexikonban
22. ábra. A legrövidebb úthosszak eloszlása az Agykapocs- és a Florida hálózatban és a hálózatok legnagyobb szigorúan összefüggő komponensében (Orosz–Kovács–Pollner 2012: 61).
A kialakuló hálózat felépítését, illetve az Agykapocs-hálózat felépítésének eltérését befolyásolhatja a hívószavak megválasztása és száma is. A magyar adatbázisban a kezdeti 100 (később 134-re bővített) fix hívószólista biztosította, hogy a hálózat egy része nagyon gyorsan növekedjen. Ha a kezdeti hívószólista pontjaiból indulunk ki, akkor a hálózat nagy része nagyon kevés lépésben bejárható (három lépésben a hálózat 50%-a). A többi hívószó csak véletlenszerűen jelent meg a felhasználóknak, így ezen pontokból a hálózat csak viszonylag kis mértékben növekedett. A kapott eredmények, valamint a más nyelvek adatbázisain, mások által elvégzett kutatások alapján megfogalmazhatjuk azt a kijelentést, hogy a mentális lexikon hálózatos szerkezete kisvilág-karakterű. Elképzelhető, hogy ez általános, minden nyelvre jellemző tulajdonság. Ahhoz azonban, hogy ezt biztosan kijelenthessük, még nagyon sok – legalább többször tíz – nyelvre, nagy adatbázisokon kell ezen tulajdonságot igazolni. A kisvilág-karakter a mentális lexikonban magyarázza, illetve lehetővé teszi a viszonylag gyors szóelérést és lehívást. A súlyozott kapcsolatok pedig megmagyarázzák, hogy a sok kapcsolat ellenére miképp lehetséges, hogy az aktiváció nem „terheli túl” az agyat: nem kell több ezer kapcsolatot aktiválni, csak az adott kontextus szempontjából relevánsakat.
Hálózatok a mentális lexikonban
181
7.4 Skálafüggetlen hálózat a mentális lexikonban Szóasszociációs vizsgálatok hívószavaira adott válaszok esetében vizsgálható, hogy a válaszszavak eloszlása skálafüggetlen hálózatra enged-e következtetni. Amennyiben kimutatatható, hogy a kapcsolatok erősségének eloszlása skálafüggetlen jellemzőket mutat, akkor a mentális lexikon hálózata legalább egy szempontból skálafüggetlen jellegű. Jelen kötet első kiadásában (Kovács 2011b) az Agykapocs-rendszer adataink felhasználásával, valamint Osvald (2009) adataival arra kerestük a választ, hogy a mentális lexikonban kimutatható-e a skálafüggetlenség. Ehhez vizsgáltuk a hívószavakból kimenő kapcsolatokat, illetve a válaszszavak esetében a bejövő kapcsolatokat. 2011-ben három hívószóra (adó, hitel, áfa) vizsgáltuk a kimenő kapcsolatok eloszlását. Az elemzés eredményeként megfogalmaztuk azon feltételezésünket, hogy az asszociációs hálózat (legalábbis ezen, véletlenszerűen kiválasztott hívószavakra) skálafüggetlen eloszlást mutat. Hasonlóan skálafüggetlen eloszlást tapasztaltunk a pénz szó (ez az akkor legtöbb bemenő kapcsolattal rendelkező szó) bemenő kapcsolatainak elemzésekor. A bejövő kapcsolatok eloszlása az egész adatbázisra nem volt egyértelmű. Találtunk ugyan két kiemelten sok kapcsolattal rendelkező szót (pénz, nincs ötletem), azonban ezen szavak központi szerepét és sok bemenő kapcsolatát nem egyértelmű, hogy mely tényezők befolyásolták. A pénz szó kiemelt szerepét (és sok bejövő kapcsolatát) az eredeti hívószólista gazdasági szaknyelvvel kapcsolatos kutatási célja befolyásolhatta: a kezdetei hívószólista több olyan szavat tartalmazott (pl. gazdaság, hitel, bank), amelyre a leggyakoribb válasz a pénz volt. A másik kiemelt „szó” (nincs ötletem) nem konkrét asszociáció, hanem azon válaszokat tartalmazza, amikor a kutatás résztvevője nem asszociált semmire, hanem a „Nincs ötletem” gombra kattintott. Így ezen „szó” bármely nyelvből, bármely szóval kapcsolatban gyűjti az „asszociációkat”. A bejövő kapcsolatok eloszlását egy másik szóasszociáció-kutatáson is vizsgáltuk. Osvald Mária (2009) dolgozatában 100 hívószóval, 100 válaszadóval sportszaknyelvi asszociációkat kutatott (lásd a 6. fejezetben részletesebben). Az adatok Excel-táblában történő rögzítése lehetővé tette az azonos válaszok összegyűjtését, majd az összes választ figyelembe véve a válaszok összegzését. Az összes választ ábrázolva a válaszok hatványfüggvény-eloszlást mutattak. Osvald első 100, legtöbb bejövő kapcsolattal rendelkező szavának listáját a 7. Melléklet tartalmazza. Saját adatbázisunk és Osvald adatbázisának eredménye tehát nem volt azonos: míg az Agykapocs-adatbázisban a kapcsolatok eloszlása nem mutatott egyértelműen hatványfüggvény-eloszlást, addig Osvald adatai hatványfüggvény-
182
Hálózatok a mentális lexikonban
eloszlásúak voltak. Ennek oka lehet, hogy Osvald kutatása esetében a hívószavak sporttal kapcsolatos hívószavak voltak, a válaszok (többnyire) szintén – így egy szakterületen belül látjuk a hatványfüggvény-eloszlást. A hívószavak és válaszszavak tehát szakterület szempontjából homogénnek tekinthetők. Az Agykapocskutatás esetében viszont a hívószavak köznyelvi és szaknyelvi szavak voltak – a gazdasági szaknyelvi hívószavak száma a kezdeti listában 20. A rendszer egésze jelenleg számos köznyelvi, illetve szaknyelvi adatot tartalmaz – tehát a nyelvet sokkal heterogénebben képezi le mint Osvald kutatása. A két adatból megfogalmaztuk azt a feltételezést, hogy a nyelv egy viszonylag homogén szegmensére skálafüggetlen kapcsolati rendszer lehet jellemző, míg a nyelv egészét tekintve ez az eloszlás nem szükségszerűen karakterisztikus. Az ELTE Biológiai Fizika Tanszék munkatársainak köszönhetően ma már az asszociációs adatbázis skálafüggetlen karakterével kapcsolatban is tehetünk pontosabb kijelentéseket (vö. Kovács–Orosz–Pollner 2012, Orosz–Kovács– Pollner 2012). A bemenő fokszámokat az Agykapocs-adatbázisra (a 2011 év eleji hálózatra) elemezve, illetve a kapott adatokat a Florida-adatbázissal (Nelson–McEvoy– Schreiber 1998) összevetve a fokszánok eloszlása mindkét adatbázisban skálafüggetlen karaktert mutat (23. ábra).
23. ábra. a) Az Agykapocs-hálózat bemenő fokszám-eloszlása b) A Florida hálózat bemenő fokszám-eloszlása (Orosz–Kovács–Pollner 2012: 59)
Az egyes elemek köztiségét vizsgálva szintén kijelenthetjük, hogy az Agykapocs-hálózat skálafüggetlen eloszlású. (A köztiség azt mutatja meg, hogy „a legrövidebb utak hányad része megy át az adott csúcsponton” (Kovács–Orosz– Pollner 2012: 703).) Általánosságban elmondható, hogy azon pontok, amelyek két hálózati csoport között vannak, nagy köztiséggel rendelkeznek.
Hálózatok a mentális lexikonban
183
Az eddigi vizsgálatokból kiderül, hogy a skálafüggetlen-jellegű eloszlás több ponton is kimutatható a mentális lexikonban: hívószavakra adott válaszszavak (kimenő kapcsolatok), valamint bejövő kapcsolatok gyakorisága esetében. Az adatbázis más szavainak vizsgálata esetén a kimenő és a bejövő kapcsolatok hasonló eloszlását tapasztaltuk. Szóasszociációs adatok meglepő eloszlását, illetve különböző szavakra adott válaszok eloszlási hasonlóságát ugyan Kiss et al. (1973) is említik, ugyanakkor a kapott adatok átfogó elemzését nem végezték el. „The distribution of the node indegrees and the total frequency of occurence of response words are both very close to a lognormal distribution at the lower frequency range, with a systematic deviation at the high-frequecy end” (Kiss et al. 1973: 157). Hasonló megállapítást tesz később Kiss (1975: 105) az asszociációk bemenő kapcsolatait grafikusan is ábrázolva. A mentális lexikon skálafüggetlen felépítése a kutatások alapján igazoltnak látszik. Kérdéses, hogy léteznek-e különösen összekapcsolt elemek, vagyis központok. Az eddigi hasonló kutatások alapján feltételezhetjük, hogy sok, de viszonylag gyenge kapcsolattal a zárt szófaji osztálybeli szavak (pl. névelők) rendelkeznek. Az Agykapocs-rendszer első száz hívószava nem tartalmaz ilyen szavakat, ezért ez a feltételezés igazolásra vár. Habár a rendszerben zárt szófaji osztálybeli szavak is szerepelnek hívószóként, ezek nem a fix lista részei, vagyis nem jelennek meg minden résztvevőnek. Ezért ezen hívószavakra egyelőre csak kis számú válasszal rendelkezünk: a válaszok száma minden esetben harminc alatti, többnyire kevesebb, mint tíz. Így ezen szavak mentális lexikonbeli kapcsolatait korai lenne komplex vizsgálatnak alávetni. A zárt szófaji osztálybeli szavak kapcsolatai ugyanakkor nem várt eloszlást mutatnak: a zárt szófaji osztálybeli szavak sok esetben egymást hívják elő (pl. még – már, még – csak). A nyílt szófaji osztálybeli szavak kapcsolatai esetében központi elemek jelenléte nem kimutatható, legalábbis az Agykapocs-rendszer fix listájának hívószavai esetében. Elképzelhetőnek tartjuk ugyanakkor, hogy egyes szaknyelvek esetében létezhetnek ilyen központi elemek. Az empirikus adatok mellett a mentális lexikon skálafüggetlen hálózat elrendezése indirekt módon is kimutatható: amennyiben feltételezzük, hogy a bázis szint kapcsolatai a legerősebbek, illetve hogy vannak csomópontok (sok kapcsolattal rendelkező elemek) és kevesebb kapcsolattal rendelkező elemek, akkor ezen szavaknak szerepe a mentális hálózatot ért „támadás” (betegség) esetén különlegesen fontos. Feltételezve, hogy a hálózat elemeit véletlenszerűen éri támadás, a csomópontok (mivel kevesebb van belőlük) fenntartják a mentális lexikon hálózatát akkor is, ha közben viszonylag sok elemet már „támadás” ért (vö. hálózatok
184
Hálózatok a mentális lexikonban
ellenállósága, Barabási 2003). A kapcsolatok sűrűségének és a támadásokkal szembeni ellenállás összefüggésére – vagyis arra, hogy az összekapcsoltabb elemeknek fontos szerepe van a hálózatok fenntartásában – Moss és Tyler (2001) utal különböző mentális betegségek esetében. A 4. fejezetben bemutattuk, hogy mentális betegségek esetében a mentális lexikon összeomlása hasonló jellegű más skálafüggetlen hálózatok összeomlásához. Ez indirekt módon szintén a mentális lexikon skálafüggetlen szerveződésére is utalhat. Meg kell jegyeznünk azonban, hogy ezen eredmények nem egyértelműek: nehéz elkülöníteni, hogy fenti eredményeket a mentális lexikon skálafüggetlen szerveződése, vagy az idegrendszeri (agyi) kapcsolatok skálafüggetlen szerveződése okozza-e. Schmid és Köpke (2009) szintén utal rá, hogy a mentális lexikon asszociációs adatok alapján elkészített szimulációi hasonlóan, viszonylag hirtelen „omlanak össze”: egy ideig a hálózat stabil marad, majd hirtelen, drasztikusan omlik össze – ezután viszont (egy új állapotban) ismét stabilizálódik. A mentális lexikon skálafüggetlen hálózatos felépítését, valamint kisvilág szerinti szerveződését ugyanakkor elfogadhatjuk, figyelembe véve hálózatos felépítésre vonatkozó közvetlen (szóasszociációs) és közvetett (neurolingvisztikai) kutatási eredményeket (vö. 4. fejezet). Hangsúlyoznunk kell, hogy a jelenlegi, viszonylag kis számú hálózatos irányú kutatás eredménye nem tekinthető egyértelmű bizonyítéknak: a szóasszociációs adatok sokkal szélesebb körű vizsgálata, illetve a vizsgálatok több nyelvre történő kiterjesztése szükséges ahhoz, hogy az eredményeket általánosítsuk. Szintén nem igazolható jelenleg, hogy a mentális lexikon szerkezetét csak ezek az eloszlások jellemzik-e, vagy a kapcsolatok száma, erőssége más összefüggéseket is mutat. Összetett vizsgálatok ugyanakkor csak több ezer hívószó, ezres nagyságrendű válaszadó, és a jelenleginél nagyságrendekkel több (akár milliós) adat esetén végezhetők. A kapcsolatok erősségének skálafüggetlen eloszlása hozzájárulhat az egyéni mentális lexikon kapcsolatainak pontosabb megismeréséhez is. Jelenlegi kutatások szerint az asszociációs tesztek alapján meghatározott normák eloszlása skálafüggetlen karaktert mutat, és hasonlóképpen a neurolingvisztikai kutatások az agyban skálafüggetlen hálózatok meglétét feltételezik. Ebből következhet az a valószínűsíthető (de igazolásra váró) hipotézis, hogy az egyén mentális lexikonjában a kapcsolatok erőssége szintén skálafüggetlen eloszlású.
7.5 A mentális lexikon hálózatainak további összefüggései Központi elemet nem tudunk ugyan az adatbázisban kiemelni, érdekes ugyanakkor megmutatnunk, hogy a nagyszámú bemenő kapcsolattal rendelkező
Hálózatok a mentális lexikonban
185
elemek mind a Florida-, mind az Agykapocs-adatbázisban hasonlóak. Az első hét legnagyobb bemenő fokszámú elemet a 11. táblázat mutatja. Ezen gyakori elemek közül a főnevek a bázis szinthez tartoznak, amely arra is utalhat, hogy ezen elemek hálózatszervező és hálózatösszetartó ereje nagy. Agykapocs
Florida
pénz
food
jó
money
autó
water
rossz
car
ember
good
sok
bad
munka
work
11. táblázat. Az első hét legnagyobb bemenő fokszámú csúcspont az Agykapocs és a Florida hálózatban (Orosz–Kovács–Pollner 2012: 60)
Egyes elemek központi szerepén túl vizsgálhatjuk a hálózaton belüli csoportosulásokat, illetve magokat is. A k-mag egy olyan csoport, ahol a kisebb csoporthoz minden egyes tag legalább k kapcsolattal csatlakozik. A legsűrűbb azonosított mag az Agykapocs-hálózatban 156 tagból áll, ahol minden egyes tag legalább 17 kapcsolattal csatlakozik a csoporthoz (Kovács–Orosz–Pollner 2012). A hálózatos vizsgálatok egy további, új eredményt is hoztak: az asszociációk nemek szerinti szétválasztása (nők és férfiak által adott asszociációk elkülönítése) megmutatta, hogy a két nem által válaszként megadott asszociációk eltérnek egymástól. A férfiak esetében a válaszoknak csak 10% olyan asszociáció, amit csak férfiak adtak, és nők nem; nők esetében azonban a „közös”, mindkét nem által megadott asszociációktól az eltérés sokkal nagyobb, 30% (Kovács–Orosz– Pollner 2012). A hálózat legsűrűbb csoportjait klikk perkolációs algoritmussal is elemezhetjük. A klikkek olyan csoportok, ahol a csoport minden eleme a csoport minden másik elemével is össze van kötve. A klikkek vizsgálata kimutatta, hogy a klikkek témakörük mentén jönnek létre; míg a klikkbe tartozó általánosabb szavak kapcsolatot biztosítanak más klikkekkel. Azon szavak, amelyek a csoportok közötti összeköttetést biztosítják, valószínűleg gyorsabban elő is hívhatók: az asszociációs idők csoporton belüli elemzése alapján a gyorsan érkező asszociációs válaszok
186
Hálózatok a mentális lexikonban
tipikusan ilyen szavakra történő asszociáció során voltak jellemzőek (Kovács– Orosz–Pollner 2012). A következő alfejezetben megvizsgáljuk, milyen felépítése lehet a mentális lexikon hálózatának, illetve milyen lehetőségeket nyithat meg nyelvészeti kutatásokban a mentális lexikon (skálafüggetlen) hálózatos felépítése. 7.6 Fogalmi rendszerek, nyelvi hálózatok Bemutattuk, hogy a mentális lexikon hálózatos tulajdonságokkal rendelkezik. Természetesen nem igazolható egy kötetben a hálózatkutatás összes eddigi eredménye a mentális lexikonra vonatkoztatva – ezt már csak azon okból sem tehetjük, mivel a hálózatokkal kapcsolatos ismereteink naponta bővülnek, illetve a hálózatok minden tudományterületen másképp jelennek meg. Az eredmények bizonyítani látszanak azt az eredeti feltételezésünket, hogy a mentális lexikon skálafüggetlen hálózatként működik és általános, hálózatokra jellemző tulajdonságokkal rendelkezik. A mentális lexikon hálózatként való leírását elfogadva további kérdések merülnek fel és újabb kutatások lehetőségei nyílnak meg számunkra. Jelen fejezet ezen elméleti hipotéziseket, kutatási irányokat kívánja felvázolni. Az itt megfogalmazott, a mentális lexikonra (és a nyelvre) vonatkozó elképzelések egy része valószínűleg empirikus úton igazolható lesz, más részéről kiderülhet, hogy elvetendő. Kidolgozásra vár az itt vázolt hipotézisek igazolásának módszertana és mikéntje, a nyelvészeti kutatások és a hálózatos kutatások szorosabb összekapcsolása. A mentális lexikon hálózatának elemei a vizsgálati módszertől függően más-más elemekkel mutatnak kapcsolatokat. A nyelvtudomány ezen hálózatokat (illetve hálózatként felfogható jelenségeket) mindeddig egymástól függetlenül vizsgálta. A mentális lexikon (és a nyelv) felépítése, illetve a benne tárolt egységek elérése pontosan ezen hálózatok ötvözésével, egy multidimenzionális háló segítségével modellezhető legjobban. A multidimenzionális háló egyes részei (alhálózatai) egymástól viszonylag függetlenül működnek és jönnek létre. Az egyes alhálózatok vizsgálata egymástól függetlenül is elképzelhető, a nyelv egészének vizsgálata viszont a teljes multidimenzionális hálózat komplex vizsgálatát követeli meg. Nem lehet egyelőre célunk ezen multidimenzionális hálózati rendszer vizsgálata, csupán szeretnénk rámutatni annak feltételezhető meglétére. Feltételezzük tehát, hogy a mentális lexikonban tárolt egységek nem egy egyszerű, egydimenziós (egy szempont szerint kialakított) hálózatba rendeződnek, hanem egy többdimenziós (multidimenzionális) hálózat részei (vö. pl. Dittmann 2002). Több modul együttműködését feltételezi a mentális lexikonban Aitchison is (2003: 32-33): „[…] human behaviour is often the end result of the interaction
Hálózatok a mentális lexikonban
187
of a number of quite different components, subsystems or ’modules’ […]. The same is likely to be true of the mental lexicon”. Elképzelése szerint a mentális lexikon modulokból áll, ahol a modulok átfedik egymást. Ezek a modulok: egy szemantikai-szintaktikai modul és egy fonetikai-fonológia modul, valamint egy lexikai eszköztár, amely az új szavak alkotásáért felel. A modulok komplex hálózatként képzelhetők el: erősebb kapcsolatokkal modulon belül, gyengébb kapcsolatokkal a szomszédos modulokhoz. A modulokon belül sűrűbb, kisebb hálózatok is létezhetnek. A hálózat kapcsolatai nem feltétlenül állandóak: könnyen jönnek létre vagy törlődnek, habár egy részük viszonylag állandó (vö. Aitchison 2003: 247). A mentális lexikon hálózatának egyes elemei magukban is valószínűleg egy kisebb hálózatot alkotnak, amelynek részei a szó jelentése, hangalakja, írásképe, pragmatikai szerepe, konnotációja. Collins és Loftus (1975) egy szemantikai (jelentésen alapuló) és egy lexikai (fonetikai kapcsolatokon alapuló) hálózat létezését különítik el. Caramazza (1999) Független Hálózat modellje szerint a lexikai ismeretek egymástól független hálókban tárolódnak: egy lexikai-szemantikai (pl. szójelentés) és egy lexikaiszintaktikai (pl. nyelvtani kategória) hálóban. Ezek a hálók sem egységesek, további részhálók építik fel őket. A részhálók csomópontjai gátló kapcsolatokkal is rendelkezhetnek, mivel a működés során részben egymással versengnek. Helbig (2006) elképzelése a tudás reprezentációjára szintén hasonló, azzal a különbséggel, hogy nem hálózatok együttműködését említi, hanem elképzelése szerint többdimenziós rétegek (multidimensional layer) tárolják az információt. Hudson (2007) a nyelvet szintén hálózatok együttműködésével magyarázza, feltételezve, hogy a szemantika, a morfológia, valamint a szintaxis is egy hálózat része, amely a nyelvet irányítja. A nyelv működését komplex hálózatként írja le, továbbá utal az új hálózatelméleti kutatásokkal kapcsolatos esetleges összefüggésekre is (Hudson 2007: 8-9, 123-129). Hudson megközelítése azonban nyelvészeti, és nem hálózatelméleti/matematikai. Hoey (2005) az előfeszítést (semantic priming) vizsgálva többfajta kapcsolatot (előfeszítést) feltételez, többek között kollokációs, szemantikai, pragmatikai, nyelvtani (kategóriai), valamint szövegszintű előfeszítési kapcsolatokat. Hoey elképzelése szintén egyfajta hálózatszerű rendszerként értelmezhető. Fóris Ágota (2009) nyelvi hálózatos elképzelése szintén több hálózat együttműködését feltételezi (fogalmi, nyelvészeti és kommunikációs vö. Fóris 2009: 9-10), ugyanakkor a szerző nem definiálja, hogy mit ért fogalmi, nyelvészeti és kommunikációs hálón. Fóris Ágota is utal rá, hogy – legalábbis nyelvi közvetítői tevékenységek során – további hálózatok megléte és működése is elképzelhető (Fóris 2009: 18). A mentális lexikonban a különböző nyelvek összekapcsolt volta és a mentális lexikon hálózatos felépítése mellett érvel Meara (2009) is. Balaskó Mária (2010) szavak jelentésének meghatározásában látja a hálózatok
188
Hálózatok a mentális lexikonban
szerepét: a helyzet szót korpuszokban vizsgálva arra a megállapításra jut, hogy a szavak jelentését egymásba ágyazott hálózatok dinamikus kapcsolata határozza meg. Benczes Réka (2011) értelmezésében a metonímiák egy domainhálózaton belül, szemantikai asszociációk segítségével működnek. Eddigi kutatásaink alapján feltételezhető, hogy a nyelvi (mentális lexikonban található) összetett hálózaton belül az egyes elemek között a kapcsolatok súlyozottak és irányítottak. Feltételezhető továbbá, hogy bizonyos kapcsolatok nem egyértelműen sorolhatók be a kategóriákba, illetve egyszerre több kategóriába is sorolhatók (pl. fekete – fehér: lehet domainen (szakterületen) belüli kapcsolat, hiszen színekről van szó; de lehet szemantikus kapcsolat is: ellentét), illetve, hogy a multidimenzionális rendszer részben (esetleg alhálózatonként) kisvilágkarakterű és skálafüggetlen hálózatok jellemzőit mutatja. A nyelv mint komplex, több szinten együttműködő hálózatos rendszer elképzelése tehát nem tekinthető újnak. Amennyiben a mentális lexikont mint komplex, többdimenziós hálózatot képzeljük el, számos alhálózat meglétét feltételezhetjük. A következőkben részletezzük, hogy milyen alhálózatok működését képzeljük el a mentális lexikonban. Az alhálózatokra a példákat az Agykapocsrendszerből hozzuk, hívószó → válaszszó formában. – Nyelvtani háló A nyelvtani háló részét a nyelv nyelvtani elemei alkotják, többek között a jelentéssel nem bíró szavak (névelők, kötőszók), a ragok és a jelek. A nyelvtani háló részét képezik továbbá a morfológiai elemek, valamint a szintaxis is. A jelentéssel nem bíró szavak egy része egymást hívja elő. A nyelvtant (morfológiai elemeket és szintaxist egyaránt) Hudson (2007), a mondatot Imrényi (2012) értelmezi hálózatként. Példák: valaki → senki, nyitni → ajtót, boltban → vagyok, boltban → bent, bevásárolni → boltban, elküldöm anyut → boltba. – Szemantikai háló (szinonim, antonim, hiperonim, homonim, hiponim, meronim) Az adott fogalommal kapcsolatos, tartalmilag vele szinonim, antonim, hiperonim, holonim, meronim kapcsolatban lévő fogalmak hálózata. A kapcsolatok valószínűleg ezen hálózaton belül a legerősebbek. Ezt látszik igazolni, hogy asszociációs vizsgálatok esetén a leggyakoribb válaszok ezen hálózat részét képzik (nagy – kicsi, bútor – asztal, fekete – fehér) (vö. Lengyel 2012b, Szalay–Deese 1978: 64). Murphy (2003: 42-43) ezt a fajta kapcsolatot a mentális lexikonban nem tekinti állandónak, hanem egyfajta metalexikális reprezentációját feltételezi ezen kapcsolatoknak, amelyek szükség esetén generálhatóak. Példák: adó → áfa, asztal → láb, asztal → szék, fut → kocog, kicsi → nagy.
Hálózatok a mentális lexikonban
189
– Domain (szaknyelvi) háló Az egy területhez, fogalmi körhöz tartozó kifejezések hálózata (hajó – horgony, bank – hitel). Ezen fogalmi hálózatok többnyire szaknyelvekhez tartoznak, de nem képezik szükségszerűen csak a szaknyelv részét: egy részük a köznyelvnek is része. A domain köthető szakmához, azonban nem szükségszerűen csak szakmai domainek képzelhetők el. A domaint tág értelemben képzeljük el: „[a] knowledge domain is organized by its concepts and the meaning of the concepts is anchored in the activity that is tied to the goals of the knowledge domain” (Thellefsen, T. L.–Thellefsen, M. M. 2004: 180). Példák: tőzsde → értékpapír, tőzsde → bróker, bank → kamat, kamat → láb, tőzsde → index, adó → bevallás. – Asszociatív háló Az asszociatív háló azon kapcsolatokat tartalmazza, amelyek gyakori közös előforduláson alapulnak (napsütés – tengerpart). Véleményünk szerint ebbe a csoportba sorolandók az azonos keretekből és forgatókönyvekből előhívott válaszok is, valamint elképzelhető, hogy a metonímiák és a metaforák hálózatai (vö. Benczes 2011) is ezen háló alhálói. Példák: remény → fény, ajándék → karácsony, tenger → víz, tenger → hullámok, kutya → barát, kutya → hűség, szabad → madár. – Személyes háló (szakma, társadalmi nem, utolsó tapasztalat) Ezen kapcsolati rendszerbe az adott személyre jellemző kapcsolatok tartoznak. Tartalmaz egyrészt egyértelműen azonosítható, az egyénre vonatkozó kapcsolatokat (testvér – Dezső, vagy testvér – szeretem), de tartalmazhat olyan egyéni kapcsolatokat is, amelyek kevésbé egyértelműek: külföld – Svájc (mert éppen ott nyaralt az illető). A személyes hálózatot befolyásolja a kor, a nem és a végzettség (Cramer 1968, Kegyesné 2002). Példák: szerelem → Andi, szerelem → Zoli, virág → nőnap, manager → BGF. – Kulturális háló (reália háló) Adott kultúrára jellemző kapcsolatokat tartalmaz (húsvét – locsolás). Példák: ünnep → augusztus 20., kenyér → augusztus 20., augusztus 20. → Szent István, Szent István → korona, paprika → Kalocsa. – Kollokációs háló Az általában együtt használt szavak, állandó kifejezések hálózata, amely nyelvspecifikus. A nyelvtani hálótól azért különítjük el, mivel az a szabályrend-
190
Hálózatok a mentális lexikonban
szereket alkotja meg, míg ez a hálózat a tényleges nyelvhasználatot jellemzi (vö. Hoey 2005). Példák: gazdaság → helyzet, bonyolult → helyzet, tartalmas → beszélgetés, kedves → ismerős, vidám → barakk. – Fonetikai háló Fonetikai háló esetében a kapcsolatok a hasonló hangalakú szavak között jönnek létre. Szóasszociációs vizsgálatok igazolják, hogy a fonetikai kapcsolatok főleg gyerekek és idegen nyelvet tanulók esetében fontosak (Lengyel 1997, Söderman 1993). A fonetikai jellegű kapcsolatok hálózatos jellegét Vitevitch (2008) igazolta. A fonetikai-fonológiai kapcsolatokat magyar nyelvre Lengyel (2012a) elemzi részletesen, kitérve a kapcsolatok fajtáira és azon műveletekre, amelyek segítségével ezen kapcsolatok kialakulnak. (Ezen kapcsolatok véleményünk szerint megfelelnek Collins és Loftus (1975) lexikai hálójának.) Példák: csiga → biga, cseng → bong, remény hal → lepényhal, lepke → kelep, pincér → cincér. – Enciklopedikus háló Az explicit, tárgyi ismereteket tartalmazza a világról (Olaszország – Róma). Példák: magyar király → István, Mona Lisa → Leonardo, Harley → Davidson, Komár → László, Talmácsi Gábor → motorsport, Yamaha → motormárka, Hillary → Clinton, zöld → Fradi, Weöres Sándor → költő. – Ekvivalencia háló Két- vagy többnyelvűek, illetve idegen nyelvet beszélők esetében beszélhetünk erről a hálózatról, amely egy nyelv szavait kapcsolja egy másik nyelv szavaihoz. Ez a háló valószínűleg nem egyetlen hálózat, hanem önmagában is összetett rendszer, amely fonetikai, szemantikai, domain, nyelvtani komponenst tartalmaz. Navracsics Judit (1999, 2007) utal rá, hogy kétnyelvűek asszociációs vizsgálata esetén gyakori az ekvivalensek megadása válaszként. Példák: vám → Zoll, remény → hope. Huszár Ágnes a mentális lexikon fogalmi szintjének tárgyalásánál utal rá, hogy a mentális lexikon asszociációit két szinten lehet vizsgálni: a konceptuális lexikonunk egyrészt egyetemes (ez teszi lehetővé, hogy megértsük egymást, hogy kommunikáljunk), ugyanakkor ezen közös vonások mellett minden egyes ember konceptuális lexikonja részben egyedi is (Huszár 2005: 75). Ezért úgy gondoljuk, hogy a mentális lexikonban (és a nyelvben) meglévő hálózatok szintén két szinten vizsgálandók: a saussure-i langue és parole szintjén (vö. Saussure 1997: 48).
Hálózatok a mentális lexikonban
191
– A langue-ot elméleti (absztrakt) hálózatok alkotják, amelyek társadalmiak, és függetlenek az egyéntől. A szint alrészei (fenti felsorolásból) a domain (szaknyelvi), a nyelvtani, a szemantikai, a kulturális és a fonetikai háló. Valószínűleg az asszociatív hálónak is van langue-komponense – ez magyarázhatja pl. a prototipikusság jelenségét. Ezen hálózatok leírására az asszociációs normák, thesaurusok, nyelvtani szabályok alkalmasak. – Parole szinten ezeknek a hálózatoknak egy részét realizáljuk, de mellette egy személyes és asszociatív háló is megjelenik. Ezek az egyénre, adott beszélőre; pontosabban az adott beszélőre egy adott időpontban jellemzőek. – Az ekvivalencia háló mindkét szint részét képezi (lásd pl. szótárak, illetve az egyén nyelvtudása), ugyanakkor két nyelv ismeretét feltételezve a fenti összes hálózat létezik L1 és L2 nyelven. Hasonlóképpen a Grosjean és Léwy által kidolgozott BIMOLA-modell (Bilingual Model of Lexical Access – lexikali elérés bilingvis modellje) kétnyelvűek esetében két, részben összekapcsolt nyelvi hálózatot feltételez (vö. Navracsics 1999). – Az enciklopedikus háló a nyelvi hálóktól függetlenül képzelhető el. Más szempontrendszert követve a hálózatokat besorolhatjuk rendszer- és használatnyelvészeti felosztás szerint is (asszociációk használatnyelvészeti besorolására vö. Lengyel 2011a, 2011b), vagyis egyrészt léteznek olyan hálózatok, amelyeket a nyelv struktúrája hoz létre (pl. grammatikai háló), másrészt olyan hálózatok is, amelyeket a nyelv használata, információ-, kultúra- és tudásközvetítő- és megörző szerepe indukál (pl. enciklopedikus háló). Az egyénre tehát a fent említett hálózatok valamely kombinációja lesz jellemző. Ezen kombináció természetesen lehet, hogy részben kultúra-, végzettség-, nem- és életkorfüggő: bizonyos hálók aktívabbak, illetve erősebbek lehetnek például egy kultúrában vagy adott életszakaszban. Az egyének esetében tehát ezen hálók nem állandóak, hanem dinamikusan változnak – bővülnek, szűkülnek, aktívabb-passzívabb állapotba kerülnek; például az életkor függvényében. A fenti hálózatok működése nem minden esetben hibátlan: kezdő nyelvtanuló esetén az ekvivalencia-háló hibásan működik, hatással lesz rá pl. a forrásnyelvi nyelvtani vagy szemantikai háló, vagy a kapcsolatok a forrásnyelvi elemek között (interferencia). Az anyanyelvi hálóban is lehetnek hibás kapcsolatok: ezen esetekben adott elem a tanulási folyamat során hibásan került elhelyezésre valamelyik hálóban, így azt az aktiválás során is hibásan (pl. nem megfelelő összefüggésben) hívjuk elő. Példa a hibás előhívásra, illetve a helytelen jelentésismeretre: szatócs – szolgáló, gésa – hárem, reggel – evening. A nyelvek közötti kapcsolat esetében feltételezzük, hogy az ekvivalencia háló az a háló, amely a nyelvek közötti kapcsolatot megteremti (vö. Lengyel
192
Hálózatok a mentális lexikonban
2009b asszociációit). Navracsics Judit (2001b) azonban kétnyelvűek mentális lexikonjának asszociációs vizsgálata során rámutat arra, hogy a két nyelv között fonetikai kapcsolatok is létrejöhetnek (pl. fut – foot, mély – may), így a nyelvek fonetikai alapon is kapcsolódhatnak. Lengyel Zsolt (2009b) a nyelvek kapcsolódásának további lehetőségeire is felhívja a figyelmet – többek között olyan esetekre, ahol szófajváltás és nyelvváltás is történik (pl. hallani – telephone). Kérdéses ugyanakkor, hogy ezen kapcsolatok mennyire tekinthetők relevánsnak, illetve milyen mértékben zajlik ezen kapcsolatok mentén (hibás?) aktiváció. Kétnyelvűek esetében a kapcsolatrendszer és a hálók egymást is gyengíthetik, illetve erősíthetik, így kétnyelvűeknél az L1 háló kapcsolatai, illetve annak aktiválása eltérhet a monolingvis L1 hálóétól (vö. Schmid–Köpke 2009). A kapcsolatok a hálózat elemei között lehetnek többdimenziósak, vagyis elképzelhető, hogy két elemet nemcsak egy, hanem több kapcsolat köt össze (vö. Koehly–Pattison 2005): az ázik – fázik páros esetében fonetikai kapcsolat, de aszszociációs kapcsolat is van a két elem között. A felsorolt alhálózatokhoz az Agykapocs-kutatásból hozott példáknál több esetben szintén nem egyértelmű a besorolás, mivel a kapcsolat két elem között többdimenziós. A létezőnek feltételezett hálózatok pontos működése, egymással való interakciója, egymásra hatása (blokkolása vagy erősítése) nem ismert. A hálózatok közötti hierarchiaként, illetve blokkolás-erősítésként fogható fel Spitzer (1996) – Jung és Aschaffenburg kutatásai alapján – tett megállapítása, mely szerint a fáradtság, illetve a csökkenő figyelem (koncentráció) esetén a fonetikai asszociációk kerülnek túlsúlyba. Szalay és Deese (1978) szintén utalnak ezen jelenségre: időmegkötéssel, szóbeli asszociációkat kérve sokkal több fonetikai asszociáció érkezik válaszként, mint írásban történő kérdezéskor, időmegkötés nélkül. Ez azt jelentheti, hogy bizonyos hálózatok működéséhez magasabb szintű kognitív funkciók szükségesek, míg más hálózatokhoz csak alacsonyabb szintűek. Ez utóbbiak mintegy „mentőövként” szolgálhatnak, ha a magasabb szintű kognitív funkciók nem működnek (vagy működhetnek) megfelelően. Hasonló magyarázata lehet annak, hogy nyelvtanulók esetében gyakori az L2 szavainak hangzás utáni keverése. Fenti feltételezéseket továbbgondolva elképzelhetőnek tartjuk, hogy nem csupán a mentális lexikon, hanem maga a nyelv is hálózatként értelmezhető: olyan hálózatként, amelyet számos kisebb, egymással együttműködő, illetve egymást részben átfedő alhálózat alkot. Alhálózat lehet egy szaknyelv, egy stílus, egy regiszter, de (például két- és többnyelvűek esetében) alhálózat lehet egy egész nyelv is (részletesen vö. Kovács 2012d). Ezen alhálózatokkal kapcsolatos további elképzeléseinket korábban máshol (Kovács 2012d: 46-47) már megfogalmaztuk. Fontosnak tartjuk azonban ezen összefüggéseket itt is átvenni, és azt a fent említett hálózat-alhálózat kontextusba
Hálózatok a mentális lexikonban
193
helyezni. Tesszük ezt azért, hogy az Olvasó egységes(ebb) és átfogóbb képet kapjon az alhálózatokról, anélkül, hogy más publikációhoz kellene fordulnia. A következőkben tehát saját korábbi publikációnk alapján ezen nagyobb alhálózatok (például regiszterek, stílusok) jellemzőivel kapcsolatban fogalmazunk meg feltételezéseket. Feltételezzük tehát, hogy a nyelv egy komplex hálózat, amelyet alhálózatok alkotnak. Az alhálózatokon belül erősebbek a kapcsolatok, ezzel szemben az alhálózatokon kívülre mutató kapcsolatok gyengébbek. Feltételezhető, hogy abban az esetben, ha egy adott nyelvet, (akár regisztert vagy stílust) aktiválunk, akkor annak alhálózata magasabb aktivációs szintre kerül, így annak elemei könynyebben elérhetők. Az alhálózatok egymástól (viszonylag) független működése, valamint ezzel összefüggésben az egymástól részben független aktiválása magyarázhatja, miért nem terjed ki az aktiváció bizonyos szavakra, illetve miért nem terheli túl a sok aktiváció mentális lexikonunkat. Külön említendők a zárt szóosztálybeli szavak (pl. névelők, névutók, kötőszavak stb.) amelyek minden hálózatnak egyformán részét képezik (valószínűleg egyfajta csomópontként funkcionálnak), ezért bármely stílus vagy regiszter aktiválása során aktiváltak. Az alhálózatok tehát ezeken a pontokon biztosan metszik egymást. Az alhálózatok a grammatikai funkciókat betöltő szavakon kívül is több helyen is érintkeznek, illetve kapcsolatban állnak egymással: a különböző nyelvek az ekvivalenseken, a nyelv stílusban eltérő hálózatai például a szinonimákon keresztül. Kérdésként tehetjük fel, hogy hogyan jönnek létre és miként különülnek el ezen alhálózatok – azaz milyen módon válnak egy alhálózat részévé bizonyos elemek. Az alhálózatok létrejöttére vonatkozóan négy elképzelést írunk le röviden: – szavak együttes gyakori előfordulása; – szavak gyakori előfordulása adott szituációban; – szavakhoz „mentális jelzők” rendelése; – kapcsolatok címkézése. Elképzelhető, hogy szavak együttes gyakori előfordulása teszi lehetővé a szavak között viszonylag erősebb kapcsolatok létrejöttét. Azaz, ha sokszor találkozunk együtt adott szavakkal (foglalj – helyet, pénz – bank), automatikusan erősebb kapcsolatok alakulnak ki közöttük. Egy másik lehetőség, hogy adott szituációban gyakori előfordulás befolyásolja az alhálózathoz rendelést (vö. Fodor 1983: 81-82). Például külföldön járva, idegen nyelvű kiírást (pl. gelato) látva a szót azonosítjuk adott nyelvvel, illetve a többszöri látvány (esetleg vásárlás) alapján rögzítjük, hogy egy ételről (fagylalt) van szó.
194
Hálózatok a mentális lexikonban
A harmadik lehetséges módja az alhálózatok kialakulásának, hogy az egyes szavakat tapasztalat, vagy gyakori előfordulás alapján jelzőkkel látjuk el, hasonlóan a szótárakban használt besorolásokhoz (pl. gazdasági szakszó, vagy hivatalos nyelvi kifejezés), majd adott beszédtevékenység közben ezen jelzők megléte mentén aktiváljuk a megfelelő egységeket. A mentális lexikon (és a nyelv) alhálózatainak elemei (egyes pontjai) tehát lehetséges, hogy magukban is egy hálózatot alkotnak, amely hálózatnak része többek között a szó jelentése, hangalakja, írásképe, pragmatikai szerepe, konnotációja, regiszter-, stílus- és nyelvi besorolása. A negyedik lehetőség, hogy a szavak közötti kapcsolatok típusa határozza meg az alhálózatot, vagyis adott kapcsolatnak lehet címkéje: akár csak bináris „engedélyezett aktiválás”, vagy „nem engedélyezett aktiválás” formában, esetleg sokkal összetettebben, pl. „gazdasági szaknyelv része” „szinonima”, vagy „elavult szinonima”. Ez utóbbi magyarázná a szinonimák meglétét és a közülük történő válogatás folyamatát is (vö. Gangl 2012). Ez az elképzelés részben hasonlít a szemantikai memóriáról alkotott korábbi elképzelésekhez (vö. Baddeley 2001, Quillian 1968). Valószínűsíthető, hogy a valós rendszer valamilyen módon mind a négy, itt felvázolt lehetőség ötvözete, ugyanakkor utalnunk kell rá, hogy az alhálózatok kialakulásával kapcsolatban leírtak csak feltételezések, a kialakulásban ténylegesen szerepet játszó tényezők csak empirikus kutatások segítségével azonosíthatók. A fentiek alapján megfogalmazhatjuk hipotézisünket a mentális lexikon hálózatos felépítéséről. A mentális lexikon feltételezésünk szerint egy olyan komplex hálózatos rendszer, amelynek alhálózatai adott nyelvi tevékenység kiszolgálása érdekében aktiválódnak. Az alhálózatok több helyen érintkeznek egymással, így közöttük átkapcsolás lehetséges. A mentális lexikon hálózatainak pontjai öszszetett (többek között nyelvi, grammatikai és stiláris) információkat tárolnak, míg a kapcsolatok irányítottságuk és súlyozottságuk mellett további jellemzőkkel rendelkezhetnek. Az alhálózatokon belül erősebbek, míg az alhálózatok között gyengébbek a kapcsolatok. Az elképzelés (habár ilyen jellegű megfogalmazása számunkra nem ismert), mint láttuk nem is tekinthető teljesen újnak. A nyelv hasonlóan hálózatos felépítését feltételező, fent említett kutatókon túl utalnunk kell Hymes-ra (1997: 478), aki szerint a beszédhálózatok „azonos beszédformákat és beszédmódokat ismerő személyek között létesül[nek]”. Ezen kijelentést úgy is értelmezhetjük, hogy azon személyek alkotnak a Hymes-i értelemben beszédhálózatot, akiknek mentális hálózata hasonló alhálózatokat tartalmaz, illetve akikről elmondható, hogy legalább egy olyan alhálózattal rendelkeznek (legyen az közös nyelv, stílus vagy regiszter), amelyet a beszédhálózat minden tagja ismer.
Hálózatok a mentális lexikonban
195
A mentális lexikon hálózatos struktúrájának képi ábrázolására (valós adatokkal) itt nem teszünk kísérletet: ehhez az asszociációk közötti viszonyok pontos kategorizálása lenne szükséges, ami önmagában is önálló kutatási projekt. Ennek ellenére elképzelésünket szeretnénk vizuálisan is az Olvasó elé tárni, ezért egy olyan ábrát mutatunk be, amely – bár más hálózatról készült –, de jól mutatja azt a komplex struktúrát, amelyet a mentális lexikonban feltételezünk. A 24. ábra a Last.fm zenei előadók hasonlósági gráfja. (Köszönjük Nepusz Tamásnak (ELTE Biológiai Fizika Tanszék), hogy hozzájárult az ábra publikálásához. Az ábra a http://sixdegrees.hu/last.fm honlapon, míg a kutatással kapcsolatos részletek az http://sixdegrees.hu/last.fm/technical_details.html oldalon érhetőek el.)
24. ábra. Elképzelés a mentális lexikon hálózatos felépítésének ábrázolására (Az ábra a Last.fm zenei előadók hasonlósági gráfja; Nepusz Tamás, ELTE Biológiai Fizika Tanszék, http://sixdegrees.hu/last.fm.)
A mentális lexikon hálózatait hasonló módon képzeljük el. A különböző színek a mentális lexikon különböző alhálózatait jelölik, míg az egyes pontok nagysága adott egység központi szerepének függvényében változik: minél nagyobb a pont, annál több kapcsolattal rendelkezik. Láthatjuk, hogy a hálózatok részben átfedik egymást, illetve szorosan kapcsolódnak egymáshoz. Azt is látjuk,
196
Hálózatok a mentális lexikonban
hogy ha egész alhálózatokat (azonos színű pontok) kiemelünk a hálózatból, az az egész hálózat felépítését befolyásolja ugyan, de a hálózat mégis egyben marad. A mentális lexikon hálózatainak megléte – mint láttuk – részben bizonyítottnak tekinthető (Hoey 2005, Hudson 2007, Vitevitch 2008), ebből a szempontból nem fogalmazunk meg újdonságot. A nóvum inkább ezen különböző hálózatok összekapcsolása, komplex rendszerként történő értelmezése. Hozzá kell tenni, hogy ezen összefüggések felismeréséhez és kutatásához pontosan olyan sok szempontból elemezhető asszociációs (mega-)adatbázisok szükségesek, mint amilyent az Agykapocs-rendszer is képvisel. Közel 160.000 adat és 21.000 (potenciális) hívószó és a gyors elemzés lehetősége ugyanakkor (véleményünk szerint) még mindig kevés; akkor is, ha az adatbázis jelen formájában a magyar nyelvre sok szempontból egyedinek tekinthető és más nyelveken is csak kevés adatbázis hasonló nagyságrendű. A hálózatok vizsgálatát többféleképpen is elképzelhetőnek tartjuk. Egy több százezer, akár millió adatot, több tízezer hívószót tartalmazó asszociációs adatbázis segítségével az egyes szavakra adott asszociációk elemzésével kirajzolódhat egy olyan minta, amely megmutatja, hogy mely hálózatok működése befolyásolhatja a mentális lexikon felépítését. Az adatbázisnak tartalmaznia kell hívószóként ragozott alakokat, tulajdonneveket, kötőszókat stb., tehát a hagyományos asszociációs kutatásokban kevésbé vizsgált elemeket is. Segítségével igazolható a könyvben említett hálózatok létezése. Természetesen az is elképzelhető, hogy az itt felvázolt hálózatokat részben össze lehet vonni, vagy további elemekkel kell bővíteni őket. Kérdésként tehtejük fel például, hogy külön kisebb rendszerekként (csoportosulásokként) értelmezendők-e a 2. fejezetben említett keretek és forgatókönyvek, illetve hogy ezek megfeleltethetőek-e például az epizodikus (kontextuális/szituatív) tudásnak (vö. Knipf–Rada–Bernáth 2006). A nagy adatbázis szükségességét azért hangsúlyozzuk, mivel így érhető csak el, hogy megfelelő mennyiségű adat álljon rendelkezésre. Ha csak kevés hívószóra van adatunk, akkor bizonyos hálózatok (reália, enciklopedikus) nem jelenhetnek meg. Ha adott hívószóra csak viszonylag kis számú (pár tíz) adatunk van, akkor a kirajzolódó kép nem lesz elég differenciált: más „felbontást” tudunk elérni egy hívószóra kapott 1000 válasz és 50 válasz esetében. Ez ellentmondani látszik ugyan Meara (2009) normákra vonatkozó „limitjének” (a normák beállása 50 szó körül várható), azonban ez csak részben ellentmondás. A normák beállása ugyan valószínűleg tényleg 50 válasz körül várható, jelen esetben azonban nem a normák kutatása a cél. 1000 válasz esetén már észrevehető lesz, hogy bizonyos válaszok relatíve gyakoribbak lesznek – ez esetleg csak tíz választ (1%) jelent. Tíz egyező válasz ugyanakkor valamilyen mögöttes struktúrát sejtet. Amennyiben csak ötven választ vizsgálnánk, ez a nem normaszerű, de mégis jellemző asszociációs válasz elképzelhető, hogy meg sem jelenik, illetve csak egyszer – és elveszik a többi egyszavas válasz között.
Hálózatok a mentális lexikonban
197
Az itt felvázolt, a mentális lexikont mint komplex (multidimenzionális) hálózatot leíró hipotézis ugyanakkor számos kérdést is felvet. Ahogy a 2. fejezetben említettük, jelenleg nincs egységes elképzelés a mentális lexikon felépítésére vonatkozóan. Nem tudjuk, hogy a konceptuális szint külön kezelendő-e, létezik-e szemantikai szint, amennyiben igen, az nyelvfüggetlen vagy nyelvfüggő-e stb., illetve hogyan kapcsoljuk ezen elképzelésekhez a kognitív nyelvészetben leírt prototipikalitás jelenségét vagy a kereteket? A kognitív nyelvészethez egy kapcsolódási pont lehet például Benczes Réka (2011) metonímiákat és fogalmi domaineket hálózatként értelmező publikációja, illetve Fauconnier és Turner (2002) mentális terei és blendjei/integrált terei (magyarul Kövecses–Benczes 2010). Amennyiben a mentális lexikon működését nem mint hierarchikus rendszert jellemezzük, különböző (konceptuális, szemantikai stb. (vö. pl. Gósy 2005)), egymásnak alá-, illetve fölé-, esetleg mellérendelt (PDP) szintekkel, hanem mint komplex hálózatot számtalan alhálózattal, akkor lehetséges, hogy a fent említett kérdéseket és megközelítéseket teljesen más szemszögből kell vizsgálni. A fejezetben korábban leírt alhálózatok egyszerre léteznek és működnek, erősítve, illetve blokkolva egymást. Elfogadható a feltételezés, hogy bizonyos kutatások (akaratlanul) ezen rendszereknek csak egy részét aktiválták, vagy bizonyos rendszereket jobban stimuláltak, míg más kísérletek más hálózatok működésének „kedveztek” – ennek eredményeként keletkezhetnek egymásnak (látszólag) ellentmondó empirikus adatok. Kérdéses továbbá, hogy adott nyelv felépítése (agglutináló, flektáló) nem kedvez-e ezen hálózatok közül valamelyiknek, vagyis esetlegesen elképzelhető-e, hogy ezen hálózatok működési jellegzetessége nyelvenként részben különbözik? Az is egy lehetőség, hogy adott nyelv típusa „hozza létre” a nyelvtípusra jellemző hálózatot. Szintén befolyással lehetnek a hálózatok működésére az egyén bizonyos jellemzői: kétnyelvűek és nyelvtanulók mentális lexikonjának felépítése egyértelműen különbséget mutat. Ennek oka lehet, hogy míg gyerekkorban egyfajta hálózatot részesítünk előnyben, addig felnőttkorban más hálózatok aktívabbak – így az új ismereteket (az új nyelv) is ezen, adott korban aktívabb hálózaton keresztül sajátítjuk el (vö. szintagmatikus-paradigmatikus váltás; fonetikai hálózathoz való „visszatérés” ismeretlen szavak esetében). Magyarázatként szolgálhat a komplex hálózat elképzelés a mentális lexikon tárolási és hozzáférési kérdéseire is, vagyis arra, mit, hogyan, milyen rendszerben, pl. nyelvfüggetlenül vagy nyelvhez kötötten tárolja az információt a mentális lexikon. Alhálózatokkal, az alhálózatok közti átfedésekkel, illetve azok különböző szintű aktiválásával (előnybe részesítésével) ezen kérdések (az eddig feltett formában) feleslegessé válhatnak. A legtöbb, a lexikont és a tárolást leíró modell így akár egy egységes rendszerben is magyarázható, azaz a korábbi modellek nem kizárják egymást, hanem – részben – egymás mellett léteznek.
198
Hálózatok a mentális lexikonban
A fentebb felvázolt, a mentális lexikonban tárolt tudást (és a nyelvet) mint komplex hálózatot jellemző elképzelés tehát sok kérdésre adhat választ és elősegítheti nyelvi jelenségek nem egymástól független, hanem egymással összefüggő, komplex vizsgálatát. Nyelvi jelenségek hálózatként való értelmezése nemcsak elméleti nyelvészeti szempontból fontos, hanem alkalmazott nyelvészeti hatása is jelentős. Amennyiben a nyelv ténylegesen hálózatok összessége, továbbá a nyelvi hálózatok felépítése hasonlít más valós hálózatok felépítésére (skálafüggetlenség, kisvilág-karakter), akkor a nyelvi hálózatok hálózatelméleti (matematikai/gráfelméleti) módszerekkel feltérképezhetők és jellemzőik részben kvantifikálhatók. A nyelv bizonyos jellemzőinek számszerűsítése a nyelvtechnológia területén elvezethetnek az eddigieknél pontosabb, a valós nyelvhasználatot jobban modellező alkalmazások (szoftverek) megalkotásához. A nyelv hálózatos jelenségként történő értelmezése új perspektívákat nyithat a nyelv megismerésével kapcsolatban.
7.7 Nyelvi hálózatok alkalmazási lehetőségei A mentális lexikonban található nyelvi hálózatokkal kapcsolatos eredmények számtalan kérdést vetnek fel, valamint további kutatási feladatokat is kijelölnek. Jelenleg nehezen prognosztizálható, hogy a nyelv (a fent említetthez hasonló) hálózatos szerveződése igazolható-e vagy nem, illetve ha igazolható, akkor szükséges-e, hogy a hálózatelméletben használt módszereket nyelvi hálózatok vizsgálatára adaptáljuk. A nyelv hálózatos megismerésével kapcsolatban (többek között) a következő kutatási területek merülhetnek fel: 1. a nyelv elsajátítása közbeni kialakuló hálózati rendszerek (szemantikai és szintaktikai szinten); 2. a kapcsolatok irányának és súlyozottságának változása, illetve átrendeződése az életkor változásával; 3. két- vagy több nyelvi hálózat egymásra hatásának eredménye a nyelvhasználatban (pl. kódváltás, interferencia), valamint a nyelvtanulók nyelvi hálózatainak kölcsönhatása; 4. kapcsolati hálózatok módosulásának és nyelvek változásának (nyelvújítás, nyelvterjedés, nyelvvesztés, nyelvcsere, nyelvhalál) összefüggései; 5. az agy neurális felépítésének és a nyelv egyéni változásának összefüggései, különösen nyelvpatológiai szemszögből; 6. nyelvi hálózatok sajátos nyelvi, illetve nyelvtől független, univerzális jellemzőinek kimutatása.
Hálózatok a mentális lexikonban
199
A nyelven kívüli hálózatok vizsgálatának lehetőségeit itt nem kívánjuk részletesen kifejteni: a lehetőségek és összefüggések vázlatos bemutatása is csak egy hosszabb publikáció keretein belül képzelhető el, ezért csak néhány gondolattal szeretnénk utalni az emberi kapcsolati hálózatok és nyelv összefüggéseinek vizsgálati lehetőségeire (részletesen vö. Kovács 2011a). A kapcsolati hálózatok és a nyelv összefüggései nem jelentenek új kutatási területet a nyelvészetben: Marshall (2004) és Milroy (1987) szintén társadalmi hálózatok és nyelv kapcsolatát vizsgálják. Az újdonságot a hálózatok hálózatelméleti megközelítése jelentheti: az ebből következő törvényszerűségek új szempontokat fogalmazhatnak meg szociolingvisztikai kutatások területén. Hasznos lehet többek között a csomópontok felismerése: a társadalmi hálózaton belül ezek bizonyos személyek, de akár csoportok is lehetnek (pl. egyetemisták). A meghatározó, sok kapcsolattal rendelkező csoportok felismerése hozzájárulhat többek között nyelvhasználati szokások/új szavak terjedésének leírásához, esetleg tudatos befolyásolásához. Hasonlóképpen a nyelvcsere folyamatának kutatása is új szempontokkal gazdagodhat hálózatos kutatások segítségével. Veszélyeztetett nyelvek esetén kimutathatóak lehetnek olyan összefüggések a beszélőközösségen belül, amelyek lassítják, vagy megállítják a nyelvhalál folyamatát. A mentális lexikonban a kapcsolatok irányultságának, valamint erősségének figyelembevétele, átfogóbb feltérképezése (vagyis a gráfokkal ábrázolt modell szerinti vizsgálata) a nyelvészet sok területén és interdiszciplináris kutatásokban (gyakorlati célokra) is alkalmazható. Alábbi felsorolásnak nem célja minden felhasználási terület kiemelése, illetve a kiemelt területeken végzett és/vagy jelenleg folyó kutatások ismertetése, csupán példák segítségével kíván rávilágítani arra, milyen lehetőségeket rejt a nyelvészet számára a mentális lexikon pontosabb megismerése, milyen kutatásokat inspirálhat a mentális lexikon egy pontosabb hálózatos modellje. Szóasszociációs kutatások eredményeinek gyakorlati felhasználhatóságára Lengyel Zsolt (2010) is kitér. Jelen felsorolás Kovács (2009a) felsorolásának kibővítése. Az idegennyelv-oktatás területén a mentális lexikon pontosabb megismerése segíthet a szótanulás sorrendjének kialakításában, az együtt megtanulandó szavak (pl. lecke szövegezése) kiválasztásában. Fitzpatrick (2006, 2007) nyelvtanulók és anyanyelvűek mentális lexikonját összevetve hívja fel a figyelmet az asszociációk vizsgálatának fontosságára, ugyanis releváns a különbség anyanyelvi és nem anyanyelvi beszélők (tanulók) asszociációi között: előbbiek gyakrabban adnak meg válaszként kollokációkat és szinonimákat. Az egyes szavak közti kapcsolatok irányának és erősségének vizsgálata anyanyelvűeknél tehát valószínűleg olyan összefüggéseket tárhat fel, melyeket a nyelvoktatás vagy nyelvkönyvek
200
Hálózatok a mentális lexikonban
írása során lehet hasznosítani. Hasonlóan asszociációk nyelvoktatásba történő bevonását javasolja Meara (2009) is. A magyar mint idegen nyelv oktatásában (de akár más idegen nyelvek oktatásában is) az asszociációk rámutathatnak például arra, hogy a nyelvtanuló szókincsének alakulását, a létrejövő kapcsolatokat mennyire befolyásolja az oktatásra használt tankönyv és a tananyag (vö. Nádor 2012). Az anyanyelv elsajátításában, illetve oktatásában szintén hasonló okból célszerű az irányított kapcsolatok figyelembevétele, mint idegen nyelvek esetében, azzal a különbséggel, hogy itt (főleg kisgyerek-korban) a felnőttek asszociációi helyett gyerek-asszociációs adatbázisok létrehozása a célszerű, ugyanis gyerekeknél gyakoribbak a hangzáson alapuló, illetve szintagmatikus asszociációk, mint a paradigmatikusak. Longitudinális vizsgálatokkal kimutatható a fonetikai és szintagmatikus, valamint paradigmatikus kapcsolatok közötti váltás gyerekkorban (syntagmatic-paradigmatic shift). Beckage et al. (2011) kisgyermekek nyelvi hálózatainak alakulását vizsgálva megfogalmazza a feltételezést, hogy összefüggés van a nyelvelsajátítás kora és a kialakuló nyelvi rendszer hálózatos karaktere között. Nyelvek kontrasztív elemzése, pl. azonos hívószóra adott asszociációk esetében a kapcsolatok erősségének eltérése nyelvtől függően (és ebből származó interkulturális különbségek). Nemcsak a nyelvoktatás, hanem az interkulturális kommunikáció szempontjából is fontos, hogy bizonyos szavak elhangzásakor adott anyanyelvi beszélő mire asszociál. Egyes szavak esetében az asszociációk közti különbségek előre várhatóak és egyértelműek (legerősebb asszociáció angolul king – queen, németül König – Kaiser, vö. Postman–Keppel 1970), más szavak esetében a különbség csak asszociációs tesztek segítségével lesz nyilvánvaló (house – home, ellenben Haus – Hof, vö. Postman–Keppel 1970) (Kovács 2009c). A globalizáció korában, amikor az interkulturális kommunikáció szerepe egyre fontosabb, az asszociációs kutatások új szemszögből világíthatnak rá a kultúrák közötti (misz)kommunikációra. Lexikográfiában szótárak létrehozására, a szótárbeli információk rendszerezésére használhatók a mentális lexikonból asszociációkkal gyűjtött adatok, valamint szótárakban az információk keresésében hasznosíthatók a mentális lexikon felépítéséről gyűjtött ismeretek (vö. Nielsen 2002). A marketing/reklám területe: a reklámban használt szavak sorrendisége, a különböző szavakhoz kapcsolódó asszociációk erőssége/iránya fontos lehet. Az Agykapocs-kutatásból vett példák alapján a hitel szóra a válaszok 33%-a (legerősebb asszociáció) a pénz, de a pénz szóra csak 1%-ban (20. hely) kapjuk válaszként a hitel-t. Valószínűleg nagyobb hatással, célzottabban végezhető marketingtevékenység, amennyiben tudjuk, hogy egy adott célcsoport mentális lexikonjá-
Hálózatok a mentális lexikonban
201
ban létezik-e, és milyen erősségű a kapcsolat két adott szó között. Férfiaknál az alma hívószóra a legerősebb asszociáció a körte, nőknél a piros – abból kiindulva, hogy gyümölcsöt többnyire nők vásárolnak (a családnak is) célszerűbb piros alma képével reklámozni a gyümölcsöt, mint sárga vagy zöld gyümölcsével. Asszociációk és hálózatok márkakutatásban betölthető szerepéről részletesen Kovács László (2012a, 2012b, 2012c) ír. A mentális lexikonban jelen lévő súlyozott kapcsolatok, kisvilágok kimutatása és feltérképezése hozzájárulhat számítógépek számára értelmezhető fogalmi rendszerek kialakításához. Az így kialakított fogalmi rendszer-modellek a számítógépes nyelvészet, a nyelvtechnológia és a mesterséges intelligenciakutatás, valamint az informatika következő területein használhatók: A szemantikus web-kutatások (Gottdank 2006, Szeredi–Lukácsy–Benkő 2005) és intelligens keresőrendszerek esetében a cél számítógépek által is elemezhető „értelem” hozzáadása az interneten található információkhoz: ha a gorilláról akar a felhasználó valamit megtudni, akkor a majom fogalomkörön belül mozog és ami a majmokra igaz, az igaz lesz a gorillákra is. Amennyiben krumpliból készült ételek receptjét keresi, akkor a burgonya szót tartalmazó receptek is fontosak számára. Az interneten található információ ilyen szempontból „intelligenssé” tétele fontos informatikai kutatások tárgya. A kutatók egy része pontosan szóasszociációs szótárak használatával oldaná meg a feladatot (Sinopalnikova– Smrź 2004). Fenti két példa esetében: amennyiben a számítógép tudja, hogy a gorilla egy majom, illetve hogy a krumpli=burgonya, a keresések pontosabb eredményeket adhatnak. Hasonló, a WordNetre épülő szemantikai kereső fejlesztése jelenleg is folyik (vö. Angioni et al. 2007). Az World Wide Web-ben meglévő, nem explicit információk kiszűrése és rendszerezése: web-bányászat (vö. pl. Chakrabarti 2003). A szövegbányászattól annyiban határolnánk el, hogy az szövegbányászathoz használt szövegek sokszor egymástól függetlenek, egymáshoz való kapcsolódásuk nem mindig egyértelmű. A weben található dokumentumok nagy része viszont utal egymásra, amely utalások struktúrája, vagy a szópárok előfordulása fontos információk forrása lehet. Az ilyen látens struktúrák feltérképezésének egyik lehetősége Osgood–Suci– Tannenbaum (1957) szemantikus tér (semantic space) és szemantikai eltérés (semantic differential) elképzelésének továbbfejlesztése a World Wide Web-re (Arnold 2006). Egy másik megoldás különböző rendszerek összekapcsolása: a YAGO rendszer (Suchanek–Kasneci–Weikum 2007) elektronikusan tárolt enciklopedikus (Wikipedia) és nyelvi tudást (WordNet) egyesít egy adatbázisban. A weblapok többnyelvű felépítési jellemzőjét használja fel a Linguee oldal, amely szavak jelentését párhuzamos korpuszok (weben található fordítások) segítségével adja meg.
202
Hálózatok a mentális lexikonban
Elképzelhető fogalmi rendszereken alapuló automatikus fordítói rendszerek kialakítása, illetve a jelenlegi rendszerek hibáinak javítása. A ma elterjedt rendszerek fordítási hibáinak egy része abból ered, hogy a rendszerek nem taníthatók meg olyan egyértelmű összefüggésekre, amelyek az emberek számára evidensek. A rendszerek sok esetben azt sem képesek felismerni, hogy adott szó milyen jelentésben szerepel a szövegben. Az adott jelentés megállapításához fontos a kontextus vizsgálata is: ez bizonyos rendszerek esetében már megtörténik (Prószéky– Földes 2005). Sok rendszerből hiányoznak az adott nyelvpárra jellemző kollokációk, szófordulatok, kifejezések. Amennyiben rögzíteni lehet (és így a rendszer tudja), hogy melyik szó milyen szóval alkot kapcsolatot az anyanyelvi beszélő fejében, az a kapcsolat milyen erősségű és irányú, akkor az automatikus rendszer is pontosabb fordítást tudna adni. (Itt utalva rá, hogy a legpontosabb megoldást valószínűleg egy szótárakból, korpuszokból és asszociációkból egyaránt építkező rendszer adhatná.) A szemantikus web kutatása és a fordítói rendszerek fejlesztése ezen a ponton találkozhat egymással (vö. Wilks 2009). Automatikus döntéshozó illetve döntéstámogató rendszerek megalkotása, amelyek képesek a megfelelő információ kikeresésére asszociatív memóriaként rendszerezett adatbázisokból, ezzel emberi döntéseket hozva vagy támogatva (vö. Sántáné-Tóth et al. 2008). Ebben az esetben – egyéb lehetőségek mellett – Bayeshálókban reprezentálható a tudás (Russel–Norvig 2005). Orvosi diagnózis megállapítására sikerrel modelleztek és teszteltek asszociatív alapon működő döntéshozó rendszereket (Pomi–Olivera 2006): a kutatók betegségekből és azok tüneteiből hoztak létre asszociatív kapcsolatokkal olyan szemantikai memóriát, amely képes a tünetek alapján a betegségek azonosítására, figyelembe véve geo-demográfiai változókat is. Mesterséges intelligencia kutatások esetén megfelelő nagyságú szóasszociációs adatbázis és nyelvtani modul segítségével a számítógép ugyanazon elemeket, ugyanazon információkat használná fel szövegértésre és szövegalkotásra, mint az emberek. Jelenleg neurális hálók segítségével modellezik az emberi agyat, így logikusnak látszik, hogy ezekben a rendszerekben a fogalmakat is olyan felosztásban (fogalmi hálóban, kapcsolatokkal) tároljuk, mint az emberi agyban (vö. Russel–Norvig 2005). Hálózatos működés játszhat szerepet a tudás megszerzésében és rendszerezésében. Tudásmenedzsment rendszerek esetében skálafüggetlen modelleket alkalmazva modellezhető a tudás elsajátításának folyamata. Licata et al. (2006) szövegekből asszociatív háló segítségével alkotnak tudásbázist, a munkamemóriát és a hosszú távú memóriát skálafüggetlen hálózatként értelmezve. Szövegbányászati módszerek kialakítása és alkalmazása (Tikk 2007). A mentális lexikon hálózatait figyelembe vevő rendszer mélyebb összefüggések
Hálózatok a mentális lexikonban
203
kimutatására is alkalmas lehet, így például a domain háló figyelembevételével nemcsak adott szó alapján végez kutatást, hanem a szóval kapcsolatos legfontosabb asszociációk együttes előfordulását vizsgálja – így a jelenlegi módszerekkel nem feltárható összefüggések is kimutathatóak. Szövegkorpuszok elemzése során a szóasszociációs adatbázisok alapján meghatározott kapcsolatok és fogalmi rendszerek vizsgálata kibővítheti az elemzés lehetőségeit, és mélységét: az adatok kinyerése során nem csupán az elemzett szövegre, hanem mögöttes struktúrákra támaszkodva jobb minőségű, relevánsabb adatok nyerhetők ki szövegekből. Fogalmi struktúrák és korpuszok összekapcsolásának lehetőségeit Muráth Judit és Bagó Péter (2011, 2012), illetve Bagó Péter és Muráth Judit (2012) mutatják be magyar korpuszon. Hálózatos nyelvi rendszerek a robotikában is használhatók lehetnek: például a nyelv skálafüggetlen tulajdonságai elképzelhető, hogy megkönnyíthetik automatikus rendszerek nyelvelsajátítását (vö. Solé et al 2010). A hálózatelméleti megközelítés sok nyelvészeti kérdésre nem szolgál, nem szolgálhat válaszul. A hálózatkutatási módszerek egy része még nem kiforrott, sokszor a terminológia sem egységes (National Research Council 2005). Jelenleg a hálózatok egyre bonyolultabb viselkedését kezdik feltárni a kutatók, felismerve, hogy az eddigi, már eleve bonyolult modellek is csak egyszerűsítve ábrázolták a komplex hálózatok összefüggéseit és viselkedését. Az összefüggések a hálózatos tulajdonságok és nyelvi jelenségek között sem mindig egyértelműek. Összefoglalva elmondhatjuk, hogy nyelvtudomány és hálózatok összekapcsolása számtalan olyan lehetőséget rejt magában, amelyek elősegíthetik a nyelv mint kognitív és társadalmi jelenség pontosabb megismerését. „All in all, network research will bring a new perspective to linguistics, provide a new methodology to carry out quantitative analyses and suggest new questions and insights; at the same time, studies of networks about language will bring up new challenges to network research in general, and enrich the field with abundance of empirical data and questions. This is a cross-fertilization area worthy exploring” (Ke 2007).
204
Hálózatok a mentális lexikonban
8. ÖSSZEFOGLALÁS A kötet a mentális lexikont vizsgálta több szempontból. Három elsődleges célt jelöltünk ki a Bevezetésben, amelyekkel kapcsolatban hipotéziseket fogalmaztunk meg. A mentális lexikon hálózatelméleti vizsgálata igazolni látszik a mentális lexikonban a skálafüggetlen szerveződést és a kisvilág-karaktert. Habár eredményeink, valamint az elemzett kutatások eredményei is alátámasztják eredeti feltételezésünket, a viszonylag kis számú kutatás alapján egyértelműen nem jelenthetjük ki, hogy a mentális lexikon kizárólag skálafüggetlen hálózatok tulajdonságait mutatja. Skálafüggetlen tulajdonságok, illetve a kisvilág jelenség ugyan kimutathatók, de a kutatások jelenlegi állásánál nincs bizonyítékunk arra, hogy a mentális lexikon szerveződésében csak ezek a szabályszerűségek játszanának szerepet. A kutatások eredményeként feltételezzük, hogy a mentális lexikon hálózatos felépítésű: működését különböző szinteken és mértékben együttműködő hálózatok, vagyis egy összetett, sok hálózatot magába foglaló multidimenzionális hálózat határozza meg. Az Agykapocs-rendszer megalkotásával, részletes elemzésével megmutattuk, hogy megvalósítható internet-felhasználóktól szóasszociációs adatok gyűjtése. A gyűjtött asszociációs adatok megbízhatónak tekinthetők. A projekt ugyanakkor arra is rávilágított, hogy az adatok elemzése során olyan szempontokat is figyelembe kell venni (pl. elektronikus kommunikáció nyelvhasználatának befolyása az eredményekre), amelyek hagyományos adatgyűjtési módszerek esetében nem merülnek fel. A bemutatott adatgyűjtési módszer (megfelelően alkalmazva, illetve módosítva) hozzájárulhat a nyelvészet kutatásmódszertani repertoárjának bővítéséhez. Gazdasági végzettségű szakemberek és nem szakemberek szóasszociációs adatait elemezve kimutattuk, hogy a szaknyelv szerveződése a mentális lexikonban függ a szakmától: gazdasági jellegű hívószavak esetében gazdasági szakemberek nagyobb számban adnak meg válaszként gazdasági szakszavakat, mint laikusok. A mentális lexikon szerveződése és a végzettség szintje közötti összefüggések nem egyértelműek: vannak olyan hívószavak, amelyeknél a felsőfokú gazdasági végzettségűek asszociálnak nagyobb számban gazdasági szakszavakra, más hívószavaknál a középfokú végzettségűek.
206
Összefoglalás
A szakszavak szerveződésével kapcsolatosan általánosságban megállapíthatjuk, hogy a gyenge szakszavak esetében a kapcsolatok a köznyelv és a szaknyelv között egyaránt kimutathatók és az aktuális kontextus dönti el, hogy a köznyelvi vagy szaknyelvi kapcsolatok erősebbek-e. Erős szakszavak esetében a kapcsolatok többnyire a szaknyelven belül jönnek létre. Az elsődleges hipotézisekre kapott válaszok mellett a kötet további eredménye, hogy áttekintést adott a nyelvi hálózatok általános, hálózatközpontú szakirodalmáról, valamint rámutatott, hogy a nyelv bizonyos összefüggései nemcsak hagyományos, nyelvészeti, hanem a hálózatelméleti szemszögből is elemezhetők. A nyelvészet kutatásmódszertani lehetőségeit/eszközeit ezáltal a kötet új vizsgálati szempontokkal is bővítette. A hálózatelméleti vizsgálati szempontok lehetőséget nyújtanak a nyelv bizonyos jellemzőinek kvantifikálására, így a hálózatközpontú szemléletmód a nyelvtechnológiai jellegű kutatások számára is hasznos lehet. A kutatás természetesen nem foglalta, nem foglalhatta össze a mentális lexikon vizsgálatának összes aspektusát. A szakirodalom összefoglalásánál, illetve saját kutatásunknál csak azokat a szempontokat vettük figyelembe, amelyek a kutatás célkitűzései szempontjából relevánsak. Eredményeink új kutatások irányát is kijelöl(het)ik. A nyelv, a nyelvi jelenségek hálózatközpontú elemzése új irányt adhat nyelvészeti vizsgálatoknak. A nyelv mint hálózat statikus és dinamikus vizsgálatának eredményei, illetve a hálózatkutatás módszerei segíthetnek abban, hogy eddig egymástól függetlennek gondolt nyelvi (valamint szociológiai, neurológiai) jelenségek között összefüggéseket találjunk. Az Agykapocs-kutatás mintájára esetlegesen létrejövő hasonló honlapok/projektek lehetővé tehetik, hogy viszonylag rövid idő- és erőforrásráfordítással a hagyományos úton gyűjthető nyelvi adatoknál nagyságrendekkel több adatot gyűjtsünk össze, illetve azokat komplex módon elemezzük, így mélyebb bepillantást kapjunk nyelvi jelenségekbe. Az Agykapocs-kutatás bővítése, a többi nyelv magyar nyelvhez hasonló mennyiségű asszociációs adattal történő „feltöltése” lehetőséget kínál a mentális lexikon kontrasztív vizsgálatára. A létrejövő többnyelvű, nyelvek között és nyelveken belül is kapcsolatokkal rendelkező adatbázis megfelelő átalakítással felhasználható különböző nyelvtechnológiai alkalmazásokban. Az Agykapocsrendszer adatbázisa jelenlegi állapotában is számos szóasszociációs kutatás tárgya lehet: vizsgálhatók az asszociációs eltérések nemek, kor, végzettség fajtája és szintje, valamint anyanyelv szerint, illetve ezen változók bármely kombinációjában. A rendszer fejlesztésével a kapcsolatok grafikusan megjeleníthetők lehetnek,
Összefoglalás
207
a hívó- és válaszszavak közti kapcsolatok címkézhetők. Az egyes szavak további információkkal (definíció, nyelvtani információk stb.) bővíthetők. Interdiszciplináris területeket érintő, a nyelvészeti és hálózati kutatások határán egyensúlyozó kötetnek természetesen nem lehet, nem lehetett célja a területek minden lehetséges kapcsolódási pontjának bemutatása, az új megközelítésben rejlő számtalan lehetőség és a mélyebb összefüggések vizsgálata. Számos, a nyelvi hálózatokkal kapcsolatos kérdést csak megemlítettünk, illetve sok helyen csak feltételezéseket fogalmaztunk meg a nyelvi hálózatokkal kapcsolatban. A nyelv hálózatos jelenségeinek az itt leírtaknál lényegesen átfogóbb és mélyebb vizsgálata szükséges ahhoz, hogy a nyelvészeti kutatások új, hálózatközpontú szemléletmóddal bővülhessenek. Amennyiben a kötetben leírt hálózatközpontú megközelítési mód további kutatásokat inspirál, már elértük célunkat.
208
Összefoglalás
IRODALOM Aarts, B. 2006. Conceptions of categorization in the history of linguistics. Language Sciences. 28/4: 361-385. Ablonczyné Mihályka Lívia 2006. Gazdaság és nyelv. Pécs: Lexikográfia. Ablonczyné Mihályka Lívia 2010. Gazdaság és nyelvhasználat. In Dobos Csilla (szerk.): Szaknyelvi kommunikáció. Budapest: Tinta. 243-256. Abrams, D. M.–Strogatz, S. H. 2003. Modelling the dynamics of language death. Nature. 424: 900. Adamzik, K. 1999. Fachsprachen als Vartietäten. In Hoffmann, L.–Kalverkämper, H.–Wiegand, H. E. (Hrsg.): Fachsprachen. Languages for Special Purposes. 1. Halbband. Berlin–New York: Walter de Gruyter. 181-189. Aitchison, J. 1987. Words in the Mind. Oxford: Basil Blackwell. Aitchison, J. 1997. The language web. Cambridge: Cambridge University Press. Aitchison, J. 2003. Words in the Mind. Third Edition. Malden–Oxford: Blackwell. Albert Réka–Jeong, H.–Barabási Albert-László 1999. Diameter of the World Wide Web. Nature. 401: 130-131. Albert Réka–Jeong, H.–Barabási Albert-László 2000. Error and attack tolerance of complex networks. Nature. 406: 378-382. Allegrini, P.–Grigolini, P.–Palatella, L. 2004a. Cognitive Scale-free Networks as a Model for Intermittency in Human Natural Language. In Novak, M. M. (ed.): Thinking in Patterns. Fractals and Related Phenomena in Nature. Singapore: World Scientific. 119-129. Allegrini, P.–Grigolini, P.–Palatella, L. 2004b. Intermittency and scale-free networks: a dynamical model for human language complexity. Chaos, Solitons and Fractals. 20: 95-105. Altaribba, J.–Mathis, K. M. 1997. Conceptual and Lexical Development in Second Language Acquisition. Journal of Memory and Language. 36: 550-568. Angioni, M.–Demonits, R.–Deriu, M.–Tuveri, F. 2007. SemanticNet: a WordNetbased Tool for the Navigation of Semantic Information. In Tanács A. et al. (eds.): Proceedings, GWC 2008. Szeged: University of Szeged. 21-34. Antia, E. B. 2000. Terminology and Language Planning. Amsterdam– Philadelphia: John Benjamins.
210
Irodalom
Antiqueira, L. et al. 2007. Strong correlations between text quality and complex networks features. Physica A. 373: 811-820. Arnold, J. B. 2006. Nine Psychologists: Mapping the Collective Mind with Google. Current Research in Social Psychology. 11/12: 172-184. Auger, A.–Barrière, C. 2008. Pattern-based approaches to semantic relation extraction: A state-of-the-art. Terminology. Special Issue: Pattern-based Approaches to Semantic Relation Extraction. 14/1: 1-19. Aussenac-Gilles, N.–Jacques, M. P. 2008. Designing and evaluating patterns for relation acquisition from texts with CAMÉLÉON. Terminology. Special Issue: Pattern-based Approaches to Semantic Relation Extraction. 14/1: 45-73. Baayen, R. H. 2007. Storage and Computation in the Mental Lexicon. In Jarema, G.–Libben, G. (eds.): The Mental Lexicon. Amsterdam: Elsevier. 81-104. Backstrom et al. (2011) Four degrees of separation. http://arxiv.org/pdf/1111.4570v3.pdf Baddeley, A. 2001. Az emberi emlékezet. Budapest: Osiris. Bagó Péter–Muráth Judit 2012. Fogalmi struktúrák vizsgálata számítógépes támogatással. In Silye Magdolna (szerk.) Szaknyelvkutatási irányzatok és alkalmazások: cikkek, tanulmányok a hazai szaknyelvoktatásról és -kutatásról. Debrecen: Szaknyelvoktatók és -Kutatók Országos Egyesülete. 11-18. Balaskó Mária 2004. Korpusznyelvészeti vizsgálatok és fordításnyelvi minták. Alkalmazott nyelvészeti doktori disszertáció. Pécs. Balaskó Mária 2005. Virtuális közösségek kommunikációja a cybertérben. In Balázs Géza–Bódi Zoltán (szerk.): Az internetkorszak kommunikációja. Budapest: Gondolat-Infonia. 58-88. Balaskó Mária–Balázs Géza–Kovács László (szerk.) 2010. Hálózatkutatás – Hálózatok a társadalomban és a nyelvben. Budapest: Tinta. Balaskó Mária 2010. Amikor a nyelvi hálózatok metszik egymást: kibővített jelentésegységek. In Balaskó Mária–Balázs Géza–Kovács László (szerk.): Hálózatkutatás – Hálózatok a társadalomban és a nyelvben. Budapest: Tinta. 98-108. Balázs Géza 2005. Az internetkorszak kommunikációja. In Balázs Géza–Bódi Zoltán (szerk.): Az internetkorszak kommunikációja. Budapest: GondolatInfonia. 25-57. Balázs Géza 2010. Hálózatalakzatok. In Balaskó Mária–Balázs Géza–Kovács László (szerk.): Hálózatkutatás – Hálózatok a társadalomban és a nyelvben. Budapest: Tinta. 81-97.
Irodalom
211
Balázs Géza 2012. A szöveg hálózatai. In Balázs Géza–Kovács László–Szőke Viktória (szerk.) Hálózatkutatás. Interdiszciplináris megközelítések. Budapest: Inter–Magyar Szemiotikai Társaság–Bolyai Műhely Alapítvány– Eötvös. 9-15. Balázs Géza–Kovács László–Szőke Viktória (szerk.) 2012. Hálózatkutatás. Interdiszciplináris megközelítések. Budapest: Inter–Magyar Szemiotikai Társaság–Bolyai Műhely Alapítvány–Eötvös. Bales, M. E.–Johnson, S. B. 2006. Graph theoretic modeling of large-scale semantic networks. Journal of Biomedical Informatics. 39/4: 451-464. Balló Larissza 1983. Magyar verbális asszociációk 1. Szeged: Juhász Gyula Tanárképző Főiskola. Bamford, S. P. et al. 2008. Galaxy Zoo: the independence of morphology and colour. Monthly Notices of the Royal Astronomical Society. 393/4: 13241352. Bańczerowski Janusz 1999. A kognitív nyelvészet alapelvei. Magyar Nyelvőr. 123/1: 78-87. Bańczerowski Janusz 2003. A szaknyelvek szerepe a civilizációs fejlődésben. Magyar Nyelvőr. 127/3: 277-282. Barabási Albert-László 2003. Behálózva. Budapest: Magyar Könyvklub. Barabási Albert-László 2005. Network Theory – the Emergence of the Creative Enterprise. Science. 308: 639-641. Barabási Albert-László 2006. A hálózatok tudománya: a társadalomtól a webig. Magyar Tudomány. 2006/11: 1298-1308. Barabási Albert-László 2009. Scale-Free Networks: A Decade and Beyond. Science. 325: 412-413. Barabási Albert-László 2010. Villanások. Budapest: Nyitott Könyvműhely. Barabási Albert-László 2012. Network science: Luck or reason. Nature. 489: 507508. Barabási Albert-László–Bonabeau, E. 2003. Scale-Free Networks. Scientific American. 288: 50-59. Barabási Albert-László–Albert Réka–Jeong, H. 1999. Emergence of scaling in random networks. Science. 286: 509-512. Barabási Albert-László et al. 2004. Hot spots and universality in network dynamics. The European Physical Journal B. 38: 169-175. Bárányné Szabadkai Éva–Mihalik István (szerk.) 2002. Közgazdasági Helyesírási Szótár. Budapest: Tinta. Barrat, A.–Barthélemy, M.–Vespignani, A. 2008. Dynamical Processes on Complex Networks. Cambridge: Cambridge University Press.
212
Irodalom
Barsalou, L. W. 1992. Frames, concepts and conceptual fields. In Lehrer, A.– Kittay, E. F. (eds.): Frames, fields and contrasts: new essays in semantic and lexical organization. Hillsdale, New Jersey: Lawrence Erlbaum. 2174. Bartha Csilla 1999. A kétnyelvűség alapkérdései. Budapest: Nemzeti Tankönyvkiadó. Bassett, D. S.–Bullmore, E. 2006. Small-world brain networks. Neuroscientist. 12/6: 512-523. Batagelj, V.–Mrvar, A. 1998. Pajek – Program for Large Network Analysis. Connections. 21/2: 47-57. Batagelj, V.–Mrvar, A. 2003. Pajek - Analysis and Visualization of Large Networks. In Jünger, M.–Mutzel, P. (eds.): Graph Drawing Software. Springer: Berlin. 77-103. Bátyi Szilvia 2010. Szóasszociációs vizsgálat a kétnyelvű kárpátaljai általános iskolások körében – A család mint befolyásoló tényező. In Navracsics Judit (szerk.) Nyelv, beszéd, írás I. Budapest: Tinta. 130-137. Beckage, N. et al. 2011. Small Worlds and Semantic Network Growth in Typical Late Talkers. PLoS ONE. 6/5: e19348. Becker, A.–Hundt, M. 1999. Die Fachsprache in der einzelsprachlichen Differenzierung. In Hoffmann, L.–Kalverkämper, H.–Wiegand, H. E. (Hrsg.): Fachsprachen. Languages for Special Purposes. 1. Halbband. Berlin–New York: Walter de Gruyter. 118-133. Benczes Réka 2011. Putting the notion of „domain” back into metonymy. In Benczes, R. – Barcelona, A. – Ruiz de Mendoza, F. (eds.): Defining Metonymy in Cognitive Linguistics: Towards a Consensus View. Amsterdam – Philadelphia: John Benjamins. Benczúr András et al. 2006. PageRank és azon túl: hiperhivatkozások szerepe a keresésben. Magyar Tudomány. 2006/11: 1325-1332. Benedek Gábor–Lublóy Ágnes–Szenes Márk 2007. A hálózatelmélet banki alkalmazása. Közgazdasági Szemle. LIV: 682-702. Benkler, Y. 2006. The Wealth of Networks. New Haven–London: Yale University Press. Berlin, B.–Kay, P. 1969. Basic color terms. Their Universality and Evolution. Berkeley–Los Angeles: University of California Press. Berners-Lee, T.–Fischetti, M. 1999. Weaving the web. New York: Harper Collins. Bessé, B. de et al. 1997. Glossary of terms used in terminology. Terminology. 4/1: 117-156. Bianconi, G.–Gulbahce, N.–Motter, A. N. 2008. Local Structure of Directed Networks. Physical Review Letters. 100: 118701.
Irodalom
213
Bódi Zoltán 2004. A világháló nyelve. Budapest: Gondolat. Bódi Zoltán 2005. Szimbolikus írásbeliség az internetes interakcióban. In Balázs Géza–Bódi Zoltán (szerk.): Az internetkorszak kommunikációja. Budapest: Gondolat-Infonia. 195-212. Bolten, J. 1991. Fremdsprache Wirtschaftsdeutsch: Bestandsaufnahme und Perspektive. In Müller, B.-D. (Hrsg.): Interkulturelle Wirtschaftskommunikation. München: Iudicium. Bonin, P. (ed.) 2004. Mental Lexicon: „Some Words to Talk about Words”. New York: Nova Sciencia Publishers. Börner, W.–Vogel, K. (Hrsg.) 1994. Kognitive Linguistik und Fremdsprachenerwerb. Tübingen: Gunter Narr. Braunsberger, K.–Wybenga, H.–Gates, R. 2007. A comparison of reliability between telephone and web-based surveys. Journal of Business Research. 60/7: 758-764. Brin, S.–Page, L. 1998. The Anatomy of a Large-Scale Hypertextual Web Search Engine. WWW7/Computer Networks. 30/1-7: 107-117. Bryman, A.–Bell, E. 2007. Business Research Methods. Oxford: Oxford University Press. Buhlmann, R.–Fearns, A. 1987. Handbuch des Fachsprachenunterrichts. Berlin– München: Langenscheidt. Cabré, M. T. 1999. Terminology. Amsterdam–Philadelphia: John Benjamins. Caramazza, A. 1999. Hány feldolgozási szint van a lexikai hozzáférésben? In Bánréti Zoltán (szerk): Nyelvi struktúrák és az agy. Budapest: Corvina. 249-283. Cardamone, C. et al. 2009. Galaxy Zoo Green Peas: Discovery of A Class of Compact Extremely Star-Forming Galaxies. Monthly Notices of the Royal Astronomical Society. 399/3: 1191-1205. Carter, R. 1992. Vocabulary: An applied linguistic perspective. London: Routledge. Castells, M. 2000. The Rise of the Network Society. 2nd. ed. Malden–Oxford: Blackwell. Chaffin, R.–Herrmann, D. J. 1988. The nature of semantic relations: a comparison of two approaches. In Evens, M. W. (ed.): Relational models of the lexicon. Cambridge: Cambridge University Press. 289-334. Chakrabarti, S. 2003. Mining the Web: Discovering Knowledge from Hypertext Data. San Francisco: Morgan Kaufmann.
214
Irodalom
Chan, A. S.–Salmon, D. P.–Butters, N. 1998. Semantic network abnormalities in patients with Alzheimer's disease. In Parks, R.–Levine, D.–Long, D. (eds.): Fundamentals of neural network modeling: Neuropsychology and cognitive neuroscience. Cambridge: MIT Press. 381-393. Chikán Attila–Wimmer Ágnes 2003. Üzleti fogalomtár. Budapest: Alinea. Chlopek, Z. 2009. Towards the trilingual mental lexicon. In Lengyel Zsolt– Navracsics Judit (szerk.): Tanulmányok a mentális lexikonról – Studies on the Mental Lexicon. Budapest: Tinta. 107-118. Collins, A. M.–Loftus, E. F. A Spreading-Activation Theory of Semantic Processing. Psychological Review. 82/6: 407-428. Collins, A. M.–Quillian, M. R. 1969. Retrieval time from semantic memory. Journal of verbal learning and verbal behavior. 8/2: 240-248, változatlan formában In Balota, D. A.–Marsh, E. J. (eds.): 2004. Cognitive Psychology: Key Readings. New York: Psychology Press. 395-402. Coronges, K. A.–Valente, T. W.–Stacy, A. W. 2007. Structural Comparison of Cognitive Associative Networks in Two Populations. Journal of Applied Social Psychology. 37/9: 2097-2129. Cramer, P. 1968. Word Association. London: Academic Press. Creelman, M. B. 1966. The Experimental Investigation of Meaning. New York: Springer. Cruse, A. 2004. Meaning in Language. Oxford: Oxford University Press. Cruse, D. A. 2001. The Lexicon. In Aronoff, M.–Rees-Miller, J. (eds.): The Handbook of Linguistics. Malden–Oxford: Blackwell. 238-264. Cruse, D. A. 1986. Lexical Semantics. Cambridge: Cambridge University Press. Császár Róbert 2009. A mentális lexikon szóasszociációs vizsgálata gazdasági és nem gazdasági végzettségű személyek esetében. Szakdolgozat. Szombathely: Nyugat-magyarországi Egyetem. Cser János 1939. A magyar gyermek szókincse. Budapest: Magyar Pedagógiai Társaság. Csermely Péter 2005. A rejtett hálózatok ereje. Budapest: Vince. Csomai Lídia 2012. Szabad szóasszociációs vizsgálat 10-14 évesek körében. Szakdolgozat. Veszprém: Pannon Egyetem. Dahlberg, I. 2006. Knowledge Organziation: A New Science? Knowledge Organization. 33/1: 11-19. Dancette, J. 2007. Semantic relations in the field of retailing. Terminology. 13/2: 201-223.
Irodalom
215
De Boot, K. 2012. The end of psycholinguistics as we know it? It’s about time! In Navracsics Judit–Szabó Dániel (szerk.): Mentális folyamatok a nyelvi feldolgozásban / Mental Procedures in Language Processing. Budapest: Tinta. 13-21. De Deyne, S.–Storms, G. 2008a. Word Associations: Norms for 1,424 Dutch words in a continous task. Behavior Research Methods. 40/1: 198-205. De Deyne, S.–Storms, G. 2008b. Word Associations: Network and semantic properties. Behavior Research Methods. 40/1: 213-231. De Deyne, S.–Navarro, D. J.–Storms, G. megjelenés alatt. Better explanations of lexical and semantic cognition using networks derived from continued rather than single-word associations. Behavior Research Methods. http://www.smallworldofwords.com/data/articles/2012_DeDeyneNavarro Storms_Wordassociations_BRM.pdf Deese, J. 1965. The Structure of Associations in Language and Thought. Baltimore: The Johns Hopkins Press. Derényi Imre et al. 2006. Csoportosulások szociológiai, technológiai és biológiai hálózatokban. Magyar Tudomány. 2006/11: 1319-1324. Dezső Zoltán et al. 2006. Dynamics of information access on the web. Physical Review E. 73: 066132. Dietrich, R. 2002. Psycholinguistik. Stuttgart–Weimar: Metzler. Dirven, R.–Verspoor, M. 2004. Cognitive Exploration of Language and Linguistics. Amsterdam–Philadelphia: John Benjamins. Dittmann, J. 2002. Wörter im Geist. Das mentale Lexikon. In Dittmann, J.– Schmidt, C. (Hg.): Über Wörter. Freiburg im Breisgau: Rombach. 283310. Dominich Sándor 2006. Webtechnológiák és információvisszakeresés. http://www.dcs.vein.hu/CIR/cikkek/webtechnologiak_es_informaciovissz akereses.pdf Dominich Sándor–Kiezer Tamás 2005. Hatványtörvény, „kis világ” és magyar nyelv. Alkalmazott Nyelvtudomány. V/1-2: 5-24. Domonkosi Ágnes 2005. Az internet nyelvhasználatának empirikus kutatási lehetőségei. In Balázs Géza–Bódi Zoltán (szerk.): Az internetkorszak kommunikációja. Budapest: Gondolat-Infonia. 143-158. Dooley, K.–Corman, S. 2004. Dynamic analysis of news streams: Institutional versus environmental effects. Nonlinear Dynamics, Psychology, & Life Sciences. 8/3: 403-428. Dorogovtsev, S. N.–Mendes, J. F. F. 2001. Language as an evolving word web. Proceedings of the Royal Sociey of London B. 268: 2603-2606.
216
Irodalom
Dorow, B. 2006. A Graph Model for Words and their Meanings. Doktorarbeit. Stuttgart: Institut für Maschinelle Sprachverarbeitung der Universität Stuttgart. Duijn, v. M. A. J. 2005. Software for Social Network Analysis. In Carrington, P. J.–Scott, J.–Wasserman, S. (eds): Models and Methods in Social Network Analysis. Cambridge: Cambridge University Press. 270-316. Easley, D.–Kleinberg, J. 2010. Networks, Crowds and Markets. Reasoning about a Highly Connected World. Cambridge: Cambridge University Press. Echols, C H.–Marti, C. N. 2004. The Identification of Words and Their Meanings: From Perceptual Biases to Language-Specific Cues. In Hall, G.–Waxman, S. R. (eds.): Weaving a Lexicon. Cambridge: MIT Press. 4179. Eco, U. 1999. Kant és a kacsacsőrű emlős. Budapest: Európa. Eguíluz, V. M. et al. 2005. Scale-Free Brain Functional Networks. Physical Review Letters. 94: 018102. Elman, J. L. 2004. An alternative view of the mental lexicon. TRENDS in Cognitive Science. 8/7: 301-306. Esper, E. A. 1973. Analogy and Association in Linguistics and Psychology. Athens: University of Georgia Press. Evans, V. 2006. Lexical Concepts, Cognitive Models and Meaning-Construction. Cognitive Linguistics. 17/4: 491-534. Evans, V. 2011. Language and Cognition: The View from Cognitive Linguistics. In Cook, V.–Bassetti, B. (eds): Language & Bilingual Cognition. New York: Psychology Press. 69-107. Evans, V.–Bergen, B. K.–Zinken, J. 2007. The cognitive linguistics enterprise: an overview. In Evans, V.–Bergen, B.–Zinken, J. (eds.): The Cognitive Linguistics Reader. London: Equinox. 1-34. Fauconnier, G.–Turner, M. 2002. The Way We Think. New York: Basic Books. Felber, H.–Schaeder, B. 1999. Typologie der Fachwörterbücher. In Hoffmann, L.–Kalverkämper, H.–Wiegand, H. E. (Hrsg.): Fachsprachen. Languages for Special Purposes. 2. Halbband. Berlin–New York: Walter de Gruyter. 1725-1743. Fellbaum, Ch. (ed.) 1998. WordNet. Cambridge: MIT Press. Ferrer i Cancho, R. 2005. The variation of Zipf’s law in human language. European Physical Journal B. 44: 249-257. Ferrer i Cancho, R. 2006. When language breaks into pieces – A conflict between communication through isolated signals and language. Biosystems. 84/3: 242-253.
Irodalom
217
Ferrer i Cancho, R.–Solé, R. V. 2001a. The small world of human language. Proceedings of the Royal Society of London Series B. 268: 2261-2266. Ferrer i Cancho, R.–Solé, R. V. 2001b. Two regimes in the frequency of words and the origin of complex lexicons: Zipf's law revisited. Journal of Quantitative Linguistics. 8: 165-173. Ferrer i Cancho, R.–Solé, R. V. 2002. Zipf's law and random texts. Advances in Complex Systems. 5/1: 1-6. Ferrer i Cancho, R.–Solé, R. V. 2003. Least effort and the origins of scaling in human language. Proceedings of the National Academy of Sciences of the United States of America. 100/3: 788-791. Ferrer i Cancho, R.–Solé, R.V.–Köhler, R. 2004. Patterns in syntactic dependency networks. Physical Review E. 69: 051915. Fillenbaum, S.–Rapoport, A. 1971. Structures in the Subjective Lexicon. New York–London: Acedemic Press. Fillmore, C J.–Atkins, B. T. 1992. Toward a Frame-Based Lexicon: The Semantics of RISK and its Neighbours. In Lehrer, A.–Kittay, E. F. (eds.): Frames, fields and contrasts: new essays in semantic and lexical organization. Hillsdale: Lawrence Erlbaum. 75-102. Fischer Márta 2010. Terminológia a szakmai kommunikáció szolgálatában. In Dobos Csilla (szerk.): Szaknyelvi kommunikáció. Budapest: Tinta. 51-72. Fitzpatrick, T. 2006. Habits and rabbits: word associations and the L2 lexicon. In Foster-Cohen, S.–Medved Krajnovic, M.–Mihaljevic Djigunvic, J. (eds.): EUROSLA Yearbook 6 (2006). Amsterdam: John Benjamins. 121-145. Fitzpatrick, T. 2007. Word association patterns: unpacking the assumptions. International Journal of Applied Linguistics. 17/3: 319-331. Fluck, H.-R. 1976. Fachsprachen. München: Francke. Fodor, J. A. 1983. The modularity of mind. Cambridge: MIT Press. Fóris Ágota 2005. Hat terminológiai lecke. Pécs: Lexikográfia. Fóris Ágota 2007a. A skálafüggetlen hálók nyelvészeti vonatkozásai. Alkalmazott Nyelvtudomány. VII/1-2: 105-125. Fóris Ágota 2007b. A terminológia terminológiája. In Pusztay János (szerk.): A magyar mint veszélyeztetett nyelv? Szombathely: Berzsenyi Dániel Főiskola. 122-133. Fóris Ágota 2009. A fordítás skálafüggetlen hálómodellje. Fordítástudomány. XI/1: 5-21. Fosmire, F. R. 1965. Clustering as a function of associative commonality. American Journal of Psychology. 78: 39-47. Freedman, D.–Pisani, R.–Purves, R. 2005. Statisztika. Budapest: Typotex. Galton, F. 1879. Psychometric experiments. Brain. 2: 149-62.
218
Irodalom
Galton, F. 1883. Inquires into Human Faculty and Its Development. London: Macmillan. (On-line elérhető: http://www.galton.org). Gamper, J.–Nejdl, W.–Wolpers, M. 1999. Combining Ontololgies and Terminologies in Information Systems. In Sandrini, P. (ed.): TKE ’99 Terminology and Knowledge Engineering. Vienna: Termnet. 152-168. Gangl Andrea 2010. Diskurzuselemzési módszerek alkalmazása a hálózatelméletben. In Balaskó Mária–Balázs Géza–Kovács László (szerk.): Hálózatkutatás – Hálózatok a társadalomban és a nyelvben. Budapest: Tinta. 142155. Gangl Andrea 2012. Szinonimák hálózata (újra)fordított szövegekben. In Balázs Géza–Kovács László–Szőke Viktória (szerk.): Hálózatkutatás. Interdiszciplináris megközelítések. Budapest: Inter–Magyar Szemiotikai Társaság– Bolyai Műhely Alapítvány–Eötvös. 27-35. Garman, M. 1990. Psycholinguistics. Cambridge: Cambridge University Press. Gazdaságpolitikai kisszótár. 1983. Budapest: Kossuth. Geeraerts, D.–Grondelaers, S.–Bakema, P. 1994. The Structure of Lexical Variation. Berlin–New York: Mouton de Gruyter. Ghoshal, G. et al. 2009. Random hypergraphs and their applications. Physical Review E. 79: 066118. Gillam, L.–Tariq, M.–Ahmad, K. 2005. Terminology and the construction of ontology. Terminology. 11/1: 55-81. Gläser, R. 1999. Fachsprachen und Funktionalstile. In Hoffmann, L.– Kalverkämper, H.–Wiegand, H. E. (Hrsg.): Fachsprachen. Languages for Special Purposes. 1. Halbband. Berlin–New York: Walter de Gruyter. 199-208. Gósy Mária 2000a. Az életkor hatása a mentális lexikon működésére. Magyar Nyelvőr. 124/4: 410-423. Gósy Mária 2000b. A prototípus elmélet. In Lengyel Zsolt–Navracsics Judit– Nádasi Edit (szerk.): Alkalmazott Nyelvészeti Tanulmányok IV. Veszprém: Veszprémi Egyetem. 1-9. Gósy Mária 2001. Szóasszociációs műveletek az életkor függvényében. Alkalmazott Nyelvtudomány. 1/1: 17-30. Gósy Mária 2005. Pszicholingvisztika. Budapest: Osiris. Gósy Mária–Kovács Magdolna 2001. Mentális lexikon a szóasszociációk tükrében. Magyar Nyelvőr. 125/3: 330-354. Gottdank Tibor 2006. Szemantikus Web. Budapest: ComputerBooks. Granovetter, M. S. 1973. The Strength of Weak Ties. The American Journal of Sociology. 78/6: 1360-1380. Gravino, P. et. al. 2012. Complex structures and semantics in free word association. Advances in Complex Systems. 15/3-4: 1250054-1.
Irodalom
219
Griffiths, T. L.–Steyvers, M.–Firl, A. 2007. Google and the mind: Predicting fluency with PageRank. Psychological Science. 18: 1069-1076. Guarino, N.–Giaretta, P. 1995. Ontologies and Knowledge Bases Towards a Terminological Clarification. In Mars, N. (ed.): Towards Very Large Knowledge Bases. Amsterdam: IOS Press. 25-32. Hadley, G. 1997. Lexis and Culture: Bound and Determined? Journal of psycholinguistic research. July 1997: 483-496. Hall, D. G.–Waxman, S. R. 2004. Weaving a Lexicon. Cambridge: MIT Press. Halskov, J.–Barrière, C. 2008. Web-based extraction of semantic relation instances for terminology work. Terminology. Special Issue: Patternbased Approaches to Semantic Relation Extraction. 14/1: 20-44. Hanneman, R. A.–Riddle, M. 2005. Introduction to Social Network Methods. Riverside: University of California. (Published in digital form at http://faculty.ucr.edu/~hanneman/). Harley, T. 2001. The Psychology of Language. Hove–New York: Psychology Press. He, Y.–Chen, Z. J.–Evans, A. C. 2007. Small-World Anatomical Networks in the Human Brain Revealed by Cortical Thickness from MRI. Cerebral Cortex. 17/10: 2407-2419. He, Y. et al. 2009. Impaired small-world efficiency in structural cortical networks in multiple sclerosis associated with white matter lesion load. Brain Advance Access. May 12, 2009. http://brain.oxfordjournals.org/cgi/reprint/awp089v1 Helbig, H. 2006. Knowledge Representation and the Semantics of Natural Language. Berlin–Heidelberg: Springer. Hess-Lüttich, E. W. B. 1999. Fachsprachen als Register. In Hoffmann, L.– Kalverkämper, H.–Wiegand, H. E. (Hrsg.): Fachsprachen. Languages for Special Purposes. 1. Halbband. Berlin–New York: Walter de Gruyter. 208-218. Hoey, M. 2005. Lexical Priming. London: Routledge. Hoffmann, L. 1985. Kommunikationsmittel Fachsprache. Tübingen: Narr. Hoffmann, L. 1999. Fachsprachen als Subsprachen. In Hoffmann, L.– Kalverkämper, H.–Wiegand, H. E. (Hrsg.): Fachsprachen. Languages for Special Purposes. 1. Halbband. Berlin–New York: Walter de Gruyter. 189-199. Horst, S. 1998. Wortbildung in der deutschen Wirtschaftskommunikation. Waldsteinberg: Heidrun Popp. Hudson, R. 2007. Language Networks. Oxford: Oxford University Press.
220
Irodalom
Hundsnurscher, F. 2003. Wandlungen des Wortfeld-Konzepts. In Tóth, József (Hrsg.): Quo Vadis Wortfeldforschung? Frankfurt am Main: Peter Lang. 23-36. Hundt, M. 1998. Typologien der Wirtschaftssprache: Spekulation oder Notwendigkeit. Fachsprache. 20/3-4: 98-115. Hundt, M. 1999. Neuere institutionelle und wissenschaftliche Wirtschaftsfachsprachen. In Hoffmann, L.–Kalverkämper, H.–Wiegand, H. E. (Hrsg.): Fachsprachen. Languages for Special Purposes. 1. Halbband. Berlin–New York: Walter de Gruyter. 1296-1304. Huszár Ágnes 2005. A gondolattól a szóig. Budapest: Tinta. Hymes, Dell 1997. A nyelv és a társadalmi élet kölcsönhatásának vizsgálata. In Pléh Csaba–Síklaki István–Terestyéni Tamás (szerk.): Nyelv – Kommunikáció – Cselekvés. Budapest: Osiris. 458-495. Imrényi András 2012. A magyar mondat mint multiplex hálózat. In Balázs Géza– Kovács László–Szőke Viktória (szerk.): Hálózatkutatás. Interdiszciplináris megközelítések. Budapest: Budapest: Inter–Magyar Szemiotikai Társaság–Bolyai Műhely Alapítvány–Eötvös. 36-42. ISO 1087 1990. Terminology – Vocabulary. Switzerland: ISO. ISO 1087-1. 2000. Terminology work – Vocabulary – Part 1: Theory and applications. Switzerland: ISO. Itzkovitz, S. et al. 2003. Subgraphs in random networks. Physical Review E. 68/2/2: 026127. Jagusztinné Ujvári Klára 1985. Magyar verbális asszociációk 2. Szeged: Juhász Gyula Tanárképző Főiskola. Jarema, G.–Libben, G. (eds.) 2007. The Mental Lexicon. Amsterdam: Elsevier. Jarvis, S. 2009. Lexical Transfer. In Pavlenko, A. (ed.): The Bilingual Mental Lexicon. Bristol–Buffalo–Toronto: Multilingual Matters. 99-124. Jenkins, J. J. 1970. The 1952 Minnesota word association norms. In Postman, L.– Keppel, G. (eds.): Norms of Word Association. New York: Academic Press. 1-38. Jeong, H.–Néda, Z.–Barabási Albert-László 2003. Measuring preferential attachment for evolving networks. Europhysics Letters. 61: 567-572. Jónás Frigyesné 1999. A tanári szerep új dimenziói a gazdasági szaknyelvoktatásban. In Balaskó Mária–Kohn János (szerk.): A nyelv mint szellemi és gazdasági tőke III. Szombathely: BDTF Alkalmazott Nyelvészeti Tanszék. 163-168. Kageura, K. 2002. The Dynamics of Terminology. Amsterdam–Philadelphia: John Benjamins.
Irodalom
221
Kalverkämper, H. 1999. Fachsprache und Fachsprachenforschung. In Hoffmann, L.–Kalverkämper, H.–Wiegand, H. E. (Hrsg.): Fachsprachen. Languages for Special Purposes. 1. Halbband. Berlin–New York: Walter de Gruyter. 48-59. Karrer, B.–Newman, M. E. J. 2009. Random graph models for directed acyclic networks. Physical Review E. 80: 046110. Katz, J. J.–Fodor A. J. 1963. The Structure of a Semantic Theory. Language. 39/2: 170-210. Kay, M. 1989. The concrete lexicon and the abstract dictionary. In Proceedigns of the Fifth Annual Conference of the UW Centre for the New Oxford English Dictionary. Waterloo: University of Waterloo. 35-41. Ke, J. 2007. Complex networks and human language. Eprint arXiv:cs/0701135 http://arxiv.org/ftp/cs/papers/0701/0701135.pdf Ke, J.–Gong, T.–Wang, W. S. Y. 2008. Language Change and Social Networks. Communications in Computational Physics. 3/4: 935-949. Ke, J.–Yao, Y. 2008. Analysing Language Development from a Network Approach. Journal of Quantitative Linguistics. 15/1: 70-99. Kegyesné Szekeres Erika 2002. Férfiak és nők: mentális lexikon és fogalmi tipizálás. In Fóris Ágota–Kárpáti Eszter–Szűcs Tibor (szerk.): A nyelv nevelő szerepe. Pécs: Lingua Franca Csoport. 233-240. Keil, F. C. 1994. Explanation, association and the acquisition of word meaning. In Gleitman, L.–Landau, B. (eds.): The Acquisition of the Lexicon. Amsterdam: Elsevier. 169-196. Kennedy, C.–Bolitho, R. 1994. English for Specific Purposes. London: Macmillan. Kent, G. H.–Rosanoff, A. J. 1910. A study of association in insanity. American Journal of Insanity. 67/1-2: 37-96; 317-390. Keppel, G.–Strand, B. Z. 1970. Free-association responses to the primary purposes and other responses selected from the Palermo-Jenkins norms. In Postman, L.–Keppel, G. (eds.): Norms of Word Association. New York: Academic Press. 177-240. Kertész János 2006. Súlyozott hálózatok: A tőzsdétől a mobiltelefóniáig. Magyar Tudomány. 2006/11: 1313-1318. Kiefer Ferenc 2007. Jelentéselmélet. Budapest: Corvina. Kis Ádám 2007. Automatikus terminuskivonatolás diszkurzusszerkezetek segítségével. In Pusztay János (szerk.): A magyar mint veszélyeztetett nyelv? Szombathely: Berzsenyi Dániel Főiskola. 165-181. Kis Balázs–Mohácsi-Gorove Anna 2008. A fordító számítógépe. Bicske: Szak.
222
Irodalom
Kiss, G. R. 1968. Words, associations and networks. Journal of Verbal Learning and Verbal Behaviour. 7: 707-713. Kiss, G. R. et al. 1973. An associative thesaurus of English and its computer analysis. In Aitken, A.J.–Bailey, R.W.–Hamilton-Smith, N. (eds.): The Computer and Literary Studies. Edinburgh: University Press. 153-165. Kiss, G. R. 1975. An Associative Thesaurus of English: Structural Analysis of a Large Relevance Network. In Kennedy, A.–Wilkes, A. (eds.): Studies in Long Term Memory. London: John Wiley & Sons. 103-122. Klaudy Kinga 1999. Bevezetés a fordítás elméletébe. Budapest: Scholastica. Kleiber, G. 1998. Prototypensemantik. Tübingen: Narr. Kleinberg, J. 2000. Navigation in a Small World. Nature. 406: 845. Kleinfeld, J. S. 2002. The small world problem. Society. 39/2: 61-66. Knipf-Komlósi, Elisabeth–Rada V. Roberta–Bernáth Csilla 2006. Aspekte des Wortschatzes. Budapest: Bölcsész Konzorcium. Koehly, L. M.–Pattison, P. 2005. Random Graph Models for Social Networks: Multiple Relations or Multiple Raters. In Carrington, P. J.–Scott, J.– Wasserman, S. (eds.): Models and Methods in Social Network Analysis. Cambridge: Cambridge University Press. 162-191. Kossinets, G.–Kleinberg, J.–Watts, D. 2008. The Structure of Information Pathways in a Social Communication Network. Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Las Vegas. 435-443. Kovács László 2007. Mentális lexikon és kis világok. Alkalmazott Nyelvtudomány. VII/1-2: 140-150. Kovács László 2008a. Kis világok egy pszicholingvisztikai kutatás tükrében. In Balaskó Mária–Balázs Géza (szerk.): Konvergenciák 2003-2006. Szombathely: NYME SEK. 305-314. Kovács László 2008b. Nyelvi hálózatok a mentális lexikonban – Agykapocskutatás. Alkalmazott Nyelvtudomány. VIII/1-2: 177-196. Kovács László 2009a. Irányított kapcsolatok a mentális lexikonban. Modern Nyelvoktatás. XV/1-2: 29-40. Kovács László 2009b. A mentális lexikon megismerésének szerepe a szókincs oktatásában. NyelvInfó. 2009/1: 14-21. Kovács László 2009c. Begriffsstruktur des mehrsprachigen mentalen Lexikons. In Fekete-Csizmazia, Zsuzsanna et al. (Hrsg.): Sprache – Kultur – Berührungen. Szombathely–Wien: Savaria University Press–Praesens. 65-75.
Irodalom
223
Kovács László 2010a. Hálózatelmélet és nyelvészet. In Balaskó Mária–Balázs Géza–Kovács László (szerk.): Hálózatkutatás – Hálózatok a társadalomban és a nyelvben. Budapest: Tinta. 9-17. Kovács László 2010b. A mentális lexikon vizsgálata hálózatelméleti megközelítésben. In Balaskó Mária–Balázs Géza–Kovács László (szerk.): Hálózatkutatás – Hálózatok a társadalomban és a nyelvben. Budapest: Tinta. 109-121. Kovács László 2010c. Easley, David – Kleinberg, Jon: Networks, Crowds and Markets. Reasoning about a Highly Connected World. Közgazdasági Szemle. LVII. (2010 december): 1110-1112. Kovács László 2011a. Hálózatkutatás és szociolingvisztika. Magyar Nyelvőr. 135/1: 90-96. Kovács László 2011b. Fogalmi rendszerek és lexikai hálózatok a mentális lexikonban. Budapest: Tinta. Kovács László 2012a. Márkahálózatok. In Balázs Géza–Kovács László–Szőke Viktória (szerk.): Hálózatkutatás. Interdiszciplináris megközelítések. Budapest: Inter–Magyar Szemiotikai Társaság–Bolyai Műhely Alapítvány– Eötvös. 155-160. Kovács László 2012b. Szóasszociációs vizsgálatok alkalmazási lehetőségei márkák vizsgálatában. In Horváthné Molnár Katalin–Sciacovelli, A. D. (szerk.): Az alkalmazott nyelvészet regionális és globális szerepe. Budapest–Szombathely–Sopron: MANYE–NYME. 231-236. Kovács László 2012c. Autómárkák kognitív reprezentációjának vizsgálata asszociációk segítségével. Marketing & Management. 2012/4: 36-44. Kovács László 2012d. A mentális lexikon hálózatai. In Balázs Géza–Kovács László–Szőke Viktória (szerk.): Hálózatkutatás. Interdiszciplináris megközelítések. Budapest: Inter–Magyar Szemiotikai Társaság–Bolyai Műhely Alapítvány–Eötvös. 43-49. Kovács László–Orosz Katalin–Pollner Péter 2012. Magyar szóasszociációk hálózata. Magyar Tudomány. 2012/6: 699-705. Kovács László–Osvald Mária 2010. A mentális lexikon szakmai szerveződése. Modern Nyelvoktatás. XVI/2-3: 38-46. Kövecses Zoltán 2002. A metafora. Budapest: Typotex. Kövecses Zoltán–Benczes Réka 2010. Kognitív nyelvészet. Budapest: Akadémiai. Krantz, J. H.–Dalal, R. 2000. Validity of Web-based psychological research. In Birnbaum, M.H. (ed.): Psychological Experiments on the Internet. San Diego: Academic Press. 35-60.
224
Irodalom
Kraut, R. et al. 2004. Psychological research online: Report of board of scientific affairs’ advisory group on the conduct of research on the Internet. American Psychologists. 59/2: 105-117. Kroll, J. F. et al. 2002. The development of lexical fluency in a second language. Second Language Research. 18/2: 137-171. Kroll, J. F.–Stewart, E. 1994. Category interference in translation and picture naming: evidence for asymmetric connections between bilingual memory represenations. Journal of Memory and Language. 36: 550-568. Kroll, J. F.–Sunderman, G. 2003. Cognitive Processes in Second Language Learners and Bilinguals: The Developement of Lexical and Conceptual Representations. In Doughty, C. J.–Long, M. H. (eds.): The Handbook of Second Language Acquisition. Malden–Oxford–Melbourne–Berlin: Blackwell. 104-129. Kurtán Zsuzsa 2003. Szakmai nyelvhasználat. Budapest: Nemzeti Tankönyvkiadó. Kuti Judit et al. 2007. Language Independent and Language Dependent Innovations in the Hungarian WordNet. In Tanács A. et al. (eds.): Proceedings, GWC 2008. Szeged: University of Szeged. 254-268 Labov, W. 1973. The boundaries of words and their meanings. In Bailey, C-J. N.– Shuy, R. W. (eds.): New ways of analyzing variation in English. Washington D. C.: Georgetown University Press. 340-373. Lakoff, G. 1987. Women, Fire and Dangerous Thing. Chicago: The University of Chicago Press. Lakoff, G.–Johnson, M. 1980. Metaphors We Live By. Chicago: University of Chicago. Land, K. et al. 2008. Galaxy Zoo: The large-scale spin statistics of spiral galaxies in the Sloan Digital Sky Survey. Monthly Notices of the Royal Astronomical Society. 388/4: 1686-1692. Landau, B. 2004. Perceptual Units and Their Mapping with Language: How Children Can (Or Can’t) Use Perception to Learn Words. In Hall, G.– Waxman, S. R. (eds.): Weaving a Lexicon. Cambridge: MIT Press. 111148. Lang, E. 1994. Semantische vs. konzeptuelle Struktur: Unterscheidung und Überscheidung. In Schwarz, M. (Hrsg.): Kognitive Semantik / Cognitive Semantics. Tübingen: Gunter Narr. 25-41. Langacker, R. W. 1987. Foundations of Cognitive Grammar. Volume 1. Stanford: University of Stanford Press. Lehrer, A.–Kittay, E. F. (eds.) 1992. Frames, fields and contrasts: new essays in semantic and lexical organization. Hillsdale: Lawrence Erlbaum.
Irodalom
225
Lengyel Zsolt 1981. A gyermeknyelv. Budapest: Gondolat. Lengyel Zsolt 1997. Bevezetés a pszicholingvisztikába. Veszprém. Lengyel Zsolt 2005. Magyar egyszavas szabad asszociációs vizsgálatok: 19832004. Alkalmazott Nyelvtudomány. V/1-2: 25-40. Lengyel Zsolt 2007a. Asszociációs normák enciklopédiája. Alkalmazott Nyelvtudomány. VII/1-2: 125-141. Lengyel Zsolt 2007b. Rövidzárlat. In Benő Attila–Fazakas Emese–Szilágyi N. Sándor (szerk.) Nyelvek és nyelvváltozatok. 2. kötet. Kolozsvár: Anyanyelvápolók Erdélyi Szövetsége. 46-55. Lengyel Zsolt 2008a. Férfi – nő: 10-14 évesek körében végzett verbális asszociációs vizsgálat alapján. In Bodnár Ildikó–Kegyesné Szekeres Erika– Simigné Fenyő Sarolta (szerk.): Sokszínű nyelvészet. „Női szóval - női szemmel”. Gender kutatás a nyelvészetben és az irodalomban. Miskolc: Miskolci Egyetem. 55-63. Lengyel Zsolt 2008b. Magyar Asszociációs Normák Enciklopédiája: új perspektívák. Elhangzott: A magyar mint európai és világnyelv. Magyar Alkalmazott Nyelvészeti Kongresszus. Budapest, Balassi Intézet. 2008. április 3-5. Lengyel Zsolt 2008c. Magyar asszociációs normák enciklopédiája. Budapest: Tinta. Lengyel Zsolt 2009a. Magyar Asszociációs Normák Enciklopédiája: új perspektívák. In Lengyel Zsolt–Navracsics Judit (szerk.): Tanulmányok a mentális lexikonról – Studies on the Mental Lexicon. Budapest: Tinta. 15-20. Lengyel Zsolt 2009b. Idegen nyelvi elemek 10-14 éves magyar tanulók mentális lexikonjában. In Ablonczyné Mihályka Lívia–Garai Anna (szerk.): Győri Nyelvi Mozaik III. Győr: Széchenyi István Egyetem. 203-211. Lengyel Zsolt 2010. Szóasszociációs vizsgálatok: általános elvek, célok. In Balaskó Mária–Balázs Géza–Kovács László (szerk.): Hálózatkutatás – Hálózatok a társadalomban és a nyelvben. Budapest: Tinta. 195-204. Lengyel Zsolt 2011a. A szóasszociációs vizsgálatok újabb eredményei. Hungarológiai Évkönyv XII/1. Pécs: Pécsi Tudományegyetem. 179-192. Lengyel Zsolt 2011b. A szóasszociációs vizsgálatok használatnyelvészeti aspektusa In Géczi János–Makai Péter (szerk.): Utánad, Olvasó! Veszprém: Pannon Egyetem. 191-200. Lengyel Zsolt 2012a. Fonetikai/fonológiai kapcsolatok a mentális lexikonban (magyar szóasszociációs kísérletek alapján). In Navracsics Judit–Szabó Dániel (szerk.): Mentális folyamatok a nyelvi feldolgozásban / Mental Procedures in Language Processing. Budapest: Tinta. 65-84. Lengyel Zsolt 2012b. Szóról szóra. Budapest: Gondolat. Letenyei László 2005. Településkutatás. Budapest: L’Harmattan–Ráció.
226
Irodalom
Levelt, W. J. M. 1989. Speaking. From Intention to Articulation. Cambridge– London: MIT Press. Levelt, W. J. M.–Roelofs, A.–Meyers, A. S. 1999. A theory of lexical access in speech production. Behavioral and Brain Sciences. 22: 1-75. Lewis, T. G. 2009. Network Science. New Jersey: John Wiley. Li, W. 2003. Zipf's Law Everywhere. Glottometrics. 5: 14-21. Liang, M. 2010. The Edinburgh Associative Thesaurus (EAT) for MS Windows (Version 1.1). [Software]. Letölthető: http://www.eat.rl.ac.uk Libárdi Péter 2001. A nyelvi változás tükröződése az egyén mentális lexikonában. Alkalmazott Nyelvtudomány. 1/1: 39-49. Licata, I. et al. 2006. Scale Free Graphs in Dynamic Knowledge Acquisitioan. In Minati, G.–Pessa, E.–Abram, M. (eds.): Systemics of Emergence: Research and Developement. New York: Springer. 615-624. Lintott, C. J. et al. 2008. Galaxy Zoo: Morphologies derived from visual inspection of galaxies from the Sloan Digital Sky Survey. Monthly Notices of the Royal Astronomical Society. 389: 1179-1189. Liu, H. T. 2009. Statistical properties of Chinese semantic networks. Chinese Science Bulletin. 54/16: 2781-2785. Lowe, W. 1997. Meaning and the Mental Lexicon. In Proceedings of the 15th International Joint Conference on Artificial Intelligence. San Francisco: Morgan Kaufmann. 1092-1097. Löbner, S. 2003. Semantik. Berlin–New York: Walter de Gruyter. Lublóy Ágnes 2006. Topology of the Hungarian large-value transfer system. Magyar Nemzeti Bank Occasional Papers. 57. Magyari Lilla 2008. A mentális lexikon modelljei a magyar nyelvben. In Gervain Judit–Pléh Csaba (szerk.): A láthatatlan nyelv. Budapest: Gondolat. 98119. Malt, B. C.–Sloman, S. A.–Gennari, S. P. 2003. Universality and language specificity in object naming. Journal of Memory and Language. 49/1: 2042. Malt, B. C.–Gennari, S. P.–Imai, M. 2010. Lexicalization Patterns and the Worldto-Words Mapping. In Malt, B. C.–Wolff, P. (eds.): Words and the Mind. New York–Oxford: Oxford University Press. 29-57. Markman, A. B. 1999. Knowledge Representations. Mahdah–London: Lawrence Erlbaum Associates. Markman, E. M. 1994. Constraints on word meaning in early language acquisition. In Gleitman, L.–Landau, B. (eds.): The Acquisition of the Lexicon. Amsterdam: Elsevier. 199-228.
Irodalom
227
Markošová, M. 2008. Network model of human language. Physica A. 387/2-3: 661-666. Markowitz, J. 1988. An exploration into graded set membership. In Evens, M. W. (ed): Relational models of the lexicon. Cambridge: Cambridge University Press. 239-260. Marshall, J. 2004. Language Change and Sociolinguistics: Rethinking Social Networks. Basingstoke: Palgrave. Marshman, E. 2008. Expressions of uncertanity in candidate knowledge-rich contexts: A comparison in English and French specialized texts. Terminology. Special Issue: Pattern-based Approaches to Semantic Relation Extraction. 14/1: 124-151. Masucci, A. P.–Rodgers, G. J. 2008. Network properties of written human language. Physical Review E. 74: 026102. Meara, P. 2009. Connected Words. Amsterdam–Philadelphia: John Benjamins. Mengxiao, Z.–Zhi, C.–Qingsheng, C. 2003. Automatic keywords extraction of Chinese document using small world structure. In International Conference on Natural Language Processing and Knowledge Engineering, 2003. Beijing. 438- 443. Mihalovics Árpád 2006. A politikai kommunikáció tipológiája és taxonómiája. In Mihalovics Árpád: Politikai és diplomáciai nyelvhasználat – Langage politique et diplomatique. Veszprém: Pannon Egyetemi Kiadó. 43-47. Miháltz Márton et al. 2007. Methods and Results of the Hungarian WordNet Project. In Tanács A. et al. (eds.): Proceedings, GWC 2008. Szeged: University of Szeged. 311-320. Milgram, S. 1967. The small world problem. Psychology Today. 2: 60–67. Miller, G. A. 1991. The Science of Words. New York: Scientific American Library. Miller, G. A. 1998. Nouns in WordNet. In Fellbaum, Ch. (ed.): WordNet. Cambridge: MIT Press. Miller, G. A. et al. 1990. Introduction to WordNet: an on-line lexical database. International Journal of Lexicography. 3: 235-244. javított, bővített változat (1993): http://wordnet.princeton.edu/5papers.pdf Miller, K. M. 1970. Free-association responses of English and Australian students to 100 words from the Kent-Rosanoff association test. In Postman, L.– Keppel, G. (eds.): Norms of Word Association. New York: Academic Press. 39-52. Milo, R. et al. 2002. Network motifs: Simple building blocks of complex networks. Science. 298/5594: 824-827.
228
Irodalom
Milo, R. et al. 2004. Superfamilies of evolved and designed networks. Science. 303/5663: 1538-1542. Milroy, L. 1987. Language and social networks. Oxford: Blackwell. Milroy, L.–Gordon, M. 2003. Sociolinguistics: Method and Interpretation. Malden: Blackwell. Minsky, M. 1974. A Framework for Representing Knowledge. In Winston, P. (ed.): The psychology of computer vision. New York: McGraw Hill. 211277. Montemurro, M. E.–Zanette, D. H. 2002. New perspectives on Zipf’s law in linguistics: from single texts to large corpora. Glottometrics. 4: 87-99. Moss, H.–Older, L. 1996. Birkbeck word association norms. Hove: Psychology Press. Moss, H. E.–Tyler, L. K. 2001. Towards a distributed account of conceptual knowledge. TRENDS in Cognitive Sciences. 5/6: 244-252. Motter, A. E. et al. 2002. Topology of the conceptual network of language. Physical Review E. 65: 065102(R). Möhn, D. 1999. Fachsprache als Gruppensprache. In Hoffmann, L.– Kalverkämper, H.–Wiegand, H. E. (Hrsg.): Fachsprachen. Languages for Special Purposes. 1. Halbband. Berlin–New York: Walter de Gruyter. 150-157. Munn, K.–Smith, B. 2008. Applied Ontology. Frankfurt–Paris–Lancester–New Brunswick: Ontos. Muráth Judit 2002. Zweisprachige Fachlexikographie. Budapest: Nemzeti Tankönyvkiadó. Muráth Judit 2005. A terminológiai iskolák. In Muráth Judit–Hubainé Oláh Ágnes (szerk.): A XXI. század kihívásai a szakfordítóképzésben. Pécs: PTE KTK. 37-45. Muráth Judit 2007. Szakszótárak előkészítő munkálatai: lexikológiaiterminológiai vizsgálatok. In Magay Tamás (szerk.): Félmúlt és közeljövő. Budapest: Akadémiai. 155-170. Muráth Judit 2011. Aktuális gazdasági szövegek fordításának sajátosságai – terminológiai-lexikológiai vizsgálatok. In Silye Magdolna (szerk.): A szaknyelvi kompetenciafejlesztéstől a munkaerőpiacig. Debrecen: Szaknyelvoktatók és -Kutatók Országos Egyesülete. 245-253. Muráth Judit–Bagó Péter 2011. A pénzügyi válság izotópiája. In Boda István Károly–Mónos Katalin (szerk.): Alkalmazott nyelvészet ma: innováció, technológia, tradíció. Budapest–Debrecen: MANYE–Debreceni Egyetem. 72-79.
Irodalom
229
Muráth Judit–Bagó Péter 2012. Fogalmi struktúrák vizsgálata SPSS-szoftverrel. In Horváthné Molnár Katalin–Sciacovelli, A. D. (szerk.): Az alkalmazott nyelvészet regionális és globális szerepe. Budapest–Sopron–Szombathely: MANYE–NYME. 59-66. Murphy, G. L. 2002. The Big Book of Concepts. Cambridge–London: MIT Press. Murphy, M. L. 2003. Semantic Relations and the Lexicon. Cambridge: Cambridge University Press. Nádor Orsolya 2012. A mentális lexikon kutatásának lehetőségei a magyar mint idegen nyelv tanulóinak esetében. In Navracsics Judit–Szabó Dániel (szerk.): Mentális folyamatok a nyelvi feldolgozásban / Mental Procedures in Language Processing. Budapest: Tinta. 397-402. Nagy Levente 2010. Hálózatok a nyelvi profilalkotásban. In Balaskó Mária– Balázs Géza–Kovács László (szerk.): Hálózatkutatás – Hálózatok a társadalomban és a nyelvben. Budapest: Tinta. 156-165. Namei, S. 2004. Bilingual lexical development: a Persian-Swedish word association study. International Journal of Applied Linguistics. 14: 363387. National Research Council 2005. Network Science. Washington: The National Academies Press. Navracsics Judit 1999. A kétnyelvű gyermek. Budapest: Corvina. Navracsics Judit 2001a. Kétnyelvűek mentális lexikonának jellegzetességei. Alkalmazott Nyelvtudomány. 1/1: 51-59. Navracsics Judit 2001b. Fonetikai kapcsolatok a kétnyelvűek mentális lexikonában. In Gósy Mária (szerk.): Beszédkutatás 2001. Budapest: MTA Nyelvtudomány Intézet. 143-154. Navracsics Judit 2004. Kapcsolatok a többnyelvű mentális lexikonban. In Navracsics Judit–Tóth Szergej (szerk.): Nyelvészet és interdiszciplinaritás II. Szeged–Veszprém: Generalia. 419-428. Navracsics Judit 2007. A kétnyelvű mentális lexikon. Budapest: Balassi. Navracsics Judit 2009. The emergence of early L3 Lexicon: The first month. Lengyel Zsolt–Navracsics Judit (szerk.): Tanulmányok a mentális lexikonról – Studies on the Mental Lexicon. Budapest: Tinta. 119-134. Nelson, D. L.–McEvoy, C. L.–Schreiber, T. A. 1998. The University of South Florida word association, rhyme, and word fragment norms. http://www.usf.edu/FreeAssociation/. Neuberger Tilda 2012. Szóelőhívás gyermekek szóasszociációiban és spontán beszédében. In Navracsics Judit–Szabó Dániel (szerk.): Mentális folyamatok a nyelvi feldolgozásban / Mental Procedures in Language Processing. Budapest: Tinta. 85-94.
230
Irodalom
Newman, M. E. J. 2003. The structure and function of complex networks. SIAM Review. 45: 167-256. Newman, M. E. J. 2004. Analysis of weighted networks. Physical Review E. 70: 056131. Newman, M. E. J. 2005. Power laws, Pareto distributions and Zipf’s law. Contemporary Physics. 46: 323-351. Nielsen, M. L. 2002. The Word Association Method. Åbo: Åbo Akademis Förlag. Nosek, B. A.–Banaji, M. R.–Greenwald, A. G. 2002. E-Research: Ethics, security, design, and control in psychological research on the Internet. Journal of Social Issues. 58/1: 161-176. Ober, B. A.–Shenaut, G. K. 2006. Semantic Memory. In Traxler, M.– Gernsbacher, M. (eds.): Handbook of Psycholinguistics. London– Amsterdam: Elsevier. 403-453. Oláh-Nagy Noémi 2012. Kulturális különbségek a mentális lexikonban – szóaszszociációs vizsgálat és számítógépes klaszterelemzés. In Balázs Géza– Kovács László–Szőke Viktória (szerk.): Hálózatkutatás. Interdiszciplináris megközelítések. Budapest: Inter–Magyar Szemiotikai Társaság–Bolyai Műhely Alapítvány–Eötvös. 50-58. Orosz Katalin–Kovács László–Pollner Péter 2012. Magyar és angol szóasszociációs hálózatok vizsgálata. In Balázs Géza–Kovács László–Szőke Viktória (szerk.). Hálózatkutatás. Interdiszciplináris megközelítések. Budapest: Inter–Magyar Szemiotikai Társaság–Bolyai Műhely Alapítvány–Eötvös. 58-62. Orosz Katalin–Vicsek András–Pollner Péter 2010. „Influenza” a tudomány szolgálatában: információterjedés bloghálózaton. In Balaskó Mária–Balázs Géza–Kovács László (szerk.): Hálózatkutatás – Hálózatok a társadalomban és a nyelvben. Budapest: Tinta. 71-80. Osgood, C. E.–Suci, G. J.–Tannenbaum, P. H. 1957. The Measurement of Meaning. Urbana–Chicago–London: University of Illionis Press. Osvald Mária 2009. A mentális lexikon rendezettsége. Sportszaknyelvi szóasszociációs vizsgálatok. Szakdolgozat. Szombathely: Nyugat-magyarországi Egyetem. Palla Gergely et al. 2005. Uncovering the overlapping community structure of complex networks in nature and society. Nature. 435/7043: 814-818. Palla Gergely–Barabási Albert-László–Vicsek Tamás 2007. Quantifying social group evolution. Nature. 446: 664-667. Papadopoulos, F. et al. 2012. Popularity versus similarity in growing networks. Nature. 489: 537-540.
Irodalom
231
Papp Ferenc 1984/2006. Anyanyelv és idegen nyelv a verbális asszociációk tükrében. Magyar Nyelv. LXXX/2: 202-207. Változatlan formában: In Klaudy Kinga (szerk.): Papp Ferenc olvasókönyv. Budapest: Tinta. 219224. Pavlenko, A. 2009. Conceptual Representation in the Bilingual Lexicon and Second Language Vocabulary Learning. In Pavlenko, A. (ed.): The Bilingual Mental Lexicon. Bristol–Buffalo–Toronto: Multilingual Matters. 125-160. Pinker, S. 2006. A nyelvi ösztön. Budapest: Typotex. Pinker, S.–Prince, A. 1999. The nature of human concepts: evidence from an unusual source. In Loocke, V. P. (ed.): The Nature of Concepts. London– New York: Routledge. 8-51. Pléh Csaba 1996. A modern kognitivizmus mozgalma és változásai. In Pléh Csaba (szerk.): Kognitív tudomány. Budapest: Osiris. Pléh Csaba (szerk.) 1997. A megismerés egy új útja: A párhuzamos feldolgozás. Budapest: Typotex. Pléh Csaba 1998. Bevezetés a megismeréstudományba. Budapest: Typotex. Pléh Csaba 2000. A magyar morfológia pszicholingvisztikai aspektusai. In Kiefer Ferenc (szerk.): Strukturális magyar nyelvtan. 3. Morfológia. Budapest: Akadémiai. 951-1017. Pléh Csaba–Lukács Ágnes 2003. A nyelv idegrendszeri reprezentációja. In Pléh Csaba–Kovács Gyula–Gulyás Balázs (szerk.): Kognitív idegtudomány. Budapest: Osiris. 528-584. Pléh Csaba–Lukács Ágnes–Kas Bence 2008. A szótár pszicholingvisztikája. In Kiefer Ferenc (szerk.): Strukturális magyar nyelvtan 4. Budapest: Akadémiai. 789-852. Pollio, H. R. 1966. The Structural Basis of Word Association Behavior. The Hague–Paris: Mouton. Pomi, A.–Mizraji, E. 2004. Semantic graphs and associative memories. Physical Review E. 70: 166136. Pomi, A.–Olivera, F. 2006. Context-sensitive autoassociative memories as expert systems in medical diagnosis. BMC Medical Informatics and Decision Making. 6/39: 1-11. Postman, L.–Keppel, G. (eds.): 1970. Norms of Word Association. New York: Academic Press. Potter, M. C. et al. 1984. Lexical and conceptual representation in beginning and more proficient bilinguals. Journal of Verbal Learning an Verbal Behavior. 23: 23-38.
232
Irodalom
Pozzi, M. 1999. The Concept of ’Concept’ in Terminology: a Need for a New Approach. In Sandrini, P. (ed.): TKE ’99 Terminology and Knowledge Engineering. Vienna: Termnet. 28-42. Pozzi, M. 2007. The Impact of Logical Contradictions in Three Core TC 37 Standards for Their Practical Application: ISO 704, 1087-1 and 860. http://www.ttt.org/TC37/ISO%20Conference%202007_files/Maria_704% 20860%201087.pdf Prószéky Gábor–Földes András 2005. Between Understanding and Translating: A Contex-Sensitive Comprehension Tool. Archive of Control Sciences. 15/4: 637-647. Prószéky Gábor–Miháltz Márton 2008. Magyar WordNet: az első magyar lexikális szemantikai adatbázis. Magyar Terminológia. 1/1: 43-57. Prószéky Gábor–Miháltz Márton–Nagy Dániel 2001. Toward a Hungarian Wordnet. Proceedings of the WordNet Workshop at NAACL-2001. Pittsburgh. 174–176. http://www.morphologic.hu/pg/NAACL2001-paper.pdf (2005.06.21.) Quillian, M. R. 1968. Semantic memory. In Minsky, M. (ed.): Semantic information processing. Cambridge: MIT Press. 227-270. Raddick, J. et al. 2010. Exploring the motivations of citizen science volunteers. Astronomy Education Review. 9/1: 010103. Rahmstorf, G. 1999. Identifying Words, Senses and Concepts. In Sandrini, P. (ed.): TKE ’99 Terminology and Knowledge Engineering. Vienna: Termnet. 410-426. Ravasz Erzsébet–Barabási Albert-László 2003. Hierarchical organization in complex networks. Physical Review E. 67: 026112. Rees, v. R 2003. Clarity in the usage of the terms ontology, taxonomy and classification. In Amor, R. (ed.): Proceedings of the CIB W78's 20th International Conference on Construction IT: Construction IT Bridging the Distance. University of Auckland. 432-440. Reips, U.-D. 2000. The Web experiment method: Advantages, disadvantages and soultions. In Birnbaum, M. H. (ed.): Psychological Experiments on the Internet. San Diego: Academic Press. 89-117. Reips, U.-D. 2002. Standards for Internet-based experimenting. Experimental Psychology. 49/4: 243–256. Roberson, D.–Hanley, J. R. 2010. Relatively Speaking: An Account of the Relationship between Language and Thought in the Color Domain. In Malt, B. C.–Wolff, P. (eds.): Words and the Mind. New York–Oxford: Oxford University Press. 183-198. Roelcke, T. 2002. Efficiency of communication. Glottometrics. 4: 27-38.
Irodalom
233
Roelofs, A. 1992. A spreading activation theory of lemma retrieval in speaking. Cognition. 42: 107-142. Rogers, T. T.–McClelland, J. L. 2003. The Parallel Distribued Processing Approach to Semantic Cognition. Nature Reviews Neuroscience. 4: 310322. Rogers, T. T.–McClelland, J. L. 2004. Semantic Cognition. Cambridge: MIT Press. Rosch, E. 1975. Cognitive Representation of Semantic Categories. Journal of Experimental Psychology. 104: 192-233. Rosch, E. 1978. Principles of Categorization. In Rosch, E.–Lloyd, B. B. (eds.): Cognition and categorization. Hillsdale: Lawrence Erlbaum. 27-48. Rosenzweig, M. R. 1970. International Kent-Rosanoff word association norms, emphasizing those of French male and female students and French workmen. In Postman, L.–Keppel, G. (eds.): Norms of Word Association. New York: Academic Press. 95-176. Roster, C. A. et al. 2004. A comparison of response characteristics from web and telephone surveys. International Journal of Market Research. 46/3: 359– 373. Russel, S.–Norvig, P. 2005. Mesterséges Intelligencia. Budapest: Panem. Russel, W. A. 1970. The complete german language norms for responses to 100 words from the Kent-Rosanoff word association test. In Postman, L.– Keppel, G. (eds.): Norms of Word Association. New York: Academic Press. 53-94. Sager, J. C. 1990. A Practical Course in Terminology Processing. Amsterdam– Philadelphia: John Benjamins. Sager, J. C. (ed.) 2000. Essays on Definition. Amsterdam–Philadelphia: John Benjamins. Saussure, F. d. 1997. Bevezetés az általános nyelvészetbe. Budapest: Corvina. Sántáné-Tóth Edit et al. 2008. Döntéstámogató rendszerek. Budapest: Panem. Schlobinski, P. 1996. Empirische Sprachwissenschaft. Opladen: Westdeutscher Verlag. Schmid, M. S.–Köpke, B. 2009. L1 Attrition and the Mental Lexicon. In Pavlenko, A. (ed.): The Bilingual Mental Lexicon. Bristol–Buffalo– Toronto: Multilingual Matters. 209-238. Schmidt, J. 2005. Online-Forschung. In Lehmann, K.–Schetsche, M. (Hrsg.): Die Google-Gesellschaft. Bielefeld: Transcript. 323-328. Schroeder, M. 2002. Power Laws: from Alvarez to Zipf. Glottometrics. 4: 39-44.
234
Irodalom
Schur, E. 2007. Insights into the structure of L1 and L2 vocabulary networks: intimations of small worlds. In Daller, H–Milton, J.–Treffers-Daller, J. (eds.): Modelling and Assessing Vocabulary Knowledge. Cambridge: Cambridge University Press. 182-203. Schwanenflugel, P. K.–Rey, M. 1986. Interlingual Semantic Facilitation: Evidence for a Common Representational System in the Bilingual Lexicon. Journal of Memory and Language. 25: 605-618. Schwarz, M. 1994. Kognitive Semantik – State of the Art und Quo vadis? In Schwarz, M. (Hrsg.): Kognitive Semantik / Cognitive Semantics. Tübingen: Gunter Narr. 9-21. Sierra, G. et al. 2008. Definitional verbal patterns for semantic relation extraction. Terminology. Special Issue: Pattern-based Approaches to Semantic Relation Extraction. 14/1: 74-98. Sigman, M.–Cecchi, G. 2002. Global organization of the Wordnet lexicon. Proceedings of the National Academy of Science. 99/3: 1742-1747. Singleton, D. 1999. Exploring the Second Language Mental Lexicon. Cambridge: Cambridge University Press. Sinopalnikova, A.–Smrź, P. 2004. Word Association Thesaurus as a Resource for extending Semantic Networks. In Proceedings of the International Conference on Communications in Computing (CIC 2004). 267-273. Skitka, L. J.–Sargis, E. G. 2006. The Internet as psychological laboratory. Annual Review of Psychology. 57: 529-555. Smith, B.–Welty, C. 2001. FOIS introduction: Ontology – towards a new synthesis. In Smith, B.–Welty, C. (eds.): Formal Ontology in Information Systems. Proceedings of the international conference on Formal Ontology in Information Systems. Volume 2001. Ongunquit: ACM Press. iii-x. Snedeker, J.–Gletman, L. R. 2004. Why It Is Hard to Label Our Concepts. In Hall, G.–Waxman, S. R. (eds.): Weaving a Lexicon. Cambridge: MIT Press. 257-294. Solé, R. V. 2006. Scaling laws in language evolution. In Cioffi-Revilla, C. (ed.): Power Laws in the Social Sciences. Cambridge University Press. http://complex.upf.es/~ricard/SOLE_REVIEW.ps Solé, R. V. et al. 2005. Language Networks: their structure, function and evolution. Trends in Cognitive Sciences. http://www.ecagents.org/dllink.php?id=143&type=Document Solé, R. V. et al. 2010. Language Networks: Their Structure, Function and Evolution. Complexity. 15/6: 20-26.
Irodalom
235
Soler, V.–Alcina, A. 2008. Patrones léxicos para la extracción de conceptos vinculados por la relación parte-todo en espaňol. Terminology. Special Issue: Pattern-based Approaches to Semantic Relation Extraction. 14/1: 99-123. Sowa, J. F. 1979. Semantics of conceptual graphs. Proceedings of the 17th Annual Meeting of the Association for Computational Linguistics. 39-44. http://acl.ldc.upenn.edu/P/P79/P79-1010.pdf Sowa, J. F. 2000. Knowledge Representation: Logical, Philosophical, and Computational Foundations. Pacific Grove: Brooks Cole. Sowa, J. F. 2008. Conceptual Graphs. In Harmelen, v. F.–Lifschitz, V.–Porter, B. (eds.): Handbook of Knowledge Representation. Amsterdam: Elsevier. 213-237. Söderman, T. 1993. Word association of foreign language learners and native speakers: the phenomenon of a shift in response type and its relevance for lexical developement. In Ringbom H. (ed.): Near-native proficiency in English. Stockholm: Åbo. 91-182. Spitzer, M. 1996. Geist im Netz. Heidelberg–Berlin: Spektrum. Sporns, O.–Zwi, J. 2004. The small world of the cerebral cortex. Neuroinformatics. 2: 145-162. Steyvers, M.–Tenenbaum, J. B. 2005. The Large-Scale Structure of Semantic Networks: Statistical Analyses and a Model of Semantic Growth. Cognitive Science. 29: 41-78. Storkel, H. L. 2004. Do children acquire dense neighborhoods? An investigation of similarity neighborhoods in lexical acquisition. Applied Psycholinguistics. 25: 201-221. Strogatz, S. 2003. Sync. London: Penguin. Suchanek, F. M.–Kasneci, G.–Weikum, G. 2007. YAGO: A Core of Semantic Knowledge Unifying WordNet and Wikipedia. Proceedings of 16th International WWW Conference. Banff. 697-706. http://www2007.org/proceedings.html (2009.08.01) Sunstein, C. R. 2006. Infotopia. Oxford–New York: Oxford University Press. Supekar, K. et al. 2008. Network analysis of intrinsic functional brain connectivity in Alzheimer's disease. PLoS Computational Biology. 4/6: e1000100. Sutherland, A. H. 1913. Critique of Word Association Reactions. Menasha: Collegiate Press. Szabó Katalin–Hámori Balázs 2006. Információgazdaság. Budapest: Akadémiai. Szalay, L. B.–Deese, J. 1978. Subjective Meaning and Culture: An Assessment Through Word Associations. Hillsdale: Lawrence Erlbaum.
236
Irodalom
Szántó Zoltán–Tóth István György 1993. A társadalmi hálózatok elemzése. Társadalom és gazdaság. 1993/1: 31-55. Szeredi Péter–Lukácsy Gergely–Benkő Tamás 2005. A szemantikus világháló elmélete és gyakorlata. Budapest: Typotex. Szőke Viktória 2012. A KKV-k gazdaságföldrajzi hálózatainak vizsgálati lehetőségei. In Balázs Géza–Kovács László–Szőke Viktória (szerk.): Hálózatkutatás. Interdiszciplináris megközelítések. Budapest: Inter–Magyar Szemiotikai Társaság–Bolyai Műhely Alapítvány–Eötvös. 168-172. Takács Károly 2010. Hálózati kísérletek. Közgazdasági Szemle. LVII (2010. november): 958-979. Tapscott, D.–Williams, A. 2007. Wikinómia. Budapest: HVG. Thellefsen, T. L.–Thellefsen, M. M. 2004. Pragmatic Semiotics and Knowledge Organization. Knowledge Organization. 31/3: 177-187. Tikk Domonkos 2007. Szövegbányászat. Budapest:Typotex. Tóth József 2001. Wortfeldforschung: Entwicklungsgeschichte und kontrastive semantische Untersuchungen. Szombathely: Berzsenyi Dániel Főiskola. Tóth József 2003. Rückblick auf die Entstehung- und Entwicklungsgeschichte des Wortfeldbegriffes in der Sprachwissenschaft. Eine Einleitung zur Wortfeldforschung. In Tóth József (Hrsg): Quo Vadis Wortfeldforschung? Frankfurt am Main: Peter Lang. 8-22. Tóth József 2007. Vergleich der Repräsentationsmodelle zur Beschreibung der Wortbedeutung im Gedächtnis. In Tóth József (Hrsg.): Wechselbeziehungen in der Germanistik: kontrastiv und interkulturell. Veszprém–Wien: Universitätsverlag–Praesens. 175-189. Ullman, M. T. 2001a. A neurocognitive perspective on language: the declarative/procedural model. Nature Reviews Neuroscience. 2: 717-727. Ullman, M. T. 2001b. The neural basis of lexicon and grammar in first and second language: the declarative/procedural model. Bilingualism: Language and Cognition. 4/1: 105-122. Umamoto, T. 1998. Hypertext and the Mental Lexicon: Using the Homepage for Learning Vocabulary. The Journal of the Language and Culture Association. 13: 19-29. Ungerer, F.–Schmid, H. J. 1996. An introduction to cognitive linguistics. London: Longman. Vasiljević, Z. 2008. Word Association Studies in the Second Language - Where are We Now and Where do We Go from Here? www.britishcouncil.org/serbia-elta-newsletter-december-2008academic_corner-word_associations.doc
Irodalom
237
Vicsek Tamás 2006. Hálózatok – Bevezetés. Magyar Tudomány. 2006/11: 12961297. Vise, D. A–Malseed, M. 2008. The Google Story. London–Basingstoke–Oxford: Pan Macmillan. Vitevitch, M. S. 2008. What can graph theory tell us about word learning and lexical retrieval? Journal of Speech, Language, and Hearing Research. 51: 408-422. Vivaldi, J.–Rodríguez, H. 2007. Evaluation of terms and term extraction systems. Terminology. 13/2: 225-248. Wardhaugh, R. 2002. Szociolingvisztika. Budapest: Osiris. Watts, D. J. 1999. Small Worlds. Princeton–Oxford: Princeton University Press. Watts, D. J. 2004a. The “New” Science of Networks. Annual Review of Sociology. 30: 243-70. Watts, D. J. 2004b. Six Degrees. London: Random House. Watts, D. J.–Strogatz, S. H. 1998. Collective dynamics of ‘small-world’ networks. Nature. 393: 440-442. Waxman, S. R. 1994. The developement of an appreciation of specific linkages between linguistic and conceptual organization. In Gleitman, L.–Landau, B. (eds.): The Acquisition of the Lexicon. Amsterdam: Elsevier. 229-258. Waxman, S. R. 2004. Everything Had a Name, and Each Name Gave Birth to a New Thought: Links Between Early Word Learning and Conceptual Organization. In Hall, G.–Waxman, S. R. (eds.): Weaving a Lexicon. Cambdridge: MIT Press. 295-336. Weinreich, U. 1953. Languages in Contact: Findings and Problems. The Hague: Mouton. Westbury, C. F.–Hollis, G. 2007. Putting Humpty Together Again: Synthetic Approaches to Nonlinear Variable Effects Underlying Lexical Access. In Jarema, G.–Libben, G (eds.): The Mental Lexicon. Amsterdam: Elsevier. 7-31. Wheeler, E. S. 2002. Zipf's Law and why it works everywhere. Glottometrics. 4: 45-48. Whitmore, J. M.–Shore, W. J.–Smith, P. 2004. Partial Knowledge of Word Meanings: Thematic and Taxonomic Representations. Journal of Psycholinguistic Research. 33: 137-164. Wildgen, W. 2008. Kognitive Grammatik. Berlin–New York: Walter de Gruyter.
238
Irodalom
Wilks, C.–Meara, P. 2007. Implementing graph theory approaches to the exploration of density and structure in L1 and L2 word association networks. In Daller, H.–Milton, J.–Treffers-Daller, J. (eds.): Modelling and Assessing Vocabulary Knowledge. Cambridge: Cambridge University Press. 167-181. Wilks, C.–Meara, P.–Wolter, B 2005. A further note on simulating word association behaviour in a second language. Second Language Research. 21/4: 359-372. Wilks, Y. 2009. Machine Translation. New York: Springer. Wirtschaft von A bis Z. 2004. Mannheim–Leipzig–Wien–Zürich: Duden. Wüster, E. 1968. The Machine Tool / Dictionnaire Multilingue de la MachineOutil. London: Technical Press. Wüster, E. 1985. Einführung in die allgemeine Terminologielehre und terminologische Lexikographie. Copenhagen: The Copenhagen School of Economics. Zareva, A. 2007. Structure of the second language mental lexicon: how does it compare to native speakers’ lexical organization? Second Language Research. 23/2: 123-153. Zechmeister, E. B. et al. 1993. Metacognitive and Other Knowledge about the Mental Lexicon: Do We Know How Many Words We Know? Applied Linguistics. 14/2: 189-206. Zhang, H. 2008. The Scale-Free Nature of Semantic Web Ontology. Proceeding of the 17th international conference on World Wide Web. 1047-1048. Zhang, S.,–Whang, R. S.–Zhang, X.-S. 2007. Identification of overlapping community structure in complex networks using fuzzy c-means clustering. Physica A. 374: 483-490. Zhang, X.–Cheng, C.–Qu, Y. 2007. Ontology Summarization Based on RDF Sentence Graph. In Proceedings of the 16th international conference on World Wide Web. 707-716. Ziem, A. 2008. Frames und sprachliches Wissen. Berlin–New York: Walter de Gruyter.
Irodalom
239
Hivatkozott honlapok és szoftverek Agykapocs. http://www.agykapocs.hu ConnectYourMind. http://www.connectyourmind.com _lognostics. http://www.lognostics.co.uk BOINC. http://boinc.berkeley.edu Facebook. http://facebook.com FirmNet. http://www.maven7.hu Flickr. http://www.flickr.com eBird. http://ebird.org/content/ebird/about Dutch Word Association Database. http://www.kuleuven.be/semlab/interface/index.php http://www.smallworldofwords.com/ (angol adatfelvétel) http://www.smallworldofwords.com/tuebingen/ (német adatfelvétel) Edinburgh Associative Thesaurus (EAT). http://www.eat.rl.ac.uk GalaxyZoo. http://www.galaxyzoo.org Glosbe. http://glosbe.com Google. www.google.com GraphViz. http://www.graphviz.org Human Brain Cloud. http://www.humanbraincloud.com InnoCentive. http://www.innocentive.com Last.fm gráfja. http://sixdegrees.hu/last.fm/index.html Linguee. http://www.linguee.de Maven 7. http://www.maven7.hu Pajek. http://pajek.imfm.si/doku.php?id=pajek SETI0@Home. http://setiathome.berkeley.edu Small World Project. http://smallworld.columbia.edu Stardust@home. http://stardustathome.ssl.berkeley.edu The University of South Florida word association, rhyme, and word fragment norms. http://www.usf.edu/FreeAssociation/ WIENER Project. http://complex.upf.es/~bernat/WIENER WordNet. http://wordnet.princeton.edu Yebol. http://www.yebol.com Yed. http://www.yworks.com/en/products_yed_about.htm
240
Irodalom
Adók felosztásához felhasznált honlapok (2009. július) Adó- és Pénzügyi Ellenőrzési Hivatal. http://www.apeh.hu Adó online. http://www.ado.hu Adó Sziget. http://www.adosziget.hu BME Pénzügyi és Számviteli Tanszék. Adózási ismeretek. www.uti.bme.hu/data/segedanyag/109/1.adoalapfogalmak.2009_115049.ppt Hitelek felosztásához felhasznált honlapok (2009. július) Budapest Bank Nyrt. http://www.budapestbank.hu CIB Bank Zrt. http://www.cib.hu ERSTE Bank Hungary Nyrt. http://www.erstebank.hu OTP Bank Nyrt. http://www.otpbank.hu Pénzügyi Szervezetek Állami Felügyelete. http://www.pszaf.hu PénzügySziget. http://www.penzugysziget.hu Raiffeisen Bank Zrt. http://www.raiffeisen.hu UniCredit Bank Hungary Zrt. http://www.unicreditbank.hu
MELLÉKLETEK 1. Melléklet Agykapocs-rendszer, első 100 (fix) hívószó, sorrendben (felülről lefelé) alma ember barátság hitel szép piros könyv ünnepelni autó biztonság tőzsde szépség politika Tv olvasni drága e-mail vidám szerelem bank segíteni mobil zöld nyaralás ajándék
vállalkozás szék motor nyelv tudás reklám foci inni diploma sport pénz kenyér bevásárolni manager wellness adó olcsó szabad teve hír enni gazdag tolmácsolás környezetvédelem fizetés
szín újság sok venni információ politikus mosoly vám bolt állat tiszta számítógép divat marketing kórház bankkártya Európa film gyűlölni egészség étel Internet sokkolni kereskedelem hangulat
választás ár környezet aludni nevetni nyár kevés kutya Magyarország Áfa hobbi gazdaság szabadidő fordítás határ vizsga öröm múlt orvos euró kedves piszkos világ új remény
242
Mellékletek 2. Melléklet
Agykapocs-rendszer, első 134 (fix) hívószó (2013. 04.) sorrendben (felülről lefelé) alma ember barátság hitel szép piros könyv ünnepelni autó biztonság tőzsde szépség tablet Tv olvasni drága e-mail vidám szerelem bank segíteni mobil zöld nyaralás ajándék vállalkozás márka motor nyelv válság reklám foci inni diploma
sport pénz kenyér bevásárolni manager wellness adó olcsó szabad teve hír enni gazdag recesszió környezetvédelem fizetés szín újság sok venni információ közösségi média mosoly vám bolt állat tiszta számítógép divat marketing kórház bankkártya Európa film
gyűlölni egészség étel Internet sokkolni kereskedelem hangulat okostelefon ár környezet aludni nevetni nyár kevés kutya Magyarország Áfa hobbi gazdaság szabadidő fordítás határ vizsga öröm múlt orvos euró kedves piszkos világ új remény óra játék
toll kulcs virág biztosítás zsiráf kő gyertya ásványvíz biztosító használt dísz olló garázs életbiztosítás használtcikk lakásdiszítés bolhapiac plüss állat otthonos bizományi ajándékbolt virágdísz nyelviskola virágbolt bolt garázsban virágkötészet használt játék nyelvtanulás tengely száraz virág tinta diszítés
Mellékletek
243
3. Melléklet Az 50 leggyakoribb válaszszó Agykapocs-kutatás 2013. 02. hó, bejövő válaszok száma, db. „Nincs ötletem” pénz autó jó sok kevés pihenés ruha adó öröm boldogság kutya kék állat telefon határ betegség víz drága piros karácsony zöld munka régi könyv
4036 db 3459 db 922 db 823 db 689 db 637 db 625 db 619 db 579 db 579 db 557 db 543 db 535 db 531 db 531 db 513 db 505 db 497 db 495 db 490 db 490 db 488 db 487 db 471 db 467 db
szép tv alma élet angol sport internet szeretet újság olcsó idő rossz hír ember fehér tudás bank szerelem beteg bolt foci üzlet étel papír enni
463 db 454 db 452 db 448 db 444 db 437 db 424 db 421 db 403 db 402 db 402 db 398 db 395 db 389 db 389 db 388 db 383 db 382 db 380 db 378 db 377 db 368 db 365 db 364 db 364 db
244
Mellékletek 4. Melléklet A 100 legerősebb kapcsolat
Agykapocs-kutatás 2013. 02. hó, hívószó-válaszszó, kapcsolat erőssége, db. mobil → telefon bank → pénz sok → kevés kevés → sok tőzsde → pénz hitel → pénz állat → kutya szék → asztal euró → pénz Áfa → adó enni → inni bankkártya → pénz olvasni → könyv zöld → fű kutya → macska teve → sivatag Magyarország → haza új → régi étel → ital film → mozi múlt → jelen vám → határ fizetés → pénz garázs → autó gazdag → szegény kórház → betegség környezet → védelem piros → alma kedves → aranyos marketing → reklám foci → labda olcsó → drága teve → púp alma → körte ember → állat divat → ruha hír → újság
408 db 364 db 363 db 337 db 335 db 313 db 310 db 304 db 295 db 279 db 273 db 273 db 272 db 264 db 259 db 256 db 244 db 244 db 240 db 239 db 237 db 232 db 232 db 229 db 226 db 220 db 219 db 219 db 219 db 217 db 215 db 215 db 214 db 208 db 206 db 205 db 204 db
inni → enni szín → kék vám → határ alma → piros wellness → pihenés e-mail → levél ünnepelni → karácsony kórház → beteg drága → olcsó gyűlölni → szeretni öröm → bánat alma → gyümölcs tudás → hatalom óra → idő újság → hír gyűlölni → utálni piszkos → koszos nyár → meleg bank → hitel nyelv → angol sport → foci könyv → olvasás reklám → tv kenyér → étel fordítás → nyelv öröm → boldogság vám → adó szépség → szörnyeteg tolmácsolás → fordítás számítógép → internet motor → autó orvos → beteg tiszta → fehér vidám → boldog tinta → toll egészség → betegség szabad → madár
203 db 203 db 202 db 200 db 199 db 195 db 192 db 187 db 186 db 183 db 181 db 181 db 179 db 179 db 178 db 175 db 171 db 171 db 162 db 157 db 156 db 155 db 152 db 152 db 151 db 151 db 149 db 146 db 142 db 141 db 141 db 138 db 137 db 136 db 134 db 133 db 132 db
Mellékletek barátság → szeretet múlt → jövő választás → politika inni → víz barátság → szerelem foci → sport adó → pénz szabadidő → pihenés határ → vám információ → hír hangulat → kedv szép → csúnya politika → hazugság
131 db 130 db 130 db 129 db 126 db 126 db 122 db 122 db 122 db 120 db 119 db 117 db 117 db
remény → hit wellness → hétvége szín → piros kulcs → zár ajándék → meglepetés piros → kék nyár → tél euró → forint mosoly → öröm gyertya → láng drága → ékszer e-mail → internet tolmácsolás → nyelv
245 116 db 115 db 114 db 114 db 113 db 111 db 109 db 107 db 107 db 107 db 105 db 104 db 103 db
246
Mellékletek 5. Melléklet Az autó hívószóra adott válaszok (2013. február 27.)
Magyarázat: Válasz – autó (1.) oszlop: az autó hívószóra adott válaszok. Mennyiség (2.) oszlop: a válaszok száma; válasz / összes válasz. Hívószó (3.) oszlop: az autó hívószóra adott válaszszavakat hívószóként lekérdezve vizsgáljuk, hogy létezik-e a kapcsolat mindkét irányban; vagyis például, ha az autó hívószóra a motor a válasz (kapcsolat autó → motor irányban), akkor létezik-e az ellentétes kapcsolat is, vagyis a motor hívószóra érkezett-e válaszként az autó szó (kapcsolat motor → autó irányban). Válasz (4.) oszlop: ha adott hívószóra létezik az ellentétes irányú kapcsolat (példa: motor → autó), akkor az autó szó kiírásra kerül. Mennyiség (5.) oszlop: hívószó → autó irányban a kapcsolat erőssége. Az erősség: autó válaszok száma / összes válasz. Tehát az 5. sorban vezetés 2 / 7 db jelentése: a vezetés szó 7 alkalommal szerepelt hívószóként, ebből 2 esetben volt az autó a válasz. Az adatbázisban jelenleg is vannak parkolópályán tartott, nem ellenőrzött szavak (vö. 5. fejezet), így fenti listában is találhatunk olyan szavakat, amelyek az ellenőrzés folyamán a későbbiekben törlésre kerülnek, illetve helyesírásuk javítva lesz. Válasz – autó motor kocsi utazás kerék vezetés sebesség jármű gyorsaság gyors Opel benzin Ferrari közlekedés piros autó Audi szabadság
Mennyiség 89 / 945 db 68 / 945 db 45 / 945 db 43 / 945 db 28 / 945 db 24 / 945 db 24 / 945 db 22 / 945 db 21 / 945 db 19 / 945 db 19 / 945 db 14 / 945 db 14 / 945 db 13 / 945 db 13 / 945 db 11 / 945 db 11 / 945 db
Hívószó motor kocsi utazás kerék vezetés sebesség jármű gyorsaság gyors Opel benzin Ferrari közlekedés piros autó Audi szabadság
Válasz autó autó autó autó autó autó autó autó -
Mennyiség 141 / 932 db 2 / 4 db 2 / 7 db 4 / 6 db 2 / 8 db 9 / 947 db 13 / 945 db 3 / 9 db -
Mellékletek kényelem jogosítvány út száguldás Suzuki bicikli drága Ford BMW kék gépkocsi mozgás gép verseny vezet pénz vezetni kirándulás baleset mobil Mercedes Toyota forgalom busz car Trabant Skoda Volvo gépjármű garázs ház megy kormány Volkswagen no_idea fehér Peugeot nagy gumi versenyzés
11 / 945 db 10 / 945 db 10 / 945 db 9 / 945 db 9 / 945 db 9 / 945 db 9 / 945 db 9 / 945 db 9 / 945 db 7 / 945 db 7 / 945 db 6 / 945 db 6 / 945 db 6 / 945 db 6 / 945 db 6 / 945 db 5 / 945 db 5 / 945 db 5 / 945 db 5 / 945 db 5 / 945 db 5 / 945 db 5 / 945 db 5 / 945 db 4 / 945 db 4 / 945 db 4 / 945 db 4 / 945 db 4 / 945 db 4 / 945 db 4 / 945 db 4 / 945 db 4 / 945 db 4 / 945 db 4 / 945 db 3 / 945 db 3 / 945 db 3 / 945 db 3 / 945 db 3 / 945 db
kényelem jogosítvány út száguldás Suzuki bicikli drága Ford BMW kék gépkocsi mozgás gép verseny vezet pénz vezetni kirándulás baleset mobil Mercedes Toyota forgalom busz car Trabant Skoda Volvo gépjármű garázs ház megy kormány Volkswagen no_idea fehér Peugeot nagy gumi versenyzés
247 autó autó autó autó autó autó autó autó autó autó autó autó autó autó autó autó autó autó autó -
1 / 8 db 1 / 5 db 3 / 6 db 22 / 932 db 2 / 4 db 2 / 7 db 1 / 911 db 3 / 8 db 3 / 12 db 4 / 927 db 2 / 8 db 4 / 7 db 4 / 7 db 5 / 7 db 4 / 6 db 2 / 2 db 229 / 378 db 2 / 4 db 1 / 5 db -
248 kerékpár kicsi mosás élmény Lada Matiz tuning jogsi utazóeszköz van tütü gazdagság eszköz nincs Maserati ajtó jó mata T-modell fekete kerekek vezető pálya mobilitás új jó lenne márka mentő bicaj Motor apa szmog négykerekű ablak sport mozog Seat VW séta bmw
Mellékletek 3 / 945 db 3 / 945 db 3 / 945 db 3 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db 2 / 945 db
kerékpár kicsi mosás élmény Lada Matiz tuning jogsi utazóeszköz van tütü gazdagság eszköz nincs Maserati ajtó jó mata T-modell fekete kerekek vezető pálya mobilitás új jó lenne márka mentő bicaj Motor apa szmog négykerekű ablak sport mozog Seat VW séta bmw
autó autó autó autó autó autó autó autó autó autó autó -
2 / 7 db 2 / 4 db 2 / 6 db 1 / 7 db 5 / 5 db 1 / 8 db 20 / 826 db 3 / 80 db 4 / 5 db 2 / 2 db 2 / 2 db -
Mellékletek Astra menni valahova rajzolt autó ezüst költség kényelmes négy kerék autóm benzinár Citroen veszély lopás város 4 kerék gépjármű ami közlekedik közlekedni guruló jármű gyorsulás szükség Cherokee Honda Jazz limuzin trabim személygépjármű jövő MX-5 Japán fogyasztás nem kell gyalogos Porsche túlzsúfoltság lóerő Vectra benzinkút robot álom Honda duda ölés
1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db
Astra menni valahova rajzolt autó ezüst költség kényelmes négy kerék autóm benzinár Citroen veszély lopás város 4 kerék gépjármű ami közlekedik közlekedni guruló jármű gyorsulás szükség Cherokee Honda Jazz limuzin trabim személygépjármű jövő MX-5 Japán fogyasztás nem kell gyalogos Porsche túlzsúfoltság lóerő Vectra benzinkút robot álom Honda duda ölés
249 autó autó autó autó
2 / 4 db 1 / 3 db 2 / 3 db 1 / 5 db
autó autó autó autó autó autó autó autó autó autó -
1 / 3 db 1 / 1 db 2 / 5 db 2 / 3 db 1 / 4 db 2 / 3 db 1 / 4 db 1 / 5 db 1 / 5 db 1 / 3 db -
250 szamár nem Subaru eljutás barát hiánycikk Jeep Győr biztonság Avensis rally aszti Mini autómosó váltó Renault tulajdon család Polo autószerelő amivel az iskolába megyünk szép casco bűz szükséges jólét VW Sharan szalon karambol szeretem ülés jó ha van utazni elmenni környezetszennyező az enyém forgalmi dugó saját sose lesz kaszni
Mellékletek 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db
szamár nem Subaru eljutás barát hiánycikk Jeep Győr biztonság Avensis rally aszti Mini autómosó váltó Renault tulajdon család Polo autószerelő amivel az iskolába megyünk szép casco bűz szükséges jólét VW Sharan szalon karambol szeretem ülés jó ha van utazni elmenni környezetszennyező az enyém forgalmi dugó saját sose lesz kaszni
autó autó autó autó autó autó -
2 / 4 db 1 / 5 db 4 / 946 db 1 / 4 db 1 / 3 db 1 / 5 db -
autó autó autó autó autó
1 / 949 db 1 / 4 db 1 / 9 db 1 / 1 db 1 / 3 db
Mellékletek lámpa vásárlás státuszszimbólum bogár hasznos fúj költséges kell büdös vonat siker felesleg sárga das fontos nap Mercedes Benz érték függetlenség kulcs önállóság játék szerelő terepjáró automata szekér klassz kereskedés kresz gurul fény fényes javítás fényűzés kényelmes utazás zaj közlekedési eszköz moha gáz Impala
1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db
lámpa vásárlás státuszszimbólum bogár hasznos fúj költséges kell büdös vonat siker felesleg sárga das fontos nap Mercedes Benz érték függetlenség kulcs önállóság játék szerelő terepjáró automata szekér klassz kereskedés kresz gurul fény fényes javítás fényűzés kényelmes utazás zaj közlekedési eszköz moha gáz Impala
251 autó autó autó autó autó -
3 / 415 db 7 / 431 db 1 / 5 db 1 / 4 db 2 / 7 db -
252 cabrio közlekedés kipufogó távolság sportkocsi cég utak lízing Alfa Romeo személygépkocsi tükör Saab munkaeszköz kipufogó Mitsubishi pénznyelő óra zöld férfias hajó csúszos út Nissan Micra pedál országút Micra Mazda füst Lamborghini Nissan hitel Aston Martin sportautó járda dugó sportos
Mellékletek 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db 1 / 945 db
cabrio közlekedés kipufogó távolság sportkocsi cég utak lízing Alfa Romeo személygépkocsi tükör Saab munkaeszköz kipufogó Mitsubishi pénznyelő óra zöld férfias hajó csúszos út Nissan Micra pedál országút Micra Mazda füst Lamborghini Nissan hitel Aston Martin sportautó járda dugó sportos
autó autó autó autó autó autó -
1 / 3 db 1 / 3 db 2 / 927 db 2 / 4 db 1 / 950 db 1 / 3 db -
Mellékletek
253
6. Melléklet Bármely hívószóra adott autó válaszok (2013. február 27.) Magyarázat: A Hívószó (1.) oszlop azt mutatja meg, mely hívószavakra volt válasz az autó szó, a Mennyiség (2.) oszlop pedig azt, hogy az összes autó válaszból hány darab érkezett az adott hívószóra. Példa: az autó szót összesen 918 esetben adták meg válaszként hívószavakra. A legtöbb válasz (bejövő kapcsolat) a garázs szóból származik, 229 esetben válaszoltak a garázs hívószóra az autó szóval Az adatbázisban jelenleg is vannak parkolópályán tartott, nem ellenőrzött szavak (vö. 5. fejezet), így fenti listában is találhatunk olyan szavakat, amelyek az ellenőrzés folyamán a későbbiekben törlésre kerülnek, illetve helyesírásuk javítva lesz. Hívószó garázs motor tengely használt biztosítás drága új autó piros biztosító venni játék bolt garázsban használtcikk piszkos tütü Skoda biztonsági öv biztonság jármű Volvo Toyota Trabant mentő mobil
Mennyiség 229 / 918 db 141 / 918 db 68 / 918 db 60 / 918 db 23 / 918 db 22 / 918 db 20 / 918 db 13 / 918 db 9 / 918 db 8 / 918 db 7 / 918 db 7 / 918 db 7 / 918 db 6 / 918 db 5 / 918 db 5 / 918 db 5 / 918 db 4 / 918 db 4 / 918 db 4 / 918 db 4 / 918 db 4 / 918 db 4 / 918 db 4 / 918 db 4 / 918 db
baleset Audi Suzuki jogositvány hobbi kulcs vezetni Mazda 626 Dodge slusszkulcs fényező Bugatti brümm márka lada V12 biturbós Audi Matiz vezetés BMW Ferrari négy kerék vizsga Mercedes kocsi vezet Ducati
3 / 918 db 3 / 918 db 3 / 918 db 3 / 918 db 3 / 918 db 3 / 918 db 3 / 918 db 3 / 918 db 3 / 918 db 3 / 918 db 3 / 918 db 3 / 918 db 3 / 918 db 3 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db
254 katalizátor 4 kerék Honda Jazz kormány gépjármű VW bevásárolni zöld életbiztosítás használt játék trabim Mazda irigyelhető batár hirtelen baleset autópálya Subaru Porsche Audi V12 turbó Rolls-Royce vállalkozás bank lerobban tuning négykerekű előz forgalmi közlekedési eszköz vezető térképen kár guroló jármű száguldás Honda kipufogógáz Citroen súlyadó mentők gyújtós vettél már
Mellékletek 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 2 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db
utazik ajándék kétkerekű jármű száguld jogsi M7 nagy szép reklám nyelv terepjáró újat kell venni nyaralás kereskedelem környezetvédelem teher árverés közlekedni a sajátom páncél kukás villamos Vectra kaszni makulátlan forgalmi dugó 1,6-os főtengely benzinkút szélsebes hengerfejszimering Forma-1 úttest brümmögés új dolog dizájn bolhapiac lejtő pénzbírság használható
1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db
Mellékletek fék Avensis hengerfej összetört drága kocsi gázolás lóerő Internet alkatrész Ingolstadt elüt luxus dugattyú ABS GPS kardántengely Xsara Lexus hitel Trabi bikázás karcolni olcsó barátság adó VW Sharan gépjármű ami közlekedik zötty-zötty ,,,,, szétesik anyagi jólét Jeep alváz foglalás sokkolni adásvétel Jessica Simpson Lotus Suzuki Hayabusa akkumulátor
1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db
cross pénz jogosítvány szétszed katica Viper követés amivel megyünk futómű mehet diploma mentős a legjobb bizományi dugó fogyasztás kardán szerelés tengelyek robbanómotor bedöglött kipufogó recesszió szerelő tárcsa Q7-es Audi gazdag tulajdonos támla pöfögő ülés rally Lada r5 meg lehet venni Mini berregés villámgyors cserbenhagyni
255 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db 1 / 918 db
256
Mellékletek 7. Melléklet A 100 leggyakoribb válaszszó (bejövő válaszok) Osvald Mária (2009) kutatásában
foci futás sport boksz vívás olimpia úszás tenisz biliárd egészség torna győzelem korcsolya kosárlabda pénz atlétika golf tánc kézilabda ugrás erő edzés győztes dopping sérülés verseny sportoló víz csalás kiütés ín küzdelem szurkoló játék
191 172 168 139 119 116 110 99 91 82 81 74 73 71 71 69 65 64 63 61 59 54 54 51 51 50 48 47 40 40 39 38 38 37
óra szivar védeni első Red Bull élet sí kosár csapat kenu vizsgálat munka hideg idő alma edző érem tűz kalapácsvetés autó röplabda kitartás meleg küzdőtér Savaria tél gól pálya teke betegség jég mozgás Peking siker
37 37 37 35 35 33 33 32 31 30 30 29 28 28 26 26 26 26 25 24 24 23 23 22 22 22 21 21 21 20 20 20 20 20
állat baseball első hely fájdalom Forma 1 vitamin jégkorong küzdés anya kimerültség magyar ökölvívás távolugrás amerikai foci büntető dobás egészséges masszőr síp szőnyeg Egerszegi Krisztina fontos láb labdarúgás levegő nehéz USA úszó elismer eredmény izomláz kori
19 19 19 18 18 18 17 17 16 16 16 16 16 15 15 15 15 15 15 15 14 14 14 14 14 14 14 14 13 13 13 13
Mellékletek
257
8. Melléklet Hálózatelmélettel kapcsolatos szavak magyarázata A hálózatkutatás szempontjából pontokról, kapcsolatokról, hálózatokról beszélünk. Matematikailag a hálózatok gráfként írhatók le, ebben az esetben a pontok=csúcsok, a kapcsolatok=élek, a hálózatok=gráfok. A valós hálózatokat a matematika nyelvén tehát a gráfok írják le, amelyekkel a gráfelmélet foglalkozik. Az egyes jellemzők (pl. súlyozott) igazak lehetnek egy kapcsolatra, az egész hálózatra és a gráfokra, vagyis lehet hálózatban súlyozott adott kapcsolat, lehet súlyozott az egész hálózat kapcsolatrendszere, illetve a gráf is ábrázolhat súlyozott kapcsolatokat (éleket). A lista több összefoglaló kötet és tanulmány (Barabási 2003, Csermely 2005, Fóris 2007, Letenyei 2005, Lewis 2009, Szántó–Tóth 1993) alapján készült; ugyanakkor meg kell jegyeznünk, hogy a terminológia sem angol, sem magyar nyelven nem egységes a társadalomtudományi gyökerek, a matematikai összefüggések, illetve az újabb fizikai megközelítések hatásaként. Aciklikus gráf (acyclic graph): A gráf nem tartalmaz hurkokat. Átlagos fokszám (average node degree): Megmutatja, átlagosan hány kapcsolata van egy pontnak. Átlagos útvonalhossz (average path length / average shortest path): Az átlagos út hossza a hálózat két tetszőleges eleme között. Átmérő (diameter): Egy hálózat átmérője azon kapcsolatok száma, ahány kapcsolatra a két legtávolabbi elem van egymástól. Befok lásd Bejövő kapcsolatok fokszáma. Bejövő kapcsolatok fokszáma / befok (in-degree): Azon kapcsolatok száma, amelyek adott pontba irányulnak. Ciklikus gráf (cyclic graph): A gráf hurkokat tartalmaz, vagyis adott pontból kiindulva más pontokon keresztül visszajutunk a kiindulási pontba. Csomópontok (connectors): Olyan pontok, amelyek a hálózatban átlagosnál lényegesen több kapcsolattal rendelkeznek. Csúcs lásd Pont. Él (edge) lásd Kapcsolat. Erős kapcsolatok (strong ties / strong connections): Erős kapcsolat van két elem között, ha a kapcsolat elvétele a hálózat jellemző tulajdonságait (statisztikai jellemzőit) befolyásolja. Fokszám (degree): Egy pont kapcsolatainak száma. Gráf (graph): Olyan pontok összessége, amelyek között irányított vagy nem irányított kapcsolatok vannak.
258
Mellékletek
Gráfelmélet (graph theory): A matematika azon területe, amely a gráfok tulajdonságainak tanulmányozásával foglalkozik. Gyenge kapcsolatok (weak ties / weak connections): Gyenge kapcsolat van két elem között, ha a kapcsolat elvétele a hálózat jellemző tulajdonságait (statisztikai jellemzőit) nem befolyásolja. Gyűjtő (authorities) vagy presztízs: Olyan csomópontok, amelyeknek sok bejövő kapcsolata van. Hálózati forgalom (traffic): Az információ áramlása a pontok között. Hálózatnövekedési modell (growing network model): Olyan modell, amelyben a hálózatot úgy alkotjuk meg, hogy veszünk egy vagy több kezdeti pontot, majd fokozatosan adjuk hozzá a további pontokat. Hálózattopológia (network topology) lásd Topológia. Irányított gráf (directed graph): Olyan gráf, amelyben minden kapcsolat irányított. Irányított kapcsolat (arc / directed link): A gráf egyik pontjából a másik pontba mutató irányított él. A kapcsolattól (éltől) abban különbözik, hogy iránya van. Általában nyíllal jelöljük. Kapcsolat / Él (link / connection / edge): Két pont közötti közvetlen összeköttetés. Kifok lásd Kimenő kapcsolatok fokszáma Kimenő kapcsolatok fokszáma / Kifok (out-degree): Azon kapcsolatok száma, amelyek adott pontból kifelé mutatnak. Kisvilág-karakterű hálózat (small-world network): Olyan hálózat, amelyek esetében a szomszédok között sok kapcsolat van, ugyanakkor a hálózaton belüli átlagos útvonalhossz rövid. Klaszterezési együttható (clustering coefficient): Annak a valószínűsége, hogy egy véletlenszerűen kiválasztott pont két szomszédja között van közvetlen kapcsolat. Motívum (motif / network motif): Olyan (általában ismétlődő) kapcsolódási minták, amelyek az összetett hálózat alhálózataira jellemzők. Multiplex (többrétegű) kapcsolat (multiplex connections): A hálózat két eleme között nemcsak egyfajta, hanem egyszerre többfajta kapcsolat is létezik. Nem irányított gráf (undirected graph): Olyan hálózat, ahol a kapcsolatok iránya nem jelzett. Nem súlyozott kapcsolat (unweighted link): A kapcsolatok erőssége nem jelölt csak a kapcsolat megléte a fontos. Pont / csúcs (node / vertex): A gráf egy egysége, amely kapcsolódhat más pontokhoz. Presztízs lásd Gyűjtő.
Mellékletek
259
Pszeudográf (pseudograph): Adott pontból kapcsolat irányulhat saját magára. Random gráf / Véletlenszerű gráf (random graph): Olyan gráf, amelyben a kapcsolatok véletlenszerűen jönnek létre. Robusztusság (error and attack tolerance): Egy hálózat akkor robusztus, ha a környezet változásaira kis érzékenységgel reagál. Skálafüggetlen hálózat (scale-free network): Olyan hálózat, amelyben nincs a pontoknak jellemző fokszáma és a fokszámok nagy mértékben eltérhetnek egymástól (azaz egyszerre vannak jelen nagyon kevés és nagyon sok kapcsolattal rendelkező elemek). Súlyozott kapcsolat (weighted link): A kapcsolatok nem egyforma erősségűek, az egyes kapcsolatok erőssége valamilyen módon jelölt. Szemantikai háló (semantic network): Jelentést hordozó elemek hálózata. Szociális (társadalmi) hálózat (social network): Olyan hálózat melyet az emberek és a köztük levő kapcsolatok alkotnak. A kapcsolat lehet ismeretség, barátság. Az internetes közösségi portálok a szociális hálózatokra épülnek. Szomszéd (neighbour): Olyan két pont a hálózatban, amelyek között közvetlen kapcsolat van. Szomszédok (neighbourhood): Adott pont és annak összes szomszédja. Távolság (distance): A legrövidebb út két adott pont között. Teljes gráf (fully connected graph): Olyan gráf, ahol minden egyes pont minden másik ponttal közvetlenül össze van kapcsolva. Topológia / Hálózattopológia (topology): A hálózat globális felépítése, a pontok és a kapcsolatok elrendezése. Többrétegű kapcsolat lásd Multiplex kapcsolat. Többszörös él (multiple relations): Ha két pont között több él fut (vö. Multiplex kapcsolat). Triád (triad): Olyan három pontból álló pontrendszerek, amelyek meghatározzák a hálózat lokális (helyi) felépítését. Útvonalhossz (path length): A távolság két pont között adott útvonalon (nem szükségszerűen a legrövidebb útvonal). Vezérlő (hub) (irányított gráf): Olyan csomópontok amelynek sok kimenő kapcsolata van.
260
Mellékletek 9. Melléklet Hálózatelmélettel kapcsolatos angol kifejezések magyar fordítása
A fordítás a 7. Mellékletben felhasznált források alapján történt. acyclic graph: aciklikus gráf arc: irányított kapcsolat attack tolerance: robusztusság authorities: gyűjtő average node degree: átlagos fokszám average path length: átlagos útvonalhossz average shortest path: átlagos útvonalhossz clustering coefficient: klaszterezési együttható connection: kapcsolat connector: csomópont cyclic graph: ciklikus gráf degree: fokszám diameter: átmérő directed graph: irányított gráf directed link: irányított kapcsolat distance: távolság edge: él error tolerance: robusztusság fully connected graph: teljes gráf graph theory: gráfelmélet graph: gráf growing network model: hálózatnövekedési modell hub: vezérlő (irányított gráf); csomópont (nem irányított gráf) in-degree: bejövő kapcsolatok fokszáma / befok link: kapcsolat motif: motívum multiple relations: többszörös él neighbour: szomszéd neighbourhood: szomszédok network motif: (hálózati) motívum node: pont out-degree: kimenő kapcsolatok fokszáma / kifok path length: útvonalhossz
Mellékletek pseudograph: pszeudográf random graph: random gráf / véletlenszerű gráf scale-free network: skálafüggetlen hálózat semantic network: szemantikai hálózat small-world network: kisvilág-karakterű hálózat social network: szociális (társadalmi) hálózat strong connection: erős kapcsolat strong tie: erős kapcsolat tie: kapcsolat topology: topológia / hálózattopológia traffic: hálózati forgalom triad: triád undirected graph: nem irányított gráf unweighted link: nem súlyozott kapcsolat vertex: csúcs weak connection: gyenge kapcsolat weak tie: gyenge kapcsolat weighted link: súlyozott kapcsolat
261
A kötet témája a mentális lexikon (agyi szótár): a mentális lexikon vizsgálatának lehetőségei és módszerei, valamint a mentális lexikonban tárolt egységek szerveződése. A mentális lexikon egységei nem egymástól függetlenül léteznek, hanem egymással kapcsolatot létesítve hálózatot alkotnak. Ezt a hálózatot két megközelítésben is vizsgálja a kötet: egyrészt hagyományos nyelvészeti módszerekkel, másrészt a napjainkban kibontakozóban lévő hálózatkutatás eszközeivel. A mentális lexikon hálózatainak vizsgálata nagy mennyiségű szóasszociációs adat gyűjtését és feldolgozását követeli meg. Hagyományos kutatási módszerekkel ez nem, vagy csak nehezen kivitelezhető, ezért a vizsgálathoz szükséges volt egy olyan szoftver megalkotása, amelynek segítségével szóasszociációs adatok gyűjthetők és részben automatikusan fel is dolgozhatók. A könyv részletesen bemutatja az ebből a célból megalkotott Agykapocs-rendszer működését, illetve az internet-felhasználóktól történő adatgyűjtés előnyeit és hátrányait. A gyűjtött adatok feldolgozásának példájaként a mentális lexikon szakmai szerveződését vizsgáljuk, a kapott adatokat terminológiai rendszerekkel is összevetve. Bemutatjuk továbbá a mentális lexikon hálózatos felépítésének jellemzőit, a mentális lexikon kapcsolatrendszerét és alhálózatait. A kötet egyrészt betekintést nyújt a mentális lexikon vizsgálatának és szerveződősének számos aspektusába, másrészt a nyelvészet területén új adatgyűjtési módszerrel is megismerteti az Olvasót.
ISBN 978-615-5219-35-1
2490 Ft