Értelmező szótáraink számítógépes változatairól Pajzs Júlia
Az átdolgozott Magyar értelmező kéziszótár számítógépes változata 2003-ban jelent meg, nem sokkal a nyomtatott változat kiadását követően, az Akadémiai Kiadó gondozásában. 2004 elején pedig az Arcanum kiadó jelentette meg A magyar nyelv értelmező szótárának számítógépes változatát, ezek összehasonlítására vállalkozom. 1. A kéziszótár adatbázisa Az Akadémiai Kiadó saját fejlesztésű kezelő programmal oldotta meg a közelmúltban megjelent, átdolgozott szótárainak egységes lekérdezését. A lekérdező program magja ugyanaz a Folio View program, amelyet az Arcanum is használ, elsősorban a hozzá kifejlesztett felhasználói felület különbözik, a lekérdezési lehetőségek hasonlóak. A legegyszerűbben az egyes címszavakat kereshetjük. A számítógépes változatban feloldották a nyomtatott változatban rövidítésként szereplő tildéket, ezért már a címszavak megtalálása is lényegesen könnyebb az adatbázisban. Elsősorban a nem gyakorlott szótárfelhasználók számára jelent ez óriási segítséget, akik sokszor egész egyszerűen nem találják meg a bokrosított címszavakat a nyomtatott változatban. A tildék feloldását a teljes szócikkben elvégezték, így a teljes szöveg keresésekor a példamondatokban, szólásokban, közmondásokban is megtalálhatjuk a keresett szó előfordulásait. Az alapértelmezésként felajánlott ún. egyszerű keresésénél csupán pontosan a megadott szót találja meg, így például a gyermek szó keresésekor toldalékolt alakjait már nem kapjuk meg eredményként. A keresőpanel megváltoztatásával használhatjuk az ún. összetett keresést, amely lehetőséget biztosít a szókezdet alapján való keresésre is. Mivel azonban – sajnálatos módon – címszófelismerő programot nem illesztettek a rendszerhez, az egyszerre lehet túl sok és túl kevés. (Például, az apa szó egyszerű keresése esetén csak ennek toldalékolatlan előfordulásait kapjuk meg, az apa vagy apá kezdetű szavak keresése esetén az apad, apály stb. adatait is megkapjuk eredményül.) Nem csak a szavak kezdetét, hanem végződését is kereshetjük, így például összetételek utótagja szerint is gyűjthetjük a szavakat. Szavak belsejében előforduló karaktereket is kereshetünk. Az összetett keresés nyújt lehetőséget szavak együttes előfordulásainak megtalálására (anya és gyermek), vagy éppen a szövegkörnyezet egy részének kizárására (anya aminek a közelében nem fordul elő a gyermek). A keresőpanel megváltoztatásával a szavakat minősítésük szerint is kereshetjük. Az ablak felkínálja a kereshető minősítéseket. A minősítések feloldása néha sajátos – a durva minősítésűek között kereshetjük például a trágár szavakat is – egy esetben pedig hibás: a katonai minősítésű szavakat katolikusként oldották fel. A keresések eredményeként legfeljebb csak az első 100 találatot kaphatjuk meg, sajnos nincs mód a további találatok megjelenítésére, és arról sem kapunk információt, összesen hány találatunk lehetett volna. A lekérdező egyik újítási kísérlete az ún. hasonló szavak keresése.
Ez a szócikkben előfordult szavak gyakorisága alapján próbál többé-kevésbé hasonló szavakat találni. Lássunk erre néhány példát (a közös gyakorisági mutató szerint csökkenő sorrendben): fut jár, szalad, rohan, lót-fut, nekifut, elfut, rohan, átfut, nyargal, rámegy, elfut, inal, kifut, kikerül kiabál kikiabál, belekiabál, felkiabál, bekiabál, óbégat, rikácsol, sikoltoz, racsít, csepp, abcúgol, toprongy, üvölt, ordít, ahogy, hogy, sál Némelyik érthetetlennek látszó hasonlóságra a példamondatokban kereshető a magyarázat: a kiabál szócikkében találjuk: Ez a sál nagyon kiabál rajtad. (Így került a sál a kiabálhoz hasonló szavak közé), a toprongy pedig a Mi ez a toprongy rajtad? példamondat révén ez és rajtad a közös szavak). mókus evet, kelempászmadár, kis, orángután, galambocska, bozontos, koma, ember, aranyos, pofika Az orángután annyiban hasonlít a mókusra, hogy fákon él és barnásvörös színű. A pele viszont, bár értelmezése: „pelefélék: mókushoz hasonló, de kisebb, erdőkben élő, téli álmot alvó rágcsálók családja” nem jelenik meg a hasonló szavak között, mivel értelmezésében toldalékolt alakjában szerepel a mókus. Ha a szép szóhoz hasonlóként a gyönyörű, mutatós stb. rokon értelmű szavakat várnánk, csalódnunk kell: de, szépség, igen, hanem, hogy, van, úgy, csak, mégolyan, melléknév, kell, még, mondatpótló, -tól-től, ám, csiszolás, jó… szavakat kapjuk. A jó szóból kiindulva pedig az elég, kinéz, sor, hely, szép, különben, csak, idő, rossz, igér, kar, elfér, kenyér, áll… stb. szavakat sorolja fel hasonlóként. Mint látjuk, a hasonló keresés csak időnként jelenti többé-kevésbé rokon értelmű szavak keresését. Feltehetőleg pontosabb eredményeket kapnánk, ha csak az értelmezésben előforduló szavak gyakoriságát vennék alapul, azokat viszont lehetőleg szótövesített formában. Bár nincs erre külön keresési lehetőség feltüntetve, a teljes szövegben való kereséskor megtalálhatjuk az átdolgozott szótár egyik jelentős újítását: a határainkon túli használt magyar nyelv sajátos szavait, jelentéseit. Néhány érdekes példa a szlovákiai magyarból: akció 3. (kulturális műsoros stb.) rendezvény; alobal alufólia, átfizet
térít; cselenka hajpánt; az erdélyi magyarból: abonál előfizet; csubuk borravaló, baksis | mellékkereset; formál 3. számot formál: telefonszámot tárcsáz; kazettofon kazettás magnetofon; megkap 8. megtalál; a kárpátaljai magyarból: leöltözik vetkőzik; reket bűnszövetkezet; Bár a CD változat számos olyan vizsgálatot tesz lehetővé, amelyeket a nyomtatott változat gyakorlatilag kizárt, vagy legalábbis igen nehézkessé tett, a felhasznált XML adatbázis számos további, kifinomultabb lekérdezéshez is alapul szolgálhatott volna. Az ennek alapján készült tanulmányában Mártonfy Attila bemutatja például (Mártonfy 2005), hogy – noha a szótár címszavainak csak töredéke finnugor eredetű, – ezek a leggyakrabban használt szavak. A kiadott adatbázisban azonban sem a szótár etimológiai információit,
sem a gyakorisági mutatókat nem tudjuk keresni, holott tapasztalataim szerint az átlagos felhasználókat éppen ezek a kérdések foglalkoztatják leginkább. Az eredeti XML adatbázisban megkülönböztettük a szócikk szerkezeti elemeit, nem lenne érdektelen, ha a felhasználó megadhatná, hogy az értelmezésben, a példamondatokban, vagy a különféle szókapcsolatokban, idiomatikus kifejezésekben szeretne egyes szavakat megtalálni. 2. A hétkötetes értelmező szótár adatbázisa Az Arcanum kiadásában megjelent CD keresési lehetőségei sok tekintetben hasonlóak a kéziszótáréhoz. Az egyszerű keresés esetén a szó összes előfordulását megkapjuk. A találatok számára nincs korlátozás, akár több ezer találatot is megnézhetünk. Pozitívum, hogy az összes kereshető szó feltűnik egy külön ablakban. Kereshetünk szókezdetre és végződésekre. A lemmatizált keresés sajnos itt sem biztosított. A bővített keresés funkcióban bonyolult logikai kifejezések megadására van lehetőség (pl. több szó egymás közelében, megadott távolságon belül, vagy épp ellenkezőleg: csak azok az előfordulások, ahol egy másik szó nincs a közelében stb.) A Kéziszótárnál finomabb keresést biztosít az ún. Keresőűrlap, melynek segítségével a szótár különböző mezőiben előfordult szavakat/szövegrészleteket találhatjuk meg. bármely szó a teljes szövegben keres címszó csak a címszavak között keres stílus a minősítések között keres példa az ún. szabad példamondatokban keres idézet az idézeteken belül keres szerző adott szerzőktől származó idézetekben kereshetünk A valódi idézetek szerepeltetése az ÉrtSz. specialitása, örvendetes, hogy az ezekben való speciális keresést az Arcanum megoldotta. Általánosságban elmondhatjuk, az Arcanum CD legfőbb előnye, hogy a szótári struktúrában való keresést jobban biztosítja, és nem korlátozza a találatok számát. A minősítések szerinti keresés lehetővé teszi, hogy szemelgessünk például az 1945 előttinek minősített szavakból. Ezek között bőséggel találhatunk olyanokat, amelyeket a kéziszótár mindkét kiadásában alaposan át kellett dolgozni. Értsz. bordély főnév -t, -ok, -a (1945 előtt, választékos) 1. Az az üzleti vállalkozás, mely szerződtetett kéjnőket férfiaknak nemi ösztönük kielégítése céljára rendelkezésre bocsát; kupleráj. Bordélyt tart fenn. ÉKsz1 bordély fn kiv Kéjnőket férfiak rendelkezésére bocsátó üzleti vállalkozása, ill. ennek épülete ÉKsz2 bordély fn kiv Prostituáltakat (foglalkozásszerű tevékenységében) foglalkoztató üzleti vállalkozás ill. ennek épülete
ÉrtSz. emberpiac fn 1. (1945 előtt) Az a hely, főleg tér, ahol mezőgazdasági munkások rendsz. rövidebb ideig tartó bérmunkára, napszámosmunkára önként felajánlkoztak, ahol vmely. munkáltató felfogadta őket. A szőlő bekapálására az emberpiacon két munkást fogadott. ÉKsz1 emberpiac fn nép rég Falun, kisvároson az a tér, ahol a mezőgazdasági munkások, napszámosok álldogáltak, várva, hogy felfogadják őket. ÉKsz2 emberpiac fn 1. biz sajtó Az a hely, főleg tér, ahol valamely munkáltató (v. megbízottja) rendsz. Alkalmi bérmunkára munkásokat fogad fel. | nép rég alkalmi mezőgazdasági munkások felfogadására kialakult hely, tér. ÉrtSz. jótékony melléknév -an, -abb 1. (1945 előtt) emberbaráti és vallásos jelszavak hangoztatásával és a gyökeres társadalmi változás szükségességének elkendőzésére az általa kiválasztott „szegényeknek” megalázó módon adományokat juttató <jobb módú személy v. ilyenekből álló egyesület>. Jótékony nőegylet. || a. (1945 előtt) Ilyen személyektől származó, tőlük rendezett, céljaiknak megfelelő. Jótékony alapítvány, cél; jótékony célú bál, gyűjtés, hangverseny, műsoros est. Jótékony vásárt csináltunk a nőegyletben. (Kaffka Margit) ÉKsz1 jótékony mn 1. kiv Szegényeknek (könyör)-adományokat gyűjtő és juttató. ~nőegylet | kiv Erre irányuló ~cél. ÉKsz2 jótékony mn 1. A rászorulóknak, bajbajutottaknak adományokat gyűjtő és juttató. ~szervezetek | Erre irányuló ~cél(ú). középosztály [p-o] főnév 1. (1945 előtt) a társadalomnak az a rétege, amely a testi munkájukból (munkások és parasztok), valamint a vagyonukból munka nélkül élők osztálya közé esik, s amelynek tagjai általában a szabad pályákon v. a közszolgálatban működő értelmiségiek, a tisztviselők, jobbmódú kereskedők és iparosok, a közép- és alsó papság, valamint a fegyveres erők tiszti állománya. A középosztály életformája, szelleme. Mint a középosztály gyermekének korán megmutatta végzetem, hogy kenyér után kell látnom. (Vas Gereben) A négy … testvér igazán a magyar középosztályt képviselte. A filozófus, a pap, az örök mulató és a bölcs szervező volt ez a négy ember. (Móricz Zsigmond) középosztály fn Tőkés társadalomban a két alapvető osztály között elhelyezkedő jómódú kispolgárság és értelmiség középosztály fn Magát és családját saját erejéből, munkájából tisztes színvonalon eltartani képes személyekből álló széles társadalmi csoport, réteg Ez a néhány kiragadott példa jól illusztrálja, milyen aprólékos, figyelmes munkát kellett végezni a Kéziszótár átdolgozásakor. Az új értelmezések gondosan elkerülik az erkölcsi – politikai értékítéleteket, semlegesek és tárgyszerűek.
Összegzés A számítógépes szótárak megjelenése idején a szótárak készítői és kiadó sokat aggódtak és vitatkoztak azon, vajon nem szorítják-e ki a számítógépes szótárak a nyomtatottakat. A nemzetközi tendenciák azt mutatják, a két kiadási forma hosszú távon jól megfér egymással: ugyanazok a felhasználók is különböző szituációkban hol egyik, hol másik változatot használják szívesebben. Ezért igazán örvendetes, hogy nálunk is terjedőben van a nyomtatott és számítógépes változat együttes kiadása – esetenként terjesztése. Reméljük, hogy a néhány magyar számítógépes szótárkiadásra szakosodott cég előbb-utóbb összefog, és olyan lekérdező felületet kínál, amely a különböző szoftverek legjobb tulajdonságait egyesíti: lemmatizált keresést és az adatbázis szerkezeti elemeiben való minél sokoldalúbb keresést. Ideális esetben természetesen jó volna egy olyan egynyelvű szótári adatbázisban keresni, amely valóban képes a „hasonló” szavak megtalálására, ehhez azonban magát az adatbázist kellene szakszerűen valamilyen egységes szemantikai leírással bővíteni.
Felhasznált irodalom ÉKsz1.: (Szerk: Juhász J. & al.) Budapest
Magyar értelmező kéziszótár 1972, Akadémiai Kiadó,
ÉKsz2.: (Föszerkesztő: Pusztai Ferenc) Magyar értelmező kéziszótár 2003, Akadémiai Kiadó, Budapest CD: Akadémiai Kiadó 2003. ÉrtSz.: (Szerk: Bárczi – Országh & al.) A magyar nyelv értelmező szótára 1959–1962, Akadémiai Kiadó, Budapest CD: Arcanum 2004. Mártonfy Attila 2005 Attempts and examples for the discovery of hidden information of the Concise explanatory dictionary of Hungarian (2nd edition, 2003) in: Kiefer F. Kiss G. Pajzs J. (szerk) Papers in Computational Lexicography COMPLEX 2005, MTA Nyelvtudományi Intézet, Budapest, 153–161.