Joachim László (2014): Bevezetés. In: Joachim, László – Muhyadin Hussein Tukale (2014): Hungariyan–Soomaali qaamuus. Magyar–szomáli szótár szomáloknak, fogalomköri mutatóval. (Nyomtatott szótár.) Budapest: RMK - Menekültmisszió. 9-40. ISBN 978-963-88659-3-9 http://qaamuus.rmk.hu/hatter/
9
Macalinka, luqadiistaha/luqad-yaqaan Bevezetés 1. A SZÓTÁR KONCEPCIÓJA
1.1. A szótár létrehozásának ötlete Magyar és szomáli nyelvpár között készült szótár korábban nem létezett. A közelmúltban merült fel az igény arra, hogy a magyar nyelvet tanuló (és különösen a nyelvi tanulmányaiknak az elején járó) szomáli anyanyelvűek kifejezetten számukra készült tanulói szótárat használhassanak a tanuláshoz és a mindennapi életben történő alapszintű eligazodáshoz. A Menekültmisszióban diákjaink többségének tudtunk legalább az ekvivalenseket tartalmazó szótárat ajánlani (bár ezek sem feleltek meg teljesen a célnak, hiszen magyar anyanyelvűek számára készültek), a szomálok esetében azonban semmilyen szótár nem jöhetett szóba (legfeljebb az angolul tudók használhattak angol és magyar nyelvpárban készült szótárakat). Így egyik diákommal, Muhyadin Hussein Tukaléval elkezdtünk beszélgetni egy ilyen célú szótár létrehozásának lehetőségéről. (Ezt eleinte mi sem gondoltunk teljesen komolyan, de aztán mégis egyre inkább a tervezés, majd a megvalósítás irányába kezdett haladni az ötlet, mivel úgy láttuk, hogy ha mi nem készítjük el a szótárat, akkor egész egyszerűen nem lesz ilyen segítség a magyarul tanuló szomálok számára.) A szótár így tehát tanárdiák együttműködés keretében, a Református Missziói Központ Menekültmissziójában, az Iskolai Integrációs Program 2013-2015 című projekt részeként készült el. A koncepció kidolgozása, a címszavak kiválasztása, a rájuk vonatkozó információk megadása és a fogalomköri mutató az ötletgazda Joachim Lászlónak (az Iskolai Integrációs Program magyar mint idegen nyelv tanárának) a munkája. A magyar szavak szomáli nyelvű jelentéseinek, ekvivalenseinek megadását és a példák, a magyar szavakra vonatkozó háttérinformációk, valamint a fogalomkörök fordítását Muhyadin Hussein Tukale (az Iskolai Integrációs Program diákja) végezte. A munkát természetesen rendszeres konzultáció és egyeztetés kísérte.
10 Minthogy nem volt tudomásunk olyan emberről, aki magyar és szomáli nyelven egyaránt beszél, továbbá vagy már ért a szótárszerkesztéshez, vagy pedig hajlandó lenne beletanulni legalább annak alapjaiba, csak a magyar–szomáli szótárat készítettük el, a szomáli–magyar irány elkészítése nem tűnt vállalhatónak. A kétnyelvű fogalomköri mutatót (ld. a 2.3. részt) eredetileg az alapvetően hiányzó irány legalább részleges visszapótlásához szántuk. A magyar–szomáli irányban készített tanulói szótár ugyanakkor nem csak a megértést segíti: a szócikkekben számos olyan információ található, amely az adott magyar szavak aktív, mondatban történő használatát támogatja. 1.2. A szótárkészítési munkálatok íve A szótár tervezése tanulói szótárak mintáinak gyűjtésével, vizsgálatával, valamint a vonatkozó és elérhető lexikográfiai szakirodalom feldolgozásával kezdődött. Ezt a koncepció kialakítása, valamint annak a később a projektben szakmai tanácsadóként szerepet vállaló dr. Fóris Ágotával történő egyeztetése követte. Ezután következett a címszóválogatás, valamint az egyes információk összegyűjtése és megadása. A folyamat 2013 november elejére jutott el a gépesítéssel addig, hogy az online szótár (eleinte tesztváltozata) elkészüljön (Joachim–Tukale 2013). A gépesítést a nyelvtechnológiára szakosodott MorphoLogic Kft. végezte.1 A cég a szótár speciális jellege miatt nem egy meglévő termékét kínálta, hanem kimondottan erre a célra fejlesztett egy újat. A szótár a http://qaamuus.rmk.hu/ oldalon, a Református Missziói Központ (RMK) honlapján érhető el, a szomáli qaamuus szó jelentése 'szótár'. Az online verzió általánosságban véve azon szomálok számára praktikus, akik már nem menekülttáborban laknak, tanulnak magyarul, és az órákon kívül is foglalkoznak a magyar nyelvvel. (A menekülttáborokban korlátozott a számítógép-használat, aki pedig internetkávézót keres fel, az olyankor érthető módon inkább a 1
Ezúton mondok köszönetet Endrédy Istvánnak és dr. Prószéky Gábornak.
11 családjával és barátaival tartja a kapcsolatot, mint hogy magyar–szomáli szótárat használjon.) A nyomtatott változat (Joachim–Tukale 2014) így hiába tud jellegénél fogva kevesebbet az online szótárnál (ld. a 3.4. részt), szintén rendkívül fontos a magyarul tanuló szomálok eléréséhez, mivel számítógéptől, okostelefontól2 és internettől függetlenül bárhol, bármikor használható. A nyomtatott szótár adatok szempontjából lényegében az online változat egy pillanatfelvétele3 (azzal a fő különbséggel, hogy a nyomtatott szótárban nem szerepelnek angol nyelvű ekvivalensek, valamint képek). A nyomtatott verzió megjelenésének dátuma 2014 júniusa. Már az egyes munkafázisok tervezésekor is remélhető volt, hogy az online szótárban lévő hibák jellemzően kiderülnek a tesztelés során, és így kijavíthatjuk őket, azóta azonban a két szótár pozitív egymásra hatásának másik iránya is láthatóvá vált: a nyomtatott szótár előkészítése jó lehetőség volt az ellenőrzésre és a korrekcióra (az online szótár számára is, ha oda is átvezetjük a javításokat), sőt akár a tartalmi fejlesztésre is. Az első magyar és szomáli nyelvpárban készített szótár4 létrehozását – az Iskolai Integrációs Program többi eleméhez hasonlóan 㻌 A szomálok egy része rendelkezik ilyen eszközzel (bár nem biztos, hogy már a menekülttáborban való tartózkodásakor is), anyagi korlátok miatt okostelefonos alkalmazás azonban nem készült a szótárból (a fejlődésnek ez lehetséges iránya, ld. Endrédy 2014: 43). A honlap természetesen okostelefonról is használható.㻌 3 Technológiai szempontból: az online adatbázisból a MorphoLogic Kft. közreműködésével, részlegesen automatizált megoldásokkal készült egy Word dokumentum, ezt kellett azután még átnézni és korrigálni. 4 Hogy a digitális világban a szótár fogalma mennyire megváltozott (vö. Fóris 2012: 33), jól mutatja, hogy két olyan honlap is létezik, amely magát többek között magyar–szomáli szótárnak is hívja. Az egyik a magyar–szomáli nyelvpárban minimális méretű Wikiszótár: 2014. június 17-én mindössze 94 olyan magyar szó szerepel benne, amelynek – sok más egyéb nyelv mellett – szomáli nyelven is megadták ekvivalensét. A másik pedig a Glosbe.com, amely több honlapról szedi össze az adatait, és más nyelvpárok alapján közvetetten teszi össze a magyar és a szomáli megfelelőket (2014. június 17-én 887 szó), ami persze fokozottan hordozza magában a jelentések torzulásának veszélyét. A http://hu.glosbe.com/ hu/so/ oldalon korrekt módon szerepeltetik is, hogy „a Glosbe nem szavakat tárol, hanem inkább csak az ötletet, hogy a szó mit jelenthet”. Vagyis e két honlap egyike sem kimondottan magyar–szomáli szótárnak készült. 㻞
12 – az Európai Menekültügyi Alap támogatta. Ez tette lehetővé azt, hogy a Menekültmisszió tudjon fizetni a külsős közreműködőknek is, elsősorban Tukalénak és az online szótár gépesítését végző, valamint az online adatbázist a nyomtatott szótár számára előkészítő és a nyomdakész forma elérésében is szerepet vállaló MorphoLogicnak, illetve a Vareg nyomdának. Az elkészült szótár így a professzionális közreműködők munkája ellenére is bárki számára ingyenesen hozzáférhető. Ez a migráns használók nyelvtanulásának és így integrációjának segítése miatt az egész társadalom érdeke.
2. A SZÓTÁR TARTALMA 2.1. A címszóállomány: a címszóválogatás elvei, szempontjai A terjedelem, a megcélzott nyelvi szint és a várható fordítói kapacitás ismeretében természetes módon adódott, hogy szavak kiválogatásában az alapszint angol nyelvre elkészült leírása (Waystage) jelentse a kiindulópontot. Az itt található szókincset a magyar Küszöbszint szavaival és az annak angol változatáéval (Threshold) is összevetettem, így szűkítve a Küszöbszintet az alapszint elvei szerint, illetve így igazodva a Küszöbszint által használt magyar ekvivalensekhez. (A Küszöbszintnek az angol Waystage alapján történő egyszerűsítése persze nem ugyanaz, mintha létezne egy magyar Alapszint, amit alapul vehettem volna – a szótárban eredetileg azért nem szerepelt például a szép szó, mert a beautiful nem fordult elő a Waystage-ben – ott hasonló témában a good-looking 'csinos, jóképű' van megadva. Ilyenkor az is kérdés, hogy egy-egy angol szó fordítása a magyar nyelvhasználattal is kellő mértékben összhangban van-e, például a gyakoriság vagy a kommunikatív érték szempontjából.) Az angol szintleírásokban szereplő nyitott kategóriák (van Ek–Trim 1998: 105) kitöltéséhez korábbi szótárakból, valamint nyelvkönyvekből vettem szavakat (Bíró–Kontra– Radnai T. 1989, Davies–Szabó 2009, Pelcz–Szita 2011, illetve Durst 2004, Erdős–Prileszky 2008). Ezt egészítettem ki a leggyakoribb szavak listáinak annyi szavával, amennyi (az adott listákhoz kapcsolódó adatok
13 alapján) már önmagában is, a más forrásokból származó szavak nélkül lefedi a személyes kommunikációban jellemző szavak, illetve szóelőfordulások több mint 50%-át.5 Ezen kívül felvettem a címszavak közé néhány, a Magyarországon élő szomálok számára hasznos téma (vallás, lakásbérlés stb.) bizonyos szavait is. Az online szótár tesztváltozata a fenti elvek alapján történő címszóválogatás után közel 1900 szócikkel indult el 2013 novemberében. A tesztidőszak alatt kisebb mértékben tovább bővítettük a szótárat (ez a felhasználók igényei alapján történt: a rendszer naplózza a keresőkérdéseket). A szótár a bővítést követően nagyjából 2000 szócikket tartalmaz. Kétnyelvű szótárak esetében a tanulók nyelvének szempontjait is érdemes érvényesíteni, hiszen az is segíti a nyelvtanulók kommunikációját, ha figyelembe vesszük egy-egy adott jelentésnek a forrásnyelven elfoglalt használati értékét is (Kardos 2009: 204). A magyar–szomáli szótár esetében ebben elsősorban a keresések naplózása segít, mivel a keresőkérdések jelentős része szomáli nyelvű. A magyarnyelv-tanulók számára készített szótárak címszóválogatásának elveit nincs most lehetőség bővebben kifejteni, a témáról bővebben a szakirodalom és a magyar–szomáli szótár szerkesztése során szerzett tapasztalatokat is tartalmazó, megjelenés alatt lévő cikkben lehet olvasni (Joachim 2013a). Ebben például már az a javaslat is szerepel, miszerint a hatékony munkához már a címszavak válogatása előtt érdemes egyfajta címszódefiníciót alkotni. A magyar–szomáli szótár készítésekor ilyen definíció hiányában menetközben kellett eldöntenem, hogy önálló címszavak legyenek-e, vagy pedig inkább a vonatkozó szócikkekben (netán mindkét helyen) kapjanak helyet például más szavak „becézett” alakjai (szülinap, centi stb.), egyes toldalékolt alakok (pl. a kéne), illetve a nyelvi szintleírásokban talált néhány kifejezés esetében is dilemma volt, hogy hová is érdemes rendezni őket (a nehézség helyenként a szótár kis méretéből, megfelelő kapcsolódó címszó hiányából is adódhatott). 5
Az arány eldöntése természetesen a teljes megcélzott (és az addig összegyűjtött) címszómennyiséggel összehangoltan történt. A válogatás gyakoriság alapján történő részéhez a Magyar Nemzeti Szövegtár magyarországi személyes regiszterének a szótöveket, valamint a szóalakokat alapul vevő listáját használtam fel.
14 A kiválogatott szavak elrendezésével kapcsolatban (vagyis arról, hogy mi lett önálló címszó és mi nem) elmondható, hogy az azonos alakú, de eltérő szófajú és jelentésű szavak külön címszóként szerepelnek, és hasonlóan jártam el akkor is, amikor az egy adott szóalakhoz tartozó (akár azonos, akár eltérő szófajú) különböző jelentésekhez járuló további különbségek együttes mértéke ezt indokolta. Ilyen különbségek lehetnek például, ha mások a megadott egyéb alakok, a nyelvhasználati információk vagy a példák: ezért szerepel például az alatt időre és térre vonatkozó jelentése (valamint egyéb alakjai és példái) külön címszó alatt6. A fiatal főnévi és melléknévi jelentése pedig a különbségek csekély mértéke miatt került egyazon szócikkbe (az egyéb alakjaik a szófaji különbség miatt eltérnek, a szomáli ekvivalensek viszont azonosak). Mivel a vonzatos szavak esetében a vonzatok is a címszó részét képezik, a különböző jelentéssel együtt járó vonzatkerettel kapcsolatos eltérés önálló szócikket eredményezett (például lefekszik + -NI és lefekszik valakivel). A nyomtatott szótár a szavak végén felső indexben szereplő számokkal jelzi a címszavak alaki egybeesését. Az azonos formájú címszavak sorrendjének eldöntésekor nem feltétlenül gyakorisági elvet próbáltam követni, hanem gyakran inkább a konkrétabb jelentést vettem előre, az elvontat pedig hátra (például az alatt térbeli jelentése kapta az egyes, az időbeli pedig a kettes számot). A nyomtatott szótár további sajátossága, hogy benne utaló címszavak is szerepelnek (erről bővebben ld. a 4.4. részt).
6
Ezeknek a különbségeknek egy része az adatbázis megfelelő struktúrájával és megjelenítési módokkal (például római számok használatával és más tipográfiai megoldásokkal) egyetlen szócikken belül is kezelhető lenne. Ennek ellenére inkább megőriztük az adatok strukturálására eredetileg használt táblázat egyszerű szerkezetét. Ez nem kimondottan helytakarékos megoldás, viszont világos, könnyen áttekinthető szócikkeket eredményez (például nem jellemző, hogy egymás mellett szerepelnének ezekben a szócikkekben a különböző jelentésekhez tartozó példák). A szótár kis mérete is lehetővé tette ezt a megoldást: nem lett zavaróan sok szócikk az egy-egy alakhoz különböző módon kapcsolódó információkból.
15 2.2. Az egyes címszavakról megadott információk Tanulói szótárról lévén szó, az interneten található egyes szótárakkal szemben itt nem csupán ekvivalensek szerepelnek, az egyes szócikkekben megadott információk a kétnyelvű tanulói szótárak gyakorlatát követik: a címszó mellett szerepel a kiejtés, nyelvtani információk, a jelentés, nyelvhasználattal / kontextussal kapcsolatos információk. Mindezt egy hierarchikus szerkezetű fogalomköri mutató egészíti ki (vagyis a szótár gyakorlatilag tematikus szótárként is funkcionál). Előrebocsátandó, hogy sajnos nem jutott idő arra, hogy valamennyi szócikk valamennyi információjának összegyűjtését korpuszból kinyert adatok elemzése előzze meg – bár a céljainkhoz ideálisan illeszkedő korpusz hiányzik – így korpuszt csak a szavak egy részének esetében használtam, elsősorban a kérdéses esetekkel kapcsolatban. Ez a rész a szócikkek tartalmáról szól, formájukat, az online és a nyomtatott szótárban történő megjelenítésüket a 3.2. és a 4.2. részben mutatom be. 2.2.1. Kiejtés Az online szótár minden szó kiejtését tartalmazza, gépi felolvasással, a Profivox TTS beszédszintetizátor segítségével (Németh Géza vezetésével fejlesztették a BME TMIT Beszédtechnológiai Laboratóriumában). Az eredmény egy kicsit gépies hangú, de megbízható kiejtés (anyagi korlátaink az okai annak, hogy nem egy modernebb felolvasó szoftver lett része a szótárnak). Ugyanakkor a szomáli és a magyar nyelv hangrendszere közötti határozott eltérések miatt nagyon fontos, hogy minden szó kiejtése meghallgatható. A gépi felolvasás mellett az átírt kiejtés is szerepel azoknál a szavaknál, ahol az eltér a címszó írásmódjától, vagy ahol nem egyértelmű, hogy megegyezik azzal. Az információk forrásául kiejtési szótárak szolgáltak (Fekete 1992, Olaszy–Siptár 2010, szerk., illetve Forvo.com). Néhány példa: egyik [eggyik] (de mindegyik [mindegyik]), méh [mé] (az egyéb alakoknál viszont például méhe [méhe]), milliméter [miliméter], nylon
16 [nejlon], stb. [satöbbi], tetszik [teccik], fiatal [fijatal] (de kiadó [kiadó]) stb. Az átíráshoz a magyar ábécé betűit használtam, az angol nyelv tanításában elterjedt nemzetközi fonetikai ábécé (IPA) nem lett volna felhasználóbarát megoldás. 2.2.2. Nyelvtani információk (szófaj, morfológia, szintaktika) A szófaji besorolások leginkább Hegedűs Rita (2005) egy leegyszerűsített rendszerét követik. A megadott szófaji kategóriák: ige, segédige, főnév, melléknév, számnév, névmás, határozószó, kötőszó, névutó, valamint az egyéb kategória. Ez utóbbi legfőképpen az igeneveket és a pragmatikai funkciójú viszonyszókat jelenti: névelő, partikula, felelőszó, mondathatározó, indulatszó, utalószó. Az egyes szavak szófajának megadása ugyanakkor nem volt minden esetben egyformán egyértelmű, hiszen bizonyos szavakat a különféle rendszerek vagy szótárak eltérően adnak meg, ráadásul egyes szófajok között mozgás is elképzelhető. Hegedűs Rita rendszere mellett kérdés esetén az ÉKSz2. szófaji megadását is igyekeztem figyelembe venni, néha pedig a vélhetően a nyelvtanulók számára legegyszerűbbnek tűnő megoldás mellett döntöttem (például a főnévi igenevet vonzó igék szófajaként jellemzően a segédigét adtam meg). A szavak helyes használatához bizonyos egyéb alakok ismeretére is szükség van. Mivel a magyar nyelv morfológiája meglehetősen komplex, a nyelvkönyvek pedig a szabályostól eltérő, nehezen létrehozható alakok esetében csak néhány jellemző példa közlésére tudnak szorítkozni, az egyéb morfológiai alakok megadása fontos feladata a tanulói szótáraknak. Az alábbi táblázat szemléleti, hogy a magyar–szomáli szótárban a különböző szófajú szavak esetében milyen formákat adtam meg: szófaj
példák
ige, segédige el|fogy: elfogyni, - / elfogyott VALAMIT/VALAHOGYAN érez: érezni, éreztem / érzett • érzek (én), érzel (te), érez (Ön, ő), érzünk (mi), éreztek (ti), éreznek (Önök, ők)
17 rá|ér VALAMIKOR (+ QAABKA "-NI") / rá|ér VALAMIKOR (VALAMIRE): ráérni, ráértem / ráért főnév
csekk: csekket, csekkek, csekkje külföld: külföldet, -, - • Hol? - külföldön száj: szájat, szájak • szám (én), szád (te), szája (Ön, ő), szánk (mi), szátok (ti), szájuk (Önök, ők) tavasz: tavaszt, tavaszok, tavasza • Mikor? - tavasszal
melléknév
egészséges: egészségesebb, egészségesen
számnév
három: harmadik, hármas sok: több, legtöbb
névmás
Melyik? melyiket? melyek? • melyikünk? (mi), melyikőtök? (ti), melyikőjük (Önök, ők) sehol: Honnan? - sehonnan, Hová? - sehová/sehova semmi: semmit, semmik, semmije
egészségesek,
határozószó hátra: hátrább/hátrébb, leghátra itt: Honnan? - innen, Hová? - ide közel (VALAMIHEZ): közelebb • Honnan? - közelről, Hová? - közel régen: régebben, legrégebben névutó
VALAKIN kívül: rajtam kívül (én), rajtad kívül (te), rajta kívül (ő), rajtunk kívül (mi), rajtatok kívül (ti), rajtuk kívül (ők), Önön kívül, Önökön kívül mellett: Honnan? - mellől, Hová? - mellé • mellettem (én), melletted (te), mellette (ő), mellettünk (mi), mellettetek (ti), mellettük (ők), Ön mellett, Önök mellett számára: számomra (én), számodra (te), számára (ő), számunkra (mi), számotokra (ti), számukra (ők), az Ön számára, az Önök számára
18 Mint látható, az egyes címszavakhoz tartozó formák igen széles köre szerepel a szócikkekben. Kiválasztásuk legfőbb szempontja az volt, hogy mi mennyire okoz nehézséget a nyelvtanulók számára, valamint hogy mire mennyire van szükségük – a nyelvi szinthez is próbálva igazodni, bár annál általában több alakot adtam meg (remélve, hogy bár a használók egy része számára ez gyakran többletinformáció, más része számára azonban hasznos lehet). Ezen kívül arra is törekedtem, hogy az alakok minél több tőváltozatot mutassanak be, vagy más megfogalmazásban: a megadott formák segítsék további alakok „levezetését” is. Például a határozott számnevek két megadott alakjából (harmadik, illetve hármas) el lehet jutni a dátum, a törtszámnév és a számállapot-határozó formáihoz is: harmadika, harmad, illetve hárman. Vagy ha a főnévi igenévi formánál a -ni előhangzóval kapcsolódik a tőhöz (-ani, -eni), akkor az adott igének a jelen idejű igeragozásában is megjelenik valamilyen (igaz, nem mindig azonos minőségű) előhangzó, például: tanítani → tanítasz, tanítotok, tanítanak, illetve egyetérteni → egyetértesz, egyetértetek, egyetértenek. Ugyanígy múlt idő esetében az egyes szám első és harmadik személyű formákból látható, hogy mikor lesz a múlt idő jele a -t, és mikor az -ott, az -ett vagy az -ött (netán a -tt). Az irányhármasságot nézve pedig a Hol? kérdésre felelő ragokból következtetni lehet a Honnan? és a Hová? kérdésre felelő végződésekre. (Az egyes szófajokkal kapcsolatban megadható, illetve megadandó alakok kérdése részletesebb kifejtést is megérdemelne.) Azon szavak esetében, amelyek különösen könnyen okozhatnak nehézséget, az általában megadott alakoknál is több forma szerepel, igéknél például néha teljes jelen idejű, általános/határozatlan ragozású paradigma. Más esetben pedig bizonyos kategóriák ki vannak húzva a hiányos paradigmájú szavaknál (például a nem fokozható melléknevek, csak egyes számban használt főnevek, plurale tantumok). A nyelvhasználati információk kategóriájában is szerepelnek morfológiát is érintő tudnivalók (pl. a hiányos paradigmára utalás a csak harmadik személyben használható sikerül esetében). Magyar kérdőszók is megjelennek (pl. a Hol? és a Mikor? – ezt nem lehetett volna mind
19 szomáliul megadni, mivel az irányhármasság kérdőszói akkor nem különülnének el egymástól). A morfológiai információk megadásának szempontjából sajátos esetet jelentenek a kettős szófajú szavak: például az este főnév és határozószó is (a megadott formák: estét, esték, estéje • Mikor? - este), de ugyanígy a fiatal is kettős szófajú (ebben az esetben a következő alakokat tüntettem fel: ha főnév: fiatalt, fiatalok, fiatalja; ha melléknév: fiatalabb, fiatalok, fiatalon – ugyanazon szócikkben szerepeltetve az összes formát, a szófaji feltételt természetesen szomáli nyelven megadva). Ingadozó alakok is okoztak dilemmát: esetükben a Magyar Nemzeti Szövegtár vagy a Google kereső adatai alapján döntöttem egyik, másik vagy mindkét alak feltüntetésével kapcsolatban (vö. gyümölcslé: gyümölcslevet/gyümölcslét, gyümölcslevek, gyümölcsleve). A szintaktikai információk a szavak mondatba helyezéséhez szükségesek, az aktív nyelvhasználatot teszik lehetővé. Ide tartoznak például a vonzatok: megadásukkor praktikus jelezni a kötelező vagy fakultatív jellegüket (ennek eldöntése ugyanakkor nem minden esetben egyszerű feladat), pl. valamennyi idővel ezelőtt, illetve megoldás (valamire), illetve a tipikus szórendjüket (bár ez változhat, így nem minden esetben egyértelmű, Joachim 2013a: 59), például valamiről szól, szeret valakit/valamit. Igyekeztem azt is jelezni, hogy mely szavak esetében van lehetőség a vonzat jelentéstartalmát hogy-os mellékmondattal is kifejezni, például (azt) kérdezi, hogy... Sajnos nem jutott kapacitás arra, hogy minden ilyen esetben teljes példamondatot adjunk meg, így gyakorlatilag a vonzatstruktúrához tartozó információ szerepel ilyenkor a példák helyén. Bizonyos esetekben az is kérdés volt, hogy egy-egy információt vonzatként, kollokációként (irányítószóként) és/vagy példában érdemes-e megadni, illetve ezzel összefüggésben az, hogy a megadott vonzat mennyire legyen konkrét. Például átkel (az úton), bérel valamit (a szobát, a lakást és a sportpályát lehetséges kollokációkként szerepelnek), bevált valamit (a csekket irányítószóként és példamondatban is meg van adva). Az igekötők és az igék határát is fontos jelölni – ez sem mindig egyértelmű egy kezdő nyelvtanuló számára, pl. alá|ír, egyet|ért. Az online szótárban az igék és igekötők határát tudatosan nem a kiemelt címszóban, hanem attól külön jelöltük
20 (a vonzattal együtt feltüntetett „teljes” címszóban), nehogy valaki esetleg az írásmód részének vélhesse az elválasztójelet. A nyomtatott szótárban helytakarékossági okokból csak egyszer szerepeltetjük a címszavakat, és akkor jelöljük az igekötők és az igék határát. A nyelvtani információk lexikográfiai célú összegyűjtésének, kiválasztásának és szótári megadásának általánosabb kérdéseiről, dilemmáiról bővebben egy önálló, éppen e szótár szerkesztésének kapcsán készült cikkben lehet olvasni (Joachim 2013a). 2.2.3. A jelentés megadása Az egyes magyar címszavakhoz alapvetően szomáli nyelven megadott jelentések tartoznak. A címszavak poliszém jelentései számozottak. Az egyes magyar címszavakhoz tartozó jelentések feldolgozásakor idő hiányában sajnos nem tudtam korpuszon alapuló részletes elemzést végezni, és erre támaszkodni. Elsősorban az egyes nyelvi szintek leírásaiban szereplő jelentéseket vettem így alapul (Aradi–Erdős–Sturcz 2000, van Ek–Trim 1998, van Ek–Trim 2007), a más forrás alapján válogatott szavak esetében pedig kétnyelvű szótárak jelentésmegadásait is felhasználtam (elsősorban Mozsárné Magay–P. Márkus 2006). Újabb jelentéseket esetenként Tukale is hozzáadott az adatbázishoz az ekvivalensek megadása közben. A fordítás során a legfontosabb szempontok az érthetőség, példák esetében a magyar szavakkal való megfeleltethetőség (a szórend lehetőleg segítsen láttatni, hogy melyik magyar szó mit jelent a példában), valamint a természetes hangzás, vagyis a „szomáliasság” voltak. A nyelvi és/vagy kulturális különbségek miatt nehezen fordítható szó volt például a zsemle, a különféle sertéshúsok, a szakközépiskola, az által, a határozott névelők (a, az) vagy például a közlekedés szomáli nyelvből kulturális okokból hiányzó szavai (villamos, aluljáró). Az ilyen esetek többségében Tukale körülírást, nyelvi magyarázatot alkalmazott. A fordításban az internet szomáli nyelvhasználata, egy angol–szomáli szótár, valamint
21 Tukale barátai segítettek, akik időnként afféle informális nyelvi lektorként működtek közre7. Az online szócikkek egy részében angol nyelvű jelentés is szerepel. Ezek leggyakrabban eredetileg a szerkesztést, pontosabban az azonos formákhoz tartozó egyes jelentések elkülönítését segítő információként kerültek az adatbázisba. (Ez annál is kézenfekvőbb megoldásnak tűnt, hiszen sok szó forrása az angol Waystage volt.) Végül aztán a magyar szavak megértésének plusz lehetőségeként szándékosan nem kerültek ki mégsem a rendszerből a gépesítés során. Az online szótár ennek ellenére nem háromnyelvű, az angol ekvivalensek csupán többletinformációul szolgálnak, és a szócikkeknek csupán egy részében szerepelnek. A nyomtatott szótár ezzel szemben szigorúan kétnyelvű, nem tartalmaz angol jelentéseket. Fontos információt hordoznak az online szótárban a képek. Azokban a szócikkekben szerepelnek, ahol több magyar szó esetében is azonos szomáli ekvivalens szerepel (pl. a vonat és a villamos is ’tareen’), valamint ahol – elsősorban kulturális különbségek miatt – a szomáli jelentésmegadás eleve körülírást használ (ugyanakkor képileg jól megjeleníthető denotátumról van szó). Idő, illetve megfelelő anyagi források hiányában sajnos nem tudtuk megfelelően kiaknázni a képi szemléltetés nyújtotta lehetőségeket, nem jutott időnk és energiánk megfelelő jogtiszta fotók gyűjtésére vagy készítésére, illetve fotós vagy illusztrátor megbízására. Így csupán néhány online szócikkben vannak képek (pl. kolbász, trolibusz).
7
A fordítással kapcsolatos kérdések, nehézségek forrása szerzőtársam, Muhyadin Hussein Tukale. Szempontjai a Fordítók és Tolmácsok Őszi Konferenciáján (2013. szeptember 27-én) hangzottak el, mivel ott az akkor tesztelésre már csaknem kész online szótár szerzőivel készült beszélgetést játszottak be (kisfilm formájában), a különleges nyelvek fordítási kérdéseiről szóló fórumbeszélgetés vitaindítójaként. Az interjú elkészítéséért ezúton is köszönet illeti dr. Simon Évát, a Magyarországi Fordítóirodák Egyesületének elnökét.
22 2.2.4. Nyelvhasználat/kontextus A nyelvhasználat kategóriájába8 soroltam a következőket: stílus / nyelvhasználat (szomáli nyelven megadva) / irányítószavak (a címszóval gyakran együtt használt irányítószavak magyarul is meg vannak adva, például kiad valamit – LAKÁST qol, SZOBÁT guri), illetve ezzel a kategóriával együtt tárgyalom most a (magában az adatbázisban egyébként külön szereplő) példamondatok és/vagy kifejezések szempontjait is. A stílus a megértést is segíti, az információk többi típusa elsősorban inkább az aktív nyelvhasználatot támogatja. A magyar és szomáli nyelven megadott példák a címszavakhoz tartoznak, azok több jelentésének megadása esetén sincsenek aszerint elkülönítve, hogy az adott szó melyik jelentésben szerepel bennük, hanem minden példa a szócikkek végén található. Volt olyan eset, ahol információk több szócikkbe rendezéséhez ez is hozzájárult, például a pedig esetében az eltérő, a szórenddel is összefüggő jelentéseket illusztráló példamondatok ugyanazon szócikkben megadása félreértéshez vezethetett volna, egyértelműbb megoldás volt külön címszóként szerepeltetni az eltérő jelentéseket. A példák között tüntettem fel azt is, ha az adott vonzat hogy-os mellékmondattal is helyettesíthető (amennyiben a közölni kívánt információ annyira összetett, hogy egyetlen mondatrésszel már nem fejezhető ki, vö. Hegedűs 2005: 245). Alighanem a példákkal kapcsolatban érhetőek leginkább tetten korlátaink: szerencsésebb lett volna több példamondatot megadni és lefordítani, azonban a rendelkezésre álló idő alatt ez már nem volt megvalósítható. A példamondatok forrása egyrészt a címszóválogatásnál is már említett Waystage, illetve a Küszöbszint, emellett pedig saját példákat is feltüntettem (autentikus, korpuszból vett példák az alacsony nyelvi szint miatt jellemzően nem tűntek kimondottan jól használhatónak). 8
Az adatbázis kategóriáinak kialakításakor ezzel kapcsolatban kérdés volt, hogy több, „tisztább” kategóriával érdemesebb-e dolgozni (külön kezelni például a stílust, a kollokációkat, a pragmatikai szituációra vonatkozó megjegyzéseket), vagy inkább tágabb, vegyesebb kategória megadása szerencsésebb. Minthogy mindezek az információk a nyelvhasználathoz tartoznak, az egyszerűbben kezelhető általánosabb kategória használata mellett döntöttem.
23 2.2.5. A fogalomköri besorolás Az egyes szócikkek fogalomkörökbe is vannak sorolva, ez a fogalomköri mutatóban9 nyeri el jelentőségét.
2.3. A fogalomköri rendszer A fogalomköri mutató alapvetően a címszavaknak egy hierarchikus szerkezetű csoportosítása, rendezési elve, a fogalomkörök mindkét nyelven való szerepeltetése miatt azonban a nyomtatott szótárban a szomáli irányból történő keresést is segítheti (ha nem is a szócikkek, de legalább a témák szintjén) – éppen ez volt létrejöttének eredeti célja. Emellett természetesen a nyelvtanulást támogató funkciója, hogy a szavakat témák szerinti rendszerezésben jeleníti meg. A címszavak minden jelentésükkel szerepelnek az egyes fogalomkörökben (pl. a nyelv a testrészek között és a nyelv általában fogalomkörben is szerepel, és mindkét helyen meg van adva mind a két jelentés), éppen úgy, ahogy a szócikkben is megjelennek a fogalomköri besorolások (és a teljes szócikkhez, vagyis minden megadott jelentéshez kapcsolódnak). Arról, hogy hogyan valósul meg a fogalomköri mutató a gyakorlatban, a 3.3. és a 4.3. részben lesz szó. A fogalomköri mutató alapvetően saját rendszer, kialakításában elsősorban a már korábban említett nyelvi szintek (A2, B1) leírásainak kategóriái, kisebb mértékben pedig az Értelmező szótár+ fogalomköri csoportjai nyújtottak segítséget.
2.4. A szótár egyéb tartalmai Az alapvető struktúra kettős (szótári és fogalomköri) rendszere és az egyéb további tartalmak természetesen együtt jelentik a teljes szótárat, így most ez utóbbiakat veszem sorra. 9
A fogalomköri mutató dr. Fóris Ágota javaslata volt.
24 Kétségkívül ide tartozik a használhatóságot segítő súgó (szomáli nyelvű, címe: Caawimaad), illetve a nyomtatott szótárban a mintaszócikkek (ld. a 3.4. és a 4.4. részt). Az impresszum mindkét nyelven szerepel, ahogyan a nyomtatott szótárban az előszó is, a szótár hátteréről, elkészítéséről szóló információk pedig csak magyarul. Ez utóbbi nem is a szótárat használó szomáloknak, hanem az őket tanító tanároknak, illetve a magyar tanulói szótárak iránt érdeklődő nyelvészeknek, lexikográfusoknak szól. Mivel az online szótárban a felület nyelvét a felhasználó választja, így mindig csak az adott nyelvű tartalmak jelennek meg (a súgó csak a szomáli, a szótár hátterének bemutatása pedig csak a magyar felületen látható). A nyomtatott szótárban erre természetesen nem volt lehetőség, így a különféle nyelvű tartalmak itt egyszerűen egymás után következnek. A szótárban ezen kívül egy Beszélj bátran! című rész is helyet kapott (szomáli címe Tijaabi!, amely a „próbálkozás” fontosságát emeli ki). Itt egy rövid lista található olyan mondatokból, amelyek segíthetnek egy nyelvi korlátok miatt megakadó/akadozó beszélgetés során. Az összeállítás az informális szókincsbővítés fontosságára igyekszik felhívni a szótárat használók figyelmét (illetve a nyelvtanulók saját felelősségére a nyelvtanulás során), és ehhez kínál eszközöket. A mondatok kiválasztásához a Küszöbszint, valamint az alapszint angol nyelvű leírásának kompenzációs stratégiákról szóló részét használtam (Aradi–Erdős–Sturcz 2000, van Ek, J. A.–J. L. M. Trim 2007). A mondatok után, továbbra is a kompenzációs stratégiákhoz kapcsolódva (a magyar szavak és nevek mellett a szomáli nevek betűzését is segítendő) a q-t, w-t, x-et és y-t is tartalmazó teljes magyar ábécé következik, a betűzéskor használatos kiejtést is mindenhol megadva. Ezt a részt a nyomtatott szótárban néhány üres jegyzetoldal követi (Ereyada cusub / Új szavak címmel), ezzel is próbálva arra inspirálni a szótárhasználókat, hogy gyűjtsenek és tanuljanak új szavakat.
25
3. AZ ONLINE SZÓTÁR SZERKEZETE 3.1. A nyitóoldal
A nyitóoldal alapértelmezetten szomáli nyelven töltődik be, ugyanakkor a felhasználó magyarra is válthat, ha a jobb felső sarokban a magyar zászló ikonjára kattint (és ugyanígy vissza, a szomáli ikonra való kattintással). A böngészők megjegyzik a legutóbbi választást, és aszerint töltődnek be legközelebb. A kurzor azonnal megjelenik a keresőmezőben, vagyis gépeléssel már el is kezdhető a keresés (anélkül, hogy bárhová kellene kattintani). Az oldal tetején, bal oldalt található a menürendszer: itt lehet a szótárról a fogalomköri mutatóra váltani, valamint innen érhetőek el a szótár egyéb tartalmai is. A jobb oldalon a zászlóikonok mellett egy levél-ikon is található: erre kattintva egy visszajelző üzenetet küldhetnek a felhasználók. Az oldal alján az úgymond kötelező elemek szerepelnek: a projektet támogató Európai Menekültügyi Alap által elvárt láthatósági elemek, a főbb közreműködők és a szótár könyvészeti adatai. A képernyőkép azt is jól illusztrálja, hogy míg a tartalomra és a funkciókra nagy figyelmet fordítottunk, addig az online szótár dizájnjára sajnos sem kellő figyelem, sem anyagi forrás nem jutott. A meglehetősen egyszerű kinézet azonban, bár a szemet nem feltétlenül gyönyörködteti, remélhetőleg annál jobban szolgálja az átláthatóságot, a könnyen kezelhetőséget.
26 3.2. A szócikkek szerkezete címszó
szófaj
a címszó, szintaktikai információkkal kiejtés
egyéb alakok jelentés
nyelvhasználati információk
példa
fogalomköri besorolás
Példaszócikk (a sikerül szócikk) az online szótárból (a szomáli felületről) A szócikkek szerkezete minél világosabb: az eltérő típusú információk külön sorban szerepelnek, a különböző nyelvű ekvivalenseket kis zászlócskák vezetik be, akiejtés példákatszófaj egy + szimbólum a címszó információkkal) jelöli. Az is a(szintaktikai minél könnyebb használhatóságot célozza, hogy a egyéb alakok szócikkekben nem szerepelnek rövidítések, hanem minden ki van írva. siet (VALAHOVÁ) / siet (+ QAABKA „-NI”) [sijet]
⟨sietni, siettem / A szócikkek a szótár) metanyelve természetesen alapvetően sietett⟩(és dhakhso (dhakhsasho) ❖ Ne haragudj, de most sietek. Ha cadhoon, imika waan dagdagayaa. ) 119szerint magyar vagy a szomáli. (Azigaonline felület a felhasználó választása VALAKINEK „-NI”)magyarul ⟨sikerülni, -/ szomáli, a sikerül honlap(VALAMI magyar oldalán) /asikerül szótár(+a QAABKA szófajokat mutatja sikerült⟩ iyaka, iyaga guul, ku guulaysasho ❖ Képzeld, sikerült – kiszótárazza saját magából, de a szomáli felületen ez az információ isa vizsgám! Kasoo qad (sawiro), waxan ku guulaystay imtaxaanki! ) szomáli nyelven jelenik meg.) 27, 80 sincs <magac u-yaal> 1. ma jiro, ma yaal; 2. maya ) 41 példa nyelvhasználati információk jelentés a fogalomkörök kódja 3.3. A szócikkek és a fogalomköri mutató viszonya
A szócikkek és a fogalomköri mutató össze vannak kapcsolva: az egyes szócikkekben alapértelmezetten a fogalomköri rendszernek csak a legalacsonyabb szintje jelenik meg, a felhasználók azonban opcionálisan elő tudják hozni a felette lévő szintet is, illetve a fogalomköri rendszer külön is használható (a kategóriák és az alkategóriák ilyenkor hierarchikusan, tartalomjegyzékszerűen is
27 láthatók és kezelhetők). A címszavak így tehát nemcsak a keresőmezőn keresztül találhatók meg, hanem témák szerint is listázhatók (a címszavak és az ekvivalensek listájában a címszavakra kattintva pedig a vonatkozó szócikkekhez jutnak el a felhasználók) – ez a tematikus, illetve szomáli nyelvű keresés mellett a nyelvtanulást is segítő elem.
Példa az online fogalomköri mutatóból (a magyar nyelvű felületről)
28 28 3.4. Kereshetőség a szótárban és a szótár használhatóságát segítő további elemek 3.4. Kereshetőség a szótárban és a szótár használhatóságát segítő Azelemek online szótároldalon szereplő „súgó” elsősorban egy további mintaszócikkeket egy képernyővideót az előbbiek Az online és szótároldalon szereplőtartalmaz: „súgó” míg elsősorban egy feltüntetik, hogy azésegyes szócikkekben milyen típusúmíg információk hol mintaszócikkeket egy képernyővideót tartalmaz: az előbbiek szerepelnek,hogy és az bizonyos nyelvtani milyen információkra is utalnak feltüntetik, egyes szócikkekben típusú információk hol (részletekért ld.ésa 4.4. részt), addig az utóbbiinformációkra a szócikkek és fogalomköri szerepelnek, bizonyos nyelvtani is utalnak mutató közötti mutatja be röviden. Ugyanez az oldal (részletekért ld. anavigálást 4.4. részt), addig az utóbbi a szócikkek és fogalomköri igyekszik közötti felhívni navigálást a figyelmet mutatja a gépesítés funkciójára, mutató be néhány röviden.lényeges Ugyanez az oldal mint például a gépelés közbeni automatikus vagy a igyekszik felhívni a figyelmet a gépesítés néhány kiegészítésre lényeges funkciójára, visszajelzés küldésének lehetőségére. mint például a gépelés közbeni automatikus kiegészítésre vagy a Egy elektronikus egy nyomtatott szótár keresési hatékonysága visszajelzés küldésénekés lehetőségére. nem összevethető egymással, és a magyar–szomáli online szótár Egy elektronikus és egy nyomtatott szótár keresési hatékonysága esetében ez talán különösen Az elektronikus szótárban nem összevethető egymással, isésígya van. magyar–szomáli online szótár magyar, szomáli, angol nyelven lehetAzkeresni (angol ekvivalens esetében ez talánsőtkülönösen is ígyisvan. elektronikus szótárban ugyanakkor nem minden Egyetlen magyar, szomáli, sőt angolszócikkben nyelven isszerepel). lehet keresni (angolkeresőmező ekvivalens van, ha ebbenem írunk egy szót, azt alapértelmezetten minden nyelven ugyanakkor minden szócikkben szerepel). Egyetlen keresőmező keresiha (deebbe beállítható szűkebb is). Ha magyar vagy angol szavakat van, írunk egy szót,fókusz azt alapértelmezetten minden nyelven keresnek felhasználók, akkorfókusz a toldalékolt alakokra keresés is kiadja keresi (deabeállítható szűkebb is). Ha magyar vagy angol szavakat akeresnek címszót10 ami kezdő nyelvtanulók esetébenalakokra rendkívül fontos,is hiszen a ,felhasználók, akkor a toldalékolt keresés kiadja 10 nélkül nem találnák meg, hogyrendkívül például fontos, az ivotthiszen alak ae címszót , amifeltétlenül kezdő nyelvtanulók esetében 11 jelentését az iszik szócikkben kell keresni. A keresőmezőbe történő e nélkül nem feltétlenül találnák meg, hogy például az ivott alak 11 gépelés közben a szótár felkínálja az adott betűvel/betűsorral kezdődő jelentését az iszik szócikkben kell keresni. A keresőmezőbe történő címszavakat (inkrementális bevitelaz/adott automatikus kiegészítés), sőt a gépelés közben a szótár felkínálja betűvel/betűsorral kezdődő keresett formához hasonló szavakat Ez utóbbi azért nagyon fontos, címszavakat (inkrementális bevitel /is.automatikus kiegészítés), sőt a mert nyelvtanulókról lévén szó, gyakori, hogy egy-egy szót keresett formához hasonló szavakat is. Ez utóbbi azért nagyon fontos,a szótárhasználók hibás írásmóddal be a keresőmezőbe. szótára mert nyelvtanulókról lévén szó,írnak gyakori, hogy egy-egy Aszót meg tud birkózni a magyar helyesírással legjellemzőbb szótárhasználók hibás írásmóddal írnak be kapcsolatos a keresőmezőbe. A szótár tévesztésekkel, például a kiejtés szerint tévesen írt alakokkal (fijatal, meg tud birkózni a magyar helyesírással kapcsolatos legjellemzőbb tévesztésekkel, például a kiejtés szerint tévesen írt alakokkal (fijatal, 10
A MorphoLogic saját, Humor nevű tövesítőjét építette a szótárba, ez végzi a és az angol szavak tövesítését. A MorphoLogic saját, Humor nevű tövesítőjét építette a szótárba, ez végzi a 11 Ez a legfőbb oka szavak annak,tövesítését. hogy az online szótárban nem szerepelnek utaló magyar és az angol 11 címszavak (illetve ezen kívül az is, hogy a rövidítések is teljes szócikkekben Ez a legfőbb oka annak, hogy az online szótárban nem szerepelnek utaló szerepelnek). címszavak (illetve ezen kívül az is, hogy a rövidítések is teljes szócikkekben szerepelnek). 10 magyar
29 fáratt stb.). A program ezen kívül ráadásul a magyarul tanuló szomálok tipikus tévesztéseit is kezelni tudja12, így sok esetben tévesen írt alak alapján is felkínálja a keresett szót!
Ezért van az, hogy például az oro betűsorra többek között az orosz és az arab szót is felajánlja (a fenti példában a felhasználó az utóbbit keresi), de hasonlóképpen az ozt betűsort a keresőmezőbe gépelve (a szótárban nem szerepel ilyen kezdetű szó) többek között az asztal forma is megjelenik a választási lehetőségek között (külön jelezve, hogy teljes vagy részletes egyezésről van szó). Hasonlóképpen az egymástól csupán egy hangban különböző bár és pár címszavak bármelyikére történő kereséskor a szótár a másikat is felajánlja (a b és p közötti tévesztés gyakori hiba, különösen p „rovására”, mivel a szomáli hangrendszerben a [p] nem található meg). A rendszer számára az ékezetek szempontjából téves alakok sem okoznak fennakadást. A szótár elég sok tévesztési lehetőséget ismer, vagyis egy rövid betűsor beírásakor még elég sok opciót felkínál (közöttük egészen távolinak tűnőket is), de ez mindig extra lehetőséget jelent, és a szótár kis mérete miatt egyébként sem okoz problémát. Nagy segítség a nyelvtanulók számára, hogy a szótár nem várja el, hogy pontosan tudják a szavak helyesírását, hanem segít a keresésben a felhasználónak (aki a felkínált lehetőségek között, illetve a megjelenő szócikkben meg is tudja figyelni az adott szó helyes 12
Kiindulópontul korábbi és jelenlegi szomáli anyanyelvű diákjaim magyar nyelvű dolgozatait elemeztem, az ezekből nyert adatok alapján dolgozik a szótár.
30 írásmódját), vagyis a szótár ismeri az adott nyelvpár adott irányában (!) leggyakoribb tévesztéseket. A keresőmezőnek ez az igencsak újszerű vonása különös jelentőséggel bírhat egy tanulói szótár esetében. A felhasználók visszajelzéseit segíti az üzenetküldési lehetőség, ahol bárki elmondhatja véleményét a szótárról. A szerkesztő felé is felhasználóbarát a rendszer: a szótárhoz tartozó szintén online szerkesztői felületen keresztül történik a szócikkek és a fogalomköri rendszer módosítása, bővítése. Ez komoly előrelépés a szótár szerkesztésében, mivel a szótár a gépesítés előtt egy egyszerű Excel-fájl, illetve (a fogalomköri rendszer esetében) egy Worddokumentum13 volt. A szerkesztői felületen lehet például fényképeket feltölteni és linkeket elhelyezni a szócikkekben. A rendszer mindemellett naplózza a kereséseket, és külön jelzi, hogy melyek azok a szavak, amelyeket valaki keresett, de nem szerepelnek a szótárban. Ez hasznos információ a szótár szerkesztői számára, hiszen ezekkel a szavakkal lehet utána bővíteni az adatbázist. A keresési napló is természetesen a szerkesztői felületen érhető el. Mindezek a funkciók jól mutatják, hogy nem egy már létező termékbe került bele a szótár adatbázisa, hanem a gépesítés szempontjából is teljesen új szótárról beszélünk. A szótár nyelvtechnológiai megoldásairól, újdonságairól Endrédy István cikkében lehet bővebben olvasni (Endrédy 2014).
13
Bár ez a munka kezdetekor nem tűnt megoldhatónak, utólag visszatekintve alighanem praktikusabb lett volna már a szótár tartalmának létrehozása előtt felvenni a kapcsolatot a szótár leendő gépesítőivel, és az általuk javasolt formátumot, illetve szoftvert használni az első pillanatoktól fogva, sőt esetleg akár megbízni őket egy szerkesztői felület létrehozásával.
31
4. A NYOMTATOTT SZÓTÁR SZERKEZETE 4.1. A borító A borítón a magyar és a szomáli zászló (kék zászló, középen egy fehér ötágú csillaggal) szerepel. A zászló Tukale elmondása szerint közös szimbólum a Szomáliában, Dzsibutiban, Etiópiában és Kenyában élő szomálok számára, mivel ezek a területek korábban mind NagySzomáliához tartoztak. (A szótár szempontjából ennek az a jelentősége, hogy ezt a szimbólumot valamennyi szomáli anyanyelvű használó a sajátjának érezheti.) A szomáli zászló és a borító középső részének kék háttere igazodnak egymáshoz, a zászlók sorrendjét a dizájn szempontjai határozták meg.
4.2. A szócikkek szerkezete A nyomtatott szótár szócikkeiben a különböző típusú információk elkülönítését eltérő tipográfiájuk segíti. A címszavakat és az ekvivalenseket kék szín emeli ki (a címszavak ezen kívül félkövéren is szerepelnek, és a többi sornál kijjebb kezdődnek), megkönnyítve ezzel a kereső olvasást. (A keresést támogatja az is, hogy a szócikkek egyetlen hasábban szerepelnek, így nem kell párhuzamosan két hasábot pásztáznia a szemnek az adott szó keresésekor.) A nyomtatott szótárnak is természetesen szomáli a metanyelve. Az online szócikkekkel szemben a címszavak a nyomtatott szótárban csak egyszer, teljes formájukban (például vonzattal együtt) szerepelnek, nincsenek megadva angol ekvivalensek, valamint nem minden szócikkben található kiejtés. A fogalomköri besorolás pedig az online szótárral ellentétben nem a fogalomkörök kétnyelvű megnevezésével szerepel, hanem kódok utalnak a vonatkozó
32 fogalomköri besorolás
fogalomkör(ök)re. A szócikkek elrendezése általánosságban véve is tömörebb, helytakarékosabb (így előfordulhat, hogy egyes információk az egyik sorban kezdődnek, és a következőben folytatódnak), továbbá a nyomtatott szócikkek egyikében sem szerepel képi illusztráció. kiejtés a címszó (szintaktikai információkkal)
szófaj
egyéb alakok siet (VALAHOVÁ) / siet (+ QAABKA „-NI”) [sijet] ⟨sietni, siettem / sietett⟩ dhakhso (dhakhsasho) ❖ Ne haragudj, de most sietek. Ha iga cadhoon, imika waan dagdagayaa. ) 119 sikerül (VALAMI VALAKINEK) / sikerül (+ QAABKA „-NI”) ⟨sikerülni, - / sikerült⟩ iyaka, iyaga guul, ku guulaysasho ❖ Képzeld, sikerült a vizsgám! Kasoo qad (sawiro), waxan ku guulaystay imtaxaanki! ) 27, 80 sincs <magac u-yaal> 1. ma jiro, ma yaal; 2. maya ) 41 példa nyelvhasználati információk jelentés a fogalomkörök kódja
A sikerül szócikk (és környezete) a nyomtatott szótárban
4.3. A szócikkek és a fogalomköri mutató viszonya, az online szótártól való eltérések A fogalomkörök előtt szereplő kód biztosítja, hogy a szócikkek utalásai (a cikkekben megadott kódok) segítségével a tematikus részben könnyen megtalálható legyen, hogy mely szavak szerepelnek még az adott címszóval azonos csoportban. A fogalomköri mutató két nyelven történő megadása a nyomtatott szótárban is lehetővé teszi a témák szomáli–magyar irányú böngészését is (az online szótár keresőmezőjével szemben itt ilyen irányú keresésre másképpen nem adódna lehetőség, ezzel kapcsolatban ld. a 4.4. részt). A használók így a szomáli és magyar nyelven szereplő témák szerint listázott, azokon belül pedig jellemzően
33 a magyar ábécé alapján rendezett címszavakat14 egy helyre gyűjtötten is megtalálják. Míg az online szótár fogalomköri mutatójában a magyar címszavak és a szomáli jelentések (ekvivalensek, körülírások) listájából a szavakkal kapcsolatos többi információhoz (a vonatkozó teljes szócikkhez) egyetlen kattintással el lehet jutni, addig a nyomtatott szótárban ehhez lapozgatásra van szükség, hiszen a teljes szócikkek az alfabetikus részben találhatók. Felmerült az a lehetőség is, hogy a fogalomköri mutatót valódi tematikus szótári résszé alakítsuk, és itt is teljes szócikkeket szerepeltessünk, ez azonban megtöbbszörözné a terjedelmet, mivel a címszavak közül sok több fogalomkörhöz is tartozik. A teljes szócikkek egymásutánja pedig a mutató használhatóságának is ártana, hiszen az esetenként hosszas listában a használó egy idő után már azt sem feltétlenül látná világosan, hogy 181szavainál is jár. tulajdonképpen melyik kategória 45 meghívás és meghívásra adott válasz casuumada iyo ka jawaabida casuumada 43 igen - haa van kedve + qaabka "-NI" - xiiso (ma ku hayaa inaad sameeyso wax) kedves (valakitől, hogy...) - qof furfuran (soo jiidasho leh) köszönöm - mahadsanid megfelel (valakinek) - ku haboon meghív valakit (valahová) - casuumid, marti qaad u fidin meghívás - marti-qaad nem - 1. maya (ma jirto), maya (may); 2. ma rendben - 1. waa hagaag; 2. ficnaan ráér valamikor (+ qaabka "-NI") / ráér valamikor (valamire) - firaaqo (wakhtigaaga firaaqaha ah) sajnos - nasiibdaro végül is tud (+ qaabka "-NI")? - hadal iyo dhammaan ma sameyn/qaban kartaa? 46 tanács - mahadnaqa 43 kellene + qaabka "-NI" - 1. ineey; 2. inaad; 3. inaan; 4. inuu (wax sameeyo/sameeysid) kéne - la rabaa, loo bahanyahay 㻝㻠 㻌 Az ábécérend alól(valamivel/valakivel) egy-két helyen kivételt tettem, ilaalin ahol más logika sokkal vigyáz - ka taxadarid, természetesebben adódott (például a hét napjai vagy a személyes névmások esetében). 47 vita - dood-wadaag 32 egyetért (valakivel valamiben) - ku raacid hozzászólás - faallo igaz - run ah, xaqiiq ah, sax ah szempont - aragti
34 4.4. Kereshetőség a szótárban és a szótár használhatóságát segítő további elemek A nyomtatott szótár alfabetikus részében a keresést az ábécérendbe sorolás segíti. A magyar ábécérend érvényesítésére a szerkesztéskor külön figyelmet kellett fordítani, mivel a gépi ábécérendbe sorolás nem mindig követi tökéletesen a magyar szabályokat (a szótári adatbázis ábécérend szerinti változatában például az annyi az anya előtt szerepel). Magyar mint idegen nyelv tanulói számára készített szótár esetben felvethető, hogy az a és az á, valamint az e és az é (a magyar lexikográfiai tradíciók szerint) együtt szerepeljen, vagy legyen inkább külön véve (mutatva ezzel, hogy az ékezet ezekben az esetekben nem csupán hosszúságot jelöl, hanem a hangok minőségének eltérését is). A magyar–szomáli szótár esetében a hagyományos ábécérend követése mellett döntöttünk, nem elsősorban a szerkesztés egyszerűsége miatt, hanem inkább azért, hogy ez is segítse az ékezeteket saját anyanyelvükben nem használó, és így azoknak kellő jelentőséget nem mindig tulajdonító szomálok számára az adott szavak megtalálását. Az alfabetikus rendezés kérdéseihez tartozik, hogy mivel a szomáli nyelv ábécérendje jelentősen eltér a magyarétól (az első három betűje, érzékeltetésül: b, t, j), ezért a magyar ábécét15 minden lap szélén, a regiszterben feltüntettük, az adott oldalon lévő szavak kezdőbetűjét tipográfiailag kiemelve. Az online szótárban nem szerepelnek utaló címszavak: ez a toldalékolt alakok tekintetében a gépesítés miatt felesleges, más kapcsolódó formákat (rövidítést, becézett alakot) pedig jellemzően teljes szócikk formájában adtam meg, hiszen nem kellett spórolni a hellyel. A nyomtatott szótárban ezzel szemben néhány, a vonatkozó címszótól nagymértékben eltérő és/vagy az ábécérendben nem közvetlenül mellé eső formát utaló címszóként adtam meg. Ritkábban alakilag egybeeső vagy nagyon hasonló formákat is megadtam, ezzel is 15
A cél itt az ábécérendbe sorolt magyar címszavak közötti keresés segítése volt, és helytakarékossági szempontoknak is engedtünk: itt például (az egyéb tartalmak között, a betűzést segítendő megadott ábécével szemben) nem soroltuk be a qt, a w-t, az x-et és az y-t, valamint az ábécérendbe sorolás szempontjából azonosnak tekintett magánhangzókat (pl. a, á) egymás mellé írtuk.
35 próbálva segíteni az elkülönítésüket (például az öt számnév és az őt tárgyragos személyes névmás). Az elsődleges cél minden esetben a keresett szóhoz történő eljutás segítése volt (a hellyel való takarékosság és az elméleti szempontból „tiszta” címszavak pedig további szempontként jelentek meg). A toldalékolt formák esetében egy-egy adott paradigmának általában csak a címszótól távolabb eső, illetve a szabályostól eltérő tagja(i) szerepel(nek) utaló címszóként. Így lett utaló címszó például a mész, illetve a mennek, és nem lett utaló címszó a megyek és a megyünk. Teljes paradigmák egymás mellé eső alakjainak teljes körű megadását igyekeztem kerülni: így például utaló címszó lett az ittam és az ivott, de nem lett utaló címszó az ittál, ittunk stb. (hiszen ezek az ittam mellé esnének, toldalékaik pedig szabályszerűen létrehozhatók). A személyjelezett vagy ragozott alakoknál igyekeztem a számra és a személyre (sőt, múlt idejű formáknál az igeidőre) vonatkozó információt is közölni. Például: ment (Ön, ő; wakhti tagay) megy Felmerült az adatbázis gépi „kifordításának” lehetősége is. Ez a megoldás az összegyűjtött és megadott információk rendezési elvén módosított volna (a jelenlegi szomáli ekvivalenseket kezelte volna szomáli címszavakként). A szótár címszavainak válogatása viszont (szomáli nyelven beszélő lexikográfus és megfelelő források híján) elsősorban a magyar nyelvből indult ki (ld. a 2.1. részt), így szomáli irányból nézve akár alapvető fontosságú szavak is hiányozhattak volna, ami egy szomáli–magyar irányú szótári részben zavaró lett volna. A kifordítás munkáját várhatóan több tényező16 is rendkívül 16
Az ehhez szükséges munka egyszerre igényelte volna lexikográfusi és fordítói kapacitás igénybe vételét, mivel el kellett volna dönteni, hogy az adatbázis "szomáli jelentés" mezőjében található, egymástól vesszővel elválasztott szavak közül melyek azok, amelyek esetében több szinonim ekvivalens egymásutánjáról beszélünk (és így közülük több is címszó lenne egy szomáli–magyar irányú szótárban vagy szótári részben), és mely esetekben van más oka a vessző használatának. (Az adatbázisban az azonos magyar címszavakhoz tartozó újabb, poliszém jelentéseket pontosvessző választja el – ennek kezelése így a "kifordítás" szempontjából nem lett volna problematikus.) Ezen kívül pedig a körülírással megadott jelentések (természetesen szomáli ábécé szerinti) rendezésének kérdését is meg kellett volna oldani. Bár ez a megoldás ezúttal nem látszott vállalhatónak, az adatbázis kifordítása lehetséges fejlődési iránynak tűnik.
36 megnehezítette volna, ezt a megoldást ezért elvetettük. A szomáli irányból induló keresés így tematikusan lehetséges csupán, a fogalomköri mutatóban, ahol elsősorban a fogalomkörök kódja, valamint a témák tartalomjegyzéke segíti a tájékozódást. A szócikkek az adott fogalomkörökön belül jellemzően ábécérendben szerepelnek (bár a szócikkek egy-egy csoportban való mennyisége miatt ez utóbbi rendezési szempontnak kisebb a jelentősége, mint az alfabetikus szótári részben). A nyomtatott szótár elején mintaszócikkek segítik a szócikkek szerkezetének megismerését. Ezen kívül azonban a szótár végén is szerepelnek mintaszócikkek: ezek már nem a szócikkek struktúráját mutatják be, hanem (tipográfiai eszközökkel) utalnak a megadott nyelvtani információkból levonható következtetésekre is. Példát mutatnak arra, hogy személyekre névmással történő utaláskor milyen formákat használunk: megfelel valakinek → Nekem megfelel. (Az egyéb morfológiai alakokkal kapcsolatos példákat ld. a 2.2.2. részt.) A személyes névmások határozóragos alakjait, vagyis a vonzatokkal személyekre történő utalás formáit pedig táblázat mutatja be. Ebben azok a határozóragok szerepelnek, amelyek előfordulnak valamelyik címszó vonzatjaként. Külön táblázatban történő bemutatásukat az indokolja, hogy a használathoz szükséges olyan információkról van szó, amelyeket sok szócikkben kellene feltüntetni, ezért praktikusabbnak tűnik inkább egy helyen megadni őket. Az online és a nyomtatott szótár esetében is tervben volt egy hosszabb használati útmutató elkészítése. Ennek megvalósulására fordítói kapacitás hiányában végül sajnos nem tudott sor kerülni. A borítóbelsőn (valamint az online szótár súgójában) szereplő mintaszócikkek ebben a végül el nem készült használati útmutatóban feltüntetni tervezett információk többségét17 jelenítik 17
Az eredetileg tervezett használati útmutató készítésekor felmerült, hogy például a személyes névmások határozóragos alakjai közül az egyes szám harmadik személyű formákkal más funkcióban is találkozhatnak a használók a szótárban, például a Mennyi garancia van rá? példamondatban – erre a lehetőségre, illetve az összefüggésekre azonban a súgó nem hívja fel a figyelmet, részben a fordítási kapacitás korlátai miatt, részben pedig azért, mert nem egyértelmű, hogy valóban szükség van-e erre a tudásra ezen a nyelvi szinten. 㻌
37 meg, legalább az utalás szintjén. Adott esetben a nyelvtanárok is segíthetnek értelmezni a használóknak a szótár ezen részének utalásait – természetesen csak amennyiben ez megvalósítható az adott kurzuson, vagy egy-egy óra után, néhány percben.
5. ÖSSZEGZÉS: A SZÓTÁR-MODELL
Látható tehát, hogy komplex tanulói szótár(ak)ról van szó, ahol számtalan adatot lehet találni a címszavakról (vagy legalábbis azok többségéről). Ennek a műfajnak továbbra is van létjogosultsága, hiszen a tanulói szótárak által kínált adatok nagy segítséget jelentenek a nyelvtanulók számára, és ezen adatok, szótárak megfelelően igényes elkészítésének és gépesítésének is adottak a feltételei. Az ilyen szótárak hatékonyságával ezért nem mérhetőek össze a csupán ekvivalenciákat megadó (internetes) honlapok, szótárak, amelyek egy része azonban nevének ismert csengése, esetleg nagy mérete miatt mégiscsak konkurenciaként jelenik meg a diákok eléréséért, figyelméért folytatott versenyben. (Például a Google 2013 decemberében a szomálit is hozzáadta a Google Fordító nyelveinek listájához18, de a már említett Glosbe és a Wikiszótár is ilyenek.) Nagyon fontos minél inkább felhasználóbarát szótárakat készíteni (és a célcsoport ismeretében meghatározni a részleteket, ide értve azt is, hogy online és/vagy nyomtatott szótárat készítünk). A magyar–szomáli szótár készítésekor is kiemelt szempont volt az, hogy az információk minél könnyebben hozzáférhetőek legyenek (kereshetőség), és minél áttekinthetőbben jelenjenek meg. A másik oldalról ugyanakkor a szótárhasználat tudatosítására, tanítására is szükség van. A lexikográfusok és a tanárok is sokat tudnak tenni azért, 18
A Google Fordító magyar és szomáli között az angol nyelven keresztül fordít, és mivel már az angol és a szomáli közötti fordításkor is kérdés, hogy az alapvetően statisztikai alapon működő rendszer rendelkezik-e elegendő mennyiségű párhuzamos szöveggel ahhoz, hogy valóban jó arányban adjon ki helyes megfelelőket, a magyar és a szomáli között történő fordításkor a jelentések torzulásának fokozott kockázatával kell számolnunk.
38 hogy a nyelvtanulók számára megmutassák azokat az előnyöket, amelyekkel egy tanulói szótár tud szolgálni a csupán ekvivalenciákat megadó megoldásokkal szemben. (Például nyelvtani információkkal és példákkal segíti az adott szónak elsősorban az aktív használatát, stílusmegadással a pontos megértését és használatát, többek között irányítószavakkal teszi lehetővé a megfelelő ekvivalens kiválasztását – ez nem ismert szavak, jelentések esetében kiemelten fontos.) A szótáraknak azonban érdemes nemcsak felhasználóbarátnak (könnyen kezelhetőnek), hanem anyagi szempontból is könnyen elérhetőnek is lenniük. Online szótárak esetében akár az ingyenességig is el lehet menni19 (nyomtatott szótáraknál ez alighanem csak speciális esetekben lehetséges), hiszen még a jó minőségű szótárak is leginkább így érhetik el a nyelvtanulókat.
IRODALOM Aradi András – Erdős József – Sturcz Zoltán (2000, szerk.): Küszöbszint. Magyar mint idegen nyelv. Budapest: Műegyetemi Távoktatási Központ. [http://bme-tk.bme.hu/other/kuszob/] Bíró, Ruth G. - Kontra Miklós – Radnai T. Zsófia (1989): Hungarian Picture Dictionary for Young Americans. Budapest: Tankönyvkiadó. Davies, Helen – Szabó Helga (2009): Beginner's Hungarian Dictionary. Budapest: Holnap Kiadó. Durst Péter (2004): Lépésenként magyarul. Első lépés. (Második kiadás.) Szeged: Szegedi Tudományegyetem Hungarológiai Központ. 2 ÉKSz = Pusztai Ferenc (2003, szerk.): Magyar értelmező kéziszótár. Budapest: Akadémiai.
㻌Vagyis meglátásom szerint online tanulói szótárak esetében anyagi szempontból pályázati források, esetleg kellő mennyiségű reklám jelenthetik a legéletképesebb modellt.㻌
㻝㻥
39 Endrédy, István (2014): Hungarian-Somali-English20 Online Dictionary and Taxonomy. In: Proceedings on "Collaboration and Computing for Under-Resourced Languages in the Linked Open Data Era". (Language Resources and Evaluation Conference 2014.) Reykjavík. 38-43. [http://www.lrec-conf.org/proceedings/lrec2014/workshops/ LREC2014-Workshop-CCURL2014-Proceedings.pdf] Eőry Vilma (2007, főszerk.): Értelmező szótár+. Értelmezések, példamondatok, szinonimák, ellentétek, szólások, közmondások, etimológiák, nyelvhasználati tanácsok és fogalomköri csoportok. Budapest: Tinta Kiadó. Erdős József – Prileszky Csilla (2008): Halló, itt Magyarország! Magyar nyelvkönyv külföldieknek I. (Ötödik kiadás.) Budapest: Akadémiai. Fekete László (1992): Magyar kiejtési szótár. Budapest: Gondolat. Fóris Ágota (2012): A szótár fogalma a magyar lexikográfiában. In: Pintér Tibor – Pődör Dóra – P. Márkus Katalin (szerk.): Szavak pásztora. Írások Magay Tamás tiszteletére. Szeged: Grimm Kiadó. 22-38. Forvo.com: All the words in the world. Pronounced. – magyar [http://hu.forvo.com/languages/hu/] Hegedűs Rita (2005): Magyar nyelvtan. Formák, funkciók, összefüggések. Budapest: Tinta Kiadó. Joachim László (2013a): Morfológiai és szintaktikai információk a magyar mint idegen nyelv tanulói számára készített szótárakban és szószedetekben. (Egy tanulói szótár előmunkálatainak szempontjai, tapasztalatai.) Hungarológiai Évkönyv. 14: 40-62. [http://www.epa.oszk.hu/02200/02287/00014/pdf/EPA02287_ hungarologiai_evkonyv_2013_14_040-062.pdf] Joachim László (2013b): A magyar tanulói szótárak címszókiválasztásának főbb kérdései (és néhány szempont a magyar alapszókincs meghatározásához). THL2 A magyar nyelv és kultúra tanításának szakfolyóirata. [http://epa.oszk.hu/THL2] 㻌A szótár meglátásom szerint lexikográfiai szempontból magyar–szomáli kétnyelvű (a szócikkeknek csupán egy részében szerepel angol ekvivalens is), a gépesítés azonban az angol nyelvet is kezeli. 㻌
㻞㻜
40 Joachim László – Muhyadin Hussein Tukale (2013): Hungariyan– Soomaali qaamuus, tusiyaha qaybaha guud. / Magyar–szomáli szótár (szomáloknak). Fogalomköri mutatóval. (Online szótár.) Budapest: RMK - Menekültmisszió. [http://qaamuus.rmk.hu/] Joachim, László – Muhyadin Hussein Tukale (2014): Hungariyan– Soomaali qaamuus. Magyar–szomáli szótár szomáloknak, fogalomköri mutatóval. (Nyomtatott szótár.) Budapest: RMK Menekültmisszió. MNSZ = Váradi Tamás et al. (2005): Magyar nemzeti szövegtár. Budapest. [http://mnsz.nytud.hu/] Mozsárné Magay Eszter – P. Márkus Katalin (2006): Angol–magyar, Magyar–angol tanulószótár. Szeged: Grimm Kiadó. Olaszy Gábor – Siptár Péter et al. (2010, szerk.): Magyar szavak elektronikus kiejtési szótára. Budapest: BME-TMIT. [http://beszedmuhely.tmit.bme.hu/mksz]
Pelcz Katalin – Szita Szilvia (2011): Egy szó mint száz. (Magyarangol tematikus szókincstár). Budapest: Akadémiai. van Ek, J. A. – J. L. M. Trim (1998): Threshold 1990. (A revised and corrected edition.) Cambridge: Cambridge University Press. [http://www.coe.int/t/dg4/linguistic/Threshold-Level_CUP.pdf] van Ek, J. A. – J. L. M. Trim (2007): Waystage 1990. (A revised and corrected edition.) Cambridge: Cambridge University Press. [http://www.coe.int/t/dg4/linguistic/Waystage_CUP.pdf]
Joachim László
RMK – Menekültmisszió Iskolai Integrációs Program [email protected]