Nyelvjárási és helynévtörténeti anyagok geolingvisztikai kutatása Részletes kutatási terv 1. A kutatási célok meghatározása A kutatás célja olyan nyelvjárási és helynévtörténeti adattárak létrehozása, amelyek hatékonyan és újszerűen teszik lehetővé a magyar nyelv területi szempontú vizsgálatát. Világszerte számos példát láthatunk hasonló szempontok szerint kialakított, megfelelő módszertani és informatikai háttérrel megvalósított geolingvisztikai kutatásra (pl.: Centre de Dialectologie de Grenoble, SweDia 2000, Dialect Topography, Romanische Variationslinguistik, KATTENBUSCH és mtsai 1997–2007, LABOV és mtsai. 2006). Magyarországon az utóbbi tíz évben kapott nagyobb lendületet az informatikai módszereket használó nyelvföldrajz (BALOGH–KISS 2002, VÉKÁS 2000, BODÓ–VARGHA 2007) és a digitális adattárakra támaszkodó helynévkutatás (HOFFMANN 1997, TÓTH 2001). Több olyan lezárult vagy éppen folyamatban lévő projektumról is tudunk a magyar nyelvterületen, amelynek célja korszerű, a korábbi adattárakkal való integrálásra alkalmas, szociolingvisztikai szempontoknak is megfelelő, térképezhető nyelvjárási adattár létrehozása. Az újabb geolingvisztikai kutatásoknál elengedhetetlen szempont továbbá az eszközfonetikai elemzés lehetőségének megteremtése is. Az európai (Centre de Dialectologie de Grenoble, European Corpus Phonology Group) és amerikai (LABOV és mtsai. 2006) kutatások mellett már erre is van magyar példa, A moldvai csángó nyelvjárás atlasza követéses vizsgálataként megvalósult Multimédiás moldvai nyelvatlasz (ld. BODÓ 2007). Az időbeni változások vizsgálatához azonban nélkülözhetetlen, hogy az újabb gyűjtések mellett legyenek olyan korszerű formába hozott régebbi adattáraink is, amelyek alkalmasak lehetnek az összevetésre. 2007 októberében zárul le az a kutatás, amely elsőként vállalkozott Magyarországon nagyobb mennyiségben papíratlaszok formájában már megjelent nyelvjárási adatok informatizálására (5/056/2004. számú NKFP-projektum, projektvezető: KISS JENŐ, honlap: http://geolingua.elte.hu). A magyar nyelvjárások atlasza (a továbbiakban MNyA.) rövidesen informatikai módszerekkel is kutatható anyagának szerves része az a mintegy 461 órányi hangfelvétel, amely az 1960 és 1964 között lezajlott ellenőrző gyűjtések során készült. A felvételek a MNyA. 352 kutatópontjáról (25 szlovákiai és 327 magyarországi) tartalmaznak spontán szövegfelvételeket és 41 atlaszkérdés kikérdezését (VÉGH–BALOGH 1975). A fent említett NKFP-projektumban a gyűjtés során készített valamennyi hangfelvételt digitalizáltuk, és megkezdtük a hanganyag részleges feldolgozását, ennek eredménye a Magyar nyelvjárási hangoskönyv sorozat első három darabja (HAJDÚ és mtsai. 2005, 2006, 2007), amelyek az 1974-ben megjelent Magyar nyelvjárási olvasókönyv (HAJDÚ–KÁZMÉR 1974) néhány szövegét adják közre, összekapcsolva az átiratokat eredeti hangzó formájukkal. Megkezdtük a feldolgozását az atlaszkérésekre adott válaszoknak is, igazodva az olvasókönyv kutatóponthálózatához. Jelen pályázatban feladatként tűzzük ki a Magyar nyelvjárási hangoskönyv sorozat befejezését (összesen 9 CD), valamint az atlaszkérdésekre adott válaszok fonetikus átírását az ellenőrző gyűjtés valamennyi kutatópontján, a MNyA. gyakorlatának megfelelően (összesen 352, ebből 50 kutatópont anyagát már rögzítettük). A magyar nyelvterület jó részéről vannak már számítógépen hozzáférhető, informatikai módszerekkel is kutatható helynévtörténeti adattárak, készítésük és kiadásuk elsősorban a Debreceni Egyetem névtani műhelyéhez kapcsolódik (HOFFMANN 2005), forrásuk GYÖRFFY GYÖRGY történeti földrajza (GYÖRFFY 1963–1998). Ezekhez az adattárakhoz azonban nem áll rendelkezésre olyan informatikai háttér, amely lehetővé tenné az adatok geolingvisztikai kutatását, helynévtörténeti térképek automatikus generálását. A megjelent történeti helynévtárak nagy hiányossága még, hogy a történelmi Erdély területéről nem, vagy csak igen kis számban tartalmaznak adatokat. Könyv formában 2001 óta jelennek meg SZABÓ T. ATTILA Erdélyi Helynévtörténeti Adattárának kötetei, amelyek ezt a hiányt pótolják. A teljes gyűjtésből eddig nyolc kötet látott napvilágot, összesen 2400 nyomtatott oldal terjedelemben, ebből Háromszék
1
helyneveit (II. kötet, 206 oldal) a fent említett NKFP-projektum egyik részfeladataként, egy új eljárás létrehozásával informatizáltuk, annotáltuk, adatbázisba rendeztük, kereshetővé és térképezhetővé tettük (BÁRTH M. 2007). Terveink szerint a kialakított módszertan szerint dolgozzuk föl a további hét kötetet is, olyan helynévtörténeti adattárat hozva létre, amely Erdély területéről hatalmas mennyiségű lokalizálható (tehát térképezhető) történeti névadatot tartalmaz. Az így elkészült adattár és keresőprogram nem csak a névtani kutatások, hanem a dialektológia, a néprajz és a történettudomány számára is fontos forrást jelent majd (BÁRTH M. 2007). A helynevek, helyneveket tartalmazó körülírások alkalmasak a már rendelkezésünkre álló informatizált nyelvföldrajzi adatokkal való dialektológiai szempontú összevetésre is (VARGHA 2007a). A kutatás eredményeként elkészülő erdélyi történeti helynévtár így jól illeszkedik a korábbi nyelvföldrajzi adatok informatizálását kitűző projektekhez: a Székely nyelvföldrajzi szótár és a Romániai magyar nyelvjárások atlasza számítógépes feldolgozásához (VÉKÁS 2000, VARGHA 2007b). 2. A nyelvjárási adattár kialakítása 2.1. A feldolgozás során alkalmazott infomatikai eljárások A hanganyagok átírása a VÉKÁS DOMOKOS által fejlesztett Bihalbocs dialektológiai szoftver segítségével történik (honlap: http://www.bihalbocs.hu). A szaktudományos feladatok megoldásához speciális szoftverek használata szükséges, ugyanis a kereskedelmi forgalomban beszerezhető szoftverek (szövegszerkesztők, hangszerkesztők, adatbáziskezelők, grafikus programok, térinformatikai alkalmazások) csupán az igények töredékének kiszolgálására lennének alkalmasak. A Bihalbocs olyan lejegyzésszerkesztő (speciális szövegszerkesztő), hangkezelő és térképgeneráló szoftver, amely egyrészt lehetővé teszi nyelvjárási adatok megfelelően kódolt rögzítését és adattárakba rendezését, másrészt az adatok sokoldalú felhasználását a kutatói igények szerint. A megfelelően informatizált adattárak óriási előnye, hogy integrálhatók, ez az egyértelmű struktúrából és a kompatibilis kódrendszerből következik. A nyelvjárási jelenségek kódolására olyan analitikus kódrendszert alkalmazunk, amely a teljesség igényével optimálisan biztosítja az adatrögzítés pontosságát és az informatizált anyagok hatékony felhasználását a későbbiekben (VÉKÁS 1999). A hanganyagok feldolgozása a VÉKÁS DOMOKOS által erre a célra kifejlesztett speciális BXT fájlformátumban történik, amely lehetővé teszi lejegyzett nyelvjárási adatokat tartalmazó szövegfájlok és WAV formátumú hangfájlok szinkronizálását. Vagyis a lejegyzett szövegek nem csupán magukat a nyelvjárási adatokat tartalmazzák, hanem időzítési markereket is, amelyek a vonatkozó hangfájlok megfelelő időpillanataira utalnak a másodperc töredékének pontosságával. A fájlok beolvasásakor a szövegben megjelenített markerek segítségével bármikor meghallgathatjuk a lejegyzett nyelvjárási adatokat, szövegrészleteket, anélkül, hogy megkeresnénk és megnyitnánk a szövegfelvételt tartalmazó hangfájlt. A Bihalbocs dialektológiai szoftver segítségével lehetőségünk van az így feldolgozott adatok adatbázisba rendezésére, a nyelvjárási átiratokban történő keresésre, az adatok alapján más programok (szövegszerkesztők, statisztikai alkalmazások, internetböngészők) számára is kezelhető térképes kimutatások, táblázatok készítésére. Mivel a létrehozott anyagok használatát hosszú évtizedekre biztosítani szeretnénk, a legegyszerűbb kódolási és tárolási formátumokat alkalmazzuk, hogy a rendszeresen megújuló informatikai platformok közötti hordozhatóságot minél jobban elősegítsük. („Legegyszerűbb”
2
megoldáson természetesen a feladat összetettségéhez viszonyított egyszerűséget értjük.) A BXT-fájlok szerkezete jól strukturált és viszonylag egyszerű, így az ebben a formátumban tárolt anyagokat a jövőben esetleg más, erre a célra kifejlesztett (dialektológiai) szoftverek is kezelni tudják majd. 2.2. Hangos-atlasz Terveink szerint az ellenőrző gyűjtés valamennyi kutatópontján (összesen 352 település, ebből 327 magyarországi, 25 szlovákiai) a 2.1. pontban ismertetett eljárásokkal rögzítjük a MNyA. hangfelvételeiben a 41 atlaszkérdésre adott válaszokat. Korábban az 5/056/2004. számú NKFPprojektumban már 50 kutatópont anyagát feldolgoztuk, és ezzel egyben kidolgoztuk az adattár struktúráját is. A feldolgozás alapegysége a nyelvjárási interjú, vagyis minden adat megőrzi kapcsolatát az adatközlővel. Az adattár szerkezete lehetőséget biztosít az adatközlők paraméterei szerinti keresésre, egy adatközlő különböző kérdésekre adott válaszainak összevetésére. Az adatokat a feldolgozás után olyan keresőfelületen keresztül tesszük elérhetővé, amely lehetőséget biztosít a fonetikusan lejegyzett adatok különféle nyelvészeti szempontok szerinti keresésére, kutatására, térképezésére, a MNyA. (és más nyelvjárási adattárak) informatizált adataival való összevetésére és integrálására. Az atlaszkérdésekre adott válaszok fonetikus átírását VARGHA FRUZSINA SÁRA és BÁRTH M. JÁNOS végzi. 2.3. Magyar nyelvjárási hangoskönyv A Magyar nyelvjárási olvasókönyv 43 településről közöl olyan szövegrészletet, amely a MNyA. ellenőrző gyűjtéséből származik. Ebből eddig 34 település anyagát az 5/056/2004. számú NKFP-projektumban az eredeti hanganyagokkal szinkronizáltuk (a 2.1. pontban leírtak szerint), a szinkronizált átiratokból három CD-kiadvány született a Magyar nyelvjárási hangoskönyv sorozatban, összesen 14 településről (Hajdú és mtsai. 2005, 2006, 2007). Jelen pályázatban dolgozzuk fel további 9 település anyagát, és adjuk közre a még nem publikált szinkronizált átiratokat, összesen 29 településről, 6 CD-n és a Geolingvisztikai Műhely honlapján (http://geolingua.elte.hu). A szövegek eredeti hanganyagukkal való szinkronizálását PhD-hallgatók végzik, a CDkiadványok kialakítása VARGHA FRUZSINA SÁRA feladata. 3. A helynévtörténeti adattár kialakítása 3.1. A feldolgozás során alkalmazott módszerek, informatikai eljárások Az adattár informatizálása és annotálása a háromszéki kötet feldolgozása során már kialakított módszertan alapján történik. A kötet informatizálása a betűhív forma megtartása mellett a sokoldalú felhasználásra (keresés, csoportosítás, térképezés) alkalmas kódolást és megfelelő struktúrák kialakítását jelenti. Az informatizált változat a papírkötetek digitális változata (Word dokumentumok) alapján készül. A teljes anyagot olyan kódrendszer szerint konvertáljuk, amely lehetővé teszi, hogy a nyelvtörténeti szövegek könnyen kereshetők és kutathatók legyenek, megőrizve az eredeti dokumentumoknak megfelelő írásmódot és a kapcsolatot a nyomtatott változattal. A háromszéki helynévanyag feldolgozásához BÁRTH M. JÁNOS dolgozott ki olyan osztályozási rendszert, amely alkalmas a helynevek, helynevet tartalmazó körülírások denotátumfajták szerinti manuális annotálására (címkézésére) (BÁRTH M. 2007). A helynevek, körülírások szövegben való kijelölését a történeti anyagok feldolgozásához a Geolingvisztikai Műhelyben kifejlesztett Olló nevű számítógépes alkalmazással végezzük. A kijelöléseket és minősítéseket
3
tartalmazó adatfájlokból automatikusan hozunk létre adatbázist, elektronikus mutatót, amely biztosítja a névanyagban való gyors, több szempontú keresést, miközben megmarad a kapcsolat az adat eredeti kontextusával, vagyis az eredeti cédulák szövegével, valamint a kötet nyomtatott változatának struktúrájával. (Adat és forrás ilyen szintű kapcsolatának megőrzése szokásos adatbázis-kezelővel, célszoftver kifejlesztése nélkül megoldhatatlan lenne.) A helynévanyag elemzésére speciális keresési rendszert és felhasználói felületet alakítottunk ki az Ollóban, amely hatékonyan támogatja a tudományág szempontrendszere alapján a nyelvtörténeti anyag kutatását. A keresés során lehetőség van többek között az adatok települések szerinti, vagy a forrásdokumentum keltezése szerinti szűrésére, valamint a helynevek elemzése során kialakított osztályozási rendszer alapján az adatokhoz kapcsolt minősítések szerinti keresésre. A találatok megadott szempontok szerint térképezhetők, táblázatos formában más alkalmazások (Microsoft Word, Microsoft Excel stb.) számára is kezelhető fájlformátumban menthetők. 3.2. A helynévtörténeti adattár kiépítése Korábban a fent említett NKFP-projektumban informatizáltuk és denotátumfajták szerint manuálisan annotáltuk SZABÓ T. ATTILA erdélyi történeti helynévgyűjtésének háromszéki részét. Jelen pályázatban a további, már megjelent kötetek feldolgozására vállalkozunk (Udvarhelyszék, Csík-Gyergyó, Kis- és Nagyküküllő, Alsófehér, Szilágy, Maros-Torda, TordaAranyos). A teljes anyag informatizálása és feldolgozása a 3.1. pontban leírtak szerint történik. A teljes feldolgozott anyag (megközelítőleg 2400 nyomtatott oldal) alapján előzetes becsléseink szerint mintegy 300.000 helynevet tartalmazó adattár jön létre, amelyet CD vagy DVD formájában teszünk közzé. A kötetek informatizálását VARGHA FRUZSINA SÁRA végzi, a helynevek kijelölése és manuális annotálása elsősorban BÁRTH M. JÁNOS feladata, PhD-hallgatók bevonásával. 4. Várható eredmények A tervezett munka eredményeit egy Budapesten rendezett nemzetközi workshop keretében igyekszünk ismertté tenni, és megosztani tapasztalatainkat e témák jeles külföldi kutatóival. A tanácskozás eredményeit önálló kötetben kívánjuk megjelentetni. A létrehozott adattárakat több formátumban is közzétesszük, ezzel elősegítve minél szélesebb körű használatukat. A kutatás új távlatokat nyit a történeti jelentőséggel bíró nyelvjárási hangfelvételek feldolgozásában, valamint a helynévtörténeti, lokalizálható forrásokkal dolgozó nyelvtörténeti kutatások számára. A kutatás lezárultával olyan adattárak jönnek létre, amelyek egyszerre lehetnek forrásai dialektológiai, névtani, nyelvtörténeti, szociolingvisztikai és fonetikai kutatásoknak, és hasznos adalékkal szolgálhatnak a történeti és a néprajzi kutatások számára is. Fontosnak tartjuk, hogy eredményeink ne csak a tudományág művelői számára válhassanak elérhetővé és használhatóvá. Ennek érdekében az interneten keresztül bárki számára elérhető közlemények publikálását tervezzük a feldolgozott anyagok alapján, amelyek reményeink szerint hamarosan nélkülözhetetlenek lesznek a dialektológia és a névtan közép- és felsőfokú oktatásában, és hozzájárulnak e tudományágak népszerűsítéséhez is. Kutatási eredményeink várhatóan más műhelyeket, kutatóhelyeket is arra ösztönöznek majd, hogy a miénkhez hasonlóan olyan formában dolgozzák fel és tegyék elérhetővé forrásaikat, amelyek egyszerre felelnek meg a dialektológiai, a nyelvtörténeti, a névtani, a szociolingvisztikai és a fonetikai kutatások támasztotta alapkövetelményeknek.
4
Hivatkozások BALOGH LAJOS – KISS GÁBOR 2002. Analitikus elemzési lehetőségek A magyar nyelvjárások atlaszának számítógépre vitt anyagán. In: SZABÓ GÉZA – MOLNÁR ZOLTÁN – GUTTMANN MIKLÓS szerk. IV. Dialektológiai Szimpozion. Szombathely, 41–54. BALOGH LAJOS – VÉGH JÓZSEF 1975. A magyar nyelvjárások atlaszához kapcsolódó hangfelvételek In: Deme László – Imre Samu szerk. A magyar nyelvjárások atlaszának elméletimódszertani kérdései. Akadémiai Kiadó, Budapest. 257–262. BÁRTH M. JÁNOS 2007. Háromszéki helynevek nyelvészeti elemzése informatikai módszerekkel. In HOFFMANN ISTVÁN–TÓTH VALÉRIA szerk. Helynévtörténeti tanulmányok 2. Debrecen, 207–217. BÁRTH M. JÁNOS 2007. Székelyföldi történeti helynevek névföldrajzi vizsgálata. Előadás a VI. Magyar Névtudományi Konferencián, Balatonszárszó, 2007. június 23. http://geolingua.elte.hu/about/eload/barth.ppt.htm BODÓ CSANÁD – VARGHA FRUZSINA SÁRA 2007. Régi nyelvatlaszok – új módszerek. Magyar Nyelv. megjelenés alatt. Bodó Csanád 2007. Követéses geolingvisztikai vizsgálat Moldvában. Előadás az V. Dialektológiai Szimpozionon, Szombathely, 2007. augusztus 22–24. http://geolingua.elte.hu/about/eload/bodocs_szombathely.htm Centre de Dialectologie de Grenoble, vezető: JEANINE ELISA MÉDÉLICE, honlap: http://w3.ugrenoble3.fr/dialecto/ Dialect Topography, vezető: JACK CHAMBERS, honlap: http://dialect.topography.chass.utoronto.ca/ European Corpus Phonology Group, honlap: http://www.corpho.eu/ GYÖRFFY GYÖRGY 1963–1998. Az Árpád-kori Magyarország történeti földrajza. I–IV. Budapest HAJDÚ MIHÁLY – KÁZMÉR MIKLÓS 1974. Magyar nyelvjárási olvasókönyv. Budapest HAJDÚ MIHÁLY és mtsai. 2005. Magyar nyelvjárási hangoskönyv I. (multimédiás CD-ROM) HAJDÚ MIHÁLY és mtsai. 2006. Magyar nyelvjárási hangoskönyv II. (multimédiás CD-ROM) HAJDÚ MIHÁLY és mtsai. 2007. Magyar nyelvjárási hangoskönyv III. (multimédiás CD-ROM) HOFFMANN ISTVÁN 1997. Utak, lehetőségek történeti helyneveink kutatásában. MNyTK. 209. Budapest-Miskolc, 227–236. HOFFMANN ISTVÁN szerk. 2005. Korai magyar helynévszótár, 1000–1350. 1. Abaúj-Csongrád vármegye (A Magyar Névarchívum kiadványai, 10.) Debrecen KATTENBUSCH, DIETER – KÖHLER, CAROLA – MÜLLER, MARCEL 1997–2007. Vivaio Acustico delle Lingue e dei Dialetti d'Italia. http://www2.hu-berlin.de/Vivaldi/ LABOV, WILLIAM – ASH, SHARON – BOBERG, CHARLES 2006. The Atlas of North American English: Phonetics, Phonology and Sound Change. Mouton de Gruyter, Berlin–New York MNyA. = DEME LÁSZLÓ – IMRE SAMU szerk. 1968–1977. A magyar nyelvjárások atlasza. I–VI. kötet. (A munkaközösség vezetője BÁRCZI GÉZA.) Budapest Romanische Variationslinguistik, vezető: HANS GOEBL , honlap: http://www.sbg.ac.at/rom/ag/variation/index.htm
5
TÓTH VALÉRIA 2001. Névrendszertani vizsgálatok a korai ómagyar korban. (Abaúj és Bars vármegye). A Magyar Névarchívum Kiadványai 6. Debrecen VARGHA FRUZSINA SÁRA 2007a. Nyelvjárási és helynévtörténeti anyagok számítógépes feldolgozása. Előadás a Kontextus – Filológia – Kultúra II. konferencián, Besztercebánya, 2007. május 30. http://varghafr.web.elte.hu/VarghaFr_Beszterce.ppt.htm VARGHA FRUZSINA SÁRA 2007b. Állatok kicsinyeinek megnevezése a keleti magyar nyelvjárásokban. In: HOFFMANN ISTVÁN – JUHÁSZ DEZSŐ szerk. Nyelvi identitás és a nyelv dimenziói. Nemzetközi Magyarságtudományi Társaság Debrecen-Budapest, 2007. 237–248. VÉKÁS DOMOKOS 1999. Informatikai lehetőségek a dialektológiában, különös tekintettel a fonetikai szempontokra. Budapest: ELTE Fonetikai Tanszék. http://www.btk.elte.hu/fonetika/p/s/fonszem.html VÉKÁS DOMOKOS 2000. Magánhangzó-rendszerek elemzése informatizált nyelvjárási korpuszon. In: GÓSY MÁRIA szerk. Beszédkutatás 2000. Beszéd és társadalom. Budapest, 75– 86.
6