Korpusznyelvészet és fordítástudomány
Á"ekintés • Töbnyelvű korpuszok - szövegpárhuzamosítás • az emberi fordítás gépi támogatása elektronikus szótárak, terminológiai adatbázis/ terminológia kezelő, fordítómemória, előfordító rendszerek • gépi fordítás • a fordítástudományban honos korpusz alapú kutatások FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
2
Többnyelvű korpuszok
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
3
A többnyelvű korpuszok haszna a FordTud-‐ban? • • • • • •
terminólógia adatbankok fordítómemória két-‐ és többnyelvű szótárak két-‐ és többnyelvű konkordanciák gépi fordítás fordítók képzése, fejlesztése
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
4
Párhuzamos korpusz • autenKkus szövegek + ezek fordítása • egyirányú/kéKrányú, több nyelvpár • párhuzamosítoP: mondat/szó szinten
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
5
Párhuzamos korpusz
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
6
Párhuzamos korpusz
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
7
EUR-‐Lex • ingyenes hozzáférést biztosít az Európai Unió joganyagához és más dokumentumokhoz • 23 hivatalos nyelven • 2 815 000 dokumentum
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
8
The English-‐Norwegian Parallel Corpus
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
9
The English-‐Norwegian Parallel Corpus
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
10
The English-‐Norwegian Parallel Corpus
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
11
The English-‐Norwegian Parallel Corpus
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
12
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
13
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
14
Párhuzamos korpusz The English-‐Norwegian Parallel Corpus hPp://www.helsinki.fi/varieng/CoRD/corpora/ ENPC/ • szófaj szerint címkézeP (tagged for part of speech = POS)
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
15
Párhuzamos korpusz • English-‐Norwegian Parallel Corpus • Parallel Corpora in Uppsala • CroCro Corpus mondaKllesztéssel párhuzamosítoP korpuszok • Aligned Hansards of the 36th Parliament of Canada • European Parliament Proceedings 1996-‐2001 FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
16
MondaKllesztéssel párhuzamosíto" korpusz
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
17
Fordítási korpusz két eltérő felfogás: 1. S. Johansson 1998 – a párhuzamos korpusz helyeP (FNYSZ – CNYSZ) 2. Baker 1995 -‐ csak az adoP nyelvre fordítoP szövegek
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
18
Fordítási korpusz • Corpus of Translated Finnish (CTF) • The TranslaKonal English Corpus (TEC) hPp://www.monabaker.com/tsresources/ TranslaKonalEnglishCorpus.htm • currently (2003) around 10 million words • The TEC corpus browser
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
19
Összehasonlító korpusz • AutenKkus szövegek több különböző nyelven • a szövegek hasonlóak/összehasonlíthatóak -‐ több szempontból – nehezen megvalósítható: • szövegkpus • forma • tárgy • keletkezési idő FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
20
Összehasonlító korpusz • sokszor meglévő 1 nyelvű korpuszok felhasznlása pl. ritkán vagy soha nem fordítoP szövegfajták esetében: • autenKkus beszlétnyelv • rádió adások • turiszKkai szövegek • céges szórólapok FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
21
Többnyelvű párhuzamos korpusz • adoP nyelv szövegei lefordítva több különböző nyelvre • Pedant Corpus (Danielsson/Ridings 1996) • Oslo MulKlingual Corpus (S. Johansson 1997) • TripKc Corpus (Paulussen 1999) English-‐Dutch-‐ French
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
22
Oslo MulKlingual Corpus • egyes szövegpárok tanulmányozása • egy lexikai elem vagy kifejezés különböző fordításainak tanulmányozása
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
23
Fordítástámogatás • fully automaKc MT – teljesen automaKkus gépi ford • human aided MT – ember támogaPa gépi ford • machine aided HT – gép támogaPa emberi ford
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
24
Emberi fordítás gépi támogatása • • • • •
elektronikus szótár terminológia kezelő fordítómemória előfordító remdszer CAT-‐eszközök: – a fordítómemória (translaKon memory, TM) – a terminológiai adatbázis (terminology management) – szövegpárhuzamosító eszköz (alingment tool)
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
25
Gépi fordítás • nyelvtechnológiai alkalmazás, amelynek célja a természetes nyelvek közöo fordítás folyamatának automaKzálása • a teljes eljárást automaKzáló programok / fordítástámogató eszközök = egyes részfeladatok végrehajtása a felhasználó közreműködésével
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
26
Gépi fordítás • szabályalapú / korpuszalapú (staKszKkai) hPp://www.webforditas.hu/ hPp://translate.google.hu/# • korpuszalapú : mondatonként vagy szavanként megfelelteteP szövegek ➢ fordítás = legjobban hasonlító minta célnyelvi megfelelője FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
27
Korpuszalapú fordításkutatás (Corpus-‐based translaKon studies) • Baker (1993, 1995, 1996) • • • • • • •
Laviosa (1997, 1998, 2002) Kennedy (1998) Tymoczko (1998) Stubbs (2001) Kenny (2001) Olohan (2004) Teubert (2007)
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
28
Korpuszalapú fordításkutatás Baker (1993) A korpuszban összegyűjtöP szövegek: • a ténylegesen használt nyelv megtestesülései • a nyelvi viselkedés természetes megvalósulásai • a nyelvész beleavatkozása nélkül jöPek létre
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
29
Korpuszalapú fordításkutatás Baker (1993) A korpuszalapú megközelítés • empirikusan közelíK meg a nyelv leírását • ragaszkodik a hiteles használaK előfordulások elsődlegességéhez • legfontosabb feladata a fordítás eredményeként létrejöP szöveg tulajdonságainak leírása
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
30
A korpuszalapú vizsgálatok szerepe a fordítástudományban (McEnery and Xiao, 2007) • kulcsfontosságúak a nem angol korpusznyelvészet számára (ázsiai nyelvek) • általuk új szempontokra figyel fel a komparakv nyelvészet (ezek nem merülnek föl egynyelvű korposzok vizsgálatakor)
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
31
A korpuszalapú vizsgálatok szerepe a fordítástudományban (McEnery and Xiao, 2007) • kibőviKk a nyelvek kulturális és nyelvi jellemzőire vonatkozó ismereteinket • megvilágítják a célnyelvi-‐ és forrásnyelvi, valamint az autenKkus-‐ és fordítoP szövegek közöo különbségeket • alkalmazásuk számos területen hasznos (lexikográfia, nyelvoktatás, fordítás) FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
32
Párhuzamos korpuszok felhasználsa a fordításkutatásban (Klaudy 2005) • szövegkorpuszok felfedezése → a normakv tudományból, deskripkv tudumány • a fordítoP szöveg: nem rontoP szöveg, önmagában is érdekes kutatási tárgy • 2 eredmény: a FNYSZ primátusa megszűnik, a CNYSZ mint kutatási tárgy előtérbe kerül
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
33
Párhuzamos korpuszok felhasználsa a fordításkutatásban (Klaudy 2005) • párhuzamos: megmutatja a ruKnos fordítók megoldásait pl. Hansard – szó-‐ és mondatkonkordancia • többnyelvű: a CNY elemiet természetesebb környezetben lehet vizsgálni, a jellemző lexikai kapcsolódásokat, szerkezeK mintákat
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
34
A fordíto" szövegek lexikai jellegzetességének kimutatása Baker 1995: • bizonyos szavak gyakrabban a FK-‐ban • bizonyos szavaknak más a jellegzetes környezete a FK-‐ban • a NFK bizonyos szavai nem fordulnak elő a FK-‐ ban • idegen szavak használatában eltér a FK és NFK FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
35
A fordíto" szövegek lexikai jellegzetességének kimutatása Klaudy 1986: • különbség a mondat grammaKkai tagolásában és a szöveg aktuális tagolásában • → csökken a ford. magyar szövegek kohéziója, megterhelést jelent a mondanivaló kihámozása
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
36
Vizsgált kérdések • Vannak-‐e a fordítoP szövegeknek olyan ált. tulajdonságai, amelyek megkülönbözteKk az autenKkus szöv.produkciótól? • → Baker 1993, 1996 • Vannak-‐e fordítási univerzálék? konf. 2001 • Baker 1993 – fordítási univerzálék az intuició és manuális elemzések alapján -‐ ezt kell korpuszokkal bizonyítani v. cáfolni • bizonyos nyelvi jellegzetességek eloszlása más, mint az autenKkus szövegekben (kohéziós eszk. Blum-‐Kulka, 1986) FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
37
FordTud kutatások Aijmer/Simon-‐Vandenbergen (2003) translaKons of well into Swedish and Dutch • English-‐Swedish Parallel Corpus • Oslo MulKlingual Corpus • TripKc Corpus
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
38
Aijmer/Simon-‐Vandenbergen (2004)
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
39
FordTud kutatások Heyvaert (1998) non-‐agenKve deverbal –er nominalisaKons in English and Dutch (such as bestseller) • COBUILD Corpus • Dutch INL (InsKtuut voor Nederlandse Lexicologie) Corpus
FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
40
FordTud kutatások Kenny (1998, 2001) creaKvity in translaKon, lexical creaKvity • German-‐English Parallel Corpus of Literary Texts (GEPCOLT) Holmes (1988); Laviosa (2002) general features of translated texts (explicitaKon, simplificaKon, normalisaKon) • The TranslaKon English Corpus (TEC) FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
41
FordTud kutatások • Doherty 1999: informaKon structure in English and German texts • Hasselga°rd 1998: themaKc structure • Steiner 2002, 2004: informaKon packaging for English-‐German • Fabricius-‐Hansen 1999: : informaKon packaging for German-‐English and German-‐ Norwegian FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
42
FordTud kutatások • Johansson 1995: explicitaKon in English and Norwegian parallel texts • Hansen-‐Schirra/Neumann/ Steiner 2006: the relaKon between explicitness/explicitaKon and cohesion in German-‐English and English-‐ German translaKons • Baker 2000, Olohan 2004: translator’s style • Mauranen 1997: intercultural issues FTK_PHD 2011.
Seidl-Péch Olívia: Korpusznyelvészet és fordítástudomány
43