MASARYKOVA UNIVERZITA FILOZOFICKÁ FAKULTA
Ústav českého jazyka
BAKALÁŘSKÁ DIPLOMOVÁ PRÁCE
2015
Matouš Ejem
MASARYKOVA UNIVERZITA FILOZOFICKÁ FAKULTA
Ústav českého jazyka Český jazyk se specializací počítačová lingvistika Matouš Ejem
Anglické žákovské korpusy BAKALÁŘSKÁ DIPLOMOVÁ PRÁCE
Vedoucí práce: RNDr. Miloš Jakubíček 2015
Prohlášení Prohlašuji, že tato bakalářská diplomová práce je mým původním autorským dílem, které jsem vypracoval samostatně. Všechny zdroje, prameny a literaturu, které jsem při vypracování používal nebo z nich čerpal, v práci řádně cituji s uvedením úplného odkazu na příslušný zdroj.
Matouš Ejem
i
Poděkování Děkuji Bohu, že stojí při mně, a rodině za podporu.
ii
Obsah Úvod
1
1
Vymezení pojmů, terminologie
3
2
Teoretické přístupy k nabývání druhého jazyka
6
3
Chyba v žákovském jazyce 11 3.1 Pokusy o definování chyby . . . . . . . . . . . . . . . . . . 11 3.2 Od behaviorizmu ke konceptu mezijazyka . . . . . . . . . . 12 3.3 Chybová analýza . . . . . . . . . . . . . . . . . . . . . . . 14
4
Role žákovských korpusů ve výzkumu nabývání druhého jazyka 17 4.1 Korpusová lingvistika . . . . . . . . . . . . . . . . . . . . . 17 4.2 Žákovské korpusy . . . . . . . . . . . . . . . . . . . . . . . 18
5
Dostupné anglické žákovské korpusy 23 5.1 Sketch Engine . . . . . . . . . . . . . . . . . . . . . . . . . 23 5.2 Získané korpusy . . . . . . . . . . . . . . . . . . . . . . . . 23 5.3 Společné anotační schéma . . . . . . . . . . . . . . . . . . . 26
Závěr
27
iii
Úvod Existuje oblast, ve které se prolínají lingvistika, jejímž předmětem zájmu je jazyk a jeho fungování, informatika, která se zabývá zpracováním informací, a pedagogika, jako věda o vzdělávání. Touto oblastí jsou žákovské korpusy. Žákovský korpus není v tomto kontextu ani tělo žáka základní školy, ani kulinářský polotovar, který by takový žák využil při výrobě dortu. A pravděpodobně ani nic jiného, co by napadlo člověka, který se s tímto pojmem nikdy nesetkal. Pojmem žák budeme označovat člověka, který se učí nějakému cizímu jazyku. Zkuste si představit, že škola, nebo jiná instituce, na níž probíhá výuka cizího jazyka, bude sbírat slohové práce studentů, které napsali v cizím jazyce, kterému se učí. Nebo se můžou sbírat nahrávky jejich ústního projevu. Jinými slovy, někdo posbírá to, co vyprodukovali žáci. Všechno se potom uloží do počítače, přidají se k tomu nějaké informace o žácích, o sebraném materiálu, případně se vyznačí, kde jsou chyby a jak by se měly opravit. Pomocí nějakého programu se můžou doplnit další informace, například o slovních druzích. Tomu, co vznikne, se potom říká žákovský korpus. Pomocí jiných programů mohou potom jazykovědci nebo učitelé získávat z korpusu informace o tom, jak vypadá jazyk nerodilých mluvčích, které chyby dělají nejčastěji a podobně. Každý čtenář by tedy nyní měl mít nějakou základní představu, co to jsou žákovské korpusy, kterými se tato práce zabývá. Měl by také chápat, že žákovské korpusy jsou nástrojem, který staví na lingvistických a informatických základech a který může být užitečný lingvistice a pedagogice. Studentům mého oboru bylo řečeno, že jsme především lingvisté a že je tak nás obor koncipován. Proto se v této práci snažím na tuto problematiku pohlížet především z pohledu lingvistiky. Cílem této práce je poskytnout základní orientaci v oblastech nabývání druhého jazyka a s tím souvisejícími žákovskými korpusy. Také se pokusím získat volně dostupné žákovské korpusy a sezná1
mím se s jejich obsahem a způsobem tvorby. Nakonec se pokusím navrhnout společné anotační schéma a připravit korpusy pro indexaci v korpusovém manažeru Sketch Engine. Aby bylo jasné, o čem se mluví, nejprve si definujeme termíny. Potom se podíváme, jak se vyvíjely teoretické přístupy k nabývání jazyka v posledních desetiletích. V další kapitole se budeme zabývat pojmem chyba: co to vlastně je a jak se proměňovalo chápání chyby v souvislosti s vývojem teorií. Poté se podíváme, jak souvisejí výzkumy v oblastech nabývání druhého jazyka a jazykového vyučování s korpusovou lingvistikou a blíže se podíváme na to, co je to žákovský korpus. Nakonec shrnu výsledky mého snažení získat volně dostupné korpusy, analyzuji je a vyjádřím se ke společnému anotačnímu schématu.
2
1 Vymezení pojmů, terminologie první jazyk, mateřský jazyk (first language, native language, mother tongue, L1) Termín první jazyk označuje jazyk, který se jedinec naučil jako první. Mateřský jazyk je jazyk, kterým mluvila matka jedince, v širším slova smyslu je to jazyk, kterým mluvili ti, od nichž se jedinec jazyku naučil, jazyk, kterému byl jedinec vystaven v kritickém období. V podstatě tyto dva pojmy označují tu samou skutečnost, takže se mezi nimi nerozlišuje. Takových jazyků může být více, pokud například jedinec pochází z bilingvního či jiného multilingvního prostředí, tj. není zřejmé, kterému jazyku se naučil dříve, respektive v kritickém období byl vystaven více jazykům. druhý jazyk (second language, L2) Druhý jazyk je jazyk, který jedinec na nějaké úrovni ovládá, ale není jeho prvním jazykem. cizí jazyk (foreign language, FL) Cizí jazyk je jazyk, který se neužívá v prostředí, ve kterém se jedinec pohybuje. Cizí jazyk je podle některých autorů (Ellis, 1994) zvláštním případem druhého jazyka. osvojování jazyka, akvizice (language acquisition) Termíny osvojování jazyka nebo akvizice označujeme proces získávání schopnosti rozumět jazyku a používat ho. Často se mluví o osvojování druhého jazyka (second language acquisition), v literatuře se používá zkratka SLA. učení se jazyku (language learning) Termín učení se jazyku označuje vědomou aktivitu jedince, která má za cíl naučit se nějakému jazyku. nabývání jazyka Nabývání jazyka je pojem nadřazený pojmům osvojování jazyka 3
1. Vymezení pojmů, terminologie a učení se jazyku. cílový jazyk (target language, TL) Cílový jazyk je jazyk, kterého jedinec nabývá, který chce ovládat. žák (learner) Jelikož čeština nemá žádný rozumný ekvivalent anglického learner, budu používat termín žák. Označuje se jím jedinec, který se učí cílovému jazyku. Ačkoli je slovo žák kvůli svým konotacím možná trochu matoucí, budu ho používat zejména kvůli konzistenci s dalšími termíny, které se v českém prostředí už používají (viz Štindlová, 2013). žákovský jazyk, mezijazyk (interlanguage) Žákovský jazyk nebo také mezijazyk (interlanguage) je jazyk nerodilého mluvčího, tedy jedincův druhý jazyk. korpus Termínem korpus (jazykový korpus) se označuje počítačem zpracovatelná kolekce textů určitého jazyka, která obvykle obsahuje navíc nějaké metainformace k originálnímu textu. anotace, značkování, tagování Anotací se označuje proces i výsledek přiřazování metainformací k textu, kterým se říká značky nebo tagy. Přidáním anotací značně narůstá hodnota korpusu pro uživatele. žákovský korpus (learner corpus) Žákovský korpus je korpus, který sestává z textů v žákovském jazyce. V českém prostředí se lze setkat také s označením studijní korpus (Čermák, 2004). Přikláním se spíše k označení žákovský korpus a spojení studijní nebo studentský korpus nepovažuji za nijak vhodnější (evokují zase významy spojené se studiem nebo se studenty). anglický žákovský korpus A konečně termínem anglický žákovský korpus míním žákovský 4
1. Vymezení pojmů, terminologie korpus, který je v angličtině, angličtina je zde cílovým jazykem autorů textů obsažených v korpusu. jazykový vstup (input) Termínem jazykový vstup se označuje působení jazyka na jedince. jazykový výstup (output) Jazykový výstup je souhrnné označení pro jazykovou produkci jedince.
5
2 Teoretické přístupy k nabývání druhého jazyka V této kapitole jsem vycházel převážně z knihy Žákovský korpus češtiny a evaluace jeho chybové anotace (Štindlová, 2013). Původní text jsem se snažil zestručnit, zpřehlednit, zjednodušit a případně doplnit nebo opravit. V oblasti nabývání druhého jazyka můžeme pozorovat velký rozptyl teoretických hledisek. Je to dáno zejména tím, že nabývání jazyka je komplexní proces, k jehož porozumění je potřeba mezioborová spolupráce. Z hlediska historického můžeme vymezit tři hlavní proudy: •
behaviorální;
•
kognitivně-komputační – nejčastěji uplatňovaný;
•
dialogický – nebo také psychologický, sociálně-kognitivní, kulturní, hermeneutický přístup; někdy je považován za nevědecký (Johnson, 2004).
Trochu bokem stojí teorie chaosu, která představuje posun k novému paradigmatu. Teorie orientované behaviorálně pohlížejí na nabývání jazyka jako na formování jazykového chování (habit formation). Klade se zde důraz na roli prostředí a jazykového vstupu, ovšem podceňují se interní mechanizmy, mentální procesy budování jazykové dovednosti. Na jazyk se pohlíží jako na strukturu (nejspíš pod vlivem strukturalizmu). Behaviorální přístup dal základ pro vznik kontrastivní analýzy, která věnuje pozornost transferu od prvního jazyka k druhému, respektive vlivu prvního na druhý. Nedostatky tohoto přístupu vedly k hledání jiného rámce. Někteří badatelé (Corder, 1967; Nemser, 1971; Selinker, 1972) začali na přelomu šedesátých a sedmdesátých let poukazovat na to, že žákovský jazyk je systematický a chyby, které se v něm objevují, poukazují 6
2. Teoretické přístupy k nabývání druhého jazyka na pravidly řízené chování. Předpoklad, že si žák internalizuje mentální gramatiku, přirozený jazykový systém, který se má svá pravidla, vedl k rozvíjení konceptu mezijazyka. Podstatný vliv na změnu přístupu teorií zabývajících se nabýváním jazyka měl Chomsky (1959) a jeho kritika textu Verbální chování (Skinner, 1957), která byla obecně kritikou behaviorizmu a ve které Chomsky představil ideu biologické predispozice k jazyku. Problémem behaviorálních teorií bylo podle něho to, že nedokázaly vysvětlit takzvaný logický problém akvizice: Jak je možné, že si dítě dokáže osvojit v tak krátkém čase tak komplexní systém gramatických pravidel jazyka? Lingvistická data, která poskytuje jazykový vstup, nejsou k osvojení tak složitého systému dostatečná. Tomuto argumentu se říká argument nedostatku podnětů (the poverty of stimulus argument). Chomsky se snaží tento problém vyřešit pomocí konceptu univerzální gramatiky (UG), tedy předpokladu, že každý člověk má znalost základní gramatické struktury společnou všem lidským jazykům. Začalo se tedy zkoumat, do jaké míry je mezijazyk vázán principy univerzální gramatiky, tedy zda se žákova gramatika jeho mezijazyka řídí obdobným způsobem, jako gramatika rodilého mluvčího. Ovšem výsledky zkoumání jsou nejednoznačné. Zatímco White (2003) vidí univerzální gramatiku jako nejvhodnější teoretický rámec pro nabývání druhého jazyka, protože žák má k UG bezprostřední přístup, jiní autoři (Bley-Vroman, 1983; Schachter, 1990; Jackendoff, 2003) akceptují roli UG v nabývání prvního jazyka, ale poukazují na to, že pro nabývání druhého jazyka není tento koncept přijatelný, protože je pevně spjat s hypotézou kritického období. Schwartz (2000) a jiní převádějí logický problém akvizice na rovinu osvojování druhého jazyka a navrhují, že důvodem disproporce mezi jazykovým vstupem a výstupem je vliv prvního jazyka na druhý, tedy že UG zde působí nepřímo. Později se debata přesunula k povaze mezijazyka a odlišnostem jeho gramatiky od gramatiky prvního jazyka. Podstatný je zde počáteční stav (initial state) mezijazyka, tedy zda a jakým způsobem se gramatika tohoto mezijazyka utváří pod vlivem gramatiky prvního
7
2. Teoretické přístupy k nabývání druhého jazyka jazyka. (White, 2003) Stephen Krashen (1981) představil teorii zpracovanou cíleně pro problematiku osvojování druhého jazyka (SLA), která se stala jednou z nejvlivnějších teorií v tomto oboru, přestože byla mnohokrát kritizována (např. McLaughlin, 1978; White, 1987, aj.). Krashen nahlíží na jazyk jako na vrozenou schopnost, učení se jazyku vnímá jako kreativní proces a základem teorie SLA je postupné zpracovávání jazykového vstupu pomocí vrozených mechanizmů. Svůj model vymezil pěti hypotézami: hypotéza osvojování–učení se (acquisition–learning hypothesis) Rozlišuje se mezi podvědomým osvojováním jazyka, které je možné díky nějaké vrozené predispozici, podobně jako navrhoval Chomsky (Krashen mluví o language acquisition device), a vědomým učením se jazyku, které se provozuje především při výuce ve školách. hypotéza monitoru (monitor hypothesis) Osvojování jazyka je monitorováno pomocí učení se. Učení se jazyku nemůže být zdrojem spontánního jazykového projevu, nýbrž slouží ke korigování jazykového výstupu. hypotéza jazykového vstupu (input hypothesis) Podle této hypotézy je k nabývání jazyka potřeba dostatečného množství jazykového vstupu. Aby to ovšem mělo nějaký efekt, je nutné, aby byl vstup studentovi srozumitelný (comprehensible input). hypotéza přirozeného pořádku (natural order hypothesis) Nabývání jazyka je postupné a existuje nějaký přirozený pořádek osvojování jazykových pravidel, který je společný všem studentům. hypotéza afektivního filtru (affective filter hypothesis) Srozumitelný jazykový vstup nepřinese žádné výsledky, pokud je odfiltrován kvůli nepříjemným emocím jako strach, podceňování se nebo nízká motivace. 8
2. Teoretické přístupy k nabývání druhého jazyka Kromě rozvíjení nativistických teorií, vycházejících z předpokladu vrozené schopnosti člověka osvojit si jazyk, se v současných teoriích odráží kognitivní perspektiva v lingvistice. V nynějších výzkumech se projevuje napětí mezi dvěma přístupy. Jeden z nich bychom mohli nazvat jako psychologický a druhý jako sociálně-kognitivní. Podle Tarone (1995) tam, kde se psycholingvisté při výzkumu zaměřují na izolovaná individua, sociolingvisté mají tendenci chápat individua pouze jako reprezentanty jazykové komunity, ve které se vyskytují. Studium psychologických aspektů vztahujících se k nabývání druhého jazyka je jedním z hlavních přístupů v současném uvažování. Mnoho akvizičních modelů se zabývá kognitivními procesy jako pozornost, paměť, mentální reprezentace informací a jejich zpracování. Tyto modely odmítají koncept vrozené jazykové predispozice, tedy myšlenku nějakého neurologického modulu pro osvojování jazyka. Z předpokladu, že informace lze členit na elementy, mezi kterými existují různě silné spoje, vychází tzv. konekcionizmus. Tyto elementy vytvářejí konekcionistické, neuronové sítě, jež umožňují paralelní zpracování údajů. V kontextu nabývání jazyka to znamená, že žák vystavovaný jazykovému vstupu si buduje znalost jazyka vytvářením sítě mezi jednotlivými elementy, kterými jsou jazykové rysy. V závislosti na vstupu jsou spoje mezi elementy buď posilovány, nebo oslabovány. Nabývání jazyka je tedy z tohoto pohledu simultánní zpracování zkušenosti, jejíž opakování má za výsledek posílení spojů. Tento přístup je podporován předpokladem, že jazyk je osvojován spíše po větších blocích než po jednotlivých slovech (Lightbown, 2006). Ovšem studie, které vycházejí z tohoto přístupu, se často zabývají nabýváním znalosti lexika a gramatických morfémů. Na konekcionizmu staví tzv. kompetiční model (competition model), který odmítá představy o univerzální gramatice a jim podobné a namísto toho chápe nabývání jazyka jako proces učení založený na univerzáliích kognitivního procesu. Nezabývá se pouze jazykovou formou, ale také významy a praktickým užíváním jazyka. Základním principem teorie je vstupem řízené učení (input-driven learning) založené na síle tzv. podnětů (cues), které v jazyce signalizují určité funkce. Síla
9
2. Teoretické přístupy k nabývání druhého jazyka těchto podnětů může být různá v prvním a v druhém jazyce. Firth a Wagner (Firth, 1997) odmítli psycholingvistický přístup, který je podle nich příliš „individualistický a mechanický“ a na žáka pohlíží jako na inherentně defektního mluvčího, a navrhli „rekonceptualizaci SLA jako sociokognitivního a kontextuálně orientovaného procesu“. Jejich návrhy byly ale poté řadou psycholingvistů podrobeny ostré kritice. Sociálně-kognitivní teorie navazují na teorie ze sedmdesátých let, které se objevily jako alternativa k teoriím behavioristickým a teoriím založeným na univerzální gramatice. Například akulturační model (Schumann, 1978), který chápe nabývání druhého jazyka jako proces adaptace na novou kulturu, vymezuje stupeň psychologické a sociální vzdálenosti prvního a druhého jazyka a zkoumá proces pidžinizace, který nastává v případě, že žák při akulturaci selže. Zajímavé jsou dopady původně matematické a fyzikální teorie chaosu. Teorie chaosu se zabývá chováním nelineárních dynamických systémů a jazyk lze chápat jako takovýto systém. Nabývání jazyka je zde sledováno spíše z vývojové perspektivy, proto se v tomto kontextu používá termín vývoj znalosti druhého jazyka (second language development), protože tento termín lépe demonstruje množství dynamicky propojených procesů, včetně osvojování i ztráty. Teorie chaosu představuje ve vědě důležitý mezník, mluví se proto o ní jako o počátku nové vlny v analýzách SLA, nebo jako o počátku nástupu nového paradigmatu (Larsen-Freeman, 2002; De Bot, 2007). Tento přístup přistupuje k vývoji jazykové znalosti jako k procesu, který je dynamický, nelineární, adaptivní, interaktivní a nevratný (v tom smyslu, že opakovaná aplikace nějaké procedury nemusí mít vždy stejný efekt), vyplývající zároveň z vnější interakce i vnitřní reorganizace.
10
3 Chyba v žákovském jazyce 3.1 Pokusy o definování chyby Nedílnou součástí nabývání druhého, respektive cizího jazyka, jsou chyby. Přesně definovat, co je to chyba v jazyce nerodilého mluvčího, ale není snadné, protože chápání chyby je do značné míry subjektivní. Mohli bychom říct, že chyba je to, co za chybu označí rodilý mluvčí, tím se ale dostaneme do problému, protože sami rodilí mluvčí jsou nejednotní v tom, zda se chyba vyskytla a jak moc je závažná. To vyplývá z výzkumu, který provedli Hughes a Lascaratou (Hughes, 1982), ve kterém zkoumali shodu při identifikaci chyb a při hodnocení jejich závažnosti. Běžnou definicí chyby ve výzkumech nabývání druhého jazyka je, že chyba je odchylka od normy cílového jazyka. S touto definicí ale vyvstává otázka, jaká podoba cílového jazyka by měla sloužit jako norma. Spisovná podoba jazyka určitě není vhodná pro posuzování žákovy orální produkce, na druhou stranu ani mluvená podoba nemůže být z pochopitelných důvodů použita. V současných výzkumech nabývání druhého jazyka zůstává tedy norma nejednoznačně vymezená a mluví se o normě rodilého mluvčího (Faerch, 1978). Dalším problém při definici chyby je to, že většina vysvětlení se zaměřuje na chyby v produkci, ale opomíjí se chyby v recepci. Těžko lze vysvětlit chybu v recepci neznalostí pravidel, pokud výpověď nebyla pochopena. Následuje seznam několika definicí chyby od různých autorů: •
„Použití jazykových jednotek takovým způsobem, který podle pokročilých uživatelů (fluent users) indikuje chybu nebo nedostatečné učení.“ (Chun, 1982, s. 538)
•
„Chyba se objeví vždy, když mluvčí selže při aplikaci modelů variant promluv, které používají vzdělaní lidé v současných anglicky mluvících zemích.“ (Liski, 1983, s. 227)
•
„Popis takového znaku žákovského projevu, který se liší od 11
3. Chyba v žákovském jazyce projevu rodilého mluvčího.“ (Corder, 1967, s. 26) •
„Defektní stránka žákovské řeči, která se odchyluje od nějakého vybraného standardu jazykové performance dospělých.“ (Dulay, 1982, s. 130)
•
„Lingvistické formy nebo kombinace forem, které by ve stejném kontextu a za obdobných podmínek produkce rodilý protějšek s velkou pravděpodobností nepoužil.“ (Lennon, 1991)
•
„Chyba není odchylkou od jazykové normy, nýbrž zkušenost, že se nějaký komunikační záměr nedá prosadit zvolenými prostředky.“ (Piepho, 1974, s. 20)
Některé definice jsou docela dobré, jiné méně, protože třeba nejsou vůbec jednoznačné. Celé to ale ve své rozmanitosti ilustruje, že vymezení pojmu chyba není jednoduché.
3.2 Od behaviorizmu ke konceptu mezijazyka V historii byla chyba v žákovském jazyce vnímána jako jazykový jev, který se odchyluje od lingvistických pravidel mainstreamové podoby jazyka, tedy od té, kterou mluví rodilí mluvčí. Chyba byla vnímána jako něco negativního a nechtěného, jako selhání v učení se jazyku. Zejména z pohledu behaviorismu, respektive teorie operantního podmiňování, je chyba jevem, kterému je třeba se vyhýbat, protože nejen provedení, ale i pouhá registrace chyby posiluje v mozku nechtěné spoje (Skinner, 1957). Do konce šedesátých let dvacátého století bylo nabývání druhého jazyka chápáno jako formování nových jazykových návyků. Mnohé chyby potom byly chápány jako přetrvávání návyků z užívání prvního jazyka. Z chápání nabývání druhého jazyka jako jazykového chování vychází kontrastivní analýza, tedy porovnávání prvního a druhého jazyka, které mělo umožnit vysvětlení a anticipaci žákovských chyb. Myšlenka působení prvního jazyka na druhý vychází z pozorování, že 12
3. Chyba v žákovském jazyce žáci pocházející ze stejného jazykového prostředí dělají podobné chyby (Lado, 1957). Jednotlivé kroky kontrastivní analýzy popsal Whitman (1970): 1.
formální popis prvního a cílového jazyka;
2.
výběr jazykových oblastí a jevů pro detailnější komparaci;
3.
srovnání, tj. identifikace podobností a rozdílů;
4.
predikce chyb.
Pokus o formální popis jazyků představili například Stockwell, Bowen a Martin (Stockwell, 1965) ve své hierarchii obtížnosti (hierarchy of difficulty), kterou aplikovali na angličtinu a španělštinu a předpokládali její obecné využití. Eckman (1977) navrhl o něco později modifikaci této hierarchie v hypotéze diferenciálu příznakovosti (markedness differential hypothesis), která předpokládá, že příznakové jazykové jednotky jsou pro osvojení náročnější než bezpříznakové. Teorie příznakovosti sice nabízí o něco sofistikovanější metody predikce chyb v žákovském jazyce, pořád je ale závislá na subjektivní klasifikaci. Ovšem aplikace těchto návrhů nepřinesla kýžené výsledky a v některých případech byly dokonce predikovány úplně jiné chyby, než se nakonec objevily. (např. Gradman, 1971, aj.) Ač byl tento přístup často kritizován, jeho pozitivním přínosem bylo to, že přesunul pozornost na přechod od prvního jazyka k druhému, na tzv. transfer, a chyby byly vysvětlovány jako důsledek transferu. Později se chápání chyby proměňuje. Nabývání druhého jazyka se začíná chápat jako kreativní proces konstruování systému, při kterém žáci testují své hypotézy o cílovém jazyce. Chyby jsou tedy chápány nikoliv negativně jako povrchové deviace, ale jako důkaz žákovy snahy o vytvoření pravidly řízeného jazykového systému a tím umožňují sledovat žákovo zpracování jazykového vstupu. Jinak řečeno, na žákovský jazyk již není pohlíženo jako na nedokonalou podobu cílového jazyka, ale jako na legitimní jazykový systém, který prochází vývojem a který je projevem tvořivého přizpůsobování se jazykovému prostředí. 13
3. Chyba v žákovském jazyce Nemser (1971), který se zabýval fonetikou a fonologií žákovského jazyka, mluví o žákovském mezijazyku jako o aproximativním systému, čímž vystihuje jeho přibližování se cílovému jazyku. Corder (1967) o něm zase mluví jako o idiosynkratickém dialektu, čímž zdůrazňuje tu vlastnost žákovského jazyka, že je autentickým systémem vlastním jeho mluvčímu. Na ně navazuje Selinker (1972), který zavedl termín mezijazyk (interlanguge), který se ujal. Selinker popisuje mezijazyk jako samostatný systém, který je přechodem od prvního jazyka k druhému. Na žáka se tedy už nenahlíží jako na pasivního příjemce, ale jako na aktivní jednotku, která sama vytváří gramatická pravidla na základě už osvojených pravidel prvního jazyka a postupně je upravuje a přibližuje se tak cílovému jazyku. Chyba tedy ukazuje, jak žák pravidlům rozumí, a zároveň slouží jako konstrukční prvek, který mu pomáhá posouvat se v internalizaci gramatických pravidel (Brown, 1987). Od kontrastivní analýzy se tedy výzkumy přesunuly ke studiu chyb, které se dostaly do centra pozornosti.
3.3 Chybová analýza V reakci na pouze částečnou a diskutabilní úspěšnost kontrastivní analýzy se v souvislosti s nástupem nativizmu se etabloval nový přístup: chybová analýza. Ta na rozdíl o kontrastivní analýzy nepovažuje žákovský jazyk za nedokonalou verzi cílového jazyka, ale vnímá ho jako klíč k porozumění procesu osvojování jazyka. Chybová analýza také nedává chyby do souvislosti s komparací jazyků, ale srovnává žákovskou podobu jazyka s cílovým jazykem. Corder (1967) vymezil ve svém článku The significance of learner’s errors v několika bodech základy chybové analýzy. Dává do souvislosti nabývání prvního a druhého jazyka a chyby v nabývání druhého jazyka vysvětluje podobně jako chyby při osvojování prvního jazyka, tedy považuje je za odchylky, které mají svou logiku. Žák na základě pozorování a zpětné vazby testuje svoje hypotézy o podobě cílového jazyka a svůj aktuální jazykový systém k němu posouvá. 14
3. Chyba v žákovském jazyce Corder také navrhuje rozlišovat chyby na: •
systémové (errors), které jsou selháním kompetence,
•
a nesystémové (mistakes), které jsou selháním performance, jsou tedy důsledkem pouze momentálního selhání.
Nesystémové chyby se jako takové objevují i v projevech rodilých mluvčích a ti jsou schopni je sami snadno odhalit a korigovat. Pro výzkum tedy nemají žádnou relevanci. Systémové chyby na druhou strany by měly být předmětem zájmu a jejich analýza má být přínosem nejen pro badatele a jejich zájem o porozumění nabývání druhého jazyka, ale také učitelům a studentům cizího jazyka. Učiteli může sledování chyb pomoci reflektovat, které jevy si žák osvojil a které nikoli. Systémové chyby se objevují opakovaně jako nezáměrné odchylky od cílového jazyka a indikují nedostatek znalosti. Ovšem odlišení těchto dvou typů chyb není bezproblémové. Test sebekorekce, který by měl indikovat nesystémové chyby, je nejednoznačným kritériem, například pokud žák sám chybu neobjeví, ale pokud je na ni upozorněn, dokáže ji opravit. James (2013) ale odmítá striktní rozdělení na znalost a neznalost a mluví o částečné neznalosti (partial knowledge), která tento problém řeší a zároveň odpovídá myšlence mezijazyka. Chybová analýza se tedy zabývá výzkumem chyb v žákovském jazyce, respektive vztahem žákovského jazyka a cílového jazyka. James upřesňuje, že jde o studium žákovy neznalosti cílového jazyka, tzv. lingvistické ignorance. Tato neznalost se projevuje dvěma způsoby: 1.
žák používá strategii vyhýbání (avoidance), kterou lze ale těžko zkoumat pomocí chybové analýzy;
2.
žák využívá kompenzační strategie, substituce, které jsou inherentní součástí žákovského jazyka. James také mluví o dvou možných kritériích určování chyby: 15
3. Chyba v žákovském jazyce 1.
kritérium gramatičnosti (grammaticality), podle něj je chyba porušením gramatických pravidel cílového jazyka;
2.
kritérium přijatelnosti (acceptability), podle toho je zase chyba nemožností uplatnit takovýmto způsobem komunikační záměr.
16
4 Role žákovských korpusů ve výzkumu nabývání druhého jazyka 4.1 Korpusová lingvistika V následujícím textu jsem čerpal především z knihy Computer learner corpora, second language acquisition, and foreign language teaching (Granger, 2002). Historie žákovských korpusů sahá do konce osmdesátých let dvacátého století. Žákovské korpusy propojily do té doby nespolupracující korpusovou lingvistiku a výzkum nabývání druhého jazyka. Použitím hlavních principů, nástrojů a metod korpusové lingvistiky se chce dosáhnout lepšího popisu žákovského jazyka, což může být ve výzkumu nabývání druhého jazyka použito k mnoha účelům a být přínosem i v oblasti jazykového vyučování. Korpusová lingvistika může být charakterizována jako lingvistická metodologie založená na využití elektronických kolekcí jazykových dat, tedy korpusů. Nejedná se ani o novou větev lingvistického výzkumu, ani o lingvistickou teorii, nýbrž její podstatou je metodologie, která má potenciál změnit pohled na jazyk. Leech (1992) mluví o novém přístupu, o novém filozofickém pohledu, který otevírá cestu k novému přemýšlení o jazyku. Síla počítače a softwarových nástrojů zkombinovaná s obrovským množstvím a rozmanitostí jazykových dat odhaluje dříve netušené lingvistické jevy. Heuristická síla metod korpusové lingvistiky již nemůže být zpochybňována (Stubbs, 1996, s. 232). Korpusová lingvistika přispěla k objevu mnoha nových faktů, což vedlo ke vzniku nových hypotéz. Ačkoli jsou korpusy pouze jedním z mnoha zdrojů, které mohou podpírat lingvistické hypotézy, a introspektivní metodu nenahrazují, ale doplňují, panuje všeobecná shoda, že jsou jediným spolehlivým zdrojem, pokud se jedná o takové věci, jako je například frekvence (McEnery, 2001, s. 12). Frekvence je takový aspekt jazyka, o kterém 17
4. Role žákovských korpusů ve výzkumu nabývání druhého jazyka máme jen velmi nepatrnou intuitivní znalost, která ale přesto hraje jednu z hlavních rolí v mnohých lingvistických aplikacích, které vyžadují znalost nejen toho, co je v jazyce možné, ale také toho, co je běžné. Hlavní výhodou korpusové metodologie je zřejmě její využitelnost pro kvantitativní analýzu. S pohledem, který takovýto přístup přináší, je možné seznámit se například v pracích, jejichž autorem je Biber (1991) a které ukazují, jak může korpusová metodologie pomoci odhalit rozložení distinktivních rysů v různých variantách jazyka. Studie založené na korpusových datech vedly k mnohem lepšímu popisu jazyka v mnoha různých oblastech (neformální konverzace, formální proslovy, žurnalistika, akademické práce atd.) a popisu různých dialektů angličtiny rodilých mluvčích (britská vs. americká). Nicméně angličtina jako druhý jazyk se začala zkoumat teprve na přelomu osmdesátých a devadesátých let (Granger, 2002).
4.2 Žákovské korpusy Žákovské korpusy poskytují nový typ dat, který může být užitečný jak ve výzkumech zabývajících se nabýváním druhého jazyka, jejichž hlavním cílem je snaha porozumět procesu jazykové akvizice, tak ve výzkumech vyučování jazyka, tedy výzkumech více prakticky orientovaných. Výzkum nabývání druhého jazyka se tradičně zaměřuje na tři kategorie dat: •
žákovský jazyk;
•
anotace;
•
dotazník (mluvčího subjektivní výpověď o vlastní osobě).
Mnoho výzkumů má tendenci zabývat se spíše experimentálními daty, než jazykem v běžném užívání. To má několik důvodů a ten hlavní je asi ten, že se těžko dají kontrolovat proměnné, které ovlivňují žákův jazykový výstup, jinde než při experimentu. Protože je náročné 18
4. Role žákovských korpusů ve výzkumu nabývání druhého jazyka sebrat data od velkého množství mluvčích, často se analyzují data pouze omezeného množství mluvčích, což vede k otázce, nakolik reprezentativní výsledky lze získat. Mark (1998) upozorňuje, že některým složkám jazykového vyučování je věnováno více pozornosti než jiným. V jazykovém vyučování je potřeba se zabývat těmito třemi složkami: •
popis cílového jazyka;
•
zkoumání žáků:
•
–
jejich jazykový výstup a úroveň znalosti;
–
motivace, potřeby;
příprava učebních plánů a lekcí.
Aby jazykové vyučování a učení bylo úspěšné, je potřeba při přípravě učebních plánů a lekcí mít jak dobrý popis cílového jazyka, tak mít představu o žákových znalostech a motivaci. Nejrozšířenější přístupy k jazykovému vyučování se zaměřovaly jak na popis cílového jazyka, tak na žáka a jeho postoj, motivaci a potřeby, méně však už na sledování jeho jazykového výstupu. Mark podotýká, že ignorovat při pedagogické činnosti žákovský jazyk je proti zdravému rozumu. Povzbudivé ale je, že žákovský jazyk a žákovské korpusy se svým potenciálem získávají v oblastech výzkumů nabývání druhého jazyka a jazykového vyučování čím dál více pozornosti. Jedním z důvodů, proč se žákovskému jazyku nevěnovalo tolik pozornosti, byla velká a pracnost a náročnost budování žákovských korpusů. Technologický pokrok ovšem umožnil snadnější sběr a zpracování velkého množství dat pomocí dostupných softwarových nástrojů. Typologie Pro typologii žákovských korpusů jsou relevantní čtyři dichotomie, které se často používají pro korpusové typologie: 19
4. Role žákovských korpusů ve výzkumu nabývání druhého jazyka •
monolingvní vs. bilingvní;
•
všeobecný vs. specializovaný;
•
synchronní vs. diachronní;
•
psaný vs. mluvený.
Většina žákovských korpusů jsou monolingvní, všeobecné a synchronní. Přesnější definice Ačkoli se jazykový korpus často definuje jako počítačem zpracovatelná kolekce textů, bylo by lepší použít přesnější definici, protože jinak se potom říká korpus kdečemu, co moc korpusem není, rozhodně ne užitečným. Sinclair (1996) definuje korpus takto: „Korpus je kolekce jazykových dat, jejichž výběr a uspořádání jsou dány přesně stanovenými lingvistickými kritérii, aby mohla být vzorkem onoho jazyka. Počítačový korpus je korpus, který je zakódovaný standardizovaným a homogenním způsobem.“ 1 Tuto definici rozšiřuje Sylviane Granger (2002) a navrhuje takovouto definici žákovských korpusů: „Počítačové žákovské korpusy jsou elektronické kolekce autentických textových dat v cizím/druhém jazyce sestavené podle jasně vymezených kritérií a pro specifický účel výzkumu osvojování druhého jazyka/jazykového vyučování. Jsou zakódovány standardizovaným a homogenním způsobem a mají zdokumentovaný vznik a původ.“ 2 Na této definici je několik věcí, které stojí za povšimnutí. 1. „Corpus: A collection of pieces of language that are selected and ordered according to explicit linguistic criteria in order to be used as a sample of the language. [. . . ] Computer corpus: a corpus which is encoded in a standardised and homogeneous way[. . . ]“ (Sinclair, 1996) 2. „Computer learner corpora are electronic collections of authentic FL/SL textual data assembled according to explicit design criteria for a particular SLA/FLT purpose. They are encoded in a standardised and homogenous way and documented as to their origin and provenance.“ (Granger, 2002, s. 7)
20
4. Role žákovských korpusů ve výzkumu nabývání druhého jazyka Autenticita Sinclair (1996) považuje korpus za kvalitní, pouze pokud je autentický, tedy obsahuje data z běžného a přirozeného používání jazyka, nikoli data získaná při rozličných umělých experimentech. Pokud toto aplikujeme na žákovské korpusy, tak to znamená, že čistě experimentální data nemohou být zdrojem dobrého žákovského korpusu. Problémem autenticity je ale to, že i ta nejvíce autentická data, získaná od nerodilého mluvčího, nebudou tolik autentická jako data, získaná od rodilého mluvčího, zvlášť pokud jde o studenty cizího jazyka, kteří se učí jazyku například ve škole. Vyučování cizího jazyka zahrnuje určitý stupeň „umělosti“, a získaná data tedy nemohou být naprosto přirozená. Některé žákovské korpusy obsahují textové jednotky, u kterých nebylo žákům určeno téma, takže žáci psali o tom, co je zajímá. Jinde zase museli žáci psát na určité téma, a byli navíc ještě omezeni časovým limitem. Míra autenticity u žákovských korpusů je tedy různá. Nakolik lze považovat za autentickou esej, napsanou ve škole, natolik lze považovat za autentický korpus z těchto esejí. Textová data Korpus musí být sestaven ze souvislých textů, nikoli z izolovaných vět nebo slov. Je zavádějící potom mluvit o korpusu, pokud se jedná například o kolekci chybných vět žákovské produkce. Žákovské korpusy jsou sestaveny z textů, které jsou jak správné, tak obsahují chyby. Jasně vymezená kritéria Jasně vymezená projektová kritéria jsou v případě žákovských korpusů velmi důležitá. Náhodná kolekce nesourodých žákovských dat nemůže být považována za dobrý žákovský korpus. Kritéria se mohou týkat žáka a toho, jak se učí jazyku, jeho prvního jazyka a ostatních druhých, úroveň znalosti atd. Dále se mohou týkat úlohy: časového limitu, kontextu, publika atd. 21
4. Role žákovských korpusů ve výzkumu nabývání druhého jazyka Specifický účel Žákovský korpus je budován obvykle k nějakému účelu. Může jít o snahu vylepšovat teorie o nabývání druhého jazyka, nebo může být cílem přispívat k vytváření lepších metod a nástrojů jazykového vyučování. Standardizace a dokumentace Žákovské korpusy mohou nabývat mnoha podob. Může to být například korpus sestavený z holých dat bez dalších anotací, nebo může být anotovaný, tedy obohacený dalšími lingvistickými značkami a dalšími metatextovými informacemi. Anotovaný žákovský korpus by měl ideálně být založený na standardizovaném anotačním softwaru, aby mohl být porovnatelný s jinými anotovanými žákovskými korpusy. Nicméně zvláštní povaha žákovských dat může vyžadovat vytváření nových softwarových nástrojů, jako například nástroje pro chybovou anotaci.
22
5 Dostupné anglické žákovské korpusy 5.1 Sketch Engine Sketch Engine (Kilgarriff, 2014) je korpusový manažer a software pro analýzu vyvinutý britskou firmou Lexical Computing Limited, kterou založil Adam Kilgarriff v roce 2003 a která je partnerem Centra zpracování přirozeného jazyka Fakulty informatiky Masarykovy univerzity. Sketch Engine je webová aplikace s velkým množstvím funkcí pro různá použití, jejímž prostřednictvím jsou zpřístupněny stovky korpusů.
5.2 Získané korpusy Mým úkolem mělo být sesbírat všechny volně dostupné anglické žákovské korpusy a posléze je zakódovat do Sketch Engine. Výchozím bodem mých snah byl seznam žákovských korpusů (Dumont, 2015), který buduje CECL (Centre for English Corpus Linguistics) na Katolické univerzitě v Lovani (Université catholique de Louvain). Seznam obsahuje přes osmdesát anglických žákovských korpusů (a další, jejichž cílovým jazykem je jiný jazyk než angličtina). Většina odkazů je ale již nefunkční a velká část e-mailů na zodpovědné osoby již neexistuje, takže jsem se snažil zjistit, zda se mi nepodaří nalézt nějaké webové nebo e-mailové adresy s pomocí internetového vyhledávače. Pokud se mi nepodařilo korpus najít na webu, snažil jsem se e-mailem kontaktovat jejich autory. Aktuální kompletní přehled korpusů, které jsem se snažil získat, lze najít společně s komentářem na webu (Learner Corpora List, 2015). The ANGLISH corpus Tento korpus obsahuje zvukové nahrávky 60 žáků, kteří provádějí tři úkoly: čtení, opakování vět po vyslechnutí rodilého mluvčího a monolog na libovolné téma. Korpus ale neobsahuje textové přepisy 23
5. Dostupné anglické žákovské korpusy nahrávek, pro naše účely se tedy nehodí. (Hirst, 2010) The Barcelona English Language Corpus (BELC) Korpus obsahuje nahrávky španělských dětí a mládeže, transkripce těchto nahrávek a kratší písemné projevy, ve kterých se měli účastníci představit. Zvukové nahrávky jsou tří typů: rozhovor s lektorem, vyprávění a hraní rolí (smyšlený rozhovor s rodiči apod.) Texty a transkripce obsahují informace o věku, pohlaví a jazycích, které žák ovládá. Pokud účastník mluví španělsky a ne anglicky, je to v textu vyznačeno. (Muñoz, 2007) The Gachon Learner Corpus Korpus byl budován na Gachon University v Jižní Koreji a obsahuje přes 2,5 miliónů tokenů, přes 25 tisíc textů od 2500 studentů univerzity. Data byla sebrána pomocí formuláře, ve kterém účastníci odpovídali na dvacet otázek v rozsahu 100 až 150 slov. Otázky byly různorodé, uvedu jen několik příkladů: podle čeho by si měl člověk vybírat hotel, oblíbený film, měly by se děti dívat na násilné filmy, jak ovlivňuje chování rodičů vývoj dítěte. . . U žáků se zjišťovaly následující údaje: pohlaví, věk, ročník studia na univerzitě, obor studia, první jazyk, první jazyky obou rodičů, jazyk, kterým se mluví v domácnosti, jazyk na základní a na střední škole, počet let studia angličtiny, délka pobytu v anglicky mluvící zemi, různá skóre u certifikačních testů, další druhé jazyky, sebevědomí při psaní anglicky, motivace studia a další věci. (Carlstrom, 2014) The International Corpus Network of Asian Learners of English (ICNALE) Kolekce esejí psaných pod dozorem a proslovů z deseti asijských zemí obsahuje kolem 1,5 miliónu slov. Anotace obsahuje toto: země původu, pohlaví, věk, škola, ročník, obor, počet let studia angličtiny, různá skóre u certifikačních testů, dále potom dotazník týkající se 24
5. Dostupné anglické žákovské korpusy motivace a přístupu k učení se angličtiny a také výsledek testu ověřujícího znalost anglické slovní zásoby. Součástí korpusu jsou dokonce i chybové anotace. (Ishikawa, 2015)
A Learners’ Corpus of Reading Texts Zvukové nahrávky 54 francouzských studentů, kteří se učí anglicky prvním rokem a kteří četli krátké úryvky z beletrie nebo vymyšlené dialogy. Korpus ale neobsahuje textové přepisy nahrávek a ani další anotace, pro naše účely se tedy nehodí. (Kerfelec, 2010)
The PELCRA Learner English Corpus (PLEC) Tento korpus by měl údajně obsahovat 2,8 miliónů slov a být složen z různých textů jako eseje, dopisy, závěrečné práce atd. Navíc by měl obsahovat subkorpus mluvený s 200 tisíci slov, obsahující dialogy. Na webu je ale možné stáhnout pouze mluvený subkorpus, včetně přepisů a chybové anotace. U přepisů jsou informace o pohlaví a věku účastníků. (Pęzik, 2013)
The Qatar Learner Corpus Nahrávky a přepisy krátkého vyprávění 18 univerzitních studentů z Kataru. Texty neobsahují žádné anotace (kromě křestního jména). (Zhao, 2009)
The Russian Learner Translator Corpus (RusLTC) Rusko-anglický překladový žákovský korpus, na jehož výstavbě se podílí deset ruských univerzit. Obsahuje 1,5 miliónu slov. Texty jsou zarovnané po větách. Některé texty obsahují více informací o žákovi, ale většina pouze o žánru textu, který je překládán. Ke korpusu existují i chybové anotace, ale ty není možné stáhnout. (Kunilovskaya, 2015) 25
5. Dostupné anglické žákovské korpusy The Uppsala Student English Corpus (USE) Korpus obsahuje přibližně 1 500 esejí napsaných 440 švédskými univerzitními studenty. Obsahuje přes 1,2 miliónu slov. Průměrná délka eseje je 820 slov. Texty obsahují tyto informace: pohlaví, věk, první jazyk, první jazyky rodičů, známky z angličtiny, předchozí vzdělání, délka studia angličtiny, čas strávený v anglicky mluvícím prostředí, motivace a spousta dalších. (Axelsson, 2001)
5.3 Společné anotační schéma Navrhnout společné anotační schéma se může zdát na první pohled jako dobrý nápad. Podívejme se ovšem na anotace získaných korpusů: některé korpusy obsahují opravdu vyčerpávající množství různých informací (jako například The Gachon Learner Corpus nebo The Uppsala Student English Corpus) a jiné korpusy naopak neobsahují metainformace téměř žádné. Pokud bych navrhl jedno společné anotační schéma, mohlo by například obsahovat jen ty položky, které bych považoval za relevantní. Jenže relevantní může být jakákoli informace, záleží především na účelu využití. Z toho důvodu by tedy bylo dobré ponechat v novém schématu co nejvíce informací. Kdyby se některé položky odstranily, byla by to podle mě škoda. Pokud bych ale chtěl použít jedno rozsáhlé schéma pro všechny získané korpusy, u většiny z nich by zůstala většina položek nevyplněná, protože potřebné informace jednoduše nejsou k dispozici. Někoho by mohlo napadnout, že by bylo možné navrhnout nějaké rozumné schéma s přiměřeným množstvím položek, které by se vyplnily vyextrahováním informací z původních anotací. To by ovšem vyžadovalo u každého korpusu vymyslet, jakým způsobem souvisí informace v původním korpusu s informacemi v novém anotačním schématu. Výsledkem by v nejlepším případě bylo zpřehlednění, ale také částečná ztráta informace. Také by ale mohlo dojít k dezinterpretaci a zkreslení původních dat. 26
5. Dostupné anglické žákovské korpusy Jsem tedy přesvědčen, že návrh jednotného anotačního schématu by nebyl ničemu prospěšný a že nejlepším řešením bude vycházet z původních anotací a snažit se do Sketch Engine zakódovat co nejvíce informací, které jsou k dispozici.
27
Závěr Tato práce z nadhledu pohlíží na problematiku nabývání druhého jazyka a s ní související korpusovou lingvistikou. Protože žákovské korpusy nejsou podle mě příliš známým tématem, nezacházím ve své práci do velkých podrobností, ale spíš se snažím o základní seznámení s tématem. Co se týká získávání anglických žákovských korpusů, očekával jsem, že se podaří získat více korpusů. Za úspěch lze ale považovat zjištění, kudy cesta nevede a co je naopak použitelné. Podařilo se mi získat celkem sedm korpusů, které jsem připravil pro indexaci ve Sketch Engine. Došel jsem k názoru, že vymýšlet nové anotační schéma, které by bylo společné všem získaným korpusům, není dobrý nápad a že lepší bude zachovat původní strukturu metainformací.
28
Bibliografie AXELSSON, Margareta Westergren, 2001. The Uppsala Student English Corpus (USE) [online]. [cit. 2015-06-21]. Dostupný z WWW: hhttp: //ota.ox.ac.uk/desc/2457i. BIBER, Douglas, 1991. Variation across speech and writing. BLEY-VROMAN, Robert, 1983. The Comparative Fallacy in Interlanguage Studies: The Case of Systematicity. Language learning. Vol. 33, no. 1, s. 1–17. BROWN, H Douglas; WU, Yi’an, 1987. Principles of language learning and teaching. CARLSTROM, Brian; PRICE, Nathan, 2014. The Gachon Learner Corpus [online]. [cit. 2015-06-21]. Dostupný z WWW: hhttp://goo.gl/ 8i2nA0i. CORDER, Stephen Pit, 1967. The significance of learner’s errors. IRAL – International Review of Applied Linguistics in Language Teaching. Vol. 5, no. 1-4, s. 161–170. ČERMÁK, František; SCHMIEDTOVÁ, Věra, 2004. Český národní korpus – základní charakteristika a širší souvislosti. Národní knihovna – knihovnická revue. Roč. 15, č. 3, s. 152–168. ISSN 1214-0678. DE BOT, Kees; LOWIE, Wander; VERSPOOR, Marjolijn, 2007. A dynamic systems theory approach to second language acquisition. Bilingualism language and cognition. Vol. 10, no. 1, s. 7. DULAY, H.C.; BURT, M.K.; KRASHEN, S.D., 1982. Language two. ISBN 9780195025538. DUMONT, Amandine; GRANGER, Sylviane, 2015. Learner corpora around the world [online]. [cit. 2015-03-27]. Dostupný z WWW: hhttp: //www.uclouvain.be/en-cecl-lcworld.htmli. ECKMAN, Fred R, 1977. Markedness and the contrastive analysis hypothesis. Language learning. Vol. 27, no. 2, s. 315–330.
29
BIBLIOGRAFIE ELLIS, R, 1994. The Study of Second Language Acquisition. Oxford applied linguistics. ISBN 9780194371896. FAERCH, Claus, 1978. Performance Analysis of learner’s language. In. Papers from the Fourth Scandinavian Conference on Linguistics. Odense: Odense University Press, s. 87–95. FIRTH, Alan; WAGNER, Johannes, 1997. On discourse, communication, and (some) fundamental concepts in SLA research. Modern language journal. S. 285–300. GRADMAN, Harry, 1971. The limitations of contrastive analysis predictions. Working Papers in Linguistics, University of Hawaii. Vol. 3, s. 73–7. GRANGER, Sylviane; HUNG, Joseph; PETCH-TYSON, Stephanie, 2002. Computer learner corpora, second language acquisition, and foreign language teaching. HIRST, Daniel; TORTEL, Anne, 2010. The ANGLISH corpus [online]. [cit. 2015-06-21]. Dostupný z WWW: hhttp : / / sldr . org / voir _ depot.php?lang=en&id=731&prefix=sldri. HUGHES, Arthur; LASCARATOU, Chryssoula, 1982. Competing criteria for error gravity. ELT journal. Vol. 36, no. 3, s. 175–182. CHOMSKY, Noam, 1959. A review of BF Skinner’s Verbal Behavior. Language. Vol. 35, no. 1, s. 26–58. CHUN, Ann E; DAY, Richard R; CHENOWETH, N; LUPPESCU, Stuart, 1982. Errors, Interaction, and Correction: A Study of NativeNormative Conversations. Tesol Quarterly. Vol. 16, no. 4, s. 537–547. ISHIKAWA, Shin’ichiro, 2015. The International Corpus Network of Asian Learners of English (ICNALE) [online]. [cit. 2015-06-21]. Dostupný z WWW: hhttp://language.sakura.ne.jp/icnale/i. JACKENDOFF, Ray, 2003. Précis of foundations of language: brain, meaning, grammar, evolution. Behavioral and Brain Sciences. Vol. 26, no. 06, s. 651–665.
30
BIBLIOGRAFIE JAMES, Carl, 2013. Errors in language learning and use: Exploring error analysis. JOHNSON, M, 2004. A Philosophy of Second Language Acquisition. Yale language series. ISBN 9780300100266. KERFELEC, Valérie; LEONARDUZZI, Laetitia; TURCSAN, Gabor, 2010. A Learners’ Corpus of Reading Texts [online]. [cit. 2015-06-21]. Dostupný z WWW: hhttp://sldr.org/voir_depot.php?lang= en&id=15&prefix=sldri. KILGARRIFF, Adam; BAISA, Vít; BUŠTA, Jan et al., 2014. The Sketch Engine: ten years on. Lexicography. Roč. 1, č. 1, s. 7–36. KRASHEN, Stephen D, 1981. Second language acquisition and second language learning. KUNILOVSKAYA, Maria; KUTUZOV, Andrey, 2015. Russian Learner Translator Corpus (RusLTC) [online]. [cit. 2015-06-21]. Dostupný z WWW: hhttp://rus-ltc.org/about.htmli. LADO, Robert, 1957. Linguistics Across Cultures: Applied Linguistics for Language Teachers. LARSEN-FREEMAN, Diane, 2002. Language acquisition and language use from a chaos. Language acquisition and language socialization: Ecological perspectives. S. 33. Learner Corpora List, [online]. [cit. 2015-06-21]. Dostupný z WWW: hgoo.gl/nsF7Rdi. LEECH, Geoffrey, 1992. Corpora and theories of linguistic performance. Directions in corpus linguistics. S. 105–122. LENNON, Paul, 1991. Error: some problems of definition, identification, and distinction. Applied linguistics. Vol. 12, no. 2, s. 180–196. LIGHTBOWN, Patsy M; SPADA, Nina; RANTA, Leila; RAND, Jude, 2006. How languages are learned. LISKI, Erkki; PUNTANEN, Simo, 1983. A Study of the Statistical Foundations of Group Conversation Tests in Spoken English. Language Learning. Vol. 33, no. 2, s. 225–46. 31
BIBLIOGRAFIE MARK, Kevin L, 1998. The significance of learner corpus data in relation to the problems of language teaching. Meiji University Liberal Studies. S. 77–90. MCENERY, Tony; WILSON, Andrew, 2001. Corpus linguistics: An introduction. MCLAUGHLIN, Barry, 1978. The monitor model: Some methodological considerations. Language learning. Vol. 28, no. 2, s. 309–332. MUÑOZ, Carmen, 2007. The Barcelona English Language Corpus (BELC) [online]. [cit. 2015-06-21]. Dostupný z WWW: hhttp://talkbank. org/data/i. NEMSER, William, 1971. Approximative systems of foreign language learners. IRAL – International Review of Applied Linguistics in Language Teaching. Vol. 9, no. 2, s. 115–124. PĘZIK, Piotr, 2013. The PELCRA Learner English Corpus (PLEC) [online]. [cit. 2015-06-21]. Dostupný z WWW: hhttp://rus-ltc.org/about. htmli. PIEPHO, H.E., 1974. Kommunikative Kompetenz als übergeordnetes Lernziel im Englischunterricht. Reihe Stundenvorbereitung. SELINKER, Larry, 1972. Interlanguage. IRAL – International Review of Applied Linguistics in Language Teaching. Vol. 10, no. 1-4, s. 209–232. SCHACHTER, Jacquelyn, 1990. On the issue of completeness in second language acquisition. Second Language Research. Vol. 6, no. 2, s. 93– 124. SCHUMANN, John H, 1978. The pidginization process: A model for second language acquisition. SCHWARTZ, Bonnie D; SPROUSE, Rex, 2000. When syntactic theories evolve: Consequences for L2 acquisition research. Second language acquisition and linguistic theory. S. 156–186. SINCLAIR, John, 1996. Preliminary recommendations on Corpus Typology [online]. [cit. 2015-06-13]. Dostupný z WWW: hhttp://www.ilc. cnr.it/EAGLES/corpustyp/corpustyp.htmli. 32
BIBLIOGRAFIE SKINNER, B F, 1957. Verbal behavior. Century psychology series. STOCKWELL, Robert P; BOWEN, J Donald; MARTIN, John W, 1965. The grammatical structures of English and Spanish. STUBBS, Michael, 1996. Text and corpus analysis: Computer-assisted studies of language and culture. ŠTINDLOVÁ, Barbora, 2013. Žákovský korpus češtiny a evaluace jeho chybové anotace. Vyd. 1. Praha: Univerzita Karlova v Praze, Filozofická fakulta. ISBN 9788073084639. TARONE, Elaine; SWAIN, Merrill, 1995. A sociolinguistic perspective on second language use in immersion classrooms. The Modern Language Journal. Vol. 79, no. 2, s. 166–178. WHITE, Lydia, 1987. Against Comprehensible Input: the Input Hypothesis and the Development of Second-language Competence. Applied linguistics. Vol. 8, no. 2, s. 95–110. WHITE, Lydia, 2003. On the nature of interlanguage representation: Universal grammar in the second language. The handbook of second language acquisition. S. 19–42. WHITMAN, Randal L, 1970. Contrastive analysis: Problems and procedures. Language Learning. Vol. 20, no. 2, s. 191–197. ZHAO, Yun, 2009. The Qatar Learner Corpus [online]. [cit. 2015-0621]. Dostupný z WWW: hhttp://talkbank.org/data/SLABank/ English/Qatar.zipi.
33