Taalkennis & Taalevolutie Rick Nouwen
Inleiding Taalkunde
Inleiding Taalkunde
Taalkennis & Taalevolutie
Overzicht 1
Indeling van het vakgebied taalkunde
2
Een eerste blik op de formele structuren in taal
3
Evolutie
(literatuur: Kirby 2007, vooral sect.1, 2 en 3)
Waarom is taal zo als ze is? Hoe verschilt menselijke taal van dierlijke taal/communicatie? Hoe kunnen we taalevolutie uberhaupt onderzoeken? ¨
Inleiding Taalkunde
Taalkennis & Taalevolutie
Taalkennis
Het menselijke taalvermogen is complex Mensen hebben veel soorten kennis over hun taal: Kennis over de productie en het begrip van klanken Kennis over de productie en het begrip van woorden Kennis over de productie en het begrip van structuren
Inleiding Taalkunde
Taalkennis & Taalevolutie
Taalkennis
We weten welk woord bij dit concept hoort We weten hoe we dat woord uitspreken We weten hoe we dat woord moeten herkennen als iemand anders het uitspreekt We weten wat variaties op het woord betekenen: tafel-s, tafel-tje, tafel-en
Inleiding Taalkunde
Taalkennis & Taalevolutie
Taalkennis
Meer kennis: ”Mrok” kan geen Nederlands woord zijn ”Man de vrouw kust elke” is geen Nederlandse zin Ook al weten we niet wat een flimp is of wat plit is, we begrijpen de essentie van (1) toch. (1) Elke flimp is plit. (Als iemand ons een voorbeeld van ”een flimp” laat zien, weten we direct dat dit voorbeeld de eigenschap ”plit” heeft)
Inleiding Taalkunde
Taalkennis & Taalevolutie
Taalkennis Onze kennis staat oneindig veel structuren toe Neem ”Jan slaapt” Voeg toe: ”Ik denk dat”, ”Piet hoorde dat” Je kunt (in principe) oneindig lange zinnen maken Frits weet dat Mies denkt dat ik denk dat Piet hoorde dat Jan slaapt. De oom van een bijzonder intelligente en succesvolle student van een bevriende professor van mij hoorde dat Jan de auto die ik van de broer van de buurman van mijn tandarts gekregen heb niet wilde poetsen.
Inleiding Taalkunde
Taalkennis & Taalevolutie
Taalkennis NB, competence versus performance: Honden bijten. Honden die honden bijten, bijten. Honden die honden die honden bijten, bijten, bijten. Honden die honden die honden die honden bijten, bijten, bijten, bijten.
Inleiding Taalkunde
Taalkennis & Taalevolutie
Taalkunde Opgedeeld Fonologie: de systematiek van geluiden binnen een taal Morfosyntaxis: de systematiek van betekenisvolle combinaties binnen een taal Morfologie: woordniveau Syntaxis: boven-woordniveau
Semantiek: de betekenis van betekenisvolle eenheden en combinaties binnen een taal Pragmatiek: de systematiek van de relatie tussen betekenissen en communicatieve intenties binnen een context
Inleiding Taalkunde
Taalkennis & Taalevolutie
Taalkunde Opgedeeld Fonologie: klankleer fonemen: betekenisloze delen die wel betekenisonderscheidend zijn rat / kat / dat / lat raad / rood / riet Morfologie: vormleer morfemen: kleinste betekenisvolle delen boek / boek-je / boek-je-s
Inleiding Taalkunde
Taalkennis & Taalevolutie
Taalkunde Opgedeeld Syntaxis: grammatica Loopt hij / Hij loopt Marie haat Jan / Jan haat Marie *Jan Marie kust / Ik hoop dat Jan Marie kust Semantiek: betekenis Alle mensen zijn sterfelijk. Jan is een mens. Jan is sterfelijk. All that glitters is not gold
Inleiding Taalkunde
Taalkennis & Taalevolutie
Taalkunde Opgedeeld
Pragmatiek: taal in context Ik ben Rick Hij heeft haar vermoord / Hij veroorzaakte haar dood A: Hoe ging je tentamen? B: Nou, ik wist het antwoord op vraag 1c. Geachte heer Nouwen / He´ Rick! u / jij
Inleiding Taalkunde
Taalkennis & Taalevolutie
Rode draad door alle disciplines Fonologie – Morfologie – Syntax – Semantiek – Pragmatiek Methode: vergelijk (een aspect van) natuurlijke taal met een formele taal Natuurlijke talen: we hebben meestal geen complete expliciete beschrijving Formele talen: we hebben volledige expliciete kennis Formele eigenschappen van grammatica’s Denk ook aan: implementaties, taaltechnologie
Inleiding Taalkunde
Taalkennis & Taalevolutie
Voorbeeld: fonologie
Talen kennen restricties op welke klanken op elkaar mogen volgen Japanse leenwoorden: sofuto wea
Inleiding Taalkunde
Taalkennis & Taalevolutie
Voorbeeld: fonologie
Talen kennen restricties op welke klanken op elkaar mogen volgen Japanse leenwoorden: sofuto wea (software) *soft / sofuto Vraag: wat voor soort grammatica heb je hiervoor nodig? Welke formele eigenschappen van talen zijn relevant voor taalkunde?
Inleiding Taalkunde
Taalkennis & Taalevolutie
Formele talen Een formele taal is een verzameling symbolen-rijtjes (strings) Formele talen over het alfabet {0, 1} {01, 0101, 010101, 01010101, . . .} {01, 001, 0001, 00001, 000001, . . .} {01, 0011, 000111, 00001111 . . .}
Formele talen over het alfabet {a, b, c, . . . z} {ab, ac, ad, . . . , abab, abac, . . .} {sofuto, kanazawa, riku, arigato, . . .}
Formele talen over het alfabet {Jan, Marie, haat, kust, . . .} {Jan kust Marie, Marie kust Jan, Jan haat Marie, . . . } Inleiding Taalkunde
Taalkennis & Taalevolutie
Formele Eigenschappen van Formele Talen Een taal kun je karakteriseren. . . door een grammatica/automaat die de taal genereert/herkent {01, 0101, 010101, 01010101, ...} :
{01, 0011, 000111, 00001111, ...} :
Inleiding Taalkunde
reguliere grammatica finite state automaton
context-vrije grammatica push-down automaton
Taalkennis & Taalevolutie
Formele talen
{01, 0101, 010101, 01010101, . . .}
Inleiding Taalkunde
Taalkennis & Taalevolutie
Formele talen
{01, 0101, 010101, 01010101, . . .} Kunnen we net zo een eindige automaat bouwen voor de taal {01, 0011, 000111, 00001111 . . .}? Inleiding Taalkunde
Taalkennis & Taalevolutie
Formele talen Reguliere grammatica voor {01, 0101, 010101, 01010101, . . .} Z → 01 Z → 01Z De regels van reguliere grammatica’s hebben alleen regels van de vorm A → wB of A → w, waar A en B niet-terminale knopen zijn en w een willekeurige terminale string. Er is geen reguliere grammatica voor {01, 0011, 000111, 00001111, . . .}
Inleiding Taalkunde
Taalkennis & Taalevolutie
Formele Talen Geen FSA voor {01, 0011, 000111, 00001111, . . .} Geen reguliere grammatica voor {01, 0011, 000111, 00001111, . . .} We hebben iets complexere machinerie nodig Context-vrije grammatica ∼ push-down automaat Context-vrije grammatica heeft regels van de vorm A→ω
waar ω een willkeurig rijtje terminale en niet-terminale symbolen is
S → 01 S → 0S1
Inleiding Taalkunde
Taalkennis & Taalevolutie
Formele Talen Push-down automaat voor {01, 0011, 000111, 00001111}
1
Neem een stack met alleen X erop
↓ 2
Lees de string; schuif een Y op de stack als je een 0 leest
↓ 3
Lees de string; haal een Y van de stack als je een 1 leest
↓ 4
Accepteer de string als je alles gelezen hebt en als de stack alleen een X bevat
Inleiding Taalkunde
Taalkennis & Taalevolutie
Formele Talen Elke taal die je met een eindige automaat kunt karakteriseren kun je ook met een context-vrije grammatica karakteriseren, maar niet andersom S → 01 S → 01S
{01, 0101, 010101, . . .}
M.a.w.: Context-vrije talen Reguliere talen
Inleiding Taalkunde
Taalkennis & Taalevolutie
Formele Talen en Natuurlijke Talen Simpelste formele taalsoort: reguliere talen (finite state automaten) voldoet voor het karakteriseren van klankvolgordes voldoet niet voor syntaxis De man is ziek De man die de vrouw gisteren sprak is ziek De man die de vrouw die ik haat gisteren sprak is ziek {01, 0011, 000111, 00001111, ...}
Inleiding Taalkunde
Taalkennis & Taalevolutie
Taalkunde In de rest van de cursus gaan we deelgebieden van taalkunde af Week 2: Fonologie Week 3 en 4: Morfosyntaxis Week 6: Verwerving / Complexiteit Week 7: Semantiek en Pragmatiek Week 8: Optimaliteit / Typologie Week 9: Taal en gedachte Rest Vandaag: Overzichtscollege over taalevolutie
Inleiding Taalkunde
Taalkennis & Taalevolutie
Taalevolutie 1
Wat bestudeert taalevolutie?
2
Vergelijk menselijke taal met communicatiemethodes uit de dierenwereld
3
Prototalen en taalverwerving
The evolution of language, Simon Kirby (2007). Verschenen in Dunbar, R. and Barrett L., editors, Oxford Handbook of Evolutionary Psychology, pp. 669681. OUP Sectie 1,2, & 3
Inleiding Taalkunde
Taalkennis & Taalevolutie
Evolutie: voorbeeld
Inleiding Taalkunde
Taalkennis & Taalevolutie
Evolutie: voorbeeld Waarom is het oog zoals het is? Wat karakteriseert dieren met ogen? Wat is de functie van het oog? Hoe verhoudt die functie zich met natuurlijke selectie? Wat waren de evolutiestadia? Hoe onderzoek je dat? Fossielen De vergelijkende methode (bijv. Darwin)
Inleiding Taalkunde
Taalkennis & Taalevolutie
Taalevolutie
Waarom hebben menselijke talen de eigenschappen die ze hebben? Waarom hebben alleen mensen onze soort taalvermogen? Wat is de functie van natuurlijke taal? Welke stadia waren er in de evolutie van taal?
Inleiding Taalkunde
Taalkennis & Taalevolutie
Taalevolutie
Hoe doe je onderzoek naar taalevolutie? Taalgedrag laat geen fossielen achter
Inleiding Taalkunde
Taalkennis & Taalevolutie
Taalevolutie
Hoe doe je onderzoek naar taalevolutie? Taalgedrag laat geen fossielen achter Antwoord: de vergelijkende methode Gebruik empirische data van levende diersoorten om te redeneren over uitgestorven soorten Kijk verder naar primitieve vormen van communicatie die nog tussen levende mensen bestaan: prototalen
Inleiding Taalkunde
Taalkennis & Taalevolutie
Dierenwereld: Communicatie is de norm Apen: Vogels: Honden: lichaamskenmerken
Inleiding Taalkunde
Taalkennis & Taalevolutie
Dierenwereld: Communicatie is de norm Apen: Vogels: Honden: lichaamskenmerken
Inleiding Taalkunde
Taalkennis & Taalevolutie
Dierenwereld: Communicatie is de norm Apen: Vogels: Honden: lichaamskenmerken
Maar ook: schimmels, planten, een-cellige organismen Bijen: dansen (waggle dance) Inleiding Taalkunde
Taalkennis & Taalevolutie
Inleiding Taalkunde
Taalkennis & Taalevolutie
Menselijke taal
Inleiding Taalkunde
Taalkennis & Taalevolutie
Menselijke taal
Menselijke taal is uniek Belangrijke vraag: wat maakt menselijke taal uniek? de grootte van het lexicon de mechanismen achter de grammatica compositionele semantiek parametrische variatie
Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal: Woordenschat
Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal: Woordenschat mensen, 6 jaar: 14.000 woorden volwassen mensen: 60.000 woorden tussen mensen opgegroeide dieren: Washoe (chimpanzee): 250 woorden Koko (gorilla): 1000-2000 woorden Nim Chimpsky (chimpanzee): 125 woorden Rico (border collie): 200 woorden Vergelijkbaar: dolfijnen, zeeleeuwen, papagaaien Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal: Woordenschat mensen, 6 jaar: 14.000 woorden Dat is 6.4 woorden per dag!! volwassen mensen: 60.000 woorden tussen mensen opgegroeide dieren: Washoe (chimpanzee): 250 woorden Koko (gorilla): 1000-2000 woorden Nim Chimpsky (chimpanzee): 125 woorden Rico (border collie): 200 woorden Vergelijkbaar: dolfijnen, zeeleeuwen, papagaaien Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal: Recursie / Phrase Structure Hauser, Chomsky & Fitch 2002, Science Bepaalde mechanismen voor een taalsysteem zijn misschien wel (in meer of mindere mate) aanwezig bij dieren Maar ze missen recursie Eindig aantal bouwstenen + Eindig aantal regels = Oneindig aantal uitdrukkingen
Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal: Recursie / Phrase Structure
Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal: Recursie / Phrase Structure Experiment: Fitch & Hauser 2004, Science Studie met Tamarins Twee grammatica’s, gebasseerd op twee soorten klanken (A,B) Finite state versie: { AB, ABAB, ABABAB, . . . } Context-vrije versie: { AB, AABB, AAABBB, . . . }
Inleiding Taalkunde
Taalkennis & Taalevolutie
Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal: Recursie / Phrase Structure Fitch & Hauser 2004, Science Tamarins kunnen finite state grammatica leren . . . maar geen context-vrije grammatica Claim: phrase structure grammar is uniek menselijk
Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal: Recursie / Phrase Structure
Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal: Recursie / Phrase Structure
Hevige discussie Gentner et al., 2006, Nature: Spreeuwen kunnen de context-vrije grammatica wel leren Grote discussie op Language Log over interpretatie van experimenten
http://languagelog.ldc.upenn.edu/nll/
Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal: Recursie / Phrase Structure
Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal: Recursie / Phrase Structure Nog meer controverse Daniel Everett (2005), Science Nederlands: Jan zegt dat Marie droomde dat Tom kwam. ˜ isolaat, plm. 300 sprekers Piraha: Geen hierarchische inbedding: Jan zegt. Marie droomde. Tom kwam.
Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal: Compositionaliteit Menselijke taal kent compositionele semantiek Kleinste betekenisvolle eenheid: het morfeem tafel, tafel-s, tafel-tje, tafel-tje-s, tafel-en We kennen de betekenis van de kleinste delen We kunnen de betekenis van complexe strings afleiden Woorden: morfeem-combinaties Zinnen: woord-combinaties
de/een man, in/onder/op de boom
Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal: Compositionaliteit
Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal: Compositionaliteit Groene meerkat Verschillende calls: arend, slang, luipaard Marginale sekwenties van calls Geen fonemen, geen morfemen Geen compositionele semantiek Spreeuwen: complexe motieven, maar geen compositionele semantiek
Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal: Parametrische variatie
Geen verschil in vogelzang op verschillende geografische locaties Kleine verschillen bij apen-gebaren en -calls Menselijke taal: Grote variatie in het lexicon Parametrische variatie in fonologie Parametrische variatie in syntaxis
Inleiding Taalkunde
Taalkennis & Taalevolutie
Uniek aan menselijke taal — Opsomming Wat karakteriseert de menselijke taal? Woordenschat Phrase Structure Grammar Compositionele Semantiek Parametrische Variatie ... Conclusie: groot gat tussen de communicatie-systemen van nabije soorten en menselijke taal Hoe heeft de mens dat gat overbrugd? Waren er tussen-stadia? Inleiding Taalkunde
Taalkennis & Taalevolutie
Prototalen
We kunnen over taalevolutie leren door naar niet ¨ uitgeevolueerde taalmechanismen te kijken prototalen als levende fossielen Pidgin Kindertaal Taalvermogen van apen
Inleiding Taalkunde
Taalkennis & Taalevolutie
Prototaal: Pidgin Pidgin zijn talen die spontaan ontstaan door contact tussen taalgemeenschappen Meestal wordt de taal van de meest dominante gemeenschap vereenvoudigd Klein lexicon Zeer eenvoudige zinsbouw Gebruikt als lingua franca Pidgin is nooit 1e taal
Indien het contact aanhoudt, ontstaat een creole Voorbeeld van creole:
Inleiding Taalkunde
Taalkennis & Taalevolutie
Prototaal: Pidgin Pidgin zijn talen die spontaan ontstaan door contact tussen taalgemeenschappen Meestal wordt de taal van de meest dominante gemeenschap vereenvoudigd Klein lexicon Zeer eenvoudige zinsbouw Gebruikt als lingua franca Pidgin is nooit 1e taal
Indien het contact aanhoudt, ontstaat een creole Voorbeeld van creole: Papiamentu (Curac¸ao)
Inleiding Taalkunde
Taalkennis & Taalevolutie
Voorbeeld: Hawaiian Pidgin
Ontstaan als lingua franca onder plantagewerkers (massale immigratie 19e eeuw) Grotendeels gebasseerd op het Engels. Verdere talen: Hawaiiaans, Portugees, Cantonees, Japans Sobere grammatica: Geen lidwoorden Geen markering van tijd Geen copula’s (is, zijn) Geen markering van geslacht
Inleiding Taalkunde
Taalkennis & Taalevolutie
Voorbeeld: Hawaiian Pidgin
When time up I go to boss and say you take old woman back now. He get verra mad, and make me pay all up. Marie, he good woman, but talk, talk all time, make me mad then pilikia again. (Een Portugese immigrant, 19e eeuw.)
Uit: Hopper & Traugott 2003, citerend S. Roberts 1998, citerend Vergne 1898.
Inleiding Taalkunde
Taalkennis & Taalevolutie
Prototaal: kindertaal Taalverwerving moedertaal: 0-5 jaar Spontane verwerving: geen instructie geen negatief bewijs: *kussen Jan Marie
Vanaf plm. 14 maanden: verwerving grammatica Vroege kindertaal: weglaten vervoegingen, voornaamwoorden, lidwoorden mama radio aan doen man drive truck Matratze schlafen
Inleiding Taalkunde
Taalkennis & Taalevolutie
Prototaal: Weer Koko
Inleiding Taalkunde
Taalkennis & Taalevolutie
Prototaal: Weer Koko
that cat more pour me good koko purse that red lips lipstick candy give-me
Inleiding Taalkunde
Taalkennis & Taalevolutie
Prototaal: Homesign
Doof kind Geen blootstelling aan taal ouders Geen blootstelling aan gebarentaal Ontwikkelt spontaan een gebarentaal Met een beetje morfo-syntaxis Met de mogelijkheid om te verwijzen naar zaken buiten de directe context
Inleiding Taalkunde
Taalkennis & Taalevolutie
De geboorte van een taal
Nicaraguaanse gebarentaal Spontaan ontstaan in de jaren 80 Voor de jaren 80: alleen home sign in Nicaragua Jaren 80: 1e dovenschool (vingerspelling Spaans) Door het contact onder de kinderen ontstond een pidgin gebarentaal Daarna: jongere kinderen ontwikkelden de pidgin door tot volledige taal
Inleiding Taalkunde
Taalkennis & Taalevolutie
Meer inzichten in prototalen: experimenten
Goldin-Meadow et al. 2008 Vraag proefpersonen met zelfverzonnen gebaren een bepaalde gebeurtenis te verbeelden Neem proefpersonen met verschillende talen Wat hebben de gebaren-zinnen van de proefpersonen met elkaar gemeen?
Inleiding Taalkunde
Taalkennis & Taalevolutie
Woordvolgorde Nederlands: Jan subject S
sloeg werkwoord V
Piet object O
Ook het Engels heeft SVO: John hit Peter Japans: Jon-wa Peet-o osotta
SOV
Turks: John Peter vurdu
SOV
Arabisch: VSO VOS, OVS, OSV komen wel voor, maar erg weinig
Inleiding Taalkunde
Taalkennis & Taalevolutie
Goldin-Meadow et al. 2008 De proefpersonen krijgen een illustratie van een gebeurtenis te zien op een computerscherm.
Taak 1: beeldt met zelfverzonnen gebaren, zonder te praten, uit wat er gebeurt
Taak 2: zeg in je eigen woorden wat er gebeurt
Inleiding Taalkunde
Taalkennis & Taalevolutie
Goldin-Meadow et al. 2008
Inleiding Taalkunde
Taalkennis & Taalevolutie
Goldin-Meadow et al. 2008
Actor – Patient - Act Inleiding Taalkunde
Taalkennis & Taalevolutie
Goldin-Meadow et al. 2008
Conclusie: Iedereen gebruikt dezelfde volgorde: SOV Onafhankelijk van moedertaal! Inzicht in fossiele principes over prototaal
Inleiding Taalkunde
Taalkennis & Taalevolutie
Verdere inzichten Temporal displacement Ik ben gisteren naar het park geweest 2e taal-leerders: Gisteren ik ben naar het park geweest Homesign: NP/Bijwoord – Gebeurtenisbeschrijving Algemene conclusie Beperkte linguistische systemen zijn simpel Organisatorische principes zijn onafhankelijk van ‘gewone taal’ Organisatie is succesvol voor communicatie: Eerst ‘topic’, dan ‘focus’ Inleiding Taalkunde
Taalkennis & Taalevolutie
Meer informatie over evolutie Stukje van oud-CKI-er Jelle Zuidema op kennislink: http://www.kennislink.nl/publicaties /verschil-tussen-mens-en-dier-is-relatief The language log: Taalkunde-blog door prominente taalkundigen http://languagelog.ldc.upenn.edu/nll/ Persoonlijke websites: http://www.lel.ed.ac.uk/ simon/ http://daneverettbooks.com/ Project Nim, film over Nim Chimpsky: http://www.imdb.com/title/tt1814836/ Inleiding Taalkunde
Taalkennis & Taalevolutie
S. Kirby D. Everett