Formele Semantiek Van de predicatenlogica naar gegeneraliseerde kwantoren Jeroen Van Craenenbroeck en Guido Vanden Wyngaerd
Inhoud 1. Betekenis ............................................................................................................................. 1 1.1. Wat is betekenis? ......................................................................................................... 1 1.2. Sinn en Bedeutung van zinnen ..................................................................................... 2 1.2.1. Waarheidswaarde en waarheidsvoorwaarde ......................................................... 2 1.2.2. De correspondentietheorie van de waarheid ......................................................... 5 1.3. Compositionaliteit ........................................................................................................ 6 2. Syntaxis en semantiek van de logica ................................................................................ 11 2.1. Inleiding ..................................................................................................................... 11 2.2. Propositionele logica .................................................................................................. 12 2.2.1. Syntaxis ............................................................................................................... 12 2.2.2. Semantiek ............................................................................................................ 13 2.2.3. Oefeningen .......................................................................................................... 17 2.3. Predicatenlogica ......................................................................................................... 19 2.3.1. Verzamelingen .................................................................................................... 19 2.3.2. Basisvocabularium en syntaxis ........................................................................... 21 2.3.3. Kwantificatie in de predicatenlogica .................................................................. 22 2.3.4. Semantiek van eenplaatsige predicaten .............................................................. 24 2.3.5. Semantiek van tweeplaatsige predicaten ............................................................ 31 2.3.6. Oefeningen .......................................................................................................... 33 2.3.7. Het probleem van existential import ................................................................... 34 2.4. Lambda-conversie ...................................................................................................... 37 2.4.1. Conjunctie ........................................................................................................... 37 2.4.2. Zinnen met alleen ............................................................................................... 41 2.4.3. Relatiefzinnen ..................................................................................................... 42 2.4.4. VP-ellipsis ........................................................................................................... 43 3. Syntaxis en semantiek van natuurlijke taal ....................................................................... 45 3.1. Zinnen ........................................................................................................................ 45 3.2. Werelden en tijden ..................................................................................................... 46 4. Functies en Types ............................................................................................................. 50 4.1. Functies ...................................................................................................................... 50 4.1.1. De interne structuur van VP ................................................................................ 50 4.1.2. Eigenschappen van functies ................................................................................ 53 4.1.3. Functionele applicatie ......................................................................................... 57 4.1.4. De semantische analyse van intransitieve zinnen ............................................... 61 4.1.5. De functiedenotatie van transitieve werkwoorden .............................................. 64 4.1.6. De semantische analyse van transitieve zinnen .................................................. 69 4.2. Types .......................................................................................................................... 74 i
4.2.1. Een nieuw formalisme ........................................................................................ 74 4.2.2. Adjectieven ......................................................................................................... 76 4.2.3. Individuele concepten ......................................................................................... 79 4.2.4. Gebeurtenissen .................................................................................................... 81 4.2.5. Type-gestuurde interpretatie en onwelgevormdheid .......................................... 84 4.3. λ-conversie met types................................................................................................. 86 4.4. Oefeningen ................................................................................................................. 94 5. Gegeneraliseerde kwantoren ............................................................................................. 97 5.1. Inleiding ..................................................................................................................... 97 5.2. Problemen met NP-denotaties.................................................................................... 97 5.2.1. Kwantoren ........................................................................................................... 97 5.2.2. Kwantoren in de predicatenlogica ...................................................................... 99 5.2.3. Hogere ordekwantoren ...................................................................................... 100 5.3. De oplossing: gegeneraliseerde kwantoren .............................................................. 103 5.4. Gegeneraliseerde kwantoren en zinnen ................................................................... 108 5.5. De interne structuur van generaliseerde kwantoren ................................................. 110 5.6. Zinsdenotaties en eigennamen ................................................................................. 111 5.7. Hogere ordekwantoren ............................................................................................. 112 6. Slotoefening .................................................................................................................... 114 7. Bibliografie ..................................................................................................................... 115 8. Sleutel van de oefeningen ............................................................................................... 116
ii
1. BETEKENIS 1.1.
Wat is betekenis?
(1)
Wat is betekenis?
De Duitse wiskundige/logicus/filosoof Gottlob Frege (1848-1925) introduceerde in zijn opstel Uber Sinn und Bedeutung (1892) als eerste een onderscheid tussen twee soorten betekenis. Veronderstel een situatie waarin een gezin 2 kinderen heeft, Karel en Lisa; de ouders hebben geen van beide andere kinderen. In zo’n situatie verwijzen elk van de volgende uitdrukkingen naar dezelfde persoon: (2)
a. b. c.
Lisa de zus van Karel de dochter van Karel zijn ouders
Volgens Frege hebben de drie uitdrukkingen dezelfde Bedeutung, maar een andere Sinn. Zijn klassiek geworden voorbeeld is dat van de planeet Venus, die ook wel aangeduid wordt met de termen ‘ochtendster’ en ‘avondster’, naargelang het tijdstip van de dag waarop het hemellichaam zichtbaar is. Maar terwijl de zin ‘de ochtendster is de ochtendster’ tautologisch klinkt, is het anders voor de zin ‘de ochtendster is de avondster’, die wel degelijk iets informatiefs zegt. Dat is omdat de benamingen ‘ochtendster’ en avondster’ een andere Sinn hebben, terwijl hun Bedeutung dezelfde is. Andere termen om naar hetzelfde onderscheid te verwijzen worden hieronder gegeven. Sinn sense intensie
(3)
Bedeutung reference extensie denotatie ‘aboutness’ ‘out-thereness’
Denk na over hoe je het onderscheid tussen Sinn en Bedeutung zou omschrijven.
1
In (2) hebben we een voorbeeld gezien van verschillende soorten NP’s, waarbij het onderscheid tussen Sinn en Bedeutung redelijk transparant is. Niet voor alle woorden en combinaties ervan is dit onderscheid zo eenvoudig vast te stellen. (4) Denk na over de betekenis van de volgende woorden of combinaties van woorden in termen van het onderscheid tussen Sinn en Bedeutung: 1. Lisa 2. dochter 3. ouders 4. de dochter slaapt 5. de 6. iedere Kun je, in het licht van het bovenstaande, de volgende uitspraak van Frege becommentariëren: “Nur im Zusammenhange eines Satzes bedeuten die Wörter etwas.”?
1.2.
Sinn en Bedeutung van zinnen
1.2.1. Waarheidswaarde en waarheidsvoorwaarde Wat is de betekenis van de zin in (5)? (5)
Er zit een rode salamander onder de vleugelpiano.
Frege stelt dat de Bedeutung van een zin een waarheidswaarde is: (6)
“So werden wir dahin gedrängt, den Wahrheitswert eines Satzes als seine Bedeutung anzuerkennen. Ich verstehe unter dem Wahrheitswert eines Satzes den Umstand, daß er wahr oder falsch ist. Weitere Wahrheitswerte gibt es nicht.” (Über Sinn und Bedeutung)
2
(7)
Welke Bedeutung hebben de volgende zinnen volgens Frege? a. Parijs is de hoofdstad van Frankrijk. b. Rome is de hoofdstad van Italië. c. Yamoussoukro is de hoofdstad van Ivoorkust. d. Ouagadougou is de hoofdstad van Ivoorkust.
Keren we terug naar onze zin in (5). Zijn Bedeutung is een waarheidswaarde. Kunnen we iets meer zeggen over zijn Sinn? Deze zin beschrijft een bepaalde situatie in de werkelijkheid, meer bepaald een situatie waarin er een rode salamander onder de vleugelpiano zit. Op die manier bekeken is de betekenis van een zin kennen hetzelfde als weten hoe de werkelijkheid er moet uitzien opdat de zin waar zou zijn. Merk op dat dit niet hetzelfde is als weten of de zin effectief waar is of niet. Ik hoef niet te weten of er een rode salamander onder de vleugelpiano zit om de betekenis (d.w.z. de Sinn) van de zin in (5) te kennen. Ik weet alleen hoe de werkelijkheid eruitziet als de zin waar is. Het verschil dat we hier maken is dat tussen waarheidswaarde en waarheidsvoorwaarde. Het eerste heeft betrekking op het al dan niet waar zijn van een zin. Een (mededelende) zin is waar of onwaar, en dat is zijn waarheidswaarde. In de praktijk is dit begrip echter niet altijd even goed werkbaar. Bekijken we bijvoorbeeld de zinnen in (8). (8)
a. b. c.
Het regent op dit moment in Tokyo. Op 23 april 1458 werden er in Europa 562 kinderen geboren. Carla is verliefd op Joeri.
Om de waarheidswaarde van deze zinnen te kennen, moeten we kennis hebben over het weer aan de andere kant van de wereld (8a), de geboortecijfers van 1458 (8b) of de innerlijke gevoelswereld van iemand anders (8c). Een semantische theorie die enkel en alleen op waarheidswaarden is gebaseerd, kan over deze zinnen dus weinig zinvols zeggen. Dat is de reden waarom het begrip waarheidsvoorwaarden in de theorie wordt geïntroduceerd. We weten dan wel niet of de zinnen in (8) waar zijn of niet, maar we weten wel aan welke voorwaarden moet worden voldaan opdat ze waar zouden zijn. Terug naar de waarheidsvoorwaarde van de zin in (5). We hebben gezien dat deze zin waar is als er een rode salamander onder de vleugelpiano zit. We kunnen deze waarheidsvoorwaarde dan ook weergeven als in (9): (9)
Waarheidsvoorwaarde van (5) De zin “Er zit een rode salamander onder de vleugelpiano” is waar als en alleen als er een rode salamander onder de vleugelpiano zit.
3
Zinnen van dit type noemen we T-zinnen, naar de Poolse logicus en wiskundige Alfred Tarski (1901-1983). Tarski ontwikkelde een wiskundige definitie van waarheid voor formele talen. Aan de basis van Tarski zijn definitie van waarheid liggen beweringen als in (9), waarvoor hij een algemeen schema van waarheidsvoorwaarden formuleerde, dat voor iedere mededelende zin zegt wat de waarheidsvoorwaarde van die zin is. (10)
Voor elke zin S in taal L en situatie v geldt dat S waar is in v als en slechts als p.
In deze formulering beschrijft p de waarheidsvoorwaarde voor S. Er zit een opvallende symmetrie in dergelijke schema’s, met dezelfde variabele voor en na de ‘als en alleen als’. Op het eerste gezicht is deze waarheidsvoorwaarde triviaal of zelfs banaal. Het is echter belangrijk om te beseffen dat wat er voor de ‘als en slechts als’ staat een zin is uit de taal, en wat erna staat (in (9) is dat laatste het cursieve gedeelte) opgevat moet worden als ‘hoe de werkelijkheid is’. Om het onderscheid uit te drukken spreken we van objecttaal links, en metataal rechts in de T-zin. Natuurlijk is in dit geval het verschil tussen objecttaal en metataal erg theoretisch, omdat we in beide gevallen met Nederlands te maken hebben. Dat geeft aan een T-zin als (9) en (10) dan ook heel sterk de smaak van een circulaire of tautologische bewering. Iets minder tautologisch wordt het wanneer we de zin uit de objecttaal (voor de ‘als en alleen als’) in een andere taal formuleren: (11)
De zin “Van egy piros szalamandra a zongora alatt” is waar als en alleen als er een rode salamander onder de vleugelpiano zit.
Dit voorbeeld toont aan dat de vorm die iets krijgt in taal erg variabel kan zijn, terwijl anderzijds de betekenis onveranderd blijft.
(12) Wat is de waarheidswaarde en de waarheidsvoorwaarde van de volgende zinnen? Kan je voor elke zin een waarheidswaarde en een waarheidsvoorwaarde opstellen? Leg uit waarom (niet). a.
Het Belgisch koninklijk paleis bevindt zich in Brussel.
b.
Jan is ouder dan 30 of jonger dan 40.
c.
Jan is jonger dan 30 en ouder dan 40.
4
d.
Wie heeft dat boek op de tafel gelegd?
e.
Leg dat boek op de tafel!
1.2.2. De correspondentietheorie van de waarheid In deze sectie willen we even stil staan bij een aantal eerder filosofische implicaties van waarheidsvoorwaarden zoals we die geformuleerd hebben in (9) en (10). Hoewel deze kwesties de taalkundige praktijk niet wezenlijk beïnvloeden, is het toch nuttig om even stil te staan bij een aantal ervan. Een waarheidsvoorwaarde zoals in (9) en (10) is een manifestatie van de correspondentietheorie van de waarheid, volgens welke de waarheid van een bewering bestaat in de overeenstemming tussen de inhoud van de bewering en een feit of stand van zaken in de werkelijkheid. Een dergelijke theorie veronderstelt om te beginnen al dat de werkelijkheid bestaat los van onze waarneming ervan, en dat bovendien deze werkelijkheid kenbaar is. Dergelijke aannames zijn verre van onproblematisch: hoe weten we dat onze waarnemingen van de werkelijkheid geen dromen zijn, of hallucinaties? En zelfs in die gevallen waarin we weten dat we met een fictieve werkelijkheid te maken hebben, kunnen we ware of onware beweringen doen over die fictie (bv. ‘Hercule Poirot was een Belg’), of over personen of voorwerpen waarover we gedroomd hebben. Een verwant probleem is of voorwerpen wel een bestaan hebben los van onze waarneming ervan. Waarom beschouwen we de vleugel van een vliegtuig als een object, maar de onderkant of de linkerhelft van diezelfde vleugel niet? Sommige objecten bestaan uit meerdere, ruimtelijk verspreide objecten, bv. een kudde. Maar vanaf wanneer beschouwen we een collectie dieren een kudde? En waarom beschouwen we de bladeren aan een boom niet als een voorwerp? Waarom is een tafelpoot een voorwerp, maar de poten van alle tafels in deze kamer niet? Het lijkt erop dat wat we als een object beschouwen niet in de eerste plaats bepaald wordt door objectieve eigenschappen van de werkelijkheid, maar juist sterk door de aard van de menselijke geest, d.w.z. onze cognitie. Nog meer problemen voor de correspondentietheorie zijn de talloze abstracte objecten waar we d.m.v. taal moeiteloos over spreken. (13)
a. b. c. d. e. f.
De fout in de redenering was zonneklaar, maar Noam merkte hem niet op. De gemiddelde Belg heeft 2,3 kinderen. Haar verleidelijke blik bracht me geheel van mijn stuk. Er zijn kansen die men niet mag laten lopen. We betreurden met zijn allen Marie haar gebrek aan talent. De jongens zaten gezellig te keuvelen.
5
Wat is de objectieve basis voor het bestaan van geografische entiteiten, zoals België, de Maas, etc.? Naar welk object verwijzen we met de beschrijving ‘Bachs cantate nr. 131 (Aus der Tiefen)’? De partituur? Een uitvoering ervan? Welke uitvoering? Of de opname (cd, vinylplaat, dvd, mp3, etc.) van de uitvoering? En wat denoteert het woord ‘Kerstmis’? Zelfs als we ervan uitgaan dat onze zintuigen ons een betrouwbaar beeld geven van ‘hoe de dingen zijn’, dan nog is niet vanzelf duidelijk dat onze beschrijvingen van de werkelijkheid in taal ook betrouwbaar zijn, of een accurate weergave van de werkelijkheid zoals die zou bestaan los van onze waarneming. Het begint er zelfs veeleer op te lijken dat de overgrote meerderheid van de objecten en activiteiten waar we naar verwijzen d.m.v. taal in eerste instantie een bestaan hebben in ons hoofd, eerder dan in een werkelijkheid die zou bestaan buiten en onafhankelijk van de menselijke geest. Deze veeleer rationalistische (i.t.t. empiristische) opvatting over de verhouding tussen de werkelijkheid en onze waarneming ervan gaat op zijn minst terug tot Immanuel Kant (1724 - 1804). Hij zag in dat onze waarneming van de werkelijkheid gestuurd wordt door onze begripscategorieën, die hij Begriffe noemde. Hij stelde het lapidair als volgt: “Anschauungen ohne Begriffe sind blind, Begriffe ohne Anschauungen sind leer” (Kritik der Reinen Vernunft). Sommige filosofen hebben gemeend de correspondentietheorie te moeten vervangen door een coherentietheorie, volgens dewelke de waarheid van een bewering bestaat in de overeenstemming met andere beweringen waarmee ze in een systeem kan worden samengebracht. Binnen een coherentietheorie van de waarheid is echter niet meteen in te zien hoe we een bewering als (9) of (10) moeten opvatten of interpreteren. Er bestaat een manier om de correspondentietheorie intact te houden, tenminste voor zover we er gebruik van willen maken in taalkundige analyses. Een mogelijke uitweg voor de correspondentietheorie zou erin kunnen bestaan dat we referentie opvatten, niet als een relatie tussen taal en een werkelijkheid buiten ons, maar als een relatie tussen twee soorten interne representaties: enerzijds de talige representatie, en anderzijds onze mentale representatie van de werkelijkheid. Hoe die laatste zich verhoudt tot de ‘echte’ werkelijkheid buiten ons, is dan een probleem dat we over kunnen laten aan de filosofen om op te lossen.
1.3.
Compositionaliteit
Een semantische theorie die enkel schema’s van het soort in (10) genereert, zou triviaal zijn. Het hoeft dan ook niet te verbazen dat er nog een andere, meer fundamentele eigenschap van betekenis is die we in onze theorie zullen proberen te vatten. Het gaat om het vermogen van taalgebruikers om zinnen te begrijpen die ze nog nooit eerder gehoord hebben. Bekijk bijvoorbeeld de zin in (14).
6
(14)
De blauwe eenhoorn legde de schoppen vier op de schildpad en vertelde het roodgelakte bladluisje over zijn wedervaren met het Spaanse graan.
De kans dat je deze zin al eerder gehoord of gelezen hebt is erg klein. Desalniettemin heb je geen enkel probleem om te begrijpen wat deze zin betekent. Hoe doen taalgebruikers dat? Anders geformuleerd, hoe gaan taalgebruikers tewerk wanneer ze de waarheidsvoorwaarde van een zin opstellen? Het voorbeeld in (14) laat duidelijk zien dat zinnen geen ondeelbare, monolithische betekeniseenheden zijn. Als dat het geval was, dan zouden we de betekenis van nieuwe zinnen immers niet onmiddellijk kunnen doorgronden. Vergelijk het met een kind dat zijn moedertaal aan het leren is. Wanneer het een woord tegenkomt dat hij nog nooit gehoord heeft, dan moet iemand hem uitleggen wat dat woord betekent, anders kan hij niet verder. Bij zinnen werkt het duidelijk anders. Dat komt omdat zinnen opgebouwd zijn uit kleinere delen die zelf betekenis dragen. In de zin in (14) bijvoorbeeld weten we wat de woorden de, blauwe en eenhoorn betekenen, en we weten ook wat het betekent wanneer we die woorden samenvoegen tot de nominale constituent de blauwe eenhoorn. Bovendien weten we wat het betekent wanneer die nominale constituent het subject is van het vervoegde werkwoord legde, enz. Het algemene principe is duidelijk: we leiden de betekenis van een zin af uit de betekenissen van de woorden die in die zin voorkomen. Deze idee zal een uiterst centrale rol spelen in de theorie die we in deze cursus ontwikkelen. Ze kreeg de naam compositionaliteitsbeginsel mee, en wordt in de taalkundige literatuur gewoonlijk gedefinieerd als volgt: (15)
Het compositionaliteitsbeginsel De betekenis van een complexe uitdrukking kan worden afgeleid van de betekenissen van de onderdelen van die uitdrukking, en van de manier waarop ze met elkaar gecombineerd worden.
Het compositionaliteitsbeginsel wordt vaak toegeschreven aan Frege, maar zeker is in ieder geval dat Frege nooit iets zo expliciet heeft geformuleerd als in (15); er zijn zelfs auteurs die beweren dat Frege het niet eens zou geweest zijn met (15) (zie bv. Janssen 2001, Pelletier 2001). (16) Om het begrip compositionaliteit te duiden, kijken we best naar het onderscheid tussen fonologie en morfologie. Bekijk bijvoorbeeld het woord koekjes. (a)
Uit welke fonologische bouwstenen bestaat dit woord?
7
(b)
Uit welke morfologische bouwstenen bestaat dit woord?
(c)
Voldoet de fonologische compositie van koekjes aan het compositionaliteitsbeginsel? Leg uit waarom (niet).
(d)
Voldoet de morfologische compositie van koekjes aan het compositionaliteitsbeginsel? Leg uit waarom (niet).
Vooraleer we opnieuw naar de betekenis van zinnen overstappen, willen we de morfologie nog even gebruiken om een ander aspect van de definitie in (15) te illustreren. In die definitie is immers sprake van twee dingen. De betekenis van een complexe uitdrukking wordt niet alleen bepaald door de betekenissen van de onderdelen van die uitdrukking, maar ook door de manier waarop die onderdelen met elkaar gecombineerd worden. (17) Bespreek het belang van dit principe aan de hand van het betekenisverschil tussen melkchocolade en chocolademelk.
Terug naar de betekenis van zinnen. Uit de bespreking van voorbeeld (14) kun je afleiden dat de betekenis van zinnen ook volgens het compositionaliteitsbeginsel tot stand komt. Dit kun je duidelijk laten zien aan de hand van een eenvoudige zin zoals Piet zingt. De betekenis (= de waarheidsvoorwaarde) van deze zin wordt immers bepaald door de betekenis van de onderdelen ervan (Piet en zingt) en de manier waarop die onderdelen met elkaar gecombineerd worden (Piet is het subject van zingt).
8
(18) Hoewel de syntaxis in hoge mate compositioneel is, zijn er ook voorbeelden van syntactische constructies waarvan de betekenis niet compositioneel is opgebouwd. Kan je enkele voorbeelden geven?
(19) Laat zien dat het bij de betekenis van zinnen ook erg belangrijk is hoe de woorden met elkaar gecombineerd worden (cf. het tweede deel van de definitie in (15)). Geef een syntactisch voorbeeld dat parallel is aan het chocolademelk/melkchocolade-voorbeeld van hierboven, d.w.z. twee zinnen die uit dezelfde woorden bestaan maar een andere betekenis hebben.
(20) Vormen ambiguë zinnen een probleem voor het compositionaliteitsbeginsel? Waarom (niet)?
Aangezien we het in de rest van deze cursus niet langer over fonologie of morfologie zullen hebben, kunnen we het compositionaliteitsbeginsel in (15) wat specificeren zodat het enkel op de betekenis van zinnen (en dus op syntaxis) van toepassing is. Dat zal ons ook helpen om de onderzoeksvragen scherp te stellen die in de rest van deze cursus centraal zullen staan. (21)
Het compositionaliteitsbeginsel bis (specifiek voor zinnen) De betekenis van een zin kan worden afgeleid van de betekenissen van de woorden waaruit die zin bestaat, en van de syntactische structuur van die zin.
9
Alvorens we deze definitie kunnen toepassen, rijzen er drie belangrijke vragen: (22)
(i) (ii) (iii)
Wat is de betekenis van een zin? Wat is de betekenis van de woorden waaruit een zin bestaat? Hoe geraken we van de betekenis van de woorden van een zin naar de betekenis van de hele zin? Anders geformuleerd, welke rol speelt de syntactische structuur?
De eerste vraag hebben we hierboven al beantwoord: de Bedeutung van een zin is zijn waarheidswaarde, zijn Sinn is de waarheidsvoorwaarde van die zin. De vragen in (ii) en (iii) vormen het centrale uitgangspunt van deze cursus en worden hieronder dus uitvoerig behandeld.
10
2. SYNTAXIS EN SEMANTIEK VAN DE LOGICA 2.1.
Inleiding
Veel van de instrumenten en concepten van de formele semantiek zijn ontleend aan de logica, zowel de propositionele logica als de predicatenlogica (in zijn geformaliseerde versie ook de predicatencalculus genoemd of PC). De logica heeft een lange en eerbiedwaardige traditie die teruggaat tot de Griekse wijsgeer Aristoteles (384-322 voor Christus; in het bijzonder zijn Organon). De ontwikkeling van de moderne mathematische logica, d.w.z. de predicatencalculus en zijn theorie van kwantificatie, is het werk geweest van een aantal mensen: de al eerder vermelde Gottlob Frege (1848-1925), verder Alfred North Whitehead (1861-1947) en Bertrand Russell (1872-1970), de laatste twee de auteurs van de Principia Mathematica (1910-1913), en Alfred Tarski (1901-1983). De logica is lange tijd beschouwd geweest als een los van de taalkunde staande discipline, die vooral diende om te bestuderen hoe men geldige afleidingen kon maken (bv. in de wiskunde). De logica werd niet relevant geacht voor de analyse van betekenis in natuurlijke taal. Natuurlijke taal werd gezien als te obscuur, te ambigu en te los van structuur om vatbaar te zijn voor de rigoureuze behandeling die de logica verschafte. Daarin kwam verandering in de late jaren 60 van de vorige eeuw, met enerzijds de ontwikkeling van de formele syntaxis door Noam Chomsky, en anderzijds een reeks artikelen van Richard Montague (1930–1971). Het meest bekende hiervan is “The Proper Treatment of Quantification in Ordinary English” (ook aangeduid als PTQ). Daarin betoogde hij dat natuurlijke taal net zo behandeld kon worden als de formele kunsttaal die de logica is. Zo ontstond de discipline van de formele semantiek als een subdiscipline van de (formele) taalkunde. Het is daarom nuttig even een blik te werpen op de logica, en vervolgens te zien hoe gelijkaardige methodes en concepten gebruikt kunnen worden voor natuurlijke taal. In wat volgt staan we achtereenvolgens stil bij de propositionele en de predicatenlogica. Van beide soorten logica’s bespreken we zowel de syntaxis en de semantiek. De syntaxis definieert wat de woordenschat is en hoe welgevormde uitdrukkingen (well-formed formulas of wff). De semantiek van de logica beregelt de interpretatie van de welgevormde uitdrukkingen. Die interpretatie gebeurt in een model. De modeltheorie is ontstaan als de studie van formele talen en hun interpretatie. In een ruimere zin is de modeltheorie de studie van de interpretatie van elk soort taal (formele of natuurlijke taal) door middel van verzamelingstheoretische structuren. Een zin (of een formule uit de logica) is immers zelden altijd waar of onwaar: de meeste uitdrukkingen zijn waar met betrekking tot een bepaalde situatie. Het expliciteren van informatie over de situatie waardoor we kunnen beslissen over waarheid on onwaarheid van een bewering S noemen het interpreteren van S, en de toegevoegde informatie is een interpretatie van S. Als een bepaalde interpretatie I er voor zorgt dat S waar is, dan noemen we I een model van S, of dan voldoet S aan I. Een andere
11
manier om te zeggen dat I een model is van S is zeggen dat S waar is in I. Dit is een modeltheoretische notie van waarheid, nl. waarheid in een bepaalde interpretatie. Wanneer we zeggen ‘S is waar in I’, dan bedoelen we daarmee eigenlijk ‘S is waar indien geïnterpreteerd als in I’. Dit mag nu nog redelijk abstract klinken, maar we zullen verderop concrete voorbeelden geven van een model waarbinnen we de waarheid van beweringen zullen beoordelen. Wanneer we spreken van de semantiek van de propositionele en de predicatenlogica hanteren we de term ‘semantiek’ dus in een specifieke betekenis, nl. als verwijzend naar de interpretatie in een model. Een andere vaak gebruikte betekenis van ‘semantiek’ verwijst gewoon naar het feit dat we om een betekenis weer te geven gebruik maken van een vertaling in een formele taal. Zoals we meteen zullen zien, is een zin als ‘Karel houdt van Marie of Sandra’ in de propositionele logica voor te stellen als (p ∨ q). Deze vertaling in de formele taal van de logica kan ook beschouwd worden als een voorstelling van de semantiek van de zin uit de natuurlijke taal, zonder dat er noodzakelijk een interpretatie in een model bij gegeven wordt.
2.2.
Propositionele logica
2.2.1. Syntaxis De propositielogica (in het Engels soms ook statement logic genoemd) heet zo omdat hij proposities als atomen beschouwt, d.w.z. als de minimale eenheden van het basisvocabularium. Een propositie kunnen we opvatten als de logische tegenhanger van een (enkelvoudige) zin. De propositielogica bestudeert de combinaties van proposities door middel van een aantal logische operatoren (en dus niet de interne structuur van proposities; dat doet de predicatenlogica wel). De propositielogica is een formele taal, die een syntaxis heeft en een semantiek. De syntaxis van de propositielogica is erg eenvoudig, en wordt gegeven in (24). (23)
Basisvocabularium van de propositionele logica i. een oneindig aantal atomaire proposities, voorgesteld als p, q, r, s, … ii. connectoren: ~, &, ∨, →, ↔ iii. hulpsymbolen: ( )
(24)
Syntaxis i. Elke atomaire propositie is een formule (wff). ii. Als φ en Ψ formules zijn, dan zijn ~φ, (φ & Ψ), (φ ∨ Ψ), (φ → Ψ) en (φ ↔ Ψ) formules.
12
(25)
Zijn de volgende formules welgevormd volgens de regels? a. ~~p b. (~p & ~q) c. p∨p d. & (p ∨ q) e. ((~p ∨ q) ↔ (p → q))
De logische operatoren in (24-ii) worden ook de Booleaanse operatoren genoemd (naar de Britse wiskundige en logicus George Boole, 1815-1864). Ze heten respectievelijk negatie, conjunctie, disjunctie, implicatie en equivalentie. 2.2.2. Semantiek Wat de semantiek van proposities betreft, nemen we aan dat de denotatie van een propositie, zoals die van een zin, een waarheidswaarde is. De waarheidswaarde van complexe formules wordt bepaald door de waarheidswaarden van de atomaire proposities die er deel van uitmaken, en de syntactische structuur van de complexe formule. Anders gezegd: de betekenis van complexe formules beantwoordt aan het compositionaliteitsbeginsel. Voor elke logische operator bestaat een waarheidstabel die zegt wat de waarheidswaarde is van de complexe formule in functie van de waarheidswaarde van zijn atomaire proposities. Deze waarheidstabellen worden hieronder gegeven: (26)
(27)
(28)
Negatie p ~p 1
0
0
1
Conjunctie p q (p & q) 1 1
1
1 0
0
0 1
0
0 0
0
Disjunctie p q (p ∨ q) 1 1
1
13
(29)
(30)
1 0
1
0 1
1
0 0
0
Implicatie p q (p → q) 1 1
1
1 0
0
0 1
1
0 0
1
Equivalentie p q (p ↔ q) 1 1
1
1 0
0
0 1
0
0 0
1
De logische operatoren corresponderen met woorden uit natuurlijke taal, respectievelijk ‘niet p’, ‘p en q’, ‘p of q’, ‘als p dan q’, ‘p als en slechts als q’. Toch is de betekenis van deze woorden niet steeds identiek aan die van de logische operatoren. Zo betekent ‘Jan nam een douche en kleedde zich aan’ iets anders dan ‘Jan kleedde zich aan en nam een douche’, maar in de logica geldt dat p & q steeds gelijk is aan q & p. Bij ‘of’ is het niet steeds duidelijk of de waarheid van beide conjuncten volstaat voor de waarheid van de samengestelde zin. Als ik zeg dat Marie een diploma heeft van sterrenkunde of van taalkunde, is de zin dan waar als Marie en diploma heeft van sterrenkunde én van taalkunde? Indien het antwoord op die vraag ‘nee’ is, spreken we van exclusief ‘of’, in het andere geval inclusief ‘of’. De logische disjunctie ∨ is inclusief, maar in natuurlijke taal lijkt of vaak een exclusieve betekenis te hebben, zoals in het bovenstaande geval. Er zijn echter ook gevallen in natuurlijke taal waarin de disjunctie inclusief lijkt te zijn, zoals in de logica. ‘If we assert that a man who has acted in a particular way must be either a knave or a fool, we by no means assert, or intend to assert, that he cannot be both’ (Mill 1867:512, geciteerd in Horn 1989:226). Ook bij de implicatie zijn er discrepanties tussen de manier waarop de logica werkt en natuurlijke taal werkt. Stel dat de zin ‘Als Dries braaf is, dan krijgt hij een snoepje’ waar is, dan zouden we geneigd zijn om te concluderen dat als Dries niet braaf is, hij geen snoepje krijgt. Voor de implicatie geldt dat evenwel niet: als in (p → q) de waarheidswaarde van p=0, dan is de complexe formule altijd waar. Al sinds Aristoteles staat dit fenomeen bekend als ex necessarie falso sequitur quodlibet: uit een onware bewering volgt om het even wat. De redenering ‘Als een cirkel vier hoeken heeft, dan is Jan Becaus een nieuwslezer bij de VRT’
14
is waar in de logica. In de natuurlijke taal lijkt dit erg op wartaal; om die reden spreekt men soms van ‘onnatuurlijke implicatie’ of ‘materiële implicatie’. Een andere onnatuurlijke implicatie heeft de naam verum sequitur ad quodlibet (een ware bewering volgt op elke propositie). De informatie die vervat zit in de waarheidstabellen zijn eigenlijk waarheidsvoorwaarden: ze maken duidelijk onder welke voorwaarden een propositie waar is of onwaar. Dat kunnen we wat explicieter vorm geven door ze anders te formuleren. Neem bv. een formule met de conjunctie p & q: deze is waar als en slechts als beide conjuncten waar zijn. Geformuleerd als een waarheidsvoorwaarde voor de waarheid van de complexe formule p & q kan dit er uit zien als in (31) (denotaties worden weergegeven door middel van dubbele vierkante haken〚〛): (31)
〚(p & q)〛= 1 als en slechts als〚p〛= 1 en〚q〛= 1 〚(p & q)〛= 0 in alle andere gevallen
(32) (i)
Formuleer een analoge waarheidsvoorwaarde voor de andere Booleaanse operatoren: 〚(p ∨ q)〛= 〚(p ∨ q)〛= 〚(p → q)〛= 〚(p → q)〛= 〚(p ↔ q)〛= 〚(p ↔ q)〛= 〚~p〛= 〚~p〛=
(ii) (iii) (iv)
Met een waarheidstabel kunnen we de waarheidswaarde berekenen van elke willekeurige complexe bewering in de propositionele logica. Als voorbeeld nemen we de formule ((p → q) ⟷ (p ∨ q)). Daarbij bouwen we de complexe bewering van links naar rechts stap voor stap op, beginnend met de atomaire formules. (33) p
q
(p → q)
(p ∨ q)
((p → q) ⟷ (p ∨ q))
1 1 0 0
1 0 1 0
1 0 1 1
1 1 1 0
1 0 1 0
De derde en de vierde kolom herhalen wat we hierboven gezien hebben. nieuw is de laatste kolom: daarbij kijken we naar de waarden in de twee voorgaande kolommen en passen we de
15
waarheidsvoorwaarden toe voor de waarheid van ⟷ (alleen waar indien p en q dezelfde waarheidswaarde hebben. Een tautologie is een complexe bewering die alleen de waarde 1 oplevert in de laatste kolom, d.w.z. die waar is voor elke mogelijke keuze van waarheidswaarde van de atomaire proposities. Voorbeelden van tautologieën zijn (p ∨ ~p), (p → p), en ~(p & ~p). Contradicties zijn beweringen die alleen 0 opleveren in de laatste kolom, d.w.z. die onwaar zijn voor elke keuze van waarheidswaarden van de atomaire proposities. Voorbeelden van contradicties zijn (p & ~p), ~(p ∨ ~p), en ~((p ∨ q) ⟷ (q ∨ p)). Alle andere beweringen zijn contingente beweringen: hun waarheid varieert met de waarheidswaarden van de atomaire proposities. (34) a.
Teken een waarheidstabel voor de tautologieën en contradicties hierboven vermeld. (p ∨ ~p)
b.
(p → p)
c.
~(p & ~p)
d.
(p & ~p)
e.
~(p ∨ ~p)
f.
~((p ∨ q) ⟷ (q ∨ p))
16
Als een equivalentie (p ⟷ q) een tautologie is, dan zijn de twee elementen van de equivalentie logisch equivalent, of een logische wet. Een voorbeeld is ~(p ∨ q), dat logisch equivalent is met (~p & ~q). Dergelijke logische equivalenties noteren we met een dubbele bidirectionele pijl: ~(p ∨ q) ⇔ (~p & ~q). Deze pijl is geen nieuwe Booleaanse operator, maar een manier om uit te drukken dat de bewering ~(p ∨ q) ⟷ (~p & ~q) een tautologie is. (35)
Toon aan met een waarheidstabel dat ~(p ∨ q) ⟷ (~p & ~q) een logische
equivalentie is.
2.2.3. Oefeningen (36) Vertaal de volgende zinnen in het formalisme van de propositionele logica. Geef bij elke zin een sleutel waarin je zegt voor welke Nederlandse zin elke atomaire propositie staat. Maak je atomaire proposities zo klein mogelijk. a. Jan heeft bedriegt zijn vrouw of hij heeft een drankprobleem, of allebei.
b. Jan bedriegt zijn vrouw of hij heeft een drankprobleem, maar niet allebei.
c. Als Jan stopt met drinken en stopt met roken, dan wil Marie met hem trouwen.
d. Marie wil niet met Jan trouwen, tenzij hij stopt met drinken en met roken.
17
e. Als Fred en Karen niet naar het feestje gaan, dan ga ik ook niet.
f. Rachel lust geen spruitjes of rode kool.
(37) Welke van de volgende beweringen is een logische equivalentie? Maak een waarheidstabel. a. (p → q) ⟷ (~p ∨ q)
b. (p → q) ↔ (~q → p)
c. ~(p & q) ↔ (~p ∨ ~q)
d. ~~p ↔ p
e. (p & (q ∨ r) ↔ ((p & q) ∨ (p & r))
18
2.3.
Predicatenlogica
2.3.1. Verzamelingen Voor we op de predicatenlogica zelf ingaan moeten we eerst een in de semantiek veelgebruikt wiskundig hulpmiddel bespreken, de verzamelingenleer. Een verzameling is een collectie van entiteiten van gelijk welk soort. Een verzameling kan eindig zijn (bv. de verzameling van de stoelen in dit klaslokaal) of oneindig (bv. de verzameling van de natuurlijke getallen). Verzamelingen kunnen op een aantal manieren worden voorgesteld. De eerste is door opsomming: (38)
{Marie, Amsterdam, Fido, π, de Rijn}
De volgorde waarin de leden van een verzameling staan maakt in principe geen verschil: de verzameling in (38) is precies dezelfde als die in (39): (39)
{Fido, de Rijn, π, Amsterdam, Marie}
Ook oneindige verzamelingen kunnen door opsomming weergegeven worden, op voorwaarde dat er aan het eind drie puntjes staan, en dat het duidelijk is om welke verzameling het gaat: (40)
a. b.
{0, 1, 2, 3, 4, … } {0, 2, 4, 6, 8, 10, … }
Een andere manier om de inhoud van verzamelingen voor te stellen is door een omschrijving. Dit kan natuurlijk alleen als de leden van een verzameling iets gemeenschappelijks hebben, zoals bij de verzamelingen in (40), die we door een omschrijving voorstellen als (71): (41)
a. b.
{x : x is een natuurlijk getal} {x : x is een even natuurlijk getal}
We noemen dit de predicaatsnotatie, en we lezen ze als volgt: de verzameling van alle x zodanig dat x een (even) natuurlijk getal is. De manier waarop we een verzameling voorstellen, als een opsomming of door een omschrijving, is verder irrelevant: de respectievelijke verzamelingen in (40) zijn precies dezelfde als die in (41). Ook als we omschrijving veranderen maar de leden van de verzameling dezelfde blijven hebben we te maken met dezelfde verzameling. Zo kunnen we de omschrijving van (41a) anders formuleren als in (42), maar verwijzend naar precies dezelfde getallen: (42)
{x : x is een niet-negatief geheel getal}
19
Verzamelingen worden gedefinieerd door hun ‘reference’ of extensie, en niet door hun ‘sense’ (d.w.z. de omschrijving die we gebruiken). Dat laatste blijkt ook uit het feit dat we de verzameling {a, b, c, d} beschouwen als dezelfde verzameling als {a, b, c, d, a}, waarin de volgorde anders is een element twee keer genoemd wordt, maar dit beïnvloedt de inhoud van de verzameling niet. Een verzameling kan andere verzamelingen als lid hebben: de verzameling {a, {b, c}} heeft als leden de verzameling {b, c} en a.
Hieronder definiëren we een aantal belangrijke symbolen uit de verzamelingenleer. symbool a∈Q a∉Q A=B {a}
∅ P⊆Q
P⊂Q
P⊈Q P∪Q
P∩Q
definitie Het element a is een lid van de verzameling Q. Het element a is geen lid van de verzameling Q De verzamelingen A en B zijn identiek, d.w.z. ze hebben precies dezelfde leden De verzameling die a als enige lid heeft. We noemen dit een singleton. De lege verzameling. Deze verzameling bevat geen elementen. De verzameling P is een deelverzameling van de verzameling Q: dit betekent dat elk lid van P ook een lid is van Q. De lege verzameling is een deelverzameling van elke verzameling. P is een echte, eigenlijke, of strikte deelverzameling van Q: dit betekent dat P ⊆ Q en P ≠ Q. Minstens één lid van P is geen lid van Q De unie van P en Q: de verzameling die alle elementen van P bevat en alle elementen van Q. De doorsnede van P en Q: de verzameling die de elementen bevat die
20
voorbeeld d ∈ {a, b, c, d} f ∉ {a, b, c, d} {a, b, c, d} = {a, c, b, b, d} {a} {{1, 2, 3}} Belangrijk: {a} ≠ a en {{a}} ≠ {a}
{a, b} ⊆{a, b, c, d} {a, b} ⊆{a, b}
{a, b} ⊂ {a, b, c, d} {a, b} ⊄ {a, b} {a, b, e} ⊈ {a, b, c, d} {a, b} ∪ {a, c, d} = {a, b, c, d}
{a, b, c} ∩ {e, f, g, c} = {c}
P–Q P¯
zowel lid zijn van P als van Q. Het verschil tussen P en Q, of het complement van Q ten opzichte van P. Het complement van P zijn alle elementen die niet tot P behoren ten aanzien van een universum U.
{a, b, c} – {a, d} = {b, c} P¯ = U – P
Nog een belangrijk verzamelingstheoretisch object dat van belang is in de formele semantiek is het geordend paar. Zoals de naam het zegt is bij een geordend paar de volgorde wel belangrijk: (43)
⟨a, b⟩ ≠ ⟨b, a⟩
Ook kan hetzelfde element meer dan een keer voorkomen (bv. ⟨a, a⟩). Twee geordende paren zijn identiek als de elementen in de corresponderende posities identiek zijn: ⟨a, b⟩ = ⟨c, d⟩ als en slechts als a=c en b=d. Het Cartesiaans product van A en B is de verzameling van alle geordende paren waarvan het eerste lid tot A en het tweede lid tot B behoort: (44)
A×B = {⟨x, y⟩: x ∈ A en y ∈ B}
Als A = {a, b} en B = {1, 2}, dan geldt dat A×B = {⟨a, 1⟩, ⟨a, 2⟩, ⟨b, 1⟩, ⟨b, 2⟩}. Analoog aan geordende paren hebben we geordende trio’s, die uit drie geordende elementen bestaan. Meer algemeen bestaan geordende n-tupels uit n aantal geordende elementen: (45)
⟨a1, …, an⟩
Geordende n-tupels ontstaan door het recursief toepassen van de operatie van het Cartesiaans product: (A1 × … × An). 2.3.2. Basisvocabularium en syntaxis De predicatenlogica bevat een basisvocabularium en een syntaxis, i.e. een aantal regels voor de constructie van formules. (46)
Basisvocabularium voor de predicatenlogica i. predicaten: T, L, etc., elk met een vast aantal argumentplaatsen; dit is de valentie van het predicaat, of zijn ariteit (we spreken van een eenplaatsig, tweeplaatsig, etc. predicaat).
21
(47)
ii. termen: a. individuele constanten: s, a, p, m, b, c, f, j, … b. variabelen: x, y, z, … iii. kwantoren: ∀, ∃ iv. connectoren: ~, &, ∨, →, ↔ v. hulpsymbolen: ( ) Syntaxis i. Als P een n-plaatsig predicaat is en t1, …, tn zijn termen, dan is P(t1, …, tn) een formule. ii. Als φ en Ψ formules zijn, dan zijn ~φ, (φ & Ψ), (φ ∨ Ψ), (φ → Ψ) en (φ ↔ Ψ) formules. iii. Als φ een formule is en x is een variabele, dan zijn (∀x)φ en (∃x)φ formules. iv. De formules van de predicatenlogica kunnen alleen gegenereerd worden door een eindig aantal toepassingen van de regels (i)-(iii).
(48) Hieronder staan een aantal welgevormde formules uit de predicatenlogica. Probeer een zin van natuurlijke taal te geven waarvan de formule een vertaling zou kunnen zijn. Een predicaat kan corresponderen met een adjectief of een werkwoord, zoals in volgende voorbeelden: A(s) Socrates is aardig L(m,s) Mozart houdt van Socrates Het predicaat L is tweeplaatsig, M, A en F zijn eenplaatsig, en O is drieplaatsig. a. b. c. d. e. f. g.
(∀x) L(m,x) (∃x) ~M(x) (∀x) (F(x) → A(x)) A(x) O(p,m,f) (∃x) ~M(p) (∀x) L(m,s)
Merk op dat formules als (48f) en (48g) welgevormd zijn, hoewel de variabele die bij de kwantor hoort niet terug te vinden is in de formule die er op volgt. De syntactische regels staan met andere woorden ‘vacueuze kwantificatie’ toe, waarbij een kwantor geen variabele bindt. Omgekeerd kan een variabele ook voorkomen zonder kwantor, als in (48d). We komen daar zo meteen op terug. 2.3.3. Kwantificatie in de predicatenlogica Als een formule φ voorafgegaan wordt door een kwantor zodat we (∀x)φ of (∃x)φ krijgen, dan zeggen we dat φ het bereik is van de kwantor, en dat φ en elk onderdeel van φ in het
22
bereik liggen van de kwantor. Hieronder geven we een aantal voorbeelden, waarbij het bereik van elke kwantor onderstreept is: (49)
a. b. c. d.
(∃x) P(x) ((∃x) P(x) → Q(x, m)) (∃x) (P(x) → Q(x, m)) (∃x) (∀y) (P(x, y) & Q(x)) (∃x) (∀y) (P(x, y) & Q(x))
(bereik van ∀) (bereik van ∃)
Het bereik van een kwantor is van belang in de volgende definitie: (50)
Een variabele x is gebonden als ze voorkomt in het bereik van (∀x) of (∃x). Een variabele is vrij als ze niet gebonden is.
Merk op dat de syntaxis van de predicatenlogica vrije variabelen toestaat, zoals we zagen in het geval (48d) hierboven. In (48a, b, c) vinden we daarentegen gebonden variabelen. De twee kwantoren van de predicatenlogica kunnen dienen ter formalisering van een aantal kwantorwoorden uit natuurlijke taal. (51)
i.
ii.
Welke? ∀ ∃ Kun je een kwantorwoord bedenken voor de volgende combinaties? ~∃ ~∀
De predicaatlogische behandeling van zinnen met kwantoren gaat er verder van uit dat zinnen van het type Alle V zijn G twee predicaten bevatten, V en G, die als argument een variabele hebben, die gebonden wordt door een universele kwantor. Hetzelfde geldt voor Sommige V zijn G, behalve dat we hier te maken hebben met een existentiële kwantor. (52) Welke van de connectoren van de PC (&, ∨, →, ↔) verbindt de twee predicaten in de zin Alle vlaggen zijn groen? a. b. c. d.
(∀x) (F(x) & G(x)) (∀x) (F(x) ∨ G(x)) (∀x) (F(x) → G(x)) (∀x) (F(x) ↔ G(x)) dingen zijn vlaggen
Alles is een vlag en alles is groen. Alles is een vlag of alles is groen. Als iets een vlag is, dan is het groen. Alle dingen die een vlag zijn, zijn groene dingen, en alle groene
23
(53) Welke van de connectoren van de PC (&, ∨, →, ↔) verbindt de twee predicaten in de zin Sommige vlaggen zijn groen? e. (∃x) (F(x) & G(x)) Sommige dingen zijn vlaggen en groene dingen. f. (∃x) (F(x) ∨ G(x)) Sommige dingen zijn vlaggen of groene dingen. g. (∃x) (F(x) → G(x)) Voor sommige dingen geldt dat als ze een vlag zijn, ze groen zijn. h. (∃x) (F(x) ↔ G(x)) Voor sommige dingen geldt dat als ze een vlag zijn, ze groen zijn en als ze groen zijn, een vlag zijn. In een formule met meerdere kwantoren, zoals (49d), staat de tweede kwantor in het bereik van de eerste. Deze eigenschap van kwantoren wordt gebruikt om het betekenisverschil tussen de volgende zinnen weer te geven: (54)
a. b.
Iedereen kuste iemand. Iemand werd door iedereen gekust.
Leg uit wat het betekenisverschil is tussen (54a) en (54b).
In het eerste geval heeft de universele kwantor bereik over de existentiële, in het tweede geval is het omgekeerd: (55)
a. b.
(∀x) (∃y) K(x, y) (∃y) (∀x) K(x, y)
Het veranderen van de bereiksrelaties heeft dus een mogelijk effect op de betekenis. 2.3.4. Semantiek van eenplaatsige predicaten Ook in de predicatenlogica kunnen we regels opstellen voor het afleiden van waarheidswaarden van proposities op basis van hun samenstellende delen. Beschouw een eenvoudig geval als A(s), opgebouwd uit het eenplaatsig predicaat A en de constante s. Om deze regels op te stellen maken we gebruik van een model: zoals we eerder zagen hanteren we een modeltheoretisch begrip van het concept waarheid. Zo een model M bevat drie dingen: (i) een verzameling van individuen D (het gespreksdomein), (ii) een functie V die een extensie in D toekent aan de constanten en predicaten van de PC, en (iii) een bedeling b, die
24
aan elke variabele een waarde toekent uit D. Het model maakt m.a.w. volledig expliciet wie de individuen zijn, en wat de betekenis is van de predicaten. En hoewel de modeltheorie oorspronkelijk ontwikkeld is in de moderne logica voor de analyse van formele talen, zullen we de modeltheorie later gebruiken voor de semantische analyse van natuurlijke taal. Laten we om dit concreet te maken een voorbeeld geven van een model, dat we M1 zullen noemen. Het gespreksdomein (of kortweg domein) D1 is de volgende verzameling van individuen: (56)
D1 = {Socrates, Aristoteles, Plato, Mozart, Callas, Beethoven, Fido, januari}
De denotatie (of semantische waarde) van een constante is niet een waarheidswaarde (1 of 0), maar iets anders. (57)
Wat? 〚s〛M1 = 〚a〛M1 = 〚p〛M1 = 〚m〛M1 =
Om aan te geven dat waarheid relatief is tot een model (in een ander model zou de constante s naar een ander individu kunnen verwijzen, enz.), plaatsen we een superscript M1 achter de vierkante haken. De vierkante haken in (57) doen eigenlijk hetzelfde als de functie V uit ons model: ze kennen een extensie toe aan constanten, zodat we ook kunnen zeggen V(s) = Socrates, etc. Omdat we functies pas later in detail zullen bespreken, houden we het hier in de notatie op de vierkante haken. Minder eenvoudig is de vraag wat de denotatie is een eenplaatsig predicaat zoals aardig of filosoof. In verzamelingstheoretische termen redenerend, zullen we zeggen dat de denotatie van een dergelijk predicaat een verzameling van individuen is, met name respectievelijk de verzameling van de aardige individuen en de filosofen. (58)
〚A〛M1 = {Socrates, Plato, Aristoteles, Mozart, Fido} 〚F〛M1 = {Socrates, Plato, Aristoteles}
(59) 1. 2. 3.
Welke drie soorten denotaties hebben we tot dusver geïntroduceerd?
25
Gegeven dat we de denotatie gedefinieerd hebben van het predicaat (in (58)) en de constante (in (57)), kunnen we nu een regel formuleren voor het bepalen van de denotatie van de gehele uitdrukking. Zoals eerder gezegd denoteren formules waarheidswaarden. (60)
〚A(s)〛M1 = 1 asa 〚A(s)〛M1 = 0 in alle andere gevallen
Met andere woorden, de semantische waarde van formules in PC kan berekend worden op basis van het lidmaatschap van (61). (62)
Bereken de waarheidswaarde van onderstaande formule. 〚A(x) 〛M1 = (vgl. Hij is aardig)
Conclusie:
De variabele in (62) is een vrije variabele, want hij zit niet in het bereik van een kwantor. Een vrije variabele kan slechts een interpretatie krijgen als we een bedeling hebben. Een bedeling is het derde element van een model (naast een gespreksdomein D en een denotatiefunctie voor de predicaten en constanten van PC). (63)
Een bedeling b is een functie die elke variabele afbeeldt op een individu in D.
Wat precies een functie is leggen we later nog omstandig uit. Voor nu volstaat het om de bedelingsfunctie voor te stellen als een lijst. De bedeling van ons model M1 noteren we als b1 (de variabelen noteren we hieronder eveneens met een subscript omdat er meer cijfers zijn dan letters, en we soms veel variabelen hebben):
(64)
b1
=
x1
→
𝑆𝑜𝑐𝑟𝑎𝑡𝑒𝑠
𝑥2 𝑥3
→ →
𝐴𝑟𝑖𝑠𝑡𝑜𝑡𝑒𝑙𝑒𝑠 𝑃𝑙𝑎𝑡𝑜
𝑥4
→
𝑀𝑜𝑧𝑎𝑟𝑡 26
𝑥5
→
𝐶𝑎𝑙𝑙𝑎𝑠
𝑥6 𝑥7
→ →
𝐵𝑒𝑒𝑡ℎ𝑜𝑣𝑒𝑛 𝐹𝑖𝑑𝑜
𝑥𝑧
→
𝑗𝑎𝑛𝑢𝑎𝑟𝑖 waarbij z ≥ 8
De regel in (60) kan nu veralgemeend worden door hem relatief te maken tot een bedeling b. (65)
〚A(xn)〛M1, b1 = 1 asa〚xn〛M1, b1 ∈〚A〛M1, b1 〚A(xn)〛M1, b1 = 0 in alle andere gevallen
Deze regel is natuurlijk niet alleen van toepassing op het concrete geval van het predicaat A. We kunnen hem dan ook algemener formuleren als in (66), zodat hij van toepassing wordt op alle eenplaatsige predicaten P: (66)
Voor elk eenplaatsig predicaat P en elke term t geldt 〚P(t)〛M1, b1 = 1 asa〚t〛M1, b1 ∈〚P〛M1,b1 〚P(t)〛M1, b1 = 0 in alle andere gevallen
Het bepalen van een waarheidsvoorwaarde voor formules met gebonden variabelen (en dus kwantoren) krijgt een wat ingewikkelder formulering als in (67). (67)
a.
〚(∀xn) φ〛M1, b1 = 1 asa voor alle d ∈ D, 〚φ〛M1, b1 [d/xn] = 1
b.
〚(∃xn) φ〛M1, b1 = 1 asa voor tenminste één d ∈ D, 〚φ〛M1, b1 [d/xn] = 1
Voor (67a) betekent dit dat we voor elk individu d de formule φ interpreteren, waarbij we d toewijzen aan xn. Bij de toewijzing van d aan xn wijzigen we de oorspronkelijke bedeling b1. De gewijzigde bedeling noteren we als b1[d/xn]. Indien φ waar is bij elke interpretatie, dan is (∀xn) φ waar. Laten we dit toepassen op een concreet geval, de formule in (68), wat de standaard PCvertaling is van een zin als Elke filosoof is aardig: (68)
(∀x) (F(x) → A(x))
Deze formule bevat de volgende ingrediënten: 1. de twee predicaatlogische basisformules F(x) en A(x) 2. een kwantor ∀ 3. een Booleaanse operator →
27
Hoe we de waarheidswaarde van de predicaatlogische basisformules moeten berekenen, hebben we aangetoond in (66). Wanneer we de waarheidsvoorwaarde voor de kwantor (67a) toepassen op (68), levert dit het volgende op: (69)
〚(∀xn) (F(xn) →A(xn))〛M1, b1 = 1 asa voor alle d ∈ D, 〚(F(xn) →A(xn)〛M1, b1 [d/xn] = 1
De toepassing van (69) vereist, kort gezegd, dat we voor elke individu van ons gespreksdomein nagaan of 〚F(xn) →A(xn)〛M1, b1 waar is. Indien dat zo is, dan is 〚(∀xn) (F(xn) →A(xn))〛M1, b1 waar. Hoe bepalen we of〚(F(xn) →A(xn)〛M1, b1 waar is? Hiervoor moeten we de waarheidsvoorwaarde voor de Booleaanse operator toepassen. Die waarheidsvoorwaarde is gegeven in (32ii) hierboven; toegepast op ons geval geeft dit (70): (70)
〚F(xn) →A(xn)〛M1, b1 =
onwaar asa 〚F(xn) 〛M1, b1 = 1 en 〚A(xn)〛M1, b1 = 0 waar in alle andere gevallen
Op zijn beurt vereist de toepassing van (70) het berekenen van de waarheidswaarde van de formules F(xn) en A(xn), d.w.z. de toepassing van een schema als (66), hier herhaald. (66)
Voor elk eenplaatsig predicaat P en elke term t geldt 〚P(t)〛M1, b1 = 1 asa〚t〛M1, b1 ∈〚P〛M1, b1 〚P(t)〛M1, b1 = 0 in alle andere gevallen
Het bovenstaande schetst de waarheidsvoorwaarden voor een geval als (68). Laten we concreet worden, en de waarheidswaarde berekenen van de formule (68), gegeven het domein D1 in (56) en de bedeling b1 in (64) (hier herhaald). (56)
D1 = {Socrates, Aristoteles, Plato, Mozart, Callas, Beethoven, Fido, januari}
(71)
b1
=
x1
→
𝑆𝑜𝑐𝑟𝑎𝑡𝑒𝑠
𝑥2 𝑥3
→ →
𝐴𝑟𝑖𝑠𝑡𝑜𝑡𝑒𝑙𝑒𝑠 𝑃𝑙𝑎𝑡𝑜
𝑥4
→
𝑀𝑜𝑧𝑎𝑟𝑡
28
𝑥5
→
𝐶𝑎𝑙𝑙𝑎𝑠
𝑥6 𝑥7
→ →
𝐵𝑒𝑒𝑡ℎ𝑜𝑣𝑒𝑛 𝐹𝑖𝑑𝑜
𝑥𝑧
→
𝑗𝑎𝑛𝑢𝑎𝑟𝑖 waarbij z ≥ 8
Voorts herhalen we de denotatie van de predicaten F en A zoals eerder gegeven in (58) hier boven: (58)
〚A〛M1, b1 = {Socrates, Plato, Aristoteles, Mozart, Fido} 〚F〛M1, b1 = {Socrates, Plato, Aristoteles}
We beginnen bij Socrates, de waarde die de bedeling toekent aan de variabele x1; voor het gemak stellen we dit individu voor met de kleine letter s, en doen vervolgens hetzelfde voor de andere individuen van D. (72)
a.
〚F(s)〛M1, b1 =
want
〚A(s)〛M1, b1 =
want
〚F(s) → A(s) 〛
M 1, b1
b.
〚F(a)〛
M 1, b1
=
=
〚A(a)〛M1, b1 = 〚F(a) → A(a) 〛M1, b1 = c.
〚F(p)〛M1, b1 = 〚A(p)〛M1, b1 = 〚F(p) → A(p) 〛M1, b1 =
d.
〚F(m)〛M1, b1 = 〚A(m)〛M1, b1 = 〚F(m) → A(m) 〛M1, b1 =
e.
〚F(c)〛M1, b1 = 〚A(c)〛M1, b1 = 〚F(c) → A(c) 〛M1, b1 =
f.
〚F(b)〛M1, b1 = 〚A(b)〛M1, b1 = 〚F(b) → A(b) 〛M1, b1 =
g.
〚F(f)〛M1, b1 = 〚A(f)〛M1, b1 = 〚F(f) → A(f) 〛M1, b1 =
h.
〚F(j)〛M1, b1 =
29
〚A(j)〛M1, b1 = 〚F(j) → A(j) 〛M1, b1 = We kunnen de volledige berekening van (69) overzichtelijk weergeven in een waarheidstabel zoals we die kennen uit de propositionele logica, waarbij we op de verschillende rijen de verschillende waarden voor de variabele x opnemen volgens de bedeling (64) (in de tabellen laten we voortaan omwille van de beknoptheid de superscripten M1, b1 achterwege). (73) 〚F(x)〛 s a p m c b f j
1 1 1 0 0 0 0 0
〚A(x)〛 〚F(x) → A(x) 〛 1 1 1 1 0 0 1 0
1 1 1 1 1 1 1 1
〚(∀x) (F(x) → A(x))〛
1
Deze aanpak heeft het voordeel van de volledigheid, maar hij is natuurlijk redelijk omslachtig, en het zou leuk zijn als we iets sneller tewerk zouden kunnen gaan. In bovenstaand voorbeeld is dat inderdaad het geval. Eigenlijk hadden we kunnen ophouden na het controleren van de eerste drie variabelen (72a-b-c). Immers, wanneer is de formule (∀xn) (F(xn) → A(xn)) waar? Ze is waar indien voor alle mogelijke toewijzingen van variabelen de formule (F(xn) → A(xn)) waar is. Het volstaat dus dat we één geval vinden waarin (F(xn) → A(xn)) onwaar is. De situatie waarin (φ → Ψ) onwaar is, ontstaat echter slechts in één geval, nl. wanneer φ = 1 en Ψ = 0. In (72) is het nu zo we bij (72c) de individuen waarvoor F(x) waar is, hebben uitgeput. Immers, 〚F〛M1, b1 = {Socrates, Plato, Aristoteles}, en precies die drie individuen zijn in (72a-b-c) de revue gepasseerd. Alle andere individuen maken de formule F(xn) onwaar. Maar als F(xn) onwaar is, dan is (F(xn) →A(xn)) noodzakelijk waar. Met andere woorden, we hoeven de overblijvende toewijzingen aan variabelen niet meer stap voor stap te controleren, want die leveren allen een onwaar resultaat op voor F(xn), en bijgevolg een waar resultaat voor (F(xn) → A(xn)). Anders geformuleerd, voor het controleren van de waarheid van de zin Elke filosoof is aardig moeten we niet naar de niet-filosofen kijken, maar moeten we op zoek naar één filosoof die niet aardig is. Zodra de filosofen in ons domein D uitgeput zijn, hoeven we niet verder te zoeken, want voor alle niet-filosofen is de uitspraak vanzelf waar. (74) De berekening van de waarheidswaarde van (67b) gaat op analoge wijze. Ga na of de volgende formules waar zijn met betrekking tot het model M1. 30
i. (∃x) A(x)
(Er is iemand aardig) 〚F(x)〛
〚A(x)〛 〚(∃x) A(x)〛
s a p m c b f j ii. (∃x) (F(x) & A(x)) 〚F(x)〛
(Er is een filosoof aardig) 〚A(x)〛 〚F(x) & A(x) 〛
〚(∃x) (F(x) & A(x))〛
s a p m c b f j 2.3.5. Semantiek van tweeplaatsige predicaten Voor de berekening van de waarheidswaarde van een formule met een tweeplaatsig predicaat (zie bv. (48b) hierboven) moeten we een nieuw soort van denotatie introduceren. Deze denotatie is de verzamelingstheoretische notie van het geordende paar. Herinner je dat we door het vormen van het Cartesiaans product van twee verzamelingen A en B we alle geordende paren krijgen waarvan het eerste element tot A behoort en het tweede tot B. (75)
A×B = {⟨x, y⟩: x ∈ A en y ∈ B}
(76)
Wat heeft een geordend paar gemeen met een tweeplaatsig predicaat?
31
Een Cartesiaans product kan ook gevormd worden op basis van één verzameling, zoals de verzameling D van ons gespreksdomein: (77)
D×D = {⟨x, y⟩: x ∈ D en y ∈ D}
(78)
Geef het Cartesiaans product van de verzameling D' = {Socrates, Aristoteles, Callas}. D'×D' =
(79) Wat zou de denotatie kunnen zijn van een tweeplaatsig predicaat, zoals bv. L in (48b)? 〚L〛M1, b1 = Hiermee hebben we een nieuwe soort van denotatie geïntroduceerd, naast de andere drie die we eerder al onderscheiden hadden: (80)
1. 2. 3. 4.
Het is nu redelijk makkelijk om een regel op te stellen voor de berekening van de waarheidswaarde van tweeplaatsige predicaten, die bovendien nog heel erg lijkt op de regel die van toepassing was op eenplaatsige predicaten. (81) Doe dit voor het concrete geval hieronder (de waarheidsvoorwaarde lijkt heel erg op die van (60) hierboven). 〚L(m,s)〛M1, b1 = 1 asa … 〚L(m,s)〛M1, b1 = 0 …
Dit patroon is natuurlijk van toepassing op elk tweeplaatsig predicaat.
32
(82) Formuleer een algemene regel voor tweeplaatsige predicaten, waarvoor je (66) als uitgangspunt neemt.
(83)
Doe vervolgens hetzelfde voor drieplaatsige predicaten.
(84)
Schrijf tot slot één regel die op alle soorten predicaten van toepassing is.
2.3.6. Oefeningen (85) Geef een predicaatlogische vertaling van de volgende zinnen. Als je kwantoren gebruikt, onderstreep dan hun bereik. f. Alle studenten slapen.
g. Niemand is onsterfelijk.
h. Niet iedereen kent Chomsky.
i. Sommige individuen kennen Gaga niet.
j. Als iemand Berlijn kent, dan houdt hij er van.
k. Als iemand iedereen wast, dan wast Jan zichzelf.
33
l. Als Jan lacht, dan lacht iedereen.
m. Een kat is een zoogdier
n. Niet alle viervoetigen zijn zoogdieren.
2.3.7. Het probleem van existential import Voor we verder gaan met de toepassing van de predicatenlogica op zinnen van natuurlijke taal, bespreken we een probleem dat zich stelt voor de moderne formalisering van de Aristotelische logica. In de logica van Aristoteles en zijn tijdgenoten kunnen de logische relaties tussen kwantoren worden in het logische vierkant (de zgn. square of oppositions). In de vier hoeken van het vierkant staan letters, die bepaalde kwantoren voorstellen. De universeel affirmatieve kwantor (alle) staat linksboven, en wordt voorgesteld door de letter A. De particulier affirmatieve kwantor (sommige) staat links onder, en heeft als letter I. Aan de rechtse, negatieve kant van het vierkant vinden we de universeel negatieve kwantor (letter E, bv. geen) en de particulier negatieve (letter O; bv. niet alle). De letters zijn afkomstig uit de Latijnse woorden affirmo ‘ik bevestig’ en nego ‘ik ontken’. (86)
Tussen de kwantoren gelden bepaalde relaties: de A en de E-hoek hebben een relatie van contrariteit: dit wil zeggen dat zinnen met deze kwantoren niet allebei waar kunnen zijn, maar wel allebei onwaar.
34
(87)
Geef een voorbeeld van twee zinnen die in een contraire relatie staan tot mekaar.
Andere hoeken (A en O, I en E) hebben een contradictorische relatie: zinnen met deze kwantoren kunnen niet allebei waar zijn, noch allebei onwaar. (88)
Geef een voorbeeld
De subcontraire relatie is het spiegelbeeld van de contraire relatie: ze geldt tussen de onderste hoeken van het vierkant (I en O), en houdt in dat beide beweringen tegelijk waar kunnen zijn, maar niet tegelijk onwaar. Wat ons hier interesseert is de subalterne relatie: deze geldt voor de A en I hoek, en voor de E en O hoek. De subalterne relatie is directioneel, en ze houdt in dat als een zin met de Akwantor waar is, dan ook dezelfde zin met de I kwantor waar is (idem voor de E en O hoek). (89)
Illustreer met voorbeelden.
In onze behandeling van de predicatenlogica van Aristoteles tot dusver hebben we de formalisering gehanteerd die in de 19de en de vroege 20ste eeuw gemaakt is (zie 2.1 boven). Deze formalisering heeft het voordeel van de explicietheid, maar kampt ook met een aantal problemen. Een daarvan is dat de subalterne relatie niet langer afgeleid kan worden. Dat is met name het geval wanneer in een zin als Alle A zijn B er geen individuen zijn in het gespreksdomein die A zijn, d.w.z. dat er geen individuen x zijn waarvoor geldt dat 〚A(x)〛 M 1, b1 = 1. (90) Ga na met een voorbeeld of een zin van het type Alle A zijn B waar is. Doe vervolgens hetzelfde voor Sommige A zijn B.
35
Het gevolg is dat we uit de waarheid van Alle A zijn B niet kunnen concluderen dat Sommige A zijn B ook waar is. Die conclusie kunnen we slechts trekken voor zover er individuen x zijn in het gespreksdomein die A zijn. Dit noemt met het probleem van de existential import. Behalve de relatie van subalternantie worden in het logisch vierkant overigens ook de relaties van contrariteit en subcontrariteit aangetast door het ontbreken van individuen die A zijn. (91)
Waarom?
Als uitweg uit deze patstelling wordt doorgaans aangenomen dat de universele kwantor vergezeld gaat van een presuppositie dat er in het gespreksdomein individuen zijn die aan de beschrijving beantwoorden (bv. Alle vlaggen zijn groen veronderstelt dat er vlaggen zijn). Het concept van presuppositie gaat terug op Frege, die ze zag als Voraussetzungen opdat een zin waar of onwaar zou kunnen zijn. Zo gaat een zin als (92a) vergezeld van de presuppositie dat er een individu met die naam bestond, d.w.z. de presuppositie (92b). (92)
a. b.
Kepler stierf in Regensburg. Kepler bestond.
Typisch voor presuppositie is dat ze behouden blijft als de zin negatief gemaakt wordt: de zin (71) heeft dezelfde presuppositie (92b) als zijn affirmatieve tegenhanger (92a). (93)
Kepler stierf niet in Regensburg.
Volgens Frege is een van de karakteristieken van presuppositie dat zinnen waarvan niet aan de presuppositie voldaan is geen waarheidswaarde hebben, d.w.z. ze zijn waar noch onwaar. Een klassiek geval is het volgende: (94)
De huidige koning van Frankrijk is kaal.
Hier geldt eveneens een presuppositie dat ‘de huidige koning van Frankrijk bestaat’, maar omdat die duidelijk niet waar is krijgen we een geval van ‘presuposition failure’, en is het niet mogelijk om te zeggen of (94) waar is of onwaar. Op dezelfde manier kunnen we het probleem van existential import aanpakken: zinnen als (95a) hebben een presuppositie dat er
36
vlaggen zijn (zie (95b)). Deze presuppositie wordt gedeeld door de negatieve tegenhanger in (95c). (95)
a. b. c.
Alle vlaggen zijn groen. Er zijn vlaggen. Het is niet zo dat alle vlaggen groen zijn.
Als er geen vlaggen zijn, dan heeft (95a) geen waarheidswaarde en verdwijnt het probleem dat we hier geschetst hebben.
2.4.
Lambda-conversie
2.4.1. Conjunctie Er zijn een aantal soorten van constituenten in natuurlijke taal waarvoor onze logica op het eerste gezicht niet erg goed uitgerust is. Beschouw bv. een geval met conjunctie zoals in (96): (96)
Jennifer Lopez [VP acteert en zingt].
Van individuele stukken in deze zin weten we hoe we ze predicaatlogisch moeten noteren en evalueren. Zo zijn er de eenplaatsige predicaten acteert en zingt, die we voorstellen door middel van hoofdletters (A, Z); verder de constante Jennifer Lopez (j). Een eenvoudige manier om (96) weer te geven lijkt op het eerste gezicht te zijn als in (97): (97)
(A(j) & Z(j))
Maar de formule in (97) correspondeert eerder met de zin in (98) dan met die in (96). (98)
[CP Jennifer Lopez acteert] en [CP Jennifer Lopez zingt].
In (96) hebben we te maken met een conjunctie van twee VPs, terwijl er in (98) twee CPs met elkaar verbonden zijn door en. Het verschil is dat er in (96) twee predicaten zijn voor één subject, terwijl in (98) elk predicaat zijn eigen subject heeft (al gaat het dan voor beide predicaten weliswaar om hetzelfde individu). Op zich zou dat geen probleem zijn, ware het niet dat er in sommige gevallen aantoonbare betekenisverschillen zijn tussen zinnen van het type in (98) en hun tegenhangers zoals in (96). Dat is bijvoorbeeld het geval in het volgende paar: (99)
a.
Alleen Jennifer Lopez acteert en zingt.
37
b.
Alleen Jennifer Lopez acteert en alleen Jennifer Lopez zingt.
Zin (99b) is manifest onwaar: er zijn immers nog vele andere acteurs en nog vele andere zangers. Zin (99a) is ook onwaar, maar om een andere reden. Deze zin wordt onwaar gemaakt door het bestaan van andere individuen die zowel acteur als zanger zijn. Meer algemeen, uit de waarheid van (99a) volgt geenszins de waarheid van (99b) (of vice versa), wat wijst op verschillende waarheidsvoorwaarden. Vergelijkbare gevallen vinden we in (100): (100) a. b. (101) a. b.
Sommige mensen acteren en zingen. Sommige mensen acteren en sommige mensen zingen. Veel mensen acteren en zingen. Veel mensen acteren en veel mensen zingen.
Het lijkt er dus op dat we in onze semantische weergave een onderscheid moeten maken tussen iets als in (97) (conjunctie van proposities) en een geval als (96) (conjunctie van predicaten). Een voor de hand liggende manier om dat te doen zou zijn door de directe conjunctie van predicaten: (102) (A&Z)(j) Maar dit is geen correcte formule volgens de syntaxis van de predicatenlogica zoals we die gedefinieerd hebben. En zelfs als we de syntaxis zo zouden wijzigen dat dit soort van formules toegelaten zou zijn, dan is er nog een probleem met de waarheidsvoorwaarden voor de conjunctie. Die hebben we in (31) hierboven immers als volgt geformuleerd: (31)
〚φ & Ψ〛= 1 als en slechts als〚φ〛= 1 en〚Ψ〛= 1
Het probleem met de toepassing van deze regel op de hypothetische formule in (102) is dat de denotatie van de predicaten A en Z geen waarheidswaarde is. (103) Wat voor een denotatie hebben A en Z dan wel?
Een waarheidswaarde krijgen we pas als we de predicaten toepassen op hun argument, d.w.z. voor de formules A(j) en Z(j). Voor het toepassen van (31) hebben we dus eerst de waarheidswaarde nodig van A(j) en Z(j), en dat betekent concreet dat je voor het evalueren van de waarheidswaarde van de hypothetische formule in (102) in feite tewerk moet gaan zoals in (97).
38
We moeten dus een andere oplossing bedenken. Daarvoor inspireren we ons op zinnen met kwantoren (zoals die in (100) en (101) hierboven). In die voorbeelden zijn er immers telkens twee verschillende predicaatlogische vertalingen, en kunnen we het geobserveerde betekenisverschil zonder problemen weergeven in de denotatie. (104) Toon dit aan voor (100). a. b. Wat ons hier in het bijzonder interesseert is de predicaatlogische weergave van (100a). Doordat beide predicaten hier dezelfde variabele als subject hebben, zouden we kunnen zeggen dat we een complex predicaat hebben gevormd van het type ‘acteert en zingt’, d.w.z. zoals de VP in (100a). In de predicaatlogische vertaling van (100b) daarentegen is een dergelijk complex predicaat niet aanwezig. Wat we nu nodig hebben is een manier om complexe predicaten te creëren niet enkel voor zinnen met kwantoren, maar ook voor gevallen als (97). Om die reden introduceren we de λ-operator. Die zal ons een mechanisme verschaffen dat de vorming van complexe predicaten in alle contexten mogelijk maakt. Concreet betekent dit dat we een regel toevoegen aan de syntaxis van de predicatenlogica (zie (47) hierboven). Het gaat om regel (iv) in (105): (105) Syntaxis van de predicatenlogica i. Als P een n-plaatsig predicaat is en t1, …, tn zijn termen, dan is P(t1, …, tn) een formule. ii. Als φ en Ψ formules zijn, dan zijn ~φ, (φ & Ψ), (φ ∨ Ψ), (φ → Ψ) en (φ ↔ Ψ) formules. iii. Als φ een formule is en x is een variabele, dan zijn (∀x)φ en (∃x)φ formules. iv. Als φ een formule is en x is een variabele, dan is λx[φ] een predicaat.1 v. De formules van de predicatenlogica kunnen alleen gegenereerd worden door een eindig aantal toepassingen van de regels (i)-(iv). Nemen we de formule die we gevonden hebben in (104) voor de vertaling van (100a), maar dan zonder de kwantor, dan hebben we een syntactisch welgevormde formule (zonder een bedeling of een kwantor heeft deze formule geen interpretatie, maar dat is hier voorlopig niet van belang). Vervolgens kunnen we daar door toepassing van regel (iv) het volgende van maken: (106) λx [(A(x) & Z(x)] 1
In de taalkundige literatuur wordt vaak de notatie λx.φ gebruikt in plaats van λx[φ]. Omwille van de grotere explicietheid van deze laatste verzaken we hier aan het groter gebruiksgemak van de eerste.
39
Dit is op zich nog geen formule. (107) Door toepassing van welke regel uit (105) kunnen we van (106) een formule maken? Wat is het resultaat? Zorg ervoor dat je resultaat ook semantisch interpreteerbaar is, d.w.z. dat er geen ongebonden variabelen in zitten.
Dit kunnen we nu zien als een ‘betere’ vertaling van de zin in in (96) dan die in (97), omdat we hier te maken hebben met één subject (de constante) voor twee predicaten, terwijl we in (97) twee subjecten hadden. (108) Hoe zou je het betekenisverschil dat we observeerden in (99) kunnen weergeven door gebruik te maken van de λ-operator?
Door de toepassing van regel (iv) kunnen we in principe elke formule, ook een eenvoudige als (109a), herschrijven als de equivalente formule (109b): (109) a. b.
A(j) λx [(A(x)](j)
Het omgekeerde is uiteraard ook mogelijk: elk predicaat met een λ-operator dat toegepast is op een term kan herschreven worden als een formule zonder de λ-operator. Deze equivalentierelatie kunnen we algemeen formuleren als volgt: (110) λx[φ](t) ↔ φ[t/x], waarbij t een term is (variabele of constante) en φ[t/x] het resultaat van de vervanging van alle variabelen x in φ door t. (111) Pas (110) toe op wat je gevonden hebt in (107).
Dit proces van herschrijven noemen we λ-conversie: als we van boven naar onder gaan in (109) spreken we van λ-abstractie, terwijl het omgekeerde proces (wat we eigenlijk doen in (110)) bekend staat als λ-contractie of λ-reductie.
40
Tot slot van deze sectie formuleren we nog een semantische regel die ons in staat stelt om formules met λ-operatoren te interpreteren. Die ziet er uit als volgt: (112) 〚λx[φ]〛b ={d ∈ D : 〚φ〛b[d/x] = 1} Gegeven dat een λx[φ] een predicaat is, is zijn denotatie een verzameling van individuen. Deze verzameling wordt verkregen door de variabele x in φ te vervangen door elk individu in D. Alle individuen die φ waar maken zitten in de verzameling. 2.4.2. Zinnen met alleen Uiteraard heeft λ-conversie weinig praktisch nut in een geval als Jennifer Lopez acteert. Voor een geval van conjunctie als Jennifer Lopez acteert en zingt (d.w.z. (96)) liggen de zaken al enigszins anders, zoals we gezien hebben. Daarbij moeten we wel opmerken dat de argumentatie niet echt dwingend is: er is immers weinig evidentie dat de zin in kwestie een andere betekenis heeft dan (98), m.a.w. dat (97) niet zou voldoen. Sterker nog, door de equivalentie in (110) is de formule met de λ-operator uiteindelijk gelijk aan die zonder de λoperator , zodat we weer bij af lijken te zijn. Enigszins anders liggen de zaken in een paar als (99), met alleen Jennifer Lopez als onderwerp. We kunnen ons afvragen wat het woordje alleen aan de zin toevoegt. Nemen we een simpel geval als Alleen Jennifer Lopez acteert. Wat die zin zegt is dat er niemand anders dan Jennifer Lopez acteert. Predicaatlogisch kunnen we dat als volgt weergeven. (113) (A(j) & ~(∃x) A(x)) (x ≠ j) Op dezelfde manier kunnen we het zinnenpaar van (99) weergeven, waarbij we een duidelijk verschil kunnen maken tussen beide zinnen door het bereik van de existentiële kwantor te laten variëren. (114) a. b.
((A(j) & (Z(j)) & ~(∃x) (A(x) & Z(x))) (A(j) & ~(∃x) A(x)) & (Z(j) & ~(∃x) Z(x)))
(x ≠ j) (x ≠ j)
Voor het weergeven van deze twee zinnen hebben we geen λ-operator nodig, maar dat ligt anders in de volgende zin: (115) Alleen Oscar haat zichzelf. Deze zin kan twee verschillende situaties beschrijven. Stel dat we aan een groep mensen de vraag stellen: ‘Wie haat Oscar?’, en Oscar is de enige die ‘ja’ antwoordt. De bovenstaande
41
zin kan dan geparafraseerd worden als ‘Oscar haat zichzelf, en niemand anders haat Oscar’. Dit noemen we een lezing van strikte identiteit (Eng. strict identity), omdat het object van haten steeds identiek is, nl. Oscar). De andere situatie is er een waarin we de vraag stellen ‘Wie haat zichzelf?’, en wederom antwoordt alleen Oscar bevestigend op deze vraag. Een correcte parafrase ziet er nu heel anders uit, nl. ‘Oscar haat zichzelf, en niemand anders haat zichzelf’. Mogelijk zijn er in deze situatie heel wat mensen die Oscar haten, wat niet kan in de eerste situatie (en vice versa: in de eerste situatie zijn er mogelijk heel wat zelf-haters). Deze lezing noemen we er een van slordige identiteit (Eng. sloppy identity), omdat het object van haten varieert met het subject. Het verschil zit hem in de aard van de verzameling van individuen die het predicaat (de VP) beschrijft: dat kan de verzameling van Oscar-haters zijn, of de verzameling van zelf-haters. Deze twee interpretaties van zin (115) kunnen we weergeven door gebruik te maken van de λ-operator. Dit gaat als volgt: (116) a. b.
λx[H(x,o)](o) & ~(∃x)H(x,o) (x ≠ o) λx[H(x,x)](o) & ~(∃y)H(y,y) (x ≠ y)
(117) Welke vertaling zou je toekennen aan het gecursiveerde gedeelte van de volgende zinnen (de woordjes zelf en ook mag je negeren)? a. Kijk, als iedereen van Oscar houdt, dan is het zeker ook zo dat Oscar zelf van hem houdt.
b.
Kijk, als iedereen van zichzelf houdt, dan is het zeker ook zo dat Oscar zelf van zichzelf houdt.
c.
Ik weet wat Michiel en Saartje gemeenschappelijk hebben. Saartje adoreert Michiel, en hij ook.
2.4.3. Relatiefzinnen Een ander geval waar λ-abstractie erg handig blijkt, zijn nominale constituenten met relatiefzinnen zoals in (118).
(118) a. b.
[DP Alle filosofen die van Madonna houden] zijn intelligent. [DP Alle filosofen waar Madonna van houdt] zijn intelligent.
42
In dit concrete geval hebben we al de stukken van de predicaatlogische vertaling van deze zinnen in handen: de universele kwantor (∀), de eenplaatsige predicaten filosoof en intelligent (F en I), het tweeplaatsige predicaat houden van (L), en de constante Madonna (m). (119) a. b.
(∀x)((F(x) & L(x,m)) → I(x)) (∀x)((F(x) & L(m,x)) → I(x))
Anders liggen de zaken in gevallen met relatiefzinnen waar de universele (of existentiële) kwantor ontbreekt, zoals de volgende: (120) a. b.
[DP De filosoof die van Madonna houdt] is intelligent. [DP De filosoof waar Madonna van houdt] is intelligent.
In deze zin, en in alle dergelijke zinnen waar er geen universele of existentiële kwantor in het subject zit (bv. twee filosofen, de meeste filosofen, meer dan vier filosofen, etc.) is er geen kwantor beschikbaar die de variabele x kan binden. Hiervoor kunnen we in de plaats de λoperator gebruiken, die dan de variabelen in zijn bereik bindt: (121) a. b.
λx[F(x) & L(x,m)] λx[F(x) & L(m,x)]
Door λ-abstractie maken we met andere woorden een predicaat, dat de verzameling van individuen denoteert die van Madonna houden (121a), of de verzameling van individuen waar Madonna van houdt (121b). Daarmee is de vertaling van de zinnen in (120) weliswaar incompleet, maar omdat een volledige vertaling ons hier te ver zou leiden, gaan we er hier niet verder op in. 2.4.4. VP-ellipsis In contexten van VP-ellipsis zoals die in het Engels voorkomt treffen we ook soms een ambiguïteit aan tussen een lezing van strikte identiteit en een van slordige identiteit. Dit is bv. het geval in (122): (122) Maxi likes hisi mother and Oscar does too. (123) a. Oscar likes Max’s mother. b. Oscar likes Oscar’s mother. In het tweede conjunct van (122) is de VP geëlideerd. De geëlideerde VP kan op twee manieren verstaan worden, zoals aangegeven in (123). De lezing (123a) is de strikte identiteitslezing, omdat in beide conjuncten het bezittelijke voornaamwoord geïnterpreteerd
43
wordt als verwijzende naar dezelfde persoon (Max). De lezing (123b) is de slordige identiteitslezing, omdat het bezittelijke voornaamwoord in het eerste conjunct naar Max verwijst en in het tweede naar Oscar. We kunnen met name de slordige lezing makkelijk verklaren door aan te nemen dat er λ-abstractie gebeurt in het eerste conjunct en dat het aldus gevormde predicaat gekopieerd wordt in de ellipsis-site in het tweede conjunct. Enigszins informeel weergegeven ziet dat er uit als volgt: (124) λx[x likes x’s mother](m) & λy[y likes y’s mother](o) De strikte lezing kunnen we dan weer zien als eentje waarbij het pronomen niet als een gebonden variabele gezien wordt, maar als een zelfstandig refererende uitdrukking, die (in beide conjuncten) toevallig naar dezelfde persoon verwijst, nl. Max: (125) λx[x likes his mother](m) & λy[y likes his mother](o) Deze representaties zijn informeel in de zin dat ze duidelijk niet beantwoorden aan de syntaxis van de predicatenlogica. Toch maken ze duidelijk hoe λ-abstractie gebruikt kan worden om het verschil tussen strike en slordige lezingen te formaliseren.
44
3. SYNTAXIS EN SEMANTIEK VAN NATUURLIJKE TAAL 3.1.
Zinnen
Hoe de syntaxis van natuurlijke taal eruitziet, zullen we hier grosso modo als bekend veronderstellen. Kort gezegd gaan we ervan uit dat zinnen een hiërarchische structuur hebben, weer te geven als een boom of door middel van labelled brackets. Wat de semantiek betreft, zullen we net zoals in PC aannemen dat syntactische uitdrukkingen een semantische waarde (denotatie, extensie) hebben, en dat het compositionaliteitsbeginsel van toepassing is. Het programma van de formele semantiek in de taalkunde bestaat er nu precies in vast te leggen wat die semantische waarde is van de uitdrukkingen van natuurlijke taal (CP, N, NP, AP, etc.), en hoe het compositionaliteitsbeginsel erop van toepassing is. Dat laatste betekent dat we algemene regels proberen op te stellen voor het afleiden van complexe denotaties uit de denotaties van de samenstellende delen. We gaan daarbij in twee stappen tewerk. In een eerste fase blijven we nog erg dicht bij de begrippen en ideeën van de PC. In een volgend hoofdstuk zullen we een probleem aan de orde stellen, dat ons ertoe zal nopen het formalisme van de verzamelingen te verlaten en het te vervangen door dat van functies. In wat volgt kijken we eerst naar zinnen (CP’s; voor het gemak zullen we soms nog naar CP verwijzen met het ‘ouderwetse’ symbool S). Enigszins vereenvoudigend gaan we er voor de semantische analyse van uit dat zinnen zijn opgebouwd uit een onderwerp (NP) en een predicaat (VP). (126) a. b. c.
[S [NP Socrates] [VP is aardig]] [S [NP Socrates] [VP lacht]] [S [NP Bartoli] [VP zoent Pavarotti]]
(127)
S 2 NP VP Socrates lacht
Met Frege nemen we aan dat de semantische waarde van een zin een waarheidswaarde is, en de semantische waarde van een eigennaam een individu. (128) 〚[NP Socrates]〛= Socrates 〚[NP Bartoli]〛= Bartoli 〚[NP Pavarotti]〛= Pavarotti (129) Hoe kunnen we de semantische waarde van de VP in (126a-b-c) opvatten? Geef een formele notatie van deze denotatie. 45
(i)
(126a):
(ii)
(126b):
(iii)
(126c):
Gegeven dat we weten hoe we de semantische waarden van NP’s en VP’s moeten berekenen, kunnen we, volgens het schema van (60) hierboven, ook een algemene regel opstellen voor het berekenen van de waarheidswaarde van zinnen. (130) 〚[S NP VP]〛= 1 asa (131) Toon aan hoe dit werkt voor de zinnen in (126).
We hebben nu een semantische theorie opgesteld die de denotatie van een eenvoudige boomstructuur zoals die in (127) kan berekenen op basis van de denotaties van de samenstellende delen NP en VP. Meer specifiek, we kunnen een denotatie toekennen aan elk van de drie knopen uit deze boom (NP, VP en S), en we hebben een regel die ons in staat stelt om uit de denotaties van de twee zusterknopen op het laagste niveau (NP en VP) de denotatie van de moederknoop (S) af te leiden. Met andere woorden, we hebben een regel die ons in staat stelt om compositionaliteit te modelleren. 3.2.
Werelden en tijden
In de PC wordt de waarheid van uitdrukkingen geëvalueerd met betrekking tot een model (waarvan o.a. deel uitmaakt een gespreksdomein D van individuen). In natuurlijke taal kunnen we zeggen dat de waarheid van uitdrukkingen geëvalueerd wordt met betrekking tot iets anders. (132) Wat?
46
In een aantal opzichten lijkt deze benadering ontoereikend. Zo is er in de onderstaande voorbeelden sprake van twee individuen (Suzanne en Bill Clinton) en een kusgebeurtenis. (133) a. b. c. d.
[CP Suzanne kust Bill Clinton]. Marie droomt [CP dat Suzanne Bill Clinton kust]. Marie denkt [CP dat Suzanne Bill Clinton kust]. Marie beseft [CP dat Suzanne Bill Clinton kust].
De kusgebeurtenis is een echte in (133a), maar een imaginaire in (133b), en in (133c) kan ze echt of imaginair zijn. (134) Denk na over een situatie waarin de kusgebeurtenis van (133c) echt is, en één waarin ze ingebeeld is. Ga vervolgens na hoe het zit met (133d).
Werkwoorden van het type dromen/denken/hopen/geloven etc. beschrijven mentale toestanden, en de zin in het complement van deze werkwoorden is waar of onwaar m.b.t. die mentale toestand, eerder dan m.b.t. de werkelijkheid. (135) Bedenk hoe de CP in (133b) onwaar zou kunnen zijn m.b.t. de mentale toestand van het subject van de hoofdzin.
Er lijkt dus ook in de mentale wereld sprake te zijn van waar en onwaar, en wel precies op dezelfde wijze als in de echte wereld. (136) Formuleer de waarheidsvoorwaarde voor elk van de CPs in (133). CP in (133a) is waar asa CP in (133b) is waar asa CP in (133c) is waar asa
47
Om dergelijke gevallen te integreren in onze theorie, introduceren we het concept van een mogelijke wereld. Dit is een wereld zoals de echte wereld, behalve dat er iets verschillend in is dan in de echte wereld (bv. een droomwereld, een imaginaire wereld, een hypothetische wereld, enz.). Wat voor een gevolgen heeft dit voor onze formulering van semantische interpretatieregels als (130)? We zullen waarheid relatief maken tot een mogelijke wereld (bv. de wereld van een droom, of de wereld van wat iemand denkt, of de wereld van een hypothetische situatie die we beschouwen). Dit doen we door een kleine wijziging aan te brengen in ons formalisme, door een principe als (130) bij te stellen als in (137): (137) 〚[S NP VP]〛w = 1 asa 〚NP〛w ∈〚VP〛w , 0 in alle andere gevallen Hypothetische als-zinnen zijn een ander geval waarin mogelijke alternatieve werelden opgeroepen worden. (138) a. b.
Als Proust op de Titanic gezeten had, dan zou de Titanic niet gezonken zijn. Als Proust op de Titanic gezeten had, dan zou zijn roman A la recherche du temps perdu niet voltooid geweest zijn, wat een groot verlies voor de literatuur geweest zou zijn.
We weten dat Proust niet op de Titanic was, m.a.w. dat de inhoud van de als-zin onwaar is. Toch zijn we geneigd een verschil te maken tussen (138a) en (138b) met betrekking tot hun waarheidswaarde. (139) Hoezo? (Het is daarbij van belang om te weten dat de Titanic zonk in 1912 en dat Proust zijn roman voltooide in 1922.)
Wat de zinnen in (138) doen is een hypothetische situatie (mogelijke wereld) te beschouwen waarin Proust op de Titanic zat, en na te denken over situaties die mogelijk daarvan het gevolg zouden kunnen zijn. De introductie van het concept mogelijke werelden stelt ons ook in staat om een expliciete formalisering te geven van modaliteit in natuurlijke taal. Modale zinnen zijn zinnen waarin een situatie voorgesteld wordt als niet-factueel. (140) a. b. c. d.
Het is mogelijk/noodzakelijk [CP dat Suzanne Bill Clinton kust]. Suzanne kan Bill Clinton kussen. Suzanne wil Bill Clinton kussen. Suzanne moet Bill Clinton kussen.
48
Modaliteit vereist de introductie van twee modale operatoren, noodzakelijkheid (⎕) en mogelijkheid (⃟). De syntaxis wordt als volgt uitgebreid (zie (47) boven): (141) i. ii.
Als φ een formule is, dan is ⎕φ een formule Als φ een formule is, dan is ⃟φ een formule
Bij deze syntactische regels horen de volgende semantische interpretatieregels: (142) i. ii.
〚⎕φ〛w = 1 asa voor alle w’ 〚φ〛w’ = 1 〚⃟φ〛w = 1 asa er een w’ is waarvoor geldt〚φ〛w’ = 1
Het concept van noodzakelijkheid is er dan een van waarheid in alle mogelijke werelden (universele kwantificatie), en mogelijkheid is als waarheid in minstens één mogelijke wereld (existentiële kwantificatie). (143) Welke verdere problemen ontstaan er bij de evaluatie van de waarheid van de zinnen in (126) met betrekking tot situaties in de werkelijkheid?
We passen daarom onze eerdere regel voor het berekenen van de waarheidswaarde van zinnen aan om rekening te houden met mogelijke werelden: (144) 〚[S NP VP]〛w, t = 1 asa 〚NP〛w, t ∈〚VP〛w, t 0 in alle andere gevallen We gaan hier niet verder in op de semantiek van tempus en de verdere implicaties van het concept van mogelijke werelden. We volstaan hier met de vaststelling dat de toevoeging van werelden en tijden aan het formalisme een complicatie is wanneer we het vergelijken met het systeem van de PC, maar dat deze complicatie noodzakelijk is wanneer we recht willen doen aan een aantal essentiële eigenschappen van natuurlijke taal.
49
4. FUNCTIES EN TYPES 4.1.
Functies
4.1.1. De interne structuur van VP In sectie 3.1 hebben we – geïnspireerd door de predicatencalculus – een eerste stap gezet in de richting van een semantische analyse van een syntactische structuur. We hebben de denotatie van zinnen besproken in termen van verzamelingenleer, waarbij we aangetoond hebben dat de denotatie van een zin compositioneel opgebouwd is uit de denotaties van zijn samenstellende delen, subject (NP) en predicaat (VP), volgens de regel (130) (nadien bijgesteld tot (144)). In deze sectie willen we verder gaan in het toepassen van het compositionaliteitsbeginsel door te kijken naar de interne structuur van VP. Het zal blijken dat daarbij een probleem ontstaat, in het bijzonder bij VPs met transitieve werkwoorden dat, slechts opgelost kan worden door de introductie van een heel nieuwe manier van formaliseren door middel van functies. Laten we even terugkeren naar de zinnen (126) hierboven, hier herhaald: (126) a. b. c.
[S [NP Socrates] [VP is [AP aardig]]] [S [NP Socrates] [VP lacht]] [S [NP Bartoli] [VP zoent Pavarotti]]
De VP’s in deze zinnen hebben een verschillende interne structuur. (145) Teken deze structuur.
Laten we in dit geval helemaal onderaan beginnen, bij het hoofd. (146) Wat is de denotatie van het adjectief en het intransitieve V? 〚[A aardig]〛= 〚[V lacht]〛=
Hoe verhoudt de denotatie van Vintr zich tot de VP? En die van A tot AP?
50
We zullen hier voorlopig niet uitspellen hoe je precies van het hoofd (V en A) naar de maximale projectie gaat (VP, AP), en in het geval van de AP verder naar de VP is aardig. Omdat in al deze gevallen er niets verandert aan de denotatie, is het formaliseren van de exacte regels hiervoor een betrekkelijk triviale opgave. (147) Is het type van de denotatie van een transitieve V gelijk te stellen met die van een adjectief en een intransitieve V? Waarom (niet)?
Transitieve werkwoorden lijken erg op de tweeplaatsige predicaten van de PC. (148) Hoezo? 〚[V zoent]〛=
Net als we hierboven gedaan hebben, willen we nu nagaan of de semantische regel die we net hebben opgesteld ons in staat stelt om een compositionele analyse te geven van een syntactische boomstructuur. De structuur van het voorbeeld in (126c) ziet eruit als in (149). S 2 NP VP Bartoli 2 V NP zoent Pavarotti
(149)
In de structuur hebben we 5 verschillende knopen (S, 2 keer NP, V en VP), waarvan twee vertakkende knopen (S en VP). Om een volledige semantische analyse van deze structuur te geven moeten we dus de denotatie van elk van de 5 knopen kennen; verder moeten we duidelijk maken hoe onze semantische regels de betekenis van S en VP kunnen afleiden uit de betekenissen van respectievelijk NP en VP, en V en NP. De denotaties van de vijf verschillende knopen in deze structuur kennen we al: de twee NPs verwijzen naar individuen, S naar een waarheidswaarde, de VP naar een verzameling van individuen, en V naar een verzameling van geordende paren van individuen. Regel (127) hierboven vertelt ons hoe we de waarheidswaarde van S berekenen (d.w.z. 〚S〛) op basis van〚NP〛en〚VP〛. Wat we nog moeten formaliseren is hoe we van een verzameling van geordende paren (〚Vtrans〛) naar een verzameling van individuen (〚VP〛) geraken. Dit kunnen we doen als volgt:
51
(150) 〚[V zoent]〛 = {⟨x,y⟩ : x zoent y} 〚[VP zoent Pavarotti]〛= {x : ⟨x,〚Pavarotti〛⟩ ∈〚zoent〛} {x : ⟨x, Pavarotti⟩ ∈{⟨x,y⟩ : x zoent y}} {x : x zoent Pavarotti} De manier waarop we hier tewerk gaan heeft weinig gemeen met de interpretatieregel voor combinaties van NP en VP tot S ((127) hierboven). Waar we konden zeggen dat de compositie van NP en VP tot S bestond in de verzamelingstheoretische relatie ‘is een element van’, geldt dit niet voor de combinatie van V en NP tot VP. (151) Leg uit waarom.
Anders gezegd, we kunnen regel (144) niet veralgemenen tot (152): (152) 〚[α β γ ]〛w, t =
1 asa 〚β〛w, t ∈〚γ〛w, t 0 in alle andere gevallen
Het doel van dit deel over functies bestaat in het formuleren van een algemeen mechanisme voor de combinatie van twee zusterknopen in een boom tot de moederknoop. Dat algemeen mechanisme heet functionele applicatie, maar voor we dat kunnen uitleggen moeten we eerst zeggen wat functies zijn. Functies kunnen we immers gebruiken als een andere manier om de denotaties van de verschillende woorden van een zin voor te stellen. Niet alle soorten denotaties zullen er anders uit gaan zien in een functiebenadering. Dat mag blijken uit het volgende overzicht van soorten denotaties in de verzamelingsbenadering, en wat ermee correspondeert in de functiebenadering: (153) Verzamelingen waarheidswaarden individuen verzamelingen van individuen verzamelingen van geordende paren verzamelingen van geordende trio’s
Functies waarheidswaarden individuen ? ? ?
In de volgende secties zullen we gaandeweg de vraagtekens invullen.
52
4.1.2. Eigenschappen van functies We beginnen met wat algemeen-wiskundige informatie over functies. Functies zijn een bijzonder soort relaties. Een (2-plaatsige) relatie definiëren we als een verzameling van geordende paren. Hieronder geven we enkele voorbeelden van relaties: (154) R1 = {⟨a,b⟩, ⟨c,b⟩, ⟨d,e⟩} R2 = {⟨a,a⟩, ⟨c,d⟩, ⟨c,f⟩} R3 = {⟨0,1⟩, ⟨1,2⟩, ⟨2,3⟩, ⟨3,4⟩, ...} R4 = {⟨Jan, rood⟩, ⟨is, vleermuis⟩, ⟨8, auto⟩, ⟨is, de⟩} R5 = {⟨1,0⟩, ⟨2,0⟩, ⟨3,0⟩, ...} Elke relatie heeft een domein en een bereik. Het domein is de verzameling van alle elementen die als eerste lid van een paar voorkomen, en het bereik is de verzameling van alle elementen die als tweede lid van een paar voorkomen. Formeler uitgedrukt geeft dit het volgende: (155) Als R een relatie is (R ⊆ A×B) (i) dan is A het domein van R asa A= {x : er bestaat een y zodanig dat ⟨x,y⟩ ∈ R} (ii) dan is B het bereik van R asa B = {y : er bestaat een x zodanig dat ⟨x,y⟩ ∈ R} (156) Bepaal het domein en het bereik van de relaties in (154).
Wat functies bijzonder maakt is dat er voor elk eerste lid van elk paar maar één tweede lid kan zijn. Formeler uitgedrukt ziet dat er als volgt uit: (157) Een relatie R is een functie asa ze aan de volgende voorwaarde voldoet: Voor elke x geldt dat als er een y en een z bestaat zodanig dat ⟨x,y⟩ ∈ R en ⟨x,z⟩ ∈ R, dan y = z (158) Welke van de relaties in (154) zijn functies en welke niet? Leg uit.
53
(159) Zijn de volgende relaties functies? i. R = {⟨x,y⟩ : x is de moeder van y}
ii.
R = {⟨x,y⟩ : x weegt y kg op tijdstip t}
Functies kan je op verschillende manieren representeren. Hoewel die manieren wiskundig gezien allemaal volstrekt gelijkwaardig zijn, brengen ze bij de analyse van natuurlijke taal soms belangrijke verschillen teweeg (met name m.b.t. het al eerder aangehaalde onderscheid tussen waarheidswaarde en waarheidsvoorwaarde). De eerste notatie ken je al: (160) f ={⟨a,b⟩, ⟨c,b⟩, ⟨d,e⟩} In (160) wordt de functie f gedefinieerd als een verzameling van geordende paren. Deze geordende paren kunnen visueel weergegeven worden als in (161): (161) A
B
a . c.
.b
d.
.e
Nog een andere manier om hetzelfde weer te geven, vind je in (162): daar wordt f weergegeven in een tabel, waarbij we aan de linkerkant het eerste lid van ieder geordend paar aantreffen, en aan de rechterkant het tweede lid.
⎡a → b ⎤ (162) f = ⎢c → b ⎥ ⎢ ⎥ ⎢⎣d → e ⎥⎦ Wat al deze notaties gemeenschappelijk hebben is dat ze een exhaustieve opsomming geven van alle elementen van f. Bij functies met grote – of zelfs oneindige – domeinen is dat echter onhandig. In zulke gevallen maken we dan ook eerder gebruik van een omschrijving van de
54
functie, waarbij het tweede lid van ieder paar wordt gedefinieerd als een voorwaarde waaraan voldaan moet worden. Een voorbeeld wordt gegeven in (163). (163) f: ℕ 0 → ℕ 1 zodanig dat ∀x ∈ ℕ 0 geldt dat f(x) = x + 1 In deze formulering worden niet langer elementen van f opgesomd. In de plaats daarvan krijgen we een notatie waarin eerst domein en bereik van de functie bepaald worden. (164) Hoe?
Vervolgens wordt een algemene voorwaarde geformuleerd waaraan ieder rechterlid van een geordend paar moet voldoen. Een belangrijk aspect van de formulering in (163), dat we bij de semantische analyse van zinnen in termen van functies nog veelvuldig zullen ontmoeten, is de notatie f(x). In deze notatie wordt x (element van het domein) het argument van de functie genoemd, en de uitkomst ervan (het corresponderende element in het bereik) de waarde van de functie, of, kort, de functiewaarde. (165) Veronderstel f zoals gedefinieerd in (163). f(3) = f(7) = f(125) = Denk na over de betekenis van f(x) in (163). Wat is of wat doet f(x)? Denk daarbij eerst na over x (wat voor een ding is x?), en vervolgens over f, en tenslotte over de combinatie van de beide.
Hiermee hebben we een belangrijk concept geïntroduceerd, met name dat van de functionele applicatie: de toepassing van een functie op een argument, die een (functie)waarde oplevert. (166) Formuleer de relaties R3, R5 en R1 in (154) eerst als een tabel en dan aan de hand van een functievoorwaarde. R3
55
R5
R1
Er is een belangrijk verband tussen verzamelingen en functies. Wat een verzameling is, hebben we eerder al gezien: een collectie van elementen. Impliciet in het verzamelingbegrip is dat er ook elementen zijn die geen deel uitmaken van de verzameling. Zo gezien kunnen we een verzameling zien als een tweedeling van het universum: de entiteiten die deel uitmaken van de verzameling enerzijds, en de entiteiten die geen deel uitmaken van de verzameling anderzijds. Een karakteristieke functie is een functie die iets heel gelijkaardigs doet: het is een functie die het universum in twee delen verdeelt. Hoe dat precies in zijn werk gaat, kan je aflezen uit de volgende definitie: (167) Als A een verzameling is, dan is fA de karakteristieke functie van A asa f A is een functie zodanig dat voor alle x ∈ D geldt dat fA(x) = 1 asa x ∈ A en fA(x) = 0 asa x ∉ A De entiteiten die een element vormen van de verzameling krijgen als functiewaarde 1, en de entiteiten die geen element vormen van de verzameling krijgen als functiewaarde 0. Iedere verzameling kan uniek gekarakteriseerd worden aan de hand van zo een karakteristieke functie. (168) Neem een willekeurige verzameling A (bv. de verzameling van de banketbakkers). Formuleer de verzameling in verzamelingstheoretische notatie, en vervolgens als een functie.
(169) We zeggen dat een karakteristieke functie een functie is van …………………………………… naar ……………………………………….
56
Gegeven het verband tussen verzamelingen en functies, kunnen we het concept van een karakteristieke functie toepassen op een type van denotatie dat we eerder onderscheiden hebben, nl. de verzameling van individuen. (170) Noem drie soorten syntactische constituenten waarvan de denotatie een verzameling van individuen is. Geef een voorbeeld van elk. Formuleer vervolgens de denotatie van elk van de voorbeelden (a) als een verzameling en (b) als een karakteristieke functie.
Nogmaals kijkend naar domein en bereik van deze functies, kunnen we van deze denotaties zeggen dat ze functies zijn van ………………………………. (=domein) naar ……………………………………. (=bereik)
We kunnen nu de soorten denotaties die we eerder onderscheiden hebben in verzamelingstheoretische termen als volgt vertalen naar functieterminologie: (171) Verzamelingen 1. waarheidswaarden 2. individuen 3. verzamelingen van individuen
Functies waarheidswaarden individuen functies van individuen naar waarheidswaarden ?
4. verzamelingen van geordende paren 5. verzamelingen van geordende trio’s
?
4.1.3. Functionele applicatie We hebben nu alle werktuigen in handen om terug te keren naar natuurlijke taal. We proberen heel concreet en stap voor stap na te gaan of we aan de hand van functies een semantische analyse kunnen geven van (iedere knoop in) een syntactische boomstructuur. We vertrekken
57
daarbij van gesimplificeerde boomstructuren, en voegen telkens een stukje complexiteit toe. Laten we beginnen met de zin Laura slaapt. Deze heeft de (vereenvoudigde) structuur in (172). (172) S 2 NP VP Laura slaapt Deze boom bevat – zoals in sectie 3.1 reeds aangegeven – drie knopen, en twee hiërarchische niveaus. Om een semantische analyse te geven van deze structuur moeten we dus weten (a) wat de denotatie is van iedere knoop, en (b) hoe we van het ene naar het andere hiërarchische niveau kunnen geraken (anders geformuleerd, hoe de betekenis van de moederknoop S is afgeleid van de betekenissen van de twee dochterknopen NP en VP). Wat dat tweede betreft, volgen we opnieuw Frege, die voorstelde om iedere combinatie van twee elementen tot een groter geheel (zoals in de structuur in (172)) te analyseren als een geval van functionele applicatie. Dat betekent dat een van de twee samenstellende elementen een functie moet zijn die het andere als argument neemt. Functionele applicatie kunnen we als volgt voorstellen in een boomstructuur (waarbij de volgorde van f en x onbelangrijk is): (173)
f(x) 2 f x
Dit komt erop neer dat we twee zusterknopen in een boom semantisch combineren doordat één van de zusters een functie is die de andere zuster als argument neemt, en we door toepassing van de functie op het argument (d.w.z. functionele applicatie) een semantische waarde krijgen voor de moedernkoop. Nemen we het concrete geval van (172). Van de drie relevante delen van de structuur kennen we de denotatie al. (174) De denotatie van de zin is een De denotatie van de NP is een De denotatie van de VP is een functie van naar Boomsgewijze kunnen we dit als volgt weergeven:
58
(175) 〚S〛= waarheidswaarde 〚NP〛= individu
〚VP〛= functie van individuen naar waarheidswaarden
Functionele applicatie kunnen we nu voor dit geval als volgt weergeven: (176) 〚S〛 = 〚VP〛(〚NP〛) Wat tot dusver ontbrak in de verzamelingstheoretische manier om zinsdenotaties weer te geven, was een algemene regel van hoe we van de denotaties van NP en VP tot die van S komen. Dit is precies wat functionele applicatie ons geeft: het is een algemene manier om twee zusters in de boom te combineren tot een nieuw geheel, de dominerende knoop. Deze algemene regel ziet er uit als volgt: (177) Functionele Applicatie (FA) Als α een vertakkende knoop is met β en γ als dochterknopen, en als〚β〛een functie is die als domein een verzameling heeft die〚γ〛bevat, dan geldt dat〚α〛=〚β〛(〚γ〛) Dit principe stelt twee dingen: 1. twee zusterknopen kunnen enkel leiden tot de interpretatie van hun moederknoop wanneer de denotatie van de ene zuster een functie is die de denotatie van de andere zuster in haar domein heeft. 2. het bepaalt hoe de denotatie van de moederknoop tot stand komt, nl. door de functie toe te passen op de denotatie van de zuster in het domein van de functie. Wanneer we dit toepassen op een concreet geval, met name de boomstructuur in (172), ziet de afleiding er stap voor stap uit als in (178): (178) S NP Laura
VP slaapt
=〚 [VP slaapt ] 〛 (〚 [NP Laura] 〛) =〚 [VP slaapt ] 〛(Laura)
(FA)
59
= [f: D → {0, 1} zodanig dat voor alle x ∈ D geldt dat f(x)=1 asa x slaapt en f(x) = 0 asa x niet slaapt] (Laura) = 1 asa Laura slaapt en 0 asa Laura niet slaapt De laatste regel die we bekomen is precies waar we naar op zoek waren. We hebben de denotatie van de zin Laura slaapt berekend en zijn uitgekomen op een waarheidswaarde gekoppeld aan een waarheidsvoorwaarde. De zin is waar als Laura slaapt en onwaar in alle andere gevallen. Als we een model of een werkelijkheid hebben waarin Laura slaapt, kunnen we vervolgens ook de laatste stap zetten, en de waarheidsvoorwaarde vervangen door een waarheidswaarde. We hebben dus een compositionele semantische analyse gegeven van deze zin. We zijn nu klaar om een eerste complicatie toe te voegen aan de syntactische structuur. Zoals we reeds verschillende malen hebben aangegeven, is de boomstructuur waar we tot nu toe mee gewerkt hebben een vereenvoudigde versie van echte syntactische bomen. De boom in (179) staat al een stap dichter bij de syntactische realiteit. (179) S NP | N’ | N | Laura
VP | V’ | V | slaapt
Een boomstructuur bestaat niet enkel uit vertakkende knopen. De enige manier die we tot nog toe hebben om van één hiërarchisch niveau naar het volgende te gaan is Functionele Applicatie, maar aangezien dat principe specifiek is ontworpen voor vertakkende knopen, helpt het ons niet om bijvoorbeeld van V naar V’ of van N’ naar NP te gaan. Met andere woorden, we hebben een nieuwe semantische regel nodig. Wat wel duidelijk is, is dat het hier niet om een complexe regel zal gaan: de interpretatie van zo’n niet vertakkende knoop is immers altijd identiek aan de interpretatie van zijn dochterknoop. (180) Leg uit.
60
De tussenliggende, niet-vertakkende knopen dienen eigenlijk enkel als ‘doorgeefluik’ voor de informatie van de terminale knopen (de lexicale items) naar de eerste vertakkende knoop. De algemene regel voor niet-vertakkende, niet-terminale knopen ziet er dus als volgt uit: (181) Niet-vertakkende, niet-terminale knopen (NVNT) Als α een niet-vertakkende, niet-terminale knoop is met β als dochter, dan geldt dat 〚α〛 = 〚β〛 Wat nog ontbreekt, is een regel voor de interpretatie van terminale knopen. Daarvan nemen we aan dat die in het lexicon terug te vinden is. (182) Terminale knopen (TK) Als α een terminale knoop is, dan staat〚α〛in het lexicon. In het lexicon zullen voor verschillende woordsoorten verschillende types denotaties staan. Zo hebben we eerder al gezien dat de denotatie van een adjectief en een intransitief werkwoord een verzameling van individuen is, of, in termen van functies, een functie van individuen naar waarheidswaarden. Op de kwestie van de transitieve werkwoorden komen we later nog terug. Op dit punt staan we even stil voor een samenvatting. 4.1.4. De semantische analyse van intransitieve zinnen Langzaam maar zeker hebben we alle ingrediënten bij elkaar gezocht voor een semantische theorie die compositioneel een syntactische structuur kan analyseren. Laten we onze bevindingen tot nu toe even op een rijtje zetten. We onderscheiden in onze theorie drie onderdelen: A. Een inventaris van mogelijke denotaties • elementen van D, de verzameling van alle mogelijke individuen • elementen van {0, 1}, de verzameling van waarheidswaarden • functies van D naar {0, 1} B. Een lexicon waarin de denotaties van alle woorden zijn opgenomen • 〚 Laura 〛 = Laura • 〚 slaapt 〛 = f : D → {0, 1} zodanig dat voor alle x ∈ D geldt dat f(x)=1 asa x slaapt en f(x)=0 asa x niet slaapt
61
C. Semantische regels om knopen in een boom te interpreteren (182) Terminale knopen (TK) Als α een terminale knoop is, dan staat 〚α〛 in het lexicon. (181) Niet-vertakkende, niet-terminale knopen (NVNT) Als α een niet-vertakkende, niet-terminale knoop is met β als dochter, dan geldt dat 〚α〛 = 〚β〛 (177) Functionele Applicatie (FA) Als α een vertakkende knoop is met β en γ als dochterknopen, en als 〚β〛 een functie is die als domein een verzameling heeft die 〚γ〛 bevat, dan geldt dat 〚α〛 = 〚β〛(〚γ〛) (183) Geef met deze achtergrond een gedetailleerde semantische analyse van de boomstructuur in (179). Gebruik de analyse in (178) als voorbeeld en zorg dat je de denotatie van iedere knoop berekent.
62
In de theorie die je in deze oefening hebt toegepast wordt de denotatie van een intransitief werkwoord gedefinieerd als een functie van individuen naar waarheidswaarden. Tot nu toe hebben we die functie steeds voorgesteld aan de hand van een functievoorwaarde. Zoals we hierboven hebben gezien, kunnen functies echter ook als een tabel worden weergegeven. Stel bijvoorbeeld dat het domein D van individuen slechts drie elementen bevat: D = {Laura, Piet, Karel}. Dan zou de functie〚slaapt〛er als volgt kunnen uitzien: " Piet →1 % (184) 〚slaapt〛= $$ Laura → 0'' $#Karel → 0 '&
(185) Bereken nu opnieuw de denotatie van de zin Laura slaapt. Je hoeft niet alle stappen opnieuw uit te voeren; enkel het eindresultaat interesseert ons op dit moment.
Er is een belangrijk verschil tussen wat we in (185) doen en wat we eerder in (178) gedaan hebben. Alleen in het laatste geval komt er een waarheidsvoorwaarde voor in de berekening. Dit is een belangrijk verschil tussen de notatie van een functie in termen van een functievoorwaarde (zoals in (163) hierboven), en de andere notaties die we gezien hebben: als een opsomming tussen accolades (zoals in (160)), met een Venn-diagram (zoals in (161)), met een tabel (zoals in (162)). Wiskundig gezien maakt het niet uit welke methode je gebruikt: ze zijn volledig equivalent aan elkaar. Zodra we echter de stap naar taal zetten, zien we dat het wel uitmaakt welke notatie je gebruikt: daar waar de drie genoemde notaties een waarheidswaarde opleveren, geeft alleen de notatie met een functievoorwaarde ons steeds een waarheidsvoorwaarde (met daaraan gekoppeld een waarheidswaarde). Aangezien we bij voorkeur de denotatie van een zin voorstellen als een waarheidsvoorwaarde, geven we de denotatie van functies in onze semantische theorie dus ook bij voorkeur weer d.m.v. een functievoorschrift.
63
4.1.5. De functiedenotatie van transitieve werkwoorden Laten we nu terugkeren naar het probleem waar de semantische analyse in termen van verzamelingen was op gestoten. Het betrof transitieve werkwoorden in zinnen van het type Laura ziet Karel. (186)
S
NP Laura V ziet
VP NP Karel
In de op predicatenlogica gestoelde benadering is de denotatie van een transitief werkwoord een verzameling van geordende paren. Meer bepaald kunnen we ziet definiëren als in (187). (187) De denotatie van zien in termen van verzamelingen 〚 zien 〛 = {⟨x,y⟩ ∈ D×D : x ziet y} Het probleem zit hem in het samenvoegen van V en NP tot VP. We weten immers dat de denotatie van V een verzameling van geordende paren is en dat de denotatie van NP een individu is. Zoals aangetoond in (150) hierboven, zijn die twee semantische eenheden weliswaar met elkaar te combineren, maar, zoals we toen al opmerkten, lijkt de manier waarop dat gebeurt te verschillen van geval tot geval. (188) Denk na over de correctheid van deze bewering door (150) te vergelijken met een andere regel, nl. (130).
Het centrale uitgangspunt van deze sectie over functies is echter dat we wel degelijk een algemeen geldige regel kunnen opstellen voor de manier waarop betekenissen compositioneel opgebouwd worden, nl. de regel van de functionele applicatie. Op het eerste gezicht lijkt deze regel al evenmin te werken voor de boomstructuur in (186). Om dat te zien, moeten we naar de boomstructuur kijken vanuit het perspectief van functies. Van Laura en Karel weten we hoe de denotatie eruitziet. Het gaat hier immers om individuen. (189) a. b.
〚 Laura 〛 = Laura 〚 Karel 〛 = Karel
64
Van een transitief werkwoord zoals ziet weten we al hoe de denotatie eruitziet in termen van verzamelingen (zie (187) hierboven). (190) Formuleer de karakteristieke functie van deze verzameling, d.w.z. vertaal (187) in functieterminologie. 〚 ziet 〛= f:
Om van de combinatie van〚 [V ziet] 〛en〚 [NP Karel] 〛naar die van〚 [VP ziet Karel] 〛te gaan, moeten we functionele applicatie als in (177) toepassen, hier herhaald. In (191) hebben we (177) geherformuleerd om van toepassing te zijn op het geval dat ons hier aanbelangt, dat van een transitieve VP: (177) Als α een vertakkende knoop is met β en γ als dochterknopen, en als〚β〛een functie is die als domein een verzameling heeft die〚γ〛bevat, dan geldt dat〚α〛 = 〚β〛( 〚γ〛) (191) Als VP een vertakkende knoop is met Vtrans en NP als dochterknopen, en als〚Vtrans〛 een functie is die als domein een verzameling heeft die〚NP〛bevat, dan geldt dat〚 VP〛=〚Vtrans〛(〚NP〛) Het zal duidelijk zijn dat functionele applicatie niet van toepassing kan zijn op dit geval. (192) Waarom niet?
De oplossing voor het probleem moeten we zoeken in de denotatie van Vtrans. Immers, de denotatie van VP kunnen we in het algemeen opvatten als een functie van individuen naar waarheidswaarden, wat de VP ook bevat. We moeten dus op zoek naar een andere denotatie voor Vtrans dan die in (190). Welke, en hoe moeten we tewerk gaan? Laten we, om deze vraag te beantwoorden, even een stap terug zetten en nog eens kijken hoe FA van toepassing is op de compositie van de denotaties van NP en VP tot S (cf. (175) hierboven). We zeiden dat de karakteristieke functie van VP een functie is van individuen naar waarheidswaarden. Anders gezegd, de functie heeft een individu nodig en levert als output een waarheidswaarde op. Dit werkt prima in het geval van VP: immers, de zuster van VP in de boom is NP, waarvan de denotatie een individu is, en de combinatie van NP en VP wordt gedomineerd door S, waarvan de denotatie zelf een waarheidswaarde is. Zo kan FA werken voor VP:〚VP〛 is een functie die een individu nodig heeft om een waarheidswaarde
65
op te leveren. Het individu wordt gedenoteerd door het subject, terwijl de waarheidswaarde de denotatie van de hele zin is. Het probleem met 〚Vtrans 〛is dat het een verzameling denoteert van geordende paren; in functieterminologie is het een functie van geordende paren naar waarheidswaarden. Nu denoteert de zuster van Vtrans in de boomstructuur geen geordend paar, en het resultaat van de combinatie van Vtrans en NP, VP, denoteert geen waarheidswaarde. Er is dus een dubbel probleem van type-mismatch wanneer we de semantische interpretatie compositioneel willen laten verlopen, d.w.z. in overeenkomst met de opbouw van de syntactische structuur d.m.v. FA. Wat voor een functie moet 〚Vtrans 〛dan wel zijn? Laten we dit in een algemene zin proberen te bepalen door te kijken naar het domein en het bereik van de functie (of anders gezegd, respectievelijk de input en de output van de functie). (193) Gegeven (191), wat moet het domein van de functie zijn?
We weten eigenlijk ook al wat het bereik van de functie moet zijn: deze moet overeenstemmen met de denotatie van VP. (194) Wat is het bereik van de functie? Conclusie: 〚Vtrans 〛is een functie van naar Teken een boom van een transitieve zin naar het model van (175), waarbij je voor iedere knoop het type van de denotatie aangeeft.
66
Daarmee hebben we, in een algemene zin, vastgelegd wat voor een functie de denotatie van een transitief werkwoord moet zijn. Voor we de functie in (194) concreter gaan formuleren, staan we even stil bij een algemener kwestie, nl. het verband tussen enerzijds functies van geordende paren naar waarheidswaarden (zoals (190) er een is) en anderzijds de functie die we zoeken, en waarvan de algemene vorm gegeven is in (194). Zowel in de verzamelingsdenotatie als in de functienotatie kunnen we een transitief werkwoord weergeven in termen van geordende paren. De functieterminologie biedt ons echter iets nieuws, wat de verzamelingsnotatie niet had, nl. een weergave uitsluitend in termen van individuen en waarheidswaarden, zonder gebruikmaking van geordende paren. Dat laatste stelt ons in staat om de combinatie van een transitief werkwoord met zijn object te zien als een geval van functionele applicatie, d.w.z. precies hetzelfde mechanisme dat verantwoordelijk is voor de compositie van het subject en de VP tot S. Ook als we de functie weergeven als een tabel zijn beide weergaven (d.w.z. met geordende paren of uitsluitend individuen) mogelijk. Een functie als (190) verdeelt – zoals alle karakteristieke functies – de werkelijkheid in twee delen. Aan de ene kant vinden we alle paren die behoren tot de functie, en aan de andere kant alle paren die er niet toe behoren. (195) Stel dat we een domein van drie individuen hebben: D = {Laura, Piet, Karel}. Veronderstel verder dat Laura Piet ziet en Karel en Laura elkaar.Vul nu onderstaande tabel aan. Als je niet weet wat er na de pijlen moet komen, herlees dan (190).
fziet
⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ = ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣
Laura, Laura → ...⎤ ⎥ Laura, Piet → ... ⎥ ⎥ Laura, Karel → ... ⎥ Piet , Laura → ... ⎥ ⎥ ⎥ Piet , Piet → ... ⎥ Piet , Karel → ... ⎥ ⎥ Karel , Laura → ... ⎥ Karel , Piet → ... ⎥ ⎥ Karel , Karel → ... ⎥⎦
Deze functie heeft niet individuen als argumenten, maar geordende paren van individuen (f(⟨x,y⟩) i.p.v. f(x)). Technischer uitgedrukt, het is geen 1-plaatsige, maar een 2-plaatsige functie. De wiskundige Moses Schönfinkel heeft aangetoond (in zijn artikel Über die Bausteine der mathematischen Logik uit 1924) dat iedere 2-plaatsige functie kan worden gereduceerd tot een combinatie van 1-plaatsige functies. Dit proces staat bekend als schönfinkelisatie. Toegepast op de tabel in (195) levert dit het volgende resultaat op:
67
(196)
fziet
⎡ ⎡ Laura → ...⎤ ⎤ ⎢ ⎢ ⎥ ⎥ ⎢ Laura → ⎢ Piet → ... ⎥ ⎥ ⎢ ⎢⎣ Karel → ... ⎥⎦ ⎥ ⎢ ⎥ ⎡ Laura → ...⎤ ⎥ ⎢ = ⎢ Piet → ⎢ Piet → ... ⎥ ⎥ ⎢ ⎥ ⎥ ⎢ ⎢⎣ Karel → ... ⎥⎦ ⎥ ⎢ ⎢ ⎥ ⎡ Laura → ...⎤ ⎥ ⎢ ⎢ Karel → ⎢ Piet → ... ⎥ ⎥ ⎢ ⎥ ⎥ ⎢ ⎢⎣ Karel → ... ⎥⎦ ⎥⎦ ⎢⎣
In deze tabel is geen sprake meer van een 2-plaatsige functie. In de linkerkolom van de grote tabel vinden we immers individuen terug, geen geordende paren van individuen. Dat betekent dat het domein van deze functie D is. Overeenkomstig wat we eerder gezien hebben, is dit het argument binnen de VP, d.w.z. de zuster van V. Wat is het bereik? Daarvoor moeten we naar de rechterkolom van de grote tabel kijken. Daar vinden we opnieuw tabellen terug. Dat betekent dat het bereik van deze functie een verzameling van functies is. Die functies beelden individuen af op waarheidswaarden. De individuen in kwestie zijn nu de zusters van VP. (197) Vul in (196) de lege plekken in. Met andere woorden, we hebben de 2-plaatsige functie uit (195) opgesplitst in twee eenplaatsige functies, en wel zo dat een (eerste) functie individuen afbeeldt op functies van individuen naar waarheidswaarden. Merk op dat dit precies de conclusie is waar we eerder (in (194)) op uit waren gekomen. In wiskundige termen gesteld is de functie-denotatie van een transitief werkwoord zoals ‘ziet’ dus niets anders dan de geschönfinkeliseerde karakteristieke functie van de verzameling-denotatie van dat werkwoord. Uiteraard willen we deze functie ook kunnen formuleren onder de vorm van een functievoorwaarde (d.w.z. in het formaat van bv. (163)). Dit ziet er uit als volgt: (198) 〚 ziet 〛 = f : D →{g : g is een functie van D → {0, 1}} zodanig dat voor alle y ∈ D geldt dat f(y) = g : D → {0, 1} zodanig dat voor alle x ∈ D geldt dat g(x)=1 asa x ziet y en g(x)=0 asa x ziet y niet. De denotatie in (198) kan je op een kortere manier weergeven als volgt: (199) 〚 ziet 〛 = f : D → {g : g is een functie van D naar {0, 1}} zodanig dat voor alle x, y ∈ D geldt dat (f(y))(x)=1 asa x ziet y en (f(y))(x)=0 asa x ziet y niet.
68
Leg uit waarom hier hetzelfde staat als in (198).
4.1.6. De semantische analyse van transitieve zinnen Alvorens een volledige semantische analyse te geven van de syntactische structuur van Laura ziet Karel sommen we eerst de verschillende onderdelen van onze theorie nog even op. Door de discussie van transitieve werkwoorden zijn daar immers enkele elementen aan toegevoegd: A. Een inventaris van mogelijke denotaties Verzamelingen 1. waarheidswaarden 2. individuen 3. verzamelingen van individuen 4. verzamelingen van geordende paren 5. verzamelingen van geordende trio’s
Functies waarheidswaarden (elementen van {0, 1}) individuen (elementen van D) functies van D naar {0, 1} functies van D naar de verzameling van functies van D naar {0, 1} ?
B. Een lexicon waarin de denotaties van alle woorden is opgenomen 1. 〚 Laura 〛 = Laura 2. 〚 Karel 〛 = Karel 3. 〚 slaapt 〛 = f : D → {0, 1} zodanig dat voor alle x ∈ D geldt dat f(x)=1 asa x slaapt en f(x)=0 asa x niet slaapt 4. 〚 ziet 〛 = f : D → {g : g is een functie van D naar {0, 1}} zodanig dat voor alle x, y ∈ D geldt dat (f(y))(x)=1 asa x ziet y en (f(y))(x)=0 asa x ziet y niet. C. Semantische regels om knopen in een boom te interpreteren (182) Terminale knopen (TK) Als α een terminale knoop is, dan staat〚α〛in het lexicon.
69
(181) Niet-vertakkende, niet-terminale knopen (NVNT) Als α een niet-vertakkende, niet-terminale knoop is met β als dochter, dan geldt dat 〚α〛 = 〚β〛 (177) Functionele Applicatie (FA) Als α een vertakkende knoop is met β en γ als dochterknopen, en als〚β〛een functie is die als domein een verzameling heeft die〚γ〛bevat, dan geldt dat〚α〛 = 〚β〛(〚γ〛) Op basis van deze ingrediënten kunnen we nu de volgende semantische analyse geven van de zin Laura ziet Karel. (200) S NP VP | N’ V NP | ziet | N N’ | | Laura N | Karel Geef rechts van elke stap aan welke regel is toegepast (voor de eerste twee stappen is dit reeds aangegeven). Regel? =〚 [VP ziet Karel] 〛 (〚 [NP Laura ] 〛) (FA) =〚 [VP ziet Karel] 〛 (〚 [N’ Laura ] 〛) (NVNT) =〚 [VP ziet Karel] 〛 (〚 [N Laura ] 〛) =〚 [VP ziet Karel] 〛 (〚 Laura 〛) =〚 [VP ziet Karel] 〛 (Laura) = (〚 [V ziet ] 〛(〚 [NP Karel ] 〛)) (Laura) = (〚 [V ziet ] 〛(〚 [N’ Karel ] 〛)) (Laura) = (〚 [V ziet ] 〛(〚 [N Karel ] 〛)) (Laura) = (〚 [V ziet ] 〛(〚 Karel 〛)) (Laura) = (〚 [V ziet ] 〛(Karel))(Laura) = (〚 ziet 〛(Karel)) (Laura) = ((f : D → {g : g is een functie van D naar {0, 1}} zodanig dat voor alle x, y ∈ D geldt dat (f(y))(x)=1 asa x ziet y en (f(y))(x)=0 asa x ziet y niet) (Karel)) (Laura)
70
= (g : g is een functie van D naar {0, 1} zodanig dat voor alle x ∈ D geldt dat g(x)=1 asa x ziet Karel en g(x)=0 asa x ziet Karel niet) (Laura) =1 asa Laura ziet Karel en 0 asa Laura ziet Karel niet. (201) Wat is de denotatie van een ditransitief werkwoord zoals geven in de zin Jan geeft Piet Fido? Geef dit eerst weer als een verzameling, en geef vervolgens de karakteristieke functie van deze verzameling. a.
〚 geeft 〛= {
b.
〚 geeft 〛= f:
(202) De functie van de vorige opdracht is een niet-geschönfinkeliseerde functie. Schrijf deze functie uit als een geschönfinkeliseerde functie. Ga daarbij uit van onderstaande boomstructuur (bekommer je niet om de woordvolgorde, of om de hiërarchische structuur binnen de VP). S NP VP | N’ NP V’ | | N N’ V | | | Jan N geeft | Piet
NP | N’ | N | N | Fido
fgeeft :
71
(203) Geef een volledige semantische analyse van de zin Jan geeft Piet Fido en baseer je op de analyse die we hierboven gegeven hebben van Laura ziet Karel.
72
73
4.2.
Types
4.2.1. Een nieuw formalisme In de laatste oefening van de vorige sectie hebben de onze inventaris van mogelijke denotaties nog wat verder uitgebreid. We zijn inmiddels aanbeland bij de lijst in (204). (204) De inventaris van mogelijke denotaties (meest recente versie) Verzamelingen 1. waarheidswaarden 2. individuen 3. verzamelingen van individuen 4. verzamelingen van geordende paren 5. verzamelingen van geordende trio’s
Functies waarheidswaarden (elementen van {0, 1}) individuen (elementen van D) functies van D naar {0, 1} functies van D naar de verzameling van functies van D naar {0, 1} functies van D naar de verzameling van functies van D naar de verzameling van functies van D naar {0, 1}
De laatste twee regels in dit overzicht geven het denotatietype weer van resp. transitieve en ditransitieve werkwoorden. De omschrijvingen die daar gegeven worden, zijn behoorlijk omslachtig. Daarom zullen we in deze sectie een manier introduceren waarmee we veel compacter en eenvoudiger naar verschillende soorten van denotaties kunnen verwijzen. De manier waar het om gaat zijn semantische types. We onderscheiden eerst en vooral twee basistypes: individuen en waarheidswaarden. Als je kijkt naar het overzicht in (204), dan zie je dat dit inderdaad de bouwstenen zijn waaruit de overige denotatietypes zijn opgebouwd. (205) Leg uit.
Individuen zullen we vanaf nu het label “e” geven (voor entity) en waarheidswaarden het label “t” (voor truth value). We zeggen dus dat de denotatie van de NP Socrates van type e is, en de denotatie van de zin Socrates slaapt van type t. Om functies weer te geven van individuen naar waarheidswaarden, gebruiken we de volgende notatie: ⟨e,t⟩. De visgraathaken geven aan dat het hier om een functie gaat. Links van de komma treffen we het argument aan van die functie (hier: een individu) en rechts van de komma treffen we de functiewaarde aan (hier: een waarheidswaarde). ⟨e,t⟩ is dus het type van functies van individuen naar waarheidswaarden, d.w.z. van bv. intransitieve werkwoorden.
74
(206) Bepaal nu zelf het type van transitieve en ditransitieve werkwoorden. Gebruik de notatie die we net gezien hebben: visgraten geven aan dat het om een functie gaat, links van de komma staat het argument (of domein), en rechts de functiewaarde (of bereik). (i) Het type van transitieve werkwoorden: (ii)
Het type van ditransitieve werkwoorden:
Nu we een korte, handige notatie hebben voor de verschillende soorten van denotaties, willen we die notatie ook doortrekken naar de verzamelingen van alle elementen die dat soort van denotatie hebben. Tot nu toe hebben we slechts twee dergelijke verzamelingen gebruikt: D is de verzamelingen van alle individuen (= van alle elementen van type e) en {0, 1} is de verzameling van alle waarheidswaarden (= van alle elementen van type t). Wat we gaan doen, is de letter D gebruiken voor alle verzamelingen van elementen van een bepaald type, waarbij we door middel van een subscript aangeven om welk type het gaat: (207)
a. b. c.
De = de verzameling van alle elementen van type e = de verzameling van alle individuen = D Dt = de verzameling van alle elementen van type t = de verzameling van alle waarheidswaarden = {0, 1} D⟨e,t⟩ = de verzameling van alle elementen van type ⟨e,t⟩ = de verzameling van alle functies van individuen naar waarheidswaarden = {f: f is een functie van De naar Dt}
(208) (i)
Bepaal nu zelf waar de volgende verzamelingen mee overeenkomen: D⟨e,⟨e,t⟩⟩ =
(ii)
D⟨e,⟨e,⟨e,t⟩⟩⟩ =
Het handige aan types is niet alleen dat ze een korte en uniforme manier zijn om naar semantische denotaties te verwijzen, maar ook dat we nu kunnen definiëren welke vormen zulke denotaties kunnen aannemen. Met andere woorden, we kunnen definiëren wat welgevormde types zijn en wat niet. Dat gebeurt op de volgende manier: (209) Semantische types
75
(i) (ii) (iii)
e en t zijn semantische types Als α en β semantische types zijn, dan is ⟨α,β⟩ een semantisch type. Er bestaan geen andere semantische types.
4.2.2. Adjectieven Lidwoorden, adjectieven en nomina kunnen met elkaar gecombineerd worden tot NP’s. Bijvoorbeeld, met de woorden de, blauwe en bal kunnen we de NP de blauwe bal maken. Stel dat we aan die NP de volgende (vereenvoudigde en abstracte) structuur geven: NP 2 de N’ 2 blauwe bal (210) (i) (ii)
Geef voor iedere knoop aan wat het type ervan is Welk probleem ontstaat er wanneer we een compositionele semantische analyse willen geven van deze NP?
(iii)
Je kunt dit probleem oplossen door van één terminale knoop het type te veranderen. Om welke knoop gaat het en wat is het nieuwe type?
De idee is dat adjectieven functies zijn, die een verzameling van individuen nemen (bv. de verzameling van ballen) en die afbeelden op een andere verzameling van individuen (bv. de blauwe ballen). Concreet ziet de functie van het adjectief blauw er uit als volgt: (211) 〚 blauw 〛 = f : {g : g is een functie van D naar {0, 1}} → {h : h is een functie van D naar {0, 1}} zodanig dat voor alle g ∈ D⟨e,t⟩ geldt dat f(g)=h zodanig dat voor alle x ∈ D geldt dat h(x) = 1 asa g(x) = 1 en x is blauw.
76
De verzameling van individuen die blauwe bal denoteert zijn met ander woorden de individuen bal zijn en die blauw zijn. In verzamelingstermen is dit de doorsnede van de verzameling 〚 bal 〛 en de verzameling 〚 blauw 〛. Een minder aantrekkelijk aspect van deze analyse in (210)(iii) is dat predicatief en attributief gebruikte adjectieven nu verschillende types hebben. In een zin als (212) denoteert het adjectief immers een ander soort van functie: (212) Deze bal is blauw. (213) Formuleer deze functie. 〚 blauw 〛 = f :
Een oplossing voor dit probleem die is voorgesteld in de literatuur (Montague 1970; Kamp 1975) is de volgende. Beschouw de volgende zin: (214) Deze bal is een blauw ding. Deze zin heeft dezelfde betekenis als die in (212), d.w.z. beide zinnen hebben dezelfde waarheidsvoorwaarde. We zouden nu kunnen zeggen dat (212) in feite elliptisch is voor (214). (215) Hoe lost dat het probleem op van (210)?
Een bijkomend voordeel van de analyse is dat ze kan uitleggen waarom een zin als (216) volgens onze intuïties niet noodzakelijk waar is. (216) Elke grote mier is groot. Volgens de functiedenotaties van attributief en predicatief gebruikte adjectieven die we hierboven gedefinieerd hebben, is de denotatie van grote mier de doorsnede van de verzameling van de mieren en de verzameling van de grote individuen; de denotatie van groot in het gezegde is de verzameling van de grote dingen. Met andere woorden, de denotatie van het onderwerp is een deelverzameling van de denotatie van het gezegde, en dus
77
zal de zin altijd de waarheidswaarde 1 opleveren. Dat blijkt duidelijk uit de klassieke predicaatlogische vertaling van (216): (217) (∀x) ((M(x) & G(x)) → G(x)) Maar (216) is helemaal geen noodzakelijke of logische waarheid. Onder de analyse van predicatieve adjectieven zoals hierboven voorgesteld ontstaat dit probleem, tenminste op het eerste gezicht, niet. Dit is omdat (216) elliptisch is voor: (218) Elke grote mier is een groot ding. Het is duidelijk dat deze zin ook geen noodzakelijke waarheid is. Dat is een welkom gegeven, want deze zin ligt volgens de elliptische analyse ten grondslag aan (216). Op het tweede gezicht komt het probleem toch weer opduiken, omdat dat grote mieren een deelverzameling zijn van de grote dingen. (219)
(∀x) ((M(x) & G(x)) → (D(x) & G(x))
In de mate dat de mieren een deelverzameling zijn van de dingen (en dat lijkt cruciaal voor de elliptische analyse), zal D(x) steeds waar zijn als M(x) waar is, en zal de formule in (219) steeds waar zijn. De discussie wijst op een belangrijke eigenschap van een bepaalde klasse van adjectieven, nl. dat ze contextgevoelig zijn: voor het bepalen of iets tot hun extensie behoort gebruiken we een norm of standaard van vergelijking, en deze standaard is afhankelijk van de context. Zo is een grote mier iets anders dan een grote olifant: als we spreken van een grote mier vergelijken we haar met andere mieren, niet met olifanten, want in die vergelijking is de mier altijd klein. Net zo is een grote olifant groot in de vergelijking met andere olifanten, maar niet met de Mount Everest. Een zin als (218) is dus niet noodzakelijk waar, en wel omdat omdat groot in het subject iets anders betekent dan groot in het gezegde: in het subject betekent het iets als groot, vergeleken met andere mieren, in het gezegde iets als groot, in vergelijking met andere dingen. Op die manier bekeken is het duidelijk dat (219) niet noodzakelijk waar hoeft te zijn: iets kan in de extensie zitten van grote mier maar niet in die van groot ding. We zouden dat enigszins informeel als volgt kunnen weergeven: (220) (∀x) ((M(x) & G(x)) → (D(x) & G’(x)) Gegeven dat G(x) en G’(x) verschillende predicaten bevatten, hoeven ze niet steeds dezelfde waarheidswaarde te hebben voor dezelfde x. Daardoor kan (220) als waarheidswaarde 0 hebben.
78
(221) Ken waarheidswaarden toe aan M(x), G(x), D(x) en G’(x) zodanig dat die een waarheidswaarde 0 opleveren voor de complexe formule. (∀x) ((M(x) & G(x)) → (D(x) & G’(x))
We gaan hier niet verder in op de problematiek van de contextgevoeligheid van bepaalde predicaten, omdat het formaliseren van deze notie ons te ver zou leiden.
4.2.3. Individuele concepten Er is een soort van eigennaam die niet op evidente wijze als een individu op te vatten is, en die Montague met de benaming ‘individueel concept’ heeft bedacht. Het gaat om uitdrukkingen zoals Miss België. Beschouw de volgende voorbeelden: (222) a. b.
Yvette Aelbrecht moet mooi zijn. Miss België moet mooi zijn.
We kunen met enige zekerheid stellen dat (222b) een ware zin is, maar dat zoiets veel minder zeker is voor (222a). Gegeven dat Yvette Aelbrecht de Miss België was in 1976, was de zin wellicht waar in 1976, maar niet noodzakelijk vandaag. Anders gesteld, (222b) is waar in elke mogelijke wereld en tijd, en (222a) niet. Het verschil wordt nog duidelijker gemaakt in het volgende voorbeeld: (223) Miss België wordt elk jaar groter. Voor zover deze zin betrekking heeft op Yvette Aelbrecht, de Miss België uit 1976, lijkt hij onwaar. Maar als een uitspraak over de opeenvolgende Miss Belgiës zou hij best wel eens waar kunnen zijn. Het lijkt erop dat een DP een individu kan denoteren (zoals Yvette Aelbrecht), maar ook een beschrijving kan zijn van iets anders, zoals Miss België. Dat laatste is wat Montague een individueel concept noemt. Men zou individuele concepten kunnen opvatten als intensionele entiteiten, d.w.z. uitdrukkingen die in eerste instantie een sense hebben eerder dan een reference. Montague geeft echter ook een extensionele invulling aan individuele concepten, door ze op te vatten als functies van situaties naar individuen. In het concrete voorbeeld van Miss België kunnen we die functie voorstellen als in (224) (waarbij de jaartallen staan voor de relevante situatie): (224) 〚Miss België〛= {⟨1929, Jenny Vanparays⟩, ⟨1930, Netta Duchâteau⟩, ⟨1931, Suzanne Daudin⟩, ⟨1932, Simone Eraerts⟩, ⟨1933, Georgette Casteels⟩, ⟨1934,
79
Nadia Benedetti⟩, ⟨1936, Laure Torfs⟩, ⟨1937, Josée Decœur⟩, ⟨1938, Mary van Leda⟩, ⟨1939, Gilberte de Somme⟩, ⟨1946, Ludovica Bil⟩, ⟨1947, Yvette Draux⟩, ⟨1948, Lucienne Van de Weghe⟩, ⟨1949, Andréa Bouillon⟩, ⟨1950, Nicole Poncelet⟩, ⟨1951, Lucienne Zadworny⟩, ⟨1952, Anne-Marie Pauwels⟩, ⟨1953, Sépia Degehet ⟩, ⟨1954, Nelly Dehem⟩, ⟨1955, Rosette Ghislain⟩, ⟨1956, Madeleine Hotelet⟩, ⟨1957, Jeanne Chandelle⟩, ⟨1958, Michèle Goethals⟩, ⟨1959, Diane Hidalgo⟩, ⟨1960, Huberte Box⟩, ⟨1961, Jacqueline Oroi⟩, ⟨1962, Christine Delit⟩, ⟨1963, Irène Godin⟩, ⟨1964, Danièle Defrère⟩, ⟨1965, Lucy Nossent⟩, ⟨1966, Mireille De Man⟩, ⟨1967, Mauricette Sironval⟩, ⟨1968, Sonia Doumen⟩, ⟨1969, Maude Alin⟩, ⟨1970, Francine Paul-Martin⟩, ⟨1971, Martine De Herdt⟩, ⟨1972, Anne-Marie Roger⟩, ⟨1973, Chris Devisch⟩, ⟨1974, Anne-Marie Sikorsky⟩, ⟨1975, Christine Delmelle⟩, ⟨1976, Yvette Aelbrecht⟩, ⟨1977, Claudine Vasseur,⟩, ⟨1978, Maggy Moreau⟩, ⟨1979, Christine Cailliau⟩, ⟨1980, Brigitte Billen⟩, ⟨1981, Dominique Van Eeckhoudt⟩, ⟨1982, Marie-Pierre Lemaitre⟩, ⟨1983, Francoise Bostoen⟩, ⟨1984, Brigitte Muyshondt⟩, ⟨1985, An Van Den Broeck⟩, ⟨1986, Goedele Liekens⟩, ⟨1987, Lynn Wesenbeek⟩, ⟨1988, Daisy Van Cauwenbergh⟩, ⟨1989, Anne De Baetzelier⟩, ⟨1990, Katia Alens⟩, ⟨1991, Anke Vandermeersch⟩, ⟨1992, Sandra Joine⟩, ⟨1993, Stéphanie Meire⟩, ⟨1994, Ilse De Meulemeester⟩, ⟨1995, Véronique De Kock⟩, ⟨1996, Laurence Borremans⟩, ⟨1997, Sandrine Corman⟩, ⟨1998, Tanja Dexters⟩, ⟨1999, Brigitta Callens⟩, ⟨2000, Joke Van De Velde⟩, ⟨2001, Dina Tersago⟩, ⟨2002, Ann Van Elsen⟩, ⟨2003, Julie Taton⟩, ⟨2004, Ellen Petri⟩, ⟨2005, Tatiana Silva⟩, ⟨2006, Virginie Claes⟩, ⟨2007, Annelien Coorevits⟩, ⟨2008, Alizée Poulicek⟩, ⟨2009, Zeynep Sever⟩, ⟨2010, Cilou Annys⟩, ⟨2011, Justine De Jonckheere⟩, ⟨2012, Laura Beyne⟩, ⟨2013, Noémie Happart⟩} In de theorie van de types zoals we die eerder besproken hebben ontbreekt een type om dergelijke functies weer te geven. We voegen daarom een nieuw type toe, s, dat staat voor situaties. In termen van een concept dat we eerder introduceerden, zijn situaties op te vatten als paren van werelden en tijden. We passen onze regels voor wat welgevormde types zijn (zie (209) boven) aan als volgt: (225) Semantische types (i) e en t zijn semantische types (ii) Als α en β semantische types zijn, dan is ⟨α,β⟩ een semantisch type. (iii) Als α een semantische type is, dan is ⟨s, α⟩ een semantisch type. (iv) Er bestaan geen andere semantische types.
80
(226) Wat is het type van een individueel concept?
(227) De regel (iii) in (225) laat de volgende types toe. Probeer je voor elk ervan iets voor te stellen. (i)
⟨s, t⟩
(ii)
⟨s,⟨e,t⟩⟩
4.2.4. Gebeurtenissen Een andere uitbreiding van onze inventaris van types betreft gebeurtenissen. De filosoof Donald Davidson heeft erop gewezen dat er een probleem is met de compositionele interpretatie van de predicaatlogische vertaling van zinnen als in (228): (228) a. b. c. d.
Jones boterde de toast. Jones boterde de toast in de badkamer. Jones boterde de toast in de badkamer met een mes. Jones boterde de toast in de badkamer met een mes om middernacht.
Een eenvoudige predicaatlogische vertaling van (228a) die aansluit bij wat we eerder gezien hebben is die in (229) (we gaan er voor het gemak even van uit dat de toast een constante denoteert, omdat dit niet relevant is voor het probleem in kwestie): (229) B(j,t) Het probleem ontstaat wanneer we kijken naar (228b-d). Deze zinnen zijn duidelijk verwant met (228a), en het probleem is hoe we die verwantschap formeel precies tot uitdrukking moeten brengen. We zouden kunnen zeggen dat in (228b) boteren een drieplaatsig predicaat is, met een subject, een object en een locatie, zoals weergegeven in (230a). Dezelfde redenering volgend zou boteren in (228c) een vierplaatsige relatie denoteren tussen een subject, een object, een locatie en een instrument. In (228d) zou het gaan om een vijfplaatsig predicaat (subject, object, locatie, instrument, tijd).
81
(230) a. b. c.
C(j, t, b) D(j, t, b, k) E(j, t, b, k, m)
Merk op dat we in elk van deze gevallen een verschillende predicaatsletter gebruikt hebben: de ariteit van het predicaat is immers telkens verschillend, dus gaat het om verschillende predicaten. Deze benadering heeft twee belangrijke nadelen. De eerste is dat het werkwoord boteren viervoudig ambigu zou zijn: het zou namelijk elk van de predicaten in (229) en (230) kunnen representeren. Een ernstiger probleem is dat er bepaalde logische relaties gelden tussen de zinnen van (228): als (228d) waar is, dan zijn (228a-b-c) ook noodzakelijk waar. En als (228c) waar is, dan zijn ook (228a-b) waar, enz. Er gelden met andere woorden implicationele relaties, als volgt: (231) (228d) → (228c) → (228b) → (228a) Wanneer we echter de representaties aannemen in (230), dan hebben we geen manier om deze implicaties af te leiden: kijkend naar (230) is er geen reden waarom (230a) uit (230b) zou moeten volgen, enz. Dat is duidelijk een tekort van deze weergave: we willen dat uit onze formele semantiek de logische relaties in (231) af te leiden zijn. Davidson stelt voor dat boteren een drieplaatsig predicaat is, dat een relatie denoteert tussen een gebeurtenis, een subject en een object. In verzamelingsterminologie uitgedrukt denoteert het predicaat boteren een verzameling van geordende trio’s, als volgt: (232) 〚B〛= {⟨x, y, z⟩: x is een gebeurtenis van boteren van z door y} Een volgende stap in de redenering betreft de weergave van de prepositionele modificeerders in (228). Eerder dan deze als termen te zien van predicaten, stelt Davidson voor om preposities op te vatten als tweeplaatsige predicaten. Stellen we de verschillende preposities in (228) voor door de predicaatsletters I, O en M, dan ziet dat er uit als in (233): (233) a. b. c.
〚I〛= {⟨x, y⟩: x is een gebeurtenis in y} 〚M〛= {⟨x, y⟩: x is een gebeurtenis met y} 〚O〛= {⟨x, y⟩: x is een gebeurtenis om y}
De gehele PP in de badkamer denoteert zo bv. alle gebeurtenissen die plaatsvinden in de badkamer. (234) 〚[PP in de badkamer]〛= {x : x is een gebeurtenis in de badkamer}
82
We kunnen nu de zinnen van (228) weergeven als volgt: (235) a. b. c. d.
(∃x) B(x,j,t) (∃x) (B(x,j,t) & I(x,b)) (∃x) (B(x,j,t) & I(x,b) & M(x,k)) (∃x) (B(x,j,t) & I(x,b) & M(x,k) & O(x,m))
De formule in (235a) lezen we als: ‘Er is een gebeurtenis x zodanig dat x een gebeurtenis is van boteren van de toast door Jones’. Op analoge wijze lezen we (235b): ‘Er is een gebeurtenis x zodanig dat x een gebeurtenis is van boteren van de toast door Jones, en x is een gebeurtenis in de badkamer’. Het voordeel van deze benadering is dat de implicaties in (231) op eenvoudige wijze af te leiden zijn: logisch gezien volgt (235a) uit (235b), en (235b) uit (235c), enz. Het is immers zo dat als (∃x) (φ & Ψ) waar is, altijd automatisch ook altijd (∃x) φ waar is. Omgekeerd worden implicaties die niet geldig zijn evenmin voorspeld door de representaties in (235). Kijken we bv. naar de zinnen in (236): (236) a. b. c.
Jones boterde de toast in de badkamer. Jones boterde de toast met een mes Jones boterde de toast in de badkamer met een mes.
Uit de waarheid van (236a) en (236b) kunnen we niet concluderen dat (236c) ook waar is. In de formalisering die we gegeven hebben is dit eenvoudig af te leiden: immers, de waarheid van ((∃x) A(x) & (∃y) B(y)) leidt niet tot de waarheid van (∃x) (A(x) & B(x)). Een ander domein waar variabelen voor gebeurtenissen een nuttige rol kunnen spelen is om het betekenisverschil tussen distributieve en collectieve lezingen weer te geven. Beschouw het volgende voorbeeld: (237) De kinderen verplaatsten de piano. In de collectieve lezing is er één gebeurtenis van verplaatsen van de piano, waaraan elk kind deelnam. In de distributieve lezing zijn er meerdere gebeurtenissen van pianoverplaatsing, mogelijk een verschillende voor elk kind. Dit betekenisverschil kunnen we netjes weergeven doordat in de gebeurtenisweergave een existentiële kwantor zit, die wijd of eng bereik kan nemen ten opzichte van de universele kwantor van het subject. Dat ziet er concreet zo uit: (238) a. b.
(∀y) (K(y) → (∃x) V(x,y,p)) (∃x) ((∀y) (K(y) → V(x,y,p)))
83
Merk op dat representaties met een variabele die staat voor een gebeurtenis zoals we die gegeven hebben in (235) niet de introductie van een nieuw type vereisen. Gebeurtenissen zijn immers entiteiten (van het type e) zoals andere (die we tot dusver individuen genoemd hebben). Als dusdanig behoren ze tot het gespreksdomein De. Wel is het zo dat we dat gespreksdomein uitbreiden met een bijzondere soort van entiteiten, die we gebeurtenissen noemen. (239) Wat is, in het licht van het bovenstaande, het type van het werkwoord boteren? Welke gevolgen heeft dit voor de syntaxis?
4.2.5. Type-gestuurde interpretatie en onwelgevormdheid Tot slot van deze sectie willen we nog een belangrijk pluspunt bespreken van de theorie die we tot dusver hebben opgebouwd. We vertrekken daarbij van de zinnen in (240). (240) a. b.
*Jan slaapt Piet. *Piet begrijpt.
In de cursus syntaxis hebben we gezien dat de ongrammaticaliteit van deze zinnen te wijten is aan het Theta-Criterium. (241) Theta-Criterium (i) Elke θ-rol wordt aan precies één argument toegekend. (ii) Elk argument krijgt precies één θ-rol. (242) Leg uit hoe het Theta-criterium geschonden is in de voorbeelden in (240).
In het licht van de semantische theorie die we opgebouwd hebben, is er echter een andere manier om de onwelgevormdheid van deze zinnen te verklaren. Laten we beginnen met het voorbeeld in (240a). Daarvan kunnen we de structuur als volgt weergeven:
84
S
(243) NP Jan
VP V slaapt
NP Piet
Laten we nu stap voor stap een compositionele semantische analyse geven van dit voorbeeld, gebaseerd op de semantische types van de knopen die in de boom voorkomen. Slaapt is een intransitief werkwoord, en heeft dus als type ⟨e,t⟩. De NP Piet verwijst naar een individu en is dus van type e. Deze twee elementen kunnen perfect door functionele applicatie samengenomen worden, en die leveren dan als type voor de VP-knoop t op: een functie van De naar Dt (= de denotatie van het werkwoord slaapt) toegepast op een element van De (= de denotatie van de NP Piet) levert een element van Dt (= een waarheidswaarde) op. Op dit moment ontstaat er echter een probleem: de VP is op haar beurt dochter van de vertakkende knoop S, die als andere dochter de NP Jan heeft. Die NP is van type e. De VP in dit voorbeeld is van type t. Aangezien geen beide types een functie is die de andere als argument kan nemen, kunnen de denotaties van deze twee knopen niet door functionele applicatie worden samengenomen, en aangezien we ervan uitgaan dat functionele applicatie de enige manier is om vertakkende knopen te analyseren, stuit onze semantische analyse hier op een onoplosbaar geval van type mismatch: de types van twee zusterknopen zijn niet van dien aard dat we ze kunnen samenvoegen. Met andere woorden, de zin Jan slaapt Piet is ongrammaticaal omdat hij niet compositioneel semantisch kan geanalyseerd worden. Nog anders uitgedrukt, de rol van het Theta-Criterium wordt hier overgenomen door onze semantische theorie. Laat zien dat ook de onwelgevormdheid van het voorbeeld in (240b) volgt uit onze theorie, en dat we dus ook daar het Theta-Criterium eigenlijk niet nodig hebben.
85
Tot nu toe lijken de twee analyses van de zinnen in (240) (i.e. de analyse in termen van het Theta-Criterium en de semantische analyse) notationele varianten van elkaar. Dat betekent dat deze twee analyses precies hetzelfde zeggen, maar op een andere manier of met een andere terminologie. Bijvoorbeeld, over een intransitief werkwoord zegt de Theta-theorie dat dat zijn enige theta-rol moet uitdelen aan precies één argument, terwijl wij over dergelijke werkwoorden zeggen dat ze van type ⟨e,t⟩ zijn en dat er dus precies één element van type e moet worden aan toegevoegd om tot een zin te komen. Er is echter een belangrijk verschil tussen de twee theorieën. De semantische theorie zegt immers niet specifiek dat een element van type ⟨e,t⟩ moet worden gecombineerd met een element van type e opdat de zin welgevormd zou zijn. Het enige wat de theorie zegt is dat iedere vertakkende knoop een geval van functionele applicatie moet zijn. En aangezien we weten dat functies ook argumenten kunnen zijn van andere functies (cf. hier onder, oefeningen (269) en (271) van sectie 4.3), betekent dat dat er niet voor ieder element van het type ⟨e,t⟩ noodzakelijkerwijs ook een bijpassend element van type e moet zijn. Samenvattend kunnen we stellen dat de semantische theorie die we tot dusver hebben opgebouwd, in staat is om een verklaring te bieden voor een aantal syntactische principes, zoals het Theta-Criterium (en ook een deel van het Projectieprincipe).
4.3.
λ-conversie met types
Eerder hebben we gezien hoe de predicatenlogica uitgebreid kan worden met het mechanisme van λ-conversie. Dit deden we door de regel in (244) aan de syntaxis van de predicatenlogica toe te voegen. (244) Als φ een formule is en x is een variabele, dan is λx[φ] een predicaat. Iets analoogs kunnen we doen voor functies, en in het bijzonder door gebruik te maken van types als een manier om functies weer te geven. Dit ziet er uit als volgt (waarbij L verwijst naar de syntaxis van een taal L): (245) Als φ een expressie is van type α in een taal L, en x is een variabele van type β, dan is λx[φ] een expressie van type ⟨β,α⟩ in L. Merk op dat (245) algemener is dan (244): in (244) is de enig mogelijke output van λconversie een predicaat, d.w.z. iets het type ⟨e,t⟩. In (245) is dat maar een van de mogelijkheden. Het geval waarbij de output van λ-conversie een predicaat is, wordt geïllustreerd in (246): α is van het type t en de variabele van het type e, zodat λx[φ] van het type ⟨e,t⟩ is.
86
(246) λ x e
[R(x)] t
is van het type ⟨e,t⟩
Maar er zijn nog andere mogelijkheden. (247) Wat is volgens (245) het type van de onderstaande expressies? a. λx[~A(x) & Z(x)] is van het type b.
λx[x]
is van het type
c.
λp[~p]
is van het type
d.
λx [λy[H(y,x) & Z(y,x)]]
is van het type
Merk op dat het type van een eenvoudig predicaat R hetzelfde is als dat van de complexere λformule λx[R(x)]. Men kan zich afvragen wat het nut is van het gebruik van de complexere formule. Het voordeel hiervan is dat we de Booleaanse propositionele operatoren (d.w.z. ~, &, ∨, →, ↔), die normaal alleen toegepast kunnen worden op proposities, kunnen toepassen op predicaten, d.w.z. we kunnen een predicaat negatief maken, of twee predicaten combineren d.m.v. conjunctie of disjunctie. De problematiek van het combineren van twee predicaten (of eigenschappen, zoals acteren en zingen) hebben we eerder al geïllustreerd bij de introductie van het mechanisme van λ-conversie in 2.4 hierboven. Ter opfrissing kan je de opdracht in (248) maken. (248) Vertaal de onderstaande complexe predicaten in het formalisme van de predicatenlogica door gebruik te maken van λ-conversie. (i) arm maar proper
(ii) van Madonna houden of Lady Gaga haten
In deze sectie blijven we wat uitgebreider stilstaan bij de problematiek van negatie.
87
(249) Vergelijk de volgende twee voorbeelden: a. Jan slaapt. b. Jan slaapt niet.
Stel dat de structuur van de tweede zin er als volgt uitziet: S S
niet
(i)
NP VP slaapt type van niet in deze zin? Wat isJan het semantische
(ii)
Geef de volledige denotatie van niet:
〚 niet 〛=
De semantiek van niet is in deze optiek relatief eenvoudig. Het probleem zit hem in de syntaxis die we hebben aangenomen: de positie helemaal bovenaan in de zin, geadjungeerd aan S, correspondeert helemaal niet met de positie waar we negatie in natuurlijke taal typisch aantreffen. Dat blijkt al meteen als we dezelfde negatieve zin bijzinsvolgorde meegeven, zoals in (250), of als we naar de Engelse tegenhanger kijken, of naar een Franse zin met een lijdend voorwerp: (250) a. b. (251) a. b. (252) a. b.
(Ik denk dat) [S Jan niet [VP slaapt]] *(Ik denk dat) [S [S Jan [VP slaapt]] niet] [S John doesn’t [VP sleep]] *[S [S John (does) [VP sleep(s)] not] [S Jean n’invite pas [VP tV Pierre]]. *[S [S Jean n’invite [VP tV Pierre] pas]
Het lijkt er op dat negatie ergens dieper in de structuur moet zitten, bv. geadjungeerd aan VP, of in ieder geval ergens tussen het subject en de VP, zoals in de a-zinnen. Op basis van de structuur in (249) zouden we verwachten dat niet en zijn tegenhangers voor zouden komen als eerste of laatste woord in de zin, maar dat is haast nooit het geval, zoals de b-zinnen aantonen. In een hoofdzin als Jan slaapt niet lijkt niet weliswaar het laatste woord van de zin
88
te zijn, maar daar nemen we aan dat dit het gevolg is van verplaatsing van het onderwerp en het werkwoord naar boven, terwijl niet wel degelijk lager in de structuur zit. In natuurlijke taal hebben we typisch te maken met negatie op het niveau van het predicaat (predicaatsnegatie), eerder dan op het niveau van de zin (zinsnegatie). In de logica daarentegen is negatie typisch een propositionele operator, die op het niveau van de propositie werkt. De λ-calculus biedt de mogelijkheid om negatieve predicaten te maken, en dus de syntactische positie van negatie als geadjungeerd aan een predicaat te verzoenen met een compositionele semantische analyse. Een voorbeeld kan dit verduidelijken. Stel dat het predicaat A de verzameling van aardige individuen denoteert, en dat we de verzameling van niet-aardige individuen willen aanduiden (of de eigenschap niet-aardig). Dat kunnen we niet doen door simpele toepassing van de propositionele operator ~ op het predicaat, wat ~A op zou leveren, de verzameling van individuen die niet A zijn. De reden hiervoor ligt in de syntaxis van de predicatenlogica, waar er niet zoiets bestaat als een negatief predicaat, d.w.z. dat in de formule ~A(x) de negatie noodzakelijk zinsnegatie is, die bereik heeft over de formule A(x). Ook de semantiek van niet als een functie van waarheidswaarden naar waarheidswaarden vereist dat negatie een waarheidswaarde als argument neemt. Daardoor kan de negatie niet een predicaat als argument nemen, omdat een predicaat geen waarheidswaarden denoteert (maar een verzameling individuen). Het probleem kan opgelost worden, om te beginnen door het predicaat te voorzien van een term x. A(x) heeft als denotatie een waarheidswaarde, wat de formule ~A(x) zowel syntactisch als semantisch welgevormd maakt. Natuurlijk denoteert de formule ~A(x) niet langer een verzameling van individuen, maar wel een waarheidswaarde (d.w.z. de propositie ‘het is niet het geval dat x A is’, of ook ‘x is niet A’, eerder dan ‘de verzameling van individuen die niet A zijn’). Door toepassing van λ-conversie kunnen we echter van deze propositie weer een predicaat maken: λx[~A(x)]. Dit predicaat heeft de denotatie waar we naar op zoek waren, met name de verzameling van individuen die niet A zijn. De opeenvolgende stappen en de types die er bij horen worden opgesomd in (253): (253) a. b. c. d.
A A(x) ~A(x) λx[~A(x)]
⟨e,t⟩ t t ⟨e,t⟩
Voor de volledigheid voegen we hier nog aan toe dat het λ-predicaat in (253d) vervolgens voorzien moet worden van een term, waardoor het een formule wordt van type t. In termen van onze eerdere discussie is dit een geval van functionele applicatie, d.w.z. het toepassen
89
van het predicaat op zijn argument. Door het toepassen van λ-conversie in de omgekeerde richting krijgen we weer een eenvoudige predicaatlogische formule als in (254b). (254) a. b.
λx[~A(x)](j) t ~A(j) t
(functionele applicatie) (λ-conversie)
Hiermee hebben we een begin gemaakt van een compositionele semantische analyse van niet in natuurlijke taal als predicaatsnegatie. Dat blijkt als we het bovenstaande in een boom weergeven (we negeren de rol van het koppelwerkwoord is, waarvan we voor het gemak even aannemen dat het geen semantische bijdrage levert, en vervangen de predicaatsletters voor de duidelijkheid door ‘lange versies’: A(s) wordt dus aardig(s)). (255)
t ~aardig(s) Socrates is niet aardig
e s Socrates
⟨e,t⟩ λx[~aardig(x)] niet aardig
? ? niet
⟨e,t⟩ aardig aardig
Een vooralsnog onbeantwoorde vraag is wat het type is van niet in deze structuur, en welke λformule we moeten schrijven op de plaats van het vraagteken. Het antwoord op de eerste vraag is eenvoudig: in de boom in (255) moet niet van het type ⟨⟨e,t⟩,⟨e,t⟩⟩ zijn (wat dus een heel ander type is dan dat van de logische operator ~, dat ⟨t,t⟩ is). Het antwoord op de tweede vraag ligt iets minder voor de hand. Om te zien hoe we tewerk gaan, beginnen we met de laatste stap (253) van te herhalen (met de lange versie van het predicaat): (256) λx[~aardig(x)] Hierop passen we nogmaals λ-conversie toe, maar nu door het predicaat aardig te vervangen door een predicaatsvariabele P, en deze predicaatsvariabele te laten binden door een λoperator van hetzelfde type: (257) λP[λx[~P(x)]]
90
Volgens de definitie in (245) hierboven is deze expressie er een van het type ⟨⟨e,t⟩,⟨e,t⟩⟩: enerzijds is P van het type ⟨e,t⟩, en anderzijds is de eerdere formule [λx[~P(x)]] ook van het type ⟨e,t⟩. Dit is precies het type wat we nodig hadden. In een boom weergegeven ziet dat er uit als volgt: (258)
t ~aardig(s) Socrates is niet aardig
e s Socrates
⟨e,t⟩ λx[~aardig(x)] niet aardig
⟨⟨e,t⟩,⟨e,t⟩⟩ λP[λx[~P(x)]] niet
⟨e,t⟩ aardig aardig
Door functionele applicatie op het laagste niveau wordt de functie van niet toegepast op zijn argument, waarna λ-conversie een lambda elimineert: (259) a. b.
λP[λx[~P(x)]](aardig) ⟨e,t⟩ λx[~aardig(x)] ⟨e,t⟩
(functionele applicatie) (λ-conversie)
Het voordeel van deze werkwijze is dat ze op elk soort van predicaat van toepassing is: zowel eenplaatsige predicaten zoals aardig, als meerplaatsige predicaten zoals zien. Om dat laatste te illustreren gaan we eerst even nader in op de λ-notatie van transitieve werkwoorden. We hebben gezien dat het semantisch type van een transitief werkwoord ⟨e,⟨e,t⟩⟩ is. Hoe kunnen we dit type in de λ-notatie weergeven? We vertrekken zoals hierboven van een predicaatlogische formule: zien(x,y). Deze geeft goed aan dat zien een transitief werkwoord (of tweeplaatsig predicaat) is, maar ze is wel van het verkeerde type om de denotatie van het transitieve werkwoord zien weer te geven (t i.p.v. ⟨e,⟨e,t⟩⟩). Door λ-conversie twee keer toe te passen maken we van deze formule er eentje van het juiste type. (260) a. b. c.
zien(x,y) λx[zien(x,y)] λy[λx[zien(x,y)]]
t ⟨e,t⟩ ⟨e,⟨e,t⟩⟩
91
Als we nu dit transitieve werkwoord combineren met zijn object om een VP te maken, dan passen we functionele applicatie toe. In een zin als Laura ziet Karel komt dit er op neer dat we de functie (260c) toepassen op het individu Karel, zoals weergegeven in (261a). Vervolgens passen we weer λ-conversie toe, maar nu in omgekeerde richting, waardoor er een λ verdwijnt en de variabele y die ermee correspondeert vervangen wordt door het argument k. (261) a. b.
λy[λx[zien(x,y)]](k) ⟨e,t⟩ λx[zien(x,k)] ⟨e,t⟩
(functionele applicatie) (λ-conversie)
In een boom ziet dat er zo uit: (262)
⟨e,t⟩ λx[ziet(x,k)] ziet Karel
⟨e,⟨e,t⟩⟩ e λy[λx[zien(x,y)]] k ziet Karel De volgende stap bestaat erin dat de VP combineert met het subject om de zin te vormen. Ook dit gebeurt door opeenvolgend functionele applicatie en λ-conversie toe te passen: (263)
t ziet(l,k) Laura ziet Karel
e l Laura
⟨e,t⟩ λx[ziet(x,k)] ziet Karel
⟨e,⟨e,t⟩⟩ λy[λx[zien(x,y)]]
e
k ziet
Karel
92
Zo kan door gebruik te maken van λ-conversie in een boom een volledig expliciete en precieze weergave gegeven worden van de betekenis van elke knoop, en van de manier waarop twee zusterknopen combineren door functionele applicatie. Tot slot keren we nog even terug op de predicaatsnegatie van natuurlijke taal. We gaan er daarbij van uit dat de positie van negatie er een is tussen VP en het subject, zoals betoogd naar aanleiding van de zinnen (250)-(252) hierboven. (264) [S Laura [VP niet [VP ziet Karel ]]] Het is duidelijk dat (264) geen goede woordvolgorde oplevert, noch als hoofdzin, noch als bijzin. Dit komt omdat verschillende verplaatsingsregels (van zowel het werkwoord, het onderwerp als het lijdend voorwerp) de woordvolgorde van (264) nog veranderen. De details hiervan uitspellen zou ons in dit bestek echter te ver voeren. Belangrijk is dat de negatie in (264) een modificeerder is van het predicaat VP, wat in ieder geval vanuit de syntaxis bekeken een betere zet is dan geadjungeerd aan S zoals in (249) hierboven. In een boom ziet de (gedeeltelijke) compositionele semantische analyse van (264) er uit als volgt: (265)
⟨e,t⟩ λx~[ziet(x,k)] ziet Karel niet 3 ⟨⟨e,t⟩,⟨e,t⟩⟩ ⟨e,t⟩ λP[λx[~P(x)]] λx[ziet(x,k)] niet ziet Karel 3 ⟨e,⟨e,t⟩⟩ e λy[λx[zien(x,y)]] k ziet Karel
Tot slot formuleren we een regel voor de semantische interpretatie van een λ-formule in functietermen: (266) Als φ een formule is van type α en x een variabele van type β, dan is 〚λx[φ]〛b de functie f ∈ D⟨β,α⟩ zodanig dat voor alle d ∈ Dβ : f(d) =〚φ〛b[d/x] Dit is weer een heel brede formulering die op veel verschillende gevallen van toepassing is. Een concreet geval is er een waarbij φ een formule is van type t en x een variabele van type e. De denotatie van λx[φ] zal dan functie zijn van het type ⟨e,t⟩, d.w.z. een functie van individuen naar waarheidswaarden, of, anders gezegd, een verzameling van individuen. Deze verzameling wordt verkregen door de variabele x in φ te vervangen door elk individu in D. Alle individuen die φ waar maken zitten in de verzameling. Met andere woorden, (266) beschrijft de karakteristieke functie van deze verzameling van individuen.
93
4.4.
Oefeningen
(267) Verifieer dat de types die we hebben voorgesteld voor intransitieve, transitieve en ditransitieve werkwoorden welgevormd zijn volgens de definitie in (209).
(268) Schrijf bij iedere knoop in de volgende boomstructuur het juiste type: S 2 NP VP | 2 N’ V NP | | | N ziet N’ | | Laura N | Karel
(269) (i) (ii) (iii) (iv) (v) (vi) (vii)
Geef het semantische type van de volgende woorden: Louisa: werkt: hoort: groot: belooft: hond: de:
(270) Vul de volgende definitie aan (baseer je antwoord op de definitie in (207c)): D⟨ , ⟩ = { } α β
94
(271) Sommige woorden kunnen meer dan één semantisch type hebben, afhankelijk van de context waarin ze verschijnen. Bekijk bijvoorbeeld de volgende twee zinnen: a. b.
[S Jan slaapt] en [S Marie werkt] Jan [VP slaapt] en [VP werkt].
(i)
Teken een boomstructuur van deze twee zinnen. Zorg dat je bomen steeds binair vertakkend zijn.
(ii) (iii)
Zet bij alle knopen waarvan je het type al kent, het juiste type. Bepaal nu het type van en in (271a) en in (271b).
(iv)
Kan je ook een voorbeeld bedenken waarin het type van en ⟨e,⟨e,e⟩⟩ is?
(v)
het type van en is ⟨α, ⟨α, α⟩⟩. Leg uit.
95
(vi)
Denk aan de waarheidsvoorwaarde voor de Booleaanse operator &. Is deze in alle gevallen bruikbaar voor en als we daar het type ⟨α, ⟨α, α⟩⟩ aan toekennen?
(272) Teken een boom van de volgende zinnen naar het model van de boom in (252), d.w.z. met gebruikmaking van λ-formules. a.
Jennifer acteert en zingt.
b.
Amélie wast zich.
96
5. GEGENERALISEERDE KWANTOREN 5.1.
Inleiding
In dit hoofdstuk laten we zien dat de semantische theorie zoals we die tot nu toe hebben opgebouwd, in de problemen komt wanneer we naar gekwantificeerde NP’s kijken. Het is als volgt opgebouwd. In sectie 5.2 bespreken we de problemen die complexe NP’s met zich meebrengen. Om het overzichtelijk te houden, formuleren we die problemen in termen van verzamelingen, niet in termen van functies. Al deze kwesties kunnen echter probleemloos – dankzij het begrip karakteristieke functie – vertaald worden naar functiegerelateerde terminologie. In sectie 5.3 geven we de oplossing voor de problemen. Die zal erin bestaan dat we complexe NPs niet opvatten als individuen, maar als verzamelingen van eigenschappen. In sectie 5.4 zien we wat de consequentie is van deze opvatting voor het berekenen van waarheidswaarden van zinnen. Secties 5.5, 5.6, en 5.7 en bevatten verdere uitbreidingen op en toepassingen van de analyse.
5.2.
Problemen met NP-denotaties
In het bovenstaande zijn niet toevallig alle NP’s eigennamen. Dit is omdat traditioneel wordt aangenomen dat eigennamen geen interne structuur hebben, en direct verwijzen naar individuen. Eigennamen in natuurlijke taal zijn in die zin te vergelijken met de constanten van de predicatenlogica. Maar eigennamen zijn maar een kleine fractie van de mogelijke vormen die een NP kan aannemen: elke man, de koning van Frankrijk, deze hond, elke tijger die Miep gezien heeft, de meeste kinderen, wilde paarden, etc. Dergelijke gevallen vormen een grote uitdaging voor de formele semantiek zoals we die tot dusver geschetst hebben. 5.2.1. Kwantoren De vraag waar we ons hier mee bezig houden is wat de betekenis is van complexe NP’s zoals elke filosoof, een filosoof, geen filosoof. Het lijkt redelijk evident dat deze NPs geen individuen denoteren. (273) Veronderstel het gespreksdomein (56) en de regel (130) voor de interpretatie van zinnen, hier herhaald: (56) D = {Socrates, Aristoteles, Plato, Mozart, Beethoven, Callas, Fido, januari} (130) 〚[S NP VP]〛= 1 asa 〚NP〛∈〚VP〛, 0 in alle andere gevallen
97
Wat is een mogelijk, en misschien zelfs voor de hand liggend, antwoord op de vraag wat de denotatie is van de gekwantificeerde NP elke filosoof? 〚 elke filosoof〛= Bereken nu de waarheidswaarde van de zin 〚[S [NP Elke filosoof][VP zingt]] 〛door toepassing van de regel (130). Neem aan dat de denotatie van〚zingt〛is zoals hieronder aangegeven. Welk probleem ontstaat er? 〚zingt〛= { Socrates, Aristoteles, Plato} 〚[S [NP Elke filosoof][VP zingt]]〛= 1 asa
Bemerk dat in de verzamelingenleer de relatie “lid zijn van” niet transitief is: als a ∈ X en X ∈ Y, volgt daar niet uit dat a ∈ Y). Een voorbeeld kan helpen om dit te verduidelijken. Laat Y de verzameling zijn van alle verzamelingen met meer dan twee leden. (274) Hoe zou je deze verzameling voorstellen? Y=
Veronderstel verder dat X = {Socrates, Aristoteles, Fido}; hieruit volgt dat X ∈ Y, maar hoewel Socrates ∈ X is het niet zo dat Socrates ∈ Y, de verzameling van verzamelingen met meer dan twee leden: dat zou immers impliceren dat Socrates een verzameling is met meer dan twee leden, wat manifest niet het geval is. Ook voor het principe van de functionele applicatie is een denotatie van Elke filosoof zoals voorgesteld in (273) problematisch. Waarom?
Wat zou de denotatie kunnen zijn van [NP geen filosoof]? We zouden kunnen aannemen dat dit de lege verzameling is: (275) 〚 geen filosoof〛= ∅
98
(276) Bereken de waarheidswaarde van de zin 〚[NP Geen filosoof][VP zingt] 〛door toepassing van de regel (130). Neem aan dat de denotatie van〚zingt〛is zoals aangegeven. 〚zingt〛= {Callas, Mozart} 〚 geen filosoof zingt〛= 1 asa
Wat de denotatie zou kunnen zijn van [NP een filosoof] en [NP de filosoof] is minder duidelijk. (277) Waarom?
We zouden natuurlijk regel (130) kunnen aanpassen, en verschillende versies ontwerpen voor eigennamen en NP’s met kwantoren, maar het zal duidelijk zijn dat we dan een zekere algemeenheid in de wijze waarop semantische interpretatie verloopt moeten opgeven. 5.2.2. Kwantoren in de predicatenlogica Zoals we eerder al zagen worden zinnen met de universele of de existentiële kwantor in de predicatenlogica vertaald als volgt: (278) a. b.
Alle F zijn G: Sommige F zijn G:
(∀x) (F(x) → G(x)) (∃x) (F(x) & G(x))
Een dergelijke vertaling is geen vertaling waar de regel (130) of het beginsel van de functionele applicatie op van toepassing is. Op dit punt kunnen we twee dingen doen. We zouden kunnen concluderen dat in het geval van gekwantificeerde DPs er kennelijk andere regels werkzaam zijn. Deze regels zijn dan nog verschillend naargelang de kwantor waarom het gaat. De andere mogelijkheid bestaat erin dat we toch vasthouden aan (130) of functionele applicatie, en proberen om een analyse te ontwikkelen voor zinnen met kwantoren zodat ze er toch onder vallen. In wat volgt zullen we voor die tweede oplossing kiezen. Om duidelijk te maken waarom, moeten we nog een aantal problemen bespreken die ontstaan in de predicaatlogische behandeling van kwantoren.
99
5.2.3. Hogere ordekwantoren De twee kwantoren van de PC (∀en ∃) kunnen dienen ter formalisering van een aantal kwantorwoorden uit natuurlijke taal, zoals alle, iedereen, elke, sommige, enkele, enz. (279) Kan je nog andere woorden bedenken die een hoeveelheid aanduiden?
Beschouw een kwantor als de meeste. Naar het model van (67) hierboven zouden we een denotatie voor deze kwantor kunnen formuleren als volgt: (280) 〚(de meeste xn) φ〛M1, b1 = 1 asa voor meer dan de helft van d ∈ D, 〚φ〛M1, b1 [d/xn] = 1 Dit deel is onproblematisch. Maar vervolgens moeten we een correcte PC-vertaling krijgen van zinnen met deze kwantor. (281) Toon aan welke van de connectoren van PC de correcte betekenis geeft voor (i): (i) De meeste filosofen zijn aardig We gaan tewerk zoals in 2.3.4 hierboven. We gebruiken weer delen van model M1, met name het gespreksdomein D1 = {Socrates, Aristoteles, Plato, Mozart, Callas, Beethoven, Fido, januari} en de bedeling b1 zoals in (64). Ook de denotatie van het predicaat F blijft dezelfde: 〚F〛M1, b1 = {Socrates, Plato, Aristoteles} Wel zullen we in een aantal gevallen de denotatie van het andere eenplaatsige predicaat A wel veranderen. Als dat het geval is, spreken we van een ander model, wat aangegeven wordt door andere superscripten. Bij een andere superscript hoort in principe ook een gespreksdomein met een andere superscript, maar omdat we het gespreksdomein in het voorbeeld constant willen houden, geven we dat niet telkens expliciet aan. Ook hier laten we in de bijhorende tabellen omwille van de beknoptheid de superscripten achterwege. 1. Conjunctie Veronderstel 〚F〛M2, b2 = {Socrates, Plato, Aristoteles} 〚A〛M2, b2 = {Socrates, Plato, Mozart, Fido} Omdat 2/3 van de filosofen in de denotatie van〚A〛M2, b2 zit, is zin (i), volgens onze intuïties erover, waar. Ga na of onderstaande berekening ook dat resultaat oplevert. 〚(de meeste xn) (F(xn) & A(xn))〛M2, b2 = ?
100
〚F(x)〛 〚A(x)〛
〚F(x) & A(x)〛
〚(de meeste x) (F(x) & A(x))〛
s a p m c b f j 2. Disjunctie Veronderstel 〚A〛M3, b3 = {Mozart, Callas, Beethoven, Fido} 〚F〛M3, b3 = {Socrates, Plato, Aristoteles} Omdat er geen filosoof in de denotatie van〚A〛M3, b3 zit, is zin (i), volgens onze intuïties, onwaar. Ga na of onderstaande berekening ook dat resultaat oplevert. 〚(de meeste xn) (F(xn) ∨ A(xn))〛M3, b3 = ? 〚F(x)〛 〚A(x)〛
〚F(x) ∨ A(x)〛
s a p m c b f j
101
〚(de meeste x) (F(x) ∨ A(x))〛
3. Implicatie Veronderstel 〚A〛M3, b3 = {Mozart, Callas, Beethoven, Fido} 〚F〛M3, b3 = {Socrates, Plato, Aristoteles} Omdat er geen filosoof in de denotatie van〚A〛M3, b3 zit, is zin (i) onwaar volgens onze intuïties. Ga na of onderstaande berekening ook dat resultaat oplevert. 〚(de meeste xn) (F(xn) →A(xn))〛M3, b3 = ? 〚F(x)〛 〚A(x)〛
〚F(x) → A(x)〛
〚(de meeste x) (F(x) → A(x))〛
s a p m c b f j 4. Equivalentie Veronderstel 〚A〛M4, b4 = {Socrates, Fido} 〚F〛M4, b4 = {Socrates, Plato, Aristoteles} Omdat er slechts één filosoof op 3 in de denotatie van〚A〛M4, b4 zit, is zin (i) onwaar volgens onze intuïties. Ga na of onderstaande berekening ook dat resultaat oplevert. 〚(de meeste xn) (F(xn) ↔A(xn))〛M4, b4 = ? 〚F(x)〛 〚A(x)〛
〚F(x) ↔ A(x)〛
s a p m c b f j
102
〚(de meeste x) (F(x) ↔ A(x))〛
Veronderstel tot slot een ander model, waarbij〚A〛M5, b5 = {Socrates, Aristoteles, Mozart, Callas, Beethoven, Fido} (en de overige elementen van het model onveranderd blijven). In zulk een geval is de zin waar volgens onze intuïties. Ga na of onderstaande berekening ook dat resultaat oplevert. 〚F(x)〛 〚A(x)〛
〚F(x) ↔ A(x)〛
〚(de meeste x) (F(x) ↔ A(x))〛
s a p m c b f j
De conclusie is dat een kwantor als de meeste niet te vertalen is in de PC met de instrumenten die dat formalisme biedt. 5.3.
De oplossing: gegeneraliseerde kwantoren
In oefening (269) zijn we ervan uitgegaan dat een complexe NP van het type de hond een individu denoteert (type e). In de bovenstaande sectie hebben we aangetoond dat deze aanname niet volgehouden kan worden voor een hele reeks complexe NPs, in het bijzonder de gekwantificeerde. We zullen daarom een nieuw soort van denotatie introduceren: de verzameling van verzamelingen. Hiermee breiden we onze inventaris van mogelijke denotaties uit met een nieuwigheid: (282) Verzamelingen 1. waarheidswaarden 2. individuen 3. verzamelingen van individuen 4. verzamelingen van geordende paren 5. verzamelingen van geordende trio’s
Functies waarheidswaarden (elementen van {0, 1}) individuen (elementen van D) functies van D naar {0, 1}
Types t
functies van D naar de verzameling van functies van D naar {0, 1} functies van D naar de verzameling van functies van D naar de verzameling van functies van D naar {0, 1}
⟨e, ⟨e, t⟩⟩
103
e ⟨e, t⟩
⟨e, ⟨e, ⟨e, t⟩⟩⟩
6. verzamelingen van verzamelingen (van individuen)
functies van de verzameling van functies van D naar {0, 1} naar {0, 1}
⟨⟨e,t⟩, t⟩
Die uitbreiding levert echter allerlei voordelen op, waarvan de onderstaande slechts de meest in het oog springende zijn: 1. ze stelt ons in staat om een geloofwaardige denotatie te formuleren voor gekwantificeerde NPs van het type elke filosoof. 2. die denotatie is, met minimale aanpassingen, uitbreidbaar naar de meest uiteenlopende soorten van kwantoren, inclusief kwantoren als de meeste (vandaar de benaming ‘gegeneraliseerde’ kwantoren’). 3. ze stelt ons in staat om het principe van de functionele applicatie te behouden als basisbeginsel van de compositionele analyse van zinsbetekenis. Aan de basis van het idee van de gegeneraliseerde kwantoren voorstel ligt een omkering van het perspectief. De klassieke opvatting over de betekenis van een zin als (283) is zoiets als (284): (283) Jan zingt (284) Het individu “Jan” is een lid van de verzameling van individuen van de zangers. Regel (130), hier herhaald, is de veralgemeende en geformaliseerde versie van deze opvatting. (130) 〚[S NP VP]〛= 1 asa 〚NP〛∈〚VP〛, 0 in alle andere gevallen Ze werkt prima zolang het onderwerp van de zin een eigennaam is, omdat eigennamen individuen zijn, en VP-denotaties verzamelingen van individuen. Maar voor elk ander soort van onderwerp werkt ze niet. Verzamelingen van individuen (bv. zanger, aardig, filosoof, houdt van Miep) kunnen we ook opvatten als eigenschappen: de eigenschap een zanger te zijn, aardig te zijn, filosoof te zijn, van Miep te houden, etc. Denkend in termen van eigenschappen, kunnen we echter het perspectief ook omkeren, en het volgende zeggen: (285) De eigenschap een zanger te zijn is in de verzameling van eigenschappen die Jan heeft. Wanneer we (285) weer herformuleren in termen van verzamelingen in plaats van eigenschappen, dan krijgen we (286):
104
(286) De verzameling van de zangers is een lid van de verzameling van verzamelingen waarvan Jan lid is. Hiermee hebben we een cruciaal concept geïntroduceerd dat ons zal helpen het probleem op te lossen van de kwantoren, nl. een verzameling van eigenschappen, of, meer formeel, een verzameling van verzamelingen.2 Het concept van de verzameling van eigenschappen/verzamelingen zullen we nu toepassen op kwantificationele NP’s van het type elke filosoof: (287) De denotatie van elke filosoof is de verzameling van eigenschappen die alle filosofen gemeenschappelijk hebben. We kunnen vervolgens (287) iets formeler maken, door in de formulering de term eigenschappen te vervangen door de term verzamelingen: (288) De denotatie van elke filosoof is de verzameling van verzamelingen waar alle filosofen lid van zijn. Een dergelijke denotatie noemt men in de formele semantiek een gegeneraliseerde kwantor. (289) Een gegeneraliseerde kwantor is een verzameling van verzamelingen (geïncludeerd in het domein D) Laten we dit proberen aanschouwelijk te maken met een voorbeeld. We nemen een gespreksdomein aan als in (56) hierboven. Gegeven dat eigenschappen verzamelingen van individuen zijn, kunnen we een aantal eigenschappen als volgt weergeven: (290) D = {Socrates, Aristoteles, Plato, Mozart, Callas, Beethoven, Fido} a.〚mannelijk〛= {Socrates, Aristoteles, Plato, Mozart, Beethoven, Fido} b.〚vrouwelijk〛= {Callas} c.〚Grieks〛= {Socrates, Aristoteles, Plato, Callas} d.〚auteur〛= {Aristoteles, Plato} e.〚dood〛= {Socrates, Aristoteles, Plato, Mozart, Beethoven, Callas} f.〚componist〛= {Mozart, Beethoven} g.〚aardig〛= {Socrates, Plato, Callas}
2
Een verzameling van eigenschappen is eigenlijk van een ander type dan een verzameling van verzamelingen: de eerste is van het type <<s,<e,t>>,t>, de tweede van het type <<e,t>,t>. Een verzameling van verzameling zouden we als de extensionele variant kunnen beschouwen van een verzameling van eigenschappen.
105
(291) Plaats de relevante eigenschappen van (290) in het onderstaande Venn-diagram. Plaats vervolgens de individuen van D op de juiste plaats. 〚elke filosoof〛
Uiteraard is dit een fictief voorbeeld: in de wereld zoals wij hem kennen delen niet alle filosofen de eigenschappen mannelijk en Grieks. Maar met betrekking tot de wereld van ons gespreksdomein D zoals we dat gedefinieerd hebben in (56) is dat wel het geval. Het fictieve voorbeeld dient slechts om aan te tonen hoe we de denotatie van een gekwantificeerde NP op zullen vatten. Indien we de verzameling van eigenschappen van elke filosoof op een meer realistische wijze zouden willen definiëren, dan zullen er zeker dingen in moeten zitten van het type: persoon, geleerde, denker, etc. Dat zouden evenzovele verzamelingen zijn die we zouden kunnen toevoegen aan (291). Maar het opstellen van een dergelijke volledige lijst van eigenschappen die alle filosofen delen is niet iets wat nodig is om een expliciete semantiek op te stellen van NP’s als elke filosoof, zoals we zullen zien. Kijk nogmaals naar (291). Het gebied van het diagram waar de filosofen (en alle filosofen) zich bevinden, is de doorsnede van alle verzamelingen die lid zijn van de verzameling〚elke filosoof 〛. Die doorsnede komt overeen met de denotatie van het kale nomen filosoof, (d.w.z.〚filosoof 〛). (292) Welke relatie heeft de verzameling〚filosoof〛met de verzamelingen die de elementen zijn van de verzameling〚elke filosoof〛?
De denotatie van 〚elke filosoof〛wordt dientengevolge als volgt genoteerd: (293) 〚elke filosoof〛= {X ⊆ D:〚filosoof〛⊆ X}
106
Met andere woorden, elke filosoof denoteert de verzameling van alle deelverzamelingen X van D waarvan de filosofen een deelverzameling vormen. Op dit punt is het nuttig om in herinnering te brengen dat een verzameling van verzamelingen iets heel anders is dan de verzameling van al de leden die er deel van uitmaken. Kijkend naar (291), dan kunnen we de verzameling van deelverzamelingen van D die de denotatie vormen van elke filosoof voorstellen als in (294a), wat op zijn beurt uitgespeld kan worden als in (294b): (294) a.〚elke filosoof〛= {〚mannelijk〛,〚Grieks〛,〚dood〛 } b.〚elke filosoof〛= {{Socrates, Aristoteles, Plato, Mozart, Beethoven, Fido}, {Socrates, Aristoteles, Plato, Callas}, {Socrates, Aristoteles, Plato, Mozart, Beethoven, Callas}} Maar hoewel Mozart een lid is van de verzameling 〚mannelijk〛, volgt daar niet uit dat Mozart ook een lid is van de verzameling〚elke filosoof〛; net zo is Callas een element van de verzameling〚Grieks〛, maar geen element van de verzameling elke filosoof. Dit is zo omdat, zoals we eerder hebben aangetoond, in de verzamelingenleer de relatie “lid zijn van” niet transitief is: als a ∈ X en X ∈ Y, volgt daar niet uit dat a ∈ Y. Terugkerend op de gegeneraliseerde kwantor elke filosoof kunnen we, voortbouwend op (293), een algemeen schema formuleren voor de denotatie van NP’s van de vorm elke N, en wel als volgt: (295) 〚elke N〛= {X ⊆ D:〚N〛⊆ X} De kracht van de zojuist geschetste benadering is dat ze een grote algemeenheid heeft. Dit betekent concreet dat we niet veel hoeven te veranderen voor het formaliseren van de denotatie van een filosoof: (296) De denotatie van een filosoof is de verzameling van eigenschappen die een of andere filosoof heeft. Deze verzameling zal de eigenschap mannelijk bevatten, alsook de eigenschap auteur. Als er één filosoof aardig is en eentje vervelend, dan zullen deze beide eigenschappen in de verzameling zitten. In ons domein (56) zal de denotatie echter niet de eigenschap vrouwelijk bevatten.
107
(297) Teken op basis van (290) een Venn-diagram zoals (291) hierboven:
Anders genoteerd ziet de gegeneraliseerde kwantor een filosoof er zo uit: (298) a. b.
〚een filosoof〛= {X ⊆ D:〚filosoof〛∩ X 〚een N〛= {X ⊆ D:
} }
Op analoge manier kunnen we tewerk gaan voor de kwantoren van natuurlijke taal die ook vertaalbaar zijn in de klassieke eerste orde predicatenlogica, d.w.z. elke, alle, iedere, een, sommige, geen. Voor de universele en existentiële kwantoren is dit al aangetoond. Alleen het geval van geen moeten we nog behandelen. (299) Geen filosoof denoteert de verzameling van eigenschappen die
(300) 〚geen filosoof〛 = {X ⊆ D:〚filosoof〛∩ X 〚geen N〛= {X ⊆ D:
} }
Hiermee hebben we al een eerste bezwaar ondervangen tegen de eerdere benadering die gestoeld was op de predicatenlogica, nl. dat verschillende kwantoren op een geheel andere manier vertaald worden in het PC-formalisme.
5.4.
Gegeneraliseerde kwantoren en zinnen
Welke consequenties heeft de benadering in termen van gegeneraliseerde kwantoren voor het compositioneel berekenen van de denotatie van zinnen? Een aantal eerder gemaakte assumpties blijven onveranderd gelden: een zin blijft een waarheidswaarde denoteren, en een
108
VP blijft een verzameling van individuen denoteren. Maar een gekwantificeerd subject denoteert een gegeneraliseerde kwantor, d.w.z. een verzameling van verzamelingen. Eigenlijk is de regel voor het compositioneel berekenen van de denotatie van zinnen op basis van het bovenstaande erg eenvoudig: het enige wat nodig is, is de omkering van perspectief waarover we het hadden n.a.v. (283). Immers, een gegeneraliseerde kwantor is een verzameling van eigenschappen, en de VP is zelf een eigenschap. We kunnen dus een waarheidswaarde blijven formuleren in termen van lidmaatschap van een verzameling. Het verschil is dat, in het geval van een ware zin, het subject niet een lid is van de verzameling die door de VP gedenoteerd wordt, maar de VP een lid van de verzameling van verzamelingen van het subject. Informeel kan dit als volgt geformuleerd worden: (301) Elke filosoof zingt is waar asa de eigenschap een zanger te zijn behoort tot de verzameling van eigenschappen die elke filosoof gemeenschappelijk heeft. Meer formeel ziet de regel er in termen van verzamelingen uit als volgt: (302) 〚[S NP VP]〛= 1 asa〚VP〛∈〚NP〛, 0 in alle andere gevallen (303) Toon aan hoe dit werkt voor een zin als Elke filosoof is dood. 〚elke filosoof〛
109
(304) Doe hetzelfde voor Een filosoof is aardig en Geen filosoof is aardig.
De regel (302) kunnen we ook zonder veel moeite formuleren als een geval van functionele applicatie. Wat we daarvoor nodig hebben is een functie en een argument. Als we de VP opvatten als de functie, kan het subject zijn argument zijn indien het subject een individu denoteert. Dat is niet het geval bij de meeste soorten van subjecten die we in feite aantreffen. De oplossing is ook hier een omkering van het perspectief: het subject denoteert een functie, de VP is het argument van die functie. (305) Wat voor een functie is dit? Bepaal het type van een gegeneraliseerde kwantor die als subject fungeert.
5.5.
De interne structuur van generaliseerde kwantoren
Een gegeneraliseerde kwantor is een hele DP, die typisch bestaat uit een kwantorwoord of lidwoord en een nomen (dit is een lichte afwijking van het normale gebruik van het woord kwantor, dat slechts verwijst naar het kwantorwoord alleen, exclusief het nomen). Om naar de categorie kwantorwoord/lidwoord te verwijzen, zullen we voortaan de Engelse term determiner gebruiken. Het compositionaliteitsbeginsel indachtig kunnen we nog een stap verder gaan en ons afvragen wat precies de denotatie is van de determiner op zijn eentje. Dit is niet zo moeilijk gegeven dat we al het semantische type kennen van het nomen en van de gehele DP (zie (305)).
110
(306) (i) Wat is het semantische type van een nomen? (ii) Wat is het semantische type van een gegeneraliseerde kwantor (DP)? (iii) Wat is het semantische type van een determiner? Gegeven dat een nomen een verzameling van individuen denoteert, en een NP een verzameling van verzamelingen, kunnen we concluderen dat een determiner iets is wat met een verzameling combineert om een verzameling van verzamelingen te vormen. In functieterminologie gezegd, een determiner is een functie van een verzameling van individuen naar een verzameling van verzamelingen.
5.6.
Zinsdenotaties en eigennamen
De omkering van het perspectief waarvan sprake hierboven levert een probleem op voor het berekenen van zinsdenotaties van zinnen met een eigennaam als subject. (307) Toon aan dat de regel in (302) niet werkt voor gevallen van het type Socrates zingt.
De oplossing voor dit probleem is hierin gelegen dat we ook eigennamen opvatten als gegeneraliseerde kwantoren, d.w.z. als een verzameling van verzamelingen. Naar analogie met (287), (296) en (299) hierboven kun je proberen zo een denotatie op te stellen: (308) De denotatie van Socrates is
(309) 〚Socrates〛= {X ⊆ D:
}
111
(310) In een Venn-diagram op basis van (290) ziet dit er uit als volgt: 〚Socrates〛
Merk op dat in zowel (309) als (310) Socrates twee keer voorkomt: een keer als de grootste verzameling〚Socrates〛en een keer als een element van elke deelverzameling van〚Socrates〛. In beide gevallen is de status van de eigennaam anders: een individu of een verzameling van verzamelingen. Dit is een operatie die we type-lifting noemen: van de status van individu hebben we Socrates gepromoveerd naar een andere categorie, nl. een verzameling van verzamelingen. Op die manier kunnen we een gemeenschappelijke analyse ontwikkelen voor eigennamen en anderssoortige NP’s. Merk overigens op dat het probleem dat we hier geschetst hebben niet noodzakelijk even ernstig is wanneer we naar zinsdenotaties kijken in termen van Functionele Applicatie. We kunnen dan immers aannemen dat het type van de subjects-NP bepaalt in welke richting FA werkt: is het subject een individu, dan is de VP de functie en het subject het argument, is het subject een gegeneraliseerde kwantor, dan is het subject de functie en de VP het argument.
5.7.
Hogere ordekwantoren
Een belofte die we nog moeten inlossen, is aan te tonen dat de niet-klassieke hogere ordekwantoren van het type de meeste filosofen vertaalbaar zijn in het formalisme van de gegeneraliseerde kwantoren. Voortbouwend op de denotaties die we eerder geformuleerd hebben (bv. (287) en (308)), kunnen we een poging doen: (311) De denotatie van de meeste filosofen is
112
De wat meer formele versie gaat ervan uit dat de meeste in bovenstaande definitie betekent ‘meer dan de helft’. We gebruiken hiervoor een functie, card(X), die de cardinaliteit geeft van een verzameling, d.w.z. het aantal elementen in de verzameling: bv. card(D)=8. (312) 〚de meeste N〛= {X ⊆ D: card (〚N〛∩ X) ⟩ card (〚N〛– X)} 〚de meeste filosofen〛 〚filosoof〛
〚koppig〛
〚aardig〛
Telwoorden zijn uiteraard ook hoeveelheidswoorden. Hun denotatie kan op eenvoudige wijze als een gegeneraliseerde kwantor beschreven worden. (313) a.〚twee N〛= {X ⊆ D: card(〚N〛∩ X )
}
Tot slot geven we hieronder de denotatie van definiete enkelvoudige NPs: (314) 〚de N〛= {X ⊆ D: voor een d ∈ D, 〚N〛= {d} en d ∈ X} (d.w.z. de verzameling van eigenschappen die het enige lid van〚N〛bevatten) Zoals de lezer zelf zal kunnen nagaan werkt deze benadering voor een groot aantal kwantoren, zoals veel N, weinig N, minstens/hoogstens drie N, meer/minder dan de helft van de N, ten minste twee N, meer N1 dan N2, etc. Dit feit maakt Montague zijn benadering bijzonder vruchtbaar voor de analyse van natuurlijke taal.
113
6.
SLOTOEFENING
(315) Bekijk aandachtig onderstaand voorbeeld en de bijhorende boomstructuur: Elke student kent en groet Pierre. S NP 2 Det N | | Elke student
(i) (ii)
V 2 V 2 | en V kent | groet
NP | N’ | N | Pierre
Geef het semantische type van elke knoop in deze boomstructuur. Geef de volgende denotaties weer in verzamelingnotatie: a. b. c.
(iii)
VP
〚 kent 〛 = 〚 Pierre 〛 = 〚 elke student 〛 =
Geef de volgende denotaties weer in functienotatie: a. b. c. d.
〚groet 〛 = 〚 kent en groet 〛 = 〚 Pierre 〛 = 〚 elke 〛 =
114
7. BIBLIOGRAFIE Bach, Emmon. 1989. Informal Lectures on Formal Semantics. New York: SUNY Press. Chierchia, Gennaro and Sally McConnell-Ginet. 1990. Meaning and Grammar. Cambridge, Massachusetts: MIT Press. Gamut, L.T.F. 1991. Logic, Language, and Meaning. Chicago: The University of Chicago Press. Horn, Laurence. 1989. A Natural History of Negation. Chicago: The University of Chicago Press. Jackendoff, Ray. 1983. Semantics and Cognition. Cambridge, Massachusetts: MIT Press. Jackendoff, Ray. 2002. Foundations of Language: Brain, Meaning, Grammar, Evolution. Oxford: Oxford University Press. Janssen, Theo. 2001. Frege, contextuality and compositionality. In Journal of Language, Logic, and Information 10:115-136. Kamp, Hans. 1975. Two theories about adjectives. In Formal semantics of natural language, ed. Edward Keenan, 123–155. Cambridge: Cambridge University Press. Kratzer, Angelika and Irene Heim. 1998. Semantics in Generative Grammar. Oxford: Blackwell. Lepore, Ernest. 2003. Meaning and Argument. An Introduction to Logic through Language. Oxford: Blackwell. Mill, J.S. 1867. An Examination of Sir William Hamilton’s Philosophy. London: Longman. Montague, Richard. 1970. English as a formal language. In Bruno Visentini et al., Linguaggi nella societá e nella tecnica, Milan: Editione di Communitá. 189-224 Montague, Richard. 1973. The proper treatment of quantification in ordinary English. In K. Hintikka, J. Moravcsik & P. Suppes (eds.) Approaches to Natural Language. Dordrecht: Reidel. 221-242. Pelletier, Jeffrey. 2001. Did Frege believe Frege’s principle? In Journal of Language, Logic, and Information 10:97-114. Reinhart, Tanya. 1983a. Coreference and bound anaphora: A restatement of the anaphora questions. In Linguistics and Philosophy 6:47-88. Reinhart, Tanya. 1983b. Anaphora and semantic interpretation. London: Croom Helm.
115