Kansrekening en dynamica als basis voor breed wiskundeonderwijs 2 Joost Hulshof en Ronald Meester
c Reproductie alleen in overleg met de auteurs. Alle rechten voorbehouden.
1
Voorwoord In de eerste cursus hebben we een aantal basisbegrippen uit de wiskunde in een wat ander daglicht gezet dan op school gebruikelijk. We probeerden daarbij een fundamentele invalshoek te combineren met een realistische. Beide invalshoeken fundeerden we op de common ground die voortkomt uit vertrouwdheid met getallen en getalrepresentaties. Nadrukkelijk aan de orde kwamen breuken, wortels en het getal e. Nog niet aan de orde kwam π. Met kansrekening en dynamica als beoogd perspectief werd al schrijvende duidelijk hoe met getallen en eenvoudige algebra een fundament voor goede wiskunde en goed wiskundeonderwijs gelegd kan worden. Bij dit alles was Newton alom aanwezig, maar zijn differentiequoti¨enten en differentiaalvergelijkingen bleven nog achterwege, en ook de moderne kijk op wat cosinussen en sinussen eigenlijk zijn. Dat maken we nu goed in deze tweede cursus, die de formule van Stirling, n n √ 2πn, n! ∼ e als kapstok heeft. Een toevallige keuze, gebaseerd op een vraag die langskwam tijdens het schrijven aan de eerste cursus. Wiskunde begint met het stellen van vragen. Iedereen kan vragen stellen: de gek, de student, de docent en de wetenschapper. Alle vier, ook de vakdidacticus en zelfs de onderwijskundige, kunnen veel opsteken van de antwoorden op goede vragen, en wat je nodig hebt om die antwoorden precies te maken, liefst met minimaal geschut, waarmee zo mogelijk van hogere wiskunde lagere wiskunde gemaakt wordt. Want het gaat in de wiskunde niet om het verschil tussen hogere en lagere wiskunde, maar om goede wiskunde. Deze tweede cursus ontstond door een vraag die terloops gesteld werd tijdens de voorbereiding van de eerste cursus: waar komt die normale verdeling toch altijd maar vandaan en hoe laten we dat zien? En toen was er ineens ook de vraag hoe groot n! eigenlijk is. Beide vragen zullen we in deze cursus beantwoorden op een zo elementair mogelijke manier, in hopelijk leerzaam detail, met een hier daar een uitstapje van meer filosofische aard. Als toegift behandelen we wat je zoal met machtreeksen kunt en mag doen, aansluitend op de formule exp(x) = ex = 1 + x +
x2 x3 x4 + + + ··· , 2! 3! 4!
met een eerste glimp van de imaginaire wortel uit min ´e´en als onvermijdelijke entiteit in de re¨ele wereld. Joost Hulshof Ronald Meester VU Amsterdam, 14-2-2011
2
Inhoud • §1 Hoe groot is n! vraagteken • §2 Integralen, kansdichtheden en oppervlakten – §2.1 Van rechthoeken naar oppervlakten – §2.2 De somformule voor 1n + 2n + · · · + N n – §2.3 Integreerbaarheid – §2.4 Integraalrekening voor polynomen • §3 Schuiven, schalen, meten en limieten – §3.1 Van xn naar ex – §3.2 Maattheorie – §3.3 Stirling’s formule R∞ 1 2 • §4 De integraal −∞ e− 2 x dx • §5 De centrale limietstelling • §6 Differentiaalvergelijkingen • §7 Differentiaalrekening voor machtreeksen De samenhang tussen de secties is min of meer lineair: 1
→ 2
→ 3
→
4
3
→ 5
→ 6
← 7
1
Hoe groot is n! vraagteken
Een vraag die tot de verbeelding spreekt. Mijn laatste rekenmachine1 kon bij benadering n! tot en met n = 69 aan. Dat zat nog onder 10 tot de macht 100, een 1 met honderd nullen2 . Maar 70! was al te groot want 70! = 11 978 571 669 969 891 796 072 783 721 689 098 736 458 938142 546 425 857 555 362 864 628 009 582 789 845 319 680 000 000 000 000 000, hetgeen misschien nog wel te doen is met pen en papier. De faculteit van een positief geheel getal n is per definitie het product van alle positieve gehele getallen tot en met n. Dus 1! = 1,
2! = 1 × 2,
3! = 1 × 2 × 3 = 6,
4! = 1 × 2 × 3 × 4 = 24, . . .
De eerste factor 1 doet natuurlijk niets maar wordt er meestal wel bijgeschreven. Kortom n! = 1 × 2 × 3 × · · · × n. Een iets nettere definitie is 0! = 1
en n! = n × (n − 1)!
voor n ≥ 1
geheel,
waarmee n! inductief wordt gedefinieerd. De facto is n! dus het product van n factoren, namelijk van de eerste n positieve gehele getallen, inclusief de factor 1. Bij afspraak begint de rij van faculteiten met 0! = 1, een product van nul factoren. Omdat 1 het neutrale element van de bewerking × is, zeggen we dat een leeg product gelijk is aan 1, net zoals een lege som van getallen 0 als 0, het neutrale element van de bewerking +, wordt gedefinieerd. In plaats van × schrijven we trouwens meestal · , en als we letterrekenen meestal gewoon niets. Dus n × (n − 1)! = n · (n − 1)! = n(n − 1)! , met voorrang voor het uitroepteken dat gebruikt wordt in de notatie van faculteiten. Deze faculteiten komen overal in de wiskunde en haar toepassingen voor, en daarmee ook de vraag hoe groot n! is als n groot is. Het antwoord is: GROOT. Maar hoe groot eigenlijk? Een preciezer antwoord op de vraag is n n √ 2πn voor n → ∞. (1.1) n! ∼ e Deze uitspraak is het uitgangspunt voor de cursus. Wat staat hier eigenlijk, waarom is het waar, en wat komt daar allemaal bij langs? Lezend van links naar rechts valt als eerste het teken ∼ op. Dit teken moet gelezen worden als een zwakkere vorm van het gelijkteken, in combinatie met de toevoeging voor n → ∞: (1.1) is een uitspraak over het gedrag van twee rijen getallen, namelijk de rij3 1, 2, 6, 24, 120, 720, . . . 1 Aangeschaft
voor mijn natuurkunde practicum als student. ook wel googol, zie via google wikipedia. 3 Om onnodige verwarring te vermijden laten we beide rijen nu beginnen met n = 1.
2 10100 ,
4
en een zo op het oog heel andere rij4 1√ 4√ 27 √ 64 √ 3125 √ 46656 √ 2π, 2 4π, 3 6π, 4 8π, 5 10π, 12π, . . . e e e e e e6 De uitspraak zegt niets over het vierde element in de ene rij met betrekking tot het het vierde element in de andere rij, en ook niet over het googolste element van beide rijen. Als an en bn twee rijen positieve getallen zijn dan zeggen we dat an ∼ bn voor n → ∞ als het quoti¨ent
an naar 1 gaat als n → ∞. bn Slordig gezegd: als n → ∞ dan is in de limiet de verhouding tussen an en bn gelijk aan 1. Precies gezegd5 : gegeven iedere gewenste foutmarge > 0 is vanaf zekere n, zeg vanaf n = N , voldaan aan de foutafschatting |
an − 1| < . bn
Dus als de getallen an en bn in paren voorbijkomen, dan vallen de eerste N − 1 paren buiten de gewenste foutmarge, maar daarna is aan de gewenste precisie voldaan. Precisie is dus ook hier een kwestie van geduld: hoe kleiner > 0 hoe langer je moet wachten6 . Twee zulke rijen heten asymptotisch gelijk, ook al is hun verschil helemaal niet klein, of zelfs groot. Het gaat alleen om de verhouding voor (steeds) grote(re) n: Opgave 1. Ga na dat de uitspraak an ∼ bn voor de rijen an = n(n + 1) en bn = n2 equivalent is met de uitspraak dat gegeven een willekeurige > 0 er een index N is zo dat voor alle gehele n ≥ N geldt dat n1 < . Deze eigenschap van de positieve getallen wordt de Archimedische eigenschap genoemd. We zullen deze eigenschap als zijnde vanzelfsprekend waar beschouwen7 : dat n1 naar 0 gaat als n → ∞ is de basis voor alles wat we doen in de analyse8 . Opgave 2. Kun je bewijzen dat als an ∼ bn
voor n → ∞,
dat dan ook
bn ∼ an
voor n → ∞?
Opgave 3. En als an ∼ bn
voor n → ∞ en bn ∼ cn
voor
n → ∞,
dat dan ook an ∼ cn
voor
n → ∞?
Op grond van deze en de vorige opgave spreken we over an ∼ bn voor n → ∞ als een equivalentierelatie tussen rijen positieve getallen. De relatie is immers symmetrisch, transitief, en natuurlijk ook reflexief : iedere rij positieve getallen is asymptotisch gelijk aan zichzelf. 4 Waarin
naast de vierkantswortel ook e en π voorkomen, waarover later meer. schrijven hier de formele definitie van An → A als n → ∞ over. 6 Als a = b voor alle n dan hoef je helemaal niet te wachten. n n 7 Maar daar is over te twisten, google: Non-standard Analysis. 8 Het deelgebied van de wiskunde waarin limieten een rol spelen.
5 We
5
Natuurlijk moet het zo zijn dat als je bijvoorbeeld een irrationaal getal op twee manieren met rijen rationale getallen benadert, dat dan die twee rijen asymptotisch gelijk zijn9 . Maar in (1.1) gaat het zeker niet om benaderingen van getallen. De getallen in beide rijen worden steeds (en heel snel) groter. Of je kunt spreken over de formule van Stirling als een benadering van n! is niet eens zo duidelijk. Maar als je een groot probleem wil oplossen en wilt inschatten hoe lang het duurt, dan is een formule als (1.1) al snel relevant. Dus hoe groot is n! volgens Stirling’s formule? Wel, in het rechterlid van √ (1.1) komt naast de factor 2πn de n-de macht van ne voor, en die gaat hard, erg hard. Gezien de relatief bescheiden factor √ 2πn gaat n! nog een ietsje harder. Beide factoren in Stirling’s formule zijn mysterieus. Waarom hebben π en e u ¨berhaupt iets met n! te maken? We hebben al gezien dat e = lim (1 + n→∞
∞ 1 n X 1 ) = , n n! n=0
dus de e is niet helemaal vreemd in relatie tot faculteiten, maar waar komt de wortel van π vandaan? Wat verder opvalt is het verschil tussen de formules. Beter gezegd, n! is niet eens als formule in n gedefinieerd. Want om n! uit te rekenen heb je naast n ook n − 1, n − 2, etc. nodig. Dit in tegenstelling tot Stirling’s formule n n √ 2πn, e waarin je gewoon n kunt invullen, n = googol10 bijvoorbeeld. Stirling’s formule is gebaseerd op een andere uitdrukking voor n!, namelijk Z ∞ n! = xn e−x dx. 0
Om deze integraalformule voor n! af te leiden moeten we niet alleen weten wat integralen zijn, maar ook hoe we ze (soms) uit kunnen rekenen. Voor elke gehele niet-negatieve n is het laatste kennelijk mogelijk voor Z ∞ xn e−x dx, 0
want volgens de integraalformule is Z ∞ Z ∞ e−x dx = 1, xe−x dx = 1, 0
0
Z
∞
x2 e−x dx = 2,
0
Z
∞
x3 e−x dx = 3·2,
0
enzovoort. Standaard reken je dit uit via partieel integreren, een van de meest gebruikte technieken in de wiskunde, waarmee kan worden aangetoond dat Z ∞ Z ∞ xn e−x dx = n xn−1 e−x dx. 0
0
9 Hoe 10 Zie
kun je dit uit de opgaven hierboven halen? googolplex in wikipedia.
6
Als je weet dat voor n = 0 deze integraal gelijk is aan 1, hetgeen we straks ook als speciaal geval eerst zullen zien, dan is het niet zo moeilijk om je zelf er met de recurrentieformule van te overtuigen dat inderdaad Z ∞ n! = xn e−x dx. 0
De lijn die we in deze cursus kiezen is echter elementairder en bouwt voort op de algebra van getallen en polynomen. De integraalformule voor n! leiden we af via een limietovergang beginnende met polynomen, culminerend in Opgave 20. Opnieuw nemen we polynomen als uitgangspunt voor het introduceren van de relevante onderwerpen uit de differentiaal- en integraalrekening, met als toegift een vloeiende overgang naar machtreeksen11 , waarvan we er in de vorige cursus al een hele bijzondere gezien hebben: exp(x) = ex = 1 + x +
x3 x4 x2 + + + ··· , 2! 3! 4!
een functie die zo te zien zijn eigen afgeleide is, en daarmee een oplossing van een eenvoudige differentiaalvergelijking. We bekijken meer van dat soort differentiaalvergelijkingen en hun (machtreeks)oplossingen, die in de natuur overal als dynamische verschijnselen voorkomen. Partieel integreren zelf is geen thema van deze cursus, ook al is het belang van oefenen met deze techniek in het schoolwiskundeonderwijs voor de vervolgopleidingen minstens zo groot als het belang van het vlot leren rekenen met breuken in het rekenonderwijs op de basisschool voor het vervolgtraject op het VO. Wel een hoofdthema, aansluitend bij het schoolcurriculum, is schuiven en schalen, waarmee uit de integraalformule voor n! de normale verdeling tevoorschijn komt. De centrale limiet stelling uit de kansrekening krijgt zo een tegenhanger die leidt tot de formule van Stirling. Die formule speelt in diezelfde centrale limiet stelling een rol. De cirkel(redenering?) wordt rond gemaakt door π uitroepteken
2
Integralen, kansdichtheden en oppervlakten
De integraalformule Z n! =
∞
xn e−x dx
0
zegt dat n! precies gelijk is aan de oppervlakte van dat deel van het xy-vlak dat ingesloten wordt door12 de positieve x-as en de grafiek y = xn e−x . Een andere manier om deze integraalformule voor n! te schrijven is als Z ∞ n x −x e dx = 1. n! 0 Voor elke vast gekozen gehele niet-negatieve n is de oppervlakte van het gebied tussen de grafiek van de functie fn : [0, ∞) → [0, ∞)
gedefinieerd door
11 Vergelijkbaar
fn (x) =
xn −x e n!
met de overgang van afbrekende decimale ontwikkelingen naar re¨ ele getallen als doorlopende decimale ontwikkelingen. 12 Wat gaat er mis in deze omschrijving als n = 0?
7
en de positieve x-as gelijk aan 1. Voor kansrekenaars is fn de kansdichtheid van een kansverdeling op de positieve re¨ele getallen. De bekendste kansverdeling is de normale verdeling, waarin de wortel van π voorkomt, omdat Z ∞ √ 2 e−x dx = π, −∞
bijna letterlijk de quadratuur van de cirkel, of, zoals in de kansrekening meer gebruikelijk Z ∞ 1 2 1 √ e− 2 x dx = 1. 2π −∞ √ In deze cursus zullen we op een elementaire manier laten zien hoe 2π zo te voorschijn komt. Normale verdelingen komen voor in de centrale limietstelling, misschien wel DE hoofdstelling van de kansrekening, maar ook, in ieder geval als formule, in de (asymptotische) beschrijving van integralen met parameters. Dat is handig want de meeste integralen zijn niet exact uit te rekenen en numerieke integratie is hier kansloos. In de vorige cursus hebben we beschreven hoe raaklijnen aan grafieken van polynomen kunnen worden bepaald met behulp van lineaire benaderingen en staartdelingen, en hoe zo de differentiaalrekening kan worden opgezet13 . We zullen dit uitbreiden naar machtreeksen, zeg maar polynomen van oneindige graad. In deze cursus spelen integralen en oppervlakten een grote rol, en het ligt voor de hand om eerst eens te kijken naar de oppervlakten van gebieden beschreven met polynomen, te beginnen met het gebied in het xy-vlak begrensd door x = 1, y = 0 en y = xn . Met de moderne integraalrekening is de oppervlakte van dit gebied gelijk aan n+1 1 Z 1 1 x n = , x dx = n+1 0 n+1 0 maar we zullen zien hoe dit veel rechtstreekser en zonder veel machinerie kan worden aangetoond. Vervolgens sluit dit eerste voorbeeld, als we gaan schalen en schuiven, mooi aan bij de vorige cursus en de introductie van exp(x) = ex , en de conclusie nu dat Z ∞ e−x dx = 1. 0
2.1
Van rechthoeken naar oppervlakten
Als leerzame voorbereiding concluderen we nu eerst, aan de hand van een serie opgaven, dat An = de oppervlakte van {(x, y) : 0 ≤ y ≤ xn ≤ 1} =
1 . n+1
Als uitgangspunt nemen we dat we weten wat de oppervlakte van een rechthoek is, waarbij we zonder eenheden (dus geen vierkante centimeters of zo) werken. De oppervlakte van een rechthoek die parallel ligt aan de assen wordt eenvoudig bepaald door de schaalverdeling op de assen. 13 Raaklijnen
werden in de methode van Newton gebruikt om x2 = 2 numeriek op te lossen.
8
Opgave 4. Schets voor n = 0, 1, 2, 3 het relevante stuk van de grafiek met pen op papier en reflecteer op het gedrag als n → ∞. Voor n = 1 is het gebied in het xy-vlak begrensd14 door x = 1,
y=0
en y = x,
een driehoek met oppervlakte 21 , precies de helft van de oppervlakte van het vierkant met hoekpunten (0, 0), (1, 0), (1, 1) en (0, 1), dat oppervlakte 1 heeft. Dat voor n = 2 de oppervlakte kleiner is is evident, ook voor de wiskundige die eerst de vraag stelt hoe en of de oppervlakte eigenlijk precies gedefinieerd is. De conclusie dat bijvoorbeeld A2 in ieder geval groter moet zijn dan de oppervlakte van de rechthoek met hoekpunten ( 21 , 0), (1, 0), (1, 14 ) en ( 12 , 14 ) is onvermijdelijk. Opgave 5. Leg uit waarom. Opgave 6. Laat met een plaatje zien dat zo ook moet gelden dat 1 1 1 4 1 1 1 4 1 9 · + · < A2 < · + · + · . 3 9 3 9 3 9 3 9 3 9 Opgave 7. Laat evenzo zien dat 12 + 22 + · · · + (N − 1)2 12 + 22 + · · · + N 2 < A < , 2 N3 N3 waarin het verschil tussen de ondergrens en bovengrens voor A2 gelijk is aan en dus willekeurig klein wordt als N groot wordt.
1 N,
Opgave 8. Een bewijs met volledige inductie: laat inductief zien dat 12 + 2 2 + · · · + N 2 =
N3 N2 N + + . 3 2 6
Met andere woorden, verifieer dat de uitspraak juist is voor N = 1 en laat zien dat als de uitspraak juist is voor een vast maar willekeurig gekozen N ≥ 1, dat dan ook de uitspraak voor N + 1 volgt. Deze implicatie heet de inductiestap. Omdat de uitspraak waar is voor N = 1, is dat dankzij (steeds weer) dezelfde inductiestap ook zo voor N = 2, N = 3, N = 4,..... Dit heet het principe van volledige inductie15 . Opgave 9. Laat zien dat kennelijk alleen A2 = de oppervlakte in aanmerking komt.
1 3
als numerieke waarde voor
Hoe zit met A3 , A4 ,...? Gaat het daarvoor net zo? Opgave 10. Laat zien dat 13 + 23 + · · · + (N − 1)3 13 + 23 + · · · + N 3 < A < , 3 N4 N4 waarin het verschil tussen ondergrens en bovengrens gelijk is aan willekeurig klein wordt als N groot wordt. 14 Voor 15 De
n = 0 is de beschrijving minder gelukkig, waarom? naamgeving is helaas een poging tot volledige intimidatie.
9
1 N,
en dus
Opgave 11. Laat inductief zien dat 13 + 2 3 + · · · + N 3 = en leg uit waarom A3 = 14 . Welke
1 4
N4 N3 N2 + + 4 2 4
eigenlijk?
Opgave 12. Er geldt: N5 N4 N3 N + + − . 5 2 3 30
14 + 24 + · · · + N 4 = Leg uit waarom A4 = 15 .
Zo is de regelmaat wel duidelijk, dus wat gebruiken we nu eigenlijk echt van deze formule? Opgave 13. Algemener geldt kennelijk voor gehele positieve n dat 1n + 2n + · · · + N n =
N n+1 + · · · = Pn (N ), n+1
een polynoom van graad n + 1 in N , met op de puntjes lagere orde termen in N . Over die lagere orde termen is veel interessants16 te vertellen, maar voor de oppervlakte An heb je dat niet nodig: aangenomen dat onze algemene conclusie 1 . Leg uit waarom. juist is, volgt An = n+1
De somformule voor 1n + 2n + · · · + N n
2.2
1 Die n+1 willen we natuurlijk wel zeker weten. Hoe is snel te zien dat voor elke n deze kopco¨efficient verschijnt? Dan gaat het dus eerst om de vraag waarom N X
= 1n + 2n + · · · + N n
k=1
een polynoom is in N van graad n + 1, en daarna waarom dit polynoom van de vorm N n+1 Pn (N ) = + ··· n+1 is. We willen dit weer doen met volledige inductie, dus met dezelfde techniek als in Som 8, en dan is de eerste vraag of we dat naar n of N moeten doen. Omdat we voor elke n een uitspraak doen over een polynoom in N , kiezen we nu voor n als inductieparameter en zoeken een manier om hogere machten van k, de somindex, om te zetten in lagere machten van k. Vervolgens nemen we aan dat de uitspraak al bewezen is voor 1, 2, . . . , n − 1 en laten we zien dat dan de uitspraak dan ook waar is voor n. Daarbij gebruiken we dan dat we de lagere machten al kunnen optellen tot een polynomen in N , waarvan we de graad weten. Voor de reductie van de exponenten gebruiken we het binomium van Newton in de vorm (k + 1)n+1 − k n+1 = (n + 1)k n + 16 Ook
(n + 1)n n−1 k + · · · + (n + 1)k + 1, 2
aan de schrijvers....
10
Sommeren we dit over k lopend van 1 tot en met N , dan zien we rechts de sommen van machten verschijnen waar het ons omgaat. Immers N X k=1
N X (n + 1)n n−1 k + · · · + (n + 1)k + 1 (k + 1)n+1 − k n+1 = (n + 1)k n + 2 k=1
=
N X
n
(n + 1)k +
k=1
N X (n + 1)n k=1
= (n + 1)
N X k=1
kn +
2
k
n−1
+ ··· +
N X
(n + 1)k +
k=1
N X
1
k=1
N
N
N
k=1
k=1
k=1
X X (n + 1)n X n−1 k + · · · + (n + 1) k+ 1, 2
waarin we inderdaad de sommen zien staan van het type dat we beschouwen. De eerste, met exponent n, willen we bepalen. Met de voorfactor (n + 1) moet hier een polynoom in N van graad n + 1 met kopco¨efficient 1 uitkomen. Is dat zo? Wel, gebruikmakend van de aanname dat voor exponenten 1, 2, . . . , n − 1 al bekend is dat er polynomen uitkomen, die allemaal graad hoogstens n hebben, zijn we klaar als N X (k + 1)n+1 − k n+1 k=1
een polynoom in N is van graad n + 1 met kopco¨efficient 1. Dat is inderdaad het geval. Immers, deze telescoopsom is gelijk aan N X
(k + 1)n+1 − k n+1 = (N + 1)n+1 − 1 = N n+1 + · · · .
k=1
Hiermee is het bewijs geleverd. Opgemerkt kan nog worden dat we in de inductiestap om de somformule voor exponent n te bewijzen alleen gebruiken dat voor lagere exponenten de somformule een polynoom is van graad hoogstens n, zonder verdere informatie over de co¨efficienten, ook niet over de kopco¨efficienten. In elke stap zien we vervolgens de juiste kopco¨efficient verschijnen.
2.3
Integreerbaarheid
We hebben hierboven An uitgerekend zonder ons druk te maken over de vraag of de oppervlakte wel goed gedefinieerd was. De vanzelfsprekende insluiting tussen onder- en bovensommen, waarvan het verschil zo klein genomen kan worden als we maar willen lijkt voldoende overtuigend voor praktische doeleinden, en in dit expliciete voorbeeld volgde vervolgens ook meteen het antwoord op de vraag over de numerieke waarde van An . Twee vliegen in ´e´en klap. De eerste vlieg lukt voor elke monotone functie. Teken maar een plaatje van de grafiek van een positieve functie f op een interval [a, b], neem een N zo groot als je wil, teken rechthoekjes onder en boven de grafiek die in de hoeken net passen, allemaal met breedte b−a N . Schuif je de bovenrechthoekjes een rechthoekje opzij, naar rechts als de functie stijgt, dan kiepert een rechthoekje van het interval af. Aan de andere kant zet je er eentje bij, en je ziet dat het verschil tussen boven- en ondersom gelijk is aan b−a |f (b) − f (a)| · , N 11
zo klein weer als je maar wilt. Er zit dus hoogstens ´e´en getal tussenin. Dat er inderdaad een getal tussen alle ondersommen en bovensommen zit vergt voor een wiskundige een wiskundig argument waarin we precies maken wat we onder re¨ele getallen verstaan. Dat laten we hier nu achterwege. In de vorige cursus zijn we uitgebreid ingegaan op hoe in de wiskunde het vanzelfsprekende kan worden geaxiomatiseerd. De zo gedefinieerde oppervlakte noteren we met Z b Z b f= f (x) dx, a
a
en noemen we de integraal van f over [a, b]. Monotone functies zijn dus integreerbaar over begrensde intervallen, hoe lelijk ze ook zijn! We benaderen de integraal simpelweg met b−a . N Hoe groter N , hoe dichter de benadering bij de integraal zit. Zonder de eerste term is dit een ondersom of bovensom, en zonder de laatste term ook, maar dan andersom. En die ene term maakt in de limiet niets uit17 . Ook continue functies zijn integreerbaar over begrensde intervallen, maar dat is veel lastiger om overtuigend te brengen, omdat de definitie van continuiteit nu eenmaal echt lastig is, in tegenstelling tot de voorwaarde voor integreerbaarheid zelf: functies zijn per definitie integreerbaar als je ondersommen en bovensommen zo dicht bij elkaar kunt krijgen als je maar wilt. In dat geval kan er maar een getal tussen onder- en bovensommen zitten en dat is dan per definitie de integraal van de functie over het interval. h (f (a) + f (a + h) + f (a + 2h) + · · · + f (b)) ,
met
h=
Opgave 14. Geef zelf een definitie van wat een ondersom en een bovensom is voor de integraal van f over het interval [a, b]. Kan een onbegrensde functie integreerbaar zijn? Uit de definitie volgt rechtstreeks dat als f en g op [a, b] integreerbare functies zijn, dat ook de somfunctie f + g integreerbaar is, met Z b Z b Z b (f (x) + g(x)) dx = f (x) dx + g(x) dx. a
a
a
Ook veelvouden gaan goed. Als f integreerbaar is en λ een re¨eel getal, dan is Z b Z b λf (x) dx = λ f (x) dx. a
Tenslotte volgt ook dat Z b
a
Z f (x) dx =
a
c
Z f (x) dx +
a
b
f (x) dx, c
als c tussen a en b ligt. Te lezen als: is de rechterkant goed, dan ook de linkerkant en omgekeerd18 . Er zijn veel begrensde functies die niet integreerbaar zijn: Opgave 15. Laat f (x) = 2 voor x rationaal en f (x) = 1 voor alle overige x. Is deze f integreerbaar op [0, 1]? 17 Er
zijn natuurlijke betere benaderingstechnieken, google: trapeziumregel. is dit bij de twee uitspraken erboven niet zo?
18 Waarom
12
2.4
Integraalrekening voor polynomen
De functie x → xn is over elke begrensd interval [a, b] integreerbaar en we kunnen de integraal ook als getal bepalen: Opgave 16. Verifieer, eerst voor 0 < a < b, dat Z b bn+1 an+1 xn dx = − . n+1 n+1 a Hint: zie Sectie 2.1. Met de regels in Sectie 2.3 volgt dat alle polynomen worden geintegreerd zoals op school verteld: bij een polynoom p(x) kies je een nieuw polynoom P (x) met de eigenschap dat P 0 (x) = p(x) en P (0) = 0. Dat kunnen we als we weten hoe we polynomen differenti¨eren. Voortbouwend op Opgave 16 is het niet moeilijk in te zien dat Z b p(x) dx = [P (x)]ba = P (b) − P (a). a
Deze primitieve P van p is, dankzij de keuze P (0) = 0, uniek bepaald. Dit is de hoofdstelling van de integraalrekening voor polynomen. Opgave 17. Overtuig jezelf van deze hoofdstelling, uitgaande van Opgave 16, en de regels hierboven. Een veelvoorkomende integraal van dit type19 is Z 1 β(n, m) = xn−1 (1 − x)m−1 dx, 0
die op grond van wat we nu weten bestaat voor alle positieve gehele m en n. Uitrekenen met de hoofdstelling is tamelijk vervelend, maar: Opgave 18. Laat zien dat β(n + 1, m) + β(n, m + 1) = β(n, m) = β(m, n). Met β(n, 1) = n1 kun je zo in het n, m vlak op de roosterpunten in het eerste kwadrant de waarden van β(n, m) eenvoudig invullen. Een soort driehoek van Pascal op zijn kant, die de andere kant opgaat. De volgende opgave is geeft het antwoord en vraagt om verificatie via de betrekking hierboven. Het is natuurlijk leuker om het gegeven antwoord te negeren en het zelf af te leiden.... Opgave 19. Laat zien dat β(n, m) =
(n − 1)!(m − 1)! . (n + m − 1)!
De integraal Z β(n, m) =
1
xn−1 (1 − x)m−1 dx =
0 19 Google:
beta functie.
13
(n − 1)!(m − 1)! (n + m − 1)!
vertelt ons wat de oppervlakte is van {(x, y) : 0 ≤ y ≤ xn−1 (1 − x)m−1 , 0 ≤ x ≤ 1} . Vooruitlopend op Sectie 3 veranderen we de schaal op de x-as door de eenheden met een factor m te schalen. Waar 1 stond zetten we m en daarna laten we m groot worden: Opgave 20. Laat zien dat Z m x mn+1 m! n! xn (1 − )m dx = → n! m (m + n + 1)! 0 als m → ∞. Beredeneer met behulp van de definitie van e−x = exp(−x) als (negatieve) rente op rente limiet, hoe bijgevolg de integraalformule voor n! verschijnt. In de volgende sectie kijken we in meer detail naar het schaalargument en de limietovergang hierboven, aansluitend bij de vorige cursus en de introductie van exp(x) = ex .
3
Schuiven, schalen, meten en limieten
Vaak bevatten de functies in integralen een parameter, bijvoorbeeld n, die we groot kunnen (of willen) kiezen. Als we de grafieken van zulke functies in ´e´en plaatje proberen te tekenen, en ook nog eens een positieve eindige oppervlakte onder de grafiek willen overhouden in de limiet, dan lukt dat meestal niet goed, tenzij we oorsprong en schaalverdelingen aanpassen naarmate n groter wordt. Dit schuiven en schalen van grafieken is een onderwerp dat tegenwoordig in de schoolboekjes aan de orde komt. In deze cursus zullen we zien wat de kracht van deze methoden is, als we dit doen met families van functies geparametriseerd door n, en daarbij een met zorg geprepareerde limietovergang verkennen. Die limietovergang leidt tot fundamentelere vragen over wat oppervlaktemeting, dus het vinden van een 2-dimensionale maat voor deelverzamelingen van het vlak, eigenlijk is. En die vraag beperkt zich natuurlijk weer niet tot dimensie 2. We zullen maattheorie hieronder wiskundig beschrijven, met wat filosofische kanttekeningen en aan de hand van voorbeelden. Precieze bewijsvoering laten we achterwege. Maar eerst een voorbeeld van hoe grafieken via schuiven, schalen en limieten tot nieuwe functies leiden, uitgaande weer van de makkelijkste functies die we kennen, polynomen, en wat er daarbij gebeurt met oppervlakten. Oppervlakten die de kansrekenaar bij voorkeur gelijk houdt aan 1.
3.1
Van xn naar ex
We gaan terug naar An =
1 = de oppervlakte van {(x, y) : 0 ≤ y ≤ xn ≤ 1} . n+1
Maken we hierin n groot, dan wordt deze oppervlakte steeds kleiner, en ook van de grafiek zelf blijft niet veel over. Leuker wordt het als op de schaalverdeling 14
van de x-as de 1 vervangen wordt door n. Om beide assen vervolgens met dezelfde schaal te tekenen rekken we het plaatje horizontaal uit met een factor n, waarbij de oppervlakte dus n keer zo groot wordt. Opgave 21. Overtuig jezelf er zo van dat de oppervlakte van x n ≤ 1} {(x, y) : 0 ≤ y ≤ n gelijk is aan
n n+1 .
Maak een plaatje!
Opgave 22. Maken we nu n groot dan gebeurt er iets geks. Wat doet de grafiek? En wat doet de oppervlakte? Opgave 23. Het plaatje horizontaal n naar links schuiven geeft iets minder geks. Overtuig jezelf er van dat ook de oppervlakte van de verzameling n x+n ≤ 1} Bn = {(x, y) : 0 ≤ y ≤ n gelijk is aan
n n+1
en pas het plaatje aan. Wat doet de grafiek als n groot wordt?
Je ziet dat de bovenrand van Bn wordt gegeven door n x n x+n = 1+ , y= n n de onderkant door het segment van de x-as tussen x = −n en x = 0, en de rechterkant door het segment van de y-as tussen y = 0 en y = 1. De oppervlakte n is nog steeds gelijk is aan n+1 en gaat naar 1 als n → ∞ We weten dat ex = lim (1 + n→∞
x n ) , n
en bovendien dat het rechterlid stijgt naar ex als n → ∞. Wat zou de oppervlakte van de verzameling B = {(x, y) : 0 ≤ y ≤ ex ≤ 1} n zijn? In ieder geval meer dan n+1 = 1 − n1 voor elke n, dus minstens 1. Immers, we hebben B1 ⊂ B2 ⊂ B3 ⊂ B4 ⊂ · · · ⊂ B.
Opgave 24. Ga na dat elk punt van B dat niet op de grafiek y = ex ligt, voor n groot genoeg in Bn ligt. Met andere woorden, de Bn vullen B, afgezien van zijn bovenrand geheel op. Is het nu zo dat de oppervlakte van B gelijk is aan 1, of kan de oppervlakte echt meer zijn? Deze vraag raakt het hart van wat in de wiskunde20 maattheorie genoemd wordt. Om de vraag te beantwoorden moeten we beter nadenken over wat we als definitie van oppervlakte willen gebruiken. Merk op dat B hier een onbegrensde verzameling is. Zou dat uitmaken voor het antwoord op de vraag? 20 En
in de kansrekening.
15
Terzijde, als je weet hoe je met primitieve functies integralen uitrekent, dan moet het wel lukken om in te zien dat in dit geval de oppervlakte van B gelijk aan 1 is, via de oneigenlijke integraal Z 0 0 ex dx = [ex ]−∞ = 1. −∞
Op dezelfde manier (of bijgevolg) is Z ∞
e−x dx = 1,
0
waarmee we de integraalformule alvast binnen hebben voor 0!. Zoals al opgemerkt, de formules voor n! met n = 1, n = 2, en hoger zijn snel te vinden met behulp van de veelgebruikte maar op school nagenoeg afgeschafte techniek van partieel integreren voor oneigenlijke integralen: Opgave 25. Laat met je kennis (van elders) over partieel integreren en limieten zien dat Z ∞ Z ∞ xn e−x dx = n
0
3.2
xn−1 e−x dx.
0
Maattheorie
Integreren kunnen we zoals gezegd en bekend opvatten als het bepalen van de oppervlakte onder een grafiek 21 van een (positieve) functie f . Het begrip “oppervlakte” is niet zo eenvoudig als het op het eerste gezicht lijkt, en in deze sectie willen we een tipje van de sluier oplichten over de problemen waar je tegenaan loop als je over “oppervlakte” moet nadenken zoals in de vorige sectie. De vragen die je kunt stellen zijn (onder meer de volgende): 1. Heeft elk gebied eigenlijk wel een oppervlakte? 2. Hoe bereken je oppervlakte? 3. Als je een oppervlakte niet rechtstreeks kunt berekenen of bepalen, kun je deze dan wel benaderen? De eerste vraag is een diepzinnige, en om je daarvan te overtuigen zullen we nu eerst iets zeggen over een verzameling waarvan je met recht kunt zeggen dat deze geen oppervlakte kan hebben. Om de beschrijving een beetje simpel te houden kijken we naar het gewone boloppervlak22 van een drie-dimensionale bol, zeg maar de buitenkant van een voetbal. Stel dat we een bepaald deelgebied van dat boloppervlak A noemen, en dat we dit gebied A zo kunnen draaien23 de gedraaide versie niets meer gemeen heeft met het oorspronkelijke gebied A. Deze laatste gedraaide versie van A noemen we maar even B. Het is natuurlijk duidelijk dat de oppervlakte van A niet kan veranderen door alleen maar te draaien, dus B moet dezelfde oppervlakte als A hebben. Als A en B nu ook nog een geheel disjunct zijn, dat wil zeggen, geen enkel punt gemeen hebben, 21 Eigenlijk:
tussen de grafieken van de fn ’s en de x-as. gekromd zijn speelt hier wellicht nog een rol, maar dat negeren we. 23 Eigenlijk: schuiven over het boloppervlak. 22 Het
16
dan zal de oppervlakte van A en B gezamenlijk, twee keer de oppervlakte van A moeten zijn. Tot zover geen rare dingen, en iedereen kan gebieden A en B als hierboven beschreven maken. En als ik niet twee, maar drie disjuncte gebieden wil hebben dan is dat ook niet moeilijk: ook is het duidelijk dat er gebieden A, B en C bestaan die door draaiingen uit elkaar verkregen worden, die onderling geen punten gemeen hebben met elkaar, en die gezamenlijk het hele boloppervlak vullen24 . Als we de bol zo kiezen dat het hele boloppervlak 1 is, dan moet elk van de verzamelingen A, B en C wel oppervlakte 31 hebben. Maar nu het ongelooflijke: er bestaat een heel bijzonder gebied A waarvoor we B en C als zojuist kunnen vinden, maar waarvoor ook nog drie andere draaiingen E, F en G bestaan die ook allemaal disjunct zijn, en die met zijn vieren de bol bedekken. Hieruit volgt dat de oppervlakte van A tegelijkertijd 13 en 14 moet zijn, en zijn we dus in een crisis terechtgekomen. De enige mogelijke uitweg is dat voor dit gebied A simpelweg geen oppervlakte bestaat. Het gebied A kan geen oppervlakte hebben, want als dat zo zou zijn, zou de waarde ervan tegelijkertijd 31 en 14 moeten zijn. Deze fantastische paradox heet de Banach-Tarskii paradox, genoemd naar twee Poolse wiskundigen die dit fenomeen beschreven hebben. Hopelijk geeft ze jullie het idee dat oppervlakte helemaal niet zo eenvoudig als je misschien in eerste instantie zou denken. We noemen ook op dit punt het feit dat bij dit onderwerp de filosofie van de wiskunde een hele grote rol speelt. Meestal maken wiskundigen zich niet zo druk over wat wiskunde nu werkelijk is, maar in dit geval komt niemand daar onderuit. De verzameling A die we hiervoor bespraken met die hele bijzondere eigenschap, kan alleen maar gemaakt worden als je het beruchte keuzeaxioma gebruikt. Het voert wellicht te ver om dit axioma hier in al haar facetten te bespreken, maar het komt er op neer dat je dat axioma wel of niet kunt accepteren, en dat deze twee keuzes aanleiding geven tot hele verschillende soorten wiskunde. Veel auteurs, waaronder Ronald, hebben geen enkel probleem bij het accepteren van dit axioma, maar Joost wel. Voor mensen als Joost is het bestaan van de verzameling A waar we het net over hadden niet zo duidelijk. We geven een elementairder voorbeeld waarin het keuzeaxioma gebruikt wordt om een rare verzameling te maken25 . Neem een cirkel met straal 1 en (dus) omtrek 2π. Beschrijf de punten op de cirkel met een hoek die je schrijft als 2πα. Die α is op veelvouden van 1 na uniek bepaald. We noemen twee punten met bijbehorende α en β equivalent als α − β een breuk is, een rationaal getal dus. De cirkel wordt zo onderverdeeld in equivalentieklassen. Zo’n klasse krijg je door een punt op de cirkel te kiezen en dat punt met alle punten die equivalent zijn met dat punt in ´e´en klasse te stoppen. Elke klasse heeft zo aftelbaar oneindig veel punten. Op deze manier krijg je een onderverdeling van de cirkel in equivalentieklassen. Maar dat vergt wel overaftelbaar veel equivalentieklassen! Kies26 nu uit elke klasse precies ´e´en punt, om met die punten een deelverzameling A van de cirkel vormen. Deze A kan over alle mogelijk hoeken 2πα met α rationaal en tussen 0 en 1. Al deze gedraaide A0 vormen samen de hele cirkel, die lengte 2π heeft. Heeft A zelf een (boog-)lengte? De constructie van de A van Banach en Tarskii is enigszins vergelijkbaar met de constructie 24 Denk
maar aan een meloen die in drie stukken wordt gesneden. non. 26 Ga er maar aan staan. 25 Quod
17
van A op de cirkel. Voor Joost bestaat A niet echt, omdat je niet overaftelbaar veel keuzes kunt maken; voor Ronald is het geen probleem. Dit alles neemt niet weg dat intu¨ıtie voor oppervlaktes vaak correct is. Een rechte lijn bijvoorbeeld heeft oppervlakte 0, hoe lang hij ook is. Ook de grafiek van een (voldoende nette) functie zelf (dus niet het gebied eronder) heeft oppervlakte 0. Heel eenvoudig is dat echter allemaal niet, en de theorie die dit alles bespreekt heet de maattheorie, een prachtig maar wel moeilijk vak. Zoals gezegd is integreren eigenlijk niets anders dan het bepalen van een oppervlakte. We hebben al gezien bij het uitrekenen van de oppervlakte onder de grafiek van een polynoom dat we de oppervlakte onder zo’n grafiek benaderen door steeds meer rechthoekjes te nemen, die beter en beter gaan passen in het gebied waarin we zijn ge¨ınteresseerd. Het blijkt zo te zijn dat deze methode voor veel gebieden27 werkt. Er zijn verschillende manieren om dit te formaliseren, en we kiezen de volgende; het resultaat staat bekend als de monotone convergentie stelling. De monotone convergentiestelling 1 Stel we hebben niet-negatieve integreerbare functies f1 , f2 , f3 , . . . die puntsgewijs stijgen naar een limietfunctie f , dat wil zeggen dat fn (x) naar f (x) stijgt. Dan geldt dat Z
b
Z fn (x) →
a
b
f (x)dx, a
dus de oppervlaktes onder de grafieken stijgen naar de oppervlakte onder de grafiek van f . Een soortgelijke uitspraak geldt als bijvoorbeeld de ondergrens ook van n afhangt, dus a = an , waarbij an een niet-stijgende rij is. Als we het maar hebben over integralen die de oppervlakten van steeds groter wordende gebieden beschrijven, precies zoals in Opgave 24 en daarboven. Het geval dat an → −∞ is nadrukkelijk toegestaan, maar je krijgt dan wel een oneigenlijke28 integraal, met ondergrens −∞ in de limiet. Of ∞ als bovengrens in het geval dat de bovengrenzen bn stijgen met bn → ∞, zie Opgave 20. De integraalformule voor n! volgt dus inderdaad via de intu¨ıtief aannemelijke limietovergang in Opgave 20. En die limietovergang kan nu dus precies gemaakt worden. Eigenlijk hebben we dit al gebruikt bij het bepalen van de integraal van xn . Misschien ben je helemaal niet verbaasd dat dit waar is, en voel je dat intu¨ıtief ook wel aan. Dan is het goed te bedenken dat de stelling niet langer waar is als we afzien van het stijgen. Dat zag je al een beetje bij Opgave 22. Zelfs als de functies fn dalen naar f hoeft het niet goed te gaan. Een eenvoudig voorbeeld dat dit illustreert is het volgende. Neem fn (x) = n1 voor alle x. De grafiek van deze functie is gewoon een horizontale rechte lijn op hoogte n1 . De oppervlakte tussen deze grafiek en de x-as moet wel oneindig zijn, voor alle n, want je kunt 1 en breedte 2n2 tussen leggen. De limietfunctie er een rechthoek met hoogte 2n is de functie gegeven door f (x) = 0 voor alle x. De grafiek van deze functie is precies de x-as, en de oppervlakte onder deze grafiek kan niet anders dan 0 zijn. De oppervlaktes dalen dus niet mee! Het blijkt dat de speciale rol die oneindig hier speelt moet worden uitgesloten in de formulering van een correcte stelling: we kunnen het probleem oplossen 27 Maar
niet allemaal, neem bijvoorbeeld het eenheidsvierkant zonder de rationale punten. bovensommen zijn dan niet meer bruikbaar in de definities.
28 Eindige
18
door te eisen dat de oppervlakte onder elk van de fn ’s eindig is. Als we dat eisen, dan kunnen we weer een monotone convergentie stelling formuleren, nu voor dalende functies: De monotone convergentiestelling 2 Stel we hebben positieve functies f1 , f2 , f3 , . . . die puntsgewijs dalen naar een limietfunctie f , dat wil zeggen dat fn (x) naar Rb f (x) daalt. Stel bovendien dat a fn (x)dx eindig is voor elke n. Dan geldt dat Z
b
Z fn (x) →
a
b
f (x)dx, a
dus de oppervlaktes onder de grafieken van de fn ’s dalen naar de oppervlakte onder de grafiek van f . Zowel a = −∞ als b = ∞ zijn hier toegestaan. Je kunt natuurlijk ook situaties bedenken waarbij de positieve functies f1 , f2 , f3 , . . . helemaal niet monotoon zijn, en “alleen maar” convergeren naar een limietfunctie f . Convergeren de oppervlaktes onder de grafiek nu altijd mee als we eisen dat de oppervlakte onder elke van de grafieken van de fn eindig is? Je zou natuurlijk hopen dat dit waar is, maar helaas, dat is niet zo. Hier is een instructief voorbeeld dat de problemen goed illustreert. Neem de functie fn gegeven door fn (x) = n voor x ∈ (0, n1 ), en fn (x) = 0 voor alle andere x. De oppervlakte onder grafiek van fn is n1 × n = 1, voor alle n. Echter, fn (x) convergeert naar 0, voor alle x, dus de limietfunctie is weer f (x) = 0, en de oppervlakte onder de grafiek hiervan is weer 0 en niet 1. Vergelijk dit ook weer met Opgave 22. Hoe kun je nu in het algemeen garanderen dat de oppervlakte onder de grafieken “mee convergeert”? Het volgende resultaat geeft aan wat een voldoende voorwaarde is. De gedomineerde convergentiestelling Stel we hebben positieve functies f1 , f2 , f3 , . . . op (a, b) die puntsgewijs convergeren naar een limietfunctie f , dus fn (x) convergeert naar f (x) voor elke x. Stel bovendien dat er een functie g bestaat Rb zodanig dat fn (x) ≤ g(x) voor alle x en zodanig dat a g(x)dx eindig is. Dan geldt dat Z b Z b fn (x) → f (x)dx, a
a
dus de oppervlaktes onder de grafieken van de fn ’s convergeren naar de oppervlakte onder de grafiek van f . Ook dit geldt weer in de oneigenlijke gevallen a = −∞ en/of b = ∞. Het is onbegonnen werk om deze stellingen in een elementaire cursus te begrijpen, ook omdat ze bewezen worden zonder enige aanname op de limietfunctie zelf, behalve dat die functie bijna overal de puntsgewijze limiet is van de integreerbare functies fn , waaronder in de Lebesgue theorie voor integralen nu ook functies als in Opgave 15. De maattheorie van Lebesgue is gebaseerd op de uitwendige maat van verzamelingen in het vlak, waarbij je met aftelbaar veel rechthoekjes de te meten verzameling zo zuinig mogelijk probeert te overdekken. De grootste ondergrens op de hoeveelheid oppervlaktemaat aan rechthoekjes die je daarvoor nodig hebt heet de uitwendige maat. Bewijzen dat de uitwendige maat van een vereniging van twee disjuncte verzamelingen de som is van van de afzonderlijke uitwendige maten is onmogelijk, want met het keuze-axioma kun je tegenvoorbeelden maken. En ook al accepteer je die tegenvoorbeelden
19
niet, zonder extra axioma’s is een bewijs van wat je zou hopen of verwachten onmogelijk, juist vanwege de verworpen tegenvoorbeelden. Confused? Wij ook, maar het is niet anders.
3.3
Stirling’s formule
Nu we weten dat
Z n! =
∞
xn e−x dx,
0
is n! dus te zien als de oppervlakte van het onbegrensde gebied Gn in het xy-vlak gedefinieerd door Gn = {(x, y) : 0 ≤ y ≤ fn (x)},
met
fn (x) = xn e−x .
We laten n = 0 vanaf nu buiten beschouwing, want we gaan n zo toch groot nemen. Indachtig de volkswijsheid dat de meeste vis tussen kop en staart zit, kijken we naar het maximum van de functie fn (x) op het x-interval [0, ∞). Dit maximum vinden we door fn (x) te differenti¨eren en gelijk aan nul te stellen, een vast item in het functieonderzoek29 van een functie en het tekenen/schetsen van de grafiek. Opgave 26. De grafiek van fn kan al radend geschetst worden door eerst te zien hoe deze erbij x = 0 en x = +∞ uit moet zien, gebruikmakend van e−x =
1 1 , = 1 x 2 e 1 + x + 2 x + 16 x2 + · · ·
en daarna de simpelste grafiek te tekenen die hier bij past. Doe dit. Opgave 27. Gebruik de regels van de differentiaalrekening om af te leiden dat er maar ´e´en nulpunt is van fn0 (x), namelijk x = n. Opgave 28. Hoe concludeer je dat fn (x) precies een maximum, vanaf nu Mn genoemd, heeft, en wel in x = n? Laat door berekening zien dat n n Mn = . e Met de laatste opgave is de belangrijkste factor in Stirling’s formule ge¨ıdentificeerd! Opgave 29. Neem nu een stuk papier en maak een schets van de grafiek van fn (x) = xn e−x waarin x-as, y-as en het punt (n, Mn ) duidelijk zijn aangegeven, stippellijntjes naar de assen toe getekend, en de co¨ordinaten n en Mn aangegeven op de assen. Opgave 30. Doe Opgave 29 nog een keer en neem een pen met een andere kleur. Kies in de grafiek het verticale stippellijntje als nieuwe verticale as, en zet naast het maximum niet Mn = ( ne )n maar 1 neer. Teken de nieuwe as. Waar 29 Waar
je meer van leert dan plotten met de GR.
20
op de horizontale as n stond, zet je nu 0 neer. Leg uit waarom in het nieuwe assenstelsel je nu de grafiek van de functie gn (x) = (1 +
x n −x ) e n
hebt staan, en waarom de oppervlakte tussen grafiek en x-as gelijk is aan Z ∞ e gn (x)dx = n! ( )n . n −n Het is niet te verwachten dat deze uitdrukking een limiet heeft als n → ∞ omdat voor elke x geldt dat lim gn (x) = 1,
n→∞
maar als we de juiste factor vinden om horizontaal mee te schalen dan lukt het misschien om wel een limietoppervlakte te vinden. Daartoe schrijven we gn (x) als gn (x) = e−ψn (x) , waarin ψn (0) = 0 en ψn (x) > 0 voor 0 6= x > −n. Dit kan, door ψn (x) = − ln gn (x) te stellen, waarin ln de inverse functie is van exp. Die inverse maken we via de vergelijking ex = exp(x) = y, die voor elke positieve y precies ´e´en oplossing heeft. Dit lijkt evident30 , maar het bewijs van deze uitspraak laten we achterwege. Een meer precieze introductie van IR is daarvoor nodig. We gebruiken de uitspraak wel, om de natuurlijke logaritme van een positief getal y te defini¨eren middels exp(x) = y
⇔
x = ln y
Deze defini¨erende uitspraak accepterend zijn deze opgaven niet moeilijk: Opgave 31. Laat zien dat voor a > 0 en b > 0 geldt dat ln(ab) = ln a + ln b. Opgave 32. Laat zien dat ψn (x) = x − n ln(1 +
x ). n
Opgave 33. Waarom heeft deze functie in x = 0 een minimum (gelijk aan 0)? Opgave 34. Wat kun je concluderen over ψn (x) als n → ∞ op basis van lim gn (x) = 1?
n→∞ 30 Waarom?
21
Kortom, alle informatie verdwijnt uit ψn (x) als n → ∞. De grafiek van ψn gaat steeds meer op de x-as lijken. Door x te schalen en de grafiek van ψn naar de y-as toe te trekken is dit misschien te voorkomen. Schalen we verkeerd (met een te grote factor), dan blijft in de limiet alleen de y-as over. Hoe vinden we een schalingsfactor (die van n afhangt) waarmee we in de limiet iets zien, en wat zullen we dan zien? De grafiek van een functie? Wat voor functie? Voor al deze vragen hebben we een beschrijving nodig van hoe ψn (x) zich bij x = 0 gedraagt, en we zoeken een schalingsfactor waarmee, na schalen, die beschrijving niet alleen in de buurt van 0 maar veel globaler geldig is. De lastige term in ψn (x) is (min) x n ln(1 + ), n een uitdrukking waarvan de grafiek x y = n ln(1 + ) n steeds meer op de diagonaal y = x gaat lijken als n → ∞. Immers de grafiek y = n ln(1 + nx ) is de grafiek van y = ln(1 + x), ingezoomed naar de oorsprong met een schalingsfactor n. Opgave 35. Verifieer en relateer dit aan de manier waarop differenti¨eren kan worden uitgelegd. Inzoomen moet rechtmaken wat krom is. Wat is de afgeleide van ln(1 + x) naar x in x = 0? Helaas, deze informatie is niet goed genoeg. We moeten juist weten wat er overblijft als we x en n ln(1 + nx ) van elkaar aftrekken. Een beschrijving als machtreeks in x van n ln(1 + nx ) zal uitkomst bieden. Daartoe eerst een beschrijving van ln(1 + x) zelf, en die begint met de afgeleide van de functie ln. Opgave 36. De raaklijn aan een grafiek wordt bepaald met behulp van de afgeleide. Gebruik de defini¨erende equivalentie ⇔
exp(x) = y
x = ln y
voor ln y om te laten zien dat de afgeleide van ln y naar y gelijk is aan y > 0. Hint: de afgeleide van ex is ex . Opgave 37. De afgeleide van ln(1+x) is gelijk aan
1 1+x
1 y
voor
voor x > −1. Waarom?
Van die afgeleide weten we iets: Opgave 38. Leg uit waarom 1 = 1 − x + x2 − x3 + x4 − x5 + · · · 1+x voor −1 < x < 1. Opgave 39. Als we machtreeksen mogen differenti¨eren dan hebben op grond van Opgave 37 en Opgave 38 de functies ln(1 + x)
en
x−
x2 x3 x4 + − + ··· 2 3 4
dezelfde afgeleide voor −1 < x < 1. Leg uit waarom. 22
Opgave 40. Zijn de functies ln(1 + x)
en
x−
x2 x3 x4 + − + ··· 2 3 4
gelijk voor −1 < x < 1? Welke uitspraak, die we hier niet zullen bewijzen, gebruik je daartoe? Opgave 41. Op grond van Opgave 39 weten we voor −1 < x < 1 nu dat ln(1 + x) = x −
x2 x3 x4 + − + ··· 2 3 4
Laat zien dat ψn (x) = − ln gn (x) = x − n ln(1 +
x4 x2 x3 x )= − 2 + 3 − ··· n 2n 3n 4n
Voor welke x geldt deze uitdrukking? Opgave 42. Met welke factor zou je horizontaal moeten schalen om wel een nette limietfunctie te krijgen voor ψn (x)? In de buurt van x = 0 geldt kennelijk gn (x) = (1 +
x2 x3 x4 x4 x3 x2 x n −x ) e = e− 2n + 3n2 − 4n3 +··· = e− 2n e 3n2 − 4n3 +··· , n
een functie met een maximum 1 = gn (0) in x = 0, die in de limiet steeds meer op 1 gaat lijken. √ Opgave 43. Waarom ligt het dus voor de hand om x = s n te stellen? Definieer de functies φn door ψn (x) = φn (s) en laat zien dat √ s φn (s) = s n − n ln(1 + √ ) n Opgave 44. Stel n = λ2 , λ > 0, om de wortels weg te werken. Dan is φn (s) = λs − λ2 ln(1 +
s ) λ
De vraag is hoe dit zich gedraagt als λ stijgt. Onderzoek dit met de GR of een ander hulpmiddel. Opgave 45. Differentieer de laatste uitdrukking naar λ en daarna naar s en laat zien dat daar s2 (λ + s)2 uitkomt. Hoe kun je dit gebruiken om te concluderen dat φn (s) stijgt met n als s < 0 en daalt als s > 0? Opgave 46. Laat zien dat φn (s) →
23
s2 . 2
Opgave 47. Waarom is Z
∞
−
√
e 1 e−φn (s) ds = n! ( )n √ ? n n n
Opgave 48. De vorige twee opgaven suggereren dat Z ∞ s2 e n 1 √ n! ( ) → e− 2 ds, n n −∞ of wel dat
n √ n! ∼ ( )n n e
Z
∞
e−
s2 2
ds,
−∞
als n → ∞. Kun je dit nu inzien met de stellingen in Sectie 3.2?
4
De integraal
R∞
− 12 x2 dx −∞ e
Wat nu nog rest is het uitrekenen van de integraal in de titel van deze paragraaf. We kunnen dat niet doen door een primitieve te vinden, en zullen in plaats daarvan een rechtsstreeks argument geven dat aansluit bij de filosofie van deze cursus. In deze berekening zal ook duidelijk worden hoe π in het antwoord terecht komt. Allereerst een mooie truc: we kijken eerst naar de functie 1
e− 2 (x
2
+y 2 )
en we gaan kijken naar het volume onder de grafiek van deze tweedimensionale functie. Waarom? Welnu, we beweren dat dit volume het kwadraat is van de 1 2 oppervlakte onder e− 2 x . Dit kunnen we als volgt inzien, waarbij we de uitleg wat versimpelen door de symmetrie in x en in y te gebruiken. We kijken dan alleen naar x ≥ 0 en y ≥ 0. De functie f met functievoorschrift 1
f (x) = e− 2 x
2
heeft de eigenschap dat f (x) = f (−x) > 0 en dat de oppervlakte in het xy-vlak Z ∞ Z ∞ A= f (x)dx = 2 f (x)dx −∞
0
onder de grafiek y = f (x) van f eindig is. Gegeven deze f kunnen we ook kijken naar het volume B van het gebied in de xyz-ruimte tussen z = 0 en z = f (x)f (y), en dat is weer 4 keer de inhoud van het gebied waar x ≥ 0 en y ≥ 0. In de volgende opgaven gaan we laten zien dat B = A2 door te laten zien dat B4 = ( A2 )2 . We kunnen A2 benaderen door onder- of bovensommen zoals we eerder beschreven. Laten we naar ondersommen kijken, dus we benaderen A2 met de totale opper1 k 2 vlakte van allemaal rechthoekjes met breedte n1 en hoogte e− 2 ( n ) , voor k = (n) 1, 2, . . . De oppervlakte van deze rechthoekjes noemen we even ak , k = 1, 2, . . ., A dus de totale ondersom voor 2 wordt ∞ X
(n)
ak .
k=1
24
Als we liever met eindige sommen werken dan nemen we 2
n X
(n)
ak ,
k=1
waarmee we op steeds grotere x-intervallen [0, n] de oppervlakte onder de grafiek benaderen. Onze monotone convergentiestelling garandeert dat we zo ook de totale oppervlakte A2 onder de grafiek op [0, ∞) krijgen in de limiet. Opgave 49. Bedenk nu dat we het volume onder z = f (x)f (y) van onderen kunnen benaderen door het product 2 2 n n X X (n) a × a(n) m k
m=1
k=1 (n) (n)
door ak am meetkundig te interpreteren. Concludeer dat
B 4
= ( A2 )2 .
We hebben nu dus rechthoekjes en “blokjes” gebruikt om aan te tonen dat B = A2 . Om nu B ook daadwerkelijk uit te rekenen gaan we iets anders doen: we benaderen het volume met cylinders. Neem een natuurlijk getal n (straks laten we n groter en groter worden) en bekijk de concentrische cirkels met middelpunt de oorsprong, en straal nk , voor k = 1, 2, 3, . . . Voor het gemak noemen we die cirkels Cn,k . De functie die we integreren is radiaal symmetrisch, en de waarde van de functie tussen Cn,k+1 en Cn,k zit tussen k2
e− 2n2
en e−
(k+1)2 2n2
.
Dit betekent dat het volume onder de grafiek van boven benaderd kan worden en minder is dan ∞ X
k2
(oppervlakte tussen Cn,k+1 en Cn,k ) · e− 2n2
k=0
De oppervlakte tussen Cn,k+1 en Cn,k is 2 2 k+1 k 2k 1 2πk π π −π =π + = 2 + 2, 2 2 n n n n n n en de som van zojuist is dus gelijk aan ∞ ∞ ∞ X X k2 π 1 k − 1 ( k )2 π X 1 − 1 ( k )2 2πk − 2n 2 2 n + e = 2π e + e 2 n . n2 n2 nn n n k=0
k=0
k=0
De eerste som aan de rechterkant convergeert, als n naar oneindig gaat, naar de integraal Z ∞
1
2
xe− 2 x dx,
0 1
2
en aangezien de primitieve van deze integrand gewoon −e− 2 x is, komt er uit deze integraal natuurlijk 1. De tweede som convergeert ook naar een eindige integraal Z ∞
1
2
e− 2 x dx,
0
25
en dus convergeert de hele term naar 0 als n naar oneindig gaat, vanwege de nπ term die voor de som staat. Hieruit concluderen we dat het volume B waar we naar zochten gelijk is aan 2π. En dus volgt nu dat Z ∞ √ 1 2 e− 2 x dx = 2π. −∞
De reden dat er een π verschijnt in de uitkomst heeft dus niet alleen te maken met het feit dat we een e-macht hebben, maar meer in het bijzonder met het feit dat er een kwadratische term in de exponent staat. Deze kwadratische term zorgt ervoor dat wanneer we de functie met “zichzelf” vermenigvuldigen, de tweedimensionale functie die we dan krijgen alleen van x en y afhangt via de afstand tot de oorsprong. Dit betekent dat we het volume goed kunnen benaderen met cylinders, en het volume van zo’n cylinder is natuurlijk een formule waar π in voorkomt. Voor de volledigheid, een benadering van onderen met ∞ X
(oppervlakte tussen Cn,k+1 en Cn,k ) · e−
(k+1)2 2n2
k=0
geeft natuurlijk dezelfde limiet als we n naar oneindig sturen.
5
De centrale limietstelling
Nu we alles weten over Stirling’s formule kunnen we hier weer spannende kansrekening mee doen. We kennen allemaal de centrale limietstelling - misschien heel gedetailleerd of alleen maar van horen zeggen. De centrale limietstelling (we korten die vanaf nu af met CLS) is altijd omgeven door een zekere mate van magie. De normale verdeling (die de hoofdrol speelt in dit drama) komt hier op het eerste gezicht een beetje uit de lucht vallen, en het is helemaal niet duidelijk dat Stirling hier ook maar iets mee te maken heeft. In dit hoofdstuk gaan we uitleggen hoe het precies zit, in de muntwerpcontext. We gaan ons dus niet bezig houden met de algemene CLS, maar beperken ons tot het geval waar we muntworpen blijven herhalen, en we het aantal koppen tellen. Eerst een beetje notatie. Stel we gooien n keer met een zuivere munt. Het aantal keer dat we kop gooien noemen we Kn , en het aantal keer dat we munt gooien noemen we Mn . We zijn vooral ge¨ınteresseerd in het verschil Sn = Kn − Mn . Deze Sn is natuurlijk stochastisch, wat niets anders betekent dan dat wanneer we het experiment herhalen, de uitkomst vast niet hetzelfde zal zijn. Het gaat ons nu om de volgende stelling: Centrale limiet stelling Voor elke a < b geldt dat Z b 1 2 Sn 1 √ e− 2 x dx, P a≤ √ ≤b → n 2π a als n → ∞.
26
√ √ In woorden betekent dit: de kans dat Sn tussen a n en b n zit, is voor n groot genoeg ongeveer gelijk aan de integraal aan de rechterkant. De functie die ge¨ıntegreerd wordt is de beroemde Gauss-kromme, door sommigen ook wel “bel-vormige curve” genoemd, maar die terminologie vermijden we hier liever, al is het alleen maar omdat er ook “bel-vormige” curves bestaan die geen Gauss kromme zijn. Het is op het eerste gezicht volstrekt onduidelijk waar de e-macht vandaan komt; eigenlijk is alles volstrekt onduidelijk, maar we zullen in het vervolg zien dat er een hele goede reden is voor dit resultaat, en die reden is de formule √ van Stirling. Die formule legt uit - zo zullen we zien - waar toch die factor n vandaan komt. We beginnen met een uitdrukking voor de kans dat Sn een bepaalde waarde aanneemt. Het is handig om in het begin alleen een even aantal muntworpen te nemen, dus we doen net of dat mag en kijken dus naar S2n . We beweren dat 2n P (S2n = 2k) = 2−2n . (5.2) n+k Dit ziet er ingewikkeld uit maar dat valt bij nader inzien reuze mee. De reden dat de formule waar is, is de volgende: Als we 2n keer met een munt gooien dan zijn er 22n mogelijke rijtjes van uitkomsten die allemaal dezelfde kans hebben. Aangezien we in totaal kans 1 moeten hebben, betekent dit dat elk rijtje kans 2−2n moet hebben. Dat is de factor aan de rechterkant. Nu moeten we nog weten hoeveel mogelijkheden er zijn om na 2n keer gooien op S2n = 2k uit te komen. Welnu, S2n = 2k is hetzelfde als K2n − M2n = 2k. Dit is 1 vergelijking met 2 onbekenden, maar we weten ook nog dat K2n + M2n = 2n. Dit geeft 2 vergelijkingen met 2 onbekenden, en als we die oplossen vinden we K2n = n + k en M2n = n − k. Dit betekent dat wanneer je op S2n = 2k uit wilt komen, je n + k keer kop moet gooien en n − k keer munt. Rest ons niets anders dan ons 2n te realiseren dat we dit op n+k manieren kunnen doen, en daaruit volgt (5.2). Met deze formule in de hand doet Stirling de rest, hoewel je nog wel even stevig moet rekenen. Stirling’s formule zegt dat √ n! ∼ nn e−n 2πn,
27
als n → ∞. Als we dit toepassen op (5.2) leidt dit tot de volgende berekening: 2n (2n)! 2−2n = 2−2n n+k (n + k)!(n − k)! 1
∼ =
=
=
(2n)2n 2−2n (2π(2n)) 2 · (n + k)n+k (n − k)n−k (2π(n + k)) 21 (2π(n − k)) 21 n+k n−k n n n+k n−k 21 21 1 n n × · (πn)− 2 n+k n−k −n−k −n+k k k 1+ 1− n n − 12 − 12 1 k k × 1+ 1− · (πn)− 2 n n −k k −n k k2 k 1− 1− 2 1+ n n n − 12 − 12 1 k k × 1+ 1− · (πn)− 2 n n
Nu komt de grote ontdekking. We weten dat x n = ex , lim 1 + n→∞ n voor alle x ∈ R. Het is in eerste instantie niet helemaal duidelijk wat dit met bovenstaande formule te makenan ∼ bn heeft, maar dit verandert totaal als we toelaten dat k van n mag gaan afhangen! (Achteraf bezien is dat ook best logisch.) Een beetje puzzelen laat zien dat als we 2k zo kiezen dat ze ongeveer √ gelijk is aan x 2n (met x een willekeurig √ getal) alles prachtig gaat uitkomen. We negeren hierbij het probleempje dat x 2n geen geheel getal is. De derde factor bijvoorbeeld kan nu geschreven worden als
k2 1− 2 n
−n
−n 1 2 x2 = 1− → e2x , 2n
als n → ∞. Voor de andere factoren vinden we −k k 1+ n
=
x 1+ √ 2n
=
1+ 1
−x√ n2
1 2 2x p x n2
2
→ e− 2 x , als n → ∞, en evenzo k 1 2 k 1− → e− 2 x . n 28
!−x√ n2
1
1
De overige factoren (1 + nk )− 2 and (1 − nk )− 2 convergeren allebei naar 1 als n → ∞. Alles bij elkaar geeft dit dus √ 1 1 2 P (S2n = x 2n) ∼ (πn)− 2 e− 2 x . Het is heel belangrijk om in te zien wat √ we gedaan hebben. De berekening dwong ons om k als een veelvoud van n te kiezen, anders zou er helemaal geen limietwaarde zijn voor de gevraagde kans. Kennelijk is S2n “typisch van √ de orde” 2n: het verschil tussen het aantal keer √ kop en aantal keer munt na n keer gooien is kennelijk typisch van de orde n - een conclusie die vrijwel rechtsstreeks uit de formule van Stirling volgt. Dit feit motiveert ons om dan maar √ √ P (a 2n ≤ S2n ≤ b 2n), uit te gaan rekenen voor a < b. Dit is een technische kwestie, maar niet heel lang of ingewikkeld: X √ √ P (a 2n ≤ S2n ≤ b 2n) = P (S2n = 2m) √ √ m:a 2n≤2m≤b 2n
X
=
√ m:a≤2m/ 2n≤b
P (S2n = 2m) 1
X
∼
1
2
(πn)− 2 e− 2 x , √
a≤x≤b: x∈2Z/ 2n
√ √ waar de laatste gelijkheid volgt uit de substitutie 2m = x 2n, en waar 2Z/ 2n √ de verzameling {2z/ 2n : z ∈ Z} is. Als we de laatste som herschrijven als X √ a≤x≤b: x∈2Z/ 2n
1 1 2 2 1 (2π)− 2 e− 2 x ( ) 2 , n
dan zien we (teken een plaatje!) dat als n → ∞, de som convergeert naar de oppervlakte onder de grafiek van 1 2 1 √ e− 2 x 2π
tussen x = a en x = b, en dat is precies de integraal die we zochten.
6
Differentiaalvergelijkingen
We hebben gezien dat voor alle re¨ele x geldt dat x2 x3 x4 x n 1+x+ + + + · · · = lim 1 + = exp(x) = ex , n→∞ 2! 3! 4! n waarin e = exp(1). De multiplicatieve eigenschap van de door de rente-op-rente limiet gedefinieerde functie exp, x n exp(x) = lim 1 + , n→∞ n 29
rechtvaardigde de conclusie dat exp(x) = ex , en in het bewijs dat de limiet bestond ontdekten we dat lim
n→∞
1+
x2 x n x3 x4 =1+x+ + + + ··· , n 2! 3! 4!
een machtreeks in x, waarmee je ex veel sneller uitrekent dat met de rente-oprente limiet. Bovendien, je kunt met machtreeksen vrij makkelijk symbolisch rekenen, bijna net zo makkelijk en met dezelfde betekenis als met polynomen. Net als polynomen zijn machtreeksen opgebouwd uit monomen. Polynomen kunnen we differenti¨eren omdat we monomen kunnen differenti¨eren en daarmee ook polynomen: eindige lineaire combinaties van monomen. In de volgende sectie zullen we zien dat dit ook waar is voor machtreeksen, “polynomen van oneindige graad” in x, als we maar wegblijven van x-waarden waarvoor de machtreeks geen betekenis heeft. In het voorbeeld van ex = exp(x) is er dus geen enkele beperking op x. We differenti¨eren de machtreeks term voor term en we zien dat de machtreeks zijn eigen afgeleide is. Kortom, y = y(x) = exp(x) is een oplossing van de differentiaalvergelijking y 0 (x) = y(x), die ook geschreven wordt als dy = y. dx Wie differentiaalvergelijkingen wil doen, moet zich realiseren dat bijna alle wetenschappers en engineers dat ook doen, en dat ze allemaal hun eigen notaties gebruiken. De wiskundige die kritiek heeft op de notatie y = y(x) heeft groot gelijk en wordt vriendelijk verzocht daarna niet verder door te zeuren. Vooral ook omdat de fysici een zeer effectieve kijk hebben op wat je als de afhankelijke variabelen (hier eentje: y) en de onafhankelijke variabelen (hier eentje: x) ziet, en daarbij zeer flexibel zijn in het kiezen van andere co¨ordinaten. Dit gezegd zijnde gaan we terug naar Newton, die differentiaalvergelijkingen opstelde voor de co¨ ordinaten (afhankelijke variabelen, vanaf nu meestal x, y of z genoemd, of x1 , x2 ,...) van bewegende objecten als functie van de onafhankelijke en de toen nog universele onafhankelijke tijdsvariabele t. Newton is onder andere beroemd vanwege zijn bewegingsvergelijkingen, waarin 2-de orde afgeleiden voorkomen, en de differentiaalrekening die hij als noodzakelijk gereedschap heeft ontwikkeld om u ¨berhaupt over beweging na te kunnen denken. We beginnen hier nu eerst met de eerste orde differentiaalvergelijking x˙ = x, voor x = x(t). De punt op de x staat voor afgeleide naar t. Dus x˙ = x0 =
30
dx , dt
een notatie die we alleen gebruiken voor differenti¨eren naar de tijd. Nu we met machtreeksen kunnen rekenen, kunnen we die gebruiken om differentiaalvergelijkingen op te lossen. Vul een machtreeks in, breng alles naar een kant van het = teken, sorteer en kijk wat je kunt concluderen. Net als bij polynomen kan een machtreeks alleen maar constant 0 zijn als alle co¨efci¨enten 0 zijn. Opgave 50. Vul x(t) = a0 + a1 t + a2 t2 + a3 t3 + · · · in in x˙ = x en bepaal de algemene machtreeksoplossing. Welke oplossing voldoet aan x(0) = 1? Druk de algmene oplossing uit in deze speciale oplossing. Opgave 51. Bepaal de algemene machtreeksoplossing van x ¨ + x = 0, waarin x ¨ staat voor de 2-de orde afgeleide naar t. Welke oplossing voldoet aan x(0) = 1 en x(0) ˙ = 0? Wij noemen deze oplossing vanaf nu X(t), of heb je liever een andere naam? En welke oplossing voldoet aan x(0) = 0 en x(0) ˙ = 1? Wij noemen deze tweede oplossing vanaf nu Y (t), of ....? Druk de algemene oplossing uit in X(t) en Y (t). Hebben de functies X en Y een eigenschap die vergelijkbaar is met de multiplicatieve eigenschap exp(t + s) = exp(t) exp(s) van de functie exp? De oplossingen X(t) en Y (t) bepalen een punt (x, y) = (X(t), Y (t)) in het xy-vlak. Dat punt kunnen we ook beschrijven met de positievector X(t) Y (t) waarbij we denken aan een pijltje met staart in de oorsprong (0, 0) en pijlpunt in het bewegende punt (x, y) = (X(t), Y (t)). Opgave 52. Laat zien dat ˙ X(t) −Y (t) = X(t) Y˙ (t) De vector in het linkerlid heet de snelheidsvector. Deze snelheidsvector staat loodrecht op de positievector en is even lang als de positievector. Wat betekent dit voor baan die het punt (x, y) = (X(t), Y (t)) doorloopt als we t vari¨eren? Wat deze opgave in feite laat zien is dat (x, y) = (X(t), Y (t)) een oplossing is van de twee gekoppelde differentiaalvergelijkingen x˙ = −y ;
y˙ = x,
die we ook weer kunnen oplossen door machtreeksen x(t) = a0 + a1 t + a2 t2 + a3 t3 + · · · , in te vullen. 31
y(t) = b0 + b1 t + b2 t2 + b3 t3 + · · ·
Opgave 53. Waarom kunnen we nu zeggen dat de oplossing wel X(t) = cos(t) en Y (t) = sin(t) moet zijn? Opgave 54. Laat zien dat gegeven a0 en b0 de overige coeffici¨enten uniek bepaald zijn. Met andere woorden, er is precies ´e´en oplossing (x, y) = (x(t), y(t)) die voldoet aan (x(0), y(0)) = (a0 , b0 ). Druk deze oplossing uit in a0 , b0 , X(t) en Y (t). Opgave 55. Waarom is er gegeven s, A en B ook precies ´e´en oplossing (x, y) = (x(t), y(t)) die voldoet aan (x(s), y(s)) = (A, B)? Laat nu A = X(s) en B = Y (s). Leg uit waarom de bijbehorende oplossing voldoet aan (x(t), y(t)) = (X(s + t), Y (s + t)) en druk X(s + t) en Y (s + t) uit in X(t), X(s), Y (t) en Y (s). Tenslotte kijken we naar Z(t) = X(t)+iY (t), waarbij i een (imaginair) getal is met i2 = −1. Opgave 56. Laat zien dat Z(0) = 1 en Z˙ = iZ. Wat voor formule zou je kunnen schrijven in plaats van Z(t)? De oplossingen X(t) en Y (t) van x ¨ + x = 0 komen overal in de natuur voor. De vergelijking x ¨ + x = 0 staat bekend als de lineaire slingervergelijking. Met een extra term µx˙ wordt dit de gedempte slingervergelijking x ¨ + µx˙ + x = 0, voor (bijvoorbeeld) de longitudinale trillingen in een MEMS. Door de tijd te schalen gaat de vergelijking over in x00 + x0 + x = 0, waar accenten differentiatie naar de geschaalde tijdsvariabele voorstellen. In het limiet geval = 0 verschijnt de vergelijking x0 + x = 0, die exponentieel verval beschrijft, een ander bekend natuurverschijnsel.
7
Differentiaalrekening voor machtreeksen
In de vorige cursus hebben we gezien dat exp(x) = lim (1 + n→∞
x n ) n
een stijgende functie is, die de multiplicatieve eigenschap exp(a) exp(b) = exp(a + b) heeft. Op grond daarvan schreven en schrijven we exp(x) = ex
met
32
e = exp(1),
niet alleen voor rationale getallen x, maar voor alle re¨ele getallen x, en we weten inmiddels ook dat exp0 (x) = exp(x) > 0. We hebben ook gezien dat x2 x3 x4 + + + ··· , 2! 3! 4! en dat dit een veel betere manier is om, gegeven x, ex uit te rekenen. Met een beetje goede wil kun je het rechterlid exp(x) = 1 + x +
x3 x4 x2 + + + ··· 2! 3! 4! zien als een polynoom van graad oneindig, en vervolgens rekenen met dit soort “polynomen” alsof het echte polynomen zijn. Getallen invullen bijvoorbeeld, maar ook: term voor term differenti¨eren, het belangrijkste voorbeeld van wat je kunt en mag31 doen met machtreeksen als x echt binnen het gebied zit waar er wat uitkomt als je een waarde voor x invult, hetgeen hier de hele verzameling van re¨ele getallen is. Op deze manier zie je meteen dat het rechterlid zijn eigen afgeleide is, en hetzelfde geldt daarom voor ex : de afgeleide van ex is ex . 1+x+
Opgave 57. Dit kun je natuurlijk ook zien via het differentiequoti¨ent ex+h − ex h en de limietovergang h → 0. Via het gebruik van de multiplicatieve eigenschap verschijnt dan een uitdrukking waarin eh − 1 h voorkomt. Laat dit zien en schrijf de laatste uitdrukking weer als een machtreeks. Wat krijg je als je h = 0 invult? Neem notitie van het de facto uitdelen van de factor h in het differentiequoti¨ent, waarna limiet nemen een kwestie van invullen wordt. Om te begrijpen dat we met machtreeksen kunnen rekenen zoals hierboven bekijken we eerst de componenten xn waaruit een machtreeks is opgebouwd. Vervolgens maken we de stap van monomen naar polynomen op zo’n manier dat de stap van monomen naar machtreeksen nauwelijks anders is! In de eerste cursus hebben we gezien dat de afgeleide van xn gelijk is aan n−1 nx , en ook al voorzichtig geproefd aan de afgeleide van ex die gelijk is aan x e zelf. De basisgedachte daarbij was dat differenti¨eren eigenlijk hetzelfde is als lineair benaderen, en dat dat laatste makkelijk is voor polynomen als je goed kan staartdelen of anderzins handig bent met algebra. Via het herschreven differentiequoti¨ent x7 − p 7 = x6 + x5 p + x4 p2 + x3 p3 + x2 p4 + xp5 + p6 x−p is door invullen van x = p de afgeleide van x7 in x = p gelijk aan 7p6 . Omdat p willekeurig was, is de afgeleide functie van x7 gelijk aan 7x6 . Als je snapt hoe x7 moet, dan snap je ze allemaal. Het differenti¨eren van polynomen als 1 1 1 1 5 P (x) = 1 + x + x2 + x3 + x4 + x 2 6 24 120 31 In
de zin van wat dat je denkt te krijgen dan ook goed is.
33
is dus makkelijk. De exponenten komen steeds naar voren en op de plek waar ze stonden gaan ze eentje omlaag. Automatiseren maar. In het niet zomaar gekozen voorbeeld krijgen we 1 1 1 P 0 (x) = 1 + x + x2 + x3 + x4 , 2 6 24 hetgeen roept om de overgang naar differentiaalrekening voor functies als 1 1 1 + x + x2 + x3 + · · · , 2 6 die nu aan de orde komt. De regels moet natuurlijk hetzelfde worden. Daartoe scherpen we de gelijkheid voor het differentiequoti¨ent hierboven nog wat aan om precies te zien hoe groot het verschil tussen differentiequoti¨ent en de afgeleide kan zijn en hoe we dat verschil klein kunnen maken. In plaats van onderstaande twee sommetjes over x7 kun je ook x3 doen (wel zelf eerst de sommetjes verzinnen). Opgave 58. Laat zien dat voor x 6= p geldt dat x7 − p 7 − 7p6 = (x − p)(x5 + 2x4 p + 3x3 p2 + 4x2 p3 + 5xp4 + 6p5 ). x−p Opgave 59. Kies nu R > 0 vast. Laat zien dat voor x, p in [−R, R] met x 6= p geldt dat x7 − p 7 7·6 5 | − 7p6 | ≤ R |x − p|. x−p 2 Opgave 60. Kies R > 0 vast en laat n een positief geheel getal zijn. Laat zien dat voor x, p in [−R, R] met x 6= p geldt dat |
xn − p n n(n − 1) n−2 − npn−1 | ≤ R |x − p|. x−p 2
Wat zo voor monomen xn kan, kan ook voor polynomen. Als Pn (x) = a0 + a1 x + a2 x2 + · · · + an xn =
n X
ak xk
k=0
een n-de graadspolynoom is, dan is de afgeleide van Pn in x = p gelijk aan Pn0 (p) = a1 + 2a2 p + · · · + nan pn−1 =
n X
kak pk−1 .
k=1
Dat wisten we al, maar nog niet met een schatting voor het verschil tussen differentiequotient en limiet: Opgave 61. Laat zien dat voor x, p in [−R, R] met x 6= p geldt dat |
Pn (x) − Pn (p) − Pn0 (p)| ≤ x−p
n(n − 1) |an |Rn−2 ) = 2 n X k(k − 1) |x − p| |ak |Rk−2 . 2
|x − p| (|a2 | + 3|a3 |R + · · · +
k=2
34
Een klein stapje voor een tekstzetter maar een geweldige sprong voorwaarts voor de wiskunde is dat voor ∞ X P (x) = a0 + a1 x + a2 x2 + · · · = a k xk , k=0
met P 0 (p) = a1 + 2a2 p + · · · =
∞ X
kak pk−1 ,
k=1
geldt, voor x, p in [−R, R] met x 6= p, dat |
∞ X k(k − 1) P (x) − P (p) − P 0 (p)| ≤ |x − p| |ak |Rk−2 x−p 2 k=2
= |x − p| (|a2 | + 3|a3 |R + 6|a4 |R2 + 10|a5 |R4 + · · · ). Is dit allemaal wel correct? Het antwoord is nee, niet altijd, maar wel als de som van positieve getallen S=
∞ X k(k − 1) k=2
2
|ak |Rk−2 = |a2 | + 3|a3 |R + 6|a4 |R2 + 10|a5 |R4 + · · ·
eindig is. In dat geval hebben de formules voor P (x) en P 0 (p) betekenis en gaat P (x) − P (p) x−p
naar P 0 (p)
als x naar p gaat. Dankzij de afschatting voor het verschil waarin de factor |x − p| en het bestaan van S, waarin x en p niet verder voorkomen. Opgave 62. Leg uit waarom bij de functie x2 x3 x4 + + + ··· 2! 3! 4! elke R een eindige S geeft en dat bijgevolg voor alle x geldt dat exp(x) = 1 + x +
exp0 (x) = exp(x). Opgave 63. Leg uit waarom ook bij de functies cos(x) = 1 −
x2 x4 x6 + − + ··· 2! 4! 6!
en
x3 x5 x7 + − + ··· 3! 5! 7! elke R een eindige S geeft en dat bijgevolg voor alle x geldt dat sin(x) = x −
cos0 (x) = − sin(x)
en
sin0 (x) = cos(x).
Opgave 64. Laat x2 x3 x4 + − + ··· 2 3 4 Legt uit waarom het misgaat met S als je R = 1 kiest, maar dat elke kleinere R wel een eindig getal S geeft. Concludeer dat voor x tussen −1 en 1 geldt dat P (x) = x −
P 0 (x) = 1 − x + x2 − x3 + · · · =
35
1 . 1+x