Van de opgaven met een letter en dus zonder nummer staat het antwoord achterin. De vragen met een nummer behoren tot het huiswerk. Spieken achterin helpt je niets in het beter snappen....
1
Stelling van Taylor
Gaap, ja, nog een keer. In ´e´en variabele hebben we deze formule nu al een paar keer gezien: f (x) = f (0) + x · f 0 (0) +
1 2 00 1 x · f (0) + x3 · f 000 (0) + . . . 2! 3!
Met de kortere notatie (voor het gemak om dit allemaal te typen ´en om te lezen!) schrijven we vaak: d f (x = 0) fx ≡ dx en de stelling ziet er dan zo uit: f (x) = f + x · fx +
1 2 1 x · fxx + x3 · fxxx + . . . 2! 3!
Het argument van de functies aan de rechterkant is dan steeds x = 0; als je rond een ander punt wilt ”Taylor-en”, bv. x = a geldt dezelfde formule maar dan door x, x2 , . . . te vervangen door x − a, (x − a)2 , . . .: f (x) = f + (x − a) · fx +
1 1 (x − a)2 · fxx + (x − a)3 · fxxx + . . . 2! 3!
met nu de afspraak dat fx ≡
2
d f (x = a) dx
Stelling van Taylor in meer dimensies
Voor functies in ´e´en variabele is er nog niet zo’n groot verschil, voor de stelling voor functies met m´e´er variabelen is het bijna noodzakelijk om stelling van Taylor leesbaar te houden. In n variabelen ziet de stelling er dan zo uit: tot en met de tweede orde h(x1 , x2 , . . .)
= h + x1 · hx1 + x2 · hx2 + . . . + xn · hxn 1 + (x21 · hx1 x1 + x22 · hx2 x2 + . . . + x2n · hxn xn ) 2 +x1 x2 · hx1 x2 + x1 x3 · hx1 x3 + . . . + xn−1 xn · hxn−1 xn +...
en de . . . bevat alle producten van het volgend type x31 , x21 x2 , x1 x2 x3 . Ach, onthouden van die formule is niet nodig, zolang je maar weet dat hij bestaat en dat hij soms nuttig is. Op een tentamen bij mij hoef je alleen de lineaire termen te kennen (als je een hogere orde nodig hebt krijg je die erbij). Voor nu: zie appendix van dit stuk, en zorg dat je dat altijd terug kunt vinden! Los met behulp van de appendix de volgende opgave op. a Opgave: Gegeven een functie in drie variabelen x, y, z. Bepaal c1 , c2 in de Taylorreeks: f (x, y, z) = f + xfx + . . . + c1 · xyz · fxyz + . . . + c2 · x2 z 2 fxxzz . . .
1
3
Optimalisatie
Het onderzoeken van een functie op maxima en minima is in natuurkunde en techniek zeer relevant. Als je wilt weten wat de beste oplossing is voor een bepaald probleem moet je allereerst defini¨eren wat je met het beste bedoelt. Als je dat kunt vertalen in termen van wiskundige termen (de goedkoopste is degene die de minste euros kost, de snelste is degene die het minste tijd kost, etc.). Als eenmaal deze definitie bekend is gaan we de beste zoeken: ofwel we gaan het minimum of maximum van die functie proberen te vinden). In dit verhaal gaan we er vanuit dat we optima (ofwel maxima of minima) zoeken waarbij de variabelen allemaal elke waarde mogen aannemen, m.a.w. we nemen aan dat de variabelen niet beperkt zijn tot een eindig interval. Dat wil niet zeggen dat we andere problemen dan deze niet zouden kunnen oplossen, integendeel. Ook nemen we aan dat de functie voldoende differentieerbaar is. Voor een functie in ´e’en variabele is het antwoord relatief eenvoudig: de noodzakelijke voorwaarde is (1) f 0 (x) = 0 Met andere woorden: de functie moet in een optimum een afgeleide nul hebben. b Opgave: Is de voorwaarde ook voldoende? Met andere woorden is een punt met (1) ook altijd een maximum of een minimum? Motiveer je antwoord. (In dit geval zou je of aannemelijk moeten maken dat het zo is OF je moet een tegenvoorbeeld geven). c Opgave: Hoe bepaal je of het een minimum of maximum is?
4
Optimalisatie voor functies in meer variabelen
In meer dimensies zijn de kritieke punten gelijk aan de punten waar alle parti¨ele vergelijkingen nul zijn. We beperken ons uitsluitend tot twee dimensies. Ook zullen we geen problemen op eindige delen van de R2 bekijken; dat is niet erg moeilijk maar het vertroebelt wat ik wil duidelijk maken. Dus een punt (x, y) is een kritiek punt van f (x, y) indien alle parti¨ele afgeleiden nul zijn: ∂ f (x, y) = 0, ∂x
∂ f (x, y) = 0 ∂y
De aard van het kritieke punt wordt bepaald door de eigenwaarden van de tweede-afgeleide-matrix: " # fxx fxy J= fyx fyy Voorbeeld: f = 21 (x2 − y 2 ). Er geldt " J=
1 0
0 −1
zodat de eigenwaardes ±1 zijn: zadel. Voorbeeld: f = xy. Er geldt "
0 1
1 0
2
#
#
en de eigenwaarden volgen uit: −λ 1
= λ2 − 1 = 0
1 −λ
→
λ = ±1
dus een zadel. Kunnen we dit op een andere manier inzien? Het aard van een punt (maximum, minimum, zadel), hangt natuurlijk niet af van hoe we ons assenkruis kiezen: een functie ziet er natuurlijk hetzelfde uit als we het assenkruis bv. draaien. Een draaiing over π/4 ziet er uit als 1 1 x = √ (s + t), y = √ (s − t). 2 2
(2)
We kiezen dus een s en een t-as die samenvallen met de lijnen x = y en x = −y. d Opdracht: Bereken de inverse van de transformatie (2), d.w.z wat zijn s, t als functie van x, y? Wat wordt de functie f = xy in de nieuwe variabelen s, t? e Opdracht: Bepaal van f (x, y) = x3 + y 2 − 3(x + y) + 1 alle kritieke punten, en daarna ook de classificatie (maximum, minimum, zadel) f Opdracht: Bepaal van f (x, y) = 2x2 + y 2 + 3xy − 3y − 5x + 2 alle kritieke punten, en daarna ook de classificatie (maximum, minimum, zadel) 15 Bepaal van f (x, y) = x3 − 15x2 − 20y 2 + 5 alle kritieke punten, en daarna ook de classificatie (maximum, minimum, zadel) 16 Laat zien dat f (x, y) =
x+y x2 + 2y 2 + 6
een maximum heeft in (x, y) = (2, 1) en een minimum in (x, y) = (−2, −1) 17 Bepaal a, b zodanig dat de integraal Z π
2 sin x − (ax2 + bx) dx
0
minimaal is. NB. Hier bepaal je dus een curve van de vorm ax + bx2 die in zekere zin het dichtst bij de sin ligt (immers, zou die deze integraal nul, dan zou de curve gelijk zijn aan sin) 18 Vind de kritieke punten van f (x, y) = 12xy − 3xy 2 − x3 en classificeer ze.
3
5
Optimalisatie met constraints
We willen voor later gemak de stelling van Taylor gebruiken. 1 f (x) = f (0) + xfx (0) + x2 fxx (0) + . . . 2
(3)
Stel dat het punt x = 0 een maximum is (voor een minimum gaat het verhaal analoog). Als we de functie f (x) iets naar links van x = 0 kijken, d.w.z. x is iets kleiner dan 0 en dus x is klein negatief dan mag fx (0) niet negatief zijn; anders zou de functie f (x) groter zijn dan f (0) en dat kan niet want f (0) was een maximum hadden we aangenomen. Omgekeerd kunnen we kijken naar x net groter dan 0. Dan komen we tot de omgekeerde conclusie dat fx (0) niet positief mag zijn. De twee resultaten samenvattend: fx (0) mag niet negatief noch positief zijn. Dus fx (0) = 0 is de enige oplossing. Een lang verhaal voor zo’n eenvoudig resultaat. Toch zal het later handig blijken. In vergelijking (3) hadden de hogere ordere termen (x2 en hoger) geen invloed op het resultaat: de constante en lineaire termen waren allesbepalend. Wiskundigen schrijven het zo: df = f (x) − f (0) = fx dx
(4)
In woorden: ”de verandering in f , die we df noemen, is gelijk aan een getal (gelijk aan fx ) maal de verandering in x die we dx noemen. Als het punt x = 0 een maximum of minimum is ´en omdat dx willekeurig is, geldt dat fx (0) = 0. Hoe schrijven we Taylor van een functie in n variabelen, x1 , . . . , xn ? df = fx1 dx1 + fx2 dx2 + . . . + fxn dxn Als we nu een optimaal punt willen hebben moeten we eisen dat fx1 = fx2 = . . . = fxn = 0. Immers we kunnen de dx1 , . . . , dxn willekeurig vari¨eren. Het verhaal verandert als we optimalisatie met randcondities bekijken. Dit is een probleem dat in de praktijk veel vaker voorkomt. Bijvoorbeeld we willen de snelste formule 1 bouwen maar we hebben maar een budget van 1 miljoen euro. 19 Opgave: Bekijk het volgende probleem. f (x, y) = x2 + y 2 , g(x, y) = x − y − 1 Bepaal minimum, maximum van de functie f (x, y) onder de voorwaarde dat g(x, y) = x − y − 1 = 0. Laat zien dat x, y = 21 , − 12 een minimum is. Doe het als volgt: a Los op: x als een functie van y uit g(x, y) = x − y − 1 = 0, b Vul dit antwood in in f waardoor f een functie van alleen y wordt, c Vind nu voor de functie f (y) de kritieke punten (dus die y-waarden waarvoor f 0 (y) = 0). d Als je y gevonden hebt (kunnen er ook meer zijn) kun je uit deel a de waarde voor x vinden.
4
Een zwak punt is natuurlijk stap a: wat moet je doen als g(x, y) = 0 niet op te lossen is? Lagrange is weer zo’n gigant uit de wiskunde. Over een paar jaar kunnen we zijn 200-jarige sterfdag vieren. Lagrange ging als volgt te werk. Bekijk eerst de verandering in f : df = fx1 dx1 + fx2 dx2 + . . . + fxn dxn
(5)
We hebben een voorwaarde op de punten die mee mogen in de strijd om het optimum, want g = 0 moet gelden. In feite betekent dat we naar variaties dx1 , . . . , dxn moeten kijken die consistent zijn met g = 0. Stel nu dat het punt (0, 0, . . . , 0) een minimum is van een bepaalde functie f , dus (5) geldt, maar ook dat g(0, 0, . . . , 0) = 0. Hoe verandert g als we variaties dx1 , . . . , dxn bekijken? dg = gx1 dx1 + gx2 dx2 + . . . + gxn dxn
(6)
Omdat per aanname een oplossing van het probleem ”vind een maximum of minimum van f onder voorwaarde g = 0” krijgen we: onder d´ıe veranderingen dx1 , . . . , dxn waarvoor geldt dat dg = 0 moet ook df = 0 gelden; met andere wooorden: fx1 dx1 + fx2 dx2 + . . . + fxn dxn = 0, gx1 dx1 + gx2 dx2 + . . . + gxn dxn = 0 Als we deze vergelijking goed aankijken zien we dat de vectoren [ fx1 , fx2 , . . . , fxn ],
[ gx1 , gx2 , . . . , gxn ]
beide loodrecht staan op [ dx1 , dx2 , . . . , dxn ] Deze vector is volledig willekeurig; daarom kunnen we laten zien dat er maar ´e´en oplossing is, namelijk dat de beide vectoren in elkaars verlengde moeten liggen: [ fx1 , fx2 , . . . , fxn ] = λ[ gx1 , gx2 , . . . , gxn ]
(7)
g Opgave: Hoeveel vergelijkingen met hoeveel onbekenden zie je in vergelijking (7)? De waarde voor λ is nog onbekend. Deze parameter wordt de ”Lagrange multiplier” genoemd (”de vermenigvuldigfactor van Lagrange”). Deze naam komt wellicht raar over. Lagrange bedacht de volgende truc: bekijk
1
L(x1 , . . . , xn , λ) = f (x1 , . . . , xn ) − λg(x1 , . . . , xn ) Wat zijn de kritieke punten van L? Deze functie hangt van n + 1 variabelen af, namelijk x1 , . . . , xn en λ. Dus ∂ ∂ f (x1 , . . . , xn ) = λ f (x1 , . . . , xn ) ∂x ∂x 1 1 ∂ ∂ f (x1 , . . . , xn ) = λ f (x1 , . . . , xn ) ∂x2 ∂x2 .. . ∂ ∂ f (x1 , . . . , xn ) = λ f (x1 , . . . , xn ) ∂x ∂x n n g(x , . . . , x ) = 0 1 n 1 Dat λ ”de vermenigvuldigfactor van Lagrange” wordt genoemd zie je hier: λ wordt vemenigvuldigd met de constraintvoorwaarde g
5
De eerste n van deze vergelijkingen zijn precies de vergelijkingen in (7); de laatste is verkregen door L(x1 , . . . , xn , λ) te differenti¨eren naar λ wordt precies de constraintvergelijking. Bekijk het oude probleem: f (x, y) = x2 + y 2 , g(x, y) = x − y − 1 We maken eerst L = x2 + y 2 − λ(x − y − 1) en differenti¨eren naar x, y, λ geeft 2x − λ = 0 2y + λ = 0 x−y−1=0 hetgeen drie lineare vergelijkingen met drie onbekenden zijn. De oplossing is gegeven door x, y, λ = 1 1 2 , − 2 , 1; natuurlijk hetzelfde antwoord als tevoren. 20 Opgave: De oppervlakte van een driehoek met zijden van lengte a, b, c wordt gegeven door p A = s(s − a)(s − b)(s − c), waarin s = (a + b + c)/2 de halve omtrek is Wat is de vorm van de driehoek die maximaal is in oppervlakte bij gegeven omtrek a+b+c = 1? Als we meerdere constraints hebben moeten we meer Lagrange multipliers gebruken, voor elke constraint 1. 21 Opgave: Laat zien dat de kritieke punten van de functie ( g1 (x, y, z) = x + y − z = 0 2 2 2 f (x, y, z) = x + y + z zdd g2 (x, y, z) = yz + 2zx − 2xy − 1 = 0 worden gegeven door 0 = 2x + λ1 + λ2 (2z − 2y) 0 = 2y + λ1 + λ2 (z − 2x) 0 = 2z − λ1 + λ2 (y + 2x) 0=x+y−z 0 = yz + 2zx − 2xy − 1 Dit zijn geen lineaire vergelijkingen dit keer. Daarom kan het lastig worden om ze op te lossen. Daarom de hint: Tel vergelijking 2 en 3 op en laat zien dat of y + z = 0 en/of λ2 = −2. Werk beide mogelijkheden uit. (Er zijn in totaal 4 oplossingen.) 22 Opgave: We willen een rechthoekige doos zonder deksel maken, waar zoveel mogelijk in past, d.w.z. met een zo’n groot mogelijk volume. Van het materiaal waarvan de doos is gemaakt hebben we maar in oppervlakte 12 dm2 . Wat is het volume van die grootst mogelijke doos?
6
Appendix Taylors stelling in detail: f (x, y)
1 2 = f + x · fx + y · fy + x · fxx + 2xy · fxy + y 2 · fyy 2! 1 3 x · fxxx + 3x2 y · fxxy + 3xy 2 · fxyy + y 3 · fyyy + . . . + 3!
Structuur is volledig bepaalt als je volgende truc onthoudt: (x + y)1 = x + y (x + y)2 = x2 + 2xy + y 2 (x + y)3 = x3 + 3x2 y + 3xy 2 + y 3 De truc geldt ook voor alle orde maar ook voor m´e´er variabelen!
7
Antwoorden a Gegeven een functie in drie variabelen x, y, z. Bepaal c1 , c2 in de Taylorreeks: f (x, y, z) = f + xfx + . . . + c1 · xyz · fxyz + . . . + c2 · x2 z 2 fxxzz . . . Antwoord: De grootheid (x + y + z)3 = . . . + 6xyz + . . . ,
dus
c1 =
6 =1 3!
(x + y + z)4 = . . . + 6x2 z 2 + . . . ,
dus
c2 =
6 1 = 4! 4
en
b Is de voorwaarde ook voldoende? Met andere woorden is een punt met (1) ook altijd een maximum of een minimum? Motiveer je antwoord. (In dit geval zou je of aannemelijk moeten maken dat het zo is OF je moet een tegenvoorbeeld geven). Antwoord: De functie f (x) = x3 heeft de eigenschap dat f 0 (0) = 0 maar dat is geen minimum of maximum. c Hoe bepaal je of het een minimum of maximum is? Antwoord: De tweede afgeleide moet in dat punt positief, resp. negatief zijn. d Bereken de inverse van de transformatie (2), d.w.z wat zijn s, t als functie van x, y? Wat wordt de functie f = xy in de nieuwe variabelen s, t? Antwoord: Optellen levert: x+y =
√
√
2s, x − y =
1 1 2t → s = √ (x + y), t = √ (x − y) 2 2
√ We hebben de 2 in (2) zo gekozen dat de inverse transformatie er hetzelfde uit ziet: de transformatie is een draaiing over 45 graden. Zie ook WCopgaven week 7. xy =
√1 (s 2
− t) ·
√1 (s 2
+ t) = 12 (s2 − t2 ) dus een zadel.
e Bepaal van f (x, y) = x3 + y 2 − 3(x + y) + 1 alle kritieke punten, en daarna ook de classificatie (maximum, minimum, zadel) Antwoord: Kritiek: fx = fy = 0: 3x2 − 3 = 0, 2y − 3 = 0 → "
#
1,
3 2
en
−1,
3 2
"
# 6x 0 J= = 0 2 Eigenwaarden zijn 6, 2 voor 1, 23 en −6, 2 voor −1, 32 ; het eerste punt is dus minimum, het tweede een zadel fxx fyx
fxy fyy
f Bepaal van f (x, y) = 2x2 + y 2 + 3xy − 3y − 5x + 2 alle kritieke punten, en daarna ook de classificatie (maximum, minimum, zadel) Antwoord: Kritiek als fx = fy = 0: 4x + 3y − 5 = 0 3x + 2y − 3 = 0
×2 ×−3
−x − 1 = 0 → x = −1, y = 3
8
dus alleen (−1, 3). De aard van de punten volgt uit " # " # fxx fxy 4 3 J= = fyx fyy 3 2 4−λ → 3
3 2−λ
√ = (4 − λ)(2 − λ) − 9 = 0 → λ = 3 ± 10
Dus een zadel! g Hoeveel vergelijkingen met hoeveel onbekenden zie je in vergelijking (7)? Antwoord: n vergelijkingen (er staat zowel links als rechts een vector ter lengte n) met n + 1 onbekenden (xi , i = 1, . . . , n en λ).
9