Funkce více proměnných
Ondřej Zindulka
[email protected]
c Ondřej Zindulka 2004
3
Obsah 1. Úvod Značení Poznámka k terminologii Literatura Topologické pojmy 2. Vektorové funkce Limita a spojitost Derivace vektorové funkce Derivování složené funkce 3. Skalární pole čili funkce více proměnných Vrstevnice Složená funkce Limita a spojitost 4. Derivování skalárních polí Směrová derivace Parciální derivace Gradient Tečná rovina Diferenciál 5. Extrémy Lokální extrémy Maximum, minimum Vázané extrémy Absolutní extrémy A. Kvadratické plochy Rejstřík
4 4 4 4 4 6 6 7 9 10 10 11 11 12 12 12 13 14 15 17 17 19 20 23 26 27
4
1. Úvod Tento text je určen posluchačům třetího semestru. Spíše než o formální matematické dokazování se při výkladu opírá o geometrickou představivost a zdravý rozum. Probírají se v něm funkce dvou a tří proměnných a jejich extrémy. Značení. • R je množina všech reálných čísel. • Rn je n-rozměrný euklidovský prostor. Formálně je to množina uspořádaných n-tic reálných čísel. R2 chápeme buď jako množinu všech bodů v rovině, nebo jako množinu všech vektorů v rovině. Obdobně chápeme R3 . V celém textu se pohybujeme výhradně v R2 a R3 . • Otevřený interval se značí (a, b), uzavřený [a, b]. • 0 označuje nulový vektor. • kuk je délka vektoru u. Jsou-li P a Q dva body v rovině či prostoru, pak P − Q chápeme jako vektor posunutí z Q do P , a kP − Qk je tedy vzdálenost P od Q. • u · v (nebo jenom uv) je skalární součin vektorů u a v. • det A je determinant matice A. • Ačkoliv se tomu snažíme vyhýbat, přece jen se sporadicky vyskytují symboly z teorie množin: Sjednocení A ∪ B, průnik A ∩ B, podmnožina A ⊆ B, kartézský součin A × B a prvek x ∈ B. Poznámka k terminologii. Je-li řeč o elipsoidu, máme na mysli buď příslušné těleso (a to buď včetně hranice, nebo bez ní), nebo jeho plášť — terminologie neumožňuje to rozlišit. Podobné problémy nastávají i u jiných těles a ploch i s jinými termíny. Snažíme se, aby bylo z kontextu jasné, co přesně příslušný název označuje. Přehled základních kvadratických ploch je uveden na konci textu. Literatura. B. Budínský, J. Charvát: Matematika II, SNTL, Praha, 1981, ISBN 80-03-00219-2. Formálně důsledná učebnice pro inženýry, která obsahuje veškerou látku třetího semestru. J. Charvát, M. Hála, V. Kelar, Z. Šibrava: Příklady k Matematice II, ČVUT, Praha, 1993. Sbírka cvičení. F. Bubeník, M. Pultar, I. Pultarová: Matematické vzorce a metody, ČVUT, Praha, 1997. K. Rektorys: Přehled užité matematiky, SNTL, Praha, 1973. Z. Šibrava: Příklady k Matematice 3, katedra matematiky FSv ČVUT, 2004. Topologické pojmy. Následující pojmy popisují kvalitativní geometrické fenomény v euklidovských prostorech. Jsou sice jednoduché, je ale třeba je promyslet. Množina M v prostoru je omezená, pokud je obsažena v nějaké (třeba i velmi velké) kouli. M je okolím bodu Q, pokud existuje nějaká (třeba i velmi malá) koule B se středem v Q, která je celá obsažena v M .
5
b
hraniční bod
M b
vnitřní bod
Obr. 1: Topologické pojmy
Bod Q je vnitřní bod množiny M , pokud je M jeho okolím. Množina je otevřená, jsou-li všechny body z M jejími vnitřními body. Bod Q je hraniční bod množiny M , pokud každé jeho okolí obsahuje nějaký bod z M a nějaký bod, který v M neleží. Množina všech hraničních bodů množiny M se nazývá hranice množiny M . Obr. 1 ilustruje tyto pojmy. Množina je uzavřená, pokud obsahuje všechny svoje hraniční body, tj. celou svoji hranici. Je jasné, že M je otevřená, právě když v ní nejsou žádné její hraniční body. Bod Q je hromadný bod množiny M , pokud libovolně blízko Q leží nějaký jiný bod z M . Obdobně se tyto pojmy definují pro množiny v rovině, jen pojem koule je třeba nahradit dvojrozměrnou koulí, tj. kruhem.
6
2. Vektorové funkce Částice, pohybující se v rovině nebo v prostoru, má v každém okamžiku nějakou polohu. Pohyb částice je tedy možno popsat zobrazením, které skalárům (času) přiřazuje body v R2 nebo R3 (polohu). Kromě toho má částice v každém okamžiku také rychlost, což je vektor, udávající směr a velkost rychlosti. Rychlost částice je zobrazení, které skalárům (času) přiřazuje vektory v R2 nebo R3 (rychlost). Protože mezi body a vektory není žádný formální rozdíl, jsou poloha i rychlost zobrazeními s hodnotami v R2 nebo R3 . Definice 2.1. Zobrazení, jehož nezávisle proměnnými jsou reálná čísla a jehož hodnotami jsou vektory, se nazývá vektorová funkce. To, zda budeme hodnoty vektorové funkce považovat za body, nebo vektory, závisí jen na kontextu a našem vkusu. Definičním oborem vektorové funkce je v aplikacích většinou interval, nejčastěji omezený a uzavřený. Ne každá vektorová funkce popisuje polohu pohybující se částice, často se ale hodí si ji tak představovat. Nezávisle proměnnou si v tom případě představujeme jako čas. Jinou obvyklou nezávisle proměnnou je délka dráhy, kterou částice urazila od počátečního okamžiku. Každá souřadnice vektorové funkce je funkce jedné proměnné, takže vektorová funkce se dá zapsat jako ψ(t) = (x(t), y(t), z(t)) (nebo jenom ψ = (x, y, z)), kde x = x(t), y = y(t) a z = z(t) jsou skalární funkce. Příklad 2.2. Funkce ψ(t) = (7t, −5t2 ) popisuje (při vhodné volbě souřadnic) pohyb tělesa, které bylo vrženo vodorovně rychlostí 7 m/s v zemském tíhovém poli (pokud zaokrouhlíme gravitační zrychlení g na 10 m/s2 ). Limita a spojitost. Oba tyto pojmy se pro vektorovou funkci ψ = (x, y, z) dají definovat prostřednictvím souřadnicových funkcí. Např. limita ψ v t0 je vektor lim ψ(t) = lim x(t), lim y(t), lim z(t) . t→t0
t→t0
t→t0
t→t0
Limitou vektorové funkce je tedy vektor, ke kterému se blíží polohové vektory, když se čas blíží k t0 . Spojitost ψ v t0 se dá definovat kterýmkoliv z následujících ekvivalentních způsobů: • Všechny souřadnicové funkce jsou v t0 spojité • limt→t0 ψ(t) = ψ(t0 ) • Pro každé ε > 0 existuje δ > 0 takové, že
|t − t0 | < δ ⇒ kψ(t) − ψ(t0 )k < ε
Vektorová funkce je spojitá, pokud je spojitá v každém hromadném bodě svého definičního oboru.
7
ψ(t + ∆t)
ψ ′ (t)
y ′ (t)
∆ψ ψ(t) x′ (t)
P
Obr. 3: K větě 2.5
Obr. 2: Derivace
Je-li ψ spojitá vektorová funkce, jejímž definičním oborem je uzavřený interval [a, b], a ψ je prostá s možnou výjimkou ψ(a) = ψ(b), pak je jejím oborem hodnot souvislá čára v rovině nebo v prostoru, která nekříží sama sebe. Taková čára se nazývá křivka1. Je-li křivka C oborem hodnot takové vektorové funkce ψ, pak říkáme, že C je určena funkcí ψ nebo že ψ je parametrizace křivky C. Parametrizace se často zapisují po souřadnicích, takže např. místo ψ(t) = (cos t, sin t, t) se píše x = cos t, y = sin t, z = t. Derivace vektorové funkce. Derivace je míra změny. Derivace vektorové funkce je míra změny polohového vektoru. Definice 2.3. Buď t0 číslo. Existuje-li limita ψ(t0 + ∆t) − ψ(t0 ) , ∆t→0 ∆t
ψ ′ (t0 ) = lim
pak se nazývá derivace vektorové funkce ψ v t0 . Označuje se ψ ′ nebo
dψ . dt
Je-li ψ parametrizací křivky, má její derivace důležitou geometrickou vlastnost. Díváme se na obr. 2. Předpokládejme, že ∆t je hodně malé, takže vektor ∆ψ = ψ(t + ∆t) − ψ(t) má skoro stejný směr jako vektor ψ ′ (t). Z obrázku je zřejmé, že ∆ψ má také téměř stejný směr jako přímka tečná ke křivce. Směr vektoru ψ ′ (t) je tedy stejný jako směr tečny ke křivce v bodě P : Tvrzení 2.4. Buď C křivka určená vektorovou funkcí ψ a P = ψ(t) bod na křivce. Pak vektor ψ ′ (t) (pokud existuje) je rovnoběžný s tečnou ke křivce C v bodě P . Definujeme-li tedy jednotkový tečný vektor rovností (2.1)
ψ ′ (t) , T= kψ ′ (t)k
je podle tohoto tvrzení T skutečně tečný. Obr. 4 ilustruje, že takové vektory jsou právě dva. Závisí pouze na orientaci křivky, který z nich je definován rovnicí (2.1). 1Někdy
je takto vymezený pojem křivky příliš omezující, takže se připouštějí i jiné definiční obory a křížení.
8
normála
tečna
T
normála
Obr. 4: Tečné a normálové vektory
Vektor n se nazývá normálový vektor křivky, pokud je kolmý k tečnému vektoru. Pro křivku v rovině existují v každém bodě, ve kterém existuje tečna, právě dva jednotkové normálové vektory. Pro prostorovou křivku existuje takových vektorů dokonce nekonečně mnoho, jak ilustruje obr. 4. Jak známo, má-li funkce jedné proměnné v t derivaci, je tam spojitá. Totéž platí pro vektorové funkce. Základním nástrojem pro počítání derivací je následující jednoduchý a zřejmý vztah mezi derivací vektorové funkce a derivacemi jejích souřadnic. Obr. 3 ilustruje jeho geometrický význam pro případ křivky v rovině. Tvrzení 2.5. Buď ψ = (x, y, z) vektorová funkce. Existují-li derivace x′ (t), y ′ (t) a z ′ (t), pak ψ má v t derivaci ψ ′ (t) = (x′ (t), y ′ (t), z ′ (t)) . Příklad 2.6. Buď ψ(t) = (t sin t, cos t, t2 ). Jest x′ (t) = (t sin t)′ = sin t + t cos t, takže
z ′ (t) = (t2 )′ = 2t,
y ′ (t) = (cos t)′ = − sin t,
ψ ′ (t) = (sin t + t cos t, − sin t, 2t) .
Pro počítání derivací funkcí vytvořených z jiných funkcí lineární kombinací nebo skalárním součinem platí následující pravidla. Tvrzení 2.7. Jsou-li ψ a φ vektorové funkce, f funkce a λ a µ skaláry, pak • (λψ + µφ)′ = λψ ′ + µφ′ • (f · ψ)′ = f ′ · ψ + f · ψ ′ • (ψ · φ)′ = ψ ′ · φ + ψ · φ′
Příklad 2.8. Je-li kψ(t)k konstantní, pak platí
0 = (kψk2 )′ = (ψ · ψ)′ = ψ ′ · ψ + ψ · ψ ′ = 2 ψ ′ · ψ,
takže ψ ′ ·ψ = 0, tj. vektory ψ a ψ ′ jsou na sebe kolmé. Naopak, jsou-li na sebe ψ a ψ ′ kolmé, pak je kψ(t)k konstantní. Je-li např. ψ(t) poloha částice, pak kψ(t)k je vzdálenost částice od počátku a ψ ′ (t) je vektor rychlosti, takže částice se pohybuje po povrchu koule se středem v počátku, právě když jsou na sebe vektory rychlosti a polohy kolmé.
9
Derivování složené funkce. Je-li ψ(s) vektorová funkce a s = f (t) skalární funkce, pak kompozice φ(t) = ψ f (t) je také vektorová funkce. s může být například délka uražené dráhy a ψ(s) pak popisuje závislost polohy na délce uražené dráhy. Je-li t čas, pak funkce s = f (t) popisuje délku uražené dráhy v závislosti na čase. Hodnota vektorové funkce φ(t) je pak poloha v okamžiku t. Věta 2.9 (Derivace složené funkce). Buď ψ(s) vektorová funkce a s = f (t) skalární funkce. Pak pro kompozici φ(t) = ψ(f (t)) platí φ′ (t) = ψ ′ f (t) · f ′ (t).
Tato rovnost se tradičně zapisuje jako dψ ds dψ = · . dt ds dt Na levé straně je skutečně dψ . Tomu je třeba rozumět takto: ψ nalevo se derivuje dt podle t, a považujeme ji tedy za funkci, jejíž nezávisle proměnnou je t. To znamená, že to je vlastně funkce φ. Obdobná licence se užívá často, např. v (4.5). Tato věta se nehodí k počítání, je ale velmi důležitá, protože z ní plyne řada užitečných tvrzení, např. rovnice tečné přímky.
10
3. Skalární pole čili funkce více proměnných Teplota uvnitř Slunce je prostorové skalární pole: V každém bodě (uvnitř Slunce) má nějakou (skalární) hodnotu, např. 100 000 Kelvinů. Atmosférický tlak je prostorové skalární pole. Zčernání fotografické desky je rovinné skalární pole. Nadmořská výška je rovinné skalární pole (pokud považujeme Zemi za plochou desku). Skalární pole je tedy přiřazení, které bodům v nějaké části roviny nebo prostoru přiřazuje skaláry, tj. reálná čísla. Formálně je to tedy zobrazení, které bodům v Rn přiřazuje reálná čísla. Definice 3.1. Buď D ⊆ Rn . Zobrazení f : D → R se nazývá funkce n proměnných nebo skalární pole. Množina D se nazývá definiční obor f . Protože se předpokládají základní znalosti o funkcích dvou proměnných, protože pro většinu aplikací vystačíme s funkcemi dvou nebo tří proměnných a konečně protože základní aparát pro funkce čtyř a více proměnných je přímou analogií aparátu funkcí tří proměnných, soustředíme se především na funkce tří proměnných. Grafem funkce dvou proměnných (tj. rovinného skalárního pole) je plocha v prostoru. Představa horského terénu je užitečná (pokud považujeme Zemi za rovnou desku). Hodnotou pole je při této představě nadmořská výška. Grafem funkce tří proměnných (tj. prostorového skalárního pole) je „třírozměrná plocha ve čtyřrozměrném prostoruÿ, takže geometrická představa selhává. Místo toho si můžeme představovat např. teplotní pole. Vrstevnice. Množině všech bodů v prostoru, ve kterých má prostorové skalární pole stejnou hodnotu, budeme říkat vrstevnice. (Užívají se také názvy hladina a úrovňová plocha, protože vrstevnice je často (ale ne vždy) plocha v R3 .) Označíme-li tuto společnou hodnotu q, je vrstevnice dána rovnicí f (x, y, z) = q. Naopak, je-li plocha v prostoru popsána touto rovnicí, je to vrstevnice pole f . Z předpovědí počasí známe pojmy izotermy a izobary — vrstevnice teplotního a tlakového pole. Pro rovinné skalární pole je vrstevnice dána rovnicí f (x, y) = q. Naopak, je-li rovinná křivka popsána touto rovnicí, je to vrstevnice pole f . p Příklad 3.2. Buď f (x, y, z) = x2 + y 2 /4 + z 2 /9 − 1. Definičním oborem f je množina D = {(x, y, z) ∈ R3 : x2 + y 2 /4 + z 2 /9 > 1}, tj. prostor, ze kterého je vyňat uzavřený elipsoid. p Vrstevnicemi jsou plochy x2 + y 2 /4 + z 2 /9 − 1 = q: • Pro q < 0 je vrstevnicí prázdná množina. • Pro q > 0 je vrstevnicí množina popsaná rovnicí
x2 + y 2 /4 + z 2 /9 = 1 + q 2 , p p p což je elipsoid o poloosách 1 + q 2 , 2 1 + q 2 , 3 1 + q 2 .
11
Obr. 5: Nespojitá funkce
Složená funkce. Je-li f funkce tří proměnných a ψ vektorová funkce, můžeme definovat novou funkci jedné proměnné vztahem h(t) = f (ψ(t)). Můžeme si představit, že f je teplotní pole a ψ(t) je poloha částice v okamžiku t. Hodnota h(t) pak je teplota v tom bodě, ve kterém je částice v okamžiku t. Napíšeme-li ψ pomocí souřadnicových funkcí jako ψ = (x, y, z), pak rovnice zní h(t) = f (x(t), y(t), z(t)) . (Pozor: x označuje jednak první souřadnici bodu definičního oboru f , jednak funkci jedné proměnné, která figuruje v rovnici na místě první souřadnice.) p Příklad 3.3. Buď f (x, y, z) = x2 + y 2 /4 + z 2 /9 − 1 a x(t) = cos t,
Pak
y(t) = 2 sin t,
z(t) = t.
q √ h(t) = cos2 t + 4 sin2 t/4 + t2 /9 = 9 + t2 3.
Limita a spojitost. Je-li f funkce tří proměnných a P hromadný bod definičního oboru f , pak se můžeme ptát, k jaké hodnotě se blíží funkční hodnoty f (Q), když se bod Q blíží k bodu P . Definice 3.4. Buď f funkce tří proměnných, D její definiční obor a P = (x0 , y0 , z0 ) hromadný bod D. Číslo L je limitou f v bodě P , pokud pro každé ε > 0 existuje nějaké okolí U bodu P takové, že kf (Q) − Lk < ε platí pro každý bod Q 6= P z množiny U ∩ D. Pokud limita existuje, je jenom jedna. Zapisujeme ji lim f (Q) nebo
Q→P
lim
(x,y,z)→(x0 ,y0 ,z0 )
f (x, y, z) nebo x→x lim f (x, y, z). 0
y→y0 z→z0
Skalární pole f je spojité, pokud malým změnám nezávisle proměnné odpovídají malé změny funkčních hodnot. Jinými slovy, jsou-li body blízko, jejich funkční hodnoty se příliš neliší. Pomocí limity to lze vyjádřit takto: Definice 3.5. Skalární pole f je spojité v hromadném bodě P svého definičního oboru, pokud f (P ) = limQ→P f (Q). Pole f je spojité, pokud je spojité v každém hromadném bodě svého definičního oboru.
12
4. Derivování skalárních polí Směrová derivace. Stojíte na úbočí kopce. Jaké stoupání či klesání má kopec v místě, ve kterém stojíte? To samozřejmě závisí nejen na místě, ale také na směru, ve kterém sklon měříte. Je-li f funkce dvou proměnných, která popisuje nadmořskou výšku, pak sklon kopce v příslušném směru je míra změny f , tedy derivace. Protože závisí na směru, nazývá se směrová derivace. Definice 4.1. Buď f funkce tří proměnných, P bod v R3 a u jednotkový vektor v R3 . Derivace f ve směru u v bodě P je ∂f f (P + tu) − f (P ) (P ) = lim t→0 ∂u t Pokud si uvědomíme, že X = P + tu je parametrická rovnice přímky procházející ∂f je míra změny hodnoty pole, bodem P ve směru vektoru u, bude hned jasné, že ∂u ∂f říká derivace ve postupujeme-li z bodu P ve směru vektoru u, a také proč se ∂u směru u. Z definice plyne, že pro funkci jedné proměnné (4.1)
φu (t) = f (P + tu)
platí ∂f (P ) = φ′u (0). ∂u
(4.2)
√ √ √ Příklad 4.2. Buď f (x, y, z) = x2 + 2y 2 + 3z 2 , u = 23 , 42 , 42 a P = (1, 3, 0). Jest √ √ √ φu (t) = f (1, 3, 0) + t 23 , 42 , 42 √ 2 √ √ √ 2 √ 2 √ = f 1 + t 23 , 3 + t 42 , t 42 = 1 + t 23 + 2 3 + t 42 + 3 t 42 . Tudíž
a proto
√ √ √ √ √ √ φ′u (t) = 2 1 + t 23 23 + 4 3 + t 42 42 + 6 t 42 42 , √ √ ∂f (P ) = φ′u (0) = 3 + 3 2. ∂u
Parciální derivace. Derivace ve směrech souřadných os se nazývají parciální derivace. Označíme-li (4.3)
i = (1, 0, 0),
j = (0, 1, 0),
k = (0, 0, 1)
jednotkové vektory ve směrech os x, y, z, pak parciální derivace podle x, y, z jsou definovány takto: ∂f ∂f ∂f ∂f ∂f ∂f fx = = , fy = = , fz = = ∂x ∂i ∂y ∂j ∂z ∂k Znalost počítání parciálních derivací se předpokládá.
13
Věta 4.3 (Derivace složené funkce). Buď f funkce tří proměnných se spojitými parciálními derivacemi a ψ(t) = (x(t), y(t), z(t)) vektorová funkce. Pro složenou funkci h(t) = f (ψ(t)) platí ∂f ∂f ∂f (ψ(t)) · x′ (t) + (ψ(t)) · y ′ (t) + (ψ(t)) · z ′ (t). (4.4) h′ (t) = ∂x ∂y ∂z Běžnější, přehlednější (a kryptičtější) je zápis df ∂f dx ∂f dy ∂f dz (4.5) = + + . dt ∂x dt ∂y dt ∂z dt Tato věta, podobně jako věta 2.9, se nehodí k počítání, je ale velmi důležitá, protože z ní plyne řada užitečných tvrzení, např. věta 4.5, rovnice tečné roviny (4.9) nebo věty 5.13 a 5.15 pro hledání vázaných extrémů. Gradient. Gradient je jeden z nejdůležitějších pojmů diferenciálního počtu funkcí více proměnných. Definice 4.4. Buď f funkce tří proměnných a P bod v R3 . Vektor ∂f ∂f ∂f (P ), (P ), (P ) ∇f (P ) = ∂x ∂y ∂z
se nazývá gradient f v bodě P . Argument se většinou vynechává, takže zápis zní ∂f ∂f ∂f , , . ∇f = ∂x ∂y ∂z Pomocí gradientu se dá pravidlo pro derivování složené funkce (4.4) zapsat stručně (4.6)
h′ (t) = ∇f (ψ(t)) ψ ′ (t)
nebo dokonce
df dψ = ∇f · . dt dt Z tohoto pravidla vyplývá vztah gradientu a směrové derivace. Buď f funkce tří proměnných, P bod v R3 a u jednotkový vektor v R3 . Definujme ψ(t) = P + tu. Pak pro funkci φu definovanou rovnicí (4.1) platí φu (t) = f (ψ(t)). Podle (4.2) je tudíž ∂f (P ) = φ′u (0) = ∇f (ψ(0)) ψ ′ (0). ∂u Protože ψ(0) = P a ψ ′ (t) = u, dostáváme: Věta 4.5 (o směrové derivaci). Buď f skalární pole, které má v bodě P spojité parciální derivace, a u jednotkový vektor. Pak ∂f (P ) = ∇f (P ) · u. ∂u Příklad 4.6. Vypočítáme znovu derivaci z příkladu 4.2. Podle věty 4.5 je √ √ √ √ √ √ √ √ ∂f (P ) = (2x, 4y, 6z) · 23 , 42 , 42 = 2 23 + 12 42 + 0 42 = 3 + 3 2. ∂u
14
Příklad 4.7. Stojíte na úbočí kopce. V jihovýchodním směru kopec stoupá pod úhlem 30◦ , v severním směru kopec klesá pod úhlem 30◦ . Jaký je sklon kopce v západním směru? Nadmořská výška je rovinné skalární pole, označíme je f . Při vhodném umístění √ √ souřadného systému je u1 = (0, 1) severní směrový vektor, u2 = (1/ 2, −1/ 2) jihovýchodní směrový vektor a u3 = (−1, 0) západní směrový vektor. Podle věty 4.5 je ∂f ∂f 1 = ∇f · u1 = , −√ = ∂u1 ∂y 3 ∂f 1 1 ∂f 1 ∂f √ = = ∇f · u2 = √ −√ . ∂u2 3 2 ∂y 2 ∂x Řešením této soustavy je
∂f ∂x
=
∂f = ∇f · u3 = ∂u3
√ 2−1 ∂f √ , ∂y 3
= − √13 . Tudíž ! √ √ 2−1 1− 2 1 √ , −√ (−1, 0) = √ . 3 3 3 √
Proto je sklon kopce v západním směru arctg 1−√3 2 ≈ −13.5◦ : Terén v západním směru klesá pod úhlem 13.5◦ . Řešíme otázku, pro který směr je směrová derivace největší. Je-li α úhel, který svírá směrový vektor u s gradientem, platí ∂f = ∇f · u = k∇f k · kuk · cos α = k∇f k · cos α. ∂u Součin napravo, a tudíž směrová derivace, je největší pokud cos α = 1, tj. pokud ∂f je u rovnoběžný s ∇f . Pro takový vektor je pak ∂u rovna délce gradientu: Věta 4.8 (Geometrie gradientu). Buď f skalární pole a P bod. Gradient ∇f (P ) má následující vlastnosti. • Ve směru u=∇f (P )/k∇f (P )k je směrová derivace největší. • Délka ∇f (P ) je rovna této největší směrové derivaci. Tečná rovina. Sestavujeme rovnici tečné roviny k ploše S, která je dána rovnicí (4.7)
F (x, y, z) = q.
Výraz na levé straně lze chápat jako prostorové skalární pole, a tak je plocha vrstevnicí F . Buď P bod na S, C libovolná křivka, která leží celá v S a prochází bodem P a ψ nějaká její parametrizace. Funkce h(t) = F (ψ(t)) je konstantní — pro každé t je ψ(t) bodem plochy S, a proto je F (ψ(t)) = q. Tudíž h′ (t) = 0. Podle pravidla o derivování složené funkce (4.6) je tedy (4.8)
0 = h′ (t) = ∇F (P ) · ψ ′ (t).
To znamená, že ∇F je kolmý k ψ ′ (t). Protože ψ ′ (t) je tečný ke křivce C, je ∇F normálový vektor křivky C. Předvedli jsme, že ∇F (P ) je normálovým vektorem
15
každé křivky, která leží v S a prochází bodem P . Takový vektor se nazývá normálový vektor plochy S v bodě P . Tečná rovina plochy S v bodě P je rovina, která prochází bodem P a je kolmá k normálovému vektoru. Z analytické geometrie víme, že taková rovina má rovnici ∇F (P ) · (X − P ) = 0.
Rozepsáním dostaneme (při označení P = (x0 , y0 , z0 )) ∂F ∂F ∂F (4.9) · (x − x0 ) + · (y − y0 ) + · (z − z0 ) = 0. ∂x ∂y ∂z Kvůli přehlednosti zápisu se obvykle vynechává argument u derivací. Příklad 4.9. Sestavíme rovnici roviny tečné k ploše x3 − y 2 + 2z = 4 v jejím bodě P = (1, −1, 2). Položíme f (x, y, z) = x3 − y 2 + 2z. Jest ∇F = (3x2 , −2y, 2), takže ∇F (P ) = (3, 2, 2) a rovnice tečné roviny je po rozepsání a úpravě
(3, 2, 2) · (x − 1, y + 1, z − 2) = 0, 3x + 2y + 2z − 5 = 0.
Diferenciál. Aplikujeme rovnici tečné roviny na případ, kdy plocha S je grafem funkce dvou proměnnýchf (x, y). Rovnice S tedy zní z = f (x, y). Položíme-li F (x, y, z) = f (x, y) − z, pak S je dána rovnicí (4.7), ve které je q = 0. Derivováním = ∂f , ∂F = ∂f , ∂F = −1, takže rovnice tečné roviny (4.9) je F dostaneme ∂F ∂x ∂x ∂y ∂y ∂z ∂f ∂f · (x − x0 ) + · (y − y0 ) − (z − z0 ) = 0. ∂x ∂y Parciální derivace se počítají v bodě (x0 , y0 ). Po úpravě a dosazení z0 = f (x0 , y0 ) ∂f ∂f · (x − x0 ) + · (y − y0 ). (4.10) z = f (x0 , y0 ) + ∂x ∂y To je rovnice tečné roviny ke grafu funkce dvou proměnných. Protože tečná rovina aproximuje v blízkosti bodu dotyku graf, používá se (4.10) ve tvaru f (x, y) ≈ f (x0 , y0 ) +
∂f ∂f · (x − x0 ) + · (y − y0 ) ∂x ∂y
pro přibližný výpočet funkčních hodnot v bodech (x, y) blízkých bodu (x0 , y0 ). Stejný postup by nás přivedl k analogii tohoto vzorce pro funkci tří proměnných: f (x, y, z) ≈ f (x0 , y0 , z0 ) +
∂f ∂f ∂f · (x−x0 ) + · (y−y0 ) + · (z−z0 ) ∂x ∂y ∂z
Ve vektorovém tvaru znějí oba vzorce stejně. Je-li P bod a u vektor, pak pro hodnotu f v bodě P + u platí (4.11)
f (P + u) ≈ f (P ) + ∇f (P ) · u
Výrazy v rámečku se nazývají diferenciál.
16
Příklad 4.10. Použijeme (4.11) k nalezení přibližné hodnoty √ √ √ 3 4 ln 1.04 + 1.03 − 0.95 .
Bod Q = (1.04, 1.03, 0.95) je blízko bodu P = (1, 1, 1), pro u = (0.04, −0.05) √ 0.03, √ √ 3 je Q = P + u. Definujeme funkci tří proměnných f (x, y, z) = ln x + y − 4 z . Hledaná hodnota se rovná f (Q) = f (P + u). Počítáme hodnoty, které je třeba dosadit do (4.11). f (P ) = f (1, 1, 1) = ln 1 = 0 √ −1 1 −1/2 1 √ √ = fx (P ) = x+ 3y− 4z · x 2 2 √ √ 1 1 √ −1 fy (P ) = · x−2/3 = x+ 3y− 4z 3 3 √ √ 1 1 √ −1 · x−3/4 = − , x+ 3y− 4z fx (P ) = 4 4 1 1 1 takže ∇f (P ) = 2 , 3 , − 4 . Tudíž f (Q) ≈ f (P ) + ∇f (P ) · u = 0 + 21 , 13 , − 41 · (0.04, 0.03, −0.05) = 0.0425.
17
Obr. 6: Tečná rovina neexistuje
Obr. 7: Tečná rovina je vodorovná
Obr. 8: Dvě maxima
Obr. 9: Sedlo
5. Extrémy Lokální extrémy. Skalární pole má v bodě P lokální maximum, pokud žádná hodnota pole blízko bodu P není větší než hodnota v P . Definice 5.1. Buď f skalární pole a D jeho definiční obor. Pole f má v bodě P lokální maximum, pokud existuje okolí U bodu P takové, že f (Q) 6 f (P ) platí pro každý bod Q z množiny U ∩ D. Lokální maximum je ostré, pokud místo f (Q) 6 f (P ) platí f (Q) < f (P ) v každém bodě Q 6= P z množiny U ∩ D. Lokální minimum a ostré lokální minimum se definují obdobně. Lokální extrém je lokální maximum nebo lokální minimum. Na obrázcích 6 a 7 jsou grafy funkcí dvou proměnných, které mají jedno lokální maximum. Na obr. 8 je funkce, která má dvě lokální maxima. Z obrázků 6 a 7 vytušíme, že je-li v bodě P lokální maximum nebo minimum, pak: • buď je tečná rovina vodorovná, jako na obr. 7, • nebo se vůbec nedá sestrojit, jako na obr. 6. Věta 5.2. Buď f skalární pole a P vnitřní bod definičního oboru, ve kterém má f lokální extrém. • Buď jsou všechny parciální derivace f v P rovny nule, tj. ∇f (P ) = 0 — takovým bodům se říká stacionární, • nebo některá parciální derivace neexistuje, tj. ∇f (P ) neexistuje — takovým bodům budeme říkat vratké.
18
Bodům, které splňují některou z těchto dvou podmínek, se říká kritické. Věta říká, že extrém může být jen v kritickém bodě, a že tedy při hledání extrémů stačí omezit se na kritické body. Při hledání kritických bodů • spočítáme parciální derivace • najdeme vratké body • najdeme stacionární body, tj. vyřešíme soustavu rovnic ∇f = 0. Příklad 5.3. Funkce dvou proměnných f (x, y) = x2 − y 2 , která je na obr. 9, má gradient ∇f = (2x, −2y). Ten je definován všude, takže všechny kritické body jsou stacionární: Splňují soustavu rovnic (2x, −2y) = (0, 0), tj. 2x = 0,
−2y = 0.
Tato soustava má jediné řešení x = 0, y = 0. Jediným kritickým bodem je tedy P = (0, 0). V tomto bodě je tečná rovina vodorovná, ale není v něm ani lokální maximum, ani lokální minimum. To znamená, že v kritickém bodě nemusí být extrém. Protože graf připomíná sedlo, říká se někdy takovému bodu sedlový. Příklad 5.4. Funkce dvou proměnných f (x, y) = definována v celé rovině. Parciální derivace jsou
takže
∂f x p = −p , 2 2 ∂x x +y (1+ x2 +y 2 )2
1+
√1 2
x +y 2
, která je na obr. 6, je
y ∂f p , = −p 2 2 ∂y x +y (1+ x2 +y 2 )2
• v bodě (0, 0) neexistují, jde tedy o vratký bod, ve kterém má f evidentně maximum, = 0, ∂f = 0 nemá žádné řešení, takže žádné stacionární • soustava rovnic ∂f ∂x ∂y body neexistují. Příklad 5.5. Najdeme kritické body funkce f (x, y) = e−x
2 −y 2
(x2 + 2y 2 ). Jest
∂f 2 2 = −2xe−x −y (x2 + 2y 2 − 1), ∂x ∂f 2 2 = −2ye−x −y (x2 + 2y 2 − 2). ∂y Gradient je tedy definován v celé rovině, takže všechny kritické body jsou stacionární. Stačí tedy řešit soustavu 2xe−x
2 −y 2
2ye−x Protože e−x
2 −y 2
2 −y 2
(x2 + 2y 2 − 1) = 0
(x2 + 2y 2 − 2) = 0.
> 0, lze krátit: x = x(x2 + 2y 2 ) 2y = y(x2 + 2y 2 )
Řešením jsou body (0, 0), (0, ±1), (±1, 0), což je seznam kritických bodů.
19
Příklad 5.6. Najdeme kritické body funkce f (x, y, z) = x2 y − 2yz − x2 + z 2 + x. Polynom nemá vratké body. Hledáme stacionární body. Gradient je ∇f = (2xy − 2x + 1, x2 − 2z, 2z − 2y),
takže řešíme soustavu rovnic
2xy − 2x + 1 = 0,
x2 − 2z = 0,
2z − 2y = 0.
Z poslední rovnice plyne y = z, takže z druhé rovnice plyne 2y = x2 . Dosazením do první rovnice dostaneme x3 − 2x + 1√= 0. Rozklad levé strany je (x − 1)(x2 + −1± 5 1 1 x − 1), a proto x = 1 nebo x = . Stacionární body tedy jsou 1, , , 2 2 2 √ √ √ −1− 5 3+ 5 3+ 5 , , 2 4 4
a
√ √ √ −1+ 5 3− 5 3− 5 , , 2 4 4
.
Maximum, minimum. Prozatím umíme najít kritické body, tj. body ve kterých může být extrém. Uvedeme kritérium, které často umožňuje určit, zda v daném kritickém bodě extrém opravdu je a zda je to maximum, nebo minimum. Pro funkce jedné proměnné toto kritérium spočívá v ohledání znaménka druhé derivace. Pro funkce více proměnných je podstata stejná, ale kritérium je komplikovanější: Jde o podmínku, která zaručí, že znaménko druhé derivace funkce φu definované rovnicí (4.1) je kladné (nebo záporné) pro každý směrový vektor u. V následujících větách figurují parciální derivace druhého řádu. Připomeneme, že například ∂2f ∂ ∂f ∂ ∂f ∂ 2f fxx = = = , fyz = ∂x2 ∂x ∂x ∂y∂z ∂z ∂y a že pro rozumné funkce nezáleží na pořadí derivování, tj. např. fxz = fzx .
Věta 5.7 (Test druhými derivacemi — dvě proměnné). Buď f funkce dvou proměnných a P její kritický bod. Definujeme fxx fxy 2 = fxx · fyy − fxy . D = det fyx fyy • • • •
Pokud Pokud Pokud Pokud
D D D D
> 0 a fxx (P ) > 0, je v bodě P ostré lokální minimum. > 0 a fxx (P ) < 0, je v bodě P ostré lokální maximum. < 0, není v bodě P extrém. = 0, test neříká nic.
Příklad 5.8. Použijeme kritérium ke klasifikaci stacionárních bodů z příkladu 5.5. 2 2 Píšeme-li E = e−x −y , je matice druhých derivací 2E(2x4 + 4x2 y 2 − 5x2 − 2y 2 + 1) 4xyE(x2 + 2y 2 − 3) H= . 4xyE(x2 + 2y 2 − 3) 2E(4y 4 + 2x2 y 2 − x2 − 10y 2 + 2) 2 0 • Bod (0, 0): E = 1, H = , D = 8, fxx = 2, takže v bodě je lokální 0 4 minimum. −2/e 0 −1 , D = 16e−2 , fxx = −2e−1 , takže • Body (0, ±1): E = e , H = 0 −8/e v obou bodech je lokální maximum.
20
• Body (±1, 0): E = e , H = −1
bodech není lokální extrém.
−4/e 0 , D = −8e−2 , fxx = −4e−1 , takže v 0 2/e
Věta 5.9 (Test druhými derivacemi — tři proměnné). Buď f ných a P její kritický bod. Definujeme fxx fxx fxy , D3 = det fyx D1 = fxx , D2 = det fyx fyy fzx • • • •
Pokud Pokud Pokud Pokud
funkce tří proměn fxy fxz fyy fyz fzy fzz
D3 > 0, D2 > 0 a D1 > 0, je v bodě P ostré lokální minimum. D3 < 0, D2 > 0 a D1 < 0, je v bodě P ostré lokální maximum. D3 6= 0 a nenastává žádný z předchozích případů, není v bodě P extrém. D3 = 0, test neříká nic.
Příklad 5.10. Použijeme kritérium ke klasifikaci stacionárních bodů z příkladu 5.6. Matice druhých derivací je 2y − 2 2x 0 0 −2 , H = 2x 0 −2 2
takže
D3 = −8(x2 + y − 1), D2 = −4x2 , D1 = 2(y − 1). Dosazením dostaneme • Bod 1, 21 , 21 : D3 < 0, D2 < 0, D1 < 0, v bodě není lokální extrém. √ √ √ • Bod −1−2 5 , 3+4 5 , 3+4 5 : D3 < 0, D2 < 0, D1 > 0, v bodě není lokální extrém. √ √ √ −1+ 5 3− 5 3− 5 • Bod , 4 , 4 : D3 > 0, D2 < 0, D1 < 0, v bodě není lokální extrém. 2 Vázané extrémy. Často se vyskytují úlohy, ve kterých je třeba najít extrém funkce za nějakých dodatečných podmínek. Například najít mezi všemi body na parabole y = x2 ten, který má od bodu (1, 0) nejmenší vzdálenost, nebo najít 2 rozměry plechové krabice s co největším objemem, máme-li p k dispozici 1 m plechu. V prvním příkladu se snažíme minimalizovat výraz (x − 1)2 + y 2 (vzdálenost) za podmínky y = x2 . Ve druhém příkladu se snažíme maximalizovat výraz xyz (objem) za podmínky 2xy + 2xz + 2yz = 1 (povrch). Jde o úlohy najít absolutní extrém na jisté množině. Řešit takové úlohy se naučíme v dalším odstavci. Budeme k tomu potřebovat následující pojmy. Definice 5.11. Buď f skalární pole definované v každém bodě množiny M . Pole f má v bodě P vázané lokální maximum vzhledem k množině M , pokud existuje okolí U bodu P takové, že f (Q) 6 f (P ) platí pro každý bod Q ∈ U ∩ M . Vázané lokální minimum se definuje obdobně. Ve výše uvedených příkladech je množina M určena rovnicí, tj. podmínkou tvaru (5.1)
g(Q) = 0,
21
tzv. vazbou. Jedna možná strategie je vyjádřit z podmínky některou z proměnných a za tu dosadit do minimalizovaného výrazu. Často se však z vazby nedá žádná proměnná vyjádřit nebo je to příliš složité. Další možnost je pokusit se křivku nebo plochu (5.1) popsat parametricky. Určuje-li (5.1) křivku a ψ je její parametrizace a f má v bodě P = ψ(tP ) vázaný extrém, pak složená funkce h(t) = f (ψ(t)) má lokální extrém v tP . Stačí tedy hledat extrémy funkce jedné proměnné. Příklad 5.12. Hledáme vázané lokální extrémy funkce f (x, y) = x2 −y na kružnici x2 + y 2 = 1. Vhodná parametrizace je ψ(t) = (cos t, sin t), −π 6 t 6 π. Hledáme extrémy funkce h(t) = f (ψ(t)) = f (cos t, sin t) = cos2 t − sin t.
Protože h′ (t) = −2 cos t sin t−cos t, jsou kritické body řešením rovnice cos t(2 sin t+ , − π6 . Funkce f tedy může mít 1) = 0. V intervalu [−π, π] jsou to body ± π2 , − 5π √ 6 vázané extrémy v bodech (0, ±1) , ± 3/2, −1/2 . Analýza h′′ (t) by ukázala, zda jde opravdu o extrémy, a jaké. Universálnější strategií je tzv. metoda Lagrangeových multiplikátorů. Využívá stejného principu, ale umožňuje hledání podezřelých bodů bez znalosti parametrizace. Stejně jako před chvílí, f a g jsou funkce dvou proměnných a vazba (5.1) určuje křivku v rovině s parametrizací ψ. Má-li f v bodě P = ψ(tP ) vázaný extrém, pak složená funkce h(t) = f (ψ(t)) má lokální extrém v tP . Tudíž h′ (tP ) = 0. Podle pravidla o derivování složené funkce (4.6) je tedy 0 = h′ (tP ) = ∇f (P ) · ψ ′ (tP ),
Protože ψ ′ (tP ) je tečný ke křivce (5.1), je k ní vektor ∇f kolmý. Jak víme z (4.8), vektor ∇g je k ní také kolmý. V rovině to znamená, že vektory ∇f (P ) a ∇g(P ) jsou rovnoběžné, tj. jeden z nich je skalárním násobkem druhého. Jsou-li f a g funkce tří proměnných, pak vazba (5.2) určuje nějakou plochu v prostoru. Obdobná analýza by ukázala, že i v tomto případě jsou gradienty f a g ve vázaném extrému rovnoběžné. Věta 5.13 (Lagrangeův multiplikátor). Buď f skalární pole a (5.2)
g(Q) = 0
vazba. Má-li f v bodě P vázaný extrém, pak existuje skalár λ (tzv. Lagrangeův multiplikátor), pro který platí (5.3)
∇f (P ) = λ · ∇g(P ).
Jsme na tenkém ledě: Tato věta platí jen za určitých předpokladů, jejichž formulování by ji nad míru komplikovalo. Nutnou podmínkou pro platnost rovnice (5.3) je samozřejmě existence obou gradientů. Také jsme předpokládali, že vazba (5.2) určuje křivku.2 2Předpoklady
věty viz např. [B. Budínský, J. Charvát, věta 9.103]
22
Příklad 5.14. Hledáme body, ve kterých může být lokální extrém funkce f (x, y, z) = xy + z 2 vázaný podmínkou x2 + y 2 + z 2 = 2, tj. řešíme rovnici (5.3) pro g(x, y, z) = x2 + y 2 + z 2 − 2. Jest ∇f = (y, x, 2z),
∇g = (2x, 2y, 2z),
takže po dosazení do (5.3) a rozepsání do souřadnic dostaneme y = 2λx x = 2λy 2z = 2λz To je soustava tří rovnic se čtyřmi neznámými (z nichž nás zajímají jen x, y, z). Potřebujeme ještě čtvrtou rovnici, a to sice vazební podmínku x2 + y 2 + z 2 = 2. Řešení takového systému rovnic žádá vždy kreativní přístup — neexistuje žádný universální návod. • Vynásobíme první rovnici y a druhou x: napravo jsou stejné výrazy, takže x2 = y 2 . • Pokud je z = 0, pak z vazby dostaneme 2x2 = 2. Tudíž x = ±1, y = ±1, z = 0 je jedna sada řešení. • Pokud je z 6= 0, pak λ = √ 1 a z prvních dvou rovnic dostaneme x = 0, y = 0. Z vazby tedy plyne z = ± 2. √ Dostali jsme celkem šest bodů: (±1, ±1, 0), (0, 0, ± 2). Tato metoda se dá zobecnit na více vazebních podmínek. Tak např. dvě vazby v prostoru určují průnik dvou ploch, což je často křivka. Vázaný extrém je pak lokální extrém vzhledem k této křivce. Věta 5.15 (Lagrangeovy multiplikátory — dvě vazby2). Buď f funkce tří proměnných a g1 (Q) = 0, g2 (Q) = 0 dvě vazby. Má-li f v bodě P vázaný extrém, pak existují skaláry λ, µ, pro které platí (5.4)
∇f (P ) = λ · ∇g1 (P ) + µ · ∇g2 (P ).
Geometricky to znamená, že ∇f je lineární kombinací ∇g1 a ∇g2 , tj. leží v rovině, určené těmito vektory. Příklad 5.16. Hledáme body, ve kterých může být lokální extrém funkce f (x, y, z) = x + y − z vázaný podmínkami x2 + y 2 = 5 a x + 2y − 3z = 7 tj. řešíme rovnici (5.4) pro g1 (x, y, z) = x2 + y 2 − 5, g2 (x, y, z) = x + 2y − 3z − 7. Jest ∇f = (1, 1, −1),
∇g1 = (2x, 2y, 0),
∇g2 = (1, 2, −3).
23
Rozepsáním do souřadnic dostaneme 1 = 2λx + µ 1 = 2λy + 2µ −1 = −3µ. Tyto rovnice doplníme vazbami 5 = x2 + y 2 7 = x + 2y − 3z
a máme pět rovnic o pěti neznámých (z nichž nás zajímají jen x, y, z). Z třetí rovnice máme µ = 31 , dosadíme to do první a druhé a dostaneme 31 = λx, 31 = 2λy a odtud x = 2y. Z první vazby tedy máme y = ±1. Z druhé dostaneme z. Dostali jsme dva podezřelé body: (2, 1, −1) a (−2, −1, −11/3). Metoda Lagrangeových multiplikátorů umožňuje pouze najít body, ve kterých může být lokální vázaný extrém. Adaptace vět 5.7 a 5.9 by nám umožnila zjistit, zda v v těchto bodech extrém opravdu je. My se bez toho obejdeme, protože metodu Lagrangeových multiplikátorů budeme užívat jen pro hledání absolutních extrémů. Absolutní extrémy. Nejběžnější praktické problémy zahrnující extrémy jsou úlohy, ve kterých se má maximalizovat nebo minimalizovat nějaký výraz (tj. funkce) za jistých podmínek omezujících možné hodnoty nezávisle proměnných. Definice 5.17. Buď f skalární pole definované v každém bodě množiny M . Pole f má v bodě P ∈ M maximum vzhledem k množině M , pokud f (Q) 6 f (P ) platí pro každý bod Q ∈ M . Minimum se definuje obdobně. Někdy se maximu (minimu) říká absolutní nebo globální, aby se odlišilo od lokálního. Maximum (či minimum) nemusí existovat. Pokud je ale množina M omezená a uzavřená a pole f spojité, pak podle Weierstrassovy věty maximum i minimum existují. Klíčem k hledání absolutních extrémů je následující tvrzení. Tvrzení 5.18. Nechť f má v bodě Q maximum nebo minimum vzhledem k M . • Je-li Q vnitřní bod M , pak je kritickým bodem f . • Je-li Q hraniční bod M , pak f má v Q vázané lokální maximum nebo minimum vzhledem k hranici M . Na příkladech ukážeme, jak se toto tvrzení používá. Příklad 5.19. Hledáme maximum a minimum funkce f (x, y, z) = xy + z 2 na uzavřené kouli x2 + y 2 + z 2 6 2. Je to funkce z příkladu 5.14. • Nejdřív najedeme podezřelé body uvnitř koule. To jsou kritické body f . Protože ∇f = (y, x, 2z), je takový bod jeden: (0, 0, 0).
24
• Ostatní podezřelé body jsou na hranici koule, což je sféra x2 + y 2 + z 2 = 2. Tyto body jsme už našli v příkladu 5.14. • Nakonec vyčíslíme hodnoty f v podezřelých bodech: f (0, 0, 0) = 0
f (−1, −1, 0) = 1
f (1, 1, 0) = 1 √ f (0, 0, 2) = 2
Maximum je tedy 2 a minimum je −1.
f (−1, 1, 0) = −1 √ f (0, 0, − 2) = 2
f (1, −1, 0) = −1
V tomto příkladu je hranice M plocha, která má v každém bodě tečnou rovinu, takže pro její ohledání nám stačila jednoduchá aplikace metody Lagrangeových multiplikátorů. Pokud má hranice hrany, jsou na ní body, ve kterých neexistuje tečná rovina. Situace je pak komplikovanější: Příklad 5.20. Hledáme minimum funkce f (x, y, z) = xy + z 2 na množině M dané nerovnostmi x2 + y 2 + z 2 6 2, 1 6 z. Je to kulová úseč. Její hranice je tedy složena z části povrchu koule a části roviny. Tyto plochy se stýkají na kružnici. Na té nemá hranice M normálový vektor, takže pokud se na ní nachází minimum, neodhalíme je Lagrangeovými multiplikátory. Postup je následující. • Najdeme kritické body f , které leží uvnitř M . Z příkladu 5.19 víme, že f má jediný kritický bod (0, 0, 0), a ten neleží uvnitř M . • Najdeme podezřelé body na té části hranice M , která splňuje rovnici x2 + y 2 + z 2√= 2. Z příkladu 5.14 víme, √ že v úvahu připadají body (±1, ±1, 0) a (0, 0, ± 2). Z nich jen bod (0, 0, 2) leží na hranici M . • Najdeme podezřelé body na té části hranice M , která splňuje rovnici z = 1. To je úloha najít vázaný extrém s jednou vazbou, je tedy možné ji řešit metodou Lagrangeových multiplikátorů. Protože vazba je velmi jednoduchá, je snazší zbavit se dosazením proměnné z a hledat kritické body funkce h(x, y) = xy + 1. Takový bod je jeden: (0, 0). Tudíž je na této části hranice jediný podezřelý bod (0, 0, 1). • Zbývá hrana, tj. ta část hranice, kde se kulová plocha a rovina protínají. Máme tedy najít podezřelé body pro pole f se dvěma vazebními podmínkami g1 (x, y, z) = x2 + y 2 + z 2 − 2 = 0, g2 (x, y, z) = z − 1 = 0.
Podle věty 5.15 musí tyto body splňovat rovnici (y, x, 2z) = λ(2x, 2y, 2z) + µ(0, 0, 1) čili y = 2λx x = 2λy 2z = 2λz + µ. Řešením jsou čtyři body (± √12 , ± √12 , 1). (Místo úlohy se dvěma vazbami jsme mohli do první vazby a do f dosadit z = 1 a hledat extrémy funkce h(x, y) = xy + 1 vázané podmínkou x2 + y 2 − 1 = 0.)
25
√ Podezřelých bodů je tedy dohromady šest: (0, 0, 2), (0, 0, 1), (± √12 , ± √12 , 1). Ve dvou z těchto bodů nabývá pole f minimální hodnoty 12 . Příklad 5.21. Hledáme rozměry co největší plechové bedny bez víka, jejíž dno je z plechu za 400 Kč/m2 a stěny z plechu za 100 Kč/m2 , pokud je náš rozpočet omezen částkou 1200 Kč. Délku, šířku a výšku bedny označíme x, y, z. Jde o nalezení maxima funkce V (x, y, z) = xyz (objem) na množině 400xy + 100(2yz + 2xz) 6 1200,
x > 0,
y > 0,
z>0
Výraz nalevo je součtem ceny dna a cen svislých stěn. Zdravý rozum napoví, že nerovnost lze nahradit rovností. Kromě toho můžeme krátit, takže úloha se redukuje na hledání maxima funkce V na množině 2xy + yz + xz − 6 = 0,
x > 0,
y > 0,
z > 0.
Použijeme metodou Lagrangeových multiplikátorů. Příslušné rovnice jsou yz = λ(2y + z) xz = λ(2x + z) xy = λ(x + y) Rovnice postupně vynásobíme x, y, z, takže nalevo je všude xyz. Protože žádná z neznámých nemůže být nula, porovnáním prvních dvou rovnic dostaneme y = x a porovnáním první a třetí rovnice dostaneme z = 2x. To dosadíme do vazební podmínky a dostaneme 2x2 + 2x2 + 2x2 = 6. Tudíž x = 1, y = 1, z = 2. Největší bedna má čtvercovou základnu o straně 1 m, výšku 2 m a objem 2 m3 .
26
A. Kvadratické plochy Sféra
Elipsoid
Paraboloid
x2 + y 2 + z 2 = 1
x2 y 2 z 2 + 2 + 2 =1 a2 b c
z = x2 + y 2
Kužel
Hyperboloid jednodílný
Hyperboloid dvojdílný
z 2 = x2 + y 2
z 2 = x2 + y 2 − 1
z 2 = x2 + y 2 + 1
Válec rotační
Válec parabolický
Válec hyperbolický
x2 + y 2 = 1
y = x2
x2 − y 2 = 1
Hyperbolický paraboloid
z = x2 − y 2
Elipsoid je zobecněním sféry. Podobným způsobem lze zobecnit všechny ostatní uvedené plochy. Např. zobecnění jednodílného hyperboloidu má rovnici z2 x2 y 2 = 2 + 2 − 1. c2 a b
Rejstřík globální, 23 lokální, 17 ostré, 17 vázané, 20 minimum, 23 absolutní, 23 globální, 23 lokální, 17 ostré, 17 vázané, 20 množina omezená, 4 otevřená, 5 uzavřená, 5
0, 4 ∂f ∂x , 12 ∂f ∂u , 12 det A, 4 fx , 12 ∇f , 13 T, 7 bod hraniční, 5 stacionární, 17 vnitřní, 5 vratký, 17 derivace parciální, 12 složené funkce, 9, 13 směrová, 12 ve směru, 12 vektorové funkce, 7 diferenciál, 15
okolí, 4 paraboloid, 26 hyperbolický, 26 parametrizace křivky, 7 pole skalární, 10
elipsoid, 26 extrém absolutní, 23 globální, 23 lokální, 17
spojitost, 6, 11 tečná rovina, 15 vazba, 21 vektor normálový, 8, 15 tečný, 7 vrstevnice, 10 válec hyperbolický, 26 parabolický, 26 rotační, 26 věta o směrové derivaci, 13
funkce n proměnných, 10 složená, 9, 11 vektorová, 6 geometrie gradientu, 14 gradient skalárního pole, 13 hranice množiny, 5 hyperboloid dvojdílný, 26 jednodílný, 26 koule, 26 kužel, 26 křivka, 7 Lagrangeův multiplikátor, 21, 22 limita funkce n proměnných, 11 vektorové funkce, 6 maximum, 23 absolutní, 23 27