Úvod – základy teorie zobrazení V přednášce se budeme zabývat diferenciálním a integrálním počtem funkcí více proměnných. Přednáška navazuje na přednášku Matematická analýza 1 z prvního semestru. Proto se předpokládá, že studenti úspěšně absolvovali zkoušku z tohoto předmětu. V tomto úvodu stručně zopakuji některé základní pojmy, které se týkají zobrazení. Ty se objevují prakticky ve všech oblastech matematiky. Proto by bylo dobré je znát. Definice 1. Nechť X a Y jsou množiny. Zobrazení množiny X do množiny Y nazýváme každou množinu F ⊂ X × Y , které má následující vlastnost: Ke každému prvku x ∈ X existuje právě jeden prvek y ∈ Y takový, že (x, y) ∈ F . Definice zobrazení v podstatě říká, že každému x ∈ X přiřadíme právě jedno y ∈ Y . Proto budeme často psát jako F : X → Y a prvek y ∈ Y , na který se zobrazuje prvek x ∈ X značit jako y = F (x). Definice 2. Nechť F : X → Y a A ⊂ X. Obrazem množiny A nazveme množinu © ª F (A) = y ∈ Y ; existuje x ∈ A takové, že y = F (x) . ¡ ¢ Je-li A = {x} jednobodová množina, bývá zvykem psát F {x} = F (x). Nechť je B ⊂ Y . Vzorem množiny B nazýváme množinu © ª F(−1) (B) = x ∈ X ; F (x) ∈ B . ¡ ¢ Je-li B = {y} jednobodová množina, bývá zvykem psát F(−1) {y} = F(−1) (y). Definice 3. Nechť je F : X → Y zobrazení množiny X do množiny Y . Množina X se nazývá definiční obor a budeme ji značit DF . Množina F (X) ⊂ Y se nazývá obor hodnot zobrazení F a budeme ji značit HF . Definice 4. Zobrazení F : X → Y se nazývá prosté nebo injektivní právě tehdy, když pro každé y ∈ Y je množina F(−1) (y) nejvýše jednobodová. Zobrazení F : X → Y se nazývá zobrazení na množinu Y nebo surjektivní právě tehdy, když F (X) = HF = Y . Zobrazení, které je prosté a na množinu Y se nazývá vzájemně jednoznačné neboli bijektivní zobrazení. ¡ ¢ ¡ ¢ Věta 1. Zobrazení F : X → Y je prosté právě tehdy, když z rovnosti F x1 = F x2 plyne x1 = x2 . Toto tvrzení ¡je ekvivalentní ¢ ¡ ¢ tvrzení, že zobrazení F : X → Y je prosté právě tehdy, když pro každé x1 6= x2 je F x1 6= F x2 . Zobrazení F : X → Y je zobrazení na množinu Y právě tehdy, když pro každé y ∈ Y existuje x ∈ X takové, že F (x) = y. Zobrazení F : X → Y je vzájemně jednoznačné právě tehdy, když pro každé y ∈ Y existuje právě jedno x ∈ X takové, že y = F (x). Poznámka. Z definice zobrazení plyne, že pro každé x ∈ X existuje právě jedno y ∈ Y takové, že y = F (x). Z věty pak plyne, že pro vzájemně jednoznačné zobrazení je vztah mezi x ∈ X a y ∈ Y vzájemně jednoznačný.
Věta 2. Nechť je F : X → Y a ¡G : Y¢ → Z. Pak existuje právě jedno zobrazení H : X → Z definované vztahem z = H(x) = G F (x) . Definice 5. Zobrazení H : X → Z z věty 2 se nazývá složené zobrazení (zobrazení F a G) a značí se H = G ◦ F . Věta 3. Nechť F : X → Y , G : Y → Z a H : Z → U jsou zobrazení. Pak platí asociativní zákon ¡ ¢ ¡ H ◦ G ◦ F = H ◦ G ◦ F). Důkaz: Pro každé x ∈ X je H ◦ G ◦ F (x) = H ◦ G F (x) = H G F (x) . Na druhou stranu je H ◦ G ◦ F (x) = H G F (x) . ¤ Typeset by AMS-TEX 1
Věta 4. Nechť F : X →¡Y je prosté. Pak existuje zobrazení G : Y → X takové, že G ◦ F = idX , tj. ¢ pro každé x ∈ X platí G F (x) = x . Důkaz: Nechť y ∈ F (X). Pak existuje právě jedno x ∈ X takové, že F (x) = y. Pro takové y definujeme G(y) = x. Jestliže y ∈ Y a y ∈ / F (X), položíme G(y) = x0 , kde x0 je libovolný pevně daný prvek množiny X. Snadno se lze přesvědčit, že takto definované zobrazení G : Y → X má požadované vlastnosti. ¤
Věta 5. Nechť je F : X → Y zobrazení množiny X na¡množinu ¢ Y . Pak existuje zobrazení G : Y → X takové, že F ◦ G = idY , tj. pro každé y ∈ Y platí F G(y) = y. Důkaz: Pro každé y ∈ Y je množina F(−1) (y) neprázdná. Z této množiny vybereme jedno x (zde používáme axióm výběru, což je jeden z axiómů teorie množin). Snadno se ukáže, že takto definované zobrazení G : Y → X má požadované vlastnosti. ¤
Věta 6. Nechť je F : X → Y vzájemně jednoznačné zobrazení. Pak existuje právě jedna funkce G : Y → X taková, že G ◦ F = idX a F ◦ G = idY . Důkaz: Podle vět 4 a 5 existují zobrazení G a H množiny Y do X takové, že F ◦ G = idY a H ◦ F = idX . Pak ale je H = H ◦ idY = H ◦ (F ◦ G) = (H ◦ F ) ◦ G = idX ◦G = G . Tedy H = G, což dokazuje existenci. Jsou-li G1 a G2 dvě funkce s uvedenými vlastnostmi, je G1 = G1 ◦ idY = G1 ◦ (F ◦ G2 ) = (G1 ◦ F ) ◦ G2 = idX ◦G2 = G2 a tedy zobrazení G je jediné.
¤
Definice 6. Zobrazení G : Y → X v věty 6 se nazývá inverzní zobrazení k vzájemně jednoznačnému zobrazení F a budeme jej značit F −1 . Věta 7. Nechť jsou zobrazení F : X → Y a G : Y → Z prostá, resp. na množinu Y a Z. Pak je také složené zobrazení G ◦ F prosté, resp. na množinu Z. Důkaz: Nechť jsou zobrazení F a G prostá a x1 , x2 ∈ X, x1 6= x2 . Pak je F (x1 ) 6= F (x2 ), a také G F (x1 ) = 6 G F (x2 ) . Tedy zobrazení G ◦ F je prosté. Nechť je G zobrazení na množinu Z. Tedy pro každé z ∈ Z existuje y ∈ Y takové, že z = G(y). Je-li navíc F zobrazení na množinu Y existuje ke každému y ∈ Y prvek x ∈ X takový, že y = F (x). Tedy ke každému z ∈ Z existuje x ∈ X takové, že z = G(y) = G F (x) , neboli složené zobrazení G ◦ F je na množinu Z. ¤
Věta 8. Nechť F : X → Y a G : Y → Z jsou vzájemně jednoznačná zobrazení. Pak je také ¡ ¢−1 G ◦ F : X → Z vzájemně jednoznačné a G ◦ F = F −1 ◦ G−1 . Důkaz: Podle věty 7 je složené zobrazení G ◦ F vzájemně jednoznačné. Proto k tomuto zobrazení existuje jediné −1 inverzní zobrazení G ◦ F . Protože platí G ◦ F ◦ F −1 ◦ G−1 = G ◦ F ◦ F −1 ◦ G−1 = G ◦ idY ◦G−1 = G ◦ G−1 = idZ F −1 ◦ G−1 ◦ G ◦ F = F −1 ◦ G−1 ◦ G ◦ F = F −1 ◦ idY ◦F = F −1 ◦ F = idX , je G ◦ F
−1
= F −1 ◦ G−1 .
¤
V různých oborech matematiky se zkoumají množiny s určitými vlastnostmi a zobrazení mezi těmito množinami, které mají také jisté vlastnosti. V přednášce Matematická analýza 1 se zkoumala zobrazení F : X → Y , kde X a Y byly podmnožinami R, tj. funkce na R. V množině R jsou oproti obecné množině definovány algebraické operace sčítání a násobení a zejména okolí bodu x ∈ R. Právě okolí bodu nám dovoluje zavést na podmnožině funkcí na R takové operace jako limita funkce. Operace sčítání a násobení nám umožňují definovat pojmy jako derivace a integrál a vybudovat diferenciální a integrální počet funkcí jedné proměnné. V přednášce Matematická analýza 2 zobecníme diferenciální a integrální počet funkcí jedné proměnné na zobrazení F : X → Y , kde X ⊂ Rn a Y ⊂ Rk .
2
Přednáška 1 Prostor Rn a některé jeho podmnožiny Prostor Rn lze realizovat jako množinu uspořádaných n–tic reálných čísel, ¢tj. jako množina je ¡ R = R × R × · · · × R. Prvky Rn budeme značit x . Tedy x = x1 , x2 , . . . , xn , kde xi ∈ R, i = | {z } n
n krát
1, 2, . . . , n. V prostoru Rn se definují operace násobení reálným číslem a vztahem ¡ ¢ ¡ ¢ x = a x1 , x2 , . . . , xn = ax1 , ax2 , . . . , axn ax a operaci sčítání ¡ ¢ ¡ ¢ ¡ ¢ x + y = x1 , x2 , . . . , xn + y1 , y2 , . . . , yn = x1 + y1 , x2 + y2 , . . . , xn + yn . S těmito operacemi je množina Rn vektorový prostor nad tělesem reálných čísel. Abychom mohli mluvit o limitách v prostoru Rn musíme zavést okolí bodů. To lze definovat pomocí vzdálenosti dvou bodů. Vzhledem k dalším aplikacím zavedeme vzdálenost obecně. Definice 1. Nechť je M množina. Funkci ρ : M ×M → R nazveme metrikou, jestliže má následující vlastnosti: (1) pro každé x ∈ M je ρ(x, x) = 0; (2) pro každé x, y ∈ M , x 6= y, je ρ(x, y) = ρ(y, x) > 0; (3) pro každé x, y, z ∈ M platí ρ(x, z) ≤ ρ(x, y) + ρ(y, z). Množinu M , na které je definována metrika, nazýváme metrický prostor. Pokud budeme chtít zdůraznit, že M je metrický prostor s metrikou ρ, budeme psát (M, ρ). Pomocí metriky definujeme v metrickém prostoru okolí bodů. Definice 2. Nechť je¡(M, ρ) ¢ metrický prostor a x0 ∈ M . Pro každé ε > 0 nazýváme množinu všech x ∈ M , pro která je ρ x, x0 < ε ¡okolím ¢ bodu x0 (přesněji otevřeným ε–ovým okolím bodu x0 . ε–ové okolí bodu x0 budeme značit Uε x0 . ¡ ¢ Množinu všech bodů x ∈ M , pro která je 0 < ρ x, x < ε nazýváme prstencové okolí bodu x0 a 0 ¡ ¢ budeme jej značit Pε x0 . ¡ ¢ ¡ ¢ © ª Zřejmě platí Pε x0 = Uε x0 \ x0 . Příklad 1. Nechť M je libovolná neprázdná množina. Definujme funkci ρ : M × M → R předpisem ( ρ(x, y) =
0
pro x = y
1
pro x 6= y.
Snadno se ukáže, že ρ je metrika na M . Pro ε > 1 a x0 ∈ M je Uε x0 = M a Pε (x0 ) = M \ {x0 }. Pro ε ≤ 1 a každé x0 ∈ M je Uε x0 = x0 , tedy jednobodová množina obsahující pouze bod x0 a Pε (x0 ) = ∅. Takto definovaná metrika se nazývá diskrétní.
Definice 3. Nechť (M, ρ) je metrický prostor a X ⊂ M . Bod x ∈ X nazveme vnitřní bod množiny X právě tehdy, když existuje okolí Uε (x) takové, že Uε (x) ⊂ X. Množinu všech vnitřních bodů množiny X ⊂ M nazýváme vnitřkem množiny M a značíme X ◦ . Definice 4. Nechť (M, ρ) je metrický prostor. Množina X ⊂ M se nazývá otevřená právě tehdy, je-li každý bod x ∈ X vnitřním bodem množiny X, tj. právě tehdy, když X = X ◦ . Definice 5. Nechť (M, ρ) a (M, σ) jsou metrické prostory. Jestliže existují reálná čísla a a b, 0 < a ≤ b taková, že pro každé x, y ∈ M platí aρ(x, y) ≤ σ(x, y) ≤ bρ(x, y) nazveme metriky ρ a σ ekvivalentní. 3
Věta 1. Nechť jsou (M, ρ) a (M, σ) metrické prostory s ekvivalentními metrikami ρ a σ. Množina X ⊂ M je otevřená v metrice ρ právě tehdy, když je otevřená v metrice σ. Důkaz: Nechť je X ⊂ M otevřená množina v metrice ρ a x ∈ X. Pak existuje ε > 0 takové, že každé y ∈ M , pro které platí ρ(x, y) < ε, je prvkem X. Z nerovnosti σ(x, y) ≤ bρ(x, y) plyne, že každý bod y ∈ M , pro který je σ(x, y) < bε patří do množiny X. Tedy x je vnitřní bod množiny X v metrice σ. Podobně je-li v metrice σ okolí bodu x ∈ X s poloměrem ε podmnožinou X, stačí zvolit v metrice ρ okolí s poloměrem ε/a. ¤
Věta 2. Nechť je (M, ρ) metrický prostor. Pak jsou ∅ a M otevřené množiny. [ Jestliže jsou Xα ⊂ M , a ∈ A, kde A je množina, otevřené množiny, je množina Xa otevřená a∈A
množina. Jestliže jsou Xi ⊂ M , kde i = 1, 2, . . . , N , otevřené množiny, je množina
N \
Xi otevřená.
i=1
Důkaz: Protože ∅ neobsahuje žádný bod, je každý její bod jejím vnitřním bodem (ukažte, že neplatí opačné tvrzení), a tedy prázdná množina je otevřená. Protože pro každé x ∈ M a libovolné ε > 0 je Uε (x) ⊂ M , je množina M otevřená. [ Nechť je x ∈ Xa . Pak existuje index a ∈ A takový, že x ∈ Xa . Protože je množina Xa otevřená, existuje pro a∈A
každé x ∈ Xa okolí Uε (x) ⊂ Xa . Tedy Uε (x) ⊂
[
Xa .
a∈A
Nechť x ∈
N \
Xi . Pak je pro každé i = 1, . . . , N bod x ∈ Xi . Protože jsou množiny Xi otevřené, existují okolí
i=1
Uεi (x) ⊂ Xi . Jestliže zvolíme ε = min ε1 , . . . εN > 0 pro každé i = 1, . . . , N okolí Uε (x) ⊂ Uεi (x) ⊂ Xi , a tedy také N \ Uε (x) ⊂ Xi . ¤ i=1
Věta 3. Vnitřek množiny X ⊂ M je největší otevřená podmnožina X, tj. jestliže je Y ⊂ X otevřená množina, pak Y ⊂ X ◦ . X ◦ je sjednocení všech otevřených podmnožin Y množiny X. Důkaz: Nechť je Y ⊂ X otevřená množina. Pak je každý bod x ∈ Y vnitřní bod množiny X, a tedy x ∈ X ◦ . Druhé tvrzení plyne z toho, že sjednocení libovolné množiny otevřených množin je otevřená množina. ¤
Definice 6. Nechť je (M, ρ) metrický prostor a X ⊂ M . Bod x ∈ M nazýváme hromadný bod množiny X právě tehdy, když každé prstencové okolí Pε (x) obsahuje alespoň jeden bod množiny X. Množinu všech hromadných bodů množiny X budeme značit der X. Poznámka: Je-li x hromadný bod množiny X, pak každé okolí bodu x obsahuje nekonečně mnoho bodů množiny X.
Definice 7. Nechť (M, ρ) je metrický prostor a X ⊂ M . Pak množinu X = X ∪ der X nazýváme uzávěr množiny X. Definice 8. Podmnožina X metrického prostoru (M, ρ) se nazývá uzavřená právě tehdy, když obsahuje všechny své hromadné body, tj. právě když X = X. Věta 4. Nechť (M, ρ) je metrický prostor. (1) Množina X ⊂ M je uzavřená právě tehdy, když je M \ X otevřená. (2) Množina X ⊂ M je otevřená právě tehdy, když je množina M \ X uzavřená. Důkaz: Nechť je množina X uzavřená. Je-li x ∈ M \ X, pak není prvkem der X. Tedy existuje prstencové okolí Pε (x) bodu x takové, že Pε (x) ∩ X = ∅. Tedy pro toto ε platí Uε (x) ⊂ M \ X a tedy x je vnitřním bodem množiny M \ X. Nechť je množina M \ X otevřená a x ∈ der X. Pak pro každé prstencové okolí Pε (x) je Pε (x) ∩ X 6= ∅. Tedy protože je M \ X otevřená množina, platí x ∈ / M \ X, tj. x ∈ X. Tedy množina X obsahuje všechny své hromadné body. Tvrzení části (2) lze dokázat pomocí rovnosti X = M \ (M \ X). ¤
Věta 5. Nechť je (M, ρ) metrický prostor. Pak jsou množiny ∅ a M uzavřené. \Jestliže jsou Xa , a ∈ A, kde A je libovolná množina, uzavřené množiny. Pak je množina X = Xa uzavřená. a∈A
4
Jestliže jsou Xi , i = 1, 2, . . . , N , uzavřené množiny, je množina X =
N [
Xi uzavřená.
i=1
Důkaz: Stačí použít větu 2 a de Morganovy vzorce [
\ M \ Xa = M \ Xa ,
a∈A
a∈A
\
[ M \ Xa = M \ Xa .
a∈A
¤
a∈A
Věta 6. Nechť (M, ρ) je metrický prostor a X ⊂ M . Pak platí: (1) X je nejmenší uzavřená množina, pro kterou je X ⊂ X, tj. je-li X ⊂ Y a Y je uzavřená, pak X ⊂Y. (2) X je průnik všech uzavřených množin Y takových, že X ⊂ Y . Důkaz: Tuto větu lze dokázat stejně jako její analogii pro otevřené množiny (Věta 3) nebo pomocí de Morganových vzorců. ¤
Definice 9. Nechť je (M, ρ) metrický prostor a X ⊂ M . Hranicí množiny X nazýváme množinu ∂X = X ∩ M \ X. Bod x ∈ ∂X se nazývá hraniční bod množiny X. Definice 10. Nechť je (M, ρ) metrický prostor a X ⊂ M je neprázdná. Průměrem množiny X nazýváme číslo dia(X) = sup ρ(x, y) . x, y∈X
Je-li X = ∅, klademe dia(X) = 0. Množina X ⊂ M se nazývá omezená, je-li dia(X) < ∞. Věta 7. Podmnožina X metrického prostoru (M, ρ) je omezená právě tehdy, když existuje y ∈ M a K ∈ R takové, že pro každé x ∈ X je ρ(y, x) ≤ K. Důkaz: Nechť y ∈ M . Pro každé x1 , x2 ∈ X plyne z trojúhelníkové nerovnosti ρ x1 , x2 ≤ ρ x1 , y + ρ y, x2 . Jestliže pro každé x ∈ X platí nerovnost ρ(x, y) ≤ K, pak pro každé x1 , x2 ∈ X platí nerovnost ρ x1 , x2 ≤ 2K. Z toho ale plyne, že dia(X) = sup ρ x1 , x2 ≤ 2K. x1 , x2 ∈X
Nechť je množina Xomezená ay ∈ M . Nechť je x0 ∈ M pevné. Pro každé x ∈ X plyne z trojúhelníkové nerovnosti vztah ρ(y, x) ≤ ρ y, x0 + ρ x0 , x ≤ K, kde K = ρ y, x0 + dia(X). ¤
Definice 11. Nechť je (M, ρ) metrický prostor. Množina X ⊂ M se nazývá nesouvislá právě tehdy, když existují podmnožiny A, B ⊂ X takové, že X = A ∪ B a A ∩ B = A ∩ B = ∅. Množina X ⊂ M se nazývá souvislá pravě tehdy, když není nesouvislá. Definice 12. Vzdáleností dvou neprázdných podmnožin X a Y metrického prostoru (M, ρ) nazýváme číslo dist(X, Y ) = inf ρ(x, y) . x∈X y∈Y
Prostor Rn není pouze množina uspořádaných n–tic reálných čísel, ale, jak jsem se zmínil na začátku, má také strukturu vektorového prostoru. Ve vektorových prostorech lze definovat jistou metriku pomocí pojmu norma vektoru, což je v podstatě vzdálenost bodu x od počátku. Definice 13. Nechť je V vektorový prostor nad tělesem R. Zobrazení ν : V → R, pro které platí: (1) (2) (3) (4)
ν(x) ≥ 0 ν(x) = 0 =⇒ x = 0 ν(ax) = |a|ν(x) ν(x + y) ≤ ν(x) + ν(y)
se nazývá norma. Vektorový prostor V , na kterém je definována norma se nazývá normovaný prostor. Jestliže chceme zdůraznit, že V je normovaný prostor s normou ν, budeme psát (V, ν). 5
Věta 8. Je-li (V, ν) normovaný prostor, je (V, ρ), kde ρ(x, y) = ν(x − y), metrický prostor. Důkaz: Protože ν(0) = 0, je ρ(x, x) = ν(x − x) = ν(0) = 0. Jestliže x 6= y jsou libovolné dva prvky V , pak ρ(x, y) = ν(x − y) = ν(y − x) = ρ(y, x) 6= 0. Pro každé tři prvky x, y, z ∈ V platí ρ(x, z) = ν(x − z) = ν (x − y) + (y − z) ≤ ν(x − y) + ν(y − z) = ρ(x, y) + ρ(y, z) . Tedy ρ je metrika.
¤
Definice 14. Dvě normy ν1 a ν2 vektorového prostoru V se nazývají ekvivalentní, jestliže existují a, b ∈ R, 0 < a ≤ b, takové, že aν1 (x) ≤ ν2 (x) ≤ bν1 (x). Poznámka: Je zřejmé, že metriky ρ1 a ρ2 generované ekvivalentními normami ν1 a ν2 jsou ekvivalentní. Příklad 2. Lze ukázat, že pro každé p ≥ 1 je !1/p n X p xi x) = νp (x i=1
norma v prostoru R a že tyto normy jsou ekvivalentní. Pro nás budou důležité normy ν1 , ν2 a νmax = lim νp . Pro tyto normy platí n
p→∞
x) = ν1 (x
n X
xi ,
i=1
x) = ν2 (x
n X
xi
2
!1/2 ,
i=1
x) = max |x1 |, |x2 |, . . . , |xn | . νmax (x Ukážeme, že všechny tyto normy jsou navzájem ekvivalentní. Z nerovností n X xi = ν1 (x x) ≤ n max |x1 |, |x2 |, . . . , |xn | = nνmax (x x) x) = max |x1 |, |x2 |, . . . , |xn | ≤ νmax (x k=1
plyne, že normy ν1 a νmax jsou ekvivalentní. Ekvivalence norem νmax a ν2 plyne z nerovností x) = max |x1 |, |x2 |, . . . , |xn | ≤ νmax (x
n X 2 xi
!1/2 x) ≤ = ν2 (x
√ √ x) . n max |x1 |, |x2 |, . . . , |xn | = nνmax (x
k=1
Z nerovností
a2
+
b2
a 2ab ≤ a2 + b2 , které platí pro a, b > 0 plyne, že !2 n n n X X X 2 2 x) = x) ≤ n x) . ν2 (x x ≤ xi = ν12 (x x2 = nν2 (x
≤ (a +
b)2
i
i
k=1
k=1
k=1
√ x). x) ≤ ν1 (x x) ≤ nν2 (x Tedy platí nerovnost ν2 (x n x), kde p ≥ 1. Obecně lze ukázat, že v R jsou vzájemně ekvivalentní všechny normy νp (x
Dále budeme prostor Rn považovat za metrický prostor s metrikou generovanou jednou z ekvivalentních norem ν1 , ν2 nebo νmax . Příklad 3. Nechť je M ⊂ R a B(M ) je vektorový všech funkcí omezených na M . Ve vektorovém prostoru prostor B(M ) lze zavést normu ν vztahem ν(f ) = sup f (x) . x∈M
V prostoru Rn je norma ν2 z příkladu 2 definována pomocí operace, která se nazývá skalární součin. Definice 15. Nechť je V vektorový prostor nad tělesem R. Pak funkci (·, ·) : V × V → R, která má pro každé x, y, z ∈ V a a, b ∈ R vlastnosti: (1) (ax + by, z) = a(x, z) + b(y, z), (2) (x, y) = (y, x), (3) (x, x) ≥ 0, (4) (x, x) = 0 ⇔ x = 0 nazýváme skalární součin. Často se značí (x, x) = kxk2 . Příklad 4. Ve vektorovém prostoru
Rn definujeme skalární součin vztahem (xx, y ) =
n X i=1
6
xi yi .
Věta 9. (Schwarzova nerovnost) Jestliže je V vektorový prostor se skalárním součinem, pak pro každé x, y ∈ V platí nerovnost (x, y)2 ≤ kxk2 kyk2 . Přitom rovnost platí pouze tehdy, když x a y jsou lineárně závislé. Důkaz: Je-li y = 0, platí znak rovnosti. Nechť y 6= 0. Pro každé λ ∈ R platí 0 ≤ (x − λy, x − λy) = kxk2 − 2λ(x, y) + λ2 kyk2 . Přitom rovnost platí pouze tehdy, když x − λy = 0, tj. když jsou jsou x a y lineárně závislé. Zvolme λ =
(x, y) . Pak kyk2
z uvedené nerovnosti dostaneme 0 ≤ kxk2 − 2 z čehož plyne dokazovaná nerovnost.
(x, y)2 (x, y)2 (x, y)2 + = kxk2 − , 2 2 kyk kyk kyk2
¤ (x, y) (x, y) ≤ 1. Proto lze psát = kxk · kyk kxk · kyk je tedy úhel mezi dvěma nenulovými vektory x a y dán vztahem
Poznámka: Ze Schwarzovy nerovnosti plyne pro kxk, kyk 6= 0, že −1 ≤ cos ϕ, kde ϕ je úhel mezi vektory x a y. V případě Rn cos ϕ =
n X i=1
! xi yi
·
n X i=1
x2i ·
n X
!−1/2 yk2
.
k=1
Věta 10. Jestliže je V vektorový p prostor se skalárním součinem, je V normovaný prostor s normou definovanou vztahem ν(x) = (x, x) = kxk. Důkaz: Ověření vlastností normy je zřejmé. Snad až na nerovnost kx + yk ≤ kxk + kyk. Ta plyne ze Schwarzovy nerovnosti, neboť kx + yk2 = (x + y, x + y) = kxk2 + 2(x, y) + kyk2 ≤ kxk2 + 2kxk · kyk + kyk2 = kxk + ky]|
2
.
¤
Definice 16. Nechť je V vektorový prostor a x, y ∈ V . Množina všech bodů z = x + (y − x)t, t ∈ h0, 1i se nazývá úsečka z bodu x do bodu y. Bod x je počáteční bod a y koncový bod této úsečky. Definice 17. Podmnožina M vektorového prostoru V se nazývá konvexní, jestliže pro každé dva body x, y ∈ M leží celá úsečka z bodu x do bodu y v množině M , tj. pro každé t ∈ h0, 1i je x + (y − x)t ∈ M . Definice 18. Podmnožina M ⊂ Rn s metrikou generovanou normou νp se nazývá kompaktní, jestliže je omezená a uzavřená. Poznámka: Význam kompaktních množin pro matematickou analýzu bude zřejmý, až zavedeme pojem limity posloupnosti.
7
Přednáška 2 Posloupnosti v metrických prostorech Definice 1. Posloupností v metrickém prostoru M nazýváme každé zobrazení f : N → M . Pro posloupnosti bývá zvykem psát f (n) = xn . Definice 2. Posloupnost xn v metrickém prostoru (M, ρ) se nazývá omezená právě tehdy, když je omezená množina {xn ; n ∈ N}, tj. když existuje x ∈ M a K ∈ R takové, že pro každé n ∈ N je ρ(x, xn ) < K. Věta 1. Jsou-li metriky ρ1 a ρ2 ekvivalentní, je posloupnost xn omezená v metrice ρ1 právě tehdy, když je omezená v metrice ρ2 . Důkaz: Tvrzení je zřejmé z definice ekvivalentních metrik.
¤
Definice 3. Nechť je xn posloupnost a k1 < k2 · · · < kn . . . , ki ∈ N. Pak posloupnost yn = xkn nazýváme vybranou posloupností z posloupnosti xn . ! 1 n + 3 2n−1 Příklad 1. Příkladem posloupnosti v R je posloupnost x n = 2, , , sin n . Tato posloupnost n+1 n+1 x je omezená, protože například pro metriku generovanou normou ! νmax je ρ(x n , 0) = νmax (0 − x n ) < 100. 1 2n + 3 4n−1 Posloupnost y n = x 2n = 2, , , sin 2n je vybraná posloupnost z posloupnosti x n . 2n + 1 2n + 1 Příkladem neomezené posloupnosti v R4 je třeba posloupnost z n = cos nπ, 5, (−1)n n, n2 + 3n + 1 . 4
Definice 4. Nechť je xn posloupnost v metrickém prostoru (M, ρ). Prvek x ∈ M se nazývá limitou posloupnosti xn právě tehdy, když lim ρ(x, xn ) = 0, tj. když ke každému ε > 0 existuje n0 ∈ N n→∞
takové, že pro každé n ∈ N, n > n0 je ρ(x, xn ) < ε. Jestliže je x limitou posloupnosti xn , píšeme lim xn = x a říkáme, že posloupnost xn konverguje k prvku x. n→∞
Posloupnosti xn , které mají limitu se nazývají konvergentní a posloupnosti, jejichž limita neexistuje nazýváme divergentní posloupnosti.
Věta 2. Každá posloupnost v metrickém prostoru (M, ρ) má nejvýše jednu limitu. 1 ρ(x, y) > 0. K tomuto ε 3 existují n0,x a n0,y takové, že pro každé n > n0,x je ρ(x, xn ) < ε a pro každé n > n0,y je ρ(y, xn ) < ε. Nechť n0 = max n0,x , n0,y . Tedy pro každé n > n0 platí nerovnost Důkaz: Nechť má posloupnost xn v metrickém prostoru M dvě limity x 6= y. Pak ε =
ρ(x, y) ≤ ρ(x, xn ) + ρ(y, xn ) < ε + ε = To je ale spor s tím, že ρ(x, y) > 0. Tedy ρ(x, y) = 0 a x = y.
2 ρ(x, y) . 3
¤
Věta 3. Každá konvergentní posloupnost je omezená. Důkaz: Nechť je lim xn = x. Pro ε = 1 existuje n0 takové, že pro každé n > n0 platí nerovnost ρ(x, xn ) < 1. Pro n→∞ K = max 1, ρ(x, x1 ), ρ(x, x2 ), . . . , ρ(x, xn0 ) je splněna nerovnost ρ(x, xn ) ≤ K pro každé n ∈ N. ¤
Věta 4. Jestliže je posloupnost yn vybrána z konvergentní posloupnosti xn , je konvergentní a lim yn = lim xn . n→∞
n→∞
Důkaz: Protože lim xn = x, existuje ke každému ε > 0 číslo n0 takové, že pro každé n > n0 je ρ(x, xn ) < ε. Protože n→∞
je yn vybraná posloupnost z posloupnosti xn , je yn = xm , kde m ≥ n. Proto stačí k danému ε > 0 zvolit ve vybrané posloupnosti yn stejné číslo n0 . ¤
Věta 5. Nechť jsou ρ1 a ρ2 dvě ekvivalentní metriky v metrickém prostoru M . Pak posloupnost xn konverguje k x v metrice ρ1 právě tehdy, když konverguje k x v metrice ρ2 . Důkaz: Plyne bezprostředně z definice ekvivalentních metrik. 8
¤
Věta 6. Nechť je x n =
¡
x1,n , x2,n , . . . , xk,n
¢
posloupnost v prostoru Rk . Pak lim x n = x = n→∞
(x1 , x2 , . . . , xk ) právě tehdy, když pro každou složku je lim xi,n = xi , i = 1, 2, . . . , k. n→∞
Důkaz: Nechť lim x n = x . Pak ke každému ε > 0 existuje n0 takové, že pro každé n > n0 je n→∞
k X xk,n − xk < ε. Ale i=1
k X xi,n − xi < ε. Tedy pro každé i = 1, 2, . . . , k z toho plyne, že pro n > n0 a každé i = 1, 2, . . . , k je xi,n − xi ≤ i=1
je lim xi,n = xi . n→∞
ε přirozená čísla n0,i taková, že pro každé k k X ε xi,n − xi < k ε = ε. ¤ ni > n0,i je xi,ni − xi < . Ale pak pro n0 = max n0,1 , n0,2 , . . . , n0,k je k k i=1 2n−3 n ! 2 n +n+1 n+3 2 1 4 −2/π Příklad 2. lim , , arctg n ,e ,e . = n→∞ 3n2 + 2n + 3 n+1 π 3 Příklad 3. Posloupnost xn = xn pro x ∈ (0, 1) nekonverguje u prostoru B (0, 1) k nule, přestože pro každé x ∈ (0, 1) je lim xn = 0. Pro každé n ∈ N je totiž sup xn = 1. Proto pro ε < 1 neexistuje n0 takové, aby pro každé n > n0 Naopak jestliže pro každé i = 1, 2, . . . , k je lim xi,n = xi existují pro n→∞
n→∞
x∈(0,1)
bylo ρ(xn , 0) < ε.
V matematické analýze hraje konvergence v prostoru B(M ), kde M je množina, velmi důležitou roli. Konvergence v tomto prostoru se nazývá stejnoměrná konvergence na rozdíl od tak zvané bodové konvergence. Proto budu přesněji definovat tyto dva pojmy nejprve na prostoru omezených funkcí na množině M ⊂ R. Definice 5. Nechť je fn (x) posloupnost omezených funkcí na množině M ⊂ R. Řekneme, že posloupnost fn (x) konverguje bodově k funkci¯ f (x), jestliže¯ pro každé ε > 0 a pro každé x ∈ M existuje n0 (x) takové, že pro každé n > n0 (x) je ¯fn (x) − f (x)¯ < ε. Bodovou konvergenci posloupnosti funkci fn (x) k funkci f (x) budeme značit fn (x) → f (x). Definice 6. Nechť je fn (x) posloupnost omezených funkcí na množině M ⊂ R. Řekneme, že posloupnost fn (x) konverguje stejnoměrně k funkci ¯f (x), jestliže ¯pro každé ε > 0 existuje n0 ∈ N takové, že pro každé x ∈ M a pro každé n > n0 je ¯fn (x) − f (x)¯ < ε. Stejnoměrnou konvergenci posloupnosti funkcí fn (x) k funkci f (x) budeme značit fn (x) ⇒ f (x). Poznámka: Rozdíl mezi bodovou a stejnoměrnou konvergencí spočívá v tom, že při bodové konvergenci může být n0 závislé na x ∈ M , kdežto při stejnoměrné konvergenci je toto n0 pro všechna x ∈ M stejné. Zapíšeme bodovou a stejnoměrnou konvergenci symbolicky ∀ε > 0 ∀x ∈ M ∃n0 ∈ N ; ∀n > n0 =⇒ f (x) − fn (x) < ε ⇐⇒ lim fn (x) = f (x) bodově n→∞ ∀ε > 0 ∃n0 ∈ N ; ∀x ∈ M , ∀n > n0 =⇒ f (x) − fn (x) < ε⇐⇒ lim fn (x) = f (x) stejnoměrně n→∞
Z tohoto zápisu je zřejmé, že pokud posloupnost funkcí fn (x) konverguje k funkci f (x) stejnoměrně, konverguje k ní také bodově. Ale opak není pravda. Právě stejnoměrná konvergence je konvergence v prostoru B(M ). Příklad 4. Na intervalu (0, 1) uvažujme posloupnost fn (x) = xn . Nechť ε > 0. Nechť je 0 < ε < 1. Hledejme n0 ln ε ln ε . Ale protože lim = +∞, není možné tak, aby pro každé x ∈ (0, 1) platila nerovnost xn0 < ε. Pak je n0 > x→1− ln x ln x n zvolit n0 nezávisle na x. n0 je vlastně neomezenou funkcí x ∈ (0, 1). Proto posloupnost funkcí fn (x) = x konverguje sice bodově k funkci f (x) = 0, ale nekonverguje k této funkci stejnoměrně, tj. v prostoru B (0, 1) .
Věta 7. (Cauchy–Bolzanova podmínka konvergence) Nechť je posloupnost xn v metrickém prostoru M konvergentní. Pak ke každému ε > 0 existuje n0 takové, že pro každé m, n > n0 platí nerovnost ρ(xm , xn ) < ε. ε Důkaz: Nechť posloupnost xn konverguje k x ∈ M a ε > 0. Pak k existuje n0 takové, že pro každé m, n > n0 2 ε ε a ρ(x, xn ) < . Z trojúhelníkové nerovnosti plyne, že pro každé m, n > n0 platí ρ(xm , xn ) ≤ je ρ(x, xm ) < 2 2 ε ε ρ(xm , x) + ρ(x, xn ) < + = ε. ¤ 2 2
Definice 7. Posloupnost xn v metrickém prostoru M se nazývá Cauchyovská právě tehdy, když splňuje Cauchy–Bolzanovu podmínku: Ke každému ε > 0 existuje n0 takové, že pro všechna m, n > n0 platí nerovnost ρ(xm , xn ) < ε. 9
Věta 7. říká, že každá konvergentní posloupnost je Cauchyovská. Opak není obecně pravda. Například v množině racionálních čísel Q nekonverguje každá Cauchyovská posloupnost k racionálnímu číslu. Proto se množina racionálních čísel Q rozšiřuje na množinu reálných čísel R, ve které už každá Cauchyovská posloupnost konvergentní. Definice 8. Metrický prostor (M, ρ) se nazývá úplný, má-li každá Cauchyovská posloupnost xn v M limitu v M . Příklad 5. Pro každé k je prostor Rk je úplný. To plyne z toho, že když je posloupnost x n v Rk Cauchyovská, jsou Cauchyovské všechny posloupnosti xk,n jejich složek. Úplnost pak plyne z úplnosti množiny reálných čísel. Příklad 6. Nechť je C(X) ⊂ B(X) vektorový prostor omezených spojitých funkcí na množině X ⊂ R se supremovou normou. Tento prostor je úplný. Důkaz: Nechť je fn (x) Cauchyovská posloupnost v prostoru C(X). Pak je pro každé x ∈ X Cauchyovská posloupnost reálných čísel fn (x). Z úplnosti množiny reálných čísel R plyne, že pro každé x ∈ X existuje lim fn (x) = f (x); tj.že n→∞
posloupnost funkcí fn (x) konverguje bodově k funkci f (x). O této funkci f (x) dokážeme, že patří do prostoru C(X), tj. že je omezená a spojitá, a že je limitou posloupnosti fn (x) v prostoru C(X). Protože je posloupnost fn (x) Cauchyovská, existuje pro ε = 1 přirozené číslo n0 takové, že pro všechna m, n > n0 je sup fm (x) − fn (x) < 1. Tedy pro každé x ∈ X je fm (x) − fn (x) < 1. Když přejdeme v této posloupnosti k x∈X limitě m → ∞, získáme nerovnost f (x) − fn (x) ≤ 1, která platí pro všechna n > n0 a x ∈ X. Jestliže nyní zvolíme jedno pevné n > n0 , získáme pro každé x ∈ X nerovnost − fn (x) − 1 ≤ f (x) ≤ fn (x) + 1. Protože je funkce fn (x) omezená, plyne z této nerovnosti, že je omezená také funkce f (x). K důkazu spojitosti funkce f (x) v bodě x ∈ X použijeme nerovnost f (x) − f (y) = f (x) − fn (x) + fn (x) − fn (y) + fn (y) − f (y) ≤ f (x) − fn (x) + fn (x) − fn (y) + f (y) − fn (y) . 1 Nechť je je ε > 0. Protože je fn (x) Cauchyovská v prostoru C(X), existuje k ε číslo n0 takové, že pro všechna m, 4 1 n > n0 a všechna x ∈ X platí nerovnost fm (x) − fn (x) < ε. Pokud v této nerovnosti přejdeme k limitě m → ∞, 4 1 1 získáme nerovnost f (x) − fn (x) ≤ ε < ε, která platí pro všechna n > n0 a všechna x ∈ X. Zvolme pevně 4 3 1 n > n0 . Protože je podle předpokladu funkce fn (x) spojitá v bodě x ∈ X, existuje k ε číslo δ > 0 takové, že pro 3 1 všechna y ∈ X, pro která je |x − y| < δ je fn (x) − fn (y) < ε. Z uvedené nerovnosti plyne, že pro námi zvolené δ, 3 n platí nerovnost a pro každé y ∈ X, pro které je |x − y| < δ f (x) − f (y) ≤ f (x) − fn (x) + fn (x) − fn (y) + f (y) − fn (y) < ε + ε + ε = ε . 3 3 3 Tedy funkce f (x) je spojitá v každém bodě x ∈ X, a proto spojitá na X. Nakonec ukážeme, že funkce f (x) je skutečně limitou posloupnosti fn (x) v prostoru C(X) se supremovou metrikou. Nechť ε > 0 je pevně dané libovolné. Pak existuje n0 takové, že pro všechna m, n > n0 a pro každé x ∈ X platí 1 nerovnost fm (x)−fn (x) < ε. Když přejdeme k limitě m → ∞ dostaneme pro n > n0 a pro každé x ∈ X nerovnost 2 f (x) − fn (x) ≤ 1 ε. Tedy pro n > n0 platí nerovnost 2 ε ρ f (x) − fn (x) = sup f (x) − fn (x) ≤ < ε . 2 x∈X To je ale tvrzení, že lim ρ f (x), fn (x) = 0, a tedy funkce f (x) je v prostoru C(X) se supremovou normou limitou n→∞
posloupnosti fn (x). ¤ Příklad 7. Nechť je C h0, 2i vektorový prostor všech omezených spojitých funkcí na intervalu h0, 2i s metrikou Z 2 f (x) dx. Ukážeme, že tento prostor není úplný. Uvažujme posloupnost funkcí generovanou normou ν(f ) = 0
( fn (x) =
xn
pro x ∈ h0, 1) ,
1
pro x ∈ h1, 2i .
Nechť je ε > 0 a n < m. Pak je ρ fn , fm = ν fn − fm =
Z
2
fn (x) − fm (x) dx =
0
Z 0
1
xn − xm dx =
1 1 1 − < . n+1 m+1 n+1
1−ε takové, že pro každé m a n > n0 je ρ fn , fm < ε. (pro ε ε ≥ 1 lze zvolit n0 = 1). Máme tedy Cauchyovskou posloupnost. Bodová limita posloupnosti funkcí fn (x) je funkce ( 0 pro x ∈ h0, 1) , f (x) = 1 pro x ∈ h1, 2i .
Z toho plyne, že k danému 0 < ε < 1 existuje n0 >
10
Pak je
Z
2
f (x) − fn (x) dx =
Z
1
1 . n + 1 0 0 Ale funkce f (x) není spojitá v bodě x = 1, a tedy není ani limitou posloupnosti funkcí fn (x) v uvažovaném prostoru. Poznámka: Ke každému metrickému prostoru M lze sestrojit metrický prostor M 0 ⊃ M , který je úplný. Touto konstrukcí lze například množině racionálních čísel Q sestrojit množinu R reálných čísel. V případě vektorového prostoru C(X), kde X ⊂ R, s normou použitou v příkladu 7, dostaneme tzv. prostor L1 (X). Pro zavedení takových prostorů je ale třeba integrály chápat v Lebesqueově smyslu. xn dx =
Věta 8. Nechť je V normovaný vektorový prostor, lim xn = x a lim yn = y. Pak posloupnost n→∞ n→∞ ¡ ¢ xn + yn konverguje a platí lim xn + yn = x + y. n→∞
Důkaz: Protože lim xn = x a lim yn = y, existují ke každému ε > 0 přirozená čísla n0,x a n0,y taková, že pro n→∞ n→∞ ε ε každé n > n0,x je x − xn < a pro každé n > n0,y je y − yn < . Pak pro každé n > n0 = max n0,x , n0,y platí 2 2 nerovnost ε ε ν(x + y − xn − yn ) ≤ ν(x − xn ) + ν(y − yn ) < + = ε . ¤ 2 2
Věta 9. Nechť je V normovaný vektorový prostor, lim xn = x a pro reálnou posloupnost an platí n→∞ ¡ ¢ lim an = a ∈ R. Pak je posloupnost an xn konvergentní a platí lim an xn = ax.
n→∞
n→∞
Důkaz: Použijeme nerovnosti
ν ax − an xn = ν (a − an )x + an (x − xn ) ≤ a − an ν(x) + an ν(x − xn ) .
Protože je posloupnost an konvergentní, je omezená. Existuje tedy K ∈ R takové, že pro všechna n ∈ nerovnost an < K. Pak ale je ν ax − an xn ≤ a − an ν(x) + Kν x − xn . Tvrzení věty pak snadno plyne z této nerovnosti.
N platí
¤
Věta 10. Nechť je V vektorový prostor se skalárním součinem, lim xn = x a lim yn = y. Pak je n→∞ n→∞ ¡ ¢ ¡ ¢ reálná posloupnost xn , yn konvergentní a lim xn , yn = (x, y). n→∞
Důkaz: Použijeme nerovnost
x, y − xn , yn = x − xn , y + xn , y − yn ≤ x − xn , y + xn , y − yn ≤ x − xn · y + xn · y − yn .
Protože je posloupnost xn konvergentní, je omezená. Tj. existuje K ∈ R takové, že pro každé n ∈ N je xn < K. Pak ale platí nerovnost
x, y − xn , yn ≤ x − xn · y + xn · y − yn < y · x − xn + K y − yn , ze které již snadno plyne dokazované tvrzení.
¤
Nyní uvedeme jednu větu o úplných metrických prostorech, která je mnohých případech užitečná při důkazu existence a jednoznačnosti řešení rovnic. Věta 11. (věta o pevném bodě) Nechť je M úplný metrický prostor a zobrazení f : M → M má ¡ následující ¢ vlastnost: Existuje K ∈ (0, 1) takové, že pro každé x, y ∈ M platí nerovnost ρ f (x), f (y) ≤ Kρ(x, y). (Takové zobrazení se často nazývá kontrahující.) Pak existuje právě jedno x ∈ M takové, že x = f (x). Důkaz: Nechť x1 je libovolný prvek M . Sestrojme posloupnost x2 = f (x1 ), x3 = f (x2 ), . . . , xn+1 = f (xn ), . . . . Jestliže tato posloupnost konverguje k x ∈ M je toto x řešením rovnice x = f (x). To plyne limitním přechodem ve vztahu xn+1 = f (xn ). Jsou-li x = f (x) a y = f (y), pak dostaneme ρ(x, y) = ρ f (x), f (y) ≤ Kρ(x, y). Protože K ∈ (0, 1), plyne z toho, že ρ(x, y) = 0, a tedy x = y. To dokazuje jednoznačnost. Musíme tedy dokázat, že za daných předpokladů je posloupnost xn konvergentní. Indukcí lze snadno dokázat, že platí nerovnost ρ xn+1 , xn = ρ f (xn ), f (xn−1 ) ≤ Kρ(xn , xn−1 ) ≤ K n−1 ρ(x2 , x1 ) . Tedy pro m > n plyne z trojúhelníkové nerovnosti předchozího vztahu nerovnost ρ(xm , xn ) ≤
m−1 X r=n
∞ X X m−1 K n−1 K r−1 ρ(x2 , x1 ) = K r−1 ρ(x2 , x1 ) ≤ ρ xr+1 , xr ≤ ρ(x2 , x1 ) . 1 −K r=n r=n
Protože K ∈ (0, 1) lze pro dané ε > 0 najít n0 tak, aby pro každé m > n > n0 platila nerovnost ρ(xm , xn ) < ε. Tedy posloupnost xn je Cauchyovská. Z úplnosti metrického prostoru M pak plyne existence limity lim xn = x ∈ M . ¤ n→∞
Na závěr se ještě zmíníme o dvou velmi důležitých vlastnostech kompaktních, tj. omezených uzavřených, množin v Rk . 11
Věta 12. Podmnožina X ⊂ Rk je kompaktní právě tehdy, když z každé posloupnosti x n ∈ X lze vybrat konvergentní podposloupnost y n , která je v X konvergentní. Důkaz: V tomto důkazu budeme používat metriku generovanou normou νmax . Nechť je množina X kompaktní, tj. omezená uzavřená. Protože je X omezená, existuje L ∈ R takové, že pro každé x ∈ X je xi ≤ L, i = 1, 2, . . . , k. Tedy množina X leží uvnitř krychle se středem v počátku a stranou rovnou 2L. Označme tuto krychli K0 . Rozřežme krychli K0 rovinami rovnoběžnými se stěnami na 2k shodných uzavřených krychlí se stranami L. Alespoň jedna z těchto krychlí obsahuje nekonečně mnoho bodů posloupnosti x n . Vyberme jednu z těchto krychlí a označme ji K1 . Z bodů posloupnosti, které leží v krychli K1 vybereme jeden bod y 1 = x n1 . Krychli K1 rozdělíme opět na 2k shodných uzavřených krychlí se stranou 2−1 L. Alespoň jedna z nich obsahuje nekonečně mnoho bodů posloupnosti x n . Vybereme jednu z těchto krychlí a označíme ji K2 . Je zřejmé, že K2 ⊂ K1 . V uzavřené krychli K2 vybereme bod y 2 = x n2 , kde n2 > n1 . Jestliže jsme již vybrali uzavřené krychle K1 ⊃ K2 ⊃ · · · ⊃ Kr se stranami L, 2−1 L, . . . , 2−r+1 a body y 1 = x n1 , y 2 = x n2 , . . . , y r = x nr , n1 < n2 < · · · < nr , takové, že y i ∈ Ki , i = 1, 2, . . . , r, vybereme y r+1 takto: Krychli Kr rozdělíme na 2k shodných uzavřených krychlí se stranou 2−r L. Alespoň jedna z těchto krychlí obsahuje nekonečně mnoho bodů posloupnosti xn . Vyberme jednu z těchto krychlí a označme ji Kr+1 . V krychli Kr+1 vyberme bod y r+1 = x nr+1 , kde nr+1 > nr . Takto získáme posloupnost y n vybranou z posloupnosti x n . Ukážeme, že tato vybraná posloupnost je Cauchyovská. Protože je prostor Rk úplný, plyne z toho konvergence posloupnosti y n . Nechť je dáno ε > 0. Zvolme n0 tak, aby 2−n0 < ε. Protože všechny body posloupnosti y n , n > n0 leží v uzavřené krychli Kn0 +1 , jejíž strana je 2−n0 , pro xm , x n ) ≤ 2−n0 < ε. každé m, n > n0 platí ρ(x Nechť množina X není kompaktní, tj. není omezená uzavřená. Jestliže není množina X omezená ex není
nebo
istuje ke každému n ∈ N prvek x n takový, že ρ 0,
xn = xn > n. Tedy posloupnost x n není omezená. Je-li y n podposloupnost vybraná z posloupnosti xn , platí y n > n. Tedy jakákoliv podposloupnost vybraná z posloupnosti x n není omezená a podle věty 6 ani konvergentní. Jestliže množina X není uzavřená, existuje x ∈ Rk , který je hromadným bodem množiny X, ale není prvkem X. Protože x je hromadný bod množiny X existuje posloupnost x n ∈ X taková, že lim x n = x ∈ / X. Tedy podle věty n→∞
2 každá podposloupnost y n vybraná z posloupnosti x n konverguje k x ∈ / X. ¤ Poznámka: V obecných metrických prostorech slouží vlastnost kompaktních množin popsaná ve větě 12 k jejich definici: Podmnožina X metrického prostoru M se nazývá kompaktní pravě tehdy, když z každé posloupnosti v X lze vybrat podposloupnost, která je v X konvergentní.
Abychom mohli formulovat další velmi důležitou vlastnost kompaktních množin, budeme nejprve definovat pojem otevřené pokrytí množiny X ⊂ M , kde (M, ρ) je metrický prostor. Definice 9. Nechť je X podmnožina metrického prostoru (M, ρ) a A je libovolná množina. Systém [ otevřených množin Uα , kde α ∈ A, takový, že X ⊂ Uα , nazýváme otevřené pokrytí množiny X. α∈A k
Věta 13. Podmnožina X ⊂ R je kompaktní právě tehdy, když z každého otevřeného pokrytí Ui , n [ i ∈ N, množiny X lze vybrat její konečné pokrytí, tj. existuje n ∈ N takové, že X ⊂ Ui . i=1
Důkaz: Nechť je X ⊂
R kompaktní množina, tj. pro každou posloupnost x n ∈ X existuje vybraná podposloupnost k
y n taková, že lim y n = x ∈ X, a Ui , i ∈ n→∞
pro každé n ∈
N existuje x ∈ X \
n [
N, jsou otevřené množiny takové, že X ⊂
∞ [
Ui . Předpokládejme, že
i=1
Ui = Xn . Tedy pro každé n ∈
N existuje x n ∈ Xn . Protože je množina
i=1
X uzavřená a množiny Ui otevřené, je každá z množin Xn uzavřená. Navíc platí Xn+1 ⊂ Xn . Z posloupnosti x n ∞ \ vybereme podposloupnost y n = x in , která konverguje v X. Tedy existuje lim y n = x ∈ X. Ale pak je x ∈ Xin . n→∞
n=1
Kdyby tomu totiž tak nebylo, existovalo by N ∈ N takové, že x ∈ / XiN , a tedy x ∈ / Xn pro každé n > iN . Tedy x je x) platí Uε (x x) ∩ XiN = ∅. Tedy vnitřní bod otevřené množiny X \ XiN . Proto existuje ε > 0 takové, že pro okolí Uε (x x) ∩ Xin ⊂ Uε (x x) ∩ XiN = ∅. Ale to je ve sporu s tím, že x = lim y n . Tedy existuje pro každé n > N je Uε (x n→∞
x∈
∞ \ n=1
Xn =
∞ \
X \ Un = X \
∞ [
Un .
n=1
n=1
Ale to je spor s tím, že Un , n ∈ N je pokrytí množiny X. Naopak nechť pro každé otevřené pokrytí Uk , k ∈
N, množiny X existuje n ∈ N takové, že X ⊂
n [ k=1
Uk a x n je
posloupnost v X. Dokážeme, že posloupnost x n má v X alespoň jeden hromadná bod. Označme Xn = x i ; i ≥ n . ∞ \ Množiny Xn jsou uzavřené a Xn+1 ⊂ Xn . Je zřejmé, že každý prvek x ∈ Y = Xn je hromadný bod posloupnosti n=1
12
∞ [
x n . Nechť je množina Y prázdná. Pak platí X ⊂ X \ Y =
Ui , kde Ui = X \ Xi jsou otevřené množiny. Tedy Ui
i=1
je otevřené pokrytí množiny X. Podle předpokladů existuje n ∈ N takové, že X=
n [ i=1
Ui =
n [
n n \ \ X \ Xi = X \ Xi =⇒ Xi = ∅ .
i=1
i=1
i=1
Tedy existuje n ∈ N takové, že množina Xn = ∅. Ale to je spor s definicí množiny Xn . Tedy množina Y je neprázdná a posloupnost x n má hromadné body. Z toho plyne, že z každé posloupnosti x n ∈ X lze vybrat podposloupnost y n , která konverguje v X, neboli X je kompaktní. ¤ Poznámka: Pro kompaktní množiny platí obecnější věta než uvedená věta 13: Věta 13a. Množina X je kompaktní právě tehdy, když z každého otevřeného pokrytí Uα , α ∈ A, množiny X lze n [ vybrat konečné pokrytí, tj. když existuje n ∈ N a α1 , α2 , . . . , αn ∈ A takové, že X ⊂ Uαi . i=1
V diferenciálním počtu zkoumáme pomocí derivací lokální vlastnosti funkcí, tj. vlastnosti v nějakém otevřeném okolí bodu x . Ale většinou nás více zajímají globální vlastnosti funkce, tj. vlastnosti funkce na jisté množině X. Je-li x) každého bodu x ∈ X, pokrývají množina X ∈ Rk kompaktní a funkce má určitou vlastnost v nějakém okolí U (x x) množinu X. Z věty 13a plyne, že existuje konečný počet takových okolí, který pokrývá celou otevřené množiny U (x množinu X. Tímto způsobem lze pro kompaktní množiny často přejít od lokálních vlastností funkce ke globálním vlastnostem na kompaktní množině.
13
Přednáška 3 Limita a spojitost funkce Definice 1. Nechť f : X → Y je zobrazení metrického prostoru (X, ρ) do metrického prostoru (Y, σ). Nechť a je hromadný bod X. Řekneme, že A ∈ Y je limitou zobrazení f a bodě a, jestliže ke ¡ ¢ každému ε > 0 existuje δ > 0 takové, že pro každé x ∈ X, ρ(a, x) < δ, x 6= a, je σ A, f (x) < ε. Definice 2. Nechť f : X → Y je zobrazení metrického prostoru (X, ρ) do metrického prostoru (Y, σ) a M ⊂ X. Řekneme, že funkce f (x) má v bodě a, který je hromadný bod množiny M limitu A vzhledem k množině M právě tehdy, když má funkce fb = f¯¯ v bodě a limitu A. Pak píšeme M
lim f (x) = A. x→a
x∈M
Věta 1. Nechť je f : X → Y zobrazení metrického prostoru X do metrického prostoru Y . Pak je lim f (x) = A právě tehdy, když pro každou posloupnost xn ∈ X, xn 6= a, a lim xn = a, je x→a
n→∞
lim f (xn ) = A.
n→∞
Důkaz: Nechť je lim f (x) = A. Pak ke každému ε > 0 existuje δ > 0 takové, že pro každé x ∈ X, pro které je x→a 0 < ρ(a, x) < δ, je σ A, f (x) < ε. Jestliže je xn , xn 6= a, posloupnost v X, která konverguje k a, existuje pro δ > 0 přirozené číslo n0 takové, že pro každé n > n0 je 0 < ρ a, xn < δ. Pak ale pro každé n > n0 platí nerovnost σ A, f (xn ) < ε, a tedy lim f xn = A. n→∞
Opačné tvrzení dokážeme nepřímo. Nechť a je hromadný bod množiny X a limita lim f (x) 6= A. To znamená, x→a že existuje ε > 0 takové, že pro každé δ > 0 existuje x ∈ X ∩ Pδ (a) takové, že σ A, f (x) > ε. Ke každému n ∈ N vybereme xn ∈ X ∩ P1/n (a), které má tuto vlastnost. Pak je xn posloupnost, pro kterou je xn 6= a, lim xn = a, ale n→∞ lim f xn 6= A. ¤ n→∞
Věta 2. Zobrazení f metrického prostoru X do metrického prostoru Y má v bodě a nejvýše jednu limitu. Důkaz: Tvrzení se dokáže standardním způsobem, a proto jej nechávám jako cvičení. ¤ Věta 3. (Cauchy–Bolzanova podmínka) Jestliže limita zobrazení f metrického prostoru X do metrického prostoru Y v ¡bodě a existuje, pak ke každému ε > 0 existuje δ > 0 takové, že pro každé ¢ x, y ∈ X ∩ Pδ (a) je σ f (x), f (y) < ε. ε Důkaz: Nechť lim f (x) = A. Pak pro každé ε > 0 existuje δ > 0 takové, že pro každé x ∈ ∩Pδ (a) je σ f (x), A) < . x→a 2 Nechť x, y ∈ X ∩ Pδ (a). Pak z trojúhelníkové nerovnosti plyne, že σ(f (x), f (y) ≤ σ A, f (x) + σ A, f (y) < ε. ¤
Věta 4. Jestliže je metrický prostor Y úplný, pak limita zobrazení f : X → Y v bodě a existuje právě tehdy, je-li splněna Cauchy–Bolzanova podmínka. Důkaz: Nechť je xn libovolná posloupnost v X, xn 6= a a lim xn = a. Nechť je ε > 0. Protože je splněna Cauchy– n→∞ Bolzanova podmínka, existuje ke každému ε > 0 δ > 0 takové, že pro každé x, y ∈ X ∩ Pδ (a) je σ f (x), f (y) < ε. Protože lim xn = a, existuje n0 takové, že pro každé n > n0 je xn ∈ X ∩ Pδ (a). Proto je posloupnost f xn n→∞ Cauchyovská a existence limity posloupnosti f xn plyne z úplnosti metrického prostoru (Y, σ). Tvrzení pak plyne z věty 1. ¤
Věta 5. Nechť jsou (X, ρ), (Y, σ) a (Z, τ ) metrické prostory. Nechť jsou f : X → Y a g : Y → Z zobrazení, lim f (x) = A a lim g(y) = B. Dále nechť existuje prstencové okolí Pδ0 (a) takové, že pro x→a
y→A
každé x ∈ X ∩ Pδ0 (a) je f (x) 6= A. Pak platí ¡ ¢ lim g ◦ f (x) = lim g(y) = B .
x→a
y→A
Důkaz: Protože lim g(y) = B, ke každému ε > 0 existuje η > 0 takové, že pro každé y ∈ Y , pro které je 0 < σ(y, A) < y→A η, platí τ g(y), b < ε. Protože lim f (x) = A, existuje k η > 0 δ1 takové, že pro každé x ∈ X, 0 < ρ(x, a) < δ1 je x→a σ f (x), A < η. Ale podle předpokladu platí pro δ = min δ0 , δ1 a x ∈ X, 0 < ρ(x, a) < δ nerovnost 0 < σ f (x), A < η. Tedy pro každé takové x platí nerovnost τ g f (x) , A < ε. ¤ 14
Věta 6. Nechť jsou f (x) zobrazení a g(x) zobrazení metrického prostoru X do normovaného vektorového prostoru V . Nechť existují limity lim f (x) = A a lim g(x) = B. Pak existuje také x→a x→a ¡ ¢ lim f + g (x) = A + B.
x→a
Důkaz: Nechť ε > 0. Pak existují δf > 0 a δg > 0 takové, že pro každé x ∈ X, pro které je 0 < ρ(a, x) < δx , resp. 0 < ε ε ρ(a, x) < δy , platí nerovnost ν f (x) − A < , resp. ν g(x) − B < . Když zvolíme δ = min δx , δy > 0, dostaneme 2 2 pro každé x ∈ X, pro které je 0 < ρ(x, a) < δ nerovnost ν f (x) + g(x) − A − B ≤ ν f (x) − A + ν g(x) − B < ε. ¤
Věta 7. Nechť je f (x) zobrazení metrického prostoru X do normovaného vektorového prostoru V a α(x) je zobrazení metrického prostoru X do R. Nechť existují lim f (x) = A ∈ V a lim α(x) = α ∈ R. x→a x→a ¡ ¢ Pak existuje také lim α(x)f (x) = αA. x→a
Důkaz: Plyne z nerovnosti ν α(x)f (x) − αA = ν α(x) · f (x) − A + α(x) − α · A ≤ α(x) · ν f (x) − A + α(x) − α · ν(A) . Protože existuje limita lim α(x) = α ∈ R je funkce α(x) v jistém okolí bodu a omezená. Z toho se již snadno dokáže x→a
uvedené tvrzení. ¤ Poznámka: Všechny uvedené věty platí po příslušných modifikacích také pro limitu vzhledem k množině.
V dalším omezíme na metrické prostory Rn a zobrazení f : X → Y , kde X ⊂ Rn a Y ⊂ Rk . Každé takové zobrazení je dáno předpisem ¡ ¢ ¡ ¢ x) = f x1 , x2 , . . . , xn = f1 (x x), f2 (x x), . . . , fk (x x) , f (x ¡ ¢ kde fi : X → R, i = 1, 2, . . . , k, jsou reálné funkce n proměnných, tj. fi x1 , x2 , . . . , xn . Protože Rk je úplný normovaný prostor, platí pro limity zobrazení f : Rn → Rk všechny výše uvedené věty. x) = A právě tehdy, když pro každé Věta 8. Nechť je f : X → Rk , kde X ⊂ Rn . Pak je lim f (x a x →a
x) = Ai . i = 1, 2, . . . , k je lim fi (x a x →a
Důkaz: je podobný jako důkaz podobné věty pro posloupnosti. Proto jej na tomto místě nebudeme opakovat. ¤ Poznámka: Z věty 8 ihned plyne, že se stačí zabývat limitou funkcí více proměnných, tj. limitou funkce f : X → R.
x) = A a lim g(x x) = B. Pak platí lim f (x x) · Věta 9. Nechť jsou f a g funkce n proměnných, lim f (x x) A (x x) = AB a je-li B 6= 0 také lim = . g(x a g(x x →a x) B
a x →a
a x →a
a x →a
¤
Důkaz: je analogií důkazu pro reálné funkce jedné reálné proměnné. n
Definice 3. Nechť je f : X → R, kde X ⊂ R , je funkce n proměnných a a je hromadný bod x) má v bodě a limitu plus nekonečno, resp. limitu mínus množiny X. Řekneme, že funkce f (x a) takové, že pro každé x ∈ nekonečno, jestliže ke každému K ∈ R existuje prstencové okolí Pδ (a a) je f (x x) > K, resp. f (x x) < K. Pak píšeme lim f (x x) = +∞, resp. lim f (x x) = −∞. X ∩ Pδ (a a x →a
a x →a
Poznámka: Všechny typy limit lze definovat pomocí okolí bodu. Definice. Množina X se systémem
A podmnožin X, pro které platí:
(1) ∅ a X patří do systému A, (2) jestliže Uα , α ∈ A, kde A je množina, patří do (3) jestliže Ui , i = 1, 2, . . . , n patří do
A, pak také
A, pak n \
[
Uα patří do
A,
α∈A
Ui patří do
A,
i=1
se nazývá topologický prostor. Množiny ze systému každá otevřená množina, která obsahuje a.
A se nazývají otevřené množiny. Okolí bodu a ∈ X se nazývá
My jsme definovali v metrických prostorech systém v topologických prostorech definuje limita následovně:
A otevřených množin pomocí pojmu vzdálenosti. Obecně se 15
Definice. Nechť je f zobrazení topologického prostoru X do topologického prostoru Y a a je hromadný bod X. Bod A ∈ Y nazveme limitou zobrazení f v bodě a právě tehdy, když pro každé okolí U (A) ⊂ Y existuje prstencové okolí P (a) = U (a) \ {a} takové, že pro každé x ∈ X ∩ P (a) je f (x) ∈ U (A).
Pro limity funkcí více proměnných platí věty, které jsou podobné větám o limitách funkcí jedné proměnné. Také důkazy těchto vět jsou analogické důkazům pro limity funkcí jedné proměnné, a proto je většinou nebudeme uvádět. a) takové, že pro každé x ∈ X ∩P (a a) platí f (x x) ≤ g(x x). Věta 10. Nechť existuje prstencové okolí P (a x) ≤ lim g(x x) (za předpokladu, že limity existují). Pak lim f (x a x →a
a x →a
a) takové, že pro každé x ∈ X ∩ P (a a) platí nerovnost Věta 11. Nechť existuje prstencové okolí P (a x) ≤ g(x x) ≤ h(x x). Jestliže je lim f (x x) = lim h(x x) = A, pak existuje také lim g(x x) = A. f (x a x →a
a x →a
a x →a
x) = 0 a existuje prstencové okolí P (a a) takové, že je funkce g(x x) v tomto Věta 12. Jestliže je lim f (x a x →a
x)g(x x) = 0. okolí omezená, je lim f (x a x →a
R právě tehdy, když ke každému ε > 0 existuje δ > 0 takové, že pro a x →a x, a ) < δ, platí nerovnost f (x x) − A < ε. Vezměme v prostoru Rn metriku ρ2 , každé x ∈ X, pro které je 0 < ρ(x v u n uX x, y ) = t která je generována skalárním součinem, tj. ρ(x xi − yi )2 . Každé x ∈ Rn , x 6= a , lze zapsat právě jedním x) = A ∈ Poznámka: Podle definice je lim f (x
i=1
způsobem ve tvaru x = a + n r, kde n je jednotkový vektor s počátečním bodem a a koncovým bodem, x a r > 0. x) = A jako: Ke každému ε > 0 existuje δ > 0 takové, že pro každé x, a ) = r. Pak lze přepsat výrok lim f (x Pak je ρ(x a x →a n) − A < ε. Tedy nejen že A nesmí záviset na jednotkovém r, 0 < r < δ a pro každý jednotkový vektor n platí f (rn vektoru n , ale také δ musíme vybrat nezávisle na n . Jedná se tedy o jistou stejnoměrnou konvergenci. To dělá výpočet limit neurčitých výrazů značně komplikovaný. Jednoduché je, když je limita závislá na n , tj. z různých směrů je různá. Ale pokud jsou limity stejné ze všech směrů, neplyne z toho, že limita existuje, protože k jistému ε > 0 nemusí být možné zvolit δ nezávisle na směru n . Příklad 1. Najděte následující limity: a)
lim
(x,y)→(0,0)
xy 2 , x2 + y 2
b)
lim
(x,y)→(0,0)
xy , x2 + y 2
c)
lim
(x,y)→(0,0)
xy 2 . x2 + y 4
Jednotkový směr v R2 lze psát jako n = (cos ϕ, sin ϕ), kde φ ∈ h0, 2π). Pak každé (x, y) 6= (0, 0) lze jediným způsobem vyjádřit ve tvaru x = r cos ϕ, y = r sin ϕ, r > 0. (r a ϕ jsou tzv. polární souřadnice v R2 ). V případě a) dostaneme xy 2 lim = lim r cos ϕ sin2 ϕ = 0 , 2 r→0+ (x,y)→(0,0) x + y 2 2 protože cos ϕ sin ϕ ≤ 1. V případě b) je xy lim = lim cos ϕ sin ϕ = cos ϕ sin ϕ r→0+ (x,y)→(0,0) x2 + y 2 a limita neexistuje, protože závisí na ϕ, tedy na směru.
xy 2 xy 2 ≤ 2 a stejně jako x2 + y 4 x v případě a) je tato limita rovna nule. Jestliže je x = 0, je celý výraz roven nule, a tedy v těchto směrech je limita také rovna nule. Tedy ve všech směrech je limita nulová. Ale přesto daná limita neexistuje. Totiž na parabole x = y 2 1 je výraz roven , a tedy po této křivce není limita rovna nule. Aby tato limita byla rovna nule, museli bychom ke 2 každému ε > 0 najít δ > 0 (nezávislé na ϕ ∈ h0, 2π)) tak, aby pro každé r, 0 < r < δ platila nerovnost V případě c) je situace poněkud komplikovanější. Jestliže je x 6= 0, tj. ϕ 6= 0, π, je
r cos ϕ sin2 ϕ cos2 ϕ + r2 sin2 ϕ < ε . Ale lze ukázat, že takové δ neexistuje.
Spojité funkce Definice 4. Nechť f : M → S je zobrazení metrického prostoru (M, ρ) do metrického prostoru (S, σ). Řekneme, že zobrazení f je spojité v bodě a ∈ M , jestliže ke každému ε >¢ 0 existuje δ > 0 ¡ takové, že pro každé x ∈ M , pro které je ρ(a, x) < δ, platí nerovnost σ f (a), f (x) < ε. 16
Definice 5. Nechť je f : M → S zobrazení metrického prostoru M do metrického prostoru S a nechť X ⊂ M . Říkáme, že zobrazení f je spojité v bodě a ∈ X vzhledem k množině X, jestliže ke každému ε >¢ 0 existuje δ > 0 takové, že pro každé x ∈ X, pro které je ρ(a, x) < δ, platí nerovnost ¡ σ f (a), f (x) < ε. Věta 13. Zobrazení f : M → S je spojité v bodě a ∈ M právě tehdy, když pro každou posloupnost xn ∈ M , pro kterou je lim xn = a, je lim f (xn ) = f (a). n→∞
n→∞
Důkaz: Nechť je f (x) spojitá v bodě ∈ M . K danému ε > 0 zvolme δ > 0 takové, že pro každé x ∈ M , ρ(a, x) < δ, je σ f (a), f (x) < ε. Nechť je xn libovolná posloupnost v M taková, že lim xn = a. Pak k našemu δ > 0 existuje n0 n→∞ takové, že pro všechna n > n0 je ρ(a, xn ) < δ. Ale pak také pro všechna n > n0 platí nerovnost σ f (a), f (xn ) < ε, a tedy lim f (xn ) = f (a). n→∞
Nechť není zobrazení f (x) spojité v bodě a ∈ M . Pak existuje ε > 0 takové, že pro každé δ > 0 existuje x ∈ X, 1 ρ(a, x) < δ, je σ f (a), f (x) ≥ ε. K tomuto ε zvolme xn ∈ M takové, že ρ(a, xn ) < a σ f (a), f (xn ) ≥ ε. Tato n posloupnost xn ∈ M konverguje k a ∈ M , ale lim f (xn ) 6= f (a). ¤ n→∞
Poznámka: Z definice plyne, že zobrazení f (x) je spojité v bodě a ∈ M právě tehdy, když je a izolovaný bod metrického prostoru M nebo platí lim f (x) = f (a). x→a
Definice 6. Nechť je f : M → S zobrazení metrického prostoru (M, ρ) do metrického prostoru (S, σ) a X ⊂ M . Říkáme, že zobrazení f je spojité na množině X právě tehdy, když je spojité v každém bodě množiny X. Věta 14. Zobrazení f metrického prostoru M do metrického prostoru S je spojité na množině X ⊂ M právě tehdy, když je vzor každé otevřené množiny V ⊂ S otevřená množina v X, tj. když pro každou otevřenou podmnožinu V ⊂ S platí f(−1) (V ) = X ∩ U , kde U ⊂ M je otevřená množina. Důkaz: Nechť je vzor každé otevřené množiny V ⊂ S otevřená množina a a ∈ X ∩ f(−1) (V ). Pak je A = f (a) bodem otevřené množiny V . Nechť je ε > 0. Pak je množina Uε (A) ∩ V otevřená. A podle předpokladu je f(−1) Uε (A) ∩ V je otevřená v X. Protože je a prvkem této otevřené množiny, existuje δ > 0 takové, že Uδ (a) ⊂ f(−1) Uε (A) ∩ V . Ale z toho plyne, že pro každé x ∈ X ∩ Uδ (a) je f (x) ∈ U² (A), a tedy zobrazení f je spojité v každém bodě a ∈ X. Nechť je zobrazení f spojité v každém bodě x ∈ X a V ⊂ S je otevřená množina. Je zřejmé, že f(−1) (V ) = f(−1) V ∩ f (X) . Protože je V otevřená množina, existuje ke každému y ∈ V takové εy > 0, pro které je Uεy (y) ⊂ V . [ [ Pak ale V = Uεy (y) a f(−1) (V ) = f(−1) Uεy (y) ∩ f (X) . Jestliže a ∈ f(−1) (V ), pak existuje A ∈ y∈V
y∈f (X)
V ∩ f (X) takové, že A = f (a). Protože je podle předpokladu zobrazení f (x) spojité v bodě a, existuje k εA > 0 číslo δa takové, že pro každé x ∈ X ∩ Uδa (a) je f (x) ∈ UεA (A). Tedy bod a je vnitřním bodem f(−1) (V ) a množina f(−1) (V ) otevřená v X. ¤
Věta 15. Nechť je f : M → S, resp. g : S → T zobrazení metrického prostoru (M, ρ) do metrického prostoru (S, σ), resp. metrického prostoru (S, σ) do metrického prostoru (T, τ ). Nechť je lim f (x) = x→a ¡ ¢ A a g je zobrazení spojité v bodě A. Pak je lim (g ◦ f )(x) = lim g f (x) = g(A). x→a
x→a
Důkaz: Nechť je ε > 0. Protože je zobrazení g spojité v bodě A ∈ S existuje η > 0 takové, že pro všechna y ∈ S, pro která je σ(A, y) < η, platí τ g(A), g(y) < ε. Ale protože lim f (x) = A, existuje k η > 0 danému výše δ > 0 x→a takové, že pro každé x ∈ M , pro které je 0 < ρ(a, x) < δ je σ A, f (x) < η. Tedy pro taková x platí nerovnost τ g(A), g(f (x)) < ε. ¤
Věta 16. Nechť je f : M → S, resp. g : S → T zobrazení metrického prostoru (M, ρ) do metrického prostoru (S, σ), resp. metrického prostoru (S, σ) do metrického prostoru (T, τ ). Nechť f je spojité v bodě a ∈ M a g je spojité v bodě f (a). Pak je složené zobrazení g ◦ f : M → T spojité v bodě a. Jestliže je f spojité na M a g spojité na S, pak je složené zobrazení g ◦ f : M → T spojité na M . Důkaz: Nechť a ∈ M a A = f (a). Pro dané ε > 0 existuje η > 0 takové, že pro každé y ∈ S ∩Uη (A) je g(y) ∈ Uε g(A) . K tomuto η > existuje δ > 0 takové, že pro každé x ∈ M ∩ Uδ (a) je f (x) ∈ S ∩ Uη (A). Tedy pro takové x je g f (x) ∈ Uε g(A) , což dokazuje spojitost složené funkce v bodě a. Druhá část tvrzení plyne z první a z toho, že f je spojité v každém bodě x ∈ M a g je spojité v každém bodě y ∈ S. ¤ 17
Věta 17. Nechť jsou f : M → V a g : M → V zobrazení metrického prostoru M do normovaného vektorového prostoru V , které jsou spojité v bodě a a α : M → R je funkce, která je spojitá v bodě a. Pak jsou zobrazení f + g a α · f spojité v bodě a. Důkaz: se provede obvyklým způsobem, a proto jej nebudeme uvádět.
Věta 18. Nechť jsou f : M → V a g : M → V zobrazení metrického prostoru M do vektorového prostoru V se skalárním součinem, které jsou spojité v bodě a. Pak (f, g) spojitá funkce v bodě a. Důkaz: se provede obvyklým způsobem, a proto jej nebudeme uvádět.
Věta 19. Zobrazení F : M → Rn metrického prostoru M je spojité v bodě a právě tehdy, když jsou v bodě a spojité všechny funkce fi : M → R, i = 1, 2, . . . , n. Důkaz: se provede obvyklým způsobem, a proto jej nebudeme uvádět.
Věta 20. Nechť jsou f : M → R a g : M → R funkce na metrickém prostoru M , které jsou spojité f spojité v bodě a. v bodě a. Pak jsou funkce f g, a jestliže g(a) 6= 0 také funkce g Důkaz: se provede obvyklým způsobem, a proto jej nebudeme uvádět. Poznámka: Věty obdobné větám 17–20 platí s příslušnými modifikacemi také pro spojitá zobrazení na množině M .
Uvedeme ještě jednu větu, která se týká spojitých funkcí na kompaktních množinách v Rn : Věta 21. (Weierstrass) Nechť je f : X → R spojitá funkce na kompaktní množině X ⊂ Rn . Pak v xm ) ≤ f (x x) a f (x xM ) ≥ f (x x). Tedy X existují body x m a x M takové, že pro každé x ∈ X platí f (x spojitá funkce na kompaktní množině X ⊂ Rn nabývá na množině X svého minima a maxima. Důkaz: Nejprve připomeňme, že pro každou posloupnost x n na kompaktní množině X existuje vybraná podposloupnost y n , která v X konverguje. Nejprve ukážeme, že spojitá funkce na kompaktní množině je omezená. Předpokláde x) není omezená. Pak je pro každé n ∈ N množina Xn = x ∈ X ; f (x x) > n neprázdná. Pro každé jme, že funkce f (x n ∈ N vybereme prvek x n ∈ Xn . Takto získáme posloupnost x n na kompaktní množině X. Z lze vybrat konvergentní y n ) = +∞. To je spor s tím, podposloupnost y n . Tedy existuje lim y n = y ∈ X. Ale protože f y n > n je lim f (y n→∞
n→∞
x) je spojitá na X. Podobně se ukáže, že je funkce f (x x) omezená zdola. že funkce f (x x) omezená, existují S = sup f (x x) a s = inf f (x x). Z definice suprema plyne, že pro každé Protože je funkce f (x x ∈X x ∈X 1 x) > S − neprázdná. Pro každé n ∈ N vyberme x n ∈ Xn . Protože je X n ∈ N je množina Xn = x ∈ X ; f (x n 1 y n ) > S − . Protože kompaktní, lze z této posloupnosti vybrat konvergentní podposloupnost y n . Pak je zřejmě f (y n y ) ≥ S. Ale protože S je supremum, musí platit f (y y ) = S. existuje lim y n = y ∈ X dostaneme limitním přechodem f (y n→∞
y ) = sup f (x x) ≥ f (x x). Analogicky je ukáže existence bodu, ve Tedy existuje y ∈ X takové, že pro každé x ∈ X je f (y x) minimum. kterém má funkce f (x
¤
x ∈X
18
Přednáška 4 Diferenciál funkce V diferenciálním počtu se snažíme lokálně, tj. v okolí daného bodu, nahrazovat zobrazení zobrazením jednodušším. V nulté aproximaci zobrazením konstantním; tomu odpovídá limita zobrazení. První aproximace je nahrazení dané funkce v okolí daného bodu rovinou. Tato rovina se volí tak, aby se v okolí bodu co nejméně lišila od grafu funkce. To znamená, že se volí tečná rovina. Za druhou aproximaci se volí kvadratická plocha, která v přesně daném smyslu co nejlépe aproximuje v okolí daného bodu graf funkce, atd. Tento princip lze obecně použít při zavedení diferenciálního počtu v úplných normovaných, tzv. Banachových prostorech. My se nebudeme zabývat diferenciálním počtem v takových obecných prostorech, ale pouze diferenciálním počtem v prostorech Rn . Připomeňme, že Rn považujeme za úplný normovaný prostor s metrikou generovanou jednou z ekvivalentních norem ν1 , ν2 nebo νmax . V geometrických úvahách je nejvhodnější norma ν2 , která je generována skalárním součinem. Pouze v prostorech se skalárním součinem má smysl hovořit o úhlu dvou vektorů, a tedy o kolmých vektorech. S touto normou je prostor Rn úplný vektorový prostor se skalárním součinem, tzv. Hilbertův prostor. Nechť je dána funkce f : Rn → R a bod a ∈ Df◦ . Naše snaha bude nahradit v okolí bodu a funkci x) pomocí lineární funkce, tj. vyjádřit ji ve tvaru f (x n X ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ a) + x) ≈ f (a a) + c1 x1 − a1 + c2 x2 − a2 + · · · + cn xn − an = f (a f (x ck xk − ak ,
(1)
k=1
x) od naší první kde ci jsou vhodná reálná čísla. Tedy rozdíl mezi přesnou hodnotou funkce f (x aproximace je n X ¡ ¢ a, x − a ) = f (x x) − f (a a) − η(a ci xk − ak . (2) k=1
x − a k malý. Přesněji aby platilo Po číslech ci budeme požadovat, aby byl tento rozdíl pro malé kx ¯ ¯ ¯η(a a , x − a )¯ lim = 0. x a →x x − ak kx
(3)
Jestliže zavedeme novou proměnnou h = x − a , lze vztahy (1)–(3) zapsat ve tvaru a + h ) = f (a a) + c1 h1 + c2 h2 + · · · + cn hn + η(a a, h ) = f (a a) + f (a
n X
a, h ) , ck hk + η(a
(4)
k=1
¯ ¯ ¯η(a a, h)¯ lim = 0. hk h →0 kh
(5)
To nás vede k následující definici: Definice 1. Nechť je dána funkce f : Rn → R a bod a ∈ Df◦ . Jestliže existují reálná čísla ck , k = 1, 2, . . . , n taková, že platí (4) a (5), nazýváme lineární funkci a, h ) = c1 h1 + c2 h2 + · · · + cn hn = df (a
n X
ck hk = c · h
(6)
k=1
¡ ¢ x) v bodě a . proměnné h = h1 , h2 , . . . , hn diferenciálem funkce f (x x) v bodě a , nazývá se funkce diferencovatelná v bodě a . Jestliže existuje diferenciál funkce f (x x) se nazývá diferencovatelná na množině M ⊂ Rn , je-li diferencovatelná v každém bodě Funkce f (x množiny M . 19
x) = xk je dfk (a a, h ) = dxk = hk , často Protože pro funkce fk : Rn → R definované předpisem fk (x se diferenciál (6) píše ve tvaru df = c1 dx1 + c2 dx2 + · · · + cn dxn =
n X
x. ck dxk = c · dx
(6a)
k=1
x) diferencovatelná v bodě a a df = Poznámka: Jestliže je funkce y = f (x
n X
ck hk , lze její graf aproximovat v malém
k=1
a tečnou rovinou. Ta má rovnici okolí bodu a , f (a n X a) + c1 x1 − a1 + c2 x2 − a2 + · · · + cn xn − an = f (a a) + ck xk − ak . y = f (a
(7)
k=1
x) není diferencovatelná v bodě a , neexistuje ke grafu této funkce v bodě a tečná rovina. Naopak jestliže funkce y = f (x Nechť je v prostoru Rk dána rovina jejím normálovým vektorem n = n1 , n2 , . . . , nk a bodem a , kterým prochází. Pak je každý vektor, který leží v této rovině kolmý na vektor n . To ale znamená, že pro každý bod x této roviny je vektor x − a kolmý na vektor n , neboli
x − a ) = 0 ⇔ n1 (x1 − a1 ) + n2 (x2 − a2 ) + . . . nk (xk − ak ) = n · (x
k X
ni (xi − ai ) = 0 .
(8)
i=1
Když srovnáme vztahy (7) a (8), vidíme, vektor n = (c1 , c2 , . . . , cn , −1) že tečná rovina je kolmá na (n + 1)–rozměrný a) . Přímka, která prochází bodem a , f (a a) a je kolmá na tečnou rovinu v tomto a prochází bodem a1 , a2 , . . . , an , f (a a) v bodě a , f (a a . Její parametrické rovnice tedy jsou bodě, se nazývá normála ke grafu funkce y = f (a xk = ak + ck t ,
a) − t , y = f (a
(9)
kde k = 1, 2, . . . , n a t ∈ R.
Obdobně se definuje pojem diferenciálu a diferencovatelného zobrazení pro zobrazení f : Rn → Rk . Definice 2. Nechť je f : Rn → Rk a a ∈ Df◦ . Nechť existuje matice C typu (k × n) s prvky cij taková, že a + h ) = f (a a) + Ch h + η (a a, h ) f (a (10) a lim
h →0
a, h )k kηη (a = 0. hk kh
Pak lineární zobrazení h ⇔ yi = y = Ch
n X
cij hj
(11)
(12)
j=1
x) v bodě a . nazýváme diferenciálem zobrazení f (x x) v bodě a , nazýváme toto zobrazení diferencovatelné v Jestliže existuje diferenciál zobrazení f (x x) se nazývá diferencovatelné na množině M ⊂ Rn , jestliže je diferencovatelné bodě a . Zobrazení f (x v každém bodě a ∈ M . x) ve tvaru Bývá zvykem psát diferenciál zobrazení y = f (x
x ⇔ dyi = dyy = Cdx
k X j=1
20
cij dxj .
(12a)
Věta 1. Zobrazení f : Rn → Rk je diferencovatelné v bodě a právě tehdy, když jsou v bodě a x), i = 1, 2, . . . , k. Přitom platí diferencovatelné všechny funkce fi (x a, h) = dfi (a
n X
cij hj ,
i = 1, 2, . . . , k ,
j=1
kde cij jsou složky matice C.
a, h ) ≤ kη η (a a, h )k. Tedy je-li zobrazení Důkaz: Jestliže vezmeme v Rk například normu ν1 dostaneme nerovnost ηi (a x) diferencovatelné v bodě a , jsou všechny funkce fi (x x) diferencovatelné v bodě a . f (x a, h ) ηi (a Naopak když pro každé i = 1, 2, . . . , k platí lim = 0, je také h →0 khk lim
h →0
k X a, h ) ηi (a η (a a, h k kη = lim = 0. h →0 khk khk i=1
¤
x) v bodě a diferenciál, je v tomto bodě spojitá. Věta 2. Má-li funkce f (x x) v bodě a diferenciál, existují konstanty ck ∈ R, k = 1, 2, . . . , n, takové, že platí Důkaz: Protože má funkce f (x a + h ) − f (a a) = f (a
n X
a, h ) , ck hk + η(a
k=1
a, h ) η(a x − a k < δ0 , je |η(a a, x − a )| < kx x − a k. = 0. Tedy existuje δ0 > 0 takové, že pro každé x ∈ Df , 0 < kx h)k kh Pro taková x pak pletí nerovnost n n X X ck · xk − ak + η(a f (x a, x − a ) ≤ K + 1)kx x − ak , a , x − h ) ≤ x) − f (a a ) = ck (xk − ak ) + η(a
a lim
h →0
k=1
k=1
kde K = max |ck | a za normu k · k bereme normu ν1 . K danému ε > 0 pak stačí zvolit δ < min δ0 ,
ε . K+1
¤
Věta 3. Nechť jsou f a g funkce z Rn do R, které jsou diferencovatelné v bodě a a α ∈ R je ¡ ¢ f a) 6= 0 také konstanta. Pak jsou v bodě a diferencovatelné funkce α · f , f + g , f · g a je-li g(a a g platí: ¡ ¢ a, h ) = αdf (a a, h ) , d αf (a (13) ¡ ¢ a, h ) = df (a a, h ) + dg(a a, h ) , d f + g (a (14) ¡ ¢ a, h ) = g(a a) · df (a a, h ) + f (a a) · dg(a a, h ) , d f · g (a (15) µ ¶ a a h a a h f g(a ) · df (a , ) − f (a ) · dg(a , ) a, h ) = (a . (16) d a) g g 2 (a a, h ) = Důkaz: Nechť df (a
n X
a, h ) = ck hk a dg(a
k=1
a + h ) − f (a a) = f (a
n X
dk hk . Pak je
k=1 n X
a, h ) , ck hk + ηf (a
a + h ) − g(a a) = g(a
n X
a, h ) , dk hk + ηg (a
k=1
k=1
ηf (a ηg (a a, h ) a, h ) kde lim = lim = 0. h →0 h →0 hk hk kh kh Rovnost (13) dostaneme ze vztahů a + h ) − αf (a a) = αf (a
n X
a, h ) αck hk + αηf (a
k=1
a lim
h →0
n αηf (a ηf (a X a, h ) a, h ) a, h ). a, h ) = αck hk = αdf (a = |α| lim = 0. Tedy d(αf )(a h →0 hk hk kh kh k=1 21
Rovnost (14) plyne ze vztahu n X a + h ) − f + g (a a) = a, h ) + ηg (a a, h ) d f + g (a ck + dk hk + ηf (a k=1
a, h ) + ηg (a a, h ) ≤ ηf (a a, h ) + ηf (a a, h ) . a nerovnosti ηf (a K důkazu rovnosti (15) použijeme vztah a + h ) − f · g (a a) = f (a a + h ) − f (a a) g(a a + h ) + f (a a) g(a a + h ) − g(a a) = f · g (a a) f (a a + h ) − f (a a) + f (a a) g(a a + h − g(a a) + f (a a + h ) − f (a a) g(a a + h ) − g(a a) = = g(a ! ! n n n X X X a, h ) = a, h ) a)ck + f (a a)dk hk + g(a a)ηf (a a, h ) + f (a a)ηg (a a, h ) + dk hk + ηg (a ck hk + ηf (a = g(a =
k=1 n X
k=1
k=1
a)ck + f (a a)dk hk + ηf g (a a, h ). g(a
k=1
kde a, h ) = g(a a)ηf (a a, h ) + f (a a)ηg (a a, h ) + ηf g (a
n X
!
n X
a, h ) ck hk + ηf (a
k=1
! a, h ) dk hk + ηg (a
.
k=1
Vztah pak plyne z nerovnosti ! ! n n X X ηf g (a a, h ) ≤ a, h ) = g(a a)ηf (a a, h ) + f (a a)ηg (a a, h ) + a, h ) dk hk + ηg (a ck hk + ηf (a k=1 k=1 a) · ηf (a a, h ) + f (a a) · ηg (a a, h ) + Ckhk + |ηf (a a, h )| Dkhk + |ηg (a a, h )| , ≤ g(a kde C = max |ck | a D = max |dk | . a) 6= 0 platí vztah d Abychom dokázali vztah (16), stačí ukázat, že pro g(a x) a plyne ze vztahu (15) pro funkce f (x
a, h ) 1 dg(a a, h ) = − 2 (a . Vztah (16) pak a) g g (a
1 x). Jednoduché úpravy dávají rovnost (x g
a) − g(a a + h) a) a, h) + ηg (a a, h) a) a, h) 1 1 g(a g(a dg(a g(a dg(a a, h ) , − = · =− · =− 2 + η1/g (a a + h) a) a) a + h) a) a + h) a) g(a g(a g 2 (a g(a g 2 (a g(a g (a kde a, h) = η1/g (a
2 a, h ) dg(a a, h )ηg (a a, h ) a, h ) dg(a ηg (a + 2 − . a)g(a a + h) a)g(a a + h) a)g(a a + h) g 2 (a g (a g(a
a) 6= 0 a funkce g(x x) je spojitá v bodě a, existuje okolí Protože předpokládáme, že g(a bodu a takové, že pro každé x z η1/g (a a, h ) 1 x) > g(a a) . Z toho se pak snadno ukáže, že lim tohoto okolí je g(x = 0. ¤ h →0 hk 2 kh
x) a g (x x) zobrazení z Rn do Rk , která jsou diferencovatelná v bodě ¡a a ¢α(x x) Věta 4. Nechť jsou f (x n f (x x), je funkce na R diferencovatelná v bodě a . Pak jsou v bodě a diferencovatelné funkce αf ¡ ¢ ¡ ¢ x) a f · g (x x), skalární součin, a platí f + g (x ¡ ¢ a, h ) = f (a a)dα(a a, h ) + α(a a)dff (a a, h ) , d αff (a ¡ ¢ a, h ) = dff (a a, h ) + dgg (a a, h ) , d f + g (a ¡ ¢ a, h ) = dff (a a, h ) · g (a a) + f (a a) · dgg (a a, h ) . d f · g (a Důkaz: Jestliže použijeme zápis ve složkách, je tato věta důsledkem Věty 2.
(17) (18) (19)
¤
x) Věta 5. (diferenciál složeného zobrazení) Nechť f : Rn → Rm a g : Rm → Rk , zobrazení f (x a je diferencovatelné v bodě a a zobrazení g (yy ) je diferencovatelné v bodě A = f (a ). Pak je složené ¡ ¢ ¡ ¢ f a g f a zobrazení g ◦ff : Rn → Rk diferencovatelné v bodě ¡ a ¢a platí d g ◦f (a , h ) = dg A , df (a , h ) . Jestliže a, h ) = Ch h a dgg (A A, k ) = Dkk , pak d g ◦ f (a a, h ) = DCh h, neboli ve složkách píšeme dff (a m X n X ¡ ¢ a, h ) = drs cst ht , d g ◦ f r (a s=1 t=1
22
(20)
kde r = 1, 2, . . . , k. a + h ) − fs (a a) = Důkaz: Podle předpokladu platí fs (a
n X
a, h ), s = 1, 2, . . . , m a gr (A A + k ) − gr (A A) = cst ht + ηs (a
t=1 m χr (A ηs (a X A , k ) a, h ) A, k ), r = 1, 2, . . . , k, a lim = lim = 0. Pak je drs ks + χr (A k →0 h →0 hk kk kh kk s=1 a + h ) − g ◦ f (a a) = g f (a a + h ) − g f (a a) = g f (a a) + f (a a + h ) − f (a a) − g f (a a) = g ◦ f (a h + η (a a, h ) − g (A A) = D Ch h + η (a a, h ) + χ A , Ch h + η (a a, h ) = = g A + Ch h + Dη η (a a, h ) + χ A , Ch h + η (a a, h ) . = DCh Věta bude dokázána, pokud ukážeme, že pro každé r = 1, 2, . . . , k, je m X a, h ) + χr A , Ch h + η (a a, h ) kh hk−1 = 0 . lim Drs ηs (a h →0 s=1 ηs (a a, h ) Protože pro každé s = 1, 2, . . . , m platí lim = 0, je limita prvního členu rovna nule. Uvažujme nyní funkce h →0 hk kh A, k ) χr (A pro k 6= 0 k) = Fr (k kk kk 0 pro k = 0 χr (A A, k ) k ) spojitá v bodě k = 0. Hledaná limita pak Protože lim = 0, je pro každé r = 1, 2, . . . , m funkce Fr (k k →0 kk kk rovna
χr A , Ch Ch h + η (a a , h ) h + η (a a, h h + η (a a, h ) · = lim Fr Ch = 0, lim h→0 h →0 hk hk kh kh kh
Ch h + η (a a, h ) h + η (a a, h ) = 0 a funkce protože lim Ch je v okolí bodu h = 0 omezená. ¤ h→0 hk kh
Parciální derivace Jak je známo z přednášky MA1, diferenciál funkce f (x) jedné proměnné v bodě a existuje právě tehdy, když existuje derivace f 0 (a) funkce f (x) v bodě a. Pak je df (a, h) = f 0 (a)h. Podobně lze diferenciál funkce více proměnných vyjádřit pomocí derivací. Ale umíme derivovat pouze funkce jedné proměnné. Proto se pro funkce více proměnných zavádějí derivace podle vektoru. ¡ a ∈ Df a v = v1 , v2 , . . . , vn ) vektor v Rn . Definice 3. Nechť je f : Rn → R funkce n proměnných © ª ¡ ¢ Nechť je bod a hromadným bodem množiny M = x ; x = a + v t , t ∈ R ∩ Df a F (t) = f a + v t . x) má v bodě a derivaci podle vektoru v Jestliže existuje derivace F 0 (0), řekneme, že funkce f (x ∂f 0 x) podle vektoru v značíme rovnou F (0). Derivaci funkce f (x , f,vv apod. ∂vv Jestliže je kvv k = 1, nazýváme derivaci podle vektoru v derivace ve směru v . Jestliže je vektor v jeden z jednotkových vektorů ve směru souřadnicových os, tj. v = e i , nazýváme ∂f derivaci fe i ve směru e i parciální derivací podle proměnné xi . Parciální derivace budeme značit ∂xi nebo f,i . Poznámka: Podle definice je derivace funkce f (x) podle vektoru v rovna
f x1 + v1 t, x2 + v2 t, . . . , xn + vn t − f x1 , x2 , . . . , xn x + v t) − f (x x) f (x = lim . t→0 t→0 t t Speciálně parciální derivace podle proměnné xi je f x1 , x2 , . . . , xi−1 , xi + t, xi+1 , . . . , xn − f (x1 , x2 , . . . , xi−1 , xi , xi+1 , . . . , xn ∂f . = lim t→0 ∂xi t x) = lim f,vv (x
x) podle proměnné xi najdeme tak, že všechny proměnné mimo xi To znamená, že parciální derivaci funkce f (x považujeme za konstanty a derivujeme podle xi jako funkci jedné proměnné.
Podobně se definuje derivace podle vektoru v zobrazení f : Rn → Rk . Protože takové zobrazení je jednoznačně určeno k funkcemi fi : Rn → R, budeme, pokud není řečeno jinak, formulovat věty pro funkce f : Rn → R. Zobecnění na zobrazení f : Rn → Rk je zřejmé. Protože jsou derivace podle vektoru derivace funkce jedné proměnné, platí pro ně vztahy známé z MA1. 23
x) a g(x x) derivace podle vektoru v v bodě a a α ∈ R je konstanta. Věta 6. Nechť mají funkce f (x Pak platí ¡ ¢ a) = αf,vv (a a) , αf ,vv (a ¡ ¢ a) = f,vv (a a) + g,vv (a a) , f + g ,vv (a ¡ ¢ a) = f,vv (a a)g(a a) + f (a a)g,vv (a a) f g ,vv (a a) 6= 0 také a je-li g(a
µ ¶ a)g(a a) − f (a a)g,vv (a a) f v (a f a) = ,v (a . a) g ,vv g 2 (a
x) = af,vv (x x). Věta 7. Pro každý vektor v a a ∈ R platí f,avv (x x) = lim Důkaz: Podle definice je f,avv (x
t→0
x) = lim f,avv (x
t→0
x + avv t) − f (x x) f (x . Pro a = 0 je tvrzení zřejmé. Pro a 6= 0 dostaneme t
x + v at) − f (x x) x + avv t) − f (x x) f (x f (x = a lim = af,vv . t→0 t at
¤
Poznámka: Pro derivaci podle vektoru obecně neplatí f,(vv 1 +vv 2 ) = f,vv 1 + f,vv 2 . Tedy derivace podle vektoru není lineární funkcí vektoru v .
x) v bodě a diferenciál, existuje derivace funkce f (x x) v bodě a podle Věta 8. Má-li funkce f (x a) = df (a a, v ). každého vektoru v a platí f,vv (a x) má diferenciál v bodě a , platí f (a a + h ) − f (a a) = df (a a, h ) + η(a a, h ), Důkaz: Protože předpokládáme, že funkce f (x η(a a , h ) kde lim = 0. Tedy h →0 hk kh a, v t) + η(a a, v t) a + v t) − f (a a) df (a f (a a, v ) , = lim = df (a t→0 t t η(a η(a a, v t) a, v t) a, v t) = tdf (a a, v ) a lim protože df (a = kvv k lim = 0. ¤ t→0 t→0 t kvv tk x) diferencovatelná v bodě a , je zobrazení v → f,vv (a a) lineární funkcí Poznámka: Z věty 8 plyne, že je-li funkce f (x n n X X a, h ) = a) = vektoru v . Konkrétně je-li df (a ck hk , pak je f,vv (a ck vk . lim
t→0
k=1
k=1
∂f a) = ci . Tedy jestliže má funkce f (x x) v bodě a diferenciál, Ve speciálním případě parciálních derivací je (a ∂xi ∂f a) a platí existují všechny parciální derivace (a ∂xi a, h ) = df (a
n X ∂f a)hk . (a ∂x k k=1
(21)
Ale v obecném případě nezaručuje existence všech parciálních derivací existenci diferenciálu funkce, a tedy ani exix) v bodě a . V přednášce se nebudeme zabývat zkoumáním parciálních stenci tečné roviny ke grafu funkce y = f (x x) v případě, že neexistuje její diferenciál. Pokud tedy budeme mluvit o parciálních derivacích derivací funkce f (x x), budeme předpokládat, že je funkce diferencovatelná, a proto lze odvodit mnohé vztahy mezi derivacemi funkce f (x pomocí podobných vztahů pro diferenciály a vztahu (21).
x) v bodě a diferenciál. Pak vektor Definice 4. Nechť má funkce f (x ¡ ¢ a) = f,1 (a a), f,2 (a a), . . . , f,n (a a) grad f (a
(22)
x) v bodě a . nazýváme gradient funkce f (x x) diferencovatelná v bodě a, psát Podle věty 8 pak můžeme v případě, že je funkce f (x a) = v · grad f (a a) . f,vv (a
24
(23)
Věta 9. (parciální derivace složené funkce) Nechť je f : Rn → Rm zobrazení diferencovatelné v a). Pak existují parciální derivace bodě a a g : Rm → Rk zobrazení diferencovatelné v bodě A = f (a složené funkce H = g ◦ f : Rn → Rk a platí m X ∂Hi ∂gi ∂f a A) · r (a a) . (a ) = (A ∂xk ∂y ∂x r k r=1
(24)
x) a v bodě A = f (a a) všechny parciální Důkaz: Podle vět 8 existují v bodě a všechny parciální derivace funkce f (x y ). Přitom podle (21) platí derivace funkce g(y a, h ) = dfr (a
n X ∂fr a)hk (a ∂xk k=1
A, h ) = dgi (A
m X ∂gi a)hr . (a ∂x r r=1
Podle věty 5 je složené zobrazení h diferencovatelné v bodě a a platí a, h ) = dHi (a
m m n n n X X X X X ∂gi ∂gi ∂fr ∂Hi A)dfr (a a, h ) = A) a)hk = hk = (A (A (a ∂xk ∂yr ∂yr ∂xk r=1 r=1 k=1 k=1 k=1
! m X ∂gi ∂fr A) a) hk . (A (a ∂yr ∂xk r=1
¤ Pro diferencovatelné funkce více proměnných platí některé věty analogické větám o diferencovatelných funkcích jedné proměnné. Například analogie k Lagrangeově větě o střední hodnotě je Srovnáním těchto rovností dostaneme vztah (24).
x) diferencovatelná na otevřené konvexní množině M ∈ Rn . Pak pro Věta 10. Nechť je funkce f (x každé dva body a , b ∈ M existuje ξ ∈ M takový, že a) = df (ξξ , b − a ) = f (bb) − f (a
n X ¡ ¢ ∂f (ξξ ) bk − ak . ∂xk
k=1
Důkaz: Protože je množina M konvexní, leží pro každé dva body a , b ∈ M úsečka x (t) = a + (bb − a )t, t ∈ h0, 1i, v M . x) diferencovatelná v M , existuje pro každé x ∈ M derivace funkce f (x x) podle libovolného vektoru Protože je funkce f (x n X x) = df (x x, v ) = x)vk Uvažujme funkce F (t) = f a + (bb − a )t jedné proměnné t ∈ h0, 1i. v , která se rovná f,vv (x f,k (x k=1
Podle předpokladů je funkce F (t) spojitá a pro každé t ∈ (0, 1) existuje derivace F 0 (t), která je rovna derivaci podle vektoru (bb − a ) v bodě x = a + (bb − a )t. Podle Lagrangeovy věty o střední hodnotě existuje τ ∈ (0, 1) takové, že x) dostaneme f (bb)−f (a a) = df a +(bb −a a)τ, b −a a . F (1)−F (0) = F 0 (τ ). Jestliže přepíšeme tuto rovnost pomocí funkce f (x n X ∂f a) = df (ξξ , b − a ) = Ale protože τ ∈ (0, 1) leží bod ξ = a + (bb − a )τ v M . Tedy f (bb) − f (a (ξξ ) bk − ak . ¤ ∂x k k=1
x) diferencovatelná na otevřené konvexní množině M a všechny její Důsledek. Jestliže je funkce f (x x) na množině M konstantní. parciální derivace jsou rovny nule, je funkce f (x Důkaz: Nechť je a bod množiny M . Pak podle předchozí věty existuje pro každé x ∈ M bod ξ ∈ M takový, že n X ∂f x) − f (a a) = x) = f (a a). ¤ f (x (ξξ ) xk − ak = 0. Tedy pro každé x ∈ M platí f (x ∂x k k=1
Poznámka: Výše uvedený důsledek platí v mnohem obecnější množiny M ⊂ Rn . Z důkazu je zřejmé, že pro jeho platnost potřebujeme pouze to, aby existoval bod a ∈ M takový, že každý bod x ∈ M lze spojit s bodem a lomenou x) je diferencovatelná v M a pro čarou. Lze ukázat, že pokud M je otevřená souvislá podmnožina v Rn , funkce f (x ∂f x) = 0, je funkce f (x x) konstantní v M . každé k = 1, 2, . . . , n je (x ∂xk
x) umíme je vyjádřit poZ toho co bylo řečeno výše plyne, že pokud existuje diferenciál funkce f (x mocí parciálních derivací. Ale otázkou je, jak snadno ukázat existenci diferenciálu. Jednu z odpovědí dává následující věta. x) v okolí bodu a parciální derivace, které jsou spojité v bodě a . Pak Věta 11. Nechť má funkce f (x x) diferencovatelná v bodě a . je funkce f (x Důkaz: Musíme ukázat, že za uvedených předpokladů platí lim
h→0
a + h ) − f (a a) − f (a
n X ∂f a)hk (a ∂x k k=1
Abychom dokázali tuto rovnost, dokážeme nejprve následující lemma. 25
! hk−1 = 0 . kh
x) všechny parciální derivace v množině M = (a1 − ε1 , a1 + ε1 ) × (a2 − ε2 , a2 + ε2 ) × Lemma 1. Nechť má funkce f (x · · · × (an − εn , an + εn ). Pak pro každé b ∈ M existují v M body ξ (1) , ξ (2) , . . . , ξ (n) takové, že a) = f (bb) − f (a
n X ∂f ξ (k) bk − ak ) . ∂x k k=1
x) byla na M diferencovatelná. Poznámka: Všimněte si, že na rozdíl od věty 10 nepožadujeme, aby funkce f (x Důkaz: Nechť a = a1 , a2 , . . . , an a b = b1 , b2 , . . . , bn ). Nechť c 1 ∈ M je bod se souřadnicemi c 1 = b1 , a2 , . . . , an . Protože je funkce F (t) = f a + (cc1 − a )t , t ∈ h0, 1i, podle předpokladů spojitá a má pro t ∈ (0, 1) derivaci ∂f a + (cc1 − a )t · b1 − a1 , existuje podle Lagrangeovy věty o střední hodnotě τ1 ∈ (0, 1) takové, že F 0 (t) = ∂x1 F (1) − F (0) = F 0 (τ1 ), neboli ∂f a) = f (cc1 ) − f (a ξ (1) · b1 − a1 , ∂x1 kde ξ (1) = a1 + (b1 − a1 )τ1 , a2 , . . . , an . Nechť je c 2 bod se souřadnicemi b1 , b2 , a3 , . . . , an ∈ M . Podobnou úvahou jako výše se ukáže, že existuje τ2 ∈ (0, 1) takový, že f (cc2 ) − f (cc1 ) =
∂f ξ (2) · b2 − a2 , ∂x2
kde ξ (2) = b1 , a2 + (b2 − a2 )τ, . . . , an ∈ M . Jestliže budeme pokračovat v těchto úvahách, sestrojíme pro všechna k = 1, 2, . . . , n body ξ (k) ∈ M , které mají souřadnice ξ (k) = b1 , . . . , bk−1 , ak + (bk − ak )τk , ak+1 , . . . , an , kde τk ∈ (0, 1), a pro které platí ∂f f (cck ) − f (cck−1 ) = ξ (k) · bk − ak , ∂xk kde c 0 = a a c n = b . Jestliže sečteme tyto rovnosti, získáme požadovaný vztah. ¤ Protože podle předpokladu existují parciální derivace v jistém okolí bodu a lze použít tvrzení Lemmatu. Pak pro hk dostaneme, že existují body ξ (k) , které patří do dostatečně malého okolí bodu a , pro která je dostatečně malá kh a + h ) − f (a a) − f (a
Tvrzení věty pak plyne z toho, že
n n X X ∂f ∂f ∂f a)hk = a) hk . (a ξ (k) − (a ∂xk ∂xk ∂xk k=1 k=1
hk ≤ 1, pro každé k = 1, 2, . . . , n je lim ξ (k) = a a spojitosti parciálních derivací h →0 hk kh
¤ x) na množině M ⊂ Rn spojité derivace, je na množině M Z věty 11 plyne, že když má funkce f (x diferencovatelná. v bodě a .
x) na otevřené množině M ⊂ Rn spojité parciální derivace, tj. Definice 5. Jestliže má zobrazení f (x x), i = 1, 2, . . . , n, mají na M spojité parciální derivace, nazýváme zobrazení všechny jeho složky fi (x x) zobrazením třídy C1 na množině M . Množina všech zobrazení třídy C1 na množině M se f (x obvykle značí C1 (M ). x) diferencovatelné. Věta 12. Jestliže je zobrazení f ∈ C1 (M ), pak je f (x ¤ Z Lemmatu 1. plyne velmi užitečná věta
Důkaz: Věta je přímým důsledkem věty 11.
x) v jistém okolí bodu a všechny parciální derivace f,k (x x), které jsou Věta 13. Nechť má funkce f (x x) spojitá. spojité v bodě a . Pak existuje okolí bodu a , na kterém je funkce f (x x) spojité v bodě a a existují v jistém okolí bodu a , existuje okolí Důkaz: Protože jsou parciální derivace funkce f (x a), na kterém jsou tyto derivace omezené. Nechť x ∈ Uδ (a a). Pak existuje ε > 0 takové, že krychle K se středem v Uδ (a a). Pro každé y ∈ K existují podle Lemmatu 1 body ξ (k) ∈ K takové, že bodě x a hranou délky 2ε leží v Uδ (a y ) − f (x x) = f (y
n X ∂f ξ (k) (yk − xk ) . ∂x k k=1
y ) = f (x x). Protože jsou všechny parciální derivace f,k ξ (k) omezené, je lim f (y x y →x
26
¤
Přednáška 5 Diferenciály a derivace vyšších řádů x) polynomy Jak jsem se už zmínil, v diferenciálním počtu se snažíme nahradit funkci y = f (x x), což vedlo k pojistého stupně. V minulé přednášce jsme zavedli lineární aproximaci funkce f (x jmu diferenciálu funkce. Jestliže funkci nahrazujeme polynomy vyššího stupně, získáme diferenciály x) v okolí bodu a ve vyššího řádu. Například při kvadratické aproximaci se snažíme zapsat funkci f (x tvaru n n X X a + h ) = f (a a) + a, h ) , f (a cr hr + crs hr hs + η(a (1) ¯ ¯ ¯η(a a, h )¯
r=1
r,s=1
= 0. Je zřejmé, že taková funkce musí mít v bodě a první diferenciál, který je h k2 kh n X ∂f a, h ) = a). Z přednášky MA1 víme, df (a (a cr hr . Tedy pro každé r = 1, 2, . . . , n musí být cr = ∂xr r=1 že pro funkci jedné proměnné F (t), která má druhou derivaci platí kde lim
h →0
F (a + h) = F (a) + F 0 (a)h + kde lim
h→0
¯ ¯ ¯η(a, h)¯ h2
(2)
= 0. V analogii s tímto vztahem budeme pro funkce n proměnných psát a + h ) = f (a a) + df (a a, h ) + f (a
kde lim
1 00 F (a)h2 + η(a, h) , 2
¯ ¯ ¯η(a a , h )¯
1 2 a, h ) + η(a a, h ) , d f (a 2
(3)
= 0. hk2 kh a + h t). Jestliže existuje Vezměme nyní h pevné a uvažujme funkci jedné proměnné F (t) = f (a x) v bodě a , měla by existovat kvadratická aproximace funkce kvadratická aproximace funkce f (x x) první F (t) v bodě t = 0. Tato aproximace je dána vztahem (2), kde a = 0. Protože má funkce f (x diferenciál, platí ¶ µ ¶ n n µ n X X X ∂f ∂f ∂f ∂ a) = a)hr a F 00 (0)h2 = a)hr = a)hr hs , F 0 (0)h = f,hh (a (a (a (a ∂xr ∂xr ,hh ∂xs ∂xr r=1 r=1 r, s=1 h →0
a) je derivace funkce f (x x) podle vektoru h v bodě a . Je přirozené požadovat, aby byl druhý kde f,hh (a x) diferenciál diferenciálem prvního diferenciálu. Proto musíme za prvé předpokládat, že funkce f (x má první diferenciál v jistém okolí bodu a . Jestliže srovnáme tento výraz z výrazem (1), je vidět, že derivace podle vektoru h parciální derivace v bodě a by měla být lineární funkcí vektoru h . ∂f Tento požadavek lze splnit tak, že budeme předpokládat, že všechny parciální derivace mají ∂xk diferenciál v bodě a . Tyto úvahy shrneme do x) má v bodě a diferenciál druhého řádu neboli druhý diferenciál, Definice 1. Řekneme, že funkce f (x jestliže x) má diferenciál prvního řádu v jistém okolí bodu a , (1) funkce f (x (2) všechny parciální derivace f,k mají v bodě a diferenciál prvního řádu. x) v bodě a budeme značit d2 f (a a, h ) a platí Druhý diferenciál funkce f (x µ ¶ n X ∂f ∂ a ) hr hs . a, h ) = (a (4) d2 f (a ∂xr ∂xs r,s=1 Z rovnice (4) vidíme, že pro výpočet druhého diferenciálu potřebujeme parciální derivace z parciálních derivací, tj. druhé parciální derivace. 27
∂f x) existuje v jistém okolí bodu a . Jestliže existuje par(x Definice 2. Nechť parciální derivace ∂xi µ ¶ ∂ ∂f a) nazýváme tento výraz druhou parciální derivací funkce f (x x) podle ciální derivace (a ∂xk ∂xi proměnných xi a xk v bodě a . Druhé parciální derivace se často značí µ ¶ ∂ ∂f ∂2f a) = a) = f,ik (a a) . (a (a ∂xk ∂xi ∂xk ∂xi a) 6= f,ki (a a). Ale pokud Poznámka: V obecném případě je nutné zachovávat pořadí derivování. Tedy obecně je f,ik (a má funkce druhý diferenciál platí následující věta:
Věta 1. Nechť je f (x1 , x2 ) funkce dvou proměnných a nechť její parciální derivace
∂f = f,1 a ∂x1
∂f a) = = f,2 existují v jistém okolí bodu a = (a1 , a2 ) a mají diferenciál v bodě a . Pak je f,12 (a ∂x2 a). f,21 (a x) a f,2 (x x) existují v okolí Uδ (a a). Pro 0 < h < δ uvažujme funkci Důkaz: Nechť parciální derivace f,1 (x 1 F (h) = 2 f (a1 + h, a2 + h) − f (a1 + h, a2 ) − f (a1 , a2 + h) + f (a1 , a2 ) . h Zvolme h pevné a označme ϕ(x1 ) = f (x1 , a2 + h) − f (x1 , a2 ). Z Lagrangeovy věty o střední hodnotě plyne F (h) =
1 1 ϕ(a1 + h) − ϕ(a1 ) = ϕ0 (a1 + Θh) , h2 h
kde 0 < Θ < 1. Protože ϕ0 (x1 ) = f,1 (x1 , a2 + h) − f,1 (x1 , a2 ), dostaneme 1 F (h) = f,1 (a1 + Θh, a2 + h) − f,1 (a1 + Θh, a2 ) . h a) plyne, že platí Z existence diferenciálu parciální derivace f,1 (a h 1 F (h) = f,1 (a1 , a2 ) + f,11 (a1 , a2 )Θh + f,12 (a1 , a2 )h + η(a1 , a2 ; Θh, h)− h i η(a1 , a2 ; Θh, 0) η(a1 , a2 ; Θh, h) − , − f,1 (a1 , a2 ) − f,11 (a1 , a2 )Θh − η(a1 , a2 ; Θh, 0) = f,12 (a1 , a2 ) + h h η(a a; h ) kde lim = 0. Ale například v normou ν1 je k(Θh, h)k = (1 + Θ)h a k(Θh, 0)k = Θh. Tedy když přejdeme k h →0 hk kh limitě h → 0+ dostaneme lim F (h) = f,12 (a1 , a2 ) + (1 + Θ) lim
h→0+
h→0+
η(a1 , a2 ; Θh, 0) η(a1 , a2 ; Θh, h) − Θ lim = f,12 (a1 , a2 ) . h→0+ (1 + Θ)h Θh
Podobně, pouze s tím rozdílem, že místo funkce ϕ(x1 ) zvolíme funkce ψ(x2 ) = f (a1 + h, x2 ) − f (a1 , x2 ) dostaneme, že lim F (h) = f,21 (a1 , a2 ) . h→0+
Srovnáním obou těchto výrazů dostaneme požadované tvrzení.
¤
x) v bodě a druhý diferenciál, platí pro každé i, k = 1, 2, . . . , n Důsledek. Jestliže má funkce f (x rovnost µ ¶ µ ¶ ∂ ∂ ∂f ∂f a) = a) . (a (a ∂xi ∂xk ∂xk ∂xi Důkaz: Protože má funkce dvou proměnných F (xi , xk ) = f (a1 , a2 , . . . , ai−1 , xi , ai+1 , . . . , ak−1 , xk , ak+1 , . . . , an ) diferenciál druhého řádu, splňuje všechny předpoklady věty 1. Tedy výše uvedené tvrzení platí podle této věty. ¤
a) = Protože pro funkce, které mají druhý diferenciál jsou parciální derivace záměnné, tj. platí f,ik (a a), lze vztah (4) psát ve tvaru f,ki (a a, h ) = d2 f (a
n X i=1
a)h2i + f,ii (a
X
a)hi hk = f,ik (a
n X i=1
i6=k
a)h2i + 2 f,ii (a
X
a)hi hk . f,ik (a
(5)
1≤i
Věta 1 o záměnnosti parciálních derivací vyžaduje předpoklad existence diferenciálu prvních parciálních derivací. Tento předpoklad se dá poměrně obtížně ověřit. Jedna z možností, jak ověřit existenci druhého diferenciálu dává následující věta 28
x) všechny první parciální derivace v jistém okolí bodu a a všechny Věta 2. Nechť má funkce f (x x). druhé parciální derivace jsou spojité v bodě a . Pak v bodě a existuje druhý diferenciál funkce f (x Důkaz: Z věty 13 z přednášky 4 plyne, že parciální derivace prvního řádu jsou spojité v jistém okolí bodu a . Z věty x) má v bodě a 11 přednášky 4 plyne existence diferenciálu všech parciálních derivací prvního řádu. Tedy funkce f (x druhý diferenciál. ¤
x) na množině M spojité druhé derivace, jsou záměnné. Ale abychom Tedy pokud má funkce f (x ověřili předpoklady této věty, musíme vědět, že jsou spojité obě derivace f,ik a f,ki . Tedy tato věta nemá příliš velký praktický význam pro to, abychom zjistili, že parciální derivace jsou záměnné. Ale platí následující x) funkce n proměnných.¡ Nechť Věta 3. Nechť je f (x v jistém okolí bodu a existují první parciální ¢ x) a f,k (x x) a nechť je f,ik (x x) = f,i ,k (x x) je spojitá v bodě a . Pak v bodě a existuje derivace f,i (x ¡ ¢ a) = f,k ,i (a a) a platí f,ik (a a) = f,ki (a a). f,ki (a Důkaz: K důkazu věty se stačí omezit na případ n = 2 a i = 1, k = 2. Dále lze předpokládat, že parciální derivace a), na kterém existují obě parciální derivace prvního řádu. Naším úkolem je tedy f,12 (a1 , a2 ) je spojitá na okolí Uδ (a ukázat, že existuje i 1 f,2 (a1 + h, a2 ) − f,2 (a1 , a2 ) = f,21 (a1 , a2 ) lim h→0 h a že její hodnota je rovna f,12 (a1 , a2 ). Protože pro 0 < |h| < δ existuje parciální derivace f,2 (a1 + h, a2 ), je hledaná limita rovna lim lim F (h, k) = f,21 (a1 , a2 ) , h→0
k→0
kde
i 1 1h f (a1 + h, a2 + k) − f (a1 + h, a2 ) − f (a1 , a2 + k) + f (a1 , a2 ) . hk Z existence první parciální derivace víme, že 0 < |h| < δ existuje vnitřní limita lim F (h, k). Abychom dokázali, že F (h, k) =
k→0
hledaná limita existuje, stačí ukázat, že existuje dvojná limita lim
(h,k)→(0,0) h6=0 k6=0
F (h, k) = f,12 (a1 , a2 ) .
Nechť je 0 < |h| < δ a 0 < |k| < δ. Položme ϕ(x1 ) = f (x1 , a2 + k) − f (x1 , a2 ). Podle Lagrangeovy věty o střední hodnotě existuje Θ1 ∈ (0, 1) takové, že 1 1 1 F (h, k) = ϕ(a1 + h) − ϕ(a1 ) = ϕ0 (a1 + Θ1 h) = f,1 (a1 + Θ1 h, a2 + k) − f,1 (a1 + Θ1 h, a2 ) . hk k k Jestliže nyní položíme ψ(x2 ) = f,1 (a1 + Θ1 h, x2 ), dostaneme podle věty o střední hodnotě, že existuje Θ2 ∈ (0, 1) takové, že F (h, k) = ψ 0 (a2 + Θ2 k) = f,12 (a1 + Θ1 h, a2 + Θ2 k) . Ze spojitosti parciální derivace f,12 v bodě a = (a1 , a2 ) pak plyne existence hledané limity a rovnost f,12 (a1 , a2 ) = f,21 (a1 , a2 ). ¤
Abychom definovali diferenciál k–tého řádu, budeme nejprve definovat parciální derivace k–tého řádu. x) funkce n proměnných. Jestliže existuje parciální derivace Definice 3. Nechť je f (x µ ¶ ∂ k−1 f ∂kf ∂ a) = a) = f,i1 i2 ...ik−1 ik (a a) , (a (a ∂xik ∂xik−1 ∂xik−2 . . . ∂xi1 ∂xik ∂xik−1 . . . ∂xi1 x) podle proměnných i1 , i2 , . . . , ik v bodě a . nazýváme tento výraz parciální derivací funkce f (x Obecně závisí parciální derivace k–tého řádu na pořadí, ve které derivujeme. Ale platí věty, které jsou analogické větám 1, 2 a 3 x) až do řádu (k − 2) včetně mají diferenciál v Věta 1a. Nechť všechny parciální derivace funkce f (x jistém okolí bodu a a všechny parciální derivace řádu (k − 1) mají diferenciál v bodě a . Pak existují x) v okolí bodu a až do řádu k včetně a nezávisí na pořadí, v všechny parciální derivace funkce f (x němž derivujeme. Důkaz: Tvrzení dokážeme indukcí. Podle věty 1, platí tvrzení pro k = 2. Nechť tvrzení platí pro k − 1. Pak jsou podle indukčního předpokladu záměnné všechny parciální derivace až do řádu (k − 1) včetně. Jde nám tedy pouze o záměnnost parciálních derivací řádu k. Ale v věty 1 plyne, že fi1 i2 ...ik−1 ,i = fi1 i2 ...ik i . k
k−1
A protože f,i1 i2 ...ik−1 nezávisí na pořadí indexů, plyne odtud, že ani f,i1 i2 ...ik nezávisí na pořadí indexů, tj. na pořadí, ve kterém derivujeme. ¤ 29
x) až do řádu (k − 1) v jistém okolí Věta 2a. Nechť existují všechny parciální derivace funkce f (x bodu a a všechny parciální derivace řádu k jsou spojité v bodě a . Pak všechny parciální derivace x) v bodě a až do řádu k jsou záměnné. funkce (x Důkaz: Věta je přímý důsledek věty 2.
¤
Věta 3a. Nechť jsou všechny parciální ¡derivace až¢do řádu (k − 1) záměnné v jistém¡okolí bodu a¢. a), pak pro každou permutaci j1 , j2 , . . . , jk Je-li v bodě a spojitá parciální derivace fi1 i2 ...,ik−1 ,i (a k ¡ ¢ indexů i, i2 , . . . , ik existuje parciální derivace a) = f,i1 i2 ...ik (a a) . f,j1 j2 ...jk (a Důkaz: plyne z věty 3. ¤ x) v bodě a záměnné parciální derivace řádu k, používáme pro parciální derivace Poznámka: Jestliže má funkce f (x zkrácené značení ∂k f ∂k f = , k1 ∂xi1 ∂xi2 . . . ∂xik ∂x1 ∂xk2 2 . . . ∂xknn kde k = k1 + k2 + · · · + kn a k1 je počet parciálních derivací podle x1 , k2 je počet parciálních derivací podle x2 , atd. Přitom je-li ki = 0, vynecháváme symbol ∂x0i . ∂7f Tedy například f,1214514 = . 3 ∂x1 ∂x2 ∂x24 ∂x5
Nyní zobecníme definici 1 na případ diferenciálu libovolného řádu. ¡ ¢ x) = f x1 , x2 , . . . , xn . Řekneme, že funkce f (x x) má v bodě a Definice 4. Nechť je dána funkce f (x diferenciál řádu k nebo diferenciál k–tého řádu, jestliže x) až do řádu (k − 2) včetně mají diferenciál prvního (1) všechny parciální derivace funkce f (x řádu v jistém okolí bodu a x) řádu (k − 1) mají v bodě a diferenciál prvního řádu. (2) všechny parciální derivace funkce f (x ¡ ¢ x) v bodě a vztahem dk f (a a, h ) = d dk−1 f (x x, h ) (a a, h ), Pak definujeme k–tý diferenciál funkce f (x kde diferenciál řádu (k − 1) považujeme za funkci proměnné x . x) v bodě a diferenciál řádu k, pak jsou její všechny parciální derivace Věta 4. Jestliže má funkce f (x až do řádu k v bodě a záměnné. Důkaz: Toto tvrzení je vlastně věta 1a. ¤ x) na množině M všechny Definice 5. Nechť je M ⊂ Rn otevřená množina. Jestliže má funkce f (x parciální derivace až do řádu k včetně spojité, říkáme, že je třídy Ck (M ). x) na otevřené množině M ⊂ Rn spojité parciální derivace všech řádů, Jestliže má funkce f (x říkáme, že je třídy C∞ (M ) neboli že je hladká na M . x) ∈ Ck (M ) má na množině M diferenciál řádu k a všechny její parciální Věta 5. Každá funkce f (x derivace až do řádu k jsou na množině M záměnné. x) v jistém okolí bodu a plyne existence Důkaz: Protože ze spojitosti všech prvních parciálních derivací funkce f (x prvního diferenciálu v bodě a , diferenciál k–tého řádu existuje. Záměnnost parciálních derivací pak plyne z věty 4. ¤
Jak jsme se již zmínili, lze diferenciály vyjádřit pomocí parciálních derivací. První diferenciál je x) je funkce f (x n X ∂f x, h ) = x)hh . df (x (x ∂x r r=1 Protože druhý diferenciál je první diferenciál druhého diferenciálu je x, h ) = d2 f (x
X r,s
x) roven Obecně je k–tý diferenciál funkce f (x X x, h ) = dk f (x
∂2f x)hr hs . (x ∂xr ∂xs
x)hi1 hi2 . . . hik . f,i1 i2 ...ik (x
i1 ,i2 ,...,ik
30
(6)
x) diferenciál k–tého řádu jsou podle věty 4 všechny parciální derivace řádu Jestliže má funkce f (x k záměnné. To nám umožňuje sloučit v (6) členy, které se liší pouze pořadím derivování. Počet všech permutací k prvkové množiny je k!. Jestliže se v této množině vyskytuje derivace podle první proměnné k1 –krát, derivací podle druhé proměnné k2 –krát atd., nezmění se permutace, jestliže permutujeme k1 prvkovou množinu, která obsahuje derivace podle proměnné x1 , k2 prvkovou množinu, která obsahuje derivace podle proměnné x2 , atd. Tedy (6) lze zapsat ve tvaru X
x, h ) = dk f (x
k1 +k2 +···+kn =k
∂kf k! x)hk11 hk22 . . . hknn . (x k 1 k1 ! · k2 ! · . . . · kn ! ∂x1 ∂xk22 . . . ∂xknn
(7)
Poznámka: Jestliže si uvědomíme, že pro každé k ∈ N platí vztah X k k! a1 + a2 + · · · + an = ak1 1 ak2 2 . . . aknn , k ! · k ! · . . . · k ! n 1 2 k +k +···+k =k 1
2
n
lze vztah (7) přepsat ve tvaru x, h ) = dk f (x
k ∂ ∂ ∂ x) . + ha + · · · + hn f (x h1 ∂x1 ∂x2 ∂xn
Z věty 4.9 víme, že když má zobrazení g : Rn → Rm v bodě a diferenciál prvního řádu a funkce a) diferenciál prvního řádu, existuje diferenciál prvního řádu, a tedy i f : Rm → R v bodě A = g (a všechny parciální derivace složené funkce H = f ◦ g : Rn → R. Přitom jsou parciální derivace dány vztahem m X ∂H ∂f ∂g a) = A) · r (a a) . (a (A ∂xi ∂y ∂xi r r=1 x) v jistém okolí Tedy jestliže existují první diferenciály zobrazení g (x ¡ bodu ¢ a a funkce f (yy ) v jistém x) = f g (x x) v jistém okolí bodu a a je okolí bodu A existuje parciální derivace složené funkce H(x rovna m X ¢ ∂g ∂H ∂f ¡ x) = x) · r (x x) . (x g (x (8) ∂xi ∂yr ∂xi r=1 x) a funkce f (yy ) mají diferenciály druhého řádu, lze Jestliže budeme předpokládat, že zobrazení g (x derivovat rovnost (8) podle xk . Derivací dostaneme µ ¶ µ ¶ m X ¢ ∂g ∂ ∂H ∂ ∂f ¡ x) = x) · r (x x) = (x g (x ∂xk ∂xi ∂xk ∂yr ∂xi r=1 µ ¶ µ ¶ ¸ · m X ¢ ∂gr ¢ ∂ ∂f ¡ ∂f ¡ ∂gr ∂ x) x) + x) x) . = g (x (x g (x (x ∂xk ∂yr ∂xi ∂yr ∂xk ∂xi r=1 ¢ ∂f ¡ x) je složená funkce a druhé parciální derivace jsou záměnné (předpokládali jsme, g (x ∂yr že existuje druhý diferenciál), dostaneme Protože
m m X X ¢ ∂gs ¢ ∂ 2 gr ∂2H ∂g ∂2f ¡ ∂f ¡ x) = x) x) r (x x) + x) x) . (x g (x (x g (x (x ∂xi ∂xk ∂yr ∂ys ∂xk ∂xi ∂yr ∂xk ∂xi r,s=1 r=1
(9)
Podobně jako jsme odvodili ze vztahu (8) rovnost (9), lze za předpokladu existence třetích diferenx) najít třetí parciální derivace složené funkce H = f ◦ g (x x), atd. Obecně ciálů zobrazení f (yy ) a g (x platí Věta 6. Nechť má zobrazení g : Rn → Rm v bodě a diferenciál k–tého řádu a funkce f : Rm → R v a) diferenciál k–tého řádu. Pak v bodě a má složená funkce H = f ◦gg všechny parciální bodě A = g (a derivace až do řádu k a tyto derivace jsou záměnné. y ) a g (x x) diferenciál k–tého řádu, lze pro každé j < k aplikovat postup, který jsme Důkaz: Protože mají zobrazení f (y použili při odvození vztahu (9) z (8). Záměnnost derivací plyne z toho, že parciální derivace j–tého řádu (j ≤ k) y ) a g (x x) řádu nejvýše j. Ale ty jsou záměnné, protože zobrazení f a g obsahuje pouze parciální derivace funkcí f (y mají diferenciál j–tého řádu. ¤ 31
Věta 7. Jestliže je zobrazení g : Rn → Rm třídy Ck (M ), kde M je otevřená podmnožina Rn a funkce f : Rm → R je třídy Ck (N ), kde N ⊂ Rm je otevřená množina taková, že g (M ) ⊂ N , pak je složená funkce H = f ◦ g ∈ Ck (M ). y ) má na N diferenciál k–tého řádu a zobrazení g (x x) má diferenciál řádu k na Důkaz: Z věty 5 plyne, že zobrazení f (y x) až do řádu k včetně. Ale k–tá parciální množině M . Proto podle věty 6 existují parciální derivace složené funkce H(x derivace funkce H je vyjádřena pomocí součtů a součinů parciálních derivací zobrazení f a g řádu nejvýše k. Protože jsou tyto derivace podle předpokladu spojité na N , resp. M , jsou na M spojité také parciální derivace funkce H. ¤
Věta 8. Nechť má zobrazení g : Rn → Rm v bodě a diferenciál k–tého řádu a funkce f : Rm → R a) diferenciál k–tého řádu. Pak v bodě a má složená funkce H = f ◦ g diferenciál v bodě A = g (a k–tého řádu. Důkaz: Tvrzení dokážeme indukcí podle k. Z věty 4.5 plyne, že tvrzení platí pro k = 1. x), resp. f (y y ), mají v bodě Předpokládejme, že tvrzení věty platí pro (k − 1). Protože předpokládáme, že funkce gi (x a), diferenciál k–tého řádu. Proto mají funkce gi (x x), resp. f (y y ), diferenciál (k − 2) řádu v jistém okolí a , resp. A = g (a x) diferenciál řádu (k − 1) v jistém okolí bodu a , resp. A . Tedy podle indukčního předpokladu má složená funkce H(x x) polynom v parciálních derivacích funkcí gi (k k ) a f (y y ) do řádu bodu a . Navíc je každá parciální derivace funkce H(x (k − 1). Podle předpokladu mají tyto funkce diferenciál, a tedy také parciální derivace (k − 1) řádu složené funkce x) mají diferenciál. ¤ H(x
Při počítání s diferenciály se často používá velmi užitečná symbolika. Zaveďme v Rn speciální x) = xi . Funkcím Vi (x x) můžeme říkat třeba ”i–tá nezávislá proměnná”. Funkce Vi (x x) funkce Vi (x x, h ) = hi a dk Vi (x x) = 0 pro každé k > 1. Jestliže jsme mají diferenciály všech řádů a přitom je dVi (x diferenciál funkce f značili df , je přirozené psát hi = dVi = dxi . Při tomto označení se zapíše jako x) = df (x nebo prostě df =
n X ∂f x) dxr (x ∂x r r=1
n n X X ∂f dxr = f,r dxr . ∂xr r=1 r=1
(10)
(10a)
Toto označení je velmi výhodné ¡i pro zápis diferenciálu složené funkce. Je-li totiž f : Rm → R a ¢ n m g : R → R , kde zobrazení g = g1 , g2 , . . . , gm , pak lze první diferenciál složené funkce H = f ◦ g zapsat ve tvaru m X n m X X dH = f,r gr,s dxs = H,r dgr , r=1 s=1
r=1
n X
x) = protože dgr = gr,s dxs . Mnohdy se ještě mlčky používá úmluva, že složenou funkci H(x s=1 ¡ ¢ x) značíme také f . Při této úmluvě vždy platí vztah f g (x df =
m X
f,r (yy ) dyr .
r=1
Pak závisí na tom, jestli považujeme funkci f za funkci nezávisle proměnné y nebo je to proměnná, která ještě závisí na proměnné x . Ale obecně lze zavést operaci diferencování d, která funkci f přiřadí funkci df . Tato operace má následující vlastnosti: (1) d(af + bg) = adf + bdg, kde a a b jsou reálné konstanty (2) d(f ¡ g)¢= gdf + f dg (3) d¡f m ¢= mf m−1 df , kde m ∈ R (4) d dk f = dk+1 f . Přitom si je ale třeba uvědomit, že pokud jsou xi nezávisle proměnné, je dk xi = 0 pro k ≥ 2. Správné používání těchto označení mnohdy dělá výpočty pro parciální derivace a diferenciály přehlednější. Tohoto označení budeme často používat zejména v přednášce 7 při výpočtu tzv. vázaných extrémů funkce více proměnných. Na závěr této přednášky uvedeme analogii Taylorova vzorce pro funkci více proměnných. 32
h, t ∈ (0, 1) Věta 9. Nechť je f : Rn → R funkce, která má v každém bodě úsečky x = a + th diferenciál (k + 1)–ního řádu. Pak existuje Θ ∈ (0, 1) takové, že a + h ) = f (a a) + f (a
1 1 1 1 a, h ) + d2 f (a a, h ) + · · · + dk f (a a, h ) + a + Θh h, h ) . (11) df (a dk+1 f (a 1! 2! k! (k + 1)!
a + th h), t ∈ h0, 1i. Podle věty 6 má tato funkce v každém bodě přímky derivace až do řádu Důkaz: Položme F (t) = f (a (k + 1). Pro funkci F (t) lze tedy použít Taylorova vzorce pro funkci jedné proměnné. Podle něj je F (1) = F (0) +
1 0 1 1 1 f (0)t + F 00 (0)t2 + · · · + F (k) (0)tk + F (k+1) (Θ) , 1! 2! k! (k + 1)!
a + th h) a funkce f (x x) mají diferenciály až do řádu (k + 1), platí pro každé t ∈ h0, 1i kde Θ ∈ (0, 1). Protože F (t) = f (a a + th h, h ). ¤ a pro každé r = 0, 1, 2, . . . , k + 1 rovnost F (r) (t) = dr f (a
V praxi je mnohdy výhodnější trochu slabší tvrzení, které ukazuje, jak lze pomocí diferenciálů x) aproximovat polynomem do řádu k. nahradit funkci n proměnných f (x x) ∈ Ck (M ), kde M ⊂ Rn je otevřená konvexní množina a a ∈ M . Věta 10. Nechť je funkce f (x Pak pro každé h takové, že a + h ∈ M platí a + h ) = f (a a) + f (a
1 1 1 a, h ) + d2 f (a a, h ) + · · · + dk (a a, h ) + η(a a, h ) , df (a 1! 2! k!
kde lim
h →0
¯ ¯ ¯η(a a , h )¯ hkk kh
(12)
= 0.
Důkaz: Uvažujme funkci h) = f (a a + h) − ρ(h
1 2 1 k a) + df (a a, h ) + a, h ) + · · · + a, h ) f (a d f (a d f (a 2! k!
x) je třídy Ck (M ) a množina proměnné h , která je definována pro všechna h taková, že a + h ∈ M . Protože funkce f (x h) v každém bodě úsečky x = th h, t ∈ (0, 1) diferenciál k-tého řádu. Podle věty 9 existuje M je konvexní, má funkce ρ(h tedy Θ ∈ (0, 1) obecně závislé na h takové, že h) = ρ(0) + dρ(0, h ) + ρ(h
1 2 1 1 k h, h ) . d ρ(0, h ) + · · · + dk−1 ρ(0, h ) + d ρ(Θh 2 (k − 1)! k!
h) plyne, že pro r = 0, 1, . . . , k − 1 je dr ρ(0, h ) = 0. Tedy existuje Θ ∈ (0, 1) takové, že Ale z definice funkce ρ(h h) = ρ(h
1 a + θh h, h ) − dk f (a a, h ) . dk f (a k!
Z tohoto vztahu dostaneme pro h = 6 0 0≤
ρ(h h) hkk kh
≤ nk max
∂k f ∂k f h − a + Θh a ) . ∂xi1 ∂xi2 . . . ∂xik ∂xi1 ∂xi2 . . . ∂xik
x) řádu k na množině M spojité, a proto je lim Ale podle předpokladů jsou parciální derivace funkce f (x
h →0
33
ρ(h h ) = 0. k kk kk
¤
Přednáška 6 Funkce definované implicitně V této přednášce se budeme¡ zabývat následujícím problémem: ¢ x, y ), k = 1, 2, . . . , s, r + s proměnJe dáno s spojitých funkcí Fk x1 , x2 , ˙,xr , y1 , y2 , . . . , ys = Fk (x x), y2 = f2 (x x), . . . , ys = fs (x x) proměnných. Kdy existují, alespoň lokálně, spojité funkce y1 = f1 (x ných x1 , x2 , . . . , xr takové, že pro každé k = 1, 2, . . . , s platí ¡ ¢ ¡ ¢ x) = Fk x1 , . . . , xr , f1 (x x), . . . , fs (x x) = 0 ? Fk x , f (x ¡ ¢ V podstatě se jedná o to, kdy můžeme zaručit, že ze soustavy rovnic Fk x1 , . . . , xr , y1 , . . . , ys = 0, k = 1, 2, . . . , s, lze, alespoň lokálně, najít yk jako spojité funkce xi . Řešení tohoto problému nejprve ukážeme na případě, kde r = s = 1. Jedná se tedy o řešení rovnice F (x, y) = 0. Nejprve musíme zaručit, že rovnice má nějaké řešení. Proto budeme předpokládat, že existují a a b taková, že F (a, b) = 0. Pro řešení rovnice F (x, y) = 0 v okolí bodu (a, b) existují na funkci F (x, y) různé předpoklady. My budeme předpokládat, že funkce F (x, y) je v okolí bodu (a, b) ∂F spojitá, že v jistém okolí bodu (a, b) existuje spojitá parciální derivace (x, y), která je v bodě ∂y (a, b) různá od nuly. Za těchto předpokladů lze totiž, ¡ aspoň¢teoreticky, sestrojit pro každé x z jistého okolí bodu a funkci y = f (x), pro kterou platí F x, f (x) = 0. Konstrukce řešení využívá větu o kontrahujícím zobrazení v úplném metrickém prostoru. 1 Označme C = F,y (a, b) 6= 0 a uvažujme zobrazení Φ(x, y) = y − F (x, y). Rovnice F (x, y) = 0 C je ekvivalentní rovnici y = Φ(x, y). Navíc platí b = Φ(a, b), funkce Φ(x, y) je spojitá v jistém okolí bodu (a, b), parciální derivace Φ,y (x, y) existuje v jistém okolí tohoto bodu a Φ,y (a, b) = 0. Nechť je dáno x. Později ukážeme, jaké podmínky musí toto x splňovat. Sestrojme posloupnost y0 = b, y1 = Φ(x, y0 ), y2 = Φ(x, y1 ), . . . , yn+1 = Φ(x, yn ), . . . . Jestliže existuje parciální derivace Φ,y (x, y) na úsečce, která spojuje bodu (x, yn ) a (x, yn−1 ), existuje podle Lagrangeově věty o střední hodnotě η takové, že bod (x, η) leží na této úsečce a platí ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯yn+1 − yn ¯ = ¯Φ(x, yn ) − Φ(x, yn−1 )¯ = ¯Φ,y (x, η)¯ · ¯yn − yn−1 ¯ . ¯ ¯ Bod x musíme volit tak, aby bylo zaručeno, že pro každé n takové η existuje a aby ¯Φ,y (x, η)¯ < 1. Pak je pro takové x zobrazení Φ(x, y) kontrahující v proměnné y. Protože je funkce Φ,y (x, y) spojitá v bodě (a, b) a Φ,y (a, b) = 0, existuje ∆ > 0 takové, že pro ¯ ¯ 1 každé (x, y) ∈ (a − ∆, a + ∆) × (b − ∆, b + ∆) je ¯Φ,y (x, y)¯ < . Protože je funkce Φ(x, y) v jistém 2 okolí bodu (a, b) spojitá a Φ(a, b) = b, existuje δ, 0 < δ < ∆ takové, že pro každé x ∈ (a − δ, a + δ) ¯ ¯ ¯ ¯ ¯ ∆ 1¯ je ¯Φ(x, b) − b¯ < . Pak pro každé x ∈ Uδ (a) platí ¯yn+1 − yn ¯ < ¯yn − yn−1 ¯. Z toho plyne, že 4 2 ¯ ¯ ¯ ¯ 1 ¯¯ ∆ 1 ¯¯ ¯ ¯ ¯ ¯ pro každé n je yn+1 − yn < n y1 − y0 = n Φ(x, b) − b < n+2 . Pro každé n ∈ N tedy platí 2 2 2 nerovnost n n ∞ ¯ ¯ X¯ ¯ X −r ¯ ¯ X ∆ ¯yn+1 − y0 ¯ ≤ ¯yr+1 − yr ¯ < ¯ ¯ . 2 y1 − y0 < 2−(r+2) ∆ = 2 r=0 r=0 r=0 Z toho ale plyne, že pro všechna x ∈ (a − δ, a + δ) leží celá posloupnost yn¯v intervalu (b − ∆, b + ¯∆). Tedy pro každé takové x a n ∈ N existuje η ∈ (yn+1 , yn ) takové, že ¯Φ(x, yn+1 ) − Φ(x, yn )¯ = ¯ ¯ ¯Φ,y (x, η)¯ < 1 . Protože pro každé m > n je 2 ∞ X X ¯ ¯ m−1 ¯ym − yn ¯ ≤ 2−r−2 ∆ = 2−n−1 ∆ , 2−r−2 ∆ < r=n
r=n
¿
À ¡ ¢ ∆ ∆ je posloupnost yn Cauchyovská. Existuje tedy lim yn = y ∈ b − , b + ⊂ b − ∆, b + ∆ . n→∞ 2 2 Protože je funkce Φ(x, y) spojitá, je y = lim yn+1 = lim Φ(x, yn ) = Φ(x, y). Tedy toto y je pro n→∞
n→∞
34
¡ ¢ pevné x řešením rovnice y = Φ(x, y). Jestliže je z ∈ b − ∆, b + ∆ druhé řešení této rovnice, je ¯ ¯ ¯ ¯ ¯ ¯ ¯y − z ¯ = ¯Φ(x, y) − Φ(x, z)¯ < 1 ¯y − z ¯, neboli y = z. Tedy pro každé x ∈ (a − δ, a + δ) existuje ¡ ¢2 právě jedno y ∈ b − ∆, b + ∆ takové, že y = Φ(x, y), čili F (x, y) = 0. Proto existuje funkce f : (a − δ, a + δ) → (b − ∆, b + ∆) definovaná předpisem y = f (x), kde y je právě nalezené řešení rovnice F (x, y) = 0. Ukážeme, že právě sestrojená funkce y¡= f (x) je ¢ na intervalu x ∈ (a − δ, a + δ) spojitá. Protože y0 (x) = b je spojitá funkce a yn+1 (x) = Φ x, yn (x) plyne z předpokladu, že yn (x) je spojitá funkce, že funkce yn+1 (x) je také spojitá, protože Φ(x, y) je spojitá. Indukcí lze ukázat, že všechny funkce yn (x) jsou na intervalu (a − δ, a + δ) spojité. Podle definice je y(x) = lim yn (x). Ale z nerovnosti n→∞ ¯ ¯ ¯y(x) − yn (x)¯ < 2−n ∆ plyne, že posloupnost funkcí yn (x) konverguje k funkci y(x) na intervalu (a − δ, a + δ) stejnoměrně. Proto je funkce y = f (x) na intervalu (a − δ, a + δ) spojitá. Předpokládejme navíc, že funkce F (x, y) má diferenciál prvního řádu. Ukážeme, že funkce y = f (x) má diferenciál prvního řádu. Protože má funkce F (x, y) diferenciál prvního řádu, platí ¡ ¢ F (x + h, y + k) − F (x, y) = F,x (x, y)h + F,y (x, y)k + |h| + |k| η(x, y; h, k) , kde
¡ ¢ ¡ η(x, y; h, k) = 0. Nechť je y(x + h) − y(x) = k(h). Pak je F x, y(x) = F x + h, y(x) +
lim
(h,k)→(0,0) ¢ k(h) = 0, a tedy platí
¯ ¯ ¡ ¡ ¢ ¡ ¢ ¢ F,x x, y(x) h + F,y x, y(x) · k(h) + ¯h + k(h)¯η x, y(x); h, k(h) = 0 , neboli ³ ¡ ³ ¡ ¢ ¡ ¢´ ¢ ¡ ¢´ k(h) F,y x, y(x) ± η x, y(x); h, k(h = −h F,x x, y(x) ± η x, y(x); h, k(h . ¡ ¢ Protože lim k(h) = 0 a F,y (x, y) 6= 0, existuje okolí bodu x, y(x) takové, že na tomto okolí je h→0 ¡ ¢ ¡ ¢ F,y x, y(x) ± η x, y(x); h, k(h) 6= 0. Na tomto okolí platí ³ ¡ ¢ ¡ ¢´ h ¡ ¢ F,x x, y(x) ± η x, y(x); h, k(h) = F,y x, y(x) ± η x, y(x); h, k(h) ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ F,x x, y(x) F,x x, y(x) ± F,y x, y(x) ¡ ¢ ³ =− h± ¡ ¢ ¡ ¢ ¡ ¢´ η x, y(x); h, k(h) h . F,y x, y(x) F,y x, y(x) · F,y x, y(x) ± η x, y(x); h, k(h)
k(h) = −
¡
¢
A protože lim k(h) = 0 a h→0
lim
(h,k)→(0,0)
η(x, y; h, k) = 0, je ¡ ¢ F,x x, y(x) ¢ dx . dy(x) = − ¡ F,y x, y(x)
(1)
Tedy pro x ∈ (a − δ, a + δ) existuje derivace ¡ ¢ F,x x, y(x) ¢. y (x) = − ¡ F,y x, y(x) 0
(1a)
Navíc jsou-li obě parciální derivace funkce F (x, y) spojité, je tato derivace spojitá v jistém okolí bodu x = a. Má-li funkce F (x, y) na nějakém okolí bodu (a, b) diferenciál n–tého řádu, je z (1) vidět, že v okolí bodu x = a má implicitně definovaná funkce y = y(x) také diferenciál n–tého řádu a jestliže jsou na jistém okolí bodu (a, b) všechny parciální derivace funkce F (x, y) až do řádu n včetně spojité, má funkce y = y(x) na jistém okolí bodu x = a spojité všechny derivace až do řádu n. Pro obecné r a s platí 35
Věta 1. (o implicitních funkcích) a, b ) = (a1 , . . . , ar , b1 , . . . , bs ). Nechť jsou funkce Nechť jsou r a s přirozená čísla a nechť je α = (a x, y ) = Fk (x1 , . . . , xr , y1 , . . . , ys ), k = 1, 2, . . . , s, spojité v jistém okolí bodu α a mají v tomto Fk (x ∂Fk okolí všechny parciální derivace prvního řádu , které jsou spojité spojité v bodě α . Nechť platí: ∂yi a, b ) = Fk (a1 , . . . , ar , b1 , . . . , bs ) = 0 Fk (a µ ¶ ∂Fk ¡ ¢ det a , b 6= 0 . ∂yi
pro k = 1, 2, . . . , s
(2) (3)
© Pak existují δ >ª 0 a ∆ > 0 taková, že ke každému x = (x1 ,©. . . , xr ) ∈ J, kde J = x ; |xi −ªai | < δ, i = 1, 2, . . . , r , existuje právě jeden bod y ∈ K, kde K = y ; |yk − bk | < ∆, k = 1, 2, . . . , s , pro x, y ) = Fk (x1 , . . . , xr , y1 , . . . , ys ) = 0 pro všechna k = 1, 2, . . . , s. který platí Fk (x Souřadnice yk tohoto bodu definují funkce ¡ ¢ yk = ϕk x1 , x2 , . . . , xr
k = 1, 2 . . . , s .
(4)
Tyto funkce ϕ1 , ϕ2 , . . . , ϕs jsou spojité na intervalu J. x, y ), k = 1, 2, . . . , s, mají diferenciál n–tého řádu na množině J × K, mají Jestliže funkce Fk (x x), k = 1, 2, . . . , s na množině J diferenciál n–tého řádu. funkce yk = ϕk (x x, y ) ∈ Cn (J × K), pak jsou funkce yk = Jestliže jsou pro všechna k = 1, 2, . . . , s funkce Fk (x ϕk (x1 , . . . , xr ) ∈ Cn (J) pro všechna k = 1, 2, . . . , s. Důkaz: Důkaz této věty v obecném případě je velmi podobný důkazu případu r = s = 1, který jsme uvedli dříve. x, y ) = 0 Nejprve se pomocí věty o kontrahujícím zobrazení dokáže existence a jednoznačnost řešení soustavy rovnic Fk (x a, b ). To definuje funkce yk = ϕk (x x) a nakonec se dokáže, že tyto funkce mají za uvedených předpokladů v okolí bodu (a požadované vlastnosti. ∂Fk x, y ) matice C(x x, y ) s prvky cki (x x, y ) = x, y ) je v bodě α = (a a, b ) Protože předpokládáme, že determinant C(x (x ∂yi a nenulový a všechny parciální derivace prvního řádu podle y k jsou spojité v jistém okolí bodu (a , b), proměnných x, y ) 6= 0. existuje ∆1 > 0 takové, že pro všechna x a y , pro která je xi − ai < ∆1 a yk − bk < ∆1 je determinant C(x x, y ) inverzní matici C−1 (x x, y ), jejíž prvky v bodě (a a, b) označíme Cki . Na této množině tedy existuje k matici C(x Uvažujme s funkcí s X x, y ) = yk − x, y ) , k = 1, 2, . . . , s . Ψk (x Cki Fi (x i=1
x, y ) = 0 je ekvivalentní se soustavou yk = Ψk (x x, y ). V bodě (a a, b ) navíc pro každé Je zřejmé, že soustava rovnic Fk (x ∂Ψk a, b ) a pro každé i, k = 1, 2, . . . , s je a, b ) = 0. Protože parciální derivace k = 1, 2, . . . , s platí bk = Ψk (a (a ∂yi x, y ) jsou v bodě α spojité, existuje ∆ > 0, ∆ < ∆1 takové, že pro každé (x x, y ), pro které je xi − ai < ∆ a Fk,yi (x ∂Fk 1 yk − bb < ∆, i = 1, 2, . . . , r, k = 1, 2, . . . , s, platí nerovnost x, y ) < x, y ) na . Ze spojitosti funkcí Fk (x ∂y (x 2s i a, b ) plyne, že existuje δ > 0, δ < ∆, takové, že pro každé x , pro které je xi − ai < δ, i = 1, 2, . . . , r, okolí bodu (a 1 x, b ) − bk = Ψk (x x, b ) − Ψk (a a, b ) < ∆. Z věty 4.10 pak plyne pro platí pro každé k = 1, 2 . . . , s nerovnost Ψk (x 4 každé x ∈ J a y , z ∈ K existuje η ∈ K, pro které platí s s ∂Ψk X X ∂Ψk Ψk (x yi − zi < x, y − Ψk (x x , z ) = x, η ) · yi − zi ≤ x (x (x , η ) ∂y ∂y i i i=1 i=1 <
s 1 X 1 1 y, z ) , yi − zi < max |yi − zi | = ρ(y 2s i=1 2 2
k = 1, 2, . . . , s ,
y , z ) = max |yk − zk | je metrika v Rs . kde ρ(y Pro každé x ∈ J sestrojme posloupnost y (n) takto: y (0) = b , y (1) = Ψ x , y (0) , . . . , y (n+1) = Ψ x , y (n) , . . . . 1 (1) (0) x, b ) − bk ≤ ρ y (1) , b < ∆ plyne, že Ukážeme, že pro každé n ∈ N je y (n) ∈ K. Z nerovnosti yk − yk = Ψk (x 4 y (1) ∈ K. Nechť pro každé r = 0, 1, . . . , n je y (r) ∈ K. Pak je (r+1) 1 (r) y − yk = Ψk x , y (r) − Ψk x , y (r−1) < ρ y (r) , y (r−1) . k 2 36
(r+1) Indukcí se snadno ukáže, že v tomto případě pro všechna r = 1, 2, . . . , n a k = 1, 2, . . . , s platí nerovnost yk − (r) y < 2−r ρ y (1) , y (0) < 2−r−2 ∆. Ale pak je k
n n ∞ X X X (n+1) (r+1) 1 (0) (n) y y − yk ≤ − yk < 2−r−2 ∆ < 2−r−2 ∆ = ∆ . k k 2 r=0 r=0 r=0
Tedy y (n) ∈ K pro každé n ∈ N. Podobně pro každé m > n dostaneme nerovnost m−1 m−1 ∞ X (r+1) X X (m) (n) (r) y y − yk ≤ − yk < 2−r−2 ∆ < 2−r−2 ∆ = 2−n−1 ∆ . k k r=n
r=n
(5)
r=n
Ze vztahu (5) plyne, že posloupnost y (n) je Cauchyovská, a protože je prostor Rs úplný, existuje lim y (n) = y . Z n→∞ (n) 1 (n+1) x, y ) spojité na J × K a yk nerovnosti yk − bk < ∆ vyplývá, že y ∈ K. Protože jsou funkce Ψk (x = Ψk x , y (n) 2 (n+1) x, y ), a tedy pro každé x ∈ J existuje y ∈ K takové, že yk = Ψk (x x, y ). je lim yk = yk = Ψk (x n→∞
x, z ). Pak ale musí platit Nechť je z ∈ K jiné řešení soustavy zk = Ψk (x
1 1 yk − zk = Ψk (x x, y ) − Ψk (x x, z ) < ρ(y y , z ) = max yk − zk . 2 2 x, y ) Ale z toho plyne max |y1 −z1 |, |y2 −z2 |, . . . , |ys −zs | = 0, tj. yk = zk . Tedy řešení y ∈ K soustavy rovnic yk = Ψk (x je pro každé x ∈ J jediné. x). Pro takto definované funkce platí Přiřazení x 7→ y definuje zobrazení ϕ : J → K, jehož složky jsou yk = ϕk (x x) = Ψk x , ϕ (x x) neboli Fk x , ϕ (x x) = 0 pro k = 1, 2, . . . , s. ϕk (x x) jsou pro všechna k spojité. Tyto funkce jsou podle definice limitou posloupnosti Ukážeme, že funkce yk = ϕk (x (n+1) (0) x) = Ψk x , y (n) . Protože yk (x x) = bk je spojitá funkce a funkce Ψk (x x, y ) jsou spojité na intervalu funkcí yk (x (n)
x) spojité na J pro každé n ∈ N. Z nerovnosti (5) plyne, že pro každé k konverguje posloupnost J ×K, jsou funkce yk (x (n) x) yk (x
x) stejnoměrně na intervalu J. Z toho plyne, že funkce yk = ϕk (x x) jsou na intervalu funkcí k funkci yk = ϕk (x J spojité. x, y ) mají na intervalu J × K diferenciál prvního řádu. To znamená, že pro Nyní předpokládejme, že funkce Fk (x x, y ) ∈ J × K platí každé k = 1, 2, . . . , s a (x ! r s r s X X X X ∂Fk ∂Fk hi + q` ηk (x x + h , y + q ) − Fk (x x, y ) = x, y )hi + x, y )q` + x, y , h , q ) , Fk (x (x (x (6) ∂xi ∂y` i=1 i=1 `=1 `=1 kde
lim
h,q q )→(0,0) (h
x, y , h , q ) = 0. Nechť x a x + h jsou z intervalu J. Označme ϕk (x x + h ) − ϕk (x x) = qk (h h). Pak z (6) ηk (x
dostaneme x + h − Fk x , ϕ (x x) = Fk x + h , ϕ (x s r X X ∂Fk ∂Fk x) hi + x) q` (h h) + x , ϕ (x x , ϕ (x = ∂x ∂y i ` i=1 `=1
! s r X X q` (h hi + h) ηk x , y , h , q (h h) . i=1
`=1
Protože je levá strana této rovnice rovna nule, plyne z ní s X ∂Fk `=1
∂y`
s X ∂Fk x) + ²` ηk h , q (h h) q` (h h) = − x) + ²i ηk h , q (h h) hi , x , ϕ (x x , ϕ (x ∂xi i=1
x, h ) matici s elementy Yk,` = kde ²k = ±1. Označme Y(x
∂Fk x) + ²` ηk h , q (h h) a X(x x, h ) matici s prvky x , ϕ (x ∂y`
∂Fk h) . Výše uvedenou soustavu rovnic pro q` (h h) lze pak zapsat ve tvaru Y(x x, h ) ·qq (h h) = x) + ²i ηk h , q (h x , ϕ (x ∂xi h) = 0, existuje okolí bodu (a a, b ), na kterém je det Y(x x, h ) 6= 0. x, h )·h h. Ale protože det Y(a a, 0) 6= 0 a lim ηk h , q (h −X(x
Xki =
h →0
x, h ). Z toho ale dostaneme q (h h) = −Y −1 (x x, h )X(x x, h )h h. Tedy V tomto okolí existuje tedy inverzní matice Y −1 (x h) = ϕ (x x + h ) − ϕ (x x) = −Y −1 (x x, 0 )X(x x, 0 )h h − Y −1 (x x, 0 )X(x x, 0 ) − Y −1 (x x, h )X(x x, h ) h . q (h x, 0 )X(x x, 0 ) − Y −1 (x x, h )X(x x, h ) = 0. To ale znamená, že funkce yk = ϕk (x x) mají v bodě x ∈ J Ale lim Y −1 (x h →0
diferenciál prvního řádu, který splňuje rovnici r s X X ∂Fk ∂Fk x) dxi + x) dy` = 0 x , y (x x , y (x ∂x ∂x i ` i=1 `=1
37
(7)
neboli dyk = −
s X r X
Y −1
k`
X`,i dxi .
(7a)
`=1 i=1
x, y ) mají na intervalu J × K spojité parciální derivace, je z (7) a (7a) snadno Jestliže předpokládáme, že funkce Fk (x ∂yk x) jsou spojité v intervalu J. vidět, že parciální derivace (x ∂xi x, y ) mají diferenciál n–tého řádu, lze indukcí ukázat, že diferenciály Jestliže budeme předpokládat, že funkce Fk (x x) se dají vyjádřit pomocí součtů, součinů a podílů parciálních derivací řádu p, p = 1, 2, . . . , n − 1, funkcí yk = ϕk (x x, y ) do řádu p. Přitom ve jmenovateli jsou pouze mocniny determinantu matice Y(x x, y ), který je nenulový. funkcí Fk (x x). Tedy podle věty 4.3 o diferenciálu součtu, součinu a podílu funkcí, existuje diferenciál n–tého řádu funkcí yk = ϕk (x x, y ) mají na množině J × K spojité všechny parciální derivace až do řádu n včetně, Když předpokládáme, že Fk (x x) mají na intervalu J spojité všechny parciální derivace zjistíme podobným způsobem, že všechny funkce yk = ϕk (x až do řádu n. ¤
V praxi se věty o implicitních funkcí používá tak, že se nejprve ověří její předpoklady. Pak najdeme x, y ) a z rovnic první diferenciál funkcí Fk (x x, y ) = dFk (x
r s X X ¢ ¢ ∂Fk ¡ ∂Fk ¡ x) dxi + x) dy` = 0 x , y (x x , y (x ∂x ∂y i ` i=1
(8)
`=1
x, y ), kde determinant najdeme dyk . Řešení této soustavy existuje v bodech (x µ x, y ) = det D(x
Protože dyk =
r X ∂yk i=1
∂xi
∂Fk ∂y`
¶
¡ ¢ D F1 , F2 , . . . , Fs ¡ ¢ x, y ) = x, y ) 6= 0 . (x (x D y1 , y2 , . . . , ys
(9)
dxi , lze velmi snadno najít z prvního diferenciálu funkcí yk jejich první
parciální derivace. x), resp. druhé parciální derivace těchto funkcí, difeAbychom našli druhý diferenciál funkcí yk (x rencujeme rovnici (8). Tím dostaneme (pro jednoduchost vynecháváme označení bodu, v němž se počítají parciální derivace) d2 F =
r r X s s s X X X X ∂ 2 Fk ∂ 2 Fk ∂ 2 Fk ∂Fk 2 dxi dxj +2 dxi dym + dym dyn + d y` = 0 . ∂x ∂x ∂x ∂y ∂y ∂y ∂y` i j i m m n m,n=1 i,j=1 i=1 m=1 `=1
(10) Protože z (8) již známe dym , je soustava (10) soustavou lineárních rovnic pro d2 y` . Všimněte si, že koeficienty u d2 y` v (10) jsou stejné jako koeficienty u dy` v soustavě (9). Abychom tedy našli ∂Fk ze soustavy (10) druhé diferenciály d2 y` stačí znát inverzní matici k matici Y s prvky Yk` = . ∂y` Ale tu jsme vlastně našli při řešení soustavy (8). Jestliže jsme našli druhé diferenciály d2 y` , snadno najdeme všechny druhé parciální derivace funkcí yk , protože d2 yk =
r X
∂ 2 yk dxi dxj . ∂xi ∂xj i,j=1
(11)
Postup při výpočtu diferenciálů a parciálních derivací vyšších řádů je podobný. Příklad 1. Najděte všechny první a druhé parciální derivace funkcí u(x, y) a v(x, y), které jsou definovány soustavou rovnic u2 − v 2 x − 2uvy = 1 , 2uvx + u2 − v 2 y = 0 v okolí bodu x0 , y0 , u0 , v0 = [1, 0, −1, 0]. Řešení: Obě funkce F1 (x, y, u, v) = u2 − v 2 x − 2uvy − 1 a F2 (x, y, u, v) = 2uvx + u2 − v 2 y mají spojité derivace 4 všech řádů v celém R . Dále platí F1 (1, 0, −1, 0) = F2 (1, 0, −1, 0) = 0 a D(1, 0, −1, 0) = 4 6= 0. Proto tyto funkce implicitně definují v jistém okolí bodu [x, y] = [1, 0] spojité funkce u = u(x, y) a v = v(x, y) takové, že u(1, 0) = −1 a v(1, 0) = 0. Tyto funkce mají v okolí bodu [x, y] = [1, 0] spojité parciální derivace všech řádů. V principu bychom mohli ze soustavy rovnic F1 (x, y, u, v) = F2 (x, y, u, v) = 0 určit explicitně příslušné funkce u = u(x, y) a v = v(x, y) 38
a pak najít jejich derivace. Ale tento postup není nutný. Derivace těchto funkcí lze najít, aniž bychom znali funkce u(x, y) a v(x, y). Pro první diferenciál funkcí F1 a F2 je dF1 = u2 − v 2 dx − 2uvdy + 2(ux − vy)du − 2(vx + uy)dv = 0 , dF2 = 2uvdx + u2 − v 2 dy + 2(vx + uy)du + 2(ux − vy)dv = 0 .
(12)
Tedy v bodě [x, y, u, v] = [1, 0, −1, 0] je dx − 2du = 0 ,
dy − 2dv = 0 ⇒ du =
1 dx , 2
dv =
1 dy . 2
∂u ∂v 1 ∂u ∂v (1, 0) = (1, 0) = a (1, 0) = (1, 0) = 0. ∂x ∂y 2 ∂y ∂x Druhé diferenciály najdeme diferencováním (12). To dává
Tedy
d2 F1 = 4udxdu − 4vdxdv − 4vdydu − 4udydv + 2xdu2 − 4ydudv − 2xdv 2 + 2(ux − vy)d2 u − 2(vx + uy)d2 v = 0 , d2 F2 = 4vdxdu + 4udxdv + 4ududy − 4vdydv + 2ydu2 + 4xdudv − 2ydv 2 + 2(vx + uy)d2 u + 2(ux − vy)d2 v = 0 , kde jsme označili, jak je zvykem du2 = (du)2 atd. Poznamenejme, že jeto v diferenciálním počtu obvyklá konvence. Naopak chceme-li psát diferenciál funkce u2 , používáme značení d u2 . Jestliže do těchto rovnic dosadíme známe 1 1 hodnoty x = 1, y = v = 0, u = −1, du = dx a dv = dy, dostaneme 2 2 3 3 − dx2 + dy 2 − 2d2 u = 0 , 2 2
−3dxdy − 2d2 v = 0 ⇒ d2 u =
3 −dx2 + dy 2 , 4
3 d2 v = − dxdy . 2
3 Z těchto vztahů plyne, že nenulové druhé parciální derivace jsou uxx (1, 0) = −uyy (1, 0) = vxy (1, 0) = − . 4 a, b), má v okolí tohoto bodu diferenciál prvního Příklad 2. Nechť je funkce F x1 , x2 , . . . , xn , y spojitá okolí bodu (a a, b) 6= 0. Pak rovnice F (x x, y) = F (a a, b) = C definuje v okolí bodu a implicitně funkci y = f (x x), pro řádu a F,y (a a) = b. Tato funkce má v okolí bodu a diferenciál prvního řádu, a tedy ke grafu této funkce existuje kterou je f (a n X ∂f a, b) tečná rovina. Ta má rovnici y − b = a) · xi − ai . Ale pro derivace f,i (a a) platí podle věty o v bodě (a (a ∂x i i=1 F,i a, b). Jestliže dosadíme do rovnice tečné roviny, dostaneme po vynásobení F,y (a a, b) a) = − (a implicitních funkcí f,i (a Fy n X a, b) · xi − ai + F,y (a a, b) · (y − b) = 0. Ale v tomto tvaru nehraje speciální volba rovnici tečné roviny ve tvaru F,i (a i=1 proměnné y žádnou význačnou roli. Obecně je-li funkce F x1 , x2 , . . . , xn spojitá v okolí bodu a , má v okolí tohoto n X
F,i (a a) = a) 6= 0, definuje rovnice F (x x) = F (a a) jistou plochu v Rn . bodu diferenciál prvního řádu a grad F (a i=1
Rovnice tečné roviny k této ploše v bodě a má rovnici
n X
a) · xi − ai = 0 neboli grad F (a a) · (x x − a ) = 0. Tedy F,i (a
i=1
a) je kolmý k tečné rovině k této ploše v bodě a a má tedy směr normálového vektoru. vektor grad F (a
Regulární zobrazení Nechť je f : M → Rn zobrazení otevřené ¡množiny M ⊂¢Rn do Rn . Obraz bodu x ∈ M budeme x) nebo ve složkách yk = fk x1 , x2 , . . . , xn , kde k = 1, 2, . . . , n. psát jako y = f (x Definice 1. Nechť je M ⊂ Rn otevřená množina a f : M → Rn . Řekneme, že zobrazení f je x) mají na M spojité všechny parciální regulární zobrazení množiny M , jestliže všechny funkce fk (x derivace prvního řádu a pro každé x ∈ M je ∂f1 ∂f1 ∂f1 ... ∂x1 ∂x2 ∂xn ¡ ¢ ∂f2 ∂f2 ∂f2 D f 1 , f 2 , . . . , fn . . . ¢ (x x) = ¡ x) 6= 0 . (x det ∂x ∂xn 1 ∂x2 D x1 , x2 , . . . , xn ...................... ∂f ∂fn ∂fn n ... ∂x1 ∂x2 ∂xn
39
Matice
∂f1 ∂f1 ∂f1 ... ∂x1 ∂x2 ∂xn ∂f2 ∂f2 ∂f2 ... x) = ∂x x) f 0 (x (x ∂xn 1 ∂x2 ...................... ∂f ∂fn ∂fn n ... ∂x1 ∂x2 ∂xn ¡ ¢ ¡ 0¢ D f 1 , f 2 , . . . , fn ¢ (x x) = ¡ x) nazýváme Jacobiho se nazývá Jacobiho matice a její determinant det f (x D x1 , x2 , . . . , xn determinant neboli jakobián zobrazení f . Nejprve dokážeme jednu užitečnou větu o jakobiánu složeného zobrazení Věta 2. Nechť M a N jsou otevřené podmnožiny Rn a f : M → N a g : N → Rn jsou zobrazení, jejichž složky mají spojité všechny parciální derivace prvního řádu na M , resp. na N . Pak pro jakobián složeného zobrazení h = g ◦ f : M → Rn platí ¡ ¢ ¡ ¢ ¡ ¢ ¢ D f1 , f2 , . . . , fn D h1 , h 2 , . . . , h n D g1 , g2 , . . . , gn ¡ ¢ (x ¢ f (x ¢ (x x) = x) · x) . (13) D(x1 , x2 , . . . , xn D(y1 , y2 , . . . , yn D(x1 , x2 , . . . , xn x), resp. g (y y ), mají na množině M , resp. N , spojité parciální derivace prvního řádu, má i Důkaz: Protože zobrazení f (x složené zobrazení h spojité parciální derivace prvního řádu na množině M . Podle věty o parciálních derivacích složené funkce platí n X ∂fr ∂hk ∂gk x) = x) · x) . (x f (x (x ∂xi ∂y ∂xk r r=1 Pomocí Jacobiho matic zobrazení f , g a h lze tento vztah zapsat ve tvaru x) = g 0 f (x x) · f 0 (x x) , h0 (x kde vpravo je násobení matic. Tvrzení věty pak plyne z věty o determinantu součinu matic.
¤
Důsledek. Nechť jsou f : M → Rn a g : N → Rn regulární zobrazení a f (M ) ⊂ N . Pak je složené zobrazení h = g ◦ f : M → Rn regulární. Důkaz: Podle věty o derivaci složeného zobrazení mají všechny složky zobrazení h spojité na M všechny parciální derivace prvního řádu. Z věty 2 plyne, že jakobián zobrazení h je roven součinu jakobiánů zobrazení f a g , a tedy různý od nuly. ¤
Pro regulární zobrazení platí následující velmi důležitá věta. Věta 3. Nechť je f regulární zobrazení otevřené množiny M ⊂ Rn . Pak platí: ¯ (1) Ke každému bodu a ∈ M existuje okolí N bodu a takové, že zúžené zobrazení f ¯N je prosté. (2) Je-li A ⊂ M otevřená množina, je f (A) otevřená množina v Rn . (3) Je-li f prosté regulární zobrazení, pak inverzní zobrazení ϕ : f (M ) → M je také regulární. Poznámka: Jak je známo, je zobrazení F : M → N z metrického prostoru M do metrického prostoru N spojité právě tehdy, když je vzor každé otevřené podmnožiny B ⊂ N otevřená podmnožina M , tedy když pro každou otevřenou množinu B ⊂ N je F(−1) (B) otevřená podmnožina M . Ve větě se naopak tvrdí, že obraz každé otevřené množiny A ⊂ M je otevřená množina. a). Zapišme rovnice y = f (x x) ve tvaru Fk (x x, y ) = fk (x x) − yk = 0. Z těchto Důkaz: Nechť a ∈ M . Položíme b = f (a rovnic budeme chtít najít x jako funkce y . Ale pro tyto funkce jsou splněny všechny předpoklady věty o implicitních funkcích. (Oproti větě 1 je zaměněna role x a y ). Z ní plyne, že existují otevřené intervaly K ⊂ M a J, a ∈ K a b ∈ J, x). Toto zobrazení takové, že pro každé y ∈ J existuje právě jeden bod x ∈ K takový, že jsou splněny rovnice y = f (x y ). Tedy platí budeme značit ϕ (y y) , x = ϕ (y
resp. xk = ϕk y1 , y2 , . . . , yn ,
k = 1, 2, . . . , n .
(14)
y ) spojité v J a mají tam spojité parciální derivace prvního řádu. Pro každé k jsou funkce ϕk (y Abychom ukázali, že pro každou otevřenou množinu A ⊂ M je množina f (A) otevřená, musíme ukázat, že každý a) pro nějaké a ∈ A existuje okolí V bodu b takové, bod b ∈ f (A) je vnitřním bodem této množiny. Tedy když b = f (a x). V první části důkazu jsme ukázali, že existují okolí J a že pro každé y ∈ V existuje x ∈ A takové, že y = f (x K ⊂ M , takové, že pro každé y ∈ J existuje x ∈ M takové, že x ∈ K. Toto zobrazení je dáno vztahem (14), kde 40
y ) jsou spojité funkce na K. Ale protože je množina A otevřená, existuje pro každé a okolí U bodu a takové, že ϕk (y y ) spojité v bodě b existuje ke každému okolí Uε (a a) bodu a okolí Uδ (bb) takové, U ⊂ A. Tedy protože jsou funkce ϕk (y y ) ∈ Uε (a a). Nyní stačí zvolit ε > 0 tak, aby Uε (a a) ⊂ A. že pro každé y ∈ Uδ (bb) je ϕ (y x) prosté, existuje k němu inverzní zobrazení ϕ b : f (M ) → M . Ale protože je inverzní zobrazení Je-li zobrazení f (x b (y y ) = ϕ (y y ), kde ϕ je definováno vztahem (14). Jak jsme ukázali, jediné, musí v okolí každého bodu y ∈ F (M ) platit ϕ y ) spojité všechny parciální derivace prvního řádu v okolí každého bodu y . Stačí tedy ukázat, že mají funkce ϕk (y jakobián tohoto inverzního zobrazení není v žádném bodě y ∈ f (M ) roven nule. Ale protože pro každé x ∈ M platí D(f1 , f2 , . . . , fn ) D(ϕ1 , ϕ2 , . . . , ϕn ) x) = x platí podle věty 2 rovnost x) · x) = 1, a tedy jakobián zobrazení ϕ ◦ff (x y (x (x D(y1 , y2 , . . . , yn ) D(x1 , x2 , . . . , xn ) y ) je nenulový. ¤ ϕ (y Příklad 3. (polární souřadnice v rovině) Uvažujme zobrazení f : M → R2 definované rovnicemi x = r cos ϕ , y = r sin ϕ , M = (r, ϕ) ∈ R2 ; r > 0 , ϕ ∈ (−π, π) . (15) Pro toto zobrazení je f (M ) = R2 \ (x, 0) ; x ≤ 0 a zobrazení je prosté. Jeho Jacobiho matice a jakobián J(r, ϕ) jsou cos ϕ −r sin ϕ f0 = , J(r, ϕ) = r . sin ϕ r cos ϕ Tedy všechny parciální derivace prvního řádu jsou spojité na celém M a jakobián je na množině M nenulový. Tedy (15) je regulární zobrazení. Z rovnic (15) plyne, že inverzní zobrazení je p x ϕ(x, y) = sgn(y) · arccos p . r = x2 + y 2 , x2 + y 2 Podle věty 3 je toto zobrazení regulární na f (M ). Jeho Jacobiho matice je inverzní k matici původního zobrazení a jakobián je J −1 . Jestliže interpretujeme (x, y) jako souřadnice bodu v R2 nazývají se (r, ϕ) polární souřadnice. Geometricky je r rovno vzdálenosti bodu [x; y] od počátku souřadnic a ϕ je úhel, který svírá rádius–vektor r = (x, y) s kladným směrem osy Ox. Křivky dané rovnicí r = a = konst. > 0 jsou kružnice s poloměrem a bez bodu [a; 0] a křivky, pro které je ϕ = α = konst. jsou polopřímky jsoucí z počátku, které mají směrnici k = tg α. 3 Příklad 4. V tomto příkladu zobecníme polární souřadnice zavedené v příkladu 3. Definujme zobrazení f : M → R , kde M = (r, ϕ, ζ) ; r > 0 , ϕ ∈ (0, 2π) , ζ ∈ R definované složkami x = r cos ϕ ,
y = r sin ϕ , z = ζ . (16) Zobrazení je prosté a obraz množiny M je f (M ) = R3 \ (x, 0, z) ; x ≥ 0 , z ∈ R . Zobrazení f je regulární a jeho jakobián je J(r, ϕ, ζ) = r > 0. Protože plochy r = a jsou rotační válce s osou Oz a poloměrem a, nazývají se (r, ϕ, ζ) válcové (cylindrické) souřadnice. Proměnné r a ζ leží v polorovině r > 0. Jestliže definujeme ještě jedno regulární zobrazení g dané rovnicemi π π r = ρ cos θ , ζ = ρ sin θ , ϕ = ϕ , ρ > 0 , ϕ ∈ (0, 2π) , θ ∈ − , , 2 2 je složené zobrazení h = f ◦ g opět regulární zobrazení h : N → R3 , které je v souřadnicích definováno vztahy x = ρ cos θ cos ϕ ,
y = ρ cos θ sin ϕ , z = ρ sin θ . (17) 3 Toto zobrazení zobrazuje množinu N prostě na množinu R \ (x, 0, z) ; x ≥ 0 . Jakobián tohoto zobrazení je podle věty 2 roven součinu jakobiánů zobrazení f a g , tedy J = rρ = ρ2 cos θ. Protože plochy s rovnicí ρ = a > 0 jsou v souřadnicích (x, y, z) ∈ R3 dány rovnicí x2 + y 2 + z 2 = a2 , a tedy kulové plochy s poloměrem a, nazýváme souřadnice (ρ, ϕ, θ) ∈ N sférické souřadnice bodu (x, y, z). Příklad 5. V postupu uvedeném v příkladu 4 lze dále pokračovat. Jestliže je bod x = (x1 , x2 , x3 , x4 ) ∈ R4 , lze zavést místo prvních tří souřadnic sférické souřadnice (r, ϕ, θ1 ) podobně jako v (17) a čtvrtou souřadnici označit novou proměnnou x4 = z. Pakje r > 0 a z ∈ R. Pro souřadnice r a z pak použijeme polární souřadnice r = ρ cos θ2 , π π z = ρ sin θ2 , kde ρ > 0 a θ2 ∈ − , . Takto dostaneme zobrazení 2 2 x1 = ρ cos θ2 cos θ1 cos ϕ , x2 = ρ cos θ2 cos θ1 sin ϕ , x3 = ρ cos θ2 sin θ1 , x4 = ρ sin θ2 , π π . Toto zobrazení je opět regulární a jeho jakobián je J4 = r2 cos θ1 · ρ = kde ρ > 0, ϕ ∈ (0, 2π) a θk ∈ − , 2 2 3 2 ρ cos θ2 cos θ1 . Takto zavedené souřadnice se nazývají sférické souřadnice v prostoru R4 . Zobecnění na případ Rn je dále zřejmé. Pro bod x = (x1 , x2 , . . . , xn−1 , xn ) zavedeme nejprve sférické souřadnice (r, ϕ, θ1 , . . . , θn−3 ) pro prvních (n − 1) proměnných a souřadnici xn nazveme z. proměnné r > 0 a z ∈ R dále Pro π π zavedeme polární souřadnice r = ρ cos θn−2 , z = ρ sin θn−2 , kde ρ > 0 a θn−2 ∈ − , . Takto dostaneme regulární 2 2 π π n , k = 1, 2, . . . , n − 2, do R , které má složky zobrazení množiny M , ρ > 0, ϕ ∈ (0, 2π), θk ∈ − , 2 2 x1 = ρ cos θn−2 cos θn−3 . . . cos θ1 cos ϕ , x3 = ρ cos θn−2 cos θn−3 . . . sin θ1 ,
... ,
x2 = ρ cos θn−2 cos θn−3 . . . cos θ1 sin ϕ , xn−1 = ρ cos θn−2 sin θn−3 , 41
xn = ρ sin θn−2 .
Indukcí lze snadno ukázat, že jakobián tohoto zobrazení je Jn = Jn−1 · ρ = rn−2 cosn−3 θn−3 cosn−4 θn−4 . . . cos2 θ2 cos θ1 · ρ = = ρn−1 cosn−2 θn−2 cosn−3 cos θn−3 . . . cos2 θ2 cos θ1 . Takto definované souřadnice ρ, ϕ a θk , k = 1, 2, . . . , n − 2, se nazývají sférické souřadnice v prostoru Rn . Příklad 6. Jiné zobecnění polárních souřadnic z příkladu 3, resp. sférických souřadnic z příkladu 4, jsou tzv. zobecněné polární, resp. sférické, souřadnice. Když místo rovnic (15) použijeme zobrazení x = ar cos ϕ ,
y = br sin ϕ ,
(18)
y2 x2 + 2 = α2 . a2 b Jsou to tedy elipsy se středem v počátku a poloosami rovnoběžnými se souřadnicovými osami. Protože lze toto zobrazení složit ze dvou zobrazení u = r cos ϕ, v = rϕ a x = au, y = bv, jejichž jakobiány jsou r a ab, je jakobián zobrazení (18) roven J = abr. Podobně lze zobecnit sférické souřadnice tak, že položíme
kde a > 0, b > 0 jsou konstanty a r > 0, ϕ ∈ (0, 2π), mají křivky r = α v souřadnicích (x, y) rovnici
x = ar cos θ cos ϕ ,
y = br cos θ sin ϕ , z = cr sin θ , (19) π π kde a, b a c jsou kladné konstanty a r > 0, ϕ ∈ (0, 2π) a θ ∈ − , . V tomto případě odpovídají plochy r = α > 0 2 2 2 2 2 x y z elipsoidům s rovnicí 2 + 2 + 2 = α2 . Jakobián tohoto zobrazení se najde podobně jako v případě R2 a je a b c J = abcr2 cos θ > 0. Tedy zobrazení dané vztahy (19) je regulární. Zobecnění na případ podobných souřadnic v Rn je zřejmé. s r Uvedeme ještě jednu větu, která popisuje zobrazení f : M → R , kde M je otevřená podmnožina R . Nechť x) má složky fk x1 , x2 , . . . , xr , k = 1, 2, . . . , s, které mají na množině M spojité všechny parciální zobrazení f (x x) ∈ Rs neboli ve složkách derivace prvního řádu. Nechť zobrazení f přiřazuje každému bodu x ∈ M bod y = f (x y1 = f1 x1 , x2 , . . . , xr , y2 = f2 x1 , x2 , . . . , xr , . . . , ys = fs x1 , x2 , . . . , xr . (20)
x) matici typu (s × r) se složkami Yki = Označme Y(x
∂fk x), tedy (x ∂xi
∂f1 ∂f1 ∂f1 . . . ∂x ∂x2 ∂xr 1 ∂f ∂f2 ∂f2 2 . . . x) = ∂x (21) Y(x ∂x2 ∂xr . 1 ...................... ∂fs ∂fs ∂fs ... ∂x1 ∂x2 ∂xr Věta 4. Nechť funkce fk x1 , x2 , . . . , xr , k = 1, 2, . . . , s, mají v otevřené množině M ⊂ Rr spojité všechny parciální derivace prvního řádu. Uvažujme zobrazení f : M → Rs definované vztahem (20). Pak platí: 1. Je-li hodnost matice (21) v každém bodě x otevřené množiny A ⊂ M rovna s (v tomto případě musí být r ≥ s), je obraz f (A) otevřená množina. 2. Je-li hodnost matice (21) v bodě a ∈ M rovna s (opět musí být r ≥ s), obsahuje obraz každého okolí bodu a a). jisté okolí bodu b = f (a x) v jistém okolí bodu a konstantní. 3. Je-li hodnost matice Y v jistém okolí bodu a rovna nule, jsou funkce fk (x 4. Nechť a ∈ M a 0 < h < s. Nechť existuje okolí bodu a takové, že hodnost matice (20) je v tomto okolí rovna h. Pak je alespoň jeden subdeterminant řádu h je v bodě a , a tedy i v jistém okolí bodu a nenulový. Bez újmy na obecnosti lze předpokládat, že je to determinant D f1 , f2 , . . . , fh (x x) 6= 0 . (22) D x1 , x2 , . . . , xh Pak existují čísla δ > 0, ∆ > 0 a (s − h) funkcí Φh+1 y1 , y2 , . . . , yh , Φh+2 y1 , y2 , . . . , yh ,
...,
Φs y1 , y2 , . . . , yh ,
(23)
které mají následující vlastnosti: a) Je-li x libovolný bod intervalu J, xi − ai < δ, i = 1, 2, . . . , r je x) = Φs f1 (x x), . . . , fh (x x) . fs (x (24) b) Funkce (23) mají v intervalu yk − bb < ∆, k = 1, 2, . . . , h, spojité parciální derivace prvního řádu.
x), . . . , fh (x x) , x) = Φh+1 f1 (x fh+1 (x
x), . . . , fh (x x) , x) = Φh+2 f1 (x fh+2 (x
42
...,
Poznámky k větě 4. Z této věty je vidět, že důležitou roli hraje hodnost matice (21). Tato hodnost závisí na bodu x). Je-li a ∈ M mohou nastat dva případy: x ∈ M . a je tedy funkcí h(x x) = h(a a). Takový bod a se nazývá regulární. (1) Existuje okolí U bodu a takové, že pro každé x ∈ U je h(x Je zřejmé, že každý bod z okolí U je také regulární, a tedy množina všech regulárních bodů je otevřená. a) = s je regulární, protože existuje subdeterminant s–tého řádu, Speciálně každý bod a ∈ M , pro který je h(a který je v bodě a nenulový a ze spojitosti parciálních derivací plyne, že je tento determinant nenulový na jistém okolí bodu a . x) 6= h(a a). Takové body nazýváme singulární. (2) V každém okolí U bodu a existuje bod x takový, že h(x Věta 4 se zabývala regulárními body. V okolí singulárních bodů je situace značně složitější. Všimněte si také rozdílu mezi tvrzeními 2 a 4. V případě 4 jsou hodnoty, které nabývají funkce fk , k = 1, 2, . . . , s, na intervalu J na sobě závislé v tom smyslu, že hodnoty funkcí fh+1 , fh+2 , . . . , fs jsou jednoznačně určeny hodnotami funkcí f1 , f2 , . . . , fh . Naproti tomu v případě 2 mohou všechny funkce fk nabývat v jakémkoliv okolí U bodu a a). libovolných na sobě nezávislých hodnot z jistého okolí bodu b = f (a Příklad 7. Uvažujme funkce f (x, y, z) = x + y + z + 1, g(x, y, z) = x − y + z + 1 a h(x, y, z) = x2 − y 2 + z 2 + 2xz + 5x + 5y + 5z + 6. Matice (21) je
1 Y(x, y, z) = 1 2x + 2z + 5
1 −1 −2y + 5
1 . 1 2x + 2z + 5
Hodnost této matice je h(x, y, z) = 2, pro každé (x, y, z) ∈ R3 . Existuje tedy funkce Φ(u, v) taková, že (alespoň lokálně) h = Φ(f, g). Snadno se ověří, že h = Φ(f, g) = f g + 4f − g + 2.
r-rozměrné plochy v Rn Nakonec se krátce zmíním o r–rozměrných plochách v n–rozměrném prostoru. Většinu pojmů v této části budu používat pouze intuitivně. Přesná formulace by si vyžádala daleko obsáhlejší přednášku. Nechť je M ⊂ Rn−1 otevřená množina a f : M → R funkce, která má na M spojité parciální derivace prvního řádu. Nechť N ⊂ Rn je množina bodů, pro které platí £ ¤ x1 ; . . . ; xk−1 ; xk+1 ; . . . ; xn ∈ M
a
¡ ¢ xk = f x1 , . . . , xk−1 , xk+1 , . . . , xn .
(25)
Množinu N si můžeme představit jako kus jisté hladké (n − 1)–rozměrné plochy v Rn . Poznámka: Množina N je zhruba řečeno popsána jako graf jisté funkce (n − 1) proměnných. Slovo hladký znamená, že funkce f má spojité parciální derivace, a tedy že se tečné roviny, resp. normály, mění na N spojitě. Obecně nelze ani velmi jednoduché plochy jako například kružnici x2 + y 2 = 1 popsat jako graf jedné funkce. Proto se plocha popisuje pouze lokálně pomocí jednotlivých kusů, které se pak k sobě jistým způsobem ”lepí”.
Obecněji nechť je 0 < r < n a M ⊂ Rr je otevřená množina. Nechť f1 , f2 , . . . , fn−r jsou funkce r proměnných, které mají v M spojité parciální derivace prvního řádu. Nechť ¡
i1 , i2 , . . . , ir , k1 , k2 , . . . , kn−r
¢
je jistá permutace množiny {1, 2, . . . , n}. Nechť je N ⊂ Rn množina všech bodů, pro které platí: £ ¤ xi1 , xi2 , . . . , xir ∈ M ¡ ¢ xk1 = f1 xi1 , . . . , xir ,
...,
¡ ¢ xkn−r = fk−n xi1 , . . . , xir .
(26)
Množinu N pak nazveme ”hladkým kusem r–rozměrné plochy v Rn . 1–rozměrná plocha se nazývá křivka a (n − 1)–rozměrné ploše v Rn se často říká nadplocha. Mnohdy se takové hladké kusy ploch vyjadřují jinými způsoby. Jeden z nich je vyjádření takového kusu r–rozměrné plochy pomocí průniku (n − r)–rozměrných nadploch. Nechť je dáno (n − r) funkcí Fk : M → R, k = 1, 2, . . . , n − r, a M ⊂ Rn je otevřená množina. Nechť všechny tyto funkce mají na M spojité parciální derivace prvního řádu a nechť a ∈ M . Předpokládejme, že matice ∂F1 ∂F1 ... ∂xn ∂x1 . . . . . . . . . . . . . . . . . . . . (x x) = W(x x) ∂Fn−r ∂Fn−r ... ∂x1 ∂xn 43
má v bodě a hodnost (n − r). Tedy některý její subdeterminant řádu (n − r) je různý od nuly. Nechť je to například determinant ¡ ¢ D F1 , F2 , . . . , Fn−r ¡ ¢ (a a) = a) 6= 0 . W (a D xr+1 , xr+2 , . . . , xn x) plyne, že existuje okolí U bodu a takové, že pro Ze spojitosti parciálních derivací funkcí Fk (x x) 6= 0. Podle věty o implicitních každé x ∈ U je W (x funkcích tedy existují δ >ª 0 a ∆ > 0 takové, © že pro každé (x1 , x2 , . . . , xr ) ∈ J, kde J = ©(x1 , x2 , . . . , xr ) ; |xi − ai | < δ existuje ª právě jeden bod (xr+1 , xr+2 , . . . , xn ) ∈ K, kde K = (xr+1 , xr+2 , . . . , xn ) ; |xk − ak | < ∆ , takový, že Fk (x1 , . . . , xn ) = 0. Toto zobrazení lze zapsat jako ¡ ¢ xk = fk x1 , x2 , . . . , xr , k = r + 1, . . . , n . (27) Přitom funkce fk mají na J spojité parciální derivace prvního řádu. Proto je množina N = J ×K kus x) = 0, k = 1, 2, . . . , n−r, za předpokladu, hladké r–rozměrné plochy v Rn . Tedy soustava rovnic Fk (x x) je (n − r) definuje jistý kus hladké plochy. V případě r = n − 1 máme že hodnost matice W(x x) = 0. Jestliže má F (x x) na množině M spojité parciální derivace prvního řádu a jednu rovnici F (x ° ° °grad F °(x x) 6= 0, definuje rovnice F (x x) = 0 jistý kus hladké nadplochy. Tedy je-li r–dimenzionální x) = 0, k = 1, . . . , n − r, znamená to, že je průnikem plocha dána jako řešení soustavy rovnic Fk (x (n − r) nadploch. Podmínka na hodnost matice říká to, že soustava rovnic definující plochu je x) směr normály k nadploše Fk (x x) = 0, je podmínka, že nezávislá. Protože má vektor grad Fk (x x) je rovna (n − r) ekvivalentní tomu, že v bodě x ∈ N existuje k r–rozměrné hodnost matice W(x ploše (n − r) lineárně nezávislých vektorů, které jsou k ní kolmé. Jiný způsob, jak se často zadávají r–rozměrné plochy v Rn je parametrický popis plochy N . r Nechť je dáno ¡ n funkcí ϕ¢k : P → R, k = 1, 2, . . . , n, kde P ⊂ R je otevřená množina. Nechť funkce ϕk (tt) = ϕk t1 , t2 , . . . , tr mají na P spojité všechny derivace prvního řádu a matice ∂ϕ1 ∂ϕ1 ... ∂tr ∂t1 . . . . . . . . . . . . . . . . (tt) W(tt) = ∂ϕn ∂ϕn ... ∂t1 ∂tr má v P hodnost r. Uvažujme množinu N = ϕ (P ), tj. množinu x ∈ Rn , pro která je ¡ ¢ xk = ϕk t1 , t2 , . . . , tr , t ∈ P , k = 1, 2, . . . , n . (28) Nechť τ ∈ P a a = ϕ (ττ ), tj. ak = ϕk (ττ ). Z toho že W (ττ ) 6= 0 plyne, že pro každé τ ∈ P existuje subdeterminant řádu r, který je na nějakém okolí bodu τ různý od nuly. Nechť je to například ¡ ¢ D ϕ 1 , ϕ 2 , . . . , ϕr ¡ ¢ (tt) . W (tt) = D t1 , t2 , . . . , t r ¡ ¢ Podle© věty o implicitních funkcíchªexistují δ > 0 a ∆ > 0 taková, ©že pro každé x1 , x2 , . . . , xr ª∈ J = |xi − ai | < δ ; i = 1, 2, . . . , r existuje právě jedno t ∈ K = |ti − τi | < ∆ ; i = 1, 2, . . . , r , pro která platí (28). Toto přiřazení (x1 , x2 , . . . , xr ) 7→ (t1 , t2 , . . . , tr ) definuje r funkcí ψk : J → K ¡ ¢ tk = ψk x1 , x2 , . . . , xr , k = 1, 2, . . . , r . (29) Navíc mají funkce ψk na množině J spojité derivace prvního řádu. Když dosadíme (29) do (28) pak dostaneme, že pro k = r + 1, r + 2, . . . , n platí ¡ ¢ xk = fk (x1 , x2 , . . . , xr ) = ϕk ψ1 (x1 , . . . , xr ), ψ2 (x1 , . . . , xr ), . . . , ψr (x1 , . . . , xr ) . Protože funkce ψk i ϕk mají spojité derivace, mají spojité derivace i všechny složené funkce fk . Tedy rovnicemi (28) je zadán hladký kus r–rozměrné plochy v Rn . Když si uvědomíme, že vektory ¡ ¢ ∂xi mají směr tečny ke křivce v ploše N , která má parametrické v k , jejichž i–tá složka je vk i = ∂tk rovnice ¡ ¢ ¡ ¢ xi tk = ϕi τ1 , . . . τk−1 , tk , τk+1 , . . . , τr , kde τi jsou konstanty, znamená podmínka na hodnost matice W to, že v každém bodě t ∈ P existuje k ploše N právě r–lineárně nezávislých tečných vektorů. 44
Přednáška 7 Extrémy funkcí více proměnných xk značíme jednu z norem na prostoru Rn , definovanou v přednášce 1. Protože Připomeňme, že kx jsou všechny tyto normy ekvivalentní, nezáleží na tom, jakou z těchto norem vybereme. x) je Definice 1. Nechť je f : M → R, kde M ⊂ Rn je funkce n–proměnných, a ∈ M a funkce f (x definována na nějakém okolí bodu a . x − a k < δ, platí nerovnost Jestliže existuje δ > 0 takové, že pro všechna x , pro která je 0 < kx x) > f (a a) , f (x x) má v bodě a ostré lokální minimum. řekneme, že funkce f (x Jestliže místo (1) platí x) ≥ f (a a) , f (x
(1)
(1a)
x) má v bodě a (neostré) lokální minimum. říkáme, že funkce f (x x − a k < δ, platí nerovnost Jestliže existuje δ > 0 takové, pro která je 0 < kx x) < f (a a) , f (x x) má v bodě a ostré lokální maximum. řekneme, že funkce f (x Jestliže místo (2) platí x) ≤ f (a a) , f (x
(2)
(2a)
x) má v bodě a (neostré) lokální maximum. říkáme, že funkce f (x Společný název pro (ostrá) lokální maxima a minima je (ostré) lokální extrémy a pro neostrá maxima a minima neostré lokální extrémy. Definice 2. Nechť je f : E → R, kde E ⊂ Rn je funkce n–proměnných, M ⊂ E a a ∈ M . x −a ak < δ, platí nerovnost Jestliže existuje δ > 0 takové, že pro všechna x ∈ M , pro která je 0 < kx x) > f (a a) , f (x x) má v bodě a ostré lokální minimum vzhledem k množině M . řekneme, že funkce f (x Jestliže místo (3) platí x) ≥ f (a a) , f (x
(3)
(3a)
x) má v bodě a (neostré) lokální minimum vzhledem k množině M . říkáme, že funkce f (x x −a ak < δ, platí nerovnost Jestliže existuje δ > 0 takové, že pro všechna x ∈ M , pro která je 0 < kx x) < f (a a) , f (x x) má v bodě a ostré lokální maximum vzhledem k množině M . řekneme, že funkce f (x Jestliže místo (4) platí x) ≤ f (a a) , f (x
(4)
(4a)
x) má v bodě a (neostré) lokální maximum vzhledem k množině M . říkáme, že funkce f (x Společný název pro (ostrá) lokální maxima a minima vzhledem k množině M je (ostré) lokální extrémy vzhledem k množině M a pro neostrá maxima a minima vzhledem k množině M neostré lokální extrémy vzhledem k množině M . Přímo z definice plynou následujíc dvě věty: x) nabývá na množině M své největší hodnoty v bodě a ∈ M . Pak má Věta 1. Nechť funkce f (x x) v bodě a lokální maximum vzhledem k množině M (maximum nemusí být ostré). funkce f (x 45
x) má v bodě a lokální maximum vzhledem k množině N , Věta 2. Je-li a ∈ M ⊂ N a funkce f (x má v bodě a lokální maximum vzhledem množině M . x) měla v bodě a ∈ M lokální Následující věta udává nutné podmínky pro to, aby funkce f (x extrém. x) Věta 3. Nechť je M ⊂ Rn otevřená množina. Jestliže v bodě a ∈ M existuje derivace funkce f (x ve směru n a je různá od nuly, nemá funkce v bodě a lokální extrém. a + n t) nemá lokální extrém v bodě t = 0. Důkaz: Z předpokladu věty plyne, že funkce jedné proměnné F (t) = f (a Proto pro libovolné τ > 0 existují t1 ,t2 , tk < τ taková, že F (t1 ) > F (0) > F (t2 ). Ale to znamená, že pro libovolné x1 ) > fa a) > f (x x2 ). Tedy funkce f (x x) nemá v bodě a okolí bodu a existují x 1 = a + n t1 a x2 = a + n t2 takové, že f (x lokální extrém. ¤
x) mohla mít v bodě a lokální extrém, musí být její derivace bodě a v každém Tedy aby funkce f (x směru rovna nule nebo nesmí existovat. Tedy nás budou zajímat body, kde parciální derivace jsou ∂f ∂f ∂f a) = a) = · · · = a) = 0 , (a (a (a ∂x1 ∂x2 ∂xn
(5)
nebo body, kde některá parciální derivace neexistuje. Poznámka: Poznamenejme, že některé z výše uvedených bodů jsou větou 3 vyloučeny. Jsou to ty body, kde je nějaká parciální derivace v bodě a existuje a je nenulová. Pak nás už nemusí zajímat, zda ostatní parciální derivace prvního řádu existují.
V bodech, ve kterých platí (5) lze často o existenci a druhu extrému rozhodnout podle následující věty. x) má v bodě a diferenciál druhého řádu a nechť v bodě a platí (5). Věta 4. Nechť funkce f (x Uvažujme kvadratickou formu h) = Φ(h1 , h2 , . . . , hn ) = d2 f (a a, h ) = Φ(h
n X
∂2f a)hr hs . (a ∂xr ∂xs r,s=1
(6)
x) v bodě a ostré lokální mini(1) Je-li kvadratická forma (6) pozitivně definitní má funkce f (x mum. x) v bodě a ostré lokální maxi(2) Je-li kvadratická forma (6) negativně definitní má funkce f (x mum. x) v bodě a lokální extrém. (3) Je-li kvadratická forma (6) indefinitní nemá funkce f (x Poznámka: Z algebry by měly být známy základní pojmy a vlastnosti kvadratických forem. Ale pro úplnost je krátce připomenu. Nechť jsou ars = asr , r, s = 1, 2, . . . , n, reálná čísla. Kvadratickou formou nazýváme funkci n n X X x) = Q x1 , x2 , . . . , xn = Q(x ars xr xs = arr x2r + 2 r,s=1
r=1
X
ars xr xs .
(7)
1≤r<s≤n
0) = 0. Zřejmě Q(0 x) > 0, nazýváme kvadratickou formu pozitivně definitní. Jestliže pro každé x 6= 0 je Q(x x) ≥ 0, nazýváme kvadratickou formu pozitivně semidefinitní. Jestliže pro každé x 6= 0 je Q(x x) < 0, nazýváme kvadratickou formu negativně definitní. Jestliže pro každé x 6= 0 je Q(x x) ≤ 0, nazýváme kvadratickou formu negativně semidefinitní. Jestliže pro každé x 6= 0 je Q(x x) > 0 > Q(y y ), nazývá se kvadratická forma indefinitní. Jestliže existují x a y takové, že Q(x x) patří. jsou pouze tří možnost. Pokusme se nyní odpovědět na otázku, ke kterému typu kvadratická forma Q(x A. Pro všechna r, s je ars = 0. V tomto případě je kvadratická forma rovna nule pro každé x a forma je tedy pozitivně i negativně semidefinitní. B. Existují indexy r a s takové, že arr = ass = 0 a ars 6= 0. Jestliže v tomto případě zvolíme x 1 tak, že xk = 0 pro x1 ) = 2ars 6= 0. Ale volba x 2 , pro kterou je xk = 0 pro k 6= r, s, xr = 1 a xs = −1 dává k 6= r, s a xr = xs = 1, je Q(x x2 ) = −2ars = −Q(x x1 ). Tedy v těchto dvou bodech nabývá kvadratická forma dvou nenulových hodnot, která se Q(x liší pouze znaménkem, a je tedy indefinitní. C. Existuje r takové, že arr 6= 0. Bez újmy na obecnosti lze předpokládat, že a11 6= 0. Pak platí rovnost x) = a11 Q(x
2 a13 a1n a12 x2 + x3 + · · · + xn + Q2 x2 , x3 , . . . , xn , x11 + a11 a11 a11 46
(8)
kde Q2 x2 , . . . , xn je kvadratická forma (n − 1) proměnných. Je-li kvadratická forma Q2 tvaru B., je indefinitní. To plyne z toho, že pro libovolné (x2 , x3 , . . . , xn ) můžeme a12 x2 + · · · + a1n xn položit x1 = − . V tom případě je Q(x1 , x2 , . . . , xn ) = Q2 (x2 , . . . , xn ) a kvadratická forma a11 Q2 (x2 , . . . , xn ) je indefinitní. Podobná úvaha vede k tomu, že jestliže kvadratická forma Q2 tvaru A. je forma pozitivně, resp. negativně, semidefinitní pro a11 > 0, resp. a11 < 0. Zbývá tedy případ, kdy je kvadratická forma Q2 tvaru C. Když použijeme podobný zápis formy Q2 jako jsme použili při přechodu ke vztahu (8), dostaneme Q(x1 , x2 , . . . , xn ) = a11
2 2 a12 a13 a1n x11 + x2 + x3 + · · · + xn +A2 x22 +c2,3 x3 +· · ·+c2n xn +Q3 (x3 , . . . , xn ) , a11 a11 a11
kde A2 a c2,k jsou jistá reálná čísla. V tomto postupu lze pokračovat. Pokud dostaneme v k–tém kroku formu Qk , která je tvaru B, je kvadratická forma (7) indefinitní. Pokud nedostaneme v žádném kroku formu tvaru B, lze kvadratickou formu (7) zapsat ve tvaru x) = A1 x1 +c12 x2 +· · ·+c1n xn Q(x
2
+A2 xx +c23 x3 +· · ·+c2n
2
+· · ·+Ak xk +ck,k+1 xk+1 +· · ·+ckn xn
2
+· · ·+An x2n (9)
x) již snadno zjistíme její typ. Z tvaru (9) kvadratické formy Q(x x) pozitivně definitní. Je-li Ak > 0 pro každé k = 1, 2, . . . , n je kvadratická forma Q(x x) pozitivně semidefinitní. Je-li Ak ≥ 0 pro každé k = 1, 2, . . . , n je kvadratická forma Q(x x) negativně definitní. Je-li Ak < 0 pro každé k = 1, 2, . . . , n je kvadratická forma Q(x x) negativně semidefinitní. Je-li Ak ≤ 0 pro každé k = 1, 2, . . . , n je kvadratická forma Q(x x) indefinitní. Existují-li indexy r a s takové, že Ar > 0 a As < 0 je kvadratická forma Q(x V algebře se dokazuje následující věta x) kvadratická forma (7). Označme Věta. (Sylvestrovo kritérium) Nechť je Q(x
a11 a12 a13 . . . a1k a12 a22 a23 . . . a2k Dk = det a13 a23 a33 . . . a3k , ......................... a1k
a2k
a3k
...
k = 1, 2, . . . , n .
(10)
akk
Nechť je Dk 6= 0 pro každé k. x) pozitivně definitní. Je-li Dk > 0 pro každé k = 1, 2, . . . , n, je kvadratická forma Q(x Je-li (−1)k Dk > 0 pro každé k = 1, 2, . . . , n, (tj. D1 = a11 < 0 a determinanty Dk z (10) střídají znaménka), je x) negativně definitní. kvadratická forma Q(x x) indefinitní. Jestliže nenastává ani jedna z výše uvedených možností, je kvadratická forma Q(x x) v bodě a plyne, že první diferenciál funkce f (x x) existuje Důkaz věty 4: Z existence druhého diferenciálu funkce f (x v jistém okolí U bodu a . Nechť h je takové, že a + h ∈ U . Podle věty 5.9 existuje Θ ∈ (0, 1) takové, že a + h ) = f (a a) + f (a
n X
a + Θh h)hr . f,r (a
r=1
Protože parciální funkce f,r mají v bodě a diferenciál prvního řádu, je a + Θh h) = f,r (a a) + f,r (a
n X
a)hs + kΘh hkηr (a a, Θh h) , f,rs (a
s=1
a, h ) = 0. Protože v bodě a platí podle předpokladu (5), je kde lim ηr (a h →0
a + h ) − f (a a) = Θ f (a hk, je Protože hr ≤ kh
n X
n X
r=1
s=1
! a)hs + kh hkηs (a a, h ) f,rs (a
hr .
a + h ) − f (a a) = Θ Φ(h h) + kh hk2 η(h h) , f (a
(11)
n X a, h )hr ηs (a h) = h) = 0. Protože Θ > 0 závisí znaménko rozdílu f (a a + h ) − f (a a) pouze na kde η(h a lim η(h h →0 hk kh r, s=1
znaménku závorky v (11). h) pozitivně definitní. Protože množina M všech bodů h , pro které je kh hk = max |h1 |, |h2 |, . . . , |hn | = 1 Nechť je Φ(h h) je spojitá, existuje v M bod h 0 takový, že Φ h 0 = inf Φ(h h) = je kompaktní, tj. uzavřená a omezená, a funkce Φ(h h∈M
47
h) ≥ Akh hk2 . Toto tvrzení zřejmě platí pro h = 0 . Je-li h nenulové, je A > 0. Pak ale pro každé h platí nerovnost Φ(h h h0 = ∈ M , a tedy Φ h 0 ≥ A. Tedy platí hk kh a + h ) − f (a a) ≥ Θkh hk2 A + η(h h) . f (a h) = 0, existuje δ > 0 takové, že pro 0 < kh hk < δ je f (a a + h ) − f (a a) > 0. Tedy Protože je Θ > 0, A > 0 a lim η(h h →0
x) má v bodě a lokální minimum. funkce f (x h) negativně definitní, stačí použít předchozí tvrzení na funkci −f (x x). Jestliže je Φ(h h) indefinitní, existují body α a β takové, že Φ(α α) > 0 > Φ(β β ). Pro t > 0 pak Jestliže je kvadratická forma Φ(h plyne z (11) a + tα α) − f (a a) = Θt2 Φ(α α) + kα αk2 η(tα α) , f (a
a + tβ β ) − f (a a) = Θt2 Φ(β β ) + kβ β k2 η(tβ β) . f (a
(12)
α) = lim η(tβ β ) = 0 plyne z (12), že existuje δ > 0takové, že pro každé t ∈ (0, δ) platí nerovnost Ale protože lim η(tα t→0+
t→0+
a + tα α) > f (a a) > f (a a + tβ β ). Tedy funkce f (x x) nemá v bodě a lokální extrém. ¤ f (a 1 Příklad 1. Najděte lokální extrémy funkce f (x, y, z) = x3 + y 2 + z 2 − 3xz − 2y + 2z. 2 3 Řešení: Funkce f (x, y, z) má spojité derivace všech řádu na celé množině R . Tedy existuje diferenciál libovolného řádu. První diferenciál je df (x, y, z) = 3 x2 − z dx + 2(y − 1)dy + (z − 3x + 2)dz. Tedy lokální extrémy mohou existovat v bodech, kde ∂f = 3 x2 − z , ∂x
∂f =2 y−1 , ∂y
∂f = z − 3x + 2 . ∂z
Tato soustava má dvě řešení a 1 = [1; 1; 1] a a 2 = [2; 1; 4]. Druhý diferenciál funkce f (x, y, z) je d2 f (x, y, z) = 6xdx2 + 2dy 2 + dz 2 − 6dxdz. V bodě a 1 = [1; 1; 1] je odpovídající kvadratická forma (6) 1 2 1 Φ(h, k, l) = 6h2 + 2k2 + l2 − 6hl = 6 h − l + 2k2 − l2 . 2 2 Jak je vidět, je tato kvadratická forma indefinitní, a tedy v bodě a 1 = [1; 1; 1] nemá funkce f (x, y, z) lokální extrém. V bodě a 2 = [2; 1; 4] je kvadratická forma (6) 1 2 1 Φ(h, k, l) = 12h2 + 2k2 + l2 − 6hl = 12 x − l + 2k2 + l2 . 4 4 Tedy kvadratická forma je v tomto případě pozitivně definitní, a proto má funkce f (x, y, z) v bodě a2 = [2; 1; 4] lokální minimum. 6 0 −3 Ukážeme ještě použití Sylvestrova kritéria. Matice druhých derivací v bodě a 1 je A = 0 2 0 . Z ní −3 0 1 dostaneme 6 0 −3 6 0 = 12 > 0 , det 0 2 0 = −6 < 0 . D1 = 6 > 0 , D2 = det 0 2 −3 0 1 Tedy forma Φ(h, k, l) je indefinitní a funkce nemá extrém. v bodě a 1 lokální 12 0 −3 V bodě a 2 je matice druhých derivací A = 0 2 0 . Protože −3 0 1 D1 = 12 > 0 ,
D2 = det
12 0
0 2
= 24 > 0 ,
12 det 0 −3
0 2 0
−3 0 = 6 > 0, 1
je kvadratická forma Φ(h, k, l) pozitivně definitní, a tedy v bodě a2 má funkce f (x, y, z) lokální minimum.
Vázané extrémy
¡ ¢ x), x = x1 , x2 , . . . , xn V této části se budeme zabývat výpočtem lokálních extrémů funkce f (x na množině M , která je dána soustavou rovnic x) = 0 , gk (x
k = 1, 2, . . . , r . 48
(13)
Vztahy (13) se často nazývají vazby, a proto se často mluví o vázaných extrémech. Nejprve na případě n = 2 a r = 1 ukážeme různé způsoby řešení této úlohy. Máme tedy najít lokální extrémy funkce f (x, y) na množině, která je určena rovnicí g(x, y) = 0. Jestliže se nám podaří explicitně z rovnice g(x, y) = 0 vyjádřit jednu proměnnou jako funkci druhé, například najít funkci ¡ y =¢ϕ(x), lze za y dosadit do funkce f (x, y) a hledat extrém funkce jedné proměnné F (x) = f x, ϕ(x) . Ale to je úloha, kterou jsme se zabývali v přednášce z MA1. Jiná možnost je popsat množinu M parametricky, tj. najít funkce x = ϕ(t), y = ψ(t), t ∈ T , ¡ ¢ dosadíme takové, že g ϕ(t), ψ(t) = 0. Jestliže tyto vztahy ¡ ¢ do funkce f (x, y), můžeme lokální extrémy hledat pro funkci jedné proměnné Φ(t) = f ϕ(t), ψ(t) , kde t ∈ T . Existuje ale ještě jiná možnost, při které nemusíme znát řešení rovnice g(x, y) = 0. Předpoklá∂g dejme, že funkce g(x, y) má spojité parciální derivace na otevřené množině E ⊂ R2 a 6= 0 na M . ∂y Pak lze podle věty o implicitních funkcích vyjádřit alespoň lokálně vyjádřit y jako funkci proměnné x, tj. y = ϕ(x). Když dosadíme tento vztah do funkce f (x, y), máme najít lokální extrém funkce ¡ ¢ jedné proměnné F (x) = f x, ϕ(x) . Jak je známo z MA1 extrém funkce F (x) může existovat pouze v bodě a, ve kterém je ¡ ¢ ¡ ¢ F 0 (a) = f,x a, ϕ(a) + f,y a, ϕ(a) ϕ0 (a) = 0 .
(14)
¡ ¢ V bodě, kde je lokální extrém máme tedy dvě rovnice, (14) a g a, ϕ(a) = 0, pro tři proměnné a, ϕ(a) a ϕ0 (a). Tedy musíme najít ještě jednu rovnici. Ale tu získáme derivováním vazbové podmínky v bodě a. Z té plyne vztah ¡ ¢ ¡ ¢ g,x a, ϕ(a) + g,y a, ϕ(a) ϕ0 (a) = 0 . Tedy v bodě, kde má funkce f (x, y) lokální extrém, musí platit rovnice f,x (a, b) + f,y (a, b)y 0 (a) = 0 , 0
(15)
g,x (a, b) + g,y (a, b)y (a) = 0 ,
(16)
g(a, b) = 0 ,
(17)
kde jsme označili b = ϕ(a) a y 0 (a) = ϕ0 (a). Soustava (15)–(17) je již soustavou tří rovnic pro tři neznáme a v principu ji lze řešit. Většinou se ale používá jistá metoda řešení této soustavy. Protože jsme předpokládali, že je g,y (a, b) 6= 0 existuje právě jedna konstanta λ taková, že f,y (a, b) + λg,y (a, b) = 0 .
(18)
Jestliže vynásobíme rovnici (16) číslem λ a přičteme k rovnici (15), dostaneme vzhledem k podmínce (18), že pro takové λ musí platit také f,x (a, b) + λg,x (a, b) = 0 .
(19)
Tedy jestliže má funkce f (x, y) s vazbovou podmínkou g(x, y) = 0 v bodě (a, b) lokální extrém, musí existovat konstanta λ taková, že platí f,x (a, b) + λg,x (a, b) = 0 ,
(19)
f,y (a, b) + λg,y (a, b) = 0 ,
(20)
g(a, b) = 0 .
(21)
¡ ¢ Abychom rozhodli o druhu lokálního extrému, najdeme druhý diferenciál funkce F (x) = f x, ϕ(x) v bodě a. Z věty o diferenciálu složené funkce dostaneme d2 F (a) = f,xx (a, b)dx2 + 2f,xy (a, b)dxdy + f,yy (a, b)dy 2 + f,y (a, b)d2 y , 49
(22)
Ale z vazbové podmínky plynou vztahy dg(a, b) = g,x (a, b)dx + g,y (a, b)dy = 0 , 2
(23)
2
2
2
d g(a, b) = g,xx (a, b)dx + 2g,xy (a, b)dxdy + g,yy (a, b)dy + g,y (a, b)d y = 0 .
(24)
Jestliže rovnici (24) číslem λ a přičteme k rovnici (22), dostaneme vzhledem k podmínce (20) pro druhý diferenciál vztah ¡ ¢ ¡ ¢ ¡ ¢ d2 F (a) = f,xx (a, b)λg,xx (a, b) dx2 + 2 f,xy (a, b) + λg,xy (a, b) dxdy + f,yy (a, b) + λg,yy (a, b) dy 2 . (25) Ale dx a dy splňují podmínku (23), a tedy nejsou nezávislé. Proto musíme za jednu z těchto proměnných dosadit z (23). Tím získáme kvadratickou formu v jedné proměnné. Je-li tato forma pozitivně definitní, má funkce f (x, y) v bodě (a, b) ostré lokální minimum a je-li negativně definitní, má v tomto bodě lokální maximum. Číslo λ se nazývá Lagrangeův multiplikátor a celá metoda pak metoda Lagrangeova multiplikátoru. Tuto metodu hledání lokálních vázaných extrémů lze formulovat pro obecný případ. Věta 5. Nechť funkce x) = f (x1 , x2 , . . . , xn ) , f (x
x) = gk (x1 , x2 , . . . , xn ) , gk (x
k = 1, 2, . . . , r
(26)
mají spojité parciální derivace prvního řádu v otevřené množině E ⊂ Rn . Nechť je v každém bodě množiny E hodnost matice ∂g1 ∂g1 ∂g1 ... ∂x1 ∂x2 ∂xn ∂g2 ∂g2 ∂g2 ... W = ∂x (27) ∂xn 1 ∂x2 ...................... ∂g ∂gr ∂gr r ... ∂x1 ∂x2 ∂xn rovna r a nechť je M množina všech bodů x = (x1 , x2 , . . . , xn ), které splňují rovnice x) = gk (x1 , x2 , . . . , xn ) = 0 . gk (x
(28)
Pak platí následující tvrzení. x) v bodě a ∈ E lokální extrém vzhledem k množině M , existují reálná čísla Jestliže má funkce f (x λ1 , λ2 , . . . , λr taková, že r
X ∂gk ∂f a) + a) = 0 (a λk (a ∂xi ∂xi
pro každé i = 1, 2, . . . , n
(29)
k=1
a) = 0 gk (a
pro každé k = 1, 2, . . . , r
(30)
Nechť je bod a ∈ E a λk čísla, pro která platí (29) a (30), a nechť mají funkce (26) v bodě a diferenciál druhého řádu. Sestrojme kvadratickou formu proměnných dx1 , dx2 , . . . , dxn n X ¡ ¢ Ψ dx1 , dx2 , . . . , dxn = i,j=1
Ã
! r X ∂ 2 gk ∂2f a) + a) dxi dxj . λk (a (a ∂xi ∂xj ∂xi ∂xj
(31)
k=1
Protože matice W má v bodě a hodnost r, existuje alespoň jeden její nenulový determinant řádu r. Nechť je to například determinant ¡ ¢ D g1 , g2 , . . . , gr ¢ (a a) 6= 0 . W = ¡ D x1 , x2 , . . . , xr 50
(32)
Když ze soustavy r rovnic
n X ∂gk i=1
∂xi
a) dxi = 0 (a
(33)
vyjádříme dx1 , dx2 , . . . , dxr jako lineární formy proměnných dxr+1 , dxr+2 , . . . , dxn a dosadíme je do kvadratické formy Ψ, získáme kvadratickou formu Φ proměnných dxr+1 , dxr+2 , . . . , dxn . x) v bodě a Jestliže je tato kvadratická forma pozitivně, resp. negativně, definitní, má funkce f (x ostré lokální minimum, resp. maximum, vzhledem k množině M . Jestliže je kvadratická forma Φ x) v bodě a lokální extrém vzhledem k množině M . indefinitní, nemá funkce f (x Důkaz: Nechť je a ∈ E libovolný bod množiny M , tj. platí (30). Protože matice W definovaná v (27) má v bodě a hodnost r, existuje aspoň jeden determinant řádu r, který je nenulový. Bez újmy na obecnosti lze předpokládat, že je to determinant (32). Z věty o implicitních funkcích plyne, že existují δ > 0 a ∆ > 0 taková, že ke každému bodu (xr+1 , xr+2 , . . . , xn ), pro který je xi − ai < δ, i = r + 1, r + 2, . . . , n, existuje právě jeden bod (x1 , x2 , . . . , xr ), xk − ak < ∆, k = 1, 2, . . . , r, takový, že platí (28). Tyto hodnoty označme xk = ϕk xr+1 , xr+2 , . . . , xn = ϕk (ξξ ) ,
(34)
α ) = ak . kde k = 1, 2, . . . , r. Funkce (34) mají spojité první derivace v okolí bodu α = ar+1 , a2 , . . . , an a ϕk (α x) v bodě a lokální extrém vzhledem k množině M , Je zřejmé, že místo abychom vyšetřovali, zda má funkce f (x stačí vyšetřit, zda má funkce F (ξξ ) = F xr+1 , xr+2 , . . . , xn = f ϕ1 (ξξ ), . . . , ϕr (ξξ ), xr+1 , . . . , xn (35) x) a ϕk (ξξ ) plyne, že funkce F (ξξ ) lokální extrém v bodě α (teď již bez jakéhokoliv omezení). Z vlastností funkcí f (x má v okolí bodu α spojité parciální derivace prvního řádu. Tedy z věty 3 plyne, že pokud má funkce F (ξξ ) v bodě α lokální extrém, musí platit r X ∂ϕk ∂f ∂F ∂f α) = a) · α) + a) = 0 (α (a (α (a ∂xi ∂x ∂x ∂x i i k k=1
pro každé i = r + 1, r + 2, . . . , n .
(36)
Navíc z (28) plyne pro každé s = 1, 2, . . . , r vztah r X ∂gs ∂ϕk ∂gs a) · α) + a) = 0 (a (α (a ∂xk ∂xi ∂xi k=1
pro každé i = r + 1, r + 2, . . . , n .
(37)
Z nenulovosti determinantu (32) plyne, že existuje právě jedna množina reálných čísel λ1 , λ2 , . . . , λr taková, že r X ∂gs ∂f a) + a) = 0 (a λs (a ∂xk ∂x k s=1
pro každé k = 1, 2, . . . , r .
(38)
Jestliže vztah (37) vynásobíme λs , sečteme a pak přičteme k (36), dostaneme ! r r r X X X ∂f ∂gs ∂f ∂gs ∂ϕk a) + a) α) + a) + α) = 0 . (a λs (a (α (a λs (α ∂x ∂x ∂x ∂x ∂xi i i k k s=1 s=1 k=1 x) v bodě a lokální extrém vzhledem Ale první člen je podle (38) roven nule. Tedy jsme ukázali, že pokud má funkce f (x k množině M , existují reálná čísla λ1 , λ2 , . . . , λr taková, že platí (29). Nechť existují čísla λ1 , λ2 , . . . , λr taková, že platí (29) a nechť funkce (26) mají v bodě a diferenciál druhého řádu. Pak mají funkce (35) v bodě α diferenciál druhého řádu. Z věty o diferenciálu složené funkce plyne, že dF =
n X ∂f dxk , ∂x k k=1
d2 F =
n X k,l=1
(39)
n X ∂2F ∂F 2 dxk dxl + d xk , ∂xk ∂xk ∂x k k=1
(40)
kde dxk a d2 xk pro k = 1, 2, . . . , r jsou diferenciály funkcí (34) a d2 xk = 0 pro k = r+1, r+2, . . . , n. Diferencováním vazbových podmínek dostaneme pro s = 1, 2, . . . , r dgs =
n X ∂gs dxk = 0 , ∂xk k=1
d 2 gs =
n X k,l=1
n X ∂ 2 gs ∂gs 2 dxk dxl + d xk . ∂xk ∂xl ∂x k k=1
51
(41) (42)
Jestliže vynásobíme rovnice (42) λs , sečteme a připočteme k (41), dostaneme vzhledem k (29) ! n r X X ∂2f ∂ 2 gs α) = a) + a) dxk dxl . d2 F (α (a λs (a ∂xk ∂xl ∂xk ∂xl s=1 k,l=1 Tato rovnice platí pro všechna dxr+1 , dxr+2 , . . . , dxn . Přitom jsou dx1 , dx2 , . . . , dxr vyjádřeny jako lineární funkce z rovnice (41). Dokazované tvrzení pak plyne z věty 4. ¤ Poznámka: Konstanty λ1 , . . . , λr v věty 5 se často nazývají Lagrangeovy multiplikátory a metoda hledání vázaných extrémů uvedená v této větě metoda Lagrangeových multiplikátorů. Tato věta je poměrně dlouhé, ale její použití lze popsat velmi jednoduše. Sestrojíme tzv. Lagrangeovu funkci x) = f (x x) + L(x
r X
x) , λk gk (x
(43)
k=1
kde λk jsou zatím neurčené konstanty. S touto funkcí zacházíme stejně, jako by vazbové podmínky neexistovaly, tj. najdeme body a takové, že ∂L ∂L ∂L a) = a) = · · · = a) = 0 . (a (a (a (44) ∂x1 ∂x2 ∂xn Přitom se ale musíme omezit na body a , pro které je a) = g2 (a a) = · · · = gr (a a) = 0 . g1 (a
(45)
Soustava rovnic (44) a (45) je soustava (n + r) rovnic pro (n + r) proměnných a = a1 , a2 , . . . , an a λ1 , . . . , λr . x) v bodě a , tj. Když najdeme takové body, sestrojíme druhý diferenciál funkce L(x d2 L =
m X k,l=1
Z rovnic a) = dgi (a
∂2L dxk dxl . ∂xk ∂xl
(46)
n X ∂gi a) dxk = 0 (a ∂x k k=1
vypočteme r z hodnot dx1 , . . . , dxn pomocí (n − r) ostatních a dosadíme do (46). Tak získáme kvadratickou formu (n − r) proměnných, která rozhoduje o typu extrému v bodě a stejně jako kvadratická forma Φ definovaná v (6) ve větě 4. Příklad 2. Najděte lokální extrémy funkce f (x, y, z) = x + y + z na množině M , která je dána rovnicí g(x, y, z) = xyz − 1 = 0. 1 Řešení: Úlohu bychom mohli řešit tak, že bychom z vazbové podmínky vyjádřili například z = a pak hledali xy 1 lokální extrémy funkce dvou proměnných F (x, y) = x + y + . Ale na tomto příkladě ukážeme použití metody xy Lagrangeových multiplikátorů. Tato metoda by mohla selhat pouze v bodech, kde by bylo g(x, y, z) = g,x (x, y, z) = g,y (x, y, z) = g,z (x, y, z) = 0. Ale takové body neexistují, a proto lze metodu použít bez obav. Sestrojíme Lagrangeovy funkci L(x, y, z) = f (x, y, z) + λg(x, y, z) = x + y + z + λ(xyz − 1). Nutné podmínky pro extrém jsou ∂L ∂L ∂L = 1 + λyz = = 1 + λxz = = 1 + λxy = 0 , xyz = 1 . ∂x ∂y ∂z Tato soustava má pouze jediné řešení x = y = z = 1, λ = −1. Abychom rozhodli o typu extrému, sestrojíme v tomto bodě druhý diferenciál funkce L(x, y, z). Ten je d2 L(1, 1, 1) = −2(dxdy + dxdz + dydz). Ale tato kvadratická forma tří proměnných je indefinitní. Ale diferenciál vazebné podmínky dává vztah dg(1, 1, 1) = dx + dy + dz = 0. Z 2 toho plyne, že dz = −dx − dy. Jestliže dosadíme tento vztah do d L(1, 1, 1), dostaneme kvadratickou formu Φ dvou proměnných dx a dy tvaru Φ = 2 dx2 + dxdy + dy 2 , která je, jak se lze snadno přesvědčit pozitivně definitní. Tedy funkce f (x, y, z) na v bodě [1; 1; 1] ostré lokální minimum vzhledem k množině M = [x; y; z] ∈ R3 ; xyz = 1 . Příklad 3. Najděte extrémy funkce f (x1 , x2 , . . . , xn , y) = y za podmínky g(x1 , x2 , . . . , xn , y) = 0. Řešení: Jedná se vlastně o extrém funkce y = y(x1 , . . . , xn ) definované implicitně rovnicí g(x1 , . . . , xn , y) = 0. Lagrangeova funkce je v tomto případě L(x1 , . . . , xn , y) = y + λg(x1 , . . . , xn , y). Nutné podmínky pro extrém jsou λ Z nich plyne, že λ 6= 0 a λ=−
∂g ∂g ∂g ∂g =1+λ = 0. =λ = ··· = λ ∂x1 ∂x2 ∂xn ∂y
∂g ∂g 6= 0. Tedy v bodě, kde má funkce y extrém, musí platit = 0, k = 1, 2, . . . , n a ∂y ∂xk
1 . Druhý diferenciál Lagrangeovy funkce je g,y n n X X ∂2g ∂2g ∂2g 2 2 d L=λ dxi dxk + 2 dxk dy + dy . ∂xi ∂xk ∂xk ∂y ∂y 2 i,k=1 k=1 52
Diferenciál vazebné podmínky g(x1 , . . . , xn , y) = 0 je dg =
n X ∂g ∂g dxk + dy = 0 . ∂x ∂y k k=1
∂g = 0 plyne z toho, že dy = 0. Tedy o typu extrému funkce y = ∂xk y(x1 , . . . , xn ) definovaná implicitně rovnicí g(x1 , . . . , xn , y) = 0 rozhoduje typ kvadratické formy
Protože v bodě, kde má funkce extrém, je
Φ = −g,y
n X i,k=1
v bodě, ve kterém jsou parciální derivace
∂2g dxi dxk ∂xi ∂xk
∂g = 0 pro všechna k. ∂xk
Globální extrémy na kompaktní množině x) na Mnohdy vedou řešené problémy na úlohu najít největší nebo nejmenší hodnotu funkce f (x množině M , která je dána jistými nerovnostmi. Jestliže je množina M kompaktní, tj. omezená x) na množině M spojitá, víme z Weierstrassovy a uzavřená, a funkce f (x M ¡ ¢věty, že v množině ¡ ¢ x) ≤ f a 2 . Tedy existustují body a 1 a a 2 takové, že pro všechna x ∈ M platí nerovnosti f a 1 ≤ f (x x) nabývá na množině M nejmenší a největší hodnoty. Tyto hodnoty mohou byt vnitřní funkce f (x x) nabývá extrému ve vnitřním body množiny M nebo mohou ležet na hranici M . Jestliže funkce f (x bodě a množiny M, musí mít v bodě a lokální extrém. Tedy pokud existují parciální derivace musí x) extrém v bodě a , který je hraniční bod množiny M , musí v bodě a platit (5). Nabývá-li funkce f (x x) v bodě a lokální extrém vzhledem k hranici množiny M . Jestliže je hranice M dána mít funkce f (x x) = 0, lze v těchto bodech použít metodu Lagrangeových multiplikátorů. pomocí rovnic gk (x x) na kompaktní Abychom tedy našli největší a nejmenší hodnotu diferencovatelné funkce f (x množině M stačí najít vnitřní body množiny M , ve kterých platí (5) a hraniční body M , kde by mohl být extrém. Jestliže je těchto bodů konečně mnoho, stačí z těchto bodů vybrat ten, ve kterém x) největší nebo nejmenší. je funkční hodnota f (x Tento postup ilustrujeme v následujícím příkladě. Příklad 4. Najděte nejmenší a největší hodnotu funkce f (x, y) = x3 +y 3 −3xy na množině M ⊂ R2 dané nerovnostmi 0 ≤ x ≤ 3 a 0 ≤ y ≤ 2x2 . Řešení: Nejprve budeme zkoumat vnitřní body množiny M , tj. body, které vyhovují nerovnostem 0 < x < 3 a 0 < y < 2x2 . Aby funkce f (x, y) nabývala v tomto bodě své nejmenší nebo největší hodnoty, musí platit (5), tj. ∂f = 3x2 − 3y = 0 , ∂x
∂f = 3y 2 − 3x = 0 . ∂y
Tyto rovnice jsou splněny pouze v bodech x = y = 0 nebo x = y = 1. Ale bod [0; 0] není vnitřním bodem množiny M . Tedy jediný vnitřní bod, ve kterém může funkce f (x, y) nabývat extrém je bod a 1 = [1; 1]. Hranice množiny M je tvořena třemi křivkami: (1) x = 3, 0 ≤ y ≤ 18 (2) y = 0, 0 ≤ x ≤ 3 (3) y = 2x2 , 0 ≤ x ≤ 3 Na první křivce je f (3, y) = F1 (y) = y 3 − 9y + 27. Tato funkce může nabývat extrém v bodech y ∈ (0, √ kde 18), F10 (y) = 0 nebo v krajních bodech. Protože F10 (y) = 3y 2 − 9, dostaneme pomocí derivace jediný bod a 2 = 3; 3 . V bodech druhé křivky budeme hledat body, v nichž může mít lokální extrém funkce F2 (x) = f (x, 0) = x3 , x ∈ (0, 3). V těchto bodech je derivace F20 (x) = 3x2 6= 0. Ve třetím případě hledáme body, ve kterých je derivace funkce F3 (x) = f x, 2x2 = 8x6 − 5x3 , x ∈ (0, 3), rovna = 48x5 − 15x2 . Protože bod x = 0 nevyhovuje podmínce x ∈ (0, 3), dostáváme jediný bod nule. "Protože F30 (x) # r r 1 3 5 1 3 25 a3 = ; . 2 2 2 4 Konečně nám zbývají body, které jsou průnikem dvou hraničních křivek, tedy body a 4 = [0; 0], a 5 = [3; 0] a a 6 = [3; 18]. √ 25 Protože je f a 1 = −1, f a 2 = 27 − 3 3, f a 3 = − , f a 4 = 0, f a 5 = 27 a f a 5 = 5697, nabývá funkce 32 f (x, y) na množině M největší hodnoty 5697 v bodě [3; 18] a nejmenší hodnoty −1 v bodě [1; 1].
53
Přednáška 8 Existuje několik definic integrálu funkce v prostoru Rn . Liší se zejména v množině funkcí, pro kterou je možné definovat integrál. Ale pokud existuje integrál podle různých definic, jsou integrály stejné. My se v přednášce budeme zabývat tzv. Riemannovým integrálem v Rn , a to zejména proto, že jeho definice je poměrně názorná. Ale většinou se zavádí tzv. Lebesgueův integrál, jehož hlavní výhoda spočívá v tom, že se velmi dobře chová při limitních přechodech. Lebesgueův integrál je v jistém smyslu ”zúplnění” Riemannova integrálu. Toto zúplnění je přechod velmi podobný tomu, jak se z neúplné množiny racionálních čísel konstruuje množina čísel reálných. O definici Lebesgueova integrálu se zmíníme v následující přednášce. Riemannův integrál v Rn Nechť je I ⊂ Rn omezený uzavřený interval, tj. ® ® ® I = a1 , b1 × a2 , b2 × · · · × an , bn ,
(1)
kde ai ≤ bi jsou reálná, a tedy konečná, čísla. Definice 1. Nechť je I ⊂ Rn interval definovaný v (1). Každou množinu bodů xij , i = 1, 2, . . . , n, j = 0, 1, 2 . . . , Ni ∈ N, kde xi0 = ai ≤ xi1 ≤ xi2 ≤ · · · ≤ xiNi = bi , nazýváme dělení intervalu I. Dělení intervalu, tj. výše uvedenou množinu bodů, budeme značit D. Množinu všech dělení intervalu I budeme značit D. Pro každé dělení D intervalu I označme Ij1 ,j2 ,...,jn , 1 ≤ jk ≤ Nk , interval ® ® ® Ij1 ,j2 ,...,jn = xj1 −1 , xj1 × xj2 −1 , xj2 × · · · × xjn −1 , xjn a ¡ ¢¡ ¢ ¡ ¢ dj1 ,j2 ,...,jn = xj1 − xj1 −1 xj2 − xj2 −1 . . . xjn − xjn −1
(2)
obsah n–dimenzionálního intervalu Ij1 ,j2 ,...,jn . x) reálná funkce omezená na intervalu I. Pro každé dělení D označme Nechť je f (x ¡ ¢ x) mj1 ,j2 ,...,jn = inf f (x x ∈Ij1 ,...,jn ¡ ¢ x) Mj1 ,j2 ,...,jn = sup f (x
(4)
(3)
(5)
x ∈Ij1 ,...,jn
a definujme s(f, D) =
N1 X N2 X j1 =1 j2 =1
S(f, D) =
Nn X
···
N1 X N2 X j1 =1 j2 =1
mj1 ,j2 ,...,jn dj1 ,j2 ,...,jn
(6)
Mj1 ,j2 ,...,jn dj1 ,j2 ,...,jn .
(7)
jn =1
···
Nn X jn =1
x) příslušný k Čísla s(f, D), resp. S(f, D) se nazývá dolní, resp. horní, integrální součet funkce f (x x) omezená na I, existují reálná čísla m = inf f (x x) a M = sup f (x x). dělení D. Protože je funkce f (x x ∈I
x ∈I
Ze zřejmého vztahu m ≤ mj1 ,...,jn ≤ Mj1 ,...,jn ≤ M , plyne, že pro každé dělení D intervalu I platí nerovnost mdI ≤ s(f, D) ≤ S(f, D) ≤ M dI , (8) kde dI je obsah intervalu I. Definice 2. Nechť je I je interval (1) a D1 , D2 jeho dvě dělení. Je-li každý bod dělení D1 bodem dělení D2 , nazveme dělení D2 zjemněním dělení D1 . Poznámka: Z definice 2 plyne, že když je dělení D2 zjemněním dělení D1 , obsahuje D2 všechny body dělení D1 a třeba i některé další dělící body. Tedy každý interval Ik1 ,k2 ,...,kn dělení D1 je sjednocením konečného počtu intervalů Jα dělení D2 . 54
Věta 1. Jestliže je dělení D2 intervalu I zjemnění dělení D1 intervalu I, je ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ s f, D1 ≤ s f, D2 ≤ S f, D2 ≤ S f, D1 .
(9)
Důkaz: Protože je D2 zjemněním dělení D1 je každý podinterval Ij1 ,J2 ,...,jn dělení D1 sjednocením jistých podintervalů dělení D2 , a to jmenovitě podintervalů s dělícími body ykr = xjr ≤ ykr +1 ≤ · · · ≤ ykr +s = xjr +1 , r = 1, 2, . . . , n. Označme tyto podintervaly Jα , α ∈ A. Tedy každý interval Ij1 ,j2 ,...,in lze psát jako sjednocení Ij1 ,j2 ,...,jn =
[
Jα .
α∈A
Označíme-li dα obsah intervalu Jα , pak platí dj1 ,j2 ,...,jn =
X
dα .
(10)
α∈A
Protože Jα ⊂ Ij1 ,j2 ,...,jn , platí nerovnosti mj1 ,j2 ,...,jn ≤ mα ≤ Mα ≤ Mj1 ,j2 ,...,jn . Tedy pro každý podinterX X val Ij1 ,j2 ,...,jn je mj1 ,j2 ,...,jn dj1 ,j2 ,...,jn ≤ mα dα ≤ Mα dα ≤ Mj1 ,j2 ,...,jn dj1 ,j2 ,...,jn . Součtem těchto nerovností pak dostaneme (9).
¤
α∈S
α∈S
Věta 2. Jestliže jsou D1 a D2 dvě dělení intervalu I, pak platí ¡ ¢ ¡ ¢ s f, D1 ≤ S f, D2 ,
(11)
Důkaz: Nechť je D0 dělení intervalu I, které obsahuje všechny dělící body dělení D1 a D2 . Protože D0 je zjemněním dělení D1 a D2 , plyne z věty 2 s f, D1 ≤ s f, D 0 ≤ S f, D0 ≤ s f, D2 .
¤
Ze vztahu (8) plyne, že existují konečná reálná čísla s(f ) = sup s(f, D) ≤ inf S(f, D) = S(f ) . D∈D
D∈D
(12)
Definice 3. Čísla s(f ), resp. S(f ) z (12) nazýváme dolní, resp. horní, Riemannův integrál funkce f (x) přes interval I. Jestliže v (12) platí rovnost s(f ) = S(f ) nazýváme toto číslo (Riemannův) integrál funkce f (x) x) je integrovatelná na intervalu I. Pro tento integrál používáme přes interval I a říkáme, že funkce f (x označení Z Z ¡ ¢ x) dV , a pod. f x1 , x2 , . . . , xn dx1 dx2 . . . dxn = f (x (13) I
I
x) je tzv. charakteristická funkce množiny Definice 4. Nechť M ⊂ Rn je omezená množina a χM (x M , která je definována předpisem ½ x) = χM (x
1
pro x ∈ M
0
pro x ∈ /M
(14)
Protože je M omezená, existuje interval I ∈ Rn takový, že M ⊂ I. Jestliže existuje Riemannův integrál Z x) dV , d(M ) = χM (x I
říkáme, že množina M je (Riemannovsky) měřitelná a číslo d(M ) se nazývá mírou (obsahem) množiny M . Poznámka: Snadno se lze přesvědčit, že v definici 4 nezávisí na volbě intervalu I ⊃ M . Jeden z podstatných rozdílů mezi Riemannovým a Lebesgueovým integrálem je v tom, že Lebesgueův integrál má podstatně více měřitelných množin. 55
x) funkce omezená na Definice 5. Nechť je M ⊂ Rn je Riemannovsky měřitelná množina a f (x množině M . Nechť je I interval v Rn takový, že M ⊂ I. Definujme funkci ½ x) f (x pro x ∈ M x) = fb(x 0 pro x ∈ I \ M x) integrovatelná na intervalu I, říkáme, že funkce f (x x) je integrovatelná na Jestliže je funkce fb(x množině M a píšeme Z Z Z ¢ ¡ ¢ ¡ x) dV = f (x f x1 , x2 , . . . , xn dx1 dx2 . . . dxn = fb x1 , x2 , . . . , xn dx1 dx2 . . . dxn . (15) M
M
I
Množinu všech funkcí, které mají Riemannův integrál přes množinu M budeme značit R(M ). Poznámka: Snadno se lze přesvědčit, že v definici 4 nezáleží na tom, jak vybereme interval I ⊃ M .
x) má Riemannův integrál přes interval I právě tehdy, když ke každému ε > 0 Věta 3. Funkce f (x existuje dělení D intervalu I takové, že S(f, D) − s(f, D) < ε .
(16) Z
x) Riemannův integrál přes interval I. Protože I = Důkaz: Nechť má funkce f (x
x) dV = inf S(f, D), existuje f (x I
D∈D
ε ke každému ε > 0 dělení D1 intervalu I takové, že S(f, D1 ) < I + . Podobně existuje k tomuto ε > 0 dělení D2 2 ε intervalu I takové, že I − < s(f, D2 ). Jestliže je D společné zjemnění dělení D1 a D2 , tj. obsahuje body z dělení 2 D1 i D2 , pak podle věty 1 platí s(f, D2 ) ≤ s(f, D) ≤ S(f, D) ≤ S(f, D1 ). Z toho plyne S(f, D) − s(f, D) ≤ S(f, D1 ) − s(f, D2 ) < I +
ε ε − I− = ε. 2 2
Tedy pokud je f ∈ R(M ), platí uvedená podmínka. Nyní dokážeme opačné tvrzení. Předpokládejme, že ke každému ε > 0 existuje dělení D intervalu I takové, že Z x) dV , tj. S(f ) − s(f ) > 0. Pro každé dělení D intervalu I platí nerovnost f (x platí (16) a neexistuje integrál M
S(f ) − s(f ) = inf S(f, D) − sup s(f, D) ≤ S(f, D) − s(f, D) . D∈D
D∈D
Podle předpokladu existuje ke každému ε > 0 dělení D takové, že S(f, D) − s(f, D) < ε. Zvolme ε = Pak existuje dělení D takové, že musí platit nerovnost S(f ) − s(f ) ≤ S(f, D) − s(f, D) < Ale to je spor s předpokladem, že S(f ) − s(f ) > 0.
S(f ) − s(f ) > 0. 2
S(f ) − s(f ) . 2
¤
Věta 4. Nechť jsou funkce f , f1 , f2 ∈ R(M ) a c ∈ R je konstanta. Pak jsou také funkce cf ∈ R(M ) a f1 + f2 ∈ R(M ) a platí Z Z x) dV = c x) dV , cF (x f (x (17) M M Z Z Z ¡ ¢ x) + f2 (x x) dV = x) dV + x) dV . f1 (x f1 (x f2 (x (18) M
M
M
x) = 0 ∈ R(M ) vztah (17) platí. Důkaz: Je-li c = 0 je funkce cf (x Předpokládejme, že c > 0. Nechť je I ⊂ Rn interval, pro který platí M ⊂ I. Pro každé dělení D intervalu I platí rovnost x) = cmj1 ,j2 ,...,jn x) = c f (x cf (x inf inf x ∈Ij1 ,j2 ,...,jn
sup x ∈Ij1 ,j2 ,...,jn
x) = c cf (x
x ∈Ij1 ,j2 ,...,jn
sup x ∈Ij1 ,j2 ,...,jn
56
x) = cMj1 ,j2 ,...,jn . f (x
Proto je s(cf, D) = cs(f, D) a S(cf, D) = cS(f, D). Ale z toho plyne, že s(cf ) = sup s(cf, D) = c sup s(f, D) = cs(f ) = cS(f ) = c inf S(f, D) = inf S(cf, D) . D∈D
D∈D
D∈D
D∈D
To dokazuje vztah (17) pro c > 0. Abychom tento vztah dokázali i pro c < 0 stačí ho dokázat pro c = −1. Rovnost (17) plyne okamžitě z toho, že pro každou množinu X ∈ R platí rovnosti inf (−x) = − sup (x)
x∈X
a
sup (−x) = − inf (x) .
x∈X
x∈X
x∈X
Abychom dokázali rovnost (18), uvažujme interval I ⊃ M . Pro každý interval Iα platí zřejmé nerovnosti x) + inf f2 (x x) ≤ inf f1 (x x) + f2 (x x) ≤ sup f1 (x x) + f2 (x x) ≤ sup f1 (x x) + sup f2 (x x) . inf f1 (x x ∈Iα
x ∈Iα
x ∈Iα
x ∈Iα
x ∈Iα
x ∈Iα
Z těchto nerovností plyne, že pro každé dělení D platí s f1 , D + s f2 , D ≤ s f1 + f2 , D ≤ S f1 + f2 , D ≤ S f1 , D + S f2 , D . Tedy platí nerovnosti
s f1 + s f2 ≤ s f1 + f2 ≤ S f1 + f2 ≤ S f1 + S f2 . (19) Z Z x) dV a s f2 = S f2 = x) dV , plyne rovnost (18) A protože podle předpokladů je s f1 = S f1 = f1 (x f2 (x M
¤ Přímo z věty 4 plyne
ze vztahu (19).
M
Důsledek. Jestliže jsou funkce fk ∈ R(M ) a ck ∈ R konstanty, k = 1, 2, . . . , r, pak je funkce r X x) = x) ∈ R(M ) a platí rovnost f (x ck fk (x k=1
Z
r X
x) dV = ck fk (x
M k=1
r X k=1
Z x) dV . fk (x
ck
(20)
M
Poznámka: Rovnost (20) znamená, že Riemannův integrál je lineární funkcí množiny čísel.
R(M ) do množiny reálných
Definice 6. Nechť je f : M → R, kde M ⊂ Rn . Funkci ¡ ¢ ¡ ¢ x) = max f (x x), 0 , resp. f− (x x) = max −f (x x), 0 f+ (x
(21)
x). nazýváme nezápornou, resp. nekladnou, částí funkce f (x
¯ ¯ x) ≥ 0 , f (x x) = f+ (x x) − f− (x x) a ¯f (x x)¯ = f+ (x x) + f− (x x). Důležitou roli, Pro tyto funkce platí f± (x kterou hrají tyto funkce v teorii integrálu, lze nahlédnout z následující věty. x) je integrovatelná na množině M právě tehdy, když jsou na M integrovatelné Věta 5. Funkce f (x x) a f− (x x). obě funkce f+ (x
x) = f+ (x x) − f− (x x), plyne z věty 4, že jsou-li obě funkce f+ (x x) a f− (x x) integrovatelné na množině Důkaz: Protože f (x x) a platí M , pak je integrovatelná i funkce f (x Z Z Z x) dV = x) dV − x) dV . f (x f+ (x f− (x M
M
M
x). Vezměme interval I ⊃ M . Podle věty 3 existuje ke každému ε > 0 Nechť naopak je integrovatelná funkce f (x dělení D intervalu I takové, žeS(f, D) − s(f, D) < ε. Ale, jak se snadno ověří, platí na každém dělícím intervaluIα x) − mα f± (x x) ≤ Mα f (x x) − mα f (x x) , kde Mα f (x x) = sup f (x x) a mα f (x x) = dělení D nerovnosti Mα f± (x x ∈Iα x) . Tedy pro výše zmíněné dělení D je inf f (x
x ∈Iα
S f± , D − s f± , D ≤ S(f, D) − s(f, D) < ε .
¤ Tuto větu nyní použijeme k důkazu toho, že součin dvou integrovatelných funkcí je integrovatelná funkce. x) jsou na M integrovatelné. Z věty 3 pak plyne, že funkce f± (x
57
¯ ¯ x) a g(x x) integrovatelné na množině M . Pak jsou integrovatelné funkce ¯f (x x)¯, Věta 6. Nechť jsou f (x ¢ ¡ ¢2 ¡ x) a f · g (x x). f (x x) jsou integrovatelné na množině M . Proto je i funkce f (x x) = f+ (x x) + f− (x x) Důkaz: Z věty 5 plyne, že funkce f± (x integrovatelná na množině M . 2 2 2 x) = f (x x) , lze při důkazu integrovanosti funkce f (x x) předpokládat, že funkce f (x x) je nezáporná. Protože f (x x) nezáporná, platí na každém Nechť je I interval takový, že M ⊂ I a D je dělení intervalu I. Protože je funkce f (x dělícím intervalu Iα rovnost x) = Mα f 2 = Mα2 f sup f 2 (x
a
x ∈Iα
inf
x ∈Iα
x) = mα f 2 = m2α f . f 2 (x
x) omezená, existuje K ∈ R takové, že 0 ≤ f (x x) < K. Pak ale platí nerovnost Protože předpokládáme, že je funkce f (x Mα f 2 − mα f 2 = Mα2 (f ) − m2α (f ) = Mα (f ) − mα (f ) · Mα (f ) + mα (f ) < 2K Mα (f ) − mα (f ) . x) integrovatelná, existuje ke každému ε > 0 dělení D intervalu I takové, že S(f, D) − s(f, D) < Protože je f (x Pak ale pro toto dělení D plyne z předcházející nerovnosti
ε . 2K
ε S f 2 , D − s f 2 , D ≤ 2K S(f, D) − s(f, D) < 2K = ε. 2K Integrabilita součinu dvou integrabilních funkcí pak plyne z rovnosti 2 2 i 1h x) + g(x x) − f (x x) = x) − g(x x) f · g (x f (x . 4 x) a g(x x) integrovatelné, jsou integrovatelné jejich lineární kombinace, mocniny a lineární Protože jsou funkce f (x kombinace mocnin. ¤
Z věty 6 plyne Věta 7. Nechť jsou M1 a M2 měřitelné množiny. Pak jsou také množiny M1 ∩ M2 , M1 ∪ M2 a M1 \ M2 měřitelné. x), charakteristickou funkci množiny M1 , resp. M2 . Snadno se ukáže, že pro x), resp. χM2 (x Důkaz: Označme χM1 (x charakteristické funkce platí rovnosti x) = χM1 (x x) · χM2 (x x) , χM1 ∩M2 (x
x) = χM1 (x x) + χM2 (x x) − χM1 (x x) · χM2 (x x) , χM1 ∪M2 (x
x) . x) · χM2 (x x) − χM1 (x x) = χM1 (x χM1 \M2 (x
(22)
Protože jsou množiny M1 a M2 měřitelné, jsou charakteristické funkce těchto množin integrovatelné, jsou podle věty 6 integrovatelné také charakteristické funkce množin M1 ∩ M2 , M1 ∪ M2 a M1 \ M2 . ¤ Poznámka. Z věty 7 plyne, že konečná sjednocení a konečné průniky měřitelných množin jsou měřitelné množiny a rozdíl dvou měřitelných množin je také měřitelná množina. Množinu množin, tj. množinu, jejíž prvky jsou množiny, která má tyto vlastnosti nazýváme množinovou algebrou. Tedy měřitelné množiny v Riemannově smyslu tvoří množinovou algebru. Ale tato množina nemusí obsahovat spočetná sjednocení, tj. jestliže jsou Mi , i ∈ N, měřitelné množiny, ∞ ∞ [ \ nemusí být množina Mi ani množina Mi měřitelná. Jestliže spočetná sjednocení a spočetné průniky množin i=1
i=1
množinové algebry patří do této algebry, nazýváme takovou algebru σ–algebrou. Množiny měřitelné v Riemannově smyslu tvoří pouze množinovou algebru a nikoliv σ–algebru. Při zavedení Lebesgueova integrálu je podstatná podmínka, že měřitelné množiny tvoří σ–algebru.
Důsledek. Nechť M1 a M2 jsou měřitelné množiny. Pak platí (1) (2) (3) (4)
d(M1 ∪ M2 ) = d(M1 ) + d(M2 ) − d(M1 ∩ M2 ); Jsou-li M1 a M2 disjunktní, tj. M1 ∩ M2 = ∅, je d(M1 ∪ M2 ) = d(M1 ) + d(M2 ); d(M1 ) = d(M1 ∩ M2 ) + d(M1 \ M2 ); Je-li M2 ⊂ M1 je d(M2 ) ≤ d(M1 ).
Důkaz: Protože χM1 (x)χM2 (x) = χM∩ M2 (x) plyne část (1) integrací druhé rovnosti v (22). Část (2) plyne z (1) a zřejmého faktu, že d(∅) = 0. Část (3) dostaneme z (2), když napíšeme M1 = M1 ∩ M2 ∪ M1 \ M2 a uvědomíme si, že na pravé straně je sjednocení disjunktních množin. Poslední tvrzení plyne z (3) a toho, že pro M2 ⊂ M1 je M1 ∩ M2 = M2 . Protože míra každé měřitelné množiny je nezáporná, dostaneme tvrzení (4). ¤
Velmi důležitou roli v teorii integrálu hrají tzv. množiny nulové míry. 58
Definice 7. Jestliže je M ⊂ Rn měřitelná množina taková, že Z x) dV = 0 , χM (x
d(M ) = M
nazýváme množinu M množinou míry nula nebo množinou nulové míry. x) platí pro všechna x ∈ M mimo bodů z množiny N ⊂ M Definice 8. Jestliže nějaká vlastnost V (x x) platí skoro všude na množině M . a množina N má míru nula, budeme říkat, že vlastnost V (x x) platí skoro všude na M budeme často psát jako: ”V (x x) platí s.v. na M ”. Tvrzení V (x Z x) = 0 s.v. na M . Pak je x) dV = 0 Věta 8. Nechť je f (x f (x M
x) 6= 0. Podle předpokladu Důkaz: Označme N ⊂ M množinu, kde f (x je míra této množiny rovna nule. Protože x) omezená, existuje konstanta K ∈ R, K > 0, taková, že f (x x) < K. Nechť je I ⊃ M interval. Protože je f (x R ε x . N χN (x ) dV = 0. Pak ke každému ε > 0 existuje dělení D intervalu I takové, že 0 ≤ s(χN , D) ≤ S(χN , D) < K Nechť Iα , α ∈ A, jsou intervaly z tohoto dělení takové, že Iα ∪ N 6= ∅. Pak ale platí S(f, D) =
X
M α dα < K
α∈A
s(f, D) =
X
X
dα = KS(χN , D) < ε ,
α∈A
mα dα > −K
α∈A
X
dα = −Ks(χN , D) > −ε .
α∈A
Z x) dV = 0. f (x
Tedy pro každé ε > 0 je −ε ≤ s(f ) ≤ S(f ) ≤ ε. Z toho ale plyne, že s(f ) = S(f ) =
¤
M
x) integrovatelná na množinách M1 a M2 . Nechť M = M1 ∪ M2 a Věta 9. Nechť je funkce f (x N = M1 ∩ M2 je množina míry nula. Pak platí Z
Z x) dV = f (x
M
Z x) dV + f (x
M1
x) dV . f (x
(23)
M2
x) definovanou na množině M = M1 ∪ M2 rovnost Důkaz: Podle (22) platí pro každou funkci f (x x) . x) − f (x x) · χM1 ∩M2 (x x) + f (x x) · χM2 (x x) · χM (x x) = f (x x) · χM1 (x f (x Protože podle předpokladů je množina M1 ∩ M2 množinou míry nula, dostaneme vzhledem k větě 8 integrací této rovnosti (23). ¤
Nyní se budeme trochu více zabývat množinami míry nula. Věta 10. Jestliže je M množina míry nula, je každá množina N ⊂ M množinou míry nula. Důkaz: Protože N ⊂ M stačí podle důsledku věty 7 dokázat, že množina N je měřitelná. ZNechť N ⊂ M a I je x) dV = 0, kde χM (x interval v Rn takový, že N ⊂ M ⊂ I. Protože je množina M měřitelná, existuje integrál I x) je charakteristická funkce množiny M . Protože S χm = 0, existuje ke každému ε > 0 dělení D intervalu I χM (x x) ≤ χM (x x). Proto pro výše zmíněné dělení D platí nerovnost takové, že S χM , D < ε, Ale protože N ⊂ M , je χN (x x) nezáporná, je S χN , D ≤ S χM , D < ε. A protože ε Z> 0 bylo libovolné, je S χN = 0. A protože je funkce χN (x x) dV = 0. ¤ 0 ≤ s χN ≤ S χN = 0. Tedy existuje χN (x
¡
I
¢ Věta 11. intervalu I = ® Nechť ®je funkce y = f x1 , x®2 , . . . , xn−1 spojitá na omezeném uzavřeném ◦ a1 , b1 × a2 , b2 × · · · × an−1 , bn−1 a nechť mají¡ v¢ otevřeném intervalu I omezené parciální © n derivace prvního řádu. Pak míra množinu M = f I = x ∈ R ; (x , . . . , x ) ∈ I , xn = 1 n−1 ¡ ¢ª f x1 , . . . , xn−1 rovna nule. x) spojitá na kompaktním intervalu Důkaz: Označme x = (x1 , x2 , . . . , xn−1 ) bod intervalu I. Protože je funkce y = f (x I, má na něm maximum L a minimum `. Tedy množina M je podmnožinou intervalu J = I × h`, Li. Naším úkolem Z je ukázat, že existuje integrál χM x , xn dV = 0, kde χM x , xn je charakteristická funkce množiny M . Protože J je funkce χM nezáporná, je s χM ≥ 0. Stačí tedy ukázat, že ke každému ε > 0 existuje dělení D intervalu J takové, že S χM , D < ε. 59
x) v intervalu I ◦ omezené parciální derivace, existují podle lemmatu 1.3 pro každé dva Protože má funkce y = f (x (1) (2) body x 1 , x 2 ∈ I body ξ , ξ , . . . , ξ (n−1) v intervalu I ◦ takové, že platí x2 ) − f (x x1 ) = f (x
n−1 X k=1
∂f ξ (k) x2,k − x1,k . ∂xk
x) jsou omezené existuje K ∈ Protože předpokládáme, že parciální derivace funkce y = f (x Tedy platí nerovnost
f (x x2 ) − f (x x1 ) < K(n − 1) x 2 − x 1 .
R takové, že fi (xx) < K. (24)
Vezměme dělení D intervalu I s dělícími body, které dělí hrany tohoto intervalu na N stejných dílů, tj. xi,k = k ai + bi − ai , i = 1, 2, . . . , n − 1 a k = 0, 1, . . . , N . Označme D = max b1 − a1 , b2 − a2 , . . . , bn−1 − an−1 . Pak N D pro každé i a k platí nerovnost xi,k+1 − xi,k ≤ . N x) spojitá na každém kompaktním intervalu Ii1 ,...,in−1 existuje v tomto intervalu body Protože je funkce f (x x) nabývá na intervalu Ii1 ,...,in−1 v tomto bodě minima, resp. α i1 ,...,in−1 , resp. β i1 ,...,in−1 , takové, že funkce f (x maxima. Z nerovnosti (24) podintervalu Ik1 ,k2 ,...,kn−1 je D . Mi1 ,...,in−1 − mi1 ,...,in−1 = f β i1 ,...,in−1 − f α i1 ,...,in−1 < K(n − 1) N
D Vezmeme dělení intervalu `, L na úsečky délky DN = K(n − 1) . Vzhledem k nerovnosti (24) protíná graf funkce N x) na každém intervalu Ii1 ,...,in−1 nejvýše dva z těchto intervalů. Tedy pro toto DN dělení intervalu J platí xn = f (x nerovnost D Dn−1 n−1 2KD n (n − 1) . S χM , DN < 2K(n − 1) N = n−1 N N N 2kDn n Jestliže je tedy ε > 0 a zvolíme N tak, aby bylo < ε, platí pro dělení DN nerovnost S χM , DN < ε. ¤ N
¡ ¢ x) = 0, Věta 12. Nechť je M množinou všech bodů x ∈ Rn takových, že F x1 , x2 , . . . , xn = F (x x) je spojitá, kde F (x má spojité parciální derivace prvního řádu na otevřené množině U ⊃ M a pro ° ° x) 6= 0. Pak pro každý kompaktní (omezený a uzavřený) interval I je každé x ∈ M je °grad F °(x M ∩ I množina míry nula.
Důkaz: Pro každý bod x 0 ∈ M existuje podle věty o implicitních funkcích index k, δ > 0 a ∆ > 0 takové, že xk = ϕk x1 , . . . , xk−1 , xk+1 , . . . , xn , xk − x0,k < ∆ a xi − x0,i < δ, i = 1, . . . , k − 1, k + 1, . . . , n. Přitom má funkce ϕk má spojité parciální derivace. Z věty 11 plyne, že pro každý bod x 0 ∈ M existuje okolí U x 0 takové, že x) spojitá a množina M je vzorem uzavřené množiny {0}, je množina M ∩ U x 0 má míru nula. Protože je funkce F (x množina M uzavřená. Protože interval I je kompaktní, je kompaktní i množina množin M ∩ I. Systém otevřených U x pokrývá kompaktní množinu M ∩ I. Tedy existuje konečná množina U x 1 , U x 2 , . . . , U x N , která pokrývá N N [ [ množinu M , tj. M ∩ I ⊂ U x i . Tedy platí M ∩ I = U x i ∩ M ∩ I. Protože každá z množin U x i ∩ M má i=1
i=1
míru nula, má nulovou míru také každé její konečné sjednocení, tedy i množina M ∩ I.
¤
Věta 13. Nechť je M měřitelná množina taková, že její hranice ∂M má míru nula. Pak je každá omezená funkce spojitá na M na množině M integrovatelná. xk = max |x1 |, |x2 |, . . . , |xn | . Důkaz: Při důkazu této věty budeme pod normou v Rn rozumět normu kx Nejprve předpokládejme, že množina M je uzavřená. Protože je M měřitelná, je omezená, a tedy kompaktní. Nyní dokážeme jednu pomocnou větu. x) spojitá na kompaktní množině M , je na M stejnoměrně spojitá, tj. ke každému ε > 0 Lemma. Je-li funkce f (x x − y k < δ, platí nerovnost f (x x) − f (y y ) < ε. existuje δ > 0 takové, že pro každé dva body x , y ∈ M , pro které je kx x) není na M stejnoměrně spojitá, tj. že platí tvrzení: Důkaz lemmatu: Předpokládejme, že spojitá funkce f (x ”Existuje x − y k < δ a f (x x) − f (y y ) ≥ ε”. Vezměme ε > 0 takové, že pro každé δ > 0 existují dva body x , y ∈ M , pro které je kx
1 xn ) − f (y y n ) ≥ ε. Uvažujme toto ε. Pro každé n ∈ N existují dva body x n , y n ∈ M takové, že x n − y n < a f (x n tuto posloupnost bodů x n ∈ M . Protože je množina M kompaktní, existuje vybraná podposloupnost x n vybraná z x) spojitá na M , platí posloupnosti x n , která je v M konvergentní. Označme lim x n = x 0 ∈ M . Protože je funkce f (x n→∞
1 lim f xn = f x0 . Uvažujme posloupnost y n takovou, že xn − y n < a f xn − f y n ≥ ε. Protože n→∞ n
x 0 − y ≤ x 0 − x n + x n − y < x 0 − x n + 1 , n n n 60
x) spojitá, je lim f y n = f x 0 . Ale na druhou stranu je konverguje posloupnost y n k x 0 . Protože je funkce f (x n→∞
0 = f x 0 − f x 0 = lim f x n − lim f y n = lim f x n − f y n ≥ ε > 0 , n→∞
což je spor.
n→∞
n→∞
¤
x) omezená, existuje K ∈ R takové, že f (x x) < K. Nechť je I interval takový, že M ⊂ I. Protože je funkce f (x x) integrovatelná podle věty 8. Nechť je V > 0. Protože Označme V míru množiny M . Jestliže je V = 0, je funkce f (x x) je spojitá na M , existuje podle Lemmatu pro každé ε > 0 předpokládáme, že množina M je kompaktní a funkce f (x ε x − y k < δ platí nerovnost f (x x) − f (y y ) < takové δ > 0, že pro každé x , y ∈ M , pro které je kx . Vezměme dělení 2V D1 intervalu I takové, že xi,k − xi,k−1 < δ, kde i = 1, 2, . . . , n a k = 1, 2, . . . , N1 . Tedy pro každé dva body x , y x − y k < δ. Protože hranice ∂M množiny M má míru nula, existuje dělícího intervalu Iα dělení D1 platí nerovnost kx ε ke každému ε > 0 dělení D2 intervalu I takové, že S χ∂M , D2 < . Nechť je D zjemnění obou dělení D1 a D2 . 4K ε Protože je D zjemněním dělení D2 platí nerovnost S χ∂M , D < . Navíc pro každé dva body x a y každého dělícího 2 ε x − y k < δ, a tedy f (x x) − f (y y ) < intervalu D platí kx . 2V Rozdělme intervaly dělení D na tři skupinu: I. Iα ∩ M = ∅; II. Iα ∩ ∂M 6= ∅; III. Iα ⊂ M ◦ . Je zřejmé, že každý dělící interval dělení D patří právě do jedné z těchto skupin. Proto lze psát S(f, D) − s(f, D) = SI (f, D) − sI (f, D) + SII (f, D) − sII (f, D) + SIII (f, D) − sIII (f, D) ,
(25)
kde SI (f, D) je horní Riemannův součet pro intervaly ze skupiny I., atd. Protože pro každý interval Iα ze skupiny I. je, Mα = mα = 0, je první závorka v (25) rovna nule. Pro každý interval Iα skupiny II. je Mα < K a mα > −K. Tedy platí nerovnost ε SII (f, D) − sII (f, D) < KS χ∂M D + KS χ∂M , D = 2KS χ∂M , D < . 2 ε x) − f (y y ) < Protože pro každé dva body x a y z intervalu Iα , který patří do skupiny III. platí nerovnost f (x , 2V ε je Mα − mα ≤ . Tedy platí nerovnost 2V SIII (f, D) − sIII (f, D) ≤
ε ε ε SIII χM , D ≤ V = . 2V 2V 2
A tedy z (25) plyne, že pro toto dělení D je S(f, D) − s(f, D) < ε. Nechť je nyní M libovolná Riemannovsky měřitelná množina a I je interval v Rn takový, že M ⊂ I. Protože x) omezená na M , existuje reálná konstanta K taková, že pro každé x ∈ M je f (x x) < K. Protože je funkce f (x ε je hranice ∂M množina míry nula, existuje dělení D intervalu I takové, že S χ∂M , D < . Nechť Ik , k = 8K 1, 2, . . . , N , je množina všech podintervalů dělení D takových, že I ∩ ∂M = 6 ∅. Ke každému z uzavřených k
intervalů bk = A1,k − B1,k × . . . An,k , Bn,k takový, že Ik = a1,k − b1,k × . . . an,k , bn,k sestrojíme otevřený interval I ai,k + bi,k = Ai,k + Bi,k a Bi,k − Ai,k = 21/N bi,k − ai,k , tj. otevřené intervaly se stejným středem a hranami délky N [ bk a M2 = M \ M1 . Je zřejmé, že ∂M ⊂ M1 , 21/N –krát délka každé hrany dělícího intervalu Ik . Označme M1 = I k=1
ε . Protože je měřitelná, protože je konečným sjednocením intervalů Ik a pro její velikost platí nerovnost d M1 ≤ 4K je množina M1 otevřená a M2 = M \ M1 , je množina M2 uzavřená a omezená, tj. kompaktní. Hranice množiny M2 x) spojitá na je podmnožinou konečného sjednocení stěn intervalů Ik , a tedy má míru nula. A protože je funkce f (x M2 , je na M2 integrovatelná. ε Tedy existuje dělení D2 intervalu I takové, že S f χM2 , D2 − s f χM2 , D2 < . K tomuto dělení D2 přidejme 2 bk . Takto získáme dělení D intervalu I, pro které platí: hraniční body intervalů I ε (1) S f χM2 , D − s f χM2 , D < , protože D je zjemnění dělení D2 2 ε (2) S f χM1 , D − s f χM1 , D ≤ 2Kd M1 ≤ , protože dělící intervaly dělení D, které mají neprázdný průnik 2 bk . s množinou M1 , jsou podintervaly I Z x) dV . ¤ Tedy pro toto dělení D platí nerovnost S(f, D) − s(f, D) < ε. Tedy existuje f (x M
61
Metody výpočtu Riemannova integrálu v Rn Při výpočtu Riemannova integrálu v prostoru Rn se většinou používají dvě věty: Fubiniova věta a věta o substituci. x, y ) ∈ Rn = Rr+s = Nejprve se budeme zabývat Fubiniovou větou. Zaveďme označení z = (x r s n r s n R × R , kde z ∈ R , x ∈ R a y ∈ R . Je-li M ⊂ R budeme psát © ª © ª x, y ) ∈ M , My = x ∈ Rr ; (x x, y ) ∈ M . Mx = y ∈ Rs ; (x © ª © ª M x = x ∈ Rr ; Mx 6= ∅ , M y = y ∈ Rs ; My = 6 ∅ . x, y ) funkce definovaná na množině M ⊂ Rn , definujme funkce f x : Mx → R a Jestliže je f (zz ) = f (x y x) = f (x x, y ). f : My → R, která jsou definovány předpisem f x (yy ) = f y (x Jestliže je I ⊂ Rn interval, platí rovnost I = Iy × Ix = I x × I y = I x × Ix = Iy × I y . Je zřejmé, že pro objem těchto intervalů platí rovnosti ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ V I = V I x · V Ix = V I y · V Iy . Pomocí Riemannova integrálu lze tuto rovnost zapsat jako Z
µZ
Z χI (zz ) dV =
I
¶ χx (yy ) dVy
Ix
ÃZ
Z dVx =
Ix
Iy
! x) dVx χy (x
dVy ,
(26)
Iy
kde symbol dVx , resp. dVy , znamená, že integrujeme přes proměnnou x , resp. y . Vztah (26) zobecňuje následující věta. x, y ) definovaná na M . Nechť existuje Věta 14. (Fubiniova věta) Nechť je M ⊂ Rn a funkce f (x integrál Z x, y ) dV f (x (27) M
a pro skoro všechna x ∈ Mx , resp. pro skoro všechna y ∈ My , existují integrály Z Z x) = F (x f x (yy ) dVy = f x (yy ) dy1 . . . dys , Mx
resp.
Mx
Z
(28)
Z x) dVx = f y (x
G(yy ) = My
x) dx1 . . . dxr . f y (x My
x) na množinu M x , resp. G(yy ) na množinu M y , v bodech, kde není Jestliže rozšíříme funkci F (x definována nulou, pak platí rovnost Z Z Z x, y ) dV = x) dVx = f (x F (x G(yy ) dVy . (29) M
Mx
My
Podle této věty lze Riemannův integrál v Rn najít pomocí výpočtu dvou Riemannových integrálů v prostorech menší dimenze. Postupnou aplikací této věty je pak možné najít integrál v Rn , pokud existuje, pomocí výpočtu n jednorozměrných Riemannových integrálů. Z Příklad 1. Najděte Riemannův integrál f (x, y, z) dV , kde M = (x, y, z) ∈ R3 ; 0 ≤ x2 + y 2 ≤ z ≤ 1 a M p f (x, y, z) = z x2 + y 2 . Řešení: Protože je funkce f (x, y, z) spojitá na M , hledaný integrál existuje. Lze tedy použít Fubiniovu větu. Uvažujme R3 jako součin R2 × R1 a prvek (x, y, z) ∈ M jako uspořádanou dvojici (x, y) ∈ R2 a z ∈ R. Pro ilustraci ukážeme dva případy rozkladu množiny M .
62
V prvním případě integrujeme nejprve funkci f(x,y) (z) přes množinu M(x,y) ⊂ R a získáme funkci F (x, y), kterou následovně integrujeme přes množinu M (x,y) ⊂ R2 . V tomto případě je M(x,y) = z ∈ R ; x2 + y 2 ≤ z ≤ 1 , Tedy
Z F (x, y) =
M (x,y) = (x, y) ∈ R2 ; 0 ≤ x2 + y 2 ≤ 1
1 x2 +y 2
z
p
x2 + y 2 dz =
a
f (x,y) (z) = z
p
x2 + y 2 .
2 p 1 1 − x2 + y 2 x2 + y 2 . 2
Z Fubiniovy věty pak dostaneme Z z M
Z p 2 p 1 x2 + y 2 dx dy dz = 1 − x2 + y 2 x2 + y 2 dx dy . 2 x2 +y2 ≤1
Tedy jsme výpočet integrálu přes množinu M ⊂ R3 převedli na výpočet integrálu v M (x,y) ⊂ R2 . Na tento integrál lze opět aplikovat Fubiniovu větu. Nyní je p p Mx = y ∈ R ; − 1 − x2 ≤ y ≤ 1 − x2 ,
M x = h−1, 1i
f (x) (y) =
a
p 1 1 − x4 − 2x2 y 2 − y 4 x2 + y 2 . 2
Integrál přes proměnnou y dává 1 F (x) = 2
Z √1−x2 −
√
1−x2
1−x4 −2x2 y 2 −y 4
A tedy
p
Z z
x2 + y 2 dy =
p
1 5 2 5 4 − x − x 3 24 16 Z
1
x2 + y 2 dx dy dz =
M
√ p 1 + 1 − x2 x2 1 − x2 + 8−5x4 ln . 16 |x|
F (x) dx = −1
4 π. 21
V druhém přístupu integrujeme nejprve přes množinu Mz ⊂ R2 a pak přes množiny M z ⊂ R. Snadno zjistíme, že Mz = (x, y) ∈ R2 ; 0 ≤ x2 + y 2 ≤ z
a
M z = h0, 1i .
z
p x2 + y 2 dx dy .
Funkce G(z) je dána dvojným integrálem Z
Z f (z) (x, y) dx dy =
G(z) = Mz
0≤x2 +y 2 ≤z
Na tento dvojný integrál lze opět použít Fubiniovu větu. Nyní je p p Mx = y ∈ R ; − z − x2 ≤ y ≤ z − x2
a
√ √ Mx = x ∈ R ; − z ≤ x ≤ z .
Tedy funkci G(z) najdeme pomocí dvou integrálů
F (z) (x) = Z G(z) = A konečně je
Z √z−x2 √
− √ z
√ − z
Z z M
p
z−x2
z
p
q x2 + y 2 dy = z
F (z) (x) dx =
z(z − x2 ) + x2 ln
! √ √ z + z − x2 |x|
2 πz 5/2 . 3 Z
1
x2 + y 2 dx dy dz =
G(z) dz = 0
2 π 3
Z 0
1
z 5/2 dz =
4 π. 21
Při výpočtu Riemannových integrálů v prostoru Rn s použitím Fubiniovy věty často narážíme na dvě obtíže. První z nich je najít analytické popis množin Mx a M x . Ten může být často dost kompx). Tento problém bylo u jednorozměrných likovaný. Druhá je pak samotný tvar integrované funkce f (x integrálů často možné vyřešit tak, že jsme do integrálu zavedli novou proměnnou. Tohoto postupu se často používá i u více rozměrných integrálů. K tomu slouží následující věta. 63
x) prosté regulární zobrazení otevřené množiny X ⊂ Rn na Věta 15. (o substituci) Nechť je ϕ(x n x) jakobián zobrazení množinu Y ⊂ R . Nechť je M ⊂ X, f (yy ) funkce definovaná na ϕ(M ) a Dϕ (x ϕ. Pak platí Z Z ¯ ¡ ¢¯ x) ¯Dϕ (x x)¯ dx1 . . . dxn , f (yy ) dy1 . . . dyn = f ϕ(x (30) ϕ(M )
M
pokud oba integrály v (30) existují. Jak je vidět z věty 15, substituce nemění pouze integrovanou funkci, ale také podstatně oblast M , přes kterou integrujeme. Proto se na rozdíl od jednorozměrných integrálů pomocí substituce nesnažíme pouze zjednodušit integrovanou funkci, ale také integrační oblast. To je při výpočtu vícerozměrných integrálů velmi podstatné. Například jestliže se nám podaří transformovat oblast M na interval, stačí podle Fubiniovy věty najít n jednorozměrných integrálů, i když většinou poměrně složitých. Z Příklad 2. V příkladě 1 jsme poměrně složitě hledali integrál
x2 +y 2 ≤1
1 − x2 + y 2
2 p x2 + y 2 dx dy. Výpočet
by se značně zjednodušil, kdybychom v tomto integrálu zavedli místo proměnných x a y polární souřadnice r a ϕ vztahy x = r cos ϕ a y = r sin ϕ. Jak víme z přednášky 6, je toto zobrazení regulární na množině M = (r, ϕ) ; r > 0 ϕ ∈ (0, 2π) , kterou zobrazuje prostě na množinu R2 \ R+ , kde R+ = (x, 0) ∈ R2 ; x ≥ 0 . Jakobián tohoto zobrazení je J(r, ϕ) = r > 0. Jestliže toto zobrazení zúžíme na množinu M0 danou vztahy 0 < r < 1, 0 < ϕ < 2π, získáme prosté regulární zobrazení množiny M1 na množinu danou vztahy 0 < x2 + y 2 < 1. Protože množiny [0; 0] a x2 + y 2 = 1 mají míru nula je Z Z 2 p 2 p 1 − x2 + y 2 x2 + y 2 dx dy = 1 − x2 + y 2 x2 + y 2 dx dy = x2 +y 2 ≤1
Z
1 − r r2 dr dϕ =
Z
2π
4
=
0<x2 +y 2 <1 Z 1 2 6
dϕ · 0
0
r −r
dr =
0
8 π. 21 Z
∞
Příklad 3. V tomto příkladě najdeme pomocí věty o substituci tzv. Gaussův integrál
exp −x2 dx. Tento integrál
0
je velmi důležitý v teorii pravděpodobnosti a matematické statistice. Jedná se o nevlastní Riemannův integrál. Protože platí nerovnosti 0 ≤ exp −x2 ≤ f (x), kde f (x) = 1 pro x ∈ h0, 1i a f (x) = e−x pro x ∈ (1, ∞) a funkce f (x) je integrovatelná, existuje tento nevlastni Riemannův integrál a platí Z ∞ Z R exp −x2 dx = lim exp(−x2 dx . Z Označme I = 0
R→∞
0 ∞
exp −x2 dx a IR = Z
2 I 2 = lim IR = lim R→∞
R→∞
R
Z
R
exp −x
2
0
exp −x2 dx ·
0
dx. Pak je
Z
R
exp −y 2 dy
Z
0
0
exp −x2 − y 2 dx dy ,
= lim
R→∞
MR
kde MR = (x, y) ∈ R2 ; x > 0 , y > 0 , max(x, y) < R , protože dvojný integrál vpravo existuje. Jestliže označíme KR = (x, y) ∈ R2 ; x > 0 , y > 0 , x2 + y 2 < R2 , snadno se přesvědčíme, že platí KR ⊂ MR ⊂ KR√2 . Tedy platí nerovnosti Z Z 2 exp −x2 − y 2 dx dy ≤ IR ≤ exp −x2 − y 2 dx dy . x2 +y 2
0, y>0
x2 +y 2 <2R2 x>0, y>0
Z
exp −x2 − y 2 dx dy. Do tohoto integrálu zavedeme polární souřadnice x =
Nechť R > 0. Najdeme integrál KR
r cos ϕ, y = r sin ϕ, kde r > 0 a 0 < ϕ < 2π. Protože toto zobrazení je regulární a množina 0 < r < R, 0 < ϕ < zobrazí prostě na množinu KR , plyne z věty o substituci Z Z Z π R π exp −x2 − y 2 dx dy = exp −r2 r dr dϕ = exp −r2 r dr = 1 − exp −R2 . 2 4 KR 0 0
Tedy platí nerovnosti
π π 2 1 − exp − R2 ≤ IR ≤ 1 − exp −2R2 . 4 4 Jestliže přejdeme k limitě R → ∞, dostaneme √ Z ∞ π π I2 = =⇒ I = exp −x2 dx = . 4 2 0
64
π se 2
Přednáška 9 Jak se ukazuje, je Riemannův integrál příliš omezený. V moderní matematice se s Riemannovým integrálem už prakticky nesetkáte. Integrály jsou definovány trochu jinak. V obvyklých případech se počítají sice stejně, ale z hlediska teorie je to něco úplně jiného. Proto se v této přednášce se stručně zmíním o obecné teorii integrálu. Základem obecné teorie integrálu je teorie míry, která v podstatě říká, přes které množiny, měřitelné množiny, lze integrovat a přiřazuje jim jejich míru, tj. ”objem”. Pak se definují funkce na měřitelných množinách, měřitelné funkce, pro které má smysl integrály počítat a integrál měřitelných funkcí. Oba tyto pojmy jsou definovány abstraktně pomocí axiomů, a proto je v podstatě jedno, jak jsou měřitelné množiny a měřitelné funkce konkrétně definovány. Samozřejmě konkrétní numerický výpočet integrálů závisí na míře a měřitelných funkcích a obecně se provést nedá. My se v dalších přednáškách zaměříme na výpočet integrálů přes k–rozměrné nadplochy v prostoru Rn . Definice. Funkci f : X → h−∞, +∞i nazýváme zobecněnou funkcí. Poznámka: Pro zobecněné funkce připouštíme, aby jejich funkční hodnoty byly ±∞.
Úmluva: V této přednášce budeme definovat 0 · (±∞) = 0. Teorie míry Definice 1. Nechť X je množina. Neprázdný systém M podmnožin množiny X se nazývá množinovou algebrou, jestliže platí (1) Pro každou množinu A ∈ M je X \ A ∈ M. n [ (2) Jestliže Ai ∈ M, i = 1, 2, . . . , n, pak Ai ∈ M. (3) Jestliže Ai ∈ M, i = 1, 2, . . . , n, pak
i=1 n \
Ai ∈ M.
i=1
Poznámka: Z rovností A ∩ (X \ A) = ∅
a
A ∪ (X \ A) = X
plyne, že systém M obsahuje prázdnou množinu a celou množinu X. Z de Mogranových vzorců A ∩ B = X \ (X \ A) ∪ (X \ B) a A ∪ B = X \ (X \ A) ∩ (X \ B) plyne, že vlastnosti (2) a (3) v definici jsou ekvivalentní.
Povšimněte si toho, že množiny měřitelné v Riemannově smyslu tvoří množinovou algebru. Ale pro množinovou algebru nelze definovat takové operace jako je limita. Nevím, zda si to uvědomujete, ale hlavní rozdíl mezi algebrou a analýzou je v tom, že v algebře počítáme s tzv. bodovými množinami, tj. například sčítáme čísla. Naopak v matematické analýze se většinou nepracuje s čísly, ale s číslem a jeho okolím. Proto by bylo z hlediska matematické analýzy vhodné, aby bylo také sjednocení nebo průnik nejen konečného, ale také ”nekonečného” počtu měřitelných množin měřitelná množina. Ale ukazuje se, že nekonečno v matematice není pouze jedno. Nejjednodušší nekonečná množina je množina přirozených čísel. Problém je v tom, jak vlastně definovat počet prvků množiny. U konečné množiny je přirozené, že říkáme, že množina M má n prvků, pokud existuje vzájemně jednoznačné zobrazení množiny M na množinu n = {1, 2, . . . , n}. U nekonečných množin je to ale složitější. Například se zda docela zřejmé, že množina všech kladných sudých čísel je menší než n množina všech kladných čísel. Ale když přiřadíme každému sudému přirozenému číslu n číslo , 2 dostaneme vzájemně jednoznačné zobrazení množiny všech sudých přirozených čísel na množinu všech přirozených čísel. Z tohoto pohledu mají obě tyto množiny stejný počet prvků. Toto je obecná vlastnost nekonečných množin. Proto říkáme, že dvě množiny A a B mají stejný počet prvků (stejnou mohutnost), když existuje vzájemně jednoznačné zobrazení množiny A na množinu B. Definice. Množina, která má stejnou mohutnost jako množina přirozených čísel N se nazývá spočetná. Příklad: Může Vám to připadat podivné, ale množina všech racionálních čísel 65
Q je spočetná.
Například spočtené sjednocení spočetných množin je spočetná množina. Kartézský součin konečně mnoha spočetných množin je také spočetná množina.
V teorii míry nepožadujeme pouze to, aby konečné množinové operace (sjednocení a průnik) mezi měřitelnými množinami byly měřitelné množiny, ale aby také spočetné množinové operace mezi měřitelnými množinami byly měřitelné množiny. Definice 2. Nechť X je množina. Neprázdný systém M podmnožin množiny X se nazývá množinovou σ–algebrou, jestliže platí (1) Pro každou množinu A ∈ M je X \ A ∈ M. ∞ [ (2) Jestliže Ai ∈ M, i ∈ N, pak Ai ∈ M. (3) Jestliže Ai ∈ M, i ∈ N, pak
i=1 ∞ \
Ai ∈ M.
i=1
Poznámka: Je zřejmé, že každá množinová σ–algebra je také množinovou algebrou. Tedy obsahuje celou množinu X a prázdnou množinu. Příklad: Pro každou množinu X je systém U všech jejich podmnožin σ–algebra.
\
Věta 1. Nechť jsou Mα , α ∈ S, σ-algebry množiny X. Pak je M =
Mα také σ–algebra.
α∈S
Důkaz: Protože X ∈ je An ∈ ∞ [
An ∈
n=1
Mα , pro každé α ∈ S, je M neprázdný systém podmnožin. Je-li An ∈ M pro každé n ∈ N,
Mα pro každé α ∈ S. Ale protože Mα jsou σ–algebry, je také \
∞ [
An ∈
Mα pro každé α ∈ S. Tedy
n=1
Mα . ¤
α∈S
Věta 2. Nechť je X množina a K libovolný neprázdný systém podmnožin množiny X. Pak existuje právě jedna σ–algebra M, pro kterou je K ⊂ M a pro každou σ-algebru M0 , pro kterou je K ⊂ M0 platí M ⊂ M0 . Důkaz: Uvažujme množinu S všech σ–algeber Mα takových, že K ⊂ Mα . Protože systém všech podmnožin množiny X \je σ–algebra, která obsahuje K, není tato množina prázdná. σ–algebru M pak definujeme jako průnik M = Mα . ¤ α∈S
Definice 3. Nechť je X metrický prostor a B je nejmenší σ–algebra, která obsahuje všechny otevřené podmnožiny X. Množiny ze systému B se nazývají Borelovské množiny. Poznámka: Protože každou uzavřenou podmnožinu B metrického prostoru X lze napsat jako B = X \ A, kde A je otevřená množina, jsou všechny uzavřené množiny Borelovské. Borelovské jsou také spočetné průniky otevřených množin (těmto množinám se říká množiny typu Gδ ) a spočetná sjednocení uzavřených množin (množiny typu Fσ ).
Definice 4. Každá funkce µ na množinové σ–algebře M množiny X, pro kterou platí (1) pro každou množinu A ∈ M je 0 ≤ µ(A) ≤ ∞, (2) µ(∅) = 0, Ã (3) pro každou disjunktní posloupnost An ∈ M je µ
∞ [ n=1
! An
=
∞ X ¡ ¢ µ An n=1
se nazývá míra. Pro A ∈ M se nezáporné číslo µ(A) nazývá míra množiny A. Množiny, které patří do σ–algebry M, na které je definována míra µ, se nazývají µ–měřitelné. Poznámka: Podmínka (1) říká, že míra je nezápornou zobecněnou funkcí množiny. Podmínka (3), která tvrdí, že míra spočetného sjednocení disjunktních měřitelných množin je rovna součtu měr jednotlivých množin, se nazývá σ–aditivita míry.
Pro každou míru µ platí: Věta 3. Jsou-li A, B ∈ M, A ⊂ B, pak µ(A) ≤ µ(B). Důkaz: Protože B = A ∪ (B \ A) jsou měřitelné disjunktní množiny, je µ(B) = µ(A) + µ(B \ A) ≥ µ(A). 66
¤
Věta 4. Jsou-li A, B ∈ M, A ⊂ B a µ(A) < ∞, pak µ(B \ A) = µ(B) − µ(A). Ã∞ ! ∞ [ X ¡ ¢ Věta 5. Pro každou posloupnost množin An ∈ M platí µ An ≤ µ An . n=1
n=1
Poznámka: Vlastnost z věty 5 nazýváme spočetnou subaditivitou. Důkaz: Položme B1 = A1 , B2 = A2 \ B1 , . . . , Bn = An \ A1 ∪ A2 ∪ · · · ∪ An−1 . Pak jsou množiny Bn disjunktní, n n [ [ Bn = An a Bn ⊂ An . Tedy platí nerovnost i=1
i=1
µ
!
∞ [
An
!
∞ [
=µ
n=1
Bn
∞ X
=
n=1
∞ X µ Bn ≤ µ An .
n=1
¤
n=1
Definice 5. Je-li A ∈ M a µ(A) = 0 říkáme, že A je množina míry nula. Věta 6. Jestliže je A ∈ M, A ⊂ B a µ(B) = 0, je µ(A) = 0. Sjednocení konečné nebo spočetné množin míry nula je množina míry nula. ¤
Důkaz: plyne ze σ–subaditivity míry.
Definice 6. Jestliže je každá podmnožina každé množiny míry nula měřitelná, říkáme, že míra µ je úplná. Definice 7. Jestliže je µ(A) < ∞, říkáme, že množina A má konečnou míru. Jestliže je míra celého prostoru X konečná, tj. jestliže je µ(X) < ∞, řekneme, že míra µ je konečná. Je-li celý prostor X sjednocením spočetné posloupnosti množin konečné míry, říkáme, že míra µ je σ–konečná. Pro míru na měřitelných množinách je velmi důležité následující tvrzení Věta 7. Nechť An je neklesající posloupnost měřitelných množin, tj. pro každé n ∈ N je An ⊂ An+1 . Pak je Ã∞ ! [ ¡ ¢ An = lim µ An . µ n→∞
n=1
¡ ¢ Jestliže je An nerostoucí posloupnost měřitelných množin, tj. An+1 ⊂ An , a µ A1 < ∞, pak platí Ã
∞ \
µ
! An
¡ ¢ = lim µ An . n→∞
n=1
Důkaz: Nechť B1 = A1 , B2 = A2 \ A1 , . . . , Bn+1 = An+1 \ An . Pak jsou množiny Bn měřitelné, disjunktní a n [ An = Bn . Ze σ–aditivity míry µ pak pro každé n ∈ N plyne i=1
µ
n [
! Ai
n [
=µ
i=1
! Bi
=
i=1
n X
µ Bi = µ An .
i=1
A protože limita obou stran rovnosti existuje, je lim µ
n→∞
n [
! Ai
=µ
∞ [
! An
n=1
i=1
= lim µ An . n→∞
Ve druhém případě splňují množiny Bn = A1 \ An předpoklady prvního tvrzení této věty. Protože je µ A1 ) < ∞, platí µ A1 ) − µ
∞ \ n=1
! An
=µ
A1 \
∞ \ n=1
! An
=µ
∞ [
A1 \ An
n=1
67
!
= lim µ A1 \ An = µ A1 − lim µ An . n→∞
n→∞
¤
Měřitelné funkce Definice 8. Nechť je f funkce definovaná na měřitelné množině A. Řekneme, že funkce f (x) je měřitelná, jestliže pro každé a ∈ R je měřitelná množina © ª f (−1) (−∞, a) = x ∈ A ; f (x) < a . Věta 8. Je-li funkce f (x) měřitelná, pak jsou pro každé a ∈ R měřitelné množiny © ª x ∈ A ; f (x) ≤ a © ª x ∈ A ; f (x) > a © ª x ∈ A ; f (x) ≥ a . Důkaz: Protože
∞ \ 1 x ∈ A ; f (x) < a + x ∈ A ; f (x) ≤ a = , n n=1
je množina x ∈ A ; f (x) ≤ a měřitelná. Měřitelnost dalších množin plyne ze vztahů x ∈ A ; f (x) > a = A \ x ∈ A ; f (x) ≤ a x ∈ A ; f (x) ≥ a = A \ x ∈ A ; f (x) < a .
¤
Věta 9. Jsou-li funkce f (x) a g(x) měřitelné, jsou měřitelné všechny množiny © ª © ª © ª x ; f (x) < g(x) , x ; f (x) ≤ g(x) , x ; f (x) = g(x) . Důkaz: Pro každé racionální číslo q ∈ rovnost
Q je množina Mq = x ; f (x) < q ∩ x ; g(x) > q měřitelná. Protože platí [ x ; f (x) < g(x) = Mq , q∈Q
je tato množina měřitelná. Měřitelnost druhé množiny plyne z rovnosti x ; f (x) ≤ g(x) = A \ x ; g(x) < f (x) a třetí množiny z rovnosti
x ; f (x) = g(x) = x ; f (x) ≤ g(x) ∩ x ; g(x) ≤ f (x) .
¤
Poznámka: Z definice měřitelné funkce je zřejmě, že konstantní funkce f (x) = c definovaná na měřitelné množině A je měřitelná. Z věty 9 pak plyne, že pro každé c ∈ R jsou množiny x ∈ A ; f (x) = c a x ∈ A ; f (x) 6= c měřitelné.
Věta 10. Je-li ¯ funkce f (x) měřitelná na měřitelné množině A a B je měřitelná podmnožina A, je funkce g = f ¯B měřitelná. Důkaz: Věta plyne z toho, že množina x ∈ B ; g(x) < a = B ∩ x ∈ A ; f (x) < a je měřitelná.
Věta 11. Nechť je funkce f (x) definovaná na množině A = ¯ f ¯An (x) jsou měřitelné. Pak je funkce f (x) měřitelná.
∞ [
¤
An a všechny funkce gn (x) =
n=1
∞ [ x ∈ An ; gn (x) < a . Důkaz: Věta plyne z rovnosti x ∈ A ; f (x) < a =
¤
n=1
Věta 12. Je-li funkce f (x) definovaná na množině A měřitelná a je-li B měřitelná podmnožina A, je funkce ½ f (x) pro x ∈ B g(x) = 0 pro x ∈ A \ B měřitelná. Důkaz: Věta plyne z rovnosti x ∈ A ; f (x) < a =
(
B ∩ x ∈ A ; f (x) < a A \ B ∪ x ∈ A ; f (x) < a
68
pro a ≤ 0 pro a > 0
¤
Věta 13. Je-li funkce f (x) měřitelná na množině A, je pro každé c ∈ R měřitelná funkce cf (x). Jsou-li f (x) a g(x) měřitelné funkce na množině A, pak jsou na A měřitelné funkce f + g a f − g. Důkaz: Je-li c = 0 je funkce cf (x) = 0, a tedy je měřitelná. Jestliže je c > 0, plyne z rovnosti n ao x ∈ A ; cf (x) < a = x ∈ A ; f (x) < , c že pro každé a ∈ R je množina x ∈ A ; cf (x) < a měřitelná, a tedy cf (x) je měřitelná funkce. Pro c < 0 plyne měřitelnost funkce cf (x) z rovnosti n ao x ∈ A ; cf (x) < a = x ∈ A ; f (x) > . c Protože platí rovnost x ∈ A ; g(x) + c < a = x ∈ A ; g(x) < a − c , je pro každé c ∈ R funkce g(x) + c měřitelná. Proto je podle věty 9 měřitelná množina x ∈ A ; f (x) − g(x) < c = x ∈ A ; f (x) < g(x) + c . Tedy funkce f (x) − g(x) je měřitelná. Z dokázaných tvrzení pak plyne, že funkce f (x) + g(x) = f (x) − (−1) · g(x) je měřitelná. ¤
Důsledek. Jestliže jsou funkce fi (x), i = 1, 2, . . . , n měřitelné a ci libovolná reálná čísla, je funkce f (x) = c1 f1 (x) + c2 f2 (x) + · · · + cn fn (x) měřitelná, tj. lineární kombinace konečného počtu měřitelných funkcí je měřitelná funkce. Věta 14. Součin dvou měřitelných funkcí je měřitelná funkce. Důkaz: Nechť f (x) je měřitelná funkce. Z rovnosti ( ∅ x ∈ A ; f 2 (x) < a = √ √ x ∈ A ; f (x) < a ∩ x ∈ A ; f (x) > − a
pro a ≤ 0 pro a > 0
plyne, že pro každou měřitelný funkci f (x) je funkce f 2 (x) měřitelná. Jsou-li f (x) a g(x) měřitelné funkce, jsou 2 2 měřitelné také funkce f (x) + g(x), f (x) − g(x), f (x) + g(x) a f (x) − g(x) . Tedy je měřitelná také funkce 2 2 1 f (x) · g(x) = f (x) + g() − f (x) − g(x) . ¤ 4
¡ ¢ Definice 9. Nechť f (x) je zobecněná reálná funkce. Funkce f+ (x) = max f (x), 0 , resp. f− (x) = ¡ ¢ max −f (x), 0 , se nazývají nezáporná, resp. nekladná, část funkce f (x). Poznámka: Z definice funkcí f+ (x) a f− (x) je ihned vidět, že platí vztahy f (x) = f+ (x) − f− (x) a f (x) = f+ (x) + f− (x).
¡ ¢ ¡ ¢ Věta 15. Jsou-li f (x) a g(x) měřitelné funkce. Pak jsou funkce max f (x), g(x) a min f (x), g(x) měřitelné. Důkaz: Věta plyne z rovností x ∈ A ; max f (x), g(x) < a = x ∈ A ; f (x) < a ∩ x ∈ A ; g(x) < a x ∈ A ; min f (x), g(x) < a = x ∈ A ; f (x) < a ∪ x ∈ A ; g(x) < a , což jsou pro každé a ∈ R měřitelné množiny.
¤
¯ ¯ Důsledek. Je-li f (x) měřitelná funkce, jsou funkce f+ (x), f− (x) a ¯f (x)¯ měřitelné. Na rozdíl od Riemannovsky měřitelných funkcí mají funkce měřitelné v námi definovaném smyslu lepší vlastnosti pokud se týká limit posloupností měřitelných funkcí. Věta 16. Jsou-li funkce fn (x) pro každé n ∈ N mžitelné, jsou měřitelné také funkce sup fn (x) a n∈N
inf fn (x).
n∈N
Důkaz: Snadno se ověří, že pro každé a ∈ R platí rovnosti ( ) x ∈ A ; sup fn (x) > a
=
n∈N
∞ [
x ∈ A ; fn (x) > a
n=1
∞ [ x ∈ A ; fn (x) < a . x ∈ A ; inf fn (x) < a = n∈N
n=1
Tedy pro každé a ∈ R jsou množiny na levé straně rovny spočetnému sjednocení měřitelných množin, a tedy měřitelné. Z toho plyne měřitelnost funkcí sup fn (x) a inf fn (x). ¤ n∈N
n∈N
69
Věta 17. Pro každou posloupnost fn (x) měřitelných funkcí jsou funkce lim sup fn (x) a lim inf fn (x) n∈N
n∈N
měřitelné.
!
Důkaz: Snadno lze dokázat, že lim sup fn (x) = inf
n∈N
n∈N
sup fm+n (x)
m∈N
a lim inf fn (x) = sup n∈N
n∈N
inf fm+n (x) . Podle
m∈N
věty 16 jsou pro každé n ∈ N funkce gn (x) = sup fm+n (x) a hn (x) = inf fm+n (x) měřitelné. Proto jsou měřitelné m∈N
m∈N
¤
také funkce inf gn (x) = lim sup fn (x) a sup hn (x) = lim inf fn (x). n∈N
n∈N
n∈N
n∈N
Věta 18. Pro každou posloupnost fn (x) měřitelných funkcí je množina B všech bodů, v nichž existuje lim fn (x), měřitelná a funkce lim fn (x) na B měřitelná funkce. n→∞
n→∞
Důkaz: Množina B je definována vztahem ( B=
)
x ∈ A ; lim sup fn (x) = lim inf fn (x) n∈N
n∈N
,
a proto je měřitelná. Protože lim fn (x) je zúžení funkce lim sup fn (x) na měřitelnou podmnožinu B, je funkce n→∞
lim fn (x) měřitelná funkce.
n→∞
n∈N
¤
Jednoduché funkce Definice 10. Jednoduchou funkcí budeme nazývat každou konečnou nezápornou měřitelnou funkci, která nabývá pouze konečného počtu hodnot. Jestliže označíme ¡ ¢ a1 , a2 , . . . , an všechny hodnoty jednoduché funkce f (x) definované na množině A a Ai = f−1 ai , i = 1, 2, . . . , n, lze zapsat funkci f (x) ve tvaru f (x) =
n X
ai χAi ,
i=1
kde χX je charakteristická funkce množiny X. Je zřejmé, že každá konečná lineární kombinace jednoduchých funkcí s nezápornými konstantami je jednoduchá funkce a součin jednoduchých funkcí je také jednoduchá funkce. Dále platí velmi důležitá Věta 19. Je-li f (x) nezáporná měřitelná funkce, existuje posloupnost jednoduchých funkcí fn (x) takových, že fn (x) ≤ fn+1 (x) a lim fn (x) = f (x). n→∞
m m m+1 právě tehdy, když je n ≤ f (x) < , kde m = 2n 2 2n 0, 1, 2, . . ., n · 2n − 1 a fn (x) = n pro f (x) ≥ n. Protože je funkce f (x) měřitelná, jsou měřitelné také množiny m m+1 Am,n = x ; n ≤ f (x) < a množina An = x ; f (x) ≥ n . Tuto funkci lze zapsat ve tvaru 2 2n
Důkaz: Nechť je n ∈
N. Definujme funkci fn (x) =
fn (x) =
n n·2 X−1
m=0
m χAmn (x) + nχAn (x) . 2n
Je zřejmé, že funkce fn (x) je jednoduchá. m m+1 M m Nechť je fn+1 (x) = n+1 . Pak je n+1 ≤ f (x) < n+1 . V takovém bodě je hodnota funkce fn (x) = n , kde 2 2 2 2 hmi M M +1 ≤ f (x) < . Z toho ale plyne, že M ≤ (celá část), a tedy fn (x) ≤ fn+1 (x). Jestliže je fn+1 (x) = n + 1, n n 2 2 2 je f (x) ≥ n + 1, a tedy fn (x) = n < n + 1 = fn+1 (x). Nyní dokážeme, že pro každé x je lim fn (x) = f (x). Je-li f (x) < ∞, existuje n0 ∈ N takové, že f (x) < n0 . Pro n→∞
1 , což ukazuje, že lim fn (x) = n→∞ 2n platí fn (x) = n, a tedy opět lim fn (x) = f (x). ¤
n > n0 pak dostaneme podle definice funkce fn (x) nerovnost 0 ≤ f (x) − fn (x) < f (x). Je-li f (x) = ∞, pak pro každé n ∈ N
n→∞
70
Integrál jednoduché funkce Definice 11. Nechť jednoduchá funkce f (x) definovaná na měřitelné množině M má tvar f (x) =
n X
ak χMk ,
k=1
kde Mk jsou měřitelné množiny. Integrálem jednoduché funkce f (x) přes množinu M při míře µ nazýváme číslo (konečné nebo nekonečné) Z
n X
f (x) dµ = M
¡ ¢ ak µ M k .
k=1
Z Poznámka: Je zřejmé, že když je µ(M ) = 0, pak pro každou jednoduchou funkci f (x) je f (x) dµ = 0. Jestliže M Z je f (x) jednoduchá funkce, která je rovna nule skoro všude na M , je f (x) dµ = 0. Je-li f (x) = cχM (x), kde c je M Z Z nezáporná konstanta, je f (x) = cµ(M ). Je-li N ⊂ M měřitelná množina, je χN (x) dµ = µ(N ). M
M
Velmi snadno se pro integrál jednoduché funkce dokáží následující věty Věta 20. Pro každé jednoduché funkce f (x) a g(x) platí Z
¡
¢ f (x) + g(x) dµ =
M
Z
Z f (x) dµ + M
g(x) dµ . M
Věta 21. Je-li f (x) jednoduchá funkce a c ≥ 0 reálná konstanta, pak Z
Z cf (x) dµ = c
f (x) dµ .
M
m
Věta 22. Jsou-li f (x) a g(x) dvě jednoduché funkce, pro které platí g(x) ≤ f (x), pak je Z
Z g(x) dµ ≤
M
f (x) dµ . M
Definice 12. Nechť je N ⊂ M měřitelná množina a f (x) je jednoduchá funkce na M . Pak definujeme Z Z f (x) dµ = f (x) · χN (x) dµ . N
Věta 23. Nechť je M =
n [
M
Mk , kde Mk jsou disjunktní měřitelné množiny. Pak pro každou
k=1
jednoduchou funkci f (x) na M platí Z f (x) dµ = M
n Z X k=1
Velmi důležité jsou následující dvě věty 71
f (x) dµ . Mk
Věta 23. Nechť je fn (x) posloupnost jednoduchých funkcí na množině M , pro které platí fn (x) ≤ fn+1 (x) a které konvergují k jednoduché funkci f (x). Pak je Z
Z
lim
fn (x) dµ =
n→∞
f (x) dµ .
M
M
Z Z Z Důkaz: Z nerovnosti fn (x) ≤ fn+1 (x) plyne fn (x) dµ ≤ fn+1 (x) dµ. Proto existuje lim fn (x) dµ. Stačí n→∞ M M M Z tedy dokázat, že tato limita je rovna f (x) dµ. M
Nejprve budeme vyšetřovat případ, kdy je f (x) konstantní funkce. Je-li f (x) = 0, jsou všechny funkce fn (x) = 0 a vztah platí. Nechť je f (x) = c > 0. Nechť a je libovolné reálné číslo, pro které platí 0 < a < c. Protože pro každé x ∈ M je fn (x) ≤ fn+1 (x) ≤ c a lim fn (x) = c, tvoří množiny n→∞
Mn = x ∈ M ; fn (x) > a neklesající posloupnost množin, tj. Mn ⊂ Mn+1 , jejímž sjednocením je množina M . Podle věty 7 platí lim µ Mn = n→∞
µ(M ). Protože platí nerovnost aχMn (x) ≤ fn (x) ≤ c, je aµ Mn =
Z
Z
M
aχMn (x) dµ ≤
Z fn (x) dµ ≤
c dµ = cµ(M ) .
M
M
Z fn (x) dµ ≤ cµ(M ).
Tedy přechodem k limitě n → ∞ dostaneme, že pro libovolné a, 0 < a < c, platí aµ(M ) ≤ lim
n→∞
Protože tato nerovnost platí pro každé a < c, je Z n→∞
Z fn (x) dµ = cµ(M ) =
lim
M
c dµ . M
Obecný případ pak plyne z toho, že jednoduchou funkci f (x) lze zapsat ve tvaru f (x) = Z fn (x) dµ = ak µ Mk . ¤ množině Mk je lim n→∞
M
n X
ak χMk a na každé
k=1
Mk
Věta 24. Nechť dvě neklesající posloupnostiZ jednoduchých funkcí Z fn (x) a gn (x) na množině M konvergují k téže funkci f (x). Pak platí lim fn (x) dµ = lim gn (x) dµ. n→∞
n→∞
M
M
Z
Z Důkaz: Z nerovností fn (x) ≤ fn+1 (x) a gn (x) ≤ gn+1 (x) plyne, že limity lim
n→∞
gn (x) dµ
fn (x) dµ a lim M
n→∞
M
existují. Stačí tedy dokázat jejich rovnost. Nechť je m ∈ N pevné a hn (x) = min fn (x), gm (x) . Protože fn (x) ≤ fn+1 (x) a lim hn (x) = gm (x), platí podle Z Z Z Z n→∞ fn (x) dµ. Tedy hn (x) dµ = gm (x) dµ. Protože je hn (x) ≤ fn (x) je hn (x) dµ ≤ věty 23 rovnost lim n→∞ M M MZ Z Z ZM gn (x) dµ. fn (x) dµ ≥ lim pro každé m ∈ N je lim fn (x) dµ ≥ gm (x) dµ. Ale z toho plyne, že lim n→∞
M
n→∞
M
Obrácenou nerovnost dostaneme, když vzájemně zaměníme funkce fn (x) a gn (x).
M
¤
n→∞
M
Obecná definice integrálu a jeho základní vlastnosti Definice 13. Nechť je f (x) nezáporná měřitelná funkce definovaná na měřitelné množině M . Integrálem funkce f (x) přes množinu M při míře µ nazýváme číslo Z
Z f (x) dµ = lim
M
n→∞
fn (x) dµ , M
kde fn (x) je neklesající posloupnost jednoduchých funkcí, které konvergují k funkci f (x). Poznámka: Z věty 19 plyne, že pro každou měřitelnou funkci f (x) taková posloupnost existuje a z věty 24 plyne, že limita nezávisí na posloupnosti funkcí fn (x). 72
Definice 14. Nechť je f (x) měřitelná funkce na měřitelné množině M . Nechť f+ (x) a f− (x) jsou nezáporná a nekladná část funkce f (x). Integrálem funkce f (x) přes množinu M při míře µ nazýváme číslo Z Z Z f (x) dµ = f+ (x) dµ − f− (x) dµ M
M
M
za předpokladu, že rozdíl vpravo existuje. Poznámka: Rozdíl vpravo existuje právě tehdy, když je alespoň jeden z integrálů konečné číslo. Jsou-li oba integrály vpravo rovny nekonečnu, integrál funkce f (x) neexistuje.
Definice 15. Říkáme, že funkce f (x) je integrovatelná přes množinu M (nebo, že integrál konverZ guje) právě tehdy, když je f (x) dµ konečné číslo. M
Poznámka: Je zřejmé, že integrál funkce f (x) přes množinu M konverguje právě tehdy, když přes množinu M konvergují integrály funkcí f+ (x) a f− (x). Právě definovaný integrál se na rozdíl od integrálu definovaných dříve nazývá Lebesgueův.
Definice 16. Nechť je N ⊂ M měřitelná množina a f (x) je měřitelná funkce definovaná na množině M . Integrálem funkce f (x) přes množinu N budeme rozumět integrál Z Z f (x) dµ = f (x) · χN (x) dµ . M
N
Z Věta 25. Je-li µ(M ) = 0 a f (x) libovolná měřitelná funkce na M je
f (x) dµ = 0. M
Důkaz: Věta platí pro každou jednoduchou funkci. Je-li funkce f (x) nezáporná Za měřitelná a fn (x)Z je neklesající fn (x) dµ = posloupnost jednoduchých funkcí, které konvergují k funkci f (x), je podle definice f (x) dµ = lim n→∞
M
M
0. Jestliže části důkazu pro nezáporné funkce f+ (x) a f− (x) Z Z Z Z je f (x) libovolnáZměřitelná funkce, platí podle předchozí f− (x) dµ = 0. ¤ f+ (x) dµ − f (x) dµ = f− (x) dµ = 0. Proto je také f+ (x) dµ = 0 a vztahy M
M
M
M
M
Věta 26. Nechť M a N jsou disjunktní měřitelné množiny. Pak pro každou funkci f (x) měřitelnou na množině M ∪ N platí Z Z Z f (x) dµ = f (x) dµ + f (x) dµ . M ∪N
M
N
Důkaz: Je-li funkce f (x) jednoduchá, bula rovnost již dokázána. Je-li f (x) nezáporná měřitelná funkce a fn (x) neklesající posloupnost jednoduchých funkcí, které konvergují k funkci f (x), platí Z Z Z Z fn (x) dµ = fn (x) dµ + f (x) dµ = lim fn (x) dµ = lim n→∞ M ∪N n→∞ M N M ∪N Z Z Z Z = lim fn (x) dµ + lim fn (x) dµ = f (x) dµ + f (x) dµ . n→∞
n→∞
M
N
M
N
Je-li f (x) libovolná měřitelná funkce, je f (x) = f+ (x) − f− (x), kde f+ (x) a f− (x) jsou nezáporná a nekladná část funkce f (x). Ale to jsou nezáporné měřitelné funkce. Proto platí Z Z Z Z Z Z Z f (x) dµ = f+ (x) dµ − f− (x) dµ = f+ (x) dµ + f+ (x) dµ − f− (x) dµ − f− (x) dµ = M ∪N M ∪N M N M N ZM ∪N Z = f (x) dµ + f (x) dµ . ¤ M
N
Důkazy několika dalších vět jsou podobné. Proto je nebudeme uvádět. Věta 27. Nechť N ⊂ M je měřitelná Z Z podmnožina měřitelné množiny M . Jestliže existuje integrál f (x) dµ, existuje také integrál f (x) dµ. M
N
Z
Věta 28. Nechť je N ⊂ M měřitelná množina a f (x) ≥ 0. Pak platí N
73
Z f (x) dµ ≤
f (x) dµ. M
Věta 29. Je-li µ(N ) = 0, pak platí Z Z f (x) dµ = M
Z f (x) dµ = M ∪N
f (x) dµ . M \N
Z Věta 30. Nechť f (x) a g(x) jsou měřitelné funkce na množině M a existují integrály Z Z Z g(x) dµ. Je-li f (x) ≤ g(x), pak platí f (x) dµ ≤ g(x) dµ. M
M
f (x) dµ a M
M
Definice 17. Nechť M je měřitelná množina. Řekneme, že skoro všechny body množiny M mají jistou vlastnost V , má-li množina všech bodů x ∈ M , které nemají vlastnost V míru rovnou nule. Poznámka: Jestliže skoro všechny body množiny M mají vlastnost V , říkáme často V platí skoro všude na M a píšeme V platí s.v. na M .
Lze jednoduše Z ukázat, že když platí rovnost f (x) = g(x) skoro všude na množině M , pak Z g(x) dµ. Tedy integrál funkce se nezmění, jestliže ji změníme na množině míry je f (x) dµ M M © nula. Lze ukázat,ª že je-li funkce f (x) integrovatelná přes množinu M je míra množiny N = x ∈ M ; f (x) = ±∞ rovna nule. Tedy pokud mluvíme o integrovatelných funkcích, lze předpokládat, že jsou na množině M konečné, tj. nenabývají hodnot ±∞. Této poznámky se používá při důkazu následující věty. Věta 31. Nechť jsou f (x)a g(x) funkce integrovatelné přes množinu M . Pak platí Z Z Z ¡ ¢ f (x) + g(x) dµ = f (x) dµ + g(x) dµ . M
M
M
Věta 32. Nechť je f (x) funkce integrovatelná přes množinu M a c ∈ R je konstanta. Pak platí Z Z cf (x) dµ = c f (x) dµ . M
M
Z vět 31 a 32 plyne Důsledek. Nechť jsou f1 (x), f2 (x), . . . , fn (x) integrovatelné funkce přes množinu M a c1 , c2 , . . . , cn jsou reálné konstanty. Pak platí Z Z Z Z ¡ ¢ c1 f1 (x) + c2 f2 (x) + · · · + cn fn (x) dµ = c1 f1 (x) dµ + c2 f2 (x) dµ + · · · + cn fn (x) dµ . M
M
M
M
Tedy integrál je lineární zobrazení z prostoru integrovatelných funkcí do reálných čísel. Věta 33. Nechť je f (x) měřitelná funkce. Pak je¯ f (x) je integrovatelná přes množinu M právě ¯ tehdy, když je integrovatelná přes M funkce ¯f (x)¯. Navíc platí nerovnosti ¯Z ¯ Z Z ¯ ¯ ¯ ¯ ¯ ¯f (x)¯ dµ . f (x) dµ ≤ ¯ f (x) dµ¯¯ ≤ M
M
M
Důkaz: Protože je funkce Z f (x) měřitelná, Z jsou měřitelné také funkce f+ (x) a f− (x). Z integrovatelnosti funkce f (x) plyne, že oba integrály f+ (x) dµ a f− (x) dµ jsou konečné. Protože f (x) = f+ (x) + f− (x), je integrovatelná M M také funkce f (x) . Naopak z integrovatelnosti funkce f (x) plyne, že jsou integrovatelné obě funkce f+ (x) a f− (x), a tedy i funkce f (x) = f+ (x) − f− (x). Uvedená nerovnost snadno plyne ze zřejmých nerovností Z Z Z Z Z Z Z f (x) dµ . f+ (x) dµ − f− (x) dµ ≤ f+ (x) dµ − f− (x) dµ ≤ f+ (x) dµ + f− (x) dµ = ¤ M
M
M
M
M
74
M
M
Věta ¯ 34. ¯ Je-li funkce f (x) měřitelná na M a jestliže je g(x) funkce integrovatelná na M taková, že ¯f (x)¯ ≤ g(x), pak je funkce f (x) integrovatelná na M . Z
f (x) dµ ≤
Důkaz: Protože 0 ≤ M
Z
g(x) dµ < ∞, je funkce f (x) integrovatelná na M . Tedy podle věty 33 je na
M
M integrovatelná i funkce f (x).
Z
Věta 35. Nechť je f (x) měřitelná na množině M a platí f (x) ≥ 0. Pak je
f (x) dµ = 0 právě M
tehdy, když je f (x) = 0 skoro všude na M . Z
Z
Důkaz: Je-li f (x) = 0 skoro všude na M je zřejmé, že
f (x) dµ = 0. Nechť je f (x) ≥ 0 a M
Mn = Pak platí nerovnost
1 . x ∈ M ; f (x) > n
Z 0=
f (x) dµ = 0. Označme M
Z f (x) dµ ≥
M
M
1 1 χMn (x) dµ = µ Mn . n n
Tedy pro každé n ∈ N je µ Mn = 0. Ale množina všech x ∈ M , pro která je f (x) 6= 0 je sjednocením všech množin M1 , M2 , . . . , a proto má míru nula. ¤
Pro Lebesgueův integrál platí mnoho dalších důležitých vět, které zde nelze pro nedostatek místa uvést. Uvedeme jen některé důležité věty, které se týkají záměny limity a integrálu. Následující dvě věty se nazývají Lebesgueovy věty o monotonní konvergenci. Věta 36. Je-li fn (x) neklesající posloupnost nezáporných měřitelných funkcí na množině M je Z Z lim fn (x) dµ = lim fn (x) dµ . n→∞
M n→∞
M
Důkaz: Označme f (x) = lim fn (x). Nechť fn,1 (x), fn,2 (x), . . . , fn,k (x), je posloupnost neklesajících jednoduchých n→∞ funkcí, které konvergují k funkci fn (x). Označme gn (x) = max f1,n (x), f2,n (x), . . . , fn,n (x) . To je neklesající posloupnost jednoduchých funkcí, k funkci f (x). Protože pro každé Zn ∈ N je gn (x) Z≤ fn (x) ≤ f (x), Z Z která konverguje Z platí nerovnost
gn (x) dµ ≤ M
fn (x) dµ ≤ M
f (x) dµ. Ale podle definice je lim
n→∞
M
gn (x) dµ = M
f (x) dµ.
¤
M
Věta 37. Nechť je fn (x) nerostoucí posloupnost nezáporných měřitelných funkcí na množině M a funkce f1 (x) je na M integrovatelná, je Z Z lim fn (x) dµ = lim fn (x) dµ . n→∞
M n→∞
M
Důkaz: Protože podle předpokladů pro každé n ∈ N platí 0 ≤ fn (x) ≤ f1 (x), jsou všechny funkce fn (x) integrovatelné. Protože posloupnost funkcí gn (x) = f1 (x) − fn (x) je splňuje předpoklady věty 36, platí Z Z Z Z lim f1 (x) − fn (x) dµ = lim f1 (x) − fn (x) dµ = f1 (x) dµ − lim fn (x) dµ . n→∞
M
M
n→∞
m n→∞
M
Z Jestliže od obou stran této rovnosti odečteme M
f1 (x) dµ, dostaneme tvrzení věty.
¤
Věta 38. (Fatouovo lemma) Pro každou posloupnost nezáporných měřitelných funkcí je Z Z ³ ´ lim inf fn (x) dµ ≥ lim inf fn (x) dµ . n→∞
M
n→∞
M
Důkaz: Označme gn (x) = inf fn (x), fn+1 (x), . . . . Protože je posloupnost gn (x) neklesající, existuje lim gn (x) = n→∞ Z Z lim inf fn (x). Navíc je gn (x) ≤ fn (x), a proto pro každé n ∈ N platí gn (x) dµ ≤ fn (x) dµ. Posloupnost funkcí n→∞
gn (x) splňuje předpoklady věty 36. Proto platí nerovnost Z Z Z lim inf fn (x) dµ = lim gn (x) dµ = lim M
n→∞
M n→∞
n→∞
M
Z gn (x) dµ ≤ lim inf
M
Následující věta se často nazývá Lebesgueova věta o majorantě. 75
M
n→∞
fn (x) dµ . M
¤
Věta 39. Nechť je fn (x) posloupnost měřitelných funkcí na množině¯ M , která na množině M ¯ konverguje. Nechť existuje funkce g(x) integrovatelná na M taková, že ¯fn (x)¯ ≤ g(x). Pak platí Z
Z
lim
n→∞
Důkaz: Nechť f (x) =
³
fn (x) dµ = M
´ lim fn (x) dµ .
n→∞
M
lim fn (x). Změníme-li funkce fn (x) a g(x) na množině míry nula, lze předpokládat, že všechny funkce jsou na množině M konečné. Protože fn (x) ≤ g(x) platí g(x) + fn (x) ≥ 0 a g(x) − fn (x) ≥ 0. Jestliže aplikujeme Fatouova lemmatu na posloupnost funkcí g(x) + fn (x) dostaneme n→∞
Z
g(x) + fn (x) dµ ≥
lim inf n→∞
Z
M
Z lim inf g(x) + fn (x) dµ = n→∞
M
g(x) + f (x) dµ .
M
Z Jestliže na obou stranách odečteme
g(x) dµ, dostaneme nerovnost M
Z
Z
lim inf
fn (x) dµ ≥
n→∞
M
f (x) dµ . M
Aplikujeme-li Fatouovo lemma na posloupnost funkcí g(x) − fn (x), dostaneme Z
g(x) − fn (x) dµ ≥
lim inf n→∞
M
Z
Z lim inf g(x) − fn (x) dµ =
M
n→∞
g(x) − f (x) dµ .
M
Z této nerovnosti plyne Z
−fn (x) dµ ≥ −
lim inf n→∞
M
Z n→∞
Z
M
n→∞
Z fn (x) dµ ≤
f (x) dµ ⇐⇒ lim sup M
fn (x) dµ ≤
Tedy platí lim sup
Z
Z
M
f (x) dµ . M
Z f (x) dµ ≤ lim inf n→∞
M
fn (x) dµ, a tedy platí tvrzení věty.
¤
M
Následující věta platí nejen pro Lebesgueův, ale také pro Riemannův integrál. Věta 40. Limita stejnoměrně konvergentní posloupnosti fn (x) konečných funkcí, které jsou integrovatelné přes množinu M konečné míry, je integrovatelná přes množinu M a platí Z ³ Z ´ lim fn (x) dµ = lim fn (x) dµ . M
n→∞
n→∞
M
Důkaz: Protože je posloupnost funkcí fn (x) stejnoměrně konvergentní na M , existuje n0 takové, že pro každé n > n0 fn (x) − fn (x) ≤ 1. Funkce g(x) = fn (x) + 1 integrovatelná na množině M , a každé x ∈ M platí nerovnost 0 0 protože funkce fn0 (x) je integrovatelná a konstantní funkce 1 je integrovatelná přes M , protože M má konečnou míru. Protože pro každé n > n0 platí nerovnost fn (x) ≤ g(x), lze použít větu 39. Z ní pak plyne tvrzení věty. ¤
Věty analogické větám 36 až 40 lze použít také na funkční řady. Pro nedostatek času zde formulaci těchto vět nebudeme uvádět. Lebesgueova míra v Rn Definice Lebesgueova integrálu v konkrétních případech závisí hlavně na σ–algebře měřitelných množin a míře. Proto nyní krátce naznačím, jak se definují měřitelné množiny a jejich míra v případě objemového Lebesgueova integrálu v Rn . ® ® ® Nejprve se definuje¡ objem ¢¡ uzavřeného ¢ intervalu ¡ ¢P = a1 , b1 × a2 , b2 × · · · × an , bn , kde ak ≤ bk , jako V (P ) = b1 − a1 b2 − a2 . . . bn − an . Jestliže je M ⊂ Rn libovolná množina a Pn , n ∈ N, spočetný systém uzavřených intervalů, které ∞ [ pokrývají množinu M , tj. pro které platí M ⊂ Pn , definujeme tzv. vnější míru množiny M jako infimum všech čísel
∞ X
n=1
¡ ¢ V Pn , kde systém intervalů Pn pokrývá množinu M . Vnější míru množiny
n=1
M budeme značit |M |. Vnější míra každé množiny M ⊂ Rn je číslo, pro které platí 0 ≤ |M | ≤ ∞. 76
∞ [
Z definice vnější míry je zřejmé, že když M ⊂
Pn , pak platí |M | ≤
n=1
ε > 0 existuje systém intervalů Pn takový, že ¯ ¯ Snadno se dokáže, že ¯∅¯ = 0 a je-li M ⊂
∞ X
∞ X
¡ ¢ V Pn a že pro každé
n=1
¡
¢
V Pn ≤ |M | + ε.
n=1 ∞ [
Mn , pak platí nerovnost |M | ≤
n=1
∞ X ¯ ¯ ¯Mn ¯. n=1
Pro vnější míru dále platí následující tvrzení: (1) je-li N ⊂¯ M , pak |N | ≤ |M | (monotonie vnější míry) ¯ ∞ ∞ ¯[ ¯ X ¯ ¯ ¯ ¯ ¯Mn ¯ (subaditivita vnější míry) (2) ¯ Mn ¯ ≤ ¯ ¯ n=1 n=1 (3) Je-li P uzavřený interval pak je |P | = V (P ).
Speciálně je-li N ⊂ M a |M | = 0 je |N | = 0. Množiny, pro které je |M | = 0 se nazývají množiny míry nula. Protože každý degenerovaný interval, tj. aspoň pro jeden index k = 1, 2, . . . , n, je ak = bk , má vnější míru nula, platí pro každý otevřený interval nebo polootevřený interval Q rovnost |Q| = V (P ), kde P je uzávěr intervalu Q. Mohlo by se zdát, že vnější míra je vhodným zobecněním pojmu objem intervalu. Ale není tomu tak. Není totiž ani aditivní. Lze ukázat, že v Rn existují dvě disjunktní množiny M a N takové, že neplatí rovnost |M ∪ N | = |M | + |N |. Proto se za σ–algebru měřitelných množin nebere systém všech podmnožin Rn , ale menší množina. Definice 18. Řekneme, že množina M ⊂ Rn je měřitelná (nebo podrobněji měřitelná v Lebesgueově smyslu), pokud pro každou množinu Z ⊂ Rn platí rovnost |Z ∩ M | + |Z \ M | = |Z| . Množinu měřitelných množin budeme značit M. Ze subaditivity vnější míry plyne, že pro každé dvě podmnožiny M, Z ⊂ Rn platí nerovnost |Z ∩ M | + |Z \ M | ≥ |Z| . Proto abychom dokázali, že M ∈ M, stačí ukázat, že pro každou podmnožinu Z ⊂ Rn platí nerovnost |Z ∩ M | + |Z \ M | ≤ |Z| . Ukazuje se, že platí: (1) Systém M měřitelných podmnožin tvoří σ–algebru (2) Každá množina, která má vnější míru nula je měřitelná Definice 19. Nechť je M ∈ M. Mírou (přesněji Lebesgueovou mírou) množiny M nazveme číslo µ(M ) = |M |, kde |M | je vnější míra množiny M . Nyní ještě uvedeme některé měřitelné množiny. Všechny množiny s vnější mírou nula jsou měřitelné. Tedy každá podmnožina míry nula má míru nula. Proto je Lebesgueova míra na Rn úplná. Všechny intervaly v Rn (uzavřené, otevřené i polootevřené) jsou měřitelné. Protože celou množinu ∞ [ ¡ ¢ Pk , kde Pk = h−k, ki × . . . h−k, ki a µ Pk = (2k)n < ∞, je míra µ na Rn lze zaspat jako Rn = k=1
Rn σ–konečná. Protože každou otevřenou množinu lze zaspat jako spočetné sjednocení otevřených intervalů, jsou otevřené množiny v Rn měřitelné. Uzavřené množiny lze psát jako M = Rn \ N , kde N je otevřená množina. Proto jsou také všechny uzavřené množiny v Rn měřitelné. 77
Protože M je σ–algebra, jsou měřitelné také všechny
∞ \
Mk , kde Mk jsou otevřené množiny.
k=1
Tyto množiny se nazývají množiny typu Gδ . Měřitelné jsou také všechny množiny, které lze zapsat ∞ [ Mk , kde Mk jsou uzavřené množiny. Tyto množiny se nazývají množiny typu Fσ . ve tvaru k=1
Obecně lze každou měřitelnou množinu M psát ve tvaru M = G \ N , kde G je množina typu Gδ a N je množina míry nula, nebo ve tvaru M = F ∪ N , kde F je množina typu Fσ a N je množina míry nula. Jestliže máme definovanou míru na σ–algebře množin M, lze pomocí obecné konstrukce sestrojit Lebesgueův integrál. Pro tento integrál platí samozřejmě všechny věty, které platí pro obecný Lebesgueův integrál. Jde zejména o věty 36 až 40. Mimo to platí pro Lebesgueův integrál obecnější verze Fubiniovy věty a věty o substituci. x, y ) je definovaná Věta 41. (Fubiniova věta) Nechť je M ⊂ Rn = Rr × Rs měřitelná a funkce f (x na M , kde x ∈ Rr a y ∈ Rs . Nechť konverguje integrál Z x, y ) dx1 . . . dxr dy1 . . . dys . f (x M
Pak pro skoro všechna x ∈ Mx ⊂ Rr , resp. pro skoro všechna y ∈ My ⊂ Rs , existují integrály Z x) = F (x f x (yy ) dy1 . . . dys , Mx Z x) dx1 . . . dxr . G(yy ) = f y (x My
a platí rovnost Z
Z x, y ) dx1 . . . dys = f (x
M
Mx
Z x) dx1 . . . dxr = F (x
My
G(yy ) dy1 . . . dys .
x) prosté regulární zobrazení otevřené množiny X ⊂ Rn na Věta 42. (o substituci) Nechť je ϕ(x n x) jakobián zobrazení množinu Y ⊂ R . Nechť je M ⊂ X, f (yy ) funkce definovaná na ϕ(M ) a Dϕ (x ϕ. Pak platí Z Z ¯ ¡ ¢¯ x) ¯Dϕ (x x)¯ dx1 . . . dxn , f (yy ) dy1 . . . dyn = f ϕ(x ϕ(M )
M
pokud alespoň jeden z integrálů existuje.
78
Přednáška 10 Regulární k–rozměrné nadplochy v Rn V této přednášce budeme vyšetřovat k–rozměrnou analogii toho, co ve dvojrozměrném případě intuitivně nazýváme plochou. Přesněji řečeno ”plochou bez okraje”, bez rozvětvení a bez průsečíků se sebou samou. Charakteristickým rysem takto chápaného pojmu ”plochy” S ⊂ Rn je, že každý bod x ∈ S má v ploše S okolí, které lze vzájemně jednoznačně zobrazit na otevřenou množinu v Rk . My se budeme zabývat tzv. hladkými plochami, tj. plochami, které mají v každém bodě tečnou rovinu, která závisí spojitě na dotykovém bodě. Nejprve připomenu jednu definici. Definice 1. Nechť je S ⊂ Rn . Množina M ⊂ S se nazývá otevřená v množině S právě tehdy, když existuje otevřená množina U ⊂ Rn taková, že M = U ∩ S. x) = S ∩ Uε (x x), kde Uε (x x) ⊂ Rn je otevřené ε–ové okolí bodu Je-li x ∈ S, nazveme množinu Vε (x n x v R , ε–ové okolí bodu x v množině S. Definice 2. Neprázdnou množinu S ⊂ Rn nazýváme k–rozměrnou nadplochou (v Rn ), jestliže pro x) v S a vzájemně jednoznačné zobrazení Φ : G → Uε (x), kde každý bod x ∈ S existuje okolí Uε (x G ⊂ Rk , takové, že obě zobrazení Φ a Φ (−1) jsou spojitá. Poznámka: Zobrazení Φ lze zapsat ve tvaru x1 = ϕ1 t1 , t2 , . . . , tk ,
x2 = ϕ2 t1 , t2 , . . . , tk ,
,... ,
xn = ϕn t1 , t2 , . . . , tk .
Tyto rovnice udávají parametrický popis nadplochy S v jistém okolí bodu x 0 ∈ S. Často se proměnné t1 , t2 , . . . , tk nazývají lokální souřadnice. Jednorozměrné nadplochy, tj. k = 1, se nazývají křivky a dvourozměrné nadplochy, tj. k = 2, nazýváme plochy.
Z definice k–rozměrné nadplochy S ⊂ Rn ihned plyne, že každá neprázdná v S otevřená množina S0 ⊂ S je také k–rozměrná nadplocha. My se budeme zabývat případem, kdy je zobrazení Φ diferencovatelné. Definice 3. Nechť je S ⊂ Rn k–rozměrná nadplocha. Jestliže pro každý bod x 0 ∈ S existuje okolí ¡ ¢ ¡ ¢ U x 0 v S zobrazení Φ : G → Uε x 0 , kde G je otevřená množina v Rk , takové, že (1) (2) (3) (4)
Φ je vzájemně jednoznačné obě zobrazení Φ a Φ¢(−1) jsou spojitá ¡ Φ = ϕ1 , ϕ2 , . . . , ϕn je třídy Cm (G) hodnost matice ∂ϕ1 ∂ϕ1 ∂ϕ1 ... ∂t2 ∂tk ∂t1 ∂ϕ2 ∂ϕ2 ∂ϕ2 . . . W(tt) = ∂t ∂tk 2 . . .1. . . . .∂t ............... ∂ϕn ∂ϕn ∂ϕn ... ∂t1 ∂t2 ∂tk
(1)
je pro každé t ∈ G rovna k říkáme, že S je regulární nadplocha¡ (třídy Cm ). Zobrazení Φ pak nazýváme regulárním paramet¢ rickým popisem (třídy Cm ) okolí U x 0 . Příklad. Nechť je dáno (n − k) funkcí k proměnných ϕ1 , ϕ2 , . . . , ϕn−k definovaných na otevřené množině G ⊂ Rk . Definujme zobrazení Φ : G → Rn definované předpisem Φ t1 , t 2 , . . . , t k =
(
xi = ti xk+j = ϕj (t1 , t2 , . . . , tk
i = 1, 2, . . . , k j = 1, 2, . . . , n − k .
Protože pro t 1 6= t 2 platí pro nějaké i nerovnost xi t 1 = ti,1 6= xi t 2 = ti,2 , je zobrazení Φ prosté, a tedy je to n vzájemně jednoznačné zobrazení G → Φ (G) ⊂ R . Jestliže jsou ϕi spojitá zobrazení, jsou spojitá také zobrazení Φ a 79
Φ (−1) . Tedy množina Φ (G) je k–rozměrná nadplocha v Rn . Takto definovanou nadplochu lze interpretovat jako graf nějakého zobrazení Ψ : G → Rn−k , které je definováno předpisem xk+r = ϕr x1 , x2 , . . . , xk ,
r = 1, 2, . . . , n − k .
Je zřejmé, že když jsou funkce ϕr třídy Cm (G), je nadplocha Φ (G) regulární nadplocha třídy Cm . Naopak nechť je S ⊂ Rn regulární k–rozměrná nadplocha a Φ (tt) : G → S příslušné zobrazení. Nechť je τ ∈ G a označme ξ = Φ (ττ ) ∈ S. V souřadnicích lze zobrazení Φ psát ve tvaru x1 = ϕ1 t1 , t2 , . . . , tk ,
x2 = ϕ2 t1 , t2 , . . . , tk ,
...,
xn = ϕn t1 , t2 , . . . , tk .
Protože pro každé t ∈ G je hodnost matice W(tt) rovna k, existuje její subdeterminant řádu k, který je v bodě τ nenulový. Nechť je to například determinant ∂x1 ∂x1 ... ∂t1 ∂tk det . . . . . . . . . . . . . . . 6= 0 . ∂xk ∂xk ... ∂t1 ∂tk
δ > 0 a ∆ Podle věty o implicitních funkcích existují > 0 taková, že pro každé x1 , x2 , . . . , xk , pro které je xr − ξr < δ, a pro každé t1 , t2 , . . . , tk , pro které je tr − τr < ∆, r = 1, 2, . . . , k lze psát t1 = ψ1 x1 , x2 , . . . , xk ,
t2 = ψ2 x1 , x2 , . . . , xk ,
... ,
tk = ψk x1 , x2 , . . . , xk
a τr = ψr ξ1 , ξ2 , . . . , ξk pro r = 1, 2, . . . , k. Tedy pro každé s = k + 1, . . . , n lze psát xs = ϕs ψ1 (x1 , . . . , xk ), . . . , ψk (x1 , . . . , xk ) . Tedy alespoň lokálně lze k–rozměrnou regulární nadplochu v Rn vyjádřit jako graf nějaké funkce z Rk do Rn−k . Přitom jsou-li funkce ϕs , s = 1, 2, . . . , n na množině G třídy Cm , jsou funkce ψr , r = 1, 2, . . . , k třídy Cm . Protože příslušná funkce je složením funkcí ψr a ϕs , které jsou třídy Cm , je také třídy Cm .
Nechť je S regulární k–rozměrná nadplocha v Rn a Φ : G → S je její parametrické vyjádření, tj. ¡ ¢ x 1 = ϕ1 t1 , . . . , t k ,
¡ ¢ x2 = ϕ2 t1 , . . . , tk ,
...,
¡ ¢ xn = ϕ1 t1 , . . . , tk .
Nechť τ ∈ G a ξ = Φ (ττ ) ∈ S. Uvažujme zobrazení Ψ r (t), r = 1, 2, . . . , k definovaná vztahy ¡ ¢ x1 = ϕ1 τ1 , . . . , τr−1 , t, τr+1 , . . . , τk ¡ ¢ x2 = ϕ1 τ1 , . . . , τr−1 , t, τr+1 , . . . , τk ...
(2)
¡ ¢ xn = ϕ1 τ1 , . . . , τr−1 , t, τr+1 , . . . , τk © ª Zobrazení Ψr je zobrazení množiny G = t ∈ R ; (τ , . . . , τ , t, τ , . . . , τ ) ∈ G ⊂ R. Je zřejmé, r 1 r−1 r+1 k ¡ ¢ že Ψ r : Gr → Ψ r Gr ⊂ S je prosté. Jestliže je zobrazení ° °Φ třídy Cm , je zobrazení Ψ r třídy Cm . ° dΨr ° ° Protože je hodnost matice W(tt) rovna k, musí být ° ° dt ° 6= 0. Tedy pro každé r = 1, 2 . . . , k je ¡ ¢ Ψ r Gr regulární 1–rozměrná nadplocha, tj. křivka v Rn , která leží v nadploše S. Vektor Ψr dΨ = vr = dt
µ
∂ϕ1 ∂ϕ2 ∂ϕn , ,..., ∂tr ∂tr ∂tr
¶
¡ ¢ τ1 , τ2 , . . . , τk
(3)
¡ ¢ ¡ ¢ je tečný vektor ke křivce Ψ r Gr v bodě ξ = ξ1 , ξ2 , . . . , ξn , a tedy i k ploše S. Podmínka (1) znamená, že v každém bodě regulární k–rozměrné nadplochy S existuje právě k–lineárně nezávislých tečných vektorů. Tečná nadrovina ke k–rozměrné regulární nadploše S ⊂ Rn v bodě ξ = Φ (ττ ) ∈ S má parametrické rovnice Φ Φ Φ ∂Φ ∂Φ ∂Φ (ττ ) t1 + (ττ ) t2 + · · · + (ττ ) tk (4) x =ξ + ∂t1 ∂t2 ∂tk 80
nebo ve složkách ∂ϕ1 ∂ϕ1 ∂ϕ1 (ττ ) t1 + (ττ ) t2 + · · · + (ττ ) tk ∂t1 ∂t2 ∂tk ∂ϕ2 ∂ϕ2 ∂ϕ2 x2 = ξ2 + (ττ ) t1 + (ττ ) t2 + · · · + (ττ ) tk ∂t1 ∂t2 ∂tk ... ∂ϕn ∂ϕn ∂ϕn xn = ξn + (ττ ) t1 + (ττ ) t2 + · · · + (ττ ) tk , ∂t1 ∂t2 ∂tk
x1 = ξ1 +
kde t1 , t2 , . . . , tk ∈ R. Nadrovinu kolmou k tečné nadrovině regulární k–rozměrné nadplochy S ∈ Rn v bodě ξ ∈ S nazýváme normálovou nadrovinou. Normálová nadrovina je určena (n − k) vektory n s , které jsou kolmé k tečné nadrovině. Tyto vektory tedy splňují rovnice v r · ns = 0
r = 1, 2, . . . , k
a
s = 1, 2, . . . , n − k ,
(5)
kde v r jsou tečné vektory dané vztahy (3) a násobení znamená skalární součin vektorů v r a n s . V souřadnicích má soustava rovnic pro normálový vektor n tvar ∂ϕ1 (ττ ) · n1 + ∂t1 ∂ϕ1 (ττ ) · n1 + ∂t2 ... ∂ϕ1 (ττ ) · n1 + ∂tk
∂ϕ1 (ττ ) · n2 + · · · + ∂t1 ∂ϕ2 (ττ ) · n2 + · · · + ∂t2
∂ϕn (ττ ) · nn = 0 ∂t1 ∂ϕn (ττ ) · nn = 0 ∂t2
(6)
∂ϕ2 ∂ϕn (ττ ) · n2 + · · · + (ττ ) · nn = 0 ∂tk ∂tk
To je homogenní soustava k lineárních rovnic pro n složek normálového vektoru n . Protože je hodnost matice této soustavy rovna k, má tato soustava právě (n − k) lineárně nezávislých řešení n s , s = 1, 2, . . . , n − k. Parametrické rovnice normálové nadroviny k regulární k–rozměrné nadploše S v bodě ξ = Φ (ττ ) jsou pak x = ξ + n 1 t1 + n 2 t2 + · · · + n n−k tn−k
(7)
nebo v souřadnicích x1 = ξ1 + n1,1 t1 + n2,1 t2 + · · · + nn−k,1 tn−k x2 = ξ2 + n1,2 t1 + n2,2 t2 + · · · + nn−k,2 tn−k ... xn = ξ2 + n1,n t1 + n2,n t2 + · · · + nn−k,n tn−k , kde t1 , t2 , . . . , tn−k ∈ R. V případě regulární (n − 1)–rozměrné nadplochy v Rn jsou složky normálového vektoru například ∂ϕ1 ∂ϕ2 ∂ϕr−1 ∂ϕr+1 ∂ϕn ... ... ∂t1 ∂t1 ∂t1 ∂t1 ∂t1 ∂ϕ ∂ϕr−1 ∂ϕr+1 ∂ϕn ∂ϕ2 1 ... ... nr = (−1)r+1 det ∂t2 ∂t2 ∂t2 ∂t2 ∂t2 .................................................. ∂ϕ ∂ϕr−1 ∂ϕr+1 ∂ϕn ∂ϕ2 1 ... ... ∂tn−1 ∂tn−1 ∂tn−1 ∂tn−1 ∂tn−1 81
(8)
Jestliže označíme e r jednotkové vektory v kladném směru souřadnicové osy Oxr , lze vektor normály (8) formálně vyjádřit ve tvaru determinantu e1 e2 ... en ∂ϕ1 ∂ϕ2 ∂ϕn ... ∂t1 ∂t ∂t1 1 ∂ϕ2 ∂ϕn n = n1e 1 + n2e 2 + · · · + nne n = det ∂ϕ1 (9) ... ∂t ∂t2 2 . . . .2. . . . . .∂t ................. ∂ϕ1 ∂ϕ2 ∂ϕn ... ∂tn−1 ∂tn−1 ∂tn−1 ¡ ¢ ¡ ¢ Jsou-li a = a1 , a2 , a3 a b = b1 , b2 , b3 dva vektory v R3 nazývá se operace analogická (8) nebo (9) vektorový součin vektorů a a b a značí se a × b . Formálně lze psát e1 e2 e3 a × b = det a1 a2 a3 b1 b2 b3 ¡ ¢ Analogická operace v prostoru Rn přiřazuje (n − 1) vektorům a r = ar,1 , ar,2 , . . . , ar,n , r = 1, 2, . . . , n − 1 vektor e1 e2 e3 ... en a1,2 a1,3 ... a1,n a1,1 b = det a2,1 a2,2 a2,3 ... a2,n (10) .................................... an−1,1 an−1,2 an−1,3 . . . an−1,n Geometricky je (10) vektor, který je kolmý na všechny vektory a 1 , a 2 , . . . , a n−1 a jeho velikost je rovna (n − 1)–rozměrnému rovnoběžníku s hranami a r . je obsah k–rozměrného rovnoběžníku v Rn s hranami danými vektory a r = ¡ V obecném případě ¢ ar,1 , ar,2 , . . . , ar,n , r = 1, 2, . . . , k, roven q ¡ ¢ P = det AAT , (11) kde
a1,1 a1,2 a1,3 . . . a1,n a2,2 a2,3 . . . a2,n a A = 2,1 .......................... ak,1 ak,2 ak,3 . . . ak,n
(12)
Vztah (11) lze také napsat ve tvaru a1 · a1 a1 · a2 a1 · a3 . . . a1 · ak a · a a2 · a2 a2 · a3 . . . a2 · ak P 2 = det 1 2 .................................... a1 · ak a2 · ak a3 · ak . . . ak · ak V algebře se ukazuje, že (13) lze napsat ve tvaru X P2 =
A2i1 i2 ...ik ,
1≤i1
kde
a1,i1 a1,i2 . . . a1,ik a2,i2 . . . a2,ik a = det 2,i1 ...................... ak,i1 ak,i2 . . . ak,ik
Ai1 i2 ...ik
82
(13)
Jestliže je S regulární (n − 1)–rozměrná nadplocha v Rn , lze rovnici tečné nadroviny v bodě ξ psát ve tvaru ¡ ¢ x −ξ ·n = 0, (14) kde n je normálový vektor definovaný vztahem (9). Regulární k–rozměrná nadplocha S ⊂ Rn se často zadává jako řešení soustavy (n − k) rovnic. ¢ Přesněji nechť jsou dány funkce Φr (x1 , x2 , . . . , xn , r = 1, 2, . . . , n − k. Uvažujme množinu S ⊂ Rn všech řešení soustavy ¡ ¢ (15) Φr x1 , x2 , . . . , xn = 0 , r = 1, 2, . . . , n − k . ¡ ¢ Nechť je ξ = ξ1 , ξ2 , . . . , ξn ∈ S, tj. pro každé r = 1, 2, . . . , n − k platí ¡ ¢ Φr ξ1 , ξ2 , . . . , ξn = 0 . Nechť jsou funkce Φr v v jistém okolí bodu ξ třídy Cp a hodnost matice ∂Φ ∂Φ1 ∂Φ1 1 ... ∂x1 ∂x2 ∂xn ∂Φ2 ∂Φ2 ¡ ¢ ∂Φ2 ... W ξ1 , ξ2 , . . . , ξn = ∂x1 ∂x . . . . . . . . . . .∂x . . .2. . . . . . . . . . . . . .n. . ∂Φ ∂Φn−k ∂Φn−k n−k ... ∂x1 ∂x2 ∂xn je rovna (n − ¡ k). Pak podle věty ¢ o implicitních funkcích existuje δ > 0 a ∆ > 0, indexy¯ i1 , i2 , . .¯. , ik a ¯funkce ϕs¯ xi1 , xi2 , . . . , xik , s = j1 , j2 , . . . , jn−k , různé od ir takové, že pro každé ¯xir − ξir ¯ < δ a ¯xjs − ξjs ¯ < ∆ je ¡ ¢ xs = ϕs xi1 , xi2 , . . . , xik . ¯ ¯ Přitom jsou funkce ϕs třídy Cp . Zobrazení Φ definované pro ¯tr − ξir ¯ < δ předpisem xir = tr ,
¡ ¢ xjs = ϕjs t1 , t2 , . . . , tk
je v okolí bodu ξ parametrické vyjádření regulární k–rozměrné nadplochy v Rn , která je třídy Cp . Tedy množina S definovaná vztahy (15) je regulární k–rozměrná nadplocha. Nechť je regulární k–rozměrná nadplocha S ⊂ Rn dána rovnicemi (15). Bez újmu na obecnosti lze předpokládat, že její parametrické rovnice jsou x i = ti
¡
x j = ϕ j t 1 , t 2 , . . . , tk
¢
pro i = 1, 2, . . . , k pro j = k + 1, k + 2, . . . , n
Tečné vektory v i jsou v tomto případě µ ¶ ∂ϕk+1 ∂ϕn v 1 = 1, 0, . . . , 0, ,..., ∂t1 ∂t1 µ ¶ ∂ϕk+1 ∂ϕn v 2 = 0, 1, . . . , 0, ,..., ∂t2 ∂t2 ... ¶ µ ∂ϕn ∂ϕk+1 ,..., v k = 0, 0, . . . , 1, ∂tk ∂tk Derivací rovnic (15) dostaneme pro každé r = 1, 2, . . . , n − k a i = 1, 2, . . . , k ∂Φr ∂Φr ∂ϕk+1 ∂Φr ∂ϕn + · + ··· + · = 0. ∂xi ∂xk+1 ∂xi ∂xn ∂xi 83
Tento vztah lze přepsat ve tvaru v i · grad Φr = 0 ,
i = 1, 2, . . . , k ,
r = 1, 2, . . . , n − k .
Ale to znamená, že vektory grad Φr jsou kolmé na všechny tečné vektory k nadploše S, a tedy jsou to normálové vektory k nadploše dané vztahy (15). Podmínka na hodnost matice W pak znamená, že v každém bodě existuje (n − k) lineárně nezávislých normálových vektorů. Parametrické rovnice normálové nadroviny k této nadploše S v bodě ξ jsou x = ξ + t1 grad Φ1 + t2 grad Φ2 + · · · + tn−k grad Φn−k . Rovnici tečné nadroviny v tomto bodě lze zapsat pomocí soustavy rovnic ¡ ¢ ¡ ¢ x − ξ · grad Φr ξ = 0 , r = 1, 2, . . . , n − k .
(16)
(17)
Příklad 1. (n − 1)–rozměrná kulová plocha v Rn s poloměrem R a středem v počátku je nadplocha S definována rovnicí x21 + x22 + · · · + x2n = R2 . (18) 2 2 n Protože je funkce Φ x1 , . . . , xn = x1 + · · · + xn třídy C∞ R a grad Φ = 2x1 , . . . , 2xn 6= 0 na S, definuje podle toho, co bylo řečeno dříve, regulární (n − 1)–rozměrnou nadplochu S třídy C∞ . Neexistuje jediný parametrický popis, kterým bychom popsali celou tuto plochu. To plyne z toho, že množina S je uzavřená a omezená v Rn , a tedy kompaktní. Na druhou stranu, nechť je Φ : G → S, kde G je otevřená množina v Rn−1 , parametrický popis množiny S. Pak je ale inverzní zobrazení Φ (−1) spojité na S a G = Φ (−1) (S) je kompaktní množina v Rn−1 . Ale to je spor s tím, že množina G je otevřená. Proto musíme nadplochu S popsat pomocí několika zobrazení. Lze to udělat například takto: Označme Sk+ = S ∩ (x1 , . . . , xn ) ; xk > 0 , Sk− = S ∩ (x1 , . . . , xn ) ; xk < 0 . Platí, že S =
n [
Sk+ ∪ Sk− . Každou množinu Sk+ , resp. Sk− lze popsat jako graf funkce
k=1
Sk+ Sk−
q
o R2 − x21 − · · · − x2k−1 − x2k+1 − · · · − x2n , xk+1 , . . . , xn ; (x1 , . . . , xk−1 , xk+1 , . . . , xn ∈ G q o n = x1 , . . . , xk−1 , − R2 − x21 − · · · − x2k−1 − x2k+1 − · · · − x2n , xk+1 , . . . , xn ; (x1 , . . . , xk−1 , xk+1 , . . . , xn ∈ G n
=
x1 , . . . , xk−1 ,
n o kde G = x1 , . . . , xk−1 , xk+1 , . . . , xn ; x21 + · · · + x2k−1 + x2k+1 + · · · + x2n < R2 je otevřená koule v Rn−1 s poloměrem R. Normálový vektor je n = grad Φ = 2 x1 , . . . , xn . Tedy rovnice tečné nadroviny v bodě ξ = ξ1 , . . . , ξn ∈ S je x − ξ · grad Φ ξ = 0 ⇔ x1 − ξ1 ξ1 + x2 − ξ2 ξ2 + · · · + xn − ξn ξn = 0 , 2 = R2 , a parametrická rovnice normály je x = ξ + t grad Φ(ξ ξ ), tj. xk = ξk + 2tξk , kde t ∈ R. kde ξ12 + ξ22 + · · · + ξn + Souřadnice tečných vektorů k nadploše S závisí na parametrickém popisu nadplochy S. Například na Sn jsou tečné vektory
v 1 = 1, 0, . . . , 0, q
−x1 R2
−
v 2 = 0, 1, . . . , 0, q ...
x21
− ··· −
x2n−1
−x2 R2 − x21 − · · · − x2n−1
(19)
v n−1 = 0, 0, . . . , 1, q
−xn−1 R2 − x21 − · · · − x2n−1
.
Příklad 2. Nechť je S ⊂ R3 , která vznikne rotací kružnice s poloměrem R2 a středem v bodě R1 ; 0; 0 , R1 > R2 , která leží v rovině y = 0 kolem osy Oz. Protože tato množina kompaktní, nelze ji parametricky popsat pomocí jednoho zobrazení. Snadno se lze přesvědčit, že ji ale lze popsat funkcemi x = Φ 1 (u, v) = R1 + R2 cos v cos u, R1 + R2 cos v sin u, R2 sin v , u ∈ (0, 2π) , v ∈ (0, 2π) x = Φ 2 (u, v) = R1 + R2 cos v cos u, R1 + R2 cos v sin u, R2 sin v , u ∈ (−π, π) , v ∈ (−π, π) . 84
Tato plocha se nazývá anuloid. Uvažujme zobrazení Φ 1 . Nechť je dáno u0 ∈ (0, 2π) a v0 ∈ (0, 2π). Tento bod se zobrazí na bod x0 = R1 + R2 cos v0 cos u0 , y0 = R1 + R2 cos v0 sin u0 , z0 = Rr sin v0 . Tečné vektory k anuloidu S v bodě x0 ; y0 ; z0 jsou Φ ∂Φ u0 , v0 = − R1 + R2 cos v0 sin u0 , R1 + R2 cos v0 cos u0 , 0 ∂u Φ ∂Φ tv = u0 , v0 = −R2 sin v0 cos u0 , −R2 sin v0 sin u0 , R2 cos v0 . ∂v Parametrické rovnice tečné roviny k ploše S v bodě x0 ; y0 ; z0 jsou tu =
x = x0 − t1 R1 + R2 cos v0 sin u0 − t2 R2 sin v0 x = x 0 + t1t u + t2t v ⇔ y = y0 + t1 R1 + R2 cos v0 cos u0 − t2 R2 sin v0 z = z0 + t2 R2 cos v0 Normálový vektor n v daném bodě lze najít jako n = t u × t v = R2 R1 + R2 cos v0 cos v0 cos u0 , R2 R1 + R2 cos v0 cos v0 sin u0 , R2 R1 + R2 cos v0 sin v0 . Parametrické rovnice normály proto jsou x = x0 + tR2 R1 + R2 cos v0 cos v0 cos u0 n ⇔ y = y0 + tR2 R1 + R2 cos v0 cos v0 sin u0 x = x 0 + tn z = z0 + tR2 R1 + R2 cos v0 sin v0 Rovnici tečné roviny lze zapsat ve tvaru
x − xé · n = 0
neboli x−x0 R2 R1 +R2 cos v0 cos v0 cos u0 + y−y0 R2 R1 +R2 cos v0 cos v0 sin u0 + z−z0 R2 R1 +R2 cos v0 sin v0 = 0 Příklad 3. Nechť je množina S ⊂ R4 , která je dána parametrickými rovnicemi (R1 , R2 > 0) Φ 1 (u, v) = R1 cos u, R1 sin u, R2 cos v, R2 sin v Φ2 (u, v) = R1 cos u, R1 sin u, R2 cos v, R2 sin v Tyto rovnice popisují regulární 2–rozměrnou plochu v u, v ∈ (0, 2π). Tečné vektory v tomto bodě jsou
u, v ∈ (0, 2π) u, v ∈ (−π, π) .
R4 . Uvažujme bod ξ = Φ 1 u0 , v0 = ξ1 , ξ2 , ξ3 , ξ4 , kde
Φ1 ∂Φ u0 , v0 = −R1 sin u0 , R1 cos u0 , 0, 0 ∂u Φ1 ∂Φ tv = u0 , v0 = 0, 0, −R2 sin v0 , R2 cos v0 . ∂v
tu =
Tedy parametrické rovnice tečné roviny jsou x1 x2 x = ξ + t1t u + t2t v ⇔ x3 x4
= ξ1 − t1 R1 sin u0 = ξ2 + t1 R1 cos u0 = ξ3 − t2 R2 sin v0 = ξ4 + t2 R2 cos v0
Normálové vektory n splňují rovnice tu · n = 0 −R1 n1 sin u0 + R1 n2 cos u0 = 0 např. n 1 = (cos u0 , sin u0 , 0, 0) ⇔ =⇒ n 2 = (0, 0, cos v0 , sin v0 ) tv · n = 0 −R2 n3 sin v0 + R2 n4 cos v0 = 0 V tomto případě je normálová nadrovina 2–rozměrná ploch s parametrickými rovnicemi
x = ξ + t1 n 1 + t2 n 2 ⇔
85
x1 x2 x3 x4
= ξ1 + t1 cos u0 = ξ2 + t1 sin u0 = ξ3 + t2 cos v0 = ξ4 + t2 sin v0
Příklad 4. Nechť R > R0 > 0 a S = x = (x, y, z) = Φ (u, v) ; u ∈ −R0 , R0 , v ∈ h0, 2πi , kde Φ (u, v) =
1 2
R + u cos
v cos v, R + u cos
1 2
v sin v, u sin
1 2
v .
Tato množina S ⊂ R3 se nazývá M¨ obiův list. Lze si ji představit takto: Vezmeme pásek papíru. Přetočíme jeden konec o 180◦ a slepíme jej s druhým koncem. Výsledkem je právě M¨ obiův list. Jestliže omezíme proměnnou v na otevřený interval v ∈ (0, 2π), dostaneme parametrický popis této plochy bez otevřené úsečky spojující body R − R0 a R + R0 na ose Ox. Tečné vektory k ploše S v bodě x0 = x0 , y0 , z0 = Φ u0 , v0 ∈ S jsou Φ Φ ∂Φ ∂Φ tu = (u0 , v0 ) , t v = (u0 , v0 ) . ∂u ∂v Například pro u0 = 0 jsou tečné vektory v0 v0 v0 t u = cos v0 cos , sin v0 cos , sin , 2 2 2
t v = −R sin v0 , R cos v0 , 0
Normálový vektor k ploše S v tomto bodě je v0 v0 v0 n = t u × t v = − cos v0 sin , − sin v0 sin , cos . 2 2 2 Všimněte si toho, že pro v0 → 0 je x 0 → (R, 0, 0) a n → (0, 0, 1), kdežto pro v0 → 2π dostaneme x 0 → (R, 0, 0), ale n → (0, 0, −1). Proto nelze na celém M¨ obiově listu definovat normálu tak, aby byla spojitá. Takové plochy se nazývají ”neorientovatelné”. O orientovatelných a neorientovatelných plochách se zmíníme v následující přednášce.
Integrál přes regulární nadplochy v Rn Jak je známo z předchozí přednášky, abychom zavedli integrál přes k–rozměrnou nadplochu S v Rn musíme na S definovat σ–algebru MS měřitelných množin a σ–aditivní míru µS na MS . My se v přednášce omezíme na regulární k–rozměrné nadplochy v Rn . Připomenu, že S ⊂ Rn je regulární k–rozměrná nadplocha právě tehdy, když pro bod ¡ ¢ ¡ každý ¢ x 0 ∈ S existuje otevřené okolí U x 0 v S, vzájemně jednoznačné zobrazení Φ : G → U x 0 , kde G je ¡ ¢ otevřená podmnožina Rk , pro které jsou zobrazení Φ a Φ (−1) spojitá, zobrazení Φ = ϕ1 , ϕ2 , . . . , ϕn je třídy C1 (G) a matice ∂ϕ ∂ϕ2 ∂ϕ3 ∂ϕn 1 ... ∂t1 ∂t1 ∂t1 ∂t1 ∂ϕ1 ∂ϕ2 ∂ϕ3 ∂ϕn ... Φ 0 (tt) = ∂t2 ∂t ∂t ∂t . . . . . . . . . .2. . . . . .2. . . . . . . . . . . .2. ∂ϕ1 ∂ϕ2 ∂ϕ3 ∂ϕn ... ∂tk ∂tk ∂tk ∂tk ¡ ¢ má v každém bodě t = t1 , t2 , . . . , tk ∈ G hodnost k. Zobrazení Φ budeme nazývat parametrický popis nadplochy S. Označme ° 0° q ¡ ¢ °Φ ° = det Φ 0Φ 0 T . (21) Věta 1. Nechť je S regulární k–rozměrná nadplocha v Rn . Existuje právě jedna míra µS definovaná na jisté σ–algebře MS podmnožin množiny S, pro níž platí: (1) Množina M ⊂ S patří do MS právě tehdy, je-li její vzor Φ (−1) (M ) pro každý parametrický popis Φ : G → S, kde G je otevřená množina v Rk , měřitelný (v Lebesgueově smyslu) (2) Pro každý parametrický popis Φ : G → S platí, že když M ⊂ Φ (G) a M ∈ MS je Z µS (M ) =
Φ (−1) (M )
° 0° °Φ ° dt1 dt2 . . . dtk .
(22)
Poznámka: Jestliže je Φ (tt) = ϕ1 (tt), ϕ2 (tt), . . . , ϕn (tt) parametrický popis regulární nadplochy S, jsou vektory vr =
Φ ∂Φ = ∂tr
∂ϕ1 ∂ϕ2 ∂ϕn (tt), (tt), . . . , (tt) , ∂tr ∂tr ∂tr 86
r = 1, 2, . . . , k, tečné vektory k nadploše S v bodě t . Vztah (21) lze zapsat ve tvaru v1 · v1 v1 · v2 v1 · v3 ... v1 · vk
0 2 v2 · v2 v2 · v3 ... v2 · vk
Φ = det v 1 · v 2 ............................................. v1 · vk v2 · vk v2 · vk ... vk · vk
nebo jako
X
0 2
Φ =
A2i1 ,i2 ,...,ik ,
i1
kde
Ai1 ,i2 ,...,ik
∂ϕik ∂ϕi1 ∂ϕi2 . . . ∂t ∂t1 ∂t1 1 ∂ϕ ∂ϕik ∂ϕi2 i1 . . . = det ∂t2 ∂t2 ∂t2 ......................... ∂ϕi1 ∂ϕi2 ∂ϕik ... ∂tk ∂tk ∂tk
Jestliže si uvědomíte, že platí Φ ∂Φ Φ t1 , . . . , tr−1 , tr + dtr , tr+1 , . . . , tk − Φ t1 , . . . , tk ≈ (tt) dtr = v r t1 , . . . , tk dtr , ∂tr
lze snadno nahlédnout, viz (11), že Φ 0 dt1 . . . dtk je rovno obsahu rovnoběžníku s hranami v r dtr . Námi zavedená míra na regulární k–rozměrné nadploše S souvisí právě s touto aproximací.
Uveďme nyní některé speciální případy, které se nejčastěji vyskytují v aplikacích. 1. Nechť je G =¡ (a, b) ⊂ R otevřený interval a Φ : G → Rn jsou parametrické rovnice křivky C. ¢ Jestliže je Φ (t) = ϕ1 (t), . . . , ϕn (t) , pak dostaneme ° 0 ° q¡ ¡ ¢2 ¡ ¢2 °Φ ° = ϕ01 )2 + ϕ02 + · · · + ϕ0n . Integrál
Z
b
q¡
a
(23)
¡ ¢2 ¡ ¢2 ϕ01 )2 + ϕ02 + · · · + ϕ0n dt = s
(24)
udává délky křivky C. 2 3 2. Nechť ¡ je G otevřená množina ¢v R a parametrické rovnice regulární plochy S ∈ R jsou Φ (u, v) = ϕ1 (u, v), ϕ2 (u, v), ϕ3 (u, v) , kde (u, v) ∈ G. V tomto případě jsou tečné vektory µ
¶ ∂ϕ1 ∂ϕ2 ∂ϕ3 , , ∂u ∂u ∂u µ ¶ ∂ϕ1 ∂ϕ2 ∂ϕ3 tv = , , ∂v ∂v ∂v tu =
(25)
Normálový vektor n = t u × t v má velikost ° ° ° 0° °n ° = °Φ ° neboli
Integrál
¯ ¯ ∂ϕ2 ° °2 ¯¯ ∂u °n ° = ¯ ¯ ∂ϕ2 ¯ ∂v v¯ u¯ ∂ϕ 2 Z u u¯¯ u ∂u P = t¯¯ ∂ϕ 2 G ¯ ∂v
∂ϕ3 ∂u ∂ϕ3 ∂v ∂ϕ3 ∂u ∂ϕ3 ∂v
¯2 ¯ ¯ ¯ ∂ϕ1 ¯ ¯ ¯ ¯ ¯ + ¯ ∂u ¯ ¯ ∂ϕ1 ¯ ¯ ∂v
¯2 ¯ ¯ ¯ ∂ϕ1 ¯ ¯ ¯ ¯ ¯ + ¯ ∂u ¯ ¯ ∂ϕ1 ¯ ¯ ∂v 87
(26)
∂ϕ3 ∂u ∂ϕ3 ∂v ∂ϕ3 ∂u ∂ϕ3 ∂v
¯2 ¯ ¯ ¯ ∂ϕ1 ¯ ¯ ¯ ¯ ¯ + ¯ ∂u ¯ ¯ ∂ϕ1 ¯ ¯ ∂v
¯2 ¯ ¯ ¯ ∂ϕ1 ¯ ¯ ¯ ¯ ¯ + ¯ ∂u ¯ ¯ ∂ϕ1 ¯ ¯ ∂v
∂ϕ2 ∂u ∂ϕ2 ∂v ∂ϕ2 ∂u ∂ϕ2 ∂v
¯2 ¯ ¯ ¯ ¯ . ¯ ¯
¯2 ¯ ¯ ¯ ¯ du dv ¯ ¯
(27)
udává obsah plochy S. 3. Jestliže je regulární (n −¡ 1)–rozměrná nadplocha S ⊂ Rn dána jako graf funkce (n − 1) ¢ proměnných, tj. jestliže xn = ϕ x1 , x2 , . . . , xn−1 , jsou tečné vektory ¡ ¢ t 1 = 1, 0, . . . , 0, ϕ01 ¡ ¢ t 2 = 0, 1, . . . , 0, ϕ02 ... ¡ ¢ t n−1 = 0, 0, . . . , 1, ϕ0n−1 a míra je dána funkcí ¡ ¢2 1 + ϕ01
ϕ01 ϕ02 ϕ01 ϕ03 ... ϕ01 ϕ0n−1 ¡ ¢2 ° 0 °2 1 + ϕ02 ϕ0 ϕ0 ... ϕ0 ϕ0 = °Φ ° = det ϕ01 ϕ02 . . . . . . . . . . . . . . . . . . . . . . . . . .2. . 3. . . . . . . . . . . . . 2. . .n−1 . . . . . ¡ 0 ¢2 0 0 0 0 0 0 ϕ1 ϕn−1 ϕ2 ϕn−1 ϕ3 ϕn−1 . . . 1 + ϕn−1 ¡ 0 ¢2 ¡ 0 ¢2 ¡ 0 ¢2 ¡ ¢2 = 1 + ϕ1 + ϕ2 + ϕ3 + · · · + ϕ0n−1 .
(28)
Tento vztah lze ukázat indukcí. V předchozí části jsme definovali σ–algebru měřitelných podmnožin regulární k–rozměrné nadplochy S ⊂ Rn a míru na této podalgebře. Tím jsou ale také definovány měřitelné funkce na S a x) přes nadplochu S. integrál měřitelné funkce f (x x) definovaná Věta 2. Nechť je S regulární k–rozměrná nadplocha v Rn . Zobecněná reálná funkce f (x na měřitelné podmnožině M ∈ MS je měřitelná právě tehdy, když je pro každý parametrický popis Φ : G → S měřitelná funkce f ◦ Φ (rozumí se při Lebesgueově míře v Rk ). Je-li M ∈ MS a M ⊂ Φ (G), kde Φ : G → S je parametrický popis nadplochy S, je Z Z ¡ ¢° ° x) dµS = f (x f ◦ Φ °Φ 0 ° dt1 . . . dtk . (29) Φ (−1) (M )
M
Z
¡ ¢ f x1 , x2 , . . . , xn ds a tento
Jestliže je C jednorozměrná regulární nadplocha, tj. křivka, píšeme C
integrál nazýváme křivkový integrál prvního druhu. Je-li S regulární dvourozměrná nadplocha (zejména když je S ⊂ R3 ), tj. plocha, používáme pro Z ¡ ¢ integrál (29) označení f x1 , x2 , . . . , xn dS a nazýváme jej plošným integrálem prvního druhu. S
Na závěr ještě uvedu konkrétní výrazy pro speciální případy, o nichž jsem se zmínil dříve. n 1. Nechť je G =¡ (a, b) ⊂ R otevřený ¢ ¡interval a Φ : ¢G → R jsou parametrické rovnice křivky C. Jestliže je Φ (t) = ϕ1 (t), . . . , ϕn (t) a f x1 , x2 , . . . , xn je měřitelná funkce na C, je Z
¡ ¢ f x1 , x2 , . . . , xn ds =
Z
b a
C
¡ ¢q¡ 0 ¡ ¢2 ¡ ¢2 f ϕ1 (t), ϕ2 (t), . . . , ϕn (t) ϕ1 )2 + ϕ02 + · · · + ϕ0n dt .
(30)
2 3 2. Nechť ¡ je G otevřená množina ¢v R a parametrické rovnice regulární plochy S ∈ R jsou Φ (u, v) = ϕ1 (u, v), ϕ2 (u, v), ϕ3 (u, v) , kde (u, v) ∈ G a f (x, y, z) je funkce měřitelná na S. Pak je
Z f (x, y, z) dS =
(31)
S
v¯ u¯ ∂ϕ u¯ 2 Z ¡ ¢u ¯ ∂u u = f ϕ1 (u, v), ϕ2 (u, v), ϕ3 (u, v) t¯ ¯ ∂ϕ2 G ¯ ∂v
∂ϕ3 ∂u ∂ϕ3 ∂v 88
¯2 ¯ ¯ ¯ ∂ϕ1 ¯ ¯ ¯ ¯ ¯ + ¯ ∂u ¯ ¯ ∂ϕ1 ¯ ¯ ∂v
∂ϕ3 ∂u ∂ϕ3 ∂v
¯2 ¯ ¯ ¯ ∂ϕ1 ¯ ¯ ¯ ¯ ¯ + ¯ ∂u ¯ ¯ ∂ϕ1 ¯ ¯ ∂v
∂ϕ2 ∂u ∂ϕ2 ∂v
¯2 ¯ ¯ ¯ ¯ du dv ¯ ¯
3. Jestliže je regulární¡(n − 1)–rozměrnᢠnadplocha S ⊂ Rn dána ¡ ¢ jako graf funkce (n ¡ − 1) proměn¢ ných, tj. jestliže xn = ϕ x1 , x2 , . . . , xn−1 , kde x1 , x2 , . . . , xn−1 ∈ G ⊂ Rn−1 , a f x1 , . . . , xn je měřitelná funkce na S, je Z ¡ ¢ f x1 , x2 , . . . , xx dµS = (32) S Z ¡ ¢2 ¡ ¢2 ¡ ¢2 ¡ ¢q = f x1 , x2 , . . . , xn−1 , ϕ(x1 , . . . , xn−1 ) 1 + ϕ01 + ϕ02 + · · · + ϕ0n−1 dx1 dx2 . . . dxn−1 . G
89
Přednáška 11 Křivkový a plošný integrál druhého druhu v R3 Ve fyzikálních aplikacích se často setkáváme s křivkovým a plošným integrálem vektorové funkce v R3 . Příkladem takového integrálu po křivce C je práce, kterou vyková síla F , která působí po křivce C a příkladem plošného integrálu je výpočet množství kapaliny, která se pohybuje rychlosti v , které proteče plochou S. Nejprve se budeme zabývat prací, kterou vykoná síla F , která působí po křivce. Jak je znáno z fyziky, působíme-li konstantní sílou F po která je rovnoběžná s vektorem τ a má délku s, ° ° úsečce, vykonáme práci A = F s cos α, kde F = °F ° je velikost síly F , s je délka úsečky a α je úhel, který F ·τ °° ° svírají vektory F a τ . Protože je cos α = ° °F °·°τ ° , lze práci zapsat ve tvaru A = F ·τ0 · s, τ ° kde τ 0 = ° °τ ° je jednotkový vektor ve směru vektoru τ . Jestliže síla F není konstantní nebo křivka C není přímka, lze práci po křivce s počátečním bodem a a koncovým bodem b přibližně vyjádřit tak, že křivku rozdělíme body x k , k = 0, 1, . . . , N , kde x 0 = a a x N = b . Přitom když budeme probíhat po křivce C od bodu a do bodu b leží bod x k před bodem x k+1 . Tyto¡body ¢ rozdělí křivku C na malé úseky, ve kterých lze sílu F dobře aproximovat konstantní silou F x k a úsek křivky C úsečkou, ¡ ¢která ¡ spojuje¢ body x k a x k+1 . Proto lze práci po těchto úsecích aproximovat veličinou Ak ≈ F x k · x k+1 − x k a práci po celé křivce C výrazem A≈
N −1 X
¡ ¢ ¡ ¢ F x k · x k+1 − x k .
(1)
k=0
¡ ¢ Jestliže má křivka C parametrické rovnice Φ : (a, b) → C,¡ tj. ¢ Φ (t) = x (t) = x(t), y(t), z(t) , odpovídají bodům x k ∈ C body tk ∈ ha, bi takové, že x k = Φ tk . Pak lze přibližně psát ¡ ¢ ¡ ¢ ¡ ¢¡ ¢ ¡ ¢ ¡ ¢ x k+1 − x k = Φ tk + 1 − Φ tk ≈ Φ 0 tk tk+1 − tk = x0 (tk ), y 0 (tk ), z 0 (tk ) · tk+1 − tk .
(2)
Po dosazení (2) do (1) dostaneme A≈
N −1 X
¡ ¢ ¡ ¢¡ ¢ F x k (t) · Φ 0 tk tk+1 − tk .
(3)
k=0
x po křivce C z bodu a do bodu b ve tvaru Vztah (3) nás vede k vyjádření práce síly F (x Z
b
A= a
¡ ¢ F Φ (t) Φ 0 (t) dt =
Z
b
¡ ¢ F x (t) · x 0 (t) dt =
a
Z x) · dx x. F (x
(4)
C
Z přibližného vyjádření (3) je zřejmé, že (4) závisí na směru, ve kterém se pohybujeme po křivce C. Jestliže se budeme pohybovat po křivce v opačném směru, změní integrál (4) znaménko. Abychom tedy úplně definovali tento integrál, je třeba zadat, v jakém směru se pohybujeme po křivce C neboli orientaci křivky. Tu lze zadat tak, že udáme počáteční, resp. koncový bod křivky nebo zadáme v každém bodě x křivky C směr tečného vektoru, tj. jestliže zadáme na křivce C spojité nenulové x). Takové křivky se nazývají orivektorové pole tečných vektorů — spojitou vektorovou funkci τ (x entované. Tedy integrály typu (4) lze počítat jen přes orientované křivky. Obecně lze definovat křivkový integrál prvního druhu v Rn takto: 90
Definice 1. Nechť je C regulární orientovaná křivka v Rn , Φ : (a, b) → C její parametrický popis a x) měřitelná vektorová funkce, tj. všechny její složky jsou měřitelné funkce, na křivce C. Pak se F (x Z Z b ¡ ¢ x) dss = F (x F Φ (t) · Φ 0 (t) dt (5) C
a
x) přes křivku C. nazývá křivkový integrál druhého druhu funkce F (x ¡ ¢ Jestliže píšeme Φ (t) = x1 (t), x2 (t), . . . , xn (t) a ¢ ¡ ¢ x = F1 (x1 , . . . , xn ), F2 (x1 , . . . , xn ), . . . , Fn (x1 , . . . , xn ) , F (x pak lze psát (5) ve tvaru Z Z b³ ¡ ¢ ¡ ¢ ¢´ x) dss = F (x F1 x1 (t), . . . , xn (t) x01 (t) + · · · + Fn x1 (t), . . . , xn (t) x0n (t) dt . C
(6)
a
Ale když si uvědomíte, že x0k (t) dt = dxk , snadno nahlédnete, proč se křivkový integrál prvního druhu často píše jako Z Z ³ ´ x) dss = x) dx1 + f2 (x x) dx2 + · · · + Fn (x x) dxn . F (x F1 (x (7) C
C
x). Ptáme Zabývejme se nyní následujícím problémem: Kapalina protéká plochou S rychlostí v (x se, jaké množství kapaliny proteče touto plochou za jednotku času. Jestliže předpokládáme, že rychlost toku kapaliny v je konstantní a plocha S je rovina s normálovým vektorem n a obsahem ° ° S, je objem kapaliny, který proteče plochou S ve směru vektoru n roven V = vS cos α, kde v = °v ° je velikost rychlosti a α je úhel, který svírá vektor směru rychlosti v s vektorem normály n plochy S. Snadno nahlédneme, že tento vztah lze zapsat jako V = v ·nS,
(8)
kde n je jednotkový vektor normály plochy S. V případě, že rychlost není konstantní nebo plocha není rovina, lze tok kapaliny plochou přibližně vyjádřit tak, že plochu rozdělíme na malé části, které budeme aproximovat rovinou a rychlost na těchto malých částech plochy budeme považovat za konstantní. Přesněji pro regulární plochu s parametrickou rovnicí Φ : G → S ⊂ R3 , kterou lze napsat ve tvaru ¡ ¢ ¡ ¢ Φ (u, v) = ϕ1 (u, v), ϕ2 (u, v), ϕ3 (u, v) = x(u, v), y(u, v), z(u, v) , 2 kde (u, v) ∈ G ⊂ podobně jako při definici Riemannova integrálu, na ob R . Množinu ® G rozdělíme, ® délníky Or,s = ur , ur+1 × vs , vs+1 . Obdélník Or,s se při zobrazení Φ zobrazí do jisté podmnožiny Sr,s ⊂ S, kterou aproximujeme částí roviny. Protože ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ Φ ur+1 , vs − Φ ur , vs ≈ Φ 0u ur , vs · ur+1 − ur = τ u ur , vs · ur+1 − ur ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ Φ ur , vs+1 − Φ ur , vs ≈ Φ 0v ur , vs · vs+1 − vs = τ v ur , vs · vs+1 − vs , ¡ ¢ ¡ ¢ ¡ ¢ kde τ u ur , vs a τ v ur , vs jsou tečné ¡vektory Φ¢ ur , vs¡ , aproximujeme Sr,s ¢ k ploše S v bodě ¡ ¢ x) rovnoběžníkem, který je určen bodem Φ ur , vs a má strany τ u , v a τ u , v . Rychlost v (x u r s v r s ¢ ¡ na Sr,s můžeme aproximovat konstantním vektorem v x(ur°, vs°),¡ y(ur , vs ), z(u , v ) . Protože nor¢¡ r s ¢ málový vektor k této ploše je n = τ u × τ v a její velikost je °n ° ur+1 − ur vs+1 − vs , lze objem kapaliny, který proteče plochou S za jednotku času, aproximovat výrazem X ¡ ¢¡ ¢ ¢ n ° ° ¡ ° · °n ° · ur+1 − ur vs+1 − vs v x(ur , vs ), y(ur , vs ), z(ur , vs ) · ° V ≈ °n ° r,s X ¡ ¢ ¡ ¢¡ ¢ v x(ur , vs ), y(ur , vs ), z(ur , vs ) · n · ur+1 − ur vs+1 − vs . = r,s
91
Proto je přirozené, že Z V =
¡ ¢ v x(u, v), y(u, v), z(u, v) · n (u, v) du dv .
(9)
G
Je zřejmé, že pokud změníme směr jednotkového normálového vektoru n , změní se znaménko integrálu (9). Tedy aby byl integrál určen jednoznačně, musíme zadat v každém bodě plochy S jednotkový vektor normály. Navíc požadujeme, aby byl vektor n na ploše S spojitý. Plocha S, na kterém je v každém bodě x ∈ S zadán směr vektoru normály, který je na ploše S spojitý se nazývá orientovaná plocha. Existují ale plochy, na kterých nelze definovat spojité pole jednotkových normálových vektorů, například M¨obiův list. Takové plochy nazýváme neorientovatelné . Naopak plochy na nichž je možné definovat spojité pole jednotkových normálových vektorů nazýváme orientovatelné. Integrály typu (9) lze proto definovat pouze přes orientovatelné plochy. Definice 2. Nechť je S regulární 2–rozměrná orientovaná plocha v R3 s orientací danou spojitým x) vektorové pole definované na ploše S. vektorovým polem n 0 , Φ : G → S její parametrizace a F (x Plošný integrál druhého druhu nazýváme výraz ZZ ZZ ¡ ¢ S= F ◦ Φ · n du dv , (10) F dS S
G
¡ ¢ n0 , kde c > 0. kde n = ± Φ 0u × Φ 0v , kde znaménko ± se volí tak, aby n = cn Poznámka. Rozepíšeme (10) pomocí složek. Označme F x1 , x2 , x3 ) = F1 x1 , x2 , x3 , F2 x1 , x2 , x3 , F3 x1 , x2 , x3 Φ (u, v) = x1 (u, v), x2 (u, v), x3 (u, v) Pak je
∂x1 ∂x2 ∂x3 ∂x1 ∂x2 ∂x3 , , , τv = , , ∂u ∂u ∂u ∂v ∂v ∂v ∂x2 ∂x3 ∂x3 ∂x2 ∂x3 ∂x1 ∂x1 ∂x3 ∂x1 ∂x2 ∂x2 ∂x1 n = τu × τv = − , − , − ∂u ∂v ∂u ∂v ∂u ∂v ∂u ∂v ∂u ∂v ∂u ∂v τu =
a plošný integrál druhého druhu (10) pak je Z "
ZZ S= F dS S
G
+ F2 + F3
∂x2 ∂x3 − ∂u ∂v ∂x3 ∂x1 x1 (u, v), x2 (u, v), x3 (u, v) ∂u ∂v ∂x1 ∂x2 x1 (u, v), x2 (u, v), x3 (u, v) ∂u ∂v
F1 x1 (u, v), x2 (u, v), x3 (u, v)
∂x3 ∂x2 ∂u ∂v −
+
∂x1 ∂x3 ∂u ∂v
+ # ∂x2 ∂x1 − du dv . ∂u ∂v
(11)
Členy integrandu v závorkách lze zapsat v přehlednější formě. Uvažujme reálný vektorový prostor V s bází du a dv. Mezi prvky x, y ∈ V definujme bilineární antisymetrickou operaci ∧. To znamená, že pro každé x, y, z ∈ V a a ∈ R platí (x + y) ∧ z = x ∧ z + y ∧ z, (ax) ∧ y = ax ∧ y = x ∧ (ay) a x ∧ y = −y ∧ x. Pak ale pro každé x ∈ V je x ∧ x = −x ∧ x, a tedy x ∧ x = 0. Protože diferenciály funkcí xk = xk (u, v), k = 1, 2, 3, jsou dxk =
∂xk ∂xk du + dv , ∂u ∂v
dostaneme
∂x1 ∂x2 ∂x1 ∂x1 ∂x2 du + dv ∧ du + dv = ∂u ∂v ∂u ∂v ∂u ∂x3 ∂x1 ∂x3 ∂x3 ∂x1 dx3 ∧ dx1 = du + dv ∧ du + dv = ∂u ∂v ∂u ∂v ∂u ∂x3 ∂x2 ∂x2 ∂x2 ∂x3 du + dv ∧ du + dv = dx2 ∧ dx3 = ∂u ∂v ∂u ∂v ∂u dx1 ∧ dx2 =
92
∂x2 ∂x2 ∂x1 − du ∧ dv ∂v ∂u ∂v ∂x1 ∂x1 ∂x3 − du ∧ dv ∂v ∂u ∂v ∂x3 ∂x3 ∂x2 − du ∧ dv . ∂v ∂u ∂v
(12)
Členy u du ∧ du jsou právě výrazy v závorkách v integrandu. Protože dudv v integrálu (11) je pouze značka, která nám vlastně jen říká, že integrujeme podle u a v, lze ji formálně nahradit výrazem du ∧ dv a psát (11) ve tvaru ZZ ZZ S= F dS F1 dx2 ∧ dx3 + F2 dx3 ∧ dx1 + F2 dx1 ∧ dx2 , S
G
kde předpokládáme, že jsme dosadili z (12). Proto se pro plošný integrál druhého druhu často používá značení ZZ ZZ ZZ S= F dS F1 dx2 ∧ dx3 + F2 dx3 ∧ dx1 + F3 dx1 ∧ dx2 = F1 dx2 dx3 + F2 dx3 dx1 + F3 dx1 dx2 . (13) S
S
S
Obecně se integrál druhého druhu přes regulární orientovanou k–rozměrnou nadplochu S ∈ Rn s parametrickými rovnicemi Φ : G → S, kde Φ t1 , . . . , tk = x1 t1 , . . . , tk , x2 t1 , . . . , tk , . . . , xn t1 , . . . , tk , definuje vztahem Z Z ω= S
S 1≤i
Z =
X
X
G 1≤i <···
=
X 1≤i1
ωi, ...,ik Z G
ωi1 ,i2 ,...,ik dxi1 ∧ dxi2 ∧ · · · ∧ dxik = k k k X X X ∂xik ∂x ∂x i i 1 2 ◦ Φ t1 , . . . , tk dtr1 ∧ dtr2 ∧ · · · ∧ dtrk = ∂tr1 ∂tr2 ∂trk r =1 r =1 r =1 1
ωi1 i2 ...ik
2
k
X ∂xik ∂xi1 ∂xi2 dt1 ∧ dt2 ∧ · · · ∧ dtk , ◦ Φ t1 , . . . , tk ... (−1)|σ| ∂t ∂t ∂trk r1 r2 σ
kde se sčítá přes všechny permutace σ = r1 , r2 , . . . , rk množiny 1, 2, . . . , k), |σ| je sudé nebo liché v závislosti na tom, zda je permutace σ sudá nebo lichá a ∧ je tzv. vnější součin, tj. multilineární antisymetrické zobrazení. Φ ∂Φ Přitom orientace nadplochy S je definována pomocí výrazu τ t1 ∧ τ t2 ∧ . . . τ tk , kde τ tr = jsou tečné vektory. ∂tr Mnohdy, zejména v případě (n − 1)–rozměrné plochy, se zavádí označení Fj1 ,j2 ,...,jn−k = (−1)|σ| ωi1 ,i2 ,...,ik , kde j1 , . . . , jn−k , i1 , . . . , ik je permutace množiny (1, 2, . . . , n) a |σ| je sudé nebo liché v závislosti na tom, zda je tato permutace sudá nebo lichá. Speciálně v případě (n − 1)–rozměrné plochy je Fk = (−1)k+1 ω1,...,k−1,k+1,...,n . Poznamenejme ještě, že každá otevřená množina G ⊂ Rn je podle definice regulární n–rozměrná nadplocha v Rn . Za její parametrické rovnice stačí vzít identické zobrazení množiny G. V tomto případě pokládáme ω1,2,...,n = F a Z Z Z F dx1 ∧ dx2 ∧ · · · ∧ dxn ω1,2,...,n dx1 ∧ dx2 ∧ · · · ∧ dxn = ω= G
G
G
je obvyklý Lebesgueův integrál v
Rn . Snadno lze také nahlédnout, že pro parametrizaci x = Φ (yy ) množiny G je
dx1 ∧ dx2 ∧ · · · ∧ dxn = J Φ dy1 ∧ dy2 ∧ · · · ∧ dyn kde J Φ je jakobián zobrazení Φ.
Stokesovy věty Nyní se budeme zabývat vztahem mezi plošným integrálem druhého druhu přes k–rozměrnou nadplochu S ⊂ Rn a integrálem přes její hranici δS. Protože je nadplocha S podmnožinou metrického prostoru Rn s metrikou ρ, je to také metrický prostor s metrikou ρ zúženou na množinu S. Otevřené množiny, uzavřené množiny a hranice množiny budeme uvažovat v této redukované metrice. Jestliže je H uzavřená podmnožina nadplochy S, budeme říkat, že zobrazení F je třídy Cr (H), ¡ ¢ b ⊃ H a zobrazení G , které je třídy Cr H b a jehož zúžení na jestliže existuje otevřená množina H množinu H je rovno zobrazení F . Nechť S je k–rozměrná regulární orientovatelná nadplocha v Rn s parametrizací Φ : G → S, kde G je otevřená množina v Rk . Pak jsou µ ¶ Φ ∂ϕ1 ∂ϕ2 ∂ϕn ∂Φ = , ,..., , r = 1, . . . , k Tr = ∂tr ∂tr ∂tr ∂tr tečné vektory k nadploše S a orientace S je definována pomocí výrazu Γ = T1 ∧T2 ∧ ··· ∧Tk . 93
(14)
Nechť ∂S je hranice nadplochy S. Hranici ∂S nadplochy S budeme v tomto okamžiku chápat intuitivně. Přesná definice hranice ∂S by si vyžádala příliš mnoho času. O hranici ∂S budeme předpokládat, že je konečným sjednocením (k − 1)–rozměrných regulárních nadploch a spočetně mnoha regulárních nadploch dimenze menší než (k − 1). Nadplochy dimenze menší než (k − 1) mají (k − 1)–dimenzionální míru rovny nule, a proto nás z hlediska integrálů nebudou zajímat. Proto pokud budeme hovořit o hranici ∂S nadplochy S budeme mít na mysli regulární (k − 1)–rozměrnou nadplochu. Lze ukázat, že ∂S je orientovatelná. Jestliže je Ψ : H → ∂S parametrická popis hranice, jsou vektory µ ¶ Ψ ∂Ψ ∂ψ1 ∂ψ2 ∂ψn = , ,..., , τs = ∂ts ∂ts ∂ts ∂ts kde s = 1, 2, . . . , k − 1, tečné vektory k ∂S a orientace ∂S nechť je dána výrazem γ = τ 1 ∧ τ 2 ∧ · · · ∧ τ k−1 .
(15)
Budeme předpokládat, že existuje regulární křivka C ∈ S s parametrizací Θ : (a, bi → S taková, Θ dΘ že Θ (b) = x ∈ ∂S, pro každé t ∈ (a, b) je Θ (t) vnitřním bodem S a vektor s = (b) není tečným dt vektorem (k − 1)–rozměrné nadplochy ∂S. Pak se vektor s nazývá vnějším tečným vektorem plochy S v bodě x ∈ ∂S. Orientace (15) hranice ∂S se nazývá souhlasnou s orientací (14) nadplochy S právě tehdy, když pro každé x ∈ ∂S je x) = c(x x)ss(x x) ∧ γ (x x) , Γ (x x) je vnější tečný vektor k nadploše S v bodě x a c(x x) > 0. kde s (x Abychom mohli formulovat tzv. Stokesovu větu, zavedeme ještě jednu operaci s výrazy typu x) = ω(x
X
x) dxi1 ∧ dxi2 ∧ · · · ∧ dxir , ωi1 i2 ...ir (x
(16)
1≤i1
x) je funkce. Takové výrazy se v matematice nazývají diferenciální formy. Konkrétně kde ωi1 ik ...ir (x diferenciální (16) je tzv. r–forma. Říkáme, že diferenciální forma je třídy Cm (M ) právě tehdy, x) třídy Cr (M ). Jestliže je ω(x x) diferenciální r–forma třídy C1 (M ) když jsou její složky ωi1 i2 ...ir (x definovaná vztahem (16), lze pro ni definovat operaci d, tzv. vnější derivaci, vztahem x) = dω(x
n X
X
s=1 1≤i1
∂ωi1 i2 ...ir x) dxs ∧ dxi1 ∧ dxi2 ∧ · · · ∧ dxir . (x ∂xs
(17)
x) třídy C1 (M ) diferenciální (r + 1)– Tedy vnější derivace přiřazuje každé diferenciální r–formě ω(x x). formu dω(x Stokesovu větu lze formulovat takto: Věta. Nechť je S regulární orientovaná k–rozměrná nadplocha a ∂S je její hranice, která je souhx) diferenciální k–forma, která je třídy C1 (S). Pak lasně orientovaná s nadplochou S. Nechť je ω(x platí I Z x) = x) . ω(x dω(x (18) ∂S
S
Uvedeme speciální verze Stokesovy věty, které se nejčastěji vyskytují v aplikacích. 1. (Greenova věta) Nechť je Ω uzavřená množina v R2 a její hranice ∂Ω je regulární křivka C. Orientace křivky C je dána jejím tečným vektorem t a je souhlasná s orientací množiny Ω právě tehdy, když Ω leží vlevo, pokud probíháme po křivce C ve směru vektoru t . Nechť mají funkce fx a 94
fy na množině Ω spojité parciální derivace. Protože dx ∧ dx = dy ∧ dy = 0 a dy ∧ dx = − dx ∧ dy je µ ¶ µ ¶ ³ ¢ ∂fx ∂fy ∂fx ∂fy d fx dx + fy dy = dx + dy ∧ dx + dx + dy ∧ dy = ∂x ∂y ∂x ∂y ∂fx ∂fx ∂fy ∂fy = dx ∧ dx + dy ∧ dx + dx ∧ dy + dy ∧ dy = ∂x ∂y ∂x ∂y µ ¶ ∂fy ∂fy = − dx ∧ dy . ∂x ∂x Tedy za daných předpokladů platí I
³
¢ fx dx + fy dy =
ZZ µ
∂Ω
Ω
∂fx ∂fy − ∂x ∂y
¶ dx ∧ dy .
(19)
Vztah (19) se nazývá Greenova věta. 2. (Stokesova věta) Nechť je S uzavřená orientovaná regulární 2–rozměrná plocha v R3 , jejíž orientace je dána normálovým vektorem n. Nechť je křivka C = ∂S její orientovaná hranice. Orientace hranice C je souhlasná s orientací plochy S, jestliže křivka obíhá plochu S proti směru hodinových x) = ručiček, pokud se na plochu S díváme ze směru normály n. Nechť je vektorová funkce f (x ¡ ¢ fx , fy , fz třídy C1 (S). Protože ¡ ¢ d fx dx+fy dy +fz dz =
µ
∂fz ∂fy − ∂y ∂z
¶
µ dy ∧ dz +
∂fx ∂fz − ∂z ∂x
¶
µ dz ∧ dx+
∂fy ∂fx − ∂x ∂y
¶ dx∧ dy ,
je podle Stokesovy věty za těchto předpokladů I
¡ ¢ fx dx + fy dy + fz dz = (20) ∂S ¶ µ ¶ µ ¶ ZZ µ ∂fy ∂fx ∂fz ∂fy ∂fx ∂fz − dy ∧ dz + − dz ∧ dx + − dx ∧ dy . = ∂y ∂z ∂z ∂x ∂x ∂y S
Vektorová funkce
µ rot f =
∂fz ∂fy ∂fx ∂fz ∂fy ∂fx − , − , − ∂y ∂z ∂z ∂x ∂x ∂y
¶
x). Vztah (20) lze pak zapsat ve tvaru se nazývá rotace vektorového pole f (x I
ZZ x) dss = f (x
x) dS S. rot f (x
∂S
(21)
S
Vztah (20), resp. (21), se často také nazývá Stokesova věta. 3. (Gaussova věta) Lze ukázat, že když je regulární plocha S hranicí nějakého omezeného uzavřeného tělesa V, je orientovatelná. Orientaci plochy S = ∂V definujeme pomocí normály n k ploše S. Plocha je souhlasně orientovaná s orientací tělesa V právě tehdy, když normála n směřuje vně ¡ ¢ tělesa, čili když je n vnější normála. Uvažujme vektorovou funkci f (x, y, z) = fx , fy , fz , která je x) diferenciální 2–formu třídy C1 (V). Označme ω(x ω(x, y, z) = fx dy ∧ dz + fy dz ∧ dx + fz dx ∧ dy . Pak je
µ dω =
∂fy ∂fz ∂fx + + ∂x ∂y ∂z 95
¶ dx ∧ dy ∧ dz ,
a tedy ze Stokesovy věty plyne ZZ ∂V
³
¶ ´ Z Z Z µ ∂f ∂fy ∂fz x + + dx ∧ dy ∧ dz . (22) fx dy ∧ dz + fy dz ∧ dx + fz dx ∧ dy = ∂x ∂y ∂z V
¢ ¡ Jestliže je f = fx , fy , fz vektorové pole, které je třídy C1 (V), pak výraz div f =
∂fx ∂fy ∂fz + + ∂x ∂y ∂z
nazýváme divergence vektorového pole f . Rovnost (22) pak lze zapsat ve tvaru ZZZ ZZ S= div f dV . f dS
(23)
V
∂V
Vztahy (22), resp. (23), se nazývají Gaussova věta. Poznámka. Operace grad f , div f a rot f lze symbolicky zapsat pomocí tzv. diferenciálního operátoru ∇ (nabla). Jestliže označíme e x , e y , resp. e z jednotkové vektory ve směrech souřadnicových os Ox, Oy, resp. Oz, definujeme ∇ = ex
∂ ∂ ∂ + ey + ez . ∂x ∂y ∂z
(24)
Pomocí tohoto operátoru lze psát ∂f ∂f ∂f ex + ey + ez ∂x ∂y ∂z ∂fx ∂fy ∂fz div f = ∇ · f = + + ∂x ∂y ∂z ex ey ez ∂ ∂ ∂ rot f = ∇ × f = det ∂x ∂y ∂z fx fy fz
grad f = ∇f =
(25) (skalární součin)
(26)
(vektorový součin)
(27)
Uvedeme ještě časté aplikace těchto vět. 1. Nechť je G omezená uzavřená množina v R2 taková, že její hranice ∂G je regulární křivka. Protože diferenciální 1–forma ω = ay dx + bx dy je na třídy C∞ (G) a dω = (b − a) dx ∧ dy, je podle Gaussovy věty I Z ¡ ¢ ay dx + bx dy = (b − a) dx ∧ dy = (b − a)P (G) , (28) ∂G
G
kde P (G) je obsah G. Tedy pokud (b − a) = 1, je I ¡ ¢ P (G) = ay dx + bx dy . ∂G
I Většinou se volí a = 0, b = 1, tj. ω = x dy, a P (G) =
x dy. ∂G
2. Nechť je Ω ⊂ R3 otevřená a souvislá množina a f (x, y, z) je funkce třídy C1 (Ω) taková, že rot f = 0 na Ω. Jestliže má Ω tu vlastnost, že každou uzavřenou křivku C ⊂ Ω lze ”spojitě deformovat” tak, abychom dostali bod, pak pro každou uzavřenou křivku C je I f dss = 0 . (29) C
Vysvětlíme ještě některé pojmy, které se v tomto tvrzení vyskytují. Křivka C se nazývá uzavřená, jestliže je souvislá a její počáteční bod je totožný s jejím koncovým bodem. Méně zřejmé je to, co myslíme spojitou deformací uzavřené křivky C. Zhruba řečeno myslí se tím toto: Nechť je ϕ (t), 96
t ∈ ha, bi, ϕ (a) = ϕ (b), parametrický popis uzavřené křivky C. Řekneme, že křivku C lze spojitě deformovat do bodu, ¡jestliže ¢ existuje spojité zobrazení Φ (t, u) : ha, bi × h0, 1i → Ω takové, že pro každé u0 ∈ h0, 1i je Φ u0 , t uzavřená křivka, Φ (0, t) = ϕ (t), tj. křivka C a Φ (1, t) = ϕ (a), tj. bod v Ω. Otevřené souvislé množiny, které mají tuto vlastnost se nazývají jednoduše souvislé. Příklad. Uvažujme vektorovou funkci f (x, y, z) =
x −y , ,0 + y 2 x2 + y 2
.
x2
Tato funkce je mimo přímku x = y = 0 třídy C∞ . Protože ∂ ∂y
−y x2 + y 2
=
−x2 + y 2 ∂ 2 = 2 2 ∂x x +y
x x2 + y 2
,
je rot f = 0 v každé otevřené souvislé množině Ω, která má neprázdný průnik s přímkou x = y = 0. Tedy pro každou uzavřenou křivku C, která leží v Ω je I −y dx + x dy = 0. x2 + y 2 C Ale třeba pro kružnici C definovanou rovnicemi x = cos t, y = sin t, z = 0, t ∈ h0, 2πi je I
Z
−y dx + x dy = x2 + y 2
C
2π
dt = 2π . 0
Tedy předpoklad, že Ω je jednoduše souvislá je pro tvrzení podstatný.
3. Gaussovu větu často používáme pro výpočet toku vektoru f hranicí nějakého objemu V. Například je-li f = (x, y, z) vektorová funkce a máme najít tok tohoto vektoru hranicí ∂V omezeného tělesa, je ZZ ZZZ ZZZ S= dS div f dV = 3 dV = 3V , ∂V
V
V
kde V je objem tělesa V. Nezávislost křivkového integrálu v R3 na cestě V této části se budeme zabývat problémem, kdy křivkový integrál vektorové funkce f (x, y, z) závisí jen na počátečním a koncovém bodě křivky C, ale nezávisí¡ na křivce,¢ která tyto body spojuje. Nechť je Ω otevřená a souvislá podmnožina R3 a f (x, y, z) = fx , fy , fz spojitá vektorová funkce definovaná na Ω. Nechť a , b jsou dva body v Ω a C1 a C2 jsou dvě orientované křivky v Ω, které mají počáteční bod a a koncový bod b . Jestliže křivkový integrál nezávisí na křivce musí platit Z
Z f dss =
C1
Z
Z
f dss ⇔ C2
f dss − C1
Z
Z
f dss = 0 ⇔ C2
f dss + C1
Z f dss = 0 ⇔
−C2
f dss = 0 , C1 −C2
kde −C2 je křivka C2 , ale s opačnou orientací. Protože je křivka C1 − C2 uzavřená a křivky C1 , C2 byly libovolné, platí Věta. Nechť je Ω otevřená a souvislá podmnožina R3 a f je vektorová funkce na Ω. Křivkový Z integrál f dss nezávisí na křivce C právě tehdy, když pro každou uzavřenou křivku C ∈ Ω je C I f dss = 0. C
¡ ¢ Předpokládejme, že křivkový integrál funkce f = fx , fy , fz nezávisí v otevřené množině Ω ⊂ R3 na křivce. Nechť je a ∈ Ω je pevný bod a x je libovolný bod v Ω. Nechť je C křivka s počátečním bodem a a koncovým bodem x . Protože křivkový integrál nezávisí na křivce, lze na Ω definovat x) předpisem funkci U (x Z x) = U (x
f dss . C
97
Nechť je x libovolný bod Ω, f vektorová funkce spojitá na Ω a h libovolný vektor takový, že pro úsečka spojující body x a x + h ∈ Ω. Pak platí ¡ ¢ ¡ ¢ x) · h = U x + h − U x − f (x
Z
1
¡ ¢ x) · h = f x + h t · h dt − f (x
Z 1³ ¡ ¢ ¡ ¢´ f x + h t − f x · h dt .
0
0
x) spojitá, je Protože je podle předpokladů funkce f (x ¯ ¯Z ¯ ¯ 1¡ ¯ ¢ ¡ ¢ ¢ h 1 ¯¯ ¡ ¯ ¯ ¯ ° ¯U x + h − U x − f (x x) · h ¯ = lim ¯ x + h t) − f )x x · ° ° dt¯ ≤ lim f (x °h ° ¯ h →0 kh h →0 ¯ 0 h° Z 1 ° ° °f (x x + h t) − f (x x)° dt = 0 . ≤ lim h →0
0
x) je na Ω diferencovatelná a její diferenciál je Z toho plyne, že funkce U (x ¡ ¢ ¡ ¢ dU x ; h = f x · h . To ale znamená, že platí fx =
∂U , ∂x
fy =
∂U , ∂y
fz =
∂U , ∂z
(30)
neboli f (x, y, z) = grad U (x, y, z) . Funkci U (x, y, z), pro kterou platí (30) nazýváme potenciál vektorové funkce f (x, y, z). Jestliže má vektorová funkce f (x, y, z) na množině Ω potenciál, nazýváme vektorové pole, tj. vektorovou funkci, konzervativní. Tedy platí následující Věta. Jestliže je Ω otevřená souvislá podmnožina R3 a křivkový integrál funkce f (x, y, z) nezávisí v Ω na křivce C. Pak je pole dané vektorovou funkcí f konzervativní. Jestliže je U (x, y, z) její potenciál, je Z a) , f dss = U (bb) − U (a (31) C
kde a je počáteční a b koncový bod křivky C. Platí také opačná věta Věta. Jestliže je Ω otevřená a souvislá podmnožina R3 a U (x, y, z) je funkce třídy C1 (Ω), nezávisí křivkový integrál vektorové funkce f (x, y, z) = grad U (x, y, z) v množině Ω na křivce C. V tomto případě totiž pro každou křivku C a její parametrizaci x = x(t), y = y(t), z = z(t), t ∈ ha, bi, platí ¶ Z Z µ ¡ ¢ ∂U ∂U ∂U fx dx + fy dy + fz dz = dx + dy + dz = ∂x ∂y ∂z C C ¶ Z bµ ∂U dx ∂U dy ∂U dz + + dt = = ∂x dt ∂y dt ∂z dt a Z b ¢ ¡ ¢ ¡ ¢ dU ¡ = x(t), y(t), z(t) dt = U x(b), y(b), z(b) − U x(a), y(a), z(a) . a dt Výraz dU =
∂U ∂U ∂U dx + dy + dz ∂x ∂y ∂z
se nazývá úplný neboli exaktní diferenciál funkce U (x, y, z). Tedy je-li výraz fx dx + fy dy + fz dz v otevřené souvislé množině Ω ⊂¢ R3 exaktním diferenciálem nějaké funkce U (x, y, z), nezávisí křivkový ¡ integrál funkce f = fx , fy , fz v množině Ω na cestě. 98
¡ ¢ Nechť je f = fx , fy , fz konzervativní vektorové pole třídy na otevřené souvislé množině Ω, které je třídy C1 (Ω). Pak existuje funkce U (x, y, z), která je třídy C2 (Ω) taková, že platí (30). Ale v tomto případě plynou ze záměnnosti druhých parciálních derivací funkce U (x, y, z) vztahy ∂fx ∂2U ∂fy ∂fy ∂fx = = ⇔ − =0 ∂y ∂x∂y ∂x ∂x ∂y ∂fx ∂2U ∂fz ∂fz ∂fx = = ⇔ − =0 ∂z ∂x∂z ∂x ∂x ∂z ∂fy ∂2U ∂fz ∂fz ∂fy = = ⇔ − =0 ∂z ∂y∂z ∂y ∂y ∂z
(32)
Ale vztahy (32) znamenají, že platí rovnost rot f = 0 . Tedy platí Věta. Je-li je vektorové pole f v otevřené souvislé množině Ω ⊂ R3 konzervativní a je třídy C1 (Ω), je rot f = 0. Opačná věta obecně neplatí. Ale pokud budeme předpokládat, že množina Ω je navíc jednoduše souvislá, je každá uzavřená křivka C hranicí jisté plochy S, která leží v Ω. Pak plyne ze Stokesovy věty, že pro každou vektorovou funkci f , která je třídy C1 (Ω), platí I
ZZ f dss =
S. rot f dS
C
Ω
Jestliže tedy o funkci předpokládáme, že rot f = 0, je integrál vektorové funkce f přes každou uzavřenou křivku C ∈ Ω roven nule a vektorové pole f je konzervativní. Tedy platí Věta. Nechť je f vektorová funkce třídy C1 na otevřené, souvislé, jednoduše souvislé množině Ω ⊂ R3 . Pak je vektorové pole f na Ω konzervativní právě tehdy, když rot f = 0.
99