1. Základy logiky a teorie množin
Studijní text
1. Základy logiky a teorie množin A. Logika Matematická logika vznikla v 19. století. Jejím zakladatelem byl anglický matematik G. Boole (1815–1864). Boole prosadil algebraické pojetí logiky a zavedl logické spojky. K dalším tvůrcům booleovské logiky patřil J. Venn (1834–1923). Predikátová logika a její vznik je pak spojen s německým matematikem G. Fregem (1848–1925). Frege zavedl v logice pojem kvantifikátoru. Definice 1.1. (intuitivní) Výrok je tvrzení o němž má smysl říci, zda je pravdivé nebo nepravdivé. Buď A výrok. Je-li A pravdivý, zapisujeme tuto skutečnost symbolicky p(A) = 1, je-li A nepravdivý, píšeme p(A) = 0. Symboly 0, 1 se nazývají pravdivostní hodnoty. Příklad 1.2. Rozhodněte o pravdivosti následujících výroků. a) A: 1i = −i. b) B: 51 je prvočíslo. i = −i. b) Zřejmě p(B) = 0, neboť 51 = 3 · 17. Řešení. a) Zřejmě p(A) = 1, neboť 1i = i2 = −1 i Jednotlivé výroky lze spojovat ve složené výroky pomocí logických spojek (funktorů). Předmětem studia výrokové logiky je studium závislosti pravdivostní hodnoty složeného výroku na způsobu spojení a na pravdivostních hodnotách jednotlivých výroků. Výrok se nazývá elementární, nebo též atomární, neobsahuje-li logické spojky. Například výroky A, B jsou atomární. Rozhodování o pravdivosti atomárního výroku přísluší odpovídající vědecké disciplíně, která zkoumá shodu jeho obsahu s objektivní realitou. Definice 1.3. (Logické spojky) Buď A výrok. Výrok A0 , jehož pravdivostní hodnoty jsou definovány tabulkou p(A) p(A0 ) (1.1) 1 0 0 1 se nazývá negace výroku A. Negace mění pravdivostní hodnotu výroku v opačnou. Buďte A, B výroky. Logické spojky, které spojují dva výroky, definujeme tabulkou pravdivostních hodnot vypsáním všech existujících kombinací. Spojky se po řadě nazývají konjunkce ∧, disjunkce ∨, implikace ⇒, ekvivalence ⇔, alternativa ∨ a Shefferův symbol |. p(A) p(B) p(A ∧ B) p(A ∨ B) p(A ⇒ B) p(A ⇔ B) p(A∨B) p(A|B) 1 1 1 1 1 1 0 0 1 0 0 1 0 0 1 1 0 1 0 1 1 0 1 1 0 0 0 1 1 0 1 0
(1.2)
V následující tabulce uvedeme název spojky, její označení, slovní vyjádření a odpovídající logický význam. název spojky konjunkce disjunkce alternativa implikace ekvivalence Shefferův symbol ÚM FSI VUT v Brně
označení A∧B A∨B A∨B A⇒B A⇔B A|B
slovní vyjádření A a současně B A nebo B buď A, nebo B jestliže A, pak B A právě tehdy, když B nikoli A a B současně
logický význam současně platí A i B platí aspoň jeden z A, B platí právě jeden z A, B z A plyne B A a B jsou ekvivalentní neslučitelnost A a B 1
1. Základy logiky a teorie množin
Studijní text
Speciálně pak pro implikaci platí následující terminologie. V implikaci A ⇒ B se A nazývá postačující podmínka pro B a B nutná podmínka pro A. Implikace B ⇒ A se nazývá obrácená implikace a B 0 ⇒ A0 obměna implikace. Zřejmě všech možných logických spojek, které spojují dva výroky A, B je 16. Systém spojek nazveme úplný, když stačí k definování všech 16-ti spojek. Tzn. stačí k popisu libovolné logické situace. Věta 1.4. Následující systém logických spojek 0 , ∧, ∨, ⇒, ⇔ je úplný. Lze rovněž dokázat, že k vytvoření úplného systému stačí vzít pouze dvě spojky negaci 0 a libovolnou ze spojek ∧, ∨, ⇒. Dokonce lze dokázat, že všechny logické spojky lze popsat pomocí jediné. Touto spojkou je například Shefferův symbol. Analogicky existují logické spojky spojující tři výroky A, B, C. Všeobecně je známa například spojka if A then B else C, používaná v programování. Příklad 1.5. Určete pravdivostní hodnotu výroku (2 · 3 = 6) ∨ (3 · 4 = 11) ⇒ (2 < 1).
Řešení. Jedná se o složený výrok, který je tvořen třemi atomárními výroky A, B, C, kde A : 2 · 3 = 6, B : 3 · 4= 11, C : 2 < 1. Určíme jejich pravdivostní hodnoty. Zřejmě p(A) = 1, p(B) = 0 a p(C) = 0. Odtud plyne p (2 · 3 = 6) ∨ (3 · 4 = 11) ⇒ (2 < 1) = p (1 ∨ 0) ⇒ 0 = p(1 ⇒ 0) = 0. Složený výrok je tedy nepravdivý. Poznámka 1.6. Při vyhodnocování pravdivostní hodnoty složeného výroku budeme zachovávat následující pořadí operací: 0 , ∧, ∨, ⇒, ⇔ . Uzávorkování je tomuto pořadí nadřazeno. √ Matematické objekty s jednoznačně stanoveným významem, např. 1, π, 2 nazýváme konstanty. Objekty, které nemají jednoznačně stanovený význam, např. x, y, z, nazýváme proměnné. Definice 1.7. Výroková forma je tvrzení obsahující proměnné, z něhož se stane výrok po dosazení konstant za proměnné.
Příklad 1.8. Tvrzení A : 3x je sudé, je výroková forma. Volíme-li x = 1, pak p(A, x = 1) = 0, zatímco pro x = 2 je p(A, x = 2) = 1. Z výrokové formy lze utvořit výrok také tak, že všechny proměnné ve formě vážeme nějakou omezující podmínkou, jednoznačně specifikující jejich počet. Tato podmínka se nazývá kvantifikátor. Poznámka 1.9. V matematice se nejčastěji používají následující dva kvantifikátory: 1. obecný kvantifikátor, který se označuje ∀ a čte se „pro každéÿ a 2. existenční kvantifikátor ∃, který má význam „existuje aspoň jedenÿ. Kvantifikátorů existuje nekonečně mnoho. Příkladem dalšího kvantifikátoru je kvantifikátor ∃! s významem existuje právě jeden. Podobně existují kvantifikátory právě dva, právě tři, atd. Nejběžněji používané kvantifikátory využívají slovních spojení aspoň, právě a nejvýše. Poznámka 1.10. Negací obecného kvantifikátoru je existenční a naopak. Výroková forma, která při dosazení libovolné kombinace pravdivostních hodnot nabývá hodnotu 1 se nazývá tautologie, 0 kontradikce. V ostatních případech se forma nazývá splnitelná. Výrokové formy A, B se nazývají logicky ekvivalentní, což zapisujeme A = B, když je forma A ⇔ B tautologie. Například formy A ∧ B a B ∧ A jsou logicky ekvivalentní, platí A ∧ B = B ∧ A a forma (A ∧ B) ⇔ (B ∧ A) je tautologie.
ÚM FSI VUT v Brně
2
1. Základy logiky a teorie množin
Studijní text
Příklad 1.11. Šárka a Iva čekají na svoje kamarády Petra, Honzu a Jirku. Šárka tvrdí: Přijde-li Petr a Honza, přijde i Jirka. Iva říká: Já si myslím, že když přijde Petr a nepřijde Jirka, nepřijde ani Honza. Na to povídá Šárka: To ale říkáš totéž co já. Rozhodněte, zda obě skutečně říkají totéž. Řešení. Nejprve provedeme vhodné označení atomárních výroků. Symbolem A označme výrok „Petr přijdeÿ, symbolem B označme výrok „Honza přijdeÿ a dále C označme výrok „Jirka přijdeÿ. V provedeném označení mají výpovědi Šárky a Ivy tvar: X = (A ∧ B) ⇒ C a Y = (A ∧ C 0 ) ⇒ B 0 . Aby Šárka a Iva říkaly totéž musí být X ⇔ Y tautologie. Sestavíme tabulku pravdivostních hodnot. A B 1 1 1 1 1 0 1 0 0 1 0 1 0 0 0 0
C 1 0 1 0 1 0 1 0
A∧B 1 1 0 0 0 0 0 0
A ∧ C0 0 1 0 1 0 0 0 0
X 1 0 1 1 1 1 1 1
Y 1 0 1 1 1 1 1 1
X⇔Y 1 1 1 1 1 1 1 1
Z tabulky pravdivostních hodnot vyplývá, že X ⇔ Y je tautologie, což znamená, že Šárka a Iva říkají skutečně totéž. Věta 1.12. Následující výrokové formy jsou tautologie: 1. (A ⇒ B) ⇔ (B 0 ⇒ A0 ). 2. (A ⇒ B) ∧ (B ⇒ C) ⇒ (A ⇒ C). 3. (A ⇔ B) ⇔ (A ⇒ B) ∧ (B ⇒ A) .
Poznámka 1.13. Uvedené tautologie mají zásadní význam. Tvoří základ teorie důkazů. Tvrzení (1) říká, že důkaz implikace je ekvivalentní důkazu její obměny. Vlastnost (2) se nazývá tranzitivita implikace. Matematickou indukcí můžeme tvrzení (2) rozšířit na libovolný konečný počet výrokových proměnných A1 , . . . , An . Odtud plyne, že forma [(A1 ⇒ A2 ) ∧ · · · ∧ (An−1 ⇒ An )] ⇒ (A1 ⇒ An ). je tautologie. Důkaz tvrzení rozdělíme na postupné dokazování elementárních kroků. Část (3) říká, že důkaz ekvivalentnosti dvou tvrzení dokážeme důkazem implikace a obrácené implikace.
Věta 1.14. Platí následující vztahy pro negace složených výroků: 1. A00 = A. 2. (A ∧ B)0 = A0 ∨ B 0 . 3. (A ∨ B)0 = A0 ∧ B 0 . 4. (A ⇒ B)0 = A ∧ B 0 . 5. (A ⇔ B)0 = (A ∨ B) ∧ (A0 ∨ B 0 ).
ÚM FSI VUT v Brně
3
1. Základy logiky a teorie množin
Studijní text
Definice 1.15. Buďte dány symboly ◦, ∗. Pak následující zákony nazýváme: 1. a ◦ b = b ◦ a . . . komutativní zákon. 2. a ◦ (b ◦ c) = (a ◦ b) ◦ c . . . asociativní zákon. 3. a ◦ (b ∗ c) = (a ◦ b) ∗ (a ◦ c) . . . distributivní zákon.
Věta 1.16. Pro logické spojky ∧, ∨ platí komutativní, asociativní a distributivní zákon.
B. Důkazy v matematice Matematická tvrzení mají často tvar implikací, nebo ekvivalencí. Ve větě tvaru A ⇒ B se A nazývá předpoklad a B tvrzení věty nebo závěr. Existují tři základní možnosti důkazu implikace: přímý, nepřímý a sporem. V krátkosti si nyní vysvětlíme, jaký je logický základ těchto důkazů a v čem spočívají. Přímý důkaz. Chceme-li dokázat implikaci A ⇒ B přímým důkazem, pak se pokusíme zkonstruovat tzv. řetězec implikací A ⇒ A1 , A1 ⇒ A2 , . . . , An ⇒ B. Podle Věty 1.12, části (2) odtud plyne A ⇒ B. Zápis řetězce implikací je zvykem zapisovat v kratším tvaru A ⇒ A1 ⇒ A2 ⇒ · · · ⇒ An ⇒ B.
(1.3)
Nepřímý důkaz. Při nepřímém důkazu využijeme platnost tautologie (1) z Věty 1.12. Implikaci B 0 ⇒ A0 potom dokazujeme přímým důkazem. Důkaz sporem. Vycházíme z předpokladu, že p(A ∧ B 0 ) = 1 a konstruujeme řetězec implikací A ∧ B 0 ⇒ A1 , A1 ⇒ A2 , . . . , An ⇒ S, až dojdeme k výroku S, který logicky popírá původní předpoklad, nebo nějaký evidentně pravdivý výrok. Spor je situace, kdy nějaký výrok a jeho negace mají být současně pravdivé. Uvedené důkazové postupy budeme nyní demonstrovat na příkladu. Příklad 1.17. Dokažte přímo, nepřímo i sporem, že ∀x ∈ N : x ≥ 2 ⇒ 6x + 3 > 13. Řešení. a) Přímý důkaz: Jednotlivé kroky důkazu vyžadují elementární znalosti o vlastnostech nerovností. x ≥ 2 ⇒ 6x ≥ 12 ⇒ 6x + 1 ≥ 12 + 1 ⇒ 6x + 1 ≥ 13 ⇒ 6x + 3 > 13. Uvedený řetězec implikací tvoří důkaz tvrzení. b) Nepřímý důkaz: Sestrojíme obměnu původní implikace. ∀x ∈ N : 6x + 3 ≤ 13 ⇒ x < 2. Toto tvrzení je logicky ekvivalentní původnímu tvrzení. Obměnu dokážeme přímým důkazem. Zkonstruujeme řetězec implikací 10 6x + 3 ≤ 13 ⇒ 6x < 10 ⇒ 6x ≤ 10 ⇒ x ≤ ⇒ x < 2. 3 c) Důkaz sporem: Předpokládejme, že dokazované tvrzení neplatí. Pak je ale pravdivá jeho negace. Negace implikace má tvar ∃x ∈ N : x ≥ 2 ∧ 6x + 3 ≤ 13. Z tohoto předpokladu nyní plyne, že existuje x ∈ N takové, že x ≥ 2 ∧ 6x + 3 ≤ 13 ⇒ x ≤ 2 ∧ 6x ≤ 10 ⇒ x ≥ 2 ∧ x ≤
10 , 6
což je spor, neboť žádné x ∈ N vlastost x ≥ 2∧x ≤ 10 6 nemá. Předpoklad, z něhož se řetězec implikací odvíjel, je tedy nepravdivý. To ale znamená, že je pravdivá jeho negace. Tato negace je však ekvivalentní původní implikaci. ÚM FSI VUT v Brně
4
1. Základy logiky a teorie množin
Studijní text
Speciálním, ale v matematice často používaným důkazem je důkaz pomocí principu matematické indukce. Matematická indukce je věta, která umožňuje provádět důkazy tvrzení týkajících se množiny přirozených čísel N = {1, 2, 3, . . . }. Důkaz matematické indukce provedeme sporem. Věta 1.18. (Matematická indukce) Buď V (n) výroková forma proměnné n ∈ N. p V (1) = 1 ∧ ∀k ∈ N : p V (k) = 1 ⇒ p(V (k + 1)) = 1 ⇒ ∀n ∈ N : p(V (n)) = 1.
(1.4)
Důkaz. Tvrzení dokážeme sporem. Předpokládejme, že existuje číslo k ∈ N, takové, že p V (k) = 0. Odtud plyne, že množina M = = {k; p V (k) = 0} je neprázdná a symbolem m označme její nejmenší prvek. Protože p V (1) = 1 je m > 1 a protože m − 1 ∈ / M platí p V (m − 1) = 1. Z indukčního předpokladu ale plyne p V (m) = 1, což je spor. Poznámka 1.19. Důkaz tvrzení ∀n ∈ N : p V (n) = 1 pomocí matematické indukce se skládá ze tří částí: 1. Dokážeme, že je p V (1) = 1. (Pozn. Obecněji platí, že dokážeme platnost formule pro nejmenší přípustné n a nejčastěji je to právě číslo 1.) 2. Dokážeme, že platí implikace ∀k ∈ N : p(V (k)) = 1 ⇒ p(V (k + 1)) = 1. 3. Odvoláme se na Větu 1.18 o matematické indukci, podle které je nyní tvrzení V (n) pravdivé pro každé přirozené číslo n. Postup vysvětlíme na příkladu. Příklad 1.20. Řekneme, že a dělí b a píšeme a|b, když existuje číslo c tak, že b = ac. Pomocí matematické indukce dokažte následující tvrzení ∀k ∈ N : 7|62k − 8. Řešení. Důkaz provedeme ve třech krocích: 1. Nejprve dokážeme, že tvrzení je pravdivé pro k = 1. Výrok V (1) má tvar 7|62 − 8 = 28. Platí ale 28 = 4 · 7. Tedy tvrzení pro k = 1 platí. 2. Předpokládejme nyní, že tvrzení je pravdivé pro libovolné pevně zvolené číslo k a dokažme, že platí rovněž pro k+1. Označme V (k+1) = 7|62(k+1) −8. Je třeba dokázat, že ∀k ∈ N : 7|62k −8 ⇒ 7|62(k+1) −8. Číslo 62(k+1) − 8 z výroku V (k + 1), jehož dělitelnost číslem 7 máme dokázat, upravíme na tvar 62(k+1) − 8 = 62k+2 − 8 = 62 · 62k − 8 = 36 · 62k − 8 = (62k − 8) + 35 · 62k . První člen součtu (62k − 8) + 35 · 62k je dělitelný číslem 7 podle indukčního předpokladu, dělitelnost druhého člene je zřejmá, neboť 7|35. Protože jsou číslem 7 dělitelné oba členy je jím dělitelný i jejich součet a to bylo třeba dokázat. 3. Podle Věty 1.18 o matematické indukci je tvrzení pravdivé pro každé přirozené číslo n. Deduktivní úvahou nazýváme takovou úvahu, při níž z obecného tvrzení vyvozujeme zvláštní, individuální. Podstata dedukce je tedy v tom, že zvláštní případ zahrnuje pod obecný princip. Matematické úvahy jsou převážně deduktivní.
C. Základní množinové pojmy Privilegované postavení mezi matematickými teoriemi zaujímá teorie množin. Za jejího zakladatele je považován německý matematik G. Cantor (1845–1918). Základní problematikou, kterou se teorie množin zabývala byly otázky týkající se vlastností nekonečna, zejména srovnávání různých velikostí nekonečna. Ukázalo se však, že v teorii množin lze modelovat i jiné matematické teorie a to tak, že se každému matematickému ÚM FSI VUT v Brně
5
1. Základy logiky a teorie množin
Studijní text
objektu přiřadí určitá množina, která ho reprezentuje. V tomto smyslu se teorie množin stala základem celé matematiky. S jistou nadsázkou lze říci, že se teorie množin narodila 7. 12. 1873. Toho dne totiž G. Cantor nalezl odpověď na otázku, zda lze všechna reálná čísla z nějakého intervalu (a, b) spočítat v tom smyslu, že je lze bijektivně zobrazit na množinu všech přirozených čísel. Ke svému překvapení zjistil, že takové zobrazení neexistuje. Otázku, zda má smysl porovnávat nekonečné systémy podle velikosti, si položil například již v roce 1638 jeden z géniů té doby, Galileo Galilei. Ten vypsal řadu čísel 1, 2, 3, 4, . . . a jejich druhých mocnin 1, 4, 9, 16, . . . a uvědomil si, že mezi těmito množinami existuje bijekce. To by však znamenalo, že jsou uvedené systémy čísel stejně velké. Tento závěr se mu jevil naprosto absurdní. Popíral totiž jeden ze základních Eukleidových logických axiomů, který říká, že celek je vždy větší než jeho část. Galilei proto dospěl k závěru, že pro nekonečné systémy nemá otázka o jejich velikosti žádný smysl. Na konci svého života sepsal B. Bolzano (1781– 1848) matematicko-filozofické dílo Paradoxy nekonečna. Vyšlo posmrtně v roce 1851. V tomto díle dospěl na práh teorie množin. Na přelomu 19. a 20. století se objevily v teorii množin antinomie, které si vynutily novou metodiku výstavby matematických teorií. Nejobvyklejší metodou se stala axiomatická výstavba. Definice 1.21. (intuitivní) Množina je souhrn libovolných navzájem rozlišitelných objektů.
Poznámka 1.22. 1. Jednotlivé objekty nazveme prvky množiny a shrnování v jeden celek budeme označovat pomocí složených závorek. 2. Množiny zpravidla označujeme velkými písmeny a jejich prvky malými písmeny. 3. Zápis a ∈ A znamená, že objekt a je prvkem množiny A. 4. Negace má tvar a ∈ / A. 5. Symbolem ∅ označujeme množinu, která nemá žádný prvek (tzv. prázdná množina). 6. Řekneme, že množiny A, B jsou si rovny, když mají tytéž prvky. Pak píšeme A = B. 7. Řekneme, že množina A je podmnožinou množiny B, když každý prvek množiny A je prvkem množiny B. Pak píšeme A ⊆ B. 8. Symbol ⊆ se nazývá znak inkluze. 9. Některé často používané množiny mají vlastní stálé označení. 10. Množinu lze zadat výčtem prvků, tj. napsáním seznamu, např. {1, 2, 3} nebo pomocí charakteristické vlastnosti {x ∈ N; x ≤ 3}.
Věta 1.23. Pro libovolné množiny A, B, C platí: 1. ∅ ⊆ A. 2. A ⊆ A. 3. A ⊆ B ∧ B ⊆ C ⇒ A ⊆ C
...
tranzitivita inkluze.
4. A ⊆ B ∧ B ⊆ A ⇔ A = B. Tvrzení (1) a (2) jsou zřejmá a (3) znamená tranzitivitu inkluze. Tvrzení (4) má zásadní význam pro důkazy množinových rovností. Chceme-li dokázat, že A = B, tak postupujeme tak, že dokážeme, že A ⊆ B a B ⊆ A. Odtud podle (4) již plyne, že A = B.
ÚM FSI VUT v Brně
6
1. Základy logiky a teorie množin Příklad 1. 2. 3. 4.
Studijní text
1.24. Rozhodněte, které z výroků jsou pravdivé: Množina {∅} nemá žádný prvek. {1, 1} = {1}. {1} ⊂ {1}. {1, 2} = {2, 1}.
Poznámka 1.25. V množinových závorkách nezáleží na pořadí, v jakém prvky zapíšeme. Nezáleží ani na tom, kolikrát prvek v množině zapíšeme. Proto budeme pro přehlednost zapisovat každý prvek pouze jednou. Russelův paradox (1903). Následující úvaha je typickým příkladem, který se objevil na počátku 20. století v souvislosti se třetí krizí matematiky. Buď A libovolná množina. Pak nastane právě jedna z možností buď A ∈ A nebo A ∈ / A. Všechny množiny rozdělíme do dvou skupin X = {A; A ∈ A}, Y = {B; B ∈ / B}. Je zřejmé, že žádná množina nemůže patřit do X i Y současně a že X, Y jsou také množiny. Uvažme nyní Y . Protože Y je množina, musí sama ležet v X nebo Y . Připusťme nejprve Y ∈ X. Pak ale podle definice X platí Y ∈ Y , což je spor, neboť Y nemůže ležet v X i Y . Připusťme tedy, že Y ∈ Y . Pak ale z definice Y plyne Y ∈ / Y , což je rovněž spor, protože Y nemůže ležet a současně neležet v Y . Vzniká neřešitelná situace na úrovni intuitivní teorie množin. Pojem množiny v intuitivním smyslu se ukázal příliš široký. Problém spočívá ve shrnování v jeden celek. Definice 1.26. Mezi množinami A, B definujeme následující základní operace: 1. Průnik A ∩ B := {x; x ∈ A ∧ x ∈ B}. 2. Sjednocení A ∪ B := {x; x ∈ A ∨ x ∈ B}. 3. Rozdíl A − B := {x; x ∈ A ∧ x ∈ / B}.
Speciálním případem rozdílu množin je tzv. množinový komplement. Je-li dána nějaká základní množina Z, vzhledem ke které se vztahují naše úvahy, pak komplement množiny A v množině Z definujeme vztahem Ac := Z − A. Poznámka 1.27. Symbolem 2A := {X; X ⊆ A} označujeme množinu všech podmnožin množiny A.
Věta 1.28. Pro množinové operace ∪, ∩ platí komutativní asociativní a distributivní zákon.
Definice 1.29. 1. Uspořádanou dvojicí prvků a, b v tomto pořadí nazýváme množinu [a, b] := {{a}, {a, b}}. 2. Buďte A, B libovolné množiny. Kartézským součinem mezi množinami A, B nazýváme množinu A × B := {[a, b]; a ∈ A ∧ b ∈ B}. 3. Místo A × A píšeme A2 . Pro kartézský součin neplatí asociativní zákon. Tj. A × (B × C) 6= (A × B) × C. Tato skutečnost je ihned zřejmá, pokud si uvědomíme, že uvedené množiny mají jiné prvky. Příklad 1.30. Nechť A = {a}, B = {b}, C = {c}. Určete A × (B × C) a (A × B) × C. Řešení. Pak A × (B × C) = {[a, [b, c]]} a (A × B) × C = {[[a, b], c]}.
ÚM FSI VUT v Brně
7
1. Základy logiky a teorie množin
Studijní text
Definice 1.31. Binární relace ρ mezi množinami A, B je libovolná podmnožina množiny A × B. Je-li A = B, mluvíme o relaci na množině. Každé binární relaci ρ odpovídají dvě význačné množiny: Dρ := {a ∈ A; ∃b ∈ B : [a, b] ∈ ρ} . . . definiční obor Dρ Hρ := {b ∈ B; ∃a ∈ A : [a, b] ∈ ρ} . . . obor hodnot Hρ. Binární relace na množině mohou mít řadu významných vlastností. Nejdůležitější z nich popíšeme v následující definici. Definice 1.32. Buď ρ binární relace na množině A. Nazveme ji 1. reflexivní, splňuje-li ∀a ∈ A : [a, a] ∈ ρ. 2. symetrická, splňuje-li ∀a, b ∈ A : [a, b] ∈ ρ ⇒ [b, a] ∈ ρ. 3. antisymetrická, splňuje-li ∀a, b ∈ A : [a, b] ∈ ρ ∧ [b, a] ∈ ρ ⇒ a = b. 4. tranzitivní, splňuje-li ∀a, b, c ∈ A : [a, b] ∈ rho ∧ [b, c] ∈ ρ ⇒ [a, c] ∈ ρ.
Definice 1.33. Binární relace ρ ⊆ A × B se nazývá zobrazení z A do B, když pro každé x ∈ A existuje nejvýše jedno y ∈ B tak, že [x, y] ∈ A × B. Úmluva: Místo ρ obvykle píšeme f a místo [x, y] ∈ ρ píšeme y = f (x). Zobrazení z A do B budeme označovat symbolem f : A → B. Je-li Df = A, mluvíme o zobrazení A do B, je-li Hf = B, mluvíme o zobrazení A na B a f nazýváme surjekce (čti syrjekce). Zobrazení f se nazývá prosté nebo též injekce, když ∀a, b ∈ A : a 6= b ⇒ f (a) 6= f (b). Je-li f injekce i surjekce, nazývá se bijekce, nebo též vzájemně jednoznačné zobrazení.
ÚM FSI VUT v Brně
8
2. Relace, zobrazení, operace a algebraické struktury
Studijní text
2. Relace, zobrazení, operace a algebraické struktury Definice 2.1. Předpokládejme, že máme kartézský součin A1 × · · · × An množin A1 , . . . , An (ne nutně různých); n-ární relací potom rozumíme libovolnou podmnožinu tohoto kartézského součinu. Nejčastěji se setkáváme s n = 2, tzn. s binárními relacemi, a to zejména s případem, kdy jsou podmnožinami kartézského součinu A × A téže množiny A. Označíme-li relaci R, píšeme pak R ⊂ A1 × · · · × An , případně R ⊂ A × A, apod. Zde je namístě se zmínit o relačních databázích, které strukturují data ve formě tabulek: tyto tabulky nejsou ničím jiným, než binární relací R ⊂ A × B, kde A je například množina zaměstnanců, B množina vozidel a relace vyjadřuje, kdo s kterým vozidlem má právo jezdit. Definice 2.2. Zobrazením neboli funkcí z množiny A do množiny B pak je relace, která splňuje pro všechna a ∈ A a všechna b, ¯b ∈ B (a, b) ∈ R,
(a, ¯b) ∈ R
⇒
b = ¯b.
Místo pak R ⊂ A × B užíváme zápisu f: A→B a místo (a, b) ∈ R píšeme b = f (a); b se potom nazývá obraz prvku a.
Definice 2.3. Všechna a ∈ A, pro které existuje f (a) = b (v relačním zápisu: všechna a, pro něž existuje b tak, že (a, b) ∈ R) tvoří množinu, které říkáme definiční obor zobrazení f a značíme ji Domf . Všechna b ∈ B, pro které existuje a ∈ A takové, že f (a) = b (v relačním zápisu: všechna b, pro něž existuje a tak, že (a, b) ∈ R) tvoří množinu, které říkáme obor hodnot zobrazení f a značíme ji Imf .
Definice 2.4. Zobrazení f : A → B, které splňuje pro všechna a, a ¯ ∈ A a všechna b ∈ B b = f (a),
b = f (¯ a)
⇒
a=a ¯
se nazývá injekce. Dále, zobrazení f : A → B, pro nějž je množina všech jeho obrazů rovna B, se nazývá surjekce. Zobrazení f : A → B s definičním oborem Domf = A, které je současně injekcí i surjekcí, označujeme slovem bijekce (množin A a B).
Definice 2.5. Inverzní relaci k binární relaci R ⊂ A × B definujeme jako relaci R−1 ⊂ B × A vztahem (a, b) ∈ R
⇐⇒
(b, a) ∈ R−1 .
Je-li R zobrazení a injekce, je inverzní relace také zobrazení (a také injekce). Nazýváme ho inverzní zobrazení. Další úvahy budeme často provádět pro číselné množiny, a sice pro: ÚM FSI VUT v Brně
9
2. Relace, zobrazení, operace a algebraické struktury
Studijní text
• množinu přirozených čísel N • množinu celých čísel Z • množinu racionálních čísel Q • množinu reálných čísel R Předpokládáme zde, že tyto množiny již byly zavedeny (pokud nebyly korektně definovány, spokojíme se s běžnou intuitivní představou). Příklad 2.6. V případě bijekce každému prvku množiny A odpovídá právě jeden prvek množiny B; jsou-li množiny A a B konečné, mají nutně stejný počet prvků; jsou-li nekonečné a existuje-li mezi nimi bijekce, mají také „stejněÿ prvků, přesněji říkáme, že mají stejnou mohutnost. Povšimněme si některých množin, které mají stejnou mohutnost jako množina přirozených čísel N, tedy jejich prvky lze přirozenými čísly oindexovat. Je to je například množina všech kladných sudých čísel 2, 4, 6, 8, 10, . . . , množina všech celých čísel Z 0, −1, 1, −2, 2, . . . , i všech racionálních čísel Q, což dokážeme takto: racionální číslo zapíšeme ve tvaru pq , kde p, q jsou nesoudělná, p ∈ Z, q ∈ N, (číslo 0 zapíšeme 01 ). Každému číslu pq nyní přiřadíme tzv. výšku r = |p| + q a protože je počet racionálních čísel s konkrétní výškou konečný, jejich oindexování definujeme tak, že nejdříve vypíšeme všechna čísla s výškou 1, pak s výškou 2, atd.: r=1: r=2: r=3: r=4:
0 1 −1 1 1 , 1 −2 −1 1 1 , 2 , 2, −3 −1 1 1 , 3 , 3,
2 1 3 1
... (Tedy. např. a10 = 31 .) Nekonečné množiny se stejnou mohutností jako N se nazývají spočetné (množiny konečné a spočetné se dohromady označují termínem nejvýše spočetné).
Příklad 2.7. Existují však i množiny, které mají nekonečně mnoho prvků, ale bijekce s přirozenými čísly neexistuje. Takové množiny nazýváme nespočetné. Dokážeme nyní, že množina všech reálných čísel R je nespočetná. Stačí ovšem, když dokážeme, že je nespočetná nějaká část množiny R, tedy např. interval [0, 1). Předpokládejme opak, tzn. že všechna čísla z intervalu [0, 1) lze nějak uspořádat do nekonečné posloupnosti a1 = 0, a11 a12 a13 a14 . . . a1n . . . a2 = 0, a21 a22 a23 a24 . . . a2n . . . a3 = 0, a31 a32 a33 a34 . . . a3n . . . a4 = 0, a41 a42 a43 a44 . . . a4n . . . ... an = 0, an1 an2 an3 an4 . . . ann . . . ... (kde aik je k-tá číslice v desetinném vyjádření čísla ai ). Sestrojme nyní číslo b = 0, b1 b2 b3 b4 . . . bn . . . takto: je-li aii = 1, klademe bi = 2, je-li aii 6= 1, klademe bi = 1. Číslo b takto sestrojené je různé od všech čísel ai (od a1 se liší v první číslici za desetinnou čárkou, od a2 se liší v druhé číslici za desetinnou čárkou, atd.). Protože ale b ∈ [0, 1), mělo by být ve vypsaném seznamu, tzn. mělo by být některým z čísel ai , což je spor. Interval [0, 1) a tudíž i množina R jsou nespočetné množiny. Pojem zobrazení nám umožňuje korektně (pokud nechceme akceptovat intuitivní definice jako matice je „tabulka čísel uspořádaných do řádků a sloupcůÿ a funkce je „předpisÿ) zavést řadu dalších pojmů jako ÚM FSI VUT v Brně
10
2. Relace, zobrazení, operace a algebraické struktury
Studijní text
reálná matice nebo reálná funkce reálné proměnné: Jde o zobrazení A : {1, . . . , m} × {1, . . . , n} → R, respektive f : R → R. Definice 2.8. n-ární operací na množině A rozumíme funkci f : A1 × · · · × An → A. (Nejde tedy o nic jiného než o speciální (n + 1)-ární relaci.)
Poznámka 2.9. 1-ární operací se nazývá unární (například převrácená hodnota reálného čísla), 2-ární operací se nazývá binární (například součet dvou čísel) 3-ární operací se nazývá ternární, apod. Nejčastěji užívané jsou ovšem operace binární: zde místo (a1 , a2 , a) ∈ R budeme psát a1 ∗ a2 = a, přičemž ∗ se nahrazuje i jinými vhodnými (a obvyklými) znaky.
Definice 2.10. Algebraickou strukturou rozumíme množinu spolu s nějakými operacemi na ní (daná struktura musí být na tyto operace uzavřená (uzavřenost znamená, že neomezené užití operace nevede nikdy k „vyběhnutíÿ z množiny A). Algebra se zabývá vyšetřováním obecných vlastností algebraických struktur. Jde o typický postup matematické abstrakce: abstraktní popis algebraických struktur pak může být implementován v jednotlivých problémech. Například množina A s jednou binární operací se nazývá grupoid; zjištěné vlastnosti grupoidů pak můžeme uplatnit například pro množinu přirozených čísel N s operací sčítání +, která je grupoidem. Důležitější algebraickou strukturou s jednou (užívány jsou ovšem i struktury s více operacemi: např. okruh, pole, aj., těm se zde již nevěnujeme) binární operací je ale grupa, což je množina G s binární operací ∗ splňující G I. (Asociativita operace) pro všechna a, b, c ∈ G platí (a ∗ b) ∗ c = a ∗ (b ∗ c) G II. (Existence neutrálního prvku) existuje prvek e ∈ G splňující pro všechna a ∈ G platí e∗a=a∗e=a G III. (Existence opačného prvku) pro každý prvek a ∈ G existuje prvek a ¯ ∈ G splňující a∗a ¯=a ¯ ∗ a = e.
ÚM FSI VUT v Brně
11
3. Matice a determinanty
Studijní text
3. Matice a determinanty Teorie matic a determinantů představuje úvod do lineární algebry. Nejrozsáhlejší aplikace mají matice a determinanty při řešení systémů lineárních rovnic. Pojem determinantu zavedl již v roce 1693 německý matematik W. G. Leibniz (1646–1716), ale jeho objev upadl v zapomenutí. V roce 1750 dospěl znovu k pojmu determinantu švýcarský matematik G. Cramer (1704–1752). Všeobecně se začalo v matematice používat determinantů až koncem 18. století. Zasloužili se o to zejména matematici A.-T. Vandermonde (1735–1796) a A. L. Cauchy (1789–1857). Současně s teorií determinantů se rozvíjela teorie matic, jejímž zakladatelem je anglický matematik A. Cayley (1821–1895). Na dalším rozvoji teorie matic se podíleli zejména G. Frobenius (1849–1917), J. J. Sylvester (1814–1897) a K. Weierstrass (1815–1897).
A. Základní maticové pojmy Definice 3.1. Matice A = (aij ) typu m/n nad množinou X 6= ∅ je schema složené z m · n prvků množiny X zapsaných do m řádků a n sloupců. Přesněji matice A typu m/n nad X je zobrazení množiny {1, . . . , m} × {1, . . . , n} do množiny X. Množina X bývá často číselná, tj. X ∈ {N, Z, Q, R, C}. Prvky matic mohou být ale i komplikovanější objekty, například algebraické výrazy, nebo funkce. Poznámka 3.2. Matici A typu m/n budeme zapisovat ve tvaru a11 . . . a1n .. A= , . am1
...
amn
nebo jen krátce A = (aij ), kde i je řádkový index a j sloupcový index. Příklad 3.3. Matice
A=
1 2
7 6
3 4
je příkladem matice typu 2/3 nad množinou N. Platí například, že a23 = 4, protože prvek a23 leží ve druhém řádku a třetím sloupci matice A. Definice 3.4. a) Je-li m = n, nazývá se matice čtvercová; b) V obecném případě m 6= n obdélníková; c) Množina všech prvků se stejným řádkovým a sloupcovým indexem se nazývá hlavní diagonála matice; d) Nulová matice O je matice, jejíž všechny prvky jsou nuly; e) Jednotková matice E je čtvercová matice, jejíž prvky mimo hlavní diagonálu jsou nuly a prvky na hlavní digonále jsou rovny jedné; f) Matice A se nazývá trojúhelníková matice, (přesněji horní trojúhelníková), pokud pro libovolné dva indexy i, j platí i > j ⇒ aij = 0. Horní trojúhelníková matice má nuly pod hlavní diagonálou; g) Analogicky definujeme dolní trojúhelníkovou matici; h) Dvě matice A, B se rovnají, když mají stejný typ a pro libovolné indexy i, j platí aij = bij . Pak píšeme A = B.
ÚM FSI VUT v Brně
12
3. Matice a determinanty
Studijní text
B. Operace s maticemi Maticová algebra je jednoduchá. Definice 3.5. (Sčítání matic) Matice A, B lze sečíst, když mají stejný typ m/n. Pak výsledek A + B je matice C = (cij ) typu m/n, kde cij = aij + bij .
(3.1)
Definice 3.6. (Násobení matice číslem) Každou matici A typu m/n lze vynásobit prvkem c ∈ X. Výsledkem cA je matice C = (Cij ) typu m/n, kde cij = c · aij .
(3.2)
Definice 3.7. (Odečítání matic) Odečítání matic A, B lze pak formálně definovat vztahem A − B = A + (−1)B.
(3.3)
Definice 3.8. (Násobení matic) Pro násobení matic platí komplikovanější vztahy. Předně dvě matice A, B lze vynásobit v tomto pořadí, tj. vytvořit součin A·B, když typy matic na sebe navazují v následujícím smyslu: pokud typ A je m/k, typ B je k/n, pak typ A · B je m/n. Výsledkem násobení je tedy matice C = (cij ) typu m/n, přičemž pro cij platí cij =
k X
ais bsj .
(3.4)
s=1
Prvek ležící v i-tém řádku a j-tém sloupci výsledné matice tedy získáme tak, že procházíme i-tý řádek v matici A a jeho prvky postupně násobíme prvky ležícími v j-tém sloupci matice B a vytvořené součiny posčítáme.
Definice 3.9. (Transponování matice) Libovolnou matici A = (aij ) typu m/n lze transponovat. Výsledkem transpozice je matice AT = (aji ) typu n/m. Pro operace s maticemi platí všechny typy asociativních zákonů, distributivní zákony A(B+C) = AB+AC a (A + B)C = AC + BC a pro sčítání matic platí i zákon komutativní. Násobení matic ale komutativní není. Jednotková matice E má podobnou vlastnost jako jednička: A · E = E · A = A. Analogicky pro nulovou matici platí: A · O = O · A = O. Chování součinu vzhledem k transpozici popisuje vztah (A · B)T = B T · AT . Nyní demonstrujme algoritmus násobení matic podle vztahu (3.4) na příkladu. Příklad 3.10. Nechť jsou dány dvě matice A=
1 2
0 1
3 1
a
1 B= 2 1
3 0 . 2
Určete součin A · B a B · A. Zamyslete se nad tím, zda pro násobení matic platí, nebo neplatí komutativní zákon. Řešení. A·B =
ÚM FSI VUT v Brně
1 2
0 1
3 1
1 · 2 1
3 1+0+3 0 = 2+2+1 2
3+0+6 6+0+2
=
4 5
9 8
.
13
3. Matice a determinanty
1 B·A= 2 1
Studijní text
3 1 0 · 2 2
0 1
3 1
1+6 = 2+0 1+4
0+3 0+0 0+2
3+3 7 6+0 = 2 3+2 5
3 0 2
6 6 . 5
Z uvedeného příkladu je ihned patrné, že pro násobení matic obecně neplatí komutativní zákon, tj. A·B 6= B · A. Výsledné matice mají dokonce úplně odlišné typy.
C. Determinanty
Definice 3.11. Buď X množina, f : X → X bijekce. Pak f se nazývá permutace množiny X. Je-li ... n X = {1, . . . , n}, zapisujeme permutaci symbolicky f = i11 i22 ... in , přičemž f (s) = is , s = 1, . . . , n. Buďte i, j ∈ X, i 6= j. Řekneme, že dvojice [i, j] je inverze v f , když i < j ∧ f (i) > f (j). Klademe pak sgn(f ) = (−1)k ,
(3.5)
kde k je počet inverzí v f .
Definice 3.12. Determinant čtvercové matice A = (aij ) typu n/n definujeme vztahem X det A = sgn(f ) · a1f (1) · · · · · anf (n) ,
(3.6)
f
kde součet probíhá všechny permutace f množiny {1, . . . , n}.
Poznámka 3.13. Místo det A někdy píšeme |A|. Sarrusovo pravidlo. Pro n = 2, 3 lze definiční vztah snadno rozepsat a upravit na tvar
det(A)
a = 11 21
a12 = a11 a22 − a12 a21 a22
(3.7)
a det(A)
a11 = a21 a31
a12 a22 a32
a13 a23 a33
=
= a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31 + a12 a21 a33 + a11 a23 a32 .
(3.8) (3.9)
Výpočet podle vztahu (3.7) resp. (3.8) nazýváme výpočtem podle Sarrusova pravidla (podle francouzského matematika P. F. Sarruse (1798–1858)). Elementární řádkové úpravy. Řádkovými elementárními transformacemi matice nazýváme následující úpravy: a) záměna dvou řádků; b) vynásobení řádku nenulovým číslem; c) přičtení řádku k jinému řádku; d) libovolnou kombinaci úprav a), b), c).
ÚM FSI VUT v Brně
14
3. Matice a determinanty
Studijní text
Analogicky definujeme sloupcové elementární transformace. Kombinujeme-li řádkové i sloupcové transformace, nazýváme tyto úpravy elementární transformace matice. Následující věta popisuje vlastnosti determinantu, které jsou důležité pro jeho výpočet. Zejména popisuje, jaký vliv má provedení jednotlivých transformací na hodnotu determinantu. Věta 3.14. (základní vlastnosti determinantů) 1. Transpozicí matice se hodnota determinantu nezmění. Důsledek: Libovolné tvrzení platící pro řádky, platí i pro sloupce a naopak. 2. Existuje-li v matici nulový řádek nebo nulový sloupec, pak je její determinant roven nule. 3. Existují-li v matici dva stejné řádky, nebo dva stejné sloupce, pak determinant této matice je roven nule. 4. Nechť matice B vznikla z matice A záměnou dvou řádků, nebo sloupců. Pak det(B) = − det(A). 5. Nechť matice B vznikla z matice A vynásobením jednoho řádku, nebo sloupce číslem c. Pak det(B) = c · det(A). 6. Determinant matice se nezmění, pokud k nějakému jejímu řádku, (nebo sloupci), přičteme nenulový násobek jiného jejího řádku, (nebo sloupce). 7. Determinant trojúhelníkové matice je roven součinu prvků na hlavní diagonále. 8. Každou matici lze pomocí konečného počtu řádkových transformací převést na trojúhelníkový tvar.
Tvrzení obsažená ve Větě 3.14 nám poskytují jednoduchý návod, jak hodnotu determinantu určit. Pomocí elementárních transformací převedeme matici na horní trojúhelníkovou matici. Jednotlivé transformace sice mohou měnit hodnotu determinantu, ale podle Věty 3.14 víme k jakým změnám dojde. Hodnota determinantu je pak podle vlastnosti 7 Věty 3.14 rovna součinu prvků na hlavní digonále. Výpočet determinantu lze provést i pomocí následující metody. Definice 3.15. 1. Buď A = (aij ) matice typu m/n. Každá matice B, která vznikne z A vynecháním některých řádků a některých sloupců se nazývá submatice matice A. 2. Determinant čtvercové submatice se nazývá subdeterminant, nebo též minor matice A. Buď A čtvercová matice typu n/n. 3. Subdeterminant matice vzniklé vynecháním i-tého řádku a j-tého sloupce v matici A označme Aij . Číslo Dij = (−1)i+j Aij nazýváme algebraický doplněk prvku aij .
Věta 3.16. (Laplaceova věta) Buď A = (aij ) čtvercová matice typu n/n, kde n ≥ 2. Pak det(A) =
n X
aik Dik =
k=1
n X
(−1)i+k aik Aik
(3.10)
k=1
a det(A) =
n X k=1
akj Dkj =
n X
(−1)k+j akj Akj .
(3.11)
k=1
Vztah (3.10) se nazývá rozvoj podle i-tého řádku, vztah (3.11) rozvoj podle j-tého sloupce.
ÚM FSI VUT v Brně
15
3. Matice a determinanty
Studijní text
Příklad 3.17. Vypočtěte determinant matice A následujícími metodami: a) pomocí Sarrusova pravidla; b) převodem na trojúhelníkovou matici; c) rozvojem podle druhého řádku. Matice A je dána vztahem 2 −3 8 6 −7 . A= 4 −5 4 −9
Řešení. a) Podle Sarrusova pravidla je det(A) = [2 · 6 · (−9) + (−3)(−7)(−5) + 4 · 4 · 8] − [8 · 6 · (−5) + 4(−3)(−9) + 4(−7)3] = = (−108 − 105 + 128) − (−240 − 56 + 108) = −85 + 188 = 103. b) Pomocí elementárních transformací a Věty ?? platí 2 −3 8 8 1 2 −3 6 −7 = 2 12 −23 det(A) = 4 −5 4 −9 2 0 −7 −22
c) Podle Laplaceovy věty 3.16 platí 2 −3 8 −3 6 −7 = (−4) det(A) = 4 4 −5 4 −9
8 1 1 2 −3 = 2 12 0 12 −23 = 0 0 103 1 = (2 · 12 · 103) = 103. 24
2 8 + 6 −5 −9
2 8 + 7 −5 −9
−3 = 4
= (−4)(27 − 32) + 6(−18 + 40) + 7(8 − 15) = 20 + 132 − 49 = 103.
D. Inverzní matice
Definice 3.18. Buď A = (aij ) čtvercová matice typu n/n. Čtvercová matice B typu n/n se nazývá inverzní k matici A, když A · B = B · A = E. Na první pohled není z uvedené definice zřejmé, zda matice B inverzní k A existuje vždy, zda je určena jednoznačně a jak tuto matici vypočítat. K formulaci odpovědí nám pomůže teorie determinantů. Definice 3.19. K matici A = (aij ) typu n/n vždy existuje matice A∗ = (Dij )T , tzv. adjungovaná matice k matici A. Vznikne tak, že každý prvek v matici A nahradíme jeho algebraickým doplňkem a matici transponujeme.
Věta 3.20. (O inverzní matici) Buď A = (aij ) čtvercová matice typu n/n. Pak platí a) Inverzní matice k A existuje právě tehdy, když det(A) 6= 0. b) V případě, že inverzní matice existuje, je určena jednoznačně a označuje se A−1 . c) Inverzní matici lze pak vypočítat podle vzorce A−1 =
1 · A∗ det(A)
(3.12)
Pro inverzní matici platí řada zákonitostí. Uveďme aspoň dvě nejpoužívanější. ÚM FSI VUT v Brně
16
3. Matice a determinanty
Studijní text
Poznámka 3.21. Platí (A−1 )−1 = A
(A · B)−1 = B −1 · A−1 .
a
Rovněž existuje alternativní možnost výpočtu inverzní matice. Je založena na teorii elementárních transformací matic. Věta 3.22. Nechť [A|E] je matice typu n/2n vzniklá tak, že za matici A napíšeme jednotkovou matici E, viz Příklad 3.23. Pak existuje posloupnost řádkových elementárních transformací, která převede matici [A|E] na matici [E|B] a platí B = A−1 .
Příklad 3.23. Vypočtěte inverzní matici A−1 k matici 2 1 A= 1 1 1 2
A, kde 1 2 . 0
Řešení. Předně zjistíme, zda je matice A regulární. Některou z metod pro výpočet determinantu vypočteme, že det A = −5. Podle Věty 3.20 existuje k matici A matice inverzní. Tuto matici můžeme vypočítat dvěma způsoby. První možnost výpočtu je založena na Větě 3.20. Platí
A−1 =
1 · A∗ det(A)
−4 1 2 = −5 1
1 2
2 0
1 − 1
2 0
2 1
1 0
2 − 1
1 2
− 52
− 15
1 − 1 1 = −5 2 0 1 1 1 2 T 2 1 −1 −3 = −3 1
4 5 − 25 − 15
1 5 3 5
3 5 − 51
T 1 2 2 1 = − 1 2 2 1 1 1 1 1
.
Druhá možnost výpočtu je založena na Větě 3.22. Platí
2 [A|E] = 1 1
1 1 2
1 0 0
0 1 2 0 → 1 1 2 1 1 1 2 0 → 0 −1 2 0 0 −5 0 1 2 0 0 − 15 → 0 −1 0 25 3 0 0 1 − 15 5 1 2 0
0 1 0
1 2 0 0 0 1 1 0 → 0 −1 2 0 1 −1 → 0 0 −3 1 1 0 −2 1 0 0 1 1 2 0 0 0 0 1 −1 → 0 −1 2 0 1 −1 → 1 −3 1 0 0 1 15 53 − 51 1 − 25 − 15 1 0 0 45 1 3 − 53 → 0 1 0 − 52 = [E|B]. 5 5 1 1 3 1 0 0 1 −5 −5 − 5 5 0 2 1
0 0 1
0 1 0
Podle Věty 3.22 je B = A−1 .
ÚM FSI VUT v Brně
17
4. Hodnost matice
Studijní text
4. Hodnost matice Definice 4.1. Nechť A je matice typu (m, n). Pak hodnost matice A je rovna maximálnímu počtu jejích lineárně nezávislých řádků. Hodnost matice značíme h(A). Poznámka 4.2. Ujasněme si, co rozumíme pod pojmem lineárně nezávislé řádky. Představme si řádky matice A typu (m, n) jako vektory ~a1 , . . . , ~am a předpokládejme, že žádný z nich není nulový. Řekneme, že nenulové vektory ~a1 , . . . , ~am (tj. řádky matice) jsou lineárně závislé, jestliže existují čísla t1 , . . . , tm z nichž alespoň jedno je různé od nuly tak, že t1~a1 + · · · + tm~am = ~o. V opačném případě říkáme, že jsou lineárně nezávislé. Poznámka 4.3. Lineární nezávislost m vektorů lze definovat i takto: nenulové vektory ~a1 , . . . , ~am se nazývají lineárně nezávislé, jestliže platí t1~a1 + t2~a2 + · · · + tm~am = 0 ⇒ t1 = t2 = · · · = tm = 0
pro každé
t1 , t2 , . . . , tm ∈ R.
Dříve než se budeme zabývat praktickým výpočtem hodnosti matice, připomeňme si, jaké jsou elementární řádkové úpravy matice A: Věta 4.4. Nechť A je matice typu (m, n). Pak každá z následujících úprav matice A se nazývá elementární řádková úprava: 1. libovolná záměna pořadí řádků; 2. vynásobení libovolného řádku nenulovým číslem; 3. přičtení lineární kombinace několika řádků k jednomu řádku;
Věta 4.5. Provedením libovolné elementární řádkové úpravy se hodnost matice A nezmění. Z předchozích úvah vyplývá, že při praktickém zjišťování hodnosti dané matice bude zřejmě výhodné pomocí elementárních řádkových úprav převést matici na nějaký „ jednoduchý tvarÿ, z něhož bude hodnost přímo vidět. Tento „ jednoduchý tvarÿ popisuje následující definice. Definice 4.6. Nechť A je matice typu (m, n). Řekneme, že A je matice ve schodovitém tvaru, jestliže v matici A každý nenulový řádek začíná větším počtem nul než předchozí řádek. Věta 4.7. Každou matici lze konečným počtem elementárních řádkových úprav převést na schodovitý tvar. Věta 4.8. Hodnost matice ve schodovitém tvaru je rovna počtu jejích nenulových řádků. Příklad 4.9. Určete hodnost matice A.
1 A= 7 0
−1 6 1
2 5 2
. ÚM FSI VUT v Brně
16
4. Hodnost matice
Studijní text
Řešení. Matici převedeme elementárními řádkovými úpravami do schodovitého tvaru. 1 −1 2 1 −1 2 1 −1 2 7 6 5 → 0 13 −9 → 0 13 −9 ⇒ h(A) = 3. 0 1 2 0 1 2 0 0 −35
Příklad 4.10. Určete hodnost matice B.
2 B= 1 −2
6 3 −6
3 −5 10
8 −1 2
. Řešení. Matici převedeme elementárními 2 6 3 1 3 −5 −2 −6 10
ÚM FSI VUT v Brně
řádkovými úpravami do 8 2 6 3 −1 → 0 0 13 2 0 0 0
schodovitého tvaru. 8 10 ⇒ h(B) = 2. 0
17
5. Soustavy lineárních rovnic
Studijní text
5. Soustavy lineárních rovnic Se soustavami lineárních rovnic a jejich řešením je možné se v určitých jednoduchých případech setkat již na střední škole. Ukážeme si jednu praktickou metodu řešení obecných soustav lineárních rovnic a jednu metodu pro čtvercové matice. Definice 5.1. Nechť aij , bi jsou reálná čísla. Pak soustava a11 x1 + a12 x2 + · · · + a1n xn = b1 a21 x1 + a22 x2 + · · · + a2n xn = b2 .. . am1 x1 + am2 x2 + · · · + amn xn = bm se nazývá soustava m lineárních rovnic o n neznámých. Číslo aij se nazývá koeficient v i-té rovnici u j-té neznámé. Číslo bi se nazývá absolutní člen i-té rovnice. Maticový zápis. Soustavu (5.1) lze zapsat i v maticovém tvaru AxT = bT , kde A se nazývá matice soustavy (5.1), x se nazývá vektor neznámých a b se nazývá vektor pravých stran (sloupec absolutních členů). Rozšířená matice soustavy. Při výpočtech je praktické k matici soustavy A připsat i vektor pravých stran b a oddělit jej svislou čárou. Taková matice a11 a12 · · · a1n b1 a21 a22 · · · a2n b2 T A|b = . .. .. .. . . am1 am2 · · · amn bm se nazývá rozšířená matice soustavy (5.1) Nyní si uvedeme důležitou větu, která nám umožní rozhodnout o řešitelnosti či neřešitelnosti soustavy lineárních rovnic, aniž bychom hledali její řešení. Věta 5.2. (Frobeniova) Soustava lineárních rovnic (5.1) je řešitelná, právě když hodnost matice A této soustavy je rovna hodnosti rozšířené matice A|bT této soustavy, tj. h(A) = h(A|bT ).
Poznámka 5.3. Frobeniova věta je jednoduchým a elegantním kritériem řešitelnosti soustav lineárních rovnic, ovšem v případě řešitelné soustavy neříká nic o počtu řešení ani o tom, jak všechna řešení vypadají. Uvědomme si, že může nastat právě jeden z těchto tří případů: a) soustava nemá žádné řešení (tzn. je neřešitelná); b) soustava má jediné řešení; c) soustava má nekonečně mnoho řešení. Ve speciálním případě, kdy je matice A řádu n (tj. rovnic je stejný počet jako neznámých) a matice A je regulární (tj. |A| = 6 0) nám k určení řešení poslouží Cramerovo pravidlo uvedené v následující větě.
ÚM FSI VUT v Brně
18
5. Soustavy lineárních rovnic
Studijní text
Věta 5.4. (Cramerovo pravidlo) Nechť je dána soustava n lineárních rovnic o n neznámých, jejíž matice soustavy A je regulární. Pak soustava má jediné řešení (x1 , x2 , . . . , xn ), přičemž xj =
|Aj | , |A|
j = 1, 2, . . . , n,
kde Aj je matice vzniklá z matice A nahrazením j-tého sloupce sloupcem absolutních členů.
Poznámka 5.5. Cramerovo pravidlo má spíše teoretický význam, protože je numericky poměrně náročné. Na druhou stranu však umožňuje přímý výpočet jednotlivých neznámých, což může být někdy výhodné.
Příklad 5.6. Cramerovým pravidlem určete řešení soustavy. Nejprve ověřte, že je matice A regulární! 2x1 − 3x2 + x3 = 0 x1 + 2x2 − x3 = 3 2x1 + x2 + x3 = 12 Řešení. 2 |A| = 1 2
−3 1 2 −1 = 2 · 2 · 1 + (−3) · (−1) · 2 + 1 · 1 · 1 − 1 · 2 · 2 − (−3) · 1 · 1 − 2 · (−1) · 1 = 12 6= 0, 1 1
a proto je matice A regulární. Spočtěme si determinanty matic, ve kterých bude sloupec absolutních členů postupně nahrazovat sloupec koeficientů: 0 −3 1 2 −1 = 0 · 2 · 1 + (−3) · (−1) · 12 + 1 · 3 · 1 − 1 · 2 · 12 − (−3) · 3 · 1 − 0 · (−1) · 1 = 24, |A1 | = 3 12 1 1 2 |A2 | = 1 2
0 3 12
1 −1 1
= 36,
2 |A3 | = 1 2
−3 2 1
0 3 12
= 60.
Tedy x1 =
|A1 | 24 = = 2, |A| 12
x2 =
|A2 | 36 = = 3, |A| 12
x3 =
|A3 | 60 = =5 |A| 12
a soustava má jediné řešení (2, 3, 5). Dříve než si uvedeme další metodu řešení soustavy lineárních rovnic, připomeňme si, jaké jsou ekvivalentní úpravy soustavy rovnic (5.1), kterými neovlivníme množinu řešení. Věta 5.7. Nechť je dána soustava lineárních rovnic (5.1). Pak následující úpravy jsou ekvivalentními úpravami soustavy (5.1): 1. libovolná záměna pořadí rovnic; 2. vynásobení libovolné rovnice nenulovým číslem; 3. k jedné rovnici přičtení jiné rovnice vynásobené libovolným číslem; 4. vypuštění rovnice, která je lineární kombinací ostatních rovnic.
Při provádění ekvivalentních úprav dané soustavy lineárních rovnic není nutné stále opisovat celou soustavu i s neznámými, ale zřejmě stačí pracovat s její rozšířenou maticí soustavy. Uvědomme si, že pak provádění úprav 1.–4. na dané soustavě, je ekvivalentní provádění elementárních řádkových úprav na její rozšířené matici soustavy.
ÚM FSI VUT v Brně
19
5. Soustavy lineárních rovnic
Studijní text
Na této úvaze je založena další metoda, jejíž princip spočívá v tom, že danou soustavu lineárních rovnic převedeme na „ jednoduššíÿ soustavu. Její řešení bude možno víceméně ihned vypsat. Gaussova eliminační metoda. Nechť je dána soustava lineárních rovnic (5.1). Pak ekvivalentními úpravami z Věty 5.7 převedeme soustavu (5.1) na soustavu (5.1’), jejíž rozšířená matice soustavy je ve schodovitém tvaru. Nechť soustava (5.1’) má nyní s ≤ m rovnic. Potom: a) vyskytne-li se v (5.1’) rovnice, v níž všechny koeficienty jsou nulové a absolutní člen je od nuly různý (tedy řádek vypadající například takto: 0 0 · · · 0|8), pak soustava (5.1’), a tedy i soustava (5.1) nemá řešení; b) má jediné řešení, je-li s = n. Toto řešení spočítáme postupným dosazováním ze soustavy (5.1’); c) má nekonečně mnoho řešení, je-li s < n. V tomto případě (opět postupným dosazováním z (5.1’)) vyjádříme jistých s neznámých pomocí zbývajících (n − s) neznámých, které se nazývají volné neznámé. Ilustrujme si nyní Gaussovu metodu řešení soustavy lineárních rovnic na několika typických příkladech. Příklad 5.8. x1 − 2x1 x1
Řešte soustavu lineárních rovnic + 2x2 − x3 + x4 − 3x2 + 2x3 − 3x4 + x2 − x3 + 2x4 x2 + 2x4
=1 =2 = −1 =3
Řešení. Napíšeme rozšířenou matici této soustavy a pomocí elementárních řádkových úprav ji převedeme na schodovitý tvar. Navíc vypouštíme řádky, které jsou lineární kombinací ostatních řádků (pokud se takové vyskytnou) 1 2 −1 1 1 2 −1 1 1 2 −1 1 1 1 1 −2 −3 2 −3 2 1 0 −1 4 0 −1 4 ∼ 0 ∼ 0 1 1 1 −1 2 −1 0 −1 0 1 −2 0 0 0 0 2 0 1 0 2 3 0 1 0 2 3 0 0 0 0 −1 I když poslední matice ještě není formálně upravena na schodovitý tvar, vidíme, že daná soustava nemá řešení, neboť ve třetím řádku poslední matice jsou všechny koeficienty u neznámých nulové, kdežto absolutní člen je od nuly různý. Příklad 5.9. Řešte x1 − 2x2 x1 2x1 − 5x2 2x1 − 3x2 Řešení.
soustavu lineárních rovnic + x3 = −1 + x3 = 1 + 4x3 = 0 = −4
1 1 2 2
−2 1 −1 1 0 0 1 1 ∼ −5 4 0 0 −3 0 −4 0
−2 1 −1 1 2 0 2 ∼ 0 −1 2 2 0 1 −2 −2
−2 1 −1 1 0 1 3 0 2
Tedy z poslední rovnice plyne, že 2x3 = 3, neboli x3 = 32 . Dále z předposlední rovnice dostáváme přímo, že 1 x2 = 1. A konečně z první rovnice x1 = −1 + 2x2 − x3 po dosazení za x2 a x3 dostaneme, že x1 = − 2 . Daná 1 3 soustava má tedy jediné řešení: − 2 , 1, 2 . Příklad x1 x1 x1
5.10. Řešte soustavu − 2x2 + x3 − 2x2 − x3 − 2x2 + 3x3
ÚM FSI VUT v Brně
lineárních rovnic + x4 = 2 + x4 = −2 + x4 = 6
20
5. Soustavy lineárních rovnic Řešení.
1 1 1
−2 −2 −2
Studijní text
1 1 2 1 −1 1 −2 ∼ 0 6 3 1 0
−2 1 1 2 1 0 −2 0 −4 ∼ 0 4 0 2 0
−2 1 1 2 0 1 0 2
Tedy dostáváme soustavu, v níž budou dvě volné neznámé (zřejmě kterékoliv dvě z neznámých x1 , x2 , x4 , nikoliv však neznámá x3 ). Zvolíme-li za volné neznámé např. neznámé x2 , x4 , pak lehce vypočteme, že x3 = 2, x1 = 2x2 − x4 . Tedy položíme-li x2 = t, x4 = s, pak daná soustava má nekonečně mnoho řešení ve tvaru (2t − s, t, 2, s), kde t, s jsou libovolná čísla. Poznámka 5.11. Má-li soustava lineárních rovnic nekonečně mnoho řešení, pak z Gaussovy eliminační metody vyplývá pouze to, kolik neznámých volíme za volné neznámé, nikoliv však, které neznámé to jsou. Může se totiž stát, že některou neznámou nesmíme volit za volnou neznámou nebo naopak, některou neznámou musíme volit za volnou neznámou.
Homogenní soustavy lineárních rovnic. Speciálním případem soustav lineárních rovnic jsou soustavy s nulovými absolutními členy na pravé straně. Definice 5.12. Nechť aij jsou reálná čísla. Pak soustava a11 x1 + a12 x2 + · · · + a1n xn = 0 a21 x1 + a22 x2 + · · · + a2n xn = 0 .. . am1 x1 + am2 x2 + · · · + amn xn = 0 se nazývá homogenní soustava m lineárních rovnic o n neznámých.
T
Poznámka 5.13. Protože rozšířená matice soustavy (5.12), kterou označíme opět A|b , vznikla z matice A T přidáním sloupce skládajícího se ze samých nul, je zřejmě h(A) = h(A|b ), a tedy podle Frobeniovy věty 5.2 je homogenní soustava (5.12) vždy řešitelná. Evidentně je vždy řešením soustavy (5.12) uspořádaná n-tice (0, 0, . . . , 0). Toto řešení se nazývá nulové řešení. Vidíme tedy, že homogenní soustava lineárních rovnic (5.12) má buď jediné řešení (nulové) anebo má nekonečně mnoho řešení (tj. kromě nulového i nenulová řešení).
Příklad 5.14. Řešte homogenní soustavu lineárních rovnic x1 + 2x2 + x3 + x4 = 0 + x2 − x3 + x4 = 0 x1 + 3x2 + 2x4 = 0 Řešení.
1 2 0 1 1 3
1 1 0 1 2 1 1 0 1 −1 1 0 ∼ 0 1 −1 1 0 ∼ 0 0 2 0 0 1 −1 1 0
2 1 1 0 1 −1 1 0
Položíme-li x3 = t, x4 = s, pak daná soustava má nekonečně mnoho řešení ve tvaru (−3t + s, t − s, t, s), kde t, s jsou libovolná čísla.
ÚM FSI VUT v Brně
21
6. Vektorový počet
Studijní text
6. Vektorový počet Budeme se pohybovat v prostoru Rn , což je kartézská mocnina množiny reálných čísel R; Rn = R × · · · × R. Obvykle nám bude stačit omezení na případy n = 1, 2, 3; nicméně teorie je platná obecně. Prvky Rn budeme nazývat body a značit např. A = [a1 , . . . , an ], reálná čísla a1 , . . . , an pak nazýváme souřadnice bodu. Poznámka 6.1. Polohu obecného bodu P v R3 charakterizujeme nejčastěji trojicí souřadnic x, y, z a znázorňujeme jej v pravotočivé soustavě Oxyz, viz. Obrázek 6.1.
Obr. 6.1: Význam trojice souřadnic [x, y, z] charakterizujících polohu bodu P (x, y, z) v trojrozměrné pravotočivé soustavě pravoúhlých souřadnic Oxyz. Definice 6.2. Uspořádanou dvojici bodů A, B nazveme vázaný vektor v Rn s počátkem v A a s koncem v B. Značíme −−→ AB = ([a1 , . . . , an ], [b1 , . . . , bn ]). −−→ Je zřejmé, že vázaný vektor AB lze zadat i tak, že zadáme bod A a spolu s ním uspořádanou n-tici reálných čísel (b1 − a1 , . . . , bn − an ). Samotnou tuto n-tici pak nazýváme volný vektor a značíme −−→ → − u = AB; − je ovšem jasné, že → u body A, B neurčuje, protože i jiné body C, D mohou vést k témuž volnému vektoru u −−→ −−→ (přesněji, definujeme zde binární relaci mezi vázanými vektory: řekneme, že dva vázané vektory AB, CD patří do relace R, jestliže (b1 − a1 , . . . , bn − an ) = (d1 − c1 , . . . , dn − cn ); tato relace (protože je ekvivalence) určuje rozklad množiny vázaných vektorů na třídy zvané volné vektory). Dále se budeme zabývat volnými vektory. Poznámka 6.3. Při vyšetřování vztahů mezi vektorovými veličinami s užitím kartézské soustavy souřadnic se zavádějí některé další pojmy a operace. Kolmé průměty vektorové veličiny ~a do souřadnicových os se značí ax , ay , az (viz Obr. 6.2) a jsou definovány vztahy ax = a cos α,
ÚM FSI VUT v Brně
ay = a cos β,
az = a cos γ .
(6.1)
22
6. Vektorový počet
Studijní text
Obr. 6.2: Vyjádření vektorů ~a a ~b pomocí jejich složek ax , ay , az (resp. bx (= 0), by , bz ) a jednotkových vektorů ~ı, ~, ~k. V obrázku jsou rovněž vyznačeny úhly, které svírá vektor ~a se souřadnicovými osami. Tyto veličiny se nazývají rovněž souřadnice vektoru ~a. Ze vztahu (6.1) plyne ax > 0 pro 0 ≤ α ≤ π/2, ax = 0 pro α = π/2, ax < 0 pro π/2 < α ≤ π. Užívá se zápisu ~a = (ax , ay , az ). Vektor ~a a jeho souřadnice mají stejné jednotky. Je-li dán vektor svými souřadnicemi, např. ~a = (ax , ay , az ), lze určit jeho velikost a úhly, které svírá se souřadnicovými osami, s užitím vztahů plynoucích z Obrázku 6.2: q |~a| = a = a2x + a2y + a2z ; cos α =
ax ay az , cos β = , cos γ = . a y a
− Definice 6.4. (Součet a násobení skalárem) Pro volné vektory nyní definujeme operaci součet → u + → − → − v = w vztahem (w1 , . . . , wn ) = (u1 + v1 , . . . , un + vn ) → − − a operaci násobení skalárem c u = → v (c ∈ R) vztahem (v1 , . . . , vn ) = (cu1 , . . . , cun ) .
Množinu volných vektorů na Rn spolu s těmito operacemi pak nazýváme vektorový prostor a značíme Vn (poznamenáváme zde, že vůbec není naším cílem budovat obecnou teorii algebraických struktur zvaných vektorové prostory; název vektorový prostor zde tedy užíváme vědomě jen pro právě uvedený příklad). Povšimněme si, že volné vektory spolu s binární operací sčítání jsou dalším příkladem grupy, která byla definována v tématu Relace, zobrazení, operace a algebraické struktury. Neutrálním prvkem je zde tzv. nulový vektor → − o = (0, . . . , 0). − − − Definice 6.5. Řekneme, že vektor → v je lineární kombinací vektorů → u 1, . . . , → u k , jestliže ho pro nějaká c1 , . . . , ck ∈ R lze vyjádřit jako → − − − v = c1 → u 1 + · · · + ck → uk.
− Poznámka 6.6. Povšimněme si, že nulový vektor → o je vždy triviální lineární kombinací (tj. s c1 = → − → − = · · · = ck = 0) libovolných vektorů u 1 , . . . , u k . Někdy je také jejich netriviální kombinací, tzn. alespoň − − − − jedno z čísel c1 , . . . , ck je nenulové (je-li např. k = 2, → u1 = → u a→ u 2 = −→ u , vztah je splněn pro libovolné c1 = c2 = c ∈ R). ÚM FSI VUT v Brně
23
6. Vektorový počet
Studijní text
To nás vede k následující definici. − − Řekneme, že vektory → u 1, . . . , → u k jsou lineárně závislé, pokud je nulový vektor jejich netriviální lineární kombinací. Pokud tomu tak není, tedy nulový vektor lze obdržet pouze jako triviální lineární kombinaci − − vektorů → u 1, . . . , → u k , nazveme tyto vektory lineárně nezávislé. V prostoru Vn lze vybrat nejvýše n lineárně nezávislých vektorů; množina n lineárně nezávislých vektorů se nazývá báze Vn . Lze sice vybrat nekonečně mnoho bází Vn , jednu však preferujeme: je to tzv. kanonická báze: → − e1 → − e2 → − e 3
=
(1, 0, 0, . . . , 0)
=
(0, 1, 0, . . . , 0)
=
(0, 0, 1, . . . , 0)
... → − en
=
(0, 0, 0, . . . , 1)
− − Povšimněme si, že vektory kanonické báze → e 1, . . . , → e n zapsané jako řádky matice dávají jednotkovou matici E; obecně, vektory libovolné báze představují vždy regulární matici. Poznámka 6.7. Jednotkové vektory ve směru souřadnicových os Ox, Oy, Oz v R3 budeme obvykle značit ~ı, ~, ~k. Tyto vektory jsou navzájem kolmé (viz Obrázek 6.2) a platí pro ně |~ı| = |~| = |~k| = 1. Vektory ax~ı, ay~, az~k o velikostech |ax |, |ay |, |az | se nazývají složky vektoru ~a v souřadnicových osách. Platí pro ně tzv. semikartézské vyjádření vektoru ~a ~a = ax~ı + ay~ + az~k. − − − Předpokládejme, že vektor → u má souřadnice v obvyklé, tedy kanonické bázi. Uvažujme jinou bázi → a 1, . . . , → a n, → − → − zapsanou řádkově do matice ji označme A. Vektor u v této bázi budeme označovat u A . Zřejmě platí (vektory → − − u, → u A píšeme sloupcově) − − A→ u A = E→ u a tedy
→ − − u A = A−1 → u.
− Ještě obecněji, předpokládejme, že vektor → u B je vyjádřen v bázi (maticově) B a chceme jej vyjádřit v bázi A. Postupem analogickým předchozímu odstavci zjistíme, že → − − u A = A−1 B → u B. Matici A−1 B nazýváme matice přechodu od báze B k bázi A (v této důležité úloze aplikujeme tedy jak výpočet inverzní matice, tak součin matic). − − Definice 6.8. (Skalární součin) Na Vn lze zavést další operaci: skalární součin → u→ v = c (c ∈ R) definujeme vztahem c = u1 v1 + · · · + un vn . Vektorový prostor Vn s takto zavedeným skalárním součinem nazýváme euklidovský prostor a značíme En (skalární součin lze zavést i jiným způsobem, tomu se ale zde nevěnujeme). Geometrický význam skalárního součinu. Skalární součin ~a ·~b dvou (libovolných) vektorových veličin ~ ~a, b je skalární veličina c daná vztahem c(= ~a · ~b) = ab cos α,
(6.2)
kde α je dutý nebo přímý úhel sevřený vektory a, b (viz Obrázek 6.3).
ÚM FSI VUT v Brně
24
6. Vektorový počet
Studijní text
Obr. 6.3: Geometrický význam skalárního součinu ~a · ~b = a b cos α(= ab b = ba a).
Příklad 6.9. Vagón je tažen na přímém úseku délky s = 20 m lanem, které svírá se směrem rychlosti vagonu úhel α = 20◦ a které je napínáno silou o velikosti F = 800 N. Vyjádřete práci W vykonanou silou F~ pomocí skalárního součinu a vypočtěte ji. Řešení. Zavedeme vektor ~s podle Obrázku 6.4. Pak W W
= Fs s = F · cos α) · s = F~ · ~s, = F~ · ~s = F s cos α = 800 N · 20 m · cos 20◦ = 1,50 · 104 J.
Obr. 6.4: K příkladu 6.9.
Definice 6.10. (Vektorový součin) Dále, definujme pro n > 1 na Vn tzv. vektorový součin jako − − (n − 1)-ární operaci přiřazující vektorům → u 1 = (u11 , . . . , u1n ), . . . , → u n−1 = (u(n−1)1 , . . . , u(n−1)n ) vektor → − → − → − w = u 1 × · · · × u n−1 jako determinant u11 u12 ... u1n u21 u22 ... u2n → − ... w = u(n−1)1 u(n−1)2 ... u(n−1)n , → → − → − − e1
e2
...
en
− − kde → e 1, . . . , → e n jsou vektory kanonické báze. − − Pro n = 2 jde o unární operaci, která vektoru → u = (u1 , u2 ) přiřadí vektor → w = u1 (0, 1)−u2 (1, 0) = (−u2 , u1 ). → − → − − Pro n = 3 jde o binární operaci, která vektorům u = (u1 , u2 , u3 ), v = (v1 , v2 , v3 ) přiřadí vektor → w = u1 v2 (0, 0, 1) + u2 v3 (1, 0, 0) + u3 v1 (0, 1, 0) − u1 v3 (0, 1, 0) − u2 v1 (0, 0, 1) − u3 v2 (1, 0, 0) = (u2 v3 − u3 v2 , u3 v1 − u1 v3 , u1 v2 − u2 v1 ). Poznámka 6.11. Doporučujeme čtenáři hlouběji se seznámit s vlastnostmi operace vektorového součinu − − − − (tato operace je mj. pro n = 3 antikomutativní: → u ×→ v = −→ v ×→ u ). Důležitým výsledkem (dokáže → − → − − se přímým výpočtem) dále je, že skalární součin vektoru w = u 1 × · · · × → u n−1 s libovolným z vektorů → − → − u 1 , . . . , u n−1 je vždy nulový. Geometrický význam vektorového součinu. Vektorový součin ~a × ~b dvou (libovolných) vektorových veličin ~a, ~b je vektorová veličina ~c, kterou je graficky možno znázornit tak, že oba vektory ~a, ~b umístíme do jednoho (libovolného) bodu (bod P v Obrázku 6.5). ÚM FSI VUT v Brně
25
6. Vektorový počet
Studijní text
Obr. 6.5: Geometrický význam vektorového součinu ~a × ~b. Pro vektor ~c = ~a × ~b platí: 1. Velikost: |~c| = ab sin α, tj. platí, že velikost vektoru ~c je rovna plošnému obsahu kosodélníka vyšrafovaného v Obrázku 6.5, kde α je tupý nebo přímý úhel sevřený vektory ~a, ~b. 2. Směr je kolmý na rovinu danou vektory ~a, ~b tak, že vektory ~a, ~b, ~c (v uvedeném pořadí) tvoří pravotočivý trojhran (nebo: pravotočivý šroub — otáčení kolem přímky p od ~a do ~b nejkratší cestou, vektor ~c má směr postupu šroubu) – viz Obrázek 6.5.
Příklad 6.12. Síla F~ působící na těleso v bodě P vyvozuje vzhledem k počátku souřadnic otáčivý moment ~ = ~r × F~ , kde ~r je polohový vektor bodu P (viz Obrázek 6.6). M
~ síly F~ působící na těleso v bodě P , jehož Obr. 6.6: Příklad užití vektorového součinu: otáčivý moment M ~ = ~r × F~ . polohový vektor je ~r, je roven M
Příklad 6.13. Na konci tyče délky l působí síla F~ Ox podle Obrázku 6.7. Určete otáčivý moment síly F~ vzhledem k počátku O. (Pozn.: symbolem ~a ~b vyjadřujeme, že vektory ~a, ~b jsou souhlasně rovnoběžné, tj. paralelní. Symbol ~a ↑↓ ~b vyjadřuje, že vektory ~a, ~b jsou nesouhlasně rovnoběžné, tj. antiparalelní). ~ = ~r × F~ . Vektor M ~ zakreslíme v bodě O, směr je zřejmý z Obrázku 6.7. Platí Řešení. M 1 M = |~r| · |F~ | sin 90◦ = lF. 2
ÚM FSI VUT v Brně
26
6. Vektorový počet
Studijní text
Obr. 6.7: K příkladu 6.13.
Definice 6.14. Pro n > 1 na Vn definujeme také tzv. vnější součin jako n-ární operaci přiřazující − − vektorům → u 1 = (u11 , . . . , u1n ), . . . , → u n = (un1 , . . . , unn ) determinant (tedy číslo) u u ... u u11 u12 ... u1n 21 22 ... 2n . un1 un2 ... unn
Absolutní hodnota vnějšího součinu vyjadřuje objem n-rozměrného rovnoběžnostěnu s vrcholy O (počátek), − − − − − − O+→ u 1, O + → u 1 +→ u 2, . . . , O + → u 1 +→ u 2 + · · · + +→ u n . V prostoru V2 jde o obsah rovnoběžníka. V prostoru 3 V jde o objem rovnoběžnostěnu (pro úplnost ještě uveďme alternativní možnost: pokud v prostoru V3 vy− − − násobíme dva vektory → u, → v vektorově a výsledek pak s třetím vektorem → w skalárně, obdržíme tzv. smíšený součin tří vektorů; ten splývá s vnějším součinem: tedy jeho absolutní hodnota udává objem rovnoběžnostěnu − − − s hranami představovanými vektory → u, → v a→ w ). − − Definice 6.15. Na En dále definujeme velikost |→ u | vektoru → u vztahem √ − − − |→ u|= → u→ u (odmocnina skalárního součinu vektoru se sebou samým). Takto zavedená velikost mj. splňuje tzv. trojúhelníkovou nerovnost − − − − |→ u +→ v | ≤ |→ u | + |→ v |.
− − Definice 6.16. Můžeme dále na En zavést úhel dvou nenulových vektorů → u a→ v jako číslo φ ∈ [0, π), pro něž → − − u→ v cos φ = → . − − | u ||→ v| − − Zřejmě φ = π2 nastává právě tehdy, když skalární součin → u a→ v je nulový; takové vektory tedy nazýváme kolmé (a viz nyní znovu Poznámka 6.11). − − Pro vektory → u a→ v v E3 svírající úhel φ pak např. platí − − − − |→ u ×→ v | = |→ u ||→ v | sin φ, jak si čtenář může nyní dokázat.
ÚM FSI VUT v Brně
27
7. Analytická geometrie
Studijní text
7. Analytická geometrie A. Přímka v rovině y
− → n
− → s
− → n ϕ
×
B
p
b
×
A s2 b
0
− → s ϕ s1
→ − s → − n
= (s1 , s2 ) · · · směrový vektor přímky p
ϕ
· · · směrový úhel přímky p s2 = tgϕ = · · · směrnice přímkyp s1
k
x
· · · normálový vektor přímky p
Definice 7.1. Přímka v rovině je množina bodů o souřadnicích [x, y] daná jedním z následujících způsobů: 1) p = {[x, y] ∈ R × R | ax + by + c = 0, a, b, c ∈ R}, kde alespoň jedno z čísel a, b je různé od nuly. 2) p = {[x, y] ∈ R × R | x = a1 + s1 t, y = a2 + s2 t, t ∈ R}, − kde A = [a1 , a2 ] je bod, kterým přímka prochází a → s = (s1 , s2 ) je její směrový vektor. 3) p = {[x, y] ∈ R × R | y = kx + q, k, q ∈ R} 4) p = {[x, y] ∈ R × R |
x y + = 1}, p q
kde p, q jsou úseky, které přímka vytíná na osách x, y. V prvním případě je přímka zadána pomocí své obecné rovnice, v druhém pomocí parametrických rovnic, ve třetím se jedná o směrnicový tvar rovnice přímky a ve čtvrtém o úsekový tvar. Poznámka 7.2. Vlastnosti koeficientů obecné rovnice. − 1) Koeficienty a, b určují souřadnice normálového vektoru → n = (a, b) a tím i souřadnice směrového vektoru → − s = (−b, a). 2) Pokud a = 0, je přímka rovnoběžná s osou x. 3) Pokud b = 0, je přímka rovnoběžná s osou y. 4) Pokud c = 0, přímka prochází počátkem souřadné soustavy.
Poznámka 7.3. Vlastnosti směrnicového tvaru rovnice přímky. Tento tvar nezahrnuje přímky rovnoběžné s osou y, neboť koeficient u y není nikdy roven 0. Navíc tento způsob zadání odpovídá zadání lineární funkce, jejímž grafem nemůže být přímka rovnoběžná s osou y. Koeficient k se nazývá směrnice přímky, více o směrnicích viz. kapitola Derivace funkce. Koeficient q je úsek, který přímka vytíná na ose y. 1 ÚM FSI VUT v Brně
28
7. Analytická geometrie
Studijní text
Věta 7.4. Vzdálenost bodu od přímky v rovině. Mějme přímku p : ax+by +c = 0 a bod A = [a1 , a2 ], který na ní neleží. Pak vzdálenost v bodu A od přímky p je dána vztahem v=
|a · a1 + b · a2 + c| √ a2 + b2
. Definice 7.5. Odchylkou dvou různoběžných přímek rozumíme úhel, který je dán a) jako ostrý úhel, který svírají směrové vektory těchto přímek, b) jako rozdíl přímého úhlu (π) a tupého úhlu, který svírají směrové vektory těchto přímek.
− − Věta 7.6. Odchylka dvou přímek. Jsou-li → sa , → sb směrové vektory přímek a, b, potom pro odchylku ϕ těchto dvou přímek platí − − |→ sa · → sb | cos ϕ = → , − − |sa | · |→ sb | kde · v čitateli je skalární součin vektorů. Definice 7.7. Vzájemná poloha přímek v rovině. Mějme přímky p, q dané obecnými rovnicemi p : a1 x + b1 y + c1 = 0, q : a2 x + b2 y + c2 = 0. Pak tyto přímky mohou být a) rovnoběžky splývající, jestliže existuje r ∈ R \ {0} takové, že platí a1 = ra2 ∧ b1 = rb2 ∧ c1 = rc2 . (jedna rovnice je násobkem druhé) b) rovnoběžky různé, jestliže existuje r ∈ R \ {0} takové, že platí a1 = ra2 ∧ b1 = rb2 ∧ c1 6= rc2 . (normálové resp. směrové vektory jsou lineárně závislé, ale přímky nemají společný bod) c) různoběžky kolmé, jestliže a1 a2 + b1 b2 = 0. (skalární součin normálových resp. směrových vektorů je roven 0) d) různoběžky (nekolmé), jestliže neplatí ani jedna z předchozích možností.
B. Rovina v prostoru Rovina v prostoru je jednoznačně určena: • třemi různými body, které neleží na jedné přímce, • dvěma různoběžnými přímkami, tj, přímkami, které mají společný právě jeden bod a jejichž směrové vektory jsou lineárně nezávislé, • dvěma různými rovnoběžnými přímkami, • bodem a přímkou, která daným bodem neprochází.
ÚM FSI VUT v Brně
29
7. Analytická geometrie
Studijní text
Následující definice obsahuje i analytické vyjádření roviny v prostoru. Definice 7.8. Rovina v prostoru je množina bodů o souřadnicích [x, y, z] daná jedním z následujících způsobů: 1) σ = {[x, y, z] ∈ R3 | ax + by + cz + d = 0, a, b, c, d ∈ R}, kde alespoň jedno z čísel a, b, c je různé od nuly. 2) σ = {[x, y, z] ∈ R3 | x = a1 + s1 p + r1 q, y = a2 + s2 p + r2 q, z = a3 + s3 p + r3 q, p, q ∈ R}, − − kde A = [a1 , a2 , a3 ] je bod, který leží v zadané rovině a → s = (s1 , s2 , s3 ) a → r = (r1 , r2 , r3 ) jsou její směrové vektory. V prvním případě řekneme, že rovina je zadaná pomocí obecné rovnice, ve druhém pomocí parametrických rovnic. Poznámka 7.9. Z parametrických rovnic dostaneme obecnou rovnici vyloučením parametrů, tj. sčítáním vhodných násobků parametrických rovnic. Z obecné rovnice přejdeme k parametrickým snadno volbou dvou proměnných jako parametrů (např. y = p, z = q) a dopočítáním třetí proměnné.
Poznámka 7.10. Vlastnosti koeficientů obecné rovnice roviny. − 1) Koeficienty a, b, c určují souřadnice normálového vektoru → n = (a, b, c). Pozor: narozdíl od přímky, normálový vektor k rovině nemůže jednoznačně určit směrový vektor roviny, neboť rovina má směrové vektory dva! 2) Pokud a = 0, je rovina rovnoběžná se souřadnou osou x. 3) Pokud b = 0, je rovina rovnoběžná s osou y. 3) Pokud c = 0, je rovina rovnoběžná s osou z. 4) Pokud d = 0, rovina prochází počátkem souřadné soustavy. 5) Pokud jsou dva koeficienty z trojice a, b, c rovny nule, je daná rovina rovnoběžná se souřadnou rovinou určenou osami s nulovými koeficienty, tedy například je-li a = b = 0, je daná rovina rovnoběžná s rovinou xy.
Definice 7.11. Odchylkou dvou různoběžných rovin rozumíme úhel, který je dán a) jako ostrý úhel, který svírají normálové vektory těchto rovin, b) jako rozdíl přímého úhlu (π) a tupého úhlu, který svírají normálové vektory těchto rovin.
− → Věta 7.12. Odchylka dvou rovin. Jsou-li − n→ σ , nρ normálové vektory rovin σ, ρ, potom pro odchylku ϕ těchto dvou rovin platí − → |− n→ σ · nρ | cos ϕ = − → →| , |nσ | · | − n ρ kde · v čitateli je skalární součin vektorů.
Poznámka 7.13. Vzájemná poloha dvou rovin v prostoru je analogická vzájemným polohám přímek v rovině. ÚM FSI VUT v Brně
30
7. Analytická geometrie
Studijní text
C. Přímka v prostoru
Definice 7.14. Přímka v prostoru je množina bodů o souřadnicích [x, y, z] daná jedním z následujících způsobů: 1) p = {[x, y, z] ∈ R3 | x = a1 + s1 t, y = a2 + s2 t, z = a3 + s3 t, t ∈ R}, − kde A = [a1 , a2 , a3 ] je bod, který leží na zadané přímce a → s = (s1 , s2 , s3 ) je její směrový vektor. 2)
y − a2 z − a3 x − a1 = = }, s1 s2 s3 − kde A = [a1 , a2 , a3 ] je bod, který leží na zadané přímce a → s = (s1 , s2 , s3 ) je její směrový vektor. p = {[x, y, z] ∈ R3 |
V prvním případě se jedná o parametrické rovnice přímky v prostoru, druhý případ se nazývá kanonický tvar rovnice přímky. Poznámka 7.15. Přímku v prostoru lze zadat i jako průsečnici dvou různoběžných rovin p : a1 x + b1 y + c1 z + d1 = 0 a q : a2 x + b2 y + c2 z + d2 = 0, tj, jako řešení systému dvou obecných rovnic rovin o třech neznámých: p = {[x, y, z] ∈ R3 | a1 x + b1 y + c1 z + d1 = 0, a2 x + b2 y + c2 z + d2 = 0, }. Tento tvar se někdy nazývá obecná rovnice přímky v prostoru.
Poznámka 7.16. Z kanonických rovnic dostaneme parametrické rovnice snadno tak, že položíme každý z výrazů roven parametru a vypočítáme proměnnou, opačně z každé parametrické rovnice spočítáme parametr, vzniklé výrazy se pak musí rovnat.
Poznámka 7.17. Odchylka dvou přímek v prostoru je definována a spočítá se stejně jako odchylka přímek v rovině Narozdíl od rovinné situace, v prostoru máme ještě jednu možnou vzájemnou polohu dvou přímek. Definice 7.18. Dvě přímky v prostoru jsou • rovnoběžné splývající, jestliže mají lineárně závislé směrové vektory a nekonečně mnoho společných bodů, • rovnoběžné, jestliže mají lineárně závislé směrové vektory a žádný společný bod, • různoběžné, jestliže mají lineárně nezávislé směrové vektory a právě jeden společný bod. Je-li navíc skalární součin směrových vektorů roven nule, jsou přímky jimi určené na sebe kolmé. • mimoběžné, jestliže mají lineárně nezávislé směrové vektory a žádný společný bod.
D. Kuželosečky 1. Parabola Definice 7.19. Parabolou nazýváme množinu takových bodů [x, y] v rovině, které jsou stejně vzdáleny od pevného bodu F (ohniska) a pevné přímky d (řídící přímka). ÚM FSI VUT v Brně
31
7. Analytická geometrie
Studijní text
y
D
n
V M
0
|
d
· · · řídící přímka paraboly
= [m, n] · · · vrchol paraboly p |V F | = |V D| = , p je parametr paraboly 2 M · · · libovolný bod na parabole
×
x
m
d
· · · ohnisko paraboly
V
F b
F
Definice 7.20. Je-li parabola zadána rovnicí y 2 + Ax + By + C = 0, , A, B, C ∈ R, A 6= 0, je-li osa paraboly rovnoběžná s osou x nebo x2 + Ax + By + C = 0, , A, B, C ∈ R, B 6= 0, je-li osa paraboly rovnoběžná s osou y, pak tuto rovnici nazveme obecnou rovnicí paraboly. Definice 7.21. Je-li dána parabola s vrcholem V = [m, n], pak její vrcholová rovnice je dána: (y − n)2 = ±2p(x − m), je-li osa paraboly rovnoběžná s osou x; (x − m)2 = ±2p(y − n), je-li osa paraboly rovnoběžná s osou y. 2. Kružnice
y M× r ×
n
S
S
= [m, n] · · · střed kružnice
r
· · · poloměr kružnice
M
0
· · · libovolný bod na kružnici
x
m
Definice 7.22. Kružnicí nazýváme množinu takových bodů v rovině o souřadnicích [x, y], které jsou od pevného bodu (středu) stejně vzdáleny.
Definice 7.23. Je-li kružnice zadána rovnicí x2 + y 2 + Ax + By + C = 0, A, B, C ∈ R, pak se tato rovnice nazývá obecná rovnice kružnice.
1
Definice 7.24. Středová rovnice kružnice je tvaru (x − m)2 + (y − n)2 = r2 , kde S = [m, n] je střed kružnice a r je její poloměr.
ÚM FSI VUT v Brně
32
7. Analytická geometrie
Studijní text
Definice 7.25. Parametrické rovnice kružnice jsou: x
= m + r cos t,
y
= n + r sin t,
kde bod S = [m, n] je střed, r je poloměr, x, y jsou souřadnice libovolného bodu na kružnici a t ∈ R je parametr. Poznámka 7.26. Parametr t v parametrických rovnicích kružnice udává úhel, který svírá úsečka SM a kladný směr osy x, M je libovolný bod na kružnici. Pro jednoznačně danou kružnici je tedy 0 ≤ t ≤ 2π. 3. Elipsa
y M×
×
M′ E, F
A n E |
e
S
B
a F |
b 0
S a, b
· · · hlavní a vedlejší poloosa elipsy
M
· · · libovolný bod na elipse p = a2 − b2 · · · excentricita elipsy
x
m
· · · ohniska elipsy = [m, n] · · · střed elipsy
e
Definice 7.27. Elipsou nazýváme množinu takových bodů v rovině o souřadnicích [x, y], jejichž součet vzdáleností od dvou pevných bodů E, F (ohnisek) je roven konstantě 2a je-li a > b nebo 2b je-li b > a.
Definice 7.28. Je-li elipsa zadána rovnicí Ax2 + By 2 + Cx + Dy + E = 0, A, B, C, D, E ∈ R, A > 0, B > 0, A 6= B, pak se tato rovnice nazývá obecná rovnice elipsy.
Definice 7.29. Středová rovnice elipsy je tvaru (x − m)2 (y − n)2 + = 1, a2 b2 kde S = [m, n] je střed elipsy a a, b jsou délky jejích poloos.
Definice 7.30. Parametrické rovnice elipsy jsou: x
= m + a cos t,
y
= n + b sin t,
kde bod S = [m, n] je střed, a, b jsou délky poloos, x, y jsou souřadnice libovolného bodu na elipse a t ∈ R je parametr.
ÚM FSI VUT v Brně
33
7. Analytická geometrie
Studijní text
4. Hyperbola
y
E n |
S |
A
M× 0
m
e a
b B |
E, F |
F
x
S
· · · ohniska hyperboly = [m, n] · · · střed hyperboly
a, b
· · · hlavní a vedlejší poloosa hyperboly
M
· · · libovolný bod na hyperbole p = a2 + b2 · · · excentricita hyperboly
e
Definice 7.31. Hyperbolou nazýváme množinu takových bodů v rovině o souřadnicích [x, y], jejichž rozdíl vzdáleností od dvou pevných bodů E, F (ohnisek) je v absolutní hodnotě roven konstantě 2a.
Definice 7.32. Je-li hyperbola zadána rovnicí Ax2 − By 2 + Cx + Dy + E = 0, A, B, C, D, E ∈ R, A > 0, B > 0, je-li hlavní osa rovnoběžná s osou x, −Ax2 + By 2 + Cx + Dy + E = 0, A, B, C, D, E ∈ R, A > 0, B > 0, je-li hlavní osa rovnoběžná s osou y, pak se tato rovnice nazývá obecná rovnice hyperboly.
Definice 7.33. Středová rovnice hyperboly je tvaru (x − m)2 (y − n)2 − = 1, je-li hlavní osa rovnoběžná s osou x, a2 b2 (y − n)2 (x − m)2 + = 1, je-li hlavní osa rovnoběžná s osou y, 2 a b2 kde S = [m, n] je střed elipsy a a, b jsou délky jejích poloos. −
1
ÚM FSI VUT v Brně
34
8. Pojem funkce
Studijní text
8. Pojem funkce Funkce (zobrazení) byla již definována v tématu Relace, zobrazení, operace a algebraické struktury. Budeme se ale zabývat pouze funkcemi f : A → B, kde A = B = R. Takovým funkcím říkáme reálné funkce (jedné) reálné proměnné a jsou ústředním pojmem matematické analýzy čili kalkulu. Pojem definičního oboru a oboru hodnot byl už také zaveden; připomeňme označení Domf a Imf . (Je mj. zřejmé, že Domf = ∅ právě tehdy, když Imf = ∅; v takovém případě říkáme, že f je prázdná funkce.) Obrazu f (x) říkáme obvykle funkční hodnota v x. Stejně tak už máme definovány a do kalkulu přenášíme pojmy injekce, surjekce, bijekce a inverzní funkce (zobrazení). Tedy zopakujme: je-li funkce f injekcí, máme definovánu inverzní funkci f −1 . Vidíme pak, že Dom(f ) = Im(f −1 ),
Dom(f −1 ) = Im(f ).
Poznámka 8.1. Funkci zadáme tak, že stanovíme definiční obor a zadáme funkční předpis (v praxi se totiž zabýváme právě funkcemi zadanými nějakým (relativně) jednoduchým předpisem; není ale od věci si uvědomit, že „drtivá většinaÿ funkcí by se jednoduchým předpisem popsat nedala). Funkčním předpisem se rozumí obvykle buď jeden nebo více explicitních vzorců nebo výčet (tabulka), případně i kombinace obojího. Není-li stanoven definiční obor, rozumí se jím všechny body z R, pro něž mají explicitní vzorce smysl. Pokud definiční obor funkce f není prázdná množina, můžeme získat novou funkci tak, že funkční předpis ponecháme, avšak za definiční obor vezmeme nějakou vlastní podmnožinu U množiny Domf . Vzniklou funkci nazýváme restrikce funkce f a značíme f |U . Naopak, pokud je funkce f restrikcí nějaké funkce g (tzn. definiční obor funkce f není R), nazýváme g extenze funkce f . Z dané funkce f získáme tedy g vhodným dodefinováním (tím bývá i rozšíření funkčního předpisu), které obvykle má nějaké námi stanovené vlastnosti. Poznámka 8.2. Vezměme nyní funkce f, g : R → R. Předpis h(x) = g(f (x)) nyní definuje novou funkci h : R → R. Je-li Imf ∩ Domg = ∅, je h prázdná funkce. Definice 8.3. Funkci f : R → R nazveme sudá, pokud splňuje x ∈ Domf ⇐⇒ −x ∈ Domf
a platí
f (−x) = f (x).
Nazveme ji lichá, pokud splňuje x ∈ Domf ⇐⇒ −x ∈ Domf
a platí
f (−x) = −f (x).
Definice 8.4. Funkci f : R → R nazveme periodická, jestliže (i) existuje nenulové reálné číslo p takové, že x ∈ Domf ⇐⇒ x + p ∈ Domf
a platí
f (x + p) = f (x)
(ii) mezi všemi kladnými čísly p, které splňují (i), existuje nejmenší. Zmíněné nejmenší kladné p pak nazýváme perioda funkce f .
ÚM FSI VUT v Brně
35
8. Pojem funkce
Studijní text
Definice 8.5. Funkce f se nazývá zdola omezená na množině U ⊂ Domf , jestliže existuje číslo a ∈ R takové, že pro všechna x ∈ U je f (x) ≥ a. Funkce f se nazývá shora omezená na množině U ⊂ Domf , jestliže existuje číslo a ∈ R takové, že pro všechna x ∈ U je f (x) ≤ a. Funkce f se nazývá omezená na množině U ⊂ Domf , je-li na U současně zdola omezená a shora omezená.
Definice 8.6. Funkce f se nazývá rostoucí na množině U ⊂ Domf , jestliže pro každé dva prvky x1 , x2 platí x1 < x2 ⇒ f (x1 ) < f (x2 ). Funkce f se nazývá klesající na množině U ⊂ Domf , jestliže pro každé dva prvky x1 , x2 platí x1 < x2 ⇒ f (x1 ) > f (x2 ). Funkce f se nazývá nerostoucí na množině U ⊂ Domf , jestliže pro každé dva prvky x1 , x2 platí x1 < x2 ⇒ f (x1 ) ≥ f (x2 ). Funkce f se nazývá neklesající na množině U ⊂ Domf , jestliže pro každé dva prvky x1 , x2 platí x1 < x2 ⇒ f (x1 ) ≤ f (x2 ). Funkce f se nazývá konstantní na množině U ⊂ Domf , jestliže pro každé dva prvky x1 , x2 platí x1 < x2 ⇒ f (x1 ) = f (x2 ). Má-li f na množině U libovolnou z uvedených vlastností, říkáme, že je na U monotónní. Je-li f na množině U rostoucí nebo klesající, říkáme, že je na U ryze monotónní. Uveďme nyní dva příklady funkcí, které nejsou až tak běžné. Příklad 8.7. Dirichletova funkce χ je definována ( 1 pro x racionální χ(x) = 0 pro x iracionální Snadno ověříme, že Domχ = R, Imχ = {0, 1}, funkce je omezená na R, sudá a není periodická.
Příklad 8.8. Riemannova funkce ρ je definována ( 1 pro x racionální vyjádřené ve tvaru pq , kde p, q jsou nesoudělná, q > 0 ρ(x) = q 0 pro x iracionální.
ÚM FSI VUT v Brně
36
9. Základní elementární funkce
Studijní text
9. Základní elementární funkce Za základní elementární funkce považujeme funkce: a) exponenciální a logaritmické; b) obecné mocninné; c) goniometrické a cyklometrické; d) hyperbolické a hyperbolometrické.
A. Exponenciální a logaritmické funkce Definice 9.1. Exponenciální funkce je funkce f (x) = ax , a ∈ R, a > 0, x ∈ R. Podívejme se, jak se jednotlivé fukce liší v závislosti na exponentu x: a) x = n, kde n ∈ N: an = |a · a ·{z. . . · a} . n−krát
b) x = 0: a0 = 1. c) x = −n, kde n ∈ Z: a−n = a1n . √ p d) x = pq , kde pq ∈ Q: a q = q xp . √
e) x ∈ R \ Q: Zde je problém. Jak definovat například aπ , a−
2
, . . .?
Pro libovolné x ∈ R existuje posloupnost {xn } racionálních čísel taková, že xn → x. Pak existuje lim axn = α, α > 0, která nezávisí na volbě posloupnosti {xn }. Potom definujeme ax = α.
n→∞
f) Jen pro úplnost doplňme přehled o případ, kdy a = 1. Potom ax = 1 pro ∀x ∈ R.
y 4
3
f(x) = ax ;a > 1
2
1 f(x) = ax ;0 < a < 1 2
0
1
1
2
x
Obr. 9.1: Exponenciální funkce f (x) = ax
ÚM FSI VUT v Brně
1
37
9. Základní elementární funkce
Studijní text
Věta 9.2. (Vlastnosti exponenciální funkce) Nechť a ∈ R, a > 0, a 6= 1. Potom má exponenciální funkce f (x) = ax tyto vlastnosti: 1) Pro x, y ∈ R platí: ax · ay = ax+y , ax ay = x y
ax−y ,
(a ) = axy . 2) D(f ) = R, H(f ) = (0, ∞) (viz Obrázek 9.1). 3) f je rostoucí pro a > 1, klesající pro 0 < a < 1 (viz Obrázek 9.1).
Poznámka 9.3. Speciálním případem je přirozená exponenciální funkce f (x) = ex . Užívá se i značení f (x) =exp(x). Definice 9.4. Nechť a ∈ R, a > 0, a 6= 1. Inverzní funkce k f (x) = ax se nazývá logaritmická funkce o základu a. Značí se f (x) = loga x. Poznámka 9.5. Následující rovnosti jsou tedy ekvivalentní: y = ax ⇔ x = loga y.
y 2
1 f(x) = loga x;a > 1
0
1
x f(x) = loga x;0 < a < 1
1
2
Obr. 9.2: Logaritmická funkce f (x) = loga x
Věta 9.6. (Vlastnosti logaritmické funkce) Nechť a ∈ R, a > 0, a 6= 1. Potom má logaritmická funkce f (x) = loga x tyto vlastnosti: 1) loga (xy) = loga x + loga y, loga
x y = y
loga x − loga y,
loga x = y loga x, logb x =
1
loga x loga b .
b) D(f ) = (0, ∞), H(f ) = R (viz Obrázek 9.2). c) f je rostoucí pro a > 1, klesající pro 0 < a < 1 (viz Obrázek 9.2).
ÚM FSI VUT v Brně
38
9. Základní elementární funkce
Studijní text
Poznámka 9.7. Speciální případy: 1. a = e, značíme loge x = ln x . . . přirozená logaritmická funkce 2. a = 10, značíme log10 x = log x . . . dekadická logaritmická funkce Věta 9.8. Pro libovolné a ∈ R, a > 0, x ∈ R platí ax = exln a . Důkaz. exln a = eln a
x
= ax .
B. Obecné mocninné funkce Definice 9.9. Nechť a ∈ R. Funkce f (x) = xa definovaná vztahem xa = ealn x se nazývá obecná mocninná funkce. Podle toho, jak je zvolena hodnota a, se liší definiční obor této funkce a lze jej někdy rozšířit i mimo kladná čísla. Na Obrázku 9.3 jsou uvedeny grafy některých mocninných funkcí. y
3
a> 1
a= 1
2 0 < a< 1 a= 0
1
a< 0 0
1
2
3
x
Obr. 9.3: Obecná mocninná funkce f (x) = xa
Věta 9.10. (Vlastnosti obecných mocninných funkcí) Nechť a ∈ R. Potom má obecná mocninná funkce f (x) = xa tyto vlastnosti: 1) (xy)a = xa · y a , a a x = xya , y
1
b) D(f ) = H(f ) = (0, ∞) (viz Obrázek 9.3). c) f je rostoucí pro a > 0, klesající pro a < 0 (viz Obrázek 9.3). d) V některých speciálních případech má funkce definiční obor širší než (0, ∞). 1
Např. f (x) = x 3 má D(f ) = R.
ÚM FSI VUT v Brně
39
9. Základní elementární funkce
Studijní text
C. Goniometrické funkce a cyklometrické funkce Definice 9.11. Goniometrické funkce úhlu x v intervalu h0, 2πi definujeme pomocí jednotkové kružnice (viz Obrázek 9.4) takto: Značí-li B bod na jednotkové kružnici, který obdržíme tak, že na tuto kružnici naneseme od bodu A[1, 0] oblouk délky |x| v kladném směru (tj. proti směru oběhu hodinových ručiček) pro x ≥ 0, resp. v záporném směru (tj. po směru oběhu hodinových ručiček) pro x ≤ 0, tak první souřadnici bodu B prohlásíme za cos x a druhou souřadnici za sin x. Tedy B[cos x, sin x].
Obr. 9.4: Jednotková kružnice Z Obrázku 9.4 lze vyčíst i hodnoty dalších goniometrických funkcí úhlu x, tj. tg x a cotg x, které je také možno vyjádřit vztahy: sin x cos x tg x = , cotg x = . cos x sin x
1 0
y
y
1
1
1
2
3
4
5
6
1
7
x
1 0
1
2
3
4
5
6
7
x
1
Obr. 9.5: f (x) = sin x
Obr. 9.6: f (x) = cos x
Poznámka 9.12. Úhel x může být zadán ve stupňové nebo v obloukové míře. Připomeňme si vzájemnou π vazbu: 180o = π, 1o = 180 , ... kružnici Tedy hovoříme-li o oblouku délky |x|, například pro x = −30o = − π6 , nanášíme na jednotkovou h √3 1 i π . π π od bodu A[1, 0] délku 6 = 0,523 v záporném směru a získáme tak bod B cos (− 6 ), sin(− 6 ) = 2 , − 2 .
1 ÚM FSI VUT v Brně
1 40
9. Základní elementární funkce
Studijní text
y 5
y
4 3
5
4
3
2
2
2
1
1
10
1 1
2
3
4
5
x
3
2
10
1 1
2
2
3
4
5
6
x
2
3 4 5
Obr. 9.7: f (x) = tg x
Obr. 9.8: f (x) = cotg x
Věta 9.13. (Vlastnosti goniometrických funkcí) 1) sin2 x + cos2 x = 1,
2
připomeňme, že platí: sin2 x = (sin x) ,
tg x · cotg x = 1, sin 2x =1 2 sin x cos x,
1
cos 2x = cos2 x − sin2 x.
b) D(sin x) = D(cos x) = R, H(sin x) = H(cos x) = h−1, 1i (viz Obrázky 9.5 a 9.6). c) D(tg x) = R − π2 + kπ, k ∈ Z , D(cotg x) = R − {kπ, k ∈ Z}, H(tg x) = H(cotg x) = R (viz Obrázky 9.7 a 9.8).
Definice 9.14. Cyklometrické funkce jsou funkce inverzní k funkcím goniometrickým. Ve všech případech musíme zúžit definiční obor původní goniometrické funkce na interval, ve kterém je prostá: sin x je prostá na h− π2 , π2 i, inverzní funkci značíme arcsin x, cos x je prostá na h0, πi, inverzní funkci značíme arccos x, tg x je prostá na − π2 , π2 , inverzní funkci značíme arctg x, cotg x je prostá na (0, π), inverzní funkci značíme arccotg x.
Poznámka 9.15. Pro x ∈ h− π2 , π2 i jsou rovnosti y = arcsin x a x = sin y ekvivalentní. Pro další goniometrické a cyklometrické funkce platí analogické vztahy. Věta 9.16. (Vlastnosti cyklometrických funkcí) a) Pro x ∈ h−1, 1i platí arcsin x + arccos x = pro x ∈ R platí arctg x + arccotg x =
π 2,
π 2.
b) D(arcsin x) = D(arccos x) = h−1, 1i ,
π H(sin x) = −π 2 , 2 , H(arccos x) = h0, πi (viz Obrázky 9.9 a 9.10), D(arctg x) = D(arccotg x) = R, H(arctg x) = − π2 , π2 , H(arccotg x) = (0, π) (viz Obrázky 9.11 a 9.12).
ÚM FSI VUT v Brně
41
9. Základní elementární funkce
2
y
y
2
3
1
2
0
1
Studijní text
1
1
x
2
1 1
0
1
2
Obr. 9.10: f (x) = arccos x
y 4
y 4
3
3
2
2
1
1 4
3
1 0
2
x
3
1
Obr. 9.9: f (x) = arcsin x
1
2
1 1 1
2
3
4
x
4
3
1 0
2
1 1
2
2
3
3
4
4
2
3
4
x
Obr. 9.11: f (x) = arctg x
Obr. 9.12: f (x) = arccotg x
1
1
ÚM FSI VUT v Brně
42
10. Polynomy a racionální lomenné funkce
Studijní text
10. Polynomy a racionálně lomenné funkce A. Polynomy
Definice 10.1. Reálný polynom stupně n (neboli mnohočlen) je funkce tvaru p(x) = an xn + an−1 xn−1 + · · · + a0 , kde a1 , . . . , an ∈ R, an 6= 0, která každému komplexnímu číslu x přiřazuje komplexní číslo p(x). a0 , . . . , an se nazývají koeficienty. a0 je absolutní člen. x je proměnná. n je stupeň polynomu. Polynom, který má za koeficienty a0 , . . . , an komplexní čísla, se nazývá komplexní polynom. Připouštíme-li hodnoty za proměnnou x z reálného oboru (tj. x ∈ R), mluvíme o reálném (případně komplexním) polynomu v reálném oboru. Připouštíme-li hodnoty za proměnnou x z komplexního oboru (tj. x ∈ C), mluvíme o reálném (případně komplexním) polynomu v komplexním oboru. Definice 10.2. Každé číslo α (reálné i komplexní, podle oboru v jakém pracujeme) takové, že splňuje p(α) = 0 se nazývá kořen polynomu p(x).
Poznámka 10.3. Každý kořen je tedy řešením rovnice an xn + an−1 xn−1 + · · · + a0 = 0 , které říkáme algebraická rovnice n-tého stupně.
Příklad 10.4. Výraz p(x) = x2 + 3x − 5 je reálný polynom 2. stupně. Rovnice x2 + 3x − 5 = 0 je algebraická rovnice 2. stupně (kvadratická rovnice).
Poznámka 10.5. Je tedy jasné, že graf funkce p(x) protíná osu x v bodech, které jsou reálnými kořeny polynomu p(x). Toho se dá s výhodou využít například při řešení kvadratických nerovnic grafickou cestou.
Příklad 10.6. Určete kořeny polynomu p(x) v komplexním oboru: a) p(x) = x2 + x − 2; b) p(x) = x4 − 1; c) p(x) = x3 + 1. Řešení. a) Polynom si zapíšeme ve tvaru algebraické rovnice, tj. x2 + x − 2 = 0, což je „obyčejnáÿ kvadratická rovnice, kterou vyřešíme. Nalezneme dva reálné (což znamená, že jsou zároveň i komplexní) kořeny α1 = 1 a α2 = −2. b) Řešíme algebraickou rovnici x4 − 1 = 0. Tu upravíme na tvar (x2 + 1)(x2 − 1) = 0. Odtud již snadno získáme kořeny α1 = 1, α2 = −1, α3 = ı, α4 = −ı. √ √ c) p(x) = x3 + 1 = (x + 1)(x2 − x + 1) = (x + 1) x − 21 − ı 23 x − 21 + ı 23 .
ÚM FSI VUT v Brně
43
10. Polynomy a racionální lomenné funkce
Studijní text
Otázkou tedy je, zda existuje nějaký univerzální algoritmus na hledání kořenů polynomu? Již v 16. století byly známy vzorce pro polynom stupně 1, 2, 3 a 4. Dlouhou dobu se potom matematikové snažili nalézt podobné vzorce pro kořeny polynomů stupně 5. Teprve v polovině 19. století bylo dokázáno, že takové vzorce pro polynomy většího nebo rovného pěti neexistují. Při odhadování racionálních a celočíselných kořenů u polynomů s celočíselnými koeficienty a nenulovým absolutním členem nám výrazně pomůže následující věta. Upozorněme však na podstatný detail. Tvrzení věty nám dává pouze nutnou, nikoli však postačující podmínku pro to, aby číslo rs bylo kořenem polynomu. Věta 10.7. Nechť číslo rs , kde r ∈ Z a s ∈ N je kořenem polynomu f (x) = an xn + · · · + a1 x + a0 , kde a0 , . . . , an ∈ Z a a0 6= 0. Pak platí r|a0 ∧ s|an .
Poznámka 10.8. Pro ověřování, zda je číslo kořenem polynomu se s výhodou používá Hornerovo schema. Pomocí něj se také snadno zjišťuje násobnost kořene.
Příklad 10.9. Nalezněte všechny racionální a celočíslené kořeny polynomu g(x) = 4x3 − 8x2 − 11x − 3. Řešení. Podle Věty 10.7 si vytipujeme čísla r a s takto: r| − 3 =⇒ r = 1, −1, 3, −3; s |4 =⇒ s = 1, 2, 4. Dále si vypíšeme všechny možné hodnoty r : s
1, −1,
r s.
1 1 1 1 3 3 3 3 , − , , − , 3, −3, , − , , − . 2 2 4 4 2 2 4 4
Ověření, zda se jedná o kořeny polynomu g(x) provedeme Hornerovým schematem, podle něhož zjistíme, že − 21 je dvojnásobným kořenem a 3 je kořenem jednoduchým. Věta 10.10. Nechť rs , kde r ∈ Z a s ∈ N je kořenem polynomu f (x) = an xn + · · · + a1 x + a0 , kde a0 , . . . , an ∈ Z a a0 6= 0. Potom pro libovolné celé číslo m platí: (r − ms)|f (m). Speciálně tedy: (r − s)|f (1), resp. (r + s)|f (−1).
Příklad 10.11. Rozhodněte, které vytipované kořeny polynomu g(x) = 4x3 − 8x2 − 11x − 3 z předchozího příkladu nemá smysl vyšetřovat Hornerovým schématem. Řešení. Určíme funkční hodotu g(1) = 4 − 8 − 11 − 3 = −18 a g(−1) = −4 − 8 + 11 − 3 = −4. Podíváme se na vytipované hodnoty rs : r 1 −1 1 −1 1 −1 3 −3 3 −3 3 −3 s : 1, 1 , 2, 2 , 4, 4 , 1, 1 , 2, 2 , 4 , 4 r+s: 2 0 3 1 5 3 4 -2 5 -1 7 1 g(−1) = −4 r−s 0 -2 -1 -3 -3 -5 2 -4 1 -5 -1 -7 g(1) = −18 Z této tabulky je zřejmé, že Hornerovým schématem není nutno vyšetřovat tyto hodnoty r −1 1 1 −1 3 3 1 −3 −3 −3 s: 1 , 2, 4, 4 , 2,4, 1, 1 , 2 , 4 . Je tedy vidět, že počet potenciálních kořenů se nám výrazně zredukoval a k ověření Hornerovým schéma3 tem zůstavají pouze tito adepti: −1 2 , 1. Věta 10.12. (Bézoutova věta) Nechť p(x) = an xn + an−1 xn−1 + · · · + a0 je libovolný polynom stupně n ≥ 1. Potom číslo α je kořenem p(x) ⇐⇒ p(x) = (x − α)q(x), kde q(x) je polynom stupně n − 1.
ÚM FSI VUT v Brně
44
10. Polynomy a racionální lomenné funkce
Studijní text
Následující věta měla pro celou algebru opravdu základní význam v dobách, kdy se algebra zabývala studiem číselných struktur. Platnost této věty tušili již italští matematikové v 16. století, ale první její správný a úplný důkaz nalezl teprve K. F. Gauss v roce 1799. Věta 10.13. (Základní věta algebry) Každý nekonstantní komplexní polynom má v komplexním oboru alespoň jeden kořen.
Věta 10.14. (D’Alembertova věta o rozkladu na kořenové činitele v oboru komplexních čísel) Pro každý polynom p(x) = an xn + an−1 xn−1 + · · · + a0 stupně n ≥ 1 existuje právě n komplexních čísel α1 , α2 , . . . , αn (která od sebe nemusejí být různá) takových, že p(x) = an (x − α1 )(x − α2 ) · · · (x − αn ).
(10.1)
Uvědomme si jen, že všechna čísla α1 , . . . , αn jsou kořeny polynomu p(x). Poznámka 10.15. Pokud v rozkladu (10.1) vystupuje stejný činitel (x − αi ) právě k-krát, řekneme, že αi je k-násobným kořenem polynomu p(x).
Příklad 10.16. Určete kořeny (i jejich násobnost) polynomů v komplexním oboru: a) p(x) = x2 − 2x + 1; b) p(x) = x4 + x3 ; c) p(x) = x2 + 1. Řešení. a) p(x) = x2 − 2x + 1 = (x − 1)2 , tedy 1 je dvojnásobným kořenem. b) p(x) = x4 + x3 = x3 (x − 1), tedy 0 je trojnásobným kořenem a 1 jednoduchým kořenem. c) p(x) = x2 + 1 = (x + ı)(x − ı), tedy jednoduchými kořeny jsou čísla −ı a ı. Věta 10.17. Má-li reálný polynom p(x) komplexní kořen α = a + bı, pak má i komplexně sdružený kořen α = a − bı. Násobnosti obou kořenů jsou stejné.
Příklad 10.18. Určete rozklad reálného polynomu p(x) = x2 + x + 1 v komplexním oboru. Řešení. Přepíšeme polynom p(x) = x2 + x + 1 jako algebraickou rovnici x2 +√x + 1 = 0. Ta má diskriminant √ −1+ı 3 3 D = −3, a proto jsou jejím řešením dva kořeny a x2 = −1−ı . Rozklad polynomu vypadá 2 2 x1 = následovně: p(x) = x2 + x + 1 = x −
√ −1+ı 3 2
x−
√ −1−ı 3 2
.
Příklad 10.19. Určete polynom nejnižšího stupně tak, aby α1 = 0 byl jednoduchý kořen, α2 = −1 byl dvojnásobný kořen, α3 = ı a α4 = −ı. 2 Řešení. p(x) = x − 0 x − (−1) x − ı x − (−ı) = x(x + 1)2 (x − ı)(x + ı) = x5 + 2x4 + 2x3 + 2x2 + x. Poznámka 10.20. Pokud máme určit rozklad reálného polynomu pouze reálném oboru, tak kvadratické trojčleny x2 + px + q se záporným diskriminantem nerozkládáme.
ÚM FSI VUT v Brně
45
10. Polynomy a racionální lomenné funkce
Studijní text
Věta 10.21. (O rozkladu reálného polynomu v reálném oboru) Nechť p(x) = an xn + an−1 xn−1 + + · · · + a0 je reálný polynom stupně n ≥ 1. Nechť α1 , . . . , αr jsou všechny jeho reálné kořeny, každý s násobností ki , i = 1, . . . , r. Pak rozkladem reálného polynomu v reálném oboru rozumíme vztah p(x) = an (x − α1 )k1 · · · (x − αr )kr (x2 + p1 x + q1 )l1 · · · (x2 + ps x + qs )ls ,
(10.2)
kde x2 + pj x + qj , j = 1, . . . , s jsou nerozložitelné kvadratické trojčleny se záporným diskriminantem, které odpovídají komplexním kořenům. Platí k1 + · · · + kr + 2l1 + · · · + 2ls = n.
Příklad 10.22. Rozložte polynomy v reálném oboru: a) a(x) = x4 − 1; b) b(x) = 16x4 − 9; c) c(x) = x2 + 2x + 5; d) d(x) = x3 + 1; e) e(x) = x4 + 1; f) f (x) = x5 + x4 + x3 − x2 − x − 1. Řešení. a) a(x) = x4 − 1 = (x2 + 1)(x2 − 1) = (x2 + 1)(x + 1)(x − 1). 9 b) b(x) = 16x4 − 9 = 16 x4 − 16 = 16 x2 + 34 x2 − 43 = 16 x2 + 43 x +
√
3 2
x−
√
3 2
.
c) c(x) = x2 + 2x + 5 nelze v reálném oboru rozložit, protože příslušná kvadratická rovnice má D < 0. d) d(x) = x3 + 1 = (x + 1)(x2 − x + 1). √ √ e) e(x) = x4 + 1 = x4 + 1 + 2x2 − 2x2 = (x2 + 1)2 − 2x2 = (x2 + 1 − x 2)(x2 + 1 + x 2). f) f (x) = x5 + x4 + x3 − x2 − x − 1 = x2 (x3 − 1) + x(x3 − 1) + x3 − 1 = (x3 − 1)(x2 + x + 1) = = (x − 1)(x2 + x + 1)(x2 + x + 1) = (x − 1)(x2 + x + 1)2 .
B. Funkce reálná racionální lomená Definice 10.23. Nechť p(x) je reálný polynom stupně m a q(x) nenulový reálný polynom stupně n. Pak funkce p(x) r(x) = q(x) se nazývá reálná racionální lomená funkce. Je-li m < n, pak mluvíme o ryze racionální lomené funkci. Je-li m ≥ n, pak mluvíme o neryze racionální lomenéfunkci. Příklad 10.24. a) b)
x4 +x−2 x2 −x−1
x2 +1 x3 −2x−1
je ryze racionální lomená funkce (krátce: ryze lomená).
je neryze racionální lomená funkce (krátce: neryze lomená).
Poznámka 10.25. Každá neryze racionální lomená funkce se dá zapsat jako součet polynomu a ryze racionální lomené funkce ve tvaru s(x) p(x) = h(x) + . r(x) = q(x) t(x)
Příklad 10.26. Vyjádřete racionální funkce jako součet polynomu a ryze lomené racionální funkce: 2 +10x−1 a) r(x) = −4x x2 −3x+6 ; b) r(x) =
2x5 −x4 +3x2 −x+1 . x2 −2x+4
ÚM FSI VUT v Brně
46
10. Polynomy a racionální lomenné funkce
Studijní text
Řešení. Polynomy vydělíme tak, jak jsme zvyklí ze střední školy a výsledek dělení zapíšeme ve tvaru: a) r(x) = −4 + x223−2x −3x+6 ; 3 b) r(x) = 2x + 3x2 − 2x − 13 + x−19x+53 2 −2x+4 . Definice 10.27. Zlomky tvaru A (x − α)k
a
Mx + N , kde p2 − 4q < 0 + px + q)l
(x2
nazýváme parciální zlomky.
Věta 10.28. (Rozklad ryze racionální lomené funkce na parciální zlomky) Každou ryze racionální lomenou funkci r(x) = p(x) q(x) lze rozložit na součet parciálních zlomků. 1. Jmenovatel q(x) rozložíme v reálném oboru: q(x) = an (x − α1 )k1 · · · (x − αr )kr (x2 + p1 x + q1 )l1 · · · (x2 + ps x + qs )ls . 2. Pak každému faktoru (x − αi )ki , i = 1, . . . , r odpovídá skupina ki zlomků ve tvaru Aki A2 A1 + ··· + + 2 (x − αi ) (x − αi ) (x − αi )ki a faktoru (x2 + pj x + qj )lj , j = 1, . . . , s odpovídá skupina zlomků ve tvaru Ml x + Nlj M 1 x + N1 M 2 x + N2 + ··· + 2 j . + 2 2 + pj x + qj (x + pj x + qj ) (x + pj x + qj )lj
x2
3. Funkci r(x) zapíšeme pomocí součtu odpovídajících skupin zlomků, kterému se říká rozklad na parciální zlomky. Na příkladu si ukážeme, jakým způsobem vypočítáme příslušné konstanty Ak , Ml a Nl . Příklad 10.29. Rozložte na parciální zlomky funkci r(x) =
x2 −2 x4 −2x3 +2x2 .
Řešení. Funkce r(x) je ryze lomená racionální funkce. 1. Rozložíme jmenovatel v reálném oboru, tj. q(x) = x4 − 2x3 + 2x2 = x2 (x2 − 2x + 2), kde kvadratický výraz x2 − 2x + 2 má záporný diskriminant. 2. Rozklad na parciální zlomky má tedy tvar: x2 − 2 A1 A2 M 1 x + N1 = + 2 + 2 . x4 − 2x3 + 2x2 x x x − 2x + 2
(10.3)
3. Určíme konstanty A1 , A2 , M1 , N1 . Vynásobíme rovnici (10.3) společným jmenovatelem x2 (x2 − 2x + 2). Dostaneme x2 − 2 = A1 x(x2 − 2x + 2) + A2 (x2 − 2x + 2) + (M1 x + N1 )x2 . (10.4) Porovnáním koeficientů u příslušných mocnin proměnné x na levé a pravé straně rovnice (10.4) dostáváme tuto soustavu rovnic: A1 + M 1 = 0 −2A1 + A2 + N1 = 1 2A1 − 2A2 = 0 2A2 = −2, ze které je přímo vidět, že A1 = −1, A2 = −1, M1 = 1, N1 = 0. Tedy rozklad na parciální zlomky má tvar −1 −1 x x2 − 2 = + 2 + 2 . 4 3 2 x − 2x + 2x x x x − 2x + 2
Příklad 10.30. Rozložte na parciální zlomky funkci r(x) =
ÚM FSI VUT v Brně
x3 −4x2 +x−2 x4 −2x3 +2x2 −2x+1 .
47
10. Polynomy a racionální lomenné funkce Řešení. r(x) =
x x2 +1
−
2 (x−1)2 .
Příklad 10.31. Rozložte na parciální zlomky funkci r(x) = Řešení. r(x) =
x (x2 +1)2
ÚM FSI VUT v Brně
Studijní text
−
1 x2 +1
x4 −x3 +3x2 −x+1 . x5 +2x3 +x
+ x1 .
48
11. Limita a spojitost funkce
Studijní text
11. Limita a spojitost funkce A. Limita Podobně jako tomu bylo u posloupností, kde nás zajímalo „chováníÿ posloupnosti {an } pro n → ∞, zaměříme svou pozornost na chování funkcí v okolí bodů, které jsou z nějakého důvodu zajímavé. Mohou to být body, ve kterých funkce není definovaná, nebo se v nich funkce chová „zvláštněÿ a podobně. U posloupností bylo jasně dáno, že nás zajímá lim an , u limit funkcí to může být mnohem zajímavější. n→∞ Podívejme se na následující obrázky:
Obr. 11.1: Posloupnost
1 n
Obr. 11.2: Funkce y =
1 x
Než přejdeme k samotné definici limity funkce je třeba uvést následující pojmy. Definice 11.1. Okolí bodu x0 , kde δ > 0, je interval (x0 − δ, x0 + δ) = O(x0 ), viz Obr. 11.3. Ryzí okolí bodu x0 , je množina O(x0 ) − {x0 }, viz Obr. 11.4.
Obr. 11.3: Okolí bodu x0
Obr. 11.4: Ryzí okolí bodu x0
Definice 11.2. Pravé (resp. levé) okolí bodu x0 je interval hx0 , x0 + δ), resp. (x0 − δ, x0 i, viz Obr. 11.5 a 11.6. Pravé (resp. levé) ryzí okolí bodu x0 , je interval (x0 , x0 + δ), resp. (x0 − δ, x0 ), viz Obr. 11.7 a 11.8.
Obr. 11.5: Pravé okolí bodu x0
Obr. 11.6: Levé okolí bodu x0
Definice 11.3. Okolí bodu ∞ (resp. −∞), je každý interval (K, ∞) (resp. (−∞, L)), kde K, L ∈ R. Viz Obrázek 11.9.
ÚM FSI VUT v Brně
49
11. Limita a spojitost funkce
Studijní text
Obr. 11.7: Pravé ryzí okolí bodu x0
Obr. 11.8: Levé ryzí okolí bodu x0
Obr. 11.9: Okolí ∞ Podobně jako u posloupností lze očekávat, že limita funkce f (x) bude buď reálné číslo, nebo ±∞, nebo vůbec neexistuje. Abychom definici limity funkce mohli uvést co nejobecněji, rozšiřme reálná čísla o +∞ a −∞. Zavedeme označení R+ = R ∪ {−∞, +∞}. Definice 11.4. Řekneme, že funkce f (x) má v bodě x0 ∈ R+ limitu a ∈ R+ právě když platí ∀O(a) ∃O(x0 ) : ∀x ∈ O(x0 ) − {x0 } platí f (x) ∈ O(a). Tento matematický zápis čteme takto: Pro každé okolí bodu a existuje okolí bodu x0 takové, že pro všechna x z ryzího okolí bodu x0 platí, že funkční hodnota v bodě x leží v okolí bodu a. Označení: lim f (x) = a. x→x0
Poznámka 11.5. Je nesmírně důležité si uvědomit podstatný detail této definice. K tomu, aby měla funkce f (x) v bodě x0 limitu není nutné mít funkci v tomto bodě definovánu. Uvědomme si, že podstatné je, že „pouzeÿ funkční hodnoty z ryzího okolí bodu x0 musí padnout do okolí čísla a, které je limitou. Uveďme si názorný příklad, jak to tedy je s tím ryzím okolím. Příklad 11.6. Odhadněte limitu následujících funkcí v bodě x0 = 0: a) f (x) = x3 + 2; x3 + 2, pro x 6= 0, b) g(x) = 1, pro x = 0. Řešení. Namalujme si grafy těchto funkcí:
y
y
3
3
2
2
1
1
Obr. 11.10: f (x) = x3 + 2
Obr. 11.11: g(x) = x3 + 2 pro x 6= 0
x x Odpověď na1 otázku, 0 mnohé jistě překvapí, ale jde 0 jaká je 1tedy limita 0 2 2 těchto funkcí v bodě 2 1 1 2 jen o to, ujasnit si definici limity a pojem ryzí okolí bodu. ÚM FSI VUT v Brně
50
11. Limita a spojitost funkce
Studijní text
Tedy lim f (x) = 2 i lim g(x) = 2. x→0
x→0
Poznámka 11.7. Chceme-li nadefinovat pojem limita v bodě x0 zprava, resp. zleva, tak v definici stačí nahradit ryzí okolí O(x0 ) − {x0 } ryzím pravým okolím (x0 , x0 + δ), resp. levým okolím (x0 − δ, x0 ). Označení: lim f (x), resp lim− f (x). x→x+ 0
x→x0
Věta 11.8. Funkce f (x) má v bodě x0 ∈ R limitu a ∈ R+ právě když lim f (x) = lim− f (x) = a.
x→x+ 0
x→x0
Věta 11.9. Libovolná funkce má v libovolném bodě nejvýše jednu limitu.
Věta 11.10. 1. Nechť lim f (x) = 0 a g(x)je ohraničená na nějakém ryzím okolí bodu x0 . x→x0 Pak lim f (x) · g(x) = 0. x→x0
2. Nechť x0 ∈ R. Pak lim f (x) = a, kde a ∈ R ⇔ lim f (x) = lim− f (x) = a. x→x0
3. Nechť lim |f (x)| = ∞ ⇒ x→x0
x→x+ 0
lim 1 x→x0 f (x)
x→x0
= 0. 1 x→x0 |f (x)|
4. Nechť lim f (x) = 0 a zároveň f (x) 6= 0 pro x ∈ O(x0 ) − {x0 } ⇒ lim x→x0
= ∞.
Poznámka 11.11. Zapamatujte si tyto důležité limity: sin x = 1, x→0 x lim
ex − 1 = 1. x→0 x lim
B. Spojitost
Definice 11.12. Řekneme, že funkce f (x) je spojitá v bodě x0 ∈ R právě když lim f (x) = f (x0 )
x→x0
Příklad 11.13. Podívejme se, jak to vypadá se spojitostí funkcí z Příkladu 11.6. Už z obzázku je patrné, že funkce f (x) je v bodě x0 = 0 spojitá a funkce g(x) je v bodě 0 nespojitá (tj. funkční hodnota g(0) 6= lim g(x)). x→0
Věta 11.14. (1. Weierstrassova) Nechť f (x) je spojitá na ha, bi ⇒ f (x) je na ha, bi ohraničená.
Věta 11.15. (2. Weierstrassova) Nechť f (x) je spojitá na ha, bi ⇒ f (x) nabývá na ha, bi své největší a nejmenší hodnoty.
ÚM FSI VUT v Brně
51
11. Limita a spojitost funkce
Studijní text
Věta 11.16. (Bolzanova) Nechť f (x) je spojitá na ha, bi a f (a) · f (b) < 0 ⇒ ∃c ∈ (a, b) takové, že f (c) = 0.
Poznámka 11.17. Praktickou ukázkou užitečnosti Bolzanovy věty je odhadování řešení rovnice metodou půlení intervalů.
Příklad 11.18. Metodou půlení intervalů určete přibližné řešení rovnice x3 +5x2 −x+3 = 0 s přesností 0, 07. Řešení. Odhadneme interval, ve kterém by kořen polynomu f (x) = x3 + 5x2 − x + 3 měl ležet: f (−5) = 8 a f (−6) = −27. Tedy podle Bolzanovy věty interval (−6, −5) obsahuje kořen. Půlíme intervaly tak dlouho, až odhadneme, že kořen leží v intervalu, který má délku menší, než požadovaná přesnost. V tomto příkladu je výsledným intervalem (−5.25, −5.1875).
ÚM FSI VUT v Brně
52
12. Derivace funkce
Studijní text
12. Derivace funkce Dříve než přistoupíme k vlastní definici pojmu derivace, podívejme se na obrázek 12.1. Na křivce y = f (x) je pevně zvolený bod A[x0 , f (x0 )]. „Kousekÿ od něj si zvolme bod B[x, f (x)]. Sečna AB vyjádřená ve směr(x0 ) . Limitním přechodem (tj. bod B nicovém tvaru jako přímka y = ks x + q má směrnici ks = tg α = f (x)−f x−x0 volíme nekonečně blízko bodu A) se sečna změní v tečnu, pro niž je směrnice kt = lim
x→x0
f (x)−f (x0 ) . x−x0
Obr. 12.1: Grafické znázornění derivace Definice 12.1. Nechť f je funkce a x0 ∈ R. Existuje-li vlastní limita lim
x→x0
f (x) − f (x0 ) , x − x0
nazýváme tuto limitu derivací funkce v bodě x0 a značíme ji f 0 (x0 ). V ostatních případech, tj. limita je rovna ±∞, nebo neexistuje, řekneme, že funkce f derivaci v bodě x0 nemá. Z matematického hlediska pod pojmem derivace funkce v bodě tedy vidíme směrnici tečny ke grafu funkce f (x). Z fyzikálního hlediska jde o změnu sledované veličiny nejčastěji v čase. Proto se ve fyzice k označení derivace podle času t používá značení f˙(t). Poznámka 12.2. Směrnice přímky y = kx + q (tj. číslo k) je definována jako tangenta úhlu α, který tato přímka svírá s kladným směrem osy x. Hodnotu měřenou proti směru otáčení hodinových ručiček považujeme za kladnou, hodnotu měřenou po směru otáčení hodinových ručiček považujeme za zápornou. Tak například hodnoty 210◦ a −150◦ udávají směr stejné přímky. Podívejte se na příklady na Obrázku 12.2.
Obr. 12.2: Směrnice přímky
ÚM FSI VUT v Brně
53
12. Derivace funkce
Studijní text
Podobně, jako tomu bylo u limit, definujeme derivaci v bodě zprava a zleva. Označujeme je f 0 (x+ 0) a f (x− ). 0 0
Definice 12.3. Nechť f (x) je funkce a M ⊆ D(f ) množina bodů x0 , v nichž má f (x) derivaci. Pak funkce, která každému x0 přiřadí hodnotu derivace v bodě x0 se nazývá derivací funkce f (x) a značí se f 0 (x). Věta 12.4. Funkce f (x) má v bodě x0 ∈ D(f ) derivaci f 0 (x0 ) právě když má derivaci zprava i zleva a platí 0 − f 0 (x+ 0 ) = f (x0 ).
Věta 12.5. Má-li funkce f (x) v bodě x0 derivaci, pak je v x0 spojitá. Jasnou představu o důležitosti této věty si uděláme z obrázku 12.3.
Obr. 12.3: Existence derivace ve vztahu ke spojitosti
Věta 12.6. Základní vzorce pro derivování 0
c ∈ R;
1. (c) = 0, 0
2. (xn ) = n · xn−1 , 0
3. (ax ) = ax · ln a,
a ∈ R, x > 0; a > 0, x ∈ R;
0
4. (ex ) = ex ; 0
5. (ln x) = x1 , 0
x > 0; 1 x·ln a ,
6. (loga x) = 0
7. (sin x) = cos x,
x > 0, a > 0, a 6= 1; x ∈ R;
0
8. (cos x) = − sin x, x ∈ R; 0 sin x 0 9. (tg x) = cos = cos12 x , x 6= x 0
10. (cotg x) = − sin12 x , 0
11. (arcsin x) =
√ 1 , 1−x2
x ∈ (−1, 1);
0
0
1 1+x2 ,
0
x ∈ (−1, 1);
x ∈ R;
1 14. (arccotg x) = − 1+x 2,
ÚM FSI VUT v Brně
+ kπ;
x 6= 0 + kπ;
1 12. (arccos x) = − √1−x , 2
13. (arctg x) =
π 2
x ∈ R.
54
12. Derivace funkce
Studijní text
Málokdy se stane, že derivujeme přímo základní funkci. Většinou potřebujeme zderivovat součin nebo podíl dvou funkcí, nejčastěji však složenou funkci. Uveďme základní pravidla pro derivování. Věta 12.7. Základní pravidla pro derivování 0
1. (c · f (x)) = c · f 0 (x),
c ∈ R;
0
2. (f (x) ± g(x)) = f 0 (x) ± g 0 (x); 0
3. (f (x) · g(x)) = f 0 (x) · g(x) + f (x) · g 0 (x), (derivace součinu); 0 0 (x) (x)·g 0 (x) 4. fg(x) = f (x)·g(x)−f , (derivace podílu); (g(x))2 0
5. (f [ϕ(x)]) = f 0 [ϕ(x)] · ϕ0 (x), (derivace složené funkce); 0 0 6. f (x)g(x) = eg(x)·ln f (x) .
Poznámka 12.8. Platí: sin2 x = (sin x)2 ;
cos x2 = cos(x2 );
√
1
x = x2 ;
1 x
= x−1 .
Definice 12.9. Provedeme-li n-krát derivaci funkce f (x) (tedy pokaždé znovu zderivujeme získanou derivaci), dostaneme derivaci n-tého řádu. Označení: f (n) ; derivace nižších řádů značíme f 0 (x), f 00 (x), f 000 (x). Celou dobu máme na paměti, derivace v bodě se týká směrnice tečny ke grafu funkce v tomto bodě. Uveďme tedy jeden z možných způsobů vyjádření tečny a normály ke grafu funkce f (x). Poznámka 12.10. Rovnice tečny ke grafu funkce y = f (x) v bodě T [x0 , y0 ]: t : y − y0 = f 0 (x0 )(x − x0 ). 1 Rovnice normály ke grafu funkce y = f (x) v bodě T [x0 , y0 ]: n : y − y0 = − f 0 (x (x − x0 ). 0)
ÚM FSI VUT v Brně
55
13. L’Hospitalovo pravidlo
Studijní text
13. L’Hospitalovo pravidlo Markýz de l’Hospital (též l’Hôpital), celým jménem Guillaume Francois Antoine žil v letech 1661– 1704. Zabýval se matematickou analýzou a geometrií. V roce 1696 publikoval učebnici diferenciálního počtu „Analýza nekonečně malých veličin”. Ve zmíněné knize je poprvé uveřejněno tvrzení, které je v současné době známé jako l’Hospitalovo pravidlo pro výpočet limit. Je paradoxní, že autorem tohoto tvrzení je l’Hospitalův učitel Johann Bernoulli I. Věta 13.1. (l’Hospitalovo pravidlo) Nechť a ∈ R ∪ {−∞, ∞} a nechť jsou splněny tyto podmínky: Funkce f, g jsou diferencovatelné v nějakém ryzím okolí bodu a a buď Pak je
lim f (x) = lim g(x) = 0,
x→a
x→a
f (x) f 0 (x) = lim 0 , x→a g(x) x→a g (x) lim
nebo
lim |g(x)| = +∞.
x→a
existuje-li limita vpravo.
Analogická tvrzení platí pro limitu zprava v bodech a < +∞ a zleva v bodech a > −∞.
A. l’Hospitalovo pravidlo pro limitu funkce typu | 00 |. Základní metodický postup je následující. Funkce, jejíž limitu v daném bodě máme počítat, má tvar zlomku. Určíme nejprve limitu čitatele a limitu jmenovatele. Tyto limity často zjistíme pouhým dosazením. Je-li limita čitatele i jmenovatele rovna nule, lze aplikovat l’Hospitalovo pravidlo. Při výpočtu je pak mnohdy nuté provést aplikaci pravidla vícekrát po sobě. Pravidlo lze rovněž použít pro výpočet jednostranných limit. Postup nyní demonstrujme na příkladech. Příklad 13.2. Spočtěte následující limity: x a) lim 1−cos . x2 x→0
ex −e−x sin x . x lim x−sin . x3 x→0 2x e −2x−1 lim . 2 x→0 sin 3x
b) lim
x→0
c) d)
Řešení. a) lim
sin x = | 00 | = lim cos2 x = 12 . x→0 2x x→0 x x ex −(−1)e−x 0 +e−x 1+1 −e−x = | | = lim = lim e cos lim e sin x 0 cos x x = 1 = 2. x→0 x→0 x→0 x x x lim x−sin = | 00 | = lim 1−cos = | 00 | = lim sin = | 00 | = lim cos6 x = 16 . 2 x3 x→0 x→0 3x x→0 6x x→0 2x 2x 2(e2x −1) −2 4·e2x lim e sin−2x−1 = lim = | 00 | = lim 18·cos = | 00 | = lim 2·sin2e3x·cos 2 3x 3x·3 3·sin 6x 6x x→0 x→0 x→0 x→0 x→0
b) c) d)
1−cos x x2
= | 00 | = lim
=
4·1 18·1
= 29 .
B. l’Hospitalovo pravidlo pro limitu funkce typu | ∞ |. ∞ Postup při výpočtu je analogický jako v případě limit typu | 00 |. Funkce, jejíž limitu v daném bodě máme počítat, je ve tvaru zlomku. Určíme limitu absolutní hodnoty jmenovatele. Je-li tato limita rovna ∞, lze aplikovat l’Hospitalovo pravidlo. Při výpočtu je v řadě případů opět nuté provést aplikaci pravidla vícekrát po sobě. Zdůrazněme skutečnost, že limita čitatele ani jmenovatele nemusí sama o sobě existovat. Dále a připomeňme, že výraz ∞ = 0 pro libovolné reálné číslo a.
ÚM FSI VUT v Brně
56
13. L’Hospitalovo pravidlo
Studijní text
Příklad 13.3. Spočtěte následující limity: 2 a) lim 3xx . x→∞
ln sin x ln tg x . ln x lim cotg x. x→0+ cotg 2x . lim x→π/2 tg x
b) lim
x→0+
c) d)
Řešení. a) lim b) c) d)
∞ 2x ∞ 2 x2 2 x = | ∞ | = lim 3x ·ln 3 = | ∞ | = lim 3x ·ln 2 3 = ∞·ln 2 3 = 0. x→∞ x→∞ x→∞ 3 cos x cos x ∞ sin x sin x sin x lim ln = lim = lim cos2 x = 1. cos x ln tg x = | ∞ | = lim+ tg1 x · 12 x→0+ x→0 x→0+ sin x·cos2 x x→0+ cos x 1 − sin2 x ∞ − sin 2x ln x x = lim = 0. lim cotg x = | ∞ | = lim −1 = lim x 1 x→0+ x→0+ sin2 x x→0+ x→0+ −1 2 ·2 2x cos x cos2 x = |∞ | = lim sin212x = −2 lim sin lim cotg 2 2x = −2 lim 2 x sin2 x tg x ∞ 4 cos 2 x→π/2 x→π/2 x→π/2 x→π/2 cos
1 2 x→π/2 sin x
= − 21 lim
=
x
= − 12 .
C. Další typy limit. Nejprve zjistíme, jakého je limita typu. Typ určíme většinou snadno dosazením, nebo krátkým výpočtem. Potom volbou vhodné úpravy podle typu převedeme výpočet zadané limity na výpočet limity, při němž lze l’Hospitalovo pravidlo použít. Na l’ Hospitalovo pravidlo jsou převoditelné následující typy limit: 0 · ∞,
∞ − ∞,
00 ,
1∞ .
∞0 ,
Pro typ 0 · ∞ používáme nejčastěji jednu z úprav lim f (x)g(x) = lim
x→a
která výpočet převede na typ
0 0
nebo
∞ ∞.
x→a
f (x) 1 g(x)
= lim
x→a
g(x) 1 f (x)
,
Pro limitu typu ∞ − ∞ lze použít úpravy
lim f (x) − g(x) = lim
x→a
x→a
1 g(x)
−
1 f (x)
1 f (x)g(x)
.
V řadě případů lze u typu ∞−∞ postupovat jinou cestou. V případě, že funkce f (x) a g(x) mají tvar zlomků, stojí za pokus provést jejich rozdíl převedením na společného jmenovatele. V jiných případech lze realizovat vytknutí některé části a převést limitu rozdílu na limitu součinu funkcí. U limit typu 00 , ∞0 , 1∞ lze použít následující úpravy: lim g(x) · ln f (x) lim f (x)g(x) = lim eg(x) · ln f (x) = ex→a .
x→a
x→a
Příklad 13.4. Spočtěte následující limity: a) lim xln x = |0 · ∞|. x→0+
b) lim (π − 2arctg x) · ln x. x→∞ 1 c) lim x(x+1) − ln (x+1) . x2 x→0
d) lim ex − x. x→∞ √ e) lim x x. x→∞ tg x f) lim x1 . x→0+
g) lim 1 + x→∞
1 x
x 2
ÚM FSI VUT v Brně
.
57
13. L’Hospitalovo pravidlo
Studijní text
Řešení. a) lim xln x = |0 · ∞| = lim x→0+
ln x
x→0+
1 x
= |∞ ∞ | = lim
x→0+
1 x
− x12
= lim (−x) = 0. x→0+
−2 2 π − 2arctg x +1 = = | 00 | = lim x −1 b) lim (π − 2arctg x) · ln x = |0 · ∞| = lim 1 x→∞ x→∞ x→∞ ln x xln 2 x 1 ln 2 x+2xln x· 2 x ∞ x = lim ln 2 x+2ln x = lim 2(ln x · = lim 2 · xln = | | = lim 2 · 2 x→∞
= lim 2 · x→∞
c) lim
x→0
x +1 ∞ ln x lim 2 x = x→∞
1 x(x+1)
·
x→∞ 1 x = 0.
2x
x→∞
x
x→∞
1 x
+ x2 ) =
1 1 − 1 ln (x + 1) x(x + 1) x2 = − ln (x+1) = |∞ − ∞| = lim 2 x 1 x→0 1 ln (x + 1) · x(x + 1) x2
x2 − x(x + 1) x2 − x(x + 1) · ln (x + 1) ln (x + 1) x − (x + 1) · ln (x + 1) = lim = lim = | 00 | = lim = 3 x→0 x→0 x→0 x (x + 1) x3 + x4 x2 + x3 ln (x + 1) 1 1 1 − ln (x + 1) − (x + 1) · − −ln (x + 1) −1 0 x + 1 x + 1 = lim = lim 2 = | 0 | = lim 2 − 6x = 2 . x→0 x→0 x→0 2x − 3x 2x − 3x2 x x d) lim ex − x = |∞ − ∞| = lim x · ( ex − 1) = lim x · lim ( ex − 1) = lim x · lim ex = ∞ · ∞ = ∞. x→∞
x→∞
x→∞
x→∞
x→∞
x→∞
1 ln x 1 x lim lim · ln x √ 1 ∞ e) lim x x = lim x x = |∞0 | = lim e x = |0 · ∞| = ex→∞ x = | ∞ | = ex→∞ 1 = x→∞ x→∞ x→∞ 1 lim 1 x→∞ x = e ∞ = e0 = 1. =e 1 − lim tg x · ln x tg x tg x · ln x = lim e−tg x · ln x = e x→0+ f) lim x1 = = |∞0 | = lim e x→0+
x→0+
x→0+
1 x − lim ln x sin x sin2 x 1 x→0+ − lim lim sin x · lim lim − 2 + cotg x + + + ∞ x→0 x x = x→0 x→0 x→0 sin x = e =e =e = |∞| = e = e0 · 1 = e0 = 1. 1 1 2 lim x2 · ln (1 + ) x2 · ln (1 + ) 1 x ∞ x = x = ex→∞ g) lim 1 + x = |1 | = lim e x→∞
x→∞
1 −1 1 · x2 ln (1 + x1 ) 1+ x 1 lim lim lim 1 −2 lim x2 · ln (1 + ) x→∞ x→∞ x = ex→∞ x2 x3 = ex→∞ = | 00 | = e =e x3 3x2 6x lim lim lim x→∞ 2x(x + 1) ∞ x→∞ 4x + 2 = ex→∞ 4 = e∞ = ∞. = |∞| = e =e
ÚM FSI VUT v Brně
−1 x(x+1) −2 x3
=
58
14. Monotonnost, lokální extrémy, globální extrémy a asymptoty funkce
Studijní text
14. Monotonnost, lokální extrémy, globální extrémy a asymptoty funkce A. Rostoucí a klesající funkce Pojmy rostoucí, klesající a konstantní používáme k popisu chování funkce na nějakém intervalu (po kterém se pohybujeme zleva doprava, jak je přirozené). Intuitivní představu těchto pojmů si každý udělá z Obrázku 14.1.
Obr. 14.1: Rostoucí, klesající a konstantní funkce Nyní tyto pojmy definujme precizněji a definici ilustrujme na Obrázku 14.2. Definice 14.1. Nechť funkce y = f (x) je definovaná na nějakém intervalu I. Nechť x1 , x2 jsou hodnoty z tohoto intervalu. Potom řekneme, že a) f (x) je rostoucí na intervalu I, jestliže pro každé x1 < x2 platí f (x1 ) < f (x2 ). b) f (x) je klesající na intervalu I, jestliže pro každé x1 < x2 platí f (x1 ) > f (x2 ). c) f (x) je konstantní na intervalu I, jestliže pro libovolné x1 , x2 platí f (x1 ) = f (x2 ).
Obr. 14.2: Růst a klesání — podle definice
Poznámka 14.2. Nechť funkce y = f (x) je definovaná na nějakém intervalu I. Nechť x1 , x2 jsou hodnoty z tohoto intervalu. Potom řekneme, že a) f (x) je neklesající na intervalu I, jestliže pro každé x1 < x2 platí f (x1 ) ≤ f (x2 ). b) f (x) je nerostoucí na intervalu I, jestliže pro každé x1 < x2 platí f (x1 ) ≥ f (x2 ).
ÚM FSI VUT v Brně
59
14. Monotonnost, lokální extrémy, globální extrémy a asymptoty funkce
Studijní text
Podívejme se na funkci rostoucí, klesající a konstantní z hlediska derivací. Konkrétně nás budou zajímat znaménka derivací v bodech funkce. Hodnota derivace funkce y = f (x) v bodě x0 udává směrnici tečny ke grafu funkce y = f (x) v bodě x0 . Názorně je situace uvedena na Obrázku 14.3, a proto nás nepřekvapí následující věta. Věta 14.3. Nechť y = f (x) je funkce spojitá na uzavřeném intervalu ha, bi a diferencovatelná na otevřeném intervalu (a, b). a) Je-li f 0 (x) > 0 pro všechna x ∈ (a, b), potom je f (x) rostoucí na ha, bi. a) Je-li f 0 (x) < 0 pro všechna x ∈ (a, b), potom je f (x) klesající na ha, bi. a) Je-li f 0 (x) = 0 pro všechna x ∈ (a, b), potom je f (x) konstantní na ha, bi.
Obr. 14.3: Růst a klesání — znaménka derivací
Poznámka 14.4. Směrnice přímky y = kx + q (tj. číslo k) je definována jako tangenta úhlu α, který tato přímka svírá s kladným směrem osy x. Hodnotu měřenou proti směru otáčení hodinových ručiček považujeme za kladnou, hodnotu měřenou po směru otáčení hodinových ručiček považujeme za zápornou. Tak například hodnoty 210o a −150o udávají směr stejné přímky. Podívejte se na příklady na Obrázku 14.4.
Obr. 14.4: Směrnice přímky
Příklad 14.5. Určete intervaly, ve kterých jsou následující funkce rostoucí, a ve kterých jsou klesající. Namalujte nejprve obrázek, z něj vyčtěte řešení a výsledek potvrďte výpočtem. a) f (x) = x2 − 4x + 3, b) f (x) = x3 . ÚM FSI VUT v Brně
60
14. Monotonnost, lokální extrémy, globální extrémy a asymptoty funkce
Studijní text
Řešení. a) Z grafu funkce f (x) na Obrázku 14.15 vidíme, že funkce je klesající pro x ≤ 2 a rostoucí pro x ≥ 2. Pro určení řešení výpočtem potřebujeme derivaci funkce f (x), tj. f 0 (x) = 2x − 4 = 2(x − 2). Odtud vyplývá, že f 0 (x) < 0 pro −∞ < x < 2, a proto podle Věty 14.3 je funkce klesající na (−∞, 2i. f 0 (x) > 0 pro 2 < x < ∞, a proto je funkce rostoucí na h2, ∞). b) Z grafu funkce f (x) na Obrázku 14.13 vidíme, že funkce je rostoucí pro všechna x ∈ (−∞, ∞). Spočtěme derivaci funkce f (x), tj. f 0 (x) = 3x2 . Odtud vyplývá, že f 0 (x) > 0 pro f 0 (x) > 0 pro
−∞ < x < 0, 0 < x < ∞,
a proto je funkce rostoucí na (−∞, ∞).
y 7
y 4
6
3
5
2
4
1
3
−1
−2
0
−1
1
2
−1
1
−2
0
1
2
3
4
5
2
x
−3
x
−4
−1 Obr. 14.5: f (x) = x2 − 4x + 3
Obr. 14.6: f (x) = x3
Příklad 14.6. a) Za pomoci grafu (viz Obrázek 14.16) funkce f (x) = 3x4 + 4x3 − 12x2 + 2 odhadněte, ve kterých intervalech je funkce rostoucí a kdy klesající. b) Užitím Věty 14.3 potvrďte váš odhad. Řešení. a) Z grafu funkce f (x) na Obrázku 14.16 vidíme, že funkce je klesající pro x ≤ −2, rostoucí pro −2 ≤ x ≤ 0, klesající pro 0 ≤ x ≤ 1 a rostoucí pro x ≥ 1. y 30 20 10
−3
−2
−1
0
1
2
x
−10 −20 −30 4
Obr. 14.7: f (x) = 3x + 4x3 − 12x2 + 2 ÚM FSI VUT v Brně
61
14. Monotonnost, lokální extrémy, globální extrémy a asymptoty funkce
Studijní text
b) Derivací funkčního předpisu dostáváme f 0 (x) = 12x3 + 12x2 − 24x = 12x(x2 + x − 2) = 12x(x + 2)(x − 1). Analyzujme nyní znaménka jednotlivých členů (tj. jednotlivých „závorekÿ) a odtud odvoďme znaménko pro f 0 (x). interval x < −2 −2 < x < 0 0<x<1 x>1
(12x)(x + 2)(x − 1) (−)(−)(−) (−)(+)(−) (+)(+)(−) (+)(+)(+)
znaménko f 0 (x) − + − +
závěr f (x) je na (−∞, −2i klesající f (x) je na h−2, 0i rostoucí f (x) je na h0, 1i klesající f (x) je na h1, ∞) rostoucí
B. Lokální extrémy funkce
Definice 14.7. Řekneme, že funkce f má v bodě x0 ∈ R lokální maximum (resp. lokální minimum) právě když existuje ryzí okolí O(x0 )−{x0 } takové, že O(x0 )−{x0 } ⊆ D(f ) a zároveň pro ∀x ∈ O(x0 )−{x0 } platí f (x) ≤ f (x0 ), resp. f (x) ≥ f (x0 ). Analogicky definujeme ostré lokální maximum, pro které platí f (x) < f (x0 ) a ostré lokální minimum, pro které platí f (x) > f (x0 ). Definice 14.8. Nechť funkce f má v bodě x0 ∈ R derivaci f 0 (x0 ). Body, pro které platí f 0 (x0 ) = 0 nazveme stacionární body. Jinými slovy můžeme říci, že stacionární body jsou body, podezřelé z etrému. Lokální extrém v nich nasat může, ale také nemusí. Bylo by jistě nepraktické, kdybychom lokální extrémy vyšetřovali pomocí funkčních hodnot v jejich ryzím okolí. Přesto je to možné, pokud si uvědomíme vazbu na růst a klesání funkce a tím pádem i na znaménko první derivace (tj. sgnf 0 (x)). Velký pozor si ovšem musíme dát na body, ve kterých první derivace neexistuje. I to jsou potenciální adepti na extrém.
C. Konvexní a konkávní funkce Znaménko derivace funkce f (x) nám prozradí, kde je graf funkce rostoucí a kde klesající. Ovšem nic nám neřekne o způsobu zakřivení. Podívejme se například na Obrázek 14.8. Graf je rostoucí vlevo i vpravo od vyznačeného bodu. Ovšem vlevo leží „nad tečnouÿ a vpravo „pod tečnouÿ sestrojenou v tomto bodě.
Obr. 14.8: Konvexní — „nad tečnouÿ, konkávní — „pod tečnouÿ
Definice 14.9. Leží-li graf funkce f (x) na nějakém okolí bodu B „nad tečnouÿ sestrojenou v tomto bodě, řekneme, že f (x) je konvexní v bodě B. Leží-li graf funkce f (x) „pod tečnouÿ, řekneme, že f (x) je konkávní v bodě B.
ÚM FSI VUT v Brně
62
14. Monotonnost, lokální extrémy, globální extrémy a asymptoty funkce
Studijní text
Potřebujeme ovšem nějaký spolehlivý nástroj, který lze snadno použít při výpočtech. Ten nám dává následující věta. Věta 14.10. Nechť je funkce f (x) dvakrát diferencovatelná na nějakém intervalu I. a) Je-li f 00 (x) > 0 na I, pak je f (x) konvexní na intervalu I. b) Je-li f 00 (x) < 0 na I, pak je f (x) konkávní na intervalu I.
Příklad 14.11. Najděte intervaly, na kterých jsou funkce konvexní, a na kterých jsou konkávní. a) f (x) = x2 − 4x + 3, b) f (x) = x3 , c) f (x) = x3 − 3x2 + 1. Řešení. a) Výpočtem prvních dvou derivací získáme f 0 (x) = 2x − 4 a f 00 (x) = 2. Vzhledem k tomu, že f 00 (x) > 0 pro všechna x, je funkce f (x) konvexní na (−∞, ∞). To souhlasí se situací na Obrázku 14.15. y 7
y 4
6
3
5
2
4
1
3
−1
−2
−1
0
1
2
−1
1
−2
0
1
2
3
4
5
2
x
−3
x
−4
−1 Obr. 14.9: f (x) = x2 − 4x + 3
Obr. 14.10: f (x) = x3
b) Výpočtem prvních dvou derivací získáme f 0 (x) = 3x2 a f 00 (x) = 6x. Vidíme, že f 00 (x) < 0 pro x < 0 a f 00 (x) > 0 pro x > 0. Tedy funkce f (x) je konkávní na (−∞, 0i a konvexní na h0, ∞). To souhlasí se situací na Obrázku 14.13. c) Výpočtem prvních dvou derivací získáme f 0 (x) = 3x2 − 6x a f 00 (x) = 6x − 6 = 6(x − 1). Vidíme, že f 00 (x) < 0 pro x > 1 a f 00 (x) > 0 pro x < 1. Tedy funkce f (x) je konkávní na (−∞, 1i a konvexní na h1, ∞). To souhlasí se situací na Obrázku 14.14. 2 1 −1
1
0
2
3
x
−1 −2 −3 y
Obr. 14.11: f (x) = x3 − 3x2 + 1
ÚM FSI VUT v Brně
63
14. Monotonnost, lokální extrémy, globální extrémy a asymptoty funkce
Studijní text
Věta 14.12. Nechť x0 je stacionární bod funkce f (x). 1. Platí-li f 0 (x0 ) = 0 ∧ f 00 (x0 ) > 0, pak je v bodě x0 ostré lokální minimum. 2. Platí-li f 0 (x0 ) = 0 ∧ f 00 (x0 ) < 0, pak je v bodě x0 ostré lokální maximum.
D. Globální (absolutní) extrémy funkce Definice 14.13. Nechť f (x) je funkce a M ⊆ D(f ). Jestliže existuje bod x0 ∈ M tak, že pro všechna x ∈ M platí f (x) ≤ f (x0 ) (resp. f (x) ≥ f (x0 )), pak řekneme, že funkce f (x) nabývá v bodě x0 globálního maxima (resp. globálního minima) na množině M . Někdy se místo pojmu globální minimum nebo maximum používá pojem absolutní minimum nebo maximum. Věta 14.14. Je-li f (x) spojitá na ha, bi, pak na ha, bi nabývá globálních extrémů a to buď v bodech lokálních extrémů nebo v krajních bodech intervalu.
Poznámka 14.15. Při vyšetřování globálních extrémů na uzavřeném intervalu se postupuje tak, že vyšetříme nejprve lokální extrémy a určíme i jejich funkční hodnoty. Tyto funkční hodnoty pak porovnáme s funkčními hodnotami v krajních bodech intervalu. Nejvyšší funkční hodnota určí bod, ve kterém nastává globální maximum a nejnižší funkční hodnota určí bod, ve kterém nastává globální minimum. Pozor, globální extrém může nastat současně ve více bodech.
E. Inflexní body Bodům, ve kterých graf přechází z konvexního na konkávní a naopak, budeme věnovat zvláštní pozornost. Definice 14.16. Přechází-li graf spojité funkce f (x) v bodě B = [x0 , f (x0 )] z jedné strany tečny na druhou, říkáme, že f (x) má v bodě B (tj. pro x0 ) inflexní bod. Viz Obrázek 14.12.
Obr. 14.12: Inflexní body — podle definice
Příklad 14.17. Například funkce f (x) = x3 má inflexní bod pro x = 0, tj. v bodě [0, 0] (viz Obrázek 14.13). Funkce f (x) = x3 − 3x2 + 1 má inflexní bod pro x = 1, tj. v bodě [1, −1] (viz Obrázek 14.14). Funkce f (x) = x2 − 4x + 3 nemá žádné inflexní body (viz Obrázek 14.15). ÚM FSI VUT v Brně
64
14. Monotonnost, lokální extrémy, globální extrémy a asymptoty funkce
Studijní text
y 4
2
3
1
2
−1
1
0
2
3
x
1 −2
0
−1
1
2
x
−1
−1 −2
−2 −3
−3
−4
y
Obr. 14.13: f (x) = x3
Obr. 14.14: f (x) = x3 − 3x2 + 1 y
y 7
30
6 20 5 10
4 3 −3
2
−2
−1
0
1
2
x
−10
1 −20 −1
0
1
2
3
4
5
x
−1
−30
Obr. 14.15: f (x) = x2 − 4x + 3
Obr. 14.16: f (x) = 3x4 + 4x3 − 12x2 + 2
Příklad 14.18. Použijte Obrázek 14.16 k hrubému odhadu souřadnic inflexních bodů funkce f (x) = 3x4 + 4x3 − 12x2 + 2 a zkontrolujte své odhady výpočtem. Řešení. Graf přechází z konvexního na konkávní někde mezi −2 a −1, řekněme zhruba pro x = −1, 25 a z konkávního na konvexní někde mezi 0 a 1, řekněme pro x = 0, 5. Pro přesný výpočet inflexního bodu potřebujeme druhou derivaci funkce f (x). f 0 (x) = 12x3 + 12x2 − 24x a f 00 (x) = 36x2 + 24x − 24 = 12(3x2 + 2x − 2). Položíme druhou derivaci rovnu nule, tj. 3x2 + √2x − 2 = 0. A zjistíme body, kde se mění funkce z konvexní na konkávní, nebo naopak. To nastává pro x = −1−3 7 ≈ −1, 22 √ a pro x = −1+3 7 ≈ 0, 55. Pro úplnost výpočet doplníme tabulkou. interval√ x < −1−3 7 √ √ −1− 7 < x <√−1+3 7 3 x > −1+3 7
ÚM FSI VUT v Brně
znaménko f 00 (x) + − +
závěr √ −1− 7 f (x) je na (−∞, 3 √i konvexní √ −1− 7 −1+ 7 f (x) je na h 3 √, 3 i konkávní f (x) je na h −1+3 7 , ∞) konvexní
65
14. Monotonnost, lokální extrémy, globální extrémy a asymptoty funkce
Studijní text
Příklad 14.19. Najděte inflexní bod funkce f (x) = sin x na intervalu h0, 2πi. Na závěr výsledky porovnejte s grafem Řešení. Výpočtem prvních dvou derivací obdržíme f 0 (x) = cos x a f 00 (x) = − sin(x). Tedy f 00 (x) < 0 pro 0 < x < π a f 00 (x) > 0 pro π < x < 2π. Což implikuje, že graf je konkávní pro 0 < x < π a konvexní pro π < x < 2π, a tedy inflexní bod je pro x = π ≈ 3, 14, tj. v bodě [π, 0]. To souhlasí s Obrázkem 14.17. y
y
1
4
3
0
1
2
3
4
5
6
2
x
1
−1 −2 Obr. 14.17: f (x) = sin x, 0 ≤ x ≤ 2π
−1
0
1
2
x
Obr. 14.18: f (x) = x4
Poznámka 14.20. V předchozích příkladech inflexní body funkce f (x) splňovaly podmínku f 00 (x) = 0. Pokaždé však z f 00 (x) = 0 neplyne, že by v daném bodě musel být inflexní bod. Ukažme si to na následujícím příkladu.
Příklad 14.21. Najděte inflexní bod (pokud vůbec existuje) funkce f (x) = x4 . Řešení. Výpočtem prvních dvou derivací obdržíme f 0 (x) = 4x3 a f 00 (x) = 12x2 . Tedy f 00 (x) > 0 pro každé x ∈ (−∞, ∞), proto je funkce konvexní na (−∞, ∞) a tudíž nemá žádné inflexní body. Upozorněme na skutečnost, že pro x = 0 sice platí, že f 00 (x) = 0, ale o inflexní bod nejde, viz Obrázek 14.18. Dosud jsme o inflexních bodech mluvili jen v souvislosti se změnou funkce z konvexní ne konkávní a naopak. Uvědomme si, že inflexní body jsou body na křivce, ve kterých se mění směrnice tečen. Je-li funkce konvexní, směrnice, tečen narůstá a je-li konkávní, tak směrnice tečen klesá. (Viz Obrázek 14.19.) Ukažme si to na příkladu z fyziky.
Obr. 14.19: Konvexní a konkávní podle směrnic tečen
ÚM FSI VUT v Brně
66
14. Monotonnost, lokální extrémy, globální extrémy a asymptoty funkce
Studijní text
Příklad 14.22. Předpokládejme, že voda je nalitá do lahve, která má tvar jako na Obrázku 14.20 a její objem narůstá konstantní rychlostí. Pozorujme, jak při této rychlosti narůstá výška hladiny y vzhledem k času t. Zpočátku se bude výška hladiny y zvyšovat pomalu, protože láhev má širokou podstavu. Se zužováním láhve se bude výška hladiny y zvyšovat rychleji až do nejužšího místa, kterým je hrdlo. Od té chvíle se bude výška hladiny y zvyšovat pomaleji, protože se láhev opět rozšiřuje. Tudíž hrdlo je bodem, ve kterém se mění rychlost změny výšky hladiny y v závislosti na čase t z rostoucí na klesající.
Obr. 14.20: Výška hladiny v láhvi v závislosti na čase
Při vyšetřování průběhu funkce je třeba mít v ruce snadný rozhodovací aparát. Tím je následující věta. Věta 14.23. Je-li f 00 (x0 ) = 0 ∧ f 000 (x0 ) 6= 0, pak je x0 inflexní bod. Poznamenejme, že inflexní body může funkce f (x) mít buď v bodech, kde f 00 (x0 ) = 0 nebo v bodech, kde f (x) neexistuje. 00
F. Asymptoty Názorně si pod pojmem asymptota představujeme přímku, ke které se graf funkce f (x) nekonečně blíží. Při bližším pohledu si uvědomíme, že tyto přímky můžeme rozdělit na dva případy: 1. Buď přímka, která je asyptotou směrnici nemá (např. asymptoty funkce f (x) = tg x). 2. Nebo přímka asymptotu má (například u hyperboly). Poznámka 14.24. Přímka, která směrnici nemá (tj. přímka bez směrnice) má rovnici x = x0 , kde x0 ∈ R. Graf přímky bez směrnice je přímka kolmá k ose x (tzn. je rovnoběžná s osou y). Definice 14.25. Přímka x = x0 se nazývá asymptota bez směrnice právě když funkce f (x) má nevlastní limitu (tj. ±∞) v bodě x0 zleva nebo zprava.
Poznámka 14.26. Body na ose x, které jsou podezřelé z toho, že jimi prochází asymptota bez směrnice jsou body vyřazené z definičního oboru D(f ). Například je-li pro nějakou funkce f (x) definičním oborem D(f ) = R − {−2}, pak při vyšetřování asymptot bez směrnice počítáme tyto dvě jednostranné limiy lim f (x) = . . . ,
x→−2+
lim f (x) = . . .
x→−2−
Pokud alespoň jedna z nich vyjde +∞ nebo −∞, pak je přímka x = −2 asymptotou bez směrnice. ÚM FSI VUT v Brně
67
14. Monotonnost, lokální extrémy, globální extrémy a asymptoty funkce
Poznámka 14.27.
Studijní text
Asymptot bez směrnice může být nekonečně mnoho, viz graf funkce f (x) = tg x.
Definice 14.28. Nechť u je přímka, která není rovnoběžná s osou y. Nechť d(x) značí vzdálenost bodu [x, f (x)] od této přímky. Řekneme, že přímka u je asymptota se směrnicí právě když lim d(x) = 0 nebo x→∞
lim d(x) = 0.
x→−∞
Poznámka 14.29.
Libovolná funkce f (x) může mít maximálně dvě asymptoty se směrnicí.
Při vyšetřování asymptot se směrnicí u funkce f (x) hledáme ve skutečnosti přímku y = kx+q. Při výpočtu směrnice a posunutí využijeme následující tvrzení. Věta 14.30. Přímky y = k1 x + q1 a y = k2 x + q2 jsou asymptotou se směrnicí funkce f (x) právě když existují vlastní čísla k1,2 a q1,2 (tj. čísla různá od ±∞) taková, že platí k1,2 = lim
x→±∞
f (x) x
(14.1)
a q1,2 = lim f (x) − k1,2 x x→±∞
ÚM FSI VUT v Brně
(14.2)
68
15. Průběh funkce
Studijní text
15. Průběh funkce Při vyšetření grafu funkce budeme postupovat podle následujícího algoritmu: 1. Určení definičního oboru. 2. Rozhodnutí, jestli je funkce sudá, lichá, periodická nebo nemá ani jednu z uvedených vlastností. 3. Nalezení průsečíků s osou x (tzv. nulové body) a určení znaménka f (x). 4. Výpočet limit pro x jdoucí k ±∞. 5. První derivace funkce: a) Nalezení stacionárních bodů (tj. bodů podezřelých z extrémů). b) Nalezení intervalů, kde je funkce rostoucí, nebo klesající. c) Nalezení lokálních extrémů. 6. Druhá derivace funkce: a) Nalezení intervalů, kde je funkce konkávní, nebo konvexní. b) Nalezení inflexních bodů. 7. Vyšetření asymptot: a) Bez směrnice, tj. přímek x = x0 , kde x0 jsou případné body nespojitosti. b) Se směrnicí, tj. přímek y = kx + q. 8. Načrtnutí grafu. Proveďme stručnou rekapitulaci pojmů a upozorněme na úskalí, která mohou nastat. Definiční obor. Správné určení definičního oboru je nezbytné. Body, které „vyřadímeÿ z definičního oboru jsou horkými kandidáty na to, že jimi bude procházet asymptota bez směrnice. Sudá, lichá, nebo periodická funkce. Potvrzení některé z těchto vlastností nám výrazně usnadní vykreslení průběhu funkce, protože budeme vědět o určité symetričnosti. Připomeňme, že funkce: • sudá má graf osově souměrný podle osy y a platí f (−x) = f (x) pro všechna x ∈ D(f ). • lichá má graf středově souměrný podle počátku a platí f (−x) = −f (x) pro všechna x ∈ D(f ). • periodická s periodou p splňuje pro všechna x ∈ D(f ) podmínku f (x) = f (x + p). Nulové body a průsečík s osou y. Body na ose x mají y-ovou souřadnici rovnu nule. Stačí tedy vyřešit rovnici f (x) = 0. Abychom věděli, kdy bude graf funkce f (x) probíhat pod osou x a nad ní, potřebujeme určit znaménko f (x) (tzv. sgn f (x)). Výpočet limit pro x jdoucí k ±∞. Počítáme lim f (x) a lim f (x). x→∞
x→−∞
První derivace, stacionární body, monotonnost, extrémy. Připomeňme nejprve geometrický význam derivace funkce f (x) v bodě x0 - číslo f 0 (x0 ) je směrnice tečny ke grafu funkce f (x) v bodě x0 . Jestliže sestrojíme tečnu ke grafu funkce f v jejím lokálním extrému (tj. v lokálním minimu nebo lokálním maximu), tato tečna bude rovnoběžná s osou x a tudíž její směrnice bude rovna nule. Hledání extrémů odpovídá nalezení bodů, ve kterých je směrnice tečny ke grafu rovna nule. Stacionární body (tj. body podezřelé z extrémů) jsou jsou kořeny rovnice: f 0 (x) = 0 ÚM FSI VUT v Brně
69
15. Průběh funkce
Studijní text
Pozor, ne každý bod, kde směrnice tečny je rovna nule musí být extrém. Ještě stále může jít o tzv. inflexní bod, což je bod, kde se průběh funkce mění z konvexního na konkávní nebo naopak. Pozor, ne všechny lokální extrémy „zachytímeÿ tím, že položíme f 0 (x) = 0. Je třeba si pohlídat body, ve kterých první derivace vůbec neexistuje! O tom, jestli je stacionární bod bodem lokálního minima, lokálního maxima, nebo inflexním bodem rozhodneme podle intervalů, na kterých funkce roste, nebo klesá. • Funkce rostoucí na nějakém intervalu splňuje podmínku, že f 0 (x) > 0 pro všechna x z tohoto intervalu. • Funkce klesající na nějakém intervalu splňuje podmínku, že f 0 (x) < 0 pro všechna x z tohoto intervalu. Proto nás bude zajímat znaménko první derivace (tzv. sgn f 0 (x)). Druhá derivace, konvexnost, konkávnost, inflexní body. • Funkce konvexní leží v daném intervalu „nad tečnouÿ a platí f 00 (x) > 0 pro všechna x z tohoto intervalu. • Funkce konkávní leží v daném intervalu „pod tečnouÿ a platí f 00 (x) < 0 pro všechna x z tohoto intervalu. Proto nás bude zajímat znaménko druhé derivace (tzv. sgn f 00 (x)). • Inflexní bod je bod, pro který platí f 00 (x) = 0 a ve kterém se průběh funkce mění z konvexního na konkávní, nebo naopak. Poznamenejme, že pokud jsme z nějakého důvodu nedokázali rozhodnout, jaký extrém nastává u bodů, které podezříváme již od první derivace, druhá derivace nám může pomoci. Platí totiž: • Je-li f 0 (x) = 0 a zároveň f 00 (x) > 0, pak je v x lokální minimum. • Je-li f 0 (x) = 0 a zároveň f 00 (x) < 0, pak je v x lokální maximum. Poznamenejme, že pokud jsme z nějakého důvodu nedokázali rozhodnout pomocí konvexnosti a konkávnosti o inflexním bodu, pomohla by nám třetí derivace. Asymptoty bez směrnice, asymptoty se směrnicí. Adepty na asymptoty bez směrnice jsou body „vyřazenéÿ z definičního oboru, označme jeden z nich x0 . K tomu, abychom prohlásili přímku x = x0 za asymptotu bez směrnice nám stačí, když se ukáže, že alespoň jedna jednostranná limita lim f (x)
x→x+ 0
nebo
lim f (x)
x→x− 0
je nevlastní (tj. ±∞). Asymptoty se směrnicí, tj. přímky y = kx + q, získáme (pokud vůbec existují) výpočtem těchto limit k1 = lim
x→∞
a
f (x) , x
f (x) , x→−∞ x
k2 = lim
q1 = lim f (x) − k1 x
x→∞
q2 = lim
x→−∞
f (x) − k2 x .
Graf funkce. Pokud dobře rozumíme jednostlivým vlastnostem a známe vazby mezi nimi, je již celkem snadné zakreslit předchozí poznatky do souřadného systému.
ÚM FSI VUT v Brně
70
16. Diferenciál funkce a Taylorův polynom
Studijní text
16. Diferenciál funkce a Taylorův polynom A. Diferenciál funkce Pojem diferenciálu funkce y = f (x) v bodě a lze nejnázorněji vysvětlit pomocí Obrázku 16.1. Jde o přírůstek funkční hodnoty na tečně. To vlastně znamená, že funkce je v okolí bodu a aproximována tečnou a k přibližnému stanovení funkční hodnoty v bodě „blízkoÿ bodu a nám stačí určit hodnotu na tečně.
Obr. 16.1: Diferenciál funkce y = f (x) v bodě a
Definice 16.1. Nechť funkce y = f (x) má v bodě a spojitou derivaci (tj. existuje f 0 (a)). Diferenciálem funkce f (x) v bodě a při přírůstku h ∈ R nazýváme číslo df (a)(h) = f 0 (a)h.
(16.1)
Poznámka 16.2. Z Obrázku 16.1 je zřejmé, že platí tg α = f 0 (a) =
df (a) h
⇒
df (a)(h) = f 0 (a)h.
Poznámka 16.3. ∆f (a) je diference funkce f (x) mezi body a a a + h, tj. přírůstek funkční hodnoty.
Poznámka 16.4. h je přírůstek proměnné x, který bývá zvykem značit h = x − a = dx.
(16.2)
Definice 16.5. Nechť funkce y = f (x) má v bodě a spojité derivace až do řádu n včetně (tj. existují f 0 (a), f 00 (a), . . . , f (n) (a)). Diferenciálem řádu n funkce f (x) v bodě a při přírůstku h ∈ R nazýváme číslo dn f (a)(h) = f (n) (a)hn .
ÚM FSI VUT v Brně
(16.3)
71
16. Diferenciál funkce a Taylorův polynom
Studijní text
Poznámka 16.6. Diferenciály (i vyšších řádů) bývá na základě Poznámky 16.4 zvykem značit df (a)(h) = f 0 (a)h = f 0 (a)dx = f 0 (a)(x − a).
(16.4)
Poznámka 16.7. Pokud pro výpočet funkční hodnoty v bodě a + h použijeme diferenciál, dopustíme se určité chyby R(h) = |∆f (a) − df (a)(h)| a platí R(h) = 0. h→0 h lim
Příklad 16.8. Pomocí diferenciálu spočtěte přibližně arctg 0, 97. Řešení. Zvolíme vhodnou funkci f (x) a vhodný bod a, ve kterém se snadno počítá funkční hodnota a je dostatečně blízko bodu 0, 97. Uvažujme tedy f (x) = arctg x a a = 1. Vypočteme si přírůstek h = x − a = 0, 97 − 1 = −0, 03. Chceme tedy spočítat f (0, 97). Vypočtěme nejprve diferenciál df (1)(−0, 03) pomocí vztahu (16.1) následovně 1 , 1 + x2 1 f 0 (1) = , 2 1 df (1)(−0, 03) = (−0, 03). 2 Nyní stačí jen přičíst funkční hodnotu v bodě a = 1 a získáme π 0, 03 . . f (0, 97) = f (1) + df (1)(−0, 03) = − = 0, 77. 4 2 f 0 (x) =
Příklad 16.9. Vypočtěte diferenciál funkce f (x) = sin x. Řešení. Vzhledem k tomu, že nebyl zadán ani bod a, ani přírůstek h, bude výpočet naprosto obecný f 0 (x) = cos x, df (x) = f 0 (x)dx = cos xdx.
B. Taylorův polynom V předchozí kapitole jsme funkční hodnotu v bodě a + h nahrazovali pomocí přírůůstku na tečně ke grafu funkce y = f (x) v bodě a. Je zřejmé, že se tím dopouštíme určité nepřesnosti, která je ovšem vyvážena snadností výpočtu. Pokud bychom chtěli mít výpočet f (a + h) přesnější, jistě by nás napadlo aproximovat graf funkce y = f (x) v okolí bodu a ne těčnou (tj. polynomem 1. stupně), ale polynomem vyššího stupně. To je hlavní myšlenkou aproximace funkce f (x) pomocí Taylorova polynomu. Věta 16.10. (Taylorova věta) Nechť má funkce f (x) v intervalu ha, a+hi (resp. v ha+h, ai pro h záporné) spojité derivace až do řádu n včetně a v (a, a + h) (resp.v (a + h, a)) spojitou derivaci (n + 1)-řádu. Pak f (a + h) = f (a) +
f 0 (a) f 00 (a) 2 f (n) (a) n h+ h + ··· + h + Rn+1 , 1! 2! n!
(16.5)
kde tzv. Taylorův zbytek Rn+1 lze zapsat například v Lagrangeově tvaru Rn+1 =
ÚM FSI VUT v Brně
f (n+1) (a + ϑh) n+1 h , kde 0 < ϑ < 1. (n + 1)!
(16.6)
72
16. Diferenciál funkce a Taylorův polynom
Studijní text
Poznámka 16.11. Píšeme-li přírůstek h ve tvaru h = x−a, dostaneme často používaný tvar rovnice (16.5) f (x) = f (a) +
f 0 (a) f 00 (a) f (n) (a) (x − a) + (x − a)2 + · · · + (x − a)n + Rn+1 . 1! 2! n!
(16.7)
Chceme-li danou funkci f (x) nahradit v okolí bodu a polynomem, použijeme tzv. Taylorův polynom. Definice 16.12. Taylorovým polynomem stupně n v bodě a nazýváme polynom Tn (x) = f (a) +
Poznámka 16.13.
f 0 (a) f 00 (a) f (n) (a) (x − a) + (x − a)2 + · · · + (x − a)n . 1! 2! n!
(16.8)
Je-li a = 0, pak se polynom (16.8) nazývá Maclaurinův polynom a má vyjádření Mn (x) = f (0) +
f 0 (0) f 00 (0) 2 f (n) (0) n x+ x + ··· + x . 1! 2! n!
(16.9)
Příklad 16.14. Napište Maclaurinův polynom stupně n = 4 funkce ex . Řešení. Je třeba si určit funkční hodnotu v bodě 0 a první 4 derivace a jejich hodnoty v bodě 0. f (0) = e0 = 1 f 0 (x) = ex f 00 (x) = ex f 000 (x) = ex f (4) (x) = ex
⇒ f 0 (0) = e0 = 1, ⇒ f 00 (0) = e0 = 1, ⇒ f 000 (0) = e0 = 1, ⇒ f (4) (0) = e0 = 1.
Získané hodnoty dosaďme do vztahu (16.9) ex ≈ M4 (x) = 1 +
1 1 1 1 x x2 x3 x4 x + x2 + x3 + x4 = 1 + + + + . 1! 2! 3! 4! 1! 2! 3! 4!
Příklad 16.15. Nahraďte funkci y = cos x v okolí počátku (např. v intervalu h−0, 1; 0, 1i) polynomem čtvrtého stupně a odhadněte chybu. Řešení. Je třeba si určit funkční hodnotu v bodě 0, prvních 5 derivací. f (0) = cos 0 = 1 f 0 (x) = − sin x f 00 (x) = − cos x f 000 (x) = sin x f (4) (x) = cos x f (5) (x) = − sin x.
⇒ f 0 (0) = − sin 0 = 0, ⇒ f 00 (0) = − cos 0 = −1, ⇒ f 000 (0) = sin 0 = 0, ⇒ f (4) (0) = cos 0 = 1
Tedy x2 x4 + + R5 . 2! 4! Nyní se zabývejme odhadem chyby R5 , kterou lze pomocí vztahu (16.6) zapsat ve tvaru cos x ≈ 1 −
R5 =
− sin(ϑx) 5 x , kde 0 < ϑ < 1. 5!
Vzhledem k tomu, že −1 ≤ sin x ≤ 1, bude pro všechna x z intervalu h−0, 1; 0, 1i platit |R5 | ≤
ÚM FSI VUT v Brně
0, 15 1 = . 5! 12000000
73
17. Křivky
Studijní text
17. Křivky Rovinnou křivku chápeme jako množinu bodů v rovině. Lze ji popsat různými způsoby, např.: √ 1. Explicitně rovnicí y = f (x), např. f : y = x2 , y = − x, . . . 2. Implicitně rovnicí g(x, y) = 0, např. x2 + y 2 − 9 = 0, x − y 2 = 0, . . . 3. Parametrickými rovnicemi x = ϕ(t), y = ψ(t),
t ∈ ha, bi
např. přímka k : x = 1 + 2t, y = 3 − 3t, t ∈ R
A. Parametrické vyjádření rovinné křivky Definice 17.1. Nechť funkce ϕ(t) a ψ(t) jsou spojité na intervalu I (kde I je nejčastěji hα, βi nebo ˙ (−∞, ∞)) a mají v I spojité nebo po částech spojité derivace ϕ(t) ˙ a ψ(t). Pak množinu C bodů v rovině, jejichž kartézské souřadnice x a y jsou dány rovnicemi x = ϕ(t), y = ψ(t),
t∈I ,
(17.1)
nazýváme rovinná křivka daná parametricky, kde t je parametr.
Poznámka 17.2. Derivace ϕ(t) ˙ znamená derivaci funkce ϕ(t) podle proměnné t, která se dá zapsat také jako dϕ(t) ϕ(t) ˙ = . dt Uveďme si některé důležité vlastnosti rovinných křivek. Uvažujme interval I = hα, βi. Za počáteční bod křivky považujeme bod [ϕ(α), ψ(α)] a za koncový bod [ϕ(β), ψ(β)]. Uzavřená křivka. Jestliže platí [ϕ(α), ψ(α)] = [ϕ(β), ψ(β)] (tzn. počáteční a koncový bod jsou totožné), pak křivku C nazveme uzavřenou (viz Obrázek 17.1 a)). Otevřená křivka. Jestliže má křivka C krajní body, tzn. počáteční bod je různý od koncového, pak ji nazveme otevřenou křivkou (viz Obrázek 17.1 b)).
Obr. 17.1: a) Uzavřená křivka, b) Otevřená křivka ˙ Hladká křivka. Jsou-li funkce ϕ(t) ˙ a ψ(t) spojité v I, pak jde o hladkou křivku. Lépe si tuto vlastnost představíme následovně: otevřená křivka je hladká, jestliže v každém jejím bodě dokážeme udělat tečnu
ÚM FSI VUT v Brně
74
17. Křivky
Studijní text
Obr. 17.2: a), b), c) Hladké křivky, d) Křivka, která hladká není
Obr. 17.3: a), b) Po částech hladká křivka
a u uzavřené křivky nám nevadí, jestliže tečna neexistuje v počátečním bodě, který splývá s koncovým (viz Obrázek 17.2 a), b), c)). Po částech hladká křivka. Jestliže je křivka složená z hladkých úseků, které na sebe navazují, tak je po částech hladká (viz Obrázek 17.3). Jednoduchá křivka. Jestliže otevřená křivka neprotíná sebe sama, pak jde o jednoduchou křivku. Tzn. pro t1 6= t2 platí ϕ(t1 ) 6= ϕ(t2 ) ∧ ψ(t1 ) 6= ψ(t2 ). U uzavřených křivek platí stejná podmínka, která se ovšem nevztahuje na počáteční bod, který je totožný s koncovým bodem (viz Obrázek 17.4 a), b)).
Obr. 17.4: a), b) Jednoduchá křivka, c) Křivka, která jednoduchá není
Poznámka 17.3. Jedna křivka může mít více různých parametrických vyjádření. Příklad 17.4. Vyjádřete parametricky parabolu y = x2 − 2 pro x ∈ h−1, 2i (viz Obrázek 17.5). Řešení. Jedno z mnoha možných řešení je (ϕ(t) =) x = t, (ψ(t) =) y = t2 − 2,
t ∈ h−1, 2i.
(ϕ(t) =) x = 2t , 2 (ψ(t) =) y = t4 − 2,
t ∈ h−2, 4i.
Jiné správné řešení je
ÚM FSI VUT v Brně
75
17. Křivky
Studijní text
Obr. 17.5: Parabola y = x2 − 2 pro x ∈ h−1, 2i
Příklad 17.5. Načrtněte křivku danou parametricky rovnicemi x = t2 , 2 y = t4 ,
t ∈ R.
Řešení. Nejlepší představu si uděláme vynesením několika bodů do kartézského grafu (x, y). Sestrojme nejprve tabulku, ve které libovolně vhodně volme hodnoty t a na základě zadaných rovnic dopočítejme souřadnice bodů [x, y] hledané křivky. Získané hodnoty jsou zobrazeny na Obrázku ??. t x y
-1 1 − 41
0 0 0
1 1 1 4
2 4 2
-2 4 -2
Obr. 17.6: Křivka daná parametricky rovnicemi x = t2 , y =
t2 4 ,t
∈R
Poznámka 17.6. Derivace funkce y = f (x) dané parametrickými rovnicemi x = ϕ(t), y = ψ(t), t∈I ˙ dy ψ(t) y0 = = , (17.2) dx ϕ(t) ˙ y 00 =
¨ ϕ(t) ˙ ϕ(t) d 0 ψ(t) ˙ − ψ(t) ¨ d 0 dt (y ) = (y ) = , 3 dx dt dx [ϕ(t)] ˙
(17.3)
kde ϕ(t) ˙ 6= 0.
ÚM FSI VUT v Brně
76
17. Křivky
Studijní text
Příklad 17.7. Určete derivace první a druhou derivaci funkce y = f (x), která je dána parametrickými rovnicemi x = 6t + t3 , y = t2 − t, t ∈ R.
Řešení. Chceme určit y 0 a y 00 . Zkusme si výpočet trochu rozepsat a nedosazovat přímo do „vzorcůÿ (17.2) a (17.3). dy ˙ dy 2t − 1 ψ(t) dt . y0 = = dx = = dx ϕ(t) ˙ 6 + 3t2 dt
y 00 =
d 0 (y ) = dx
dy 0 dt dx dt
dy 0 dt
0
d
2t−1 6+3t2
dy 1 = = ϕ(t) ˙ dt ϕ(t) ˙ dt 2 6 + 3t2 − (2t − 1)6t 1 = · . 2 2 6 + 3t2 (6 + 3t ) =
·
1 = 6 + 3t2
B. Rovinné křivky dané polárně Speciálním případem parametrického vyjádření křivky C v rovině je její vyjádření pomocí polárních souřadnic. Výhodu tohoto vyjádření oceníme například při integraci. Polohu bodu M , ležícího na křivce C vyjádříme polárními souřadnicemi %, ϕ. Souřadnice % je vzdálenost bodu M od počátku souřadnic O. Souřadnice ϕ je orientovaný úhel, který svírá úsečka OM s kladným směrem osy x. Platí, že % ≥ 0 a 0 ≤ ϕ ≤ 2π. Situace je znázorněna na Obrázku 17.7.
Obr. 17.7: Polární souřadnice
Poznámka 17.8. Křivku C zadáváme předpisem, který dává do souvislosti % a ϕ a intervalem přípustných hodnot ϕ. Pak jsou souřadnice bodů [x, y] křivky C dány vztahy x = %(ϕ) cos ϕ, y = %(ϕ) sin ϕ,
ϕ ∈ ha, bi,
(17.4)
které nazýváme polární souřadnice. Příklad 17.9. Křivka je dána polárně rovnicí % = 2ϕ, ϕ ∈ h0, ∞). Načrtněte graf této funkce.
Řešení. Křivku chceme zakreslit v souřadném systému (y, x). To znamená, že nás zajímají souřadnice x a y několika bodů na křivce. Sestavme si proto tabulku, ve které budeme vhodně volit hodnoty ϕ v prvním řádku a ve druhém vypočítáme podle zadaného předpisu %. Ve třetím a čtvrtém řádku budou souřadnice x a y
ÚM FSI VUT v Brně
77
17. Křivky
Studijní text
Obr. 17.8: Křivka daná polárně % = 2ϕ (Archimédova spirála)
spočítané podle rovnic (17.4). Na Obrázku 17.8 jsou vyneseny tyto body a je jimi proložena hledaná křivka, kterou je Archimédova spirála. ϕ % = 2ϕ x = % cos ϕ y = % sin ϕ
0 0 0 0
π 2
π 0 π
π 2π −2π 0
3 2π
3π 0 −3π
2π 4π 4π 0
Poznámka 17.10. Derivace funkce y = f (x), která je dána polárně rovnicí % = g(ϕ) v polárních souřadnicích (17.4) d dy dϕ g(ϕ) sin ϕ 0 0 . y = f (x) = = d (17.5) dx dϕ g(ϕ) cos ϕ
Příklad 17.11. Napište parametrické rovnice funkce y = f (x) dané polárně rovnicí % = 2ϕ, ϕ ∈ h0, πi a určete její derivaci f 0 (x). Řešení. Do rovnic (17.4) dosadíme zadané vyjádření pro % a získáme parametrické vyjádření x = 2ϕ cos ϕ, y = 2ϕ sin ϕ,
ϕ ∈ h0, πi,
kde ϕ je parametr. Derivaci f 0 (x) vypočteme f 0 (x) =
ÚM FSI VUT v Brně
dy 2 sin ϕ + 2ϕ cos ϕ = . dx 2 cos ϕ − 2ϕ sin ϕ
78
18. Primitivní funkce, neurčitý integrál, základní integrály
Studijní text
18. Primitivní funkce, neurčitý integrál, základní integrály A. Základní pojmy Definice 18.1. Říkáme, že F (x) je v intervalu (a, b) primitivní funkcí k funkce f (x), jestliže pro všechna x ∈ (a, b) platí F 0 (x) = f (x). Věta 18.2. Ke každé funkci f (x) spojité na (a, b) existuje v (a, b) primitivní funkce. Je jich dokonce nekonečně mnoho. Je-li F (x) jedna z nich, pak všechny ostatní mají tvar F (x) + C, kde C je integrační konstanta, která je libovolná. Poznámka 18.3.
Používáme formální zápis Z f (x) dx = F (x) + C,
R
f (x) dx znamená množinu všech primitivních funkcí k funkce f (x) a nazývá se neurčitý integrál funkce f (x). Poznámka 18.4. Je zvykem pracovat se symbolem výsledku připsat integrační konstantu C. 0
Platí: (F (x) + C) = f (x) ⇔ F (x) =
R
R
f (x) dx jako s jednou z primitivních funkcí a ve
f (x) dx.
0
0
Příklad 18.5. (sin x + 5) = cos x; (sin x − 6) = cos x. Tedy
R
cos x dx = sin x + C.
Věta 18.6. Přehled základních integračních vzorců R n+1 1. xn dx = xn+1 + C, x > 0, n ∈ R, n 6= −1. R 2. x1 dx = ln |x| + C, x 6= 0. R 3. ex dx = ex + C. R x 4. ax dx = lna a + C, a > 0, a 6= 1. R 5. sin x dx = − cos x + C. R 6. cos x dx = sin x + C. R 7. sin12 x dx = −cotg x + C, x 6= kπ, k ∈ Z. R 8. cos12 x dx = tg x + C, x 6= π2 + kπ, k ∈ Z. R 1 9. 1+x 2 dx = arctg x + C1 = −arccotg x + C2 . R 1 10. √1−x dx = arcsin x + C1 = −arccos x + C2 , x ∈ (−1, 1). 2 11.
R
√ 1 x2 +a
12.
R
1 x2 +a2
13.
R
f 0 (x) f (x)
dx = ln x + dx = a1 arctg
x a
√
x2 + a + C,
+ C,
a > 0.
a 6= 0.
dx = ln |f (x)| .
ÚM FSI VUT v Brně
79
18. Primitivní funkce, neurčitý integrál, základní integrály
Studijní text
Poznámka 18.7. Přestože ke každé spojité funkci existuje primitivní funkce, nelze v mnoha případech tuto primitivní funkci vyjádřit pomocí elementárních funkcí.
B. Integrační metody Věta 18.8. Existují-li k funkcím f1 (x), f2 (x), f (x) primitivní funkce, pak R R R 1. (f1 (x) ± f2 (x)) dx = f1 (x) dx ± f2 (x) dx. R R 2. k · f (x) dx = k f (x) dx, kde k je konstanta.
Jednou z integračních metod je přímá integrace. Příklad 18.9. Spočtěte integrály: R 2 1. 5x√x−3 dx. R 2 2. 3x − 2x + √1x3 dx. 3.
R
3x cos2 x−5 cos2 x
4.
R
cotg x dx.
5.
R
6.
R
1 xln x
7.
R
x(x − 2)(x − 3) dx.
√
dx.
x4 +2+x−4 x3
dx.
dx.
Další možností je řešení integrálů substituční metodou. Tu si ukážeme na následujících příkladech. Příklad 18.10. R 1. cos(5x + 6) dx. R 2. xln1 x dx. R 3. sin2 x cos x dx. R √ 4. x x2 + 1 dx. R √ 3 arctg x 5. 1+x2 dx. R sin x √ 6. dx. 3 1+2 cos x R √ 1 7. dx. 2 x
3−ln x
Poznámka 18.11. žijeme úpravu:
Počítáme-li integrály
sin2 x =
ÚM FSI VUT v Brně
R
sin2 x dx,
1 − cos 2x , 2
R
cos2 x dx, tak před vlastní integrací nejprve pou-
cos2 x =
1 + cos 2x . 2
80
18. Primitivní funkce, neurčitý integrál, základní integrály
Příklad 18.12.
R
Studijní text
sin2 x dx.
Velmi užitečná je i integrace per partes. Věta 18.13. Metoda per partes (po částech) Mají-li funkce u(x) a v(x) v intervalu (a, b) spojitou derivaci, pak v intervalu (a, b) platí Z Z 0 u(x) · v (x) dx = u(x) · v(x) − u0 (x) · v(x) dx.
(18.1)
Důkaz. Stačí si uvědomit, jak se derivuje součin funkcí u · v: 0 u0 v +Ruv 0 . Nyní Robě strany rovnice zintegrujeme: R(u · v) = 0 (u · v)R dx = uR0 v dx + uv 0 dx. Odtud: u · v = u0 v dx + uv 0 dx, což je dokazované tvrzení. Poznámka 18.14. tvaru
Z důkazu je jasně vidět, že integrace per partes může být zapsána v ekvivalentním Z Z 0 u (x) · v(x) dx = u(x) · v(x) − u(x) · v 0 (x) dx.
Poznámka 18.15. Typické příklady, kdy je vhodné použít integraci per partes (pn (x) je polynom stupně n). Značení ze vztahu (18.1): R používáme x p (x) · e dx, R n R pn (x) · sin x dx, zde volíme za funkci „kterou budeme derivovatÿ polynom pn (x) = v(x). pn (x) · cos x dx, R R pn (x) · ln x dx, p (x) · arcsin x dx, zde volíme za funkci „kterou budeme integrovatÿ polynom pn (x) = u0 (x). n R pn (x) · arctg x dx, Příklad 18.16. R 1. (1 + x)ex dx. R 2. xe−x dx. R 3. arctg x dx. R 4. ln x dx. R 5. cos(ln x) dx.
Pokud integrujeme racionálně lomenou funkci R(x) = a ty již snadno zintegrujeme.
P (x) Q(x) ,
pak ji nejprve převedeme na parciální zlomky
Příklad 18.17. R 4 2 +x−2 1. x +6x dx. x4 −2x3 R x 2. (x−1)(x+1) 2 dx. R 5 3. (2x−3) 7 dx. 4.
R
11x2 +2x−33 x2 −3
dx.
ÚM FSI VUT v Brně
81
18. Primitivní funkce, neurčitý integrál, základní integrály
Studijní text
R Integrujeme-li goniometrické funkce, tj. R(sin x, cos x), pak nejčastěji postupujeme substitucí. O vhodné volbě substituce rozhodneme až u konkrétního příkladu. Určitá pravidla ovšem platí obecně: R(sinn x, cosm x), kde m je sudé číslo a n je liché číslo . . . substituce sin x = t; R(sinn x, cosm x), kde m je liché číslo a n je sudé číslo . . . substituce cos x = t; Ve všech případech R(sinn x, cosm x), kde m je liché číslo a n je liché číslo . . . substituce tg x = t. lze využít tzv. univerzální substituci tg x2 = t.
Příklad 18.18. R 1. sin3 x dx; R 5 x 2. cos dx; sin4 x R sin x−cos x 3. sin x+2 cos x dx; R 2−sin x 4. 2+cos x dx.
ÚM FSI VUT v Brně
82
19. Určitý (Riemannův) integrál
Studijní text
19. Určitý (Riemannův) integrál Myšlenka integrování pochází z geometrických požadavků - zjišťování povrchů, objemů a délek geometrických útvarů. To znamená, že se omezujeme jen na nějakou část (pozn. tím máme na mysli interval) funkce, která je základem geometrického útvaru. Pojmy potřebné k zavedení Riemannova integrálu. Nechť je dána funkce y = f (x), která je spojitá v uzavřeném intervalu ha, bi (viz Poznámka 19.1). 1. Rozdělme interval ha, bi body x1 < x2 < . . . < xn−1 na n podintervalů ∆x1 , ∆x2 , . . . , ∆xn , které nemusí mít stejnou délku. Viz Obrázek 1. Toto dělení označme d. Délky těchto podintervalů označme stejně, tj. ∆x1 , ∆x2 , . . . , ∆xn .
Obr. 19.1: Zavedení Riemannova integrálu
2. Protože f (x) je spojitá v ha, bi, nabývá v něm své maximální hodnoty M a minimální hodnoty m. f (x) je ovšem spojitá také v každém podintevalu ∆xi a nabývá v něm své maximální hodnoty Mi a minimální hodnoty mi (pro i = 1, 2, . . . , n − 1). Platí m ≤ mi ≤ Mi ≤ M. 3. Sestrojme k zavedenému dělení d tzv. horní integrální součet S(d) S(d) =
n X
Mi ∆xi
i=1
a dolní integrální součet s(d) s(d) =
n X
mi ∆xi .
i=1
Na Obrázku 1 je vidět, že S(d) je součet plošných obsahů modrých a s(d) je součet plošných obsahů červených obdélníků. 4. Poznamenejme, že hodnota S(d) a s(d) závisí na zvoleném dělení d. Zaveďme horní integrál z funkce f (x) na intervalu ha, bi jako infimum množiny všech horních součtů při všech možných děleních d Z d
ÚM FSI VUT v Brně
b
f (x)dx
inf S(d) = a
83
19. Určitý (Riemannův) integrál
Studijní text
a dolní integrál z funkce f (x) na intervalu ha, bi jako supremum množiny všech dolních součtů při všech možných děleních d Z b sup s(d) = f (x)dx. d
a
Poznámka 19.1. Požadavek, aby byla funkce f (x) spojitá v ha, bi je „zbytečněÿ tvrdý, stačilo by předpokládat, že funkce f (x) je v ha, bi ohraničená. Pak by se místo maxim a minim uvažovala suprema a infima. Definice 19.2. Je-li b
Z
b
Z f (x)dx =
f (x)dx, a
a
pak společné hodnotě těchto integrálů říkáme integrál z funkce f (x) v intervalu ha, bi a o funkci f (x) říkáme, že je v ha, bi integrovatelná (tj. integrace schopná) ve smyslu Riemannovy definice. Věta 19.3. Je-li f (x) integrovatelná v ha, bi a je-li a < c < b, pak f (x) je integrovatelná v ha, ci a v hc, bi a platí Z b Z c Z b f (x)dx. (19.1) f (x)dx + f (x)dx = c
a
a
Poznámka 19.4. Z předchozí věty je vidět, že k tomu, aby bylo možné funkci f (x) integrovat, nemusí být f (x) v intervalu ha, bi spojitá. Stačí, aby byla po částech spojitá, tzn. měla konečně mnoho bodů nespojitosti. Definice 19.5. Pro b < a je integrál definován takto Z
b
Z
a
f (x)dx = − a
f (x)dx. b
Uveďme ještě jednu často používanou nerovnost. Věta 19.6. (Schwarzova nerovnost) Z
!2
b
f (x)g(x)dx
b
Z
2
≤
a
Z
f (x)dx a
b
g 2 (x)dx.
(19.2)
a
Nyní se dostáváme k vztahu, který má při výpočtech zásadní význam. Věta 19.7. (Newtonova-Leibnizova formule) je-li f (x) spojitá v ha, bi a je-li F (x) libovolná funkce k ní primitivní v ha, bi a spojitá v ha, bi, pak Z a
b
b
f (x)dx = [F (x)]a = F (b) − F (a).
(19.3)
Příklad 19.8. Spočtěte následující určité integrály. Rπ a) 02 cos xdx. R1 b) −3 |x|dx. R e 1+ln x c) 1 x dx. ÚM FSI VUT v Brně
84
19. Určitý (Riemannův) integrál
Studijní text
π Rπ Řešení. a) 02 cos xdx = [sin x]02 = sin π2 − sin 0 = 1 − 0 = 1. b) Při hledání primitivní funkce k funkci |x| na intervalu h−3, 1i bude nutno přistoupit k rozdělení tohoto intervalu na dvě části. Dělícím bodem bude bod 0. Potom
Z
1
Z
0
−xdx +
|x|dx = −3
Z
−3
0
1
2 0 2 1 2 x x (−3)2 1 9 1 xdx = − + =0− − + − 0 = + = 5. 2 −3 2 0 2 2 2 2
c) Je vidět, že tento integrál je poněkud komplikovanější. Pokusíme se ho zjednodušit substitucí, kdy od proměnné x přejdeme k proměnné t. Tím pádem ovšem musíme přepočítat i meze určitého integrálu, které byly zadány vzhledem k původní proměnné x. Z 1 Z e substituce: 1 + ln x ln x = t 1 → 0 (1 + t) dt = dx = 1 = x 0 1 x dx = dt e → 1 1 t2 1 3 = t+ = 1 + − (0 + 0) = . 2 0 2 2
ÚM FSI VUT v Brně
85
20. Nevlastní integrál
Studijní text
20. Nevlastní integrál Poznámka 20.1. Dosud jsme se zabývali Riemannovým integrálem, který je definován pro ohraničenou Rb funkci f (x) na uzavřeném intervalu ha, bi. Tento určitý integrál jsme zapisovali f (x) dx. Nyní potřebujeme a
vyřešit, jak definovat: a)
Rb
f (x) dx, kde funkce f (x) není ohraničená. Viz Obrázek 20.1.
a
Obr. 20.1: Nevlastní integrál vlivem funkce R∞ Rb b ) f (x) dx nebo f (x) dx, tj. integrál z funkce na otevřeném intervalu. Viz Obrázek 20.2. −∞
a
Obr. 20.2: Nevlastní integrál vlivem meze
A. Nevlastní integrál vlivem funkce Definice 20.2. Nechť funkce f (x) je integrovatelná v každém intervalu ha, ti kde a < t < b a nechť je f (x) Rt neohraničená v levém okolí bodu b (viz Obrázek 20.3). Existuje-li vlastní limita lim− f (x) dx, říkáme, že t→b
integrál
Rb
a
f (x) dx konverguje. Pak pokládáme
a
Zb
Zt f (x) dx = lim−
f (x) dx.
(20.1)
t→b
a
Pokud limita lim
Rt
t→b− a
ÚM FSI VUT v Brně
a
f (x) dx neexistuje nebo je nevlastní, pak říkáme, že integrál diverguje
86
20. Nevlastní integrál
Studijní text
Obr. 20.3: Funkce neohraničená v levém okolí bodu b
Poznámka 20.3. Bodu b, pro který platí, že v jeho levém okolí je funkce f (x) neohraničená a
Rb
f (x) dx
a
konverguje říkáme singulární bod.
Poznámka 20.4. Je-li singulárním bodem bod a(tj. f (x) je neohraničená v pravém okolí bodu a a
Rb
f (x) dx
a
konverguje), je definice analogická a píšeme Zb
Zb f (x) dx = lim
f (x) dx.
t→a+
a
Příklad 20.5.
R1
Příklad 20.6.
R1
√ 1 1−x2
0
0
(20.2)
t
dx.
xln x dx.
Poznámka 20.7. Pokud jsou oba krajní body intervalu ha, bi singulární a funkce f (x) je integrovatelná na (a, b), pak rozdělíme interval libovolným bodem c (viz Obrázek 20.4) a spočteme
Zb
c
Z f (x) dx = a
a
b
Z f (x) dx +
Z
c
f (x) dx = lim
t→a+
c
t
Z f (x) dx + lim
f (x) dx.
t→b−
t
c
Poznámka 20.8. Pokud se singularita vyskytne uvnitř intervalu ha, bi, pak integrál rozdělíme právě v tomto bodě c (viz Obrázek 20.5) a spočítáme
Zb
Z f (x) dx =
Příklad 20.9.
R2
1 −1 x
ÚM FSI VUT v Brně
Z f (x) dx +
a
a
c
c
b
Z f (x) dx = lim− t→c
t
Z f (x) dx + lim
a
t→c+
b
f (x) dx. t
dx.
87
20. Nevlastní integrál
Studijní text
Obr. 20.4: Funkce se singularitami v obou krajních bodech
Obr. 20.5: Funkce se singularitou uvnitř
B. Nevlastní integrál vlivem meze
Definice 20.10. Nechť funkce f (x) je integrovatelná v intervalu ha, ∞) kde a ∈ R. Existuje-li vlastní Rb R∞ limita lim f (x) dx, říkáme, že integrál f (x) dx konverguje. Pak pokládáme b→+∞ a
a
Z∞
Zt f (x) dx = lim
f (x) dx.
t→+∞
a
Pokud limita lim
Rb
b→+∞ a
(20.3)
a
f (x) dx neexistuje nebo je nevlastní, pak říkáme, že integrál diverguje.
Poznámka 20.11. Je-li singularita v dolní mezi, je definice analogická a platí Zb
Zb f (x) dx = lim
f (x) dx.
t→−∞
−∞
(20.4)
t
Poznámka 20.12. Pokud jsou singulární body v horní i v dolní mezi, pak interval rozdělíme bodem c a píšeme
Z
∞
Z
−∞
Příklad 20.13.
f (x)x. =
R∞ 2
ÚM FSI VUT v Brně
1 x2
c
Z f (x) dx +
−∞
∞
Z f (x)x. = lim
c
t→−∞
c
Z f (x) dx + lim
t
t→+∞
t
f (x) dx. c
dx.
88
20. Nevlastní integrál
Příklad 20.14.
R∞
Příklad 20.15.
R∞
1
Studijní text √1 x
dx.
1 −∞ 1+x2
ÚM FSI VUT v Brně
dx.
89