Lineární algebra : Úvod a opakování (1. přednáška)
František Štampach, Karel Klouda LS 2013/2014 vytvořeno: 19. února 2014, 13:15
1
2
0.1
Lineární prostory R2 a R3
V této přednášce si na jednoduchém příkladu lineárního prostoru, který znáte ze střední školy, ukážeme základní pojmy lineární algebry. Cílem je studenty pomocí konkrétního a jednoduše představitelného příkladu připravit na obecnou (abstraktní) konstrukci lineárního prostoru. Prostory „šipek“ R2 a R3 budeme používat jako ilustrační příklady v celé přednášce a silně doporučujeme studentům, aby si všechny probrané pojmy snažili v těchto prostorech představit. I k tomu by měla napomoci tato úvodní přednáška. Vektor : n-tice čísel, šipka, bod
Ústředním pojmem lineární algebry je vektor. Na střední škole jste se seznámili s vektory ve dvourozměrném R2 a třírozměrném prostoru R3 a vektor jste si představovali jako šipku. Tato představa Vám často pomůže i při studiu tohoto předmětu, kde se ovšem bude pracovat s abstraktními (zobecněnými) pojmy.
Tři pohledy na vektor v R2 : uvažujme vektor ~v = (2, 1/2). Vektor jako uspořádaná dvojice čísel: ~v = (v1 , v2 ) = (2, 1/2) první souřadnice: v1 = 2 druhá souřadnice: v2 =
1 2
Vektor jako bod: 3 2 1
−1 −1
[2, 1/2] θ
1
2
3
Vektor jako šipka:
3 3
(2, 1/2)
2 1
−1 −1
(2, 1/2) θ
1
2
3
Podobně by to dopadlo pro trojrozměrný vektor z R3 , jenom by přibyla ještě třetí souřadnice v3 , a také příslušná třetí osa. Formálně ovšem můžeme pokračovat a přidávat další souřadnice a dostaneme tak nrozměrný vektor ~v = (v1 , . . . , vn ) jakožto prvek Rn . Pro n > 3 už selhává lidská představivost, ale matematika to zvládá hravě. Pro zajímavost ještě doplňme, že i číslo lze chápat jako jednorozměrný vektor ~v = v1 .
Operace s vektory Sčítání vektorů: ~ v⊕~ u
Abychom odlišili sčítání vektorů od klasického sčítání, budeme jej značit značkou ⊕. Definice 1. Sčítání vektorů v R2 definujeme jako sčítání po složkách, tedy ~v ⊕ ~u = (v1 , v2 ) ⊕ (u1 , u2 ) := (v1 + u1 , v2 + u2 ).
• Podobně bychom definovali sčítání v R3 .
• Všimněte si, že operace sčítání vektorů je definována pomocí notoricky známe operace sčítání čísel. Jak uvidíme, zdědí od ní i mnoho vlastností.
Sčítání vektorů: geometrická interpretace
Příklad 2. Součtem vektorů (2, 1) a (2, −2) dostaneme vektor (2, 1) ⊕ (2, −2) = (2 + 2, 1 − 2) = (4, −1)
4 2 (2, 1)
1
(2, −2) −2
θ
−1 −1
1 2 (4, −1)
3
4
−2
Geometrická interpretace ~v ⊕ ~u: šipku ~v položím do počátku θ = (0, 0) a napojím na ni šipku ~u, součet je šipka mezi θ a koncem šipky ~u. Sčítání vektorů: komutativita
Věta 3. Sčítání vektorů v R2 je komutativní, neboli pro libovolné ~v a ~u platí ~v ⊕ ~u = ~u ⊕ ~v . Důkaz (nemístně rozpitván). Chceme ukázat, že pro všechny ~v , ~u ∈ R2 platí ~v ⊕ ~u = ~u ⊕ ~v , neboli pro všechna reálná čísla v1 , v2 , u1 , u2 ∈ R (v1 + u1 , v2 + u2 ) = (u1 + v1 , u2 + v2 ). Dva vektory se rovnají, pokud se rovnají všechny jejich složky, neboli pokud v1 +u1 = u1 +v1 a v2 +u2 = u2 +v2 . A to platí, neboť sčítání reálných čísel komutativní je.
Co komutativita znamená pro „sčítání šipek“: Příklad 4 (ne důkaz!!!). Na pořadí při sčítání vektorů nezáleží: (2, 1) ⊕ (2, −2) = (2 + 2, 1 − 2) = (2 + 2, −2 + 1) = (2, −2) ⊕ (2, 1) 2 (2, 1)
1
(2, −2) −2
−1 −1 −2
θ
1
2 (2, −2)
3
4 (4, −1)
(2, 1)
Sčítání vektorů: komutativita (na šipkách)
5
Sčítání vektorů: asociativita
Věta 5. Sčítání vektorů v R2 je asociativní, neboli pro libovolné ~v , ~u a w ~ platí (~v ⊕ ~u) ⊕ w ~ = ~u ⊕ (~v ⊕ w). ~ Důkaz. Výše uvedenou rovnost opět s použitím definice operace ⊕ převedeme na rovnice (v1 + u1 ) + w1 = v1 + (u1 + w1 )
a (v2 + u2 ) + w2 = v2 + (u2 + w2 )
pro souřadnice z R a ty zjevně platí, neboť sčítání reálných čísel je asociativní. Sčítání vektorů: asociativita (příklad)
Příklad 6 (ne důkaz!!!). Sčítám-li tři vektory, je jedno jestli nejdříve sečtu první dva a přičtu ke třetímu, nebo sečtu druhý a třetí: ((2, 1) ⊕ (2, −2)) ⊕ (−1, 3) = (4, −1) ⊕ (−1, 3) = (3, 2) (2, 1) ⊕ ((2, −2) ⊕ (−1, 3)) = (2, 1) ⊕ (1, 1) = (3, 2) Sčítání vektorů: asociativita a komutativita revisited
• Lidsky řečeno (tj. v písemce nepoužitelné!): asociativní zákon říká, že při sčítání více vektorů mohu vynechat závorky, protože to při jakémkoli uzávorkování dopadne stejně. • Přidáme-li k asociativitě ještě komutativitu, můžeme dokonce vektory libovolně „propermutovat“ a výsledek sčítání se nezmění. • Kdybychom operaci ⊕ pro vektory definovali jako násobení po složkách ~v ⊕ ~u = (v1 u1 , v2 u2 ) bude se opět jednat o komutativní a asociativní operaci, neboť násobení čísel je komutativní a asociativní. • Operace, pro kterou toto neplatí dobře známe: odčítání a dělení čísel 3 − 2 6= 2 − 3
(8 ÷ 4) ÷ 4 6= 8 ÷ (4 ÷ 4).
6
Sčítání vektorů: asociativita a komutativita na šipkách
Sčítáme vektory (1, 1),
(1, 2),
(3, 1/2),
(−1, −5/2).
Díky asociativitě a komutativitě víme, že příslušné šipky můžeme vkládat za sebe libovolně a vždy skončíme ve stejném bodě [4, 1] (resp. součet bude vektor (4, 1)). 4 3 2 [4, 1]
1
−2
−1 −1
θ
1
2
3
4
5
−2 −3
Násobení vektoru číslem
Abychom odlišili násobení vektoru číslem od klasického násobení, budeme jej značit značkou . Definice 7. Násobení vektoru ~v z R2 číslem α z R definujeme jako α ~v = α (v1 , v2 ) := (αv1 , αv2 ).
• Podobně bychom definovali násobení vektoru z R3 . • Všimněte si, že operace je definována opět pomocí notoricky známe operace násobení čísel. Jak uvidíme, opět od ní zdědí i mnoho vlastností.
Příklad 8. Násobení vektoru (2, 1) čísly 2 a −3, 2:
Násobení vektoru číslem: geometrická interpretace
7 2
2 (2, 1) = (4, 2) (2, 1)
1
−4
−3
−2
−1 −1
θ
1
2
3
4
−3/2 (2, 1) = (−3, −3/2) −2
• Násobení číslem znamená změnu velikosti vektoru, v případě násobení záporným číslem i obrácení směru. • Je-li vektor ~v rovnoběžný s ~u, pak existuje α ∈ R tak, že ~v = α ~u. Vlastnosti operací ⊕ a
Už jsme ukázali, že ⊕ je komutativní a asociativní, podobně bychom mohli ukázat ještě mnoho dalších vlastností: 1. (∀~v , ~u ∈ R2 )( ~v ⊕ ~u = ~u ⊕ ~v ),
komutativita ⊕
2. (∀~v , ~u, w ~ ∈ R2 )( (~v ⊕ ~u) ⊕ w ~ = ~v ⊕ (~u ⊕ w) ~ ),
asociativita ⊕
3. (∀α, β ∈ R)(∀~v ∈ R2 )( α (β ~v ) = (αβ) ~v ),
asociativita
4. (∀α ∈ R)(∀~v , ~u ∈ R2 )( α (~v ⊕ ~u) = (α ~v ) ⊕ (α ~u) ),distributivita 5. (∀α, β ∈ R)(∀~v ∈ R2 )( (α + β) ~v = (α ~v ) ⊕ (β ~v ) ),distributivita 6. (∀~v ∈ R2 )( 1 ~v = ~v ), 7. (∃θ ∈ R2 )(∀~v ∈ R2 )(0 ~v = θ).
neutralita jedničky existence nulového vektoru
Všechny tyto vlastnosti platí i v případě vektorů z R3 .
• Všech sedm vlastností ⊕ a bychom snadno dokázali s využitím definice ⊕ a a vlastností operací sčítání a násobení reálných čísel. • Brzy si ukážeme další vlastnosti a tvrzení o množině vektorů s operacemi ⊕ a .
Vlastnosti operací ⊕ a : axiomy lineárního prostoru
8 • Obecně řečeno postupujeme takto: 1. Vezmeme si konkrétní množinu vektorů (R2 resp. R3 ) a na ní definujeme operace ⊕ a . 2. O této množině a nově definovaných pojmech ukazujeme další tvrzení. • V semestru budeme postupovat jinak: nebudeme zkoumat konkrétní množinu a konkrétní operace, ale obecnou konstrukci, kterou nazveme lineární prostor a která bude vymezena axiomy. • Množina vektorů (šipek) z R2 bude pouze jeden z mnoha možných příkladů lineárního prostoru.
Jak bude vypadat konstrukce abstraktního Lineárního prostoru V nad tělesem T : • Těleso je množina T skalárů (obvykle čísel), na které jsou definované dvě binární operace, které z tradičních důvodů značíme + a ·. Formálně je tedy těleso trojice (T, +, ·). Musí být navíc splněny tzv. axiomy tělesa: uzavřenost T vůči operacím + i ·, asociativita, distributivita, komutativita obou operací a existence jednotky a nuly. • My se pro zjednodušení omezíme na číselná tělesa, kde operace + a · budou klasické sčítání a násobení, a jako množinu T budeme uvažovat obvykle R nebo C. • Lineární prostor pak bude množina V objektů, kterým budeme říkat vektory, vybavená binárními operacemi ⊕:V ×V →V
a : T × V → V,
které splňují axiomy lineárního prostoru. Tyto axiomy se shodují se sedmi vlastnostmi R2 uvedenými dříve. Lineární prostor je tedy čtveřice (V, T, ⊕, ).
Obecná konstrukce lineárního prostoru (náznak)
9
Lineární kombinace Lineární kombinace
Od teď budeme namísto ⊕ a psát normální + a · (příp. nic). Z kontextu bude vždy jasné, jestli se jedná o klasické sčítání či násobení čísel, nebo o sčítání vektorů či násobení vektorů číslem. Dalším veledůležitým pojmem lineární algebry je lineární kombinace vektorů, která vznikne zřetězením operací násobení číslem a sčítání vektorů: Definice 9. Buďte ~v1 , . . . , ~vn vektory a α1 , . . . , αn reálná čísla (obecně prvky tělesa), n je přirozené. Potom vektor ~u =
n X
αk~vk = α1~v1 + · · · + αn~vn
k=1
nazveme lineární kombinací vektorů ~v1 , . . . , ~vn s koeficienty α1 , . . . , αn . Lineární obal
Příklad 10. Uvažujme dva vektory ~e1 = (1, 0) a ~e2 = (0, 1) z R2 . Tvrdíme, že každý další vektor z R2 je lineární kombinací těchto dvou. A je tomu skutečně tak: vezměme vektor ~v = (v1 , v2 ). Potom zřejmě platí, že ~v = v1 · ~e1 + v2 · ~e2 a tedy ~v je lineární kombinací vektorů ~e1 a ~e2 . Skutečně jsme ukázali, že lze nakombinovat libovolný vektor, neboť vektor ~v je vyjádřen pomocí dvou proměnných (tj. libovolných) souřadnic v1 a v2 , pro které neplatí žádné omezení (kromě předpokladu, že se jedná o reálná čísla). Použití proměnných z uvedené úvahy dělá obecný důkaz. Pokud byste vzali1 konkrétní čísla, ukázali byste přinejlepším mechanizmus, jak se důkaz zkonstruuje, ale rozhodně by se nejednalo o korektní a úplný důkaz. Jak za chvíli uvidíme, vektory ~e1 a ~e2 tvoří tzv. bázi R2 , jednou z vlastností báze je právě to, že každý vektor je jejich lineární kombinací. Abychom mohli bázi řádně definovat, potřebujeme zavést dva další důležité pojmy. Definice 11. Množinu všech lineárních kombinací vektorů ~v1 , . . . , ~vn , kde n je přirozené číslo, nazýváme jejich lineární obal a značíme h~v1 , . . . , ~vn i.
10
Lineární obal: příklady (1 ze 3)
Příklad 12 (pokračování). Uvažujme stále dva vektory ~e1 = (1, 0) a ~e2 = (0, 1) z R2 . Fakt, že každý vektor z R2 je jejich lineární kombinací můžeme nyní přeformulovat takto: h~e1 , ~e2 i = R2 , neboli že lineární obal ~e1 a ~e2 je celý prostor R2 .
Otázka: které další soubory vektorů mají tuto vlastnost?
Příklad 13. Uvažujme vektory (2, 1) a (−4, −2) a zkusme pomocí jejich lineární kombinace získat vektor (2, 2). Hledáme tedy čísla α a β tak, aby α(2, 1) + β(−4, −2) = (2, 2). Lineární obal: příklady (2 ze 3)
Příklad 14. Uvažujme vektory (2, 1) a (−4, −2) a zkusme pomocí jejich lineární kombinace získat vektor (2, 2). Hledáme tedy čísla α a β tak, aby α(2, 1) + β(−4, −2) = (2, 2). To vede na soustavu dvou rovnic o dvou neznámých 2α − 4β = 2 2α − 4β = 1, která zjevně nemá řešení. Proto jistě neplatí, že h(2, 1), (−4, −2)i = R2 .
Lineární obal: příklady (3 ze 3) 1
Jistě to mnoho lidí v písemce či zkoušce udělá.
11 Příklad 15. Uvažujme nyní vektory (2, 1) a (1, 2) a zkusme napsat vektor (v1 , v2 ) jako jejich lineární kombinaci: hledáme opět α a β tak, aby platily násl. dvě rovnice: 2α + 1β = v1 1α + 2β = v2 . Odečtením dvojnásobku druhé rovnice od první dostáváme −3β = v1 − 2v2 α + 2β = v2 . což vede na řešení β = 2v23−v1 a α = v2 − 2β = libovolný vektor umíme nakombinovat a tedy platí
2v1 −v2 . 3
Ukázali jsme, že
h(2, 1), (1, 2)i = R2 . Lineární závislost 3)
Viděli jsme že h(2, 1), (−4, −2)i = 6 R2 . Jakou množinu vektorů ale získáme: h(2, 1), (−4, −2)i =??.
Abychom si to ujasnili, reprezentujme si vektory jako šipky: 2 (2, 1)
1
−4
−3
(−4, −2)
−2
−1 −1 −2
θ
1
2
3
(1
nez
12 Vzpomeneme-li si na geometrickou interpretaci násobení vektoru číslem a sčítání vektorů, je vidět že lineární obal odpovídá přímce ve směru vektorů (2, 1) a (−4, −2).
Lineární závislost 3)
(2
nez
Důvod, proč z vektorů (2, 1) a (−4, −2) nedostaneme celý prostor R2 je ten, že jsou tyto vektory rovnoběžné, neboli jeden je násobek druhého: 1 (2, 1) = − (−4, −2) a 2
(−4, −2) = −2(2, 1).
Platí tedy h(2, 1), (−4, −2)i = h(2, 1)i = h(−4, −2)i a jeden z vektorů můžeme vyhodit, aniž bychom změnili výsledný lineární obal. Lineární nezávislost (3 ze 3)
Definice 16. Soubor n > 0 vektorů ~v1 , . . . , ~vn nazveme lineárně nezávislý, jestliže žádný z vektorů není lineární kombinací ostatních.
Kdybychom chtěli ověřit, zda daný soubor vektorů je lineárně nezávislý, nemusíme testovat všechny možnosti jak jeden vektor nakombinovat z ostatních, neboť platí následující.
Věta 17. Soubor n > 0 vektorů ~v1 , . . . , ~vn je lineárně nezávislý právě když rovnice α1~v1 + · · · + αn~vn = θ má jediné řešení α1 = α2 = · · · = αn = 0.
13 Důkaz. Předpokládejme nejdříve, že soubor je lineárně nezávislý a ukažme, že rovnice α1~v1 + · · · + αn~vn = θ má jediné řešení α1 = α2 = · · · = αn = 0. Ukážeme to sporem2 předpokládejme, že existuje řešení, kde αk 6= 0 pro nějaké 1 ≤ k ≤ n. Potom platí α1~v1 + · · · + αk−1~vk−1 + αk+1~vk+1 · · · ~vn = −αk~vk . Jelikož je αk nenulové, můžeme rovnici tímto číslem vydělit, a tak zjistíme, že vektor ~vk je lineární kombinací vektorů ostatních a soubor tak není lineárně nezávislý, což je spor. Zbývá ukázat, druhou implikaci: má-li rovnice α1~v1 + · · · + αn~vn = θ
(1)
jediné řešení α1 = α2 = · · · = αn = 0, pak musí být soubor lineárně nezávislý. Opět tuto implikaci dokážeme sporem: předpokládejme, že soubor je lineárně závislý. Potom musí existovat vektor ~vk , kde 1 ≤ k ≤ n, takový, který je lineární kombinací ostatních. Dle definice lineární kombinace to znamená, že existují koeficienty α1 , . . . , αk−1 , αk+1 , . . . , αn tak, že α1~v1 + · · · + αk−1~vk−1 + αk+1~vk+1 · · · ~vn = ~vk . To ale znamená, že rovnice (1) má nenulové řešení α1~v1 + · · · + αk−1~vk−1 − 1~vk αk+1~vk+1 · · · ~vn = θ.
Lineární nezávislost: příklady
Příklad 18. Dříve jsme si vysvětlili, že vektory (2, 1) a (−4, −2) jsou lineárně závislé. Skutečně tomu tak je, neb rovnice α(2, 1) + β(−4, −2) = θ má řešení např. α = 2 a β = 1.
14 Příklad 19. Naopak vektory (2, 1) a (1, 2) jsou lineárně nezávislé, neb rovnice α(2, 1) + β(1, 2) = θ má jediné řešení α = β = 0, jak si snadno ověříte (Udělejte to!!!). Lineární obaly v R2
Lineární obal jednoho nenulového vektoru ~v z R2 je vždy přímka. Jak to je se dvěma vektory? Věta 20. Lineární obal dvou nenulových vektorů je • přímka, jsou-li tyto dva vektory lineárně závislé (tj. rovnoběžné), • celý prostor R2 , jsou-li lineárně nezávislé. Důkaz. Zatím intuitivně (s pomocí geometrické představy). Dimenze a báze lineárního prostoru
Z předchozí věty plyne, že každý tří a vícečlenný soubor (nenulových) vektorů je lineárně závislý. Skutečně: máme-li tři vektory, je jejich lineární obal buď přímka, a pak jsou jistě lineárně závislé, neb musí být všechny rovnoběžné, anebo v souboru jsou dva lineárně nezávislé vektory a tedy jejich lineární obal je celé R2 . Z toho nutně plyne, že třetí vektor lze nakombinovat z těchto dvou a tedy celý soubor je lineárně závislý. Tento fakt lze formulovat takto: největší lineárně nezávislý soubor vektorů v R2 má dva členy. Číslu které vyjadřuje velikost největšího lineárně nezávislého souboru říkáme dimenze lineárního prostoru. Platí tedy, že dimenze R2 je dva. Nyní je jasné, že lineární obal lineárně nezávislého dvoučlenného souboru vektorů je celé R2 , takovému souboru budeme říkat báze. Obecně budeme definovat bázi jako lineárně nezávislý soubor n vektorů, kde n je dimenze daného lineárního prostoru (pokud je dimenze konečná). Báze lineárního prostoru R2 : příklady 2
Dokazujeme-li implikaci A ⇒ B sporem, ukážeme, že nemůže platit negace, tedy A∧¬B. Zde A = soubor vektorů je lineárně nezávislý a B = rovnice má jediné nulové řešení
15 Příklad 21. Viděli jsme, že vektory ~e1 = (1, 0) a ~e2 = (0, 1) mají jako lineární obal R2 a tvoří tedy bázi. Těmto vektorům se říká standardní báze R2 a značíme je E = ((1, 0), (0, 1)).
Příklad 22. Další bází, kterou jsme si ukázali, byl soubor X = ((2, 1), (1, 2)). Lineární prostor R3
Vše, co jsme si řekli o R2 , lze rozšířit i na R3 .
• Dimenze R3 je rovna třem.
• Dva vektory jsou lin. nezávislé, nejsou-li rovnoběžné. Jejich lineární obal je pak rovina, která tyto dva vektory obsahuje.
• Tři vektory jsou lin. nezávislé, pokud neleží všechny v jedné rovině. Je-li tomu tak, je jejich lineárním obalem celé R3 a tyto vektory tvoří bázi.
• Standardní bází R3 jsou vektory E = ((1, 0, 0), (0, 1, 0), (0, 0, 1)).