INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ
LEKCE Z LINEÁRNÍ ALGEBRY
Marek Jukl
Olomouc 2012
Předmluva Učební text Lekce z lineární algebry je určen pro kurz lineární algebry ve 2. semestru bakalářského studia matematiky zaměřeného na ekonomii na Přírodovědecké fakultě Univerzity Palackého v Olomouci (ve stávající nomenklatuře předmětů se jedná o předmět KAG/LA2S). Skripta tak zahrnují základní poznatky o euklidovských vektorových prostorech, homomorfizmech vektorových prostorů a pseudoinverzi a jsou členěna tak, že každá podkapitola odpovídá v zásadě jedné přednášce. Tyto partie tvoří základní kameny lineární algebry a aplikují se v dalších matematických disciplínách (např. matematická analýze, geometrii či matematické statistice), ale pro Vás je důležité zejména to, že jsou základem matematického aparátu aplikovaného k popisu ekonomických jevů. Text má konspektivní charakter a neklade si za cíl přednášky nahradit – naopak, má studentům poskytnout základní faktografii předmětu, aby přednášky mohly být věnovány budování, resp. zdůraznění, logické výstavby příslušné matematické disciplíny a jejím vnitřním souvislostem. Každá kapitola obsahuje vzdělávací cíle, motivaci i konkrétní úkoly – dává tak studentovi možnost, aby sám, již před vlastní přednáškou, se s danou sekcí seznámil a určil si otázky, ke kterým je třeba přednášku zvláště zaměřit. K zaznamenání poznatků na přednášce slouží pak volný list řazený za každou z podkapitol. Studenti s hlubším zájmem o lineární algebru uvítají seznam další doporučené literatury. V textu jsou barevně odlišeny texty definic (červený rámeček) a matematických vět (šedý rámeček). Jako průvodci textem Vám poslouží následující ikony, které by vám měly usnadnit samostatnou práci s ním. Cíle: Na začátku každé kapitoly naleznete konkrétně formulované cíle. Jejich prostřednictvím získáte přehled o tom, čemu budete po nastudování příslušného tématického rozumět a co budete schopni dělat. Motivace: Odstavec, v němž by mělo být vysvětleno, proč se danou problematikou vůbec hodláme zabývat. Má vás motivovat k tomu, abyste studovali právě tuto pasáž. Průvodce: Pasáž, v níž se poukazuje na propojenost učiva s jinými částmi textu či Vašimi předchozími znalostmi. Jde tedy o jakési „zasazení do kontextuÿ. Zapamatujte si: Mělo by sloužit pro upozornění na nějakou chybu, které se studenti často (a úplně zbytečně) dopouštějí. Úkol: Jeho prostřednictvím jste vybídnuti k tomu, abyste na základě studia určité tématiky něco vytvořili. Má převážně aplikační charakter. 3
Otázky: Prověřují, do jaké míry jste učivo pochopili, zapamatovali si podstatné informace a zda je umíte aplikovat. Listopad 2012 Autor
4
Obsah 1 Euklidovský vektorový prostor 1.1 Základní pojmy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Kolmost v euklidovském vektorovém prostoru . . . . . . . . . . . 1.3 Vzdálenost a odchylka v euklidovském vektorovém prostoru . . . . 1.3.1 Grammovy determinanty, vnější a ortogonální součin . . . 1.3.2 Vzdálenost a odchylka v euklidovském vektorovém prostoru
7 7 13 23 23 28
2 Homomorfizmy vektorových prostorů 2.1 Základní pojmy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Vektorový prostor homomorfizmů; skládání homomorfizmů . . . . 2.2.1 Vektorový prostor homomorfizmů . . . . . . . . . . . . . . 2.2.2 Skládání homomorfizmů . . . . . . . . . . . . . . . . . . . 2.3 Endomorfizmy vektorového prostoru . . . . . . . . . . . . . . . . . 2.4 Vlastní hodnoty a vlastní podprostory endomorfizmů vektorového prostoru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Homomorfizmy euklidovských vektorových prostorů . . . . . . . . 2.5.1 Ortogonální projekce . . . . . . . . . . . . . . . . . . . . . 2.5.2 Ortogonální homomorfizmy . . . . . . . . . . . . . . . . .
37 37 46 46 49 51
3 Faktorové vektorové prostory
71
4 Duální vektorový prostor
79
5 Pseudoinverzní matice a homomorfizmy 5.1 Pseudoinverzní matice . . . . . . . . . . . . . . . . . 5.2 Moor–Penroseova pseudoinverze. Optimální přibližné stav lineárních rovnic. . . . . . . . . . . . . . . . . . 5.2.1 Moor–Penroseova pseudoinverzní matice . . . 5.2.2 Moor–Penroseův homomorfizmus . . . . . . . Doporučená literatura
. . . . . . . řešení sou. . . . . . . . . . . . . . . . . . . . .
57 63 63 65
84 84 88 88 92 97
5
6
1
Euklidovský vektorový prostor
1.1
Základní pojmy Student umí vymezit euklidovský vektorový prostor, rozezná skalární součin, dovede zavést v euklidovském vektorovém prostoru metriku, určit normu vektoru a úhel vektorů. Ze střední školy pojem skalární součin dvou vektorů znáte - zaváděli jste jej však pomoci intuitivně chápaných pojmů úhel a délka vektoru. Zde se dozvíte, jak zavést pojem skalárního součinu axiomaticky a jak pomocí něj vymezit pojmy délka a úhel vektorů. Také se seznámíte s pojmem vzdálenost dvou vektorů.
Definice 1.1 Euklidovským vektorovým prostorem rozumíme každý vektorový prostor V nad tělesem reálných čísel R spolu se zobrazením · : V × V → R majícím následující vlastnosti ∀u, v, w ∈ V, ∀t ∈ R : 1. u · v = v · u,
2. u · (v + w) = u · v + u · w,
3. (tu) · v = t(u · v),
4. u 6= o ⇒ u · u > 0. V tomto případě nazýváme zobrazení · : V × V → R skalárním součinem na V a reálné číslo u · v pak skalárním součinem vektorů u a v. Poznámka 1.1 • Euklidovský vektorový prostor z definice 1.1 je možné chápat jako uspořádanou dvojici (V, ·). Na témže reálném vektorovém prostoru můžeme definovat různé vektorové součiny a dostáváme tak obecně různé euklidovské vektorové prostory. • Vzhledem k tomu, že typograficky odlišujeme skaláry (t, r, s ∈ R) a vektory (u, v, w ∈ V), píšeme namísto u·v jen uv, neboť nehrozí záměna s násobením vektoru skalárem, např. tu. • V literatuře se můžete také setkat s jiným označeními skalárního součinu vektorů u a v, např.
, β(u, v) apod.
7
Pamatujte si, že skalární součin zavádíme jen pro vektorové prostory nad reálnými čísly1 . Někdy bývá zvykem skalární součin vektoru u se sebou samým označovat u2 , namísto uu, a hovořit o skalárním čtverci vektoru u. Upozorněme výslovně, že však nemají žádný význam zápisy typu u3 , u4 apod. Příklad 1.1 Rozhodněte, která z následujících zobrazení „·ÿ jsou skalárním součinem na příslušném vektorovém prostoru V: (i) V = R2 , (x1 , x2 ) · (y1 , y2 ) = 2x1 y1 + x1 y2 + x2 y1 + x2 y2 , [ano] P (ii) V = Rn , (x1 , x2 , . . . , xn ) · (y1 , y2 , . . . , yn ) = ni=1 xi yi , [ano; tento součin bývá nazýván standardní skalární součin na Rn ] (iii) V = R3 , (x1 , x2 , x3 ) · (y1 , y2 , y3 ) = 2x1 y1 + x1 y2 + x2 y1 + x2 y2 , [ne] (iv) V = R2 , (x1 , x2 ) · (y1 , y2 ) = 2x1 y1 + x1 , [ne] (v) V = R3 , (x1 , x2 , x3 ) · (y1 , y2 , y3 ) = 2x1 y1 + x1 y2 + x2 y1 + 2x2 y2 + 2x3 y3 . [ano] Věta 1.1 Buď V se skalárním součinem · euklidovský vektorový prostor. Pak libovolný podprostor W ⊆⊆ V je spolu s restrikcí ·|W × W euklidovským vektorovým prostorem. Důsledek 1.1 Všechny pojmy zaváděné pro euklidovské vektorové prostory lze přenést do jejich podprostorů (aniž by je bylo nutno definovat znova). Všechny věty platné pro euklidovské vektorové prostory platí i pro jejich podprostory (a není je nutno znova dokazovat). Věta 1.2 Pro každé ∀u, v ∈ V a všechna t, r ∈ R platí: 1. (tu)(rv) = (tr)uv,
2. uu = 0 ⇔ u = o,
3. (∀x ∈ V : xu = 0) ⇔ u = o,
4. u = v ⇔ (∀x ∈ V : xu = xv).
1
jeho zobecněním pro čísla komplexní je tzv. unitární součin
8
Důsledek 1.2 Pro libovolný vektor u ∈ V platí: uu ≥ 0. K odstavci 4 věty 1.2: Uvědomte si, že pouhá existence vektoru x, pro nějž xu = xv, nezaručuje rovnost u = v – např. v R2 se standardním skalárním součinem je (1, 1) · (1, 0) = (1, 1) · ( 12 , 21 ), avšak (1, 0) 6= ( 12 , 21 ). Definice 1.2 Buď u ∈ V. Pak normou vektoru u rozumíme číslo označované kuk a definované takto: √ kuk = uu. Je-li kuk = 1, řekneme, že vektor u je normovaný.
Příklad 1.2 Napište formule pro normy určené skalárními součiny z příkladu 1.1. [Řešení: Ukažme řešení např. pro skalární součin (i): V souladu s definicí 1.2 můžeme pro vektor u = (u1 , u2 ) ∈ R2 psát p √ √ kuk = uu = (u1 , u2 )(u1 , u2 ) = 2u1 u1 + u1 u2 + u2 u1 + u2 u2 = q = 2u21 + 2u1 u2 + u22 Pro skalární součin (ii) obdržíme analogicky relaci q kuk = u21 + u22 + u23 .]
Věta 1.3 Pro libovolné vektory u, v ∈ V a libovolný t ∈ R platí: 1. ktuk = |t| kuk;
2. kuk = 0 ⇔ u = o;
3. kuk > 0 ⇔ u 6= o;
4. kuk kvk ≥ |uv|, přičemž rovnost nastává, právě když u, v jsou lineárně závislé; 5. kuk + kvk ≥ ku + vk, přičemž rovnost nastává, právě když existuje t ∈ R, t ≥ 0, tak, že v = tu nebo u = tv;
6. |kuk − kvk| ≤ ku − vk, přičemž rovnost nastává, právě když existuje t ∈ R, t ≥ 0, tak, že v = tu nebo u = tv.
O nerovnosti 4 z věty 1.3 se hovoří jako o Cauchyově či Schwarzově, o nerovnosti 5 pak jako o trojúhelníkové. 9
Definice 1.3 Buďte u, v ∈ V. Pak úhlem vektorů u a v rozumíme číslo z intervalu < 0, π > označované ∡(u, v) a definované takto: 1. u6=o6=v : ∡(u, v) = arccos kuuv , k kvk 2. u=o ∨ v=o : ∡(u, v) = π2 . Důsledek 1.3 Pro libovolné u, v ∈ V platí: 1. ∡(u, v)= π2 ⇔ uv=0, 2. uv = kuk kvk cos ∡(u, v). Poznámka 1.2 • Díky komutativitě skalárního součinu (viz vlastnost 1 definice 1.1) je zřejmě pro libovolné u, v ∈ v ∡(u, v) = ∡(v, u). • Bod 1 právě uvedeného důsledku využijeme v další lekci k formulaci kriteria kolmosti dvou vektorů. • Vztah uvedený v bodě 2 bývá na středních školách používán právě k zavedení skalárního součinu pomocí pojmů délka vektoru a úhel vektorů. Vidíme, že námi axiomaticky zavedený skalární součin definicí 1.1 zcela odpovídá intuitivně chápanému pojmu SŠ matematiky. Po zavedení pojmů délka vektoru a úhel dvou vektorů nyní zavedeme pojem metrika neboli vzdálenost dvou vektorů. V matematické analýze se seznámíte s pojmem metrický prostor, což je libovolná neprázdná množina M spolu se zobrazením ρ : M × M → R+ , nazývaným metrika na M, majícím tyto vlastnosti: 1. ∀x, y ∈ M, x 6= y : ρ(x, y) = ρ(y, x) > 0, 2. ∀x ∈ M : ρ(x, x) = 0,
3. ∀x, y, z ∈ M : ρ(x, y) + ρ(y, z) ≥ ρ(y, z). Již teď patrně vidíte, že ρ je přirozeným zobecněním pojmu vzdálenost dvou bodů prostoru, který pro body intuitivně chápané euklidovské roviny nebo třírozměrného prostoru znáte z geometrie na základní a střední škole. Se vzdáleností vektorů jste přitom patrně na SŠ nepracovali.
10
Věta 1.4 Buď V euklidovský vektorový prostor. Zobrazení ρ : V × V → R+ definované vztahem ∀u, v ∈ V : ρ(u, v) = kv − uk
(1.1)
je metrikou na množině V. Definice 1.4 Buď V spolu se skalárním součinem · euklidovský vektorový prostor. Pak metrika ρ definovaná na V vztahem (1.1) se nazývá metrika indukovaná skalárním součinem ·. Poznámka 1.3 Každý euklidovský vektorový prostor je tedy současně prostorem metrickým. Na daném euklidovském vektorovém prostoru lze ovšem zavést i jiné metriky, než je metrika indukovaná skalárním součinem. V případě aritmetického vektorového prostoru Rn se standardním skalárním součinem je metrika indukovaná tímto součinem dána formulí (srv. příklad 1.2): v u n uX ρ((x1 , . . . , xn ), (y1 , . . . , yn )) = t (yi − xi )2 . i=1
Na témže vektorovém prostoru můžeme ovšem zavést metriku ρ′ např. také vztahem ρ′ ((x1 , . . . , xn ), (y1 , . . . , yn )) = Max{|yi − xi |}ni=1 , která je různá od metriky indukované uvažovaným skalárním součinem.
Uvažujeme-li nyní aritmetický vektorový prostor R2 se skalárním součinem definovaným formulí (i) z příkladu 1.2, pak předpis pro metriku indukovanou tímto skalárním součinem zní p ρ((x1 , x2 ), (y1 , y2 )) = 2(y1 − x1 )2 + 2(y1 − x1 )(y2 − x2 ) + (y2 − x2 )2 .
11
Poznámky:
12
1.2
Kolmost v euklidovském vektorovém prostoru Student umí definovat pojem kolmost vektorů euklidovského vektorového prostoru, dovede zkonstruovat ortogonální doplněk libovolného podprostoru a rozhodnout o kolmosti dvou podprostorů euklidovského vektorového prostoru. K dané bázi sestrojí její ortonormalizaci. Student zná euklidovské formule pro skalární součin, normu a vzdálenost dvou vektorů. Ze střední školy máte jistě intuitivní představu o kolmosti dvou vektorů, kolmosti vektoru na množinu vektorů a v případě jedno- a dvourozměrných podprostorů dvoj- nebo třírozměrného prostoru i o jejich vzájemné kolmosti. Zde se dozvíte, jak zavést pojem kolmosti v euklidovských vektorových prostorech obecně tak, aby odpovídal vaší intuitivní představě o několika konkrétních případech. Ukážete si, že v ortonormální bázi má formule pro skalární součin dvou vektorů velmi jednoduchý tvar a naučíte se v každém euklidovském vektorovém prostoru ortonormální bázi sestrojit.
Definice 1.5 Buďte u, v∈V. Řekneme, že vektory u, v jsou kolmé (ortogonální), což značíme u⊥v, jestliže ∡(u, v) = π2 . Poznámka 1.4 S ohledem na poznámku 1.2 je relace být kolmý opravdu symetrická, tj. nemusíme rozlišovat zda u⊥v či v⊥u. Z důsledku 1.3 dostáváme následující kriterium kolmosti dvou vektorů (bývá někdy v literatuře používáno pro definici kolmosti dvou vektorů). Věta 1.5 Buďte u, v∈V. Pak platí: v⊥u ⇔ uv = 0. Definice 1.6 Nechť U ⊂ V. Řekneme, že 1. U je ortogonální množinou vektorů, jestliže platí ∀u, v ∈ U : u 6= v ⇒ uv = 0, 2. U je ortonormální množinou vektorů, jestliže U je ortogonální množinou vektorů jednotkové délky. Pro konečné podmnožiny vektorů dostáváme2 : Připomeňme, že symbol δij , nazývaný Kroneckerovo delta, je definovaný pro libovolná přirozená čísla i, j takto: 0 pro i 6= j, δij = 1 pro i = j. 2
13
Věta 1.6 Nechť U = {u1 , u2 , . . . , uk } ⊂ V. Pak platí: 1. U je ortogonální množinou, právě když ∀i, j ∈ N : i 6= j ⇒ ui uj = 0, 2. U je ortonormnální množinou, právě když ∀i, j ∈ N : ui uj = δij . Poznámka 1.5 Poznamenejme, že i když se někdy užívá – pro zjednodušení – obratu ortogonální, resp. ortonormální, vektory, jde vždycky o vlastnost nikoli jednotlivých vektorů, ale celé jimi tvořené množiny. Podobně, jako v případě obratu vektory lineárně nezávislé, resp. závislé. Nyní si všimneme vztahu mezi ortogonalitou množin vektorů a jejich lineární (ne)závislosti. Zavedeme zvláštní název pro báze tvořené ortonormální množinou vektorů. Věta 1.7 Každá ortogonální podmnožina nenulových vektorů z V je lineárně nezávislá. Důsledek 1.4 Každá ortonormální podmnožina vektorů z V je lineárně nezávislá. Pamatujte si, že ve větě 1.7 nelze předpoklad nenulovosti vektorů vynechat – přidáním nulového vektoru k jakékoli množině vektorů získáme vždy množinu lineárně závislou.
Definice 1.7 Řekneme, že báze B euklidovského vektorového prostoru V se nazývá 1. ortogonální bází, jestliže B je ortogonální podmnožinou ve V,
2. ortonormální bází, jestliže B je ortonormální podmnožinou ve V.
Z věty 1.7 pak snadno vyplývá, že
14
Důsledek 1.5 1. Každá n-členná ortogonální podmnožina nenulových vektorů z V je ortogonální bází V, 2. Každá n-členná ortonormální podmnožina vektorů z V je ortonormální bází V.
Následující věta, plynoucí z vlastností skalárního součinu a věty 1.6, říká, kdy je skalární součin dán tzv. euklidovskou neboli kartézskou formulí pomocí souřadnic daných vektorů. Jednoduchost této formule je příčinou, proč se v praxi snažíme zpravidla volit za báze v euklidovských prostorech právě báze ortonormální (viz také věta 1.9 a její důsledek). Vyplývá z ní mj. že v aritmetickém euklidovském vektorovém prostoru Rn se standardním skalárním součinem je jednou z ortonormálních bází tzv. báze standardní3 . Věta 1.8 Buď B báze prostoru V. Báze B je ortonormální, právě když platí: ∀u, v∈V, {u}B ={u1 , . . . , un }, {v}B = {v1 , . . . , vn } : uv =
n X
uj v j .
(1.2)
j=1
Připomeňme, že symbolem {x}B značíme souřadnice vektoru x v bázi B. Poznámka 1.6 Euklidovskou formuli (1.2) lze maticově přepsat takto: uv = {u}B {v}TB . Věta 1.9 Buď B báze prostoru V. Báze B je ortonormální, právě když platí: v uX u n 2 uj . ∀u∈V, {u}B ={u1 , . . . , un } : kuk = t j=1
3
tj. báze tvořená aritmetickými vektory (1, 0, . . . , 0), (0, 1, . . . , 0), . . . , (0, 0, . . . , 1)
15
Důsledek 1.6 Buď B báze prostoru V. Báze B je ortonormální, právě když platí: v uX u n ∀u, v∈V, {u}B ={u1 , . . . , un }, {v}B ={v1 , . . . , vn } : ρ(u, v) = t (vj − uj )2 . j=1
Zatím však ještě nevíme, zda v libovolném euklidovském prostoru alespoň jedna ortonormální báze existuje. Matematickou indukcí (pro dimenzi prostoru) byste ověřili platnost následující věty [zkuste!], z níž získáme odpověď na tuto otázku. Věta 1.10 Ortonormální bázi libovolného podprostoru euklidovského vektorového prostoru lze doplnit na ortonormální bázi tohoto prostoru. Důsledek 1.7 V každém euklidovském vektorovém prostoru existuje alespoň jedna ortonormální báze. Příklad 1.3 V euklidovském vektorovém prostoru z úlohy (v) v příkladu 1.1 najděte alespoň jednu ortonormální bázi. [Návod: zvolte libovolný nenulový vektor e¯1 z V a hledejte množinu vektorů na něj kolmých. V ní vyberte libovolný nenulový vektor e¯2 a konečně hledejte množinu vektorů kolmých současně na e¯1 a na e¯2 současně a v ní vyberte vektor e¯3 . Takto získáte ortogonální bázi ve V. Vynásobíte-li každý e¯i číslem ke1i k , obdržíte hledanou ortonormální bázi. Např. vektory e1 = ( √ 2 e3 = (0, 0, 2 ) jsou jedním z řešení.]
√ 2 , 0, 0), 2
e2 = (
√ √ 6 6 , − , 0), 6 3
Příklad 1.4 V aritmetickém vektorovém prostoru R3 jsou dány vektory e1 = (1, 1, 0), e2 = (0, 1, 1), e3 = (0, 0, 1). Najděte skalární součin · na R3 tak, aby B = <e1 , e2 , e3 > byla ortonormální bází. [Návod: Skalární součin dvou vektorů pomocí vyjádřený pomocí souřadnic v bázi B musí být dán formulí (1.2). Využijte pak transformace souřadnic od báze B do standardní báze. Řešení: u · v = 3u1 v1 − 2u1 v2 + u1 v3 − 2u2 v1 + 2u2 v2 − u2 v3 + u3 v1 − u3 v2 + u3 v3 . ] Platnost následující věty snadno odvodíte z definice matice přechodu, definice součinu matic a relace (1.2). 4 4
Symbolem (B, C) budeme v celém textu rozumět matici přechodu od báze B k bázi C.
16
Věta 1.11 Buď B ortonormální a C libovolná další báze euklidovského vektorového prostoru. Pak je báze C ortonormální, právě když platí: (B, C)(B, C)T = E
Definice 1.8 Reálnou čtvercovou matici A nazýváme ortogonální matice, jestliže AAT = E.
Věta 1.12 Reálná čtvercová matice řádu n je ortogonální, právě když její řádky tvoří ortonormální bázi aritmetického vektorového prostoru Rn se standardním skalárním součinem. Důsledkem vět 1.11 a 1.12 je: Věta 1.13 Množina ortogonálních matic daného řádu spolu s násobením matic tvoří grupu, která je podgrupou v multiplikativní grupě reálných regulárních matic téhož řádu. Připomeňme, že dvě báze daného reálného vektorového prostoru se nazývají souhlasné, jestliže determinant matice přechodu od jedné z nich ke druhé je kladný. Následující věta, zvaná též Grammův-Schmidtův ortonormalizační proces ukazuje, že ke každé bázi euklidovského vektorového prostoru lze sestrojit jistou, jednoznačně určenou, ortonormální bázi (tzv ortonormalizace výchozí báze). Věta 1.14 Ke každé bázi U = euklidovského vektorového prostoru V existuje právě jedna ortonormální báze V = tohoto prostoru s vlastnostmi: 1. pro všechna r, r = 1, . . . , n, platí: [u1 , u2 , . . . , ur ] = [v1 , v2 , . . . , vr ], 2. pro všechna r, r = 1, . . . , n, jsou a souhlasnými bázemi podprostoru jimi generovaného. Přibližme si konstrukci ortonormální báze, jejíž existenci zaručuje právě řečená věta (její důkaz je právě na této konstrukci založen a mohli byste jej provést matematickou indukcí pro n = dim V):
17
Hledejme nejprve k bázi U ortogonální bázi W = <w1 , w2 , . . . , wn > splňující požadavky 1 a 2 předešlé věty. Pak již snadno vektory báze W normalizujeme a obdržíme hledanou bázi V. Položme w 1 = u1 . (1.3) Vektor w2 budeme hledat ve tvaru w2 = u2 + tw1 ,
(1.4)
což spolu s (1.3) evidentně znamená splnění požadavků 1 i 2 pro r = 2 5 . Nyní rovnost (1.4) vynásobme skalárně vektorem w1 , čímž dostaneme: w1 w2 = w1 u2 + t(w1 w1 ).
(1.5)
Protože požadujeme, aby W byla ortogonální, položíme w1 w2 = 0. Rovnice 0 = w1 u2 + t(w1 w1 ) o neznámé t je jednoznačně řešitelná, neboť (w1 w1 ) = 6 0. Dosazením řešení t do rovnosti (1.4) dostáváme vektor w2 tvořící spolu s w1 bázi požadovaných vlastností pro r = 2. Dále postupujeme analogicky volbou w 3 = u 2 + t 2 w 2 + t 1 w1 .
(1.6)
Tuto rovnost vynásobíme nejprve vektorem w1 , čímž, položíme-li w1 w3 = 0, dostaneme řešitelnou rovnici o neznámé t1 , protože w1 ⊥w2 . Vynásobením rovnosti (1.6) vektorem w2 pak, položíme-li w2 w3 = 0, dostaneme řešitelnou rovnici o neznámé t2 a můžeme tedy spočíst w3 . Takto postupujeme stále dále až nakonec obdržíme vektor wn tvořící se svými předchůdci ortogonální bázi W požadovaných vlastností. Příklad 1.5 Nechť je dán vektorový prostor R3 se skalárním součinem definovaným relací (x1 , x2 , x3 ) · (y1 , y2 , y3 ) = 2x1 y1 + x1 y2 + x2 y1 + x2 y2 + 2x3 y3 . Ortonormalizujte bázi U = 6 , kde u1 = (1, 0, 0), u2 = (0, 1, 0), u3 = (0, 0, 1). příslušná „kandidátkaÿ na matici přechodu mezi bázemi a <w1 , w2 > má tvar , je tedy regulární a navíc s kladným determinantem. přesvědčte se, že U vzhledem ke zvolenému skalárnímu součinu opravdu není ortonormální
5 1 0 t 1 6
18
[Řešení: v1 =
√
2 (1, 0, 0), 2
v2 =
√
2(− 12 , 1, 0), v3 =
√
2 (0, 0, 1).] 2
Definice 1.9 Buďte u∈V, Q⊆V. Řekneme, že vektor u je kolmý (ortogonální) na množinu Q, což značíme u⊥Q, jestliže je kolmý na všechny vektory náležící Q. Je-li množina Q navíc podprostorem, dostaneme následující užitečné kriterium. Věta 1.15 Buďte u∈V, U⊆⊆V. Pak je vektor u kolmý na U, právě když je kolmý na některou (a pak tedy na každou) množinu generátorů podprostoru W. Definice 1.10 Buď Q⊆V. Ortogonálním doplňkem množiny Q ve V rozumíme množinu právě všech vektorů z V kolmých na Q a značíme jej Q⊥ . Důsledek 1.8 1. Buď Q⊆V. Pak platí: Q⊥ = {y ∈ V; ∀x ∈ Q : xy = 0}. 2. Buď Q ⊆⊆ V, Q = [u1 , . . . , uk ]. Pak platí: Q⊥ = {y ∈ V; ∀i, i=1, . . . , k : ui x = 0}. Věta 1.16 Buď U ⊆⊆ V. Pak platí: 1. dim U⊥ = dim V − dim U,
2. V = U ⊕ U⊥ , 3. U⊥⊥ = U.
Je-li U ⊆⊆ V, pak lze dle odstavce 2 právě uvedené věty každý vektor x ∈ V právě jedním způsobem psát ve tvaru x = x∗ + x⊥ , kde x∗ ∈ U, x⊥ ∈ U⊥ . Tento důležitý výsledek využijeme později ke konstrukci tzv. kolmého průmětu vektoru do podprostoru.
19
Věta 1.17 Buďte U, W ⊆⊆ V. Pak platí: 1. (U + W)⊥ = U⊥ ∩ W⊥ ,
2. (U ∩ W)⊥ = U⊥ + W⊥ , 3. U ⊆ W ⇔ W⊥ ⊆ U⊥ .
Intuitivní představa vypěstovaná ve školské geometrii roviny a třírozměrného prostoru nás vede k tomu chápat dvě přímky jako kolmé, jsou-li kolmé jejich směrové vektory, tedy náleží-li směr jedné z nich ortogonálnímu doplňku směru druhé. Podobně, přímku chápeme jako kolmou na rovinu, právě když je kolmá ke dvěma různoběžkám této roviny, nebo-li náleží-li její směr ortogonálnímu doplňku zaměření této roviny. Konečně dvě roviny pokládáme za kolmé, obsahuje-li jedna kolmici na druhou z nich, neboli je-li ortogonální doplněk zaměření druhé obsažen v zaměření první. Přirozená se nám tak jeví následující definice.
Definice 1.11 Buďte U, W ⊆⊆ V. Řekneme, že podprostor U je kolmý na podprostor W, což značíme U⊥W, jestliže U ⊆ W⊥ ∨ W⊥ ⊆ U. Z vět 1.16, 1.17 plyne Důsledek 1.9 Relace „být kolmýÿ na množině podprostorů daného vektorového prostoru je symetrická. O dvojici podprostorů tak můžeme jednoduše hovořit jako o kolmých podprostorech. Připomeňme, že vektorovou nadrovinou ve vektorovém prostoru dimenze n rozumíme každý jeho (n − 1)-rozměrný podprostor. Věta 1.18 1. Ke každé vektorové nadrovině N ⊂ V existuje až na nenulový násobek jediný (a to nenulový) vektor n ∈ V tak, že N = {x ∈ V : xn = 0}.
(1.7)
2. Ke každému nenulovému vektoru n ∈ V existuje právě jedna vektorová nadrovina N ⊂ V tak, že platí (1.7). 20
Definice 1.12 Buď N libovolná nadrovina ve V. Pak N⊥ se nazývá normálový směr vektorové nadroviny N a každý generátor normálového směru se nazývá normálový vektor vektorové nadroviny N. Z věty 1.18 plyne: Věta 1.19 Buď N libovolná nadrovina ve V, B některá ortonormální báze ve V. Pak pro normálový vektor nadroviny N platí: {n}B = (a1 , a2 , . . . , an ), právě když N = {x ∈ V, {x}B = (x1 , x2 , . . . , xn ) : a1 x1 + a2 x2 + · · · + an xn = 0}. Příklad 1.6 V euklidovském vektorovém prostoru V3 je dán podprostor W = [w1 , w2 ]. Nalezněte ortogonální doplněk W⊥ , jestliže v ortonormální bázi B je dáno: {w1 }B = (1, 2, 0), {w2 }B = (1, 1, 1).
[Návod: využijte odstavec 2 důsledku 1.8. Řešení: W⊥ = [(2, −1, −1)].
Podprostor W je vektorovou nadrovinou, kterou můžeme (podle věty 1.19) zadat rovnicí 2x1 − x2 − x3 = 0.
21
Poznámky:
22
1.3
Vzdálenost a odchylka v euklidovském vektorovém prostoru Student umí definovat pojmy vzdálenost a odchylka vektoru od podprostoru euklidovského vektorového prostoru. Dovede vymezit pojmy ortogonální a vnější součin. Umí zkonstruovat kolmý průmět vektoru do podprostoru, určit vzdálenost a odchylku vektoru od daného podprostoru. Student dovede používat metodu nejmenších čtverců, zná vlastnosti vnějšího a ortogonálního součinu vektorů v euklidovském vektorovém prostoru a dovede je aplikovat. Z předchozí kapitoly víte, že euklidovský vektorový prostor je přímým součtem libovolného svého podprostoru a jeho ortogonálního doplňku. Nyní se naučíte – s využitím rozkladu libovolného vektoru – určovat vzdálenost a odchylku vektoru od daného podprostoru. Seznámíte se s přirozenými aplikacemi tohoto aparátu lineární algebry v geometrii a při řešení soustav lineárních rovnic. Poznáte, že pojem smíšeného a vektorového součinu, se kterým jste pracovali na SŠ ve fyzice, má své zobecnění i pro vyšší dimenze.
1.3.1
Grammovy determinanty, vnější a ortogonální součin Než přistoupíme k pojmům vzdálenost a odchylka vektoru od podprostoru, bude užitečné zavést pojmy Grammova matice, ortogonální a vnější součin.
Definice 1.13 Buďte u1 , . . . , uk ∈ V. Pak 1. Grammovou maticí vektorů u1 , . . . , uk rozumíme matici označovanou G(u1 , . . . , uk ) a definovanou takto: u1 ·u1 u1 ·u2 . . . u1 ·uk u2 ·u1 u2 ·u2 . . . u2 ·uk G(u1 , . . . , uk ) = .. .. .. . . . uk ·u1 uk ·u2 . . . uk ·uk 2. Grammovým determinantem vektorů u1 , . . . , uk rozumíme číslo označované G(u1 , . . . , uk ) a definované takto: G(u1 , . . . , uk ) = det G(u1 , . . . , uk ). Poznámka 1.7 Grammova matice je zřejmě reálná symetrická matice.
23
Věta 1.20 Pro libovolné u1 , . . . , uk ∈ V platí: 1. G(u1 , . . . , uk ) ≥ 0,
2. G(u1 , . . . , uk ) = 0, právě když vektory u1 , . . . , uk jsou lineárně závislé, 3. ∀π ∈ Sk : G(uπ(1) , . . . , uπ(k) ) = G(u1 , . . . , uk ). Symbolem Sk se rozumí množina všech permutací množiny {1, 2, . . . , k}. Připomeňme, že orientovat vektorový prostor V znamená prohlásit některou z jeho bází za kladnou. Kladnými bázemi se pak rozumí všechny báze s ní souhlasné; báze ostatní se nazývají záporné. Orientovat každý vektorový prostor lze tedy právě dvěma způsoby. Definice 1.14 Buďte u1 , . . . , un ∈ Vn , B nechť je kladná ortonormální báze orientovaného vektorového prostoru Vn . Položíme-li {ui }B = (ui1 , . . . , uin ), 1≤i≤n, pak vnějším součinem vektorů u1 , . . . , un (vzhledem k bázi B) nazveme číslo označované [u1 , . . . , un ]B a definované takto: u11 u12 . . . u1n u21 u22 . . . u2n [u1 , . . . , un ]B = .. .. .. . . . . un1 un2 . . . unn
Definicí je hodnota vnějšího součinu dané n-tice vektorů formálně vázána na volbu konkrétní báze. Vyšetřeme, o jakou závislost se jedná. Buďte B, B ′ dvě ortonormální báze. Uvážíte-li definici součinu matic a vztah pro transformaci souřadnic vektoru, s nimiž jste se seznámili v minulém semestru, snadno zjistíte, že označíme-li souřadnice vektorů u1 , . . . , un v bázi B ′ analogicky jako v definici 1.14, ale čárkovaně, platí: u11 u12 . . . u1n u′11 u′12 . . . u′1n u21 u22 . . . u2n u′ u′ . . . u′ 2n 21 22 ′ .. .. .. = .. .. .. (B, B ). . . . . . . un1 un2 . . . unn u′n1 u′n2 . . . u′nn Vezmete-li v úvahu větu 1.11, je již zřejmá platnost následující věty.
24
Věta 1.21 1. Hodnota vnějšího součinu daných vektorů nezávisí na výběru kladné ortonormální báze. 2. Změní-li se orientace vektorového prostoru, změní se hodnota vnějšího součinu daných vektorů v číslo opačné. Poznámka 1.8 Ve zvolené orientaci vektorového prostoru V tedy není volba báze podstatná a můžeme vnější součin označovat jen [u1 , . . . , un ]. Věta 1.22 Buďte u1 , . . . , un ∈ Vn . Pak platí: 1. [u1 , . . . , un ]2 = G(u1 , . . . , un ),
2. ∀π ∈ Sn : [uπ(1) , . . . , uπ(n) ] = sgn π[u1 , . . . , un ],
3. ∀i, 1 ≤ i ≤ n, ∀ui , u′i ∈ V :
[u1 , . . . , (ui + u′i ), . . . , un ] = [u1 , . . . , ui , . . . , un ] + [u1 , . . . , u′i , . . . , un ], 4. ∀i, 1 ≤ i ≤ n, ∀c ∈ R : [u1 , . . . , cui , . . . , un ] = c[u1 , . . . , ui , . . . , un ]. Věta 1.23 Buďte u1 , . . . , un−1 ∈ Vn a Vn je orientovaný vektorový prostor. Pak existuje právě jeden vektor u∗ ∈ V takový, že platí: 1. u∗ ⊥ u1 , . . . , un−1 , p 2. ku∗ k = G(u1 , . . . , un−1 ),
3. jsou-li u1 , . . . , un−1 lineárně nezávislé, tvoří kladnou bázi prostoru V. Zvolíte-li si ve vektorovém prostoru Vn kladnou ortonormální bázi B = <e1 , . . . , en > a položíte-li {ui }B = (u1 , . . . , un ), 1 ≤ i ≤ n−1, a dále položíte
u11 u12 u21 u22 .. .. ∗ u = . . un−1 1 un−1 e1 e2
, . . . un−1 n . . . en . . . u1n . . . u2n .. .
2
dovedete se přesvědčit, že u∗ splňuje požadavky věty 1.23? 25
(1.8)
[Návod: z (1.8) plyne, že vektor u∗ má v B souřadnice (Un1 , . . . , Unn ), kde Uij označuje algebraický doplněk prvku na pozici (i, j) v dotyčné matici. Uvážíte-li dále matici u11 u12 . . . u1n u21 u22 . . . u2n .. .. .. , . . . un−1 1 un−1 2 . . . un−1 n x1 x2 . . . xn
je zřejmé, že její determinant je pro libovolný vektor x, {x}B = (x1 , . . . , xn ), roven skalárnímu součinu u∗ ·x.] Definice 1.15 Buďte u1 , . . . , un−1 ∈ Vn a nechť V je orientovaný. Pak vektor u∗ ∈ V splňující požadavky věty 1.23 se nazývá ortogonální součin vektorů u1 , . . . , un−1 a značí se u1 × u2 × · · · × un−1 .
Poznámka 1.9 Buďte dány vektory u1 , . . . , un−1 orientovaného vektorového prostoru Vn . • Ortogonální součin je jednoznačně dán zadáním vektorů u1 , . . . , un−1 a volbou orientace vektorového prostoru Vn . • Je-li dána kladná ortonormální báze ve V, je ortogonální součin u1 × · · · × un−1 roven symbolickému determinantu (1.8) . Věta 1.24 Buďte u1 , . . . , un−1 vektory orientovaného vektorového prostoru V. Pak u = u1 × · · · × un−1 , právě když pro každý x ∈ V platí: [u1 , . . . , un−1 , x] = u·x.
Věta 1.25 Buďte u1 , . . . , un−1 ∈ Vn . Pak platí: 1. ∀π ∈ Sn−1 : uπ(1) × · · · × uπ(n−1) ] = sgn π(u1 × · · · × un−1 ), 2. ∀i, 1 ≤ i ≤ n−1, ∀ui , u′i ∈ V : u1 × · · · × (ui + u′i ) × · · · × un−1 = u1 × · · · × ui × · · · × un−1 + u1 × × · · · × u′i × · · · × un−1 , 3. ∀i, 1 ≤ i ≤ n−1, ∀c ∈ R: u1 × · · · × cui × · · · × un−1 = c(u1 × · · · × ui × · · · × un−1 ), 4. změní-li se orientace vektorového prostoru V, přejde ortogonální součin ve vektor opačný. 26
Definice 1.16 V prostoru V3 se vnější součin tří vektorů nazývá součin smíšený a ortogonální součin dvou vektorů součin vektorový. Z věty 1.24 plyne: Důsledek 1.10 Pro libovolné vektory u1 , u2 , u3 ∈ V3 platí: [u1 , u2 , u3 ] = (u1 × u2 ) · u3 .
Věta 1.26 Nechť N⊂⊂V je vektorová nadrovina, její libovolná báze. Pak vektor u1 × · · · × un−1 je normálovým vektorem nadroviny N. Porovnejte vlastnosti ortogonálního součinu dvou vektorů ve V3 dle věty 1.23 s vlastnostmi, pomocí nichž jste na SŠ definovali vektorový součin. Příklad 1.7 V euklidovském vektorovém prostoru V je vzhledem ke kladné ortonormální bázi B = <e1 , e2 , e3 , e4 > dáno: {u1 }B = (1, 0, 1, 0), {u2 }B = (0, 1, 1, 0), {u3 }B = (1, 1, 1, 1). Spočtěte ortogonální součin u1 × u2 × u3 . [Návod: postupujte dle Poznámky 1.9: u1 × u2 × u3 = e1 + e2 − e3 − e4 , tj. ortogonální součin má souřadnice (1, 1, −1, −1).]
27
1.3.2
Vzdálenost a odchylka v euklidovském vektorovém prostoru Připomeňte si větu 1.16. Podle ní lze každý vektor x ∈ V vzhledem k libovolnému podprostoru W ⊆⊆ V právě jedním způsobem psát ve tvaru x = x∗ + x⊥ , kde x∗ ∈ W, x⊥ ∈ W⊥ .
(1.9)
Definice 1.17 Buď W ⊆⊆ V, x vektor z V a nechť x∗ , x⊥ jsou vektory splňující (1.9). Pak vektor x∗ nazýváme kolmý průmět vektoru x do podprostoru W a vektor x⊥ nazýváme perpendikulár vektoru x na podprostor W.
Věta 1.27 Buď W ⊆⊆ V, x vektor z V. Pak platí: 1. kolmý průmět vektoru x do podprostoru W je roven perpendikuláru vektoru x na podprostor W⊥ , 2. perpendikulár vektoru x na podprostor W je roven kolmému průmětu vektoru x do podprostoru W⊥ .
Věta 1.28 Buď W ⊆⊆ V, x vektor z V. Pak platí: x ∈ W ⇔ x∗ = x ⇔ x⊥ = o, x⊥W ⇔ x∗ = o ⇔ x⊥ = x. Ve V existuje jediný vektor, pro nějž x = x⊥ = x∗ . Který to je? [Použijte větu 1.28.]
Věta 1.29 Buď W ⊆⊆ V, x vektor z V. Pak platí: kxk2 = kx∗ k2 + kx⊥ k2 . Pozn.: V euklidovských vektorových prostorech tedy platí Pythagorova věta.
28
Pro zjišťování vzdálenosti a odchylky vektoru od podprostoru se ukáže důležitost normy perpendikuláru.
Věta 1.30 Buď N vektorová nadrovina ve V, n její libovolný normálový vektor. Pak pro libovolný vektor x z V platí: kx⊥ k =
|x · n| . knk
Věta 1.31 Buď W libovolný podprostor ve V, některá jeho báze. Pak pro libovolný vektor x z V platí: s G(u1 , . . . , uk , x) kx⊥ k = . G(u1 , . . . , uk ) Příklad 1.8 V euklidovském vektorovém prostoru V je dán vektor x a podprostor W = [u1 , u2 ]. Nalezněte kolmý průmět vektoru x do podprostoru W a perpendikulár na W, jestliže v ortonormální bázi je dáno: {x} = (5, 3, 1); {u1 } = (1, 2, 0), {u2 } = (1, 1, 1). [Návod: vyjádřete si vektor x ve tvaru (1.9), vektor x∗ pak jako lineární kombinaci vektorů u1 , u2 . Získanou rovnost pak skalárně vynásobte vektorem u1 a uvažte, že vektory u1 , x⊥ jsou kolmé. Stejně postupujte pro vektor u2 . Tím obdržíte soustavu rovnic xu1 = c1 (u1 u1 ) + c2 (u2 u1 ), xu2 = c1 (u1 u2 ) + c2 (u2 u2 ). Jejím vyřešením naleznete c1 , c2 a tím vektor x∗ . Řešení: {x∗ } = (3, 4, 2), x⊥ = (2, −1, −1). ] Definice 1.18 Buď W⊆⊆V, x vektor z V a nechť x∗ je kolmý průmět vektor x do W. Pak odchylkou vektoru x od podprostoru W rozumíme číslo označované ∡(x, W) a definované vztahem ∡(x, W) = ∡(x, x∗ ).
29
Věta 1.32 Buď W⊆⊆V, x vektor z V. Pak platí D πE . ∡(x, W) ∈ 0, 2 Věta 1.33 Buď W⊆⊆V, x vektor z V. Pak platí 1. ∡(x, W) =
π 2
⇔ x ⊥ W,
2. ∡(x, W) = 0 ⇔ x ∈ W ∧ x 6= o. Věta 1.34 Buď W⊆⊆V, x vektor z V. Pak platí 1. kx∗ k = kxk cos ∡(x, W), 2. kx⊥ k = kxk sin ∡(x, W). A nyní využijeme vět 1.30, 1.31: Věta 1.35 Buď N vektorová nadrovina ve V, n její libovolný normálový vektor. Pak pro libovolný vektor x z V, x 6= o, platí: ∡(x, N) = arcsin
|x · n| . kxkknk
Věta 1.36 Buď W libovolný podprostor ve V, některá jeho báze. Pak pro libovolný vektor x z V, x 6= o, platí: p G(u1 , . . . , uk , x) p ∡(x, W) = arcsin . kxk G(u1 , . . . , uk ) Příklad 1.9 V euklidovském vektorovém prostoru V je dán vektor x a podprostor W = [u1 , u2 ]. Stanovte odchylku vektoru x od podprostoru W, jestliže v ortonormální bázi je dáno: {x} = (5, 3, 1); {u1 } = (1, 2, 0), {u2 } = (1, 1, 1).
30
6 [Řešení: ∡(x, W) = arcsin √210 ; porovnejte přímým výpočtem za použití výsledku Příkladu 1.8.]
Následující věta ukazuje názorně význam pojmu vzdálenost vektoru od podprostoru definovaného v Definici 1.19. Věta 1.37 Buďte W ⊆⊆ V, x ∈ V. Pak pro libovolný vektor y z W platí: ρ(x, y) ≥ ρ(x, x∗ ), přičemž rovnost nastává jen v případě y = x∗ . Definice 1.19 Buď W⊆⊆V, x vektor z V a nechť x∗ je kolmý průmět vektor x do W. Pak vzdáleností vektoru x od podprostoru W rozumíme číslo označované ρ(x, W) a definované vztahem ρ(x, W) = ρ(x, x∗ ).
Důsledek 1.11 Buďte W ⊆⊆ V, x ∈ V. Pak platí: ρ(x, W) = Min{ρ(x, y)}y∈W .
Věta 1.38 Buď W⊆⊆V, x vektor z V. Pak platí 1. ρ(x, W) = 0 ⇔ x ∈ W, 2. ρ(x, W) = kxk ⇔ x⊥W. Uvážíte-li, jak vyjádřit vzdálenost vektoru od podprostoru pomocí jeho perpendikuláru, pak s využitím vět 1.30, 1.31 dostanete: Věta 1.39 Buď N vektorová nadrovina ve V, n její libovolný normálový vektor. Pak pro libovolný vektor x z V platí: ρ(x, N) =
31
|x · n| . knk
Věta 1.40 Buď W libovolný podprostor ve V, některá jeho báze. Pak pro libovolný vektor x z V platí: s G(u1 , . . . , uk , x) ρ(x, W) = . G(u1 , . . . , uk ) Příklad 1.10 V euklidovském vektorovém prostoru V je dán vektor x a podprostor W = [u1 , u2 ]. Stanovte vzdálenost vektoru x od podprostoru W, jestliže v ortonormální bázi je dáno: {x} = (5, 3, 1); {u1 } = (1, 2, 0), {u2 } = (1, 1, 1). √ [Řešení: ρ(x, W) = 6; porovnejte přímým výpočtem pomocí délky perpendikuláru za použití výsledku Příkladu 1.8.] Na závěr této lekce si všimneme několika přirozených aplikací teorie vzdáleností a odchylek, a to v teorii řešení soustav lineárních rovnic a v euklidovské geometrii. Z prvního semestru víte, že soustava lineárních rovnic A(x1 , x2 , . . . , xn )T = (b1 , b2 , . . . , br )T je řešitelná, právě když sloupcový vektor pravých stran je možné vyjádřit jako lineární kombinaci sloupcových vektorů matice dané soustavy; koeficienty této lineární kombinace pak představují řešení soustavy. Uvažujeme-li soustavu lineárních rovnic s reálnými koeficienty, lze říci, že uspořádaná n-tice (x1 , . . . , xn ) je řešením dané soustavy, právě když vzdálenost mezi vektory (A(x1 , x2 , . . . , xn )T ) a (b1 , b2 , . . . , br )T euklidovského vektorového prostoru Rr je nulová. V případě, kdy soustava řešitelná není, má smysl hledat takové „dosazeníÿ (x1 , . . . , xn ), pro nějž je číslo ρ((A(x1 , x2 , . . . , xn )T ), (b1 , b2 , . . . , br )T ) nejmenší možné. Na základě věty 1.37 popisuje metodu, nazývanou metoda nejmenších čtverců 7 , nalezení tohoto přibližného řešení následující věta. tento název plyne z toho, že vzdálenost dvou vektorů v Rr se standardním skalárním součinem je dána relací zmíněnou v důsledku 1.6 7
32
Věta 1.41 (metoda nejmenších čtverců) Buďte A ∈ Mr×n (R) a b ∈ Mr×1 (R). Je-li b∗ kolmým průmětem vektoru b do sloupcového podprostoru matice A a x1 , x2 , . . . , xn vyhovují soustavě lineárních rovnic x1 .. (1.10) A . = b∗ , xn pak pro každé y1 , y2 , . . . , yn ∈ R platí:
y x 1 1
..
..
A − b ≥ A − b
.
.
,
yn xn
přičemž rovnost nastává, právě když y1 , y2 , . . . , yn ∈ R řeší soustavu lineárních rovnic (1.10). Příklad 1.11 Určitý fyzikální děj je popsán funkční závislostí y = f (x), o níž je známo, že je lineární. Při experimentu byly zjištěny následující hodnoty x 0 1 2 . f (x) 1 5 3 Metodou nejmenších čtverců nalezněte parametry ve funkčním předpise uvedené závislosti, aby co nejlépe vystihoval provedené měření. [Návod: Funkční závislost předpokládejte ve tvaru y = ax + b, dosazením uvedených dvojic hodnot obdržíte soustavu tří lineárních rovnic o neznámých a, b, která nebude řešitelná. Dále postupujte dle věty 1.41. Řešení: y = x + 2.] Uvažujme nyní v euklidovském prostoru E podprostor Mk daný bodem A a bázi jehož zaměření nechť tvoří vektory u1 , . . . , uk . Zabývejme se dvěma úlohami: – zjištěním vzdálenosti libovolného bodu B od podprostoru M , – zjištěním odchylky libovolné přímky p se směrovým vektorem s od podprostoru M . V prvním případě si představme kolmý průmět B ∗ bodu B do podprostoru M ; vzdálenost ρ(B, M ) se v geometrii definuje rovna vzdálenosti ρ(B, B ∗ ). Uvažujeme-li vektor B −A, je zřejmě vektor B ∗ −A jeho kolmým průmětem
33
do zaměření8 V(M ) podprostoru M , a tudíž platí ρ(B, M ) = kB ∗ − Bk = = ρ((B − A), V(M )).
V druhém případě si na přímce p zvolme libovolně dva různé body B, C. Jejich rozdílem je směrový vektor C − B = s. Sestrojme jejich kolmé průměty C ∗ , B ∗ . V geometrii se odchylka ∡(p, M ) definuje jako odchylka přímek BD a B ∗ D∗ . Je zřejmé, že vektor C ∗ − B ∗ je kolmým průmětem vektoru s do zaměření V(M ) podprostoru M , a tudíž platí ∡(p, M ) = = ∡(s, V(M )). Důsledkem vět 1.36 a 1.40 jsou tedy následující věty euklidovské geometrie. Věta 1.42 Buď M libovolný podprostor euklidovského prostoru E určený bodem A a nechť je některá báze jeho zaměření. Pak pro libovolný bod B ∈ E platí: s G(u1 , . . . , uk , (B−A)) ρ(A, M ) = . G(u1 , . . . , uk )
Věta 1.43 Buď M libovolný podprostor euklidovského prostoru E určený bodem A a nechť je některá báze jeho zaměření. Pak pro libovolnou přímku p se směrovým vektorem s platí: p G(u1 , . . . , uk , s) p . ∡(p, M ) = arcsin ksk G(u1 , . . . , uk ) Geometrický význam mají i vnější a ortogonální součin vektorů. Zmiňme je alespoň pro třírozměrný euklidovský prostor E. Věta 1.44 Buďiž dán rovnoběžnostěn A1 B1 C1 D1 A2 B2 C2 D2 v euklidovském prostoru E3 . Pak pro jeho objem platí: V = |[(B1 −A1 ), (D1 −A1 ), (A2 −A1 )]|. Věta 1.45 Buď v euklidovském prostoru E3 dán rovnoběžník ABCD. Pak pro jeho plochu platí: S = k(B−A) × (D−A)k. 8 připomeňme, že zaměřením podprostoru rozumíme množinu vektorů daného podprostoru; získáme je např. jako průvodiče vedoucí z bodu A do všech jeho bodů
34
Příklad 1.12 V euklidovském prostoru E3 jsou dány body A = [1, 1, 1], B = [3, 1, 1], C = [3, 1, 3]. Určete obsah trojúhelníku ABC. [Návod: použijte větu 1.45. Výsledek: S=2]
35
Poznámky:
36
2
Homomorfizmy vektorových prostorů
2.1
Základní pojmy Student umí definovat pojem homomorfizmus vektorových prostorů. Umí rozpoznat zobrazení, která jsou homomorfizmem vektorových prostorů. Zná pojmy monomorfizmus, epimorfizmus, izomorfizmus, endomorfizmus a automorfizmus a dovede přiřadit daný homomorfizmus k těmto pojmům. Zná pojmy obrazu a jádro homomorfizmu a dovede je nalézt. Dovede sestavit analytické vyjádření homomorfizmu ve zvolených bázích a nalézt matici homomorfizmu v libovolné dvojici bází. Z předchozího semestru znáte pojem vektorový prostor – víte, že se jedná o množinu prvků (vektorů) vybavenou tělesem skalárů a dvojicí zobrazení – sčítáním vektorů a násobením vektorů skalárem. Nyní si ukážeme, že mezi všemi zobrazeními, která si dokážeme mezi dvojicemi vektorových prostorů (přesněji mezi jejich množinami vektorů) představit, hrají roli ta zobrazení, která zachovávají obě zobrazení (nazveme je homomorfizmy). Uvidíte, že jistým způsobem „přenášejíÿ strukturu prvního prostoru do druhého a ve zvláštním případě izomorfizmu pak vytvářejí věrnou „kopiiÿ prvního z vektorových prostorů. Naučíte se vyjádřit takováto zobrazení rovnostmi popisujícími souřadnice obrazu pomocí souřadnic vzoru. Seznámíte se zadáním homomorfizmu prostřednictvím matice.
Definice 2.1 Buďte (V, +, T, ·) a (W, ⊕, T, ◦) vektorové prostory9 . Zobrazení f : V → W se nazývá homomorfizmus vektorového prostoru V do vektorového prostoru W, jestliže má následující vlastnosti: 1. ∀u, v ∈ V : f (u + v) = f (u) ⊕ f (v),
2. ∀u ∈ V, ∀t ∈ T : f (t · u) = t ◦ f (u).
Poznámka 2.1 • nebude-li výslovně řečeno jinak, budeme všechny vektorové prostory nadále uvažovat na tímže tělesem T, • víme-li v každém případě, kterému vektorovému prostoru daná dvojice vektorů, resp. vektor, náleží, nehrozí nebezpečí nedorozumění a můžeme sčítání vektorů i v druhém prostoru označovat stejným symbolem „+ÿ, resp. násobení vektoru skalárem stejným symbolem „·ÿ či tuto tečku zcela vynechávat; ze stejného důvodu budeme i nulový vektor v obou prostorech značit tímže symbolem o. 9
všimněte si, že oba vektorové prostory mají totéž těleso skalárů
37
• všechny vektorové prostory budeme označovat jen symbolem příslušné množiny vektorů – tj. např. namísto (V, +, T, ·) budeme psát jen V. Označení 2.1 Buďte V, W vektorové prostory. Množinu všech homomorfizmů V do W budeme označovat Hom(V, W). Příklad 2.1 Buďte V3 , W3 vektorové prostory nad R a uvažujme zobrazení f : V3 → W3 daná vzhledem ke zvoleným bázím B, C předpisem: ∀x∈V3 : {x}B = (x1 , x2 , x3 ) 7−→ {f (x)}C = (y1 , y2 , y3 ), kde: 1. y1 = x1 2. y1 = x21 3. y1 = x1 y2 = 2x1 + x2 y2 = 2x1 + x2 y2 = 2x1 + x2 + 5 y3 = 3x1 − x3 , y3 = 3x1 − x3 . y3 = 3x1 − x3 . Je zobrazení f v jednotlivých případech homomorfizmem? [1. ano; 2.,3. ne.] Definice 2.2 Buď f ∈ Hom(V, W); 1. jestliže je f injektivní, nazývá se monomorfizmus, 2. jestliže je f surjektivní, nazývá se epimorfizmus, 3. jestliže je f bijektivní, nazývá se izomorfizmus, 4. jestliže je W = V, nazývá se f endomorfizmus vektorového prostoru V, 5. jestliže je W = V a f je bijektivní, nazývá se automorfizmus vektorového prostoru V.
Definice 2.3 Buď f ∈ Hom(V, W). Pak 1. obrazem homomorfizmu f rozumíme množinu označovanou Imf a definovanou takto: Im f = {y ∈ W; ∃x ∈ V : y = f (x)}, 2. jádrem homomorfizmu f rozumíme množinu označovanou Kerf a definovanou takto: Ker f = {x ∈ V; f (x) = o}.
38
Důsledek 2.1 Buď f ∈ Hom(V, W). Pak 1. f je epimorfizmem V na Im f , 2. je-li f monomorfizmus V do W, pak je izomorfizmem V na Im f .
Věta 2.1 Buď f ∈ Hom(V, W). Pak 1. Im f ⊆⊆ W, 2. Ker f ⊆⊆ V.
Příklad 2.2 Buďte V3 , W4 vektorové prostory R a uvažujme zobrazení f : V3 → W4 dané vzhledem ke zvoleným bázím B, C předpisem: ∀x∈V3 : {x}B = (x1 , x2 , x3 ) 7−→ {f (x)}C = (y1 , y2 , y3 , y4 ), kde:
y1 y2 y3 y4
= x1 + 2x2 − = x1 + 5x2 − = 3x2 − = x1 + 8x2 −
x3 5x3 4x3 9x3 .
Určete jeho jádro a obraz. [Ker f ={x∈V, {x}B ∈ [(−5, 4, 3)]}, Im f ={y∈W, {y}C ∈ [(−2, −1, 1, 0), (1, 1, 0, 1)]}.] Věta 2.2 Buďte V, W vektorové prostory. Je-li f izomorfizmus V na W, pak je f −1 izomorfizmem W na V. Věta 2.3 Buď f ∈ Hom(V, W). Pak platí: 1. f je epimorfizmus V na W, právě když Im f = W, 2. f je monomorfizmus V do W, právě když Ker f = {o}.
Dle definice 2.1 zachovává homomorfizmus dvě základní zobrazení vektorového prostoru +, ·. Následující věta ukazuje, že zachovává i libovolnou lineární kombinaci vektorů a dále ukáže souvislost lineární (ne)závislosti vzorů a obrazů. 39
Věta 2.4 Buď f ∈ Hom(V, W). Pak 1. pro každé x1 , . . . , xk ∈ V každé t1 , . . . , tk ∈ T platí: f (t1 x1 + · · · + tk xk ) = t1 f (x1 ) + · · · + tk f (xk ), 2. pro každé x1 , . . . , xk ∈V platí: jsou-li x1 , . . . , xk lineárně závislé, pak jsou f (x1 ), . . . , f (xk ) též lineárně závislé, 3. pro každé x1 , . . . , xk ∈V platí: jsou-li x1 , . . . , xk lineárně nezávislé a je-li f monomorfizmus, pak jsou f (x1 ), . . . , f (xk ) též lineárně nezávislé, – Vyslovte obměněnou větu k tvrzení v odstavci 2. – Najděte příklad ukazující, že předpoklad injektivity homomorfizmu f nelze v odstavci 3 vynechat. Důsledek 2.2 Buďte f ∈ Hom(V, W), U ⊆⊆ V. Pak platí: 1. množina f (U) je podprostorem v W, 2. jestliže M je množina generátorů podprostoru U, pak f (M) je množina generátorů podprostoru f (U), 3. je-li G množina generátorů prostoru V, pak f je epimorfizmus, právě když f (G) je množinou generátorů prostoru W, 4. je-li B báze prostoru V, pak f je izomorfizmus, právě když f (B) je báze prostoru W.
Homomorfizmus f : V → W, je, jakožto zobrazení, množinou uspořádaných dvojic {(x, f (x)) ∈ V × W, x ∈ V}. V případě homomorfizmů však není třeba (mnohdy ani možné) zadat výčtem všechny takovéto uspořádané dvojice – důležitou otázkou je, kolik takových uspořádaných dvojic je třeba znát, aby bylo toto zobrazení jednoznačně určeno. Odpovědí je následující věta o určenosti homomorfizmu. Věta 2.5 Buďte V, W vektorové prostory. Pak ke každé bázi vektorového prostoru V a každé n-tici vektorů w1 , . . . , wn z vektorového prostoru W existuje právě jeden homomorfizmus f : V → W s vlastností f (vi ) = wi , i = 1, . . . , n.
40
Definice 2.4 Buďte V, W vektorové prostory. Řekneme, že uvedené vektorové prostory jsou izomorfní, což značíme V ∼ = W, existuje-li izomorfizmus V na W. Poznámka 2.2 Na základě věty 2.2 vidíme, že relace být izomorfní je opravdu symetrická. Právě uvedená definice je tedy v tomto smyslu korektní. Jsou-li vektorové prostory (V, +, T, ·) a (W, ⊕, T, ◦) izomorfní, znamená to více, než jen to, že existuje bijekce mezi množinami V a W jejich vektorů. Buď f izomorfizmus V na W. Podívejme se nyní, jak sečíst dva vektory u, w náležící W. Protože na základě věty 2.2 a definice 2.1 můžeme psát u ⊕ v = f (f −1 (u)) ⊕ f (f −1 (w)) = f (f −1 (u) + f −1 (w)), je patrno, že tento součet je plně určen operací + sčítání vektorů ve V. Podobně se přesvědčíte, že i násobení ◦ vektorů skalárem ve W je plně určeno zadáním násobení · ve V.
Můžete tedy uzavřít, že dva izomorfní vektorové prostory jsou navzájem svými „přesnými kopiemiÿ, což vyjadřujeme obratem, že dva izomorfní vektorové prostory se liší jen pojmenováním svých prvků. Věta 2.6 Vám poskytne kritérium, kdy jsou dva vektorové prostory izomorfní. Přesvědčte se, že z prvního semestru Vám známé zobrazení Vn → T n zvané soustava souřadnic je izomorfizmem uvedených vektorových prostorů. Odvoďte pomocí tohoto faktu platnost následující věty! [Návod: použijte větu 2.2]
Věta 2.6 Dva vektorové prostory (nad tímže tělesem) jsou izomorfní, právě když mají stejnou dimenzi.
Definice 2.5 Buď f ∈ Hom(V, W). Nechť B, C jsou libovolné báze po řadě vektorových prostorů Vn a Wm , B = . Označíme-li {f (ai )}C = (ai1 , ai2 , . . . , ain ), i=1, . . . , n, pak matici (aij ) ∈ Mn×m (T ) nazýváme matice homomorfizmu f vzhledem k bázím B, C a značíme (f, B, C). 41
Užitím věty 2.4 (1) byste se přesvědčili o platnosti následující věty. Věta 2.7 Buď f ∈ Hom(V, W). Nechť B, C jsou libovolné báze po řadě vektorových prostorů V a W. Pak pro každý vektor x z V platí: {f (x)}C = {x}B (f, B, C), neboli: je-li {x}B = (x1 , . . . , xn ), pak pro f (x) platí: {f (x)}C = (y1 , . . . , ym ) ⇔ ∀j, 1 ≤ j≤m : yj =
n X
aij xi ,
(2.1)
i=1
kde (aij )n×m = (f, B, C). Víte již, že k určení homomorfizmu f není třeba zadání všech uspořádaných dvojic (x, f (x)). Znáte-li obrazy vektorů některé báze, můžete určit souřadnice obrazu kteréhokoli vektorů, a to pomocí tzv. analytického vyjádření homomorfizmu vůči zvolené dvojici bází, jak budeme soustavě rovností (2.1) dále říkat. Na základě věty 2.5 je patrně zcela rovnocenné, zda homomorfizmus určíte zadáním obrazů prvků některé báze, maticí homomorfizmu či analytickým vyjádřením. Věta 2.8 Buďte B, C některé báze po řadě prostorů V, W. Pak zobrazení HBC : Hom(Vn , Wm ) → Mn×m (T ) definované vztahem ∀f ∈ Hom(V, W) : HBC (f) = (f, B, C) je bijekcí uvedených množin.
Příklad 2.3 Buďte V, W vektorové prostory. Nechť B = <e1 , e2 , e3 > je báze prostoru V a C = je báze prostoru W. Napište analytické vyjádření homomorfizmu f : V → W, jestliže platí: f (e1 ) + 2f (e2 ) = b1 + 4b2 + 3b3 f (e1 ) − f (e2 ) + f (e3 ) = b1 + b2 + 2b3 f (e2 ) + f (e3 ) = b2 − b3 . 1 2 3 [Řešení: matice hledaného homomorfizmu je 0 1 0 . ] 0 0 −1 42
Věta 2.9 Buď f ∈ Hom(V, W). Nechť B, B ′ , resp. C, C ′ , jsou libovolné báze vektorového prostoru V, resp. W. Pak platí: (f, B ′ , C ′ ) = (B, B ′ )(f, B, C)(C ′ , C).
Věta 2.10 Buď f ∈ Hom(V, W). Nechť B, B ′ , resp. C, C ′ , jsou libovolné báze vektorového prostoru V, resp. W. Pak platí: h(f, B ′ , C ′ ) = h(f, B, C) = dim Im f. Pozn.: o společné hodnosti všech matic daného homomorfizmu f se hovoří jako o hodnosti homomorfizmu f. Věta 2.11 Buď f ∈ Hom(V, W). Pak platí: dim Ker f + dim Im f = dim V.
Důsledek 2.3 Buď f ∈ Hom(V, W) a nechť dim V= dim W. Pak jsou následující podmínky ekvivalentní: 1. f je izomorfizmus, 2. f je epimorfizmus, 3. f je monomorfizmus,
Důsledek 2.4 Homomorfizmus je izomorfizmem V na W, právě když jeho matice v jedné (a tudíž v každé) dvojicí bází prostorů V a W je regulární.
43
Věta 2.12 Buď f ∈ Hom(Vn , Wm ). Pak existují báze B, C po řadě prostorů V, W tak, že analytické vyjádření homomorfizmu f v této dvojici bází má tvar: y1 y2
= x1 = x2 .. .
yr = yr+1 = .. .
xr 0
ym =
0 ,
kde r je dimenze obrazu homomorfizmu f . Jaký tvar má matice homomorfizmu v bází dle věty 2.12?
Příklad 2.4 Buďte V a W vektorové prostory a uvažujme homomorfizmus f : V → W daný vzhledem k jisté zvolené dvojici bází analytickým vyjádřením: y1 y2 y3 y4
= x1 + 2x2 − = x1 + 5x2 − = 3x2 − = x1 + 8x2 −
x3 5x3 4x3 9x3
Najděte takovou dvojici bází, v níž bude mít daný homomorfizmus analytické vyjádření ve tvaru dle věty 2.12. [Návod: Označme hledané báze po řadě B = <e1 , e2 , e3 >, C = . Uvažte, že jádro homomorfizmu f je podprostorem ve V, jehož všechny prvky se zobrazí na nulový vektor. Najděte tedy nejprve bázi jádra Ker f . Její vektory budou tvořit „odzaduÿ prvky báze B. Bázi Ker f doplňte libovolně na bázi prostoru V, tím dostanete bázi B. V tomto konkrétním případě je dim Ker f = 1, tedy jeho bází bude vektor e3 . Ten pak doplníme vektory e1 a e2 na bázi B. Nyní zobrazte vektory báze B nepatřící jádru Ker f v homomorfizmu f . Tyto vektory dle věty 2.2 generují Im f a jejich počet je dle věty 2.11 roven dimenzi Im f – jsou tedy lineárně nezávislé. Označme tedy b1 = f (e1 ), b2 = f (e2 ) a vektory b1 , b2 pak doplňme libovolně na bázi C prostoru W. Uvažte definici matice homomorfizmu, pak je zřejmé, že 1000 (f, B, C) = 0 1 0 0 , 0000 a tedy analytické vyjádření bude mít požadovaný tvar.] 44
Poznámky:
45
2.2
Vektorový prostor homomorfizmů; skládání homomorfizmů Student umí zavést na množině homomorfizmů strukturu vektorového prostoru. Dovede určit matici součtu homomorfizmů a skalárního násobku homomorfizmu. Student zná vztah mezi vektorovým prostorem homomorfizmů a s ním izomorfní strukturou matic, dovede využít vztahů mezi těmito dvěma izomorfními strukturami. Student dovede skládat homomorfizmy a určit matici složení homomorfizmů. V minulé lekci jste se seznámili s množinou homomorfizmů vektorového prostoru V do vektorového prostoru W. Nyní si ukážete, jak přirozeně definovat sčítání homomorfizmů i násobení homomorfizmu skalárem, a získáte tak na množině Hom(V, W) strukturu vektorového prostoru. Dále uvidíte, jaké vlastnosti má zobrazení přiřazující ve zvolené bázi každému homomorfizmu jeho matici. V prvním semestru jste viděli, že množina matic spolu se sčítáním matic a násobením matice skalárem tvoří vektorový prostor – nyní uvidíte, že je izomorfní právě vybudovanému vektorovému prostoru homomorfizmů. Dále se naučíte skládat homomorfizmy. Popsané operace s homomorfizmy Vám osvětlí přirozenost definic sčítání matic, násobení matice skalárem a součinu matic, s nimiž jste se v minulém semestru seznámili.
2.2.1
Vektorový prostor homomorfizmů
Definice 2.6 Buďte f, g ∈ Hom(V, W), t ∈ T . Pak součtem homomorfizmů f a g nazýváme zobrazení f + g : V → W definované vztahem ∀x ∈ V : (f + g)(x) = f (x) + g(x), skalárním t-násobkem homomorfizmu f nazýváme zobrazení tf : V → W definované vztahem ∀x ∈ V : (tf )(x) = tf (x). Ověřte platnost axiomů vektorového prostoru pro množinu Hom(V, W) spolu se sčítáním homomorfizmů a násobením homomorfizmu skalárem.
Věta 2.13 Množina Hom(V, W) spolu spolu se sčítáním homomorfizmů a násobení homomorfizmu skalárem tvoří vektorový prostor nad tělesem T . 46
Pozn.: Nulovým prvkem vektorového prostoru Hom(V, W) je tzv. nulový homomorfizmus o definovaný pro každé x z V relací o(x) = o. Věta 2.14 Buďte f, g ∈ Hom(V, W), t ∈ T . Pak pro libovolné báze B, C po řadě prostorů V, W platí: (f + g, B, C) = (f, B, C) + (g, B, C), (tf, B, C) = t(f, B, C). Vezmete-li v úvahu větu 2.8, dostanete Věta 2.15 Buďte B, C některé báze po řadě prostorů V, W. Pak zobrazení HBC : Hom(Vn , Wm ) → Mn×m (T ) definované vztahem ∀f ∈ Hom(V, W) : HBC (f) = (f, B, C) je izomorfizmem vektorových prostorů Hom(Vn , Wm ) a Mn×m (T ) Označte si pro libovolné přípustné (i, j) symbolem Eij matici z Mn×m (T ), jejíž prvky jsou nulové s výjimkou právě prvku na pozici (i, j), který je roven 1. Zřejmě každou matici z Mn×m (T ) lze zapsat jako lineární kombinaci matic množiny E = <E11 , E12 , . . . , E1n , . . . , En1 , En2 , . . . , Enm >, a to jediným způsobem. Množina E je tedy bází vektorového prostoru Mn×m (T ). Např. 100 1 2 −1 010 001 000 000 =1 +2 −1 +8 +7 . 000 08 7 000 000 010 001 | {z } | {z } | {z } | {z } | {z } E11
E12
E13
Z věty 2.15 dostanete:
47
E21
E23
Důsledek 2.5 Buďte V, W vektorové prostory. Pak platí: 1. dim Hom(V, W) = dim V. dim W, 2. jsou-li B, C báze po řadě prostorů Vn , Wm a označíme-li pro každé i, j, 1 ≤ i ≤ n, 1 ≤ j ≤ m, homomorfizmus eij definovaný relací (eij , B, C) = Eij , pak množina <e11 , e12 , . . . , e1n , . . . , en1 , en2 , . . . , enm > je bází vektorového prostoru Hom(V, W), 3. jsou-li B, C báze po řadě prostorů Vn , Wm , pak platí X aij eij . (f, B, C) = (aij )n×m ⇐⇒ f = 1≤i≤n 1≤j≤m
Poznámka 2.3 • Z věty 2.14 vidíte, že sčítání matic je přirozeně určeno sčítáním homomorfizmů a podobně skalární násobek matice je přirozeně určen násobením homomorfizmu skalárem. • Z důsledku 2.5, odst. (3) je patrný další význam prvků matice homomorfizmu – mají současně význam souřadnic daného homomorfizmu v bázi dle odst. (2).
48
2.2.2
Skládání homomorfizmů Druhá část této lekce je věnována skládání homomorfizmů. Dva homomorfizmy můžeme složit jako každá jiná zobrazení10 . Důležité však je, že složením homomorfizmů obdržíte opět homomorfizmus.
Věta 2.16 Buďte U, V, W vektorové prostory. Pak pro libovolné homomorfizmy f ∈ Hom(U, V), g ∈ Hom(V, W) platí, že f ◦ g ∈ Hom(U, W). Věta 2.17 Buďte U, V, W vektorové prostory, f ∈ Hom(U, V) a g ∈ ∈ Hom(V, W). Pak, jsou-li B, C, D libovolné báze po řadě prostorů U, V, W, platí: (f ◦ g, B, D) = (f, B, C)(g, C, D). Poznámka 2.4 Z věty 2.17 vidíte, že násobení matic je přirozeně určeno skládáním homomorfizmů. Důsledek 2.6 Buď f ∈ Hom(U, V) a B, C libovolné báze po řadě prostorů U, V. Pak platí: (f −1 , C, B) = (f, B, C)−1 . Věta 2.18 Buďte U, V, W vektorové prostory. Pak pro libovolné homomorfizmy f, g ∈ Hom(U, V), h, k ∈ Hom(V, W) a t ∈ T platí: 1. (f + g) ◦ h = f ◦ h + g ◦ h,
2. f ◦ (h + k) = f ◦ h + f ◦ k,
3. (tf ) ◦ h = t(f ◦ h) = f ◦ (th). Jak zní důsledky věty 2.18 pro operace s maticemi?
10
v tomto textu se pro označení složení dvou zobrazení α, β budeme držet této konvence: (α ◦ β)(x) = β(α(x)).
49
Poznámky:
50
2.3
Endomorfizmy vektorového prostoru Student dovede zavést na množině endomorfizmů vektorového prostoru strukturu okruhu, resp. lineární algebry. Student zná vztah mezi okruhem, resp. lineární algebrou, endomorfizmů a příslušnou izomorfní strukturou matic, dovede využít vztahů mezi těmito dvěma izomorfními strukturami. Dále dovede rozpoznat automorfizmus vektorového prostoru a zavést na množině automorfizmů strukturu grupy, zná vztah mezi touto grupou a příslušnou strukturou matic s ní izomorfní. Student dovede zavést pojem projekce vektorového prostoru a rozpoznat mezi endomorfizmy projekce. V jedné z předešlých lekcí (definice 2.2) jste se seznámili s pojmem endomorfizmus vektorového prostoru, jako homomorfizmem vektorového prostoru do sebe, a v lekci bezprostředně předcházející jste se naučili homomorfizmy sčítat, násobit skalárem i skládat. Nyní si ukážete, že endomorfizmy daného vektorového prostoru tvoří okruh. Zobrazení, přiřazující endomorfizmu jeho matici ve zvolené bázi, tvoří izomorfizmus tohoto okruhu a okruhu matic. Dále poznáte strukturu lineární algebry endomorfizmů, grupu automorfizmů a v obou těchto případech s nimi izomorfní struktury matic. Seznámíte se s projekcemi vektorového prostoru na podprostor, jako endomorfizmy zobrazujícími vektorový prostor na některý jeho podprostor, tedy na vektorový prostor nižší dimenze11 , což dává projekcím široký praktický význam.
Označení 2.2 Buď V vektorový prostor. Pak množinu endomorfizmů vektorového prostoru V (tedy množinu Hom(V, V)) budeme značit End(V). Matici endomorfizmu f v bázi B budeme značit jen (f, B). Ověřte platnost axiomů okruhu pro množinu End(V) spolu se sčítáním a skládáním homomorfizmů. Věta 2.19 Buď V vektorový prostor. Množina End(V) spolu se sčítáním endomorfizmů + a skládáním endomorfizmů ◦ tvoří okruh s jednotkovým prvkem, kterým je identický endomorfizmus id. Tento okruh není obecně komutativní. Důsledkem věty 2.14 a 2.17 je následující věta: Věta 2.20 Buď B některá báze prostoru V. Pak zobrazení HB : End(Vn ) → → Mn×n (T ) definované vztahem ∀f ∈ End(V) : HB (f) = (f, B) je izomorfizmem okruhů (End(Vn ), +, ◦) a (Mn×n (T ), +, ·). 11
s výjimkou triviálního případu identity
51
Definice 2.7 Buď A množina, T komutativní těleso a nechť jsou dána zobrazení + : A × A → A, ◦ : A × A → A, · : T × A → A, přičemž
1. A spolu se zobrazeními +, · je vektorový prostor nad T ,
2. A spolu se zobrazeními +, ◦ je okruh s jednotkovým prvkem,
3. ∀a, b ∈ A, ∀t ∈ T : t · (a ◦ b) = (t · a) ◦ b = a ◦ (t · b).
Pak se množina A spolu s uvedenými zobrazeními nazývá lineární algebrou nad tělesem T . Řádem algebry A se rozumí dimenze A jakožto vektorového prostoru.
Definice 2.8 Buďte A a B lineární algebry nad týmž tělesem. Řekneme, že lineární algebra A je izomorfní s lineární algebrou B, existuje-li zobrazení H : A → B, které je současně izomorfizmem A a B jakožto vektorových prostorů i jako okruhů. Z vět 2.13, 2.15, 2.18, 2.19 a 2.20 plynou dvě věty následující: Věta 2.21 Množina End(V) spolu se sčítáním a skládáním endomorfizmů a násobením endomorfizmu skalárem z T tvoří lineární algebru nad tělesem T , jejíž řád je roven (dim V)2 . Věta 2.22 Buď B některá báze prostoru Vn . Pak zobrazení HB přiřazující každému endomorfizmu jeho matici v bázi B je izomorfizmem lineárních algeber End(V) a Mn×n (T ) Nyní se všimneme zvláštního případu endomorfizmů, a sice automorfizmů daného vektorového prostoru (viz definice 2.2). Označení 2.3 Buď V vektorový prostor. Pak množinu automorfizmů vektorového prostoru V (tedy podmnožinu množiny End(V)) budeme značit Aut(V). Ověřte platnost axiomů grupy pro množinu Aut(V) spolu se skládáním zobrazení. [Využijte mj. větu 2.2.] 52
Věta 2.23 Buď V vektorový prostor. Množina Aut(V) spolu se skládáním automorfizmů tvoří grupu. Pozn.: Grupa (Aut(V), ◦) bývá nazývána lineární grupa vektorového prostoru V. Z důsledku 2.4 plyne: Věta 2.24 Endomorfizmus je automorfizmem prostoruV, právě když jeho matice v jedné (a tudíž v každé) bázi prostoru V je regulární. Důsledek 2.7 Grupa automorfizmů vektorového prostoru Vn je izomorfní s multiplikativní grupou regulárních matic řádu n nad tělesem T . Buď B některá báze prostoru Vn . Pak zobrazení HB přiřazující každému endomorfizmu jeho matici v bázi B je izomorfizmem grup (Aut(V), ◦) a (Ln×n (T ), ·). Využitím důsledku 2.2 a porovnáním definic matice homomorfizmu a matice přechodu odvoďte platnost následujícího tvrzení! Věta 2.25 Buď f endomorfizmus a B některá báze prostoru V. Pak je f automorfizmem vektorového prostoru V, právě když množina C, C = f (B) je bází prostoru V. Přitom platí (B, C) = (f, B). Představíte-li si intuitivně chápaný pojem projekce 3-rozměrného vektorového prostoru na některý jeho 2-rozměrný podprostor rovnoběžně se zvoleným směrem, vidíte, že následující definice je jeho přirozeným zobecněním.
Definice 2.9 Buďte U, W ⊆⊆ V takové, že V = U ⊕ W. Pak zobrazení označované pUW a definované předpisem ∀x∈V, x = xW + xU , xW ∈W, xU ∈U : pUW (x) = xW , nazýváme projekce vektorového prostoru V na podprostor W rovnoběžně podprostoru U. Poznámka 2.5 Vzhledem k tomu, že součet V = U ⊕ W je přímý (direktní), je zobrazení pUW definováno korektně. 53
Věta 2.26 Buď pUW projekce vektorového prostoru V. Pak pro každé x z V platí: 1. pUW (x) = o, právě když x ∈ U,
2. pUW (x) = x, právě když x ∈ W. Důsledek 2.8 Každá projekce pUW prostoru V je surjekcí V na W. Důsledek 2.9 Buď pUW projekce vektorového prostoru V. Pak platí: 1. pUW = idV ⇔ U = {o} ⇔ W = V,
2. pUW = o ⇔ W = {o} ⇔ U = V.
Věta 2.27 Každá projekce prostoru V je endomorfizmem prostoru V. Věta 2.28 Buď p projekce prostoru V. Pak je projekcí V na Im p rovnoběžně Ker p. Věta 2.29 Buď p endomorfizmus prostoru V. Pak p je projekcí, právě když platí 1. V = Ker p ⊕ Im p, 2. p| Im p = idIm p
Věta 2.30 Buď p endomorfizmus prostoru V. Pak p je projekcí, právě když platí p ◦ p = p. Důsledek 2.10 Buď p endomorfizmus prostoru V. Pak p je projekcí, právě když v libovolné (a pak tedy v každé) bázi B prostoru V platí (p, B)2 = (p, B).
54
Příklad 2.5 Nalezněte projekci p prostoru V nad R, pro niž platí p(ui ) = vi , i = 1, 2, je-li ve zvolené bázi B prostoru V dáno: {u1 }B =(1, 2, 1, −1), {u2 }B =(3, 0, 0, 1), {v1 }B =(1, 2, 0, 0), {v2 }B =(1, 1, 1, 1). [Návod: uvažte, že vektory v1 , v2 náleží do Im p a použijte větu 2.29. Řešení:
3 4 2 2 1 4 9 −1 −1 .] (p, B) = 11 2 −1 5 5 2 −1 5 5
55
Poznámky:
56
2.4
Vlastní hodnoty a vlastní podprostory endomorfizmů vektorového prostoru Student dovede vymezit pojem vlastní hodnoty a vlastních vektoru endomorfizmu vektorového prostoru. Dále dovede pro konkrétní endomorfizmus nalézt vlastní hodnoty a vlastní podprostory. Zná vztah mezi násobností vlastní hodnoty jako kořene charakteristického polynomu a dimenzí vlastního podprostoru. Dovede aplikovat kriteria pro to, aby endomorfizmus byl diagonalizovatelný. Umí definovat a nalézt vlastní hodnoty a vlastní podprostory čtvercové matice. V řadě oblastí matematiky (např. geometrii, matematické analýze, statistice) i jejích aplikací je důležité znát pro daný endomorfizmus vektory, které určují stejný směr jako jejich obrazy. Takovým vektorům budeme říkat vlastní vektory a v této kapitole se je naučíte hledat. Poznáte, že množina vektorů zobrazující se na svůj daný násobek tvoří podprostor a že v některých případech je vektorový prostor na takové podprostory direktně rozložitelný.
Definice 2.10 Buď f endomorfizmus vektorového prostoru V. Platí-li pro skalár λ ∈ T a nenulový vektor x ∈ V f (x) = λx, řekneme, že λ je vlastní hodnota endomorfizmu f a x vlastní vektor endomorfizmu f příslušný vlastní hodnotě λ. Množina všech vlastních hodnot endomorfizmu f se nazývá spektrum endomorfizmu f a značí se Specf . Pozn.: Je-li T číselným tělesem, užívá se vedle pojmu vlastní hodnota též pojem vlastní číslo. Označení 2.4 Buď f endomorfizmus na vektorovém prostoru V, λ některá jeho vlastní hodnota. Pak symbolem Nλ budeme rozumět následující množinu Nλ = {x ∈ V; f (x) = λx}
57
(2.2)
Věta 2.31 Buď f endomorfizmus na vektorovém prostoru V, λ některá jeho vlastní hodnota. Pak platí: 1. Nλ ⊆⊆ V, Nλ = Ker(f − λ id) 2. je-li B některá báze V, pak x ∈ V je vlastním vektorem endomorfizmu f příslušným λ, právě když jeho souřadnice v bázi B jsou netriviálním řešením soustavy lineárních homogenních rovnic o matici (f, B)T − λE. Definice 2.11 Buď f endomorfizmus na vektorovém prostoru V, λ některá jeho vlastní hodnota. Pak množina Nλ definovaná vztahem (2.2) se nazývá vlastní podprostor endomorfizmu f příslušný vlastní hodnotě λ. Důsledek 2.11 Buď f endomorfizmus na vektorovém prostoru V, λ některá jeho vlastní hodnota, B libovolná báze. Označíme-li (f, B) = (aij )n×n , pak vektor x, {x}B = (x1 , . . . , xn ), náleží vlastnímu podprostoru Nλ , právě když (a11 − λ)x1 + a21 x2 + · · · + an1 xn = 0 a12 x1 + (a22 − λ)x2 + · · · + an2 xn = 0 .. .
(2.3)
a1n x1 + a2n x2 + · · · + (ann − λ)xn = 0
Předešlá věta dává návod, jak pro dané λ najít vlastní vektory endomorfizmu f . Zbývá ještě nalézt vlastní hodnoty daného endomorfizmu. Uvážímeli, že vlastní vektory jsou nenulové, hledáme netriviální řešení soustavy rovnic (2.3). Z prvního semestru víte, že jeho existence je ekvivalentní singularitě matice soustavy. Odtud vyplývá věta 2.32, která je návodem pro nalezení vlastních hodnot λ. Definice 2.12 Buď f endomorfizmus na vektorovém prostoru V, B libovolná báze tohoto prostoru. Pak charakteristickým polynomem endomorfizmu f rozumíme polynom chf (x) ∈ T [x] definovaný vztahem chf (x) = det( (f, B) − xE ).
58
(2.4)
Přesvědčte se, že charakteristický polynom daného endomorfizmu nezávisí na volbě báze B – tedy, že definice 2.12 je v tomto smyslu korektní.
[Návod: užijte větu 2.9.]
Věta 2.32 Buď f endomorfizmus na vektorovém prostoru V. Pak spektrum endomorfizmu f je rovno množině kořenů jeho charakteristického polynomu. Připomenete-li si ještě větu 2.24, pak platí: Důsledek 2.12 Buď f endomorfizmus na vektorovém prostoru V. Pak spektrum endomorfizmu f množina právě těch λ ∈ T, pro něž endomorfizmus f −λid není automorfizmem prostoru V. Příklad 2.6 Nechť v jisté bázi B prostoru V nad R maticí A a endomorfizmus g maticí B. 1 −3 3 0 2 A = 1 1 1 , B = 4 −7 6 −7 −1 0 0
je dán endomorfizmus f 4 8. 7
Najděte vlastní hodnoty a vlastní podprostory obou endomorfizmů. [Návod: Nejdříve spočítejte charakteristický polynom daného endomorfizmu dle (2.4). Pro endomorfizmus f obdržíme chf (x) = −(x−1)2 (x−2), tj. Specf = {1, 2}. Pak pro každou vlastní hodnotu sestavte soustavu lineárních rovnic (2.3) a vyřešte ji. Tím pro každou vlastní hodnotu získáte vlastní podprostor. Řešení: Pro endomorfizmus f obdržíme: Spec f = {1, 2}, N1 = [(1, 0, 2), (0, 1, 1)], N2 = [(1, 0, 1)]. Pro endomorfizmus g pak Spec g = {−1, 3}, N−1 = [(−2, 1, 0)], N3 = [(1, −1, 1)].] Věta 2.33 Buďte λ1 , . . . , λr navzájem různé vlastní hodnoty endomorfizmu f na některém vektorovém prostoru V. Označíme-li N1 , . . . , Nr příslušné vlastní podprostory, platí: N 1 + · · · + Nr = N 1 ⊕ · · · ⊕ N r . Důsledek 2.13 1. Každý vlastní vektor přísluší jediné vlastní hodnotě daného endomorfizmu. 2. Vlastní vektory příslušné různým vlastním hodnotám téhož endomorfizmu jsou lineárně nezávislé. 59
Věta 2.34 Buď f endomorfizmus na vektorovém prostoru V, λ některá jeho vlastní hodnota a nλ její násobnost jakožto kořene charakteristického polynomu chf (x). Pak pro dimenzi vlastního podprostoru Nλ platí: dim Nλ ≤ nλ . Povšimněte si, že dimenze vlastního podprostoru se opravdu nemusí rovnat násobnosti – viz endomorfizmus g v příkladu 2.6. Definice 2.13 Endomorfizmus f na vektorovém prostoru V se nazývá diagonalizovatelný, jestliže existuje báze B prostoru V tak, že matice (f, B) je diagonální. Naskýtá se otázka, které endomorfizmy jsou diagonalizovatelné. Následující trojice vět přináší některá kriteria. Z druhé z nich a příkladu 2.6 vyplývá, že existují endomorfizmy, které nejsou diagonalizovatelné : (endomorfimus f je diagonalizovatelný, zatímco endomorfizmus g nikoli). Obecně tedy neplatí, že by ke každému endomorfizmu existovala báze tak, že by matice endomorfizmu nad touto bází byla diagonální.
Věta 2.35 Endomorfizmus f na vektorovém prostoru V je diagonalizovatelný, právě když existuje báze B prostoru V tvořená vlastními vektory endomorfizmu f . Diagonála matice (f, B) je v tom případě tvořena vlastními hodnotami endomorfizmu f ; každé z nich stojí na diagonále právě tolikrát, kolikanásobným je kořenem charakteristického polynomu chf (x). Věta 2.36 Endomorfizmus f na vektorovém prostoru V je diagonalizovatelný, právě když je vektorový prostor V roven součtu právě všech vlastních podprostorů endomorfizmu f . Věta 2.37 Je-li endomorfizmus f diagonalizovatelný, pak pro každý jeho vlastní podprostor Nλ platí, že dimenze Nλ je rovna násobnosti λ jakožto kořene charakteristického polynomu. Pro endomorfizmy na vektorových prostorech nad C platí i věta obrácená.
60
Poznámka 2.6 Analogicky12 můžete dospět k pojmům vlastní vektor, vlastní hodnota a vlastní podprostor matice A z Mn×n (T ): • Platí-li pro skalár λ ∈ T a nenulový vektor x ∈ V x.A = λx, řekneme, že λ je vlastní hodnota matice A a x vlastní vektor matice A příslušný vlastní hodnotě λ. • Podprostor Nλ ⊆⊆ T n , Nλ = {x ∈ T n ; x.A = λx}, nazývá se vlastní podprostor matice A příslušný vlastní hodnotě λ.
12 stačí uvažovat aritmetický vektorový prostor V = T n a na něm pro zvolenou matici A definovat endomorfizmus f předpisem f (x) = x.A, což nám umožní přenést vlastnosti vlastních vektorů/hodnot/podprostorů endomorfizmu na tyto pojmy pro matice.
61
Poznámky:
62
2.5
Homomorfizmy euklidovských vektorových prostorů Student dovede vymezit pojem ortogonální projekce a ortogonální homomorfizmus. Dovede rozhodnout o ortogonalitě dané projekce a daného homomorfizmus. Student dovede aplikovat vlastnosti ortogonální projekce, resp. homomorfizmu, při konstrukci těchto zobrazení. Zná vztah mezi grupou automorfizmů a příslušnou multiplikativní grupou matic. Zná nutné a postačující podmínky pro to, aby dané zobrazení bylo ortogonálním homomorfizmem. Umí rozeznat ortogonálně izomorfní euklidovské vektorové prostory. V kapitole 1.2 jste poznali, že euklidovský vektorový prostor je roven přímému součtu svého libovolného podprostoru a jeho ortogonálního doplňku. Využijete-li poznatků kapitoly 2.3, můžete zkoumat projekce, jejichž jádro a obraz jsou navzájem ortogonálními doplňky. Tyto projekce nazveme ortogonální projekce a mají řadu aplikací v geometrii i dalších oblastech matematiky. V kapitole 2.1 jste se seznámili s izomorfizmem vektorových prostorů a viděli jste, že v tomto případě je druhý z dvojice izomorfních vektorových prostorů jen „kopiíÿ prvního, neboť izomorfizmus. V případě euklidovských vektorových prostorů zavedeme pojem ortogonálního izomorfizmu, který krom sčítání vektorů a násobení vektoru skalárem zachovává též skalární součin. Uvidíte, že v případě, kdy budou dva euklidovské vektorové prostory ortogonálně izomorfní, bude opět druhý z nich „kopiíÿ prvního.
2.5.1
Ortogonální projekce
Připomeňte si definici 2.9 a větu 1.16. Pak je zřejmé, že platí: Věta 2.38 Buď W podprostor euklidovského vektorového prostoru V. Pak pro⊥ jekce pW W přiřazuje každému vektoru x z V jeho kolmý průmět do podprostoru W. Definice 2.14 Buď W podprostor euklidovského vektorového prostoru V. ⊥ nazýváme ortogonální projekce prostoru V na podprostor Pak projekci pW W W a značíme ji pW . Zobrazení přiřazující každému vektoru z V jeho kolmý průmět do daného podprostoru W – ortogonální projekce – je tedy zvláštním případem projekce (a tedy endomorfizmem) – jedná se o projekci V na W rovnoběžně W⊥ .
63
Věta 2.39 Buď p libovolná projekce euklidovského vektorového prostoru V na některý jeho podprostor. Pak p je ortogonální projekcí, právě když ∀x, y ∈ V : p(x) · y = x · p(y).
Lemma 2.1 Buď p endomorfizmus euklidovského vektorového prostoru V, B libovolná ortonormální báze. Pak platí: [∀x, y ∈ V : p(x) · y = x · p(y)] ⇔ [(p, B)T = (p, B)].
Věta 2.40 Buď p libovolná projekce euklidovského vektorového prostoru V na některý jeho podprostor. Pak p je ortogonální projekcí, právě když v některé (a pak tedy ve všech) ortonormální bázi B prostoru V platí: (p, B)T = (p, B). Příklad 2.7 Nalezněte ortogonální projekci p prostoru V na podprostor W = [v1 , v2 ], je-li ve zvolené ortonormální bázi B prostoru V dáno: {v1 } = (1, 2, 0, 0), {v2 } = (1, 1, 1, 1). [Návod: uvažte, co je jádrem a obrazem hledáné projekce a kam se zobrazí vektory náležící jejímu jádru a obrazu. Příklad jde řešit také jinak, např. užitím důsledku 2.10 a věty 2.40 – proveďte!. Řešení: 3 4 2 2 1 4 9 −1 −1 .] (p, B) = 11 2 −1 5 5 2 −1 5 5
64
2.5.2
Ortogonální homomorfizmy
Definice 2.15 Buďte (V, ·) a (W, ⊙) euklidovské vektorové prostory. Homomorfizmus f : V → W se nazývá ortogonální, jestliže platí: ∀x, y ∈ V : x · y = f (x) ⊙ f (y). Poznámka 2.7 Nebude-li hrozit nebezpečí nedorozumění, budeme skalární součin v různých euklidovských vektorových prostorech značit týmž symbolem „·ÿ, nebo jeho označení budeme vypouštět zcela. Uvažte definici 1.2 normy vektoru, 1.3 úhlu mezi vektory a 1.4 vzdálenosti vektorů. Pak z definice 2.15 snadno odvodíte následující důsledek. Později uvidíte, že tvrzení (1) a (3) je nejen nutnou, ale i postačující podmínkou ortogonality homomorfizmu. Bude tomu tak i u tvrzení (2)? [Ne; zdůvodněte!] Z tvrzení 2.14 (3) pak plyne věta 2.41. Důsledek 2.14 Buď f : V → W ortogonální homomorfizmus. Pak pro každé x, y z V platí: 1. kf (x)k = kxk,
2. ∡(f (x), f (y)) = ∡(x, y), 3. ρ(f (x), f (y)) = ρ(x, y).
Věta 2.41 Každý ortogonální homomorfizmus je monomorfizmem. Odtud a z věty 2.3 plyne: Věta 2.42 Je-li dim V = dim W, pak každý ortogonální homomorfizmus V → → W je izomorfizmem V na W. Speciálně: každý ortogonální endomorfizmus vektorového prostoru je automorfizmem tohoto prostoru. Poznámka 2.8 Příkladem ortogonálního izomorfizmu je např. kartézská soustava souřadnic euklidovského vektorového prostoru (jde o ortogonální izomorfizmus Vn na Rn se standardním skalárním součinem). Snadno rovněž zjistíte, že každý ortogonální izomorfizmus Vn na Rn se standardním skalárním součinem je kartézskou soustavou souřadnic. 65
Připomeňme důsledek 2.2 (4). Dále si uvědomte, že ortogonální homomorfizmus díky důsledku 2.14 zobrazí ortonormální množinu vektorů opět na ortonormální množinu. Konečně, zobrazuje-li některý homomorfizmus ortonormální bázi opět na ortonormální bázi, pak se s ohledem na větu 1.8 přímým výpočtem snadno přesvědčíte, že následující věta je opravdu ekvivalencí. Věta 2.43 Buď f homomorfizmus V do W, B libovolná ortonormální báze prostoru V. Pak je f ortogonálním izomorfizmem V na W, právě tehdy když f (B) je ortonormální bází prostoru W. Důsledek 2.15 Buďte U, V, W euklidovské vektorové prostory. Pak platí: 1. je-li f ortogonální izomorfizmus U na V, pak f −1 je ortogonálním izomorfizmus V na U, 2. je-li f ortogonální homorfizmus U do V a g ortogonální homomorfizmus V do W, pak f ◦ g je ortogonální homomorfizmus U do W. Je přirozenou otázkou, jak snadno zjistit, zda daný homomorfizmu je či není ortogonální. Uvážíte-li opět větu 2.43, definici matice homomorfizmu 2.5, definici součinu matic a ovšem i kartézskou formuli pro skalární součin, snadno se přesvědčíte o platnosti následujícího kriteria.
Věta 2.44 Buď f homomorfizmus V do W, B, C libovolné ortonormální báze po řadě prostorů V, W. Pak je f ortogonálním homomorfizmem V do W, právě tehdy když (f, B, C)(f, B, C)T = E. Pamatujte si, že předpoklad ortonormality u žádné z bází nelze vynechat! Z věty 2.44 a důsledku 2.15 plyne:
66
Důsledek 2.16 1. Množina ortogonálních automorfizmů euklidovského vektorového prostoru V spolu se skládáním homomorfizmů tvoří grupu, která je podgrupou v grupě automorfizmů vektorového prostoru V. 2. Grupa ortogonálních automorfizmů13 je izomorfní s multiplikativní grupou ortogonálních matic řádu n. Je-li B ortonormální báze prostoru Vn , pak zobrazení HB přiřazující každému endomorfizmu jeho matici v bázi B je izomorfizmem uvedených grup.
Následující čtyři věty Vám přinesou další nutné a postačující podmínky pro to, aby homomorfizmus, resp. zobrazení, byl ortogonálním homo-, popř. izomorfizmem. Srovnejte jejich obsah s definičními podmínkami ortogonality homomorfizmu (definice 2.15) a s důsledkem 2.14. Užitím identity (x + y)(x + y) = xx + 2xy + yy ověřte platnost první z dále uvedených vět! [Návod: odvoďte z této identity relace pro normu součtu vektorů a normu součtu jejich obrazů.] Věta 2.45 Buď f homomorfizmus V do W. Pak je f ortogonálním homomorfizmem V do W, právě když pro každé x z V platí: kf (x)k = kxk. Věta 2.46 Buď f homomorfizmus V do W. Pak je f ortogonálním homomorfizmem V do W, právě když pro každé x, y z V platí: ρ(f (x), f (y)) = ρ(x, y).
Věta 2.47 Buď f bijekce V na W. Pak je f ortogonálním izomorfizmem V do W, právě když pro každé x, y z V platí: f (x)f (y) = xy. 13 grupa ortogonálních automorfizmů se nazývá ortogonální nebo izometrická grupa daného vektorového prostoru; je tedy podgrupou v tzv. lineární grupě – srv. věta 2.23. prostoru Vn .
67
Věta 2.48 Buď f bijekce V na W. Pak je f ortogonálním izomorfizmem V do W, právě když platí: 1. f (o) = o, 2. ∀x, y ∈ V : ρ(f (x), f (y)) = ρ(x, y). Příklad 2.8 Nalezněte všechny ortogonální homomorfizmy f : V → W, pro něž u 7→ v, je-li ve zvolených ortonormálních bázích B, C po řadě prostorů V, W dáno: √ √ {u}B = (− 2, 2), {v}C = (0, −2).
[Návod: uvažte platnost věty 2.44. Řešení: existují právě dva ortogonální homomorfizmy, a to o maticích √ √ √ √ 1 − 2 1 √2 ] √ √2 √2 , resp. 2− 2 2 2 − 2− 2 Definice 2.16 Buďte V, W euklidovské vektorové vektorové prostory. Řekneme, že uvedené euklidovské vektorové prostory jsou izomorfní, existuje-li ortogonální izomorfizmus V na W. Přívlastek euklidovské ve spojení „euklidovské vektorové prostory jsou izomorfníÿ je třeba zdůraznit. Někdy se – právě pro odlišení od běžného homomorfizmu vektorových prostorů – užívá také obratu ortogonálně izomorfní vektorové prostory nebo izometrické vektorové prostory. Poznámka 2.9 Na základě důsledku 2.15 vidíme, že relace být ortogonálně izomorfní je opravdu symetrická. Právě uvedená definice je tedy v tomto smyslu korektní. Již víte, že jsou-li vektorové prostory (V, +, T, ·) a (W, ⊕, T, ◦) izomorfní, znamená to více, než jen to, že existuje bijekce mezi množinami V a W jejich vektorů: v sekci 2.1 jsme ukázali, že i sčítání vektorů ⊕ a násobení vektorů skalárem ◦ ve druhém z prostorů jsou plně určeny odpovídajícími operacemi v prostoru prvním, v tom smyslu jste hovořili o tom, že mezi těmito vektorovými prostory není třeba – až na pojmenování vektorů – rozlišovat. 68
Uvažujme nyní dva izomorfní euklidovské vektorové prostory ((V, +, R, ·), •) a (W, ⊕, R, ◦), ⊙) a nechť f je příslušný ortogonální izomorfizmus V na W. Podívejme se nyní, jak skalárně vynásobit dva vektory u, w náležící W. Protože na základě důsledku 2.15 a definice 2.15 můžeme psát u ⊙ w = f (f −1 (u)) ⊙ f (f −1 (w)) = f −1 (u) • f −1 (w), vidíte, že tento skalární součin je plně určen skalárním součinem • na vektorech ve V. Lze tedy říci, že (též) dva izomorfní euklidovské vektorové prostory jsou navzájem svými „přesnými kopiemiÿ, oprávněně se proto užívá obratu, že dva izomorfní euklidovské vektorové prostory se liší jen pojmenováním svých prvků.
Z definice 2.16 je jasné, že jsou-li dva euklidovské vektorové prostory ortogonálně izomorfní, jsou izomorfní jako vektorové prostory, a tedy dle věty 2.6 mají stejnou dimenzi. Najděte zdůvodnění pro tvrzení obrácené! [Návod: připomeňte si poznámku 2.8.] Tím dokážete následující větu (srovnejte ji s větou 2.6!).
Věta 2.49 Dva euklidovské vektorové prostory jsou izomorfní, právě když mají touž dimenzi.
69
Poznámky:
70
3
Faktorové vektorové prostory Student zná pojem faktorový vektorový prostor. Umí rozhodnout o kongruenci vektorů dle podprostoru a dovede sestrojit faktorizaci dle daného podprostoru, nalézt její bázi a určit dimenzi. Student dovede aplikovat větu o homomorfizmu k určení všech homomorfních obrazů zvoleného vektorového prostoru a dovede použít teorii faktorových vektorových prostorů ke konstrukci afinního prostoru a jeho podprostorů. V prvním semestru jste se seznámili s relací ekvivalence na množině a naučili se sestrojit rozklad (faktorizaci) této množiny dle zvolené ekvivalence. S využitím těchto znalostí se v této kapitole naučíte ke zvolenému podprostoru vektorového prostoru přiřadit relaci ekvivalence (kongruence) tak, aby na množině vzniklých tříd (lineárních variet) bylo možné zkonstruovat strukturu vektorového prostoru. Uvidíte, že větu o homomorfizmu množin lze rozšířit vektorové prostory. Poznáte, že afinní prostor, známý vám z geometrie, lze získat také pomocí faktorizace vektorového prostoru dle jeho podprostorů.
Symbolem V budeme dále rozumět libovolný n-rozměrný vektorový prostor nad tělesem T . Definice 3.1 Buď K ⊆⊆ V, a∈V. Pak se množina označovaná a + K definovaná vztahem a + K = {x ∈ V; ∃y ∈ K : x = a + y} nazývá lineární varieta prostoru V určená vektorem a o zaměření K. Poznámka 3.1 Uvažujme 2-rozměrný vektorový prostor V, jeho jednorozměrný podprostor (směr) K a některý vektor a ∈ V (viz obrázek). Pak je lineární varieta a + K rovna množině vektorů, jejichž koncové body leží na tečkované přímce.
Poznámka 3.2 1. Přímo z definice 3.1 plyne, že pro každý x z V platí x ∈ a + K ⇔ x − a ∈ K. 71
2. Nelze obecně ztotožňovat varietu a + K s podprostorem [a] + K. (Promyslete si! Čemu by byl roven podprostor [a] + K v případě popsaném v poznámce 3.1?) Nyní zavedeme na množině V pro každý podprostor K jistou relaci. Ukážeme pak, že je právě tou ekvivalencí, která množinu V rozkládá na množinu právě všech lineárních variet o zaměření K.
Definice 3.2 Buď K ⊆⊆ V, a, b∈V. Řekneme, že vektor a je kongruentní s vektorem b modulo K14 , což značíme a ≡ b (mod K), jestliže vektor b − a náleží K. Vždy je třeba uvést, vzhledem ke kterému podprostoru K jsou uvažované vektory kongruentní – pracujeme-li současně s různými podprostory ve V, musíme vždy důsledně mod K k symbolu a ≡ b uvádět. Jen pokud je zřejmé, který podprostor máme na mysli, můžeme psát jen a ≡ b. Odvoďte platnost následujícího lemmatu. Lemma 3.1 Buď K⊆⊆V. Pak platí: 1. ∀a ∈ V : a ≡ a (mod K),
2. ∀a, b ∈ V : a ≡ b (mod K) ⇒ b ≡ a (mod K),
3. ∀a, b, c ∈ V : (a ≡ b (mod K) ∧ b ≡ c (mod K)) ⇒ a ≡ c (mod K).
Tedy: Věta 3.1 Relace „být kongruentní modulo Kÿ je pro každý podprostor K ⊆⊆ V relací ekvivalence na množině V. Věta 3.2 Buďte K⊆⊆V, a, x ∈ V. Pak platí: x ∈ a + K ⇔ x ≡ a (mod K). Připomeňte si definici rozkladu množiny dle relace ekvivalence15 . Tak získáte – již avizované – důležité tvrzení: užívá se též obratu podle K nebo vzhledem ke K. třída rozkladu určená např. prvkem a je množina právě všech prvků, které jsou s ním ekvivalentní 14
15
72
Důsledek 3.1 Buďte K⊆⊆V, a ∈ V. Pak lineární varieta a + K je třídou rozkladu množiny V podle relace „být kongruentní modulo Kÿ určená prvkem a. Z tohoto důsledku, definice 3.2 a Vám známých vlastností rozkladů množin (zde tedy rozkladu množiny V dle relace ≡ (mod K)) získáte toto tvrzení: Věta 3.3 Buď K⊆⊆V. Pak pro každé a, b z V platí: 1. ∀a, b ∈ V : (a + K = b + K) ⇔ (b − a) ∈ K, 2. ∀a ∈ V : (a + K = K) ⇔ a ∈ K,
3. ∀x, y, a ∈ V : (x ∈ a + K ∧ y ∈ a + K) ⇔ (y − x) ∈ K. Zvolte si K⊆⊆V. Pak můžete zkonstruovat rozklad množiny V dle ekvivalence ≡ (mod K) – množinu právě všech variet prostoru V o zaměření K. Označme tuto tzv. faktorovou množinu symbolem V/K. Platí tedy: V/K = {{x ∈ V; ∃y ∈ K : x = a + y}, a ∈ V} = {{a + K}, a ∈ V}. Na této množině chceme vybudovat strukturu vektorového prostoru nad T – tedy definovat sčítání variet a násobení variety skalárem: (i) Zvolme a + K, b + K ∈ V/K a položme (a + K) + (b + K) = (a + b) + K,
(3.1)
(ii) Zvolme a + K ∈ V/K, t ∈ T a položme16 t · (a + K) = (t · a) + K.
(3.2)
Ukažte, že definice operací +, · vztahy (3.1) a (3.2) jsou korektní, tedy že nezávisí na výběru vektoru určujících danou varietu (tzv. reprezentant variety) – varieta c + K může být přece určena také jiným vektorem c. [Návod: mezi dvěma vektory c, c určujícími stejnou varietu musí platit vztah plynoucí z věty 3.3 (1). Pak již stačí porovnat variety, které mají být výsledkem součtu variet, resp. t-násobku variety.] 16
symbol „·ÿ budeme obvykle vynechávat a psát jen t(a + K)
73
Definice 3.3 Buď K⊆⊆V a nechť jsou dány a + K, b + K ∈ V/K a t ∈ T . Pak 1. součtem lineárních variet a + K a b + K rozumíme lineární varietu označovanou (a + K) + (b + K) a definovanou vztahem (3.1), 2. (skalárním) t-násobkem lineární variety a+K rozumíme lineární varietu označovanou t · (a + K) a definovanou vztahem (3.2). Věta 3.4 Buď K ⊆⊆ V. Pak množina V/K spolu se sčítáním lineárních variet a násobením lineární variety skalárem z T tvoří vektorový prostor nad tělesem T . Ověřte, že (V/K, +, T, ·) splňuje axiomy vektorového prostoru, kde nulovou varietou je varieta o + K a opačnou varietou k lineární varietě a + K je varieta ((−a) + K). Odvoďte, pro jaké vektory b je varieta b + K varietou nulovou17 . Věta 3.5 Buď K⊆⊆V. Pak množina V/K spolu se sčítáním lineárních variet a násobením lineární variety skalárem z T tvoří vektorový prostor nad tělesem T . Definice 3.4 Buď dán K⊆⊆V. Pak vektorový prostor (V/K, +, T, ·) nazýváme faktorový vektorový prostor vektorového prostoru V podle podprostoru K (nebo krátce jen faktorizace vektorového prostoru V podle podprostoru K). Nyní si blíže všimneme vztahu mezi vektorovým prostorem V a jeho faktorizací V/K. Z teorie rozkladů množin víte, že zobrazení ν přiřazující prvku dané množiny třídu rozkladu tímto prvkem určenou je surjekcí dané množiny na její rozklad (tzv. přirozené zobrazení). Vezmete-li v našem případě navíc v úvahu definici 3.3, uvidíte, že přirozené zobrazení bude navíc homomorfizmem V na V/K – jsme tedy oprávněni vyslovit definici 3.5. Připomeňte si dále větu o homomorfizmu množin, podle níž: (1) každá surjekce f zvolené množiny V na jistou množinu W budí na množině V ekvivalenci ≈ ztotožňující prvky mající stejný obraz v zobrazení f ; (2) surjekci f lze právě jedním způsobem rozložit na přirozené zobrazení 17
[Řešení: b + K je nulová pro libovolné b ∈ K.]
74
ν množiny V na její faktorizaci V / ≈ a bijekci g této faktorizace na množinu W . Zvolme nyní dva vektorové prostory V, W, epimorfizmus f : V → W a aplikujme větu o homomorfizmu množin. Protože f je homomorfizmus, pak snadno zjistíme, že: ∀u, v ∈ V : (u ≈ v) ⇔ (u − v ∈ Ker f ) ⇔ (u ≡ v(mod Ker f )), neboli onou vzbuzenou ekvivalencí na V je právě relace ≡ (mod Ker f ) dle definice 3.2. Využijeme-li definici 3.3 operací s lineárními varietami, přesvědčíme se, že bijekce g, pro niž g ◦ νKer f = f , tyto operace zachovává, a je tedy bijektivním homomorfizmem. Souhrnně řečeno, zjistili jste, že následující definice je korektní a věta 3.6 platná. Definice 3.5 Buď dán K ⊆⊆ V. Zobrazení νK : V → V/K definované relací ∀a ∈ V : νK (a) = a + K nazýváme přirozený (nebo kanonický) homomorfizmus příslušný faktorizaci V/K. Věta 3.6 (o homomorfizmu vektorových prostorů) Buďte V, W vektorové prostory. Pak ke každému epimorfizmu f : V → W existuje právě jeden izomorfizmus g : V/ Ker f → W tak, že g ◦ νKer f = f, neboli následující diagram komutuje:
Nahradíte-li v předešlé větě slovo „epimorfizmusÿ slovem „homomorfizmusÿ a slovo „izomorfizmusÿ slovem „monomorfizmusÿ, obdržíte opět platné, avšak obecnější, tvrzení. Zdůvodněte! [Návod: použijte důsledek 2.1] 75
Právě uvedená věta umožňuje – až na izomorfizmus – popsat všechny homomorfní obrazy daného vektorového prostoru: Důsledek 3.2 Množina všech homomorfních obrazů dané vektorového prostoru je až na izomorfizmus rovna množině všech jeho faktorizací podle jednotlivých jeho podprostorů Zaměříme se na zjištění dimenze a nalezení báze faktorizace V/K. Pro určení dimenze je podstatné, že Im νK = V/K. Pak již použitím věty 2.11 získáte větu 3.7. Pro nalezení některé báze faktorizace V/K výjdeme ze zřejmé skutečnosti, že lineární varieta určená lineární kombinací vektorů je lineární kombinací variet těmito vektory určených s týmiž koeficienty [proč?]. Odtud vidíte, že lineární variety určené vektory libovolné báze prostoru V tvoří množinu generátorů faktorizace V/K. Uvědomte si, jaké variety určují vektory náležící podprostoru K a sestrojte bázi B prostoru V doplněním libovolné báze podprostoru K. Počet nenulových lineárních variet určených prvky takové báze B je pak dle věty 3.7 roven dimenzi faktorizace V/K. Tím jste se přesvědčili o platnosti věty 3.8.
Věta 3.7 Buď dán K ⊆⊆ V. Pak platí: dim V/K = dim V − dim K.
Věta 3.8 Buď dán K ⊆⊆ V. Buď he1 , . . . , en−k i libovolný systém vektorů doplňující některou bázi podprostoru K na bázi prostoru V. Pak he1 + K, . . . , en−k + Ki je bází faktorového vektorového prostoru V/K.
76
Poznámka 3.3 Jednou z aplikací teorie faktorových vektorových prostorů je konstrukce afinního prostoru (kterou – patrně jiným způsobem – znáte z geometrie): Máme-li dán vektorový prostor V můžeme afinní prostor A s tímto zaměřením, tj. A = A(V), vybudovat takto: • body afinního prostoru A budeme rozumět právě všechny jednoprvkové podmnožiny ve V (tj. všechny faktorizace V podle triviálního podprostoru) – tedy např. A = {a}, B = {b}, kde a, b ∈ V, jsou příklady bodů v A; • přímkami afinního prostoru A budeme rozumět právě všechny faktorizace V podle jeho jednorozměrných podprostorů, tedy např. p = a + K, q = b + L, kde a, b ∈ V, K, L ⊆⊆ V, dim K = dim L = 1, jsou příklady přímek v A, jde po řadě o přímku určenou bodem A = {a} a směrem K a přímku určenou bodem B = {b} a směrem L; obecně:
• k-rozměrnými afinními podprostory afinního prostoru A, 0 ≤ k ≤ n, budeme rozumět právě všechny faktorizace V podle jeho k-rozměrných podprostorů, tedy např. K = a + K, L = b + L, kde a, b ∈ V, K, L ⊆⊆ V, dim K = dim L = k, jsou příklady k-rozměrných podprostorů v A, jde po řadě o podprostor určený bodem A = {a} a zaměřením K a podprostor určený bodem B = {b} a zaměřením L;
• relací incidence je množinová inkluze, tedy bod A = {a} leží v podprostoru L = b + L, právě když a ∈ b + L, neboli a − b ∈ L. Patrně tedy tečkovaně na obrázku v poznámce 3.1 je znázorněna přímka určená bodem A = {a} a směrem K, přičemž bod Y1 = {y1 + a} je jedním z jejích bodů, neboť y1 ∈ K. Příklad 3.1 Ve vektorovém prostoru V4 je dán podprostor K = [u, v] a vektor x ∈ V. {u} = (1, 2, 1, 1), {v} = (2, 0, 0, 1) a {x} = (1, −2, 2, −1).
Stanovte dimenzi faktorového vektorového prostoru V/K a nalezněte alespoň jednu jeho bázi; dále stanovte souřadnice variety x + K v této bázi. [Návod: Pro výpočet dimenze použijte větu 3.7. Pro konstrukci některé báze C faktorizace postupujte dle průvodce před větou 3.7. Uvažte, že varieta x + K má v bázi C = he1 + K, e2 + Ki souřadnice x1 , x2 , právě když x − (x1 e1 + x2 e2 ) ∈ K. Řešení: • dim V/K = 2,
• C je např. h(0, 0, 1, 0) + K, (0, 0, 0, 1) + Ki, • {x + K}C = (3, −1). ]
77
Poznámky:
78
4
Duální vektorový prostor Student definuje duální vektorový prostor, zná pojem lineární forma. Umí na množině lineárních forem zavést strukturu vektorového prostoru. Zná pojem duální báze a dovede ji k dané bázi vektorového prostoru zkonstruovat. Umí přiřadit vektoru z daného vektorového prostoru lineární formu a naopak. V kapitole 2 jste poznali speciální druh zobrazení mezi vektorovými prostory nad stejným tělesem skalárů – homomorfizmy vektorových prostorů. Nyní si všimnete zvláštního případu homomorfizmu. Protože každé komutativní těleso lze považovat za (1-rozměrný) vektorový prostor nad sebou samým, můžeme uvažovat pro vektorový prostor V nad tělesem T homomorfizmy Hom(V, T ), které nazveme lineární formy. A právě jejich vlastnostem patří tato kapitola.
Symbolem V budeme dále rozumět libovolný n-rozměrný vektorový prostor nad tělesem T . Definice 4.1 Buď V vektorový prostor nad T . Pak 1. vektorový prostor Hom(V, T ) nazýváme duální vektorový prostor prof; storu V a značíme jej V f nazýváme lineární forma na V. 2. každý prvek f z V
Poznámka 4.1 • Lineární formou na V je tedy každé zobrazení f : V → T s vlastnostmi 1. ∀u, v ∈ V : f (u + v) = f (u) + f (v), 2. ∀u ∈ V, ∀t ∈ T : f (tu) = tf (u).
f je množina právě všech lineárních forem na • Duální vektorový prostor V V spolu se sčítáním lineárních forem a násobením lineární formy skalárem (viz definice 2.6). • S pojmem lineární forma se setkáváme i v teorii polynomů, kde je chápán jako homogenní polynom stupně 1. Jak uvidíte, je lineární forma ve smyslu naší definice právě takové zobrazení V → T , jehož analytickým vyjádřením je homogenní polynom stupně 1 – tedy lineární forma ve smyslu teorie polynomů, kde neurčitými jsou souřadnice vektoru z V. Protože lineární forma je zvláštním případem homomorfizmu, je celá řada jejích vlastností jen specializací obecných pojmů a tvrzení o homomorfizmech, které jste poznali v kapitole 2. Uvedeme proto jen některá tvrzení z nich (najděte k nim odpovídající tvrzení ve zmíněné kapitole!) 79
Věta 4.1 Buď V vektorový prostor. Pak platí f = dim V. dim V Věta 4.2 Ke každé bázi B = hu1 , . . . , un i vektorového prostoru V a každé uspořádané n-tici (a1 , . . . , an ) skalárů z T existuje právě jedna lineární forma f na V s vlastností f (ui ) = ai , i = 1, . . . , n. (4.1) Poznámka 4.2 Pokud jde o volbu báze v T , jakožto vektorovém prostoru, budeme implicite předpokládat, že zvolená báze je h1i. Matici lineární formy f vzhledem k bázi B, což je patrně sloupcový vektor (a1 , . . . , an )T se složkami danými relací (4.1), budeme proto značit jen (f, B). Věta 4.3 Buď f lineární forma na V a B libovolná báze prostoru V. Pak pro každý x z V platí: f (x) = {x}B (f, B),
neboli, je-li {x}B = (x1 , . . . , xn ) a B = hu1 , . . . , un i, pak f (x) = a1 x1 + a2 x2 + · · · + an xn , kde f (ui ) = ai , i = 1, . . . , n.
fn je izomorfní s aritmetickým vektoroVěta 4.4 Duální vektorový prostor V n vým prostorem T . Je-li B báze prostoru V, pak je zobrazení HB definované relací f: HB (f ) = (f, B) ∀f ∈ V
fn na T n . izomorfizmem vektorového prostoru V
Následující věta vyplývá rovněž z teorie řešení soustav lineárních homogenních rovnic. Věta 4.5 Buď f lineární forma na V. Pak platí: 1. f = o, právě když Ker f = V, 2. f 6= o, právě když dim Ker f = n − 1.
80
Pro prostor Hom(Vn , Wm ) umíte sestavit jistou bázi – viz důsledek 2.5. f. Zvolme bázi B proZkonstruujme nyní její zvláštní případ pro prostor V storu V, B = he1 , . . . , en i.
Protože v našem případě m = 1, budeme prvky – tedy lineární formy – f značit nikoli he11 , e21 , . . . , en1 i, ale (po tvořící příslušnou bázi prostoru V řadě) he˜1 , e˜2 , . . . , e˜n i. (4.2)
Přitom uvedené lineární formy (tzv. souřadnicové lineární formy) splňují relaci (ověřte!) ∀i, 1 ≤ i ≤ n : e˜i (ek ) = δik , k = 1, . . . , n.
(4.3)
Pojmenování souřadnicová lineární forma vychází z následujícího řetězce rovností, kdy můžeme pro libovolný x ∈ V, {x}B = (x1 , . . . , xn ), a zvolené i, i = 1, . . . , n, psát: e˜i (x) = e˜i
n X k=1
xk ek =
n X
(4.3) xk e˜i (ek ) = xi .
k=1
Definice 4.2 Buď B = he1 , . . . , en i báze prostoru V. Pak systém lineárních forem he˜1 , e˜2 , . . . , e˜n i definovaných relací (4.3) budeme nazývat báze prostoru f duální k bázi B a budeme ji značit B. e V Z věty 4.2 plyne:
Věta 4.6 Buď B = he1 , . . . , e2 i báze prostoru V, G = hg1 , . . . , gn i báze prof. Pak je báze G bází duální k bázi B, právě když storu V ∀i, 1 ≤ i ≤ n : gi (ek ) = δik , k = 1, . . . , n.
f. VyčerUkázali jsme, jak k dané bázi prostoru V přiřadit bázi prostoru V f pává se tak množina všech bází duálního prostoru V ?
Užitím definice matice přechodu a relací (4.3) byste dospěli k této větě: Věta 4.7 Buďte B, C báze prostoru V. Pak platí: e B) e = (B, C)T . (C, 81
f je duální k právě jedné bázi prostoru V. Důsledek 4.1 Každá báze prostoru V Z důsledku 2.5,(3) vyplývá:
Věta 4.8 Je-li B báze prostoru V, pak pro libovolnou lineární formu f platí: (f, B) = (a1 , . . . , an ) ⇔ {f }Be = (a1 , . . . , an ). Neboli: Ve zvolené bázi má analytické vyjádření lineární formy f tvar f (x) = a1 x1 + · · · + an xn , právě když f = a1 e˜1 + · · · + an e˜n . f definované Důsledek 4.2 Je-li B báze prostoru V, pak zobrazení β : V → V předpisem ∀a ∈ V : β(a) = f ⇔ {f }Be = {a}B f. je izomorfizmem vektorového prostoru V na V
Pozn.: Jestliže tedy má např. vektor a ve zvolené bázi souřadnice (1, 8, −2), pak je mu izomorfizmem β přiřazena lineární forma f mající analytické vyjádření f (x) = x1 + 8x2 − 2x3 . Věta 4.9 Buďte f, g lineární formy na V. Pak platí, že Ker f ⊆ Ker g, právě když existuje c ∈ T tak, že g = cf . Pamatujte si, že pořadí forem nelze zaměnit – v případě, že by g byla forma nulová a f nenulová, není možné vyjádřit f jako c-násobek formy g. Příklad 4.1 Na vektorovém prostoru V3 jsou dány lineární formy g1 , g2 , g3 . f a v kladném případě nalezněte Rozhodněte, zda G = hg1 , g2 , g3 i je bází prostoru V bázi prostoru V, k níž je báze G duální, je-li ve zvolené bázi B prostoru V dáno: g1 (x) = x1 + 2x2 g2 (x) = x1 − x2 + x3 g3 (x) = 2x1 + x2 .
[Návod: Pro zjištění, zda G tvoří bázi si uvědomte význam koeficientů analytického vyjádření lineární formy dle věty 4.8 a pak již postupujte, jako v případě např. aritmetických vektorů. Pro nalezení báze v V, k níž je G duální, využijte větu 4.6. Řešení: Ano, jedná se o bázi. Jde o bázi duální k bázi k C = hc1 , c2 , c3 i, kde {c1 }B = (− 31 , 32 , 1),
{c2 }B = (0, 0, 1), 82
{c3 }B = ( 23 , − 13 , −1).]
Poznámky:
83
5
Pseudoinverzní matice a homomorfizmy Student umí vymezit pojem pseudoinverzní matice (obecná i Moor–Penroseova) a dovede k dané matici matice pseudoinverzní nalézt. Student zná souvislosti mezi teorií pseudoinverzí a teorií homomorfizmů či teorií soustav lineárních rovnic. Dovede teorii pseudoinverzí aplikovat při konstrukci optimálního přibližného řešení soustavy lineárních rovnic. V prvním semestru jste se seznámili s pojmem inverzní matice k dané matici regulární. V této lekci poznáte, jak lze uvedený pojem zobecnit pro libovolnou matici. Dozvíte se také, jak souvisí vlastnosti pseudoinverzních matic s řešitelností soustav lineárních rovnic a naučíte se další metodu přibližného řešení soustav lineárních rovnic. Poznáte také, jak zobecnit pojem inverzního homomorfizmu i pro případ libovolného homomorfizmu.
5.1
Pseudoinverzní matice V případě, kdy A je regulární čtvercová matice nad tělesem T , existuje k této matici matice inverzní, značená symbolem A−1 , tedy (jediná) matice s vlastností AA−1 = A−1A = E. (5.1) V této kapitole pojem inverzní matice vhodným způsobem zobecníme – zavedeme pojem pseudoinverzní matice – , a to nejen bez ohledu na regularitu či singularitu matic čtvercových, ale i bez ohledu na typ matice. Buď A ∈ Mn×n (T ) regulární matice a uvažujme soustavu lineárních rovnic o této matici: AxT = cT , (5.2) kde c ∈ T n .
Řešením (jediným) této soustavy je zřejmě vektor x = (x1 , x2 , . . . xn ), xT = A−1 cT .
(5.3)
Z relace (5.1) dále plyne identita AA−1 A = A.
(5.4)
Nadále uvažujme matici A zcela obecného typu, tj. A ∈ Mm×n (T )
(5.5)
a soustavu m lineárních rovnic o n neznámých AxT = cT , 84
(5.6)
kde c ∈ T m . Tato soustava je pro některé c řešitelná, pro jiné nikoli18 .
Viděli jsme, že v případě regulárních matic existuje ke každé matici A (jediná) matice B s vlastností ABA = A, jakož i to, že pak (pro libovolné c ∈ T n ) je vektor ve tvaru xT = BcT řešením soustavy (5.6). To nás inspiruje k následující úvaze:
(i) Buď A ∈ Mm×n (T ) a nechť existuje B ∈ Mn×m (T ) taková, že ABA = A.
(5.7)
Buď dále c ∈ T m takové, že soustava (5.6) je pro ně řešitelná – ať u ∈ T n je jejím některým řešením, tj. AuT = cT . Pak můžeme psát: (5.7) A(BcT ) = (AB)cT = (AB)(AuT ) = (ABA)uT = AuT = cT .
Vidíme, že vektor x, xT = BcT je (dalším) řešením soustavy (5.6). (ii) Nyní předpokládejme, že k matici A ∈ Mm×n (T ) existuje matice B ∈ Mn×m (T ) taková, že pro každé c ∈ T m , pro které je soustava (5.6) řešitelná, je uspořádaná n-tice x, xT = BcT , jedním z jejích řešení. Platí v tomto případě identita (5.7)? Označme pro libovolné i = 1, . . . , n symbolem ei uspořádanou n-tici mající i-tou složku rovnu 1 a ostatní rovny 0. Vynásobením libovolné matice vektorem ei zleva obdržíme její i-tý řádek a jejím vynásobením vektorem eTi zprava její i-tý sloupec. Označíme-li a(i) i-tý sloupec matice A, platí tedy AeTi = a(i) ,
(5.8)
neboli pro cT = a(i) je soustava (5.6) řešitelná. To však dle našeho předpokladu znamená, že platí A(Ba(i) ) = a(i) , (5.9) a pro i = 1, . . . , n tak můžeme psát: (5.9) (ABA)eTi = (AB)(AeTi ) = (AB)a(i) = A(Ba(i) ) = a(i) .
Získaná soustava rovností (ABA)eTi = a(i) , 1 ≤ i ≤ n, znamená, že matice ABA a A mají všechny sloupce stejné, a tedy se rovnají. Platí tedy (5.7). 18
viz Frobeniova věta
85
Věta 5.1 Buď A ∈ Mm×n (T ). Pak platí: 1. jestliže existuje matice B ∈ Mn×m (T ) taková, že ABA = A, pak platí, že pro každé c ∈ T m , pro které je soustava AxT = cT řešitelná, náleží x, xT = BcT , do množiny jejích řešení; 2. jestliže existuje matice B ∈ Mn×m (T ) taková, že pro každé c ∈ T m , pro které je soustava AxT = cT řešitelná, náleží x, xT = BcT , do množiny jejích řešení, pak platí ABA = A.
Z předešlých úvah vyplývá vhodnost zavedení pojmu pseudoinverzní matice následujícím způsobem. Definice 5.1 Buď dána matice A ∈ Mm×n (T ). Pak pseudoinverzní maticí k matici A rozumíme každou matici A− , A− ∈ Mn×m (T ), s vlastností AA−A = A.
(5.10)
Pozn.: symbol A− čteme „A minusÿ; vedle pojmu pseudoinverzní matice se někdy hovoří též o zobecněné inverzi, g-inverzi. Poznámka 5.1 Z definice pseudoinverzní matice vyplývá, že v případě, kdy je A regulární matice, existuje jediná matice A− a platí A− = A−1 . V případě, kdy A je nulová matice typu m × n, je maticí A− libovolná matice typu n × m. Pseudoinverzní matice k dané matici (pokud existuje) nemusí být obecně jediná, a proto symbol minus nebude zobrazením Mm×n (T ) do Mn×m (T ). Existuje ke každé matici matice pseudoinverzní? Uvažujme matici A ∈ ∈ Mm×n (T ). Pak na základě vět 2.12 a 2.9 existuje matice D = (dij ) téhož typu taková, že pro všechna i, j, 1 ≤ i ≤ m, 1 ≤ j ≤ n, platí (i6=j ⇒ dij = 0) a dii ∈ {0, 1}, a regulární matice B ∈ Mm×m (T ), C ∈ Mn×n (T ) s vlastností A = BDC.
(5.11)
Uvážíme-li definici součinu matic, snadno se přesvědčíme, že platí (promyslete si!): D = D DTD. (5.12) 86
Nyní je již zřejmé, že položíme-li X = C−1DTB−1 , pak použitím (5.11) a (5.12) obdržíme: AXA = (BDC)(C−1 DT B−1 )(BDC) = (BD)(CC−1 ) DT(B−1 B)(DC) = = B(D DTD)C = BDC = A. Matice X tedy splňuje požadavky kladené na pseudoinverzní matici A− (viz (5.10)).
Věta 5.2 Ke každé matici existuje alespoň jedna pseudoinverzní matice. Jaký důsledek má právě uvedená věta pro řešení soustav lineárních rovnic?
Příklad 5.1 Je dána matice A z M3×3 (R) 1 0 3 A = 0 1 1. 2 −1 5
Najděte matice pseudoinverzní k A. [Návod: Označte si hledanou matici A− = (bij )3×3 . Z podmínky (5.10) obdržíte soustavu lineárních rovnic pro prvky bij . Jistě jste si povšimli, že matice A je singulární, a tudíž bude existovat více než jedna pseudoinverzní matice. Řešení: Pseudoinverzní maticí k matici A je každá matice následujícího tvaru: 1 − 3b31 − 2b13 −3b32 + b13 b13 A− = −2b23 − b31 1 + b23 − b32 b23 , b13 , b23 , b31 , b32 ∈ R.] b31 b32 0
87
5.2
Moor–Penroseova pseudoinverze. Optimální přibližné řešení soustav lineárních rovnic. Student umí vymezit pojem Moor–Penroseova pseudoinverzní matice. Dovede k dané matici nalézt Moor–Penroseovu pseudoinverzní matici. Student dovede definovat optimální přibližné řešení soustavy lineárních rovnic, zná jeho vlastnosti a aplikuje tyto poznatky k nalezení optimálního přibližného řešení pro danou soustavu rovnic. Student zná Moor-Penroseův homomorfizmus a dovede jej zkonstruovat k zadanému homomorfizmu. Student zná souvislosti teorie Moor–Penroseovy pseudoinverze a teorie projekcí vektorového prostoru na podprostor. V předešlé kapitole jste se seznámili s pojmem pseudoinverzní matice, která k dané matici není obecně jediná. V této kapitole poznáte – pro případ reálných matic – speciální případ pseudoinverzí – Moor–Penroseovu matici, která je dané matici přiřazena jednoznačně. Uvidíte, jak pomocí ní hledat jistá přibližná řešení soustav lineárních rovnic (s jednou metodou jste se již seznámili, věta 1.41). Dozvíte se také, jak zobecnit pojem inverzního homomorfizmu tak, aby jej – v případě euklidovských vektorových prostorů – bylo možné konstruovat nejen k izomorfizmům.
5.2.1
Moor–Penroseova pseudoinverzní matice
Definice 5.2 Buď dána matice A ∈ Mm×n (R). Pak Moor–Penroseovou pseudoinverzní maticí k matici A rozumíme matici A+ , A+ ∈ Mn×m (R), s vlastností 1. A+ je pseudoinverzní maticí k A (tj. AA+A = A), 2. A je pseudoinverzní maticí k A+ (tj. A+AA+ = A+ ), 3. matice AA+ i A+A jsou symetrické. Pozn.: symbol A+ čteme „A plusÿ; pro matici A+ se užívá i jen názvu Moor– Penroseova matice. Uvědomte si, že Moor–Penroseovu matici zavádíme jen pro případ matic nad reálnými čísly. Jaký význam mají součiny matic P=AA+ a Q=A+A? Snadno se použitím bodů 1 a 2 definice 5.2 přesvědčíte, že matice P, Q jsou idempotentní a tedy vzhledem k bodu 3 zmíněné definice představují v souladu s důsledkem 2.10 a větou 2.40 matice ortogonálních projekcí po řadě p, q v prostorech po řadě
88
Rm , Rn se standardním skalárním součinem. V aritmetickém vektorovém prostoru je formulí f (x) = x C dán homomorfizmus, jehož obraz je roven řádkovému podprostoru matice C [proč?]. S ohledem na větu 2.17 vidíte, že Im p je obsažen v řádkovém podprostoru matice A+ a Im q v řádkovém podprostoru matice A. Víte z prvního semestru, že hodnost součinu libovolných matic je menší nebo rovna hodnosti kterékoli z nich19 . Zkuste se užitím definice 5.1 přesvědčit, že speciálně pro matici a matici pseudoinverzní nastává v uvedeném vztahu hodností rovnost. Proto tedy jsou obrazy obou projekcí rovny zmíněným řádkovým podprostorů. Lemma 5.1 Buď A reálná matice, k níž existuje matice A+ . Pak platí: 1. (AA+ ) je maticí ortogonální projekce prostoru Rm na řádkový podprostor matice A+ , 2. (A+ A) je maticí ortogonální projekce prostoru Rn na řádkový podprostor matice A. Uvážíte-li, že transpozicí přejde řádkový podprostor dané matice v podprostor sloupcový, pak lze z definičních vlastností Moor–Penroseovy matice odvodit: Lemma 5.2 Buď A reálná matice, k níž existuje matice A+ . Pak platí: 1. sloupcový podprostor matice A je roven řádkovému podprostoru matice A+ , 2. sloupcový podprostor matice A+ je roven řádkovému podprostoru matice A. Poznámka 5.2 Buď dána matice A ∈ Mm×n (R). Popišme nyní konstrukce matice A+ . Označme B = hb(1) , b(2) . . . b(r) i bázi sloupcového podprostoru matice A a označme F matici tvořenou právě uvedenými sloupci, tj. F ∈ Mm×r (R). Dále vyjádřeme jednotlivé sloupce a(1) , a(2) . . . a(n) matice A jako lineární kombinace prvků báze B a(1) = g11 b(1) + g12 b(2) + · · · + g1r b(r) a(2) = g21 b(1) + g22 b(2) + · · · + g2r b(1) ... a(n) = gn1 b(1) + gn2 b(1) + · · · + gnr b(1) 19
pokud jste tento fakt již zapomněli, odvoďte si jej např. z věty 2.17
89
a zaveďme matici G = (gij ), G ∈ Mn×r (R). Můžete se přesvědčit, že Moor–Penroseova matice k matici A je dána relací A+ = G(G T G)−1 (F T F)−1 F T .
(5.13)
Je Moor–Penroseova matice k dané matici jediná? Zadáme-li reálnou matici A typu m × n, je tím bezpochyby jednoznačně určena ortogonální projekce prostoru Rn na její řádkový podprostor i ortogonální projekce prostoru Rm na její podprostor sloupcový – tedy jednoznačně jsou v souladu s lemmaty 5.1 a 5.2 určeny i jejich matice Q, P. Pokud by A∗ byla rovněž Moor– Penroseovou maticí k matici A, muselo by platit (A+ A) = Q = (A∗ A) a (AA+ ) = P = (AA∗ ), odkud užitím bodů 1, 2 definice 5.1 lze odvodit A∗ = A+ (zkuste to!). Věta 5.3 Ke každé reálné matici existuje právě jedna Moor–Penroseova pseudoinverzní matice.
V sekci 1.3 jste se naučili nalézt přibližné řešení soustavy lineárních rovnic A(x1 , x2 , . . . , xn )T = (b1 , b2 , . . . , br )T , které jsme nazvali metoda nejmenších čtverců (viz věta 1.41). Připomeňme, že jsme se snažili nalézt takové aritmetický vektory x = (x1 , x2 , . . . , xn ), pro něž by hodnota ρ((A(x1 , x2 , . . . , xn )T ), (b1 , b2 , . . . , br )T ) byla co nejmenší. Nyní si ukažme další metodu přibližného řešení soustav lineárních rovnic, která se nebude snažit minimalizovat pouze hodnotu kAxT − bT k, ale i délku onoho přibližného řešení, tj. hodnotu kxk. Takové přibližné řešení pojmenujeme takto: Definice 5.3 Buď dána soustava lineárních rovnic AxT = bT ,
(5.14)
kde A ∈ Mm×n (R), b ∈ Rm . Aritmetický vektor x0 ∈ Rn se nazývá optimální přibližné řešení soustavy lineárních rovnic (5.14), jestliže:
1. pro každé x, x ∈ Rn , platí : AxT − bT ≥ AxT0 − bT ,
2. platí-li pro některé x, x ∈ Rn , x 6= x0 : AxT − bT = AxT0 − bT , pak kx0 k < kxk . 90
Pro ty b, pro něž (5.14) řešitelná, je dle věty 5.1 n-tice xT =A− bT jedním z jejích řešení. Jakou roli bude hrát speciálně řešení xT0 =A+ bT ? Je-li x také řešením soustavy (5.14), lze psát: x0 = b(A+ )T = (xAT )(A+ )T = x(A+ A),
neboli x0 = q(x).
Jak víme, je q ortogonální projekce, a tudíž dle věty 1.29 bude pro x 6= x0 : kx0 k < kxk. To ovšem znamená, že x0 = b(A+ )T vyhovuje oběma požadavkům definice 5.3.20 A jaký význam bude mít x0 = b(A+ )T v obecném případě (tj. b je libovolný vektor z Rm tedy i takový, kdy soustava nemá řešení)? Pro součin AxT0 můžeme psát: x0 AT = b(A+ )T AT = b(AA+ )T = b(AA+ ),
neboli (x0 AT ) = p(b),
a tudíž – protože p je ortogonální projekce – (x0 AT ) náleží v souladu s lemmaty 5.2 a 5.1 do sloupcového podprostoru matice A a dle věty 1.37 je tak splněn požadavek 1 definice 5.3. Podobnými úvahami byste se přesvědčili i o tom, že pro ty x, pro něž kAxT − bk = kAxT0 − bk – což ovšem značí xAT = x0 AT – splňuje x0 i požadavek 2 (zkuste to!) Věta 5.4 Buď (5.14) soustava lineárních rovnic o matici A ∈ Mm×n (R). Pak aritmetický vektor x0 ∈ Rn daný relací xT0 = A+ bT
(5.15)
je optimálním přibližným řešením soustavy lineárních rovnic (5.14).
Věta 5.5 Je-li soustava lineárních rovnic (5.14) řešitelná, pak aritmetický vektor x0 daný relací (5.15) je takovým řešením této soustavy, které má nejmenší možnou délku ze všech jejích řešení. Pozn.: hovoří se o optimálním nebo minimálním řešení příslušné soustavy; hodP nota ni=1 x2i je pro toto řešení ze všech řešení nejmenší možná.
20
první je splněn triviálně
91
5.2.2
Moor–Penroseův homomorfizmus Jak jste poznali v kapitole 2.1, existuje inverzní zobrazení jen k těm homomorfizmům, které jsou izomorfizmy. Zobecněme tedy pojem izomorfizmu tak, aby jisté zobecněné zobrazení bylo možné zkonstruovat ke každému homomorfizmu. Uvažujme euklidovské vektorové prostory V, W a homomorfizmus f : V → W. Označme dále ⊥ ⊥ V(1) = Ker f, V(2) = V(1) , W(2) = Im f, W(1) = W(2) .
(5.16)
Protože V = V(1) ⊕ V(2) (a f je homomorfizmus), platí pro restrikci f na V(2) , že Im(f |V(2) ) = Im f a Ker f |V(2) = {o}, což ovšem znamená, že f |V(2) je izomorfizmem V(2) na W(2) . Uvažujme ortogonální projekci pW(2) prostoru W na podprostor W(2) . Následující kompozicí je tak zkonstruován homomorfizmus f + : W → V takto: f + = pW(2) ◦ (f |V(2) )−1 (5.17) Homomorfizmus f + je možné ekvivalentně vyjádřit formulí: ∀x ∈ W, x=x1 +x2 , x1 ∈ W1 , x2 ∈ W(2) : (f + (x) = y) ⇔ (f (y) = x2 , y ∈ V(2) )
(5.18)
Definice 5.4 Buďte V, W euklidovské vektorové prostory a nechť je dán homomorfizmus f : V → W. Pak homomorfizmus f + : W → V definovaný relací (5.17) se nazývá Moor–Penroseův pseudoinverzní homomorfizmus k homomorfizmu f . Podobně jako v případě Moor-Penroseovy matice můžeme hovořit jen o Moor– Penroseově homomorfizmu. Poznámka 5.3 Z úvah před definicí 5.4 vyplývá, že f + je epimorfizmem, právě když f je monomorfizmem a je monomorfizmem, právě když f je epimorfizmem. Je patrno, že f + je inverzním homomorfizmem k f , tj.f + = f −1 , právě když f je izomorfizmus. Věta 5.6 Buďte V, W euklidovské vektorové prostory. Ke každému homomorfizmu f : V → W existuje právě jeden Moor-Penroseův homomorfizmus f + : W → V. 92
Poznámka 5.4 Moor-Penroseův homomorfizmus je vázán na volbu skalárního součinu v obou vektorových prostorech - při změně některého z nich obdržíme ke zvolenému homomorfizmu f obecně jiný homomorfizmus f + (srv. Poznámka 1.1). Užitím relací (5.16) a (5.17), resp. (5.18), ukažte, že pro zvolený homomorfizmus f a jeho Moor–Penroseův homomorfizmus f + platí: -
f ◦ f + ◦ f = f, f + ◦ f ◦ f + = f +, f ◦ f + je ortogonální projekce V na V(2) , f + ◦ f je ortogonální projekce W na W(2) .
Odtud a z definice 5.221 je již patrna platnost věty popisující matici Moor– Penroseova homomorfizmu (proč je nutný předpoklad ortonormálností bází?) Věta 5.7 Buďte V, W euklidovské vektorové prostory, B, C po řadě ortonormální báze těchto prostorů. Pak pro každý homomorfizmus f : V → W platí: (f + , C, B) = (f, B, C)+ .
(5.19)
Příklad 5.2 Je dána soustava lineárních rovnic: x1 + 2x2 + 3x3 + 4x4 = 5 x1 + x2 + 2x3 + 3x4 = 2 2x1 + 3x2 + 5x3 + 7x4 = 3 Najděte její optimální přibližné řešení. [Návod: Označte A matici soustavy a b vektor pravých stran. Optimální přibližné řešení je dáno relací (5.15). Nejprve nalezněte matici A+ – postupujte dle Poznámky 5.2: Protože h(A) = r = 2, lze volit 12 F = (b(1) , b(2) ) = 1 1 , 23 a pak tedy
21
1 0 G= 1 2
a ovšem s využitím např. vět 2.17 a 2.40
93
0 1 . 1 1
Dále zjistíme, že T
−1
(F F)
1 = 3
14 −9 −9 6
T
−1
, (G G)
1 = 3
1 −1 −1 2
.
Dosazením do relace (5.13) obdržíte
−7 8 1 1 10 −11 −1 . A+ = 9 3 −3 0 −4 5 1
Dosazením do relace (5.15) získáte výsledek −7 8 1 5 1 10 −11 −1 T 2, x0 = 3 −3 0 9 3 −4 5 1
tj. optimálním přibližným řešením je uspořádaná trojice 16 25 7 x0 = (x1 , x2 , x3 ) = − , ,− . 9 9 9
Pozn.: pro zadanou soustavu platí, že h(A) = 2, h(A|b) = 3, není tedy řešitelná.]
94
Poznámky:
95
Poznámky:
96
Doporučená literatura [1] Bican, L.: Lineární algebra a geometrie. Vyd. 2. Praha: Academia, 2009, 303 s. ISBN 978-80-200-1707-9. [2] Bican, L.: Lineární algebra v úlohách. Praha: Státní pedagogické nakladatelství, 1982, 303 s. [3] Gantmacher, F. R.: Teorija matric. 4. vyd. Moskva: Nauka, 1988, 548 s. [4] Geľfand, I.: Lectures on linear algebra. 1. vyd. New York: Dover Publications, 1989, 185 p. ISBN 04-866-6082-6. [5] Jukl, M.: Lineární operátory. 1. vyd. Olomouc: Univerzita Palackého, Přírodovědecká fakulta, 2001, 107 s. ISBN 80-244-0342-0. [6] Jukl, M.: Lineární algebra: euklidovské vektorové prostory : homomorfizmy vektorových prostorů. 2., upr. vyd. Olomouc: Univerzita Palackého v Olomouci, 2010, 179 s. ISBN 978-80-244-2522-1. [7] Naylor, W., Sell, G.: Teória lineárných operátorov v technických a prírodných vedách. Bratislava: Alfa, 1981, 627 s. [8] Rao, C. R., Mitra, K. S.: Generalized Inverse of Matrices and Its Application, New York 1971 Generalized inverse of matrices and its applications. Vyd. 2. New York: Wiley, 1971, xiv, 240 p. ISBN 04-717-0821-6. [9] Zlatoš, P.: Lineárna algebra a geometria: cesta z troch rozmerov s presahmi do príbuzných odborov. 1. vyd. Bratislava: Marenčin PT, 2011, 741 s. ISBN 978-80-8114-111-9.
97