Úvod do lineární algebry učební text pro studenty FS TUL
Martina Šimůnková 20. února 2007
Obsah 1 Vektorové prostory 1.1 Geometrické a fyzikální vektory . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Operace s geometrickými vektory . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Sčítání geometrických vektorů . . . . . . . . . . . . . . . . . . . . . 1.2.2 Násobení geometrického vektoru číslem . . . . . . . . . . . . . . . . 1.3 Vlastnosti operací s geometrickými vektory . . . . . . . . . . . . . . . . . . 1.4 Definice vektorového prostoru . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Příklady vektorových prostorů . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Souřadnice vektoru, baze, aritmetické vektory . . . . . . . . . . . . . . . . 1.7 Definice baze obvyklá v učebnicích, lineární (ne)závislost vektorů . . . . . . 1.8 Změna souřadnic při změně baze, matice přechodu . . . . . . . . . . . . . . 1.9 Násobení matice aritmetickým vektorem . . . . . . . . . . . . . . . . . . . 1.10 Matice inverzní k matici přechodu a Gauss-Jordanova metoda jejího výpočtu 1.10.1 Ještě jeden příklad na Gauss-Jordanovu metodu . . . . . . . . . . . 1.11 Tři baze a násobení matic přechodu . . . . . . . . . . . . . . . . . . . . . . 1.12 Otočení a osová symetrie jako speciální příklady změny baze . . . . . . . . 1.12.1 Odvození matice otočení . . . . . . . . . . . . . . . . . . . . . . . . 1.13 Souřadný systém a souřadnice vektoru – vzájemné souvislosti těchto pojmů
3 3 3 3 4 4 6 7 10 11 13 15 16 17 19 20 21 22
2 Základní pojmy maticového počtu 24 2.1 Operace s maticemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.2 Vlastnosti operací s maticemi . . . . . . . . . . . . . . . . . . . . . . . . . 26
2
Kapitola 1 Vektorové prostory 1.1
Geometrické a fyzikální vektory
Budeme vycházet z běžné středoškolské definice vektoru jako veličiny, která je určena velikostí, směrem a orientací. Tato názorná představa má jednu výjimku, a sice nulový vektor – vektor o nulové velikosti nemající směr ani orientaci. Geometrický vektor si můžeme znázornit jako orientovanou úsečku, nebo přesněji množinu úseček o stejné délce, směru a orientaci. Na obrázku jsou znázorněny vektory a, b a c. Vektory a, b mají stejnou velikost a směr, ale opačnou orientaci.
V dalším textu zavedeme bazi vektorového prostoru a souřadnice vektoru vzhledem k bazi. Ukážeme, že v prostorech konečné dimenze (definice viz další text) můžeme místo vektorů pracovat s jejich souřadnicemi – tzv. aritmetickými vektory. Dále ukážeme, že stejně jako geometrické vektory můžeme sčítat a násobit číslem, můžeme stejné operace provádět s funkcemi a že pojmy vybudované na geometrických vektorech můžeme v analogickém významu používat i na prostorech funkcí.
1.2
Operace s geometrickými vektory
Představa vektoru jako množiny úseček o stejné délce, směru a orientaci nám umožňuje definovat součet dvou vektorů a číselný násobek vektoru.
1.2.1
Sčítání geometrických vektorů
Na obrázku jsou znázorněny vektory a, b a na dalším obrázku je znázorněn jejich součet c = a + b. 3
1.2.2
Násobení geometrického vektoru číslem
Na dalším obrázku jsou znázorněny součiny b = 1.6a a c = −2.4a.
Od těchto dvou operací je odvozena tvorba lineární kombinace dvou nebo více vektorů c = 1.3a + 0.7b.
1.3
Vlastnosti operací s geometrickými vektory
Operace součtu dvou geometrických vektorů má následující vlastnosti 1. Pro libovolné dva vektory a, b je a + b = b + a. 2. Pro libovolné tři vektory a, b, c je (a + b) + c = a + (b + c). Na obrázku je žlutě znázorněna levá strana rovnosti, čárkovaně pravá.
4
Tuto vlastnost využíváme k vypouštění závorek, píšeme stručněji a + b + c. 3. Existuje vektor, který nazýváme nulovým vektorem a označujeme 0, pro nějž a pro libovolný vektor a platí a + 0 = a. Tuto vlastnost splňuje geometrický vektor o nulové délce, který jako jediný geometrický vektor nemá směr ani orientaci. 4. Ke každému vektoru a existuje vektor b, který splňuje a + b = 0. Tuto vlastnost pro nenulový geometrický vektor a splňuje vektor stejné velikosti a směru jako vektor a, ale opačně orientovaný. Pro nulový geometrický vektor a = 0 tuto vlastnost splňuje nulový vektor b = 0. Vektor b nazýváme vektorem opačným k vektoru a a často ho označujeme −a. Součet vektoru −a s vektorem c pak píšeme místo c + −a stručněji c − a. Operace násobení geometrického vektoru číslem má vlastnosti 5. Pro každý vektor a platí 1a = a. 6. Pro každý vektor a platí 0a = 0. 7. Pro každou dvojici čísel α, β a pro každý vektor a platí α(βa) = (αβ)a. Díky této vlastnosti můžeme vypouštět závorky a psát stručněji αβa. Obě operace splňují distributivní zákony 8. Pro každou dvojici čísel α, β a pro každý vektor a platí (α + β)a = αa + βa. 9. Pro každé číslo α a pro každou dvojici vektorů a, b platí α(a + b) = αa + αb. 5
1.4
Definice vektorového prostoru
Tento oddíl je určen převážně pro studenty se zájmem o hlubší pochopení. Nepatříte-li k nim, čtěte pozorně pouze následující dva odstavce. Libovolnou množinu, na které je definováno sčítání dvou prvků a násobení prvku reálným číslem splňující vlastnosti 1 – 9 z předchozí kapitoly nazveme vektorovým prostorem a její prvky nazýváme vektory. (V aplikacích se někdy požaduje možnost násobení komplexním číslem; my se v tomto textu vektorovými prostory nad komplexními čísly zabývat nebudeme.) Přitom požadujeme, aby jak výsledek součtu dvou vektorů, tak (číselný) násobek vektoru byly opět prvky daného vektorového prostoru. Ve skutečnosti není třeba požadovat splnění všech devíti vlastností – některé z nich jsou důsledkem ostatních. Ukážeme, že vlastnost 6 plyne z vlastností 8, 5, 4, 1, 2 a 3. Vyjdeme z platného vztahu (1 + 0)a = 1a a použijeme vlastnost 8 1a + 0a = 1a dále použijeme vlastnost 5 a + 0a = a přičteme k oběma stranám rovnice vektor opačný k vektoru a (a + 0a) − a = a − a levou stranu upravíme užitím vlastností 1, 2 0a + (a − a) = a − aa použijeme vlastnost 4 0a + 0 = 0 a na závěr vlastnost 3 0a = 0 Odvodili jsme vlastnost 6 pro libovolný vektor a. Nulový vektor 0 můžeme definovat pomocí vlastnosti 6, a pak můžeme vypustit vlastnosti 3 a 4 a ukázat, že plynou z vlastností 5, 6, 8. Vlastnost 6 je třeba pro tyto potřeby přeformulovat na • Existuje vektor 0 takový, že pro každý vektor a platí 0a = 0. Protože platí: a = 1a = (1 + 0)a = 1a + 0a = a + 0a = a + 0, 6
je vektor 0 z vlastnosti 6 nulovým vektorem dle vlastnosti 3. Dále platí 0 = 0a = (1 − 1)a = 1a + (−1)a = a + (−1)a, a proto je vektor (−1)a opačným vektorem k vektoru a. Výhoda výše uvedené axiomatické definice vektorového prostoru je v možnosti použití vlastností odvozených z axiomů na libovolný prostor okamžitě po ukázání platnosti axiomů (v případě vektorových prostorů hrají roli axiomů vlastnoti 1–5 spolu s 7–9 nebo vlastnosti 1–2 spolu s 5–9). Historicky axiomatické definice vznikají vypozorováním paralel v různých strukturách a pro studenty technických fakult bývají zpravidla obtížné pro svoji abstrakci. My v tomto textu budeme proto současně rozvíjet teorii jak na různých příkladech, tak ve všeobecném axiomatickém základu. Doufám, že alespoň někteří studenti během semestru nahlédnou, že „prokousání seÿ axiomatickým přístupem je užitečné – jakmile se vám to podaří, stanou se pro vás paralely z různých modelů (příkladů) vektorových prostorů samozřejmostí a co nastudujete pro jeden model, budete moci okamžitě uplatnit pro model jiný.
1.5
Příklady vektorových prostorů
Uvedeme několik příkladů vektorových prostorů (ve smyslu definice vektorového prostoru z minulé kapitoly). V textu jsou příklady prokládány množinami, které nejsou vektorovými prostory a všechny jsou číslovány (1 – 9). Místo geometrických vektorů (tj. orientovaných úseček) často pracujeme s jejich souřadnicemi tj. s uspořádanými dvojicemi, případně trojicemi reálných čísel). Součet dvou vektorů a číselný násobek vektoru je definován po složkách: (x1 , y1 ) + (x2 , y2) = (x1 + x2 , y1 + y2 ) α(x1 , y1) = (αx1 , αy1 ) 1. Množina všech uspořádaných dvojic reálných čísel s výše zmíněnými operacemi sčítání vektorů a násobení vektoru reálným číslem je vektorovým prostorem. Nulový vektor je 0 = (0, 0), vektorem opačným k vektoru (x1 , x2 ) je vektor (−x1 , −x2 ). Splnění vlastností 1, 2, 5 – 9 z definice vektorového prostoru je přímým důsledkem komutativity a asociativity sčítání a násobení reálných čísel a distributivního zákona. Dalšími příklady vektorových prostorů jsou podmnožiny množiny uspořádaných dvojic. Jak uvidíme v dalším, ne každá podmnožina je vektorovým prostorem. Protože na těchto podmnožinách pracujeme se stejnými operacemi jako na celé množině, jsou vlastnosti 1, 2 a 5 – 9 automaticky splněny. Zbývá ukázat, že a. v podmnožině leží nulový vektor, b. podmnožina s každým vektorem obsahuje i vektor k němu opačný, c. podmnožina s každými dvěma vektory obsahuje i jejich součet. 7
d. podmnožina s každým vektorem obsahuje všechny jeho násobky reálnými čísly. Ve skutečnosti stačí ověřit splnění vlastností c, d. Je-li podmnožina neprázdná, obsahuje se svým vektorem a i vektor 0a (a ten je roven nulovému vektoru 0). Dále s každým vektorem a obsahuje i vektor −1a, který je roven opačnému vektoru. 2. Množina geometrických vektorů v rovině jejichž koncové body leží (při umístění vektoru do počátku) na kružnici o rovnici x2 + y 2 = 1 není vektorovým prostorem. Není vektorovým prostorem např. proto, že neobsahuje nulový vektor (02 + 02 6= 1). 3. Zaměníme-li v předchozím příkladě kružnici za kruh opět nedostaneme vektorový prostor. Na obrázku jsou uvedeny příklady vektorů ležících v uvažovaném kruhu, jejichž součet v kruhu neleží. y
1
x
4. Množina vektorů s koncovým bodem ležícím na přímce p o rovnici 2x + 5y = 0 je vektorovým prostorem. Nechť koncové body vektorů A1 = (x1 , y1), A2 = (x2 , y2 ) leží na přímce p – tj. pro jejich souřadnice platí 2x1 +5y1 = 0, 2x2 +5y2 = 0. Rozmyslete si, že platí vlastnosti c, d, tedy, že i pro souřadnice vektorů αA1 = (αx1 , αy1), (kde α je libovolné reálné číslo), A1 + A2 = (x1 + x2 , y1 + y2 ) platí 2αx1 + 5αy1 = 0 a 2(y1 + y2 ) + 5(x1 + x2 ) = 0. 5. Zaměníme-li v předchozím příkladě přímku p za přímku q o rovnici 2x + 5y = 3 nedostaneme vektorový prostor. Tato mno není vektorovým prostorem např. proto, že neobsahuje nulový vektor (2 · 0 + 5 · 0 6= 3). Dále při stejném značení jako v předchozím příkladě platí 2αx1 +5αy1 = 3α a 2(y1 + y2 ) + 5(x1 + x2 ) = 6, a tedy například součet žádných dvou vektorů množiny q není jejím prvkem. S říklady podobnými příkladům 4 a 5 se později setkáme při řešení soustav lineárních rovnic. Ukážeme, že řešení soustavy s nulovou pravou stranou (tzv. soustava homogenních rovnic) tvoří vektorový prostor, zatímco řešení soustavy s nenulovou pravou stranou (tzv. soustava nehomogenních rovnic) netvoří vektorový prostor. 8
Dalšími příklady vektorových prostorů, významných v technické praxi, jsou prostory funkcí. Operace jsou definovány přirozeným způsobem. Pro funkce f : x 7→ f (x), g : x 7→ g(x) je definován jejich součet f +g : x 7→ f (x)+g(x) a součin funkce f s číslem αf : x 7→ αf (x). Mají-li všechny funkce uvažované množiny funkcí stejný definiční obor, jsou vlastnosti 1, 2 a 5 – 9 pro výše uvedené operace splněny. Aby uvažovaná neprázdná množina funkcí byla vektorovým prostorem, je nutné a stačí, aby platily podmínky c, d. Uveďme jen, že nulovým vektorem je tzv. nulová funkce o : x 7→ 0 a opačným vektorem k funkci f je funkce −f : x 7→ −f (x). Následující množiny funkcí podmínky c, d splňují. 6. Prostor Pn polynomů stupně n-tého a menšího. Definičním oborem polynomů je množina reálných čísel. 7. Speciálně prostor P2 polynomů P : x 7→ ax2 + bx + c, kde a, b, c jsou reálné parametry. 8. Pro zadaných n + 1 bodů nazývaných uzly: x0 < x1 < · · · < xn množina funkcí definovaných na intervalu hx0 , xn i a lineárních na intervalech hxi , xi+1 i pro i = 0, 1, . . . , n − 1. Tyto funkce nazýváme po částech lineárními funkcemi. Na obrázku je graf jedné po částech lineární funkce (pro n = 4).
x3 x0 x1
x2
x4
Na závěr ještě uvedeme množiny funkcí, které některou (případně obě) z podmínek c, d nesplňují, a tedy spolu s výše zmíněnými operacemi netvoří vektorový prostor. 9. Množina všech kvadratických funkcí. Na rozdíl od příkladu 7 neobsahuje polynomy nižšího stupně, tedy lineární funkce, konstantní funkce a nulový polynom. Kromě podmínky a, nesplňuje např. podmínku c, součet kvadratických funkcí f1 (x) = 2x2 + 3x, f2 (x) = −2x2 + 5 je lineární funkce (f1 + f2 )(x) = 3x + 5. 10. Množina všech rostoucích funkcí definovaných na množině reálných čísel. Je-li f rostoucí funkcí, je funkce −f k ní opačná klesající funkcí – uvažovaná množina tedy nesplňuje podmínku b. Mimochodem, podmínku c uvažovaná množina splňuje – součet rostoucích funkcí je rostoucí funkce. 9
Podmnožinu vektorového prostoru mající vlastnosti c a d nazveme podprostorem daného vektorového prostoru.
1.6
Souřadnice vektoru, baze, aritmetické vektory
Mají-li dva geometrické vektory a, b různé směry, určují rovinu a jejich libovolná lineární kombinace leží v této rovině. Ukážeme na příkladě, že platí i opak: libovolný vektor z dané roviny je možné vyjádřit jako lineární kombinaci vektorů a, b. Na obrázku jsou znázorněny vektory a, b, c.
Chceme-li vektor c vyjádřit jako lineární kombinaci vektorů a, b, vedeme koncovým bodem vektoru c rovnoběžky s vektory a, b.
Tím získáme vyjádření vektoru c jako součtu vektorů, které jsou násobky vektorů a a b.
Koeficienty, kterými je třeba vektory a, b vynásobit, zjistíme změřením velikosti vektorů; znaménko určíme z orientace. V našem příkladě vyjde c = 0.67a − 0.42b, kde přesnost koeficientů závisí na přesnosti s jakou změříme velikosti vektorů. Výše uvedená vlastnost geometrických vektorů v rovině nám umožňuje místo s vektory 0.67 pracovat s uspořádanou dvojicí čísel – v případě vektoru c s dvojicí ( −0.42 ). Tuto dvojici čísel nazýváme souřadnicemi vektoru c vzhledem k bazi {a, b}. Skupinu vektorů a1 , a2 , . . . , an , která umožňuje každý vektor v vyjádřit jednoznačně jako lineární kombinaci vektorů a1 , a2 , . . . , an , nazveme bazí vektorového prostoru. Číslo n – počet prvků baze – nazýváme dimenzí vektorového prostoru. Zde je podstatné, že dvě různé baze téhož vektorového prostoru mají stejný počet prvků – to je důsledkem Steinitzovy věty, jejíž znění ani důkaz nebudeme uvádět. Místo vektoru v = x1 a1 +x2 a2 +· · ·+xn an můžeme pracovat s jeho souřadnicemi. Proto zavedeme označení baze A = {a1 , a2 ,! . . . , an } a souřadnic vektoru vzhledem k bazi A v = ! x1 x2
x1 x2
.. .. . Uspořádanou n-tici čísel nazýváme aritmetickým vektorem dimenze n. . . xn xn V předchozí kapitole jsme uváděli příklady vektorových prostorů – prostor polynomů Pn a prostor po částech lineárních funkcí. Uvedeme příklady bazí v těchto prostorech. Jednou z bazí prostoru P2 jsou funkce e0 : x 7→ 1, e1 : x 7→ x, e2 : x 7→ x2 . Souřadnice c 2 E vektoru (funkce) p : x 7→ ax + bx + c vzhledem k bazi E = {e0 , e1 , e2 } jsou p = ab . 10
Jednou z bazí prostoru po částech lineárních funkcí se čtyřmi uzly x0 , x1 , x2 , x3 jsou funkce f0 , f1 , f2 , f3 dané grafy: 1 f0 :
x0
1 x1 x2
f1 :
x3
x0
1 f2 :
x0
x1 x2
x3
x1 x2
x3
1 x1 x2
f3 :
x3
x0
Po částech lineární funkce je jednoznačně zadána hodnotami v uzlech. Funkce f zadaná tabulkou funkčních hodnot x f (x)
x0 y0
x1 y1
x2 y2
x3 y3
y0 má vzhledem k bazi F = {f0 , f1 , f2 , f3 } souřadnice F f = yy12 . y3
Podobně jako ve výše uvedených příkladech můžeme v každém vektorovém prostoru, ve kterém umíme najít bazi o n prvcích, místo s vektory pracovat s aritmetickými vektory jejich souřadnic. Všechny vektorové prostory dimenze 1 (2, 3) si můžeme představit jako body na přímce, (v rovině, v prostoru). Pro prostory vyšší dimenze je geometrická představa obtížnější. Ještě obtížnější je (geometrická) představa vektorových prostorů nekonečné dimenze – to jsou prostory, které nemají bazi o konečném počtu prvků. Mezi prostory nekonečné dimenze patří mnohé příklady prostorů funkcí.
1.7
Definice baze obvyklá v učebnicích, lineární (ne)závislost vektorů
Pochopení úvah obsažených v této kapitole se možná bude zdát některým studentům obtížné, nicméně jej považuji za příležitost ke tříbení myšlení a za jednu z podmínek úspěšného absolvování předmětu. Dostanu-li z vaší strany konkrétní podnět, ve kterém bodě je pro vás pochopení nejobtížnější, jsem ochotna na příslušném místě text doplnit. Rozebereme podrobněji, co znamená slovo jednoznačně v definici pojmu baze. To, že vektor v je možné vyjádřit jako lineární kombinaci vektorů a1 , a2 , . . . , an , ale nikoliv jednoznačně, znamená, že existují různé n-tice x1 , x2 , . . . , xn a y1 , y2 , . . . , yn splňující v = x1 a1 + x2 a2 + · · · + xn an ,
(1.1)
v = y1 a1 + y2 a2 + · · · + yn an .
(1.2)
Odečtením rovnic (1.1) a (1.2) dostaneme 0 = (x1 − y1 )a1 + (x2 − y2 )a2 + · · · + (xn − yn )an 11
(1.3)
Označme z1 = x1 − yi pro i = 1, 2, . . . , n. Pak alespoň jedno ze zi je nenulové – připomeňme, že n-tice x1 , x2 , . . . , xn a y1 , y2 , . . . , yn jsou navzájem různé. Lineární kombinaci z1 a1 + z2 a2 + · · · + zn an ,
(1.4)
ve které jsou naopak všechna zi nulová, nazýváme triviální lineární kombinací – asi proto, že z vlastností 6 a 3 z definice vektorového prostoru „triviálněÿ plyne, že je rovna nulovému vektoru. Lineární kombinaci (1.4), ve které je alespoň jedno ze zi nenulové nazýváme netriviální lineární kombinací. Z výše provedených úvah plyne, že vyjádření (1.2) je jednoznačné, pokud pouze triviální lineární kombinace (1.4) je rovna nulovému vektoru. Vektory a1 , a2 , . . . , an nazýváme lineárně závislými, pokud existuje jejich netriviální lineární kombinace, která je rovna nulovému vektoru. Pokud taková netriviální lineární kombinace neexistuje, nazýváme vektory a1 , a2 , . . . , an lineárně nezávislými. V dalším textu budeme lineární závislost případně nezávislost pro stručnost značit LZ, LN. Rozeberme ještě jeden důsledek LZ vektorů. Pro jednodušší vysvětlení zvolme n = 5. Stejné úvahy je možno provést i v obecném případě. Zopakujme, že vektory a1 , a2 , . . . , a5 jsou LZ, pokud existuje pětice x1 , x2 , . . . , x5 taková, že alespoň jedno xi pro i = 1, 2, . . . , 5 je nenulové a platí 0 = x1 a1 + x2 a2 + x3 a3 + x4 a4 + x5 a5 . (1.5) Nechť je například x4 nenulové. Pak je možné z (1.3) vyjádřit a4 převedením 4. členu na druhou stranu rovnice a vydělením celé rovnice koeficientem x4 a4 = −
x2 x3 x1 a1 − a2 − a3 . x4 x4 x4
Vidíme, že ze skupiny LZ vektorů je možné alespoň jeden vektor (ve skutečnosti každý s nenulovým koeficientem ve (1.5)) vyjádřit jako lineární kombinaci ostatních vektorů skupiny. Platí i opak – je-li možné vyjádřit některý vektor – třeba a1 – jako lineární kombinaci ostatních a1 = y2 a2 + y3 a3 + y4 a4 jsou vektory a1 , a2 , . . . , a5 LZ – to je vidět po úpravě 0 = −a1 + y2 a2 + y3 a3 + y4 a4 + y5 a5 . Tato lineární kombinace je jistě netriviální, protože koeficient u vektoru a1 je roven −1, a je tedy nenulový. Shrňme poslední úvahy: skupina vektorů b1 , b2 , . . . , bn (záměrně jsem změnila značení, abyste se na to původní nezafixovali) je LZ tehdy a jen tehdy, můžeme-li alespoň jeden z vektorů skupiny vyjádřit jako lineární kombinaci ostatních vektorů skupiny. A jak se zpravidla definuje pojem baze v učebnicích lineární algebry? Zavede se ještě pojem generátorů vektorového prostoru – množinu vektorů B = {b1 , b2 , . . . , bn } nazveme množinou generátorů vektorového prostoru, pokud můžeme každý vektor prostoru vyjádřit jako lineární kombinaci vektorů z množiny B. A baze vektorového prostoru se pak definuje jako množina lineárně nezávislých generátorů prostoru. 12
V právě uvedené definici je jednoznačnost souřadnic vzhledem k bazi implicitně obsažena. V tomto textu jsme zvolili jiný postup, neboť se domnívám, že je správné v definici vypíchnout to, co je v ní podstatné a ne to schovávat do jiného pojmu. Nicméně je snad z výše uvedených úvah jasné, že obě definice jsou ekvivalentní – tj. mají stejný obsah.
1.8
Změna souřadnic při změně baze, matice přechodu
Na obrázku je znázorněna baze tvořená geometrickými vektory a1
Na dalším obrázku je přidána baze tvořená geometrickými vektory b1 přitom baze b1 , b2 je s bazí a1 , a2 svázána vztahy
b1 = 1.5a1 + 2a2
.
a2
b2 = a1 − 0.5a2 .
b2
(1.6)
Naším úkolem je určit souřadnice vektoru v vzhledem k bazi A = {a1 , a2 }, známe-li souřadnice téhož vektoru v vzhledem k bazi B = {b1 , b2 } a naopak – vyjádřit souřadnice vektoru v vzhledem k bazi B = {b1 , b2 } pomocí jeho souřadnic vzhledem k bazi A = {a1 , a2 }. Připomeňme, že zápis A v = ( xyaa ) znamená v = xa a1 + ya a2 ,
(1.7)
v = xb b1 + yb b2 .
(1.8)
a zápis B v = ( xybb ) znamená Dosadíme-li (1.6) do (1.8), dostaneme v = xb (1.5a1 + 2a2 ) + yb (a1 − 0.5a2 ), a po úpravě (roznásobení a následném vytknutí vektorů baze A) v = (1.5xb + yb )a1 + (2yb − 0.5yb)a2 .
(1.9)
Porovnáme-li (1.7) s (1.9) a uvědomíme-li si, že souřadnice vektoru vzhledem k bazi jsou určeny jednoznačně, dostaneme hledané vztahy mezi souřadnicemi xa = 1.5xb + yb , ya = 2xb − 0.5yb. 13
(1.10)
0.8 Uvedené vztahy znázorníme graficky pro vektor A v = ( −1.3 ).
. Jak z obrázku, tak ze vztahů (1.10) můžeme určit B v = ( −0.33 1.29 ). Vztahy mezi souřadnicemi (1.10) můžeme stručněji zapsat ve formě matice přechodu 1.5 1 . 2 −0.5 V obecném případě (prostoru dimenze 2) je matice přechodu od baze B k bazi A rovna p11 p12 P B→A = , p21 p22 pokud pro aritmetické vektory souřadnic téhož vektoru v vzhledem k oběma bazím: A v = ( xyaa ), B v = ( xybb ) platí xa = p11 xb + p12 yb , ya = p21 xb + p22 yb , tj. A
v=
p11 xb + p12 yb p21 xb + p22 yb
.
(1.11)
V ještě obecnějším případě prostoru dimenze n je matice přechodu od baze A = {a1 , a2 , . . . , an } k bazi B = {b1 , b2 , . . . , bn } rovna p11 p12 · · · p1n p21 p22 · · · p2n P A→B = . .. .. . . . . . . . pn1 pn2 · · · pnn
pokud pro aritmetické vektory souřadnic téhož vektoru v vzhledem k oběma bazím: A v = y1 ! x1 ! x2
.. .
xn
, Bv =
y2
.. .
platí
xn
y1 = p11 x1 + p12 x2 + · · · + p1n xn , y2 = p21 x1 + p22 x2 + · · · + p2n xn , .. . yn = pn1 x1 + pn2 x2 + · · · + pnn xn , 14
tj. B
v=
p11 x1 + p12 x2 + · · · + p1n xn p21 x1 + p22 x2 + · · · + p2n xn .. . pn1 x1 + pn2 x2 + · · · + pnn xn
.
Pro potřeby výpočtu matice přechodu je dobré si všimnout si, že ve sloupcích matice přechodu jsou souřadnice staré baze vzhledem k nové bazi.
1.9
Násobení matice aritmetickým vektorem
Uveďme několik terminologických poznámek 1 A=4 7
k matici přechodu na příkladu matice 2 3 5 6 8 10
Matice A má tři řádky a tři sloupce. Protože má stejný počet řádků jako sloupců, nazýváme ji čtvercovou maticí. Poznamenejme, že každá matice přechodu je čtvercovou maticí, o maticích obecnějšího typu, obdélníkových, budeme pojednávat v kapitole o lineárních zobrazeních. Pak budeme mluvit o maticích typu n × m – to jsou matice o n řádcích a m sloupcích. Místo matice typu n × m říkáme také někdy matice řádu n × m. Řádky číslujeme shora, sloupce zleva. Např. číslo 7 je v prvním sloupci a ve třetím řádku matice A. x1 ! V minulé kapitole jsme ukázali, že ze souřadnic vektoru A v =
pn1 x1 + pn2 x2 + · · · + pnn xn
.. .
vzhledem k bazi
xn
A a z matice přechodu od baze A k bazi B p11 p12 · · · p1n p21 p22 · · · p2n P A→B = . .. .. . . . . . . . pn1 pn2 · · · pnn
lze spočítat souřadnice vektoru v vzhledem k bazi B p11 x1 + p12 x2 + · · · + p1n xn p21 x1 + p22 x2 + · · · + p2n xn B v= .. .
x2
Pro snažší zápis a úpravy složitějších výrazů se souřadnicemi vektorů vzhledem k různým bazím zavádíme operaci součinu matice (zatím pouze čtvercové, pro obdélníkovou to bude obdobné) a sloupcového aritmetického vektoru p11 x1 + p12 x2 + · · · + p1n xn x1 p11 p12 · · · p1n p21 p22 · · · p2n x2 p21 x1 + p22 x2 + · · · + p2n xn = .. . . .. . . .. .. .. .. . . pn1 pn2 · · · pnn
pn1 x1 + pn2 x2 + · · · + pnn xn
xn
15
Na závěr ještě vypočtěme několik příkladů 2 −3 0 3 −6 1 5 −1 = 6 −2
−4
a b c d
2 −3
4
=
9 1 −26
2a − 3b 2c − 3d
2 −3 0 3 není definován. Součin −6 1 5 4 −4 6 −2
1.10
Matice inverzní k matici přechodu a GaussJordanova metoda jejího výpočtu
V kapitole 1.8 jsme uvažovali dvě baze A = {a1 , a2 }, B = {b1 , b2 } svázané vztahy b1 = 1.5a1 + 2a2
b2 = a1 − 0.5a2
(1.12)
1 definovali (zavedli) matici přechodu P B→A = ( 1.5 2 −0.5 ) a uvedli jsme, že matice přechodu je jen stručnějším vyjádřením vztahů mezi souřadnicemi vektoru v. Pokud je B v = ( xy ) 1.5x+y A 1 pak je A v = 2x−0.5y . Vztahy (1.12) můžeme zapsat: A b1 = ( 1.5 2 ), b2 = ( −0.5 ). Všimněte si, že ve sloupcích matice přechodu jsou souřadnice vektorů baze B (staré – původní) vzhledem k bazi A (nové). Toto platí pro libovolnou dvojici bazí a příslušnou matici přechodu. Cílem této kapitoly je získání matice přechodu v opačném směru – tj. z matice P B→A získat matici P A→B . Matici P A→B nazýváme inverzní maticí matice P B→A . V jejích sloupcích jsou, dle výše uvedeného, souřadnice vektorů baze A vzhledem k bazi B. Výpočet inverzní matice si ukážeme na příkladě. Sestavíme tabulku ze souřadnic bazových vektorů b1 , b2 . Před čarou jsou souřadnice vzhledem k bazi A a za čarou vzhledem k bazi A – uvědomte si, že b1 = 1b1 + 0b2 a b2 = 0b1 + 1b2 .
b1 b2
1.5 2 1 1 −0.5 0
0 1
Budeme doplňovat tabulku o další vektory, které získáme jako lineární kombinaci předchozích řádků, s cílem získat vektory a1 , a2 – tedy stejnou tabulku jedniček a nul před čarou jako máme na začátku za čarou. Nejdříve chceme získat vektor, jehož první souřadnice vzhledem k bazi A je nula. Takovým vektorem je např. c = b1 − 1.5b2 . b1 b2 c
1 0 1.5 2 1 −0.5 0 1 0 2.75 1 −1.5
Nyní je třeba se, podle kontextu, rozhodnout, zda budeme počítat v desetinných číslech a mezivýpočty zaokrouhlovat nebo přejdeme na počítání ve zlomcích. Dejme tomu, že jsme se rozhodli počítat ve zlomcích. Předchozí tabulka pak je 16
3/2 2 1 1 −1/2 0 0 11/4 1
b1 b2 c
0 1 −3/2
Dalším krokem je přidání vektoru d = 4/11c. b1 b2 c d
3/2 2 1 −1/2 0 11/4 0 1
1 0 0 1 1 −3/2 4/11 −6/11
Posledním krokem je přidání vektoru e = b2 + 1/2d. b1 b2 c d e
3/2 2 1 −1/2 0 11/4 0 1 1 0
1 0 0 1 1 −3/2 4/11 −6/11 2/11 8/11
Vektory d, e jsou rovny bazovým vektorům a1 , a2 a tudíž hledaná matice přechodu je P A→B =
1.10.1
2/11 4/11 8/11 −6/11
.
Ještě jeden příklad na Gauss-Jordanovu metodu
V prostoru dimenze 3 uvažujeme dvě baze A = {a1 , a2 , a3 }, B = {b1 , b2 , b3 }, jejichž prvky jsou svázány vztahy a1 = 2b1 − b3 , a2 = 3b1 − 2b2 − 3b3 , a3 = −2b1 + 4b2 , a naším cílem je vypočítat prvky matice přechodu P B→A . Z předchozí kapitoly víme, že sloupce hledané matice jsou souřadnice vektorů baze B vzhledem k bazi A a že je získáme z tabulky 2 3 −2
0 −1 1 −2 −3 0 4 0 0
0 0 1 0 0 1
eliminační metodou, při které vytváříme před čarou stejnou matici z nul a jedniček, jako máme na začátku za čarou. Pro větší přehlednost naznačíme v prvním sloupci, jakou lineární kombinací jsme příslušný řádek získali. 1 2 0 −1 3 −2 −3 0 −2 4 0 0 [2] − 3/2[1] 0 −2 −3/2 −3/2 [3] + 1[1] 0 4 −1 1 17
0 1 0 1 0
0 0 1 0 1
Zápis [2] − 3/2[1] před řádkem znamená, že jsme od druhého řádku odečetli 1.5násobek prvního řádku. 2 0 −1 1 0 3 −2 −3 −2 4 0 0 [2] − 3/2[1] 0 −2 −3/2 −3/2 [3] + 1[1] 0 4 −1 1 −2 [5] + 2[4] 0 0 −4 −[6]/4 0 0 1 1/2 [1] + [7] 2 0 0 3/2 [8]/2 1 0 0 3/4 [5] + [7] 0 4 0 3/2 [10]/4 0 1 0 3/8
0 0 1 0 0 1 1 0 0 1 0 1 −1/2 −1/4 −1/2 −1/4 −1/4 −1/8 −1/2 3/4 1/8 3/16
Červenou barvou zvýrazněné řádky odpovídají bazovým vektorům b3 , b1 , b2 . Hledaná matice přechodu je 3/4 3/8 1/2 P B→A = −1/4 1/8 −1/2 −1/8 3/16 −1/4
Uvedeme dva další způsoby výpočtu matice přechodu. První se bude lišit pouze způsobem zápisu, druhý i v počítání (ale nikoliv v algoritmu). Začneme tím, že do jednoho schématu zapíšeme matici přechodu P B→A (připomínám, že sloupce matice přechodu píšeme do řádků) spolu s maticí nul a jedniček (tu nazýváme jednotkovou maticí). 2 0 −1 1 0 0 3 −2 −3 0 1 0 −2 4 0 0 0 1
a provádíme výše uvedené úpravy 2 0 2 0 −1 1 0 0 3 −2 −3 0 1 0 ∼ 0 −2 −2 4 0 0 0 1 0 4 2 0 −1 1 0 0 2 0 0 −2 −3/2 −3/2 1 0 ∼ 0 −2 −2 2 1 0 0 −4 0 0 2 0 0 1 3/2 −1/2 −1/4 0 −2 0 −3/4 1/4 −3/8 ∼ 0 1/2 −1/2 −1/4 0 0 1 0
−1 1 0 0 −3/2 −3/2 1 0 ∼ 1 0 1 −1
1 0 0 −1 0 −3/4 1/4 −3/8 ∼ 1/2 −1/2 −1/4 1 0 0 3/4 −1/4 −1/8 1 0 3/8 −1/8 3/16 0 1 1/2 −1/2 −1/4
Sloupce matice přechodu se objeví v řádcích našeho schématu v okamžiku, kdy před čarou vytvoříme jednotkovou matici. Ukážeme si ještě na stejném příkladě, že můžeme na 18
začátku i na konci výpočtu vypustit napsání řádků do sloupců. 2 0 −1 1 0 0 1 0 0 2 0 −1 0 −2 ∼ 0 1 0 4 0 1 0∼0 −2 4 −2 4 0 0 0 1 0 −3/2 −1 1/2 0 1 [3] + [1]/2 2 0 0 1 3/2 0 [1] + 3/2[2] 0 −2 ∼ 4 0 1 0 0 0 −4 1/2 −3/4 1 [3] − 3/4[2] 2 0 0 3/2 3/4 1 [1] + [3] 0 −2 0 1/2 1/4 1 [2] + [3] ∼ 0 0 −4 1/2 −3/4 1 0 0 0 3/4 3/8 1/2 [1] + [3] 0 1 0 −1/4 −1/8 −1/2 [2] + [3] 0 0 1 −1/8 3/16 −1/4
Vidíme, že po vytvoření jednotkové matice před čarou se za čarou objeví inverzní matice. Zde je potřeba zdůraznit, že vynechání výměny řádků za sloupce můžeme provést nejen v tomto konkrétním případě, ale při výpočtu libovolné inverzní matice. Tento fakt zatím berme, že platí, i když pro něj nemáme řádné zdůvodnění. V některé z pozdějších kapitol jej zdůvodníme. V matematice je běžné všechna tvrzení podrobně zdůvodňovat. Tvrzení platná obecně – zpravidla pro nekonečně mnoho případů – není možno odmávnout tvrzením, že to dosud vždy vyšlo. V učebním textu určeném pro studenty technických oborů není samozřejmě nutné ani žádoucí všechna tato podrobná zdůvodnění provádět. Přesto však trvám na tom, že by měl student umět rozlišit, kdy je mu předkládán fakt k uvěření a kdy předkládaný fakt je zřetelně platný.
1.11
Tři baze a násobení matic přechodu
Uvažujme nyní tři baze v prostoru dimenze n = 2: A = {a1 , a2 }, B = {b1 , b2 }, C = {c1 , c2 } s maticemi přechodu P A→B =
p11 p12 p21 p22
P B→C =
q11 q12 q21 q22
.
(1.13)
Rozeberme ještě jednou podrobně, co vztahy (1.13) znamenají. Vektor a1 vyjádříme pomocí baze A následovně a1 = 1a1 +0a2 , a proto A a1 = ( 10 ). Obdobnou úvahou dostaneme: A a2 = ( 01 ). Dosazením do (1.11) z kapitoly 1.8 dostaneme B
a1 =
p11 p21
B
a2 =
p12 p22
.
(1.14)
11 x+q12 y (viz výše citovaný odkaz na vztah Dále pro vektor B v = ( xy ) platí C v = qq21 x+q22 y p11 B B C 11 p11 +q12 p21 (1.11) a speciálně pro vektory a1 = ( p21 ), a2 = ( pp12 a1 = qq21 , 22 ) platí p +q p 11 22 21 q11 p12 +q12 p22 C a2 = q21 p12 +q22 p22 . 19
Naším cílem je určit matici přechodu P A→C . Porovnáme-li (1.13) s (1.14), zjistíme, že ve sloupcích matice přechodu od baze A k bazi B jsou souřadnice vektorů baze A vzhledem k bazi B. Toto platí pro jakoukoliv dvojici bazí, a proto je q11 p11 + q12 p21 q11 p12 + q12 p22 P A→C = . (1.15) q21 p11 + q22 p21 q21 p12 + q22 p22 Všimněte si, že v i-tém řádku a j-tém sloupci je součet pi1 q1j + pi2 q2j . V případě prostoru dimenze n je v i-tém řádku a j-tém sloupci matice přechodu od baze A k bazi C součet pi1 q1j + pi2 q2j + . . . + pin qnj , kde pij , případně qij jsou prvky i-tého řádku a j-tého sloupce matice přechodu od baze A k bazi B, případně od baze B k bazi C. Matici P A→C nazýváme součinem matic P B→C a P A→B , značíme P B→C = P B→C P A→B . Na závěr uvedeme ještě několik příkladů, aby si čtenář mohl ověřit, že výše uvedenému textu správně porozuměl. Všimněte si, že násobení dvou matic je analogické násobení matice aritmetickým vektorem. −14 4 −1 5 2 −3 = −1 27 4 2 5 1 23 8 2 −3 −1 5 = 18 −10 5 1 4 2 Všimněte si, že, v obecném případě, záleží na pořadí, v jakém matice násobíme. 2 −1 −4 3 −9 −5 0 0 −28 −4 2 8 2 −6 6= 0 0 56 1 4 2 1 −3 3 13 −39 25 3 −9 −5 −1 5 Součin 2 −6 6 není definován. 4 2 1 −3 3
1.12
Otočení a osová symetrie jako speciální příklady změny baze
Na obrázku jsou znázorněny souřadnice bodu A vůči vzájemně pootočeným souřadným systémům. Úhel pootočení je vyznačen modře a jeho velikost označíme ω.
y
y
Vztahy mezi souřadnicemi [x, y] a [x, y] téhož bodu A jsou
A
x = x cos ω + y sin ω, y = −x sin ω + y cos ω.
x
(V následující kapitole tyto vztahy odvodíme.)
x
20
Změníme-li orientaci osy y, a tedy i znaménko příslušné souřadnice, budou vztahy mezi [x, y] a [x, y] x = x cos ω + y sin ω, y = x sin ω − y cos ω. Červená souřadná soustava vznikne v tomto případě z černé osovou symetrií, jejíž osa je zároveň osou modře vyznačeného úhlu. y A
x x
y
V této kapitole mluvíme o bodech místo o vektorech a na zdůraznění tohoto rozdílu píšeme souřadnice bodu do řádku a uzavíráme je do hranatých závorek. Ve skutečnosti místo bodů můžeme pracovat s jejich polohovými vektory. Výběr soustavy souřadné (tj. výběr os a volba jednotky na každé z nich) pak odpovídá výběru baze a souřadnice bodu jsou pak totožné se souřadnicemi jejich polohového vektoru. Více v kapitole 1.13.
1.12.1
Odvození matice otočení
Cílem této kapitoly je odvodit vztahy x = x cos ω + y sin ω, y = −x sin ω + y cos ω, uvedené v minulé kapitole. Nejdříve si uvědomíme, které další úhly mají velikost ω.
y
y A
x x 21
y
y A
Souřadnice x je součtem velikostí červených úseček, ty jsou x cos ω a y sin ω, a proto je x = x cos ω + y sin ω.
x x
y
y A Souřadnice y (na obrázku znázorněna čárkovaně) je rozdílem velikostí červených úseček, ty jsou y cos ω a x sin ω, a proto je x = −x sin ω + y cos ω.
x x
Poznámka: Ve výše uvedeném odvození byl zvolen bod A ležící v 1. kvadrantu v obou soustav souřadných. Pro bod ležící v jiném(-ých) kvadrantech je třeba odvození modifikovat, vede však ke stejnému výsledku.
1.13
Souřadný systém a souřadnice vektoru – vzájemné souvislosti těchto pojmů
V předcházející kapitole jsme udělali výjimku z jinak všeobecně používaného pojmu vektor a způsobu zápisu jeho souřadnic. Mluvili o bodech místo o vektorech – to se projevilo i v jejich označování netučnými velkými písmeny – a jejich souřadnice jsme psali do řádků a uzavírali do hranatých závorek (A = [x, y]). Pokud jsme touto nedůsledností čtenáře zmátli, nechť si uvědomí, že libovolný bod C – a to jak v rovině, tak v prostoru, ve kterých máme zavedený souřadný systém – můžeme nahradit jeho polohovým vektorem (tj. geometrickým vektorem, který při umístění svého počátečního bodu do počátku soustavy souřadné má svůj koncový bod v bodě C). Cílem této kapitoly je ukázat, že hodnoty běžně používaných souřadnic bodu jsou totožné se souřadnicemi jejich polohových vektorů vzhledem k bazi, která velmi přirozeným způsobem odpovídá zvolenému souřadnému systému. Začneme s kartézskou soustavou souřadnic v rovině. Ta má kolmé osy a shodné jednotky na osách. 22
y 2
A Na obrázku je vyznačen bod A = [3.5, 2].
1 1
2
3
y 2
4x A
Zvolíme-li za vektory baze polohové vektory bodů [1, 0] a [0, 1], má polohový vektor bodu A vzhledem k této bazi stejné souřadnice jako bod A.
1 1
2
3
4 x
Vše funguje obdobně v obecnějších soustavách souřadných. Uvedeme příklad soustavy s různými jednotkami na osách. y 4 A 3 V této soustavě souřadné je A = 2 [3.5, 3.3]. 1 1 2 3 4 x A na závěr ještě příklad soustavy, jejíž osy nejsou kolmé – takovou soustavu nazýváme afinní soustavou souřadnou. y 4 A 3 Zde je A = [2.9, 3.3].
2 1 1
2
3
4 x
23
Kapitola 2 Základní pojmy maticového počtu Maticí řádu m × n nazýváme obdélníkové schéma reálných (v případě vektorového prostoru nad komplexními čísly komplexních) čísel o m řádcích a n sloupcích. Čísla v matici nazýváme prvky matice. Dále mluvíme o řádcích matice a sloupcích matice a číslujeme je – řádky shora a sloupce zleva. Matice značíme obvykle velkými písmeny, jejich prvky příslušným malým písmenem s dvěma indexy – řádkovým a sloupcovým. Matice A řádu m × n a11 a12 · · · a1n a21 a22 · · · a2n A= . .. .. . .. .. . . . am1 am2 · · · amn
Matice B řádu 3 × 2
b11 b12 B = b21 b22 . b31 b32
Sloupcové aritmetické vektory o n složkách můžeme podle výše uvedené definice považovat za matici řádu n × 1. Budeme se v tomto případě držet dříve zavedeného označení vektoru malými tučnými písmeny. Složky vektoru budeme značit malými netučnými písmeny s indexem označujícím řádek. Místo matice řádu m × n říkáme též matice typu m × n. Dvě matice A, B se rovnají, pokud jsou stejného řádu a rovnají se všechny jejich odpovídající si prvky. Matici o n řádcích a n sloupcích nazýváme čtvercovou maticí řádu n. Čtvercovou matici, jejíž sloupce jsou lineárně nezávislé, nazýváme regulární maticí. Matice plné hodnosti je matice jejíž sloupce nebo řádky jsou lineárně nezávislé. Prvky aii matice A, tj. prvky jejichž řádkový a sloupcový index je stejný, nazýváme diagonálními prvky. Všechny diagonální prvky tvoří (hlavní) diagonálu. Čtvercovou matici řádu n, která má všechny diagonální prvky rovny jedné a ostatní nulové, nazýváme jednotkovou maticí řádu n. Jednotkovou matici budeme značit písmenem E, budeme-li chtít vyznačit, že je řádu n, pak E n . V literatuře se též používá písmeno I, případně I n . 24
Například:
1 0 E4 = 0 0
2.1
0 1 0 0
0 0 1 0
0 0 . 0 1
Operace s maticemi
Pro dvě matice A řádu m × n a B řádu n × p je definován součin AB jako matice C řádu m × p o prvcích cii = ai1 b1j + ai2 b2j + · · · + ain bnj =
n X
aik bkj .
k=1
Operaci, která maticím A, B přiřadí jejich součin nazýváme násobením matic. Například prvek ve 3. řádku a 1. sloupci součinu 1 2 3 5 −3 6 2 −5 2 1 2 −4 0 4 1 −1 −2 −3
je roven 0 · 5 + 2 · 1 − 4 · 4 = −14. Výsledný součin je
19 4 −11 29 S= . 0 −14 −19 −4
Maticí transponovanou k matici A řádu n × p nazýváme matici B řádu p × n, o prvcích bij = aji . Transponovanou matici obvykle značíme horním indexem T . Maticí transponovanou k matici S je matice 19 −11 −14 −19 S= . 4 29 0 −4 Z důvodů úspory místa se někdy píší vektory jako transponované matice k řád 4sloupcové kovým vektorům, např. místo a = 5 napíšeme a = ( 4 5 −2 )T případně a = (4, 5, −2)T . −2
Matici A, která se rovná svojí transponované matici (tedy A = AT ), nazýváme symetrickou maticí. Inverzní maticí k regulární matici A řádu n je matice, kterou značíme A−1 a která splňuje AA−1 = A−1 A = E n .
Výpočet inverzní matice gaussovou eliminační metodou je vysvětlen v kapitole 1.10.1. Mocnina čtvercové matice A s nezáporným celočíselným exponentem n je definována následovně: 25
• pro n = 0 je A0 rovno jednotkové matici stejného řádu jako matice A, • pro n > 0 je An = An−1 A. Je-li čtvercová matice A regulární, jsou definovány mocniny se záporným celočíselným exponentem n následovně A−n = (A−1 )n . Součtem dvou matic A, B stejného řádu m × n je matice C, která je též řádu m × n a jejíž prvky jsou cij = aij + bij .
2.2
Vlastnosti operací s maticemi
Některé z uvedených vlastností budeme ilustrovat na následujících maticích.
A=
−1 2 −3 4 1 0
−2 4 1 B = 3 −1 1 4 2 3
4 3 C = −2 4 . 1 2
Časem přibudou dvě kapitoly, ve kterých bude ukázána (dokázána) platnost uvedených vlastností. Sčítání matic je komutativní a asociativní operace, tj. pro matice A, B, C stejného typu platí: A+B =B+A (A + B) + C = A + (B + C) Platí distributivní zákony – jsou-li matice A, B stejného typu a matice C je takového typu, že jsou definovány součiny AB, BC, (A+B)C (tj. matice C má stejný počet řádků jako matice A, B sloupců), pak je (A + B)C = AC + BC. Za podobných předpokladů – zaručujících existenci příslušných operací – platí A(B + C) = AB + AC. Násobení matic je asociativní, tj. jsou-li matice A, B, C takového typu, že jsou definovány příslušné součiny, platí (AB)C = A(BC). 26
Pro výše uvedené matice je −4 −12 −8 , D 1 = AB = −5 15 5 0 −76 , (AB)C = D 1 C = −45 55 −15 12 D2 = BC = 15 7 , 15 26 0 −76 A(BC) = AD 2 = . −45 55
Násobení matic není komutativní. Například pro výše uvedené matice A, B je definován součin AB, ale nikoliv součin BA. Dále −11 −1 , AC = 14 16 zatímco
8 11 −12 CA = 18 0 6 . 7 4 −3
Jsou-li matice A, B takového typu, že je definován jejich součin AB, pak je definován i součin B T AT (všimněte si opačného pořadí násobení) a platí (AB)T = B T AT . Pro výše uvedené matice je −4 −5 (AB)T = B T AT = −12 15 . −8 5
Ke každé regulární matici A existuje inverzní matice. Pro libovolnou matici A řádu m × n jsou součiny AAT , AT A definovány a jsou to čtvercové symetrické matice řádu a m × n. Pro výše uvedenou matici A je 14 −2 T AA = −2 17 a
17 2 3 AT A = 2 5 −6 . 3 −6 9
Má-li matice A, která není čtvercová, plnou hodnost, je právě jedna z matic AAT , AT A regulární (ta o menším řádu). Pro výše uvedenou matici A je matice AAT regulární, zatímco matice AT A nikoliv. Ověřte, že pro její sloupce platí 17 2 3 2 = 4 5 + 3 −6 . 3 −6 9 27
Má-li matice A řádu m × n plnou hodnost, definujeme matici B B 1 = (AT A)−1 A pro m > n, B 2 = AT (AAT )−1 pro m < n. Pro matice B 1 , B 2 platí B1A = E n
AB 2 = E m .
Pro výše uvedenou matici A je −1/26 3/13 B2 = 2/13 1/13 . −17/78 −1/39
Ověřte, že platí
AB 2 =
28
1 0 0 1
.