Kapitola 5
Symetrické matice
Symetrické matice mají mezi všemi maticemi významné postavení. Nejen, že se častěji vyskytují v aplikacích, ale i jejich matematické vlastnosti jsou specifické. V této kapitole ukážeme mimo jiné, že každá reálná symetrická matice je podobná reálné diagonální matici. I když je možné odvodit i analogii tohoto tvrzení pro třídu komplexních matic nazývaných hermitovské, budou pro jisté zjednodušení naše další úvahy omezeny pouze na reálné matice. Proto budeme symetrickou maticí vždy rozumět reálnou symetrickou matici. Další vlastnosti symetrických matic odvodíme na základě jejich souvislosti s kvadratickými formami. Při vyšetřování symetrických matic bude hrát významnou úlohu skalární součin v Cn a Rn : (x, y ) =
n X
xk y k .
(5.1)
k=1
Věta 5.1 Skalární součin (5.1) má v Cn i Rn následující vlastnosti: a) (x, y ) = (y , x) pro všechny vektory x, y . b) (x + y , z ) = (x, z ) + (y , z ) pro všechny vektory x, y , z . c) (αx, y ) = α(x, y ) pro všechny vektory x, y a všechna čísla α. d) (x, x) ≥ 0 pro všechny vektory x; rovnost platí jen pro x = o. Důkaz. Vlastnosti a) – c) vyplývají přímo z (5.1) a vlastnost d) ze vztahu (x, x) =
n X
xk xk =
k=1
n X
|xk |2 .
(5.2)
k=1
2 Dsledek. Pro libovolný vektor x a libovolné číslo α platí (x, αy ) = α(x, y ). 2
Důkaz. Je kombinací vlastností a) a c).
Uvedené čtyři vlastnosti lze také považovat za základ axiomatické definice skalárního součinu v libovolném lineárním prostoru (ne nutně konečné dimenze). Jsou-li některá tvrzení v této kapitole vyslovena pro obecný lineární nebo vektorový prostor V místo Cn nebo Rn , pak skalárním součinem ve V rozumíme jakékoliv zobrazení V × V → C, mající čtyři výše uvedené vlastnosti. Povšimněme si, že skalární součin vektorů x a y v Cn i Rn lze vyjádřit též pomocí maticového násobení: (x, y ) = xT y . (5.3) Zde y = (y 1 , . . . , y n ). Důležitý je vztah skalárního součinu a násobení reálnou maticí. 69
70
Kapitola 5
Věta 5.2 Nechť A je reálná čtvercová matice n -tého řádu a x, y ∈ Cn . Pak (Ax, y ) = (x, AT y ). Důkaz. Na základě (5.3) je (Ax, y ) = (Ax)T y = (xT AT )y = xT (AT y ) = (x, AT y ).
2
Dsledek. Pro libovolnou reálnou symetrickou matici A a libovolné vektory x, y ∈ Cn platí (Ax, y ) = (x, Ay ).
5.1
(5.4)
Ortogonální matice
Pomocí skalárního součinu zavedeme nyní pojem velikosti vektoru a ortogonálnosti (kolmosti) vektorů. p Definice. Číslo (x, x) nazýváme velikostí vektoru x a značíme |x|. Vektory x, y se nazývají ortogonální, jestliže (x, y ) = 0. Vektory x1 , x2 , . . . , xk se nazývají ortonormální, jestliže 1 pro i = j (xi , xj ) =
. 0 pro i 6= j
Bázi tvořenou ortonormálními vektory nazýváme ortonormální bází. Příkladem ortonormální báze v Cn a Rn je standardní báze E. Věta 1.3 zajišťuje existenci báze v každém nenulovém lineárním prostoru. Nyní ukážeme, že platí ještě více, totiž že v každém nenulovém vektorovém prostoru se skalárním součinem existuje ortonormální báze. Nejdříve odvodíme lineární nezávislost libovolné ortonormální množiny. Věta 5.3 Každá ortonormální množina je lineárně nezávislá. Důkaz. Podle definice lineární nezávislosti stačí dokázat platnost věty pro konečné množiny. Nechť tedy {x1 , . . . , xk } tvoří ortonormální množinu a nechť α1 x1 + · · · + αk xk = o.
(5.5)
Vynásobme obě strany rovnice 5.5 skalárně vektorem xl , 1 ≤ l ≤ k. Protože (xi , xl ) = 0 pro i 6= l, dostáváme αl (xl , xl ) = 0. Odtud, vzhledem k tomu, že (xl , xl ) = 1, plyne αl = 0 pro l = 1, . . . , k, což znamená lineární nezávislost vektorů x1 , . . . , xk . 2 Věta 5.4 Nechť a1 , . . . , ak jsou lineárně nezávislé vektory v Cn . Pak existují ortonormální vektory q1 , . . . , qk tak, že ha1 , . . . , ak i = hq1 , . . . , qk i. Důkaz. Existenci ukážeme matematickou indukcí podle k. Tvrzení je zřejmé pro k = 1 : q1 = a1 /|a1 |. Nechť nyní tvrzení platí pro k − 1 vektorů a nechť vektory a1 , . . . , ak jsou lineárně nezávislé. Podle indukčního předpokladu existují ortonormální vektory q1 , . . . , qk−1 tak, že ha1 , . . . , ak−1 i = hq1 , . . . , qk−1 i. Označme rik = (qi , ak )
pro
i = 1, . . . , k − 1
(5.6)
Symetrické matice
71
a položme ek = ak − q
k−1 X
rik qi .
(5.7)
i=1
Pro l = 1, . . . , k − 1 pak je ek ) = (ql , ak ) − (ql , q
k−1 X
(qi , ak )(ql , qi ) = (ql , ak ) − (ql , ak ) = 0.
(5.8)
i=1
ek 6= 0, neboť jinak by na základě (5.7) byl vektor ak lineární kombinací vekKromě toho q torů q1 , . . . , qk a tedy také lineární kombinací vektorů a1 , . . . , ak , což vzhledem k lineární ek /|q ek |, je na základě (5.7) nezávislosti vektorů a1 , . . . , ak není možné. Položíme-li nyní qk = q hq1 , . . . , qk i = ha1 , . . . , ak i a z (5.8) vyplývá ortogonálnost vektorů q1 , . . . , qk . 2 Postupu, který byl použit v tomto důkazu se říká Gramův–Schmidtův ortonormalizační proces. Umožňuje „ortonormalizovatÿ libovolnou lineárně nezávislou množinu vektorů, t.j. nahradit libovolnou lineárně nezávislou množinu množinou ortonormální, která má stejný lineární obal jako množina původní, a to nejen v Cn , ale v jakémkoli lineárním prostoru se skalárním součinem. Uplatníme-li Gramův–Schmidtův proces na bázi vektorového prostoru, dostáváme: Dsledek. V každém nenulovém vektorovém prostoru, ve kterém je definován skalární součin, existuje ortonormální báze. Důkaz věty 5.4 je současně návodem, jak hledané ortonormální vektory vypočíst. Klíčovou roli zde hraje vztah (5.7). Všimněme si, že je velice podobný vzorci pro maticové násobení; po malých úpravách jej opravdu lze do maticového tvaru převést. Předpokládejme, že lineárně nezávislé vektory a1 , . . . , am postupně nahrazujeme ortogonálními vektory q1 , . . . , qm tak, že pro k = 1, . . . , m platí (5.7). Položme ještě ek | pro rkk = |q
k = 1, . . . , m
a
rik = 0
pro i = k + 1, . . . , m.
(5.9)
Pak z (5.7) dostáváme ek + ak = q
k−1 X
rik qi = rkk qk +
i=1
k−1 X
rik qi =
i=1
m X
rik qi .
i=1
Pro j -tou souřadnici ajk vektoru ak pak je ajk =
m X i=1
rik qji =
m X
qji rik .
i=1
To přesně odpovídá maticovému součinu A = QR, kde sloupce matice A tvoří vektory a1 , . . . , am , sloupce matice Q vektory q1 , . . . , qm a R je trojúhelníková matice řádu m, jejíž prvky jsou (jednoznačně) určeny vztahy (5.6) a (5.9). Dostáváme tím větu o QR rozkladu.
72
Kapitola 5
Věta 5.5 Nechť A je matice typu (n, m) s lineárně nezávislými sloupci. Pak existuje matice Q typu (n, m) s ortonormálními sloupci a trojúhelníková matice R řádu m tak, že platí A = QR. V dalším budeme často pracovat se čtvercovými maticemi, jejichž sloupce jsou ortonormální. Definice. Reálná čtvercová matice A se nazývá ortogonální, jestliže ATA = E. Definice ortogonální matice je evidentně ekvivalentní požadavku ortonormálnosti množiny jejích sloupců. Odtud a z věty 5.3 pak plyne, že každá ortogonální matice je regulární. Vynásobením rovnosti ATA = E maticí A−1 zprava dostáváme významnou vlastnost ortogonálních matic: A−1 = AT . Je-li AT inverzní maticí k A, pak podle definice inverzní matice platí také AAT = E, takže i řádky matice A tvoří ortonormální množinu. Poznamenejme však, že nečtvercové matice s ortonormálními sloupci nemusejí mít ortonormální řádky. Příklad 5.1 Matice
R=
cos α − sin α sin α cos α
je ortogonální pro každé reálné α, což se ověří vynásobením RT R. Matice reprezentuje otočení v rovině o úhel α kolem počátku (viz úlohu 2.7). Příklad 5.2 Ověřte, že matice W = E − 2ww T je ortogonální pro libovolný vektor w ∈ Rn , |w | = 1. Řešení. Matice W je symetrická, neboť W T = (E − 2ww T )T = E − 2ww T = W . Dále je W T W = (E − 2ww T )(E − 2ww T ) = E − 4ww T + 4ww T ww T = E − 4ww T + 4ww T = E, neboť w T w = 1. Matice W se nazývá matice zrcadlení odpovídající vektoru w . Obraťme nyní pozornost k symetrickým maticím. Abychom mohli zkoumat jejich vlastnosti i prostřednictvím lineárních zobrazení, zavedeme pomocný pojem symetrického lineárního zobrazení. Definice. Lineární zobrazení A : Rn → Rn nazýváme symetrické, jestliže pro všechna x, y ∈ Rn platí A(x), y = x, A(y ) . Ačkoliv se definice symetrického lineárního zobrazení zdá přirozeným zobecněním pojmu symetrické matice, vede i k některým méně očekávaným důsledkům – proto se pojem v tomto pojetí příliš nevžil. Tím, že se symetrie zobrazení definuje pomocí skalárního součinu, tedy pojmu, který je závislý na bázi (skalární součin je definován pomocí souřadnic ve standardní bázi), stává se také závislým na volbě báze v Rn . Zatímco matice symetrického lineárního zobrazení ve standardní bázi bude evidentně symetrická, nemusí tomu tak být v každé bázi Rn . Není totiž obecně pravda, že matice podobná symetrické matici je opět symetrická. Jak však ukazuje následující věta, podobnostní transformace ortogonální maticí zachovává symetričnost. Pro zjednodušení vyjadřování v tomto případě zaveďme nejdříve nový pojem.
Symetrické matice
73
Definice. Matice A a B nazýváme ortogonálně podobné, existuje-li ortogonální matice P tak, že B = P −1AP . Věta 5.6 Matice ortogonálně podobná symetrické matici je symetrická. Důkaz. Již jsme ukázali, že z definice ortogonálnosti matice vyplývá její regulárnost. Je-li nyní A symetrická a P ortogonální, je (P −1AP )T = (P TAP )T = P TATP = P TAP = P −1AP a tedy matice P −1AP je symetrická.
2
Ortogonální podobnost je tudíž ekvivalencí na třídě všech symetrických matic; vzniká tedy otázka nalezení vhodného reprezentanta každé třídy podobnosti. Postupně ukážeme, že jím je reálná diagonální matice. Prvním krokem k řešení je znalost vlastností charakteristických čísel symetrických matic. Věta 5.7 Charakteristická čísla reálné symetrické matice jsou reálná. Důkaz. Nechť A je symetrická matice a λ její charakteristické číslo, jemuž přísluší charakteristický vektor x. Ukážeme, že λ = λ. Z vlastností skalárního součinu (věta 5.1 a její důsledek) a z (5.4) vyplývá λ(x, x) = (λx, x) = (Ax, x) = (x, Ax) = (x, λx) = λ(x, x). Protože x 6= o (charakteristický vektor), je λ = λ a λ je tedy reálné.
2
Věta 5.8 Jsou-li λ1 a λ2 různá charakteristická čísla reálné symetrické matice A, pak jim odpovídající charakteristické vektory jsou ortogonální. Důkaz. Nechť x1 a x2 jsou charakteristické vektory odpovídající číslům λ1 a λ2 . Pak postupným využitím (5.4), důsledku věty 5.1 a věty 5.7 dostáváme λ1 (x1 , x2 ) = (λ1 x1 , x2 ) = (Ax1 , x2 ) = (x1 , Ax2 ) = (x1 , λ2 x2 ) = λ2 (x1 , x2 ) = λ2 (x1 , x2 ). Odtud plyne (λ1 − λ2 )(x1 , x2 ) = 0. Protože podle předpokladu věty je λ1 6= λ2 , je (x1 , x2 ) = 0 a vektory x1 a x2 jsou ortogonální. 2 Věta 5.9 Nechť A je symetrické lineární zobrazení Rn do Rn . Pak existuje reálná ortonormální báze Rn složená z reálných charakteristických vektorů zobrazení A. Důkaz. Důkaz provedeme indukcí podle n. Pro n = 1 je tvrzení zřejmé. Předpokládejme tedy, že tvrzení platí pro všechny prostory dimenze menší než n. Zobrazení A má aspoň jedno reálné charakteristické číslo λ1 , jemuž odpovídá reálný charakteristický vektor x1 . Reálnost λ1 vyplývá z věty 5.7 a reálnost x1 ze vztahu (A − λ1 E)x1 = o. Označme V1 množinu všech vektorů z Rn ortogonálních k x1 : V1 = {x ∈ Rn ; (x, x1 ) = 0}.
74
Kapitola 5
Je zřejmé, že V1 je vektorový podprostor Rn ; jeho dimenze je n−1, neboť je vlastně množinou všech řešení jedné homogenní rovnice pro n neznámých souřadnic vektoru x. V1 je tedy izomorfní Rn−1 . Protože pro každý vektor x ∈ V1 platí
A(x), x1 = x, A(x1 ) = (x, λ1 x1 ) = λ1 (x, x1 ) = λ1 (x, x1 ) = 0,
je A(x) ∈ V1 a V1 je tudíž A -invariantní podprostor Rn . Nechť A1 značí zúžení zobrazení A na V1 . Podle indukčního předpokladu existuje ve V1 ortonormální báze složená z reálných charakteristických vektorů zobrazení A1 ; označme je x2 , x3 , . . . , xn . Na základě věty (4.1) je každý z těchto vektorů také charakteristickým vektorem zobrazení A. Množina B = {x1 , . . . , xn } je tedy hledanou ortonormální bází Rn , neboť x1 je ortogonální k V1 a B je podle věty (5.3) lineárně nezávislá. 2
Věta 5.10 Každá reálná symetrická matice A je ortogonálně podobná reálné diagonální matici D : A = P DP T .
(5.10)
Přitom diagonální prvky matice D tvoří charakteristická čísla matice A a P je ortogonální matice, jejíž sloupce tvoří charakteristické vektory matice A v pořadí odpovídajícím pořadí charakteristických čísel na diagonále D.
Důkaz. Nechť A je reálná symetrická matice n -tého řádu a A lineární zobrazení z Rn do Rn definované vztahem A(x) = Ax. Podle věty 5.9 existuje ortonormální báze Rn sestávající z reálných charakteristických vektorů zobrazení A. Označme P matici, jejíž sloupce tvoří tyto charakteristické vektory. Matice P je ortogonální a podle věty 3.6 a jejího důsledku existuje diagonální matice D tak, že A = P DP −1 = P DP T . 2
5.2
Kvadratické formy
Na základě souvislostí mezi maticemi a lineárními zobrazeními jsme v předcházejících kapitolách odvodili řadu netriviálních vlastností čtvercových matic. Nyní ukážeme na souvislost mezi reálnými symetrickými maticemi na jedné straně a bilineárními a kvadratickými formami na straně druhé, vedoucí k novému pohledu na další vlastnosti reálných symetrických matic. Protože kvadratické formy mají i svůj samostatný význam, bude vyšetřování jejich vlastností věnováno více místa. Veškeré úvahy budeme opět dělat pouze v reálném oboru.
Symetrické matice
75
Definice. Nechť V je reálný lineární prostor. Zobrazení B : V × V → R nazýváme bilineární formou, jestliže pro všechna reálná α, β a všechny vektory x, y , z ∈ V platí: (a) B((αx + β y ), z ) = αB(x, z ) + βB(y , z ), (b) B(z , (αx + β y )) = αB(z , x) + βB(z , y ). Stručně můžeme říci, že bilineární forma na lineárním prostoru V je takové zobrazení kartézského součinu V × V do R, které je lineární v každé ze svých dvou proměnných samostatně; t.j. B je lineární ve své první proměnné při každé pevné hodnotě druhé proměnné a současně je lineární ve své druhé proměnné při libovolné pevné hodnotě první proměnné. Příklad 5.3 a) Nechť B(x, y ) =
n X n X
bik xi yk ,
(5.11)
i=1 k=1
kde x, y ∈ Rn a bik ∈ R. Pak B je bilineární forma v Rn . V dalším ukážeme, že každá bilineární forma v Rn má tvar (5.11). b) Speciálním případem (5.11) je skalární součin v Rn : B(x, y ) = x1 y1 + · · · + xn yn . c) Definujeme-li v lineárním prostoru C ha, bi všech spojitých reálných funkcí na intervalu ha, bi Zb B(f, g) =
f (t) g(t) dt, a
pak B je bilineární forma v C ha, bi. Podobně jako u lineárních zobrazení, bude i hodnota bilineární formy B(x, y ) velice často popsána pomocí souřadnic vektorů x a y . Vyšetřeme, jak takový popis bude vypadat v konečně dimenzionálním prostoru V. Předpokládejme, že B = {b1 , . . . , bn } je báze prostoru V a pro i, j = 1, . . . , n označme bij = B(bi , bj ). (5.12) Je-li nyní x = x1 b1 + · · · + xn bn a y = y1 b1 + · · · + yn bn , pak B(x, y ) = B
n X i=1
=
n X n X i=1 j=1
xi bi ,
n X
n n X X yj bj = xi B bi , yj bj =
j=1
xi yj B(bi , bj ) =
i=1 n X n X
j=1
(5.13)
bij xi yj .
i=1 j=1
Vidíme tedy, že v pevně zvolené bázi prostoru V je každá bilineární forma na V jednoznačně určena čísly bij , což jsou hodnoty této bilineární formy pro všechny možné dvojice bázových vektorů. Položme n B = bij i,j=1 . Pak B je čtvercová matice n -tého řádu a místo (5.13) můžeme psát B(x, y ) = X TBY ,
(5.14)
76
Kapitola 5
kde X = (x1 , . . . , xn )T a Y = (y1 , . . . , yn )T . V Rn můžeme vztah (5.14) zapsat také pomocí skalárního součinu: B(x, y ) = (B y , x) = (x, B y ). Každá bilineární forma B je tedy v dané bázi B jednoznačně určena čtvercovou maticí B. Nazýváme ji maticí bilineární formy B v bázi B. Příklad 5.4 Nechť P2 značí vektorový prostor všech reálných polynomů nejvýše druhého stupně. Podle příkladu 5.3 je Z B(p, q) =
1
p, q ∈ P2
p(t) q(t) dt,
(5.15)
0
bilineární forma v P2 . Nalezněme nejdříve její matici B vzhledem k bázi B = {1, t, t2 } a přepišme vztah (5.15) pomocí matice B. Řešení. Označíme-li b1 (t) = 1, b2 (t) = t, b3 (t) = t2 , pak pro prvky bij matice B podle (5.12) platí bij = B(bi , bj ), i, j = 1, 2, 3. Postupně tedy dostáváme Z b11 =
1
Z
dt = 1,
1
1 t dt = , 2 0 Z 1 1 = t3 dt = , 4 0
b12 = b21 =
0 1 1 b13 = b22 = b31 = t2 dt = , 3 0 Z 1 1 t4 dt = . b33 = 5 0
Z
Odtud
b23 = b32
1
1 2
1 3
B = 12
1 3
1 . 4
1 3
1 4
1 5
Je-li nyní p(t) = p0 + p1 t + p2 t2 , q(t) = q0 + q1 t + q2 t2 a označíme-li
p0 P = p1 , p2
q0 Q = q1 , q2
pak B(p, q) = P TBQ. Protože i obráceně každá čtvercová matice B popisuje vztahem (5.14) bilineární formu v prostoru V, existuje vzájemně jednoznačné přiřazení mezi čtvercovými maticemi n -tého řádu a bilineárními formami v n -dimenzionálním vektorovém prostoru. Na jeho základě budeme schopni odhalit další vlastnosti čtvercových matic. Vyšetřeme nyní, jak se změní matice bilineární formy při změně báze v prostoru V.
Symetrické matice
77
Věta 5.11 Nechť B je bilineární forma na vektorovém prostoru V. Nechť B a B 0 jsou dvě báze prostoru V, P transformační matice přechodu od báze B k B 0 a B matice bilineární formy B v bázi B . Pak matice formy B v bázi B 0 je P TBP . Důkaz. Nechť x, y jsou libovolné vektory ve V. Označme X = (x1 , . . . , xn )T
a Y = (y1 , . . . , yn )T
jejich souřadnice vzhledem k bázi B a X 0 = (x01 , . . . , x0n )T
a
Y 0 = (y10 , . . . , yn0 )T
jejich souřadnice vzhledem k bázi B 0 . Podle (2.6) je X = P X0
a Y = P Y 0.
Dosazením do (5.14) dostáváme B(x, y ) = X TBY = P X 0
T
BP Y 0 = X 0
T
P TBP Y 0 ,
což znamená, že P TBP je matice formy B v bázi B 0 .
2
Poznamenejme, že ačkoliv je matice bilineární formy B a tedy i způsob výpočtu hodnoty B(x, y ) závislý na volbě báze, samotná hodnota B(x, y ) vychází vždy táž. Definice. Bilineární forma B se nazývá symetrická (v lineárním prostoru L ), jestliže pro libovolné dva vektory x, y ∈ L je B(x, y ) = B(y , x). Věta 5.12 Bilineární forma B je symetrická na vektorovém prostoru V právě tehdy, když v nějaké bázi prostoru V je její matice symetrická. B má pak symetrickou matici v každé bázi prostoru V. Důkaz. Je-li B symetrická a B = {b1 , . . . , bn } nějaká báze prostoru V, pak bij = B(bi , bj ) = B(bj , bi ) = bji , takže matice B je symetrická. Je-li naopak symetrická matice B maticí bilineární formy B vzhledem k nějaké bázi prostoru V, pak pro libovolné vektory x, y ∈ V je B(x, y ) =
n X i,j=1
a forma B je symetrická.
bij xi yj =
n X i,j=1
bji xi yj =
n X
bji yj xi = B(y , x)
i,j=1
2
Jak ukazuje následující pomocné tvrzení, jsou hodnoty, které nabývá symetrická bilineární forma pro libovolnou dvojici vektorů x, y jednoznačně určeny hodnotami B(x, x) pro x ∈ V. Lemma. Nechť B je symetrická bilineární forma na lineárním prostoru L. Pak pro libovolné vektory x, y ∈ L je B(x, y ) = 21 B(x + y , x + y ) − B(x, x) − B(y , y ) .
78
Kapitola 5
Důkaz. Z vlastností bilineární formy dostáváme B(x + y , x + y ) = B(x, x + y ) + B(y , x + y ) = B(x, x) + B(x, y ) + B(y , x) + B(y , y ) = = 2B(x, y ) + B(x, x) + B(y , y ), 2
odkud již tvrzení snadno plyne. Dsledek. Nechť pro symetrické bilineární formy B1 a B2 na lineárním prostoru L platí B1 (x, x) = B2 (x, x) pro každé x ∈ L. Pak pro všechna x, y ∈ L je B1 (x, y ) = B2 (x, y ).
Jsou-li všechny hodnoty, kterých libovolná symetrická bilineární forma na lineárním prostoru L nabývá, odvoditelné z hodnot B(x, x), x ∈ L, pak i všechny vlastnosti formy B jsou určeny hodnotami B(x, x), x ∈ L. Je tedy účelné zavést následující definici. Definice. Je-li B symetrická bilineární forma na lineárním prostoru L, pak zobrazení Q : L → R definované vztahem Q(x) = B(x, x),
x∈L
(5.16)
nazýváme kvadratickou formou na lineárním prostoru L. Z (5.13) vyplývá, že obecný tvar kvadratické formy na lineárním prostoru dimenze n je Q(x) =
n X
bij xi xj ;
(5.17)
i,j=1
hodnotu Q(x) tedy dostaneme jako kombinaci kvadratických výrazů xi xj , což motivuje její název. Důsledek předcházejícího lemmatu zajišťuje, že dvě různé symetrické bilineární formy definují dvě různé kvadratické formy. To znamená, že i každou kvadratickou formu můžeme jednoznačně reprezentovat symetrickou maticí. Půjde o tutéž matici, která popisuje bilineární formu, pomocí níž je kvadratická forma definována. Je-li tedy Q kvadratická forma na vektorovém prostoru V dimenze n, existuje při pevně zvolené bázi B prostoru V jednoznačně určená symetrická matice Q řádu n tak, že Q(x) = X TQX,
(5.18)
kde X je sloupcový vektor souřadnic x v bázi B. Při vyšetřování vlastností (reálných) kvadratických forem na vektorových prostorech postačí, omezíme-li se na formy definované v Rn , neboť věta 2.5 umožňuje přenést výsledky na libovolný prostor dimenze n. Všimněme si, že pak lze vztah (5.18) zapsat pro standardní bázi Rn též pomocí skalárního součinu: Q(x) = (Qx, x)
(5.19)
Ze vztahů (5.17) a (5.18) je zřejmé, že pro prvky qij matice Q platí qij = bij , i, j = 1, . . . , n. Je však třeba vzít v úvahu, že vzhledem k symetrii je bij = bji a odpovídající dva členy jsou v (5.17) pro i 6= j obvykle sloučeny do jediného sčítance. Pak qij odpovídá polovině koeficientu u xi xj .
Symetrické matice
79
Příklad 5.5 Je-li Q(x) = 3x21 − 2x1 x2 + x22 + 6x2 x3 − 2x23 , pak matice formy Q je
3 −1 0 1 3 . Q = −1 0 3 −2 Je zajímavé si všimnout, že kvadratickou formu lze odvodit od libovolné (ne nutně symetrické) bilineární formy B. I když vztah (5.16) má smysl pro jakoukoliv bilineární formu B, nevzniknou takto jiné kvadratické formy než ty, které jsou vytvořeny symetrickými bilineárními formami. Každé bilineární formě B můžeme totiž přiřadit symetrickou bilineární formu Bs vztahem 1 Bs (x, y ) = B(x, y + B(y , x 2 a pro ni je B(x, x) = Bs (x, x). Bilineární forma B tedy určuje stejnou kvadratickou formu jako symetrická bilineární forma Bs . Matice kvadratické formy Q závisí na změně báze stejným způsobem jako matice jí příslušné symetrické bilineární formy. Je-li tedy Q matice kvadratické formy Q v jisté bázi B a P transformační matice přechodu od báze B k bázi B 0 , pak kvadratická forma Q bude mít v bázi B 0 matici Q0 = P TQP . (5.20) Jedné kvadratické formě tak přísluší celá třída matic tvaru (5.20), kde P je libovolná regulární matice odpovídajícího řádu. Všimněme si analogie vztahu (5.20) a (3.1), popisujícího třídu matic příslušející jednomu lineárnímu zobrazení. Tak jako u matic lineárního zobrazení, lze i mezi maticemi kvadratické formy nalézt nejjednodušší možný – kanonický tvar. Díky symetrii matice Q je kanonický tvar určen větou 5.10: Ke každé symetrické matici Q existuje ortogonální matice P tak, že P TQP je diagonální. Platí tedy tato věta. Věta 5.13 Vhodnou změnou báze Rn lze každou kvadratickou formu v Rn tvaru Q(x) =
n X
qij xi xj
(5.21)
i,j=1
převést na kanonický tvar Q(x) =
n X
di yi2 ,
i=1
kde yi jsou souřadnice vektoru x v nové bázi. Na rozdíl od lineárních zobrazení nejsou hodnoty di určeny jednoznačně. Z věty 5.10 vyplývá, že di mohou být charakteristická čísla matice kvadratické formy Q; poznáme však, že existují i další možnosti. Všechny mají jednu společnou vlastnost, kterou popisuje následující věta. Věta 5.14 Nechť B a B 0 jsou dvě báze Rn a nechť Q je kvadratická forma v Rn , která má v bázi B kanonický tvar Q(x) = α1 x21 + · · · + αk x2k − αk+1 x2k+1 − · · · − αr x2r ,
80
Kapitola 5
kde (x1 , . . . , xn )T jsou souřadnice vektoru x v bázi B, α1 > 0, . . . , αr > 0, r ≤ n a v bázi B 0 kanonický tvar 2 Q(x) = β1 y12 + · · · + βl yl2 − βl+1 yl+1 − · · · − βs ys2 ,
kde (y1 , . . . , yn )T jsou souřadnice vektoru x v bázi B 0 , β1 > 0, . . . , βs > 0, s ≤ n. Pak k = l a r = s. Důkaz. Nechť jsou splněny předpoklady věty, nechť B = {b1 , . . . , bn } a B 0 = {b01 , . . . , b0n }. Stačí, když dokážeme, že v obou vyjádřeních formy Q je stejný počet kladných koeficientů; t.j. k = l. Stejným způsobem by se ukázalo, že i počet záporných koeficientů v obou vyjádřeních Q je shodný, odkud pak plyne, že r = s. Důkaz provedeme sporem. Předpokládejme, že l > k. Zvolme nenulový vektor x ∈ Rn tak, aby xk+1 = · · · = xn = 0 a současně aby také y1 = · · · = yl = 0. Takový vektor skutečně existuje, neboť pro jeho zbývajících n − l + k souřadnic x1 , . . . , xk , yl+1 , . . . , yn bude platit x1 b1 + · · · + xk bk = yl+1 b0l+1 + · · · + yn b0n , což je homogenní soustava n rovnic pro n − l + k neznámých. Protože vzhledem k předpokladu l > k je n − l + k < n, má soustava aspoň jedno nenulové řešení. Pro tento vektor pak je Q(x) = α1 x21 + · · · + αk x2k > 0 a současně 2 + · · · + βs ys2 < 0, Q(x) = − βl+1 yl+1 2
což je spor a věta je dokázána.
Pro danou kvadratickou formu je tedy počet kladných koeficientů i počet záporných koeficientů (a tudíž i počet nulových koeficientů) v jejím kanonickém tvaru na tomto tvaru nezávislý a formu určitým způsobem charakterizuje. Definice. Nechť Q je kvadratická forma v Rn , jejíž kanonický tvar je Q(x) = d1 x21 + · · · + dp x2p − dp+1 x2p+1 − · · · − dp+q x2p+q , kde d1 > 0, . . . , dp+q > 0. Uspořádanou dvojici (p, q) nazýváme signaturou formy Q a značíme sig Q. První složka sig Q tedy udává počet kladných koeficientů v kanonickém tvaru Q, druhá počet záporných koeficientů. Předcházející věta zajišťuje, že tyto hodnoty se při změně kanonického tvaru nemění. Popišme nyní početní postup, kterým lze danou kvadratickou formu převést na kanonický tvar. Bude založen na postupném doplňování vhodných výrazů v kvadratické formě na čtverce a bude využívat vzorce (a1 + a2 + a3 + · · · + an )2 = a21 + 2a1 a2 + 2a1 a3 + · · · + 2a1 an + + a22 + 2a2 a3 + 2a2 a4 + · · · + 2a2 an + · · · · · · + a2n . V kvadratické formě Q(x) =
n X i,j=1
qij xi xj
(5.22)
(5.23)
Symetrické matice
81
zvolíme proměnnou xk , mající nenulový koeficient qkk a doplníme na čtverec všechny členy z 5.23, obsahující proměnnou xk . Ve „zbytkuÿ se tak vyskytuje pouze n − 1 proměnných x1 , . . . , xk−1 , xk+1 , . . . , xn , na něž opakujeme předcházející krok. Po nejvýše n − 1 krocích tak dospějeme ke kanonickému tvaru. Příklad 5.6 Převeďte na kanonický tvar kvadratickou formu Q, která je v R3 definována vztahem Q(x) = 2x21 + x22 − 4x1 x2 − 20x1 x3 + 6x2 x3 . Řešení. Opakovaným použitím vzorce (5.22) pro n = 3 dostáváme Q(x) = 2(x21 − 2x1 x2 − 10x1 x3 ) + x22 + 6x2 x3 = = 2 (x1 − x2 − 5x3 )2 − x22 − 10x2 x3 − 25x23 + x22 + 6x2 x3 = = 2(x1 − x2 − 5x3 )2 − (x22 + 14x2 x3 ) − 50x23 = = 2(x1 − x2 − 5x3 )2 − (x2 + 7x3 )2 − x23 = = 2y12 − y22 − y32 , kde jsme položili y1 = x1 − x2 − 5x3 , y2 = x2 + 7x3 , y3 = x3 . Vypočtěme ještě vektory té báze, jíž získaný kanonický tvar odpovídá a také transformační matici P přechodu od standardní báze k této nové, „kanonickéÿ bázi. K tomu stačí převést poslední trojici vztahů do tvaru (2.5): x1 = y1 + y2 − 2y3 , x2 = y2 − 7y3 , x3 = y3 . Na základě (2.6) pak dostáváme
1 1 −2 P = 0 1 −7 . 0 0 1 Z (2.3) vyplývá, že souřadnice vektorů nové báze odečteme ze sloupců matice P :
b1 = e1 ,
b2 = e1 + e2 ,
b3 = −2e1 − 7e2 + e3 .
Naznačený postup není zdaleka jediný; mohli jsme např. postupovat i takto: Q(x) = (x22 − 4x1 x2 + 6x2 x3 ) + 2x21 − 20x1 x3 = = (x2 − 2x1 + 3x3 )2 − 4x21 + 12x1 x3 − 9x23 + 2x21 − 20x1 x3 = = (x2 − 2x1 + 3x3 )2 − 2(x1 + 4x1 x3 ) − 9x23 = = (x2 − 2x1 + 3x3 )2 − 2(x1 + 2x3 )2 − x23 = = z12 − 2z22 − z32 , Koeficienty u kvadrátů výsledného kanonického tvaru jsou na zvoleném postupu závislé, avšak signatura se nemění. Je sig Q = (1, 2).
82
Kapitola 5
Popsaný postup vyžaduje, aby v každém kroku existoval aspoň jeden nenulový koeficient u některého z kvadrátů proměnných. Není-li tato podmínka splněna, je třeba vložit takovou transformaci souřadnic v Rn , která její splnění zajistí. Postup ilustruje následující příklad. Příklad 5.7 Převeďte na kanonický tvar kvadratickou formu Q, která je v R3 definována vztahem Q(x) = x1 x2 + x1 x3 + x2 x3 . (5.24) Řešení. Zaveďme nejdříve transformaci souřadnic, definovanou rovnicemi x1 = y1 + y2 , x2 = y1 − y2 ,
(5.25)
x3 = y3 . Dosazením do (5.24) dostáváme Q(x) = y12 − y22 + y1 y3 + y2 y3 + y1 y3 − y2 y3 = y12 − y22 + 2y1 y3 . Nyní již můžeme postupovat jako v předcházejícím příkladě. Q(x) = (y1 + y3 )2 − y32 − y22 = z12 − z22 − z32 , kde jsme položili z1 = y 1 + y 3 ,
z 2 = y2 ,
z 3 = y3 .
(5.26)
Transformace souřadnic, převádějící danou kvadratickou formu na výsledný kanonický tvar vznikne složením transformací (5.25) a (5.26) – z (5.26) vyjádříme yi a dosadíme do (5.25). Dostaneme x1 = z1 + z2 − z3 , x2 = z1 − z2 − z3 , x3 = z3 . Signatura formy Q vyplývá z jejího kanonického tvaru a je sig Q = (1, 2). Ve fyzikálních a technických aplikacích hrají významnou roli ty kvadratické formy, které nabývají pouze nezáporných resp. kladných hodnot. Bývá to zejména v případech, kdy kvadratická forma vyjadřuje energii jistého systému. Pro snadnější vyjadřování rozdělíme kvadratické formy na typy podle hodnot, kterých formy nabývají. Definice. Kvadratickou formu Q definovanou na Rn nazýváme a) b) c) d) e)
pozitivně definitní, je-li Q(x) > 0 pro každý nenulový vektor x ∈ Rn , pozitivně semidefinitní, je-li Q(x) ≥ 0 pro každý vektor x ∈ Rn , negativně definitní, je-li Q(x) < 0 pro každý nenulový vektor x ∈ Rn , negativně semidefinitní, je-li Q(x) ≤ 0 pro každý vektor x ∈ Rn , indefinitní, existují-li vektory x, y ∈ Rn tak, že Q(x) > 0 a Q(y ) < 0.
Pozitivně (resp. negativně) definitní kvadratická forma je tedy také pozitivně resp. (negativně) semidefinitní. Každá kvadratická forma spadá do některého z uvedených typů. Problém rozpoznání tohoto typu řeší následující věta. Věta 5.15 Nechť Q je kvadratická forma v Rn se signaturou sig Q = (p, q). Pak a) Q je pozitivně definitní právě tehdy, když p = n (a tudíž q = 0 ),
Symetrické matice
b) c) d) e)
Q Q Q Q
je je je je
83
pozitivně semidefinitní právě tehdy, když p ≤ n a q = 0 , negativně definitní právě tehdy, když q = n (a tudíž p = 0 ), negativně semidefinitní právě tehdy, když q ≤ n a p = 0 , indefinitní právě tehdy, když p > 0 a q > 0 .
Důkaz. Protože postup důkazu je pro každý z pěti uvažovaných typů stejný, bude stačit, když dokážeme tvrzení a). Předpokládejme, že Q(x) = β1 x21 + · · · + βn x2n
(5.27)
je kanonický tvar kvadratické formy Q. Nechť nejdříve p = n. Pak v (5.27) jsou všechna βi kladná a tudíž Q(x) > 0 pro všechny nenulové vektory x ∈ Rn , což znamená, že Q je pozitivně definitní. Nechť obráceně Q je pozitivně definitní a p 6= n. To podle definice signatury znamená, že v kanonickém tvaru (5.27) je βi ≤ 0 pro některé i. Pak však pro vektor x, mající i -tou souřadnici rovnu 1 a ostatní nulové (v bázi odpovídající kanonickému tvaru) je Q(x) = βi ≤ 0, což je spor s pozitivní definitností Q. Je tedy p = q. 2 Příklad 5.8 Kvadratická forma Q(x) = 2x21 + x22 − 4x1 x2 − 20x1 x3 + 6x2 x3 . z příkladu (5.6) je indefinitní v R3 , neboť její signatura vyšla (1,2). Rovněž kvadratická forma Q(x) = x1 x2 + x1 x3 + x2 x3 z příkladu (5.7) má signaturu sig Q = (1, 2) a je tedy indefinitní.
5.3
Pozitivně definitní matice
Pojmy pozitivní definitnosti a pozitivní semidefinitnosti lze z kvadratických forem přenést i na reálné symetrické matice. Definice. Reálná symetrická matice A n -tého řádu se nazývá pozitivně definitní, jestliže pro každý nenulový vektor x ∈ Rn platí (Ax, x) > 0.
(5.28)
Platí-li místo vztahu (5.28) pro každý vektor x (Ax, x) ≥ 0, nazývá se A pozitivně semidefinitní. Každá pozitivně definitní matice je podle této definice také pozitivně semidefinitní. Podmínku, kdy je pozitivně semidefinitní matice pozitivně definitní, uvedeme ve větě 5.18. Z (5.19) plyne, že symetrická matice A je pozitivně definitní právě tehdy, když jí odpovídající kvadratická forma v Rn je pozitivně definitní. Všechny věty tohoto odstavce mají tedy své analogie pro pozitivně definitní kvadratické formy. Jejich formulace je zřejmá a je přenechána čtenářovi. Příklad 5.9 Pro libovolnou reálnou (ne nutně čtvercovou) matici A jsou matice B = ATA i C = AAT pozitivně semidefinitní.
84
Kapitola 5
Řešení. Protože jsou úvahy pro matice B i C analogické, stačí uvést jednu z nich. Je-li matice A typu (m, n), pak B je evidentně čtvercová matice n -tého řádu, která je symetrická ( B = B T ). Využijeme-li věty 5.2 a vztahu (5.2), platí pro libovolný vektor x ∈ Rn (B x, x) = (ATAx, x) = (Ax, Ax) ≥ 0, takže matice B je pozitivně semidefinitní. Věta 5.16 Reálná symetrická matice A je pozitivně definitní právě tehdy, jsou-li všechna její charakteristická čísla kladná a pozitivně semidefinitní právě tehdy, jsou-li všechna její charakteristická čísla nezáporná. Důkaz. Podle věty 5.10 lze A psát ve tvaru A = P DP T , kde P je ortogonální a D diagonální; D = diag(d1 , . . . , dn ). Přitom di jsou charakteristická čísla matice A. Je tedy (s využitím věty 5.2) T
T
T
(Ax, x) = P DP x, x = DP x, P x = (D y , y ) =
n X
di yi2 .
i=1
Poslední výraz je kladný pro každý nenulový vektor x právě tehdy, když všechna di jsou kladná a nezáporný právě tehdy, jsou-li jsou-li všechna di nezáporná, čímž je věta dokázána. 2 Lemma. Všechny hlavní submatice
A(k)
a11 a12 · · · a1k a21 a22 · · · a2k = . .. .. .. .. . . . ak1 ak2 · · · akk
pozitivně definitní matice A jsou pozitivně definitní. Důkaz. Podle věty 5.16 stačí ukázat, že všechna charakteristická čísla každé z matic A(k) jsou kladná. Nechť tedy λ je charakteristické číslo matice A(k) a x(k) jemu příslušný charakteristický vektor. Doplňme souřadnice vektoru x(k) nulami na n -členný vektor a označme jej x. Z pozitivní definitnosti matice A plyne (Ax, x) > 0. Dále je 2 (Ax, x) = A(k) x(k) , x(k) = λx(k) , x(k) = λ x(k) , x(k) = λ x(k) . Poslední výraz je tedy také kladný, což implikuje λ > 0.
2
Věta 5.17 (Sylvestrovo kritérium) Nechť A je reálná symetrická matice n -tého řádu. Pro k = 1, . . . , n označme Dk hlavní subdeterminanty matice A : a11 a12 · · · a1k a21 a22 · · · a2k Dk = det . .. .. .. .. . . . ak1 ak2 · · · akk Pak A je pozitivně definitní právě tehdy, když Dk > 0 pro k = 1, . . . , n.
Symetrické matice
85
Důkaz. Nechť nejdříve Dk > 0 pro k = 1, . . . , n. Pak A je silně regulární a podle věty 1.13 existuje jednoznačně určený rozklad A = BDC,
(5.29)
kde B a C jsou trojúhelníkové matice s jedničkami na hlavní diagonále, D = diag(d1 , . . . , dn ), d1 = a11 , dk = Dk /Dk−1 pro k ≥ 2. Vzhledem k předpokladu jsou tedy všechny diagonální T prvky dk kladné. Z (5.29) plyne AT = C TDB T . Protože A = A , je vzhledem k jednoznač√ T T nosti rozkladu (5.29) B = C a C = B . Označíme-li hk = dk a H = diag(h1 , . . . , hn ), pak A = BH 2 B T = BHH TB T . Odtud pro každý nenulový vektor x je 2 (Ax, x) = (BHH TB T x, x) = (H TB T x, H TB T x) = H TB T x > 0, takže A je pozitivně definitní. Je-li obráceně A pozitivně definitní, je podle předchozího lemmatu každá její hlavní submatice také pozitivně definitní a všechna její charakteristická čísla jsou podle věty 5.16 kladná. Podle vztahu (3.5) je Dk součinem všech charakteristických čísel odpovídající hlavní submatice, tedy kladný. 2 Je možné odvodit i analogii Sylvestrova kriteria pro negativně definitní matice: A je negativně definitní právě tehdy, když (−1)k Dk > 0. Negativně definitní matice tedy nemá všechny hlavní subdeterminanty záporné. Jednodušší však je uvědomit si, že matice A je negativně definitní právě tehdy, je-li −A pozitivně definitní. Poznamenejme ještě, že matice, jejíž všechny hlavní subdeterminanty jsou nezáporné, nemusí být pozitivně semidefinitní. Dokumentuje to následující příklad. Příklad 5.10 Nechť
0 0 −1 0 . A = 0 −1 −1 0 1 Pak, v souhlase se značením věty 5.17, je A1 = A2 = 0 a A3 = 1. Avšak pro vektor x = (1, 1, 1)T je (Ax, x) = −2, takže matice A není pozitivně semidefinitní. O přesném vymezení vztahu mezi pozitivně definitními a pozitivně semidefinitními maticemi hovoří poslední věta tohoto odstavce. Věta 5.18 Pozitivně semidefinitní matice je pozitivně definitní právě tehdy, je-li regulární. Důkaz. Pozitivně definitní matice je podle definice také pozitivně semidefinitní a podle věty 5.17 má nenulový determinant, takže je regulární. Je-li obráceně matice A regulární pak podle věty 1.8 je det A 6= 0; z věty 3.3 tedy plyne, že žádné její charakteristické číslo není 0. Je-li matice A navíc pozitivně semidefinitní, pak podle věty 5.16 jsou její charakteristická čísla nezáporná; dohromady má tedy každá regulární pozitivně semidefinitní matice všechna charakteristická čísla kladná, což podle věty 5.16 znamená, že je pozitivně definitní. 2
86
Kapitola 5
5.4
Příklady
Příklad 5.11 Častým příkladem kvadratické formy, vyskytujícím se v diferenciálním počtu, je diferenciál druhého řádu funkce n proměnných. Je-li f funkce, mající v jisté otevřené množině D ⊂ Rn spojité parciální derivace druhého řádu, pak její druhý diferenciál má v libovolném bodě a ∈ D má tvar (viz např. [2]) d2 f (a)(u) =
n X ∂ 2 f (a) ui uj . ∂xi ∂xj
(5.30)
i,j=1
Navíc je ∂ 2 f (a) ∂ 2 f (a) = , ∂xi ∂xj ∂xj ∂xi takže d2 f (a)(u) opravdu je při pevně zvoleném a ∈ D kvadratickou formou v proměnné u ∈ Rn . Matice této kvadratické formy ve standardní bázi má na místě (i, j) hodnotu druhé parciální derivace funkce f podle i -té a j -té proměnné. Typ kvadratické formy d2 f (a)(u) hraje roli při vyšetřování lokálních extrémů funkce f. Pokud je a stacionárním bodem funkce f (t.j. df (a) = 0 ), pak platí ([2]): a) Je-li d2 f (a)(u) pozitivně definitní, má f v bodě a ostré lokální minimum. b) Je-li d2 f (a)(u) negativně definitní, má f v bodě a ostré lokální maximum. c) Je-li d2 f (a)(u) indefinitní, nemá f v bodě a žádný lokální extrém. Příklad 5.12 Ukažte, že pro pozitivně definitní kvadratickou formu Q v R2 a c > 0 je Q(x1 , x2 ) = c rovnicí elipsy, jejíž směrové vektory os jsou charakteristické vektory matice formy Q ve standardní bázi. Řešení. Nechť
Q=
q11 q12 q12 q22
je matici formy Q vzhledem ke standardní bázi R2 . Pak Q(x) = xT Qx = q11 x21 + 2q12 x1 x2 + q22 x22 . Je-li matice Q násobkem jednotkové matice, je tvrzení ihned zřejmé. Předpokládejme tedy, že Q 6= cE. Matice Q je symetrická, je tedy podle věty 5.10 ortogonálně podobná diagonální matici: Q = P −1DP = P TDP . Na diagonále matice platilo λ1 = λ2 = λ, Charakteristická čísla od standardní báze k kanonický tvar:
D jsou charakteristická čísla matice Q : D = diag(λ1 , λ2 ). Kdyby pak diag(λ, λ) = λE a tudíž také Q = λE, což jsme však vyloučili. λ1 a λ2 jsou tedy různá. Matice P je transformační matice přechodu bázi tvořené charakteristickými vektory matice Q; v této bázi má Q Q(x) = λ1 (x01 )2 + λ2 (x02 )2 ,
(5.31)
Symetrické matice
87
kde (x01 , x02 ) jsou souřadnice vektoru x v nové bázi. Změna báze reprezentuje změnu souřadné soustavy; od původní pravoúhlé kartézské souřadné soustavy, jejímiž směrovými vektory os jsou vektory standardní báze přecházíme k soustavě, jejíž směrové vektory os tvoří charakteristické vektory matice Q. Tato soustava je opět pravoúhlá, neboť charakteristické vektory odpovídající různým charakteristickým číslům symetrické matice jsou ortogonální (věta 5.8). V ní má kvadratická forma Q rovnici (5.31). Protože Q je podle předpokladu pozitivně definitní, je i matice Q pozitivně definitní a její charakteristická čísla λ1 , λ2 jsou kladná (věta 5.16). To však znamená, že λ1 (x01 )2 + λ2 (x02 )2 = c je v uvedené souřadné soustavě rovnicí elipsy, jejíž osy splývají se souřadnými osami – mají tudíž směr charakteristických vektorů matice Q.
5.5
Úlohy
5.1 Rozhodněte, která z následujících tvrzení jsou pravdivá. a) Součin dvou symetrických matic je symetrická matice. b) Všechna charakteristická čísla symetrické matice jsou reálná. c) Všechna charakteristická čísla symetrické matice jsou jednonásobná. d) Každá symetrická matice je podobná nějaké diagonální matici. e) Všechny řetězce zobecněných charakteristických vektorů symetrické matice mají délku jedna. f) Pro každou symetrickou matici A n -tého řádu existuje n lineárně nezávislých charakteristických vektorů. g) Charakteristické vektory symetrické matice, odpovídající různým charakteristickým číslům, jsou vždy ortogonální. h) Každá symetrická matice n -tého řádu má n ortogonálních charakteristických vektorů. i) Matice podobná symetrické matici je také symetrická. j) Je-li matice A ortogonální, je i AT ortogonální. k) Je-li matice A ortogonální, je i A−1 ortogonální. l) Každá ortogonální matice je regulární. 5.2 Rozhodněte, která z následujících tvrzení jsou pravdivá. a) Pozitivně definitní matice je regulární. b) Pozitivně semidefinitní matice je singulární. c) Pozitivně semidefinitní matice nemá žádná záporná charakteristická čísla. d) Pozitivně definitní matice má kladný determinant. e) Všechny prvky pozitivně definitní matice jsou nezáporné.
88
Kapitola 5
5.3 K matici A najděte ortogonální matici U tak, aby matice U TAU byla diagonální. 2 −4 2 −1 2 2 2 −2 2 . a) A = −4 b) A = 2 −1 2 −2 −1 2 2 −1 5.4 V prostoru R4 jsou dány vektory a = (−1, 0, 1, 2), b = (0, 1, 0, −3) a lineární podprostor V = x ∈ R4 ; (x, a) = 0, (x, b) = 0 . Určete nějakou ortogonální bázi V . 5.5 V prostoru R3 je dáno lineární zobrazení A , jehož matice vzhledem ke standardní bázi je 1 1 0 A= 1 1 2 1 1 1 a lineární podprostor V = x ∈ R3 ; A(x) ∈ N (A) . Určete nějakou ortogonální bázi V . 5.6 Ukažte, že pro každou symetrickou ortogonální matici A platí A2 = A. 5.7 Dokažte, že matice A = 2P − E je ortogonální pro každou symetrickou matici P , pro níž P2 = P. 5.8 Dokažte, že hodnost symetrické matice je rovna počtu jejích nenulových charakteristických čísel. Ukažte, že tvrzení neplatí pro nesymetrické matice. 5.9 Dokažte, že mají-li dvě symetrické matice stejná charakteristická čísla (včetně násobnosti), jsou si podobné. 5.10 Dokažte, že pro každé charakteristické číslo λ ortogonální matice je |λ| = 1. 5.11 Dokažte, že symetrická ortogonální matice nemá jiná charakteristická čísla než ±1. 5.12 Dokažte, že pro každou ortogonální matici U je | det U | = 1. 5.13 Dokažte, že ortogonální trojúhelníková matice je diagonální, přičemž prvky na její diagonále jsou ±1. 5.14 Rozložte matici
1 4 7 1 −2 A= 0 −2 −3 6 na součin A = QR , kde Q je ortogonální čtvercová matice a R horní trojúhelníková. 5.15 Nalezněte všechny symetrické bilineární formy B v R2 , které mají stejnou matici B vzhledem k bázím B = {b1 , b2 } a C = {c1 , c2 }, kde
c1 = b1 + 2b2 a c2 = b1 + 3b2 .
Symetrické matice
89
5.16 Převeďte dané kvadratické formy na kanonický tvar a popište potřebnou transformaci souřadnic. a) Q(x) = 2x21 + 9x22 + 9x23 − 8x1 x2 + 4x1 x3 − 4x2 x3 b) Q(x) = 2x1 x2 − x2 x3 5.17 Určete všechna reálná a , pro něž jsou kvadratické formy Q1 (x) = x21 + x22 + x23 + ax1 x2 Q2 (x) = x21 + x22 + x23 + 2ax2 x3 stejného typu. Tento typ specifikujte. 5.18 Určete všechna reálná λ , pro něž je v R3 pozitivně definitní kvadratická forma Q(x) = λx21 + x22 + 3x23 + 4x1 x2 + 6x1 x3 + 4x2 x3 5.19 Určete počet kladných, záporných a imaginárních charakteristických čísel matice 0 2 − 21 0 − 12 . A= 2 1 1 −2 −2 0 Návod: využijte kvadratické formy určené maticí A . 5.20 Vypočtěte takovou ortogonální bázi R3 , aby kvadratická forma Q(x) = 2(x1 x2 + x1 x3 + x2 x3 ) měla v této bázi kanonický tvar. 5.21 Dokažte, že součet pozitivně definitních matic je opět pozitivně definitní matice. 5.22 Ukažte, že pozitivně definitní matice je regulární a matice k ní inverzní je též pozitivně definitní. 5.23 Ukažte, že pro každou pozitivně definitní matici A a každé α > 0 je matice αA také pozitivně definitní. 5.24 Dokažte, že pro každou pozitivně definitní matici A = (aik ) jsou aii > 0. 5.25 Dokažte, že matice
1
1 2 Hn = .. .
1 n
1 2 1 3
1 3 1 4
1 n+1
1 n+2
.. .
.. .
... ... .. . ...
1 n 1 n+1
.. .
1 2n−1
(Hilbertova matice n -tého řádu) je pro každé přirozené n pozitivně definitní a regulární.
90
Kapitola 5
5.26 Dokažte, že pro každou reálnou symetrickou matici A je matice B = A2 + 2A + 5E pozitivně definitní. 5.27 Odůvodněte, že pro každou pozitivně definitní matici A a každou regulární matici P je matice P TAP rovněž pozitivně definitní. 5.28 Ukažte, že ke každé pozitivně definitní matici A existuje pozitivně definitní matice B tak, že B 2 = A. 5.29 Ukažte, že pro indefinitní kvadratickou formu Q v R2 a c 6= 0 je Q(x1 , x2 ) = c rovnicí hyperboly, jejíž směrové vektory os jsou charakteristické vektory matice formy Q ve standardní bázi.
5.6
Výsledky
5.1 Pravdivá tvrzení: b), d), e), f), g), h), j), k), l). 5.2 Pravdivá tvrzení: a), c), d). 1 √ √1 √1 3 2 6 1 2 2 1 √1 1 −2 ; b) U = √13 − √12 5.3 a) U = 2 6 3 2 −2 1 2 √1 √ 0 − 6 3 5.4 {(1, 0, 1, 0, ), (1, 3, −1, 1)}.
5.5 {(1, −1, 0), (1, 1, 2)}.
5.10 Pro charakteristické číslo λ a jemu příslušný charakteristický vektor x upravte skalární součin (λx, λx). 5.11 Využijte tvrzení předcházející úlohy a reálnosti charakteristických čísel symetrické matice. 5.12 Využijte vztahu det A = det AT . 1 2 2 √
5.14 Q =
5
√
6
√
30
0
√1 6
− √530
− √25
√1 6
√1 30
,
√
R=
√ √ 5 2 5 − 5 √ √ 0 6 3 6 . √ 0 0 30
5.15 B =
2 1 1 −1
.
5.16 a) 2y12 + y22 + 3y32 , kde y1 = x1 − 2x2 + x3 , y2 = x2 + 2x3 , y3 = x3 . b) 2y12 − 2y22 , kde y1 = 41 (2x1 + 2x2 − x3 ), y2 = 14 (2x1 − 2x2 − x3 ), y3 = x3 . 5.17 Pozitivně definitní pro |a| < 1, indefinitní pro |a| > 2. 5.19 Jedno kladné, dvě záporná, žádné imaginární.
5.18 Žádné.
5.20 {(1, 1, 1, ), (1, 0, −1), (1, −2, 1)}.
5.22 Využijte vlastností charakteristických čísel pozitivně definitních matic. 5.24 Uvažte kvadratickou formu Q určenou maticí A a ukažte, že aii je hodnota, kterou Q přiřazuje i -tému vektoru standardní báze. 5.25 Analogicky jako v příkladu 5.4 ukažte, že H n je maticí bilineární formy (5.15) na vektorovém prostoru Pn−1 všech polynomů stupně nejvýše n − 1 s bází {1, t, t2 , . . . , tn−1 } a dokažte, že odpovídající kvadratická forma je pozitivně definitní. Regulárnost H n plyne z úlohy 5.22. 5.26 Použijte vět 3.5 a 5.16.