Numerické metody pro nalezení

Masarykova univerzita Brno Fakulta pˇr´ırodovˇedecká Katedra aplikované matematiky

Numerick´ e metody pro nalezen´ı vlastn´ıch ˇ c´ısel matic Diplomová práce

kvˇeten 2006

Alena Baˇstincová

Podˇ ekov´ an´ı Vu ´vodu bych ráda podˇekovala vedouc´ı diplomové práce Prof. RNDr. Ivanˇe Horové, CSc. z katedry aplikované matematiky PˇrF MU v Brnˇe za peˇclivé pˇreˇcten´ı textu, cenné rady, pˇripom´ınky k práci a za trpˇelivost. Dále bych chtˇela podˇekovat sv´ ym rodiˇc˚ um za veˇskerou podporu, které se mi v pr˚ ubˇehu studia dostalo.

Prohl´ aˇ sen´ı

ˇ Cestnˇ e prohlaˇsuji, ˇze jsem svou diplomovou práci vypracovala samostatnˇe a pouˇzila jsem pouze uvedenou literaturu.

V Brnˇe dne 20. kvˇetna 2006

Obsah 1 Z´ akladn´ı kapitola

7

2 Typy metod pro hled´ an´ı vlastn´ıch ˇ c´ısel

8

3 Klasick´ e metody urˇ cen´ı koeficient˚ u charakteristick´ eho polynomu 3.1 Krylovova metoda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Faddˇejevova-Leverrierova metoda . . . . . . . . . . . . . . . . . . . . . . . .

10 10 11

4 Poloha a odhad vlastn´ıch ˇ c´ısel 4.1 Gerˇsgorinovy vˇety . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13 13

5 Metody v´ ypoˇ ctu dominantn´ıho 5.1 Mocninná metoda . . . . . . . 5.2 Metoda Rayleighova pod´ılu . 5.3 V´ ypoˇcet dalˇs´ıch vlastn´ıch ˇc´ısel

17 17 20 22

vlastn´ıho ˇ c´ısla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . mocninnou metodou . . . . . . . . . . . . . .

6 Metody pro v´ ypoˇ cet vlastn´ıch ˇ c´ısel a vlastn´ıch vektor˚ u symetrick´ ych matic 6.1 Jacobiho metoda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Householderova matice zrcadlen´ı . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Givensova-Householderova metoda . . . . . . . . . . . . . . . . . . . . . . . 6.3.1 Householderova metoda . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.2 Givensova metoda . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 QR-rozklad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5 Konstrukce QR-rozkladu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5.1 QR-rozklad pomoc´ı Gram-Schmidtova algoritmu . . . . . . . . . . . . 6.5.2 QR-rozklad pomoc´ı Householderovy matice . . . . . . . . . . . . . . 6.5.3 QR-rozklad pomoc´ı Givensovy matice . . . . . . . . . . . . . . . . . . 6.5.4 Srovnán´ı algoritm˚ u . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5.5 QR-rozklad a vlastn´ı ˇc´ısla matice A – QR-algoritmus . . . . . . . . .

24 24 32 35 35 37 40 40 40 42 46 48 49

7 Podm´ınˇ enost probl´ emu vlastn´ıch ˇ c´ısel 7.1 Globáln´ı ˇc´ıslo podm´ınˇenosti . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Odhad chyby vypoˇc´ıtaného vlastn´ıho ˇc´ısla . . . . . . . . . . . . . . . . . . . 7.3 Relativn´ı chyba vypoˇc´ıtaného vlastn´ıho ˇc´ısla . . . . . . . . . . . . . . . . . .

51 51 52 53

4

´ Uvod C´ılem mé diplomové práce je popsat numerické metody pro nalezen´ı vlastn´ıch ˇc´ısel matic. Vlastn´ı ˇc´ısla a vlastn´ı vektory maj´ı velmi ˇsiroké spektrum aplikac´ı, napˇr´ıklad se pouˇz´ıvaj´ı pˇri hledán´ı ˇreˇsen´ı diferenciáln´ıch rovnic a jejich soustav a to jak u obyˇcejn´ ych difarenciáln´ıch rovnic, tak u parciáln´ıch diferenciáln´ıch rovnic a jejich soustav. Totéˇz plat´ı i pro diferenˇcn´ı rovnice a jejich soustavy. Mnohé technické problémy se daj´ı popsat pomoc´ı diferenciáln´ıch nebo diferenˇcn´ıch rovnic a jejich soustav, jako napˇr´ıklad popis obvod˚ u v elektrotechnice.Pokud má obvod vˇetˇs´ı poˇcet prvk˚ u, dostáváme soustavu diferenciáln´ıch rovnic vyˇsˇs´ıho ˇrádu. Pro jejich ˇreˇsen´ı potˇrebujeme znát vlastn´ı ˇc´ısla matice soustavy. Odtud je zˇrejmá duleˇzitost u ´lohy o nalezen´ı vlastn´ıch ˇc´ısel matice. Pˇr´ımé metody hledán´ı vlastn´ıch ˇc´ısel jsou mnohdy neefektivn´ı a proto je nutné ˇreˇsit tuto u ´lohu numericky. Pˇri numerickém ˇreˇsen´ı se sice dopouˇst´ıme urˇcité chyby, ale souˇcasnˇe se dostaneme k ˇreˇsen´ı, alespoˇ n pˇribliˇznému, v relativnˇe kratˇs´ım ˇcase s poˇzadovanou pˇresnost´ı. Ve své práci nejdˇr´ıve definuji základn´ı pojmy, nevˇenuji se pˇr´ım´ ym metodám v´ ypoˇctu vlastn´ıch ˇc´ısel a zab´ yvám se numerick´ ymi metodami jejich urˇcen´ı. Postupnˇe uvád´ım ˇradu zp˚ usob˚ u nalezen´ı vlastn´ıch ˇc´ısel a jim pˇr´ısluˇsn´ ym vlastn´ım vektor˚ um. Nejdˇr´ıve uvád´ım klasické metody urˇcen´ı koˇren˚ u charakteristického polynomu, dále se vˇenuji odhadu polohy vlastn´ıch ˇc´ısel, poté následuj´ı metody v´ ypoˇctu dominantn´ıho vlastn´ıho ˇc´ısla. Nejv´ıce m´ısta vˇenuji metodám pro v´ ypoˇcet vlastn´ıch ˇc´ısel symetrick´ ych matic. Závˇereˇcná kapitola je vˇenována problému podm´ınˇenosti vlastn´ıch ˇc´ısel. Nevˇenovala jsem se rozboru jednotliv´ ych algoritm˚ u pˇri jejich zpracován´ı na poˇc´ıtaˇci, protoˇze tato problematika závis´ı na volbˇe programovac´ıho jazyka a softwarovém vybaven´ı poˇc´ıtaˇce.

5

Oznaˇ cen´ı N Z R C pn (x) Am,n A = (aij ) I ei O o det A = |A| A−1 hod (A) tr(A) ρ(A) AH (Rn , +, .) dim P < ·, · > kxk kxk2 kAk kAk2 kAk∞

mnoˇzina pˇrirozen´ ych ˇc´ısel mnoˇzina cel´ ych ˇc´ısel mnoˇzina reáln´ ych ˇc´ısel mnoˇzina komplexn´ıch ˇc´ısel polynom n-tého stupnˇe promˇenné x matice typu m, n (s m ˇrádky a n sloupci) matice s prvky aij jednotková matice jednotkov´ y vektor s 1 na i-tém m´ıstˇe nulová matice nulov´ y vektor determinant matice A matice inverzn´ı k matici A hodnost matice A stopa matice A spektráln´ı polomˇer matice A ¯T matice hermitovsky sdruˇzená, tj.AH = A vektorov´ y prostor vˇsech uspˇrádan´ ych n-tic dimenze prostoru P . standardn´ı skalárn´ı souˇcin norma vektoru x eukleidovská norma vektoru x norma matice A euklidovská norma matice A krychlová norma matice A konec d˚ ukazu

6

Kapitola 1 Z´ akladn´ı kapitola Definice 1.0.1. Necht’ A je ˇctvercová matice ˇrádu n. Jej´ı vlastn´ı ˇc´ısla λ1 , . . . , λn jsou koˇreny rovnice det(A − λI) = 0,

zvané charakteristická rovnice. Ke kaˇzdému vlastn´ımu ˇc´ıslu λi existuje aspoˇ n jedno nenulové (1) (2) (n) T ˇreˇsen´ı soustavy rovnic Ax = λi x. Toto ˇreˇsen´ı xi , kde xi = (xi , xi , . . . , xi ), nazveme pravým vlastn´ım vektorem matice A. (Vˇsude v dalˇs´ım bude pojem vlastn´ı vektor znaˇcit v´ yhradnˇe prav´ y vlastn´ı vektor.) Levý vlastn´ı vektor yi odpov´ıdaj´ıc´ı vlastn´ımu ˇc´ıslu λi je ˇreˇsen´ım rovnice yT A = λi yT . Lev´ y vlastn´ı vektor matice A je tedy vlastn´ım vektorem T transponované matice A a snadno lze ukázat , ˇze odpov´ıdá-li lev´ y vlastn´ı vektor yk vlastn´ımu ˇc´ıslu λk a prav´ y vlastn´ı vektor xi vlastn´ımu ˇc´ıslu λi a plat´ı λk 6= λi jsou vektory yk a xi ortogonáln´ı. (Ve vˇetˇsinˇe dále uveden´ ych pˇr´ıklad˚ u se budou vyskytovat reálné matice , budeme pˇredpokládat , pokud nebude ˇreˇceno jinak, ˇze matice A je reálná. Mnohé vˇety budou vˇsak platit i pro komplexn´ı matice nebo budeme-li pˇredpokládat symetrii, pro hermitovské matice, (d˚ ukazy následuj´ıc´ıch vˇet viz. [8]). Vˇ eta 1.0.1. Jsou-li λ1 , . . . , λn vlastn´ı ˇc´ısla matice A, má matice Ak vlastn´ı ˇc´ısla λk1 , . . . , λkn . Obecnˇeji, je-li p(x) libovolný polynom, má matice p(A) vlastn´ı ˇc´ısla p(λ1 ), . . . , p(λn ). Vˇ eta 1.0.2. Je-li matice A reálná a symetrická, jsou vˇsechna jej´ı vlastn´ı ˇc´ısla a vˇsechny pˇr´ısluˇsné vlastn´ı vektory reálné. Kromˇe toho vlastn´ı vektory pˇr´ısluˇsné r˚ uzným vlastn´ım ˇc´ısl˚ um jsou ortogonáln´ı a levý vlastn´ı vektor a pravý vlastn´ı vektor pˇr´ısluˇsné témuˇz vlastn´ımu ˇc´ıslu jsou si rovny. Vˇ eta 1.0.3. Podobnostn´ı transformace PAP−1 nemˇen´ı vlastn´ı ˇc´ısla matice A. Vˇ eta 1.0.4. (Cayley-Hamilton) Necht’ je f (λ) = det(A−λI) = 0 charakteristická rovnice matice A. Pak plat´ı f (A) = 0. Vˇ eta 1.0.5. Vlastn´ı ˇc´ısla horn´ı (doln´ı) troj´ uheln´ıkové matice jsou prvky na jej´ı diagonále. Vˇ eta 1.0.6. Libovolná matice A je podobná diagon´ aln´ı matici D právˇe tehdy, kdyˇz má matice Akompletn´ı soubor n lineárnˇe nez´ avislých vlastn´ıch vektor˚ u. 7

Kapitola 2 Typy metod pro hled´ an´ı vlastn´ıch ˇ c´ısel Podle základn´ı definice v´ıme, ˇze vlastn´ı ˇc´ısla dané matice jsou koˇreny jej´ıho charakteristického polynomu. Z algebraické teorie uˇzeme algebraicky √ v´ıme, ˇze koˇreny polynomu stupnˇe n > 4 nem˚ (tj. pomoc´ı operac´ı ±, ×, ÷, ) vyjádˇrit ve tvaru vzorce. Proto se obecnˇe nedaj´ı z´ıskat vlastn´ı ˇc´ısla pˇresnˇe ( aˇz na zaokrouhlovac´ı chyby) po koneˇcném poˇctu operac´ı. K ˇreˇsen´ı naˇseho problému m˚ uˇzeme pˇristupovat v´ıce zp˚ usoby. 1. Pouˇzijeme-li libovolnou metodu na hledán´ı koˇren˚ u charakteristického polynomu p(λ). Pro jednoduch´ y koˇren m˚ uˇzeme pouˇz´ıt Newtonovu metodu ci+1 = ci − p(ci )/p′ (ci )

i = 1, 2, . . . ,

pˇri vhodné volbˇe poˇcáteˇcn´ı aproximace c0 , metodu seˇcen, metodu p˚ ulen´ı intervalu atd. Modifikovaná Newtonova metoda se dá pouˇz´ıt i na hledán´ı násobn´ ych koˇren˚ u. V pˇr´ıpadˇe komplexnˇe sdruˇzené dvojice koˇren˚ u m˚ uˇzeme pouˇz´ıt napˇr. Bairstowovu metodu. Hledán´ı velkého poˇctu koˇren˚ u t´ımto zp˚ usobem je vˇsak dost nároˇcné a problém b´ yvá nestabiln´ı. 2. Z´ıskán´ı vlastn´ıch ˇc´ısel bez znalost´ı charakteristického polynomu, pˇri vyuˇz´ıván´ı vlastnost´ı podobn´ ych matic. C´ılem je naj´ıt podobnou matici v jednoduˇsˇs´ım tvaru, ze kterého se dá vlastn´ı ˇc´ıslo urˇcit (napˇr´ıklad z diagonáln´ı nebo troj´ uheln´ıkové matice). Takovou matici (nˇekdy jen nˇekteré jej´ı vlastn´ı ˇc´ıslo) m˚ uˇzeme z´ıskat jako limitu posloupnosti podobnostn´ıch transformac´ı. V´ ybˇer tˇechto transformac´ı b´ yvá zaloˇzen na speciáln´ıch vlastnostech matic a jejich vlastn´ıch vektor˚ u. 3. Nelineárn´ı pˇr´ıstup, vlastn´ı problém (A − λI)x = 0 uvaˇzujeme jako soustavu n rovnic pro ych x1 , ..., xn , λ, kterou dopln´ıme P n 2+ 1 neznám´ normovanou podm´ınkou napˇr´ıklad xi = 1 na soustavu n + 1 nelineárn´ıch rovnic. Tato soustava se dá ˇreˇsit napˇr´ıklad Newtonovou metodou. Pˇritom se vˇsak nevyuˇz´ıvaj´ı algebraické vlastnosti soustavy, které m˚ uˇzou v´ ypoˇcet znaˇcnˇe ulehˇcit. Proto je tento postup znaˇcnˇe neefektivn´ı. Pozn´ amka 2.0.1. Pod pojmem u ´plný problém vlastn´ıch ˇc´ısel se rozum´ı u ´loha naj´ıt vˇsechna vlastn´ı ˇc´ısla a pˇr´ıpadnˇe i pˇr´ısluˇsné vlastn´ı vektory. 8

Pojem ˇcásteˇcný problém vlastn´ıch ˇc´ısel znamená naj´ıt jedno nebo v´ıce vlastn´ıch ˇc´ısel spolu s pˇr´ısluˇsn´ ymi vlastn´ımi vektory. ´ y a ˇcásteˇcn´ Upln´ y problém vystupuj´ı jako naprosto odliˇsné u ´lohy nejen oborem aplikac´ı, ale i metodami ˇreˇsen´ı. ˇ sen´ı u Reˇ ´plného problému je nároˇcnˇejˇs´ı. Neexistuje univerzáln´ı algoritmus, kter´ y by byl stejnˇe efektivn´ı pro vˇsechny typy matic.

9

Kapitola 3 Klasick´ e metody urˇ cen´ı koeficient˚ u charakteristick´ eho polynomu Dˇr´ıve se vˇetˇsina metod na v´ ypoˇcet vlastn´ıch ˇc´ısel zakládala právˇe na v´ ypoˇctu koeficient˚ u charakteristického polynomu. Jejich v´ ypoˇcet pomoc´ı souˇctu hlavn´ıch minor˚ u je vˇsak nerentabiln´ı. Existuj´ı mnohem jednoduˇsˇs´ı metody na urˇcen´ı koeficient˚ u, které maj´ı stejn´ y charakter (tj. pˇri v´ ypoˇctu bez zaokrouhlován´ı z´ıskáme po koneˇcném poˇctu krok˚ u pˇresné koeficienty). Zaokrouhlovac´ı chyby vˇsak m˚ uˇzou vypoˇc´ıtané koeficienty hodnˇe oddálit od jejich pˇresn´ ych hodnot. Proto se tyto metody moc nepouˇz´ıvaj´ı.

3.1

Krylovova metoda

Charakteristickou rovnici m˚ uˇzeme zapsat ve tvaru n

p(λ) = λ +

n−1 X

bi λi = 0.

i=0

Z Cayleyovy − Hamiltonovy vˇety plyne n

A +

n−1 X

bi Ai = 0.

i=0

Tedy pro kaˇzd´ y vektor y plat´ı An y +

n−1 X i=0

bi Ai y = O.

(3.1)

Rovnice (3.1) je soustava n lineárn´ıch rovnic pro n neznám´ ych b0 , . . . , bn−1 . Pozn´ amka 3.1.1. K v´ ypoˇctu vektoru Ai y podle rovnice Ai y = A(Ai−1 y) je tˇreba n2 násoben´ı, takˇze k sestaven´ı soustavy (3.1) je tˇreba ˇrádovˇe n3 operac´ı.

10

3.2

Faddˇ ejevova-Leverrierova metoda

Metoda se op´ırá o fakt, ˇze souˇcet vlastn´ıch ˇc´ısel libovolné matice je roven jej´ı stopˇe. Algoritmus Faddˇejˇevovy-Leverrierovy metody poˇc´ıtá jednoduch´ ym zp˚ usobem koˇreny charakteristické rovnice. Algoritmus 1. Je dána matice A ˇrádu n. Krok 1: Poloˇzme B1 = A pak p1 = tr(B1 ) Krok 2: B2 = A(B1 − p1 I) a p2 = 12 tr(B2 ) .. . Krok n: Bn = A(Bn−1 − pn−1 I) a pn = n1 tr(Bn ) Krok n+1: Charakteristický polynom je ve tvaru p(λ) = λn − p1 λn−1 − . . . − pn−1 λ − pn . Pozn´ amka 3.2.1. Pro inverzn´ı matici A−1 plat´ı A−1 =

1 (Bn−1 − pn−1 I). pn

Pozn´ amka 3.2.2. D˚ ukazy konvergence popsan´ ych metod v této kapitole a anal´ yzu chyb m˚ uˇzeme naj´ıt v literatuˇre, viz.[1],[10]. Pˇ r´ıklad 3.2.1. Najdˇete koeficienty charakteristického polynomu uˇzit´ım F.-L. metody pro matici   8 −1 3 −1 −1 6 2 0  . A= 3 2 9 1 −1 0 1 7 B1 = A ⇒ tr(B1 ) = 30 ⇒ p1 = 30,   −165 22 −42 18  22 −139 −33 3   B2 = A(B1 − 30I) =   −42 −33 −175 −17  , 18 3 −17 −159 1 1 ⇒ p2 = tr(B2 ) = (−638) = −319, 2 2  1066 −106 146 −106 992 132 B3 = A(B2 + 319I) =   146 132 1087 70 −34 67

 −70 −34  , −67  1085

1 1 ⇒ p3 = tr(B3 ) = 4230 = 1470, 3 3   −2138 0 0 0  0 −2138 0 0   B4 = A(B3 − 1410I) =   0 0 −2138 0  0 0 0 −2138 11

1 1 ⇒ p4 = tr(B4 ) = (−8552) = −2138, 2 4 ⇒ p(λ) = λ4 − 30λ3 + 319λ2 − 1410λ + 2138. Pozn´ amka 3.2.3. F.-L. metoda je i pˇres jednoduch´ y algoritmus ménˇe v´ yhodná neˇz Krylovova metoda, protoˇze vyˇzaduje skuteˇcnˇe poˇc´ıtat matice Ak pro k = 1, . . . , n.

12

Kapitola 4 Poloha a odhad vlastn´ıch ˇ c´ısel 4.1

Gerˇ sgorinovy vˇ ety

Pˇresná znalost vlastn´ıch ˇc´ısel dané matice nás v nˇekter´ ych praktick´ ych aplikac´ıch nemus´ı zaj´ımat a staˇc´ı znát polohu vlastn´ıch ˇc´ısel v urˇcit´ ych oblastech komplexn´ı roviny. Tyto informace m˚ uˇzeme z´ıskat i bez pˇr´ım´ ych v´ ypoˇct˚ u vlastn´ıch ˇc´ısel dané matice. K nalezen´ı polohy vlastn´ıch ˇc´ısel lze pouˇz´ıt následuj´ıc´ı vˇetu. Vˇ eta 4.1.1. Gerˇ sgorinova vˇ eta ’ Necht A = {aij } je ˇctvercová matice ˇrádu n. Definujme ri :=

n X

j=1,j6=i

|aij |,

i = 1, . . . , n.

(4.1)

Potom kaˇzdé vlastn´ı ˇc´ıslo λ matice A splˇ nuje aspoˇ n jednu z n´ asleduj´ıc´ıch nerovnost´ı |λ − aii | ≤ ri ,

i = 1, . . . , n.

(4.2)

Jinými slovy, vˇsechna vlastn´ı ˇc´ısla matice A leˇz´ı v oblasti K=

n [

Ri ,

(4.3)

i=1

kde Ri jsou kruhy o polomˇeru ri a stˇredu aii . D˚ ukaz. Necht’ λ je vlastn´ı ˇc´ıslo matice A a x je vlastn´ı vektor odpov´ıdaj´ıci vlastn´ımu ˇc´ıslu λ. Potom ze vztahu Ax = λx nebo ze vztahu (A − λI) = 0 dostaneme (λ − aii )xi =

n X

aij xj ,

i = 1, . . . , n

j=1,j6=i

kde xi je i-t´ y prvek vektoru x. ’ Necht xk je nejvˇetˇs´ı prvek vektoru x (v absolutn´ı hodnotˇe). Protoˇze |xj |/|xk | ≤ 1 pro j 6= k, je |λ − akk | ≤

n X j=1

|akj |(|xj |/|xk |) ≤

Tedy λ leˇz´ı v kruhu {λ : |λ − akk | ≤ rk }. 13

n X

j=1,j6=k

|akj |.

(4.4)

Definice 4.1.1. Kruhy Ri := {z : |z − aii | ≤ ri }, i = 1, . . . , n, se naz´ yvaj´ı Gerˇsgorinovy kruhy v komplexn´ı rovinˇe. Pozn´ amka 4.1.1. Vˇeta nám nezaruˇcuje, ˇze v kaˇzdém kruhu bude nˇejaké vlastn´ı ˇc´ıslo, pouze nám ˇr´ıká, ˇze vlastn´ı ˇc´ısla matice A leˇz´ı ve sjednocen´ı Gerˇsgorinov´ ych kruh˚ u. Následuj´ıc´ı vˇeta polohu vlastn´ıch ˇc´ısel upˇresˇ nuje. Vˇ eta 4.1.2. Gerˇ sgorinova zobecnˇ en´ a vˇ eta Necht’ r Gerˇsgorinových kruh˚ u je disjunktn´ıch. Pak právˇe r vlastn´ıch ˇc´ısel matice A leˇz´ı ve sjednocen´ı tˇechto kruhu. D˚ ukaz. V d˚ ukazu této vˇety se pouˇz´ıva vlastnost´ı z komplexn´ı anal´ yzy, viz [2]. Pozn´ amka 4.1.2. Urˇcen´ı polohy vlastn´ıho ˇc´ısla dané matice pomoc´ı Gerˇsgorinov´ ych vˇet je pomˇernˇe jednoduché. Pro zaj´ımavost uvedeme jeˇstˇe jednu vˇetu, která sice také urˇcuje polohu vlastn´ıch ˇc´ısel, ale jej´ı pouˇzit´ı je uˇz sloˇzitˇejs´ı a v urˇcit´ ych pˇr´ıkladech nepraktické. Vˇ eta 4.1.3. Necht’ A je ˇctvercová (obecnˇe komplexn´ı) matice n-tého ˇrádu, necht’ α je (komplexn´ı) ˇc´ıslo, pro které stopa matice tr((αI − A)−1 ) 6= 0. Pak v kaˇzdém uzavˇreném kruhu obsahuj´ıcim ˇc´ıslo α a α ˜ , kde n , α ˜ =α− tr((αI − A)−1 ) leˇz´ı alespoˇ n jedno vlastn´ı ˇc´ıslo matice A. n (α − α ˜) Definujme r = , pak v kruhu o stˇredu a polomˇeru r leˇz´ı alespoˇ n −1 2tr((αI − A) ) 2 jedno vlastn´ı ˇc´ıslo matice A. Pozn´ amka 4.1.3. Tato vˇeta nen´ı obecnˇe známa a vypl´ yva z vˇet o koˇrenech polynomiáln´ı rovnice.D˚ ukaz viz.[9] Pˇ r´ıklad 4.1.1. Uˇzit´ım Gerˇsgorinových vˇet urˇcete pˇribliˇznou polohu vlastn´ıch ˇc´ısel komlexn´ı matice   1 −1/2 1/4 −1/4  1/4 1 + 2i 0 1/4    −1/2 1/4 −1 1/2  1/4 −1/2 1/2 −2 − 2i ˇ sen´ı 1. Reˇ P r1 = Pni=1,i6=1 |a1i | = 1/2 + 1/4 + 1/2 = 1 r2 = Pni=1,i6=2 |a2i | = 1/4 + 0 + 1/4 = 1/2 r3 = Pni=1,i6=3 |a3i | = 1/2 + 1/4 + 1/2 = 5/4 r4 = ni=1,i6=4 |a4i | = 1/4 + 1/2 + 1/2 = 5/4 R1 R2 R3 R4

= {z = {z = {z = {z

: |z − 2| ≤ 1} : |z − 1 − 2i| ≤ 1/2} : |z + 1| ≤ 5/4} : |z + 2 + 2i| ≤ 5/4}

14

R2 2

R3

R1

1

-2

-1

1

0

2

-1

-2

R4 Obrázek 4.1: Gerˇsgorinovy kruhy

Podle Gerˇsgorinových vˇet tedy S leˇz´ı jedno vlastn´ı ˇc´ıslo v kruhu R1 , jedno v kruhu R2 a zbylá dvˇe ve sjednocen´ı kruh˚ u R3 R4 . viz obr(4.1). Uved’me pˇresnou hodnotu vlastn´ıch ˇc´ısel: λ1 = 1.9285 − i0.0446 λ2 = 1.0063 + i2.0678 λ3 = −0.9079 − i0.0855 λ4 = −2.0269 − i1.9377 coˇz pˇresnˇe odpov´ıdá poloze urˇcené pomoc´ı Gerˇsgorinových kruh˚ u. Poznámky ke Gerˇsgorinovˇe vˇetˇe 1. Ze vztahu (4.4) pro maximáln´ı souˇradnici |xi | m˚ uˇzeme z´ıskat odhad X X |λi | ≥ |aii | − |aij | ≥ min(|akk | − |akj |) k

j6=i

a

min |λi | ≥ (|aii | − i

j6=i

X j6=i

|aij |).

Pro matici s pˇrevládaj´ıc´ı diagonálou plat´ı X X 0 < min(|aii | − |aij |) ≤ |λi | ≤ max |aij | = ||A||∞ i

i

j6=i

15

j6=i

2. K matici A m˚ uˇzeme pomoc´ı jednoduché podobnostn´ı transformace D−1 AD = B (D je diagonáln´ı) z´ıskat podobnou matici B, která má jiné Gerˇsgorinovy kruhy. Potom vˇsechna vlastn´ı ˇc´ısla leˇz´ı v oblasti KA ∩ KB . C´ılem tˇechto transformac´ı je rozklad oblasti K na souvislé komponenty, pˇr´ıpadná izolace jednoho kruhu, ve kterém pak m˚ uˇzeme zaruˇcit existenci právˇe jednoho vlastn´ıho ˇc´ısla. 3. Pokud det(λI − A) = det(λI − AT ), m˚ uˇzeme vytvoˇrit Gerˇsgorinovy kruhy i pro matici T A a z´ıskat oblast KA ∩ KAT .,ve které vlastn´ı ˇc´ısla leˇz´ı. 3 2 3 −2 Pˇ r´ıklad 4.1.2. Matice A1 = resp. A2 = maj´ı stejné oblasti KA1 = 1 1 −1 1 KA2 := KA . Na obr.2 vid´ıme, ˇze v pˇr´ıpadˇe matice A2 , ˇza´dný z malých kruh˚ u neobsahuje vlastn´ı ˇc´ıslo.

Obrázek 4.2:

Pouˇzité znaˇcen´ı: Hranice oblasti KA je znaˇcena pˇreruˇsovanˇe Hranice oblasti KAT je znaˇcena plnou ˇcarou ˇ Sedou barvou je znaˇcena hranice √ oblasti KA ∩ KAT ⋆ vlastn´ı ˇc´ısla A1 λ1,2 = 2 ± 3 • vlatn´ı ˇc´ısla A2 λ1,2 = 2 ± i

16

Kapitola 5 Metody v´ ypoˇ ctu dominantn´ıho vlastn´ıho ˇ c´ısla ´ Umluva: Oˇc´ıslujeme-li vlastn´ı ˇc´ısla dané matice A tak, aby platilo |λ1 | ≥ |λ2 | ≥ . . . ≥ |λn | (kaˇzdé ˇc´ıslo p´ıˇseme tolikrát, kolik ˇcin´ı jeho násobnost), pak budeme vlastn´ı ˇc´ıslo λ1 naz´ yvat dominantn´ı vlastn´ı ˇc´ıslo.

5.1

Mocninn´ a metoda

Mocninná metoda je nejˇcastˇeji pouˇz´ıvanou metodou pro nalezen´ı dominantn´ıho vlastn´ıho ˇc´ısla a pˇr´ısluˇsného vlastn´ıho vektoru dané matice. Metoda je obzvlaˇstˇe vhodná pro ˇr´ıdké matice, protoˇze spoˇc´ıvá pouze v násoben´ı sloupcov´ ych vektor˚ u dané matice. Základn´ı pˇredpoklad k uˇzit´ı této metody je, ˇze daná matice má dominantn´ı vlastn´ı ˇc´ıslo λ1 a ˇze nemá nelineárn´ı elementárn´ı dˇelitele, tj. ˇze existuje n lineárnˇe nezávisl´ ych vlastn´ıch vektor˚ u této matice, kde n je ˇrád matice. Konstrukce: Necht’ x je libovoln´ y vektor, x ∈ Rn , za pˇredpokladu, ˇze {v1 , . . . , vn } je mnoˇzina lineárnˇe nezávisl´ ych vlastn´ıch vektor˚ u, m˚ uˇzeme vektor x vyjádˇrit jako lineárn´ı kombinaci vektor˚ u vi , i = 1, . . . , n x=

n X

αi vi .

(5.1)

i=1

Násoben´ım obou stran rovnice (5.1) maticemi A, A2 , . . . , Ak dostaneme systém rovnic Ax =

n X

αi Avi =

A2 x =

αi A2 vi =

A x=

n X

n X

αi λ2i vi ,

i=1

i=1

k

αi λi vi ,

i=1

i=1

n X

n X

k

αi A vi =

n X i=1

i=1

17

.. . αi λki vi .

(5.2)

Pro λk1 , které jsme vypoˇc´ıtali ze systému (5.2), dostáváme k

A x=

λk1

n X

αi (

i=1

λi k ) vi . λ1

Z pˇredpokladu, ˇze λ1 je dominantn´ı vlastn´ı ˇc´ıslo a tedy |λ1 | > |λj | j = 2, . . . , n, plyne, ˇze lim (

k→∞

λj k ) =0 λ1

a tedy lim Ak x = lim λk1 α1 v1 .

k→∞

k→∞

(5.3)

Tento postup bude konvergovat k nule, jestliˇze |λ1 | < 1 a divergovat, jestliˇze |λ1 | ≥ 1, ovˇsem za pˇredpokladu, ˇze α1 6= 0.

Pozn´ amka 5.1.1. Popsaná konstrukce je i d˚ ukazem následuj´ıc´ı vˇety.

Vˇ eta 5.1.1. Von Mises Jestliˇze matice A má n lineárnˇe nez´ avislých vektor˚ u a je-li vlastn´ı ˇc´ıslo λ1 dominantn´ı a pro vektor x0 ∈ Rn plat´ı, ˇze hx0 , v1 i = 6 0 .Pak lim (

k→∞

Ak x0 ) = α1 v1 . λk1

(5.4)

D˚ usledek 5.1.1. Je-li y libovolný vektor, který nen´ı ortogonáln´ı k vlastn´ımu vektoru v1 , plyne z vˇety 5.1.1,ˇze λ1 = lim ( k→∞

yT xk+1 ), yT xk

kde xk+1 = Axk = Ak x0 . ˇ ısla yT xk+1 = yT Axk se naz´ Definice 5.1.1. C´ yvaj´ı Schwarzovými konstantami. Algoritmus 2. Je zadána matice A Krok 1: Zvol´ıme x0 Krok 2: Pouˇzijeme iteraˇcn´ı formuli xd k+1 = Axk

Krok 3:

xk+1 =

xd k+1 (j) cj |} ⇒ λ1 = maxj=1,...,n {|x n d (j) max{|xk+1 |}

.. . d (j) (j) Krok n: Zastaven´ı výpoˇctu po n kroc´ıch ⇒ λ1 = maxj=1,...,n {|xn |} (k+1) (k) nebo zastaven´ı výpoˇctu pro |λ1 − λ1 | < δ. 18

Pozn´ amka 5.1.2. Nejˇcastˇejˇs´ı volbou poˇcáteˇcn´ıho vektoru x0 je vektor x0 = (1, . . . , 1)T . Pˇ r´ıklad 5.1.1. Najdˇete dominantn´ı vlastn´ı ˇc´ıslo  4 2 3 3 0 4  A= 1 2 5 2 6 0 3 6 5 ˇ sen´ı 2. Zvol´ıme x0 = (1, 1, 1, 1, 1)T Reˇ   13 11    xb1 = Ax0 =  12 , 11 17 

 9.7647  8.7647    , 9.5882 xb2 = Ax1 =     7.7059  12.3529

(1)

λ1

matice  2 2 1 3  0 4 . 2 1 1 2

  0.7647 0.6471   , 0.7059 = 17 x1 =    0.6471 1

(2)

λ1 = 12.3529

•



 0.7905 0.7095   , 0.7762 x2 =    0.6238 1

• •

x10

xc 11 = Ax10 Vlastn´ı ˇc´ısla matice A jsou

  0.7731 0.6957    = 0.7735 , 0.6125 1

  10.0285  9.0247     =  10.0307 ,  7.9454  12.9722

(11)

λ1

= 12.9722.

λ1 = 12.9722, λ2 = 3.8755, λ3 = −3.0794, λ4 = −0.0297 − i0.0164. Takˇze je vidˇet,ˇze po jedenácti kroc´ıch jsme dostali pˇresné ˇreˇsen´ı zadaného pˇr´ıkladu. 19

Pˇ r´ıklad 5.1.2. Pro matici

  1.5 −2 0.4 A =  3 0.86 −0.5 2 1.5 1.5

vˇsak metoda nebude konvergovat, protoˇze ˇc´ıselné hodnoty budou oscilovat. λ1 = 2.13746 λ2,3 = 0.86127 ± i2.25118

⇒ |λ2,3 | = 2.66

Absolutn´ı hodnoty vlastn´ıch ˇc´ısel jsou si rovny a tedy mocninn´ a metoda nedok´ aˇze urˇcit dominantn´ı vlastn´ı ˇc´ıslo. Pozn´ amka 5.1.3. Nev´ yhody mocninné metody: • odhad chyby • konvergence (obvykle v praxi nev´ıme, zda jsou splnˇeny pˇredpoklady mocninné metody) • volba x0 (bude-li vektor x0 takovou lineárn´ı kombinac´ı vlastn´ıch vektor˚ u, ˇze koeficient u vlastn´ıho vektoru odpov´ıdaj´ıc´ıho dominantn´ımu vlastn´ımu ˇc´ıslu bude roven 0, potom mocninná metoda nevypoˇcte dominantn´ı vlastn´ı ˇc´ıslo). Pozn´ amka 5.1.4. Rychlost konvergence mocninné metody závis´ı hlavnˇe na volbˇe vektoru |λ2 | x0 a na velikosti pod´ılu . |λ1 |

5.2

Metoda Rayleighova pod´ılu

Metoda Rayleighova pod´ılu je modifikovanou mocninnou metodou a zamˇeˇruje se na v´ ypoˇcet dominantn´ıho vlastn´ıho ˇc´ısla symetrické matice. Pro tuto ˇcást tedy budeme vˇzdy pˇredpokládát, ˇze matice A je symetrická. Potom vlastn´ı vektory mus´ı b´ yt ortonornáln´ı (tj. vTi vj = 0 pro i 6= j, vTi vi = 1). Odvozen´ı: 1. Zvol´ıme x0 jako lineárn´ı kombinaci vlastn´ıch vektor˚ u x0 =

n X

αi vi .

i=1

2. Sestroj´ıme posloupnost xk = Axk−1 , xk = Ak x0 ,

xk = α1 Ak v1 + . . . + αn Ak vn .

20

3. Plat´ı Avi = λi vi , potom xk = α1 λk1 v1 + α2 λk2 v2 + . . . + αn λkn vn , kde λ1 je dominantn´ı vlastn´ı ˇc´ıslo. 4. Dostaneme xk =

λk1 [α1 v1

+

n X

αi (

i=2

Sumu

Pn

i=2

αi (

λi )vi ]. λ1

λi )vi ] definujme jako wk , wk → o. λ1

5. Analogicky xk+1 6. Vyjádˇr´ıme souˇcin xTk xk , xTk xk = λk1 [α1 v1 +

n X i=2

n

αi (

n

X X λi T k λi λi 2 )vi ]λ1 [α1 v1 + [α + αi ( )vi ] = λ2k αi2 ( )2k ] = 1 1 λ1 λ1 λ1 i=2 i=2 2 T λ2k 1 [α1 + wk wk ]

a souˇcin xTk xk+1 xTk xk+1

=

λk1 [α1 vT1

+

n X i=2

[α12 λ2k+1 1

+

n X i=2

n

X λi λi αi ( )k+1 vi ] = [α v + αi ( )k vTi ]λk+1 1 1 1 λ1 λ1 i=2

αi2 (

λi 2k+1 2 T ) ] = λ2k 1 [α1 + wk wk+1 ]. λ1

Dostáváme →0

xTk Axk xTk Axk+1 = lim k→∞ xT xk k→∞ xTk xk k lim

z }| { T 2 w λ2k+1 (α + k wk+1 ) = 1 2k 2 1 = λ1 . T λ1 (α1 + wk wk+1 ) | {z } →0

Pozn´ amka 5.2.1. Souˇcin wTk wk konverguje k nule pro k → ∞ dvakrát rychleji neˇz wk k nulovému vektoru, z toho vypl´ yvá, ˇze metoda Raleighova pod´ılu bude rychlejˇs´ı neˇz mocninná metoda. Pˇ r´ıklad 5.2.1. Metodou Rayleighova pod´ılu urˇcete dominantn´ı vlastn´ı ˇc´ıslo matice   1 1 0 A = 1 1 1 . 0 1 1 21

ˇ sen´ı 3. x0 = (1 1 Reˇ

1)T   2 x1 = Ax0 = 3 , 2

λ1 =

  5  x2 = Ax1 = 7 , 5

λ1 =

  12 x3 = Ax2 = 17 , 12

λ1 =

(1)

(2)

xT0 x1 = 2.3333, xT0 x0

xT1 x2 = 2.4118, xT1 x1

(3)

xT2 x3 = 2.4142. xT2 x2

Vlastn´ı ˇc´ısla matice A jsou

λ1 = 2.4142, λ2 = 1, λ3 = −0.4142. Tedy uˇz po tˇrech kroc´ıch jsme dostali pˇresné ˇreˇsen´ı.

5.3

V´ ypoˇ cet dalˇ s´ıch vlastn´ıch ˇ c´ısel mocninnou metodou

Pokud jiˇz známe vlastn´ı ˇc´ıslo λ1 matice A a k nˇemu pˇr´ısluˇsn´ y vlastn´ı vektor v1 , m˚ uˇzeme vypoˇc´ıtat následuj´ıc´ı vlastn´ı ˇc´ıslo λ2 a vlastn´ı vektor v2 opˇet mocninnou metodou, kterou pouˇzijeme na redukovanou matici. Vˇ eta 5.3.1. O redukci Necht’ λ1 6= 0 je vlastn´ı ˇc´ıslo matice A s vlastn´ım vektorem v1 a vektor x je libovolný vektor s vlastnost´ı xT v1 = 1. Potom vlastn´ı ˇc´ısla matice B = A − λ1 v1 xT jsou 0, λ2 , . . . , λn (kde λ1 , λ2 , . . . , λn jsou vlastn´ı ˇc´ısla matice A). D˚ ukaz. Necht’

  λ1 δ1 0 · · · 0  0 λ2 δ2 · · ·  .  . . .   .. .. .. J = V−1 AV =  .. , .  . . . .. .. . . δn−1   .. 0 0 0 . . . λn

je Jordan˚ uv tvar matice, kde δi ∈ {0, 1}, i = 1, . . . , n − 1. Jsou-li v1 , . . . , vn sloupce matice V, potom matice C = V−1 BV má tvar C = J − λ1 V−1 v1 xT V = J − λ1 e1 (xT v1 , . . . , xT vn ) = 22

= J − λ1

xT v2 . . . xT vn 0n−1,n−1

1 01,n−1

=

  0 δ1 − λ1 xT v2 −λ1 xT v3 · · · −λ1 xT vn 0  λ2 δ2 ··· 0 .  . ... ...   .. 0 =  ..  .  . . . .. .. ..  .. δn−1  0 0 0 ... λn

coˇz vˇetu dokazuje (vlastn´ı ˇc´ısla jsou na diagonále). V´ ybˇ er vektoru x: Vˇeta o redukci zaruˇcuje ˇsirok´ y v´ ybˇer vektoru x. Napˇr.

1. Wielandtova redukce V´ yhoda této metody je v tom, ˇze v kaˇzdé dalˇs´ı fázi pracujeme s menˇs´ı matic´ı a provád´ıme ménˇe v´ ypoˇct˚ u. Poloˇz´ıme x=

1 j T v r λ1 1 j

kde rj je j-t´ y ˇrádek matice A a v1j 6= 0. Index j vybereme tak, aby odpov´ıdal nejvˇetˇs´ı sloˇzce vektoru x. 2. Hotellingova redukce Zde poloˇz´ıme x = y1 , kde y1 je lev´ y vlastn´ı vektor k λ1 a je normalizován, tak, ˇze T plat´ı y1 x = 1. Protoˇze y1 obvykle neznáme, pouˇz´ıvá se tato metoda nejsnadnˇeji u symetrick´ ych matic, v tomto pˇr´ıpadˇe je xi = vi .

23

Kapitola 6 Metody pro v´ ypoˇ cet vlastn´ıch ˇ c´ısel a vlastn´ıch vektor˚ u symetrick´ ych matic 6.1

Jacobiho metoda

Jacobiho metoda m˚ uˇze naj´ıt vˇsechna vlastn´ı ˇc´ısla a jim odpov´ıdaj´ıc´ı vlastn´ı vektory symetrické matice A. Metoda je vhodná hlavnˇe pro plné matice. Necht’ A je symetrická, potom existuje ortonormáln´ı báze sloˇzená z vlastn´ıch vektor˚ u A = MT DM λi jsou reálná vlastn´ı ˇc´ısla matice A, D = diag(λ1 , . . . , λn ) a T je ortogonáln´ı matice. Pˇri prvn´ım kroku Jacobiho metody poloˇz´ıme A = A1 a sestroj´ıme posloupnost {Sk }k≥1 elementárn´ıch ortogonáln´ıch matic takovou, aby Ak+1 = STk Ak Sk = (S1 . . . Sk )T A(S1 . . . Sk ) k = 1, 2, . . . konverguj´ıc´ı k D. Protoˇze Ak+1 jsou podobné matici A, maj´ı stejná vlastn´ı ˇc´ısla. Necht’ S je matice tvaru   1 ··· 0 ··· 0 ··· 0 .. .. ..   .. . . . . . . .   0 · · · cos α · · · sin α · · · 0 . .. .. ..  ... S= . . .  ..  0 · · · − sin α · · · cos α · · · 0   .  . . . . . . . . . . . . . . 0 ··· 0 ··· 0 ··· 1 (tzn. matice rovinné rotace nebo Givensova transformace)

kde prvky cos α jsou na pozc´ıch (p,p) a (q,q),sin α na pozici (p,q) a − sin α na pozici (q,p). Pak plat´ı vˇeta Vˇ eta 6.1.1. Necht’ p,q jsou pˇrirozená ˇc´ısla, 1 ≤ p < q ≤ n, α je reálné ˇc´ıslo, necht’ S je ortogonáln´ı matice. 24

1. Je-li A = (aij ) symetrická, je B = ST AS = (bij ) symetrická a n X

b2ij

n X

=

a2ij

i,j=1

i,j=1

2. Je-li apq 6= 0, existuje jediné α ∈ h−π/4, 0) ∪ (0, π/4) tak, ˇze bpq = 0, kde α je jediné ˇreˇsen´ı rovnice aqq − app 2apq

cotg 2α = leˇz´ıc´ı v této mnoˇzinˇe. Potom

n X i=1

b2ii

=

n X

a2ii + 2a2pq .

i=1

D˚ ukaz. 1. Protoˇze A = SBST a v´ıme, ˇze pro dvˇe matice K,L plat´ı tr(KL) = tr(LK), máme

n X

a2ij = tr(AT A) = tr(SBT ST SBST ) =

i,j=2

tr(SBT BST ) = tr(ST SBT B) = tr(BT B) = n X

b2ij .

i,j=2

2. Transformace na pozic´ıch (p,q);(q,q);(p,p);(q,p) má tvar cos α − sin α cos α − sin α app apq bpp bpq · = · sin α cos α aqp aqq sin α cos α bqp bqq cos α − sin α app cos α − apq sin α apq cos α − aqq sin α · = sin α cos α app sin α + apq cos α apq sin α + aqq cos α a tedy •

bpp = app cos2 α − 2apq sin α cos α + aqq sin2 α app cos2 α + aqq sin2 α − apq sin 2α 25

•

bpq = bqp = app cos α sin α + apq sin2 α + apq cos2 α − aqq sin α cos α = apq cos 2α + 1/2(apq − aqq ) sin 2α

•

bqq = app sin2 α + 2apq sin α cos α + aqq cos2 α app sin2 α + aqq cos2 α + apq sin 2α

Stejnˇe jako v ˇcásti (1) a2pp + a2qq + 2a2pq = b2pp + b2qq + 2b2pq pro libovolné α. Zvol´ıme-li α tak, aby platilo cotg 2α = − je bpq = bqp = 0 a tedy

app − aqq 2apq

b2pp + b2qq = a2pp + a2qq + 2a2pq

ostatn´ı aii = bii pro i 6= p, q. Pozn´ amka 6.1.1. • Pˇri transformaci

A → B = ST · A · S

se mˇen´ı pouze p-té a q-té ˇrádky a sloupce, pˇresnˇeji pro libovolné α : – bij = aij

pro i 6= p, q

a j 6= p, q

– bpi = bip = api cos α − aqi sin α pro i 6= p, q – bqi = biq = api sin α − aqi cos α pro i 6= p, q – bpp = app cos2 α + aqq sin2 α − apq sin 2α – bqq = app sin2 α + aqq cos2 α + apq sin 2α –

1 bpq = bqp = apq cos 2α + (app − aqq ) sin 2α 2

• Pouˇzijeme-li vztahy mezi goniometrick´ ymi funkcemi, lze prvky matice B vyjádˇrit pomoc´ı prvk˚ u matice A.

26

Postup v´ ypoˇ ctu: • Nejprve poloˇz´ıme

K=

• Oznaˇc´ıme-li t = tg α je

• Dále

aqq − app 2apq

(= cotg 2α)

( koˇren t2 + 2Kt − 1 pro K 6= 0 t= 1 pro K = 0

c= √

1 1 + t2

s= √

(= cos α)

t 1 + t2

(= sin α)

• Pro prvky matice B plat´ı vztahy: bpi = bip = c · api − s · aqi

i 6= p, q

bqi = biq = c · aqi + s · api

i 6= p, q

bpi = bip = app − t · apq bpi = bip = aqq + t · apq

Uved’me odvozen´ı napˇr. pro bqq bqq = app sin2 α + aqq (1 − sin2 α) + apq sin 2α = aqq − (aqq + app ) sin2 α + apq sin 2α = aqq + apq (sin 2α − 2 cotg 2α sin2 α).

Protoˇze

−2 cot 2α sin2 α + sin 2α =

sin2 2α − 2 cos2 2α sin2 α 2 sin α cos α

a dále ˇcitatel 4 sin2 α cos2 α − 2 sin2 α cos2 α + 2 sin4 α = 2 sin2 α(sin2 α + cos2 α) = 2 sin2 α je bqq = aqq +

sin α apq = aqq + t · apq . cos α

Jeden krok Jacobiho metody: (k) Máme-li sestrojenou matici Ak = [aij ], vybereme (p,q) tak, aby a(k) p,q 6= 0. Sestroj´ıme Sk jako ve vˇetˇe 6.1.1, urˇc´ıme α ∈ (−π/4, 0) ∪ (0, π/4) tak, aby (k)

cotg 2αk =

(k)

aqq − app

poloˇz´ıme

(k)

2apq

,

(k+1)

Ak+1 = STk ASk = [aij 27

].

Strategie pro volbu (p,q): 1. Klasick´ a Jacobiho metoda: Zvol´ıme (p,q) taková , aby platilo (k)

|a(k) pq | = max |aij | i6=j

a (p,q) se mˇen´ı pro r˚ uzná k. 2. Cyklick´ a Jacobiho metoda: Nuluj´ı se vˇsechny nediagonáln´ı prvky cyklickou smyˇckou, napˇr. (p,q) vol´ıme (1, 2) (1, 3)

...

(1, n); (2, 3)

...

(2, n);

...

; (n − 1, n).

Zˇrejmˇe, je-li nˇekter´ y prvek nulov´ y, postupujeme dále (tj. vol´ıme αk = 0 nebo Sk = I) 3. Prahov´ a Jacobiho metoda: Postupujeme jako u cyklické Jacobiho metody, ale nediagonáln´ı prvky, které jsou v absolutn´ı hodnotˇe menˇs´ı neˇz ”jistá” mez, která se zmenˇsuje s kaˇzdou smyˇckou, se neanuluje. Pozn´ amka 6.1.2. Co se t´ yˇce konvergence, ukáˇzeme myˇslenku d˚ ukazu pro nejjednoduˇsˇs´ı pˇr´ıpad. Oznaˇc´ıme Pn mnoˇzinu vˇsech permutac´ı ˇc´ısel 1, 2, . . . , n. Vˇ eta 6.1.2. Posloupnost matic {Ak }∞ ıskaných klasickou Jacobiho metodou je konverk=1 z´ gentn´ı, lim Ak = diag(λs(i) ) k→∞

pro jistou permutaci s ∈ Pn . K d˚ ukazu potˇrebujeme následuj´ıc´ı lemma. Lemma 6.1.1. Bud’ X koneˇcnˇedimenzionáln´ı normovaný vektorový prostor, {xk } ohraniˇcená posloupnost v X, kter´ a má pouze koneˇcný poˇcet hromadných bod˚ u, necht’ lim ||xk+1 − xk || = 0.

k→∞

Potom je posloupnost {xk } konvergentn´ı. D˚ ukaz. vˇety 6.1.2 (k) Oznaˇcme Ak = [aij ] = Dk + Bk ,

(k)

Dk = diag(aii ).

• Nejprve dokáˇzeme, ˇze limk→∞ Bk = 0. Oznaˇcme X (k) Ωk = |aij |2 . i6=j

Pak plat´ı 2 Ωk ≤ n(n − 1)|a(k) pq |

28

(k) nebot’ máme n(n-1) nediagonáln´ıch prvk˚ u a ˇc´ıslo |apq | je maximáln´ı. Dále podle vˇety 6.1.1 (k) Ωk+1 = Ωk − 2|aij |2 ,

tedy Ωk+1 ≤ (1 − tj.

2 )Ωk n(n − 1)

lim Ωk = 0.

k→∞

• Nyn´ı dokáˇzeme, ˇze limk→∞ (Dk+1 − Dk ) = O. Pro diagonáln´ı prvky matice Ak+1 plat´ı   i 6= p, q, 0, (k+1) (k) (k) aii − aii = −(tg αk )apq , i = p,   (k) (tg αk )apq , i = q. (k)

Protoˇze |αk | ≤ π/4 a limk→∞ apq = 0 je d˚ ukaz proveden.

• Necht’ {Dk′ } je posloupnost, která konverguje k matici D, potom také limk′ →∞ Ak′ = D, protoˇze Bk′ = 0. Ak′ = Dk′ + Bk′ a lim ′ k →∞

Tedy det(λI − D) = lim det(λI − Ak′ ) = det(λI − A). ′ k →∞

Matice Ak′ a A jsou podobné, tedy det(λI − Ak′ ) = det(λI − A) pro vˇsechna k ′ . Takˇze D a A maj´ı stejné charakteristické polynomy, tedy i stejná vlastn´ı ˇc´ısla. D proto mus´ı b´ yt diagonáln´ı, D = diag(λs(i) ) • Posloupnost {Dk }, kde Dk je vektor dimenze n2 , je ohraniˇcená, nebot’ ||Dk ||2 = (

n X

i,j=1

(k) |dij |2 )1/2

≤(

n X

i,j=1

(k)

|aij |2 )1/2 =

||Ak ||2 = ||A||2 Jsou tedy splnˇeny pˇredpoklady lemmatu 6.1.1 a posloupnost {Ak } konverguje. Pˇ r´ıklad 6.1.1. Klasickou Jacobiho metodou urˇcete vˇsechna vlastn´ı ˇc´ısla matice   8 −1 3 −1 1 6 2 0 , A= 3 2 9 1 −1 0 1 7 29

ˇ sen´ı 4. Maximáln´ı nediagon´ Reˇ aln´ı prvek (v absolutn´ı hodnotˇe) je 3 na pozici (1,3) ⇒ p = 1 q=3 a33 − a11 1 K= = 6= 0 ⇒ 2a13 6 t je koˇren (s menˇs´ı absolutn´ı hodnotou) polynomu t2 +

1 − 1 = 0, 3

t = 0.84712708838304, 1 t c= √ = 0.76301998247272 s = √ = 0.64637489613020 2 1+t 1 + t2 b13 = b31 = 0 b11 = a11 − t · a13 = 5.45861873485088, b33 = a33 + t · a13 = 11.54138126514912, b12 = c · a12 − s · a32 = −2.05576977473312 = b21 , b14 = c · a14 − s · a34 = −1.40939487860292 = b41 , b32 = c · a32 + s · a12 = 0.87966506881525 = b23 , b34 = c · a34 + s · a14 = 0.11664508634253 = b43 , b22 = a22

b44 = a44

b42 = b24 = a24 .

Pak dostaneme matici   5.45861873485088 −2.05576977473312 0 −1.40939487860292  −2.05576977473312 6 0.87966506881525 0 .   0 0.87966506881525 11.54138126514912 0.11664508634253  −1.40939487860292 0 0.11664508634253 7 Nyn´ı opˇet vybereme maximáln´ı prvek a stejným zp˚ usobem postupujeme dál .. . Po 7 kroc´ıch se dostamene k matici   3.79407218081762 0.07086171427580 −0.00393661412823 0.00516622055919  0.07086171427580 6.40219536739289 −0.08436498867668 −0.06428537120075 . B= −0.00393661412823 −0.08436498867668 11.76776520507119  o 0.00516622055919 −0.06428537120075 0 8.03596724671830 Zde uˇz je vidˇet , ˇze nediagonáln´ı prvky konverguj´ı k nule.Po dalˇs´ıch sedmi kroc´ıch uˇz dostaneme diagon´ aln´ı matici   3.2957 0 0 0  0 6.5923 0 0  , B=  0 0 11.7043 0  0 0 0 8.4077 kde diagonáln´ı prvky odpov´ıdaj´ı vlastn´ım ˇc´ısl˚ um zadané matice A. 30

Nyn´ı se budeme zab´ yvat konvergenc´ı vlastn´ıch vektor˚ u klasické Jacobiho metody, kterou dokáˇzeme pomoc´ı následuj´ıc´ı vˇety. Pˇripomeˇ nme, ˇze Ak+1 = STk Ak Sk = QTk AQk kde Qk = S1 . . . Sk . Vˇ eta 6.1.3. Pˇredpokládejme, ˇze vˇsechna vlastn´ı ˇc´ısla matice A jsou vzájemnˇe r˚ uzná. Potom posloupnost matic Qk , k = 1, 2 . . . , konstruovaných klasickou Jacobiho metodou konverguje k ortogonáln´ı matici, jej´ıˇz sloupce tvoˇr´ı ortogonáln´ı mnoˇzinu vlastn´ıch vektor˚ u matice A. D˚ ukaz. Opˇet pouˇzijeme lemma 6.1.1, ovˇeˇr´ıme jeho pˇredpoklady. • {Qk } má pouze koneˇcn´ y poˇcet hromadn´ ych bod˚ u, které jsou nutnˇe ve tvaru [±ps(1) ± ps(2) ± . . . ± ps(n) ],

s ∈ Pn ,

kde p1 , . . . , pn jsou sloupce ortonormáln´ı matice Q, pro n´ıˇz QT AQ = diag(λi ). Necht’ {Qk′ } je podposloupnost posloupnosti {Qk }, Qk′ → Qk . Podle vˇety 6.1.2 existuj´ı s ∈ Pn tak, ˇze (QTk′ Ak′ Qk′ ) = QTk′ Ak′ Qk′ diag(λs(i) ) = lim Ak′ = lim ′ ′ k →∞

k →∞

coˇz bylo dokázáno. Vˇsechna vlastn´ı ˇc´ısla jsou r˚ uzná, tedy existuje pouze koneˇcnˇe mnoho hromadn´ ych bod˚ u. • Pro u ´hly urˇcuj´ıc´ı Sk máme (k)

tg 2αk =

2apq

(k)

(k)

aqq − app

,

|αk | ≤ π/4.

Podle vˇety 6.1.2 odtud plyne, ˇze existuje l tak, ˇze pro k ≥ l je (k) |a(k) qq − app | ≥

1 min |λi − λj | > 0. 2 i6=j

(k)

Protoˇze se dvojice (p,q) mˇen´ı s k, nem˚ uˇzeme dokázat, ˇze posloupnosti aqq konverguj´ı. Ale lim a(k) pq = 0,

(k)

a app

k→∞

tedy lim αk = 0 a

k→∞

lim Sk = I

k→∞

Qk+1 − Qk = Qk (Sk − I) → 0.

A koneˇcnˇe posloupnost {Qk } je ohraniˇcená, protoˇze ||Qk || = 1. Pozn´ amka 6.1.3. Pˇri v´ ypoˇctu m˚ uˇzeme pr˚ ubˇeˇznˇe kontrolovat v´ ysledky t´ım, ˇze po kaˇzdém kroku zjiˇst’ujeme, zda (k) a(k+1) + a(k+1) = a(k) pp qq pp + aqq . Nebo vypoˇc´ıtáme matici SDST , která by se mˇela rovnat matici A. 31

Pozn´ amka 6.1.4. Pˇresnost Jacobiho metody závis´ı na tom, jak pˇresnˇe se vypoˇc´ıtaj´ı odmocniny pro urˇcen´ı sin αk a cos αk . Pozn´ amka 6.1.5. Aˇckoliv se Jacobiho metoda pouˇz´ıvá pˇreváˇznˇe pro symetrické matice, pracuje ˇcasto dobˇre i v pˇr´ıpadˇe nesymetrick´ ych matic. V tomto pˇr´ıpadˇe ovˇsem konverguje k troj´ uheln´ıkové matici a má-li v´ ychoz´ı matice komplexn´ı vlastn´ı ˇc´ısla, je nutné pouˇz´ıt m´ısto matic Sk vhodné unitárn´ı matice.

6.2

Householderova matice zrcadlen´ı

Definice 6.2.1. Matice tvaru H(u) : = I −

2uuT 2uuT = I − uT u kuk2

se naz´ yvá Householderova matice (nˇekdy téˇz elementárn´ı zrcadlen´ı nebo Householderova transformace). Vlastnosti: • oznaˇcen´ı matice zrcadlen´ı se pouˇz´ıvá proto, ˇze aplikujeme-li matici H(u) pro nˇejaké u na vektor x ∈ Rn , pak je vektor H(u)x soumˇern´ y s vektorem x podle nadroviny ortogonáln´ı k vektoru v.

Obrázek 6.1: Householderova transformace • matice I je speciáln´ı pˇr´ıpad Householderovy transformace. Pro u = o je H(o) = I. • kHxk2 = kxk2 pro kaˇzdé x ∈ Rn , tj. zrcadlen´ı tedy nemˇen´ı délku vektoru. • Hy = y pro kaˇzdé y ∈ P = {v ∈ Rn | vT u = 0}. 32

• H má jednoduchou vlastn´ı hodnotu -1 a (n − 1)-násobnou vlastn´ı hodnotu 1. D˚ ukaz. Protoˇze y ∈ P = {v ∈ Rn | vT u = 0} má n − 1 lineárnˇe nezávisl´ ych vektor˚ u y1 , . . . , yn−1 a Hyi = yi pro i = 1, 2, . . . , n − 1, pak 1 je (n − 1)-násobná vlastn´ı hodnota a H také zrcadl´ı u na -u, tj. Hu = −u. Takˇze -1 je vlastn´ı hodnota matice H, která mus´ı b´ yt jednoduchá, nebot’ H má pouze n vlastn´ıch hodnot. • z vˇety o spektráln´ım rozkladu plyne det(H) = (−1)1 · · · 1 = −1, • Matice H je ortogonáln´ı a symetrická. D˚ ukaz. Symetrie plyne z uuT T 2uuT = H(u). =I− HT (u) = IT − 2 T u u kuk Dále plat´ı 2

H (u) =

2uuT I− T u u

2uuT I− T u u

= I2 − 4

uuT uuT uuT + 4 = I, kuk2 kuk4

a proto je matice H(u) ortogonáln´ı. Vˇ eta 6.2.1. Pro kaˇzdé dva vektory y, z ∈ Rn takové, ˇze y 6= z a kyk2 = kzk2 , plat´ı y = H(y - z)z. Jinými slovy, kaˇzdé dva r˚ uzné vektory o stejné normˇe lze pˇrevést jeden na druhý Householderovou transformac´ı. D˚ ukaz. Plat´ı

2(y − z)(y − z)T yT z − kzk22 H(y − z)z = I − z = z − 2 (y − z) = ky − zk22 ky − zk22 kyk22 + kzk22 − 2yT z ky − zk22 =z+ (y − z) = z + (y − z) = y. ky − zk22 ky − zk22 D˚ usledek 6.2.1. Jsou-li y, z dva vektory o stejné normˇe, potom existuje ortogonáln´ı matice Q takov´ a, ˇze y = Qz. D˚ ukaz. Pro y 6= z staˇc´ı vz´ıt Q = H(y − z), jinak Q = I.

33

Vˇ eta 6.2.2. Pro kaˇzdé x ∈ Rn je ( H(x + sgn(x1 )kxk2 e1 ), pro x1 = 6 kxk2 , H= I, pro x1 = kxk2 , ortogonáln´ı matice s vlastnost´ı Hx = kxk2 e1 .

Nebo-li, aplikujeme-li vhodnou matici H na vektor x, dostaneme vektor, který má vˇsechny sloˇzky aˇz na prvn´ı nulové. D˚ ukaz. Je-li x1 = kxk2 , potom z x21 = x21 + · · · + x2n plyne, ˇze x2 = · · · = xn = 0. Tedy x = x1 e1 = kxk2 e1 = Ix = Hx. Je-li x1 6= kxk2 , potom x + sgn(x1 )kxk2 e1 6= 0, takˇze vektory y = sgn(x1 )kxk2 e1 a z = x jsou r˚ uzné a plat´ı pro nˇe kyk2 = kxk2 = kzk2 , a odtud je y = sgn(x1 )kxk2 e1 = H(y − z)z = H(−x − sgn(x1 )kxk2 e1 )x.

Pozn´ amka 6.2.1. Pro vektor urˇcuj´ıc´ı Householderovu matici lze volit bud’ +kxk2 e1 nebo −kxk2 e1 . Z d˚ uvodu minimalizace numerick´ ych chyb vol´ıme stejné znaménko jako u prvn´ı sloˇzky vektoru x. Vˇ eta 6.2.3. Pro kaˇzdé x takové, ˇze kxk2 = 1, je ( H(x + sgn(x1 )w1 ), H= I,

pro x 6= e1 , pro x = e1 .

ortogonáln´ı matice, jej´ımˇz prvn´ım sloupcem je vektor x. D˚ ukaz. Pro x = e1 je zˇrejm´ y. Necht’ tedy x 6= e1 . Protoˇze kxk2 = 1 = ke1 k2 , je podle Vˇety 6.2.2 x = H(x + sgn(x1 )e1 ) = He1 = H•1 ,

coˇz je tvrzen´ım vˇety. D´ıky tˇemto vˇetám tedy um´ıme naj´ıt vektor u tak, ˇze dan´ y nenulov´ y vektor x se transformuje na vektor, kter´ y má nenulovou pouze prvn´ı sloˇzku. Pˇ r´ıklad 6.2.1. Lze

H(u)

x = (−1, −2, 7)T −−−→ (α, 0, 0)T ? √ √ √ Protoˇze kxk2 = 3 6, poloˇz´ıme u = x − kxk2 e1 = (−1 − 3 6, −2, 7)T a kuk2 = 6(18 + 6 ). D´ ale √  √ √ √    55 + 6√ 6 2 + 6 6 −7 − 21 6 −1 − 3 6 √  (−1 − 3 6, −2, 7) =  2 + 6 6 , uuT =  −2 4 −14 √ 7 −7 − 21 6 −14 49 takˇze

√ √  √ −1 − 3√6 −2 − 6√ 6 7 + 21 6 1 √  −2 − 6 √6 50 + 3 6 H(u) = 14√  . 3(18 + 6 ) 14 5+3 6 7 + 21 6

Snadno lze ovˇeˇrit, ˇze



√ H(u)x = (3 6, 0, 0)T . 34

6.3

Givensova-Householderova metoda

Jedná se o metodu speciálnˇe vhodnou k hledán´ı nˇekter´ ych vlastn´ıch ˇc´ısel symetrick´ ych matic, napˇr. vˇsech vlastn´ıch ˇc´ısel obsaˇzen´ ych v pˇredem zadaném intervalu. Umoˇzn ˇuje poˇc´ıtat vlastn´ı ˇc´ısla s r˚ uznou pˇresnost´ı. Na druhé stanˇe nám neposkytuje informace o vlastn´ıch vektorech. Má dvˇe etapy: • Householderova metoda pro redukci symetrické matice na tˇr´ıdiagonáln´ı tvar. • Givensova metoda (metoda bisekce) pro v´ ypoˇcet vlastn´ıch ˇc´ısel symetrické tˇr´ıdiagonáln´ı matice.

6.3.1

Householderova metoda

Necht’ A je symetrická matice, postupnˇe se urˇcuje n − 2 ortogonáln´ıch matic H1 , . . . , Hn−2 , tak, aby matice Ak = HTk−1 · Ak−1 · Hk−1 = (H1 . . . Hk−1 )T · A · (H1 . . . Hk−1 ),

k = 1, . . . , n − 2

byly ve tvaru

Tud´ıˇz matice

 • • • • •   • • •   • •   • Ak =       ak →  



• • |• |• |• |• |•

• • • • • •

• • • • • •

aTk • • • • • •

• • • • • •

      •  •  •  •  • •

An−1 = (H1 . . . Hn−2 )T · A · (H1 . . . Hn−2 ) je tˇr´ıdiagonáln´ı a také podobná matici A. Kaˇzdá transformace Ak → Ak+1 = HTk · Ak · Hk se provád´ı pomoc´ı matice

Ik 0 Hk = fk , 0 H

fk = H(f e k )ak byla nenulová. fk byl zvolen tak, aby pouze prvn´ı sloˇzka H(v kde H vk ), kde v

35

Potom zˇrejmˇe  • • • • •   • • •   • • •   • •  HTk · Ak · Hk =  |•   |•   f T  Hk ak → |•   |• |•



fk aTk H • • • • • • • • • • • • • • • • • •

• • •

• • •

      •  , •   •  •  • •

fk máme dalˇs´ı ˇcást tˇr´ıdiagonáln´ı matice. tj.po vhodné volbˇe v Matici Hk m˚ uˇzeme popsat také jako Householderovu matici pˇr´ısluˇsnou vektoru fk ]T . vk = [0, . . . , 0, v

Máme dvˇe moˇzné volby vektoru vk : vk =

(k) [0, . . . , 0, ak+1,k

±(

n X

i=k+1

(k)

(k)

(k)

|aik |2 )1/2 , ak+2 , . . . , an,k ]T ,

(k)

(k+1)

znaménko se vol´ı stejné jako je znaménko u ak+1,k . Máme-li urˇcen vektor vk , prvky aij k + 1 ≤ i , j ≤ n matice Ak+1 = Postupnˇe urˇc´ıme vektory

(k+1) [aij ]

urˇc´ıme následovnˇe:

wk = (vTk vk )−1/2 vk , (k)

jejichˇz sloˇzky oznaˇc´ıme wi

(k)

qk = 2(I − wk wTk )Ak wk ,

, qi . Potom matice Ak+1 má tvar Ak+1 = Ak − wk qTk − qk wTk

tj.

(k+1)

aij

(k)

(k) (k)

(k)

(k)

= aij − wi qj − qi wj

k + 1 ≤ i, j ≤ n. Pˇ r´ıklad 6.3.1. Householderovou transfornac´ı pˇreved’te matici   4 2 2 1 2 −3 1 1  A= 2 1 3 1 1 1 1 2 na tˇr´ıdiagonáln´ı tvar.

36

,

ˇ sen´ı 5. Reˇ

T √ v0 = 0 2 + ( 22 + 22 + 12 ) 2 1 ,

T 1 w0 = (vT0 v0 )− 2 v0 = 0 0.912871 0.365148 0.182574 ,

T q0 = 2(I − w0 wT0 )Aw0 = 5.477224 −2.7386095 5.03904626 3.61496813 ,   4 −3 0 0 −3 2 −2.6 −1.8   A1 = A − w0 qT0 − q0 wT0 =   0 −2.6 −0.68 −1.24 , 0 −1.8 −1.24 0.68 p

−2.62 + (−1.8)2 −1.8 , T w1 = 0 0 −0.954514 −0.298168 , T q1 = 0 6.0365793 −0.3770516 1.207794 ,   4 −3 0 0 −3 2 3.162278 0  . A2 = A1 − w1 qT1 − q1 wT1 =   0 3.162278 −1.4 −0.2 0 0 −0.2 1.4 v1 = 0 0 −2.6 −

6.3.2

Givensova metoda

Metoda slouˇz´ı k urˇcen´ı vlastn´ıch ˇc´ısel  b1 c1   B=  

symetrické tˇr´ıdiagonáln´ı matice  c1  b2 c2   ... ... ... .  cn−2 bn−1 cn−1  cn−1 bn

Pokud je nˇekteré z ˇc´ısel ci nula, rozpadá se matice B na dvˇe tˇr´ıdiagonáln´ı matice stejného typu. Tedy bez u ´jmy na obecnosti m˚ uˇzeme pˇredpokládat, ˇze ci 6= 0 , (i = 1, . . . , n − 1). Oznaˇcme   b1 c 1  c 1 b2 c 2      ... ... ... Bi =  ,    ci−1 bi−1 ci−1  ci−2 bi i = 1, . . . , n

Vˇ eta 6.3.1. Polynomy pi (λ), λ ∈ R, definované pro i = 1, . . . , n rekurentnˇe p0 (λ) = 1 p1 (λ) = b1 − λ

pi (λ) = (bi − λ)pi−1 (λ) − c2i−1 pi−2 (λ),

maj´ı n´ asleduj´ıc´ı vlastnosti:

37

2≤i≤n

1. Polynom pi je charakteristický polynom matice Bi (pi (λ) = det(Bi − λI)). 2. lim pi (λ) = +∞,

λ→∞

i = 1, . . . , n

3. Jestliˇze pi (λ0 ) = 0, potom pi−1 (λ0 )pi+1 (λ0 ) < 0, i = 1, . . . , n − 1 4. Polynom pi má vzájemnˇe i r˚ uzných koˇren˚ u, které oddˇeluj´ı i + 1 koˇren˚ u polynomu pi+1 , i = 1, . . . , n. D˚ ukaz.

1. Plyne z rozvoje det(Bi − λI)

2. pi (λ) = (−1)i λi − . . . → ∞ pro λ → ∞ 3. Necht’ pi (λ0 ) = 0 pro nˇejaké i, i = 1, . . . , n − 1, z definice pi plyne pi+1 (λ0 ) = −c2i · pi−1 (λ0 ). Protoˇze ci 6= 0, dostaneme bud’ pi−1 (λ0 ) · pi+1 (λ0 ) < 0 nebo pi−1 (λ0 ) = pi− (λ0 ) = pi+1 (λ0 ) coˇz by indukc´ı vedlo k tomu, ˇze pi (λ0 ) = pi−1 (λ0 ) = . . . = p1 (λ0 ) = p0 (λ0 ), coˇz je spor, protoˇze p0 (λ0 ) = 1. 4. Plyne z 2 a 3. Pozn´ amka 6.3.1. Posloupnost polynom˚ u splˇ nuj´ıc´ı 2-4 se naz´ yvá Sturmova posloupnost (pouˇz´ıvá se pˇri v´ ypoˇctu koˇrenu polynom˚ u). Pˇ r´ıklad 6.3.2. Pomoc´ı charakteristického polynomu urˇcete vlastn´ı ˇc´ısla tˇr´ıdiagonáln´ı matice A2 z pˇr´ıkladu 6.3.1.   4 −3 0 0 −3 2 3.162278 0   A2 =   0 3.162278 −1.4 −0.2 0 0 −0.2 1.4

38

ˇ sen´ı 6. Reˇ p0 (λ) = 1 p1 (λ) = 4 − λ p2 (λ) = (−2 − λ)(4 − λ) − 9 p3 (λ) = (−1.4 − λ)[(−2 − λ)(4 − λ) − 9] − 10(4 − λ) p4 (λ) = (1.4 − λ)[(−1.4 − λ)[(−2 − λ)(4 − λ) − 9] − 10(4 − λ)] − 0.04[(−2 − λ)(4 − λ) − 9] = λ4 − 2λ3 − 29λ2 + 58λ − 22

Koˇreny polynomu p4 (λ) jsou λ1 = −5.4355 λ2 = 5.4907

λ3 = 1.4289 λ4 = 0.5159

Vˇ eta 6.3.2. Bud’ i pˇrirozené ˇc´ıslo, 1 ≤ i ≤ n. Pro dané µ ∈ R poloˇzme ( sgnpi (µ) je-li pi (µ) 6= 0, sgnpi (µ) = sgnpi−1 (µ) je-li pi (µ) = 0. Potom N (i, µ), coˇz je poˇcet znaménkových zmˇen v posloupnosti po sobˇe jdouc´ıch prvk˚ u uspoˇrádané mnoˇziny N (i, µ) = {+, sgnp1 (µ), . . . , sgnpi (µ)} se rovná poˇctu koˇren˚ u polynomu pi , které jsou menˇs´ı neˇz µ. Tato vˇeta umoˇzn ˇuje aproximaci (s libovolnou pˇresnost´ı) vlastn´ıch ˇc´ısel matice B = Bn a dokonce pˇr´ım´ y v´ ypoˇcet vlastn´ıho ˇc´ısla na dané pozici. (n) Pˇredpokládejme napˇr´ıklad, ˇze chceme aproximaci i-tého vlastn´ıho ˇc´ısla λi = λi matice B ( jako pˇredt´ım pˇredpokládáme, ˇze λ1 , . . . , λn jsou vzájemnˇe r˚ uzná a uspoˇrádaná sestupnˇe). Krok 1: Urˇc´ıme interval ha0 , b0 i, v nˇemˇz leˇz´ı ˇzádané vlastn´ı ˇc´ıslo, napˇr. −a0 = b0 = ||B||∞ . Krok 2: c0 = Potom bud’

a0 + b 0 , spoˇcteme N (n, c0 ). 2 N (n, c0 ) ≥ i a λi ∈< a0 , c0 )

nebo N (n, c0 ) < i a λi ∈< c0 , b0 > t´ım z´ıskáme interval < a1 , b1 >, v nˇemˇz leˇz´ı koˇren λi . Postupnˇe z´ıskáme posloupnost interval˚ u < ak , bk >, k ≥ 0 takov´ ych, ˇze λi ∈< ak , bk > a bk − ak = 2−k (b0 − a0 ), k ≥ 0.

39

6.4

QR-rozklad

Definice 6.4.1. Dvojici matic Q a R nazveme QR-rozkladem matice A, pokud plat´ı, ˇze A = QR, pˇriˇcemˇz Q je ortogonáln´ı matice a R je horn´ı troj´ uheln´ıková matice. Nyn´ı uvedeme vˇety o existenci QR-rozkladu a jeho jednoznaˇcnosti. Vˇ eta 6.4.1. K libovolné reálné matici A ∈ Rm×n , kde m ≥ n, existuje ortogonáln´ı matice Q ∈ Rm×m a horn´ı troj´ uheln´ıková matice R ∈ Rm×n tak, ˇze plat´ı A = QR. Vˇ eta 6.4.2. Jsou-li sloupce matice A ∈ Rm×n , m ≥ n, line´ arnˇe nez´ avislé, potom v QRrozkladu jsou matice R a prvn´ıch n sloupc˚ u matice Q urˇceny aˇz na znaménko jednoznaˇcnˇe. D˚ ukazy obou vˇet viz [2]

6.5 6.5.1

Konstrukce QR-rozkladu QR-rozklad pomoc´ı Gram-Schmidtova algoritmu

Vˇ eta 6.5.1 (Gram-Schmidt˚ uv QR-rozklad). K libovolné reálné matici A ∈ Rm×n , kde m ≥ n, existuje ortogonáln´ı matice Q ∈ Rm×m a horn´ı troj´ uheln´ıková matice R ∈ Rm×n s nez´ apornými prvky na diagon´ ale tak, ˇze plat´ı A = QR. V pˇr´ıpadˇe line´ arnˇe nezávislých sloupc˚ u matice A jsou prvky na diagon´ ale kladné. Základn´ı myˇslenka d˚ ukazu: Máme-li matici A ∈ Rm×n , pak aplikac´ı zobecnˇeného GramSchmidtova ortogonalizaˇcn´ıho procesu na sloupce matice A (ty mohou b´ yt lineárnˇe závislé m i nezávislé) a doplnˇen´ım tˇechto vektor˚ u na bázi v R z´ıskáme sloupce matice Q. Uvaˇzujme matici A = (a1 | . . . |an ) sloˇzenou ze sloupcov´ ych vektor˚ u. Pak u1 = a1 ,

e1 =

u2 = a2 − pe1 a2 ,

u1 , ku1 k

e2 =

u3 = a3 − pe1 a3 − pe2 a3 ,

u2 , ku2 k

e3 =

.. . uk = ak −

k−1 X

p ej a k ,

j=1

40

ek =

u3 , ku3 k

uk , kuk k

kde pu v =

u.

Po u ´pravˇe obdrˇz´ıme vzorce pro vektory ai a1 = e1 ku1 k, a2 = pe1 a2 + e2 ku2 k, a3 = pe1 a3 + pe2 a3 + e3 ku3 k, .. . ak =

k−1 X j=1

pej ak + ek kuk k.

Oznaˇcme Q = (e1 | . . . |en ). Nyn´ı máme   < e1 , a1 > < e1 , a2 > < e1 , a3 > · · · < e1 , an >  0 < e2 , a2 > < e2 , a3 > · · · < e2 , an >     0 0 < e3 , a3 > · · · < e3 , an >  R = QT A =  ,   .. .. .. . . .. ..   . . . 0 0 0 . . . < en , an > nebot’ QQT = I a < ej , aj >= kuj k, < ej , ak >= 0 pro j  12  6 Pˇ r´ıklad 6.5.1. Proved’me QR-rozklad matice A = −4

> k.

 −51 4 167 −68. 24 −41

ˇ sen´ı 7. Gram-Schmidtovým procesem dostaneme Reˇ   12 −69 −58 6 . U = (u1 | u2 | u3 ) =  6 158 −4 30 −165

Matici Q potom z´ıskáme jako Q=

  6/7 −69/175 −58/175 u1 u2 u3 6/175  . =  3/7 158/175 ku1 k ku2 k ku3 k −2/7 6/35 −33/35

A = QQT A = QR, takˇze

  14 21 −14 R = QT A =  0 175 −70 . 0 0 35 Algoritmus Mˇejme matici A. Poloˇzme r11 = ka1 k,

41

q1 =

a1 , r11

pro k = 2, . . . , n spoˇc´ıtejme: rjk = < qj , ak > zk = ak − 2 rkn

k−1 X

pro j = 1, . . . , k − 1,

rjk qj ,

j=1

= < zk , zn > zk qk = . rkk

Metodu lze také upravit tak, ˇze zamˇen´ıme poˇrad´ı operac´ı. Tedy poloˇzme A0 ≡ A. Pak pro k = 2, . . . , n, spoˇctˇeme rkk

(k−1)

, = ak 2 (k−1)

rki = qTk ai

(k−1)

a , qk = k rkk pro i = k + 1, . . . , n,

A(k) = A(k−1) − qk rkT . Z formáln´ıho hlediska jde o zmˇenu poˇrad´ı operac´ı, ovˇsem z numerického hlediska obdrˇz´ıme kvalitativnˇe r˚ uzné v´ ysledky.

6.5.2

QR-rozklad pomoc´ı Householderovy matice

Vˇ eta 6.5.2 (Householder˚ uv QR-rozklad). m×n Kaˇzdou matici A ∈ R lze pomoc´ı s = min{n, m − 1} Householderových matic rozloˇzit na souˇcin QR, a to tak, ˇze plat´ı  R1  m > n,  0 T Hs · · · H2 H1 A = Q A = (R1 , 0) m < n,   R m = n. D˚ ukaz. Konstrukce QR-rozkladu Mˇejme reálnou matici A



a11  a21  A =  ..  .

··· ··· ...

 a1n a2n   ..  . . 

am1 · · · amn

Krok 1.: Zkonstruujme Householderovu matici H1 tak, aby H1 A mˇela v prvn´ım sloupci pouze samé 0 s v´ yjimkou pozice (1, 1), tj. aby   ⊞ ···  0 · · ·   H1 A =  .. ..  . . .  0 ··· 42

K tomu staˇc´ı z´ıskat vektor un (dle pˇredchoz´ıho) tak, ˇze pro un uTn H1 = I − 2 T un un plat´ı



   a11 ⊞  a21   0      H1  ..  =  ..  .  .  . am1

Oznaˇcme A(1) : = H1 A. A(1) je tvaru

A(1)

0

  a11 · · ·  0 · · ·   =  .. ..  .  . .  0 ···

Krok 2.: Zkonstruujme Householderovu matici H2 tak, ˇze H2 A(1) má ve druhém sloupci 0 pod pozic´ı (2, 2) pˇri zachován´ı poˇzadavku prvn´ıho kroku, tj.   ⊞ ···  0 ⊞ · · ·     A(2) : = H2 A(1) =  0 0 .  .. .. ..  . . .  0 0 ···

Matici H2 z´ıskáme tak, ˇze nejdˇr´ıve zkonstruujeme Householderovu matici o rozmˇeru (m − 1) × (n − 1) T b 2 : = In−1 − 2 un−1 un−1 H uTn−1 un−1 takovou, ˇze     ⊞ a22  a32   0     b2 H  ..  =  ..  ,  .  . 0 am2 a definujme

  1 0 ··· 0 0    H2 : =  .. . b .  H2 0

T´ım z´ıskáme matici A(2) = H2 A(1) . Analogicky pokraˇcujeme dále.

Pro k ≤ s. Krok k-tý: Obecnˇe vytváˇr´ıme Householderovu matici T

b k : = In−k+1 − 2 un−k+1 un−k+1 H uTn−k+1 un−k+1 43

o rozmˇeru (m − k + 1) × (n − k + 1) takovou, ˇze

  ⊞ akk 0 .    bk  H  ..  =  ..  . . amk 0 

Definujeme



Ik−1 0 Hk : = bk , 0 H

ˇcili m˚ uˇzeme spoˇc´ıtat A(k) = Hk A(k−1) .

T´ımto zp˚ usobem po s kroc´ıch obdrˇz´ıme matici A(s) , která bude v horn´ım troj´ uheln´ıkovém tvaru a bude právˇe matic´ı R. Protoˇze A(k) = Hk A(k−1) k = 2, . . . , s, máme Poloˇzme

R = A(s) = Hs A(s−1) = Hs Hs−1 A(s−2) = · · · = Hs Hs−1 · · · H2 H1 A. QT = Hs Hs−1 · · · H2 H1 .

Máme hledanou ortogonáln´ı matici (nebot’ kaˇzdá z Hi je ortogonáln´ı). Celkem R = QT A, tj. A = QR. (Zopakujme si, ˇze Q = HT1 HT2 · · · HTs = H1 H2 · · · Hs .) Pˇ r´ıklad 6.5.2. Uvaˇzme matici

ˇ sen´ı 8. Krok 1.: Konstrukce H1 . Reˇ

  0 1 1 A = 1 2 3 . 1 1 1     ⊞ 0    H1 1 = 0  . 0 1

Potom tedy dle Pˇr´ıkladu 6.2.1 spoˇcteme   √    1 0 2 √      u3 = 1 + 2 0 = 1 , 0 1 1 takˇze

   1 1 0 0 u3 uT3  H1 = I3 − 2 T = 0 1 0 −  √12 u3 u3 √1 0 0 1 2 44

√1 2 1 2 1 2



√1 2 1  2  1 2



 0 − √12 − √12  1 − 12  = − √12 . 2 1 1 1 − √2 − 2 2

Urˇceme A(1) Krok 2.: Zkonstruujeme

 √ √ √  − 2 − 3 2√2 2 √2   = H1 A =  0 − 1−2√2 − 2−2√2  . 0 − 1+2 2 − 2+2 2

−0, 2071 ⊞ = , −1, 2071 0 −1, 4318 1 −0, 2071 , = − 1, 2247 u2 = −1, 2071 0 −1, 2071 −0, 1691 −0, 9856 b2 = , H −0, 9856 0, 1691 b2 = H

tzn.

 1 0 0 H2 = 0 −0, 1691 −0, 9856 , 0 −0, 9856 0, 1691 

a spoˇc´ıt´ ame A(2) = H2 A(1) Pro Q nyn´ı plat´ı

Celkem tedy



 −1, 4142 −2, 1213 −2, 8284 0 1, 2247 1, 6330 = R = H2 H1 A =  0 0 −0, 5774 

 0 0, 8165 0, 5774 0, 4082 −0, 5774 . Q = H2 H1 = −0, 7071 −0, 7071 −0, 4082 0, 5774

  0 1 1 A = 1 2 3 = 1 1 1    0 0, 8165 0, 5774 −1, 4142 −2, 1213 −2, 8284 −0, 7071 0, 4082 −0, 5774  0 1, 2247 1, 6330 = QR. −0, 7071 −0, 4082 0, 5774 0 0 −0, 5774

45

6.5.3

QR-rozklad pomoc´ı Givensovy matice

Definice 6.5.1. Matice tvaru  1 ··· 0 .  .. . . . .. .  0 · · · c . .. G(i, j, c, s) : =  .  .. 0 · · · −s  . ..  .. . 2

2

0 ···

0

··· ··· ... ··· ···

 0 ··· 0 .. ..  . .  s · · · 0 .. ..  i iT j jT i iT j jT . .  = I+(c−1)(e e +e e )+s(e e −e e ), c · · · 0  .. . . ..  . . . 0 ··· 1

kde c + s = 1, se naz´ yvá Givensova matice, která nám mezi jin´ ymi popisuje Givensovu transformaci.

Obrázek 6.2: Geometrick´ y v´ yznam Givensovy rotace Givensovu matici znaˇc´ıme G(i, j, α). Opˇet chceme setrojit matice Q1 , Q2 , . . ., Qs tentokrát vˇsak pomoc´ı Givensov´ ych matic tak, aby A(1) = Q1 A mˇela nuly pod prvkem (1, 1) v prvn´ım sloupci, matice A(2) = Q2 A(1) mˇela nuly pod prvkem (2, 2) ve druhém sloupci, atd. Kaˇzdou z matic Qi lze sestrojit jako souˇcin Givensov´ ych matic – ten je moˇzné sestrojit takto: Q1 : = G(1, m, α)G(1, m − 1, α) · · · G(1, 3, α)G(1, 2, α) Q2 : = G(2, m, α)G(2, m − 1, α) · · · G(2, 3, α) .. . Bud’ s = min{m − 1, n}. Pak R = A(s) = Qs A(s−1) = · · · = Qs Qs−1 · · · Q2 Q1 A = QT A. Nyn´ı máme A = QR, kde QT = Qs · · · Q2 Q1 . To lze zformulovat do následuj´ıc´ı vˇety. 46

Vˇ eta 6.5.3 (Givens˚ uv QR-rozklad). Bud’ A matice m × n a necht’ s = min{m − 1, n}. Existuje s ortogonáln´ıch matic Q1 , . . ., Qs definovaných jako Qi : = G(i, m, α)G(i, m − 1, α) · · · G(i, i + 1, α). Pro Q = QT1 QT2 · · · QTs

plat´ı

A = QR, kde R je matice m × n s nulami pod hlavn´ı diagon´ alou.

Znázornˇeme si schématicky Givensovu metodu redukce matice A ∈ R3×3 na horn´ı troj´ uheln´ıkov´ y tvar (symbol • znaˇc´ı prvky, které se transformac´ı nezmˇenily, a ± znaˇc´ı prvky, které se zmˇenily):     • • • ± ± ± G(1, 3, α) G(1, 2, α) A = • • • −−−−−→  0 ± ± −−−−−→ • • • • • •     ± ± ± • • • G(1, 3, α) G(2, 3, α) −−−−−→  0 • •  −−−−−→ 0 ± ± = R. 0 ± ± 0 0 ±

Pˇ r´ıklad 6.5.3. Necht’

  0 1 1 A = 1 2 3 . 1 1 1

ˇ sen´ı 9. Krok 1.: Najdˇeme c a s tak, aby Reˇ ⊞ a11 c s . = 0 a21 −s c Nebot’ a11 = 0 a a21 = 1, mus´ı být c = 0 a s = 1, tedy   0 1 0 G(1, 2, α) = −1 0 0 . 0 0 1

Pak dostaneme

    1 2 3 0 1 0 0 1 1 e = G(1, 2, α)A = −1 0 0 1 2 3 = 0 −1 −1 . A 1 1 1 0 0 1 1 1 1 

Nyn´ı najdˇeme c a s tak, aby

Nebot’ e a11 = 1 a e a31 = 1, bude c =

c s −s c √1 2

e a11 ⊞ . = e a31 0

as=

√1 , 2



tedy

√1 2

G(1, 3, α) =  0 − √12 47

0 1 0

 √1 2

0 .

√1 2

Celkem 

√1 2

 √ √3 2 2 3 2  −1 0  0 −1 −1 =  0 √1 1 1 1 0 − √12 2  √1 1 2

0 1 0

e = 0 A(1) = G(1, 3, α)A − √12 Krok 2.: Urˇceme c a s tak, aby

c s −s c

(1) a22 (1) a32

!

√  2 2  −1 √ . − 2

⊞ = . 0

q (1) (1) Nebot’ a22 = −1 a a32 = − √12 , bude c = − 23 a s = − √13 , tedy G(1, 3, Θ)A(1)

6.5.4

 √  1 0 0 √3 q 2 2   1 2  0 − 3 − √3   0 −1 =  q  1 0 − √12 √ 0 − 3 − 23

√  √  √ 2 √32 2 2 2 2 q q   3 2  = R. −1 = 2 0    2 3 √ − 2 √1 0 0 3

Srovn´ an´ı algoritm˚ u

Pˇri v´ ypoˇctu QR-rozkladu pomoc´ı Householderovy matice je poˇcet proveden´ ych operac´ı roven ˇc´ıslu n n2 (3 − ). 3 K explicitn´ımu vyjádˇren´ı matice Q je nav´ıc potˇreba 1 2(m2 n − mn2 + n3 ) 3 operac´ı, tedy celkem

1 2m2 n − mn2 + n3 . 3 Zat´ımco pro QR-rozklad pomoc´ı Givensovy matice je tento poˇcet dvojnásobn´ y, tj. 2n2 (3 −

n ). 3

c s −s c

Ovˇsem pokud v metodˇe s Givensovou matic´ı nahrad´ıme matici rotace a matice c s 1 a a 1 odrazu maticemi a s ortogonáln´ımi sloupci, pak se nám podaˇr´ı s −c −a 1 1 −a sn´ıˇzit poˇcet operac´ı na u ´roveˇ n metody vyuˇz´ıvaj´ıc´ı Householderovy matice – jedná se o tzv. matice rychl´ e Givensovy transformace. Householderova matice má vˇsak tu nev´ yhodu, ˇze v matici, kterou ji násob´ıme, nám zmˇen´ı vˇsechny prvky (zat´ımco Givensova matice jen i-t´ y a k-t´ y ˇrádek), takˇze nám napˇr´ıklad m˚ uˇze z ˇr´ıdké matice vytvoˇrit matici plnou. V modifikované metodˇe s Gram-Schmidtov´ ym algoritmem je poˇcet operac´ı mn2 .

48

6.5.5

QR-rozklad a vlastn´ı ˇ c´ısla matice A – QR-algoritmus

Základn´ı QR-algoritmus: Mˇejme matici A. Sestrojme jej´ı QR-rozklad, tj. A = A0 = Q0 R0 , urˇc´ıme A1 : = R0 Q0 . Nyn´ı sestrojme QR-rozklad matice A1 , tj. A1 = Q1 R1 , a spoˇctˇeme A2 = R1 Q1 . Takto pokraˇcujme analogicky dále. Jistˇe plat´ı Ak+1 = Rk Qk = QTk Ak Qk = QTk Rk−1 Qk−1 Qk = = QTk QTk−1 Ak−1 Qk−1 Qk = · · · = (Q0 Q1 · · · Qk )T A(Q0 Q1 · · · Qk ). Tedy matice A0 , A1 , . . . jsou kongruentn´ı (tj. A ≡ B ⇐⇒ A = PT BP). Nav´ıc d´ıky ortogonálnosti matic Q0 , Q1 , . . . jsou matice A0 , A1 , . . . také podobné (tj. A ∼ B (téˇz A ≈ B) ⇐⇒ A = P−1 BP). Tyto matice maj´ı d´ıky podobnosti stejná vlastn´ı ˇc´ısla jako matice A. Posloupnost tˇechto matic konverguje za urˇcit´ ych pˇredpoklad˚ u k horn´ı troj´ uheln´ıkové (resp. horn´ı blokovˇe troj´ uheln´ıkové) matici, která má vlastn´ı ˇc´ısla na diagonále (resp. diagonáln´ı bloky maj´ı vlastn´ı ˇc´ısla se stejnou absolutn´ı hodnotou) seˇrazena podle velikosti poˇc´ınaje nejvˇetˇs´ım vlastn´ım ˇc´ıslem. Poddiagonáln´ı prvky (resp. poddiagonáln´ı bloky) konverguj´ı k nule. Ovˇsem d˚ ukazy konvergence existuj´ı jen pro nˇekteré speciáln´ı typy matic. Napˇr´ıklad má-li matice A kladná vlastn´ı ˇc´ısla, pak Qk konverguje k jednotkové matici a posloupnost matic Ak k horn´ı tro´ uheln´ıkové matici, pˇriˇcemˇz diagonáln´ı prvky této matice jsou vlastn´ı ˇc´ısla matice A. Pˇ r´ıklad 6.5.4. Urˇceme vlastn´ı ˇc´ısla matice  2 A = 3 0

1 3 5 −3 11 9

 1 1 . 5 3

Lze snadno ovˇeˇrit, ˇze vlastn´ı ˇc´ısla matice A jsou λ1 = 1, λ2 = −2 a λ3 = 3. Výsledky z´ıskané QR-algoritmem: (k)

(k)

(k)

k

a11

a22

a33

1

2,0

-1,6666667

1,6666667

5

3,1781374

-2,2260322

1,0478949

10 2,9486278

-1,9471270

0,9984996

15 3,0003596

-2,0064061

1,0000468

20 2,9991547

-1,9991527

0,9999984

25 3,0001104

-2,0001098

0,9999999

49

Ke zrychlen´ı konvergence lze vyuˇz´ıt tzv. posunut´ı a poˇc´ıtat nikoli rozklad matice Ak = Qk Rk , n´ ybrˇz matice e kR e k. Ak − σk I = Q

P˚ uvodn´ı spektrum matice A se t´ımto posune o σk (je v´ yhodné volit jej jako nˇejakou aproximaci vlastn´ıho ˇc´ısla; matice Ak − σk I má vlastn´ı ˇc´ısla λj − σk , jsou-li λj vlastn´ı ˇc´ısla matice Ak ). Zaznamenáváme-li velikosti posunut´ı σk , snadno ze znalosti spektra matice Ak najdeme spektrum matice A. Protoˇze jeˇstˇe (v metodˇe bez posunut´ı) Ak = (Q0 Q1 · · · Qk−1 )T A(Q0 Q1 · · · Qk−1 ), je A = (Q0 Q1 · · · Qk−1 )T Ak (Q0 Q1 · · · Qk−1 ). Vlastn´ı vektory y matice A dostaneme z vlastn´ıch vektor˚ u matice Ak podle vzorce y = Q0 Q1 · · · Qk−1 . e j ) z˚ T´ yˇz vzorec (s maticemi Q ustává v platnosti i pro metodu s posunut´ımi, protoˇze pˇri posunut´ı se vlastn´ı vektory nemˇen´ı. Vol´ı-li se posunut´ı speciálnˇe, dostáváme v nˇekter´ ych d˚ uleˇzit´ ych pˇr´ıpadech i kubickou konvergenci (tzn. zhruba ˇreˇceno, poˇcet platn´ ych m´ıst se v kaˇzdém kroku pˇribliˇznˇe ztrojnásob´ı).

Pozn´ amka 6.5.1. Nejv´ yhodnˇejˇs´ı se jev´ı upravit nejdˇr´ıve matici A do tzv. Hessenbergova tvaru (tj. aij = 0 pro j < i − 1, i, j = 1, . . . , n) pomoc´ı Gaussovy eliminace a pak na tuto upravenou matici pouˇz´ıt QR-rozklad. Konvergence je potom rychlejˇs´ı (obzvláˇstˇe pouˇzijeme-li metodu posunu, kde za σk vol´ıme tzv. Rayleigh˚ uv pod´ıl T

T

ek Hek /ek ek , kde H je právˇe matice A v Hessenbergovˇe tvaru). Nav´ıc plat´ı, ˇze je-li matice A v Hessenbergovˇe tvaru, pak kaˇzdá z matic Hk je také v Hessenbergovˇe tvaru, a to i pˇri metodˇe posunut´ı.

50

Kapitola 7 Podm´ınˇ enost probl´ emu vlastn´ıch ˇ c´ısel D˚ uleˇzitou charakteristikou libovolného problému je jeho podm´ınˇenost, která udává, jak v´ yznamnˇe se zmˇen´ı ˇreˇsen´ı problému, pokud zmˇen´ıme vstupn´ı hodnoty. Podm´ınˇenost problému vlastn´ıch ˇc´ısel m˚ uˇzeme popsat pomoc´ı tzv. globáln´ıho ˇc´ısla podm´ınˇenosti.

7.1

Glob´ aln´ı ˇ c´ıslo podm´ınˇ enosti

Vzhledem k zaokrouhlován´ı ˇreˇs´ıme ve skuteˇcnosti problém (A + E − λI)x = 0 nam´ısto (A − λI)x = 0.

˜ x ˜ , kter´ V d˚ usledku zaokrouhlován´ı pˇri v´ ypoˇctu dostáváme ˇreˇsen´ı problému λ, y je pˇresn´ ym ˇreˇsen´ım problému s poruchou ˜ x = 0, (A − EM − λI)˜ kde EM zahrnuje zaokrouhlovac´ı chyby bˇehem v´ ypoˇctu. Pozn´ amka 7.1.1. Anal´ yza stability vlastn´ıho problému je velmi sloˇzitá a dá se uspokojivˇe provést jen pro jednoduché vlastn´ı ˇc´ıslo a nebo pro matici, která je diagonalizovatelná. Definice 7.1.1. Matice A je diagonalizovatelná, kdyˇz existuje matice X taková, ˇze X−1 AX = D, kde D je diagonáln´ı matice. Vˇ eta 7.1.1 (Bauer, Fike). Pokud je A diagonalizovateln´ a matice s vlastn´ımi ˇc´ısly λ1 , . . ., λn , potom vlastn´ı ˇc´ısla matice A + E leˇz´ı v kruhu Ki = {z; |z − λi | ≤ c(X).kEk}, kde c(X) = kXkkX−1 k je ˇc´ıslo podm´ınˇenosti matice vlastn´ıch vektor˚ u v maticové normˇe k.k. D˚ ukaz. Necht’ (A + E)x = λx. Potom bud’ λ = λi pro nˇejak´ y index i a potom λ ∈ Ki , a nebo λ 6= λi pro i = 1, . . . , n. Potom λI − A je regulárn´ı matice. Matice (λI − A)−1 (λI − A − E) = I − (λI − A)−1 E 51

je singulárn´ı. Proto podle vztahu ρ[(λI − A)−1 E] ≥ 1 plat´ı 1 ≤ k(λI − A)−1 Ek = k(λI − XDX−1 )−1 Ek = kX(λI − D)−1 X−1 Ek ≤ ≤ kXkkX−1 kkEkk(λI − D)−1 k = c(X)kEkk(λI − D)−1 k = = c(X)kEk max[ i

1 ]. |λ − λi |

Pˇritom jsme vyuˇzili skuteˇcnost, ˇze maticová norma diagonáln´ı matice je daná jej´ım maximáln´ım diagonáln´ım prvkem v absolutn´ı hodnotˇe. Odtud min |λ − λi | ≤ c(X)kEk. i

ˇ ıslo c(X) charakterizuje m´ıru odchylky poruˇsen´ Pozn´ amka 7.1.2. C´ ych vlastn´ıch ˇc´ısel v závislosti na velikosti poruchy kEk. D˚ usledek 7.1.1. Problém vlastn´ıch ˇc´ısel norm´ aln´ıch matic je dobˇre podm´ınˇený. D˚ ukaz. Protoˇze normáln´ı matice jsou unitárnˇe podobné diagonáln´ı matici a ve spetkráln´ı normˇe kUk2 = kU∗ k2 = kU−1 k2 = 1, potom c2 (U) = 1.

7.2

Odhad chyby vypoˇ c´ıtan´ eho vlastn´ıho ˇ c´ısla

Pˇresnost vypoˇc´ıtaného vlastn´ıho ˇc´ısla a vlastn´ıho vektoru ovˇeˇrujeme pomoc´ı rezidu´ı. ˜ a k Vˇ eta 7.2.1 (Odhad chyby vypoˇc´ıtaného vlastn´ıho ˇc´ısla). Necht’ urˇcené vlastn´ı ˇc´ıslo λ ˜ dávaj´ı (pˇresný) reziduáln´ı vektor nˇemu pˇr´ısluˇsný vypoˇc´ıtaný vlastn´ı vektor x ˜ x. r = A˜ x − λ˜ ˜ x ˜ jsou pˇresné hodnoty vlastn´ıho ˇc´ısla a vlastn´ıho vektoru matice s poruchou A + E, Potom λ, kde r˜ x E=− kxk22 a plat´ı odhad

˜ ≤ |λ − λ|

kyk2 kxk2 krk2 , |yT x|k˜ xk2

kde y je levý vlastn´ı vektor matice A pˇr´ısluˇsný vlastn´ımu ˇc´ıslu λ.

52

(7.1)

D˚ ukaz.

Kdyˇz

r˜ x k˜ xk22 ˜x ˜ A− r = A˜ x − r = λ˜ x = A˜ x − k˜ xk22 k˜ xk22 2 kyk kxk kEk kEk 2 2 2 2 ˜ ≤ |λ − λ| . +O |yT x| kAk2 kEk2 =

dosad´ıme do nerovnosti, dostáváme

krk2 krk2 k˜ x∗ k2 = k˜ xk2 k˜ xk

2 2 kEk krk kEk krk kyk kxk 2 2 2 2 2 2 ˜ ≤ = c(λ) . +O +O |λ − λ| |yT x| k˜ xk2 kAk2 k˜ xk2 kAk2 Pozn´ amka 7.2.1.

1. Pro symetrické matice c(λ) =

.

kyk2 kxk2 ˜ ≤ krk2 = 1 a |λ − λ| T |y x| k˜ xk2

2. V praxi pˇresné hodnoty x, y neznáme, proto se ve vztahu (7.1) nahrazuj´ı hodnotami ˜, y ˜ , tj. x k˜ yk2 krk2 yk2 k˜ xk2 krk2 ˜ / k˜ = |λ − λ| T xk2 ˜ | k˜ ˜| |˜ y x |˜ yT x

7.3

(7.2)

Relativn´ı chyba vypoˇ c´ıtan´ eho vlastn´ıho ˇ c´ısla

Pro jednoduché vlastn´ı ˇc´ıslo λ 6= 0 m˚ uˇzeme pomoc´ı (7.1) vyjádˇrit relativn´ı chybu takto kBk2 |∆λ| yT Bx 1 kyk2 kxk2 kBk2 ≈ ε T = εc(λ) ≈ ≤ε T |λ| y x λ |y x| |λ| |λ| ≈ εc(λ)

kAk2 kAk2 ρ(A) = εc(λ) . |λ| ρ(A) |λ|

Vid´ıme, ˇze relativn´ı chyba vypoˇc´ıtaného vlastn´ıho ˇc´ısla závis´ı nejen na chybˇe ε a ˇc´ıslu podm´ınˇenosti c(λ), ale i na pod´ılu ρ(A)/|λ| = max1 |λi |/|λ|, (ˇc´ıslo ||A||/ρ(A) je konstanta, která je stejná pro vˇsechny vlastn´ı ˇc´ısla matice A). Menˇs´ı vlastn´ı ˇc´ısla se poˇc´ıtaj´ı s vˇetˇs´ı relativn´ı chybou neˇz vˇetˇs´ı vlastn´ı ˇc´ısla.

53

Z´ avˇ er Numerické metody uvedené v mé práci jsou u vyˇsˇs´ıch ˇrád˚ u matice poˇcetnˇe nároˇcné a proto se v souˇcasné dobˇe u ´lohy tohoto typu ˇreˇs´ı pomoc´ı softwarového vybaven´ı poˇc´ıtaˇc˚ u. Proto maj´ı zvláˇstn´ı d˚ uleˇzitost podm´ınky konvergence jednotliv´ ych metod, které mus´ı provˇeˇrit uˇzivatel pˇredem, protoˇze vˇetˇsina program˚ u tyto proplémy netestuje. Právˇe tak je d˚ uleˇzité provádˇet zpˇetnou kontrolu a ovˇeˇrovat pravdivost z´ıskan´ ych v´ ysledku.

54

Seznam literatury ´ V. N.: Computation Methods of Linear Algebra. [1] FADDEJEV, D. K., FADDEJEVOVA, Moskva : Fizmatgiz, 1963. [2] FIEDLER, M.: Speciáln´ı matice a jejich pouˇzit´ı v numerické matematice. Praha : SNTL, 1981. [3] HIGHAM, NICHOLAS, J.: Accuracy and stability of numerical algoritms. Philadelphia: Society for Industrial and Applied Mathematics. [4] HORN, R. A., JOHNSON, Ch. R.: Matrix Analysis. Cambridge : Cambridge University Press, 1986. (rusk´ y pˇreklad, Moskva : Mir, 1989) ´ I.: Numerické metody. Brno :Masarykova univerzita, 1999. [5] HOROVA, ´ ENCYKLOPEDIE: Aplikovaná matematika A aˇz Z. ˇ Praha :SNTL, 1978. [6] OBOROVE [7] RALSTON, A.: A First Course in Numerical Analysis. N. Y. : Mc Graw-Hill Book Company, 1965 (ˇcesk´ y pˇreklad Praha : Academia, 1973) ˇ [8] SIK, F.: Lineárn´ı algebra zamˇeˇrená na numerickou anal´ yzu. Brno :Masarykova univerzita, 1998. ´ [9] VITASEK, E.: Numerické metody, Praha: SNTL, 1987 [10] WILKINSON, J. H.: The Algebraic Eigenvalue Problem. Oxford : Clarendon Press, 1965. (rusk´ y pˇreklad Moskva : Nauka, 1970) [11] Biswa Nath Datta: Numerical linear algebra and applications. Brooks and Cole Publishing Company, Pacic Grove, California, 1995.

55

Numerické metody pro nalezení

Recommend Documents