P S E U D O I N V E R Z N ´I M A T I C E metoda nejmenˇs´ıch ˇctverc˚ u Ladislav Skula Brno, leden 2015
Obsah ´ 1 Uvod
2
2 Nˇ ekter´ e pojmy a tvrzen´ı z line´ arn´ı algebry.
3
2.1
Hodnost souˇcinu matic . . . . . . . . . . . . . . . . . . . . . . . .
3
2.2
Blokov´e matice . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
2.3
Inverzn´ı matice . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
2.4
Permutaˇcn´ı matice . . . . . . . . . . . . . . . . . . . . . . . . . .
11
3 Inverzn´ı matice zleva a zprava
14
4 Pseudoinverzn´ı matice.
19
5 Moore-Penroseova inverze a syst´ em line´ arn´ıch rovnic.
35
6 V´ aˇ zen´ a inverze a obecn´ a involuce.
41
6.1
Obecn´ a involuce a zobecnˇen´ a inverze . . . . . . . . . . . . . . . .
6.2
V´ aˇzen´ a inverze a norma, ˇreˇsen´ı syst´emu line´arn´ıch rovnic vzhledem k minim´aln´ı v´ aˇzen´e normˇe . . . . . . . . . . . . . . . . . . .
1
43 48
1
´ Uvod
Tento pˇr´ıspˇevek m´a slouˇzit jako doplnˇek k l´ atce z line´arn´ı algebry pˇredn´ aˇsen´e v oboru matematick´eho inˇzen´ yˇrstv´ı na VUT. Motivac´ı je n´asleduj´ıc´ı problematika ˇcasto potˇrebn´ a v mnoha aplikac´ıch matematiky ([An],[BG],[DMP],[Sea],[Si]) : Jestliˇze m´ame nˇejak´ y syst´em line´arn´ıch rovnic (koeficienty jsou re´aln´a ˇc´ısla), kter´ y m´ame ˇreˇsit, pak pro mnoˇzinu R vˇsech ˇreˇsen´ı tohoto syst´emu rovnic plat´ı jedna z n´asleduj´ıc´ıch moˇznost´ı:
(a) mnoˇzina R je jednoprvkov´ a (syst´em rovnic m´a pr´avˇe jedno ˇreˇsen´ı), (b) mnoˇzina R je nekoneˇcn´ a (syst´em rovnic m´a nekoneˇcnˇe mnoho ˇreˇsen´ı), (c) mnoˇzina R je pr´azdn´ a mnoˇzina, t.j. R = ∅ (syst´em rovnic nem´ a ˇz´adn´e ˇreˇsen´ı).
Velmi ˇcasto v aplikac´ıch matematiky je ale potˇreba m´ıt nˇejak´e ”ˇreˇsen´ı”syst´emu line´arn´ıch rovnic. Proto je nutno v pˇr´ıpadˇe (b) z mnoˇziny ˇreˇsen´ı vybrat jedno v jak´emsi smyslu ”v´yznaˇcn´e ˇreˇsen´ı”a to pouˇz´ıvat. V pˇr´ıpadˇe, ˇze syst´em nem´ a ˇreˇsen´ı (pˇr´ıpad (c)), mus´ı se nˇejak´a n- tice re´ aln´ ych ˇc´ısel ( n je poˇcet nezn´am´ ych) urˇcit a br´ at jako ”v´yznamn´e ˇreˇsen´ı”soustavy. Tento v´ ybˇer ˇreˇsen´ı vˇsak nem˚ uˇze b´ yt libovoln´ y, mus´ı nˇejak´ ym zp˚ usob˚ um odpov´ıdat potˇreb´am aplikaˇcn´ı oblasti. V praxi takov´ ych moˇznost´ı se vyskytuje cel´a ˇrada, ale nejv´ yznamnˇejˇs´ı a nejˇcastˇeji poˇz´ıvan´a metoda je tzv. metoda nejmenˇs´ıch ˇctverc˚ u, kter´a je zaloˇzena na pojmu pseudoinverzn´ı matice. Tuto metodu se pokus´ıme v tomto semin´aˇri vysvˇetlit. Budeme pˇredpokl´adat znalosti line´arn´ı algebry v rozsahu pˇredn´ aˇsky v prvn´ım semestru z t´eto oblasti ve studiu matematick´eho inˇzen´ yrstv´ı prezentovan´e ve skriptech [KS]. Tyto znalosti jenom rozˇs´ıˇr´ıme o skuteˇcnost, ˇze uveden´e v´ ysledky plat´ı nejenom pro re´ aln´ a ˇc´ısla, ale t´eˇz pro ˇc´ısla komplexn´ı tvoˇr´ıc´ı tˇeleso C (dokonce pro line´arn´ı algebru nad libovoln´ ym komutativn´ım tˇelesem). Tud´ıˇz prvky matice A budou komplexn´ı ˇc´ısla, transponovanou matici matice A budeme znaˇcit symbolem AT a symbolem A budeme oznaˇcovat matici vzniklou z matice A nahrazen´ım prvk˚ u matice A, coˇz jsou komplexn´ı ˇc´ısla, ˇc´ısly 2
komplexnˇe sdruˇzen´ ymi. V teorii matic s komplexn´ımi ˇc´ısly se zav´ ad´ı tzv. hermitovsk´ y oper´ ator znaˇcen´ y symbolem
∗
definovan´ y pro matici A typu m × n
vztahem: A∗ = (A)T . Zˇrejmˇe matice A∗ je typu n × m a pro matice A, B typ˚ u vhodn´eho pro n´asoben´ı m´ame:
(A · B)∗ = B ∗ · A∗ , (A∗ )∗ = A
.
Tak´e v pˇr´ıpadˇe, ˇze matice A,B jsou stejn´eho typu plat´ı identita:
(A + B)∗ = B ∗ + A∗
.
Hodnost matice A budeme oznaˇcovat symbolem r( A) (z angliˇctiny the rank ). Zˇrejmˇe r(A) = r(A∗ ). Poznamenejme, ˇze partie, kter´a pojedn´ av´ a o psedoinverzn´ı matici a metodˇe nejmenˇs´ıch ˇctverc˚ u, je velmi dobˇre vysvˇetlena v knize [PO] v kapitole 5 a 8. V t´eto knize kaˇzd´ a kapitola je doplnˇena odstavcem MATLAB Moment, ve kter´em je pops´ ano pouˇzit´ı syst´emu MATLAB na v´ ypoˇcty uveden´ ych pojm˚ u.
2
Nˇ ekter´ e pojmy a tvrzen´ı z line´ arn´ı algebry.
V tomto odstavci uvedeme nˇekter´e v´ ysledky z line´arn´ı algebry, kter´e budou v dalˇs´ım pouˇz´ıv´any:
2.1
Hodnost souˇ cinu matic
Pro hodnost souˇcinu matic vhodn´ ych typ˚ u uv´ad´ıme n´asleduj´ıc´ı nerovnost: Vˇ eta 1. Necht’ A je matice typu m ×n, B je matice typu n × p. Pak plat´ı:
3
r(A · B) ≤ min(r(A),r(B)) .
D˚ ukaz. Necht’ U, V je mnoˇzina vˇsech p-rozmˇern´ ych sloupcov´ ych vektor˚ u X (tj.matic typu p×1), pro kter´e plat´ı: B · X = 0n , resp. A · B · X = 0m . Pak U, V jsou vektorov´e prostory ˇreˇsen´ı homogenn´ıch line´arn´ıch rovnic B · X = 0n , resp. A · B · X = 0m , odkud plyne dim U = p − r(B), dim V = p − r(A · B). Jelikoˇz U ⊆ V , m´ame r(A · B) ≤ r(B). Odtud pak dostaneme r(A · B) = r((A · B)∗ ) = r(B ∗ · A∗ ) ≤ r(A∗ ) = r(A).
Z t´eto vˇety obdrˇz´ıme n´asleduj´ıc´ı tvrzen´ı: Tvrzen´ı 2. N´ asoben´ım (zleva nebo zprava) matice regul´ arn´ı matic´ı (vhodn´eho ˇr´ adu) se nemˇen´ı hodnost matice. D˚ ukaz. Necht’ A je matice typu m × n a P je regul´ arn´ı matice ˇra´du m. Poloˇzme B = P · A. Pak A = P −1 · B a z nerovnosti ve vˇetˇe 1 dost´ av´ ame: r(B) ≤ r(A) ≤ r(B), odkud plyne r( A) = r( B). Podobnˇe se dok´ aˇze tvrzen´ı pro n´ asoben´ı regul´ arn´ı matic´ı zprava. Tvrzen´ı 3. Pro kaˇzdou matici M plat´ı: r(M ∗ · M ) = r(M ). 4
D˚ ukaz. Vzhledem k vˇetˇe 1 staˇc´ı dok´ azat r(M ∗ · M ) ≥ r( M). Necht’ M je matice typu m × n. Bud’te: U,V mnoˇziny vˇsech n-rozmˇern´ ych sloupcov´ ych vektor˚ u X (tj. matic typu n × 1) s vlastnost´ı M X = Om , resp. M ∗ M X = 0n . Pak U, V jsou vektorov´e prostory ˇreˇsen´ı homogenn´ıch line´arn´ıch rovnic M · X = 0m , resp. M ∗ · M · X = 0n , odkud plyne dim U = n − r(M ), dim V = n − r(M ∗ M ). Bud’ X ∈ V a necht’ Y = MX,
y1 . . Y = . . ym
M´ame m X i=1
|yi |2 =
m X
yi y i = Y ∗ Y = (M X)∗ M X = X ∗ M ∗ M X = 0,
i=1
Tud´ıˇz y1 = . . . ym = 0 a M X = 0m a vektor X patˇr´ı do vektorov´eho prostoru U, odkud plyne V ⊆ U , dim V ≤ dim U , tud´ıˇz r(M ∗ M ) ≥ r(M).
Pozn´ amka. Jelikoˇz pro kaˇzdou matici M m´ame r(M ) = r(M ∗ ), m˚ uˇzeme tvrzen´ı 3 formulovat n´asledovnˇe: Pro kaˇzdou matici M maj´ı matice M, M ∗ , M · M ∗ , M ∗ · M stejnou hodnost.
2.2
Blokov´ e matice
Definice 4. Uvaˇzujme obecn´ y tvar rozdˇelen´ı matice A typu m × n :
5
A11 . . A= . Ak1
A12 .. .
...
Ak2
...
A1l .. . , Akl
kde pro 1 ≤ i ≤ k, 1 ≤ j ≤ l je Aij podmatice matice A typu mi × nj (i, j, k, l ∈ Pk Pl N). M´ame pak i=1 mi = m, yv´a blok matice j=1 nj = n. Matice Aij se naz´
A, matice A v uveden´em rozdˇelen´ı se naz´ yv´a blokov´ a matice blokov´eho typu k×l.
Podobnˇe maticov´e n´azvy pouˇz´ıv´ame pro blokovou matici s pˇr´ıvlastkem blokov´y (napˇr. (Ai1 , . . . , Aij ) se naz´ yv´a i-t´y blokov´y ˇr´ adek ). Poˇcet ˇra´dk˚ u mi matice Aij je stejn´ y pro kaˇzd´e 1 ≤ j ≤ l a stejnˇe poˇcet sloupc˚ u nj matice Aij je stejn´ y pro kaˇzd´e 1 ≤ i ≤ l.
Pˇ r´ıklad 5. Uvaˇzujme matici
−1
3
0 A= −2 1
−6
4
0 . 5 8
9 −3 3
2
1 −7
Matice A je matice typu 4 × 4 (neboli ˇctvercov´ a matice ˇra´du 4). M˚ uˇzeme ji povaˇzovat za blokovou matici: E
F
G
H
!
,
kde E=
−1 3 0
9
!
, F =
4
−6
−3
0
!
, G=
−2 3 1
1
!
2
, H=
5
−7 8
!
.
Matice E, F, G, H jsou bloky matice A, kter´a m´a blokov´ y typ 2 × 2. Matici A m˚ uˇzeme tak´e povaˇzovat za blokovou matici blokov´eho typu 2 × 3: ! B11 B12 B13 A= , B21 B22 B23 kde
−1 3
4
−6
, B12 = −3 , B13 = 0 , B11 = 0 9 5 2 −2 3 6
B21 =
1 1
, B22 =
−7
Snadno se dok´ aˇz´ı n´asleduj´ıc´ı vˇety 6 – 8:
, B2,3 =
8
.
Vˇ eta 6. Necht’ A je blokov´ a matice blokov´eho typu k × l: A11 . . . A1k . .. .. A= . . Ak1 . . . Akl Pak pro komplexn´ı ˇc´ıslo c m´ ame
cA11 . cA = .. cAk1
...
...
cA1l .. . . cAkl
Matice AT , A∗ mohou b´yt uvaˇzov´ any jako blokov´e matice blokov´eho typu l × k:
A11 . T . A = . Ak1
A11 . ∗ A = .. Ak1
...
... ...
...
T AT11 A1l .. . . = .. AT1l Akl ∗ A∗11 A1l .. . . = .. A∗1l Akl
...
... ...
...
ATk1 .. . , ATkl A∗k1 .. . . A∗kl
Vˇ eta 7. Necht’ A,B jsou blokov´e matice stejn´eho typu a stejn´eho blokov´eho typu k × l,
A11 . . A= . Ak1
...
...
A1l B11 . .. . , B = .. Akl Bk1
...
...
B1l .. . , Bkl
kde pro 1 ≤ i ≤ k, 1 ≤ j ≤ l jsou podmatice Aij , Bij stejn´eho typu. Pak
A11 + B11 .. A+B = . Ak1 + Bk1 7
...
...
A1l + B1l .. . . Akl + Bkl
Vˇ eta 8. Necht’ A je blokov´ a matice typu m × n a blokov´eho typu q × r a B je blokov´ a matice typu n × p a blokov´eho typu r × s, B11 A11 . . . A1r . . . . .. , B = .. A= . Br1 Aq1 . . . Aqr
B1s .. . , Brs
...
...
kde pro 1 ≤ i ≤ q, 1 ≤ j ≤ r, 1 ≤ k ≤ s, matice Aij je typu mi × nj a matice Bjk je typu nj × pk . Pak
C11 . A · B = C = .. Cq1
C1s .. . , Cqs
...
...
kde pro 1 ≤ i ≤ q, 1 ≤ k ≤ s m´ ame
Cik =
r X
Aij · Bjk .
j=1
Pˇ r´ıklad 9. a) Necht’ U,V jsou ˇctvercov´e matice ˇra´du n a W je blokov´ a matice s blokov´ ym ˇra´dem 2:
W =
U
V
V
−U
!
.
Pak W2 =
U2 + V 2
UV − V U
V U − UV
U2 + V 2
!
.
b) Necht’ A je ˇctvercov´ a matice ˇra´du n, B je matice typu n × m, C je ˇctvercov´ a matice ˇra´du m a 0 je nulov´ a matice typu m × n. Pak pro blokovou ˇctvercovou matici W =
A B 0
C
!
blokov´eho ˇra´du 2 m´ame: det(W ) = det(A) · det(C). 8
Pojem blokov´e matice vyuˇzijeme pro d˚ ukaz ”Sylvesterova z´ akona nulity”t´ ykaj´ıc´ıho se hodnosti souˇcinu matic: Vˇ eta 10. Sylvester˚ uv z´ akon nulity - Sylvester’s Law of Nullity. Necht’ A je matice typu m×n, B je matice typu n × p. Pak plat´ı: r(A) + r(B) - n ≤ r(A · B) .
D˚ ukaz. Jestliˇze A nebo B jsou nulov´e matice, pak tvrzen´ı je zˇrejm´e. Pˇredpokl´adejme, ˇze matice A,B jsou nenulov´e a oznaˇcme r hodnost matice A ( r je pak pˇrirozen´e ˇc´ıslo). I. Nerovnost dok´ aˇzeme nejdˇr´ıve pro pˇr´ıpad blokov´eho vyj´ adˇren´ı matice A a matice B: A=
Ir
0
0
0
!
, B =
B11
B12
B21
B22
!
,
kde nulov´e matice v blokov´em vyj´ adˇren´ı matice A maj´ı vhodn´ y typ nebo se v tomto vyj´ adˇren´ı nevyskytuj´ı. Matice B11 je ˇctvercov´ a ˇra´du r a ostatn´ı matice Bij jsou vhodn´eho typu nebo se ve vyj´ adˇren´ı v˚ ubec nevyskytuj´ ı. Matice Ir znaˇc´ı matici jednotkovou ˇra´du r. Necht’ C = B11 B12 . Pak A · B =
B11
B12
0
0
!
=
C 0
!
. V pˇr´ıpadˇe, ˇze C je nenulov´ a matice, necht’
r1 , . . . , rs (s ∈ N) je maxim´aln´ı syst´em line´arnˇe nez´avisl´ ych ˇra´dk˚ u matice C, tud´ıˇz s = je nenulov´ a exisB21 B22 tuje maxim´aln´ ych ˇra´dk˚ u matice ı syst´em s1 , . . . , st (t ∈ N) line´arnˇe nez´avisl´ tak, ˇze {r1 , . . . , rs , s1 , . . . st } je maxim´aln´ı syst´em line´arnˇe nez´avisl´ ych B21 B22 = r(C) = r(A · B). V pˇr´ıpadˇe, ˇze matice
ˇra´dk˚ u matice B. Odtud plyne s + t = r(B), t ≤ n − r. Jelikoˇz s = r(A · B), m´ame r(A · B) = r(B) − t ≥ r(B) + r − n = r(B) + r(A) − n. Trivi´ aln´ı pˇr´ıpady, kter´e byly vynech´any, se snadno podobnˇe dok´ aˇz´ı. II. V obecn´em pˇr´ıpadˇe existuj´ı element´ arn´ı ˇra´dkov´e a sloupcov´ !e transformace Ir 0 matice A, kter´e pˇrev´ ad´ı matici A na blokovou matici typu m × n. 0 0 9
Tento pˇrevod se d´a vyj´ adˇrit vyn´ asoben´ım matice A zleva a zprava regul´arn´ımi maticemi P,Q ˇra´d˚ u m,n. Tud´ıˇz P ·A·Q =
Ir
0
0
0
!
.
(Plat´ı u ´mluva o typech nulov´ ych matic.) Podle tvrzen´ı 2 m´ame r(A · B) = r((P · A · Q) · (Q−1 · B)), r(A) = r(P · A · Q), r(B) = r(Q−1 · B). Pro matice P · A · Q a Q−1 · B plat´ı podle I vˇeta 10, tud´ıˇz tak´e plat´ı pro matice A,B.
2.3
Inverzn´ı matice
Pˇripomeneme jen struˇcnˇe pojem inverzn´ı matice. ˇ Definice 11. Bud’ A ˇctvercov´ a matice ˇra´du n. Ctvercov´ a matice X ˇra´du n se naz´ yv´a inverzn´ı matice matice A, jestliˇze plat´ı: X · A = In = A · X . Symbolem In budeme znaˇcit jednotkovou matici ˇra´du n. Tedy
In =
1
0
...
0 .. .
1 .. .
... .. .
0 ...
0
0 .. . . 0
1
Pro existenci a jednoznaˇcnost inverzn´ı matice plat´ı n´asleduj´ıc´ı vˇeta: Vˇ eta 12. Necht’ A je ˇctvercov´ a matice. Pak matice A m´ a inverzn´ı matici, pr´ avˇe kdyˇz matice A je regul´ arn´ı, tj. det( A) 6= 0. V tomto pˇr´ıpadˇe je inverzn´ı matice jednoznaˇcnˇe urˇcena a pro matice X,Y vhodn´ych typ˚ u plat´ı: A · X = A · Y =⇒ X = Y, X · A = Y · A =⇒ X = Y. 10
Inverzn´ı matice X regul´ arn´ı matice A se oznaˇcuje symbolem A−1 . Dalˇs´ı vˇeta n´am ˇr´ık´a, ˇze inverzn´ı oper´ ator pro regul´ arn´ı matice a hermitovsk´ y oper´ ator jsou zamˇeniteln´e: Vˇ eta 13. Pro regul´ arn´ı matici A plat´ı: (A∗ )−1 = (A−1 )∗ . D˚ ukaz. Je-li m ˇra´d matice A, m´ame (A∗ )−1 · A∗ = Im , odkud dost´ av´ ame aplikac´ı hermitovsk´eho oper´ atoru na souˇcin matic A· ((A∗ )−1 )∗ = Im , z ˇcehoˇz plyne podle vˇety 12 ((A∗ )−1 )∗ = A−1 a tedy (A∗ )−1 = (A−1 )∗ .
2.4
Permutaˇ cn´ı matice
D˚ uleˇzit´ ym prostˇredkem v teorii matic je pojem permutaˇcn´ı matice, kter´a je definov´ ana n´asledovnˇe: Definice 14. Necht’ n ∈ N a π je permutace mnoˇziny {1, . . . , n} (tj. bijekce t´eto mnoˇziny na sebe). Pro pˇrirozen´e ˇc´ıslo 1 ≤ j ≤ n poloˇzme Ej = (0, . . . , 0, 1, 0, . . . 0), kde 1 je na j-t´em m´ıstˇe a na ostatn´ıch m´ıstech vektoru Ej je 0. Permutaˇcn´ı matice ˇra´du n je matice
P = Pπ
Eπ(1)
Eπ(2) = .. . Eπ(n)
Tud´ıˇz pro P = (pij ), 1 ≤ i, j ≤ n m´ame
pij =
(
.
1,
jestliˇze
π(i) = j,
0,
jestliˇze
π(i) 6= j.
11
Zˇrejmˇe kaˇzd´ a permutaˇcn´ı matice je regul´ arn´ı. Odtud m˚ uˇzme odvodit n´asleduj´ıc´ı vˇetu: Vˇ eta 15. Necht’ n ∈ N a ϕ, ψ, χ jsou permutace mnoˇziny {1, . . . , n}, pˇriˇcemˇz χ = ψϕ. Pak plat´ı: Pϕ · Pψ = Pχ = Pψϕ . D˚ ukaz. Necht’ Pϕ = (aij ), Pψ = (bij ), Pχ = (cij ), Pϕ · Pψ = (dij ). Pak aij =
(
1,
jestliˇze
ϕ(i) = j,
0,
jestliˇze
ϕ(i) 6= j,
bij =
(
1,
jestliˇze
ψ(i) = j,
0,
jestliˇze
ψ(i) 6= j,
cij =
(
1,
jestliˇze
χ(i) = j,
0,
jestliˇze
χ(i) 6= j.
Pro 1 ≤ i, j ≤ n m´ame dij =
n X
aik · bkj = aiϕ(i) · bϕ(i)j = bϕ(i)j .
k=1
Jelikoˇz bϕ(ij =
(
m´ame bϕ(i)j =
1,
jestliˇze
ψ(ϕ(i)) = j,
0,
jestliˇze
ψ(ϕ(i)) 6= j,
(
1,
jestliˇze
χ(i) = j,
0,
jestliˇze
χ(i) 6= j
a tedy dij = cij . Z vˇety 15 plyne snadno n´asleduj´ıc´ı doplnˇek: Doplnˇ ek. Necht’ n je pˇrirozen´e ˇc´ıslo, σ, ε bud’te permutace na mnoˇzinˇe {1, . . . , n} a ε je identick´ a permutace. Pak plat´ı: (Pσ )−1 = Pσ−1 , Pε = In .
12
Vˇ eta 16. Necht’ n,v jsou pˇrirozen´ a ˇc´ısla a π je permutace mnoˇziny {1, . . . , n}. Necht’ M je matice typu n × v a N je matice typu v × n. Pak matice Pπ · M (N · Pπ ) je matice M ( N), ve kter´e ˇr´ adky ( sloupce) jsou permutov´ any permutac´ı π (π −1 ). (Pˇresnˇeji ˇreˇceno: indexy ˇra´dk˚ u ( sloupc˚ u) jsou permutov´ any.)
D˚ ukaz. Jelikoˇz pro komplexn´ı ˇc´ısla x1 , . . . , xn plat´ı: x1 xπ(1) x2 xπ(2) Pπ · . = . .. .. xn xπ(n) a tak´e (x1 , x2 , . . . , xn ) · Pπ = (xπ−1 (1) , xπ−1 (2) . . . , xπ−1 (n) ), m´ame dok´ azanou vˇetu. Poloˇz´ıme-li pro pˇr´ırozen´e ˇc´ıslo 1 ≤ j ≤ n
0 . .. 0 Fj = 1 , 0 . . . 0 kde 1 je na j-t´em m´ıstˇe a na ostatn´ıch m´ıstech vektoru Fj jsou nuly, pak maticie Q = Qπ = Fπ(1) . . . Fπ(n)
je jednotkov´ a matice, ve kter´e permutujeme sloupce permutac´ı π. Jelikoˇz Qπ−1 = uˇzeme vyj´ adˇrit n´asledovnˇe: Pπ , m´ame N · Pπ = N · Qπ−1 . Vˇetu 16 m˚
13
(a) Jestliˇze permutujeme ˇr´ adky matice M typu n × v permutac´ı π, dostaneme matici M vyn´ asobenou zleva jednotkovou matic´ı In ˇr´ adu n, ve kter´e permutujeme ˇr´ adky permutac´ı π. (b) Jestliˇze permutujeme sloupce matice M typu v × n permutac´ı π, dostaneme matici M vyn´ asobenou zprava jednotkovou matic´ı In ˇr´ adu n, ve kter´e permutujeme sloupce permutac´ı π.
3
Inverzn´ı matice zleva a zprava
Naˇsim u ´kolem nyn´ı bude studovat ot´ azku, jak zm´ırnit poˇzadavky v definici inverzn´ı matice, abychom dostali ˇsirˇs´ı okruh matic s nov´ ym pojmem inverze. Budeme studovat nejdˇr´ıve n´asleduj´ıc´ı pˇrirozen´e zobecnˇen´ı inverze: Definice 17. Necht’ A je matice typu m × n a necht’ B (C) jsou matice typu n×m. Matice B (C) se naz´ yv´a inverzn´ı matice zprava ( zleva) matice A, jestliˇze plat´ı: A · B = Im (C · A = In ) . Vyˇsetˇr´ıme nyn´ı ot´ azku, pro kter´e matice existuj´ı inverze zprava a zleva. Za t´ım u ´ˇcelem si zavedeme n´asleduj´ıc´ı pojem, kter´ y bude t´eˇz uˇziteˇcn´ y pro dalˇs´ı problematiku: ˇ Definice 18. Rekneme, ˇze matice A typu m × n m´ au ´plnou ˇr´ adkovou hodnost, jestliˇze r( A) = m, tj. poˇcet ˇra´dk˚ u matice A je roven jej´ı hodnosti. Jestliˇze r( A) = n, tj. poˇcet sloupc˚ u matice A je roven jej´ı hodnosti, ˇrekneme, ˇze matice A m´ au ´plnou sloupcovou hodnost. Vˇ eta 19. Pro matici A jsou n´ asleduj´ıc´ı v´yroky ekvivalentn´ı: (a) matice A m´ a inverzi zprava, (b) matice A m´ au ´plnou ˇr´ adkovou hodnost, (c) matice A ·A∗ je regul´ arn´ı.
14
D˚ ukaz. Necht’ A je typu m × n. I. Pˇredpokl´adejme, ˇze plat´ı (a) a matice B je inverzn´ı matice zprava matice A. Pak A · B = Im . Z vˇety 1 plyne m = r(A · B) ≤ r(A) ≤ m. Odtud dost´ av´ ame m = r( A), tud´ıˇz matice A m´a u ´plnou ˇra´dkovou hodnost. II. Necht’ plat´ı (b), tedy r( A) = m. Pak podle pozn´ amky za tvrzen´ım 3 m´ame r(A · A∗ ) = r(A) = m, tud´ıˇz matice A · A∗ je regul´ arn´ı. III. Jestliˇze matice A · A∗ je regul´ arn´ı, poloˇz´ıme A∗ · (A · A∗ )−1 = = B. Pak A · B = Im , tud´ıˇz B je inverze zprava matice A. Plat´ı v´ yrok (a).
Analogick´ a vˇeta plat´ı pro matice, kter´e maj´ı inverzi zleva:
Vˇ eta 20. Pro matici A jsou n´ asleduj´ıc´ı v´yroky ekvivalentn´ı: (a) matice A m´ a inverzi zleva, (b) matice A m´ au ´plnou sloupcovou hodnost, (c) matice A∗ · A je regul´ arn´ı.
D˚ ukaz je analogick´ y jako d˚ ukaz vˇety 19.
V dalˇs´ı ˇc´asti tohoto odstavce ud´ ame popis mnoˇziny vˇsech inverz´ı zprava pro matice s u ´plnou ˇra´dkovou hodnost´ı a mnoˇziny vˇsech inverz´ı zleva pro matice su ´plnou sloupcovou hodnost´ı. Jestliˇze matice A je regul´ arn´ı ˇra´du m , pak m´a pr´avˇe jednu inverzi zprava a pr´ avˇe jednu inverzi zleva a tyto inverze se rovnaj´ı a rovnaj´ı se matici A−1 . Jestliˇze matice A je ˇctvercov´ a a singul´ arn´ı, pak nem´ au ´plnou ˇra´dkovou hodnost a tak´e nem´ au ´plnou sloupcovou hodnost, tud´ıˇz matice A nem´ a ˇz´adnou inverzi zprava a nem´ a ˇz´adnou inverzi zleva. Pro popis mnoˇziny vˇsech inverz´ı zprava resp. zleva m˚ uˇzeme se tud´ıˇz omezit na matice typu m × n, m < n s u ´plnou ˇra´dkovou 15
hodnost´ı pro pˇr´ıpad inverze zprava a pro pˇr´ıpad inverze zleva na matice typu n × m, m < n s u ´plnou sloupcovou hodnost´ı. Pˇredpokl´adejme nyn´ı, ˇze A je matice typu m × n, m < n, kter´a m´a u ´plnou ˇra´dkovou hodnost. Jelikoˇz r( A) = m, existuje podle vˇety 16 permutace π mnoˇziny {1, 2, . . . , n} tak, ˇze sloupce matice A jsou permutov´ any permutac´ı π −1 a matice A · Pπ =
A1
A2
,
kde A1 je regul´ arn´ı matice ˇra´du m a A2 je matice typu m × (n − m). Matici Pπ vyj´ adˇr´ıme jako blokovou matici Pπ =
P1
P2
,
kde P1 je matice typu n × m a P2 je matice typu n × (n − m). M˚ uˇzeme nyn´ı vyslovit vˇetu: Vˇ eta 21. Necht’ plat´ı v´yˇse uveden´e pˇredpoklady a oznaˇcen´ı. Pak mnoˇzina vˇsech inverzn´ıch matic zprava matice A je rovna mnoˇzinˇe vˇsech matic B typu n × m tvaru + (P2 − P1 · A−1 B = P1 · A−1 1 · A2 ) · C, 1 kde C je matice typu (n − m) × m.
D˚ ukaz. I. Pˇredpokl´adejme, ˇze matice B je uveden´eho tvaru a pro struˇcnost poloˇzme −1 A−1 1 − A1 · A2 · C
D=
C
!
.
Pak B= odkud plyne A · B = A · Pπ · D =
P1
A1
P2
A2
· D = Pπ · D,
·
tud´ıˇz matice B je inverz´ı zprava matice A. 16
−1 A−1 1 − A1 · A2 · C
C
!
= Im ,
II. Pˇredpokl´adejme, ˇze matice B typu n × m je inverz´ı zprava matice A. Pak A · B = Im . Necht’ M je ˇctvercov´ a matice ˇra´du m a C je matice typu (n − m) × m, pˇriˇcemˇz plat´ı: (Pπ )
−1
M
·B =
C
!
.
Pak Im = A · Pπ · (Pπ )
−1
·B =
A1
A2
!
M
·
C
= A1 · M + A2 · C.
z´ıme − A−1 Odtud plyne M = A−1 1 · A2 · C. Odtud a z definice matice B obdrˇ 1
M
B = Pπ ·
C
!
=
P1
P2
!
M
·
C
= P1 · M + P2 · C =
= P1 · A−1 + (P2 − P1 · A−1 1 1 · A2 ) · C.
Pˇ r´ıklad 22. Udejte vˇsechny inverze zprava matice A=
!
−3
2
1
1
2
1 −1
2
,
kter´a m´a u ´plnou ˇra´dkovou hodnost. Matici A uvaˇzujme jako blokovou matici, kde sloupce tvoˇr´ı bloky matice: A=
s1
s2
s3
s4
.
Tuto matici chceme permutace π −1 sloupc˚ u pˇrev´est na tvar A −→ Pak π
−1
=
s2
1
2 3
4
2
4 3
1
s4 !
s3
aπ=
17
s1
.
1
2 3
4
4
1 3
2
!
,
tedy
0 0
1
−3
1
2
1 0 Pπ = 0 0 0 1
D´ale m´ame A · Pπ =
0 1
0
0 0 , P1 = 1 0 1 0 0 0 0 1
2
−1 2
V´ ypoˇctem pak obdrˇz´ıme: 0 2 = 5 · P1 · A−1 1 0 −1
Poloˇz´ıme-li
0
!
0
0
1
0 , P2 = 0 1 0 1 0 1 −3
, A1 =
1
2
!
0 . 0 0
, A2 =
0
3 , 5 · (P2 − P1 · A−1 · A2 ) = 1 1 5 0 2 1 C =
x
y
u
v
!
1
2
−1
2
5
!
.
−10 . 0 0
,
kde x, y, u, v jsou komplexn´ı ˇc´ısla, dost´ av´ ame ze vzorce ve vˇetˇe 21: mnoˇzina vˇsech inverz´ı zprava matice A je mnoˇzina vˇsech matic B tvaru: 5u 5v x − 10u + 2 y − 10v + 3 1 , · B = 5 5x 5y 2x − 1 2y + 1
kde x, y, u, v jsou libovoln´ a komplexn´ı ˇc´ısla.
Podobnˇe se ˇreˇs´ı ot´ azka inverz´ı zleva pro matici u ´pln´e sloupcov´e hodnosti: Pˇredpokl´adejme, ˇze A je matice typu n × m, m < n, kter´a m´a u ´plnou sloupcovou hodnost. Jelikoˇz r( A) = m, existuje podle vˇety 16 permutace π mnoˇziny {1, 2, . . . , } tak, ˇze matice A1
Pπ · A =
A2
18
!
,
kde A1 je regul´ arn´ı matice ˇra´du m a A2 je matice typu (n − m) × m. Matici Pπ vyj´ adˇr´ıme jako blokovou matici P1
Pπ =
P2
!
,
kde P1 je matice typu m × n a P2 je matice typu (n − m) × n. Stejn´ ym zp˚ usobem jako vˇetu 21 m˚ uˇzeme dok´ azat n´asleduj´ıc´ı vˇetu: Vˇ eta 23. Necht’ plat´ı pˇred vˇetou uveden´e pˇredpoklady a oznaˇcen´ı. Pak mnoˇzina vˇsech inverzn´ıch matic zleva matice A je rovna mnoˇzinˇe vˇsech matic B typu n × m tvaru −1 B = A−1 1 · P1 + C · (P2 − A2 · A1 · P1 ),
kde C je libovoln´ a matice typu m × (n − m). Vˇetu 23 m˚ uˇzeme z´ıskat z vˇety 21 pomoc´ı hermitovsk´eho oper´atoru ∗ (v.vˇetu 13).
4
Pseudoinverzn´ı matice.
V tomto odstavci zavedeme pojem pseudoinverzn´ı matice, kterou m´a kaˇzd´ a matice a tato pseudoinverzn´ı matice je jednoznaˇcnˇe urˇcena. Definice 24. Necht’ A je matice (nad tˇelesem komplexn´ıch ˇc´ısel C) typu m × n. Matice X typu n × m se naz´ yv´a pseudoinverzn´ı matice matice A, jestliˇze plat´ı: (1) AXA = A, (2) XAX = X, (3) ( AX)∗ = AX, (4) ( XA)∗ = XA. Podm´ınky (1) - (4) se naz´ yvaj´ı Penroseovy podm´ınky a pseudoinverzn´ı matice se ˇcasto naz´ yv´a Moore-Penroseova inverze matice A nebo struˇcnˇe M-P inverze ([Da]). Mluv´ıme tak´e jen o pseudonverzi matice A.
19
Vˇ eta 25. Jednoznaˇ cnost pseudoinverzn´ı matice. Jestliˇze matice A m´ a pseudoinverzi, pak tato pseudoinverze je urˇcena jednoznaˇcnˇe. D˚ ukaz. Pˇredpokl´adejme, ˇze matice B,C jsou pseudoinverze matice A. Pak plat´ı: (2)
(4)
(1)
(4)
B = (BA)B = (A∗ B ∗ )B = (A∗ C ∗ A∗ )B ∗ B = (4)
(4)
(2)
= (CA)(A∗ B ∗ B) = (CA)(BAB) = CAB. (2)
(3)
(1)
(3)
C = C(AC) = CC ∗ A∗ = CC ∗ (A∗ B ∗ A∗ ) = (3)
(3)
(2)
= CC ∗ A∗ (AB) = (CAC)(AB) = CAB.
Odtud plyne B = C a vˇeta je dok´ az´ana. ˇ ısla nad symbolem rovnosti oznaˇcuj´ı ˇc´ıslo Penroseovy podm´ınky, kter´a se C´ pouˇz´ıv´a pˇri d˚ ukazu pˇr´ısluˇsn´e rovnosti. Pˇri zjiˇst’ov´ an´ı, zdali matice X je pseudoinverze matice A, se obvykle postupuje tak, ˇze se ovˇeˇruj´ı Penroseovy podm´ınky (1) - (4). V pˇr´ıpadˇe jejich platnosti je pak X jedoznaˇcnˇe definovan´a pseudoinverzn´ı matice A+ matice A. Oznaˇ cen´ı. Jelikoˇz je pseudoinverze jednoznaˇcnˇe urˇcena, m˚ uˇzeme pro ni zav´est oznaˇcen´ı. Tuto pseudoinverzi budeme oznaˇcovat symbolem A+ .
Pˇ r´ıklad 26. a) Jestliˇze A je regul´ arn´ı matice, pak matice X = A−1 vyhovuje Penroseov´ ym podm´ınk´ am, tud´ıˇz A+ = A−1 . b) Je-li A = Om,n nulov´ a matice typu m × n, pak podobnˇe ovˇeˇr´ıme Penroseovy podm´ınky pro X = On,m , odkud plyne + Om,n = On,m .
c) Jestliˇze matice A m´a pseudoinverzi, pak m´a pseudoinverzi t´eˇz matice A+ a plat´ı: (A+ )+ = A .
20
d) Jestliˇze matice A m´a pseudoinverzi, pak m´a pseudoinverzi i matice A∗ a plat´ı:
(A∗ )+ = = (A+ )∗ . D˚ ukaz. Poloˇzme X = (A+ )∗ a ovˇeˇrme Penroseovy podm´ınky pro matice A∗ a X: (1) A∗ · X · A∗ = A∗ · (A+ )∗ · A∗ = (A · A+ · A)∗ = A∗ , (2) X · A∗ · X = (A+ )∗ · A∗ · (A+ )∗ = (A+ · A · A+ )∗ = (A+ )∗ = X, (3) (A∗ · X)∗ = (A∗ · (A+ )∗ )∗ = A+ · A = (A+ · A)∗ = A∗ · (A+ )∗ = A∗ · X, (4) (X·A∗ )∗ = A·X ∗ = A·((A+ )∗ )∗ = A·A+ = (A·A+ )∗ = (A+ )∗ ·A∗ = X·A∗ .
e) Jestliˇze D je diagon´aln´ı matice ˇra´du n
D=
d1
0
...
0 .. .
d2 .. .
... .. .
0
...
0
0 .. . , 0
dn
pak pro Moore-Penroseovu inverzi matice D m´ame
D = +
d+ 1
0
...
0 .. .
d+ 2 .. .
... .. .
0
...
0
0 .. . , 0
d+ n
kde pro komplexn´ı ˇc´ıslo c symbol c+ znaˇc´ı 0, jestliˇze c = 0. V pˇr´ıpadˇe, ˇze c je nenulov´e komplexn´ı ˇc´ıslo, poloˇz´ıme c+ = c−1 . f) Jestliˇze A je matice, kter´a m´a pseudoinverzi, a c je komplexn´ı ˇc´ıslo, pak matice c · A m´a pseudoinverzi a plat´ı: (c · A)+ = c+ · A+ .
21
V pˇr´ıpadˇe, ˇze matice m´a u ´plnou ˇra´dkovou nebo sloupcovou hodnost, pak m´a tato matice pseudoinverzi a pro tuto pseudoinverzi plat´ı rovnosti uveden´e n´asledovnˇe: Tvrzen´ı 27. (a) Necht’ matice A typu m × n, m < n m´ a u ´plnou ˇr´ adkovou hodnost. Pak m´ a matice A pseudoinveverzi, matice A · A∗ je regul´ arn´ı a plat´ı: A+ = A∗ · (A · A∗ )−1 a A · A+ = Im . (b) Jestliˇze matice A typu m × n, n < m m´ au ´plnou sloupcovou hodnost, pak m´ a matice A pseudoinverzi, matice A∗ · A je regul´ arn´ı a plat´ı: A+ = (A∗ · A)−1 · A∗ a A+ · A = In .
D˚ ukaz. Dok´ aˇzeme jen tvrzen´ı (a). Tvrzen´ı (b) se dok´ aˇze analogicky. Pˇredpokl´adejme, ˇze A je matice typu m × n, m < n, kter´a m´a u ´plnou ˇra´dkovou hodnost. Podle tvrzen´ı 3 (pozn´ amka) m´ame m = r(A) = r(A · A∗ ), z ˇcehoˇz plyne, ˇze matice A · A∗ je regul´ arn´ı. Poloˇzme X = A∗ · (A · A∗ )−1 . Pak A · X = A · A∗ · (A · A∗ )−1 = Im . Odsud snadno plyne, ˇze jsou splnˇeny Penroseovy podm´ınky (1) - (3). Uk´aˇzeme platnost Penroseovy podm´ınky (4). Z vˇety 13 obdrˇz´ıme (X · A)∗ = A∗ · X ∗ = A∗ · ((A · A∗ )−1 )∗ · A = = A∗ · ((A · A∗ )∗ )−1 · A = A∗ · (A · A∗ )−1 · A = X · A.
Pˇ r´ıklad 28. Urˇcit Moore-Penroseovu inverzi matice 1 1 A = 1 1 . 1
22
2
Hodnost matice A je rovna 2, tud´ıˇz A je matice u ´pln´e sloupcov´e hodnosti a podle tvrzen´ı 27(b) m´ame +
A
T
= (A · A)
1 = 2
2
−1
1 = 2
T
·A
2
−2
−1 −1
2
!
6
−4
−4
3
=
!
·
1 1
1
1 1
2
1
1
1
−0.5
−0.5
1
!
!
=
.
Pro konstrukci pseudoinvrze se ˇcasto pouˇz´ıv´a n´asleduj´ıc´ı vˇety:
Vˇ eta 29. Vˇ eta o skeletn´ım rozkladu matice - Lemma on ”rank factorization”of a matrix. Necht’ A je nenulov´ a matice typu m × n s hodnost´ı r (r ≥ 1). Pak existuj´ı matice B,C typu m × r, r × n takov´e, ˇze plat´ı: A = B · C, r(B) = r(C) = r . Rozklad A = B · C se pak naz´ yv´a skeletn´ı rozklad matice A. D˚ ukaz. Matici A vyj´ adˇrejme jako blokovou matici, kde bloky jsou sloupce matice A: A =
s1
...
sn
.
Vybereme ze sloupc˚ u matice A r line´arnˇe nez´avisl´ ych sloupc˚ u σ1 , . . . , σr , kter´e pak tvoˇr´ı maxim´aln´ı syst´em line´arnˇe nez´avisl´ ych sloupc˚ u matice A. Poloˇz´ıme B = σ1 . . . σr .
Pak B je matice typu m × r s hodnost´ı r. Matici C budeme uvaˇzovat tak´e jako blokovou matici, ve kter´e bloky jsou nezn´am´e sloupcov´e vektory ξ1 , . . . , ξn dimenze r a pro kterou plat´ı A = B · C, tud´ıˇz C = Bξ1 ξ1 . . . ξn a A =
...
Bξn
.
Odtud pak dost´ av´ ame n syst´em˚ u line´arn´ıch rovnic pro r nezn´am´ ych: B · ξj = sj (1 ≤ j ≤ n).
23
Pro matici B tˇechto syst´em˚ u plat´ı r(B) = r. Rozˇs´ıˇren´a matice j - t´eho syst´emu (1 ≤ j ≤ n) m´a tvar
B
sj
a jelikoˇz sj je line´arn´ı kombinac´ı sloupc˚ u matice B, m´a tato rozˇs´ıˇren´a matice tak´e hodnost r. Uveden´e syst´emy line´arn´ıch rovnic jsou tud´ıˇz ˇreˇsiteln´e a pro jejich ˇreˇsen´ı ξj pak plat´ı A=B·C =B·
ξ1
...
ξn
.
Zb´ yv´a ovˇeˇrit vztah r(C) = r. Jelikoˇz podle vˇety 1 m´ame r = A = r(B · C) ≤ r(C) ≤ r, dost´ av´ ame uveden´ y vztah.
Pˇ r´ıklad 30. Naleznˇete skeletn´ı rozklad 1 A= −1 −2
matice A, kde 4 3 1 2 . −2 0
Libovoln´ ym zp˚ usobem zjist´ıme, ˇze hodnost matice A je rovna 2 a 1. a 3.
sloupec matice A jsou line´arnˇe nez´avisl´e. Poloˇz´ıme ! ! 1 3 x1 x2 , ξ2 = , ξ3 = B = −1 2 , ξ1 = y1 y2 −2 0
x3 y3
!
Budeme hledat hodnoty xi , yi (1 ≤ i ≤ 3) tak, aby A = B · C, kde C = ξ1 ξ2 ξ3 .
Dostaneme tˇri syst´emy line´arn´ıch rovnic x1 + 3y1 = 1
x2 + 3y2 = 4
x3 + 3y3 = 3
−x1 + 2y1 = −1
−x2 + 2y2 = −1
−x3 + 2y3 = 2
−2x1 + 0y1 = −2
−2x2 + 0y2 = 0
−2x3 + 0y3 = 0.
24
.
ˇ sen´ım tˇechto syst´em˚ Reˇ u dostaneme x1 = 1, y1 = 0, x2 = 1, y2 = 1, x3 = 0, y3 = 1, tud´ıˇz C =
1 1
0
0 1
1
!
a A = B·C
je skeletn´ı rozklad matice A. Pozn´ amka. Podle vˇety 29 m´a kaˇzd´ a nenulov´ a matice skeletn´ı rozklad. Nicm´enˇe tento skeletn´ı rozklad nen´ı urˇcen jednoznaˇcnˇe. N´ asleduj´ıc´ı tvrzen´ı popisuje vˇsechny skeletn´ı rozklady nenulov´e matice. Tvrzen´ı 31. Necht’ A je nenulov´ a matice s hodnost´ı r a necht’ A = B · C je skeletn´ı rozklad matice A. Pak vˇsechny skeletn´ı rozklady matice A maj´ı tvar A = (B · R) · (R−1 · C), kde R prob´ıh´ a vˇsechny regul´ arn´ı matice ˇr´ adu r. D˚ ukaz. Zˇrejmˇe pro kaˇzdou regul´ arn´ı matici R ˇra´du r je A = (B · R) · (R−1 · C) skeletn´ı rozklad matice A (v.tvrzen´ı 2). Necht’ A = G · H je skeletn´ı rozklad matice A. Matice H m´a u ´plnou ˇra´dkovou hodnost a podle tvrzen´ı 27 m´a psedoinverzn´ı matici, pˇriˇcemˇz plat´ı H · H + = Ir . Poloˇzme R = C · H + . Ze vztahu B · C = G · H obdrˇz´ıme B · R = B · C · H + = G · H · H + = G. Z vˇety 1 dost´ av´ ame r = r(G) = r(B · R) ≤ r(R) ≤ r. Tud´ıˇz R je regul´ arn´ı matice ˇra´du r, matice G = B · R je matice u ´pln´e ˇra´dkov´e hodnosti a podle tvrzen´ı 27(a) m´a pseudoinverzi a plat´ı G+ · G = Ir . Odtud dost´ av´ ame H = G+ · (G · H) = G+ · (B · C) = G+ · (B · R) · (R−1 · C) = = (G+ · G) · (R−1 · C) = R−1 · C. Tud´ıˇz G = B · R a H = R−1 · C.
25
Vˇ eta 32. Vˇ eta o existenci pseudoinverzn´ı matice. Necht’ A je nenulov´ a matice a A = B · C je jej´ı skeletn´ı rozklad. Pak matice A m´ a pseudoinverzn´ı matici, kter´ a je d´ ana formul´ı A+ = C + · B + . D˚ ukaz. Jelikoˇz matice B,C jsou matice u ´pln´e (sloupcov´e, ˇra´dkov´e) hodnosti m´ame podle tvrzen´ı 27: B + · B = C · C + = Ir . Poloˇzme X = C + · B+ a ovˇeˇrme Penroseovy podm´ınky pro matice A a X: (1) : A · X · A = B · (C · C + ) · (B + · B) · C = B · Ir · C = B · C = A, (2): X · A · X = C + · (B + · B) · (C · C + ) · B + = C + · Ir · B + = C + · B + = X. (3): M´ame A · X = B · (C · C + ) · B + = B · B + , tud´ıˇz podle Penroseovy podm´ınky (3) (A · X)∗ = (B · B + )∗ = B · B + = A · X. (4): Podobnˇe dost´ av´ ame (4): X · A = C + · (B + · B) · C = C + · C, odkud stejn´ ym zp˚ usobem dostaneme podle Penroseovy podm´ınky (4) (X · A)∗ = X · A.
Pˇ r´ıklad 33. Vypoˇc´ıtejte Moore-Penroseovu inverzi matice
1
A = −1 −2 26
4
3
2 . −2 0 1
Podle pˇr´ıkladu 30 skeletn´ı rozklad matice A je identita A = B · C, kde
1
3
B = −1 2 , C = −2 0
1
1 0
0
1 1
!
.
Pseudoinverze matic B a C vypoˇc´ıt´ ame podle tvrzen´ı 27 B
+
1 = 77
∗
= (B · B)
13
−1
−1
6
−1
·B
!
∗
=
6
1
1
13
!−1
!
1 = 77
1 −1 −2 3
C + = C ∗ · (C · C ∗ )−1 =
2
1
0
1 1 3 0
0
1 1
−1 −2
1 3
2
−1
−1
2
2
0
17
13
A+ = C + · B + =
3
1 27 231 24
2
−1
,
1 . 2
−43
−54
−2
−24 . 30
41
2
!
1 1 3 −1
=
Pro pseudoinverzi matice A pak plat´ı
=
−15 −26
10
!
!
Pozn´ amka. Pˇri v´ ypoˇctu pseudoinverzn´ı matice pomoc´ı syst´emu MATLAB je pˇrkaz pro v´ ypoˇcet pseudoinverze matice A n´asleduj´ıc´ı: pinv (A) . Hodnoty prvk˚ u matice A+ jsou pˇri tomto pouˇzit´ı ud´ av´ any jako desetinn´e ˇc´ıslo. Tak napˇr. pro matici A z v´ yˇse uveden´eho pˇr´ıkladu dostaneme t´ımto zp˚ usobem jej´ı pseudoinverzi n´asledovnˇe:
0.0130
−0.1861
−0.2338
A+ = 0.1169 0.1039
−0.0087
−0.1039 . 0.1299
0.1775
Zn´ame-li skeletn´ı rozklad matice A = B · C, kde prvky matic B, C jsou cel´a ˇc´ısla, pak prvky matice 27
det(B ∗ · B) · det(C · C ∗ ) · A+ jsou tak´e cel´a ˇc´ısla. Tento fakt plyne z identit
B + = (B ∗ · B)−1 · B ∗ , C + = C ∗ · (C · C ∗ ), A+ = C + · B + . Poloˇz´ıme-li c = det(B ∗ · B) · det(C · C ∗ ) a provedeme-li pˇr´ıkaz v MATLABU c*pinv(A), dostaneme matici c · A+ , kter´a m´a celoˇc´ıseln´e prvky. V pˇr´ıpadˇe uveden´e matice A m´ame
Odtud plyne
∗
det(B ·B) = det
1
1
!
3
B = −1 2 , C = −2 0
6
1 13
1
1 0
0
1 1
!
.
∗
= 77 = 7· 11, det(C·C ) = det
2
1
1
2
!
= 3,
tud´ıˇz c = 231 a pˇr´ıkaz (231*pinvA) d´av´ a v MATLABu matici 3 −43 −54 c · A+ = 27 −2 −24 . 24 41 30 Velmi ˇcasto se k v´ ypoˇctu pseudoinverzn´ı matice pouˇz´ıv´a t.zv. Greville˚ uv algoritmus. Tento algoritmus ud´ av´ a v´ ypoˇcet rekurzivnˇe vzhledem k poˇctu sloupc˚ u matice. Nejdˇr´ıve se uv´ad´ı vzorec pro pseudoinverzi matice s jedn´ım sloupcem (tedy pro sloupcov´ y vektor). Pak za pˇredpokladu, ˇze zn´ ame pseudoinverzi pro matici, kter´a m´a n - 1 sloupc˚ u se ud´ av´ a vzorec pro matici, kter´a m´a n sloupc˚ u, kde n ∈ N, n ≥ 2. Pop´ıˇseme nyn´ı pˇresnˇe tento postup.
28
Tvrzen´ı 34. Necht’ A je matice typu m × 1, kde m ∈ N. Jestliˇze A je nulov´ a matice, pak A+ = O1,m . Pro nenulovou matici A m´ ame A+ = (A∗ · A)−1 · A∗ . Jestliˇze matice A je nenulov´ a, pak m´a u ´plnou sloupcovou hodnost a v d˚ ukazu pouˇzijeme tvrzen´ı 27 (b). Poznamenejme, ˇze pro σ1 m X . .. m´ame A∗ · A = |σk |2 . A = k=1 σm
Pˇredpokl´adejme nyn´ı, ˇze A je matice typu m × n, kde m, n ∈ N, n ≥ 2. Matici A uvaˇzujme jako blokovou matici A =
s1
...
sn−1
sn
kde s1 , . . . , sn jsou sloupce matice A a An−1 =
s1
= : An =
...
sn−1
An−1
sn
,
je matice typu m × (n − 1). Pˇredpokl´adejme, ˇze zn´ ame pseudoinverzi matice An−1 a poloˇzme dn : = A+ n−1 · sn , cn = sn − An−1 · dn . D´ale poloˇzme: bn =
(
(1 +
c+ ze n , jestliˇ
cn 6= 0,
d∗n dn )−1 d∗n A+ n−1 ,
jestliˇze
cn = 0.
Vˇ eta 35. Greville˚ uv algoritmus.Za pˇredch´ azej´ıc´ıho oznaˇcen´ı a pˇredpoklad˚ u m´ a matice A pseudoinverzi a plat´ı: +
A
=
A+ n
=
A+ n−1 − dn · bn bn
!
.
D˚ ukaz spoˇc´ıv´a v ovˇeˇren´ı Penroseov´ ych podm´ınek pro pseudoinverzn´ı matici a je technicky n´aroˇcnˇejˇs´ı, proto ho nebudeme prov´ adˇet. Ovˇeˇrme jen typy matic, kter´e se zde vyskytuj´ı:
29
matice
A
An−1
A+
A+ n−1
sn
typ
m×n
m × (n − 1)
n×m
(n − 1) × m
m×1
matice
dn
d∗n
cn
c+ n
bn
typ
(n − 1) × 1
1 × (n − 1)
m×1
1×m
1×m
.
uˇze pouˇz´ıt tvrzen´ı 34. Jestliˇze Poznamenejme, ˇze pro v´ ypoˇcet matice c+ n se m˚
pak d∗n · dn =
Pn−1 i=1
dn =
δ1 .. . δn−1
,
|δi |2 je re´ aln´e, nez´aporn´e ˇc´ıslo, tud´ıˇz 1 + d∗n · dn je kladn´e
aln´e kladn´e ˇc´ıslo, (coˇz se ztotoˇzn ˇuje re´ aln´e ˇc´ıslo a v´ yraz (1 + d∗n · dn )−1 znaˇc´ı re´ s matic´ı typu 1 × 1). Greville˚ uv algoritmus budeme demonstrovat na n´asleduj´ıc´ım pˇr´ıkladu:
Pˇ r´ıklad 36. Uˇzit´ım Grevilleova algoritmu vypoˇc´ıtejte pseudoinverzi matice 1 4 3 A = −1 1 2 −2 −2 0
uvedenou v pˇr´ıkladu 33.
ˇ sen´ı: a) Prvn´ı krok: n = 1. Pseudoinverzi matice Reˇ
1
A1 = −1 −2
vypoˇc´ıt´ ame podle vzorce z tvrzen´ı 34. M´ame A∗1 = 1 −1 −2 , A∗1 · A1 = (6),
tud´ıˇz
∗ −1 · A∗1 = A+ 1 = (A1 · A1 )
30
1 1 −1 6
−2
.
b) Druh´ y krok: n = 2. M´ame
1
4
A2 = −1 1 −2 −2
a vypoˇc´ıt´ ame
d2 = A+ 1 · s2 =
1 1 6
4
4
1
7 · 1 = 6 , −2
−1 −2
17
7 1 c2 = s2 − A1 · d2 = 1 − 6 −1 = 6 13 . −2 −2 2
Podle tvrzen´ı 34 plat´ı
∗ −1 ∗ c+ c2 = 2 = (c2 c2 )
Odtud dost´ av´ ame
6 1 · 17 77 6
b2 = c + 2 = Pak
13
=
13
2
2
1 17 77
1 17 13 77
2
.
7 1 1 − = · 1 −1 −2 17 13 2 6 6 77 1 1 = − = − −6 −24 −24 1 4 4 . 6 · 11 11 Podle vˇety 35 (pro n = 2) dost´ av´ ame ! −7 −28 −28 1 + . A2 = 77 17 13 2 A+ 1 − d 2 b2 =
c) Tˇret´ı krok: n = 3. M´ame
1
A3 = −1 −2 31
4
3
2 −2 0 1
.
a vypoˇc´ıt´ ame
d3 =
A+ 2 ·s3
17
3
c3 = s3 − A2 ·d3 = 2 0
3
! ! −77 −1 1 · = , 2 = 77 13 2 77 1 0 ! 1 4 3 3 0 −1 − −1 1 · = 2 − 2 = 0 1 −2 2 0 0 0
−7 −28
1 = 77
!
−28
Jelikoˇz c3 = 0, dost´ av´ ame
.
b3 = (1 + d∗3 d3 )−1 d∗3 A+ 2. D´ale plat´ı
d∗3 A+ 2 tud´ıˇz
=
−1
d∗3 d3
=
1 · 77
1
−1 1
·
−7 −28 17
13
!
= 2,
!
=
−1 1 −28 2
1 24 77
1 24 41 30 . 3 · 77 Pro z´avˇereˇcn´ y v´ ypoˇcet obdrˇz´ıme ! ! −7 −28 −28 −1 1 1 + A2 − d3 ·b3 = − · 24 77 3 · 77 17 13 2 1 ! ! −21 −84 −84 −24 −41 −30 1 1 ( − ) = 3 · 77 231 51 39 6 24 41 30
41 30
41
,
b3 =
Uˇzit´ım vˇety 35 dostaneme z´avˇer pˇr´ıkladu: A+ = A+ 3 =
3
1 27 231 24
=
3
−43
−54
24
−2
−24
−43
−54
−2
−24 . 30
41
30
Uk´aˇzeme nyn´ı dalˇs´ı moˇznost d˚ ukazu existence pseudoinverze pro libovolnou matici. Nejdˇr´ıve uvedeme definici unit´arn´ı matice, kter´a zobecˇ nuje pojem ortogon´aln´ı matice na matice s komplexn´ımi prvky. Pˇripomeˇ nme si definici ortogon´aln´ı matice: Regul´ arn´ı matice M, jej´ıˇz prvky jsou re´ aln´a ˇc´ısla, se naz´ yv´a ortogon´aln´ı, jestliˇze M −1 = M T .
32
!
.
Definice 37. Regul´ arn´ı matice M (jej´ıˇz prvky jsou komplexn´ı ˇc´ısla), se naz´ yv´a unit´ arn´ı, jestliˇze plat´ı: M −1 = M ∗ . Uvedeme pomocn´e tvrzen´ı, kter´e budeme potˇrebovat: Tvrzen´ı 38. Necht’ r je pˇrirozen´e ˇc´ıslo a d1 0 0 d 2 D1 = . . .. . . 0
... ... .. . 0
...
0 .. . 0
dr
je regul´ arn´ı, diagon´ aln´ı matice ˇr´ adu r. Necht’ D je matice typu m × n, m, n > r, kter´ a m´ a blokv´y tvar blokov´eho typu 2 × 2: D =
0r
D1 0(m−r)
r
(n−r)
0(m−r)
(n−r)
!
.
Pak pro jej´ı pseudoinverzi v blokov´em tvaru m´ ame:
D1−1
D+ =
0(n−r)
0r r
(m−r)
0(n−r)
(m−r)
!
.
D˚ ukaz se snadno provede ovˇeˇren´ım Penroseov´ ych podm´ınek. Poznamenejme jeˇstˇe, ˇze v pˇr´ıpadˇe m = r nebo n = r tvrzen´ı tak´e plat´ı, ale mus´ı se vypustit pˇr´ısluˇsn´e nulov´e matice. Napˇr., jestliˇze n = r a m > r, m´ame D =
D1 0(m−r)
r
!
, D+ =
D1−1
0r
(m−r)
.
Nov´ a varianta d˚ ukazu existence pseudoinverze je zaloˇzena na vˇetˇe o ”pˇrevodu” matice na matici D tvaru uveden´em v pˇredch´azej´ıcim tvrzen´ı. Tato vˇeta se naz´ yv´a ”UDV vˇeta”(the UDV Theorem) nebo ( the diagonal decomposition Theorem) a je velmi uˇziteˇcn´ a v teorii matic, nebot’ umoˇzn ˇuje snadnˇejˇs´ı manipulaci matic. D˚ ukaz t´eto vˇety pro potˇrebu dalˇs´ıch znalost´ı z line´arn´ı algebry neuv´ ad´ıme.
33
Vˇ eta 39. UDV-Vˇ eta. Necht’ A je nenulov´ a matice typu m × n ( s komplexn´ımi prvky) a s hodnost´ı r. Pak existuj´ı unit´ arn´ı matice U,V ˇr´ ad˚ u m,n tak, ˇze
A= U·
kde D1
=
0r
D1 0(m−r)
d1
0
...
0 .. .
d2 .. .
... .. .
0
...
0
(n−r)
0(m−r)
r
(n−r)
!
·V
,
0 .. . arn´ı, diagon´ aln´ı matice ˇr´ adu r. je regul´ 0
dr
Vˇ eta 40. Necht’ A je nenulov´ a matice typu m × n s hodnost´ı r. Bud’te U,V ! D1 0r (n−r) unit´ arn´ı matice ˇr´ ad´ u m,n a necht’ A = U ·D·V , kde D = 0(m−r) r 0(m−r) (n−r) a D1 je regul´ arn´ı, diagon´ aln´ı matice ˇr´ adu r. Pak plat´ı: A+ = V + · D+ · U + .
D˚ ukaz t´eto vˇety se provede zase ovˇeˇren´ım Penroseov´ ych podm´ınek pro matice A a X, kde X = V + · D+ · U + (U + = U −1 = U ∗ , V + = V −1 = V ∗ ). Pozn´ amka. Vzhledem k pˇredch´azej´ıc´ı vˇetˇe 40 a vˇetˇe 32 (B · C)+ = C + · B + o pseudoinverzi matice vyj´ adˇren´e skeletn´ım rozkladem B · C a tak´e vzhledem k tvrzen´ı o inverzi souˇcinu regul´ arn´ıch matic by se mohlo zd´ at, ˇze plat´ı podobn´e tvrzen´ı o pseudoinverzi souˇcinu matic: (M · N )+ = N + · M + . Toto tvrzen´ı ale neplat´ı pro pseudoinverzi souˇcinu, tedy obecnˇe m´ame pro matice M,N vhodn´ ych typ˚ u: (M · N )+ 6= N + · M + .
Pˇ r´ıklad 41. Necht’ M,N jsou nenulov´e matice M =
a
b
, N =
34
c d
!
,
kde a, b, c, d ∈ C. Pak M
+
T
T −1
= M ·(M ·M )
1 = 2 a + b2
a b
!
, N + = (N T ·N )−1 ·N T =
c2
1 c 2 +d
V pˇr´ıpadˇe, ˇze ac + bd 6= 0, obdrˇz´ıme (M · N )+ = (ac + bd)−1 , N + · M + =
(a2
ac + bd . + b2 ) · (c2 + d2 )
Jestliˇze (M · N )+ = N + · M + , dost´ av´ ame pak (ac + bd)2 = (a2 + b2 ) · (c2 + d2 ), odkud plyne ad = bc. V ostatn´ıch pˇr´ıpadech m´ame (M · N )+ 6= N + · M + . Z´ avˇerem o vˇet´ach existence pseudoinverzn´ı matice se zm´ın´ıme pro zaj´ımavost bez d˚ ukazu dalˇs´ı vˇetu o t´eto existenci, kter´a je uvedena napˇr. v Davisovˇe knize [Da] ( odstavec 2.8.3, cviˇcen´ı 5): Vˇ eta 42. Pro pseudoinverzi A+ matice A plat´ı: A+ = limt→0 A∗ · (tI + A · A∗ )−1 .
5
Moore-Penroseova inverze a syst´ em line´ arn´ıch rovnic.
Pro ˇreˇsen´ı soustavy line´arn´ıch rovnic se pouˇz´ıv´a apar´ at teorie matic a vektor˚ u. V tomto pˇr´ıspˇevku budeme pro pˇrirozen´e ˇc´ıslo n rozumˇet n-rozmˇern´ ym vektorov´ ym prostorem Cn mnoˇzinu vˇsech sloupcov´ ych vektor˚ u dimenze n, tedy matic typu n × 1. Tyto matice budeme povaˇzovat za ( n-rozmˇern´e) vektory, pˇriˇcemˇz komplexn´ı ˇc´ısla budou skal´ ary. Operace sˇc´ıt´ an´ı vektor˚ u a n´asoben´ı vektoru skal´ arem se definuje jako tyto operace s maticemi. Zˇrejmˇe axiomy z definice vektorov´eho prostoru jsou splnˇeny.
35
d
.
Definice 43. Pro vektory X, Y ∈ Cn y1 x1 . . X= .. , Y= .. yn xn poloˇz´ıme (X, Y ) = Y ∗ · X =
n X
xi · y i
i=1
a ||X|| =
p
v u n uX xi · xi = (X, X) = t i=1
v u n uX t |xi |2 . i=1
Pozn´ amka. Odmocnina z re´ aln´eho nez´aporn´eho ˇc´ısla se povaˇzuje za nez´apornou. Komplexn´ı ˇc´ıslo ( X,Y) se naz´ yv´a (hermitovsk´y ) vnitˇrn´ı souˇcin vektor˚ u X,Y ( Hermitian inner product) a ˇc´ıslo ||X|| se naz´ yv´a norma vektoru X.
Tvrzen´ı 44. Pro n-rozmˇern´e vektory X,Y,Z a komplexn´ı ˇc´ıslo λ m´ ame:
(a) N orma ||X|| je re´ aln´e nez´ aporn´e ˇc´ıslo, pˇriˇcemˇz ||X|| = 0 ⇐⇒ X = 0n,1 , (b) (Y, X) = (X, Y ), (c) (λX, Y ) = λ · (X, Y ), (X, λ · Y ) = λ · (X, Y ), ||λ · X|| = |λ| · ||X||, (d) (X + Y, Z) = (X, Z) + (Y, Z), (X, Y + Z) = (X, Y ) + (X, Z). D˚ ukaz. Pˇr´ım´ ym v´ ypoˇctem se snadno dok´ aˇz´ı v´ yroky (a) - (d).
Definice 45. Vektory X, Y ∈ Cn se naz´ yvaj´ı ortogon´ aln´ı, jestliˇze (X, Y ) = 0. P´ıˇseme pak X⊥Y . Z tvrzen´ı 44(b) dost´ av´ ame: z relace X ⊥ Y plyne relace Y ⊥ X. Pro ortogon´aln´ı vektory plat´ı t.zv. ”Pythagorova vˇeta”.
36
Vˇ eta 46. Pythagorova vˇ eta. Pro ortogon´ aln´ı n-rozmˇern´e vektory X,Y m´ ame
||X + Y ||2 = ||X||2 + ||Y ||2 . D˚ ukaz. Podle tvrzen´ı 44 (d) m´ame pro ortogon´aln´e vektory X,Y ||X + Y ||2 = (X+Y, X+Y ) = (X, X) + (X, Y ) + (Y, X) + (Y, Y ) = ||X||2 + ||Y ||2 .
N´ asleduj´ıc´ı lemma bude uˇziteˇcn´e pro vyj´ adˇren´ı specieln´ıho ”ˇreˇsen´ı”syst´emu line´arn´ıch rovnic. Lemma 47. Necht’ A je matice typu m × n, P = A · A+ , Q = A+ · A a necht’ X je n-rozmˇern´y a Y m-rozmˇern´y vektor. Pak plat´ı: (a) ||A · X + (Im − P ) · Y ||2 = ||A · X||2 + ||(Im − P ) · Y ||2 , (b) ||A+ · Y + (In − Q) · X||2 = ||A+ · Y ||2 + ||(In − Q) · X||2 . D˚ ukaz. (a) Poloˇzme R = A · X, S = (Im − P ) · Y. Pak R, S jsou m-rozmˇern´e vektory a plat´ı: (R, S) = (A·X, (Im −P )·Y ) = ((Im −P )·Y )∗ ·A·X = Y ∗ ·(Im −P )·A·X = = Y ∗ · A · X − Y ∗ · A · A+ · A · X = Y ∗ · A · X − Y ∗ · A · X = 0. Tud´ıˇz R,S jsou ortogon´aln´ı vektory a platnost identity v (a) plyne z Pythagorovy vˇety. (b) V´ yrok (b) dostaneme z v´ yroku (a) z´amˇenou: A −→ A+ , X −→ Y, Y −→ X, P −→ Q, m −→ n.
Z´ avˇerem tohoto odstavce se zamˇeˇr´ıme na syst´em line´arn´ıch rovnic. Pˇripomeˇ nme, ˇze syst´em m line´arn´ıch rovnic o n nezn´am´ ych je syst´em rovnic v maticov´em tvaru: 37
(S) kde
A·X = B ,
a11 . A = .. am1
... ... ...
a1n .. . amn
je matice soustavy typu m × n, aij ∈ C jsou koeficienty u nezn´am´ ych, X je vektor nezn´am´ ych:
x1 b1 . . . . X = . aB = . xn bm
je m-rozmˇern´ y vektor absolutn´ıch ˇclen˚ u, bj ∈ C.
Za v´ yznaˇcn´e ”ˇreˇsen´ı”syst´emu line´arn´ıch rovnic (S) budeme povaˇzovat n´asleduj´ıc´ı n-rozmˇern´ y vektor X0 definovan´ y rovnost´ı X0 = A+ · B . D˚ uvodem pro tento v´ ybˇer vektoru X0 je n´asleduj´ıc´ı vˇeta. Vˇ eta 48. Hlavn´ı vˇ eta. Pro kaˇzd´y n-rozmˇern´y vektor X ∈ Cn , X 6= X0 m´ ame: ||A · X0 − B|| ≤ ||A · X − B|| a v pˇr´ıpadˇe ||AX0 − B|| = ||AX − B|| plat´ı ||X0 || < ||X|| . Tud´ıˇz vektor X0 minimalizuje normu ||AX − B|| a ze vˇsech n-rozmˇern´ ych vektor˚ u X, kter´e minimalizuj´ı tuto normu m´a nejmenˇs´ı normu. Vektor X0 se naz´ yv´a ˇreˇsen´ı syst´emu (S) vzhledem k nejmenˇs´ım ˇctverc˚ um s minim´ aln´ı normou nebo
38
nejlepˇs´ı pˇribliˇzn´e ˇreˇsen´ı syst´emu (S) ( the least squares solution to the system (S) with minimum norm). ([Da,Ga]). D˚ ukaz hlavn´ı vˇety. Pro n-rozmˇern´ y vektor X plat´ı: A · X − B = A · (X − A+ · B) + (Im − A · A+ ) · (−B). Pouˇzijeme-li tuto rovnost na lemma 47(a), ve kter´em X bude znaˇcit X − A+ · B a Y bude znaˇcit - B, dostaneme ||A · X − B||2 = ||A · (X − A+ · B)||2 + ||(Im − A · A+ ) · (−B)||2 = = ||A · (X − X0 )||2 + ||A · X0 − B||2 . Odtud plyne ||A · X − B|| ≥ ||A · X0 − B|| a rovnost nastane, pr´avˇe kdyˇz A · X = A · X0 . Pˇredpokl´adejme, ˇze A · X = A · X0 . Pak A+ · A · X = = A+ · A · X0 = A+ · A · A+ · B = X0 . Dost´av´ ame tedy rovnosti: X − X0 = (In − A+ · A) · X, X = A+ · B + (In − A+ · A) · X . Pouˇzijeme-li pro tuto rovnost lemma 47 (b), ve kter´em roli vektoru Y hraje vektor B, dostaneme ||X||2 = ||A+ · B||2 + ||(In − A+ · A) · X||2 = ||X||2 + k|X − X0 ||2 . Jelikoˇz X 6= X0 , m´ame ||X − X0 || > 0, odkud plyne ||X0 || < ||X|| a hlavn´ı vˇeta je dok´ az´ana.
Pˇ r´ıklad 49. Naleznˇete ˇreˇsen´ı n´asleduj´ıc´ıho syst´emu vzhledem k nejmenˇs´ım ˇctverc˚ um s minim´aln´ı normou:
x + 4y + +3z = 2 −x + y + 2z = −2 −2x − 2y
39
= 1.
Matice t´eto soustavy je matice
1
A = −1 −2
Vektory
2
4
3
2 . −2 0 1
x
B = −2 , X = y z 1
jsou vektory absolutn´ıch ˇclen˚ u a nezn´am´ ych.
Hodnost matice A soustavy je rovna 2 a hodnost rozˇs´ıˇren´e matice soustavy ( A B) je rovna 3, tud´ıˇz soustava nem´ a ˇreˇsen´ı, ale existuje ”ˇreˇsen´ı”X0 t´eto soustavy vzhledem k nejmenˇs´ım ˇctverc˚ um s minim´aln´ı normou. K z´ısk´ an´ı tohoto ”ˇreˇsen´ı”pouˇzijeme psedoinverzi matice A, kter´a byla vypoˇctena v pˇr´ıkladu 33:
A+ =
Odtud pak dostaneme
1 231
3
−43
−54
27 24
−2
−24 . 30
X0 = A+ · B =
41
1 231
38
34 . −4
Pozn´ amka. Pro nejlepˇs´ı pˇribliˇzn´e ˇreˇsen´ı X0 syst´emu (S) je sice norma ||A · X − B|| minim´aln´ı, ale vektor X0 nemus´ı b´ yt jedin´ y vektor X, pro kter´ y je tato norma minim´aln´ı: Pˇ r´ıklad 50. Uvaˇzujme n´asleduj´ıc´ı syst´em line´arn´ıch rovnic o dvou nezn´am´ ych:
x + y = 1 x + y = 0. Matice tohoto syst´emu A a matice B absolutn´ıch ˇclen˚ u jsou d´any identitami:
40
A =
1
1
1
1
!
, B =
1 4
Pro psudoinverzi A+ m´ame A+ =
1 0
!
.
· A, odkud plyne pro nejlepˇs´ı pˇribliˇzn´e
ˇreˇsen´ı
X0
!
1
1 = 4
1
.
Pak A · X0
−1
1 − B = 2
1
!
a pro minim´aln´ı normu normy ||A · X − B|| m´ame ||A · X0 − B||2 =
1 . 2
Na pˇr. pro vektor X: 1 2
X =
0
!
dostaneme ||A · X − B||2 =
6
1 2
a ||X0 ||2 =
1 8
<
1 4
= ||X||2 .
V´ aˇ zen´ a inverze a obecn´ a involuce.
V aplikac´ıch matematiky se ˇcasto pouˇz´ıv´a pseudoinverzn´ı matice a to pˇrev´ aˇznˇe v oblasti numerick´ ych metod a v matematick´e statistice. V tˇechto oblastech se definuje pseudoinverze pro matice, kter´e maj´ı prvky re´aln´a ˇc´ısla. Jestliˇze pouˇzijeme napˇr. vˇeu o skeletn´ım rozkladu, odvod´ıme tvrzen´ı, ˇze pseudoinverzn´ı matice matice, jej´ıˇz prvky jsou re´ aln´a ˇc´ısla, m´a tak´e prvky jen re´aln´a ˇc´ısla. Pro tyto matice definoval J.S.Chipman (1968) ([Chi]) t.zv. v´ aˇzenou inverzi (the weighted inverse) n´asledovnˇe:
41
Definice 51. Pro pˇrirozen´ a ˇc´ısla k,m bud’te U,V ˇctvercov´e matice ˇra´du k,m, kter´e maj´ı prvky re´ aln´ a ˇc´ısla a kter´e jsou pozitivnˇe definitn´ı. Bud’ A matice, jej´ıˇz prvky jsou re´ aln´ a ˇc´ısla, typu m × k. Matice X, jej´ıˇz prvky jsou re´aln´a ˇc´ısla typu k × m se naz´ yv´a v´ aˇzen´ a inverze matice A (the weighted inverse of A), jestliˇze plat´ı: (1)
(2)
A · X · A = A, X · A · X = X ,
A · X · V = V · X T · AT , X · A · U = U · AT · X T .
Tato v´ aˇzen´ a inverze vˇzdy existuje a je jednoznaˇcnˇe urˇcena. Pozn´ amka. Pro pˇrirozen´e ˇc´ıslo n mnoˇzinu vˇsech sloupcov´ ych vektor˚ u rozmˇeru n (tj. matic typu n × 1), kter´e maj´ı prvky re´ aln´a ˇc´ısla oznaˇc´ıme Rn . Vektory s touto vlastnost´ı budeme naz´ yvat re´ aln´e vektory. Pˇripomeˇ nme, ˇze pozitivnˇe definitn´ı matice je symetrick´ a matice M s re´aln´ ymi prvky s vlastnost´ı: (R) X ∈ Rn , X 6= 0n =⇒ X T · M · X > 0, kde n znaˇc´ı ˇra´d matice M. Jestliˇze matice M m´a komplexn´ı prvky a je hermitovsk´ a ˇra´du n, pak ˇrekneme, ˇze je pozitivnˇe definitn´ı, jestliˇze plat´ı: (K) X ∈ Cn , X 6= 0n =⇒ X ∗ · M · X > 0, V n´asleduj´ıc´ım tvrzen´ı uk´aˇzeme, ˇze pro matici s re´ aln´ ymi prvky, kter´a je symetrick´ a, jsou podm´ınky (R) a (K) ekvivalentn´ı. Tvrzen´ı 52. Necht’ M je symetrick´ a matice ˇr´ adu n, kter´ a m´ a re´ aln´e prvky. Pak jsou vlastnosti (R) a (K) ekvivalentn´ı. D˚ ukaz. Zˇrejmˇe (K) implikuje (R). Jelikoˇz matice M je symetrick´ a s re´aln´ ymi prvky a je pozitivnˇe definitn´ı, existuje ortogon´aln´ı matice (re´ aln´a) P ˇra´du n a diagon´aln´ı matice
42
D=
d1
0
...
0 .. .
d2 .. .
... .. .
0
...
0
0 .. . , 0
dn
kde d1 , . . . , dn jsou kladn´a re´ aln´a ˇc´ısla, s vlastnost´ı: M = P · D · PT. Pˇredpokl´adejme, ˇze plat´ı (R) a necht’ X ∈ Cn y1 . T Y = P · X = .. yn
Pak Y ∗ = X ∗ · P a
X∗ · M · X = X∗ · P · D · P T · X = Y ∗ · D · Y =
je nenulov´ y. Poloˇzme .
n X
y i y i di =
i=1
6.1
n X
|yi |2 · di > 0.
i=1
Obecn´ a involuce a zobecnˇ en´ a inverze
Zavedeme nyn´ı obecn´ y pojem involuce, kter´ y n´am uk´aˇze bliˇzˇs´ı vztah pojmu ”v´ aˇzen´ a inverze”k pojmu ”Moore-Penroseova inverze matice”. Pro dalˇs´ı u ´vahy oznaˇcme symbolem M mnoˇzinu vˇsech matic, jejichˇz prvky jsou komplexn´ı ˇc´ısla. Definice 53. Zobrazen´ı ⊛ mnoˇziny M do sebe (⊛ : M −→ M) se naz´ yv´a involuce (na mnoˇzinˇe M), jestliˇze pro kaˇzdou matici X ∈ M a pro matice A, B ∈ M vhodn´ ych typ˚ u pro n´asoben´ı plat´ı: (X ⊛ )⊛ = X, (A · B)⊛ = B ⊛ · A⊛ . Zˇrejmˇe involuce je bijekce mnoˇziny M na M. Oper´ ator transpozice hermitovsk´y oper´ ator
∗
T
a
jsou involuce.
V tomto odstavci ud´ ame popis vˇsech involuc´ı na mnoˇzinˇe M podle ˇcl´anku ([Sk1],1998). Tento popis bude z´aviset na pojmu involutorn´ıho automorfismu tˇelesa komplexn´ıch ˇc´ısel C.
43
Definice 54. Automorfismus tˇelesa komplexn´ıch ˇc´ısel f nazveme involutorn´ı, jestliˇze plat´ı: f 2 = f ◦ f = idC . Symbol idC znaˇc´ı identitu na mnoˇzinˇe komplexn´ıch ˇc´ısel C. Oznaˇcme symbolem σ zobrazen´ı, kter´e kaˇzd´emu komplexn´ımu ˇc´ıslu pˇriˇrazuje jeho komplexnˇe sdruˇzen´e ˇc´ıslo. Zobrazen´ı idC a σ jsou involutorn´ı automorfismy. Tˇechto involutorn´ıch automorfism˚ u je vˇsak daleko v´ıce. V ˇcl´anku ([Sk1]) bylo uk´az´amo, ˇze mnoˇzina vˇsech involutorn´ıch automorfism˚ u tˇelesa C m´a mohutnost exp exp ℵ0 . Definice 55. Necht’ f je involutorn´ı automorfismus tˇelesa komplexn´ıch ˇc´ısel. Pro matici A = [aij ] ∈ M typu m × n necht’
Af
f (a11 ) .. = . f (a1n )
... ... ...
je matice typu n × m, tedy
f (am1 ) .. = (f (aij ))T . f (amn )
Af = [blk ] (1 ≤ l ≤ n, 1 ≤ k ≤ m), blk = f (akl ) . Snadno se dok´ aˇze Tvrzen´ı 56. Bud’ f involutorn´ı automorfismus tˇelesa komplexn´ıch ˇc´ısel. Pak (1) (Af )f = A pro kaˇzd´e A ∈ M. (2) Jestliˇze A,B ∈ M jsou matice vhodn´ych typ˚ u pro n´ asoben´ı, pak B f , Af maj´ı tak´e typy vhodn´e pro n´ asoben´ı a plat´ı: (A · B)
f
= B f · Af .
(3) Jestliˇze A ∈ M je regul´ arn´ı matice, pak matice Af je tak´e regul´ arn´ı a plat´ı: (Af )−1 = (A−1 )f . (4) Jestliˇze A,B ∈ M jsou matice stejn´ych typ˚ u, pak matice Af , B f jsou tak´e stejn´ych typ˚ u a plat´ı: 44
(A + B)
f
= Af + B f .
Pro charakteristiku involuce je potˇrebn´ y dalˇs´ı pojem f-hermitovsk´e matice: Definice 57. Pro involutorn´ı automorfismus f a matici A ∈ M ˇrekneme, ˇze matice A je f-hermitovsk´ a, jestliˇze je ˇctvercov´ a a plat´ı Af = A. Pozn´ amka. Jestliˇze f = idC , pak matice A je f-hermitovsk´ a, pr´ avˇe kdyˇz je symetrick´ a. Jestliˇze f je komplexn´ı konjugovanost - tedy f = σ, pak matice A je f-hermitovsk´ a, pr´ avˇe kdyˇz je hermitovsk´ a. N´ asleduj´ıc´ı dvˇe vˇety ud´ avaj´ı ˚ uplnou charekterzaci involuce ([Sk1]. Vˇ eta 58. Bud’ f involutorn´ı automorfismus tˇelesa C a necht’ pro kaˇzd´e pˇrirozen´e ˇc´ıslo n je An regul´ arn´ı f-hermitovsk´ a matice. Pro matici X ∈ M typu p × q poloˇzme: X ⊛ = Aq · X f · A−1 . p Pak ⊛
: M −→ M
je involuce na mnoˇzinˇe M.
Vˇ eta 59. Necht’
⊛
: M −→ M je involuce. Pak existuje involutorn´ı auto-
arn´ıch f-hermitovs´ych matic morfismus f tˇelesa C a posloupnost {An }∞ n=1 regul´ An ˇr´ adu n tak, ˇze pro kaˇzdou matici X ∈ M typu p × q m´ ame: X ⊛ = Aq · X f · A−1 . p Odtud snadno plyne uˇzit´ım tvrzen´ı 56(4) d˚ usledek: Tvrzen´ı 60. Necht’
⊛
je involuce. Pak pro matice A, B ∈ M stejn´ych typ˚ u
m´ ame
45
(A + B)
⊛
= A⊛ + B ⊛ .
Zavedeme nyn´ı pojem zobecnˇen´e inverze vzhledem k involuci. Definice 61. Necht’
⊛
je involuce a A ∈ M je matice typu m × n. Matici
X ∈ M typu n × m budeme naz´ yvat zobecnˇen´ a inverze (pseudoinverze) matice A vzhledem k involuci
⊛
, jestliˇze jsou splnˇeny n´asleduj´ıc´ı podm´ınky:
AXA = A, XAX = X, (AX)⊛ = AX, (XA)⊛ = XA . V pˇr´ıpadˇe, ˇze involuce
⊛
je hermitovsk´ y oper´ ator ∗ , je zobecnˇen´ a inverze
rovna Moore-Penroseovˇe inverzi matice. Stejnˇe jako vtomto pˇr´ıpadˇe se d´a uk´azat, ˇze v pˇr´ıpadˇe existence zobecnˇen´e inverze matice A vzhledem k involuci je tato zobecnˇen´ a inverze jednoznaˇcnˇe urˇcena. Budeme ji znaˇcit symbolem A⊕ . Ot´azka, pro kterou involuci kaˇzd´ a matice m´a zobecnˇenou inverzi vzhledem k t´eto involuci se ˇreˇs´ı pomoc´ı pojmu f - definitn´ı matice: Definice 62. Necht’ f je involutorn´ı automorfismus tˇelesa komplexn´ıch ˇc´ısel C. ˇ Rekneme, ˇze ˇctvercov´ a matice A ∈ M ˇra´du n je f-definitn´ı, jestliˇze je f -hermitovsk´ a a pro kaˇzd´ y n-rozmˇern´ y sloupcov´ y vektor W ∈ Cn m´ame W f · A · W = 0 =⇒ W = 0n . N´ asleduj´ıc´ı vˇeta pod´av´ a charakteristiku involuce, kter´a m´a vlastnost, ˇze kaˇzd´ a matice m´a zobecnˇenou inverzi vzhledem k t´eto involuci. Vˇ eta 63. Necht’ involuce A =
{An }∞ n=1 , An
⊛
je urˇcena dvojic´ı [A, f ] (ve smyslu vˇety 59), kde
je f-hermitovsk´ a matice ˇr´ adu n a f je involutorn´ı automor-
fismus tˇelesa C. Pak jsou n´ asleduj´ıc´ı v´yroky ekvivalentn´ı: (a) Kaˇzd´ a matice A ∈ M m´ a zobecnˇenou inverzi vzhledem k involuci (b) Pro kaˇzd´e pˇrirozen´e ˇc´ıslo n je matice An f-definitn´ı.
46
⊛
.
Pˇ r´ıklad 64. Necht’ automorfismus tˇelesa komplexn´ıch ˇc´ısel f je komplexn´ı konjugovanost, tedy f = σ a necht’ pro kaˇzd´e pˇrirozen´e ˇc´ıslo n je An re´aln´a matice, kter´a je pozitivnˇe definitn´ı ˇra´du n. Bud’ ⊛ involuce na mnoˇzinˇe M, kter´a je vytvoˇrena automorfismem σ a posloupnost´ı {An }∞ ety 58. Matice n=1 ve smyslu vˇ An jsou σ - definitn´ı, tud´ıˇz kaˇzd´ a matice m´a zobecnˇenou inverzi vzhledem k involuci
⊛
.
Necht’ A je matice typu m × k a X je jej´ı zobecnˇen´ a inverze vzhledm k involuci
⊛
. Jelikoˇz
T T −1 (A · X)⊛ = Am · (A · X)T · A−1 m = Am · X · A · Am = A · X,
dost´ av´ ame odsud Am · X T · AT = = A · X · Am . Podobnˇe obdrˇz´ıme:
(X · A)⊛ = Ak · (X · A)T · A−1 = Ak · AT · X T · A−1 = X · A, k k odkud plyne Ak · AT · X T = X · A · A−1 k . Poloˇz´ıme-li U = Ak a V = Am , pak U,V jsou pozitivnˇe definitn´ı a plat´ı: A · X · V = V · X T · AT , X · A · U = U · AT · X T
,
tedy X je v´ aˇzen´ a inverze ve smyslu definice 51. Pˇri vyˇsetˇrov´ an´ı involuc´ı, pˇri kter´ ych m´a kaˇzd´ a matice pseudoinverzi a vytvoˇren´ ych pomoc´ı automorfismu komplexn´ı konjugovanosti σ, m˚ uˇzeme se omezit na posloupnosti {An }∞ e definitn´ı. Pˇresnˇeji je to n=0 , kde matice An jsou pozitivnˇ pod´ano v n´asleduj´ıc´ı vˇetˇe: Vˇ eta 65. Necht’
⊛
je involuce vytvoˇren´ a automorfismem σ a posloupnost´ı re-
gul´ arn´ıch σ-definitn´ıch matic {An }∞ n=0 . Pak existuje involuce
♦
vytvoˇren´ a
automorfismem σ a posloupnost´ı pozitivnˇe definitn´ıch matic {Bn }∞ ze n=0 tak, ˇ kaˇzd´ a matice A m´ a stejnou pseudoinverzi vzhledem k involuc´ım 47
⊛
a ♦.
D˚ ukaz. Pˇredpokl´adejme, ˇze involuce konjugovanosti σ a
⊛
je vytvoˇrena automorfismem komplexn´ı
posloupnost´ı {An }∞ n=0
symetrick´ ych, regul´ arn´ıch, σ-definitn´ıch
matic An a pro cel´e nez´aporn´e ˇc´ıslo n poloˇzme:
εn =
(
1,
jestliˇze
An je pozitivnˇe definitn´ı
−1,
jestliˇze
An je negativnˇe definitn´ı,
Bn = εn An . Pak pro kaˇzd´e cel´e nez´aporn´e ˇc´ıslo n je matice Bn pozitivnˇe definitn´ı a ♦ je vytvoˇrena automorfismem komplexn´ı = εn A−1 n . Necht’ involuce
Bn−1
konjugovanosti σ a posloupnost´ı pozitivnˇe definitn´ıch matic Bn . Pro matici A typu m × k a jej´ı pseudoinverzi X jsou spnˇeny Penroseovy podm´ınky (1) a (2) a plat´ı A · X = (A · X)⊛ = Ak · (A · X)σ · A−1 k . Pro involuci ♦ m´ame = A·X. = Ak ·(A·X)σ ·A−1 (A·X)♦ = Bk ·(A·X)σ ·Bk−1 = εk Ak ·(A·X)σ εk A−1 k k Analogicky se uk´aˇze rovnost (X · A)♦ = X · A, odkud dost´ av´ ame, ˇze matice X je souˇcasnˇe pseudoinverze vzhledem k involuci ♦
matice A.
6.2
V´ aˇ zen´ a inverze a norma, ˇ reˇ sen´ı syst´ emu line´ arn´ıch rovnic vzhledem k minim´ aln´ı v´ aˇ zen´ e normˇ e
V dalˇs´ımm budeme pˇredpokl´adat, ˇze automorfismus f tˇelesa komplexn´ıch ˇc´ısel C je komplexn´ı konjugovanost, tedy f
= σ, a pro kaˇzd´e pˇrirozen´e ˇc´ıslo n
m´a matice An re´ aln´e prvky, je pozitivnˇe definitn´ı a d´a se t´eˇz pˇredpokl´adat A1 = (1). Dvojice ({An }∞ ety 58 involuci ⊛ a podobnˇe n=1 , σ} definuje ve smyslu vˇ jako pro hermitovsk´ y oper´ ator
∗
definujeme pro vektory X, Y ∈ C jejich vnitˇrn´ı
souˇcin (X, Y ) n´asledovnˇe:
48
(X, Y ) : = Y ⊛ · X = Y σ · A−1 n · X. Norma ||X||e vektoru X se pak definuje vzorcem:
||X||e : =
p
(X, X) =
p
X σ · A−1 n ·X .
Jelikoˇz matice A−1 a re´ aln´e prvky a je symetrick´ a, existuje ortogon´aln´ı n m´ matice P ˇra´du n tak, ˇze
P T · A−1 n ·P = D , kde
D =
d1
0
...
0 .. .
d2 .. .
... .. .
0
...
0
0 .. . 0
dn
a prvky d1 , . . . , dn jsou re´ aln´a, kladn´a ˇc´ısla. Pro X ∈ Cn poloˇzme
Pak X = P · Z a
z1 . . Z : = PT · X = . . zn
X ⊛ = A1 · (P · Z)σ · A−1 = Z σ · P T · A−1 n n , odkud plyne σ ||X||2e = (X, X) = X ⊛ · X = Z σ · P T · A−1 n · P · Z = Z · D · Z,
tud´ıˇz
||X||e =
pP n
i=1 z¯i zi di
49
=
pP n
i=1
|zi |2 di .
V pˇr´ıpadˇe, ˇze vektor X = (x1 , . . . , xn )T m´a re´ aln´e prvky xi , dostaneme
||X||e =
pP n
2 i=1 zi di
.
Norma ||.||e se naz´ yv´a elipsoidn´ı norma nebo v´ aˇzen´ a euklidovsk´ a norma (ellipsoidal nebo weighted Euclidean norm). Tento pojem je moˇzno pouˇz´ıt na syst´em line´arn´ıch rovnic (nad tˇelesem C i tˇelesem R) podobnˇe jako v pˇr´ıpadˇe Moore-Penroseovy inverze pro definici a vlastnost ˇreˇsen´ı syst´emu line´ arn´ıch rovnic vzhledem k nejmenˇs´ım ˇctverc˚ um s minim´ aln´ı normou n´aledovnˇe: Vˇ eta 66. Necht’ A ∈ Mmn , B ∈ Cm a necht’: X0 = A⊕ · B . Pak pro kaˇzd´y vektor X ∈ Cn , X 6= X0 plat´ı (1)
||A · X − B||e > ||A · X0 − B||e
nebo (2)
||A · X − B||e = ||A · X0 − B||e a ||X||e > ||X0 ||e .
Vektor X0 m˚ uˇzeme pak nazvat ˇreˇsen´ı syst´emu line´ arn´ıch rovnic vzhledem k minim´ aln´ı v´ aˇzen´e normˇe.
Reference [An] Andˇel,J., Matematick´ a statistika, SNTL, Praha, 1985. [BG] Ben-Israel,A., Greville,T.N.E., Generalized Inverses, Theory and Applications, Springer-Verlag, New York, 2003, Second Edition. [Da] Davis,P.J., Circulant Matrices, New York,1994, Second Edition.
50
[DMP] Doty,K.L., Melchiorri,C., Bonivento,C., A Theory of Generalized Inverses Applied to Robotics, The international Journal of Robotics, 1992, 36pp. [Ga] Gantmacher,F.R., The Theory of Matrices,Chelsea, New York,1959, anglick´ y pˇreklad z ruˇstiny. [Chi] Chipman,J.S., Specification problems in regression analysis, in Proceedings of the Symposium on Theory and Applications of Generalized Inverses of Matrices (T.L.Boullion and P.L.Odell, Eds.), 1968, pp. 114-176. [KS] Kar´asek,J., Skula,L., Line´ arn´ı algebra, Teoretick´ a ˇc´ast, Brno, VUT FS, 2012, 3.vyd´an´ı. [PO] Piziak,R., Odell,P.L., Matrix Theory, From Generalized Inverses to Jordan Form, Chapman&Hall/CRC,2007. [Sea] Searle,S.S., Matrix Algebra Useful for Statistics, New York, 1982. [Sk1] Skula,L., Involutions for matrices and generalized inverses, Linear Algebra and its Applications, 271 (1998), 283 - 308. [Sk2] Skula,L., Moore-Penroseova inverze matice a jej´ı aplikace, Kvaternion, 1/2013, 7 - 14. ˇ Sik,F., ˇ [Si] Line´ arn´ı algebra zamˇeˇren´a na numerickou anal´ yzu, Brno, MU, 1998. [YTT] Yanai,H., Takeuchi,K., Takane,Y., Projection Matrices, Generalized Inverse Matrices, and Singular Value Decomposition, Springer, 2011.
51