13. EUKLIDESZI ÉS UNITÉR VEKTORTEREK A korábbi fejezetekben már láthattuk, hogy a vektorterek egyik legszemléletesebb példája a geometriai sík, illetve tér vektorainak struktúrája. A vektorterek elméletének eddig tárgyalt témakörei azonban nem teszik lehetővé a geometria fontos metrikus feladatainak általánosítását. Ebben a fejezetben ezt a feladatot valós és komplex számtest feletti vektorterekre végezzük el. Látni fogjuk, hogy az így nyert euklideszi és unitér vektorterekben értelmezhetjük vektorok hosszát, távolságát, hajlásszögét, illetve merőlegességét és bebizonyíthatjuk a geometria számos eredményének lineáris algebrai általánosítását. Legyen V a valós számok ℝ teste feletti vektortér és ABil(V×V,ℝ) egy rögzített pozitív definit, szimmetrikus bilineáris funkcionál. Az (ℝ,V,A) struktúrát euklideszi vektortérnek nevezzük, a kitüntetett A bilineáris funkcionált pedig skaláris, vagy belső szorzatnak hívjuk és az xy≔A(x,y) szimbólummal jelöljük. Az értelmezésből azonnal következik, hogy az euklideszi vektortér skaláris szorzatát a következő tulajdonságokkal jellemezhetjük. Minden x1,x2,x,yV és minden rℝ esetén (R.1) (x1+x2)y=x1y+x2y , (R.2) (rx)y=r(xy) , (R.3) xy=yx , (R.4) xx≥0 és xx=0 akkor és csakis akkor, ha x=0 . Megjegyezzük, hogy az euklideszi vektorteret definiálhatjuk úgy is, mint egy olyan ℝ feletti V vektorteret, amelyben értelmezve van egy skaláris szorzatnak nevezett A:V×V→ℝ, (x,y)→xy leképezés, amely eleget tesz az (R.1)-(R.4) tulajdonságoknak.
135
13.1. Példa: A geometriai vektorok G3 vektortere az xy≔|x|·|y|·cos(x,y)∢ skaláris szorzattal egy euklideszi vektortér, ahol |x|, illetve |y| az egyes vektorok hosszát, (x,y)∢ pedig a vektorok hajlásszögének radiánban vett mértékét jelenti. A rendezett valós szám n-esek ℝ n vektortere az (x1,...,xn)·(y1,...,yn)≔ ≔x1y1+...+xnyn skaláris szorzattal egy euklideszi vektorteret alkot. Az [a,b]ℝ zárt intervallumon értelmezett valós értékű folytonos b
függvények vektortere az (f(x),g(x))→ f ( x) g ( x)dx skaláris szorzattal szina
tén egy példa euklideszi vektortérre. Legyen ezután V a komplex számok ℂ
teste feletti vektortér
H Bil (V×V,ℂ) pedig egy rögzített pozitív definit hermitikus funkcionál. Ekkor a (ℂ,V,H) struktúrát unitér vektortérnek, a kitüntetett H hermitikus funkcionált pedig skaláris, vagy belső szorzatnak nevezzük és az xy≔H(x,y) szimbólummal jelöljük. Könnyen megmutatható, hogy az unitér vektortér skaláris szorzatát a következő tulajdonságokkal jellemezhetjük. Minden x1,x2,x,yV és minden cℂ esetén (C.1) (x1+x2)y=x1y+x2y , (C.2) (cx)y=c·(xy) , (C.3)
xy =yx ,
(C.4) xx≥0 és xx=0 akkor és csakis akkor, ha x=0 . Látható, hogy az unitér vektorteret értelmezhetjük úgy is, mint egy olyan ℂ feletti V vektorteret, amelyben értelmezve van egy skaláris szorzatnak nevezett H:V×V→ℂ, (x,y)→xy leképezés, ami eleget tesz a (C.1)-(C.4) tulajdonságoknak.
136
13.2. Példa: A rendezett komplex szám n-esek ℂ n vektortere az (x1,...,xn)·(y1,...,yn)≔ ≔x1 y1 +...+xn y n skaláris szorzattal egy unitér vektortér. Az [a,b]ℝ zárt intervallumon értelmezett komplex értékű folytonos függb
vények vektortere az (f(x),g(x))→ f ( x) g ( x)dx skaláris szorzattal szintén a
egy unitér vektorteret alkot. Az euklideszi és az unitér vektortér között értelmezésükből adódóan szoros kapcsolat áll fenn, ami lehetővé teszi e két típusú vektortér elméletének párhuzamos vizsgálatát. Valóban, a valós, illetve a komplex skaláris szorzatot jellemző tulajdonságokat összehasonlítva megállapíthatjuk, hogy a (C.1)-(C.4) a megfelelő (R.1)(R.4) természetes általánosítása. A komplex skaláris szorzat (C.1)-(C.4) tulajdonságaiból levezetett eredmények ezért a valós esetben is érvényesek lesznek azzal a megjegyzéssel, hogy ekkor a konjugálás figyelmen kívül hagyható. Ezt a megállapítást szem előtt tartva együtt tárgyaljuk a két elméletet. Tekintettel a fentiekre az euklideszi és az unitér vektortér közös elnevezésére bevezetjük a skaláris szorzatos vektortér fogalmát. Ez tehát egy valós, vagy komplex számtest feletti vektortér, amelyben a rendezett vektorpárok halmazán értelmezve van egy olyan valós, illetve komplex számértékű függvény, amely eleget tesz a (C.1)-(C.4) tulajdonságoknak. Legyen most V egy skaláris szorzatos vektortér. A skaláris szorzat (C.4) tulajdonsága miatt xx minden xV vektorra egy nem negatív valós szám, s ezért képezhetjük xx valós négyzetgyökét, amely egy jól meghatározott, s szintén nem negatív érték. Ekkor az ||x||≔ xx összefüggéssel definiált valós számot az x vektor normájának nevezzük, a || ||:V→ℝ, x→ xx függvényt pedig norma függvénynek hívjuk. A norma függvény tulajdonságainak vizsgálata előtt egy nevezetes egyenlőtlenséget mutatunk be.
137
13.3. Állítás: (Cauchy-Schwarz egyenlőtlenség) Ha V egy skaláris szorzatos vektortér, akkor tetszőleges x,yV esetén érvényes az |xy|≤||x||·||y|| egyenlőtlenség, amelyben az egyenlőség pontosan akkor áll fenn, ha x és y lineárisan összefüggő vektorok. Bizonyítás: A V vektortér véges dimenziós x,y generált alterére alkalmazva a 11.30. és a 12.23. állítást könnyen beláthatjuk, hogy a V skaláris szorzatos vektortér tetszőleges x,yV vektorpárjára teljesül az |xy|2≤(xx)(yy) egyenlőtlenség, továbbá az egyenlőség pontosan x és y lineáris összefüggése esetén áll fenn. Ezen egyenlőtlenség mindkét oldalából valós négyzetgyököt vonva |xy|≤ xx yy következik, amelyből a norma értelmezését figyelembe véve közvetlenül adódik a bizonyítandó állítás. Vegyük észre, hogy a Cauchy-Schwarz egyenlőtlenséget eredményező |xy| ≤(xx)·(yy) az |xy|2=(xy) (xy) =(xy)(yx) átalakítás felhasználásával helyettesíthető az (xy)(yx)≤(xx)·(yy) egyenlőtlenséggel, amelynek egyszerű átrendezésével (xx)(yy)-(xy)(yx)≥0 adódik. Az így nyert egyenlőtlenség bal oldala egy másodrendű mátrix determinánsának tekinthető, s ezzel beláttuk az alábbi következmény helyességét. 2
13.4. Következmény: A V skaláris szorzatos vektortér minden x,yV vektorpárjára érvényes a xx xy 0 det yx yy
egyenlőtlenség, amelyben az egyenlőség akkor és csakis akkor áll fenn, ha x és y lineárisan összefüggő vektorok. Ez a következmény jól mutatja, hogy a Cauchy-Schwarz egyenlőtlenség egy különleges esete a skaláris szorzatos V vektortér valamely vektorrendszerének lineáris összefüggőségét eldöntő alábbi általános tételnek. 138
13.5. Állítás: (Gram tétele) Legyen {f1,...,fk} a skaláris szorzatos V vektortér egy tetszőleges vektorrendszere. Ekkor teljesül a
f1f1 f1f 2 f1f k f 2 f1 f 2 f 2 f 2 f k G (f1 ,..., f k ) : det 0 f k f1 f k f 2 f k f k Gram-féle egyenlőtlenség, ahol az egyenlőség akkor és csakis akkor áll fenn, ha az {f1,...,fk} egy lineárisan összefüggő vektorrendszer. Bizonyítás: A V vektortér véges dimenziós f1,...,fkgenerált alterére alkalmazzuk a 11.29. és a 12.22. állítást, amelyekből már közvetlenül következik az állítás. 13.6. Állítás: A skaláris szorzatos V vektortér norma függvénye az alábbi tulajdonságokkal rendelkezik: (1) ||x||≥0 és ||x||=0 akkor és csakis akkor, ha x=0 , (2) ||c·x||=|c|·||x|| , (3) ||x+y||≤||x||+||y|| , (Minkowski egyenlőtlenség) minden x,yV és c skalár esetén. Bizonyítás: A skaláris szorzat (C.4) tulajdonságából valós négyzetgyök vonással közvetlenül adódik a norma (1) tulajdonsága. Tetszőleges cC és xV esetén || c x || (cx)(cx) (cc ) (xx) | c | 2 xx | c | || x || bizonyítja a norma (2) tulajdonságát. Tetszőleges x,yV mellett
||x+y||2=(x+y)(x+y)=xx+xy+yx+yy=||x||2+xy+ xy +||y||2= =||x||2+2·Re(xy)+||y||2≤||x||2+2·|xy|+||y||2≤ ≤||x||2+2·||x||·||y||+||y||2=(||x||+||y||)2 139
következik. Ebben az okoskodásban a 13.3. állítás egyenlőtlenségén kívül a komplex számok elméletéből azt az egyszerű észrevételt használtuk fel, hogy konjugált komplex számpár összege valós részük kétszerese, továbbá hogy egy komplex szám valós része sohasem nagyobb a szám abszolút értékénél. A fenti becsléssel nyert ||x+y||2≤(||x||+||y||)2 egyenlőtlenség mindkét oldalán nem negatív valós szám négyzete áll, így gyökvonással közvetlenül adódik az ||x+y||≤||x||+||y|| Minkowski-féle egyenlőtlenség, ami a norma (3) tulajdonságát bizonyítja. Legyen V egy skaláris szorzatos vektortér. A norma fogalmára támaszkodva a V vektortérben a következőképpen értelmezzük vektorok távolságát. Ha x,yV, akkor az x vektornak y vektortól mért távolságán a d(x,y)≔||x-y|| összefüggéssel definiált nem negatív valós számot értjük, a d:V×V→ℝ, (x,y)→||x-y|| függvényt pedig távolság függvénynek nevezzük. 13.7. Állítás: A skaláris szorzatos V vektortér távolság függvénye a következő tulajdonságokkal rendelkezik: (1) (2) (3) (4)
d(x,y)≥0 és d(x,y)=0 akkor és csakis akkor, ha x=y , d(x,y)=d(y,x) , d(x,y)≤d(x,z)+d(z,y), (∆-egyenlőtlenség) d(x+z,y+z)=d(x,y)
minden x,y,zV esetén. Bizonyítás: A norma függvény (1) tulajdonságát felhasználva minden x,yV esetén d(x,y)=||x-y||≥0 és d(x,y)=||x-y||=0 akkor és csakis akkor, ha x-y=0 teljesül, így igaz a távolság függvény (1) tulajdonsága. A norma függvény (2) tulajdonsága szerint minden x,yV esetén d(x,y)= =||x-y||=||(-1)·(y-x)||=|-1|·||y-x||=d(y,x) adódik, tehát igaz a távolság függvény (2) tulajdonsága is. A norma függvény (3) tulajdonsága alapján tetszőleges x,y,zV mellett d(x,y)=||x-y||=||(x-z)+(z-y)||≤||x-z||+||z-y||=d(x,z)+d(z,y) teljesül, ami a távolság függvény (3) tulajdonságát bizonyítja. 140
Végül minden x,y,zV esetén d(x+z,y+z)=||(x+z)-(y+z)||=||x-y||=d(x,y) adódik, amely tulajdonságot a távolság eltolással szembeni invarianciájának nevezünk. Ezzel állításunkat bebizonyítottuk. Megjegyezzük, hogy az (1)-(3) tulajdonságokkal rendelkező távolság függvény a V skaláris szorzatos teret egy metrikus térnek nevezett struktúrává teszi. A metrikus tér tehát egy olyan nem üres halmaz, amelynek rendezett elempárjain értelmezve van egy olyan valós értékű függvény, amely eleget tesz a 13.7. állítás (1)-(3) tulajdonságainak. Legyen most V egy euklideszi vektortér és tekintsük a 13.3. állításban szereplő |xy|≤||x||·||y|| egyenlőtlenséget egy olyan x,yV vektorpár esetén, amelyre x≠0 és y≠0 teljesül. Ekkor a 13.6. állítás alapján ||x||>0 és ||y||>0, így ||x||·||y||>0 adódik, amellyel a szóban forgó egyenlőtlenség mindkét oldalát elosztva | xy | xy 1, azaz 1 || x || || y || || x || || y || következik. Ez utóbbi egyenlőtlenség a valós abszolút érték értelmezése szerint egyenértékű a xy 1 1 || x || || y || összefüggéssel, amelyből látható, hogy a benne szereplő tört felfogható egy jól meghatározott és a [0,π] intervallumba eső szög koszinuszaként, mivel az általa felvehető értékek a [-1,1] intervallumban találhatók. Ezért az x és y vektorok által bezárt szög definiálható úgy, hogy koszinusza a fenti egyenlőtlenségben szereplő tört legyen. Ha tehát x és y a V euklideszi vektortér nem zérus vektorai, akkor (x,y)∢ hajlásszögüket a xy cos(x,y)∢≔ || x || || y || összefüggéssel értelmezzük. 141
Minthogy unitér vektorterekben két vektor skaláris szorzata általában komplex szám, ezért nem értelmezzük két vektor hajlásszögét. Értelmezhetjük viszont a fenti definícióval összhangban mind euklideszi, mint pedig unitér vektorterekben két vektor merőlegességét, más szóval ortogonalitását. A V skaláris szorzatos vektortérben az x vektort akkor mondjuk ortogonálisnak az y vektorra, ha xy=0 teljesül; jelölése: xy. Az értelmezésből nyilvánvaló, hogy az ortogonalitás egy szimmetrikus reláció, így a továbbiakban egymásra ortogonális vektorokról beszélhetünk. 13.8. Állítás: (Pitagorasz tétele) Ha x és y a V skaláris szorzatos vektortér két egymásra ortogonális vektora, akkor érvényes az ||x+y||2=||x||2+||y||2 összefüggés. Bizonyítás: Ha x és y a V skaláris szorzatos vektortér ortogonális vektorai, akkor xy=yx=0, amiből ||x+y||2=(x+y)(x+y)=xx+xy+yx+yy=xx+yy= =||x||2+||y||2 következik, s ezzel állításunkat igazoltuk. Euklideszi vektorterek esetén ez az állítás az alábbiak szerint megfordítható. 13.9. Állítás: Ha x és y a V euklideszi vektortér olyan vektorai, amelyekre fennáll az ||x+y||2=||x||2+||y||2 összefüggés, akkor az x és y egymásra ortogonális vektorok. Bizonyítás: A V euklideszi vektortér tetszőleges x és y vektorára ||x+y||2=(x+y)(x+y)= =xx+xy+yx+yy=||x||2+2(xy)+||y||2 teljesül, amelyből állításunk ||x+y||2=||x||2+ +||y||2 feltevését felhasználva 2(xy)=0, azaz xy=0 következik, tehát x és y valóban egymásra ortogonális vektorok.
142
A V skaláris szorzatos vektortér egy {x1,x2,...,xk} vektorrendszerét ortogonális vektorrendszernek nevezzük, ha minden i≠j (1≤i,j≤n) indexpár esetén xixj=0 teljesül. A 11.15. és a 12.16. állításból közvetlenül adódik a következő 13.10. Állítás: Ha a V skaláris szorzatos vektortérben egy {x1,x2,...,xk} ortogonális vektorrendszer nem tartalmazza a 0 zérusvektort, akkor a vektorrendszer lineárisan független. Legyen ezután V egy véges dimenziós skaláris szorzatos vektortér. Ha valamely ortogonális vektorrendszer a V vektortér egy bázisa, akkor ezt ortogonális bázisnak nevezzük. Egy B={e1,e2,...,en} ortogonális bázist pedig ortonormált bázisnak mondunk, ha ||ei||= e i e i 1 (1≤i≤n) is teljesül. Más szóval B={e1,e2,...,en} egy ortonormált bázis akkor és csakis akkor, ha eiej=δij (1≤i,j≤n). A 11.16, 11.17. és a 12.17. állítás felhasználásával közvetlenül belátható a 13.11. Állítás: Minden n-dimenziós skaláris szorzatos V vektortérben létezik ortogonális, sőt ortonormált bázis is. A 13.11. állításban szereplő ortogonális, illetve ortonormált bázist a 11. fejezetben ismertetett Gram-Schmidt-féle ortogonalizációs eljárással szerkeszthetünk meg a V vektortér egy tetszőleges bázisából kiindulva. 13.12. Állítás: Az n-dimenziós skaláris szorzatos V vektortérben bármely ortogonális vektorrendszer kiegészíthető ortogonális bázissá, és bármely ortonormált vektorrendszer is kiegészíthető ortonormált bázissá. Bizonyítás: A 11.18. és a 12.18. következmény alapján igaz az állítás. Az ortonormált bázisok alkalmazásának előnyeit mutatja a következő állítás, amely egyszerű következménye a 11.19. és a 12.19. állításnak.
143
13.13. Állítás: Ha V egy n-dimenziós skaláris szorzatos vektortér és B={e1,...,en} ennek egy ortonormált bázisa, továbbá x,yV egy tetszőleges vektorpár az (x)B= =(x1,...,xn) és (y)B=(y1,...,yn) koordinátákkal, akkor érvényesek az xy x1 y1 ... xn y n || x || x1 x1 ... xn xn |x1| 2 ... |xn| 2
összefüggések. 13.14. Következmény: A 13.13. állítás jelöléseit alkalmazva tetszőleges x,yV esetén érvényesek az xei=xi és eiy= y i (1≤i≤n) összefüggések is. Bizonyítás: Mivel B={e1,...,en} az n-dimenziós skaláris szorzatos V vektortér egy ortonormált bázisa, ezért i (ei)B= (0,...,0, 1,0,...,0) (1≤i≤n), amiből a 13.13. állítás alkalmazásával továbbá
xei=x1·0+...+xi-1·0+xi·1+xi+1·0+...+xn·0=xi , eiy=0· y1 +...+0· yi 1 +1· y i +0· yi 1 +...+0· y n yi
következik minden 1≤i≤n esetén. 13.15. Állítás: (Parseval azonosság) Az n-dimenziós skaláris szorzatos V vektortér tetszőleges x,yV vektorpárjának skaláris szorzata előállítható az
144
n
xy (xei ) (e i y ) i 1
alakban, ahol B={e1,...,en} a V vektortér egy tetszőleges ortonormált bázisa. Bizonyítás: Alkalmazzuk a 13.13. állítást és annak 13.14. következményét. A 13.13. állítás eredményének euklideszi vektortérre történő alkalmazásával azonnal adódik a 13.16. Állítás: Ha V egy n-dimenziós euklideszi vektortér, B={e1,...,en} e vektortér egy tetszőleges ortonormált bázisa, továbbá x és y a V vektortér nem zérus vektorai az (x)B=(x1,...,xn) és (y)B=(y1,...,yn) koordinátákkal, akkor e két vektor (x,y)∢ hajlásszöge előállítható a n
xi y i
cos(x,y)∢=
i 1 n
n
xi y i 2
i 1
2
i 1
alakban. 13.17. Állítás: (Bessel-féle egyenlőtlenség) Ha V egy n-dimenziós skaláris szorzatos vektortér, {f1,...,fk} e vektortér egy ortonormált vektorrendszere, xV egy tetszőleges vektor és xi=xfi (1≤i≤k), akkor érvényes a k
2 2 |xi| || x ||
i 1
egyenlőtlenség. Bizonyítás: k
Alkalmazzuk az y≔x- xi f i V vektorra a skaláris szorzat tulajdonságait: i 1
145
k k k 0 yy x xi f i x x j f j xx x· x j f j i 1 j 1 j 1 k k k k xi f i x xi f i x j f j || x || 2 x j (xf j ) j 1 i 1 i 1 j 1 k
k
k
k
xi (f i x) xi x j (f i f j ) || x || 2 x j x j i 1
i 1 j 1
j 1
k
k
k
i 1
i 1
j 1
xi xi xi xi || x || 2 |x j |2 , s ebből már közvetlenül adódik a bizonyítandó egyenlőtlenség. Megjegyezzük, hogy az n-dimenziós skaláris szorzatos V vektortérre imént bizonyított Bessel-féle egyenlőtlenségben az egyenlőség jele pontosan akkor teljesül, ha xf1,...,fk. 13.18. Állítás: Bármely véges dimenziós valós, vagy komplex test feletti V vektortérben bevezethetünk egy skaláris szorzatot úgy, hogy egy előre megadott bázis ortonormált legyen. Bizonyítás: Legyen V egy n-dimenziós, valós vagy komplex test feletti vektortér és tekintsük ennek egy tetszőleges B={e1,e2,...,en} bázisát. Ha az x és y vektoroknak e bázisra vonatkozó koordinátái (x)B=(x1,x2,...,xn) és (y)B=(y1,y2,...,yn), akkor tekintsük az f:V×V→K, (x,y)→ x1 y1 x2 y2 ... xn yn leképezést, ahol K jelöli ℝ és ℂ valamelyikét. Ez a leképezés nyilvánvalóan kielégíti a skaláris szorzatra kirótt (R.1)-(R.4), illetve (C.1)-(C.4) követelményeket. Az így nyert (K,V,f) skaláris szorzatos vektortérben: eiej=f(eiej)=δij (1≤i,j≤n), tehát a kiindulási B bázis ortonormált lett, s ezzel állításunkat bizonyítottuk.
146
Legyen V egy n-dimenziós skaláris szorzatos vektortér. Ha W a V vektortér egy altere, akkor a W≔{xV|aW:ax=0} halmazt a W altér ortogonális komplementerének nevezzük. A W tehát a V vektortérnek azokból a vektoraiból áll, amelyek W minden vektorára merőlegesek. A 11.20. és a 12.20. állítás alapján igaz a 13.19. Állítás: Ha W a véges dimenziós skaláris szorzatos V vektortér egy tetszőleges altere, akkor érvényesek a következő összefüggések: (1) W«V ; (2) V=WW ; (3) W≔(W)=W . A fejezet további részeiben a skaláris szorzatos vektorterek lineáris transzformációival foglalkozunk. Először egy egyszerű, de a későbbiekben gyakran idézett lemmával ismerkedünk meg. 13.20. Lemma: Ha V egy skaláris szorzatos vektortér és az a,bV egy vektorpárra minden xV esetén fennáll az xa=xb egyenlőség, akkor ebből a=b következik. Bizonyítás: Ha minden xV esetén fennáll xa=xb, akkor x(a-b)=0 is teljesül. Válasszuk meg az x vektort úgy, hogy legyen x≔a-b, ekkor a fentiből (a-b)·(a-b)=0 következik. A norma értelmezése szerint így ||a-b||2=0, ezért ||a-b||=0, amiből 13.6. állítás (1) része miatt a-b=0, vagyis a=b adódik. 13.21. Állítás: Legyen V egy véges dimenziós skaláris szorzatos vektortér. A V vektortéren értelmezett minden L lineáris funkcionálhoz létezik egy és csakis egy olyan aV vektor, amellyel az L előállítható az L(x)=xa alakban. 147
Megfordítva, minden rögzített aV esetén az L(x)≔xa összefüggéssel értelmezett leképezés egy lineáris funkcionál. Bizonyítás: Legyen B={e1,...,en} a véges dimenziós skaláris szorzatos V vektortér egy ortonormált bázisa, xV egy tetszőleges vektor az (x)B=(x1,...,xn) koordinátákkal, s legyen L a V vektortéren értelmezett lineáris funkcionál. Ekkor x=x1e1+...+xnen, így L(x)=L(x1e1+...+xnen)=x1·L(e1)+...+xn·L(en), s ha ai≔ L(e i ) (1≤i≤n) és a a V vektortér azon jól meghatározott vektora, amelyre (a)B=(a1,...,an) teljesül, akkor L(x)= x1a1 ... xn an xa. Ezzel megmutattuk, hogy a V vektortéren értelmezett minden lineáris funkcionál előállítható a kívánt alakban. Ez az előállítás egyértelműen meghatározott, hiszen ha az L lineáris funkcionál előállítható L(x)=xa és L(x)=xb alakban is, akkor a minden xV vektorra fennálló xa=xb összefüggésből a 13.20. lemma felhasználásával a=b következik. Megfordítva, egyszerű számolással igazolhatjuk, hogy az L(x)≔xa összefüggéssel definiált leképezés egy lineáris funkcionál. Valóban, minden x1,x2,x vektor és k skalár esetén L(x1+x2)=(x1+x2)·a=x1a+x2a=L(x1)+L(x2), valamint L(kx)=(kx)a=k(xa)=k·L(x) teljesül, s ezzel állításunkat bizonyítottuk. 13.22. Állítás: Ha V egy véges dimenziós skaláris szorzatos vektortér, AEnd(V) egy lineáris transzformáció, akkor rögzített yV esetén az Ly(x)≔A(x)·y leképezés az x lineáris funkcionálja. Bizonyítás: Minden x1,x2,x vektorra és k skalárra
és
Ly(x1+x2)=A(x1+x2)·y=(A(x1)+A(x2))·y=A(x1)·y+A(x2)·y= =Ly(x1)+Ly(x2), Ly(kx)=A(kx)·y=(k·A(x))·y=k(A(x)·y)=k·Ly(x)
teljesül, így az Ly:V→K, x→A(x)·y leképezés valóban egy lineáris funkcionál. 148
A most bizonyított állításban láthattuk, hogy minden rögzített yV esetén az Ly(x)=A(x)·y egy lineáris funkcionál, ha AEnd(V). A 13.21. állítás szerint ehhez az Ly lineáris funkcionálhoz minden rögzített y vektor esetén létezik és egyértelműen meghatározott egy olyan y' vektor, amellyel Ly felírható az Ly(x)=xy' alakban. Tekintsük ekkor azt az A* szimbólummal jelölt és a fentiek szerint egyértelműen meghatározott leképezést, amely minden y vektorhoz az y' vektort rendeli, vagyis legyen A*:V→V, y→y'. Ekkor a konstrukció alapján az A és az A* transzformáció között érvényes az A(x)·y=Ly(x)=xy'=x·A*(y) összefüggés. Az A* transzformációt az A lineáris transzformáció adjungáltjának nevezzük, az A(x)·y=x·A*(y) összefüggést pedig az adjungált transzformáció definiáló összefüggésének hívjuk. 13.23. Állítás: Ha V egy véges dimenziós skaláris szorzatos vektortér, akkor a tetszőleges AEnd(V) lineáris transzformáció A* adjungáltja is egy lineáris transzformáció, tehát A*End(V) is teljesül. Bizonyítás: Ha x a V vektortér egy tetszőleges, de rögzített vektora, akkor minden y1,y2,yV vektorra és k skalárra
és
x·A*(y1+y2)=A(x)·(y1+y2)=A(x)·y1+A(x)·y2=x·A*(y1)+x·A*(y2)= =x·(A*(y1)+A*(y2)), x·A*(ky)=A(x)·(ky)= k ·(A(x)·y)= k ·(x·A*(y))= =x·(k·A*(y))
teljesül, amelyekből a 13.20. lemma felhasználásával A*(y1+y2)=A*(y1)+A*(y2) és A*(ky)=k·A*(y) következik, tehát A* valóban a V vektortér egy lineáris transzformációja.
149
A továbbiakban azt vizsgáljuk, hogy egy véges dimenziós skaláris szorzatos V vektortérben egy AEnd(V) lineáris transzformációról az A*End(V) adjungált lineáris transzformációra való áttérés * művelete a lineáris transzformációk összeadásával, skalárral való szorzásával, kompozíciójával és invertálhatóság esetén inverzével milyen összefüggésben áll. 13.24. Tulajdonság: Ha A a véges dimenziós skaláris szorzatos V vektortér egy tetszőleges lineáris transzformációja, akkor érvényes az (A*)*=A összefüggés. Bizonyítás: Ha x a V vektortér egy tetszőleges, de rögzített vektora, akkor minden yV esetén y·A(x)= A(x) y x A * (y) =A*(y)·x=y·(A*)*(x) teljesül, amiből a 13.20. lemma felhasználásával A(x)=(A*)*(x) adódik. Ebből a lineáris transzformációk egyenlőségének értelmezését felhasználva közvetlenül nyerjük az (A*)*=A összefüggést. 13.25. Tulajdonság: Ha A és B a véges dimenziós skaláris szorzatos V vektortér két tetszőleges lineáris transzformációja, akkor teljesül az (A+B)*=A*+B* összefüggés. Bizonyítás: Ha y a V vektortér egy tetszőleges, de rögzített eleme, akkor minden xV esetén x·((A+B)*(y))=(A+B)(x)·y=(A(x)+B(x))·y=A(x)·y+B(x)·y= =x·A*(y)+x·B*(y)=x·(A*(y)+B*(y))=x·((A*+B*)(y)) adódik, amelyből a 13.20. lemma szerint (A+B)*(y)=(A*+B*)(y) következik. Ebből pedig a lineáris transzformációk egyenlőségének értelmezése szerint azonnal nyerhetjük az (A+B)*=A*+B* összefüggést. 13.26. Tulajdonság: Ha A a véges dimenziós skaláris szorzatos V vektortér egy lineáris transzformációja és k egy tetszőleges skalár, akkor (k·A)*= k ·A*. 150
Bizonyítás: Legyen y a V vektortér egy tetszőleges, de rögzített eleme. Ekkor minden xV esetén x·((kA)*(y))=(kA)(x)·y=(kA(x))·y=k·(A(x)·y)= =k·(x·A*(y))=x·( k ·A*(y))=x·(( k A*)(y)) következik, ebből pedig a 13.20. lemma felhasználásával (kA)*(y)=( k A*)(y) adódik. A most nyert összefüggésből a lineáris transzformációk egyenlőségének értelmezése alapján azonnal a bizonyítandó (kA)*= k ·A* összefüggést kapjuk. 13.27. Tulajdonság: Ha A és B a véges dimenziós skaláris szorzatos V vektortér két tetszőleges lineáris transzformációja, akkor (A◦B)*=B*◦A*. Bizonyítás: Ha y a V vektortér egy tetszőleges, de rögzített vektora, akkor minden xV esetén érvényes az x·((A◦B)*(y))=(A◦B)(x)·y=A(B(x))·y= =B(x)·A*(y)=x·B*(A*(y))=x·((B*◦A*)(y)) összefüggés, amelyből a 13.20. lemma alapján (A◦B)*(y)=(B*◦A*)(y) következik. Ebből pedig a lineáris transzformációk egyenlőségének értelmezését felhasználva közvetlenül adódik a bizonyítandó (A◦B)*=B*◦A* összefüggés. 13.28. Tulajdonság: Ha E a véges dimenziós skaláris szorzatos V vektortér identikus transzformációja, akkor érvényes az E*=E összefüggés. Bizonyítás: Legyen y a V vektortér egy tetszőleges, de rögzített vektora. Ekkor minden xV vektorra igaz az x·E*(y)=E(x)·y=x·y=x·E(y) összefüggés, amelyből a 13.20. lemma felhasználásával E*(y)=E(y) adódik. Ebből azonban a lineáris transzformációk egyenlőségének értelmezésére hivatkozva azonnal következik a bizonyítandó állítás. 151
13.29. Tulajdonság: Ha A a véges dimenziós skaláris szorzatos V vektortér egy tetszőleges invertálható lineáris transzformációja, akkor A* adjungált transzformációja is invertálható és érvényes közöttük az (A*)-1=(A-1)* összefüggés. Bizonyítás: A 13.27. és a 13.28. tulajdonság alapján A*◦(A-1)*=(A-1◦A)*=E*=E és (A-1)*◦A*=(A◦A-1)*=E*=E teljesül, ami éppen azt mutatja, hogy (A-1)* az A* inverze. Az A* tehát invertálható lineáris transzformáció és (A*)-1=(A-1)* is teljesül. Ezután megvizsgáljuk, hogy milyen kapcsolatban áll egy lineáris transzformációnak, valamint adjungáltjának egy közös ortonormált bázisra vonatkozó mátrixa. 13.30. Állítás: Legyen V egy n-dimenziós skaláris szorzatos vektortér, N={e1,...,en} e vektortér egy tetszőleges ortonormált bázisa és LEnd(V) egy lineáris transzformáció. Ha A=(aij)n=matN(L) az L lineáris transzformáció és B=(bij)n= =matN(L*) az L* adjungált transzformáció N bázisra vonatkozó mátrixa, akkor e két mátrix között érvényes a bij= a ji (1≤i,j≤n) összefüggés, vagyis a B mátrixot az A mátrixból transzponálással, majd komponensenkénti konjugálással nyerjük. Bizonyítás: Legyen x és y a V vektortér két tetszőleges vektora, amelyeknek a tetszőlegesen választott N={e1,...,en} ortonormált bázisra vonatkozó koordináta sormátrixa (x)N=(x1x2...xn) és (y)N=(y1y2...yn). Ha LEnd(V) és az x'=L(x) vektor N bázisra vonatkozó koordináta sormátrixa (x')N=(x1'x2'...xn'), továbbá az y'=L*(y) vektor N bázisra vonatkozó koordináta sormátrixa (y')N=(y1'y2'...yn'), akkor a 6.23. állítás szerint érvényesek az és
(x1'x2'...xn')=(x1x2...xn)·A (y1'y2'...yn')=(y1y2...yn)·B
152
összefüggések. Az L lineáris transzformációt az L* adjungáltjával összekapcsoló L(x)·y= =x·L*(y) egyenlőség a 13.13. állítás felhasználásával az
( x1 ' x2 '...xn ' ) y1 ( x1 x2 ...xn ) y2 y n
y1 ' y2 ' y ' n
alakban írható fel. Helyettesítsük ezen összefüggés bal oldalába a fenti első, jobb oldalába pedig transzponálás és komponensenkénti konjugálás után a fenti második összefüggést! Ekkor az
( x1 x 2 ...x n ) a11 a12 a1n a2n a 21 a 22 a a a nn n1 n 2 ( x1 x 2 ...x n ) b11 b21 bn1 b2 n b12 b22 b b b nn 1n 2 n
y1 y2 y n y1 y2 y n
egyenlőséget nyerjük. A 12.6. állítás felhasználásával könnyen beláthatjuk, hogy itt mindkét oldalon ugyanazon konjugált bilineáris funkcionálnak az N ortonormált bázisra vonatkozó egyértelműen meghatározott mátrixa szerepel. E két mátrix tehát megegyezik, vagyis aji= bij (1≤j,i≤n), amiből a két oldal konjugálásával már közvetlenül adódik a bizonyítandó állítás. Egy lineáris transzformáció adjungáltjának értelmezése alapján természetesen kínálkozik az önadjungált transzformáció fogalmának bevezetése is a következő módon. 153
A véges dimenziós skaláris szorzatos V vektortér egy L lineáris transzformációját önadjungált, Hermite-féle, vagy röviden hermitikus transzformációnak nevezzük, ha L=L*, vagyis ha L megegyezik saját L* adjungáltjával. A 6.1. állítás szerint egy lineáris transzformáció valamely tetszőlegesen megadott bázisra vonatkozóan egyértelműen meghatározza mátrixát. Így ha N={e1,...,en} az n-dimenziós skaláris szorzatos V vektortér egy ortonormált bázisa, akkor az L=L* összefüggésből matN(L)=matN(L*) következik. Ebből pedig az A=(aij)n=matN(L) mátrixra a 13.30. állítás felhasználásával közvetlenül adódik az aij= a ji (1≤i,j≤n) összefüggés. Érvényes tehát a 13.31. Állítás: Ha L az n-dimenziós skaláris szorzatos V vektortér egy önadjungált transzformációja, akkor a V vektortér egy tetszőleges N ortonormált bázisára vonatkozó A=(aij)n=matN(L) mátrixa hermitikus, vagyis megegyezik önmaga transzponáltjának komponensenként vett konjugáltjával. Az önadjungált transzformációk hasonló szerepet töltenek be egy véges dimenziós skaláris szorzatos vektortér lineáris transzformációi között, mint a valós számok a komplex számok között. Erre az analógiára világít rá a következő 13.32. Állítás: A véges dimenziós skaláris szorzatos V vektortér minden L lineáris transzformációja felírható L=L1+i·L2 alakban, ahol az L1 és L2 önadjungált transzformációk. Bizonyítás: Vegyük észre, hogy a véges dimenziós skaláris szorzatos V vektortér minden L lineáris transzformációja felírható az
L
1 i ( L L*) ( L L*) 2 2i
formában. Tekintsük most az L1 :
154
1 1 ( L L*) és az L2 : ( L L*) 2 2i
lineáris transzformációkat, amelyek felhasználásával az L előállítható L=L1+i·L2 alakban. Már csak azt kell megmutatni, hogy L1 és L2 egyaránt önadjungált transzformációk. Mivel *
1 1 1 L ( L L* ) ( L* L) ( L L* ) L1 2 2 2 * 1
és *
1 1 1 L*2 ( L L* ) ( L* L) ( L L* ) L2 2i 2i 2i
teljesül, így L1 és L2 önadjungált transzformáció, s ezzel állításunkat igazoltuk. 13.33. Állítás: Ha L a véges dimenziós unitér V vektortér egy önadjungált transzformációja, akkor ennek minden sajátértéke valós. Bizonyítás: Legyen x az L önadjungált transzformáció egy sajátvektora, k pedig a hozzá tartozó sajátérték, vagyis legyen L(x)=kx, x≠0. Mivel L egy önadjungált transzformáció, így L=L*, s ezért L(x)·x=x·L*(x)=x·L(x), amiből (kx)·x= =x·(kx) következik. Ez utóbbi összefüggésből k(x·x)= k (x·x) adódik, ami x≠0, s így x·x≠0 alapján éppen azt jelenti, hogy k= k , tehát kℝ valóban teljesül. 13.34. Állítás: Ha L a véges dimenziós unitér V vektortér egy önadjungált transzformációja, akkor ennek a különböző sajátértékeihez tartozó sajátvektorai ortogonálisak egymásra. Bizonyítás: Legyen k1 és k2 az L önadjungált transzformáció két különböző sajátértéke, továbbá x1(≠0) a k1 és x2(≠0) a k2 sajátértékhez tartozó egy-egy sajátvektor, vagyis legyen L(x1)=k1x1, L2(x2)=k2x2 és k1≠k2. Mivel L=L*, így L(x1)·x2= =x1·L*(x2)=x1·L(x2), amiből (k1x1)·x2=x1·(k2x2), továbbá k1(x1·x2)= k 2 ·(x1·x2) következik. A 13.33. állítás szerint k2ℝ, azaz k2= k 2 , ezért fennáll
155
k1·(x1·x2)=k2·(x1·x2), amelynek átrendezésével (k1-k2)·(x1·x2)=0 adódik. Ám k1≠k2, így x1·x2=0, vagy x1,x2 valóban egy ortogonális vektorpár. Most pedig kimutatjuk, hogy véges dimenziós unitér vektortérben minden önadjungált transzformáció diagonalizálható, sőt ez a diagonális alak olyan, hogy a mátrix főátlójában csupa valós érték található. 13.35. Állítás: Ha L a véges dimenziós unitér V vektortér egy tetszőleges önadjungált transzformációja, akkor létezik a V vektortérben olyan ortonormált bázis, amelynek vektorai az L transzformáció sajátvektorai. Bizonyítás: Az n-dimenziós unitér V vektortérben az L önadjungált transzformációnak a 9.12. állítás alapján létezik legalább egy b1 sajátvektora. Ekkor érvényes az L(b1)=k1·b1 összefüggés, ahol k1 jelöli a b1 vektorhoz tartozó sajátértéket, s ez a sajátérték a 13.33. állítás szerint valós. A V vektortérben az U≔b1 altér U ortogonális komplementere egy (n-1)dimenziós L-invariáns altér. Valóban, a 13.19. állítás alapján V=UU, s így a 4.10. állítás felhasználásával n=dim(V)=dim(U)+dim(U)=1+dim(U), amiből dim(U)=n-1 következik. Ha pedig xU, akkor L önadjungált voltát kihasználva L(x)·b1=x·L*(b1)=x·L(b1)=x·(k1b1)= k1 ·(x·b1)=k1·(x·b1)=k1·0=0, s így L(x)U teljesül, tehát U tényleg egy L-invariáns altér. Az L önadjungált transzformáció U altérre való leszűkítésének a 9.12. állítás szerint szintén létezik legalább egy b2 sajátvektora, amelyhez tartozó k2 sajátérték a 13.33. állítás alapján szintén valós. A fenti lépéssel analóg okoskodással megmutathatjuk, hogy az U altérben, mint vektortérben a W≔b2 altér U ortogonális komplementere, amely tehát U-nak a b2 vektorra ortogonális vektoraiból áll, a V vektortér egy (n-2)dimenziós L-invariáns altere, és így tovább... Ezt az eljárást folytatva az n-edik lépés után az L önadjungált transzformáció n számú sajátvektorából álló {b1,...,bn} ortogonális vektorrendszerét nyerjük, amely a V vektortér egy ortogonális bázisa is egyben. Minthogy egy sajátvektornak bármely zérustól különböző skalárral való szorzata ismét sajátvektor, ezért a {b1,...,bn} ortogonális bázisról ezzel a módszerrel áttérhetünk szintén az L sajátvektoraiból álló {e1,...,en} ortonormált bázisra, amivel állításunkat igazoltuk. 156
13.36. Állítás: Legyen V egy véges dimenziós unitér vektortér. Az LEnd(V) lineáris transzformáció akkor és csakis akkor önadjungált, ha létezik a V vektortérben egy olyan ortonormált bázis, amelyre vonatkozóan az L transzformáció mátrixa egy valós komponensű diagonális mátrix. Bizonyítás: Ha L az n-dimenziós unitér V vektortér egy önadjungált transzformációja, akkor a 13.35. állításban megalkotott B={e1,...,en} ortonormált bázisban érvényesek az L(ei)=kiei (1≤i≤n) összefüggések, így az L transzformáció B bázisra vonatkozó mátrixa
k1 0 0 k2 mat B ( L) 0
0 0 0 k n
alakú, ahol a ki sajátértékek a 13.33. állítás alapján valósak. Megfordítva, legyen az L lineáris transzformációnak egy ortonormált bázisra vonatkozó mátrixa k1 0 0 0 k2 A 0 0 0 k n alakú, ahol kiℝ (1≤i≤n), vagyis egy valós komponensű diagonális mátrix. Az L* adjungált transzformáció mátrixát az L transzformáció A mátrixából a 13.30. állítás szerint transzponálással és komponensenkénti konjugálással nyerjük. 157
Elvégezve ezt a műveletet az A mátrixon önmagát kapjuk, tehát matB(L)=matB(L*) teljesül, ha B a szóban forgó ortonormált bázis. Mivel egy adott bázisban lineáris transzformáció és mátrixa kölcsönösen és egyértelműen meghatározzák egymást a 6.1. állítás szerint, ezért a két transzformáció egyenlő, vagyis L=L*. Az L tehát egy önadjungált transzformáció, s ezzel állításunkat bebizonyítottuk. Egy véges dimenziós skaláris szorzatos V vektortér önadjungált transzformációi nem alkotnak a lineáris transzformációk kompozíciójának műveletével struktúrát, mert két önadjungált transzformáció kompozíciója általában nem önadjungált. Érvényes ugyanis a következő 13.37. Állítás: Ha A és B a véges dimenziós skaláris szorzatos V vektortér két önadjungált transzformációja, akkor az A◦B lineáris transzformáció akkor és csakis akkor lesz önadjungált, ha A◦B=B◦A teljesül, vagyis ha az A és B transzformációk felcserélhetők. Bizonyítás: Feltevéseink szerint A=A* és B=B*, s keressük annak szükséges és elegendő feltételét, hogy az (A◦B)*=A◦B egyenlőség teljesüljön. Ez azonban az (A◦B)*=B*◦A*=B◦A egyenlőség folytán akkor és csakis akkor érvényes, ha A◦B=B◦A, s ezzel állításunkat igazoltuk. A skaláris szorzatos vektorterek lineáris transzformációi között sok szempontból különleges helyet foglalnak el az önadjungált transzformációk mellett az unitér transzformációk. A véges dimenziós skaláris szorzatos V vektortér egy L lineáris transzformációját unitér transzformációnak nevezzük, ha L invertálható és L-1=L*, vagyis ha L inverze saját L* adjungáltjával egyezik meg. 13.38. Állítás: Legyen V egy véges dimenziós skaláris szorzatos vektortér. Az LEnd(V) akkor és csakis akkor unitér transzformáció, ha bármely x,yV esetén fennáll az L(x)·L(y)=x·y összefüggés. Más szóval egy lineáris transzformációval szemben a skaláris szorzat pontosan akkor invariáns, ha a transzformáció unitér.
158
Bizonyítás: Ha L egy unitér transzformáció, akkor minden x,yV esetén L(x)·L(y)= =x·L*(L(y))=x·(L*◦L)(y)=x·(L-1◦L)(y)=x·E(y)=x·y teljesül, vagyis a kaláris szorzat a transzformációval szemben invariáns. Megfordítva, ha az L lineáris transzformációval szemben bármely x,y vektorpár skaláris szorzata invariáns, vagyis L(x)·L(y)=x·y, akkor x·L*(L(y))=x·y, azaz x·(L*◦L)(y)=x·E(y) következik, amelyből a 13.20. lemma felhasználásával (L*◦L)(y)=E(y) adódik. Ebből a lineáris leképezések egyenlőségét felhasználva az L*◦L=E összefüggést nyerjük, tehát az L egy unitér transzformáció. 13.39. Következmény: Ha L a véges dimenziós skaláris szorzatos V vektortér egy unitér transzformációja, akkor bármely xV esetén érvényes az ||L(x)||=||x|| összefüggés, vagyis unitér transzformációval szemben a vektorok normája invariáns. Bizonyítás: Ha L egy unitér transzformáció, akkor a 13.38. állításból az y=x helyettesítéssel adódik az L(x)·L(x)=x·x összefüggés, amelyből a norma értelmezését felhasználva közvetlenül nyerhetjük tetszőleges xV esetén a bizonyítandó ||L(x)||=||x|| egyenlőséget. 13.40. Állítás: Az n-dimenziós skaláris szorzatos V vektortér egy L lineáris transzformációja akkor és csakis akkor unitér, ha a V vektortér egy tetszőleges B={e1,...,en} ortonormált bázisát egy B'={L(e1),...,L(en)} ortonormált bázisba viszi át. Bizonyítás: Legyen B={e1,...,en} az n-dimenziós skaláris szorzatos V vektortér egy tetszőleges ortonormált bázisa. Ha LEnd(V) egy unitér transzformáció, akkor a 13.38. állítás felhasználásával az L(ei)·L(ej)=ei··ej=ij (1≤i,j≤n) összefüggéseket nyerjük, tehát L ortonormált bázist valóban ortonormált bázisba visz át. Megfordítva, legyen LEnd(V) egy olyan lineáris transzformációja, amely a tetszés szerinti B={e1,...,en} ortonormált bázist a B'={L(e1),...,L(en)} ortonormált bázisba viszi át. Ha a tetszőleges x,yV vektorpár B bázisra vonatkozó koordinátái (x)B=(x1,...,xn) és (y)B=(y1,...,yn), akkor az
159
n n n n L(x) L(y ) L xi e i L y j e j xi y j L(e i ) L(e j ) i 1 j 1 i 1 j 1 n
n
n
i 1
j 1
i 1
xi y j ij xi yi ,
és az n n n n n n n xy xi e i y j e j xi y j e i e j xi y j ij xi yi i 1 j 1 i 1 i 1 j 1 i 1 j 1
összefüggések összehasonlításával L(x)·L(y)=x·y adódik, amelyből a 13.38. állítás alapján már közvetlenül nyerjük, hogy az L egy unitér transzformáció. A véges dimenziós skaláris szorzatos V vektortéren értelmezett unitér transzformációk halmazát a továbbiakban az Uni(V) szimbólummal jelöljük. 13.41. Állítás: A véges dimenziós skaláris szorzatos V vektortér unitér transzformációinak Uni(V) halmaza a kompozícióképzés műveletével csoportot alkot. Bizonyítás: Ha L,MUni(V), akkor a 13.40. állítás folytán L◦MUni(V) is teljesül, hiszen ha két lineáris transzformáció ortonormált bázist ortonormált bázisba visz, akkor ezek kompozíciója is rendelkezik ezzel a tulajdonsággal. Ha pedig LUni(V), akkor L-1Uni(V) is teljesül, mert ha egy invertálható lineáris transzformáció ortonormált bázist ortonormált bázisba visz, akkor inverze is rendelkezik ezzel a tulajdonsággal. Végül minden unitér transzformáció automorfizmus, azaz Uni(V)Aut(V), továbbá az 5.33. állításból tudjuk, hogy (Aut(V),◦) csoport, így a fentiek éppen azt bizonyítják, hogy (Uni(V),◦) az (Aut(V),◦) automorfizmus csoport egy részcsoportja. Az (Uni(V),◦) struktúrát a véges dimenziós skaláris szorzatos V vektortér unitér csoportjának nevezzük.
160
Az A=(aij)nM(n,ℂ ) mátrixot unitér mátrixnak nevezzük, ha invertálható és A-1 inverze megegyezik transzponáltjának komponensenként képezett konjugáltjával, vagyis ha fennáll az A-1=A* összefüggés. Vegyük észre, hogy az AM(n,ℂ ) pontosan akkor unitér mátrix, ha érvényes az A·A*=A*·A=En összefüggés, amely részletesen felírva a a11 a12 a1n a11 a 21 a n1 a11 a 21 a 22 a 2 n a12 a 22 a n 2 a12 a a a a a a a nn 1n 2n nn n1 n 2 1n a11 a12 a1n 1 0 a 21 a 22 a 2 n 0 1 a a a 0 0 nn n1 n 2
a 21 a n1 a 22 a n 2 a 2 n a nn 0 0 1
alakot ölti. Ha elvégezzük a mátrixok kijelölt szorzásait és a szorzatok komponenseit összevetjük az egységmátrix komponenseivel, akkor a következő kritériumot nyerjük. 13.42. Állítás: Az A=(aij)nM(n,ℂ ) mátrix akkor és csakis akkor unitér, ha soraira teljesülnek a n
aik a jk ij (1≤i,j≤n)
k 1
összefüggések. Az A=(aij)nM(n,ℂ ) mátrix akkor és csakis akkor unitér, ha oszlopaira teljesülnek a n
aki akj ij
k 1
(1≤i,j≤n)
összefüggések.
161
A fenti állításban szereplő összefüggések szemléletes jelentése a következő. Az AM(n,ℂ ) unitér mátrix sorai a n
aik a jk ij
k 1
(1≤i,j≤n)
feltételek szerint az M(1,n,ℂ ) sormátrixok vektorterében, oszlopai pedig a n
aki akj ij
k 1
(1≤i,j≤n)
feltételek alapján az M(n,1,ℂ ) oszlopmátrixok vektorterében egy-egy ortonormált vektorrendszert, sőt ortonormált bázist alkotnak, s csakis az unitér mátrixok rendelkeznek a fenti feltételekkel. Az unitér transzformációkat és az unitér mátrixokat kapcsolja össze a következő 13.43. Állítás: Legyen L az n-dimenziós skaláris szorzatos V vektortér egy lineáris transzformációja. Az L egy unitér transzformáció akkor és csakis akkor, ha a vektortér egy tetszőleges B={e1,...,en} ortonormált bázisára vonatkozó A=(aij)n=matB(L) mátrixa unitér mátrix. Bizonyítás: Tudjuk, hogy az L lineáris transzformáció B ortonormált bázisra vonatkozó A mátrixa eleget tesz az L(e1 ) e1 A L(e n ) en összefüggésnek. Ekkor minden 1≤i,j≤n esetén teljesülnek az
162
n n n n L(e i ) L(e j ) aik e k a jm e m aik a jm e k e m k 1 m1 k 1 m1 n
n
n
aik a jm km aik a jk k 1 m 1
k 1
összefüggések. A 13.40. állítás szerint L akkor és csakis akkor unitér transzformáció, ha ortonormált bázist ortonormált bázisba visz, ez pedig a fentiek szerint éppen akkor áll fenn, ha n
L(e i ) L(e j ) aik a jk ij (1≤i,j≤n) k 1
teljesül. Ez azonban a 13.42. állítás szerint egyenértékű az A mátrix unitér voltával, s így állításunkat bebizonyítottuk. 13.44. Következmény: Ha V egy n-dimenziós skaláris szorzatos vektortér, B={e1,...,en} és B'={e1',...,en'} e vektortér két tetszőleges ortonormált bázisa, akkor e bázisok közötti B→B' átmenet AGL(n,ℂ ) mátrixa unitér mátrix. Bizonyítás: A B={e1,...,en} ortonormált bázist a B'={e1',...,en'} ortonormált bázisba vivő, s az 5.13. állítás szerint egyértelműen meghatározott L lineáris transzformáció a 13.40. állítás alapján egy unitér transzformáció, amelynek a B bázisra vonatkozó A=matB(L) mátrixa 13.43. állítás miatt unitér mátrix. E mátrixra tehát teljesül az e1 ' e1 A e n ' en összefüggés, tehát AGL(n,ℂ ) a B→B' átmenetet létrehozó invertálható mátrix.
163
A ℂ test feletti n-ed rendű unitér mátrixok halmazát a továbbiakban SL(n,ℂ ) jelöli, amely szimbólumban az SL a "special linear" rövidítése, jelentése pedig "különleges lineáris". 13.45. Állítás: A ℂ komplex számtest feletti n-ed rendű unitér mátrixok SL(n,ℂ ) halmaza a mátrixok közötti szorzás műveletével csoportot alkot. Bizonyítás: Legyen V a ℂ test felett egy n-dimenziós unitér vektortér, továbbá B a V vektortér egy tetszőleges, de rögzített ortonormált bázisa. A 6.1. állításban szereplő f:End(V)→M(n,ℂ ) leképezésnek az Uni(V)End(V) részhalmazra történő f :Uni(V)→SL(n,ℂ ),L→matB(L) leszűkítése bijektív és a matB(M◦L)=matB(L)·matB(M) összefüggés szerint egy (anti)multiplikatív leképezés, vagyis egy (anti)izomorfizmus lesz. A 13.41. állítás folytán (Uni(V),◦) csoport, így a vele (anti)izomorf (SL(n,ℂ ),·) struktúra is egy csoport lesz. Ezután megmutatjuk, hogy az unitér transzformációk is diagonalizálhatók az önadjungált transzformációkhoz hasonlóan. 13.46. Állítás: Ha L a véges dimenziós skaláris szorzatos V vektortér egy unitér transzformációja, akkor ennek minden sajátértéke egységnyi abszolút értékű. Bizonyítás: Legyen x az L unitér transzformáció egy sajátvektora, k pedig a hozzá tartozó sajátérték, vagyis legyen L(x)=kx, x≠0. Mivel L egy unitér transzformáció, ezért L(x)·L(x)=x·x, s így x·x=L(x)·L(x)=(kx)·(kx)=k· k ·(x·x), amiből k· k = =|k|2=1, azaz |k|=1 következik, amit bizonyítani akartunk.
164
13.47. Állítás: Ha L a véges dimenziós unitér V vektortér egy tetszőleges unitér transzformációja, akkor létezik a V vektortérben olyan ortonormált bázis, amelynek vektorai az L transzformáció sajátvektorai. Bizonyítás: Az n-dimenziós unitér V vektortérben az L unitér transzformációnak a 9.12. állítás folytán létezik legalább egy b1 sajátvektora. Ekkor érvényes az L(b1)=k1·b1 összefüggés, ahol k1 jelöli a b1 vektorhoz tartozó sajátértéket, s ez a 13.46. állítás szerint egységnyi abszolút értékű. A V vektortérben az U≔b1 altér U ortogonális komplementere egy (n-1)dimenziós alteret alkot, amelyről megmutatjuk, hogy ráadásul L-invariáns altér is lesz. Valóban, az L transzformáció unitér voltát felhasználva megmutatjuk, hogy ha xU, akkor L(x)U is teljesül. Az xU feltétel egyenértékű az x·b1=0 összefüggéssel, amely alapján k1 ·(L(x)·b1)=L(x)·(k1b1)= =L(x)·L(b1)=x·b1=0 következik. Ám k1≠0 a 13.46. állítás alapján, így imént kapott eredményünkből L(x)·b1=0, azaz L(x)U adódik. Az L unitér transzformáció U altérre való leszűkítésének a 9.12. állítás szerint szintén van legalább egy b2 sajátvektora, amelyhez tartozó k2 sajátérték a 13.46. állítás alapján szintén egységnyi abszolút értékű. A fenti lépéssel analóg okoskodással beláthatjuk, hogy az U altérben, mint vektortérben a W≔b2 altér W ortogonális komplementere a V vektortér egy (n-2)-dimenziós L-invariáns altere, és így tovább... Folytatva ezt az eljárást az n-edik lépés után az L unitér transzformáció n számú sajátvektorából álló {b1,...,bn} ortogonális vektorrendszerét nyerjük, s ez a V vektortér egy ortogonális bázisa is egyben. Mivel egy sajátvektornak bármely nem zérus skalárral való szorzata ismét sajátvektor, ezért a {b1,...,bn} ortogonális bázisról ezzel a módszerrel áttérhetünk az L sajátvektoraiból álló {e1,...,en} ortonormált bázisra, s ezzel állításunkat bebizonyítottuk. 13.48. Állítás: Legyen V egy véges dimenziós unitér vektortér. Minden LUni(V) unitér transzformációhoz létezik olyan ortonormált bázis, amelyre vonatkozóan az L transzformáció mátrixa olyan diagonális mátrix, amelynek főátlójában egységnyi abszolút értékű komplex számok állnak. 165
Bizonyítás: Ha L az n-dimenziós unitér V vektortér egy unitér transzformációja, akkor a 13.47. állításban előállított B={e1,...,en} ortonormált bázisban érvényesek az L(ei)=ki·ei (1≤i≤n) összefüggések, ezért az L transzformáció B bázisra vonatozó mátrixa
k1 0 mat B ( L) 0
0 0 k2 0 0 k n
alakú, ahol a ki sajátértékek a 13.46. állítás alapján egységnyi abszolút értékű komplex számok. Minthogy véges dimenziós unitér vektorterekben a 13.44. következmény szerint ortonormált bázisról egy másik ilyen bázisra való áttérés mátrixa unitér mátrix, ezért a 13.36. és a 13.48. állítás eredményei a mátrixok nyelvén a következőképpen fogalmazhatók meg: 13.49. Állítás: Minden AM(n,ℂ ) hermitikus mátrixhoz létezik olyan BSL(n,ℂ ) unitér mátrix és DM(n,ℂ ) diagonális mátrix, hogy az A mátrix előállítható az A=B·D·B-1 alakban, ahol a D mátrix főátlójában valós számok állnak. Minden ASL(n,ℂ ) unitér mátrixhoz létezik olyan BSL(n,ℂ ) unitér mátrix és DM(n,ℂ ) diagonális mátrix, hogy az A mátrix előállítható az A=B·D·B-1
166
alakban, ahol a D mátrix főátlójában egységnyi abszolút értékű komplex számok állnak. Eddigi tárgyalásunk során lehetőség szerint együtt vizsgáltuk az euklideszi és az unitér vektorterek lineáris transzformációit. Ahol ez nem volt lehetséges, ott csupán az unitér vektortér megfelelő transzformációival foglalkoztunk. Most pótoljuk ezt a hiányt, s az alábbiakban az euklideszi vektorterek lineáris transzformációinak tanulmányozása felé fordítjuk figyelmünket. Az unitér vektorterek lineáris transzformációinak tanulmányozásánál lényeges szerepet játszott a 9.12. állítás, amely szerint unitér vektortérben minden lineáris transzformációnak van legalább egy sajátvektora, s így létezik legalább egy 1-dimenziós invariáns altere. Ez az eredmény euklideszi vektorterekben nem érvényes. Igaz azonban a következő fontos állítás. 13.50. Állítás: A véges dimenziós V euklideszi vektortér minden L lineáris transzformációjának létezik 1-dimenziós, vagy 2-dimenziós L-invariáns altere. Bizonyítás: Legyen B={e1,...,en} a V n-dimenziós euklideszi vektortér egy bázisa és AM(n,ℝ) az L lineáris transzformáció e bázisra vonatkozó mátrixa. Mivel V egy valós test feletti vektortér, tehát a skalárral való szorzás csak valós számokra van értelmezve, ezért a vektorok koordinátái minden bázisban csak valósak lehetnek. A 9.5. állítás gondolatmenetét követve, a sajátértékekre a det(A-k·En)=0 karakterisztikus egyenletet nyerjük, amely a k-ra nézve egy n-ed fokú valós együtthatós algebrai egyenlet. Ezen egyenlet gyökeitől függően két esetet kell megkülönböztetnünk. (1) Ha k0 a karakterisztikus egyenlet valós gyöke, akkor ezt behelyettesítve a sajátvektorokat meghatározó (x1x2...xn)·(A-k0·En)=(00...0) egyenletbe, ennek lesz nem triviális megoldása, amely a V vektortér egy x vektorának a B bázisra vonatkozó koordinátáiból áll. Ebben az esetben tehát x egy 1-dimenziós L-invariáns altér. 167
(2) Ha k0 a karakterisztikus egyenlet nem valós, komplex gyöke: k0=a+bi, b≠0, akkor az (x1x2...xn)·(A-k0En)=(00...0) egyenletből, annak nem triviális megoldásaként az (x1x2...xn)=(u1+iv1 u2+iv2 ... un+ivn) komplex számokat nyerjük. Ezek nem határozzák meg az euklideszi vektortér egyetlen vektorát sem, vagyis ehhez a k0 értékhez nem található 1-dimenziós L-invariáns altér. A kapott megoldás viszont felírható (u1u2...un)+i·(v1v2...vn) alakban, ahol ui,viℝ (1≤i≤n) esetén. Ezek behelyettesítésével az ((u1u2...un)+i(v1v2...vn))·(A-(a+bi)En)=(00...0) összefüggéshez jutunk, amelyből beszorzás és rendezés után [-a(u1u2...un)+b·(v1v2...vn)+(u1u2...un)·A]+ +i[-b·(u1u2...un)-a(v1v2...vn)+(v1v2...vn)·A]=(00...0) adódik. Ebből az következik, hogy a bal oldalon szereplő mindkét zárójeles kifejezés értéke (00...0), vagyis fennállnak az (u1u2...un)·A=a(u1u2...un)-b(v1v2...vn) (v1v2...vn) ·A=b(u1u2...un)+a(v1v2...vn) összefüggések. Legyenek most u és v a V vektortér azon jól meghatározott vektorai, amelyek B bázisra vonatkozó koordináta sormátrixai (u1u2...un), illetve (v1v2...vn). Ekkor az imént nyert két egyenlőség egyenértékű az alábbi két L(u)=a·u-b·v L(v)=b·u+a·v összefüggéssel. 168
Könnyen beláthatjuk, hogy u és v egyike sem 0, ellenkező esetben a b≠0 feltételt kihasználva az imént nyert két formulából u=v=0 adódna, s így (x1x2...xn) a (00...0) sormátrix lenne. Az u és v egy lineárisan független vektorpár a V vektortérben. Valóban, ha ugyanis fennállna közöttük a v=c·u, c≠0 kapcsolat, akkor a fentiek alapján L(u)=a·u-b·c·u L(c·u)=b·u+a·c·u , amelyből az első összefüggésnek c-vel való beszorzásával L(c·u)=(c·a-bc2)u L(c·u)=(b+a·c)u , következik. Mivel a bal oldalak megegyeznek, így a jobb oldalak is egyenlőek, de u≠0, ezért c·a-bc2=b+a·c, amelyből (1+c2)·b=0, s ebből b=0 következik, ami ellentmond kiinduló b≠0 feltevésünknek. Az u és v tehát tényleg egy lineárisan független vektorpár a V vektortérben, s ezért az u,v egy 2-dimenziós altér lesz. Megmutatjuk, hogy u,v egy Linvariáns altér. Valóban, ha yu,v egy tetszőleges vektor ezen altérben, akkor léteznek olyan egyértelműen meghatározott r,sℝ skalárok, hogy y=r·u+s·v. Ekkor L(y)=L(r·u+s·v)=r·L(u)+s·L(v)=r·(au-bv)+ +s·(bu+av)=(r·a+s·b)u+(-r·b+s·a)·v adódik, így L(y) u,v, s ezzel állításunkat maradéktalanul igazoltuk. Ezután az euklideszi vektorterek önadjungált transzformációival foglalkozunk. A véges dimenziós V euklideszi vektortér egy L lineáris transzformációját az általános esettel összhangban önadjungáltnak nevezzük, ha bármely x,yV vektorokra L(x)·y=x·L(y) teljesül. 169
Mivel valós szám konjugáltja önmaga, ezért a 13.31. állítás alapján érvényes a 13.51. Állítás: Ha L az n-dimenziós V euklideszi vektortér egy önadjungált transzformációja, akkor a V vektortér egy tetszőleges N ortonormált bázisra vonatkozó A=matN(L) mátrixa szimmetrikus, vagyis megegyezik önmaga transzponáltjával. Fenti állításunk indokolja azt, hogy euklideszi vektorterekben az önadjungált transzformációkat gyakran szimmetrikus transzformációknak is nevezik. Megmutatjuk, hogy az unitér vektorterekben látottakkal megegyezően euklideszi vektorterekben is minden önadjungált transzformáció diagonalizálható. Ehhez az eredményhez több lépésben jutunk el. 13.52. Állítás: Ha L a véges dimenziós V euklideszi vektortér egy önadjungált transzformációja, akkor ennek létezik legalább egy sajátvektora. Bizonyítás: A 13.50. állítás szerint az L karakterisztikus egyenlete minden valós k gyökének megfelel egy 1-dimenziós L-invariáns altér, amelynek minden nem zérus vektora az L transzformáció sajátvektora. Elegendő tehát azt megmutatni, minden k karakterisztikus gyök valós szám. Legyen k=a+bi a karakterisztikus egyenlet egyik gyöke. A 13.50. állítás bizonyítása során egy ilyen k gyökhöz megalkottunk két olyan u és v vektort, amelyekre érvényes az L(u)=au-bv L(v)=bu+av két összefüggés. Ekkor azonban L(u)·v=a·(u·v)-b·(v·v) u·L(v)=b·(u·u)+a·(u·v) , s minthogy L(u)·v=u·L(v), ezért a második egyenlőségből az elsőt kivonva 0=2b(u·u+v·v) 170
adódik. De láttuk, hogy u,v≠0, így u·u+v·v≠0, ezért b=0, vagyis k valós szám, s ezzel állításunkat igazoltuk. 13.53. Állítás: Ha L a véges dimenziós euklideszi V vektortér egy tetszőleges önadjungált transzformációja, akkor létezik a V vektortérben olyan ortonormált bázis, amelynek vektorai az L transzformáció sajátvektorai. Bizonyítás: Az n-dimenziós euklideszi V vektortérben az L önadjungált transzformációnak a 13.52. állítás szerint létezik legalább egy b1 sajátvektora. A V vektortérben az U=b1 altér U ortogonális komplementere egy (n-1)-dimenziós Linvariáns altér, amelyet az analóg 13.35. állításban látott módon igazolhatunk. Az L transzformáció U altérre való leszűkítésének a 13.52. állítás szerint szintén létezik legalább egy b2 sajátvektora. Az U altérben, mint vektortérben a W=b2 altér W ortogonális komplementere a V vektortér egy (n-2)dimenziós L-invariáns altere, és így tovább... Folytatva a fenti eljárást az n-edik lépés után a V vektortér L önadjungált transzformációja n számú sajátvektorából álló {b1,...,bn} ortogonális bázist nyerünk. Erről a bázisról az egyes vektorok alkalmas skalárokkal való szorzásával áttérhetünk az L sajátvektoraiból álló B={e1,...,en} ortonormált bázisra, s ez állításunkat igazolja. 13.54. Állítás: Legyen V egy véges dimenziós euklideszi vektortér. Ha az LEnd(V) lineáris transzformáció önadjungált, akkor létezik a V vektortérben olyan ortonormált bázis, amelyre vonatkozóan az L transzformáció mátrixa diagonális. Bizonyítás: Ha L az n-dimenziós euklideszi V vektortér egy önadjungált transzformációja, akkor a 13.53. állításban megalkotott B={e1,...,en} ortonormált bázisban érvényesek az L(ei)=kiei (1≤i≤n) összefüggések, így az L transzformáció B bázisra vonatkozó mátrixa
171
k1 0 0 k2 mat B ( L) 0
0 0 0 k n
alakú, ahol a főátlóban az L transzformáció sajátértékei szerepelnek. Most pedig a véges dimenziós euklideszi terek unitér transzformációival foglalkozunk. Az általános esettel összhangban a véges dimenziós V euklideszi vektortér egy L lineáris transzformációját unitér transzformációnak nevezzük, ha bármely x és y vektorra L(x)·L(x)=x·y teljesül. 13.55. Állítás: A véges dimenziós V euklideszi vektortér egy L lineáris transzformációja akkor és csakis akkor unitér, ha minden xV vektorra L(x)·L(x)=x·x teljesül. Bizonyítás: Ha L a véges dimenziós euklideszi vektortér egy unitér transzformációja, akkor L(x)·L(y)=x·y definiáló összefüggéséből y=x helyettesítéssel L(x)·L(x)= =x·x adódik. Megfordítva, tetszőleges x,yV esetén egyrészt L(x+y)·L(x+y)=(x+y)·(x+y)=x·x+2·(x·y)+y·y , másrészt L(x+y)·L(x+y)=(L(x)+L(y))·(L(x)+L(y))=L(x)·L(x)+ +2(L(x)·L(y))+L(y)·L(y) adódik, amelyek összehasonlításával L(x)·L(x)=x·x és L(y)·L(y)=y·y miatt 2·(x·y)=2·(L(x)·L(y)), s ebből L(x)·L(y)=x·y következik. A vektor normájának értelmezését felhasználva fenti állításunkból közvetlenül adódik a
172
13.56. Következmény: A véges dimenziós V euklideszi vektortér egy L lineáris transzformációja akkor és csakis akkor unitér, ha minden xV esetén érvényes az ||L(x)||=||x|| összefüggés, vagyis pontosan az unitér transzformációkkal szemben lesz a vektorok normája invariáns. 13.57. Következmény: Ha L a véges dimenziós V euklideszi vektortér egy unitér transzformációja, akkor minden x,yV, x≠0, y≠0 vektorpár (x,y)∢ hajlásszöge az L transzformációval szemben invariáns. Bizonyítás: Ha x és y a véges dimenziós V vektortér két tetszőleges, 0 vektortól különböző vektorai, akkor az L értelmezése és a 13.56. következmény felhasználásával cos(L(x),L(y))∢=
L ( x) L ( y ) xy cos(x,y)∢ || L(x) || || L(y ) || || x || || y ||
adódik. Mivel (L(x),L(y))∢, (x,y)∢[0,π], ebben a zárt intervallumban a t→cost függvény szigorúan monoton csökken, így (L(x),L(y))∢=(x,y)∢, s ezzel állításunkat igazoltuk. A véges dimenziós euklideszi vektorterek unitér transzformációit éppen a 13.56. és a 13.57. következményben megfogalmazott tulajdonságai alapján a továbbiakban ortogonális transzformációnak nevezzük. A 13.40. állítás alapján érvényes az alábbi kritérium. 13.58. Állítás: Az n-dimenziós V euklideszi vektortér egy L lineáris transzformációja akkor és csakis akkor ortogonális transzformáció, ha a V vektortér egy tetszőleges B={e1,...,en} ortonormált bázisát egy B'={L(e1),...,L(en)} ortonormált bázisba viszi át. 173
A véges dimenziós V vektortéren értelmezett ortogonális transzformációk halmazát a továbbiakban az Ort(V) szimbólummal jelöljük. A 13.41. állítás alapján igaz a 13.59. Állítás: A véges dimenziós V euklideszi vektortér ortogonális transzformációinak Ort(V) halmaza a kompozícióképzés műveletével csoportot alkot. Az (Ort(V),◦) struktúrát a véges dimenziós V euklideszi vektortér ortogonális csoportjának nevezzük. Az A=(aij)nM(n,ℝ) mátrixot ortogonális mátrixnak hívjuk, ha invertálható és inverze megegyezik a mátrix transzponáltjával, vagyis ha fennáll az A-1=AT összefüggés. Látható, hogy az AM(n,ℝ) pontosan akkor ortogonális mátrix, ha érvényes az A·AT=AT·A=En összefüggés. Ha itt elvégezzük a mátrixok kijelölt szorzásait és a szorzatok komponenseit összehasonlítjuk az egységmátrix komponenseivel, akkor a következő kritériumot kapjuk. 13.60. Állítás: Az A=(aij)nM(n,ℝ) mátrix akkor és csakis akkor ortogonális, ha soraira teljesülnek a n
aik a jk ij
k 1
(1≤i,j≤n)
összefüggések. Az A=(aij)nM(n,ℝ) mátrix akkor és csakis akkor ortogonális, ha oszlopaira teljesülnek a n
aki akj ij
k 1
összefüggések. 174
(1≤i,j≤n)
Az unitér mátrixokra vonatkozó 13.42. kritérium mintájára most is megfogalmazhatjuk a 13.60. állítást is úgy, hogy pontosan akkor ortogonális egy mátrix, ha sorvektorai az M(1,n,ℝ) mátrixok vektorterében, illetve oszlopvektorai az M(n,1,ℝ) mátrixok vektorterében egy-egy ortonormált bázist alkotnak. A 13.43. állítással megegyező módon igazolható a 13.61. Állítás: Legyen L az n-dimenziós V euklideszi vektortér egy lineáris transzformációja. Az L transzformáció akkor és csakis akkor lesz ortogonális, ha a vektortér egy tetszőleges B ortonormált bázisára vonatkozó A=matB(L) mátrixa ortogonális mátrix. A 13.44. következmény alapján igaz továbbá a 13.62. Következmény: Ha V egy n-dimenziós euklideszi vektortér, B={e1,...,en} és B'={e1',...,en'} e vektortér két tetszőleges ortonormált bázisa, akkor e bázisok közötti B→B' átmenet AGL(n,ℝ) mátrixa ortogonális mátrix. A komplex esettel összhangban az ℝ feletti n-ed rendű ortogonális mátrixok halmazát a továbbiakban SL(n,ℝ) jelöli. A 13.45. állítással analóg igazolható a 13.63. Állítás: Az ℝ valós számtest feletti n-ed rendű ortogonális mátrixok SL(n,ℝ) halmaza a mátrixok közötti szorzás műveletével csoportot alkot. 13.64. Állítás: Ha AM(n,ℝ) egy ortogonális mátrix, akkor |det(A)|=1 teljesül. Bizonyítás: Legyen AM(n,ℝ) egy tetszőleges ortogonális mátrix. Az A·AT=En ortogonalitást jellemző összefüggésből kiindulva, s felhasználva a 7.9. és 7.11. állítás eredményeit az 175
1=det(En)=det(A·AT)=det(A)·det(AT)=(det(A))2 összefüggést nyerjük, amelyből már közvetlenül adódik a bizonyítandó |det(A)|=1 egyenlőség. Megjegyezzük, hogy fenti állításunk nem fordítható meg, hiszen például a 1 1 M(2,ℝ) B 0 1
olyan négyzetes mátrix, amelynek determinánsa det(B)=1, ám 2 1 1 B B T 1 1 0
0 E2 , 1
vagyis B nem ortogonális mátrix. A véges dimenziós V euklideszi vektortérnek azokat az ortogonális transzformációit, amelyeknek valamely ortonormált bázisra vonatkozó mátrixának determinánsa a 13.61. és a 13.64. állítás alapján 1, a V euklideszi vektortér mozgásainak, azokat pedig, amelyeknek a determinánsa -1, a vektortér átfordításainak nevezzük. A fentiek alapján könnyen adódik a 13.65. Állítás: A véges dimenziós V euklideszi vektortér mozgásainak Ort+(V) halmaza a kompozícióképzés műveletével csoportot alkot. A mozgásokat ortonormált bázisban leíró mátrixokra pedig érvényes a 13.66. Állítás: Az ℝ valós számtest feletti n-ed rendű ortogonális és 1 determinánsú mátrixok SL+(n,ℝ) halmaza a mátrixok közötti szorzás műveletével csoportot alkot. Vizsgáljuk meg most az 1-dimenziós és a 2-dimenziós euklideszi vektortér ortogonális transzformációit! Később látni fogjuk, hogy tetszőleges 176
n-dimenziós (n≥3) euklideszi vektortér ortogonális transzformációinak elemzése ezekre a legegyszerűbb esetekre vezethető vissza. Legyen először V egy 1-dimenziós euklideszi vektortér, e egy olyan vektor, amely generálja a V vektorteret, azaz V=e, és legyen LEnd(V) egy ortogonális transzformáció. Ekkor létezik olyan kℝ skalár, hogy L(e)=ke, s mivel L ortogonális, ezért a 13.55. állítás felhasználásával e·e=L(e)·L(e)= =(ke)·(ke)=k2·(e·e), de e·e≠0, így k2=1, amiből k=±1 következik. Ha most x=x·eV egy tetszőleges vektor, akkor az L linearitása szerint L(x)=L(x·e)=x·L(e)=x(±e)=±x·e=±x adódik. Az 1-dimenziós V euklideszi vektortérben tehát csak két ortogonális transzformáció létezik. Az egyik az L(x)=x összefüggéssel jellemzett mozgás, amely a V identikus transzformációja, a másik az L(x)=-x formulával jellemzett átfordítás, amelyet a geometriából kölcsönzött kifejezéssel a V origójára vonatkozó tükrözésnek nevezünk. Másodszor a 2-dimenziós V euklideszi vektortér ortogonális transzformációit vizsgáljuk. Legyen B={e1,e2} a V egy ortonormált bázisa, L a V vektortér egy ortogonális transzformációja és A=(aij)2=matB(L)M(2,ℝ) az L transzformáció B bázisra vonatkozó mátrixa. (1) Először tegyük fel, hogy det(A)=a11a22-a21a12=1, tehát legyen L egy mozgás. Mivel L ortogonális, ezért a 13.61. állítás alapján A-1=AT, azaz a11 A 1 a12
a 21 , a 22
másrészt A-1 közvetlen számítással is meghatározható, a det(A)=1 felhasználásával a22 a12 A 1 a a 11 21 177
adódik. Az A-1 kétféle előállítását összehasonlítva a22=a11, a21=-a12, tehát az L transzformáció mátrixa a11 a12 A mat B ( L) a a 12 11 2 2 alakú, ahol det(A)= a11 a12 1 . Ezért létezik egyetlen olyan φ[0,π], φℝ 2 szám, hogy a11=cosφ, s a sin φ+cos2φ=1 összefüggés alapján így a12=sinφ. Ekkor tehát a 2-dimenziós euklideszi V vektortér bármely L mozgásának a tetszőleges B ortonormált bázisra vonatkozó mátrixa
cos sin mat B ( L) sin cos
alakú. Ezért L a V vektortér origó körüli φ szögű elforgatása, amint azt a 6.5. példában is láthattuk. Eredményünkből következik, hogy az L karakterisztikus egyenlete a
det(A k E 2 )
cos k
sin
sin
cos k
(cos k ) 2 sin 2
k 2 2k cos 1 összefüggés alapján k2-2k·cosφ+1=0, ennek diszkriminánsa 4(cos2φ-1)≤0. A nyilvánvaló φ=0, és a φ=π esettől eltekintve, ami a V identikus transzformációjának, illetve a V origójára való tükrözésének felel meg, a diszkrimináns negatív, tehát az L transzformációnak nincs valós sajátértéke. (2) Másodszor tegyük fel, hogy det(A)=a11a22-a21a12=-1, tehát legyen L egy átfordítás. Miután L ortogonális, ezért az (1) részhez hasonló okoskodással egyrészt 178
a11 A 1 a12
a 21 , a 22
másrészt det(A)=-1 felhasználásával a12 a22 A 1 a a 11 21
adódik. Az A-1 kétféle előállítását összevetve a22=-a11, a21=a12, vagyis az L transzformáció mátrixa a12 a11 A mat B ( L) a a 11 12
2 2 2 2 alakú, ahol det(A)= a11 a12 1 , azaz a11 a12 1 . Mivel
det(A k E 2 )
a11 k
a12
a12
a11 k
2 (a11 k )(a11 k ) a12
2 2 k 2 a11 a12 k 2 1 (k 1)(k 1) ,
ezért az L transzformáció karakterisztikus egyenlete (k-1)(k+1)=0, amelynek k1=1 és k2=-1 gyökei szolgáltatják az L sajátértékeit. Ha b1 a k1, b2 pedig a k2 sajátértékhez tartozó egy-egy sajátvektor, akkor fennállnak az L(b1)=b1 és L(b2)=-b2 összefüggések, amelyek felhasználásával az L(b1)·L(b2)=-b1·b2 összefüggést nyerjük. Az L azonban ortogonális transzformáció, így L(b1)·L(b2)=b1·b2 is teljesül, s ebből az előzőleg nyert egyenlőség figyelembevételével 179
-b1·b2=b1·b2 adódik, amelyből viszont b1·b2=0 következik, vagyis b1 és b2 ortogonális vektorok. Ha b1 és b2 ráadásul olyan sajátvektorok, amelyek normája 1, akkor B'={b1,b2} a V vektortér olyan ortonormált bázisa lesz, hogy az U1≔b1 és az U2≔b2 1-dimenziós L-invariáns alterek. Az L transzformáció ezen alterekre történő leszűkítései szintén ortogonális transzformációk lesznek, amelyek a korábbiak szerint L(x)=±x alakúak, s ezért az L transzformáció B' bázisra vonatkozó mátrixa csak 1 0 A' mat B ' ( L) 0 1
alakú lehet. Tekintettel arra, hogy az L egy átfordítás, s ezért det(A')=-1, így 1 0 A' 0 1
vagy
1 0 . A' 0 1
Mivel e mátrixok a B' bázisban az U1, illetve az U2 tengelyre vonatkozó tükrözést írnak le, így a 2-dimenziós euklideszi V vektortér bármely L átfordítása egy origóhoz illeszkedő tengelyre vonatkozó tükrözés. (Lásd a 6.6. példát.) Az n-dimenziós euklideszi vektortér ortogonális transzformációi mátrixának bizonyos szempontból legegyszerűbb alakjára vonatkozik a következő 13.67. Állítás: Ha L az n-dimenziós V euklideszi vektortér egy ortogonális transzformációja, akkor létezik a V vektortérnek olyan B={e1,e2,...,en} ortonormált bázisa, amelyben az L transzformáció mátrixa
180
0 1 1 1 1 1 mat B ( L) 1 cos1 sin 1 sin 1 cos1 cos 2 sin 2 sin 2 cos 2 cos k sin k 0 sin k cos k
alakú, ahol a beírtakon kívül az összes többi komponens zérus. Bizonyítás: A 13.50. állítás értelmében az n-dimenziós euklideszi V vektortérben található egy U 1- vagy 2-dimenziós L-invariáns altér. Ha dim(U)=1, akkor jelölje e1, ezen altér egy egységnyi normájú vektorát, röviden egységvektorát, ha pedig dim(U)=2, akkor jelölje {e1,e2} ennek egy ortonormált bázisát. Ha dim(U)=1, akkor az L transzformáció ezen L-invariáns altérre történő leszűkítése L(x)=±x alakú. Ha dim(U)=2, akkor az L transzformáció ezen Linvariáns altérre történő leszűkítése egy mozgás, ellenkező esetben ugyanis U tartalmazna 1-dimenziós L-invariáns alteret, ezért az L transzformáció leszűkítésének az {e1,e2} ortonormált bázisra vonatkozó mátrixa cos sin
sin cos
alakú. Az U altér U ortogonális komplementere egy L-invariáns altér. Valóban, ha xU, akkor az U altér minden y vektorára x·y=0 teljesül, s mivel L ortogonális transzformáció, így x·y=L(x)·L(y), ezért L(x)·L(y)=0 is igaz. De az L transzformáció U altérre való leszűkítése bijektív, így z=L(y) befutja az egész 181
U alteret, ha y befutja azt, ezért minden zU vektorra L(x)·z=0, vagyis L(x)U teljesül. Ha dim(U)=1, akkor a 13.19. állítás alapján V=UU, s így a 4.10. állítás felhasználásával n=dim(V)=dim(U)+dim(U)=1+dim(U), amiből dim(U)= =n-1 következik. Teljesen hasonlóan, ha dim(U)=2, akkor dim(U)=n-2. Az U L-invariáns altérben ismét található egy 1- vagy 2-dimenziós L-invariáns altér, ebben az altérben ismét kiválasztva egy bázist, és az eljárást folytatva n számú, páronként ortogonális egységvektort kapunk. Ezen vektorok alkalmas sorrendbe történő elrendezésével olyan ortonormált bázist nyerünk, amelyre vonatkozóan az L ortogonális transzformáció mátrixa éppen a kívánt alakot veszi fel. A főátló mentén elhelyezkedő 1, illetve -1 értékek az 1-dimenziós L-invariáns altereknek, a cos sin sin cos alakú blokkok pedig a 2-dimenziós L-invariáns altereknek felelnek meg. Befejezésül a skaláris szorzatos vektorterek izomorfizmusaival foglalkozunk. Legyen (ℂ,V,H) és (ℂ,V',H') két unitér vektortér a H(x,y)=x·y, illetve a H'(x',y')=x'·y' azonos módon jelölt belső szorzattal. Azt mondjuk, hogy a (ℂ,V,H) unitér vektortér izomorf a (ℂ,V',H') unitér vektortérrel, ha létezik olyan L:V→V' leképezés, hogy (1) L:V→V' izomorfizmus a V és V', mint ℂ test feletti vektorterek között, (2) L:V→V' megőrzi a belső szorzatot, azaz tetszőleges x,yV esetén L(x)·L(y)=x·y teljesül. A (ℂ,V,H) unitér vektortérnek a (ℂ,V',H') unitér vektortérrel való izomorfiáját a (ℂ,V,H)(ℂ,V',H'), vagy röviden csak a VV' szimbólum jelöli. A fentihez teljesen hasonlóan értelmezhetjük az (ℝ,V,A) euklideszi vektortérnek az (ℝ,V',A') euklideszi vektortérrel való izomorfiáját is. Megjegyezzük, hogy a skaláris szorzatos vektorterek fentiekben értelmezett izomorfiája az azonos K test feletti (K,V) és (K,V') vektorterek izomorfiájának specializálása arra az esetre, ha a vektorterekben még kitünte182
tünk belső szorzást is, ugyanis skaláris szorzatos vektorterek esetén az összeadás és a skalárral való szorzás megőrzésén kívül a belső szorzat megőrzését is megköveteljük az izomorf kapcsolatot létrehozó leképezéstől. 13.68. Állítás: Az unitér (euklideszi) vektorterek izomorfiája egy ekvivalenciareláció. Bizonyítás: Minden unitér (euklideszi) vektortérben az identikus leképezés izomorfizmus, így VV, tehát a reláció reflexív. Ha a V és V' unitér (euklideszi) vektortérre VV' teljesül, akkor létezik egy L:V→V' izomorfizmus, amelynek L-1:V'→V inverze szintén izomorfizmus lesz a V' és a V unitér (euklideszi) vektorterek között, ezért V'V is teljesül, tehát a reláció szimmetrikus. Ha pedig V, V' és V'' olyan unitér (euklideszi) vektortér, hogy VV' és V'V'', akkor létezik egy L:V→V' és egy M:V'→V'' izomorfizmus. Ekkor az M◦L:V→V'' is izomorfizmus lesz a V és a V'' vektorterek között, ezért VV'' teljesül, tehát a reláció tranzitív. A fenti állításban láttuk, hogy az unitér (euklideszi) vektorterek izomorfiája egy ekvivalenciareláció. Véges dimenziós unitér (euklideszi) vektorterek esetén meghatározhatjuk ezen ekvivalenciarelációhoz tartozó osztályozást is az alábbiak alapján. A 13.1., illetve a 13.2. példában említett ℝ n , illetve ℂ n vektorteret standard n-dimenziós euklideszi (unitér) vektortérnek fogjuk nevezni a továbbiakban. E két vektortér tehát a rendezett valós (komplex) szám n-esekből áll, amelyben az összeadást (x1,...,xn)+(y1,...,yn)≔(x1+y1,...,xn+yn) , a skalárral való szorzást k·(x1,...,xn)≔(k·x1,...,k·xn) , végül a belső szorzást valós esetben az (x1,...,xn)·(y1,...,yn)≔x1y1+...+xnyn , komplex esetben pedig az 183
(x1,...,xn)·(y1,...,yn)≔x1 y1 ... xn y n összefüggésekkel definiáljuk. Erre a két standard vektortérre támaszkodva mondjuk ki a véges dimenziós unitér (euklideszi) vektorterek struktúratételét. 13.69. Állítás: Bármely n-dimenziós unitér (euklideszi) vektortér izomorf a standard ndimenziós unitér (euklideszi) vektortérrel. Bizonyítás: Legyen B={e1,...,en} a V n-dimenziós unitér (euklideszi) vektortér egy tetszőleges, de rögzített ortonormált bázisa, B'={u1,...,un} pedig a standard ndimenziós unitér (euklideszi) vektortér u1≔(1,0,...,0), u2≔(0,1,0,...,0),..., un≔(0,...,0,1) kanonikus bázisa. Ekkor az 5.13. állítás szerint egyetlen olyan F lineáris leképezés létezik, amelyre F(ei)=ui (1≤i≤n) teljesül. Az 5.34. analóg állítás bizonyításában láttuk, hogy ha xV egy tetszőleges vektor, amelynek B bázisra vonatkozó koordinátái (x)B=(x1,x2,...,xn), akkor F(x)=(x1,x2,...,xn), sőt F bijektív. Megmutatjuk, hogy az F leképezés a fentieken kívül megőrzi a belső szorzatot is. Valóban, ha x és y a V vektortér két tetszőleges vektora az (x)B=(x1,x2,...,xn) és (y)B=(y1,y2,...,yn) koordinátákkal, akkor B ortonormált voltát felhasználva n
x y xi y i i 1
unitér, illetve n
x y xi y i i 1
euklideszi esetben, s n
(x1,...,xn)·(y1,...,yn)= xi yi i 1
a standard unitér, illetve 184
n
(x1,...,xn)·(y1,...,yn) = xi yi i 1
a standard euklideszi vektortér esetén, így F(x)·F(y)=x·y teljesül. Ezért az F egy izomorfizmus, s így állításunkat bebizonyítottuk. 13.70. Következmény: Ha V és V' véges dimenziós unitér (euklideszi) vektorterek, akkor VV' akkor és csakis akkor, ha dim(V)=dim(V'). Bizonyítás: Ha dim(V)=dim(V')=n, akkor a 13.69. állítás alapján V és V' egyaránt izomorfak a standard n-dimenziós unitér (euklideszi) vektortérrel, amelyből a reláció tranzitív tulajdonsága szerint VV' következik. Megfordítva, ha VV', tehát V és V' izomorf unitér (euklideszi) vektorterek, akkor a belső szorzat mellőzésével V és V', mint ℂ (ℝ ) test feletti vektorterek is izomorfak, vagyis található közöttük olyan L:V→V' izomorfizmus, amelyre az 5.18. következmény szerint rang(L)=dim(V)=dim(V') teljesül, s ezzel állításunkat igazoltuk. A fentiekből világosan láthatjuk, hogy a véges dimenziós unitér (euklideszi) vektorterek közül pontosan a megegyező dimenziójúak alkotják az izomorfia ekvivalenciarelációjának egy-egy osztályát. Feladatok: 1. Mutassuk meg, hogy ha x és y egy skaláris szorzatos V vektortér vektorai, akkor ||x+y||2+||x-y||2=2·||x||2+2·||y||2 . 2. Mutassuk meg, hogy ha x és y egy V euklideszi vektortér vektorai, akkor 4·x·y=||x+y||2-||x-y||2 . 3. Bizonyítsuk be, hogy ha x és y egy V unitér vektortér vektorai, akkor 4·x·y=||x+y||2-||x-y||2+i·||x+iy||2-i·||x-iy||2 . 4. Bizonyítsuk be, hogy az ||(x1,x2)||≔max{|x1|,|x2|} egyenlőség egy normát definiál az ℝ 2 vektortérben.
185
5. Az a1=(1,0,0), a2=(2,3,0), a3=(-1,1,1) vektorokból álló B={a1,a2,a3} bázisból kiindulva a Gram-Schmidt eljárással határozzuk meg az
ℝ 3 vektortér egy ortonormált bázisát! 6. Bizonyítsuk be, hogy ha L egy unitér vektortér egy tetszőleges lineáris transzformációja, akkor L◦L* és L*◦L önadjungált transzformációk! 7. Mutassuk meg, hogy ha L unitér transzformáció, M pedig önadjungált transzformáció, akkor L◦M◦L-1 szintén önadjungált. 8. Bizonyítsuk be, hogy páratlan dimenziójú euklideszi vektortérben minden lineáris transzformációnak létezik 1-dimenziós invariáns altere. 9. Bizonyítsuk be, hogy euklideszi vektortérben két átfordítás kompozíciója mozgás, továbbá egy átfordítás és egy mozgás kompozíciója mindkét sorrendben átfordítás.
186