El˝oadásvázlat a Lineáris algebra II. tárgyhoz Kovács Zoltán 2005. január 4.
Tartalomjegyzék 1. Euklideszi vektorterek 1.1. Bilineáris és kvadratikus formák, skaláris szorzatok 1.2. Norma, szög, távolság euklideszi vektorterekben . 1.3. Mer˝olegesség . . . . . . . . . . . . . . . . . . . . 1.4. Lineáris operátorok euklideszi vektorterekben . . . 2. Lineáris transzformációk szerkezete 2.1. Invariáns altér, sajátvektor, sajátérték . . 2.2. A karakterisztikus polinom . . . . . . . 2.3. Önadjungált transzformációk szerkezete 2.4. Ortogonális transzformációk szerkezete
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
3 3 5 8 12
. . . .
17 17 20 23 26
3. Geometriai alkalmazások 29 3.1. Geometriai transzformációk . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.2. Kúpszeletek elemi és analitikus geometriája . . . . . . . . . . . . . . . . . . . . 34 3.3. Másodrend˝u görbék a valós síkon . . . . . . . . . . . . . . . . . . . . . . . . . 35
2
1. fejezet Euklideszi vektorterek Ebben a fejezetben (végesen generált) valós vektorterekr˝ol lesz szó.
1.1. Bilineáris és kvadratikus formák, skaláris szorzatok Definíció. Legyen V vektortér R felett. Egy L: V × V → F leképezést bilineáris formának nevezünk, ha mindkét változójában lineáris, azaz ∀x, y, z ∈ V, α, β ∈ F : L(αx + βy, z) = αL(x, z) + βL(y, z), illetve ∀x, y, z ∈ V, α, β ∈ F : L(x, αy + βz) = αL(x, y) + βL(x, z). Definíció. Legyen L bilineáris forma egy n dimenziós V vektortéren, (e1 , . . . , en ) pedig V bá¡ ¢ zisa. L ezen bázisra vonatkozó mátrixán az M = L(ei , ej ) ∈ Mn×n mátrixot értjük. 1.1. Tétel. (Bilineáris formák bázisel˝oállítása.) Legyen L bilineáris forma egy n dimenziós V vektortéren, (e1 , . . . , en ) V bázisa. Ha az x vektor koordinátái X = (x1 , . . . , xn )t , az y vektor koordinátái Y = (y1 , . . . , yn )t , továbbá az L mátrixa M = (mij ), akkor L(x, y) =
n X
xi yj mij ,
i,j=1
azaz L(x, y) = X t · M · Y.
Bizonyítás: n n n n X X X X L(x, y) = L( xi ei , yj ej ) = xi yj L(ei , ej ) = xi yj mij . i=1
j=1
i,j=1
3
i,j=1
1.2. Tétel. Rögzítsük a V vektortér (e1 , . . . , en ) és (e01 , . . . , e0n ) bázisát, az (e1 , . . . , en ) → (e01 , . . . , e0n ) báziscsere mátrixa legyen S. Egy L bilineáris forma mátrixa az els˝o bázisban M , a második bázisban M 0 . Ekkor teljesül, hogy M 0 = S t M S.
Bizonyítás: Az S illetve S t mátrix elemeit jelöljük sij -vel, illetve sˆij -vel! Ã n ! n n X n n X n X X X X ski ek , slj el = ski slj L(ek , el ) = ski slj mkl = m0ij = L(e0i , e0j ) = L =
n X
à n X
l=1
k=1
k=1
!
ski mkl
slj =
l=1 Ã n n X X l=1
l=1 k=1
!
sˆik mkl
slj =
k=1
l=1 k=1 n X
(S t M )il slj = (S t M S)ij
l=1
Definíció. Az L bilineáris formát szimmetrikusnak nevezzük, ha ∀x, y : L(x, y) = L(y, x). 1.3. Tétel. Egy bilineáris forma akkor és csakis akkor szimmetrikus, ha tetsz˝oleges bázisra vonatkozó mátrixa szimmetrikus.
Bizonyítás: Ha az L bilineáris forma szimmetrikus, akkor (a bázisel˝oállításnál alkalmazott jelölésekkel) L(ei , ej ) = L(ej , ei ) ⇐⇒ mij = mji , Innen közvetlenül látható, hogy ha L szimmetrikus, akkor a mátrixa is szimmetrikus. Most tegyük fel, hogy L mátrixa valamely (e1 , . . . , en ) bázisra vonatkozóan szimmetrikus. Ekkor n n n n X X X X L(x, y) = xi yj mij és L(y, x) = yi xj mij = yj xi mji = yj xi mij . i,j=1
i,j=1
i,j=1
i,j=1
Definíció. Legyen L egy szimmetrikus bilineáris forma. A Q : V → F, Q(x) = L(x, x) módon értelmezett függvényt kvadratikus formának nevezzük, melynek poláris formája L. 1.4. Tétel. Kvadratikus forma poláris formája egyértelm˝u.
Bizonyítás: Ha Q(x) = L(x, x) teljesül (ahol L szimmetrikus bilineáris forma), akkor L(x + y, x + y) = L(x, x) + L(y, y) + 2L(x, y), azaz 2L(x, y) = Q(x + y) − Q(x) − Q(y). L(x, y) értékét Q tehát egyértelm˝uen meghatározza. 4
Definíció. Egy kvadratikus forma rögzített bázisra vonatkozó mátrixán a poláris forma mátrixát értjük. A bilineáris formák bázisel˝oállításából közvetlenül következik az alábbi állítás: 1.5. Tétel. (Kvadratikus formák bázisel˝oállítása.) Legyen Q kvadratikus forma egy n dimenziós V vektortéren, (e1 , . . . , en ) V bázisa. Ha az x vektor koordinátái (x1 , . . . , xn ), továbbá a Q mátrixa M = (mij ), akkor n X Q(x) = xi xj mij . i,j=1
Definíció. A V valós vektortéren értelmezett Q kvadratikus formát pozitív definitnek mondunk, ha ∀x ∈ V \ {0} : Q(x) > 0. Definíció. Legyen V valós vektortér. V -n adott skaláris szorzaton olyan h, i : V × V → R szimmetrikus bilineáris formát értünk, melyb˝ol képezett kvadratikus forma pozitív definit. Ilyenkor a (V, h, i) párt euklideszi vektortérnek, vagy röviden euklideszi térnek nevezzük. Példa. A szabadvektorok tere a benne geometriai úton értelmezett skaláris szorzattal. Példa. (Rn , h, i), ahol az X = (x1 , . . . , xn ) és Y = (y1 , . . . , yn ) szám n-esek ún. kanonikus skaláris szorzatát a következ˝oképpen értelmezzük: hX, Y i =
n X
xi yi .
i=1
Példa. Legyen P n a legfeljebb n-edfokú (valós együtthatós) polinomok tere. Benne a skaláris szorzatot értelmezhetjük a következ˝oképpen: Z 1 hp, qi = p(t) · q(t) dt, p, q ∈ P n . −1
1.2. Norma, szög, távolság euklideszi vektorterekben p ¡ ¢ Definíció. Legyen E, h, i euklideszi vektortér. Az x vektor hosszán az kxk = hx, xi számot értjük. 1.6. Tétel. (A Cauchy–Bunyakovszkij–Schwarz-egyenl˝otlenség.) Egy euklideszi vektortér bármely két vektorára teljesül, hogy hx, yi2 ≤ hx, xi · hy, yi. Egyenl˝oség akkor és csakis akkor áll fenn, ha x és y lineárisan függ˝ok. 5
Bizonyítás: y = 0-ra az állítás triviálisan teljesül, a továbbiakban feltesszük, hogy y 6= 0. Legyen λ ∈ R tetsz˝oleges, s tetsz˝olegesen rögzített x-re és y 6= 0-ra tekintsük az alábbi kifejezést: f (λ) = hx − λy, x − λyi = hx, xi − 2λhx, yi + λ2 hy, yi. ∀λ ∈ R : f (λ) ≥ 0, mert vektor önmagával való skaláris szorzata mindig nemnegatív, tehát a másodfokú polinom diszkriminánsa nem pozitív: hx, yi2 − hx, xihy, yi ≤ 0. Egyenl˝oség akkor és csakis akkor állhat fenn, ha x − λy = 0, amib˝ol x és y lineáris függ˝osége következik. Megfordítva, ha x és y lineárisan függ˝ok, akkor vagy x = λy vagy y = λx valamely alkalmas skalárra. Bármelyiket behelyettesítve az egyenl˝otlenség egyik ill. másik oldalába, egyenl˝o kifejezéseket kapunk. Megjegyzés. A CBS egyenl˝otlenség mások szokásos (az el˝oz˝ovel triviálisan ekvivalens) alakja: |hx, yi| ≤ kxk · kyk. Példa. Rn kanonikus skaláris szorzatára a CBS egyenl˝otlenséget az alábbiak szerint írhatjuk (ezt az alakot tanultuk a bevezet˝o analízis tárgyból): Ã n ! Ã n ! Ã n ! X X X xi y i ≤ x2i · yi2 , xi , yi ∈ R, i = 1, . . . , n. i=1
i=1
i=1
1.7. Tétel. (Minkowski-egyenl˝otlenség.) Egy euklideszi vektortér tetsz˝oleges x és y vektorára: kx + yk ≤ kxk + kyk.
Bizonyítás: kx + yk2 = = ≤ ≤ =
hx + y, x + yi = hx, xi + 2hx, yi + hy, yi ≤ hx, xi + 2|hx, yi| + hy, yi ≤ hx, xi + 2kxk · kyk + hy, yi = kxk2 + 2kxk · kyk + kyk2 = (kxk + kyk)2 .
A következ˝o tételben összefoglaljuk a norma tulajdonságait: ¡ ¢ 1.8. Tétel. Az E, h, i euklideszi vektortérben a k k : E → R normafüggvény rendelkezik az alábbi tulajdonságokkal: (N1) ∀x ∈ E : kxk ≥ 0; továbbá kxk = 0 ⇐⇒ x = 0. (N2) ∀x ∈ E, ∀λ ∈ R : kλxk = |λ| · kxk. 6
(N3) ∀x, y ∈ E : kx + yk ≤ kxk + kyk.
Bizonyítás: Az els˝o tulajdonság következik a skaláris szorzás pozitív definit voltából, a második pedig a bihomogenitásból. A harmadik állítás a Minkowski-egyenl˝otlenség megismétlése. Az eddigiekben a norma mindig egy (a vektortéren adott) skaláris szorzatból származott. A fentebbi tételben megfogalmazott három tulajdonság vezet el a normált vektortér fogalmához. Hangsúlyozzuk, hogy a következ˝o definíció kiindulópontja nem egy euklideszi vektortér, hanem egy vektortér, azaz nincs benne adva skaláris szorzat. Definíció. Egy V vektorteret normált vektortérnek nevezünk, ha benne adva van egy k k: V → R normafüggvény, mely rendelkezik az N1, N2, N3 tulajdonságokkal. Fontos kérdés, hogy a definíció valóban újdonságot ad-e, vagy egy normához mindig be lehet vezetni a vektortéren olyan skaláris szorzatot, mely éppen az adott normát definiálja. A válasz tagadó, azaz vannak olyan normált vektorterek, melyek nem euklideszi vektortérb˝ol származnak. Erre vonatkozik az alábbi tétel: ¡ ¢ 1.9. Tétel. Legyen adva egy V, k k normált vektortér. Egy norma akkor és csakis akkor származik skaláris szorzatból, ha a vektortérben teljesül a paralelogramma reláció: ¡ ¢ ∀x, y ∈ V : kx + yk2 + kx − yk2 = 2 kxk2 + kyk2 .
Bizonyítás: Ld. feladatgy˝ujtemény: 289. feladat. Definíció. Egy euklideszi vektortér x és y vektorának távolságán a d(x, y) = kx − yk számot értjük. 1.10. Tétel. Tetsz˝oleges euklideszi vektortér metrikus tér az el˝obb értelmezett távolságfüggvényre.
Bizonyítás: A metrikus tér axiómái közül csak a háromszög-egyenl˝otlenség teljesülése nem magától érthet˝od˝o. d(x, y) + d(y, z) = kx − yk + ky − zk ≥ ≥ kx − zk = d(x, z), alkalmazva a Minkowski-egyenl˝otlenséget. 1.11. Tétel. (Pitagorasz tétele.) Egy euklideszi vektortér x és y vektora akkor és csakis akkor mer˝olegesek egymásra, ha d(x, y)2 = kxk2 + kyk2 7
Bizonyítás: d(x, y)2 = hx − y, x − yi = hx, xi2 + hy, yi2 − 2hx, yi = kxk2 + kyk2 − 2hx, yi. hx,yi Definíció. Az x és y nem nullvektorok ϕ szögét a cos ϕ = kxk·kyk (ϕ ∈ [0, π]) összefüggéssel értelmezzük. A nullvektor tetsz˝oleges vektorral bezárt szöge derékszög.
Megjegyzés. Az el˝obbi definíció jobb oldalán −1 és 1 közötti szám van, ezt a CBS egyenl˝otlenség garantálja.
1.3. Mer˝olegesség Definíció. Egy euklideszi vektortér két vektorát egymásra ortogonálisnak vagy mer˝olegesnek mondjuk, ha skaláris szorzatuk zéró. Egy vektorrendszert ortogonálisnak mondunk, ha egymásra mer˝oleges vektorok alkotják. Az olyan vektort, melynek hossza 1, egységvektornak nevezzük. Egy vektorrendszert ortonormáltnak mondunk, ha egymásra mer˝oleges egységvektorok alkotják. 1.12. Tétel. Nemzéró vektorok ortogonális rendszere mindig lineárisan független.
Bizonyítás: Legyen (e1 , . . . , ek ) nemzéró vektorok ortogonális rendszere, s tekintsük olyan lineáris kombinációjukat, amely zérusvektort ad: α1 e1 + · · · + αk ek = 0. Szorozzuk skalárisan az egyenl˝oség mindkét oldalát ei -vel (i = 1, . . . , n): α1 he1 , ei i + · · · + αk hek , ei i = 0. A bal oldalon i 6= j-re hej , ei i = 0, tehát αi hei , ei i = 0, ahol a skaláris szorzat pozitív definitsége miatt hei , ei i 6= 0, tehát αi = 0. 1.13. Tétel. Legyen B = (b1 , . . . , bn ) bázisa egy euklideszi vektortérnek. Létezik a térben olyan E = (e1 , . . . , en ) ortonormált bázis, hogy ∀1 ≤ k ≤ n-re: L(b1 , . . . , bk ) = L(e1 , . . . , ek ).
Bizonyítás (A Gram-Schmidt eljárás): A bizonyítás konstruktív. e1 = kbb11 k , továbbá tegyük fel, hogy (e1 , . . . , ej ) (j < n) olyan ortonormált lineárisan független rendszer, melyre ∀1 ≤ k ≤ jL(b1 , . . . , bk ) = L(e1 , . . . , ek ). 8
Megkonstruáljuk a j + 1-edik vektort. Legyen fj+1 = −hbj+1 , e1 ie1 − · · · − hbj+1 , ej iej + bj+1 . Ezzel egy olyan vektort kaptunk, mely e1 , . . . , ej mindegyikére mer˝oleges. Szorozzuk ugyanis az el˝oz˝o sort skalárisan ei -vel! Ekkor hbj+1 , er iher , ei i = 0 i 6= r-re, tehát 1
z }| { hfj+1 , ei i = −hbj+1 , ei i hei , ei i +hbj+1 , ei i = 0 (i = 1, . . . , j.) Mivel az (e1 , . . . , ej , fj+1 ) vektorrendszerb˝ol lineárisan kombinálható a (b1 , . . . , bj , bj+1 ) vektorrendszer s megfordítva, ezért a lineáris kombináció tranzitivitását használva teljesül, hogy L(b1 , . . . , bj+1 ) = L(e1 , . . . , ej , fj+1 ). A L(b1 , . . . , bj+1 ) j + 1 dimenziós altérben tehát (e1 , . . . , ej , fj+1 ) j + 1 tagú generátorrendszer, tehát bázis. Ebb˝ol az is következik, hogy fj+1 nem lehet nullvektor, tehát normálható, s ej+1 = fj+1 -re kfj+1 k (e1 , . . . , ej , ej+1 ) a megfelel˝o ortonormált vektorrendszer. Az eljárás n lépésben a vektortér n tagú generátorrendszerét, vagyis bázisát adja, melyre a megkívánt generátortulajdonság teljesül. Következmény. Minden euklideszi vektortérnek van ortonormált bázisa. Minden ortonormált rendszer vagy bázis, vagy kiegészíthet˝o ortonormált bázissá. Az ortonormált bázisok használata leegyszer˝usít bizonyos számításokat, amint azt az alábbi fontos példák mutatják. 1.14. Tétel. Legyen adva egy euklideszi vektortér, s abban rögzítsünk egy ortonormált bázist! Ha az x és y vektorok koordinátái a rögzített bázisra vonatkozóan (x1 , . . . , xn ) ill. (y1 , . . . , yn ) akkor a két vektor skaláris szorzatát az alábbi módon számíthatjuk ki: hx, yi = x1 y1 + · · · + xn yn . 1.15. Tétel. (Vektor Fourier-el˝oállítása.) Legyen E = (e1 , . . . , en ) ortonormált bázis egy (V, h, i) euklideszi vektortérben. Ekkor ∀x ∈ V : n X x= hx, ei iei . i=1
Bizonyítás: Mindkét állítás triviális számolás. 9
1.16. Tétel. (Bessel-egyenl˝otlenség.) Legyen E = (e1 , . . . , ek ) ortonormált vektorrendszer egy (V, h, i) euklideszi vektortérben. Ekkor ∀x ∈ V : k X
hx, ei i2 ≤ kxk2 .
i=1
Továbbá minden x-re akkor és csakis akkor teljesül egyenl˝oség, ha E bázis.
Bizonyítás: Egészítsük ki E-t ortonormált bázissá (ha már bázis akkor nem veszünk hozzá vektort): (e1 . . . , ek , . . . , en ). Ekkor n k n X X X hx, ei i2 = hx, ei i2 + hx, ei i2 = kxk2 i=1
i=1
i=k+1
teljesül, amib˝ol az állítás leolvasható. Ha E bázis, akkor az egyenl˝oség minden x-re teljesül. Megfordítva, ha E nem lenne bázis, akkor kiegészíthet˝o ortonormált bázissá. Legyen egy kiegészít˝o vektor e. x = e-re a bal oldal 0-t, a jobb oldal 1-t ad, ami ellentmondás. Definíció. A (V, h, iV ) és (W h, iW ) euklideszi tereket izometrikusan izomorf nak nevezzük, ha létezik olyan ϕ: V → W bijektív lineáris leképezés (azaz izomorfizmus), melyre ∀x, y ∈ V : hx, yiV = hϕ(x), ϕ(y)iW . 1.17. Tétel. (Véges dimenziós euklideszi terek struktúratétele.) Egy n dimenziós euklideszi vektortér izometrikusan izomorf Rn -nel, ahol Rn -ben a skaláris szorzat a kanonikus.
Bizonyítás: A véges dimenziós vektorterek struktúratételének bizonyításában már konstruáltunk izomorfizmust egy valós n dimenziós vektortér és Rn között. Ehhez bázis rögzítésére volt szükség. Most azt látjuk be, hogy ha ortonormált bázist rögzítünk, akkor ez az izomorfizmus izometrikus. Legyen tehát (V, h, i) n dimenziós euklideszi vektortér, benne (e1 , . . . , en ) ortonormált bázis. Értelmezzük a V → Rn leképezést úgy, hogy minden vektorhoz rendeljük hozzá az (e1 , . . . , en ) bázisra vonatkozó koordinátáit: V 3 x 7→ (x1 , . . . , xn ) ∈ Rn , ha x = x1 e1 + · · · + xn en . A véges dimenziós vektorterek struktúratételéb˝ol már tudjuk, hogy ez a leképezés izomorf leképezése V -nek Rn -re. Most belátjuk a leképezés izometrikus voltát. Legyen x, y ∈ V két tetsz˝oleges vektor, x 7→ (x1 , . . . xn ), y 7→ (y1 , . . . , yn ). A vektorok skaláris szorzatát V -ben a koordináták kompozítumaként számíthatjuk ki (ld. 1.14.): hx, yi = x1 y1 + · · · + xn yn , ez pontosan megegyezik az Rn -beli képek skaláris szorzatával. 10
Következmény. Két euklideszi vektortér akkor és csakis akkor izometrikusan izomorf, ha ugyanaz a dimenziójuk. Definíció. Legyen (V, h, i) euklideszi vektortér, H ⊂ V altér. H ortogonális komplementerén a következ˝o H ⊥ ⊂ V halmazt értjük: H ⊥ = { x ∈ V |∀y ∈ H : hx, yi = 0 }, azaz minden olyan vektort V -b˝ol, mely az összes H-beli vektorra mer˝oleges. 1.18. Tétel. x ∈ H ⊥ akkor és csakis akkor teljesül, ha x mer˝oleges H tetsz˝oleges bázisának minden vektorára.
Bizonyítás: Ha x ∈ H ⊥ , akkor x minden H-beli vektorra mer˝oleges, többek közt egy tetsz˝oleges bázis minden vektorára is. Megfordítva, legyen (e1 , . . . , ek ) egy bázis H-ban, s teljesüljön, hogy ∀i : hx, ei i = 0. Legyen y ∈ H tetsz˝oleges: y =
Pk i=1
αi ei .
hx, yi = hx,
k X
αi ei i =
i=1
k X
αi hx, ei i = 0,
i=1
azaz x ∈ H ⊥ . Megjegyzés. Az el˝oz˝o tétel a síkra mer˝oleges egyenes tételének általánosítása. 1.19. Tétel. Egy altér ortogonális komplementere mindig altér, továbbá, ha H ⊂ V altér, akkor H ⊕ H ⊥ = V, H ⊥⊥ = H.
Bizonyítás: El˝oször belátjuk, hogy H ⊥ altér. A zéróvektor nyilván benne van H ⊥ -ben, mert a zéróvektor minden vektorra mer˝oleges. Ha x1 , x2 ∈ H ⊥ , akkor ∀y ∈ H : hy, x1 i = 0 és hy, x2 i = 0 =⇒ hy, x1 + y2 i = hy, x1 i + hy, x2 i = 0, tehát az összegvektor is benne van H ⊥ -ben. A skalárszorosra hasonlóan: hy, x1 i = 0 =⇒ hy, αx1 i = αhy, x1 i = 0. A direktösszeg tulajdonságot úgy látjuk be, hogy ellen˝orizzük, H és H ⊥ egy-egy ortonormált bázisának egyesítése a tér bázisát adja. Legyen tehát (e1 , . . . , er ) ortonormált bázis H-ban, f1 , . . . , fs pedig H ⊥ -ben. Az egyesített rendszer ortogonális, tehát lineárisan független (ld. 1.12.) Ha nem lenne bázis, akkor egészítsük ki ortonormált bázissá. Legyen e egy a kiegészít˝o vektorok közül. e ⊥ ei (i = 1, . . . , r), tehát e ∈ H ⊥ , ugyanakkor e ⊥ fi (i = 1 . . . , s) tehát (e, f1 , . . . , fs ) 11
lineárisan független vektorrendszer lenne H ⊥ -ben, ami nyilván ellentmondás, mert (f1 , . . . , fs ) maximális lineárisan független rendszer H ⊥ -ben. H ⊥⊥ = H. H ⊂ H ⊥⊥ , mert ∀x ∈ H ⊥ és ∀y ∈ H: x ⊥ y. Az, hogy a tartalmazás nem valódi, onnan következik, hogy a dimenziójuk megegyezik: ¾ H ⊕ H ⊥ = V =⇒ dim H + dim H ⊥ = dim V =⇒ dim H = dim H ⊥⊥ . H ⊥ ⊕ H ⊥⊥ = V =⇒ dim H ⊥ + dim H ⊥⊥ = dim V Definíció. Rögzítsük egy V euklideszi vektortér H alterét! Ekkor ∀x ∈ V egyértelm˝uen felbomlik x = prH x + ortH x alakban, ahol prH x ∈ H, ortH x ∈ H ⊥ . A prH x vektort az x vektor mer˝oleges vetületének nevezzük a H altérre, míg ortH x az x vektor H-ra mer˝oleges komponense. Az k ortH xk számot az x vektor H altért˝ol való távolságának nevezzük (melyre a d(x, H) jelölést is alkalmazhatjuk). 1.20. Tétel. (Az el˝oz˝o definíció jelöléseivel.) d(x, H) = min{ kx − yk | y ∈ H }.
Bizonyítás: Az egyszer˝uség kedvéért: prH x = x0 . Ekkor ortH x = x − x0 . A Pitagorasz-tételt alkalmazva: kx − yk2 = k(x − x0 ) + (x0 − y)k2 = k(x − x0 )k2 + kx0 − yk2 ≥ k(x − x0 )k2 .
1.4. Lineáris operátorok euklideszi vektorterekben 1.21. Tétel. Legyen (V, h, i) euklideszi vektortér, ϕ ∈ L(V ; V ) lineáris operátor. Ekkor az L : V × V → R, L(x, y) = hϕ(x), yi
(∗)
leképezés bilineáris forma. Megfordítva, minden bilineáris formához egyértelm˝uen létezik olyan ϕ ∈ L(V ; V ) lineáris operátor, hogy (∗) teljesül. A tételt analóg módon megfogalmazhatjuk a második változóval kapcsolatban.
Bizonyítás: Legyen ϕ : V → V lineáris operátor, és L(x, y) = hϕ(x), yi. L(x1 + x2 , y) = hϕ(x1 + x2 ), yi = hϕ(x1 ) + ϕ(x2 ), yi = hϕ(x1 ), yi + hϕ(x2 ), yi = L(x1 , y) + L(x2 , y) 12
L definíciója ϕ lineáris a skaláris szorzás lineáris L definíciója
továbbá L(αx, y) = hϕ(αx), yi = hαϕ(x), yi = αhϕ(x), yi = αL(x, y)
L definíciója ϕ lineáris a skaláris szorzás lineáris L definíciója.
Belátjuk az egyértelm˝uséget. Tegyük fel, hogy ∀x, y : hϕ(x), yi = L(x, y) és hψ(x), yi = L(x, y) egyaránt teljesül. Ez azt jelenti, hogy ∀x, y hϕ(x), yi = hψ(x), yi =⇒ h(ϕ − ψ)(x), yi = 0. Rögzített x mellett ez el˝obbi egyenl˝oség minden y-ra teljesül, azaz ∀x : (ϕ − ψ)(x) = 0 =⇒ ϕ = ψ. A létezés bizonyítása maradt hátra. Rögzítsünk egy (e1 , . . . , en ) ortonormált bázist! Ebben a bázisban L mátrixa legyen (mij ) ∈ Mn×n . ψ-t értelmezzük úgy, hogy ϕ(ei ) =
n X
mik ek .
k=1
(Azaz ψ mátrixa L mátrixának transzponáltja.) A lineáris kiterjesztés tétele szerint így valóban meghatároztunk egy lineáris operátort. Ellen˝orizni kell a (∗) tulajdonság teljesülését. Mivel (∗) mindkét oldalán bilineáris forma van, elegend˝o azt bebizonyítani, hogy az el˝obb rögzített ortonormált bázison ugyanazokat az értékeket veszik fel. n X hϕ(ei ), ej i = h mik ek , ej i
=
k=1 n X
mik hek , ej i
k=1
hek , ej i csak k = j-re ad 0-tól különböz˝o értéket, nevezetesen 1-et: = mij . Megjegyezzük, hogy ha az L(x, y) = hx, ϕ(y)i feltétellel keresünk lineáris operátort, akkor az el˝oz˝o bizonyításrész úgy módosul, hogy ϕ konstrukciójakor L mátrixát használjuk (nem pedig a transzponáltat). 13
Definíció. Egy euklideszi vektortér ϕ lineáris operátorának adjungáltja az a ϕ∗ -gal jelölt lineáris operátor, melyre ∀x, y : hϕ(x), yi = hx, ϕ∗ (y)i. 1.22. Tétel. Egy euklideszi vektortér minden lineáris operátorának egyértelm˝uen létezik adjungáltja.
Bizonyítás: Legyen ϕ lineáris operátor, ekkor hϕ(x), yi = L(x, y) bilineáris forma, ehhez egyértelm˝uen létezik olyan ψ lineáris operátor, hogy L(x, y) = hx, ψ(y)i. ψ lesz az ϕ operátor adjungáltja. 1.23. Tétel. Ortonormált bázisban az operátor mátrixa és az adjungált operátor mátrixa egymás transzponáltja.
Bizonyítás: L(x, y) = hϕ(x), yi = hx, ϕ∗ (y)i. Tetsz˝oleges ortonormált bázisban ϕ mátrixa L mátrixának transzponáltja, ϕ∗ mátrixa pedig megegyezik L mátrixával. 1.24. Tétel. Az adjungálásra teljesülnek az alábbi tulajdonságok: (ϕψ)∗ (ϕ∗ )∗ (ϕ + ψ)∗ (λϕ)∗ (λ id)∗
= ψ ∗ ϕ∗ =ϕ = ϕ∗ + ψ ∗ = λϕ∗ = id .
Bizonyítás: Valamennyi tulajdonság a definíció szerint egyszer˝uen ellen˝orizhet˝o. Pl. az els˝o tulajdonság: h(ϕψ)(x), yi = hϕ(ψ(x)), yi = hψ(x), ϕ∗ (y)i = hx, ψ ∗ (ϕ∗ (y))i = hx, (ψ ∗ ϕ∗ )(y)i. Másik lehet˝oség a bizonyításra az, hogy minden tulajdonságot visszavezethetünk a mátrixok transzponálásának megfelel˝o tulajdonságára, ugyanis az el˝oz˝oek szerint a lineáris transzformációk adjungálásának a mátrixok transzponálása felel meg. Definíció. Egy lineáris operátort önadjungáltnak nevezünk, ha megegyezik az adjungáltjával. 1.25. Tétel. Egy lineáris operátor akkor és csakis akkor önadjungált, ha tetsz˝oleges ortonormált bázisban a mátrixa szimmetrikus. Definíció. Egy euklideszi vektortér egy lineáris operátorát ortogonális operátornak nevezzük, ha adjungáltja megegyezik az inverzével. 1.26. Tétel. Egy euklideszi vektortér lineáris operátora akkor és csakis akkor ortogonális, ha tetsz˝oleges ortonormált bázisra vonatkozó mátrixa egymásra mer˝oleges, egységnyi hosszú oszlopvektorokból (ill. sorvektorokból) áll. Az ilyen mátrixot ortogonális mátrixnak nevezzük. 14
Bizonyítás: A ϕ operátor akkor és csakis akkor ortogonális, ha ϕϕ∗ = id, ϕ∗ ϕ = id . Ortonormált bázis rögzítése után ϕ mátrixát jelölje U , ϕ∗ mátrixa ekkor U t . A fenti els˝o összefüggés pedig azzal ekvivalens, hogy U U t = I, amib˝ol a mátrixszorzás definícióját felhasználva adódik az oszlopokra vonatkozó állítás. (U t oszlopai megegyeznek U soraival!) A sorokra az állítás az U t U = I összefüggést felhasználva jön ki. 1.27. Tétel. Ortogonális mátrix inverze megegyezik a transzponáltjával.
Bizonyítás: Ld. az el˝oz˝o bizonyítást. 1.28. Tétel. Legyen V euklideszi vektortér, ϕ ∈ τV . A következ˝o állítások ekvivalensek: 1. ϕ ortogonális; 2. ϕ megtartja a skaláris szorzatot, azaz ∀x, y ∈ V : hϕ(x), ϕ(y)i = hx, yi; 3. ϕ megtartja a vektorok hosszát: ∀x ∈ V : kϕ(x)k = kxk; 4. ϕ megtartja a távolságot: ∀x, y ∈ V : d(ϕ(x), ϕ(y)) = d(x, y); 5. tetsz˝oleges ortonormált bázis képe ortonormált bázis.
Bizonyítás: 1 ⇐⇒ 2 El˝oször teljesüljön, hogy ϕ∗ ϕ = id. Ekkor hϕ(x), ϕ(y)i = hx, ϕ∗ ϕ(y)i = hx, yi. Megfordítva, ha ϕ megtartja a skaláris szorzatot, azaz hϕ(x), ϕ(y)i = hx, yi, akkor hϕ∗ ϕ(x), yi = hx, yi hϕ∗ ϕ(x), yi = hid(x), yi, 15
amib˝ol következik, hogy ∀x, y ∈ V : h(ϕ∗ ϕ − id)(x), yi = 0, vagyis ϕ∗ ϕ = id. 2 ⇐⇒ 3 2 =⇒ 3 nyilvánvaló, a norma definíciója miatt: p p kϕ(x)k = hϕ(x), ϕ(x)i = hx, xi = kxk. Megfordítva, könnyen ellen˝orizhet˝o, hogy: hx, yi =
¢ 1¡ kx + yk2 − kxk2 − kyk2 , 2
azaz a skaláris szorzat a normából kifejezhet˝o. 3 ⇐⇒ 4 Következik onnan, hogy a norma és távolság egymásból kölcsönösen kifejezhet˝ok: d(x, y) = kx − yk, kxk = d(x, 0). 2 =⇒ 5 A skaláris szorzat tartásból következik, hogy ortonormált vektorrendszer képe ortonormált vektorrendszer, P hisz a hossz és aP mer˝olegesség megmarad. n 5 =⇒ 2 P Legyen x = i=1 xi ei , y P = ni=1 yi ei , ahol (e1 , . . . , en ) ortonormált bázis. Ekn n kor ϕ(x) = i=1 xi ϕ(ei ) és ϕ(y) = i=1 yi ϕ(ei ) is teljesül. Mivel (ϕ(e1 ), . . . , ϕ(en )) is ortonormált bázis: hx, yi = hϕ(x), ϕ(y)i =
n X i=1 n X
xi y i xi y i .
i=1
Az el˝oz˝o tétel közvetlen következménye az alábbi: 1.29. Tétel. Ha egy báziscsere olyan, hogy mind a régi, mind az új bázis ortonormált, akkor a báziscsere mátrixa ortogonális.
Bizonyítás: Legyen (e1 , . . . , en ) a régi bázis, (f1 , . . . , fn ) az új bázis. Értelmezzük a ϕ lineáris transzformációt a lineáris kiterjesztés tétele alapján a ϕ(ei ) = fi relációval. ϕ ortonormált bázist ortomormált bázisba visz át, ezért ortogonális operátor. ϕ mátrixa az (e1 , . . . , en ) bázisra vonatkozóan megegyezik a báziscsere mátrixával: fi = ϕ(ei ) =
n X
sji ej .
j=1
Azt már tudjuk, hogy ortogonális operátor mátrixa ortonormált bázisban ortogonális mátrix.
16
2. fejezet Lineáris transzformációk szerkezete A fejezet f˝o problémája a következ˝o: Egy lineáris operátorhoz keresünk olyan bázist, melyben a mátrixa „egyszer˝u”. Egyszer˝u mátrixnak számít, ha „elég sok” zérus van benne, pl. a mátrix diagonális, vagy trianguláris. (Majd kés˝obb látjuk, a diagonális mátrix általában nem érhet˝o el, de komplex vektorterekben az elérhet˝o, hogy zérustól különböz˝o elem legfeljebb a f˝odiagonálisban, vagy közvetlenül alatta szerepeljen.) A következ˝oekben ismét általánosan, F feletti vektorterekr˝ol lesz szó, ahol F = R vagy C.
2.1. Invariáns altér, sajátvektor, sajátérték Definíció. Egy V vektortér H alterét az ϕ : V → V lineáris operátor invariáns alterének nevezzük, ha ∀x ∈ H : ϕ(x) ∈ H. Az x ∈ V nem zéró vektort az ϕ lineáris operátor sajátvektorának nevezzük, ha ∃λ ∈ F, hogy ϕ(x) = λ · x. λ-t ilyenkor az x sajátvektorhoz tartozó sajátértéknek nevezzük. Példa. V és {0} minden lineáris operátornak invariáns altere. Ezeket triviális invariáns altereknek nevezzük. Példa. Egy sajátvektor által generált altér mindig invariáns. (Ellen˝orizzük!) Példa. Lineáris operátor képtere és magtere invariáns altér. (Ellen˝orizzük!) Példa. Tekintsük R2 origó körüli elforgatását. Egyszer˝u geometriai megfontolás mutatja, hogy ha az elforgatás nem identitás, vagy középpontos tükrözés, akkor nincs valódi (azaz egy dimenziós) invariáns altere. A középpontos tükrözésnek minden egy dimenziós altér invariáns altere lesz. R3 -ban tekintsünk egy tengely körüli elforgatást, a tengely illeszkedjen az origóra. A tengely egy dimenziós, az origóra illeszked˝o, s a tengelyre mer˝oleges sík két dimenziós invariáns altér. 17
A fejezet kérdésfelvetése (mi az a „legegyszer˝ubb” mátrix, amihez egy mátrix hasonló) szempontjából a legegyszer˝ubb szituáció az, amikor a mátrix egy diagonális mátrixhoz hasonló: 2.1. Tétel. Egy lineáris operátor akkor és csakis akkor diagonalizálható, ha van a térben a sajátvektoraiból álló bázis.
Bizonyítás: Legyen el˝oször (a1 , . . . , an ) a ϕ lineáris operátor sajátvektoraiból álló bázis. Ekkor ϕ(ai ) = λi ai , ahol λi a ϕ megfelel˝o sajátértéke. Ez azt jelenti, hogy ϕ mátrixának i-edik oszlopa i
^
(0, . . . , λi , . . . , 0)t , azaz az i-edik oszlopban csak az i-edik elem lehet zérustól különböz˝o. Megfordítva, ha van olyan bázis, amelyben az operátor mátrixa diagonális, akkor az a bázis sajátvektorokból áll. Valóban, legyen (e1 , . . . , en ) a szóban forgó bázis, melyben az operátor mátrixa λ1 0 . . . 0 0 λ2 . . . 0 . . . . 0 0 . . . λn A lineáris operátor mátrixának képzési szabálya szerint ekkor fennáll, hogy ϕ(ei ) = λi ei , tehát ei a λi sajátértékhez tartozó sajátvektor. 2.2. Tétel. Legyen λ a ϕ : V → V lineáris operátor sajátértéke! Az Lλ = { v ∈ V |ϕ(v) = λv } halmaz a ϕ operátor invariáns altere, melyet a λ sajátértékhez tartozó sajátaltérnek nevezünk. Úgy is fogalmazhatunk, hogy egy lineáris operátor egy sajátértékéhez tartozó sajátvektorai a nullvektorral kiegészítve alteret alkotnak, mely altér invariáns.
Bizonyítás: El˝oször belátjuk, hogy Lλ altér. A zérusvektor triviálisan kielégíti a ϕ(0) = λ0 összefüggést, tehát a halmaz nem üres. Legyen x, y ∈ Lλ , azaz ϕ(x) = λx, ϕ(y) = λy. Ekkor: ϕ(x + y) = ϕ(x) + ϕ(y) = λx + λy = λ(x + y), továbbá α ∈ F-re: ϕ(αx) = αϕ(x) = αλx = λ(αx). Belátjuk, hogy Lλ invariáns altér. Teljesüljön, hogy x ∈ Lλ , azaz ϕ(x) = λx. Be kell látni, hogy ϕ(x) szintén benne van Lλ -ban. ϕ(ϕ(x)) = ϕ(λx) = λϕ(x), ez pontosan a bizonyítandó állítást jelenti. 18
Definíció. A Lλ altér dimenzióját a λ sajátérték geometriai multiplicitásának nevezzük. 2.3. Tétel. Az ϕ : V → V lineáris operátor különböz˝o sajátértékekhez tartozó sajátvektorai lineárisan függetlenek.
Bizonyítás: Legyenek λ1 , . . . , λk különböz˝o sajátértékek, a1 , . . . , ak hozzájuk tartozó egy-egy sajátvektor, azaz ϕ(ai ) = λi ai (i = 1, . . . , k). A bizonyítást a sajátértékek száma szerinti teljes indukcióval végezzük el. k = 1-re az állítás nyilván teljesül, mert egy nem zérusvektor önmagában mindig lineárisan független vektorrendszert alkot. Tegyük fel, hogy n = k − 1-re az állítás igaz, azaz a1 , . . . , ak−1 lineárisan függetlenek. Állítsuk el˝o a zérusvektort az a1 , . . . , ak vektorok lineáris kombinációjaként: µ1 a1 + · · · + µk−1 ak−1 + µk ak = 0.
(∗)
Alkalmazzuk (∗) mindkét oldalára a ϕ lineáris operátort! A linearitás miatt: µ1 ϕ(a1 ) + · · · + µk−1 ϕ(ak−1 ) + µk ϕ(ak ) = 0. Használjuk fel, hogy ϕ(ai ) = λi ai : µ1 λ1 a1 + · · · + µk−1 λk−1 ak−1 + µk λk ak = 0.
(†)
Most (∗) mindkét oldalát szorozzuk meg λk -val! µ1 λk a1 + · · · + µk−1 λk ak−1 + µk λk ak = 0.
(‡)
Végezetül vonjuk ki (†)-ból (‡)-ot: µ1 (λ1 − λk )a1 + · · · + µk−1 (λk−1 − λk )ak−1 + µk (λk − λk )ak = 0. | {z } 0
Mivel a1 , . . . , ak−1 lineárisan függetlenek, ezért ez utóbbi összefüggésben valamennyi együttható zérus: µ1 (λ1 − λk ) = 0, . . . , µk−1 (λk−1 − λk ) = 0. Mivel λi − λk 6= 0 (i = 1, . . . , k − 1), ezért µ1 = . . . = µk−1 = 0. Ezeket az értékeket (∗)-ba visszahelyettesítve µk ak = 0 következik, azaz ak 6= 0 miatt µk = 0 is. Ez azt jelenti, hogy a (∗) lineáris kombinációban minden együttható 0. Következmény. Egy n dimenziós vektortér egy lineáris operátorának legfeljebb n különböz˝o sajátértéke van. Ha pontosan n (különböz˝o) sajátérték van, akkor létezik a térben az operátor sajátvektoraiból álló bázis, s ebben a bázisban az operátor mátrixa diagonális, a f˝oátlóban pedig az operátor sajátértékei állnak.
Bizonyítás: Az állítás els˝o része onnan következik, hogy egy n dimenziós vektortérben bármely lineárisan független vektorrendszer legfeljebb n tagú, márpedig az el˝oz˝o tétel miatt a különböz˝o sajátértékekhez tartozó sajátvektorok lineárisan függetlenek. Az állítás második része a 2.1.-b˝ol következik. Világos, hogy ez az állítás nem megfordítható, tehát lehet a mátrix diagonális, ebb˝ol még nem következik, hogy a sajátértékek különböz˝ok. Gondoljunk az identikus operátorra, illetve az egységmátrixra. 19
2.2. A karakterisztikus polinom 2.4. Tétel. Jelölje az n × n-es egységmátrixot I! Az F test feletti n dimenziós vektortér ϕ lineáris operátorának mátrixát valamely rögzített bázisra vonatkozóan jelölje M ! ϕ sajátértékei pontosan a det(M − λI) = 0
(∗)
(λ-ra felírt) egyenlet megoldásai az F testben. Az el˝obbi egyenletet a ϕ karakterisztikus egyenletének illetve az M mátrix karakterisztikus egyenletének nevezzük.
Bizonyítás: A λ ∈ F skalár akkor és csakis akkor sajátérték, ha létezik olyan x 6= 0 vektor, hogy ϕ(x) = λx. Jelölje id a vektortér identikus operátorát! Ekkor: ϕ(x) = λx ⇐⇒ ϕ(x) = (λ id)(x) ⇐⇒ (ϕ − λ id)(x) = 0. Tehát λ ∈ F akkor és csakis akkor sajátérték, ha létezik olyan nem nulla vektor, hogy (ϕ − λ id)(x) = 0. Bázis rögzítése után ez a feltétel azt jelenti, hogy az (M − λI)X = 0 homogén lineáris egyenletrendszernek van triviálistól különböz˝o megoldása. (Az x vektor adott bázisra vonatkozó koordinátáit az X oszlopvektor jelöli.) A triviálistól különböz˝o megoldás létezésének szükséges és elégséges feltétele, hogy az M − λI mátrix rangja kisebb legyen mint n, a vektortér dimenziója, azaz a mátrix determinánsa 0 legyen. (Indokolhatunk a Cramer-szabállyal is: ha a determináns nem nulla, akkor a megoldás egyértelm˝u, vagyis csak a triviális megoldás van.) 2.5. Tétel. (∗) bal oldalán egy n-edfokú polinom áll, melynek f˝oegyütthatója (−1)n . Ezt a polinomot a ϕ operátor, vagy az M mátrix karakterisztikus polinomjának nevezzük.
Bizonyítás: Az M − λI mátrixot a következ˝oképpen írhatjuk fel: m11 − λ m22 − λ . mnn − λ A determináns definícióját alkalmazva, tehát a determinánst összegként felírva, az összeg mindegyik tagjában szerepel tényez˝oként valahány elem a f˝oátlóból, esetleg egy sem. Ez azt jelenti, hogy λ egy n-edfokú polinomját kapjuk, a f˝oegyüttható pedig akkor jelentkezik, amikor valamennyi tényez˝ot a f˝oátlóból választottuk: (m11 − λ)(m22 − λ) · · · (mnn − λ) = (−1)n λn + . . . . 20
2.6. Tétel. Egy lineáris operátor karakterisztikus polinomja független a bázis megválasztásától. Hasonló mátrixok karakterisztikus polinomja megegyezik.
Bizonyítás: Azt kell belátni, hogy ha S tetsz˝oleges invertálható mátrix, akkor M és S −1 M S karakterisztikus polinomja megegyezik. det(S −1 M S − λI) = = = =
det(S −1 M S − λS −1 IS) = det(S −1 (M − λI)S) = szorzástétel det(S −1 ) det(M − λI) det(S) = det(S −1 ) det(S) det(M − λI) = det(M − λI) | {z } =det(S −1 S=1)
2.7. Tétel. Egy komplex test feletti vektortér, vagy egy valós test feletti páratlan dimenziós vektortér minden lineáris operátorának van sajátvektora.
Bizonyítás: Ha komplex test feletti a vektortér, akkor a karakterisztikus polinom egy komplex együtthatós n-edfokú polinom, s a karakterisztikus egyenlet gyökeit C-ben keressük. Az algebra alaptétele szerint mindig lesz gyök C-ben, tehát mindig van sajátérték. Valós test feletti vektortér esetén a karakterisztikus polinom valós együtthatós n-edfokú polinom, s a karakterisztikus egyenletnek nem biztos, hogy van valós gyöke. Ha azonban a karakterisztikus polinom fokszáma páratlan, akkor van valós gyök, amint azt szintén az algebrából tudjuk. Definíció. Egy sajátérték algebrai multiplicitásán azt értjük, hogy hányszoros multiplicitású gyöke a karakterisztikus egyenletnek. Egy lineáros operátor spektruma a sajátértékek olyan sorozata, melybe minden sajátérték annyiszor szerepel, ahányszoros az algebrai multiplicitása. A spektrum teljes, ha a spektruma n tagú, azaz a tagszám megegyezik a vizsgált vektortér dimenziójával. 2.8. Tétel. Komplex test feletti vektortér bármely lineáris operátorának spektruma teljes, azaz multiplicitásokkal együtt annyi sajátértéke van, amennyi a vektortér dimenziója. Az operátor karakterisztikus egyenlete pedig (λ − λ1 )(λ − λ2 ) · · · (λ − λn ) = 0, ahol (λ1 , . . . , λn ) az operátor spektruma.
Bizonyítás: Az algebrából tudjuk, hogy egy n-edfokú polinomnak multiplicitásokkal együtt pontosan n gyöke van C-ben, s a polinom a tételben leírt módon bomlik els˝ofokú tényez˝ok szorzatára. (Mivel a tételben a karakterisztikus egyenletet írtuk fel, ezért a karakterisztikus polinom a bal oldaltól egy (−1)n faktorban különbözik!) A következ˝oekben a geometriai és az algebrai multiplicitás összehasonlításával foglalkozunk. El˝oször egy konkrét példán szemléltetjük a két fogalmat. 21
Példa. Tekintsük a deriválást, mint lineáris operátort a komplex együtthatós, legfeljebb (n − 1) edfokú polinomok n dimenziós terében! A λ ∈ C szám akkor lesz sajátérték, ha valamely nemzéró polinomra p0 (t) = λp(t). Mivel a deriválás során a fokszám eggyel csökken, ezért ez az összefüggés csak λ = 0-ra és konstans polinomokra teljesülhet. A λ = 0 tehát egyetlen sajátértéke a deriválás operátornak, s mivel a spektrum teljes, ezért az algebrai multiplicitásnak n-nek kell lennie. A λ = 0-hoz tartozó sajátaltér azonban a konstans polinomokból áll, s így a sajátérték geometriai multiplicitása 1. — A két fogalom tehát nem egyezik meg. 2.9. Tétel. Egy sajátérték geometriai multiplicitása nem lehet nagyobb az algebrai multiplicitásnál.
Bizonyítás: Legyen λ0 a ϕ operátor sajátértéke, L0 a hozzá tartozó invariáns altér. Vegyünk fel V -ben úgy egy bázist, hogy egy L0 -ban felvett (e1 , . . . , eg ) bázist kiegészítünk a tér bázisává. (e1 , . . . , eg ) a ϕ operátor sajátvektoraiból áll, és a λ0 sajátérték geometriai multiplicitása g. Ebben a bázisban ϕ mátrixa ¯ λ0 . . . 0 ¯ ¯ ... ¯ ¯ 0 ... λ ¯ ¯ 0 ¯ , ¯ ¯ ¯ ¯ ¯
0
azaz a karakterisztikus polinom: ¯ ¯ ¯ λ0 − λ . . . 0 ¯ ¯ ¯ .. ¯ ¯ . ¯ ¯ ¯ 0 . . . λ0 − λ ¯¯ ¯ P (λ) = ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯
0
¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯. ¯ ¯ ¯ ¯ ¯
Az els˝o r oszlopból (λ0 − λ)-t kiemelve azt kapjuk, hogy a karakterisztikus polinomra: P (λ) = (λ0 − λ)g · P˜ (λ). A karakterisztikus polinomot tehát (λ0 − λ)-nak legalább g-edik hatványa osztja, ami az algebrai multiplicitás definíciója szerint az állításunkat jelenti. 2.10. Tétel. Egy komplex test feletti lineáris operátor akkor és csakis akkor diagonalizálható, ha minden sajátértékének geometriai multiplicitása megegyezik az algebraival. Egy valós test feletti lineáris operátor akkor és csakis akkor diagonalizálható, ha spektruma teljes, továbbá, ha minden sajátértékének geometriai multiplicitása megegyezik az algebraival. 22
Bizonyítás: Tehát annak szükséges és elégséges feltételét keressük, hogy legyen sajátvektorokból álló bázis. Legyen a tér n dimenziós. Az el˝oz˝o tétel szerint legfeljebb annyi lineárisan független sajátvektor lehet, ahány tagú a spektrum. Tehát pontosan n lineárisan független sajátvektor pontosan akkor létezik, ha a spektrum egyrészt teljes, másrészt minden sajátértékhez annyi lineárisan független (hozzá tartozó) sajátvektort tudunk felsorolni, ahányszor a spektrumban el˝ofordul. 2.11. Tétel. (Jordan-féle normálalak.) Egy C feletti vektortérben minden lineáris operátorhoz létezik olyan bázis, melyben az operátor mátrixa a következ˝o alakú: a f˝oátlóban az operátor (λ1 , . . . , λk ) sajátértékei szerepelnek, közvetlenül a f˝oátló alatt 1 vagy nulla szerepel, minden más mátrixelem zérus: ¯ λ1 0 . . . 0 ¯¯ ¯ 1 ... ... 0 ¯ ¯ 0 1 λ1 0 ¯ ¯ 0 0 1 λ1 ¯ . . . ¯ . ¯ ¯ ¯λk 0 . . . 0 ¯ ¯ ¯ 1 ... ... 0 ¯ ¯ 0 1 λk 0 ¯ ¯ 0 0 1 λk (Egy sajátérték több blokkban is szerepelhet. Ha egy blokk mérete 1 × 1, akkor a blokkban nem szerepel egyes.) Megjegyzés. A tételt úgy is fogalmazhatjuk, hogy minden (komplex elemekb˝ol álló) négyzetes mátrix hasonló a tételben megadotthoz.
Bizonyítás: Nem tárgyaljuk.
2.3. Önadjungált transzformációk szerkezete Ebben a paragrafusban kiindulópontunk egy (V, h, i) euklideszi vektortér, tehát a vektortér R feletti. Tudjuk, ilyenkor egy lineáris operátor sajátértékeir˝ol általában semmit nem tudunk garantálni, a karakterisztikus polinomnak nem biztos, hogy vannak valós gyökei. Az önadjungált operátorok esetében azonban teljesül a diagonalizálhatóság, amint azt a paragrafus f˝o tétele kimondja. Az alábbi technikai jelleg˝u állítás könnyen ellen˝orizhet˝o: Lemma. Értelmezzük a következ˝o Cn × Cn → C leképezést: (X, Y ) 7→ hX, Y i = x1 y¯1 + · · · + xn y¯n , 23
ahol X = (x1 , . . . , xn ), Y = (y1 , . . . , yn ). A definiált leképezés mindkét változóban additív, az els˝o változóban (komplex) homogén, hX, Xi = 0 ⇐⇒ X = 0, továbbá ¯ hX, λY i = λhX, Y i. Megjegyzés. A definiált leképezés nem skaláris szorzat, mert nem valós test fölötti vektortérben vagyunk. 2.12. Tétel. R feletti n × n-es szimmetrikus mátrix karakterisztikus egyenletének multiplicitásokkal együtt n valós gyöke van.
Bizonyítás: Legyen A valós elemekb˝ol álló szimmetrikus mátrix. Ekkor az LA : Cn → Cn , X 7→ LA (X) = A · X lineáris operátorra könnyen teljesül, hogy hLA (X), Y i = hX, LA (Y )i azaz hA · X, Y i = hX, A · Y i. A komplex test feletti téren ható LA lineáris operátor spektruma teljes, azaz multiplicitásokkal együtt n (komplex) sajátértéke van, ezek A karakterisztikus egyenletének gyökei. Jelöljön egy sajátértéket λ! Ekkor egyrészt ∀X ∈ Cn sajátvektorra : hA · X, Xi = hλX, Xi = λhX, Xi
(∗)
¯ hA · X, Xi = hX, A · Xi = hX, λXi = λhX, Xi.
(∗∗)
másrészt
(∗)-ot és (∗∗)-ot összehasonlítva: ¯ hX, Xi = 0, (λ − λ) | {z } 6=0
¯ tehát λ valós. azaz λ = λ, 2.13. Tétel. (Önadjungált operátorok spektruma.) Legyen adott egy euklideszi téren egy ϕ önadjungált lineáris operátor! Ekkor ϕ spektruma teljes, továbbá létezik a térben ϕ sajátvektoraiból álló ortonormált bázis. Ebben a bázisban ϕ mátrixa diagonális, a f˝oátlóban ϕ sajátértékei állnak.
Bizonyítás: A lemma alapján tudjuk, hogy a ϕ operátor karakterisztikus egyenletének multiplicitásokkal együtt n valós gyöke van, hiszen ortonormált bázisban ϕ mátrixa szimmetrikus. A sajátvektorokból álló ortonormált bázis létezését kell bizonyítani. A bizonyítás az euklideszi tér dimenziója szerinti teljes indukció. 1 dimenziós térben 1 sajátérték van, s az ehhez tartozó tetsz˝oleges sajátvektor a tér kívánt bázisa. Tegyük fel, hogy az állítás igaz minden n − 1 24
dimenziós euklideszi térre. Bebizonyítjuk, hogy n dimenziósra is igaz. Legyen tehát dim V = n, ϕ : V → V önadjungált lineáris operátor. A lemma miatt tudjuk, hogy létezik sajátvektor, jelölje ezt v. Legyen H = L(v), azaz H a v sajátvektor által generált 1 dimenziós altér. Jelölje ennek ortogonális komplementerét H ⊥ . H ⊥ -r˝ol azt állítjuk, hogy invariáns altere a ϕ operátornak. Valóban, legyen x ∈ H ⊥ . Ez azt jelenti, hogy x mer˝oleges v-re: hx, vi = 0. Be kell látni, hogy ϕ(x) is mer˝oleges v-re: hϕ(x), vi = hx, ϕ(v)i = hx, λvi = λhx, vi = 0
ϕ önadjungált v sajátvektor linearitás
H ⊥ invariáns tulajdonsága azt jelenti, hogy ϕ lesz˝ukíthet˝o H ⊥ -re, tehát a lesz˝ukítés egy n − 1 dimenziós téren ható önadjungált operátor. Erre az indukciós feltevés miatt igaz, hogy létezik v benne a ϕ sajátvektoraiból álló ortonormált bázis. Ezt kiegészítve -vel a tér kívánt ortonorkvk mált bázisát kapjuk. Az el˝oz˝o tétel fontos következménye, hogy a diagonális mátrix nemcsak önadjungált operátoroknál, hanem kvadratikus formáknál is elérhet˝o. 2.14. Tétel. (Kvadratikus formák f˝otengelytranszformációja.) Egy n dimenziós euklideszi téren értelmezett Q kvadratikus forma esetén létezik a térnek olyan ortonormált bázisa, hogy ebben Q mátrixa diagonális.
Bizonyítás: Legyen Q poláris formája az L szimmetrikus bilineáris forma. Tudjuk (1.21.), hogy L-hez létezik olyan ϕ lineáris operátor, hogy L(x, y) = hϕ(x), yi. Mivel L szimmetrikus, ezért ortonormált bázisra vonatkozó mátrixa szimmetrikus, mátrixa transzponáltja pedig megegyezik ϕ mátrixával (a rögzített ortonormált bázisban). Mindez azt jelenti, hogy ϕ mátrixa ortonormált bázisban szimmetrikus, tehát ϕ önadjungált. Tehát létezik olyan ϕ önadjungált operátor, hogy ∀x ∈ V : Q(x) = hϕ(x), xi. Legyen (e1 , . . . , en ) a ϕ sajátvektoraiból álló ortonormált bázis. Kvadratikus forma (adott bázisra vonatkozó) mátrixa megegyezik a poláris formájának mátrixával. Ennek i-edik sora j-edik eleme: L(ei , ej ) = hϕ(ei ), ej i = hλi ei , ej i = λi hei , ej i, ahol λi a ϕ megfelel˝o sajátértéke.
( hei , ej i =
A megadott bázisban tehát Q mátrixa:
λ1 0 0 λ2 0 0
1, ha i = j 0, ha i 6= j 0 0 , . . . λn ... ... ...
25
ahol (λ1 , . . . , λn ) a ϕ spektruma. Definíció. Azon ortonormált bázis vektorait, melyben egy kvadratikus forma mátrixa diagonális, a kvadratikus forma f˝otengelyeinek nevezzük. Ha olyan báziscserét hajtunk végre, hogy az új bázis a kvadratikus forma f˝otengelyeib˝ol áll, akkor ezt a báziscserét f˝otengelytranszformációnak nevezzük. Az el˝oz˝o tétel közvetlen következménye az alábbi: 2.15. Tétel. (Kvadratikus formák négyzetösszegre transzformálása.) F˝otengelyek alkotta ortonormált bázisban teljesül, hogy Q(x) = λ1 x21 + · · · + λn x2n , ahol (x1 , . . . , xn ) az x vektor koordinátái, λ1 , . . . , λn pedig Q (erre a bázisra vonatkozó) mátrixának sajátértékei. Megjegyezzük, hogy egy kvadratikus forma mátrixa nemcsak ortonormált bázisban lehet diagonális, s a f˝oátlóban álló elemek sincsenek egyértelm˝uen meghatározva, azaz ha két különböz˝o bázisra vonatkozóan a kvadratikus forma mátrixa diagonális, akkor a diagonálisban álló elemek nem biztos, hogy megegyeznek. Ezzel kapcsolatban bizonyítás nélkül mondjuk ki a következ˝o összefüggést: 2.16. Tétel. (Tehetetlenségi tétel.) Kvadratikus formák kétféle négyzetösszegre transzformálásakor a pozitív együtthatók száma mindkét esetben megegyezik. Hasonlóan a negatív együtthatók száma mindkét esetben megegyezik, s végül a zérus együtthatók száma is mindkét esetben megegyezik.
2.4. Ortogonális transzformációk szerkezete 2.17. Tétel. Tetsz˝oleges ortogonális mátrix determinánsa +1 vagy −1.
Bizonyítás: Legyen M ortogonális mátrix. Alkalmazzuk a szorzástételt, s azt a tényt, hogy négyzetes mátrix és transzponáltja determinánsa megegyeznek: 1 = det(M · M −1 ) = det M · det M −1 = (det M )2 . 2.18. Tétel. Ortogonális mátrix karakterisztikus egyenletének gyökei olyan komplex számok, melyek modulusa (abszolút értéke) 1.
Bizonyítás: Legyen M ortogonális mátrix! Az LM : Cn → Cn , X 7→ LM (X) = M · X lineáris operátorról egyszer˝u számolással látható, hogy hX, Y i = hLM (X), LM (Y )i(= hM · X, M · Y i). 26
Legyen LM , azaz M egy sajátértéke λ. ¯ hX, Xi = hM · X, M · Xi = hλX, λXi = λλhX, Xi, ¯ = 1. Tehát λλ 2.19. Tétel. R2 tetsz˝oleges ortogonális operátorának mátrixa tetsz˝oleges ortonormált bázisban µ ¶ cos α ∓ sin α , sin α ± cos α ahol a fels˝o el˝ojelek a +1 determinánsú, míg az alsó el˝ojelek a −1 determinánsú operátorra vonatkoznak. A fentebbi mátrix az összes 2 × 2-es ortogonális mátrixot megadja.
Bizonyítás: Foglalkozzunk a +1 determinánsú esettel, a −1 determinánsú eset analóg. Legyen tetsz˝oleges ortonormált bázisban a ϕ ortogonális operátor mátrixa µ ¶ α β U= . γ δ Mivel U ortogonális, ezért inverze megegyezik a transzponáltjával: µ
α β γ δ
¶−1
µ =
¶ α γ . β δ
(∗)
Másrészt az inverz mátrixot a tanult módon a kofaktorokkal meghatározva: µ
α β γ δ
¶−1
µ =
¶ δ −β . −γ α
(∗∗)
(∗)-ot és (∗∗)-ot összehasonlítva: α = δ, γ = −β, tehát a keresett mátrix: µ ¶ α −β , β α ahol α2 + β 2 =1 (a mátrix determinánsa 1), tehát létezik olyan α ∈ [0, π), hogy α = cos α, β = sin α, ami a bizonyítandó állítást jelenti. 2.20. Tétel. R2 egy −1 determinánsú ortogonális operátorának spektruma (−1, +1). Létezik az operátor sajátvektoraiból álló ortonormált bázis, melyben az operátor mátrixa µ ¶ 1 0 , 0 −1 vagyis az operátor tengelyes tükrözés. 27
Bizonyítás: A karakterisztikus egyenlet: λ2 + bλ − 1 = 0
(b valamilyen konstans),
melynek diszkriminánsa b2 + 4 > 0, tehát van két (különböz˝o) valós sajátérték. Mivel a sajátértékek abszolút értéke 1, ezért a sajátértékek +1 ill. −1. Azt kell belátni, hogy az ehhez tartozó sajátvektorok ortogonálisak. (Normálással tehát valóban ortonormált bázishoz jutunk.) Legyen az 1 sajátértékhez tartozó egyik sajátvektor e1 , a −1-hez tartozó pedig e2 . he1 , e2 i = hϕ(e1 ), ϕ(e2 )i = h1 · e1 , −1 · e2 i = −he1 , e2 i, tehát he1 , e2 i = 0. 2.21. Tétel. R3 +1 determinánsú ortogonális operátorához létezik olyan ortonormált bázis melyben mátrixa: 1 0 0 0 cos α − sin α . 0 sin α cos α R3 −1 determinánsú ortogonális operátorához létezik olyan ortonormált bázis melyben mátrixa: −1 0 0 0 cos α − sin α . 0 sin α cos α
Bizonyítás: Három dimenzióban biztosan van valós sajátérték, s ez (lévén az abszolút értéke +1) +1 vagy −1. Ebb˝ol következik, hogy az operátornak van 1 dimenziós invariáns altere, melyet jelöljön H. Egyszer˝uen látható, hogy H ⊥ is invariáns altér, melyen tehát az operátor lesz˝ukítése szintén ortogonális operátor. x ∈ H ⊥ : ∀ϕ(y) ∈ H, hϕ(x), ϕ(y)i = hx, yi = 0. H ⊥ -re az el˝oz˝o tételt alkalmazva rövid esetvizsgálat után adódik állításunk. (Esetleg szükség lesz a bázisvektorok sorrendjének megváltoztatására.)
28
3. fejezet Geometriai alkalmazások 3.1. Geometriai transzformációk Geometriai alapfogalmak Rn néhány objektumára lineáris algebrai jelleg˝u és geometriai jelleg˝u elnevezések egyaránt használatosak. Definíció. Rn egy nulla dimenziós lineáris sokaságát (vagyis Rn egy vektorát) Rn egy pontjának nevezzük. Rn egy egydimenziós lineáris sokaságát Rn egyenesének nevezzük. Rn egy n − 1 dimenziós lineáris sokaságát Rn egy hipersíkjának nevezzük. Példa. R hipersíkjai a pontok, R2 hipersíkjai az egyenesek, R3 hipersíkjai a kétdimenziós lineáris sokaságok. Példa. Legyenek x 6= y ∈ Rn pontok! Ekkor a következ˝o halmaz, melyet (x, y) felez˝omer˝oleges hipersíkjának nevezünk, hipersík: { u ∈ Rn | kx − uk = ky − uk }. 3.1. Tétel. Legyenek x, y ∈ Rn pontok, x 6= y. Ekkor Rn minden egyenese felírható ` = { tx + (1 − t)y | t ∈ R } alakban. Megfordítva, minden ilyen el˝oállítás Rn egy egyenesét adja meg.
Bizonyítás: Legyen ` = L(v) + y = { y + tv | t ∈ R } (v 6= 0) egydimenziós lineáris sokaság. Definiáljuk x-et a következ˝oképpen: x = y + v. Ekkor y + tv = y + t(x − y) = tx + (1 − t)y. Megfordítva, tx + (1 − t)y = y + (x − y)t. ` tehát egy L(x − y) irányter˝u, y eltolóvektorú lineáris sokaság. 29
Definíció. Az (x1 , . . . , xn+1 ) (xi ∈ Rn ) pontokat általános helyzet˝ueknek nevezzük, ha nincsenek benne egyetlen hipersíkban sem. Példa. Jelölje Rn természetes bázisát (e1 , . . . , en ). (0, e1 , . . . , en ) általános helyzet˝uek. 3.2. Tétel. Legyenek (P0 , . . . , Pn ) általános helyzet˝u pontok Rn -ben. Ekkor (P1 − P0 , . . . , Pn − P0 ) bázis Rn -ben. jel.
Bizonyítás: Legyen L(P1 − P0 , . . . , Pn − P0 ) = H. Ha H 6= Rn , akkor H-t tartalmazza egy e e + P0 hipersíkban valamennyi pont benne van, ami H-val jelölt n − 1 dimenziós altér. A H ellentmondás.
Affin transzformációk Definíció. Az F : Rn → Rn bijektív leképezést affin transzformációnak nevezzük, ha egyenestartó, azaz tetsz˝oleges egyenes képe egyenes. Példa. Jelölje Gl(n) Rn bijektív lineáris transzformációinak csoportját. Minden ϕ ∈ Gl(n) lineáris leképezés egyben affin transzformáció is. Valóban: ϕ[tx + (1 − t)y] = tϕ(x) + (1 − t)ϕ(y). Mivel x 6= y és ϕ bijektív, ezért ϕ(x) 6= ϕ(y). Tehát ϕ(`) = { tϕ(x) + (1 − t)ϕ(y) | t ∈ Rn } egyenes. Példa. Legyen w ∈ Rn . Értelmezzük az alábbi leképezést: τw : Rn → Rn ,
x 7→ τw (x) = x + w.
Legyen ` = { x + tv | t ∈ R } (v 6= 0) egyenes. τw (x + tv) = x + w + tv, azaz τw (`) a L(v) irányter˝u, x + w eltolóvektorú egyenes. A τw transzformációt w vektorú eltolásnak nevezzük. τw affin, de w 6= 0-ra τw ∈ / Gl(n), mert τw (0) = w 6= 0. Példa. Legyen λ 6= 0 valós szám. Értelmezzük a következ˝o leképezést: δλ : Rn → Rn ,
x 7→ δλ (x) = λx.
Mivel δλ ∈ Gl(n), ezért az els˝o példa szerint affin. δλ -t λ arányú, origó középpontú homotéciának vagy középpontos hasonlóságnak nevezzük. 3.3. Tétel. (Az affin leképezések f˝otétele.) Az F : Rn → Rn bijekció akkor és csakis akkor affin leképezés, ha ∃ϕ ∈ Gl(n) és w ∈ Rn , hogy F = τw ◦ ϕ, azaz ∀x ∈ Rn :
F (x) = ϕ(x) + w. 30
Következmény. (Rn affin transzformációi.) Legyen F : Rn → Rn affin transzformáció, jel.
F (X) = X 0
X ∈ Rn .
Ekkor ∃A ∈ Mn×n invertálható mátrix és v ∈ Rn vektor, hogy X 0 = AX + v. Ezt a mátrixalakban leírt összefüggést részletesen kiírva pl. két dimenzióban, a következ˝o összejel. függést kapjuk. Ha F : R2 → R2 affin transzformáció, F (x, y) = (x0 , y 0 ). Ekkor ∃A = (aij ) ∈ M2×2 invertálható mátrix és ∃(v1 , v2 ) ∈ R2 számpár, hogy x0 = a11 x + a12 y + v1 y 0 = a21 x + a22 y + v2 ,
det A = a11 a22 − a12 a21 6= 0.
Definíció. Az F : Rn → Rn leképezésnek x ∈ Rn fixpontja, ha F (x) = x. 3.4. Tétel. (Az affin transzformációk fixponttétele.) Legyen F : Rn → Rn affin, F = τv ◦ ϕ, ahol ϕ ∈ Gl(n), v ∈ Rn . (i) Ha ker(ϕ − idRn ) = {0}, akkor F -nek egyértelm˝uen létezik fixpontja. (ii) Ha F -nek van n + 1 általános helyzet˝u fixpontja, akkor F = idRn .
Bizonyítás: (i) Legyen ker(ϕ − idRn ) = {0}. A nullitás+rang tétel szerint ekkor im(ϕ − idRn ) = Rn . Tehát speciálisan −F (0)-hoz ∃!x ∈ Rn : ϕ(x) − x = F (0). Ez ekvivalens azzal, hogy F (x) − F (0) − x = F (0) ⇐⇒ F (x) = x, azaz x fixpont. Az egyértelm˝uség bizonyítása. Teljesüljön, hogy F (x) = x és F (y) = y. Ez ekvivalens azzal, hogy ϕ(x) + v = x és ϕ(y) + v = y ⇐⇒ ϕ(x) − x = v és ϕ(y) − y = v =⇒ ϕ(x − y) − (x − y) = 0 =⇒ x − y ∈ ker(ϕ − idRn ) = {0} ⇐⇒ x − y = 0 ⇐⇒ x = y. (ii) Legyenek (P0 , . . . , Pn ) az általános helyzet˝u fixpontok: ∀i ∈ {0, . . . , n} :
ϕ(Pi ) + v = Pi ⇐⇒ (ϕ − idRn )(Pi ) = v.
A ϕ − idRn lineáris transzformáció tehát a (P1 − P0 , . . . , Pn − P0 ) bázis minden vektorán a zéróvektort veszi fel, ezért ez a transzformáció a zérus leképezés, amib˝ol az állításunk nyilvánvalóan következik. 3.5. Tétel. (Az affin transzformációk alaptétele.) Legyenek (P0 , P1 , . . . , Pn ) és (Q0 , Q1 , . . . , Qn ) általános helyzet˝u pont (n + 1)-esek. Egyértelm˝uen létezik olyan F : Rn → Rn affin leképezés, melyre teljesül, hogy: ∀i ∈ {0, . . . , n} : F (Pi ) = Qi . 31
Bizonyítás: Tudjuk, hogy E = (P1 − P0 , . . . , Pn − P0 ) továbbá E 0 = (Q1 − Q0 , . . . , Qn − Q0 ) Rn egy-egy bázisát alkotják. A lineáris kiterjesztés tétele szerint egyértelm˝uen létezik olyan ϕ ∈ Gl(n) lineáris izomorfizmus, hogy ϕ(E) = E 0 . Legyen F = τQ0 ϕτ−P0 . Azaz: ∀X ∈ Rn :
F (X) = ϕ(X − P0 ) + Q0 .
Egyszer˝u behelyettesítés mutatja, hogy F rendelkezik a kívánt tulajdonsággal. Az egyértelm˝uséget a következ˝oképpen látjuk be. Legyenek F1 és F2 affin transzformációk a kívánt tulajdonsággal. ∀i ∈ {0, . . . , n} : F2−1 F1 (Pi ) = Pi , ami a fixponttétel szerint azt jelenti, hogy F2−1 F1 = idRn ⇐⇒ F1 = F2 .
Izometriák Definíció. Az F : Rn → Rn bijektív leképezést izometriának vagy egybevágóságnak nevezzük, ha távolságtartó, azaz ¡ ¢ ∀x, y ∈ Rn : d F (x), F (y) = d(x, y). Példa. Rn ortogonális transzformációi egyben Rn izometriái is, amint arról már korábban volt szó. Izometria továbbá minden eltolás is: kτv (x) − τv (y) = kx + v − (y + v)k = kx − yk. Példa. Legyen H Rn egy hipersíkja. Az x ∈ Rn pont x0 -vel jelölt képét definiáljuk a következ˝oképpen. Ha x ∈ H, akkor x = x0 , egyébként x0 az az egyértelm˝u pont, melyre (x, x0 ) felez˝omer˝oleges hipersíkja H. Az így definiált leképezés izometria, melyet a H hipersíkra vonatkozó tükrözésnek nevezzük. 3.6. Tétel. (Az izometriák f˝otétele.) Egy F : Rn → Rn bijektív leképezés akkor és csakis akkor izometria, ha ∃ϕ ∈ Gl(n) ortogonális transzformáció és v ∈ Rn vektor, hogy F = τv ◦ ϕ, azaz ∀x ∈ Rn : F (x) = ϕ(x) + v.
Bizonyítás: Mivel minden ortogonális transzformáció és eltolás izometria, ezek kompozíciója is az. Legyen most F : Rn → Rn egybevágóság. v-t és ϕ-t a következ˝oképpen konstruáljuk meg. v = F (0), ϕ : Rn → Rn , ϕ(c) = F (x) − v. (ϕ-r˝ol pillanatnyilag még nem tudjuk, hogy lineáris leképezés.) El˝oször belátjuk, hogy az el˝obbiekben megkonstruált ϕ megtartja a skaláris szorzatot. Emlékeztetünk arra, hogy n
∀ξ, η ∈ R :
kξk2 + kηk2 − kξ − ηk2 hξ, ηi = . 2 32
Tehát kϕ(x)k2 + kϕ(y)k2 − kϕ(x) − ϕ(y)k2 = 2 kF (x) − F (0)k2 + kF (y) − F (0)k2 − kF (x) − F (0) − F (y) + F (0)k2 = = 2 kx − 0k2 + ky − 0k2 − kx − yk2 kxk2 + kyk2 − kx − yk2 = = = hx, yi , 2 2
hϕ(x), ϕ(y)i =
felhasználva, hogy F izometria. Végezetül belátjuk, hogy ϕ lineáris. Az el˝oz˝o bizonyításrészb˝ ol közvetlenül következik, ¡ ¢ hogy ha E = (e1 , . . . , en ) ortonormált bázis, akkor E 0 = ϕ(e1 ), . . . , ϕ(en ) is ortonormált bázis. Vegyük ϕ(x) Fourier-el˝oállítását E 0 -re vonatkozóan: ϕ(x) =
n X
hϕ(x), ϕ(ei )i ϕ(ei ) =
i=1
n X
hx, ei i ϕ(ei ).
i=1
ϕ(x)-nek ez a kifejezése x-ben lineáris. Következmény. Minden izometria affin leképezés. Valóban, minden izometria egy (speciális, nevezetesen ortogonális) lineáris leképezés kompozíciója, ezért az affin leképezés. A 2 × 2-es ortogonális mátrixok ismeretében explicit leírást adhatunk R2 izometriáira. jel.
Következmény. (R2 izometriái.) Legyen F : R2 → R2 , F (x, y) = (x0 , y 0 ) izometria. Ekkor ∃α ∈ [0, 2π) és ∃(v1 , v2 ) ∈ R2 : x0 = cos α · x ∓ sin α · y + v1 y 0 = sin α · x ± cos α · y + v2 . 3.7. Tétel. Rn minden izometriája legfeljebb n + 1 hipersíkra vonatkozó tükrözés szorzata.
Bizonyítás: Legyenek (x1 , . . . , xn+1 ) általános helyzet˝u pontok, F : Rn → Rn izometria, F (xi ) = x0i , (i = 1, . . . , n + 1). Egészen pontosan azt fogjuk belátni, hogy ha x1 , . . . , xk fixpontok, de xk+1 6= x0k+1 , akkor F el˝oáll mint legfeljebb n + 1 − k hipersíkra vonatkozó tükrözés szorzata (k = 0, . . . , n + 1). k szerinti, lefelé haladó indukcióval bizonyítunk. k = n + 1 esetén x1 = x01 , x2 = x02 . . . , xn+1 = x0n+1 , ekkor nyilvánvalóan F = id. Indukciós feltevésként tegyük fel, hogy az állítás 1 ≤ k ≤ n + 1-re igaz. Teljesüljön, hogy x1 = x01 , x2 = x02 , . . . , xk−1 = x0k−1 , de xk 6= x0k . Ekkor ∀i ∈ {1, . . . , k − 1} :
d(xi , xk ) = d(x0i , x0k ) = d(xi , x0k ),
azaz x1 , . . . , xk−1 benne vannak (xk , x0k ) H-val jelölt felez˝omer˝oleges hipersíkjában. A H hipersíkra vonatkozó tükrözésnek x1 , . . . , xk−1 fixpontjai, xk 7→ x0k . F ◦ ρH -re alkalmazható az indukciós feltevés. 33
Hasonlóságok Definíció. Az F : Rn → Rn bijektív leképezést hasonlóságnak nevezzük, ha ∃λ > 0 valós szám, hogy ¡ ¢ ∀x, y ∈ Rn : d F (x), F (y) = λ · d(x, y). λ-t a hasonlóság arányának nevezzük. Példa. Korábban affin leképezésre egyik példánk a(z origó középpontú) középpontos hasonlóság volt, melyr˝ol könny˝u látni, hogy hasonlóság. 3.8. Tétel. F : Rn → Rn bijektív leképezés akkor és csakis akkor hasonlóság, ha ∃ϕ ∈ Gl(n),
v ∈ Rn ,
λ 6= 0 :
F = τv ◦ δλ ◦ ϕ,
azaz F (x) = λ · ϕ(x) + v. jel.
Következmény. (R2 hasonlóságai.) Legyen F : R2 → R2 , F (x, y) = (x0 , y 0 ) hasonlóság. Ekkor ∃α ∈ [0, 2π), λ 6= 0, (v1 , v2 ) ∈ R2 : x0 = λ(cos α · x ∓ sin α · y) + v1 y 0 = λ(sin α · x ± cos α · y) + v2 . 3.9. Tétel. (A hasonlóságok fixponttétele.) Ha egy hasonlóság nem izometria, akkor egyértelm˝uen létezik fixpontja.
Bizonyítás: Legyen ϕ egy λ 6= 1 arányú hasonlóság. Azt ellen˝orizzük, hogy teljesül az affin leképezések fixponttételében el˝oírt feltétel. x ∈ ker(ϕ − idRn ) ⇐⇒ ϕ(x) − x = 0 ⇐⇒ F (X) − F (0) = x − 0 =⇒ kF (x) − F (0)k = kx − 0k. Ugyanakkor k6=1
kF (x) − F (0)k = λkx − 0k =⇒ x = 0.
3.2. Kúpszeletek elemi és analitikus geometriája Hajós György:Bevezetés a geometriába: 41. §. 34
3.3. Másodrendu˝ görbék a valós síkon Definíció. Legyen A : R2 → R2 nem zéró önadjungált lineáris operátor, b ∈ R2 rögzített vektor, c ∈ R rögzített szám. Másodrend˝u görbén az alábbi halmazt értjük: q = {x ∈ R2 |hA(x), xi + 2hb, xi + c = 0}. Az hA(x), xi + 2hb, xi + c = 0 egyenletet a másodrend˝u görbe el˝oállításának nevezzük. A másodrend˝u görbéhez tartozó vektorokat gyakran a másodrend˝u görbe pontjainak mondjuk. Megjegyzés. Euklideszi térben az önadjungált lineáris operátorok és a kvadratikus formák közt, valamint a lineáris formák és a vektorok közt kölcsönösen egyértelm˝u megfeleltetés van, ennek megfelel˝oen a másodrend˝u görbe el˝oállítását a következ˝oképpen is megadhatjuk: q = {x ∈ R2 |Q(x) + 2l(x) + c = 0}, ahol Q egy nem triviális kvadratikus forma, l pedig lineáris forma. Valóban, a definícióból kiindulva Q(x) = hA(x), xi (x ∈ R2 ) egy kvadratikus forma, l(x) = hb, xi egy lineáris forma; illetve megfordítva, tetsz˝oleges kvadratikus formából és lineáris formából kiindulva az el˝obbi formulák egyértelm˝uen meghatározzák A-t és b-t. A kés˝obbiekben néha ezt az el˝oállítást is használjuk. Q rangját ill. szignatúráját a másodrend˝u görbe rangjának ill. szignatúrájának nevezzük. Megadjuk a másodrend˝u görbék koordinátás el˝oállítását is. Felhívjuk a figyelmet arra, hogy szokásos módon a vektorok, (pontok) koordinátáit 2 dimenzióban nem indexeljük, hanem xszel és y-nal jelöljük. Ez kis figyelmet kíván, mert az x gyakran vektort jelöl (azaz R2 elemét), máskor pedig egy bázisra vonatkozó els˝o koordinátát. A kvadratikus formák és a lineáris formák bázisel˝oállításából közvetlenül következik az alábbi tétel: 3.10. Tétel. (Másodrendu˝ görbe egyenlete.) Legyen q = { x ∈ R2 | hA(x), xi + 2hb, xi + c = 0 } egy másodrend˝u görbe. Rögzítsünk R2 -ben egy bázist, a ϕ(x) = hA(x), xi kvadratikus forma erre vonatkozó mátrixa µ ¶ a11 a12 ,(a12 = a21 ) a21 a22 az l(x) = hb, xi lineáris forma együtthatórendszere (b1 , b2 ). R2 egy vektora akkor és csakis akkor eleme a q másodrend˝u görbének, ha (x, y) koordinátáira a11 x2 + 2a12 xy + a22 y 2 + 2b1 x + 2b2 y + c = 0 teljesül. A fenti összefüggést a q egyenletének is nevezzük. Úgy is fogalmazhatunk, hogy egy másodrend˝u görbe egy kétváltozós másodfokú polinom zérushelyeinek halmaza R2 -ben. Megjegyezzük, hogy egy másodrend˝u görbének nemcsak másodfokú egyenlete lehet, de ha egy másodrend˝u görbe egyenletér˝ol beszélünk, akkor mindig az el˝oz˝o tétel szerint hozzá tartozó kétváltozós másodfokú egyenletre gondolunk. (Egyébként még ez a másodfokú egyenlet sem egyértelm˝uen tartozik a görbéhez, ld. kés˝obb.) 35
Példa. Az alábbi el˝oállítások másodrend˝u görbéket határoznak meg R2 -ben: {(x, y) ∈ R2 |F (x, y) = 0}, ahol — F (x, y) = x2 + y 2 − 1 — kör. — F (x, y) = x2 + y 2 + 1 — üres halmaz. — F (x, y) = x2 − y 2 − 1 — hiperbola. — F (x, y) = x2 − y 2 = (x + y)(x − y) — metsz˝o egyenespár. — F (x, y) = x2 + y 2 — egyetlen pont. — F (x, y) = y − x2 — parabola. — F (x, y) = x2 − 1 — párhuzamos egyenespár. — F (x, y) = x2 — az x = 0 egyenes. — F (x, y) = x2 + 1 — ez a másodrend˝u görbe ismét az üres halmaz. Megjegyezzük, hogy a definíció szerint egy egyenes (R2 -ben) mindig tekinthet˝o másodrend˝u görbének. Legyen ugyanis az egyenes normálegyenlete F (x, y) = 0 — ahol F a változók els˝ofokú polinomja. Az [F (x, y)]2 = 0 egyenlet nyilvánvalóan ugyanannak a ponthalmaznak az egyenlete, de a változóknak már másodfokú polinomja. Az üres halmaz is mindig tekinthet˝o másodrend˝u görbének. A következ˝oekben a másodrend˝u görbe egyenletének egyszer˝usítése a cél. 3.11. Tétel. (Euklideszi normálegyenletek.) Létezik az A önadjungált operátor sajátvektoraiból álló ortonormált bázis úgy, hogy a q = {x ∈ R2 |hA(x), xi + 2hb, xi + c = 0} másodrend˝u görbe egyenlete az alábbiak közül valamelyik: a1 (x − u)2 + a2 (y − v)2 = 0 a1 (x − u)2 + a2 (y − v)2 = 1 a1 (x − u)2 = 2(y − v),
(I) (II) (III)
ahol a1 , a2 , u, v konstansok; I-nél és II-nél a1 és a2 közül legalább az egyik nem 0, III-nál a1 6= 0. 36
Bizonyítás: Legyenek az A sajátértékei λ1 és λ2 . A sajátvektoraiból álló ortonormált bázisban a q egyenlete ekkor λ1 x2 + λ2 y 2 + 2b1 x + 2b2 y + c = 0, hiszen ortonormált bázisban az A mátrixa és a ϕ(x) = hA(x), xi kvadratikus forma mátrixa megegyezik. Legyen el˝oször mindkét sajátérték zérustól különböz˝o. Ekkor a q egyenlete µ ¶2 µ ¶2 b2 b2 b1 b2 λ1 x + + λ2 y + = −c + 1 + 2 . λ1 λ2 λ1 λ2 Ha ν = −c + b21 λ1
b21 λ1
+ b22 λ2
b22 λ2
= 0, akkor rögtön megkaptuk az I. egyenletet: a1 = λ1 , a2 = λ2 . Ha
ν = −c + + 6= 0, akkor ezzel mindkét oldalt osztva a II. egyenletet kapjuk: a1 = λν1 , a2 = λν2 . Legyen most az egyik sajátérték zéró, ekkor a másik biztosan nullától különböz˝o, mert feltettük, hogy A nem zéró operátor. A sajátvektorokból álló ortonormált bázisban a bázisvektorok sorrendje most legyen olyan, hogy az els˝o bázisvektor tartozzon a nemzéró sajátértékhez: λ1 6= 0, λ2 = 0. q egyenlete ebben a bázisban: µ ¶2 b1 b2 λ1 x + = −2b2 y − c + 1 . λ1 λ1 Ha b2 = 0 és
b21 λ1
− c = 0, akkor az I. egyenletet kapjuk a1 = λ1 és a2 = 0-val. Ha b2 = 0, de
µ = λb12 − c 6= 0, akkor 1 b2 6= 0, akkor
b21 λ1
− c-vel osztva a II. egyenletet kapjuk: a1 = µ
λ1
b1 x+ λ1
¶2
µ = −2b2
b21 c − y+ 2b2 2λ1 b2
λ1 , µ
a2 = 0. Végül, ha
¶ ,
s ezt az egyenletet (−b2 )-vel osztva a III. egyenletet kapjuk. 3.12. Tétel. A másodrend˝u görbék R2 -ben pontosan az alábbiak: ellipszis/kör, parabola, hiperbola, egyenespár, pont, üres halmaz. Az egyenespár lehet metsz˝o egyenespár, párhuzamos de nem egybees˝o egyenespár, egybees˝o egyenespár.1
Bizonyítás: Az euklideszi normálegyenletek alapján egy másodrend˝u görbe az alábbi 8 alakzat valamelyike, azok közül pontosan az egyik: 1. Üres halmaz: II. egyenlet a1 ≤ 0, a2 ≤ 0, (de a21 + a22 > 0). 2. Pont: I. egyenlet, a1 > 0, a2 > 0. 3. Párhuzamos egyenespár (beleértve az egybees˝o egyenespárt, vagyis az egyenest is): II. egyenlet, a két együttható közül az egyik pozitív, a másik 0, vagy I. egyenlet, a két együttható közül az egyik pozitív, a másik 0. 1
Mint az a lineáris algebrában szokásos, két egyenest párhuzamosnak nevezünk, ha egysíkúak és nincs közös pontjuk, vagy egybeesnek. Az egybees˝o egyenespárra a kett˝os egyenes elnevezést is használjuk.
37
4. Metsz˝o egyenespár: I. egyenlet, a két együttható ellentétes el˝ojel˝u. 5. Ellipszis (vagy kör): II. egyenlet, mindkét együttható pozitív. 6. Parabola: III. egyenlet. 7. Hiperbola: II. egyenlet, a1 és a2 ellentétes el˝ojel˝u. Az el˝oforduló a1 , a2 együtthatók minden lehetséges szignatúráját megvizsgáltuk, tehát a felsoroltakon kívül más típusú egyenlethez nem juthatunk. Nyilvánvaló, hogy egy másodrend˝u görbe nem tartozhat két csoportba is, hiszen a csoportok között geometriai jelleg˝u különbség van. (Pl. egy ellipszis sohasem hiperbola, mert más tulajdonságú pontok halmaza az ellipszis ill. a hiperbola, stb.) A másodrend˝u görbér˝ol bizonyos információt euklideszi normálegyenletük nélkül is kaphatunk. Az el˝oz˝o bizonyítást figyelmesen tanulmányozva észrevehetjük, hogy det A = λ1 · λ2 el˝ojele megegyezik a1 · a2 el˝ojelével (a III. egyenletben legyen a1 = 1, a2 = 0), tehát sgn(det A) = sgn(a1 · a2 ). Ez azt jelenti, hogy sgn a1 a2 meghatározásához nem kell a görbét normálalakra hozni. Definíció. A q = {x ∈ R2 |hA(x), xi + 2hb, xi + c = 0} másodrend˝u görbét elliptikusnak nevezzük, ha det A > 0, parabolikusnak, ha det A = 0, hiperbolikusnak, ha det A < 0. Következmény. Az elliptikus másodrend˝u görbék az ellipszis a pont és az üres halmaz, a parabolikus másodrend˝u görbék a parabola, párhuzamos egyenespár (beleértve a kett˝os egyenest is) és az üres halmaz, a hiperbolikus másodrend˝u görbék a hiperbola és a metsz˝o egyenespár. (Mint láttuk, az üres halmazra – mint valós másodrend˝u görbére – a definíció az el˝oállítástól függ, van elliptikus és parabolikus el˝oállítása is az üres halmaznak.) Az euklideszi normálegyenletben szerepl˝o u, v konstansok „eltüntetésével” az egyenleteket tovább egyszer˝usíthetjük, ehhez azonban már affin koordinátarendszert kell használni. Ha az origót az (u, v) koordinátájú pontban rögzítjük (az euklideszi normálegyenlethez tartozó bázist használva), akkor az I. II. III.
a1 x2 + a2 y 2 = 0 a1 x2 + a2 y 2 = 1 a1 x2 = y,
egyenletekhez jutunk, de az itt szerepl˝o koordináták már nem egy bázisra, hanem egy olyan Descartes-féle koordinátarendszerre vonatkoznak, mely az A operátor sajátvektoraiból álló ortonormált bázisból, s az el˝obb megadott origóból áll. Ezekben az egyenletekben a konstansokat átjelölve, az ortonormált bázis vektorait esetleg felcserélve kapjuk az ún. kanonikus egyenleteket. 38
3.13. Tétel. (Másodrendu˝ görbék kanonikus egyenlete.) Tetsz˝oleges másodrend˝u görbéhez létezik olyan Descartes-féle koordinátarendszer, melyben a görbe egyenlete az alábbiak valamelyike: típus I II III y2 y2 x2 x2 hiperbolikus a2 − b2 = 0 a2 − b2 = 1 x2 1 2 parabolikus x2 = 0 x =y = 1 2p a2 x2 = −1 a2 y2 y2 x2 x2 elliptikus + b2 = 0 a2 + b2 = 1 a2 2 x2 + yb2 = −1 a2
39