11. KVADRATIKUS FORMÁK A bilineáris leképezésekkel foglalkozó előző fejezet készítette elő a kvadratikus formák, vagy más elnevezéssel kvadratikus alakok vizsgálatát. A kvadratikus formák a matematika számos területén nyernek alkalmazást. A geometriában például a kvadratikus formák másodrendű görbéket, illetve másodrendű felületeket határoznak meg. Ezeknek az alakzatoknak a tanulmányozása számos olyan kérdést vetett fel, amelyek tisztázása ösztönzően hatott a lineáris algebra, s ezen belül e fejezet témájául szolgáló kvadratikus formák elméletének fejlődésére is. Legyen K egy tetszőleges, nem 2 karakterisztikájú test, s U e test feletti vektortér. Ha ABil(U×U,K) a K test feletti U vektortéren értelmezett szimmetrikus bilineáris funkcionál, akkor a Q:U→K, x→A(x,x) leképezést az A bilineáris funkcionálhoz tartozó kvadratikus formának (kvadratikus alaknak) nevezzük. A kvadratikus formák egyenlőségét, mint leképezések egyenlőségét értelmezzük. Azt mondjuk tehát, hogy a Q:U→K kvadratikus forma egyenlő a Q':U'→K' kvadratikus formával, ha U=U', K=K' és minden xU esetén Q(x)=Q'(x) teljesül. 11.1. Példa: Az előző fejezet 10.12. példájából kiindulva könnyen beláthatjuk, hogy az N:K×K→K, x→x2 leképezés egy kvadratikus forma, ha K egy tetszőleges, nem 2 karakterisztikájú test. 11.2. Példa: Ha K egy nem 2 karakterisztikájú test, továbbá A=(aij)nM(n,K) egy rögzített szimmetrikus mátrix, akkor az A:Kn→K, x→x·A·xT egy kvadratikus forma, n
n
amely a 10.13. példa mintájára felírható még A(x) aij xi x j alakban is, i 1 j 1
n
n
ha x=(x1...xn)K egy tetszőleges sorvektor a K standard vektortérben.
71
11.3. Példa: Az [a,b]ℝ zárt intervallumon folytonos függvények C[a,b] terében a b
B:C[a,b]→ℝ, f → f 2 ( x)dx integrál egy kvadratikus forma a 10.14. példa a
konstrukciója alapján. Ha K egy nem 2 karakterisztikájú test, U e test felett egy vektortér és ABil(U×U,K) egy szimmetrikus bilineáris funkcionál, akkor az A egyértelműen meghatározza az értelmezéséből adódóan a Q kvadratikus formát. Megmutatjuk, hogy ez fordítva is igaz, vagyis az A is egyértelműen meghatározott, ha ismerjük a Q kvadratikus formát. Valóban, tetszőleges x,yU esetén A(x+y,x+y)=A(x,x)+A(x,y)+A(y,x)+A(y,y)=A(x,x)+2·A(x,y)+A(y,y) , amelyből Q értelmezése szerint Q(x+y)=Q(x)+2·A(x,y)+Q(y) következik, s ebből egyszerű átrendezéssel
A(x, y) 12 (Q(x y) Q(x) Q(y)) adódik, tehát Q is teljesen meghatározza az A szimmetrikus bilineáris funkcionált. Ezek alapján a Q(x)=A(x,x) és az A(x, y) 12 (Q(x y) Q(x) Q(y)) formulákkal összekapcsolt A szimmetrikus bilineáris funkcionált és Q kvadratikus alakot egymáshoz tartozónak mondjuk. Röviden utalunk arra, hogy miért szükséges a kvadratikus formák értelmezésénél az a megszorítás, hogy a K test karakterisztikája nem lehet 2. 72
Ha ugyanis a K test 2 karakterisztikájú, akkor a fent szereplő A(x+y,x+y)=A(x,x)+2·A(x,y)+A(y,y) összefüggésből A(x,y) nem határozható meg, ugyanis ekkor 2·A(x,y)=A(x,y)+A(x,y)=0, más szóval 2 karakterisztikájú testben az 12 értelmetlen. Visszatérve előző gondolatmenetünkhöz, ha a K egy nem 2 karakterisztikájú test - s a fejezet további részeiben csak ilyenekkel foglalkozunk továbbá U a K test felett egy vektortér, akkor az U vektortéren értelmezett összes szimmetrikus bilineáris funkcionálok halmaza és az U vektortéren értelmezett összes kvadratikus formák halmaza között az egymáshoz tartozás fenti értelmezése egy természetes bijektív leképezést létesít. Ez a kapcsolat lehetőséget ad arra, hogy a szimmetrikus bilineáris funkcionálokra megismert eredményeket átvihessük kvadratikus formákra is az alábbiak szerint. Ha K egy nem 2 karakterisztikájú test, U e test feletti véges dimenziós vektortér, dim(U)=n, B={e1,...,en} az U egy tetszőleges bázisa, Q:U→K egy kvadratikus forma és ABil(U×U,K) e kvadratikus formához tartozó szimmetrikus bilineáris funkcionál, akkor a Q kvadratikus forma B bázisra vonatkozó mátrixát a matB(Q)≔matB(A) összefüggéssel definiáljuk. 11.4. Állítás: Ha U a nem 2 karakterisztikájú K test feletti véges dimenziós vektortér, dim(U)=n és B={e1,...,en} az U egy tetszőleges bázisa, akkor a Q:U→K kvadratikus forma egyértelműen előállítható a Q(x) ( x1 x 2 ...x n ) a11 a 21 a n1
n a12 a1n x1 x i 1 a 22 a 2n 2 x a n 2 a nn n
n
aij xi x j j 1
73
alakban, ahol (aij)n=matB(Q)M(n,K) a kvadratikus forma mátrixa és xU egy tetszőleges vektor az (x)B=(x1,...,xn) koordinátákkal. Bizonyítás: Alkalmazzuk a 10.16. állítást a Q kvadratikus formához tartozó A szimmetrikus bilineáris funkcionálra. A bilineáris funkcionálok mintájára most a kvadratikus formák mátrixának transzformációját tanulmányozzuk. 11.5. Állítás: Ha U a nem 2 karakterisztikájú K test feletti véges dimenziós vektortér, dim(U)=n, B={e1,...,en} és B'={e1',...,en'} az U vektortér egy tetszőleges bázispárja, S=(sij)nGL(n,K) a B→B' átmeneti mátrix, akkor a Q:U→K kvadratikus forma Q≔matB(Q) és Q'≔matB'(Q) mátrixai között érvényes a Q'=S·Q·ST összefüggés. Bizonyítás: Alkalmazzuk a 10.17. állítást a Q kvadratikus formához tartozó A szimmetrikus bilineáris funkcionálra. Ha K egy nem 2 karakterisztikájú test, U e test felett egy véges dimenziós vektortér, Q:U→K egy kvadratikus forma és ABil(U×U,K) e kvadratikus formához tartozó szimmetrikus bilineáris funkcionál, akkor a Q kvadratikus forma rangját a rang(Q)≔rang(A) összefüggéssel értelmezzük. Ezután a kvadratikus formák átlós előállításával foglalkozunk. 11.6. Állítás: Legyen K egy nem 2 karakterisztikájú test, U e test felett egy véges dimenziós vektortér. Ekkor minden Q:U→K kvadratikus formához található olyan B bázis az U vektortérben, amelyre vonatkozóan a kvadratikus forma matB(Q) mátrixa diagonális. 74
Bizonyítás: Az állítás közvetlenül adódik a 10.22. állításból, ha a Q:U→K kvadratikus formához tartozó ABil(U×U,K) szimmetrikus bilineáris funkcionálra alkalmazzuk annak eredményét. A 10.23. következmény mintájára kvadratikus formák esetén érvényes a 11.7. Következmény: Minden, a 11.6. állítás feltételeinek eleget tevő Q:U→K kvadratikus formához található olyan B={e1,...,en} bázis, hogy ha xU egy tetszőleges vektor és x=x1e1+...+xnen, akkor r
Q(x) ai xi 2 , i 1
ahol r=rang(Q)≤n a kvadratikus forma rangja. A 11.7. következményben szereplő összefüggést a Q kvadratikus forma átlós előállításának nevezzük. Mivel az r=rang(Q) értéke független a bázis megválasztásától, ezért igaz a 10.24. következménynek megfelelő 11.8. Következmény: Minden, a 11.6. állítás feltételeinek megfelelő Q:U→K kvadratikus forma mindegyik átlós előállításában a zérustól különböző együtthatók száma megegyezik. A 11.6. állítás és következményei a kvadratikus alakok átlós előállításának csupán a létezését biztosítja, ám nem ad eljárást egy ilyen átlós előállítás meghatározásához. A következőkben olyan módszert ismertetünk, amelylyel egy kvadratikus forma tetszőleges bázisban felírt alakjából kiindulva megalkotható annak egy átlós előállítása. Az eljárást a kvadratikus forma négyzetösszegre való redukciójának nevezzük. Legyen K egy nem 2 karakterisztikájú test, U e test felett egy n-dimenziós vektortér, B az U egy tetszőleges, de rögzített bázisa és Q:U→K egy kvadratin
n
kus forma, amelynek a B bázisra vonatkozó előállítása aij xi x j alakú. i 1 j 1
75
Feladatunk az U vektortér egy olyan B bázisának meghatározása, amelyben a n
szóban forgó kvadratikus forma a ai xi 2 alakot ölti, amelyben pontosan i 1
r(≤n) együttható különbözik zérustól, ha rang(Q)=r. Ha a Q kvadratikus forma n
n
aij xi x j
i 1 j 1
előállításában minden aij együttható 0, akkor a Q az azonosan zérus kvadratikus forma, s ekkor a feladat érdektelen. Ha a Q kvadratikus forma n
n
aij xi x j
i 1 j 1
előállításában van aij≠0 együttható, akkor a négyzetösszegre való redukáláshoz az szükséges, hogy az aii mennyiségek, vagyis az xi2 (1≤i≤n) együtthatói közül is legalább egy különbözzék zérustól. A koordináták alkalmas transzformációjával ezt mindig el is lehet érni. Valóban, ha a nem azonosan zérus kvadratikus forma minden aii (1≤i≤n) együtthatója 0, és például a12≠0, akkor tekintsük a koordináták x1 ': 12 ( x1 x2 ), x2 ': 12 ( x1 x2 ), x3 ': x3 ,..., xn ': xn
alakú transzformációját. Mivel ekkor x1=x1'+x2' és x2=x1'-x2' teljesül, így ennél a transzformációnál az a12x1x2+a21x2x1=2a12x1x2 tag a 2a12x1x2=2a12(x1'+x2')·(x1'-x2')=2a12x1'2-2a12x2'2 kifejezésbe megy át, ahol a120 folytán 2a120, hiszen K egy nem 2 karakterisztikájú test. Minthogy feltevésünk szerint a11=a22=0, így a 2a12x1'2-2a12x2'2 kifejezésben szereplő tagok a koordináták fenti transzformációja után nem tűnnek el, tehát elértük, hogy az x1'2 együtthatója nem 0. Ha most már a nem azonosan zérus Q kvadratikus forma 76
n
n
aij xi x j
i 1 j 1
előállításában legalább egy aii (1≤i≤n) együttható nem 0, akkor a koordináták x1'≔xi, x2'≔x2,..., xi-1'≔xi-1, xi'≔x1, xi+1'≔xi+1,..., xn'≔xn alakú transzformációjával elérhetjük, hogy az x1'2 együtthatója biztosan különbözik zérustól. A fentiek alapján az egyszerűség kedvéért feltehetjük, hogy a Q kvadratikus n
n
formának már a kiindulási aij xi x j előállításában is a110. Válasszuk i 1 j 1
ezen előállításból az x1 koordinátát tartalmazó tagokat: a11x12+a12x1x2+...+a1nx1xn+a21x2x1+...+an1xnx1, amelyek aij=aji (1≤i, j≤n) miatt az egyszerűbb a11x12+2a12x1x2+...+2a1nx1xn alakban írhatók fel. Egészítsük ki ezt az összeget teljes négyzetté, vagyis írjuk fel az a11 x12 2a12 x1 x2 ... 2a1n x1 xn
1 (a11 x1 ... a1n xn ) 2 B a11
alakban, ahol B azon tagok összegét jelöli, amelyek csak az a12x2,...,a1nxn mennyiségek négyzeteit és kétszeres szorzatait tartalmazzák. Ha az így nyert kifejezést a kvadratikus forma kiindulási előállításába helyettesítjük, akkor a n
n
aij xi x j
i 1 j 1
1 (a11 x1 ... a1n xn ) 2 C a11
alakhoz jutunk, ahol a C azon tagok összegét jelöli, amelyek csak az x2,...,xn koordinátákat tartalmazzák. Alkalmazzuk most a koordináták 77
x1'≔a11x1+...+a1nxn, x2'≔x2,...,an'≔xn alakú transzformációját, amelyek hatására a kvadratikus forma a fentiek szerint az n n 2 1 x 1' aij ' xi ' x j ' a11 i 2 j 2 n
n
alakot veszi fel. A aij ' xi ' x j ' kifejezés szerkezete teljesen olyan, mint a i 2 j 2
kvadratikus forma kiindulási előállítása, azzal a különbséggel, hogy nem tartalmazza az x1 koordinátát. Ha ezután feltesszük, hogy a220, s ezt, mint fent láttuk, egyszerű okoskodással mindig elérhetjük, akkor a koordináták előbbihez hasonló x1''≔x'1, x2''≔a22' x2'+...+a2n'xn', x3''≔x'3,...,xn''≔xn' transzformációjával elérhetjük, hogy a vizsgált kvadratikus forma az 1 "2 1 "2 n x1 x2 a11 a 22 ' i 3
n
aij ' ' xi ' ' x j ' ' j 3
alakot ölti. Az eljárást folytatva véges lépésben a kvadratikus forma előáll a kívánt alakban. Könnyen beláthatjuk, hogy a fenti eljárás során a koordinátákra alkalmazott transzformációk mátrixai mind invertálhatóak, s ezért a megfelelő inverz mátrixok az állítás alapján a kvadratikus forma előállításához használt B bázis transzformációinak olyan sorozatát indukálják, amelyek kompozíciója a B bázisból olyan B bázist konstruál, hogy abban a Q kvadratikus forma négyzetösszegre redukált alakban szerepel. A kvadratikus formák négyzetösszegre történő redukcióját egy példával is illusztráljuk.
78
11.9. Példa: Legyen U a valós számok ℝ teste felett egy 3-dimenziós vektortér és Q:U→ℝ egy kvadratikus forma, amelynek az U valamely B bázisára vonatkozó előállítása Q(x) ( x1 x 2 x 3 ) 0 1 3
1 3 x1 2 x1 x 2 6 x1 x3 2 x 2 x3 0 1 x 2 1 0 x3
alakú. Határozzuk meg a Q kvadratikus forma egy átlós előállítását a fent ismertetett eljárással! Látható, hogy a11=a22=a33=0 és a12=10, ezért először a koordináták x1 ' : 12 ( x1 x2 ), x2 ': 12 ( x1 x2 ), x3 ': x3
alakú transzformációját hajtjuk végre. Mivel ekkor x1=x1'+x2' és x2=x1'-x2', így ennél a transzformációnál 2x1x2-6x1x3+2x2x3=2(x1'+x2')(x1'-x2')+2(x1'-x2')x3'-6(x1'+x2')x3'= =2x1'2-2x2'2-4x1'x3'-8x2'x3' adódik. Most x1'2 együtthatója a11’=20, ezért válasszuk ki a kvadratikus forma imént kapott előállításából az x1' koordinátát tartalmazó tagokat, majd egészítsük ki teljes négyzetté ezt az összeget. Így a kvadratikus forma a
2 x1 ' 2 2 x2 ' 2 4 x1 ' x3 '8 x2 ' x3 ' (2 x1 ' 2 4 x1 ' x3 ' ) 2 x2 ' 2 8 x2 ' x3 ' 12 (2 x1 '2 x3 ' ) 2 2 x3 ' 2 2 x2 ' 2 8 x2 ' x3 ' alakot ölti. Ezután a koordináták x1''≔2x1'-2x3', x2''≔x2', x3''≔x3' transzformációjával az
79
1 (2 x1 '2 x3 ' ) 2 2
2 x3 ' 2 2 x2 ' 2 8x2 ' x3 ' 12 x1 ' ' 2 2 x2 ' ' 2 2 x3 ' ' 2 8x2 ' ' x3 ' '
formához jutunk. Tekintve, hogy az x2''2 együtthatója a2''=-20, ismét alkalmazhatjuk a fenti módszert. Teljes négyzetté való kiegészítéssel az 1 2
x1 ' ' 2 2 x2 ' ' 2 2 x3 ' ' 2 8 x2 ' ' x3 ' ' 12 x1 ' ' 2 2 x2 ' ' 2 8 x2 ' ' x3 ' '2 x3 ' ' 2 2
12 x1 ' ' 2 12 (2 x2 ' '4 x3 ' ' ) 2 8 x3 ' ' 2 2 x3 ' ' 2 12 x1 12 (2 x2 ' '4 x3 ' ' ) 2 6 x3 ' ' 2 forma adódik, amely a koordináták x1'''≔x1'', x2'''≔-2x2''-4x3'', x3'''≔x3'' transzformációjával már négyzetösszegre redukálja a kvadratikus formát: 1 x ' ' 2 12 (2 x2 ' '4 x3 ' ' ) 2 2 1
6 x3 ' ' 2 12 x1 ' ' ' 2 12 x2 ' ' ' 2 6 x3 ' ' ' 2 .
A fenti eljárást mátrixok alkalmazásával még áttekinthetőbbé tehetjük. Valóban, a feladat fenti megoldásában a koordinátákon alkalmazott transzformációk a 6.22. állítás alapján rendre a következő alakban írhatók fel:
( x1 x 2 x3 ) ( x1 ' x 2 ' x3 ' ) · 1 1 0 , 1 1 0 0 0 1 ( x1 ' x 2 ' x3 ' ) ( x1 ' ' x 2 ' ' x3 ' ' ) · 1 0 0 , 2 0 1 0 1 0 1 ( x1 ' ' x 2 ' ' x3 ' ' ) ( x1 ' ' ' x 2 ' ' ' x3 ' ' ' ) 1 0 1 0 2 0 2
0 . 0 1
Könnyen látható, hogy mindegyik 3-ad rendű mátrix invertálható, továbbá 80
( x1 x 2 x3 ) ( x1 ' ' ' x 2 ' ' ' x3 ' ' ' ) 1 0 0 1 0 0 1 1 0 2 1 1 0 1 0 2 0 0 1 0 0 0 1 0 2 1 1 0 1 ( x1 ' ' ' x 2 ' ' ' x3 ' ' ' ) 1 1 0 12 12 2 2 0 1 3 1
szorzatuk adja meg közvetlenül a három transzformáció kompozíciójának mátrixát. Ekkor a 11.5. állítás felhasználásával a kvadratikus forma mátrixát diagonális alakúra hozhatjuk egy lépésben a
12 12 0 1 1 2 2 0 1 3 1
0 1 3 1 1 0 3 1 0
12 12 0 1 1 2 2 0 1 3 1
T
12 0 0 0 1 0 2 0 0 6
módon, ezért a kvadratikus forma most a Q(x) 2 x1 x 2 6 x1 x3 2 x 2 x3 ( x1 x 2 x3 ) 0 1 3 x1 1 0 x 1 2 3 1 0 x3 2 1 1 1 ( x1 ' ' ' x 2 ' ' ' x3 ' ' ' ) 0 0 x1 ' ' ' 2 x1 ' ' ' 2 x 2 ' ' ' 2 6 x3 ' ' ' 2 2 x ' ' ' 1 0 2 0 2 x ' ' ' 3 0 6 0
négyzetösszegre redukált alakot veszi fel. Könnyen belátható az is, hogy a bázis megfelelő transzformációját a 6.20. állítás alapján a
12 12 0 1 1 2 2 0 1 3 1
1
1 1 0 1 1 0 2 4 1 81
mátrix írja le. Megjegyezzük, hogy a kvadratikus formák négyzetösszegre való redukciójának eljárása könnyen alkalmazható szimmetrikus bilineáris funkcionálok átlós előállításának meghatározására is. A szimmetrikus bilineáris funkcionálok mintájára most megvizsgáljuk, hogy a 11.7. következményben szereplő átlós előállítás hogyan egyszerűsödik, ha a K test a ℂ komplex számtest, illetve az ℝ valós számtest. A szimmetrikus bilineáris funkcionálokra tett észrevételek alapján közvetlenül adódik a 11.10. Állítás: A komplex számok ℂ teste feletti n-dimenziós U vektortéren értelmezett bármely Q:U→ℂ kvadratikus formához létezik olyan B bázis az U vektortérben, amelyben a kvadratikus forma előállítható a r
Q(x) xi 2 i 1
alakban, ahol r=rang(Q)≤n és xU tetszőleges vektor (x)B=(x1,x2,...,xn) koordinátákkal. Komplex számtest esetén a r
Q(x) xi 2 i 1
előállítást a Q kvadratikus forma normálalakjának hívjuk. 11.11. Állítás: A valós számok ℝ teste feletti n-dimenziós U vektortéren értelmezett bármely Q:U→ℝ kvadratikus formához létezik olyan B bázis az U vektortérben, amelyben a kvadratikus forma előállítható a r
Q(x) ui xi 2 i 1
82
alakban, ahol |ui|=1, r=rang(Q)≤n és xU egy tetszőleges vektor az (x)B=(x1,x2,...,xn) koordinátákkal. Valós számtest esetén a r
Q(x) ui xi 2 i 1
előállítást a Q kvadratikus forma normálalakjának nevezzük. A 10.24. állítás alapján valós kvadratikus formákra is érvényes az inercia tétel. 11.12. Állítás: (Sylvester inercia tétele) Ha U a valós számok ℝ teste feletti n-dimenziós vektortér és Q:U→ℝ e vektortéren értelmezett kvadratikus forma, akkor a Q valamennyi normálalakjában a pozitív, illetve a negatív együtthatók száma mindig ugyanaz. A szimmetrikus bilineáris funkcionáloknál bevezetett fogalmakkal összhangban valós kvadratikus formák esetén is beszélhetünk a kvadratikus forma pozitív-, illetve negatív tehetetlenségi indexéről és szignatúrájáról. Legyen Q a valós számok ℝ teste feletti U vektortéren értelmezett kvadratikus forma. A Q kvadratikus forma pozitív definit
:⇔ minden xU, x0 esetén Q(x)>0 ;
negatív definit
:⇔ minden xU, x0 esetén Q(x)<0 ;
pozitív szemidefinit
:⇔ minden xU esetén Q(x)≥0 és van olyan xU, x0, amelyre Q(x)=0 ;
negatív szemidefinit :⇔ minden xU esetén Q(x)≤0 és van olyan xU, x0, amelyre Q(x)=0 ; :⇔ ha létezik olyan x,yU vektorpár, amelyre Q(x)>0 és Q(y)<0 teljesül. A Q kvadratikus formát definitnek mondjuk, ha pozitív vagy negatív definit, szemidefinitnek pedig akkor hívjuk, ha pozitív vagy negatív szemidefinit. Megjegyezzük, hogy a fenti elnevezéseket szimmetrikus bilineáris funkcionálokra is alkalmazzuk, mégpedig mindig ugyanazt, amit a hozzá tartozó kvadratikus alakra. indefinit
83
Az iménti értelmezésből könnyen látható, hogy ha Q pozitív (negatív) definit kvadratikus forma, akkor valamely xU vektorra Q(x)=0 akkor és csakis akkor teljesül, ha x=0. Igaz továbbá, hogy a Q egy negatív definit kvadratikus forma akkor és csakis akkor, ha a (-Q)(x)≔-Q(x) összefüggéssel definiált -Q kvadratikus forma pozitív definit. 11.13. Állítás: Ha U a valós számok ℝ teste felett egy n-dimenziós vektortér és Q:U→ℝ e vektortéren értelmezett pozitív definit kvadratikus forma, akkor az U tetszőleges bázisában a kvadratikus forma mátrixának determinánsa pozitív. Bizonyítás: Ha Q az állítás feltételeiben megfogalmazott tulajdonságú kvadratikus forma, akkor a 11.6. állítás szerint létezik olyan B={e1,...,en} bázis az U vektortérben, amelyre vonatkozóan Q mátrixa diagonális, továbbá e mátrix 0 Q(e1 ) 0 Q(e 2 ) Q : mat B (Q) 0
0 0 Q(e n )
0
alakú. Mivel Q pozitív definit, ezért Q(ei)>0 (1≤i≤n), így érvényes a egyenlőtlenség is.
det(Q)=Q(e1)·Q(e2)·...·Q(en)>0
Legyen ezután B'≔{f1,...,fn} az U vektortér egy tetszőleges másik bázisa, ekkor a Q kvadratikus forma B' bázisra vonatkozó mátrixa a 11.5. állítás miatt előállítható a Q'≔matB'(Q)=S·Q·ST összefüggéssel, ahol SGL(n,ℝ) a bázisok között a B→B' átmeneti mátrix. Ebből a 7.11. állítás felhasználásával 84
det(Q')=det(S)·det(Q)·det(ST) következik, s mivel a 7.9. állítás szerint det(S)=det(ST), így érvényes a det(Q')=det(Q)·[det(S)]2 összefüggés. A 7.24. állítás alapján azonban det(S)≠0, így [det(S)]2>0, tehát det(Q') és det(Q) előjele azonos. De det(Q)>0, így det(Q')>0 is teljesül. Mivel B' egy tetszőleges bázis az U vektortérben, így a fentiek állításunk helyességét igazolják. A fenti okoskodás mintájára pozitív szemidefinit kvadratikus formákra bizonyítható a következő állítás, csupán most azt kell figyelembe venni, hogy Q(ei)≥0 (1≤i≤n), s így det(Q)≥0. 11.14. Állítás: Ha U a valós számok ℝ teste felett egy n-dimenziós vektortér, továbbá Q:U→ℝ e vektortéren értelmezett pozitív szemidefinit kvadratikus forma, akkor az U tetszőleges bázisában a kvadratikus forma mátrixának determinánsa nem negatív. A továbbiakban a pozitív definit kvadratikus formákkal foglalkozunk, hiszen a későbbi fejezetekben is elsősorban ilyenekkel találkozunk. Legyen U a valós számok ℝ teste felett egy n-dimenziós vektortér, Q:U→ℝ e vektortéren értelmezett pozitív definit kvadratikus forma, továbbá ABil(U×U,ℝ) a Q kvadratikus formához tartozó szimmetrikus bilineáris funkcionál. Azt mondjuk, hogy az xU vektor A-ortogonális az yU vektorra, ha A(x,y)=0 teljesül; jelölése: xy. Mivel az A szimmetrikus bilineáris funkcionál, így a fenti értelmezésből azonnal látható, hogy ha xy, akkor yx is érvényes, tehát az A-ortogonalitás egy szimmetrikus reláció. Az U vektortér egy {x1,x2,...,xk} vektorrendszerét A-ortogonális vektorrendszernek nevezzük, ha A(xi,xj)=0 minden i≠j (1≤i, j≤n) indexpár esetén. 85
11.15. Állítás: Ha egy A-ortogonális vektorrendszer nem tartalmazza az U vektortér 0 zérusvektorát, akkor a vektorrendszer lineárisan független. Bizonyítás: Legyen {x1,x2,...,xk} egy A-ortogonális vektorrendszer az U vektortérben, s tekintsük az a1x1+a2x2+...+akxk=0 lineáris kombinációt aiℝ (1≤i≤k) együtthatókkal. Ekkor a 10.4. tulajdonság felhasználásával tekintettel a vektorrendszer A-ortogonalitására 0=A(0,xi)=A(a1x1+a2x2+...+akxk,xi)=a1·A(x1,xi)+a2·A(x2,xi)+...+ +ak·A(xk,xi)=ai·A(xi,xi)=ai·Q(xi) (1≤i≤k) adódik, s mivel Q pozitív definit, ezért Q(xi)>0, így ai=0 (1≤i≤k) következik. Ha valamely A-ortogonális vektorrendszer az U vektortér bázisa, akkor ezt A-ortogonális bázisnak nevezzük. Egy B={e1,e2,...,en} A-ortogonális bázist pedig A-ortonormált bázisnak mondunk, ha Q(ei)=A(ei,ei)=1 (1≤i≤n) is teljesül. Ezek szerint B={e1,e2,...,en} A-ortonormált bázis akkor és csakis akkor, ha 1 i j A(e i , e j ) ij 0 i j . Ha U az ℝ valós számtest felett egy n-dimenziós vektortér, Q e vektortéren értelmezett pozitív definit kvadratikus forma és A a hozzá tartozó szimmetrikus bilineáris funkcionál, akkor a 10.22. állítás alapján létezik olyan B={f1,...,fn} bázis, amelyre vonatkozóan az A mátrixa
0 Q(f1 ) 0 Q(f 2 ) mat B ( A) 0 86
0 0 0 Q(f n )
alakú. Itt a főátló minden eleme pozitív, hiszen Q egy pozitív definit kvadratikus forma, ekkor tehát
Q(f ) ( 0) i j , A(f i , f j ) i 0 i j (1≤i, j≤n). Ezért érvényes a 11.16. Állítás: Az ℝ valós számtest feletti n-dimenziós U vektortérben minden ABil(U×U,ℝ) pozitív definit szimmetrikus bilineáris funkcionálnak létezik A-ortogonális bázisa. Alkalmazzuk ezután az imént nyert B={f1,...,fn} bázisra az ℝ feletti szimmetrikus bilineáris funkcionálok normálalakját előállító transzformációt, amelynek mátrixa
1 Q(f1 ) 0 S 0
0
0
0 1 Q(f n ) 0
1 1 f1 ,..., f n új bázisban az A mátrialakú. Az így nyert B' Q(f n ) Q(f1 ) xa az n-ed rendű egység mátrix:
87
1 0 0 0 1 mat B ' ( A) . 0 0 0 1 Ekkor az f i ':
1 Q(f i )
f i (1 i n)
jelöléssel a fentiek szerint 1 i j A(f i ' , f j ' ) 0 i j
(1≤i, j≤n). Így érvényes a 11.17. Állítás: Az ℝ valós számtest feletti n-dimenziós U vektortérben minden ABil(U×U,ℝ) pozitív definit szimmetrikus bilineáris funkcionálnak létezik A-ortonormált bázisa. Természetes kérdésként merül fel, hogy milyen módszerrel lehet megszerkeszteni A-ortogonális, illetve A-ortonormált bázisokat. Erre a kérdésre válaszolva ismerkedhetünk meg a Gram-Schmidt-féle ortogonalizációs eljárással, amelynek segítségével egy tetszőleges bázisból kiindulva rekurzív módon konstruálunk meg egy A-ortogonális, illetve Aortonormált bázist. Legyen az U egy n-dimenziós vektortér a valós számok ℝ teste felett, Q e vektortéren értelmezett pozitív definit kvadratikus forma és A a hozzá tartozó szimmetrikus bilineáris funkcionál. Tekintsük az U vektortér egy tetszőleges, de rögzített B={g1,...,gn} bázisát. Legyen az új bázis első vektora 88
f1≔g1 és keressük a bázis második vektorát az f2=k1·f1+g2 alakban. A k1ℝ együttható értékét az A(f1,f2)=0 feltételből határozzuk meg, tehát az f2 vektort úgy akarjuk megválasztani, hogy legyen A-ortogonális az f1 vektorra. Ekkor 0=A(f1,f2)=A(f1,k1f1+g2)=k1·A(f1,f1)+A(f1,g2)= =k1·Q(f1)+A(f1,g2) , s mivel a Q pozitív definit kvadratikus forma, így Q(f1)0, ezért a fenti összefüggésből a k1 együttható előállítható a
k1
A(f1 , g 2 ) Q(f1 )
alakban. Ezután tegyük fel, hogy már ismerjük az A-ortogonális bázis f1,...,fr-1 vektorait, s keressük az fr vektort fr=k1f1+...+kr-1fr-1+gr alakban. A k1,...,krℝ együtthatók értékét az A(fi,fr)=0 (1≤i≤r-1) feltételekből határozzuk meg, vagyis az fr vektort úgy akarjuk megválasztani, hogy az legyen A-ortogonális az f1,...,fr-1 vektorok mindegyikére. Ekkor kihasználva az f1,...,fr-1 vektorok A-ortogonalitását 0=A(fi,fr)=A(fi,k1f1+...+kr-1fr-1+gr)=k1·A(fi,f1)+...+kr-1·A(fi,fr-1)+ +A(fi,gr)=ki·A(fi,fi)+A(fi,gr)=ki·Q(fi)+A(fi,gr) (1≤i≤r-1) következik, ahonnan a Q pozitív definit volta miatt Q(fi)≠0, így a ki együttható előállítható a A(f i , g r ) ki (1 i r 1) Q(f i ) 89
formában. Meg kell még mutatni, hogy az így nyert fr nem lehet zérusvektor. Valóban, a fenti konstrukcióban az fi vektor előállításában csak a g1,...,gi vektorok szerepelnek (1≤i≤r-1). Ezért az fi=k1f1+...+ki-1fi-1+gi (1≤i≤r-1) felhasználásával fr előállítható az fr=a1g1+...+ar-1gr-1+gr alakban, ahol az a1,...,ar-1ℝ együtthatók az fi vektorok fenti előállításában szereplő együtthatókból számíthatók ki. Az fr vektor fenti előállításában a gr együtthatója nem 0, s mivel a {g1,...,gr} lineárisan független vektorrendszer, ezért az a1g1+...+ar-1gr-1+gr lineáris kombináció nem állíthatja elő a 0 zérusvektort, tehát fr≠0. Ezzel az eljárással a B={g1,...,gn} bázisból kiindulva előállítottuk az U vektortér egy B'={f1,...,fn} A-ortogonális bázisát. Ha ezután tekintjük az 1 e i : f i (1 i n) Q(f i ) vektorokat, akkor a 11.17. állítás előtti észrevételek alapján a B’’={e1,...,en} az U vektortér egy A-ortonormált bázisát alkotja. Megjegyezzük, hogy a Gram-Schmidt-féle eljárás valójában a 11.16., illetve a 11.17. állítás egy újabb bizonyítását is szolgáltatja. 11.18. Következmény: Bármely A-ortogonális vektorrendszer kiegészíthető A-ortogonális bázissá és bármely A-ortonormált vektorrendszer is kiegészíthető A-ortonormált bázissá. Bizonyítás: Legyen {a1,...,ar} egy A-ortogonális vektorrendszer. Először a 4.2. állítás felhasználásával kiegészítjük egy {a1,...,ar,br+1,...,bn} bázisra, majd alkalmazzuk rá az A-ortogonális bázist előállító Gram-Schmidt-féle eljárást az (r+1)ik vektortól kezdve. Ha pedig {a1,...,ar} egy A-ortonormált vektorrendszer, akkor a fenti konstrukciót kiegészítjük az (r+1)-ik vektortól kezdve a Gram-Schmidt-féle eljárás azon részével, amely A-ortogonális bázisból A-ortonormált bázist készít. 90
11.19. Állítás: Ha U az ℝ test felett egy n-dimenziós vektortér és B={e1,...,en} ennek egy Aortonormált bázisa, továbbá x,yU egy tetszőleges vektorpár az (x)B=(x1,x2,...,xn), (y)B=(y1,y2,...,yn) koordinátákkal, akkor A(x,y)=x1y1+x2y2+...+xnyn
és
Q(x)=x12+x22+...+xn2 .
Bizonyítás: Az állítás a 11.17. állítás előtt tett észrevételből, továbbá a 10.16. és a 11.4. állításokból közvetlenül következik. Legyen ezután U a valós számok ℝ teste felett egy n-dimenziós vektortér, Q az U vektortéren értelmezett pozitív definit kvadratikus forma, A pedig a Q-hoz hozzá tartozó szimmetrikus bilineáris funkcionál. Ha V az U vektortér egy altere, akkor a V : {x U | a V : A(a, x) 0}
halmazt a V altér A-ortogonális komplementerének nevezzük. A V tehát az U vektortér azon vektoraiból áll, amelyek V minden vektorára Aortogonálisak. 11.20. Állítás: Az U vektortér bármely V alterére fennállnak az alábbi tulajdonságok: (1) V « U; (2) U = V V (3)
V ≔ (V) = V .
Bizonyítás: Ha x,yV, akkor bármely aV esetén A(a,x)=A(a,y)=0, ahonnan A(a,x+y)=A(a,x)+A(a,y)=0 és bármely kℝ esetén A(a,kx)=k·A(a,x)=0 következik, tehát x+y, kxV, így a 3.8. állítás szerint V valóban altér. Nyilvánvaló, a Q pozitív definit kvadratikus forma, illetve a hozzá tartozó A szimmetrikus bilineáris funkcionál V altérre való leszűkítése is ugyanilyen tulajdonságú kvadratikus forma, illetve bilineáris funkcionál lesz. Ezért a 91
11.17. állítás szerint a V altérben, mint ℝ feletti vektortérben létezik {e1,e2,...,er} (r≤n) A-ortonormált bázis, amely a 11.18. következmény alapján kiegészíthető az U vektortér egy {e1,...,er,er+1,...,en} A-ortonormált bázisáig. Ebben a bázisban egy tetszőleges xU vektor egyértelműen írható fel az r
n
i 1
i r 1
x xi e i xi e i
alakban, amelyben az első összeget jelölje y, a másodikat y. Mivel ekkor x=y+y, yV és yV, így U=V+V. Még azt kell igazolnunk, hogy V∩V={0}. Ha bV∩V, akkor bV, így értelmezése szerint minden aV vektorral A(a,b)=0 teljesül. De bV is érvényes, tehát a fenti összefüggés b=a helyettesítéssel az A(b,b)=Q(b)=0 alakot ölti. Ám a Q egy pozitív definit kvadratikus forma, ezért b=0 lehet csak, így tehát U=VV is teljesül. Az U=VV összefüggésből a 4.10. állítás felhasználásával dim(V)= =dim(U)-dim(V)=n-dim(V) adódik, amiből dim(V)=dim((V))= =n-dim(V)=n-(n-dim(V))=dim(V) adódik. Vegyük észre, hogy VV, ugyanis bármely yV és zV esetén A(y,z)=0, tehát y{xU |zV: :A(x,z)=0}=(V)=V. Ekkor a dim(V)=dim(V) és a VV összefüggésekből a 4.8. állítás szerint V=V következik, hiszen V nem csak részhalmaza, de nyilvánvalóan altere is a V altérnek. A 11.13. állításban láttuk, hogy ha egy kvadratikus forma pozitív definit, akkor a vektortér tetszőleges bázisában a kvadratikus forma mátrixának determinánsa pozitív. Két ellenpéldát is bemutatunk annak szemléltetésére, hogy ez az állítás nem fordítható meg. Valóban a Q1 (x) ( x1 x2 ) 2 1 x1 2 x12 2 x1 x2 x2 2 kvadratikus 1 1 x2 forma mátrixának determinánsa 2 1 1 0 , det 1 1
92
ám a Q1(x)=-2x12+2x1x2-x22=-x12-(x1-x2)2<0 átalakítás mutatja, hogy egy negatív definit kvadratikus formáról van szó. A
Q2 (x) ( x1 x2 x3 ) 1 0 0 x1 x12 x2 2 x3 2 0 1 0 x2 0 0 1 x 3
kvadratikus forma mátrixának determinánsa is
1 0 0 det 0 1 0 1 0 , 0 0 1 de ha a≔(1,0,0) és b≔(0,1,0) koordinátákkal rendelkező vektorok, akkor Q2(a)=1>0 és Q2(b)=-1<0, tehát egy indefinit kvadratikus formával állunk szemben. Láthatjuk tehát, hogy egy kvadratikus forma pozitív definit voltának szükséges, de nem elegendő feltétele, hogy egy tetszőleges bázisra vonatkozó mátrixának determinánsa pozitív legyen. Ahhoz, hogy szükséges és elégséges feltételhez jussunk, még a kvadratikus forma mátrixában az aldeterminánsok egy bizonyos rendszerének pozitivitását is meg kell követelni. Ez a kritérium először Jacobi munkáiban bukkant fel, de több matematikus, így például Sylvester és Kronecker is alkalmazta számításai során. 11.21. Állítás: (Jacobi kritériuma) Legyen U az ℝ valós számtest feletti n-dimenziós vektortér, Q:U→ℝ az U vektortéren értelmezett kvadratikus forma, A a hozzá tartozó szimmetrikus bilineáris funkcionál és A=(aij)n a Q kvadratikus formának az U egy tetszőleges, de rögzített B={b1,...,bn} bázisára vonatkozó mátrixa. A Q kvadratikus forma akkor és csakis akkor lesz pozitív definit, ha minden 1≤k≤n esetén
93
a11 a12 a1k a 21 a 22 a 2 k Dk : det 0 a k1 a k 2 a kk teljesül. Bizonyítás: Ha Q pozitív definit, akkor ennek tetszőleges 1≤k≤n esetén a W≔b1,...,bk altérre való Qw leszűkítése is pozitív definit, amelynek
a11 a12 a1k a 21 a 22 a 2 k M (k , ℝ) a k1 a k 2 a kk lesz a W altér {b1,...,bk} bázisára vonatkozó mátrixa. A 11.13. állítás szerint e mátrix determinánsa pozitív minden 1≤k≤n esetén. Megfordítva, ha Dk>0 (1≤k≤n) egyenlőtlenségek teljesülnek, akkor n szerinti teljes indukcióval megmutatjuk, hogy a Q kvadratikus forma pozitív definit. Az állítás n=1 esetén nyilvánvaló, ezért tegyük fel, hogy az minden k≤n-1 esetén igaz. Ha W=b1,...,bn-1, akkor a Dk>0 (1≤k≤n-1) egyenlőtlenségekből az indukciós feltevés alapján azonnal következik, hogy a Q kvadratikus forma W altérre való Qw leszűkítése pozitív definit, s jelölje Aw a hozzá tartozó szimmetrikus bilineáris funkcionált, amely az A bilineáris funkcionál leszűkítése a W altérre. Tekintsük most a V : {x U | a V : A(a, x) 0}
összefüggéssel definiált vektorhalmazt. Ha x,yV, akkor tetszőleges aW vektorral A(a,x)=A(a,y)=0, amiből A(a,x+y)=A(a,x)+A(a,y)=0, továbbá bármely kℝ skalárral A(a,kx)=k·A(a,x)=0 következik, tehát x+y, kxV, ezért a 94
3.8. állítás alapján a V az U vektortér egy altere. Megmutatjuk, hogy V különbözik a {0} triviális altértől, tehát tartalmaz legalább egy c≠0 vektort. Legyen {e1,...,en-1} a W altér egy Aw-ortonormált bázisa, s a cV vektort keressük c=c1e1+c2e2+...+cn-1en-1+bn alakban, ahol ciℝ (1≤i≤n-1) alkalmas skalárok bn pedig a B bázis utolsó vektora. Ekkor az A(c,ei)=0 (1≤i≤n-1) és az A(ek,ei)=Aw(ek,ei)=0, i≠k, (1≤i,k≤n-1) felhasználásával 0=A(c,ei)=A(c1e1+...+cn-1en-1+bn,ei)=c1·A(e1,ei)+...+cn-1·A(en-1,ei)+ +A(bn,ei)=ciA(ei,ei)+A(bn,ei)=ci·Qw(ei)+A(bn,ei) (1≤i≤n-1) adódik. De Qw pozitív definit, így Qw(ei)≠0, ezért a fenti összefüggésekből a ciℝ (1≤i≤n-1) együtthatók kifejezhetők a
ci
A(b n , e i ) Qw (e i )
(1≤i≤n-1)
formában. Az így megkonstruált cV vektor biztosan különbözik 0-tól, ellenkező esetben ugyanis a 0=c1e1+...+cn-1en-1+bn összefüggésből bne1,...,en-1=W=b1,...,bn-1 következne. Ez viszont lehetetlen, hiszen B={b1,...,bn-1,bn} egy bázis az U vektortérben, s így lineárisan független vektorrendszer is egyben. Ezután bizonyítjuk, hogy U=WV, tehát az U vektortér előállítható W és V alterének direkt összegeként. Könnyen látható, hogy az {e1,...,en-1,bn} vektorrendszer az U vektortér egy bázisát alkotja, s ezért minden xU vektora egyértelműen írható fel x=x1e1+...+xn-1en-1+xnbn alakban. Ebből a c vektor fenti előállítását felhasználva x=x1e1+...+xn-1en-1+xn·(c-c1e1-...-cn-1en-1)= =[(x1-c1xn)e1+...+(xn-1-cn-1xn)en-1]+xn·c következik, s ha a szögletes zárójelben szereplő vektort xw, az xn·c vektort pedig xv jelöli, akkor a tetszőleges xU vektor előállítható az 95
x=xw+xv, xwW, xvV formában, tehát U=W+V teljesül. Most belátjuk, hogy W∩V={0}. Valóban, ha yW∩V, akkor yV, így értelmezése szerint minden aV vektorral A(a,y)=0. De yW is érvényes, így a fenti összefüggés y=a helyettesítéssel az A(y,y)=Aw(y,y)=Qw(y)=0 alakot ölti. De Qw pozitív definit kvadratikus forma, ezért csak y=0 lehetséges, ami az előző bekezdéssel együtt bizonyítja az U=WV összefüggés helyességét. Az U=WV összefüggésből a 4.10. állítás felhasználásával dim(V)= =dim(U)-dim(W)=n-(n-1)=1 adódik, s mivel cV, c≠0, így c=V, és U=Wc is következik. Most megmutatjuk, hogy Q(c)>0. Valóban, a fenti konstrukció szerint {e1,...,en-1,c} az U vektortér olyan bázisát alkotja, amelyre vonatkozóan a Q kvadratikus forma mátrixa 1 0 0 0 1 C 1 0 0 0 Q(c) alakú lesz. A CM(n,ℝ) mátrix és a Q kvadratikus forma B={b1,...,bn} bázisra vonatkozó AM(n,ℝ) mátrixa között a kapcsolatot a 11.5. állítás szerint a C = S · A · ST összefüggés fejezi ki, ahol SGL(n,ℝ) a bázisok közötti átmenet mátrixa. Ebből a 7.11. állítás alapján det(C)=det(S)·det(A)·det(ST) következik. A 7.9. állítás szerint det(S)=det(ST) a 7.24. állítás alapján viszont det(S)≠0, ezért a fentiből 96
det(C)=det(A)·(det(S))2 és (det(S))2>0 adódik, tehát det(C) és det(A) előjele azonos. A feltevés szerint Dn=det(A)>0, így det(C)=Q(c)>0 is teljesül. Befejezésül már csak azt kell bizonyítani, hogy minden uU, u≠0 vektorra Q(u)>0 teljesül. Valóban az U=Wc előállítást felhasználva minden uU vektor egyértelműen állítható elő u=w+t·c alakban, ahol wW és tℝ alkalmas skalár. Ekkor Q(u)=Q(w+t·c)=A(w+t·c,w+t·c)=A(w,w)+2t·A(w,c)+t2·A(c,c)= =Q(w)+t2·Q(c)=Qw(w)+t2·Q(c) adódik. A Qw pozitív definit, ezért Qw(w)>0 minden w≠0 esetben és Qw(w)=0 pontosan akkor, ha w=0. A Q(c) a fentiek szerint pozitív, így t2·Q(c)>0 minden t≠0 esetén és pontosan a t=0 esetben t2·Q(c)=0. Ezért Q(u)>0 lesz minden olyan esetben, ha u≠0 és pontosan akkor lesz Q(u)=0, ha u=0, tehát a Q valóban pozitív definit kvadratikus forma. Ezzel a tételt maradéktalanul igazoltuk. 11.22. Következmény: Legyen U a valós számok ℝ teste felett egy n-dimenziós vektortér, Q:U→ℝ e vektortéren értelmezett kvadratikus forma, amelynek az U egy tetszőleges B bázisára vonatkozó mátrixa A=(aij)nM(n,ℝ). A Q kvadratikus forma akkor és csakis akkor negatív definit, ha érvényesek a
a11 a12 a1k a 21 a 22 a 2 k 0 (1) k ·det a k1 a k 2 a kk
(1 k n)
egyenlőtlenségek. 97
Bizonyítás: Valóban, a Q kvadratikus forma akkor és csakis akkor negatív definit, ha -Q pozitív definit, s ha matB(Q)=(aij)n, akkor matB(-Q)=(-aij)n. A -Q pozitív definit kvadratikus formára ekkor a 11.21. állítás szerint
a11 a12 a1k a21 a22 a2 k 0 det a a a k2 kk k1
(1 k n)
teljesül. A determináns függvény elemi tulajdonságaiból következik, hogy a fenti determinánsok minden oszlopából a -1ℝ skalár szorzó kiemelhető, s így a a11 a12 a1k a 21 a 22 a 2 k 0 (1) k ·det (1 k n) a a a kk k1 k 2 egyenlőtlenségekhez jutottunk, amelyek következményünk helyességét igazolják. Megjegyezzük, hogy a Dk≥0 (1≤k≤n) egyenlőtlenségekből nem következik a Q pozitív szemidefinit volta. Ezt az alábbi példával szemléltetjük. A Q(x) ( x1 x 2 x3 ) · 1 0 1 · x1 x1 2 2 x1 x3 kvadratikus forma mát 0 0 0 x2 1 0 0 x 3 rixára teljesülnek a
98
det(a11 ) 0,
a11 a12 a13 a11 a12 0 és det a a a 0 det 21 22 23 a21 a22 a a a 31 32 33
egyenlőtlenségek, mégis ha a≔(1,0,1) és b≔(1,0,-1) koordinátákkal rendelkező vektorok, akkor Q(a)=3>0 és Q(b)=-1<0, tehát Q egy indefinit, s nem pedig pozitív szemidefinit kvadratikus forma. Ezért most a Jacobi kritériummal analóg állítás szemidefinit kvadratikus formákra történő kidolgozásával foglalkozunk. Mondanivalónkat több lépésben ismertetjük. Legyen U a valós számok ℝ teste felett egy n-dimenziós vektortér, Q:U→ℝ e vektortéren értelmezett kvadratikus forma, amelynek az U egy tetszőleges B bázisára
vonatkozó
szimmetrikus
mátrixa
A=(aij)nM(n,ℝ).
Ezen
A=(aij)nM(n,ℝ) szimmetrikus mátrix főminorjai alatt azokat az aldeterminánsait értjük, amelyek képzésénél ugyanazokat az indexű sorokat és oszlopokat hagytuk el. ik Korábbi jelöléseinkkel tehát az A mátrix k-ad rendű főminorjai det A ii11 ,,ii22 ,..., ,...,ik
alakúak (1≤i≤n), ahol i1,i2,...,ik jelöli a kiválasztott sorok, illetve a velük megegyező oszlopok indexeit. Könnyen látható, hogy az elsőrendű főminorok az A szimmetrikus mátrix főátlójában elhelyezkedő a11,a22,...,ann elemei, s természetesen a teljes det(A) determináns is főminor, mégpedig az egyetlen n-ed rendű főminor. Vegyük észre, hogy az AM(n,ℝ) szimmetrikus mátrix valamennyi főminorjának mátrixa szintén szimmetrikus mátrix. A későbbiek szempontjából lényeges szerepet fog játszani az a megállapítás, hogy az AM(n,ℝ) szimmetrikus mátrix rangjának meghatározásánál csupán e mátrix főminorai mérvadók. 11.23. Állítás: Ha az AM(n,ℝ) szimmetrikus mátrixnak létezik r-ed rendű el nem tűnő főminorja, ám valamennyi (r+1)-ed rendű főminorja zérus, akkor rang(A)=r. 99
Bizonyítás: Állításunk más szóval azt jelenti, hogy ha az AM(n,ℝ) szimmetrikus mátrix valamennyi (r+1)-ed rendű főminorja eltűnik, akkor ebből már következik az összes (r+1)-ed rendű aldeterminánsának eltűnése is. Az állítást abban az ekvivalens formában igazoljuk, hogy ha rang(A)=r, akkor a mátrixnak létezik r-ed rendű el nem tűnő főminorja. Ha rang(A)=r, akkor a 7.28. állítás szerint a mátrixban létezik r sor, mondjuk az i1,i2,...,ir indexű, amelyek lineárisan függetlenek, de a mátrix valamennyi sora e sorok lineáris kombinációja. Az így kijelölt sorokba eső főminor ir A ii11 ,..., ,...,ir , s állításunkat igazoljuk, ha megmutatjuk, hogy e főminor nem tűnik
el. Az AM(n,ℝ) szimmetrikus volta miatt az A mátrix valamennyi oszlopa előállítható az i1,i2,...,ir oszlopok lineáris kombinációjaként. Tekintsük ezután az A mátrix azon BM(r,n,ℝ) részmátrixát, amely az A i1,i2,...,ir sorából áll. A fentiek szerint e B részmátrixra is fennáll az, hogy bármelyik oszlopa az i1,i2,...,ir oszlopok lineáris kombinációja. i1 ,...,ir ir Ha det A ii11 ,..., ,...,ir =0 volna, akkor a 7.28. állítás szerint A i1 ,...,ir valamennyi osz-
ir lopa, s így B valamennyi oszlopa is A ii11 ,..., ,...,ir r-énél kevesebb oszlopának lineá-
ris kombinációja lenne. Ez azonban lehetetlen, hiszen B r számú lineárisan független sorból áll a 7.28. állítás miatt. ir Az így kapott ellentmondás bizonyítja, hogy det A ii11 ,..., ,...,ir ≠0, s ezzel állítá-
sunkat igazoltuk. A szemidefinit kvadratikus formák vizsgálatához a következő lépésként bebizonyítjuk az alábbi állítást. 11.24. Állítás: Ha U a valós számok ℝ teste felett egy n-dimenziós vektortér, Q:U→ℝ e vektortéren értelmezett pozitív szemidefinit kvadratikus forma, amelynek az U egy tetszőleges B bázisára vonatkozó mátrixa A=(aij)nM(n,ℝ), akkor e mátrix főátlójában szereplő a11,a22,...,ann elemek mind pozitívak.
100
Bizonyítás: Megmutatjuk például, hogy ann>0. Mivel Q egy pozitív szemidefinit kvadratikus forma, így
Q(0,...,0,1) (0...01) a11 a12 a1n 0 a nn 0 , a 21 a 22 a 2 n 0 1 a a a n1 n 2 nn ezért állításunk helyességének igazolása céljából elegendő az ann=0 lehetetlenségét megmutatni. Ha i (1≤i≤n-1) egy tetszőlegesen rögzített index, akkor legyen xi=-2ain, xn=aii+1 és xk=0, ha k≠i, n . Ekkor
Q( x1 , x 2 ,..., x n ) (0,...,0, xi ,0,...,0, x n ) a11 a 21 a n1
aii xi 2ain xi x n a nn x n 2
2
0 a 22 0 xi 0 an2 0 x n 2 4ain a nn (aii 1) 2 0 , a12
a1n a2n a nn
hiszen a Q kvadratikus forma pozitív szemidefinit. Ha ann=0 teljesülne, az előbbi egyenlőtlenségből -4ain2≥0, azaz ain2≤0, s így ain=0 következnék. Mivel ez az i=1,2,...,n-1 esetek mindegyikére igaz, így az ann=0 összefüggéssel együtt nyernénk, hogy a1n=a2n=...=ann=0.
101
Ez azonban lehetetlen, hiszen ekkor az A mátrix utolsó oszlopa csupa 0 elemből állna, vagyis a Q kvadratikus forma x1,x2,...,xn mindegyikét nem tartalmazná. Így ann=0 lehetetlen. A fentihez hasonló okoskodással láthatjuk be az A mátrix főátlója többi elemének pozitivitását is, s ezzel állításunkat igazoltuk. Ezután a szemidefinit kvadratikus formákra vonatkozó következő állítást igazoljuk. 11.25. Állítás: Ha U a valós számok ℝ teste felett egy n-dimenziós vektortér, Q:U→ℝ e vektortéren értelmezett pozitív szemidefinit kvadratikus forma, amelynek az U egy tetszőleges B bázisára vonatkozó mátrixa A=(aij)nM(n,ℝ), akkor det(A)=0. Bizonyítás: Állításunkat az U vektortér dimenziója szerinti teljes indukcióval bizonyítjuk. Az n=1 esetben állításunk helyes, hiszen a Q(x)=a11·x12 kvadratikus forma nyilván csak akkor lehet pozitív szemidefinit, ha det(A)=a11=0. Ezután feltételezzük, hogy állításunk az ℝ test feletti legföljebb (n-1)dimenziós vektortér valamennyi kvadratikus formájára igaz. Ha
Q( x1 , x 2 ,..., x n ) ( x1 , x 2 ,..., x n ) a11 a12 a1n x1 a 21 a 22 a 2 n x 2 a n1 a n 2 a nn x n az n-dimenziós valós számtest feletti U vektortér egy pozitív szemidefinit kvadratikus formája, akkor
n 1 x1=adj(an1), x2=adj(an2),...,xn=adj(ann)=det A11,, 22,..., ,...,n 1
esetén a 7.20. állítás felhasználásával
102
Q( x1 , x 2 ,..., x n ) (adj( a n1 ),..., adj( a nn )) a11 a12 a1n adj( a n1 ) a 21 a 22 a 2 n a a a adj( a ) nn nn n1 n 2 (adj( a n1 ),..., adj( a nn )) 0 adj( a nn ) det(A) 0 0 det(A) 1, 2,...,n 1 n det A 1, 2,...,n1 det A 11,, 22,..., ,...,n 0 ,
ahol adj(ani) az A mátrix ani komponenséhez tartozó adjungált aldetermináns, 1, 2,...,n n1 det A11,,22,..., ,...,n1 az A egy (n-1)-ed rendű főminorja, det A1, 2,...,n =det(A) pedig az A egyetlen n-ed rendű főminorja. Másfelől szintén a Q(x1,...,xn) kvadratikus forma pozitív szemidefinit voltából következik, hogy a Q(x1,...,xn-1,0) kvadratikus forma pozitív definit, vagy pozitív szemidefinit. Ha Q(x1,x2,...,xn-1,0) pozitív definit, akkor a 11.21. állítás szerint
a11 Dk det a k1
a1k 0 a kk
(1 i n 1) ,
minthogy a Q(x1,...,xn-1,0) kvadratikus forma mátrixa a Q(x1,...,xn-1,xn) kvadratikus forma mátrixából az utolsó sor és oszlop elhagyásával keletkezik. Ekkor a
103
Dn1
a11 det a n1,1
a1,n1 1, 2,..., n 1 det A1, 2,...,n1 0 a n1,n1
n1 1, 2,...,n egyenlőtlenségből a fenti Q(x1,...,xn)= det A11,,22,..., ,...,n1 · det A1, 2,...,n 0 össze-
n függés alapján det(A)= det A11,,22,..., ,...,n 0 következik. De det(A)>0 lehetetlen, mert ez a Dk>0 (1≤i≤n-1) egyenlőtlenségekkel együtt a 11.21. állítás szerint azt jelentené, hogy a Q(x1,...,xn) kvadratikus forma pozitív definit, feltevésünkkel ellentétben. Ha tehát a Q(x1,...,xn-1,0) kvadratikus forma pozitív definit, akkor állításunk helyességét igazoltuk. Ha a Q(x1,...,xn-1,0) kvadratikus forma pozitív szemidefinit, akkor indukciós n1 feltevésünk szerint det A11,,22,..., ,...,n1 =0. Ekkor
n1 x1=adj(an1), x2=adj(an2),...,xn=adj(ann)= det A11,,22,..., ,...,n1
(=0)
esetén egyszerű számítással Q( x1 adj( a n1 ),..., x n adj(a nn )) ( x1 adj( a n1 ),..., x n adj( a nn )) a11 a12 a1n x1 adj( a n1 ) ( x1 ,..., x n ) a11 a12 a1n x1 a 21 a 22 a 2 n a 21 a 22 a 2 n · a a n1 a n 2 a nn x n adj( a nn ) n1 a n 2 a nn x n ( x1 ,..., x n ) · a11 a12 a1n adj( a n1 ) (adj( a n1 ),..., adj( a nn )) · a 21 a 22 a 2 n · a adj( a ) a a nn nn n1 n 2
104
a11 a12 a1n x1 (adj( a n1 ),..., adj( a nn )) a11 a12 a1n a 21 a 22 a 2 n a 21 a 22 a 2 n · a x a a a a a n2 nn n2 nn n1 n n1 adj( a n1 ) Q( x1 ,..., x n ) 2 x n det(A) adj( a nn ) det(A) adj( a ) nn Q( x1 ,..., x n ) 2 x n det(A) 0 adódik. A 11.24. állítás alapján ann>0, így det(A) det(A) a11 a12 a1n 0 0,...,0, Q 0,...,0, a a a 21 a 22 a 2 n nn nn 0 det(A) a n1 a n 2 a nn a nn det 2 ( A) det 2 ( A) det(A) a det(A) 1n a nn . 0,...,0, 2 a nn a nn a nn a nn det(A) a nn a nn
Most az imént nyert egyenlőtlenség felhasználásával det(A) det(A) Q adj( a n1 ),..., adj( a n, n 1 ), adj( a nn ) Q 0,...,0, a a nn nn 2 2 2 det(A) det ( A) det ( A) det ( A) 2 det(A) a nn 2 0 2 a nn a nn a nn a nn
105
következik. Az ann>0 egyenlőtlenség miatt ez azt jelenti, hogy det2(An)≤0, tehát hogy det(A)=0, s ezzel állításunkat teljesen bebizonyítottuk. A fenti előkészítő lépésekkel elérkeztünk egy valós kvadratikus forma pozitív szemidefinit voltát eldöntő szükséges és elégséges feltétel megfogalmazásához. 11.26. Állítás: Legyen U az ℝ valós számtest feletti n-dimenziós vektortér, Q:U→ℝ az U vektortéren értelmezett kvadratikus forma, A a hozzá tartozó szimmetrikus bilineáris funkcionál és A=(aij)nM(n,ℝ) a Q kvadratikus formának az U egy tetszőleges, de rögzített B bázisra vonatkozó mátrixa. A Q kvadratikus forma akkor és csakis akkor lesz pozitív szemidefinit, ha det(A)=0 és az A mátrix egyik lehető legmagasabb rendű el nem tűnő főminorja egy pozitív definit kvadratikus forma mátrixát szolgáltatja. Bizonyítás: Először azt mutatjuk meg, hogy ha a Q kvadratikus forma pozitív szemidefinit, akkor det(A)=0 és az A mátrix egyik lehető legmagasabb rendű el nem tűnő főminorja egy pozitív definit kvadratikus forma mátrixát szolgáltatja. Azt, hogy det(A)=0, már bebizonyítottuk a 11.25. állításban. Számozzuk át most a Q(x1,...,xn) kvadratikus formában x1,x2,...,xn indexeit, azaz cseréljük fel az A mátrix sorait és megfelelően oszlopait úgy, hogy az A mátrix bal felső sarkába egy tetszőlegesen kiválasztott maximális rendű el nem tűnő főminor kerüljön. r Ekkor ez a det A11,, 22,..., ,...,r főminor a Q(x1,x2,...,xr,0,...,0) kvadratikus forma mátrixát adja meg, s e kvadratikus forma szükségképpen pozitív definit, hiszen értéke a Q(x1,x2,...,xr) kvadratikus forma pozitív szemidefinit volta miatt mindig nemnegatív, azaz Q(x1,x2,...,xr)≥0, másfelől pozitív szemidefinit nem ler 1, 2,...,r het, mert akkor A11,, 22,..., ,...,r mátrixának det A1, 2,...,r determinánsa a 11.25. állítás
r szerint zérus volna, holott feltevésünk szerint det A11,, 22,..., ,...,r 0. Megfordítva, másodszor azt mutatjuk meg, hogy ha a Q kvadratikus forma A mátrixának determinánsára teljesül a det(A)=0 feltétel, továbbá e mátrix egyik maximális rendű el nem tűnő főminorja egy pozitív definit kvadratikus
106
forma mátrixát szolgáltatja, akkor a Q egy pozitív szemidefinit kvadratikus forma. Ezt az állítást az U vektortér dimenziója szerinti teljes indukcióval igazoljuk. Tegyük fel, hogy a Q kvadratikus forma A mátrixának maximális rendű el nem tűnő főminorjai r-ed rendűek (0
r formájának mátrixa. Ekkor a 11.21. állítás szerint det A11,, 22,..., ,...,r >0. Megjegyezzük, hogy az A mátrix bármely (r+1)-ed rendű aldeterminánsa zérus, hiszen abból a föltevésből, hogy az A mátrix bármely, r-nél magasabb rendű főminorja eltűnik, a 11.23. állítás szerint az következik, hogy rang(A)=r. Nyilvánvalóan elegendő azt megmutatni, hogy Q(x1,...,xn)≥0 érvényes tetszőleges x1,x2,...,xn értékek esetén. Ebből ugyanis az következik, hogy Q(x1,x2,...,xn) pozitív definit, vagy pozitív szemidefinit kvadratikus forma. Ám pozitív definit nem lehet, hiszen akkor állításunk már igazolt része szen rint det(A)= det A11,, 22,..., ,...,n >0, holott esetünkben det(A)=0. Indukciós feltevésünk értelmében a Q(x1,...,xr,xr+2,...,xn) kvadratikus forma pozitív szemidefinit, azaz Q(x1,...,xr,0,xr+2,...,xn)≥0 teljesül bármilyen x1,...,xr,xr+2,...,xn értékekre. Ennélfogva a Q(x1,x2,...,xn)≥0 helyességét már csak olyan x1,x2,...,xn értékekre kell bizonyítanunk, amelyekre xr+10. A Q(x1,x2,...,xn)≥0 érvényessége az összes ilyen esetre a Q(x1,...,xr,c,xr+2,...,xn)≥0 egyenlőtlenségből következik, ahol c0 rögzített szám, míg x1,...,xr,xr+2,...,xn értékei tetszőlegesek. Valóban, ha c0 olyan rögzített szám, amelyre bármely x1,...,xr,xr+2,...,xn értékek mellett érvényes Q(x1,...,xr,c,xr+2,...,xn)≥0, akkor legyen xr+10 egy tetszőc leges szám, s legyen t≔ . Ekkor t·xr+1=c és x r 1
107
Q(tx1 ,..., tx r 1 ,..., tx n ) (tx1 ,..., tx r 1 ,..., tx n ) a11 a12 a1n tx1 a21 a22 a2 n tx r 1 an1 an 2 ann tx n 2 2 t ( x1 ,..., xr 1 ,..., xn ) a11 a12 a1n x1 t Q( x1 ,..., xr 1 ,..., xn ) , a21 a22 a2 n xr 1 a a a nn n1 n 2 x n
s mivel Q(tx1,...,txr+1,...,txn)=Q(tx1,...,txr,c,txr+2,...,txn)≥0, továbbá t2>0 (hiszen t0), így Q(x1,...,xr+1,...,xn)≥0 is teljesül. A továbbiakban tehát már csak Q(x1,...,xr,c,xr+2,...,xn)≥0 érvényességét kell igazolnunk alkalmasan választott c0 állandó esetére. Jelölje adj*(aik) az aik elemhez tartozó adjungált aldeterminánst a r 1 det A11,,22,..., determinánsban. Legyen továbbá v1≔adj*(ar+1,1), ,...,r 1
r v2≔adj*(ar+1,2),...,vr+1=adj*(ar+1,r+1) és vr+2=...=vn=0. Ekkor det A11,, 22,..., ,...,r >0
r alapján vr+1=adj*(ar+1,r+1)= det A11,, 22,..., ,...,r 0, ezért a vr+10 lényeges követelménynek eleget tettünk. Most
Q( x1 v1 , x 2 v 2 ,..., x r v r ,0, x r 2 v r 2 ,..., x n v n ) Q( x1 v1 , x 2 v 2 ,..., x r v r , v r 1 v r 1 , x r 2 v r 2 ,..., x n v n ) n
Q( x1 , x 2 ,..., x r , v r 1 , x r 2 ,..., x n ) vi (ai1v1 ... ain v n ) n
i 1
2 xi (ai1v1 ... ain v n ) 2v r 1 (a r1v1 ... a rn v n ) , i 1 ir
108
így ha tehát sikerül bebizonyítani, hogy ai1v1+...+ainvn=0 (i=1,2,...,n) , akkor célunkat elértük, hiszen a fentiek szerint Q(x1-v1,...,xr-vr,0,xr+2-vr+2,...,xn-vn)=Q(x1,...,xr,vr+1,xr+2,...,xn) teljesül. Ebből pedig a bizonyítandó Q(x1,...,xr,vr+1,xr+2,...,xn)≥0 egyenlőtlenség helyessége nyilvánvaló, minthogy a bal oldalra az indukciós feltevés szerint fennáll a Q(x1,...,xr,0,xr+2,...,xn)≥0 összefüggés. Feladatunk tehát vi(i=1,2,...,n) értékeinek felhasználásával az ai1·adj*(ar+1,1)+...+ai,r+1·adj*(ar+1,r+1)=0
(i=1,2,...,n)
egyenlőségek teljesülését igazolni. Ezen összefüggések az i=1,2,...,r esetben azért igazak, mert adj*(aik) definír 1 ciója szerint a baloldalon ekkor det A11,,22,..., ,...,r 1 i-edik sora megfelelő komponenseinek az (r+1)-edik sor elemeihez tartozó adjungált aldeterminánsok rendszerével alkotott szorzatainak összege található, s
ai1·adj*(ar+1,1)+...+ai,r+1·adj*(ar+1,r+1)=0
(i=1,2,...,r)
a 7.19. állítás alapján. A fenti egyenlőségek az i=r+1,...,n esetekben viszont azért igazak, mert a bal r 1 oldalon az A mátrix i-edik sora első r+1 elemének a det A11,,22,..., ,...,r 1 utolsó sora elemeihez tartozó adjungált aldeterminánsok rendszerének megfelelő komponenseivel alkotott szorzatának összege áll. Ez az összeg éppen annak az (r+1)-ed rendű determinánsnak az utolsó sor szerinti kifejtése, amely az A mátrix első r sorának és i-edik sorának, valamint első r+1 oszlopának megtartásával, s természetesen a többi sor és oszlop törlésével keletkezik az A mátrixból. Az
ai1·adj*(ar+1,1)+...+ai,r+1·adj*(ar+1,r+1)=0
(i=r+1,r+2,...,n)
összefüggések azért igazak, mert rang(A)=r, s ezért valamennyi (r+1)-ed rendű aldeterminánsa a 7.28. állítás szerint eltűnik. Ezzel állításunkat maradéktalanul igazoltuk. 109
11.27. Következmény: Legyen U az ℝ valós számtest feletti n-dimenziós vektortér, Q:U→ℝ az U vektortéren értelmezett kvadratikus forma, A a hozzá tartozó szimmetrikus bilineáris funkcionál és A=(aij)nM(n,ℝ) a Q kvadratikus formának az U egy tetszőleges, de rögzített B bázisra vonatkozó mátrixa. A Q kvadratikus forma akkor és csakis akkor lesz negatív szemidefinit, ha det(A)=0 és az A mátrix egyik lehető legmagasabb rendű el nem tűnő főminorja egy negatív definit kvadratikus forma mátrixát szolgáltatja. Bizonyítás: Valóban, a Q kvadratikus forma akkor és csakis akkor negatív szemidefinit, ha -Q pozitív szemidefinit, s ha matB(Q)=(aij)n=A, akkor matB(-Q)=(-aij)n=-A. A -Q pozitív szemidefinit kvadratikus formára a 11.26. állítás szerint ekkor det(-A)=(-1)n·det(A)=0 és a -A mátrix egyik lehető legmagasabb rendű el nem tűnő főminorja egy pozitív definit kvadratikus forma mátrixát szolgáltatja. Pontosan ekkor azonban a -(-A)=A mátrix imént említett lehető legmagasabb rendű el nem tűnő főminorja egy negatív definit kvadratikus forma mátrixát szolgáltatja, s ezzel állításunkat igazoltuk. Összefoglalva a 11.21., a 11.22., a 11.26. és a 11.27. állításokat, a valós kvadratikus formák osztályozási tételéhez jutottunk. 11.28. Állítás: (a valós kvadratikus formák alaptétele) Legyen U az ℝ valós számtest feletti n-dimenziós vektortér, Q:U→ℝ az U vektortéren értelmezett kvadratikus forma, A a hozzá tartozó szimmetrikus bilineáris funkcionál és A=(aij)nM(n,ℝ) a Q kvadratikus formának az U egy tetszőleges, de rögzített B bázisra vonatkozó mátrixa. A Q kvadratikus forma akkor és csakis akkor pozitív definit, illetve negatív definit, ha minden 1≤k≤n esetén
a11 Dk det a k1 illetve, ha 110
a1k 0 , a kk
a11 k k (1) Dk (1) a k1
a1k 0 a kk
követelmények teljesülnek. A Q kvadratikus forma akkor és csakis akkor pozitív szemidefinit, illetve negatív szemidefinit, ha det(A)=0 és az A mátrix egyik lehető legmagasabb rendű el nem tűnő főminorja egy pozitív definit, illetve egy negatív definit kvadratikus forma mátrixát szolgáltatja. Végül, ha az így megfogalmazott, összesen négyféle feltétel egyike sem teljesül, akkor és csakis akkor a Q egy indefinit kvadratikus forma. Ha valamely véges dimenziós valós vektortéren adott egy pozitív definit kvadratikus forma, akkor a vektortér egy tetszőleges vektorrendszeréről e kvadratikus forma segítségével egyszerűen eldönthetjük, hogy lineárisan összefüggő-e, vagy sem. Most ezzel a módszerrel ismerkedünk meg. Legyen tehát U a valós számok ℝ teste felett egy n-dimenziós vektortér, Q e vektortéren értelmezett pozitív definit kvadratikus forma és A e formához tartozó szimmetrikus bilineáris funkcionál. Tekintsük az U vektortér egy tetszőleges {f1,...,fk} vektorrendszerét, s képezzük a A(f1 , f1 ) A(f1 , f 2 ) A(f1 , f k ) A(f 2 , f1 ) A(f 2 , f 2 ) A(f 2 , f k ) G (f1 ,..., f k ) : det A(f k , f1 ) A(f k , f 2 ) A(f k , f k ) determinánst, amelyet az {f1,...,fk} vektorrendszer Gram-féle determinánsának nevezünk. 11. 29. Állítás: (Gram tétele) A tetszőleges {f1,...,fk} vektorrendszer Gram-féle determinánsa G(f1,...,fk)≥0, és G(f1,...,fk)=0 akkor és csakis akkor, ha a vektorrendszer lineárisan összefüggő. 111
Bizonyítás: Ha {f1,...,fk} az n-dimenziós U vektortér egy lineárisan független vektorrendszere, akkor a 4.7. állítás miatt k≤n, s ekkor a 4.2. állítás szerint a vektorrendszer kiegészíthető az U vektortér egy B={f1,...,fk, ek+1,...,en} bázisáig. A Q kvadratikus forma B bázisra vonatkozó mátrixa A(f1 , f1 ) A(f1 , f k ) A(f1 , e k 1 ) A(f1 , e n ) A(f , f ) A(f , f ) k 1 k k mat B (Q) A(e k 1 , f1 ) A(e , f ) A ( e , e ) n 1 n n
alakú, amelyben az első k sor és első k oszlop metszésében elhelyezkedő
A(f1 , f1 ) det A(f , f ) k 1
A(f1 , f k ) A(f k , f k )
aldetermináns értéke a 11.21. Jacobi-féle kritérium szerint pozitív, tehát ekkor G(f1,...,fk)>0. Ha pedig {f1,...,fk} az U vektortér egy lineárisan összefüggő vektorrendszere, akkor az a1f1+a2f2+...+akfk=0 lineáris kombinációban legalább egy együttható nem 0. Ekkor az a1·A(fi,f1)+a2·A(fi,f2)+...+ak·A(fi,fk)= =A(fi,a1f1+a2f2+...+akfk)=A(fi,0)=0 (1≤i≤k) összefüggésekből
112
A(f1 , f1 ) A(f1 , f 2 ) A(f 2 , f1 ) A(f 2 , f 2 ) a2 ... a k a1 A(f k , f1 ) A(f k , f 2 )
A(f1 , f k ) 0 A(f 2 , f k ) 0 A(f k , f k ) 0
következik, s mivel az ajℝ (1≤i≤k) együtthatók között legalább egy különbözik 0-tól, ezért a G(f1,...,fk) Gram-féle determináns oszlopai is lineárisan összefüggő vektorrendszert alkotnak, így a 7.4. tulajdonság alapján G(f1,...,fk)=0. Megfordítva, ha G(f1,...,fk)=0, akkor {f1,...,fk} lineárisan összefüggő vektorrendszer, ellenkező esetben ugyanis bizonyításunk első része szerint G(f1,...,fk)>0 adódna. Ha pedig G(f1,...,fk)>0, akkor {f1,...,fk} csak lineárisan független vektorrendszer lehet, különben ismét bizonyításunk első része szerint G(f1,...,fk)=0 következne. Megjegyezzük, hogy imént bizonyított állításunkból nyilvánvalóan következik, hogy az {f1,...,fk} vektorrendszer G(f1,...,fk) Gram-féle determinánsa akkor és csakis akkor pozitív, ha {f1,...,fk} lineárisan független vektorrendszer. A 11.29. állítás k=2 esetéből egy nevezetes egyenlőtlenséget nyerhetünk. 11.30. Állítás: (Cauchy-Schwarz egyenlőtlenség) Ha U az ℝ felett egy n-dimenziós vektortér, Q e vektortéren értelmezett pozitív definit kvadratikus forma és A a hozzá tartozó szimmetrikus bilineáris funkcionál, akkor tetszőleges x,yU esetén érvényes az (A(x,y))2≤Q(x)·Q(y) egyenlőtlenség, amelyben az egyenlőség akkor és csakis akkor áll fenn, ha x és y lineárisan összefüggő vektorok. Bizonyítás: Ha az {x,y} vektorrendszerre alkalmazzuk a 11.29. állítást, akkor
113
A(x, x) det A(y, x)
A(x, y ) A(x, x) A(y, y ) A(x, y ) A(y, x) A(y,.y )
A(x, x) A(y, y ) [ A(x, y )]2 Q(x) Q(y ) [ A(x, y )]2 0
adódik, amelyből egyszerű átrendezéssel
[ A(x, y)]2 Q(x) Q(y) következik. Itt az egyenlőség pontosan akkor teljesül, szintén a 11.29. állítás alapján, ha x és y lineárisan összefüggő vektorok. 11.31. Példa: n
n
n
A rendezett valós szám n-esek ℝ terében az A:ℝ ×ℝ →ℝ, ((x1,...,xn), n
( y1 ,..., y n )) xi yi egy szimmetrikus bilineáris funkcionál, s a hozzá tari 1
tozó n
n
Q:ℝ →ℝ, ( x1 ,..., xn ) → xi 2 i 1
kvadratikus forma pozitív definit. Ekkor a Cauchy-Schwarz egyenlőtlenség alakja 2
n n 2 n 2 xi y i xi y i i 1 i 1 i 1
lesz. 11.32. Példa: Az [a,b]ℝ zárt intervallumon folytonos függvények C[a,b] terében az b
A:C[a,b]×C[a,b]→ℝ, (f,g) → f ( x) g ( x)dx a
egy szimmetrikus bilineáris funkcionál, a hozzá tartozó
114
b
Q:C[a,b]→ℝ, f→ f 2 ( x)dx a
kvadratikus forma pedig pozitív definit. A Cauchy-Schwarz egyenlőtlenség most az 2
b b 2 b 2 f ( x) g ( x)dx f ( x)dx g ( x)dx a a a alakot ölti. Ez utóbbi példában C[a,b] maga nem véges dimenziós vektortér, de az egyenlőtlenség felírásánál elegendő az U≔f,g függvénypár által kifeszített altérre szorítkozni. Feladatok: 1. Redukáljuk négyzetösszegre az alábbi kvadratikus formákat, továbbá határozzuk meg normálalakjukat is! a) Q1(x)=x12+2x1x2+2x22+4x2x3+5x32 , b) Q2(x)=x1x2+x2x3+x3x1 , c) Q3(x)=x12+x1x2+x3x4 . 2. Állapítsuk meg az alábbi valós kvadratikus formák definit, szemidefinit, illetve indefinit voltát! a) Q1(x)=x12+x22-x32 , b) Q2(x)=-x12-x22 , c) Q3(x)=x1·x2+x2·x3+x3·x1 . 3
3. Tekintsük a Q(x)=x12+x22+x32 pozitív definit kvadratikus formát az ℝ vektortérben és legyen A(x,y)=x1y1+x2y2+x3y3 a Q kvadratikus formához tartozó szimmetrikus bilineáris funkcionál. a) Döntsük el, hogy az a≔(1,1,0), b≔(0,-1,1), c≔(0,0,-2) egy A-ortogo3
nális vektorrendszert alkot-e ℝ -ban! 3
b) A Gram-Schmidt eljárás segítségével az ℝ vektortér B={(1,0,0), 3
(1,2,0), (-1,0,3)} bázisából kiindulva konstruáljuk meg az ℝ egy A-ortogonális bázisát! 115
4. A Jacobi kritérium segítségével döntsük el, hogy a Q(x)= =5x12+x22+5x32+4x1x2-8x1x3-4x2x3 valós kvadratikus forma pozitív definit, vagy nem! 3
5. Tekintsük a Q(x)= 2x12+x22+x32 pozitív definit kvadratikus formát az ℝ vektortérben. A Gram-féle determináns, illetve a Q(x) kvadratikus formához tartozó A(x,y) szimmetrikus bilineáris funkcionál segítségével állapítsuk meg, hogy az a 0, 12 , 23 , b 12 , 23 ,0 , c (1,0,1) vektorokból álló vektorrendszer lineárisan független, vagy összefüggő!
116