Lineáris algebra I. Kovács Zoltán El˝oadásvázlat (2006. február 22.)
2
3 Erd˝os Jen˝o emlékének.
4
Tartalomjegyzék 1. A szabadvektorok vektortere 1. Szabadvektorok összeadása és skalárral való szorzása 2. Vektorrendszerek függetlensége, bázis . . . . . . . . 3. Szabadvektorok skaláris szorzata . . . . . . . . . . . 4. Küls˝o szorzás, vegyes szorzás . . . . . . . . . . . . 5. Egyenesek és síkok . . . . . . . . . . . . . . . . . . 6. Térelemek távolsága és szöge . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
7 7 11 14 19 25 27
2. Vektorterek 7. A vektortér definíciója . . . . . . . . 8. Lineáris kombinációk, bázis, dimenzió 9. Alterek direkt összege . . . . . . . . . 10. Lineáris sokaság, faktortér . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
28 28 31 39 41
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
3. Mátrixok, lineáris egyenletrendszerek és determinánsok 11. M˝uveletek mátrixokkal . . . . . . . . . . . . . . . . 12. A Gauss-elimináció, elemi mátrixok . . . . . . . . . 13. Négyzetes mátrixok invertálhatósága . . . . . . . . . 14. Mátrix rangja . . . . . . . . . . . . . . . . . . . . . 15. Lineáris egyenletrendszerek . . . . . . . . . . . . . 16. A determinánsfüggvény tulajdonságai . . . . . . . . 17. Aldeterminánsok, kofaktorok . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
45 45 50 53 55 59 62 66
4. Lineáris leképezések 18. Lineáris leképezések alaptulajdonságai . . . . 19. Lineáris leképezés képtere és magtere . . . . 20. A lineáris leképezések mátrixreprezentációja 21. Báziscsere . . . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
71 71 75 78 79
5
. . . .
. . . .
. . . .
. . . .
6
TARTALOMJEGYZÉK
1. fejezet A szabadvektorok vektortere 1. Szabadvektorok összeadása és skalárral való szorzása Középiskolai tanulmányainkban vektor alatt a tér vagy sík szabadvektorát értettük, azaz egy vektor irányított szakasz volt, de nem téve különbséget az egymásba eltolással átvihet˝o irányított szakaszok között. (Azaz, ha nagyságuk, irányításuk és irányuk megegyezik.) A lineáris algebra tárgyban (mint ahogyan általában a fels˝obb matematikában) a vektor egy olyan absztrakt fogalom, mely sokkal általánosabb, mint a szabadvektor. (Erre a tárgyalásunk második fejezetében térünk vissza.) vektor 6= szabadvektor 6= irányított szakasz A szabadvektorok elmélete tehát a geometriához kapcsolódik, s a szabatos felépítést is a Geometria c. tárgyunkban adjuk meg. A lineáris algebra tárgyban nagymértékben támaszkodunk a középiskolás geometriai ismeretekre, mindenekel˝ott az eltolás tulajdonságaira. El˝oször néhány geometriai jelölést vezetünk be. A tér pontjainak halmazát E jelöli. AB vagy d(A, B)— Az A és B pontok távolsága. AB — A és B végpontokkal rendelkez˝o szakasz. ←−→ AB — A-t és B-t tartalmazó egyenes. −−→ AB — A kezd˝opontú és B-t tartalmazó félegyenes. Megjegyezzük még, hogy ebben a tárgyban az egybees˝o egyeneseket is párhuzamosaknak nevezzük. 1.1. Definíció. Irányított szakaszon egy (P, Q) ∈ E × E rendezett pontpárt értünk. (P, Q)-nak P a kezd˝opontja, Q a végpontja. Ha az (A, B) irányított szakasz a (P, Q) irányított szakaszba eltolással átvihet˝o, akkor azt mondjuk, hogy (A, B) ekvivalens (P, Q)-val és ezt úgy jelöljük, hogy (A, B) ∼ (P, Q). Az (A, B) irányított szakasz szemléltetése: 1.1. ábra. 1.2. Tétel. Az irányított szakaszok ekvivalenciája ekvivalenciareláció, azaz: 1. (A, B) ∼ (A, B), 2. (A, B) ∼ (C, D) =⇒ (C, D) ∼ (A, B), 3. (A, B) ∼ (C, D) ∧ (C, D) ∼ (E, F ) =⇒ (A, B) ∼ (E, F ); 7
8
A SZABADVEKTOROK VEKTORTERE
B (A, B) ∈ E × E
A
1.1. ábra. Az irányított szakasz szemléltetése.
továbbá teljesül, hogy 4. (A, B) ∼ (P, Q) =⇒ (A, P ) ∼ (B, Q).
Bizonyítás: Az els˝o három tulajdonság a definíció nyilvánvaló következménye. A 4. állítás onnan következik, hogy ha (A, B) ∼ (P, Q), akkor AP QB paralelogramma (esetleg elfajuló), melynek szemközti oldalpárjai párhuzamosak és egybevágók. Q B
P A
1.2. ábra. (A, B) ∼ (P, Q) =⇒ (A, P ) ∼ (B, Q).
1.3. Definíció. Definiáljuk a tér irányított szakaszainak halmazán az alábbi, ∼-el jelölt relációt. (A, B) ∼ (P, Q), ha (A, B) (P, Q)-ba eltolással átvihet˝o. Ez a reláció ekvivalenciareláció, mely ekvivalenciaosztályait szabadvektoroknak nevezzük. Azaz, ha A és B pontok, akkor az (A, B) reprezentánsú szabadvektor: −* AB = { (P, Q) ∈ E × E | (A, B) ∼ (P, Q) } . Az összes szabadvektorok halmazát V-vel jelöljük. −* −* Az AB szabadvektor kABk hosszán AB-t értjük. Ez a definíció független a reprezentáns választásától. Az összes olyan irányított szakaszok, melyek kezd˝o- és végpontja megegyezik, egy szabadvektort reprezentálnak. Ezt a szabadvektort nullvektornak nevezzük. Jele: 0. ∗ V elemeinek jelölésekor olykor nem utalunk reprezentánsra, ilyenkor V elemeit félkövér kisbet˝ukkel, írásban pedig aláhúzott kisbet˝ukkel is jelöljük: a ∈ V, a ∈ V.
SZABADVEKTOROK ÖSSZEADÁSA ÉS SKALÁRRAL VALÓ SZORZÁSA
9
1.4. Definíció. Az (A, B)-vel reprezentált a illetve a (B, C)-vel reprezentált b szabadvektor a + b összegén az (A, C)-vel reprezentált szabadvektort értjük. Azaz −* −* −* AB + BC = AC. A szabadvektorok összegét definiáló el˝obbi összefüggést háromszögszabálynak is nevezik. 1.5. Tétel. A szabadvektorok összege független a reprezentánsok választásától.
Bizonyítás: Ld. 1.3. ábra. Azt kell tehát bizonyítani, hogy ha (A, B) ∼ (A0 , B 0 ) és (B, C) ∼ (B 0 , C 0 ), akkor (A, C) ∼ (A0 , C 0 ). A ∼ reláció 3. és 4. tulajdonságát használjuk ki (megel˝oz˝o tétel): (A, B) ∼ (A0 , B 0 ) =⇒ (A, A0 ) ∼ (B, B 0 ); (B, C) ∼ (B 0 , C 0 ) =⇒ (B, B 0 ) ∼ (C, C 0 ). (A, A0 ) ∼ (B, B 0 ) ∧ (B, B 0 ) ∼ (C, C 0 ) =⇒ (A, A0 ) ∼ (C, C 0 ) =⇒ (A, C) ∼ (A0 , C 0 ). C0 C
B0 B
A0
A
1.3. ábra. A szabadvektorok összege független a reprezentánsok választásától.
1.6. Tétel. ka + bk ≤ kak + kbk. ka + bk = kak + kbk akkor és csakis akkor teljesül, ha a és b olyan szabadvektorok, hogy közös kezd˝opontból induló reprezentánsaik végpontjai a közös kezd˝opontból induló ugyanazon félegyenesre illeszkednek. Ha a és b közös kezd˝opontból induló reprezentánsaik végpontjai a ¯közös kezd˝opontból induló ellentétes félegyenesekre illeszkednek, ¯ ¯ akkor ka + bk = kak − kbk¯.
Bizonyítás: Az állítás a háromszög-egyenl˝otlenség és az összeadás definíciójának közvetlen következménye. 1.7. Definíció. Az (A, B) reprezentánsú szabadvektor λ valós számmal (skalárral) való szorzatán nullvektort értünk, ha λ = 0 vagy A = B, míg ha λ 6= 0, akkor azt az (A, B 0 ) reprezentánsú −−→ ←−→ −−→ szabadvektort, amelyre AB 0 = |λ| · AB és B 0 ∈ AB , ha λ > 0 illetve B 0 ∈ AB \ AB , ha λ < 0.
Megjegyzés. Egyszer˝uen látható, hogy a definíció független a reprezentáns választásától. Egy (A, B) reprezentánsú v szabadvektor és λ ∈ R skalár szorzatát a következ˝oképpen is megkaphatjuk. Legyen δλ : E → E, X 7→ X 0 tetsz˝oleges centrumú, λ el˝ojeles arányú középpontos hasonlóság. Ekkor λv-t (A0 , B 0 ) reprezentálja. (1.4. ábra.)
10
A SZABADVEKTOROK VEKTORTERE
λ>0
A
B
λ<0
B0
B0
A
B
1.4. ábra. Szabadvektor szorzása skalárral.
A definíció közvetlen következménye az alábbi állítás: 1.8. Tétel. kλak = |λ| · kak. Ha egy nemzéró szabadvektort osztunk a hosszával (azaz szorozzuk a hossza reciprokával), akkor az így kapott szabadvektor hossza 1. (Az 1 hosszúságú szabadvektorokat egységvektoroknak nevezzük, jelölésük gyakran: v0 .) 1.9. Tétel. A szabadvektorok összeadása és skalárral való szorzása rendelkezik az alábbi tulajdonságokkal: (V, +) kommutatív csoport (Abel-csoport), továbbá ∀a, b ∈ V, ∀λ, µ ∈ R : (1)
λ(a + b) = λa + λb,
(2)
(λ + µ)a = λa + µa,
(3)
(λµ)a = λ(µa),
(4)
1a = a.
Bizonyítás: Az összeadás tulajdonságait közvetlen geometriai módszerekkel is beláthatjuk (megtalálható pl. a Hajós könyvben: 30.2, 30.3.) A skalárral való szorzás tulajdonságai: λ(a + b) = λa + λb: Egy tetsz˝olegesen rögzített centrumú λ el˝ojeles arányú középpontos hasonlóságnál az X pont képét jelölje X 0 . Tekintsük a szabadvektorok egy-egy tetsz˝oleges reprezentánsát: (A, B) ∈ a, (B, C) ∈ b. Ekkor −* −* −* −−* −−* −−* −* −* λ(a + b) = λ(AB + BC) = λAC = A0 C 0 = A0 B 0 + B 0 C 0 = λAB + λBC = λa + λb. (λ+µ)a = λa+µa: Nullvektorra az állítás triviális. Legyen a továbbiakban a 6= 0! Ha λ és µ azonos el˝ojel˝uek, akkor (λ+µ)a, továbbá λa+µa közös kezd˝opontb˝ol induló reprezentánsainak végpontjai ugyanarra a félegyenesre illeszkednek. Továbbá k(λ + µ)ak = |λ + µ| · kak = (|λ| + |µ|) · kak. Másrészt 1.6. alapján: kλa + µak = kλak + kµak = |λ| · kak + |µ| · kak = (|λ| + |µ|) · kak. Ez azt jelenti, hogy (λ + µ)a továbbá λa + µa közös kezd˝opontb˝ol induló reprezentánsainak végpontjai ugyanazon a félegyenesen, a kezd˝oponttól ugyanakkora távolságra vannak.
VEKTORRENDSZEREK FÜGGETLENSÉGE, BÁZIS
11
Legyen λ és µ el˝ojele különböz˝o. Ismét 1.6.-ra hivatkozva: kλa + µak = ¯ ¯ ¯ ¯ ¯ ¯ ¯kλak − kµak¯ = ¯|λ| · kak − |µ| · kak¯ = ¯|λ| − |µ|¯ · kak = |λ + µ| · kak = k(λ + µ)ak, −* tehát (λ + µ)a hossza és λa + µa hossza megegyezik. Legyen λa = OA, és reprezentáljuk az ←−→ (λ+µ)a, λa+µa szabadvektorokat az OA egyenesen! Mindkét szabadvektor reprezentánsának −−→ −−→ végpontja attól függ˝oen illeszkedik OA -ra vagy OA ellentétes félegyenesére, hogy |λ| ≥ |µ| vagy |λ| ≤ |µ|, amivel az állítást bizonyítottuk. −* (λµ)a = λ(µa): Legyen a = OA! λ(µa) végpontjának meghatározásához A-ra el˝obb egy O centrumú, µ el˝ojeles arányú középpontos hasonlóságot, majd egy O centrumú, λ el˝ojeles arányú középpontos hasonlóságot kell alkalmaznunk. Ez ugyanazt jelenti, mintha A-ra egy O centrumú, λ · µ arányú középpontos hasonlóságot hajtanánk végre, mert közös centrumú λ ill. µ el˝ojeles arányú középpontos hasonlóságok szorzata ugyanolyan centrumú, λ · µ el˝ojeles arányú középpontos hasonlóság. 1a = a triviális. A továbbiakban a + (−b)-t (ahol −b = (−1) · b a b additív inverze) a − b-nek írjuk.
2. Vektorrendszerek függetlensége, bázis 2.1. Definíció. Szabadvektorok egy (a1 , . . . , ak ) vektorrendszerének az (α1 , . . . , αk ) skalárokkal való lineáris kombinációján az α1 a1 + . . . + αk ak szabadvektort értjük. Az (a1 , . . . , ak ) vektorrendszert lineárisan függetlennek nevezzük, ha a tér bármely vektora legfeljebb egyféleképpen állítható el˝o lineáris kombinációjukként. Szabadvektorok egy véges vektorrendszerét lineárisan függ˝onek nevezzük, ha nem lineárisan független. 2.2. Tétel. Szabadvektorok egy véges rendszere akkor és csakis akkor lineárisan független, ha a zérusvektor csak triviálisan, azaz csak csupa nulla együtthatóval kombinálható bel˝olük. Szabadvektorok egy véges rendszere akkor és csakis akkor lineárisan függ˝o, ha a zérusvektor triviálistól különböz˝o módon is kombinálható bel˝olük.
Bizonyítás: Ha a vektorrendszer lineárisan független, akkor bármely szabadvektor, s így a zérusvektor is legfeljebb egyféleképpen kombinálható bel˝olük. Mivel a triviális kombináció mindig zérusvektort ad, így ez az egyetlen olyan lineáris kombináció, melynek eredménye a zérusvektor. Megfordítva, tegyük fel, hogy az (a1 , . . . , ak ) vektorrendszerb˝ol a zérusvektor csak triviálisan kombinálható. Ha a tér valamely szabadvektorára v = α1 a1 + · · · + αk ak
12
A SZABADVEKTOROK VEKTORTERE
v = β1 a1 + · · · + βk ak egyaránt teljesül, akkor a két relációt kivonva: 0 = (α1 − β1 )a1 + · · · + (αk − βk )ak . Innen a feltételünk miatt αi = βi (i = 1, . . . , k) következik. A másik állítás az el˝oz˝onek tisztán logikai következménye (kontrapozíció). Szabadvektorok lineáris függ˝oségének szép geometriai jelentése van: 2.3. Következmény. Szabadvektorok egy (a1 , . . . , ak ) legalább kéttagú vektorrendszere akkor és csakis akkor lineárisan függ˝o, ha van olyan valódi (azaz nem csak egyetlen pontból álló), de esetleg degenerált oldalt is tartalmazó zárt töröttvonal, amelynek szakaszai rendre az a1 , . . . , ak reprezentánsait tartalmazó egyeneseken vannak. 2.4. Tétel. Szabadvektorok egy véges rendszere akkor és csakis akkor lineárisan függ˝o, ha valamelyikük lineárisan kombinálható a többib˝ol.
Bizonyítás: El˝oször tegyük fel, hogy az (a1 , . . . , ak ) vektorrendszer valamelyik vektora lineárisan kombinálható a többib˝ol! (Az egyszer˝uség kedvéért legyen ez ak !) ak = α1 a1 + · · · + αk−1 ak−1 . Ezt rendezve: 0 = −ak + α1 a1 + · · · + αk−1 ak−1 . A jobb oldalon a zérusvektor olyan lineáris kombinációja van, melyben szerepel −1 mint együttható, azaz ez a lineáris kombináció triviálistól különböz˝o. Másodjára tegyük fel, hogy az el˝obbi vektorrendszer lineárisan függ˝o, azaz a zérusvektor triviálistól különböz˝oen is kombinálható bel˝olük: 0 = α1 a1 + · · · + αk ak , miközben az együtthatók között van zérustól különböz˝o. Legyen ez a zérustól különböz˝o együttható pl. αk . Ez azt jelenti, hogy ak kifejezhet˝o a többi szabadvektor segítségével: ak = −
αk−1 α1 a1 − · · · − ak−1 . αk αk
2.5. Tétel. (A lineáris függ˝oség geometriai jelentése.) Egy szabadvektor önmagában akkor és csakis akkor alkot lineárisan függ˝o rendszert, ha nullvektor. Két szabadvektor akkor és csakis akkor alkot lineárisan függ˝o rendszert, ha egy egyenesen reprezentálhatók. Három szabadvektor akkor és csakis akkor alkot lineárisan függ˝o rendszert, ha egy síkon reprezentálhatók. A szabadvektorok bármely legalább négytagú vektorrendszere lineárisan függ˝o.
VEKTORRENDSZEREK FÜGGETLENSÉGE, BÁZIS
13
Bizonyítás: A zéróvektort tetsz˝oleges számmal szorozva zéróvektort kapunk, tehát az egyetlen zéróvektorból álló vektorrendszer lineárisan függ˝o. Legyen αa = 0, de α 6= 0. Ekkor |α| · kak = 0, ami csak úgy lehet, ha a = 0. A továbbiakban tegyük fel, hogy a megadott vektorrendszerben nincs lineárisan függ˝o részrendszer. (Ha van, akkor az állítások triviálisak.) Ha két vektor közös egyenesen reprezentálható, akkor ezen egyenes P 6= Q pontjaira P QP nyilván megfelel˝o töröttvonal. Megfordítva, legyen a kéttagú vektorrendszer lineárisan függ˝o. A kétoldalú nem elfajuló töröttvonal két csúcspontot tartalmaz. Az ezekre illeszked˝o egyenesen mindkét szabadvektor reprezentálható. Legyen három vektor közös síkban reprezentálható! Ebben a síkban jelöljük ki az egyik szabadvektor reprezentánsát: (P, Q). P -n keresztül húzzunk párhuzamost a második, míg Qn keresztül a harmadik szabadvektorral. Mivel feltettük, hogy az utóbbi két vektor lineárisan független, ezért a két egyenes metszi egymást egy M (síkbeli) pontban. P QM P a keresett töröttvonal. A megfordítás onnan következik, hogy háromoldalú zárt töröttvonalnak három csúcsa van, melyekre illeszked˝o síkban mindhárom vektor reprezentálható. Legyen (a, b, c, d) szabadvektorok négytagú vektorrendszere. S1 legyen olyan sík, melyben
S2 N
Q P
M
S1
1.5. ábra. Nincs négy lineárisan független szabadvektor. (a, b), míg S2 olyan sík, melyben (c, d) reprezentálhatók (1.5. ábra). A két sík metszésvonalán jelöljük ki a P 6= Q pontokat. P -n keresztül húzzunk párhuzamost a-val (a egyenes), Q-n keresztül b-vel (b egyenes). a ∩ b = M ∈ S1 . Q-n keresztül húzzunk párhuzamost c-vel (c egyenes), P -n keresztül d-vel (d egyenes.) c ∩ d = N ∈ S2 . P M QN P a keresett töröttvonal. 2.6. Tétel. Bármely három lineárisan független szabadvektorból álló vektorrendszerb˝ol a tér tetsz˝oleges vektora egyértelm˝uen kombinálható. Ha adott két lineárisan független szabadvektor, akkor ezekb˝ol mindazon vektorok egyértelm˝uen lineárisan kombinálhatók, melyek velük egy síkban reprezentálhatók.
14
A SZABADVEKTOROK VEKTORTERE
Bizonyítás: A lineáris függetlenség miatt a tér bármely szabadvektora legfeljebb egyféleképpen kombinálható 3 lineárisan független szabadvektorból. Azt kell belátnunk, hogy legalább egyféleképpen is. Legyen (i, j, k) a tér 3 lineárisan független szabadvektora, v pedig a tér tetsz˝oleges vektora. Ekkor (i, j, k, v) lineárisan függ˝o rendszer az el˝oz˝o tétel miatt, tehát bel˝olük a zérusvektor triviálistól különböz˝oen is kombinálható: α1 i + α2 j + α3 k + βv = 0. A β együttható biztosan zérótól különböz˝o, ellenkez˝o esetben ugyanis az (i, j, k) vektorrendszerb˝ol a zérusvektor triviálistól különböz˝oen is kombinálható lenne. Ha β 6= 0, akkor v kifejezhet˝o az (i, j, k) lineáris kombinációjaként: v=−
α1 α2 α3 i − j − k. β β β
A második állítást analóg módon bizonyítjuk. 2.7. Definíció. A térben szabadvektorok háromtagú lineárisan független rendszerét bázisnak nevezzük. Legyen (i, j, k) egy bázis. Egy v szabadvektornak erre a bázisra vonatkozó koordinátáin azt az egyértelm˝u (v1 , v2 , v3 ) számhármast értjük, melyre v1 i + v2 j + v3 k = v. 2.8. Tétel. (M˝uveletek és koordináták kapcsolata.) Legyen (i, j, k) bázis a szabadvektorok terében, x és y két tetsz˝oleges vektor, melyek koordinátái az el˝oz˝o bázisra vonatkozóan (x1 , x2 , x3 ) és (y1 , y2 , y3 ). Legyen α ∈ R tetsz˝oleges skalár! Ekkor x+y koordinátái (x1 +y1 , x2 +y2 , x3 +y3 ); αx koordinátái pedig (αx1 , αx2 , αx3 ).
Bizonyítás: x + y = (x1 i + x2 j + x3 k) + (y1 i + y2 j + y3 k) = = (x1 + y1 )i + (x2 + y2 )j + (x3 + y3 )k. Továbbá: αx = α(x1 i + x2 j + x3 k) = = αx1 i + αx2 j + αx3 k.
3. Szabadvektorok skaláris szorzata A középiskolából is ismert skaláris szorzat bevezetéséhez és tanulmányozásához szükségünk lesz a mer˝oleges vetítés fogalmára, s mindenekel˝ott a vektorok szögének definiálására.
SZABADVEKTOROK SKALÁRIS SZORZATA
15
3.1. Definíció. Az a és b vektorok közös kezd˝opontból induló reprezentánsai legyenek (O, A) és (O, B). Az a és b szögén derékszöget értünk, ha a vektorok valamelyike nullvektor, egyébként az AOB^ szöget, mely szög független a reprezentánsok választásától. Két vektort mer˝olegesnek mondunk, ha szögük derékszög. Egy vektort mer˝olegesnek mondunk egy síkra, ha van a síkra mer˝oleges reprezentánsa. 3.2. Tétel. (Szabadvektor felbontása adott szabadvektorral párhuzamos és arra mer˝oleges komponensekre.) Legyen e 6= 0 tetsz˝olegesen rögzített szabadvektor. A tér bármely x vektorához egyértelm˝uen léteznek olyan xk -vel és x⊥ -el jelölt vektorok, hogy x = xk + x⊥ , ahol xk ke és x⊥ ⊥ e. Az xk vektort az x vektor e vektorral párhuzamos összetev˝ojének, míg az x⊥ vektort az x vektor e vektorra mer˝oleges összetev˝ojének mondjuk. xk -re használjuk még az x vektor e-re vonatkozó mer˝oleges vetülete elnevezést is.
Bizonyítás: Feltehetjük, hogy x 6= 0. A felbontás létezését egyszer˝u geometriai úton könnyen ←−→ bizonyíthatjuk. Legyen (O, P ) ∈ x, (O, E) ∈ e, S legyen az O pontra illeszked˝o, s OE -re ←−→ mer˝oleges sík, P 0 a P mer˝oleges vetülete S-re, P 00 pedig OE -re: ld. 1.6. ábra. E P 00
O
P
P0
1.6. ábra. Szabadvektor felbontása adott szabadvektorral párhuzamos és arra mer˝oleges komponensekre. −−* −−* −−* −−* x = OP 0 + P 0 P = OP 0 + OP 00 −−* −−* nyilván megfelel˝o felbontás, tehát xk = OP 00 , x⊥ = OP 0 . A felbontás egyértelm˝usége. Tegyük fel, hogy x = x1 + y1 = x2 + y2
x1 , x2 ke,
y1 , y2 ⊥ e.
Ekkor: x1 − x2 = y2 − y1 . Mivel a bal oldalon e-vel párhuzamos, ugyanakkor a jobb oldalon arra mer˝oleges vektor áll, ezért mindkét oldal nullvektor, ahonnan következik az állítás.
16
A SZABADVEKTOROK VEKTORTERE
3.3. Definíció. Legyen e 6= 0, az x ∈ V vektor e-vel párhuzamos összetev˝oje xk . Legyen πe (x) az a szám, melyre xk = πe (x) · e0 . A πe (x) számot az x vektor e-re vonatkozó mer˝oleges vetülete el˝ojeles hosszának nevezzük. 3.4. Tétel. πe (x) = kxk · cos ϕ, ahol ϕ az x és e szöge.
Bizonyítás: A 1.7 ábra alapján könnyen látható.
E
x00
E
x
x00
x
1.7. ábra. 3.5. Tétel. Legyen e 6= 0. A πe : V → R leképezés additív és homogén, azaz ∀x, y ∈ V: πe (x + y) = πe (x) + πe (y); továbbá πe (αx) = α · πe (x).
Bizonyítás: Az additivitás: x = πe (x) · e0 + x⊥ y = πe (y) · e0 + y⊥ . Adjuk össze a két sort: x + y = (πe (x) + πe (y)) e0 + (x⊥ + y⊥ ). Mivel x⊥ ⊥ e és y⊥ ⊥ e, ezért x⊥ és y⊥ ugyanabban az e-re mer˝oleges síkban reprezentálhatók, tehát ezek összege is ebben a síkban reprezentálható. Megállapíthatjuk tehát, hogy (πe (x) + πe (y)) e0 ke, míg (x⊥ + y⊥ ) ⊥ e, tehát az x + y vektort az e-vel párhuzamos és arra mer˝oleges összetev˝ore bontottuk. Azaz πe (x + y) = πe (x) + πe (y).
SZABADVEKTOROK SKALÁRIS SZORZATA
17
A homogenitás: x = πe (x) · e0 + x⊥ . Szorozzuk mindkét oldalt α-val: αx = απe (x) · e0 + αx⊥ . Itt απe (x) · e0 ke, továbbá αx⊥ ⊥ e, azaz az αx vektort e-vel párhuzamos, s arra mer˝oleges összetev˝ok összegére bontottuk. Tehát πe (αx) = απe (x). 3.6. Definíció. Az a és b szabadvektorok bels˝o szorzatán vagy skaláris szorzatán azt az a · b-vel jelölt számot értjük, amely egyenl˝o a és b hosszának és a két vektor által bezárt szög cosinusának a szorzatával. Vektorok skaláris szorzatának jelölésére használatos még az ab (pont nélkül), ha, bi, illetve az (a, b) jelölés is. A definíció közvetlen következménye az alábbi tétel: 3.7. Tétel. ∀v ∈ V: kvk2 = vv. Az a 6= 0 és b 6= 0 szabadvektorok által bezárt ϕ szögre ab fennáll, hogy cos ϕ = , továbbá fennáll az ún. Cauchy-Schwarz egyenl˝otlenség: kakkbk |ab| ≤ kakkbk, ahol egyenl˝oség akkor és csakis akkor teljesül, ha a és b lineárisan függ˝ok. Két vektor akkor és csakis akkor mer˝oleges egymásra, ha skaláris szorzatuk zérus. 3.8. Tétel. ab = πb (a) · kbk. Ha e egységvektor, akkor ae = πe (a).
Bizonyítás: Következik 3.4.-b˝ol. 3.9. Tétel. Vektorok bels˝o szorzása – azaz a V × V → R, (a, b) 7→ ab bels˝oszorzat függvény – rendelkezik az alábbi tulajdonságokkal. Minden a, b, c vektor és λ szám esetén (1) Szimmetrikus: ab = ba (2) Mindkét változóban additív: (a + b)c = ac + bc, a(b + c) = ab + ac (3) Mindkét változóban homogén: (λa)b = λ(ab), a(λb) = λ(ab)
18
A SZABADVEKTOROK VEKTORTERE
(4) Pozitív definit: aa ≥ 0, aa = 0 ⇐⇒ a = 0.
Bizonyítás: (1): Az a és b vektorok ϕ szöge a definíció szerint nyilván ugyanaz, mint a b és a vektorok szöge. ab = kak · kbk · cos ϕ = kbk · kak · cos ϕ = ba. (2): Az (1) miatt elegend˝o az egyik oldali, mondjuk a baloldali additivitást belátni. (a + b)c = πc (a + b) · kck = (πc (a) + πc (b)) · kck = πc a · kck + πc (b) · kck = ac + bc. (3): Elegend˝o csak az egyik oldali homogenitást ellen˝orizni. (λa)b = πb (λa)kbk = λπb (a)kbk = λ · ab. (4) következik 3.7.-b˝ol. 3.10. Definíció. A szabadvektorok vektorterében egy bázist ortonormáltnak mondunk, ha egymásra mer˝oleges egységvektorok alkotják. 3.11. Tétel. Létezik ortonormált bázis.
Bizonyítás: Legyen (i, j) két egymásra mer˝oleges egységvektor. Reprezentáljuk ezt a két vektort egy síkban, s tekintsünk egy olyan egységvektort, mely erre a síkra mer˝oleges egyenesen reprezentálható. (Geometriailag látható, hogy két ilyen vektor van; ezek közül kell az egyiket kiválasztani.) Jelölje ezt a vektort k! (i, j, k) egymásra mer˝oleges egységvektorokból álló bázis. Az ortonormáltság definíciójából látható, hogy ii = 1, ij = 0, jj = 1, jk = 0, kk = 1, ik = 0. 3.12. Tétel. Egy i, j, k ortonormált bázist alapulvéve az a = α1 i + α2 j + α3 k és az a0 = α10 i + α20 j + α30 k vektorok bels˝o szorzata aa0 = α1 α10 + α2 α20 + α3 α30 .
Bizonyítás: Alkalmazzuk a bels˝o szorzás m˝uveleti tulajdonságait, valamint az el˝obbi megjegyzést: aa0 = (α1 i + α2 j + α3 k)(α10 i + α20 j + α30 k) = α1 α10 ii + α1 α20 ij + α1 α30 ik+ + α2 α10 ji + α2 α20 jj + α2 α30 jk+ + α3 α10 ki + α3 α20 kj + α3 α30 kk = = α1 α10 + α2 α20 + α3 α30
2
KÜLSO˝ SZORZÁS, VEGYES SZORZÁS
19
3.13. Tétel. Ha (i, j, k) ortonormált bázis a szabadvektorok vektorterében, akkor tetsz˝oleges v ∈ V vektor egyértelm˝uen el˝oállítható a következ˝o alakban: v = (vi)i + (vj)j + (vk)k.
Bizonyítás: Jelölje v koordinátáit az (i, j, k) ortonormált bázisra v1 , v2 , v3 , azaz v = v1 i + v2 j + v3 k. Szorozzuk az el˝obbi egyenl˝oség mindkét oldalát skalárisan i-vel: vi = v1 · ii + v2 · ji + v3 · ki = = v1 . Hasonlóan kapjuk a második és harmadik koordinátát.
4. Küls˝o szorzás, vegyes szorzás A skaláris szorzás két szabadvektorhoz számot rendel. Egy másik szorzástípus két szabadvektorhoz szabadvektort rendel, ez az ún. vektoriális, vagy küls˝o szorzás. Ennek el˝oször szemléletes fogalmát adjuk meg, mely egy fizikai szabályra, a jobbkéz-szabályra támaszkodik. A továbbiakban tisztázzuk majd a vektoriális szorzás olyan bevezetését is, mely fizikai fogalmakra nem támaszkodik. Bevezetünk még egy harmadik szorzást, az ún. vegyes szorzást, ez három vektorhoz rendel számot. 4.1. Definíció. (A vektoriális szorzás szemléletes fogalma.) V-ben adott küls˝o szorzáson, vagy vektoriális szorzáson egy olyan × : V × V → V, (a, b) 7→ a × b m˝uveletet értünk, mely eleget tesz az alábbi tulajdonságoknak: 1. Ha a tényez˝ok lineárisan függ˝ok, akkor a szorzat értéke nullvektor. Egyébként: 2. Az a × b szorzat mindkét tényez˝ojére mer˝oleges. 3. ka × bk megegyezik a és b egy pontból induló reprezentánsai által kifeszített paralelogramma területével: ka × bk = kak · kbk · sin ^(a, b). 4. Jobbkéz-szabály: (a, b, a × b) egy pontból induló reprezentánsai úgy következnek, mint a jobb kéz hüvelyk, mutató, középs˝o ujjai. (Miközben a középs˝o ujj a tenyérre mer˝olegesen áll.) A harmadik tulajdonság egyszer˝uen átfogalmazható a következ˝oképpen: 4.2. Tétel. (Lagrange-azonosság.) ka × bk2 = kak2 kbk2 − (ab)2 .
Bizonyítás: kak2 kbk2 − (ab)2 = kak2 kbk2 − kak2 kbk2 · cos2 ^(a, b) = = (kak · kbk · sin ^(ab))2 = (ka × bk)2 .
20
A SZABADVEKTOROK VEKTORTERE
Másod- és harmadrendu˝ determinánsok Miel˝ott rátérünk a vektoriális szorzás olyan bevezetésére, mely a jobbkéz-szabályt nem használja, szükségünk lesz néhány algebrai jelleg˝u segédeszközre. 4.3. Definíció. Legyenek a, b, c, d ∈ R. 2 × 2-es determinánson a ¯ ¯ ¯a b ¯ ¯ ¯ ¯ c d¯ = a · d − b · c számot értjük. Legyenek a1 , a2 , a3 , b1 , b2 , b3 , c1 , c2 , c3 ∈ R. 3 × 3-as determinánson a ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯a1 a2 a3 ¯ ¯b1 b3 ¯ ¯b1 b2 ¯ ¯b2 b3 ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ b1 b2 b3 ¯ = a1 · ¯ ¯ ¯c2 c3 ¯ − a2 · ¯c1 c3 ¯ + a3 · ¯c1 c2 ¯ ¯ ¯ c1 c2 c3 ¯ számot értjük. 4.4. Definíció. Legyen rögzítve V-ben egy B = (i, j, k) ortonormált bázis. A B-re vonatkozó vektoriális szorzaton a V × V → V, ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ i j k¯ ¯a a ¯ ¯a a ¯ ¯a a ¯ ¯ jel. jel. ¯ (a, b) 7→ = a × b = ¯¯ 2 3 ¯¯ · i − ¯¯ 1 3 ¯¯ · j + ¯¯ 1 2 ¯¯ · k = ¯¯a1 a2 a3 ¯¯ b2 b3 b1 b3 b1 b2 ¯ b1 b2 b3 ¯ leképezést értjük, ahol a = a1 i + a2 j + a3 k és b = b1 i + b2 j + b3 k. A B-re vonatkozó vegyes szorzaton a V × V × V → R, jel.
(a, b, c) 7→ = |a, b, c| = (a × b, c) leképezést értjük. ∗ Hangsúlyozzuk, hogy a bevezetett két szorzás definíciója pillanatnyilag függ a rögzített ortonormált bázistól. Kés˝obb belátjuk, hogy valójában csak az el˝ojel függ a bázistól, azaz mindkét szorzás el˝ojelt˝ol eltekintve egyértelm˝u. El˝oször azt látjuk be, hogy a definiált vektoriális szorzás a jobbkéz-szabálytól eltekintve visszaadja a vektoriális szorzás szemléletes fogalmát. 4.5. Tétel. 1. a · (a × b) = b · (a × b) = 0, azaz a × b mer˝oleges mind a-ra, mind b-re. 2. Teljesül a Lagrange-azonosság: ka × bk2 = kak2 kbk2 − (ab)2 .
Bizonyítás: A definíció szerint ki kell számolni. 4.6. Tétel. a × b = 0 ⇐⇒ a és b lineárisan függ˝ok.
KÜLSO˝ SZORZÁS, VEGYES SZORZÁS
21
Bizonyítás: Az állítás nyilván igaz, ha a vagy b valamelyike zérusvektor. Egyébként: a × b = 0 ⇐⇒ ka × bk = 0 ⇐⇒ kak2 · kbk2 = (ab)2 , használva a Lagrange-azonosságot. Ez utóbbi reláció csak akkor állhat fönn, ha cos2 ^(a, b) = 1 ⇐⇒ ^(a, b) = 0 ∨ ^(a, b) = π. 4.7. Tétel. A szabadvektorok vektoriális szorzása rendelkezik az alábbi tulajdonságokkal: ∀a, b, c ∈ V vektorokra és α ∈ R skalárra: (1) Ferdén szimmetrikus: a × b = −b × a, (2) Mindkét változójában lineáris: (a + b) × c = a × c + b × c, (αa) × b = α(a × b), a × (b + c) = a × b + a × c, a × (αb) = α(a × b).
Bizonyítás: Legyen a = a1 i + a2 j + a3 k, b = b1 i + b2 j + b3 k, c = c1 i + c2 j + c3 k. Az els˝o tulajdonság bizonyításához használjuk ki a 2 × 2-es determináns alábbi, könnyen ellen˝orizhet˝o tulajdonságát: ¯ ¯ ¯ ¯ ¯a b ¯ ¯ ¯ ¯ ¯ = − ¯ c d¯ . ¯ c d¯ ¯a b ¯ Tehát: ¯ ¯ ¯ ¯ ¯ ¯ ¯ b2 b3 ¯ ¯ b1 b3 ¯ ¯ b1 b2 ¯ ¯i − ¯ ¯ ¯ ¯ b × a = ¯¯ ¯a1 a3 ¯ j + ¯a1 a2 ¯ k = a2 a3 ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯a2 a3 ¯ ¯a1 a3 ¯ ¯a1 a2 ¯ ¯ ¯ ¯ ¯ ¯ ¯ k = −a × b. = −¯ i+¯ j−¯ b2 b3 ¯ b1 b3 ¯ b1 b2 ¯ A linearitást szintén egyszer˝u determinánstulajdonságok alapján látjuk be: ¯ ¯ ¯ ¯ ¯ ¯ ¯ a b ¯¯ ¯¯a b ¯¯ ¯¯a b ¯¯ ¯ ¯c + e d + f ¯ = ¯ c d ¯ + ¯ e f ¯ ; ¯ ¯ ¯ ¯ ¯ ¯ ¯αa αb¯ ¯ a b ¯ ¯a b ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ c d ¯ = ¯αc αd¯ = α ¯ c d¯ . Például az additivitás a második változóban: ¯ ¯ ¯ ¯ ¯ ¯ ¯ a2 ¯ a1 ¯ a1 a3 ¯¯ a3 ¯¯ a2 ¯¯ ¯ ¯ ¯ a × (b + c) = ¯ i−¯ j+¯ k= b2 + c2 b3 + c3 ¯ b1 + c1 b3 + c3 ¯ b1 + c1 b2 + c2 ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯a2 a3 ¯ ¯a1 a3 ¯ ¯a1 a2 ¯ ¯ ¯ ¯ ¯ ¯ ¯ k+ =¯ i−¯ j+¯ b2 b3 ¯ b1 b3 ¯ b1 b2 ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯a2 a3 ¯ ¯a1 a3 ¯ ¯a1 a2 ¯ ¯i − ¯ ¯ ¯ ¯ + ¯¯ ¯ c1 c3 ¯ j + ¯ c1 c2 ¯ k = c2 c3 ¯
illetve:
= a × b + a × c.
22
A SZABADVEKTOROK VEKTORTERE
4.8. Tétel. Vonatkozzon a vektoriális szorzás az (i, j, k) ortonormált bázisra. Ekkor: i × j = k,
j × k = i,
k × i = j.
Bizonyítás: Egyszer˝u számolás. 4.9. Tétel. Vonatkozzon a vegyes szorzás az (i, j, k) ortonormált bázisra. Legyen a = a1 i + a2 j + a3 k b = b1 i + b2 j + b3 k c = c1 i + c2 j + c3 k. ¯ ¯ ¯a1 a2 a3 ¯ ¯ ¯ |a, b, c| = ¯¯ b1 b2 b3 ¯¯ . ¯ c1 c2 c3 ¯
Ekkor
Bizonyítás: Ki kell számolni. 4.10. Tétel. A vegyes szorzás mindhárom változóban lineáris.
Bizonyítás: Következik a vektoriális szorzat és a skaláris szorzat bilineáris tulajdonságából. 4.11. Tétel. A vegyes szorzás alternáló, azaz |a, b, c| = |b, c, a| = |c, a, b| |a, b, c| = −|b, a, c| = −|a, c, b| = −|c, b, a|.
Bizonyítás: El˝oször azt vegyük észre, hogy ha a vegyes szorzatban két tényez˝o ugyanaz, akkor a vegyes szorzat értéke 0. Térjünk rá az alternálás bizonyítására! |a, b, c| = |b, a, c| következik a vektoriális szorzás ferde szimmetriájából. 0 = |a, b + c, b + c| = |a, b, b| + |a, b, c| + |a, c, b| + |a, c, c| = |a, b, c| + |a, c, b|. 4.12. Tétel. |a, b, c| = 0 akkor és csakis akkor teljesül, ha (a, b, c) lineárisan függ˝o vektorrendszer. ¯ ¯ Ha (a, b, c) lineárisan független vektorrendszer, akkor ¯|a, b, c|¯, megegyezik (a, b, c) egy pontból induló reprezentánsai által kifeszített paralelepipedon térfogatával.
Bizonyítás: Ha (a, b, c) lineárisan függ˝o vektorrendszer, akkor valamelyik vektor lineárisan kombinálható a többib˝ol, pl. c = αa + βb. Ekkor |a, b, c| = |a, b, αa + βb| = α|a, b, a| + β|a, b, b| = 0. Legyenek most (a, b, c) lineárisan függetlenek: (a × b) · c = π(a×b) (c) · ka × bk. ka × bk a paralelepipedon egyik lapja területe, π(a×b) (c) pedig el˝ojelt˝ol eltekintve pontosan a hozzá tartozó magasság.
KÜLSO˝ SZORZÁS, VEGYES SZORZÁS
23
4.13. Tétel. (A vektoriális szorzás meghatározottsága.) A vektoriális és vegyes szorzás vonatkozzon a rögzített B = (i, j, k) ortonormált bázisra. Ha (u, v, r) tetsz˝oleges ortonormált bázis, akkor |u, v, r| = ±1, továbbá ha a = α1 u + α2 v + α3 r b = β1 u + β2 v + β3 r, ¯ ¯ ¯u v r ¯ ¯ ¯ a × b = |u, v, r| · ¯¯α1 α2 α3 ¯¯ . ¯ β1 β2 β3 ¯
akkor
Azaz a különböz˝o ortonormált bázisokra vonatkozó vektoriális szorzatok legfeljebb el˝ojelben különböznek.
Bizonyítás: Az els˝o állítás onnan következik, hogy egy ortonormált bázis egy pontból induló reprezentánsai által kifeszített paralelepipedon speciálisan egységkocka. A következ˝o lépésben azt látjuk be, ha |u, v, r| = 1, akkor a következ˝o szorzótábla érvényes: >uB }} BBB } Ã }
ro
v
,
azaz u × v = r,
v × r = u,
r × u = v;
míg |u, v, r| = −1 esetén r
}} }~ }
u `BB
BB , /v
azaz u × v = −r,
v × r = −u,
r × u = −v.
Csak annyit látunk be, hogy |u, v, r| = 1 esetén u × v = r teljesül, a többi állítás igazolása analóg. Mivel (u, v, r) bázis: u × v = αu + βv + γr. Szorozzuk mindkét oldalt skalárisan rendre r-rel, u-val, v-vel: γ = 1, α = 0, β = 0. Legyen |u, v, r| = 1. a × b kiszámításához használjuk ki a vektoriális szorzás linearitását és az el˝obbi szorzótáblát: a × b = (α1 u + α2 v + α3 r) × (β1 u + β2 v + β3 r) = = α1 β1 u × u + α1 β2 u × v + α1 β3 u × r+ + α2 β1 v × u + α2 β2 v × v + α2 β3 v × r+ + α3 β1 r × u + α3 β2 r × v + α3 β3 r × r = = (α1 β2 − α2 β1 )r − (α1 β3 − α3 β1 )v + (α2 β3 − α3 β2 )u =
24
A SZABADVEKTOROK VEKTORTERE
¯ ¯ ¯u v r ¯ ¯ ¯ = ¯¯α1 α2 α3 ¯¯ . ¯ β1 β2 β3 ¯
4.14. Definíció. Azt mondjuk, hogy V-t egy irányítással láttuk el, ha a két vektoriális szorzás közül kijelöltük az egyiket. (Azaz rögzítettünk egy ortonormált bázist, s a vektoriális szorzás erre vonatkozik.) Egy (u, v, r) lineárisan független vektorhármast jobbsodrásúnak vagy jobbrendszernek nevezünk, ha |u, v, r| > 0, balsodrásúnak vagy balrendszernek, ha |u, v, r| < 0. Felhívjuk a figyelmet, hogy a jobbsodrás el˝obbi definíciója nem támaszkodik a jobbkéz-szabályra, s nem is alkalmas arra, hogy a jobb kezet és a bal kézt˝ol matematikai módon megkülönböztessük. A most definiált jobbsodrás fizikailag pusztán annyit jelent, hogy amilyen kéz szabályát követi az irányítást definiáló rögzített ortonormált bázis, ugyanolyan szabályt követ (u, v, r) is. (Tehát ha a rögzített ortonormált bázis történetesen „balkéz-szabályt” követ, akkor a jobbsodrás éppen azt jelenti, hogy (u, v, r) is balkéz-szabályt követ.) 4.15. Tétel. Ha az (a, b) vektorrendszer lineárisan független, akkor (a, b, a × b) jobbsodrású.
Bizonyítás: (a, b, a × b) = (a × b) · (a × b) = ka × bk2 > 0. 4.16. Tétel. ∀a, b, c ∈ V szabadvektorokra fennáll az ún. kifejtési szabály: a × (b × c) = ac · b − ab · c; és az ún. Jacobi-azonosság: a × (b × c) + b × (c × a) + c × (a × b) = 0.
Bizonyítás: Mindkét állítást be lehet úgy látni, hogy ortonormált bázis felvétele után koordinátákkal kiszámítjuk mindkét oldalt. Ez a hosszadalmas számolás azonban teljesen elkerülhet˝o a Jacobi-azonosságnál, s lényegesen egyszer˝usíthet˝o a kifejtési szabálynál. Kezdjük a kifejtési szabállyal. Ha b és c lineárisan függ˝ok, akkor b × c = 0, s így a bal oldalon 0 áll. A függ˝oség miatt b és c közül egyik a másiknak skalárszorosa, pl. c = tb. Számítsuk ki a jobb oldalt: ac · b − ab · c = t · ab · b − t · ab · b = 0. Legyenek most b és c lineárisan függetlenek. Vegyünk fel úgy (i, j, k) pozitív ortonormált bázist, hogy c = γ3 k, k és j ugyanabban a síkban legyen reprezentálható mint c és b, tehát b = β2 j + β3 k. Ebben a bázisban fejezzük ki a-t: a = α1 i + α2 j + α3 k.
EGYENESEK ÉS SÍKOK
25
Ezek után a × (b × c) = (α1 i + α2 j + α3 k) × (β2 γ3 )i = −α2 β2 γ3 k + α3 β2 γ3 j. A jobb oldal: ac · b − ab · c = = α3 γ3 b − (α2 β2 + α3 β3 )c = = α3 γ3 β2 j + α3 γ3 β3 k − α2 β2 γ3 k − α3 β3 γ3 k = α3 γ3 β2 j − α2 β2 γ3 k. A Jacobi-azonossághoz alkalmazzuk a kifejtési szabályt: a × (b × c) + b × (c × a) + c × (a × b) = = ac · b − ab · c + ba · c − bc · a + cb · a − ca · b = 0.
4.17. Tétel. Legyen e egységvektor. Az x vektor e vektorra mer˝oleges összetev˝oje x⊥ = (e × x) × e.
Bizonyítás: Alkalmazzuk a kifejtési tételt: (e × x) × e = −e × (e × x) = −ex · e + ee · x = −xk + x, azaz x = xk + (e × x) × e, tehát a jobb oldali második tag valóban x⊥ .
5. Egyenesek és síkok −* 5.1. Definíció. E egy O pontjának rögzítése után a P ∈ E pont helyzetvektorán a OP ∈ V szabadvektort értjük. O-t origónak is mondjuk. 5.2. Definíció. Egy egyenes irányvektorán az egyenesen reprezentálható nem zéróvektort értünk. 5.3. Tétel. (Az egyenes paraméteres el˝oállítása.) Origó rögzítése után egy egyenes pontjainak helyzetvektorai és csakis ezek el˝oállíthatók x = x0 + tv
t∈R
(∗)
alakban, ahol x0 az egyenes egy pontjának helyzetvektora, v pedig az egyenes egy irányvektora. Megfordítva, ha x0 és v 6= 0 adottak, akkor (∗) egy egyenes pontjai helyzetvektorainak halmazát állítja el˝o.
26
A SZABADVEKTOROK VEKTORTERE
Bizonyítás: Legyen adott az e egyenes, melynek egy irányvektora v, az X0 pontjának helyzet−−* vektora pedig x0 . X ∈ e ⇐⇒ XX0 az egyenesen reprezentálható vektor. Ez pontosan azt −−* jelenti, hogy v és XX0 lineárisan függ˝ok, vagyis az egyik a másiknak skalárszorosa. Mivel −−* v 6= 0, ezért XX0 = tv bizonyosan fennáll valamely t ∈ R-re. Tehát −−* −−* −−* X ∈ e ⇐⇒ XX0 = XO + OX0 = x − x0 = tv. −−* ←−−→ Megfordítva, legyen x0 = OX0 , (X0 , X1 ) ∈ v. Ekkor az els˝o rész állítása szerint, az X0 X1 egyenes paraméteres el˝oállítása (∗). 5.4. Tétel. (A sík paraméteres el˝oállítása.) Origó rögzítése után tetsz˝oleges sík pontjainak helyzetvektorai és csakis ezek el˝oállíthatók x = x0 + λv + µw
(λ, µ ∈ R)
(∗)
alakban, ahol x0 a sík egy tetsz˝oleges pontjának helyzetvektora, v és w a síkon reprezentálható lineárisan független vektorok. Megfordítva, tetsz˝olegesen adott x0 és lineárisan független v, w szabadvektorok mellett (∗) egy sík pontjainak helyzetvektorai halmazát állítja el˝o.
Bizonyítás: Tekintsük az α síkot, X0 ∈ α, továbbá legyenek v és w az α síkban reprezentálható −−* −−* lineárisan független vektorok. X ∈ α ⇐⇒ X0 X az α síkban reprezentálható, azaz v, w, X0 X lineárisan függ˝ok, azaz valamelyikük kifejezhet˝o a másik kett˝o lineáris kombinációjaként. Mivel −−* v, w lineárisan függetlenek, ezért X0 X biztosan kifejezhet˝o v és w lineáris kombinációjaként, ami pontosan azt jelenti, hogy léteznek olyan λ, µ ∈ R skalárok, hogy (∗) teljesül. Megfordítva, legyenek adva x0 , v, w, és ráadásul v és w lineárisan függetlenek. Reprezentáljuk a vektorokat a következ˝oképpen: (O, X0 ) ∈ x0 , (X0 , X1 ) ∈ v, (X0 , X2 ) ∈ w. Az X0 , X1 , X2 pontok nem kollineárisak, ellenkez˝o esetben ugyanis v és w egy egyenesen lennének reprezentálhatók. Erre a három pontra egyértelm˝uen illeszkedik tehát egy sík, melyet jelöljön α. Az els˝o állítas alapján α paraméteres el˝oállítása pontosan (∗). 5.5. Definíció. Egy sík normálvektorán egy, a síkra mer˝oleges nem zéróvektort értünk. 5.6. Tétel. (A sík Hesse-féle egyenlete.) Origó rögzítése után tetsz˝oleges sík pontjainak helyzetvektorai és csakis ezek kielégítik az n(x − x0 ) = 0
(∗)
összefüggést, ahol x0 a sík egy tetsz˝oleges pontjának helyzetvektora, n pedig a sík egy normálvektora. Megfordítva, tetsz˝olegesen adott x0 -ra és n 6= 0-ra (∗) egy sík egyenlete.
TÉRELEMEK TÁVOLSÁGA ÉS SZÖGE
27
Bizonyítás: Az adott α sík X0 pontjának helyzetvektora legyen x0 , egy normálvektora n. X ∈ −−* −−* α ⇐⇒ X0 X ⊥ n ⇐⇒ X0 X · n = 0, ami pontosan (∗)-ot jelenti. −−* Megfordítva, adott n 6= 0 és x0 = OX0 esetén tekintsük az −−* α = {X ∈ E|X0 X ⊥ n} −−* halmazt. Legyen n az n irányvektorú, O-ra illeszked˝o egyenes. Az X0 X ⊥ n feltétel azt ←−−→ jelenti, hogy vagy X0 = X, vagy X0 X ⊥ n. Mivel az n egyenesre az X0 pontban állított mer˝olegesek mind egy síkban vannak és ez a sík az n egyértelm˝u X0 -ra illeszked˝o normálsíkja, ezért megállapíthatjuk, hogy a megkonstruált α halmaz sík. Ennek az egyenlete az els˝o állítás szerint pontosan a megadott egyenlet.
6. Térelemek távolsága és szöge Hajós: 24.§, 25.§.
2. fejezet Vektorterek 7. A vektortér definíciója 7.1. Definíció. Legyen F egy test, (V, +) Abel-csoport. Ha értelmezve van egy F × V → V, (α, v) 7→ αv leképezés úgy, hogy ∀α, β ∈ F és ∀v, w ∈ V : α(v + w) (α + β)v (αβ)v 1v
= = = =
αv + αw αv + βv α(βv) v,
akkor azt mondjuk, hogy V vektortér F felett. F elemeit skalároknak, V elemeit pedig vektoroknak nevezzük. A vektortér definíciójában szerepl˝o 4 tulajdonságot gyakran vektortér axiómáknak is mondjuk. Ügyeljünk arra, hogy a test additív neutrális elemét és V neutrális elemét össze ne keverjük – mindkett˝ot ugyanúgy 0-val jelöljük! Ebben a jegyzetben kizárólag F = R, vagy F = C. A vektortérfogalom hasznosságát az mutatja, hogy nagyon sok, gyakran el˝oforduló struktúra kielégíti a definíciót:
Példa. A szabadvektorok vektortere: V vektortér R felett. Példa. Egy tetsz˝oleges pont (origó) rögzítése után a klasszikus euklideszi ponttér (azaz E) is vektortérré tehet˝o R felett. Jelölje a rögzített pontot O! Két pont összegét(!) értelmezzük a −* −* −* következ˝oképpen: P + Q = R, ha OP + OQ = OR, továbbá egy pont számmal való szorzata(!): −* −* αP = Q, ha αOP = OQ. Az így kapott vektorteret gyakran EO -val jelöljük, s a kötöttvektorok vektorterének mondjuk. 28
A VEKTORTÉR DEFINÍCIÓJA
29
Példa. Legyen (F, +, ·) test. F vektortér önmaga fölött, ahol a skalárral való szorzás a testben értelmezett szorzás. Speciálisan C C felett, R R felett. Példa. C R felett is vektortér. Példa. A skalár n-esek tere: (Fn , +) vektortér F felett, ahol az összeadás és skalárral való szorzás komponensenként van értelmezve. Példa. Az összes komplex (valós) együtthatós polinomok P halmaza C (R) felett, ahol az összeadást és a skalárral való szorzást az algebra tárgyban értelmeztük. Példa. A legfeljebb n-edfokú komplex (valós) együtthatós polinomok P n tere. Példa. Az R-en értelmezett összes valós érték˝u függvények vektorteret alkotnak R felett. (Két függvény összegét és skalárszorosát az analízis tárgyban értelmeztük.) Példa. Az ún. triviális vektortér egyetlen elemb˝ol, a zéróvektorból áll. Legyen O = {0} tetsz˝oleges egyelem˝u halmaz, F tetsz˝oleges test. O-ban az összeadást, ill. a skalárral való szorzás értelmezzük az egyedüli lehetséges módon: 0 + 0 = 0, α0 = 0. Példa. Legyen (V, R) valós vektortér. (V × V, C) vektortér, ha az összeadást és skalárral való szorzást a következ˝oképpen értelmezzük: (a1 , a2 ) + (b1 , b2 ) = (a1 + b1 , a2 + b2 ) (α + iβ)(a1 , a2 ) = (αa1 − βa2 , αa2 + βa1 ). (Képzeljünk (a1 , a2 ) helyébe formálisan a1 + ia2 -t, így könny˝u megjegyezni a skalárral való szorzás definícióját.) Ezt a vektorteret a V komplexifikáltjának mondjuk. 7.2. Tétel. Legyen V vektortér az F test felett. Ekkor teljesülnek a következ˝ok. ∀α, β ∈ F, ∀v, w ∈ V : 0v (−1)v α0 αv = 0
= = = =⇒
0 −v, ahol −v a v additív inverze V -ben 0 α = 0 vagy v = 0
Bizonyítás: A következ˝o gondolatsor minden egyenl˝oségénél valamelyik vektortér axiómát használjuk, kivéve az utolsó el˝otti egyenl˝oséget, ahol azt használjuk, hogy 0 a test additív neutrális eleme. 0v + v = 0v + 1v = (0 + 1)v = 1v = v, tehát: v = 0v + v.
30
VEKTORTEREK
Adjuk hozzá mindkét oldalhoz v additív inverzét, azaz −v-t: 0 = (0v + v) + (−v) = 0v + (v + (−v)) = 0v + 0 = 0v. A második állításnál már az el˝obb bizonyított formulát is használjuk: v + (−1)v = 1v + (−1)v = (1 − 1)v = 0v = 0, azaz v additív inverze valóban (−1)v. A harmadik állításra rátérve: α0 = α(v − v) = αv − αv = 0. Végezetül az utolsó állítás. Tegyük fel, hogy αv = 0, és α 6= 0. Belátjuk, hogy ekkor csak v = 0 teljesülhet. µ ¶ 1 1 1 v = 1v = α v = (αv) = 0 = 0. α α α
7.3. Definíció. A W ⊂ V nem-üres részhalmazt a V vektortér alterének nevezzük, ha teljesül, hogy ∀v, w ∈ W és α ∈ F : v + w ∈ W és αv ∈ W. O ⊂ V és V ⊂ V a V triviális alterei. Mivel W nem-üres, ezért van benne egy v ∈ W vektor, tehát 0w = 0 is W -ben van. Az összeadás és a skalárral való szorzás nem vezet ki W -b˝ol, továbbá az összeadás és a skalárral való szorzás tulajdonságai örökl˝odnek, azaz kimondhatjuk az alábbi tételt: 7.4. Tétel. Egy vektortér altere maga is vektortér ugyanazon test felett (az öröklött összeadással és skalárral való szorzással).
Példa. A szabadvektorok V vektorterében rögzítsünk egy v vektort. Legyen W1 = {t · v | t ∈ R} , W2 = {w | w ⊥ v} . Igazoljuk, hogy W1 és W2 altér a szabadvektorok vektorterében. Ezeknek az altereknek egyszer˝u geometriai jelentése van: ha rögzítünk E-ben egy pontot (origó), és W1 ill. W2 elemeit az origóból kiindulva reprezentáljuk, akkor a reprezentánsok végpontjai egy origóra illeszked˝o egyenest ill. síkot alkotnak.
Példa. Legyen (x1 , . . . , xn ) ∈ Rn rögzített vektor. Legyen W = {(y1 , . . . , yn ) ∈ Rn | x1 y1 + · · · + xn yn = 0} . W altér Rn -ben.
LINEÁRIS KOMBINÁCIÓK, BÁZIS, DIMENZIÓ
31
Példa. Az összes R → R függvények terében a folytonos függvények alteret alkotnak. 7.5. Tétel. Legyenek U és W alterei a V vektortérnek. Ekkor U ∩ W szintén altér, amit U és W metszetének nevezünk. Jelölje továbbá U + W a következ˝o vektorhalmazt: U + W = {u + w|u ∈ U, w ∈ W } . Ekkor U + W szintén altér, amit az U és W összegének nevezünk.
Bizonyítás: U ∩ W 6= ∅, mert a zéróvektor mindkét altérben benne van. Teljesüljön, hogy x, y ∈ U ∩ W . Ekkor x, y ∈ U ∧ x, y ∈ W , azaz x + y, αx ∈ U ∧ x + y, αx ∈ W , ami azt jelenti, hogy x + y, αx ∈ U ∩ W . U + W tartalmazza a 0 vektort, mert 0 + 0 = 0. Teljesüljön, hogy u1 + w1 ∈ U + W és u2 + w2 ∈ U + W . Ekkor (u1 + w1 ) + (u2 + w2 ) = (u1 + u2 ) + (w1 + w2 ) ∈ U + W, továbbá α(u1 + w1 ) = αu1 + αw1 ∈ U + W.
8. Lineáris kombinációk, bázis, dimenzió 8.1. Definíció. Legyen V vektortér F felett, v1 , v2 , . . . , vk ∈ V vektorok, α1 , α2 , . . . , αk ∈ F skalárok. Az α1 v1 + α2 v2 + · · · + αk vk ∈ V vektort a v1 , . . . , vk vektorok α1 , . . . , αk skalárokkal való lineáris kombinációjának nevezzük. 8.2. Tétel. (A lineáris kombináció tranzitív tulajdonsága.) Ha egy vektortér z vektora lineárisan kombinálható az x1 , . . . , xr vektorokból, továbbá minden i-re xi lineárisan kombinálható az y1 , . . . , ys vektorokból, akkor z lineárisan kombinálható az y1 , . . . , ys vektorokból is.
Bizonyítás: Legyen z=
r X
βi xi ,
i=1
továbbá ∀i (1 ≤ i ≤ r) : xi =
s X
γij yj .
j=1
Ekkor z==
r X i=1
βi xi =
r X i=1
βi
s X j=1
γij yj =
r X s X i=1 j=1
βi γij yj
32
VEKTORTEREK
=
r s X X j=1 i=1
βi γij yj =
à r s X X j=1
! βi γij
yj ,
i=1
ami valóban az y1 , . . . , ys vektorok lineáris kombinációja. 8.3. Tétel. Egy V vektortér v1 , . . . , vk rögzített vektorainak összes lineáris kombinációi alteret alkotnak V -ben. Ezt az alteret, melyet L(v1 , . . . , vk ) jelöl, a v1 , . . . , vn vektorok által generált altérnek, vagy a v1 , . . . , vn vektorok lineáris lezártjának nevezzük.
Bizonyítás: L(v1 , . . . , vk ) = W nyilván nem üres, mert például a 0v1 + · · · + 0vk = 0 vektort tartalmazza. Továbbá (α1 v1 + · · · + αk vk ) + (β1 v1 + · · · + βk vk ) = = (α1 + β1 )v1 + · · · + (αk + βk )vk . Bebizonyítottuk, hogy két W -beli vektor összege szintén W -beli. A W -b˝ol vett vektor skalárszorosa: α(β1 v1 + · · · + βk vk ) = αβ1 v1 + · · · + αβk vk ∈ W.
8.4. Definíció. A V vektortér v1 , . . . , vk vektorrendszerét a V • generátorrendszerének nevezzük, ha V bármely vektora legalább egyféleképpen lineárisan kombinálható bel˝olük; • lineárisan független vektorrendszerének nevezzük, ha bármely vektor legfeljebb egyféleképpen kombinálható bel˝olük; • bázisának nevezzük, ha bármely vektor pontosan egyféleképpen kombinálható bel˝olük. Ha egy véges vektorrendszer nem lineárisan független, akkor lineárisan függ˝onek nevezzük. Ha v1 , . . . , vk bázis, akkor tehát tetsz˝oleges v ∈ V vektorhoz egyértelm˝uen léteznek olyan α1 , . . . αk skalárok, hogy v = α1 v1 + · · · + αk vk . Az (α1 , . . . , αk ) skalár k-st a v vektor v1 , . . . , vk bázisra vonatkozó koordinátáinak nevezzük.
Megjegyzés. Az definíciót megel˝oz˝o tételben véges sok vektor lineáris lezártjáról beszéltünk. A fogalmat ki lehet terjeszteni tetsz˝oleges W ⊂ V részhalmaz esetére: W lineáris lezártja a W -beli vektorokkal képzett összes véges lineáris kombinációk halmaza. Az így értelmezett LW halmaz szintén a V altere. Erre szintén mondhatjuk, hogy a W által van generálva. A továbbiakban a
LINEÁRIS KOMBINÁCIÓK, BÁZIS, DIMENZIÓ
33
generátorrendszer elnevezést mindig csak véges vektorrendszerre használjuk, és ezt hangsúlyozandó gyakran véges generátorrendszerr˝ol beszélünk. Megemlítjük, hogy nem minden vektortér végesen generált (azaz nem minden vektortérnek létezik véges generátorrendszere), de a továbbiakban csak olyan vektorterekr˝ol lesz szó, amelyek véges sok vektorral generálhatóak. Megállapodunk abban, hogy az üres vektorrendszer által generált vektortér a O, melyet tehát 0 számú vektorral generált vektortérnek tekintünk. 8.5. Tétel. Egy V vektortér v1 , . . . , vk vektorrendszere akkor és csakis akkor lineárisan függ˝o, ha a zérusvektor nemtriviálisan is kombinálható bel˝olük, azaz: léteznek olyan α1 , . . . , αk skalárok, hogy van közöttük zérustól különböz˝o, és α1 v1 + · · · + αk vk = 0.
Bizonyítás: Ha v1 , . . . , vk lineárisan függ˝o rendszert alkotnak, akkor definíció szerint van olyan vektor, amely legalább kétféleképpen kombinálható bel˝olük: γ1 v 1 + · · · + γk v k = β 1 v 1 + · · · + β k v k , és az együtthatók között vannak különböz˝ok. Rendezve: (γ1 − β1 )v1 + · · · + (γk − βk )vk = 0. Mivel van olyan i, hogy γi 6= βi , ezért a bal oldali együtthatók között van zérótól különböz˝o. Megfordítva, ha a zéróvektor triviálistól különböz˝oen is kombinálható a v1 , . . . , vk vektorrendszerb˝ol, akkor a zérusvektor legalább kétféleképpen kombinálható, mert triviálisan minden vektorrendszerb˝ol kombinálható a zéróvektor. 8.6. Tétel. Egy V vektortér v1 , . . . , vk vektorrendszere akkor és csakis akkor lineárisan független, ha a zérusvektor csak triviálisan kombinálható bel˝olük, azaz, ha α1 v1 + · · · + αk vk = 0, akkor α1 = · · · = αk = 0.
Bizonyítás: Az el˝oz˝o állítás kontrapozíciójáról van szó. 8.7. Tétel. A bázis nem más, mint – lineárisan független generátorrendszer; – maximális független vektorrendszer (azaz tetsz˝oleges vektort hozzávéve már nem független); – minimális generátorrendszer (azaz tetsz˝oleges vektort elvéve, már nem lesz generátorrendszer).
34
VEKTORTEREK
Bizonyítás: Az els˝o állítás közvetlenül a definíció következménye. Legyen most e1 , . . . , en bázis, v tetsz˝oleges vektor. Belátjuk, hogy e1 , . . . , en , v már nem lineárisan független. Valóban, mivel e1 , . . . , en bázis, ezért a v vektor lineárisan kombinálható bel˝olük: v = α1 e1 + · · · + αn en , illetve teljesül v = α1 e1 + · · · + αn en + 0v is. Másrészt v az e1 , . . . , en , v vektorrendszerb˝ol másképpen is kombinálható: v = 0e1 + · · · + 0en + 1v. A v vektornak tehát kétféle lineáris kombinációját is megadtuk: e1 , . . . , en , v már nem lineárisan független vektorrendszer. Végezetül a harmadik állítás. A bizonyítás indirekt. Az el˝obbi bázisból tetsz˝oleges vektort, például en -et vegyük el, s tegyük fel, hogy még mindig generátorrendszert kapunk. Az en vektor tehát lineárisan kombinálható bel˝olük: en = α1 e1 + . . . + αn−1 en−1 . Ez azt jelenti, hogy az eredeti bázisban az en vektornak kétféle lineáris kombinációja is van: en = α1 e1 + . . . + αn−1 en−1 + 0en , és en = 0e1 + . . . + 0en−1 + 1en . Ez ellentmondás. 8.8. Tétel. A v1 , . . . , vk vektorok akkor és csakis akkor lineárisan függ˝ok, ha valamelyikük lineárisan kombinálható a többib˝ol.
Bizonyítás: El˝oször tegyük fel, hogy a v1 , . . . , vk vektorrendszer valamelyik tagja lineárisan kombinálható a többi vektorból. Legyen ez pl. v1 . Tehát v1 = α2 v2 + . . . + αk vk . Rendezve: −1v1 + α2 v2 + . . . + αk vk = 0. Ez a zéróvektor nem triviális lineáris kombinációja, mert az együtthatók között szerepel −1. Megfordítva, tegyük fel, hogy a v1 , . . . , vk vektorrendszer lineárisan függ˝o. Ez azt jelenti, hogy a zérusvektort nem triviálisan is lehet lineárisan kombinálni bel˝olük: α1 v1 + . . . + αk vk = 0, és az együtthatók között van zérustól különböz˝o, pl. α1 . Ekkor αk α2 v1 = − v2 − · · · − vk , α1 α1 azaz a zérustól különböz˝o együtthatóval rendelkez˝o tag lineárisan kombinálható a többib˝ol.
LINEÁRIS KOMBINÁCIÓK, BÁZIS, DIMENZIÓ
35
8.9. Következmény. Ha egy vektorrendszer tartalmazza a zérusvektort, akkor az lineárisan függ˝o. — Valóban, a zérusvektor csupa 0 együtthatóval lineárisan kombinálható a többi vektorból. 8.10. Tétel. A v1 , . . . , vk zérusvektort nem tartalmazó vektor k-as akkor és csakis akkor lineárisan függ˝o, ha valamelyik vektora lineárisan kombinálható a megel˝oz˝o vektorokból.
Bizonyítás: Ha a vi vektor (1 ≤ i ≤ k) lineárisan kombinálható a megel˝oz˝o tagokból: vi = α1 v1 + . . . + αi−1 vi−1 , akkor lineárisan kombinálható a v1 , . . . , vˆi . . . , vk vektorrendszerb˝ol is (a kalap a vektor hiányát jelenti): vi = α1 v1 + . . . + αi−1 vi−1 + 0vi+1 + . . . + 0vk , tehát a vektorrendszer valamely tagja lineárisan kombinálható a többib˝ol. Ez az el˝oz˝o tétel szerint azt jelenti, hogy a vektorrendszer lineárisan függ˝o. Most tegyük fel, hogy a v1 , . . . , vn vektorrendszer lineárisan függ˝o. Ekkor a zérusvektor triviálistól különböz˝oen is kombinálható bel˝olük: α1 v1 + . . . + αk vk = 0. Az együtthatók között van nullától különböz˝o. A legnagyobb index˝u, nullától különböz˝o együttható legyen αi . Tehát αi+1 = . . . = αk = 0, (vagy esetleg egyetlen együttható sem nulla, ekkor az utolsó nullától különböz˝o együttható αk ). Ekkor vi lineárisan kombinálható a megel˝oz˝oekb˝ol: vi = −
α1 αi−1 v1 − · · · − vi−1 . αi αi
8.11. Tétel. (Kicserélési tétel.) Egy k számú vektorral generált vektortér minden lineárisan független vektorrendszere legfeljebb k tagú.
Bizonyítás: Legyen a1 , . . . , ak generátorrendszer, b1 , . . . , bl pedig lineárisan független vektorrendszer. Azt állítjuk, hogy l ≤ k. Feltehetjük, hogy ai 6= 0. (Ha mégis, akkor ezt a vektort elhagyva még mindig generátorrendszert kapunk.) Tekintsük a b l , a1 , . . . , a k
(∗)
vektorrendszert. Ez lineárisan függ˝o vektorrendszer, mert bl lineárisan kombinálható az a1 , . . . , ak generátorrendszerb˝ol. Ez a vektorrendszer zérusvektort nem tartalmaz, tehát valamelyik tagja lineárisan kombinálható a megel˝oz˝oekb˝ol. Legyen ez a vektor ai . Hagyjuk el ezt a vektort az el˝obbi vektorrendszerb˝ol: bl , a1 , . . . , a ˆ i , . . . , ak ,
(∗∗)
36
VEKTORTEREK
(a kalap a vektor hiányát jelenti). Mivel (∗) mindegyik vektora lineárisan kombinálható (∗∗) vektoraiból, ezért a lineáris kombináció tranzitív tulajdonságát használva adódik, hogy (∗∗) is generátorrendszer. Most (∗∗) vektoraihoz balról vegyük hozzá bl−1 -et: bl−1 , bl , a1 , . . . , a ˆ i , . . . , ak .
∗ (∗∗)
∗ Az el˝oz˝o gondolatmenet megismételhet˝o, tehát (∗∗) lineárisan függ˝o, ezért valamelyik vektora lineárisan kombinálható az el˝otte lev˝o vektorokból. Ez a vektor nem lehet bl , mert a b1 , . . . , bl vektorrendszer lineárisan független a feltevés szerint. Ezért valamely aj vektort tudjuk kombi∗ nálni a megel˝oz˝o vektorokból. Elhagyva a (∗∗) vektorrendszerb˝ol ezt a vektort, még mindig generátorrendszert kapunk. Az eljárást tovább folytatva a b1 , . . . , bl vektorrendszer vektorait sorra ki tudjuk cserélni az a1 , . . . , ak vektorrendszer valamely vektorával. Ezért az as vektorok nem fogyhatnak el hamarabb, mint a br vektorok, ami pontosan a kívánt állítás. 8.12. Következmény. Egy k vektorral generált vektortérben minden k + 1 tagú vektorrendszer lineárisan függ˝o. 8.13. Tétel. Egy k számú vektorral generált vektortérnek létezik legfeljebb k tagú bázisa, s minden bázisa azonos tagszámú.
Bizonyítás: a1 , . . . , ak legyen generátorrendszer. El˝oször hagyjuk el bel˝ole az esetleg el˝oforduló nullvektorokat, így egy legfeljebb k tagú generátorrendszerhez jutunk: a1 , . . . , as (s ≤ k).
(∗)
Ha a (∗) vektorrendszer lineárisan független, akkor ez bázis, s a bizonyítás kész. Ha lineárisan függ˝o vektorrendszerrel állunk szemben, akkor van olyan ai vektor (∗)-ban, mely a többib˝ol kifejezhet˝o. Ezt elhagyva a kapott a1 , . . . , a ˆ i , . . . , as
(∗∗)
vektorrendszer még mindig generátorrendszer a lineáris kombináció tranzitív tulajdonságát használva: ∗ minden vektora lineárisan kombinálható ∗∗-ból. Az eljárást addig folytatjuk, míg lineárisan független vektorrendszerhez (lineárisan független generátorrendszerhez) nem jutunk. Az eljárás megszakad legkés˝obb akkor, amikor egyetlen vektor marad, mert egyetlen nem nullvektor lineárisan független rendszert alkot. Van tehát legfeljebb k tagú bázis. Hátra van még annak belátása, hogy bármely két bázis azonos tagszámú. Legyen A = (a1 , . . . , ar ) illetve B = (b1 , . . . , bs ) két bázis ugyanabban a végesen generált vektortérben. Tekintsük el˝oször A-t generátorrendszernek, B-t pedig lineárisan független vektorrendszernek. Alkalmazva a kicserélési tételt: s ≤ r. Most fordítva, tekintsük B-t generátorrendszernek, A-t lineárisan független vektorrendszernek: r ≤ s. Ez azt jelenti, hogy r = s.
LINEÁRIS KOMBINÁCIÓK, BÁZIS, DIMENZIÓ
37
8.14. Definíció. Egy végesen generált V vektortér dimenzióján bázisainak közös tagszámát értjük, s ezt dim V -vel jelöljük. A O triviális vektortér dimenzióján definíció szerint 0-t értünk. Az L(v1 , . . . , vk ) dimenzióját a (v1 , . . . , vk ) vektorrendszer rangjának nevezzük.
Példa. A szabadvektorok vektortere 3 dimenziós vektortér. Példa. A skalár n-esek Rn tere n dimenziós vektortér, s benne bázis a következ˝o vektorrendszer: 1 0 0 0 1 0 .. , .. , . . . .. . . . . 0 0 1 Ezt a bázist Rn kanonikus bázisának nevezzük.
Példa. P nem végesen generált, míg a legfeljebb n-edfokú polinomok P n tere n + 1 dimenziós. Benne bázis: 1, x, x2 , . . . , xn . A bázissal kapcsolatosan megfogalmazhatunk néhány további egyszer˝u állítást. 8.15. Tétel. Legyen W az n dimenziós V vektortér n dimenziós altere. Ekkor W = V .
Bizonyítás: W bázisa egyben V bázisa, mert n tagú lineárisan független vektorrendszer. 8.16. Tétel. Legyen V n dimenziós vektortér, r < n pozitív egész és v1 , . . . , vr lineárisan független vektorrendszer V -ben. Ekkor léteznek olyan vr+1 , . . . , vn vektorok, hogy v1 , . . . , vn bázis V -ben.
Bizonyítás: v1 , . . . , vr nem lehet bázis, mert r < n. Ez azt jelenti, hogy ez a vektorrendszer nem maximális lineárisan független rendszer, azaz b˝ovíthet˝o úgy egy vr+1 vektorral, hogy még mindig lineárisan független vektorrendszert kapjunk. Ha r + 1 = n, akkor a bizonyítással készen vagyunk, mert v1 , . . . , vn n tagú lineárisan független vektorrendszer egy n dimenziós vektortérben. Ha r + 1 6= n, akkor ismételjük meg az el˝oz˝o gondolatmenetet, míg n tagú lineárisan független vektorrendszert kapunk. 8.17. Tétel. Egy n dimenziós vektortér minden altere legfeljebb n dimenziós vektortér.
Bizonyítás: Ha a szóban forgó W ⊂ V altér csak a zéróvektort tartalmazza, akkor ennek a dimenziója definíció szerint 0. Tegyük fel, hogy W 6= O. Ekkor W -ben van nemzéró vektor, amelyet b˝ovítsünk W -ben maximális független vektorrendszerré (esetleg már a felvett nemzéró vektor is maximális független vektorrendszer). Ez véges sok vektor hozzávételével megtehet˝o mert W vektorai egyben V vektorai is, s V -ben legfeljebb n lineárisan független vektor vehet˝o fel. Tehát W is végesen generált, s bázisa legfeljebb n tagú.
38
VEKTORTEREK
8.18. Tétel. Egy V vektortér bármely két V1 és V2 alterére: dim(V1 ∩ V2 ) + dim(V1 + V2 ) = dim V1 + dim V2 .
Bizonyítás: Legyen dim V1 = n1 , dim V2 = n2 , dim(V1 ∩ V2 ) = m. Legyen e1 , . . . , em V1 ∩ V2 bázisa. Ezek a vektorok V1 -ben és V2 -ben is benne vannak. Egészítsük ki ezt a vektorrendszert el˝oször V1 bázisává: e1 , . . . , em , a1 , . . . , ak (k + m = n1 ), illetve V2 bázisává: e1 , . . . , em , b1 , . . . , bl (l + m = n2 ). Azt látjuk be, hogy e1 , . . . , em , a1 , . . . , ak , b1 , . . . , bl bázis V1 + V2 -ben. (Ez valóban az állítást jelenti, mert: m + (k + m + l) = (k + m) + (l + m).) El˝oször azt látjuk be, hogy e1 , . . . , em , a1 , . . . , ak , b1 , . . . , bl
(∗)
generátorrendszer V1 +V2 -ben. Valóban V1 +V2 minden vektora felbontható egy V1 -beli v1 és egy V2 -beli v2 vektor összegére. v1 lineárisan kombinálható az e1 , . . . , em , a1 , . . . , ak vektorokból, v2 pedig lineárisan kombinálható az e1 , . . . , em , b1 , . . . , bl vektorokból. Tehát v1 + v2 lineárisan kombinálható a ∗ vektorrendszerb˝ol. Hátra van annak belátása, hogy a ∗ vektorrendszer lineárisan független. Állítsuk el˝o a zérusvektort ∗ lineáris kombinációjaként! 0 = α1 a1 + · · · + αk ak + γ1 e1 + · · · + γm em + β1 b1 + · · · + βl bl .
(∗∗)
b = β1 b1 + · · · + βl bl ∈ V2
(†)
Legyen
(∗∗) miatt b ∈ V1 is teljesül. Ez azt jelenti, hogy b ∈ V1 ∩ V2 , azaz lineárisan kombinálható a következ˝oképpen is: b = ν1 e1 + · · · + νm em .
(‡)
Kivonva a (†)-ból (‡)-ot: 0 = β1 b1 + · · · + βl bl − (ν1 e1 + · · · + νm em ) adódik. Itt a nullvektort bázisból kombináltuk, tehát mindegyik kombinációs együttható 0: β1 = . . . = βl = ν1 = . . . = νm = 0. Írjuk vissza az eredményt (∗∗)-ba: 0 = α1 a1 + · · · + αk ak + γ1 e1 + · · · + γm em . a1 , . . . , ak , e1 , . . . , em azonban lineárisan független rendszer, tehát (∗∗)-ben valamennyi kombinációs együttható 0. A nullvektort (∗)-ból tehát csak triviálisan tudtuk kombinálni, ami azt jelenti, hogy (∗) lineárisan független rendszer.
ALTEREK DIREKT ÖSSZEGE
39
9. Alterek direkt összege 9.1. Definíció. Akkor mondjuk, hogy a V vektortér a V1 , . . . , Vk altereinek a direkt összege, ha V -nek minden v vektora el˝oáll egy és csakis egyféleképpen v = v1 + · · · + vk alakban, ahol v1 ∈ V1 , . . . , vk ∈ Vk . Jelölése: V = V1 ⊕ · · · ⊕ Vk . 9.2. Tétel. A V vektortér akkor és csakis akkor direkt összege a V1 , V2 , . . . , Vm altereinek, ha ezen alterek (tetsz˝oleges) bázisainak egyesítése V bázisa.
Bizonyítás: Teljesüljön el˝oször, hogy V = V1 ⊕ · · · ⊕ Vm ,
(∗)
továbbá Vi dimenziója legyen si . (e11 , . . . , e1s1 ) legyen V1 , . . . , (em1 . . . , emsm ) pedig Vm bázisa. El˝oször belátjuk, hogy e11 . . . , emsm generátorrendszere V -nek. Legyen x ∈ V tetsz˝oleges vektor. (∗) miatt x el˝oáll Vi -b˝ol vett vektorok összegeként: x = x1 + · · · + xm , ahol xi ∈ Vi . Tehát: x = x1 + · · · + xm = = α11 e11 + · · · + α1s1 e1s1 + + α21 e21 + · · · + α2s2 e2s2 + .. . + αm1 em1 + · · · + αmsm emsm , azaz beláttuk, hogy a bázisok egyesítése generátorrendszer. Most belátjuk, hogy a bázisok egyesítése lineárisan független rendszer is. Kombináljuk ehhez a vektorokból a zérusvektort: β11 e11 + · · · + β1s1 e1s1 + · · · + βm1 em1 + · · · + βmsm emsm = 0. Itt y1 = β11 e11 + · · · + β1s1 e1s1 ∈ V1 .. . ym = βm1 em1 + · · · + βmsm emsm ∈ Vm , és y1 + · · · + ym = 0.
40
VEKTORTEREK
(∗) miatt azonban a zéróvektort a Vi alterekb˝ol vett vektorok összegeként egyértelm˝uen lehet felírni, azaz yi = 0, tehát minden βi... együttható zéró. Ez a kívánt lineáris függetlenséget jelenti. Megfordítva, tegyük fel, hogy az A = {e11 , . . . , e1s1 ; . . . ; em1 , . . . , emsm } vektorrendszer a V1 , . . . , Vm bázisainak egyesítése (az el˝obbiekben alkalmazott jelölések szerint), és A egyben V bázisa is. Ekkor minden x ∈ V egyértelm˝uen felírható x = α11 e11 + · · · + α1s1 e1s1 + α21 e21 + · · · + α2s2 e2s2 + · · · + αm1 em1 + · · · + αmsm emsm = = x1 + · · · + xm alakban, ahol α11 e11 + · · · + α1s1 e1s1 = x1 .. . αm1 em1 + · · · + αmsm emsm = xm . Azaz minden x ∈ V vektort el˝oállítottunk V1 , . . . , Vm -b˝ol vett vektorok összegeként. Tekintsünk egy x = x01 + · · · + x0m , ahol x0i ∈ Vi összeget. Ekkor 0 0 x01 = α11 e11 + · · · + α1s e 1 1s1 .. . 0 0 0 xm = αm1 em1 + · · · + αms e , m msm
és 0 0 0 0 0 0 x = α11 e11 + · · · + α1s e + α21 e21 + · · · + α2s e + · · · + αm1 em1 + · · · + αms e = m msm 1 1s1 2 2s2 = x1 + · · · + xm . 0 Ezt (∗)-gal összehasonlítva αij = αij , azaz xi = x0i adódik.
9.3. Következmény. V = V1 ⊕ · · · ⊕ Vk =⇒ dim V1 + · · · + dim Vk = dim V. 9.4. Tétel. Egy vektortér akkor és csakis akkor n dimenziós, ha n számú egydimenziós alterének direkt összege.
Bizonyítás: Ha a V vektortér n számú egydimenziós alterének direk összege, akkor ezen alterekb˝ol vett bázisok egyesítése az el˝oz˝o tétel miatt V bázisa is, tehát V n dimenziós. Megfordítva, legyen e1 , . . . , en bázis V -ben. Ekkor V = L(e1 ) ⊕ · · · ⊕ L(en ) triviálisan teljesül, hiszen ez pontosan azt jelenti, hogy V tetsz˝oleges vektora egyértelm˝uen el˝oáll az e1 , . . . , en vektorok lineáris kombinációjaként.
LINEÁRIS SOKASÁG, FAKTORTÉR
41
9.5. Tétel. Ha A és B alterei a V vektortérnek, akkor V = A ⊕ B ekvivalens azzal, hogy A + B = V és A ∩ B = O.
Bizonyítás: El˝oször tegyük fel, hogy teljesül A ⊕ B = V . A + B ⊂ V azért teljesül, mert A és B V részhalmazai, V ⊂ A + B pedig azért, mert V = A ⊕ B garantálja, hogy minden V -beli vektor felbontható A-ból és B-b˝ol vett vektorok összegére. Tehát A + B = V . Ha x ∈ A és x ∈ B, akkor x = x + 0 = 0 + x, s a felbontás egyértelm˝usége miatt x = 0. Beláttuk, hogy A ∩ B = O. Megfordítva, teljesüljön most, hogy A + B = V , A ∩ B = O. A + B = V miatt minden V -beli vektor el˝oállítható A-ból vett és B-b˝ol vett vektorok összegeként, csak a felbontás egyértelm˝uségét kell belátni. Legyen most x = a + b, ahol a ∈ A, b ∈ B, x = a0 + b0 ahol a0 ∈ A, b0 ∈ B. A két relációt kivonva egymásból: 0 = a − a0 + b − b0 =⇒ a − a0 = b0 − b. a − a0 ∈ A, mert két A-beli vektor különbsége, b0 − b ∈ B, mert két B-beli vektor különbsége. Azonban A ∩ B = O, tehát a − a0 = 0 =⇒ a = a0 , b0 − b = 0 =⇒ b = b0 , tehát a felbontás egyértelm˝u. 9.6. Tétel. Egy végesen generált vektortér minden altere direkt összeadandó, azaz mindegyik altérhez létezik olyan altér, hogy direkt összegben kiadják az eredeti vektorteret.
Bizonyítás: Legyen A altér a V vektortérben. Legyen a1 , . . . , ar A bázisa. Mivel ez V -ben lineárisan független rendszer, ezért kiegészíthet˝o V bázisává valamely b1 , . . . , bs vektorrendszerrel. Legyen B = L(b1 , . . . , bs ). Mivel az A és B egy bázisának egyesítése V bázisát adja, ezért A⊕B =V.
10. Lineáris sokaság, faktortér 10.1. Definíció. Legyen H altere a V vektortérnek, továbbá v ∈ V tetsz˝oleges vektor. A v + H = {v + h | h ∈ H} halmazt H irányter˝u lineáris sokaságnak nevezzük. A v + H lineáris sokaságot gyakran a H altér eltoltjának is mondjuk.
42
VEKTORTEREK
Példa. Egyenesek és síkok: legyen x0 ∈ V tetsz˝oleges szabadvektor, v ∈ V nem nullvektor. Az {x0 + tv|t ∈ R} halmaz lineáris sokaság, irányterének bázisa v. Legyen x0 ∈ V tetsz˝oleges szabadvektor, a, b ∈ V lineárisan független szabadvektorok. Az {x0 + λa + µb|λ, µ ∈ R} halmaz lineáris sokaság, iránytere L(a, b). 10.2. Tétel. Legyen H altere a V vektortérnek. Értelmezzük V -ben a következ˝o, ∼-el jelölt relációt: x ∼ y, ha x − y ∈ H. Azt állítjuk, hogy ∼ ekvivalenciareláció, továbbá az ekvivalenciaosztályok pontosan a H irányter˝u lineáris sokaságok.
Bizonyítás: ∼ reflexív: x ∼ x, mert x − x = 0 ∈ H. ∼ szimmetrikus: x ∼ y =⇒ x − y ∈ H =⇒ −(x − y) = y − x ∈ H =⇒ y ∼ x. ∼ tranzitív: x ∼ y ∧ y ∼ z =⇒ x − y ∈ H ∧ y − z ∈ H =⇒ (x − y) + (y − z) = x − z ∈ H =⇒ x ∼ z. Beláttuk, hogy ∼ ekvivalenciareláció. Most belátjuk, hogy egy x ∈ V vektor által reprezentált ekvivalenciaosztály pontosan x + H. El˝oször belátjuk, hogy minden x + H-ból vett vektor ekvivalens x-hez. Valóban, legyen x + h ∈ x + H. Ekkor (x + h) − x = h ∈ H. Legyen most egy y-nal jelölt vektor x-hez ekvivalens! Ekkor h = y − x ∈ H, azaz y = x + h ∈ x + H. 10.3. Következmény. Tételünkb˝ol következik, hogy minden egyes x ∈ V vektor pontosan egy H irányter˝u lineáris sokaságban van benne (H ⊂ V rögzített altér). Ilyenmódon a zéróvektor is csak egy H irányter˝u lineáris sokaságban van benne, 0 + H = H-ban. Ez az egy H irányter˝u lineáris sokaság altér. Megállapodunk abban, hogy egy H irányter˝u lineáris sokaság vektorait az illet˝o lineáris sokaság reprezentánsainak is mondjuk, hiszen az el˝oz˝o tétel szerint a lineáris sokaságok tekinthet˝ok egy ekvivalenciareláció ekvivalenciaosztályainak. 10.4. Definíció. Egy lineáris sokaság dimenzióján irányterének dimenzióját értjük. 10.5. Definíció. Az a + H és b + H közös irányter˝u lineáris sokaságok összegén az (a + b) + H lineáris sokaságot értjük. A a + H lineáris sokaság α skalárral való szorzatán pedig a (αa) + H lineáris sokaságot. 10.6. Tétel. A lineáris sokaságok összege és skalárral való szorzata független a reprezentánsok választásától.
Bizonyítás: Legyen a0 ∈ a + H, b0 ∈ b + H, azt állítjuk, hogy (a + b) + H = (a0 + b0 ) + H. Ehhez azt kell belátni, hogy az a + b és a0 + b0 vektorok különbsége H-ban van. Valóban: (a + b) − (a0 + b0 ) = (a − a0 ) + (b − b0 ) ∈ H. Hasonlóan, belátjuk, hogy (αa) + H = (αa0 ) + H. αa − αa0 = α(a − a0 ) ∈ H
LINEÁRIS SOKASÁG, FAKTORTÉR
43
10.7. Tétel. Egy V vektortér H altere szerint vett összes lineáris sokaságok halmaza vektortér az összeadás és skalárral való szorzásra nézve. Ezt a vektorteret a V vektortér H altér szerint vett faktorterének mondjuk, és V /H-val jelöljük.
Bizonyítás: Könny˝u látni, hogy (V /H, +) Abel-csoport, csak annyit jegyzünk meg, hogy V /H zéróeleme H, a + H additív inverze pedig −a + H. Ellen˝orizzük a vektortér axiómákat! (Megjegyezzük, hogy az alábbi egyszer˝u levezetésekben mindig tisztázzuk az összeadásjel jelentését, mert a + jel többféle értelemben is szerepel!) α ((a + H) + (b + H)) = α ((a + b) + H) = = (α(a + b)) + H = (αa + αb) + H = (αa) + H + (αb) + H. (α + β)(a + H) = ((α + β)a) + H = (αa + βa) + H = (αa) + H + (βa) + H. (αβ)(a + H) = (αβa) + H = (α(βa)) + H = α ((βa) + H) = α (β(a + H)) . 1(a + H) = (1a) + H = a + H. 10.8. Tétel. Legyen H egy végesen generált V vektortér altere. Ekkor dim V /H = dim V − dim H.
Bizonyítás: Legyen (x1 , . . . , xm ) H egy bázisa. Egészítsük ki ezt a vektorrendszert V bázisává az xm+1 , . . . , xn vektorokkal. Azt állítjuk, hogy az xm+1 + H, . . . , xn + H vektorrendszer V /H bázisa. El˝oször belátjuk ezen vektorok lineáris függetlenségét. Kombináljuk bel˝olük V /H nullvektorát: αm+1 (xm+1 + H) + . . . + αn (xn + H) = H. A skalárral való szorzás és az összeadás definíciója szerint (αm+1 xm+1 + . . . + αn xn ) + H = H, azaz αm+1 xm+1 + . . . + αn xn ∈ H. Innen következik, hogy valamennyi együttható 0, hiszen a αm+1 xm+1 + . . . + αn xn vektor H egy direkt komplementerében és H-ban is benne van, tehát csak zéróvektor lehet. Belátjuk, hogy xm+1 + H, . . . , xn + H V /H generátorrendszere. Legyen x + H ∈ V /H tetsz˝oleges lineáris sokaság. V megadott bázisával x lineárisan kombinálható: x = (α1 x1 + . . . + αm xm ) + (αm+1 xm+1 + . . . + αn xn ).
44
VEKTORTEREK
Az els˝o zárójelben lev˝o tag H-ból való, tehát x ∼ (αm+1 xm+1 + . . . + αn xn ), vagy lineáris sokaságokra áttérve: x + H = (αm+1 xm+1 + . . . + αn xn ) + H = αm+1 (xm+1 + H) + . . . + αn (xn + H), ami a bizonyítandó állítás.
3. fejezet Mátrixok, lineáris egyenletrendszerek és determinánsok 11. Muveletek ˝ mátrixokkal 11.1. Definíció. Legyenek n, m ∈ N, n, m ≥ 1 rögzített egészek, továbbá az aij skalárok (i = 1, . . . , m és j = 1 . . . , n) egy rögzített test elemei. (Ez a test nálunk leggyakrabban R, vagy esetleg C.) Az (a11 , a12 , . . . , a1n , a21 , . . . , a2n , . . . , am1 , . . . , amn ) rendezett skalár m · n-est, amit m sorban és n oszlopban a következ˝o alakban írunk fel: a11 a12 a13 · · · a1n a21 a22 a23 · · · a2n .. .. .. .. . . . . am1 am2 am3 · · · amn m × n típusú mátrixnak nevezzük. Az összes m × n típusú mátrixok halmazát Mm×n jelöli. Az el˝obbi mátrixot röviden (aij ) ∈ Mm×n jelöli. Az a1r a2r .. . amr m × 1 típusú mátrixot az el˝obbi mátrix r-edik oszlopának nevezzük (r = 1, . . . , n), míg az ¡ ¢ as1 as2 . . . asn 1 × n típusú mátrixot az s-edik sorának. Az aij elem tehát a mátrix i-edik sorának j-edik eleme. Az egyetlen oszlopból álló mátrixot oszlopmátrixnak, vagy oszlopvektornak, míg az egyetlen sorból álló mátrixot sormátrixnak vagy sorvektornak nevezzük. Egy skalárt tekinthetünk 1 × 1 45
46
MÁTRIXOK, LINEÁRIS EGYENLETRENDSZEREK ÉS DETERMINÁNSOK
típusú mátrixnak. Ha a mátrix oszlopainak a száma megegyezik a mátrix sorai számával, akkor négyzetes mátrixról beszélünk. Egy n×n típusú négyzetes mátrix f˝odiagonálisának, vagy f˝oátlójának nevezzük az (a11 , a22 , . . . , ann ) skalár n-est. Ezek az elemek a mátrix egyik „geometriai” átlójában vannak: a11 a22 . . . . ann A másik átlót mellékátlónak is hívjuk. Ha egy mátrix mindegyik eleme 0, akkor azt zérómátrixnak nevezzük. A zérómátrixot is 0 jelöli. Gyakran hasznos az A mátrix i. sorának j. elemét Aij -vel is jelölni. A paragrafus további részében m˝uveleteket értelmezünk mátrixokkal. 11.2. Definíció. Legyenek (aij ) = A ∈ Mm×n és (bij ) = B ∈ Mm×n azonos típusú mátrixok. Ezek összege az az ugyanilyen típusú A + B ∈ Mm×n mátrix, mely i-edik sorának j-edik eleme megegyezik aij + bij -vel. Úgy is fogalmazhatunk, hogy az azonos típusú mátrixokat komponensenként adjuk össze. Legyen c tetsz˝oleges skalár, (aij ) = A ∈ Mm×n tetsz˝oleges mátrix. A cA ∈ Mm×n mátrix az az ugyanilyen típusú mátrix, mely i-edik sorának j-edik eleme megegyezik caij -vel. 11.3. Tétel. Mm×n n · m dimenziós vektortér F fölött. Azaz (Mm×n , +) kommutatív csoport, melyben a zéróelem a zérómátrix, az A mátrix additív inverze a −A = −1·A mátrix. A skalárral való szorzásra pedig teljesülnek az alábbi tulajdonságok: α(A + B) (α + β)A (αβ)A 1A
= = = =
αA + αB αA + βA α(βA) A.
Bizonyítás: A mátrixok összeadásának és skalárral való szorzásának definíciója alapján valamennyi tulajdonság visszavezethet˝o a testbeli megfelel˝o m˝uveleti tulajdonságra. Mm×n -ben egy bázist úgy kapunk, hogy tekintjük azt a különböz˝o m · n darab mátrixot, melyek mindegyike egyetlen 1-est tartalmaz, a többi mátrixelem nulla. (Kanonikus bázis.) 11.4. Definíció. Legyen A ∈ Mm×n tetsz˝oleges mátrix. Ennek At = (bji )-vel jelölt transzponáltján azt az At ∈ Mn×m mátrixot értjük, melyre bji = aij . Azaz At j-edik sorának elemei rendre megegyeznek A j-edik oszlopának elemeivel. Egy mátrixot szimmetrikusnak nevezünk, ha megegyezik a transzponáltjával, míg ferdén szimmetrikusnak, ha At = −A. Könnyen beláthatók a transzponálás alábbi egyszer˝u tulajdonságai:
˝ MUVELETEK MÁTRIXOKKAL
47
11.5. Tétel. (A + B)t = At + B t (λA)t = λAt A következ˝o mátrix-m˝uvelet a szorzás. 11.6. Definíció. Legyen A ∈ Mm×n és B ∈ Mn×s : b11 . . . b1s a11 . . . a1n .. . .. B = .. A = ... . . . bn1 . . . bns am1 . . . amn Az AB ∈ Mm×s szorzatmátrixot úgy definiáljuk, hogy annak i-edik sorának k-adik eleme n X
aij bjk = ai1 b1k + ai2 b2k + · · · + ain bnk ,
i = 1 . . . m, k = 1 . . . s.
j=1
A definíció átfogalmazása a következ˝o tétel: 11.7. Tétel. Legyen A ∈ Mm×n és B ∈ Mn×s . Ha A sorvektorait A1 , . . . , Am illetve B oszlopvektorait B 1 , . . . , B s jelöli, akkor A1 B 1 · · · A1 B s .. . AB = ... . 1 Am B · · · Am B s 11.8. Definíció. n × n-es In -nel vagy ha nem okoz félreértést csak I-vel jelölt egységmátrix alatt olyan n × n típusú mátrixot értünk, melynek i-edik sorának j-edik eleme aszerint 0 vagy 1, hogy i 6= j vagy i = j. Azaz 1 0 ··· 0 0 1 · · · 0 In = .. .. .. . . . . 0 0 ··· 1 Az egységmátrix jelölésére használjuk az alábbi szimbólumut, az ún. Kronecker-deltát is: Legyen ( 1, ha i = j δij = 0, ha i 6= j. Az egységmátrix tehát: In = (δij ). Ha A négyzetes mátrix, akkor képezhet˝o AA, amelyet A2 is jelöl. Hasonlóan képezhet˝o An tetsz˝oleges pozitív egészre. A0 alatt az A-val azonos típusú egységmátrixot értjük.
48
MÁTRIXOK, LINEÁRIS EGYENLETRENDSZEREK ÉS DETERMINÁNSOK
11.9. Tétel. Legyenek A, B, C mátrixok, λ tetsz˝oleges skalár. Ekkor ha a m˝uveletek elvégezhet˝oek, akkor érvényes a disztributív szabály: A(B + C) = AB + AC, érvényes az asszociatív szabály (AB)C = A(BC), továbbá A(λB) = λ(AB).
Bizonyítás: A mátrixszorzás disztributivitása. Legyen A = (aij ) ∈ Mm×n , B = (bij ) ∈ Mn×r , C = (cij ) ∈ Mn×r . (A(B + C))ik = X X = aij (bjk + cjk ) = (aij bjk + aij cjk ) = j
X
=
X
aij bjk +
j
j
aij cjk = (AB)ik + (AC)ik .
j
Az asszociativitás: Legyen A = (aij ) ∈ Mm×n , B = (bij ) ∈ Mn×r , C = (cij ) ∈ Mr×s . ((AB)C)ik =
r X
(AB)ij cjk =
j=1
à n r X X
=
j=1
=
l=1
ail blj
cjk =
ail
à n r X X j=1
l=1
(A(BC))ik = n X
!
n X
! ail blj cjk
.
l=1
ail (BC)lk =
Ãl=1 r X
! blj cjk
j=1
=
à r n X X l=1
! ail blj cjk
.
j=1
Mindkét esetben ugyanazon index˝u mátrixelemek szorzatának összegét kaptuk meg. A harmadik tulajdonság: X X X (A(λB))ik = aij (λB)jk = aij (λbjk ) = λ aij bjk = λ (AB)ik . j
j
j
Az asszociatív szabály egyszer˝u következménye, hogy ha r, s nemnegatív egészek, és A négyzetes mátrix, akkor Ar As = As Ar = Ar+s . Könny˝u konkrét példát adni arra, hogy általában nem érvényes a mátrixszorzás kommutativitása, még négyzetes mátrixok esetén sem.
˝ MUVELETEK MÁTRIXOKKAL
49
11.10. Tétel. Legyenek A és B olyan mátrixok, hogy AB szorzatuk definiált legyen. Ekkor (AB)t = B t At .
Bizonyítás:
¡
(AB)t ¡
t
t
BA
¢ ik
¢ ik
= (AB)ki = =
X
X j
Bijt Atjk
=
j
akj bji X
bji akj .
j
11.11. Definíció. Legyen A ∈ Mn×n . Ha létezik olyan B ∈ Mn×n , hogy AB = BA = In (ahol In az n×n-es egységmátrix), akkor azt mondjuk, hogy A invertálható, s inverze a B mátrix. 11.12. Tétel. Ha egy négyzetes mátrix invertálható, akkor inverze egyértelm˝u.
Bizonyítás: Tegyük fel, hogy az A négyzetes mátrixnak B1 és B2 is inverze. Ekkor AB1 = I. Szorozzuk mindkét oldalt balról B2 -vel: (B2 A)B1 = B2 . A bal oldali zárójelben az egységmátrix szerepel, tehát B1 = B2 . Az A invertálható mátrix egyértelm˝u inverzére a A−1 jelölést alkalmazzuk. A kés˝obbiekben majd belátjuk, hogy mátrixok esetén a jobb oldali inverz egyben bal oldali inverz is, azaz inverz is (ha létezik). 11.13. Tétel. Ha az A1 , . . . , An azonos típusú négyzetes mátrixoknak van inverze, akkor van a szorzatmátrixnak is, továbbá: −1 (A1 · · · An )−1 = A−1 n · · · A1 .
Bizonyítás: −1 −1 (A1 · · · An−1 An )(A−1 n An−1 · · · A1 ) = −1 −1 −1 −1 = (A1 · · · An−1 )(An A−1 n )(An−1 · · · A1 ) = (A1 · · · An−1 )(An−1 · · · A1 ) = . . . = I.
Analóg módon számítjuk ki a másik oldali szorzást. 11.14. Tétel. Invertálható négyzetes mátrix esetén az inverzképzés és a transzponálás m˝uvelete felcserélhet˝o, azaz: (A−1 )t = (At )−1 .
Bizonyítás: Szorzással ellen˝orizzük, hogy At inverze valóban az (A−1 )t mátrix. Használjuk fel a szorzatmátrix transzponáltjára vonatkozó összefüggést! (At )(A−1 )t = (A−1 A)t = I t = I. A másik oldalról analóg módon.
50
MÁTRIXOK, LINEÁRIS EGYENLETRENDSZEREK ÉS DETERMINÁNSOK
12. A Gauss-elimináció, elemi mátrixok 12.1. Definíció. Egy mátrixon végrehajtott (elemi) sor/oszlop m˝uveleten vagy másképpen elemi sor/oszlop átalakításon a következ˝o m˝uveletek valamelyikét értjük: – egy sor/oszlop skalárszorosának hozzáadása egy másik sorhoz/oszlophoz, – két sor/oszlop felcserélése, – egy sor/oszlop szorzása egy nem zéró skalárral. Két mátrix sorekvivalens, ha egyik a másikból véges sok elemi sorátalakítással megkapható. Analóg módon definiálunk mátrixok oszlopekvivalenciáját. 12.2. Tétel. Ha az A0 mátrix az A mátrixból elemi sor- vagy oszlopm˝uvelettel származott, akkor van olyan elemi sor- vagy oszlopm˝uvelet, melyet végrehajtva A0 -b˝ol visszakapjuk A-t.
Bizonyítás: Jelölje az A i. sorát Ai . Adjuk hozzá például az A mátrix i. sorának c-szeresét a j. sorhoz (i 6= j, oszlopokra a bizonyítás analóg). Az új mátrix i. sora változatlanul Ai , míg j. sora Aj + cAi . Most adjuk hozzá az új mátrix i. sorának (−c)-szeresét a j. sorhoz. Visszakapjuk az eredeti mátrixot. Két sor (oszlop) cseréje után felcserélve ugyanezen index˝u sorokat (oszlopokat), visszakapjuk az eredeti mátrixot. Ha egy sort (oszlopot) egy c 6= 0 számmal szoroztuk, akkor ugyanezen index˝u sort (oszlopot) szorozzuk 1c -vel. Így szintén visszakapjuk az eredeti mátrixot. 12.3. Definíció. Egy mátrix egy sorának vezet˝o eleme a sor els˝o, zérustól különböz˝o eleme (azaz a legkisebb oszlopindex˝u, zérustól különböz˝o elem), ha van ilyen. Egy mátrixot lépcs˝os alakúnak nevezünk, ha rá teljesülnek az alábbi tulajdonságok: 1. A zérótól különböz˝o elemet is tartalmazó sorok megel˝ozik a csak zéróból álló sorokat. 2. Ha két közvetlenül egymást követ˝o nem csupa zéróból álló sort tekintünk, akkor a másodikban a vezet˝o elem nagyobb oszlopindex˝u, mint a megel˝oz˝o sor vezet˝o eleme. A lépcs˝os mátrixot speciálisan trapéz alakúnak nevezzük, ha a közvetlenül egymás után következ˝o sorokban a vezet˝o elemek oszlopindexe 1-gyel különbözik. Egy négyzetes mátrixot háromszög alakúnak vagy fels˝o diagonális mátrixnak nevezünk, ha teljesül, hogy aij = 0, ha i > j, azaz a f˝oátló alatti elemek mind nullák.
Megjegyzés. Lépcs˝os mátrixból oszlopcserékkel mindig elérhet˝o trapéz alakú mátrix. 12.4. Tétel. Minden mátrix sorekvivalens egy lépcs˝os mátrixszal.
A GAUSS-ELIMINÁCIÓ, ELEMI MÁTRIXOK
51
Bizonyítás: A következ˝o bizonyításban leírt eljárást nevezik Gauss-eliminációnak. Válasszuk ki azt a legkisebb oszlopindex˝u oszlopot, amelyben van zérótól különböz˝o elem. Ha ez nem az els˝o oszlop, akkor ez azt jelenti, hogy ett˝ol az oszloptól balra csak zéróelem van a mátrixban, tehát elemi sorátalakítások során ezek az oszlopok nem változnak. Az egyszer˝uség kedvéért ezeket az oszlopokat elhagyjuk. Ekkor az els˝o oszlopban van zérótól különböz˝o elem. Sorcserével elérhet˝o, hogy ez az elem az els˝o sorban legyen. Mátrixunk tehát sorekvivalens egy a11 a12 . . . a1n a21 a22 . . . a2n .. .. .. . . . am1 am2 . . . amn mátrixszal, s a11 6= 0. (Valójában az els˝o oszloptól balra lehetnek még csak zérust tartalmazó oszlopok.) Az els˝o sor (−a21 /a11 )-szeresét adjuk hozzá a második sorhoz! A következ˝o mátrixot kapjuk: a11 a12 . . . a1n 0 a0 . . . a02n 22 .. .. . .. . . . am1 am2 . . . amn Analóg elemi sorátalakítást végzünk a többi sorral is, tehát az els˝o sor −(ai1 /a11 )-szeresét hozzáadjuk az i-edik sorhoz. Az eredmény egy olyan mátrix, melyben az els˝o oszlopban az els˝o sorbeli zérótól különböz˝o elem alatt csupa nulla van. a11 a12 . . . a1n 0 a0 . . . a02n 22 .. .. .. . . . . 0 0 0 am2 . . . amn Ezt az eljárást folytatjuk, úgy, hogy az els˝o sort már nem változtatjuk, azaz csak a 0 a022 . . . a02n .. .. .. . . . . 0 0 0 am2 . . . amn mátrixon végzünk elemi sorátalakítást. Itt az els˝o oszlopban csak zéróelem van, tehát az el˝obbi eljárást az eggyel kevesebb oszlopot tartalmazó a022 . . . a02n .. .. . . a0m2 . . . a0mn mátrixon ismételjük meg. Az eljárást folytatva az oszlopok számát mindig legalább eggyel csökkentjük, tehát az eljárás véges sok lépésben véget ér. (Szigorúbb formában indukcióval lehetne a bizonyítást leírni.)
52
MÁTRIXOK, LINEÁRIS EGYENLETRENDSZEREK ÉS DETERMINÁNSOK
12.5. Definíció. Elemi mátrixoknak nevezzük az egységmátrixból elemi sorátalakítással kapott mátrixokat.
Példa. Példa a három típusra. 12.6. Tétel. Amilyen elemi sorátalakítással származik az E elemi mátrix az egységmátrixból, olyan elemi sorátalakítással származik az EA mátrix az A mátrixból.
Bizonyítás: A tétel 3 állítása (ti. a lehetséges elemi sorátalakítások száma 3) közül csak egyet látunk be, a másik kett˝o bizonyítása hasonló. El˝oször egy jelölést vezetünk be. Jelölje Irs azt az m × m-es mátrixot, melynek minden eleme zéró, kivéve az r-edik sor s-edik elemét (1 ≤ r, s ≤ m), amely 1: 0 .......... 0 .. .. . . Irs = 0 . . . . 1rs . . . . 0 . .. .. . 0 .......... 0 Könnyen ellen˝orizhet˝o, hogy ha A = (aij ) ∈ Mm×n tetsz˝oleges mátrix, akkor 0 .......... 0 .. .. . . Irs A = as1 . . . . . . . . . . asn ← r. sor, . .. .. . 0 .......... 0 azaz a szorzatmátrix r-edik sora megegyezik A s-edik sorával, s az összes többi mátrixelem zérus. Speciálisan Irr -rel való szorzás hatása az, hogy A minden elemét zérusra cseréli, kivéve az r-edik sort, amit változatlanul hagy. Ha az Irs + Isr mátrixszal szorzunk, akkor az el˝oz˝oek szerint (Irs + Isr )A az a mátrix, melyben az s-edik sorban A r-edik sora áll, az r-edik sorban A s-edik sora, a többi mátrixelem pedig nulla. Legyen E olyan mátrix, melyet az m × m-es egységmátrixból az r-edik és az s-edik sor felcserélésével kaptunk, továbbá legyen A tetsz˝oleges m × n-es mátrix. Ekkor az EA mátrix az A mátrixból úgy kapható, hogy felcseréljük az r-edik és az s-edik sort. E a következ˝o alakban írható fel: c E = Irs + Isr + I11 + · · · + Ic rr + · · · + Iss + · · · + Imm , ahol a kalap a tag hiányát jelzi. Számítsuk ki az EA szorzatot: d EA = Irs A + Isr A + I11 A + · · · + Id rr A + · · · + Iss A + · · · + Imm A. A jobb oldalon pontosan az A mátrix áll az r-edik és s-edik sorának cseréjét˝ol eltekintve. A Gauss-elimináció az elemi mátrixok nyelvén a következ˝ot jelenti: 12.7. Tétel. Minden mátrixot véges sok elemi mátrixszal balról szorozva lépcs˝os mátrix kapható.
NÉGYZETES MÁTRIXOK INVERTÁLHATÓSÁGA
53
13. Négyzetes mátrixok invertálhatósága A következ˝oekben kiderül, hogy az el˝oz˝oekben megismert Gauss-eliminációval egyszer˝uen el lehet dönteni, hogy egy mátrix invertálható-e, s ha igen, meg lehet határozni az inverzmátrixot. 13.1. Tétel. Minden elemi mátrix invertálható.
Bizonyítás: Az elemi mátrixok tehát a következ˝ok: a. az olyan mátrixok, melyeket úgy kaptunk az n × n-es egységmátrixból, hogy az r-edik sort szoroztuk egy c 6= 0 számmal, b. az olyan mátrixok, melyeket az n × n-es egységmátrixból az i-edik és j-edik sor felcserélésével kaptunk, c. az olyan mátrixok, melyeket az n × n-es egységmátrixból úgy kapunk, hogy az r-edik sor c-szeresét hozzáadjuk az s-edik sorhoz, miközben r 6= s. Az a. esetben az A inverzmátrix az egységmátrixtól abban különbözik, hogy a diagonálisban az r-edik sorban 1 helyett 1c van. (Tehát az inverzmátrix is elemi mátrix.) Mivel az E-vel való szorzás (balról) ilyenkor az A r-edik sorának c-vel való szorzását jelenti, ezért EA valóban egységmátrix. Az AE szorzat szintén egységmátrixot eredményez, mert az A-val való szorzás most E r-edik sorának 1c -vel való szorzását jelenti. A b. esetben az elemi mátrix inverze önmaga, mert az r-edik és az s-edik sor kétszer végrehajtott cseréje az egységmátrixot eredményezi. A c. esetben is az elemi mátrixot jelölje E. A C-vel jelölt inverzét az egységmátrixból úgy kapjuk, hogy az egységmátrix r-edik sorának (−c)-szeresét hozzádjuk az s-edik sorhoz. Így C szintén elemi mátrix. A 12.6. tételb˝ol tudjuk, hogy EC és CE is az egységmátrix. 13.2. Tétel. Legyen A négyzetes mátrix, A0 pedig hozzá sorekvivalens mátrix. A akkor és csakis akkor invertálható, ha A0 is.
Bizonyítás: Ha A sorekvivalens A0 -vel, akkor léteznek olyan E1 , . . . , Ek elemi mátrixok, hogy A0 = E1 · · · Ek A. Tegyük fel, hogy A invertálható. Ekkor a jobb oldalon minden tényez˝o invertálható, tehát a bal oldal is invertálható, és A0−1 = A−1 Ek−1 · · · E1−1 . Megfordítva, ha A0 sorekvivalens A-hoz, akkor ez megfordítva is teljesül, s az el˝oz˝o bizonyításrész megismételhet˝o. A következ˝o tétel egy szükséges és elégséges feltételt ad mátrixok invertálhatóságára. (A félév során még két ilyen feltételt fogunk megtanulni.)
54
MÁTRIXOK, LINEÁRIS EGYENLETRENDSZEREK ÉS DETERMINÁNSOK
13.3. Tétel. Egy négyzetes mátrix akkor és csakis akkor invertálható, ha sorekvivalens az (ugyanolyan típusú) egységmátrixhoz.
Bizonyítás: Legyen az A négyzetes mátrix sorekvivalens az egységmátrixhoz. Az el˝oz˝o tétel szerint ekkor invertálható. Megfordítva, legyen A invertálható. Tudjuk, hogy A sorekvivalens egy lépcs˝os mátrixhoz, amely tehát invertálható. Ebben a lépcs˝os mátrixban nem lehet csupa zéróból álló sor, hiszen akkor az nem lenne invertálható (a mátrixszorzás definícióját használva). Ez azt jelenti, hogy a lépcs˝os mátrix valójában egy háromszög alakú mátrix: a11 a12 · · · a1n 0 a22 · · · a2n . . . . . . ... 0 0 · · · ann és a f˝odiagonálisban nincs egyetlen zéró elem sem. Szorozzuk meg az i-edik sort 1 a012 · · · a01n 0 1 · · · a02n . . . . . . . . . . 0 0 ··· 1
1 -vel: aii
Most az utolsó sor (−a0in )-szeresét adjuk hozzá az i-edik sorhoz, i = 1, . . . , n − 1. Így az utolsó oszlopban az utolsó elem kivételével minden elem zérus lett: 1 a0012 · · · 0 0 1 ··· 0 . . . . . . . . . . 0 0 ··· 1 Ha ezt az eljárást elvégezzük az utolsó el˝otti,. . . , a 2. sorral is akkor az egységmátrixot kapjuk meg, ahonnan következik állításunk. (Tulajdonképpen a Gauss-eliminációt végezzük el visszafelé.) A bizonyítás második részéb˝ol külön is kiemeljük az alábbi állítást: 13.4. Következmény. Minden olyan háromszög alakú mátrix invertálható, melynek f˝odiagonálisában nincs zéró elem. 13.5. Tétel. Legyen A egy invertálható mátrix. A és A−1 egyaránt felírhatók elemi mátrixok szorzataként.
Bizonyítás: Ha A invertálható, akkor sorekvivalens az egységmátrixszal. Mivel a Gauss eliminációt el tudjuk végezni elemi mátrixok szorzásával, ezért léteznek olyan E1 , . . . , Ek elemi mátrixok, hogy Ek · · · E1 A = I.
MÁTRIX RANGJA
55
A bal oldalon szerepl˝o elemi mátrixok inverzével rendre beszorozva: A = E1−1 · · · Ek−1 , illetve A−1 = Ek · · · E1 .
Az el˝oz˝oekben leírt módszer egyszer˝u gyakorlati módszert ad mátrixok invertálhatóságának eldöntésére és az inverzmátrix meghatározására.
Megjegyzés. (Mátrix invertálása szimultán Gauss-eliminációval.) Legyen adva egy A négyzetes mátrix, melyet Gauss-eliminációval egységmátrixszá alakítottunk: Ek · · · E1 A = I. A mátrix tehát invertálható és inverze: A−1 = Ek · · · E1 = Ek · · · E1 I. Ez azt jelenti, hogy ha az A mátrixot Gauss-eliminációval, azaz elemi sorátalakításokkal egységmátrixszá alakítjuk, s ugyanezeket az elemi sorátalakításokat végrehajtjuk az egységmátrixon, a végeredmény A inverze lesz. Tehát az eliminációt egyszerre, szimultán hajtjuk végre a két mátrixon, de az elemi sorátalakításokat az A határozza meg, az egységmátrix csak „elszenvedi”. (A módszer végrehajtásakor természetesen nem kell az elemi mátrixokat felírni, azoknak csak a bizonyításnál van szerepük.) Gyakorlatilag leírjuk egymás mellé az invertálandó mátrixot (bal oldal) és az egységmátrixot (jobb oldal), majd 1. Gauss-eliminációval lépcs˝os alakúra hozzuk ezt a „hosszú” mátrixot. Ha a bal oldali négyzetes mátrix nem tartalmaz csupa zéróból álló sort (háromszög alakú és a f˝oátlóban nincs zérus), akkor a mátrix invertálható, s az eljárást folytatjuk. 2. Elemi sorátalakításokkal alulról fölfelé haladva elérjük, hogy a bal oldalon egységmátrix legyen. A jobb oldalon az inverzmátrix van.
14. Mátrix rangja 14.1. Definíció. Egy (véges) vektorrendszer rangján a vektorrendszer által generált altér dimenzióját értjük. Legyen A ∈ Mm×n mátrix. Az A oszlopvektorai Fm egy alterét generálják. Ennek dimenzióját az A oszloprangjának mondjuk. Az A sorvektorai Fn egy alterét generálják. Ennek dimenziója a mátrix sorranga.
56
MÁTRIXOK, LINEÁRIS EGYENLETRENDSZEREK ÉS DETERMINÁNSOK
A szakasz f˝o tétele a kés˝obbiekben kimondja, hogy minden mátrix oszlop- és sorrangja megegyezik. 14.2. Tétel. A ∈ Mm×n , X1 , . . . , Xk ∈ Fn = Mn×1 . Ekkor rang (AX1 , . . . , AXk ) ≤ rang (X1 , . . . , Xk ) .
Bizonyítás: Az állítás onnan következik, hogy ha (X1 , . . . , Xk ) lineárisan függ˝o vektorrendszer, akkor (AX1 , . . . , AXn ) is: A(α1 X1 + · · · + αn Xn ) = α1 AX1 + · · · + αn AXn ; azaz, ha a bal oldalon a lineáris kombináció zérusvektort ad, akkor a jobb oldalon is. Tehát ha az (AX1 , . . . , AXn ) vektorrendszerb˝ol lineárisan független részrendszert választunk ki, akkor a megfelel˝o vektorok az (X1 , . . . , Xn ) vektorrendszerb˝ol szintén lineárisan függetlenek. (Függ˝oek nem lehetnek az el˝oz˝o észrevétel szerint.) 14.3. Tétel. Egy elemi sorm˝uvelet nem változtatja meg a mátrixnak sem a sorrangját, sem az oszloprangját. Hasonlóan, egy elemi oszlopm˝uvelet nem változtatja meg a mátrixnak sem a sorrangját, sem az oszloprangját.
Bizonyítás: (Sorcserére.) Két sor cseréje nyilván nem változtatja meg a sorrangot: a sorok által generált vektortér nem változik, ha a generáló vektorokat más sorrendben adjuk meg. Most adjuk hozzá egy sor skalárszorosát egy mások sorhoz, vagy szorozzunk egy sort egy nem zéró skalárral. Az egyszer˝uség kedvéért tegyük fel, hogy a második sor c-szeresét adjuk hozzá az els˝o sorhoz, vagy az els˝o sort szorozzuk c 6= 0-val. (Más indexekre analóg gondolatmenet alkalmazható.) Az új, B-vel jelölt mátrix sorai tehát: B1 = A1 + cA2 , A2 , · · · , Am . vagy B1 = cA1 , A2 , · · · , Am . B sorainak, azaz a B1 , A 2 , · · · , A m vektoroknak minden lineáris kombinációja egyben az A1 , A2 . . . Am soroknak is lineáris kombinációja, azaz L(B1 , A2 , . . . , Am ) ⊂ L(A1 , A2 , . . . , Am ). Az altér dimenziója a bennfoglaló vektortér dimenziójánál nagyobb nem lehet, azaz sorrang B ≤ sorrang A. Most a B mátrixból állítsuk vissza az eredeti A mátrixot (ld. 12.2. tétel). Az el˝obbi gondolatmenet megismételhet˝o, azaz sorrang A ≤ sorrang B,
MÁTRIX RANGJA
57
azaz sorrang A = sorrang B. Most belátjuk, hogy elemi sorátalakítás nem változtatja meg az oszloprangot. El˝oször azt vegyük észre, hogy ha (e1 , . . . , en ) jelöli Fn kanonikus bázisát, akkor oszloprang A = rang(Ae1 , . . . , Aen ), hiszen a jobb oldali vektorrendszer vektorai pontosan A oszlopai, amelyeket jelöljön a továbbiakban (A1 , . . . , An ). Írjuk le az elemi sorátalakítást az E elemi mátrixszal való balszorzással. oszloprang(EA) = rang(EAe1 , . . . , EAen ) = = rang(EA1 , . . . , EAn ) ≤ rang(A1 , . . . , An ) = = oszloprang A. Tehát oszloprang EA ≤ oszloprang A. Az el˝oz˝o gondolatmenetet ismételten alkalmazva: oszloprang A = oszloprang(E −1 EA) ≤ oszloprang(EA), ahonnan következik állításunk. 14.4. Tétel. (Mátrixok rangszámtétele.) Minden mátrix oszloprangja megegyezik a sorrangjával. (Ezt a közös értéket a mátrix rangjának nevezzük és rang A-val jelöljük.)
Bizonyítás: Az állítás következik az alábbi állításból: Legyen A egy r sorrangú mátrix. Sorm˝uveletek és oszlopm˝uveletek véges sorozatával a mátrix olyan alakra hozható, hogy a diagonális els˝o r eleme 1, a mátrix összes többi eleme 0: 1 0 ... 0 0 1 ... 0 . . . ∈ Mm×n . 0 0 ... 1
0
0
A mátrixot sorm˝uveletekkel hozzuk lopcserékkel) trapéz alakra: a11 0 0
0
el˝oször lépcs˝os alakra, majd oszlopm˝uveletekkel (osz a12 . . . a1s . . . a22 . . . a2s . . . .. . .a11 6= 0, a22 6= 0, . . . , ass 6= 0 0 . . . ass . . .
0
58
MÁTRIXOK, LINEÁRIS EGYENLETRENDSZEREK ÉS DETERMINÁNSOK
Itt az els˝o s sor azonban lineárisan független, továbbá a sorrang az elimináció során nem változott meg, tehát s = r. Most az 1. oszlop (−a1i /a11 )-szeresét adjuk hozzá az i-edik oszlophoz (i = 2, . . . , n)! Az alábbi mátrixot kapjuk:
a11 0 0 a22 0 0
... 0 0 . . . a2s . . . .. . . . . . ass . . .
0
Analóg módon eljárva az els˝o r sornál, valóban a megadott alakot kapjuk. Ennek a mátrixnak azonban nyilvánvalóan az oszloprangja és sorrangja is r, továbbá az egész eljárás során egyik rang sem változott, tehát az eredeti mátrix sorrangja és oszloprangja is r (egyenl˝o). 14.5. Következmény. Mátrix rangja és a transzponáltja rangja megegyezik. 14.6. Tétel. Egy n × n-es négyzetes mátrix akkor és csakis akkor invertálható, ha rangja n.
Bizonyítás: Egy n × n típusú négyzetes mátrix akkor és csakis akkor invertálható, ha sorekvivalens az n × n-es egységmátrixhoz. Utóbbinak azonban a rangja n. 14.7. Tétel. rang(AB) ≤ min{rang A, rang B}. Ha B invertálható, akkor rang(AB) = rang(BA) = rang(A).
Bizonyítás: A már ismert ötlettel belátjuk, hogy szorzat rangja nem nagyobb a második tényez˝o rangjánál: rang(AB) = rang(ABe1 , . . . , ABen ) = rang(AB1 , . . . , ABn ) ≤ rang B. Most ugyanezt alkalmazzuk a transzponáltakra: rang(AB) = rang(AB)t = rang(B t At ) ≤ rang At = rang A. Ha B invertálható: rang A = rang(ABB −1 ) ≤ rang(AB) ≤ rang A, rang A = rang(B −1 BA) ≤ rang(BA) ≤ rang A.
59
LINEÁRIS EGYENLETRENDSZEREK
15. Lineáris egyenletrendszerek 15.1. Definíció. Legyen A = (aij ) ∈ Mm×n egy mátrix, b1 , . . . , bm pedig skalárok. Lineáris egyenletrendszernek nevezzük az alábbi egyenletrendszert: a11 x1 + · · · + a1n xn .. .
=
b1 .. .
(∗)
am1 x1 + · · · + amn xn = bm . Az n számot az ismeretlenek számának, míg m-et az egyenletek számának nevezzük. Bevezetve az ismeretlenekb˝ol és a jobb oldali skalárokból képezett b1 x1 .. .. X= . B= . xn
bm
oszlopmátrixokat, a (∗) lineáris egyenletrendszert az alábbi rövidített formában is felírhatjuk: AX = B, illetve az A mátrix A1 , . . . , Am soraival: A 1 X = b1 .. .. . . Am X = bm . A (∗) lineáris egyenletrendszer alapmátrixának nevezzük az A mátrixot, míg b˝ovített alapmátrixának a a11 a12 · · · a1n b1 a21 a22 · · · a2n b2 .. .. .. . . . am1 am2 · · · amn bm mátrixot. Ezt röviden (A|B)-vel is jelöljük. Ha a b1 , . . . , bm skalárok mindegyike zéró, akkor homogén lineáris egyenletrendszerr˝ol beszélünk, míg ellenkez˝o esetben inhomogén lineáris egyenletrendszerr˝ol. A (∗) lineáris egyenletrendszerhez asszociált homogén lineáris egyenletrendszer alatt az a11 x1 + · · · + a1n xn .. .
= 0 .. .
am1 x1 + · · · + amn xn = 0. lineáris egyenletrendszert értjük.
(∗∗)
60
MÁTRIXOK, LINEÁRIS EGYENLETRENDSZEREK ÉS DETERMINÁNSOK
Egy (ξ1 , . . . , ξn ) skalár n-est a (∗) lineáris egyenletrendszer megoldásának nevezzük, ha teljesül a11 ξ1 + · · · + a1n ξn = b1 .. .. . . am1 ξ1 + · · · + amn ξn = bm . Triviális megoldás alatt a csupa zéró elemb˝ol álló megoldást nevezzük. Az ett˝ol különböz˝o megoldást pedig nem triviális megoldásnak. 15.2. Tétel. (Lineáris egyenletrendszerek megoldásának szerkezete.) Legyen A ∈ Mm×n . Az AX = 0 homogén lineáris egyenletrendszer megoldásai n − rang A dimenziós alteret alkotnak Fn -ben. Az AX = B megoldható lineáris egyenletrendszer megoldóvektorai lineáris sokaságot alkotnak, ennek iránytere megegyezik az AX = 0 homogén lineáris egyenletrendszer megoldásterével.
Bizonyítás: A dimenzióra vonatkozó tételt kés˝obb bizonyítjuk be. A homogén eset. A megoldáshalmaz nyilván nem üres, mert Fn zéróvektora megoldás. Ha X1 ill. X2 két megoldás, továbbá α skalár, akkor a mátrixm˝uveletek megfelel˝o tulajdonságait használva: A(X1 + X2 ) = AX1 + AX2 = 0, A(αX1 ) = αAX1 = 0. Azaz két megoldás összege, megoldás skalárszorosa megoldás. Az inhomogén eset. Legyen X1 és X2 két (nem feltétlenül különböz˝o) megoldás. A(X1 − X2 ) = AX1 − AX2 = B − B = 0, amib˝ol az állítás következik. 15.3. Tétel. Ha egy lineáris egyenletrendszer b˝ovített alapmátrixa sorekvivalens egy másik lineáris egyenletrendszer b˝ovített alapmátrixával, akkor a két lineáris egyenletrendszer ekvivalens, azaz ugyanazok a megoldásaik.
Bizonyítás: Legyen AX = B a szóban forgó lineáris egyenletrendszer, a sorátalakítást pedig írjuk le az E elemi mátrixszal való balszorzással. Ha AX = B teljesül, akkor (EA)X = E(AX) = EB, tehát (EA)X = (EB) is A lineáris egyenletrendszerek megoldásának „filozófiája” a következ˝o: A kib˝ovített alapmátrixot elemi sorátalakításokkal lépcs˝os alakúra hozzuk, mivel az így kapott lineáris egyenletrendszer ekvivalens az eredetivel, ezért elegend˝o ezt az egyszer˝u szerkezet˝u lineáris egyenletrendszert megoldani. A lépcs˝os mátrixú lineáris egyenletrendszerek megoldása valóban egyszer˝u. 15.4. Tétel. Egy lineáris egyenletrendszernek legyen lépcs˝os a kib˝ovített alapmátrixa. Ez az egyenletrendszer akkor és csakis akkor megoldható, ha nincs a kib˝ovített alapmátrixban olyan sor, melyben csak az utolsó elem zérótól különböz˝o.
LINEÁRIS EGYENLETRENDSZEREK
61
Bizonyítás: Ha a kib˝ovített alapmátrixban van olyan sor, amelyben csak az utolsó elem zérótól különböz˝o, akkor az egyenletrendszer nyilván nem oldható meg. Be kell látni a megfordítást, azaz ellenkez˝o esetben van az egyenletrendszernek megoldása. Az egyes egyenletekben a tagok megfelel˝o átrendezésével, majd az együtthatók és az ismeretlenek indexének ennek megfelel˝o átírásával elérhet˝o, hogy az egyenletrendszer a következ˝o alakú: a11 x1 + a12 x2 + · · · + a1k xk + a1,k+1 xk+1 + · · · + a1n xn = b1 , a11 6= 0 a22 x2 + · · · + a2k xk + a2,k+1 xk+1 + · · · + a2n xn = b2 , a22 6= 0 ......... akk xk + ak,k+1 xk+1 + · · · + akn xn = bk , akk 6= 0, ahol a 0 = 0 sorokat nem írtuk ki. Ennek az egyenletrendszernek a megoldását a következ˝oképpen kapjuk meg: xn = ξn ∈ R tetsz˝oleges .. . xk+1 = ξk+1 ∈ R tetsz˝oleges, majd az utolsó egyenletb˝ol kifejezzük xk -t: xk = −
ak,k+1 akn bk ξk+1 − · · · − ξn + . akk akk akk
Mivel akk 6= 0, ezt valóban megtehettük. Visszafelé haladva a következ˝o sorból kifejezzük xk−1 t, és így tovább, végül az els˝o sorból x1 -et. Most bebizonyítjuk a megoldástér dimenziójára (korábban) kimondott tételt. Tekintsük az ún. bázismegoldásokat! Ezeket úgy kapjuk, hogy egy szabadon választható ismeretlennek az 1 értéket adjuk, a többinek 0-t. Ezt n−k = n−rang A féleképpen tehetjük meg. Az el˝oz˝oek szerint ezekb˝ol a lineárisan független bázismegoldásokból az összes megoldás lineárisan kombinálható. Alkalmazzuk ezt a tételt a homogén lineáris egyenletrendszerek megoldására: 15.5. Következmény. Ha egy homogén lineáris egyenletrendszerben az ismeretlenek száma nagyobb, mint az egyenletek száma, akkor annak van triviálistól különböz˝o megoldása. 15.6. Tétel. (Kronecker–Capelli tétel.) Egy lineáris egyenletrendszer akkor és csakis akkor oldható meg, ha alapmátrixának rangja megegyezik a b˝ovített alapmátrix rangjával. (A tétel igaz homogén és inhomogén lineáris egyenletrendszerekre is, csak a homogén esetben semmitmondó.)
Bizonyítás: A lineáris egyenletrendszer mátrixalakja legyen AX = B, A oszlopai legyenek A1 , . . . , An . Ha az egyenletrendszer megoldható, akkor léteznek olyan ξ1 , . . . , ξn skalárok, hogy ξ1 A1 + · · · + ξn An = B,
62
MÁTRIXOK, LINEÁRIS EGYENLETRENDSZEREK ÉS DETERMINÁNSOK
azaz B ∈ L(A1 , . . . , An ), tehát rang(A1 , . . . , An ) = rang(A1 , . . . , An , B), ami azt jelenti, hogy az alapmátrix rangja megegyezik a b˝ovített alapmátrix rangjával. Most induljunk ki abból, hogy az rang A = rang (A, B). Válasszunk ki egy bázist az A1 , . . . , An vektorrendszerb˝ol! Ugyanez a kiválasztott vektorrendszer egyben A1 , . . . , An , B bázisa is lesz a feltétel miatt. B tehát lineárisan kombinálható a kiválasztott bázisból, azaz az ennél nem sz˝ukebb A1 , . . . , An vektorrendszerb˝ol is. (A bázisban szerepl˝o vektorok együtthatója legyen B megfelel˝o koordinátája, a többi együttható pedig 0.) Az így kapott együtthatók az eredeti lineáris egyenletrendszer megoldását adják.
16. A determinánsfüggvény tulajdonságai A fejezet els˝o definíciója el˝ott ismételjük át a harmadrend˝u determináns fogalmát! 16.1. Definíció. Legyen A = nánsán a ¯ ¯ a11 jel. ¯¯ . det A = ¯ .. ¯ ¯an1
(aij ) ∈ Mn×n négyzetes mátrix. Ennek det A-val jelölt determi¯ a12 . . . a1n ¯¯ X .. .. ¯ = ε(σ) · a1σ(1) · a2σ(2) · · · anσ(n) . . ¯¯ σ an2 . . . ann ¯
számot értjük, ahol az összegzés kiterjed az (1, 2, . . . , n) számok összes σ permutációjára; továbbá ( 1, ha σ páros permutáció ε(σ) = −1, ha σ páratlan permutáció. n-et a determináns rendjének is nevezzük. A det leképezést, amely minden n × n-es mátrixhoz hozzárendeli a determinánsát, n-edrend˝u determinánsfüggvénynek is nevezzük.
Megjegyzés. Azaz egy n-edrend˝u mátrix determinánsát a definíció szerint úgy számíthatjuk ki, hogy egy n! tagú összeget képezünk, melyben minden tag egy n tényez˝os szorzat. A szorzat tényez˝oit úgy kapjuk, hogy A minden sorából kiválasztunk pontosan 1 elemet úgy, hogy közben minden oszlopból is pontosan 1 elem szerepeljen. Ezt +1-gyel vagy −1-gyel szorozzuk aszerint, hogy a kiválasztott elemek oszlopindexei az (1, 2, . . . , n) számoknak páros vagy páratlan permutációját alkotják, miközben a sorindexek természetes sorrendben vannak. Definíció alapján csak els˝o-, másod-, vagy harmadrend˝u determinánst, vagy speciális alakú mátrix determinánsát érdemes kiszámolni. Gondoljunk arra, hogy egy általános 4 × 4 típusú mátrix determinánsához már 24 tagot kell összegezni. Els˝orend˝u determinánsra: det(a) = a. A másodrend˝u és harmadrend˝u determináns kiszámítását már ismerjük. Néhány speciális alakú mátrix determinánsa közvetlenül a definíció alapján is egyszer˝uen kiszámítható: 16.2. Tétel. Ha egy mátrix tartalmaz csak zérusból álló sort, akkor determinánsa 0. Egy háromszög alakú mátrix determinánsa megegyezik a f˝oátlóbeli elemek szorzatával. Speciálisan, tetsz˝oleges típusú egységmátrix determinánsa 1.
A DETERMINÁNSFÜGGVÉNY TULAJDONSÁGAI
63
Vezessük be az alábbi jelölést! Legyen A egy n × n-es mátrix, x ∈ Fn pedig egy sorvektor. Ai (x) jelölje azt az n × n-es mátrixot, melyet az A mátrixból úgy kapunk, hogy az i-edik sort x-re cseréljük. 16.3. Tétel. A determinánsfüggvény rendelkezik az alábbi tulajdonsággal: ∀i ∈ {1, . . . , n}: det Ai (αx + βy) = α det Ai (x) + β det Ai (y). (Linearitás a sorokban.)
Bizonyítás: Válasszuk ki a determináns egy tagját! i
^
ε(σ)a1σ(1) · · · (αxσ(i) + βyσ(i) ) · · · anσ(n) = = ε(σ)α · a1σ(1) · · · xσ(i) · · · anσ(n) + ε(σ)β · a1σ(1) · · · yσ(i) · · · anσ(n) = = α det Ai (x) + β det Ai (y).
A következ˝oekben egy egyszer˝u módszert adunk egy mátrix determinánsának kiszámítására. Elemi sorátalakításokkal (akár sor skalárral való szorzása nélkül is) a mátrixot lépcs˝os alakra hozzuk. Ennek determinánsa már könnyen kiszámítható. Azt kell megvizsgálnunk, hogy elemi sorátalakításokkal hogyan változik a determináns értéke. 16.4. Tétel. (A determináns értékének változása elemi sorátalakításnál.) Ha a B mátrix az A-ból két sor felcserélésével keletkezik, akkor det B = − det A. Ha a B mátrix az A négyzetes mátrixból úgy keletkezett, hogy egy sort szoroztunk egy λ 6= 0 skalárral, akkor det B = λ det A. Ha a B mátrix az A négyzetes mátrixból úgy keletkezett, hogy egy sor skalárszorosát hozzáadtuk egy másik sorhoz, akkor det B = det A.
Bizonyítás: Ha a mátrixban két sort felcserélünk, akkor az eredeti determináns minden tagja tagja az új determinánsnak is, de a sorcsere miatt az oszlopindexekben az inverziók számának paritása megváltozik, tehát minden tag ellentétes el˝ojellel szerepel. Ennek az állításnak közvetlen következménye, hogy ha egy négyzetes mátrixban két sor megegyezik, akkor a mátrix determinánsa 0: valóban, sorcserével a mátrix determinánsa el˝ojelet vált, ugyanakkor egyenl˝o sorok esetén sorcserével a determináns nyilván nem változik meg, ezért értéke csak nulla lehet, ez az egyetlen szám, amely megegyezik ellentettjével. A második tulajdonság a linearitás közvetlen következménye (annak egy speciális esete): det Ai (λx) = λ(det Ai (x)). A harmadik tulajdonság bizonyításához tegyük fel, hogy a mátrix i-edik sorához, amit x jelöl, hozzáadjuk az y-nal jelölt j-edik sor λ-szorosát (i 6= j). det Ai (x + λy) = det Ai (x) + λ det Ai (y) = det Ai (x), mert Ai (y)-ban van két egyenl˝o sor. = det A, mert Ai (x) = A.
64
MÁTRIXOK, LINEÁRIS EGYENLETRENDSZEREK ÉS DETERMINÁNSOK
Megjegyzés. Minden elemi sorátalakítás elérhet˝o egy elemi mátrixszal való szorzással. Ez alapján az el˝oz˝o tételt átfogalmazhatjuk. 1. det(EA) = − det A 2. det(E 0 A) = λ det A 3. det(E 00 A) = det A ahol E az egységmátrixból sorcserével származik; E 0 az elemi mátrixból úgy származik, hogy egy sort szoroztunk egy nem zéró λ skalárral; E 00 pedig úgy, hogy az egységmátrix egy sorának skalárszorosát hozzáadtuk egy másik sorhoz. A 16.4. következménye az alábbi állítás: 16.5. Következmény. Elemi sorátalakítás zéró determinánsú mátrixot zéró determinánsú mátrixba, nem zéró determinánsú mátrixot nem zéró determinánsú mátrixba visz át.
Bizonyítás: Elemi sorátalakítás során vagy megváltozik a determináns el˝ojele (sorcsere); vagy a determináns értéke szorzódik egy nem zéró skalárral (a mátrix egy sorát szorozzuk egy nemzéró skalárral); vagy nem változik a determináns értéke (a mátrix egy sorának skalárszorosát hozzáadjuk egy másik sorhoz). Mindhárom esetben a determináns elt˝un˝o vagy nem elt˝un˝o volta megmarad. 16.6. Tétel. Legyen A egy négyzetes mátrix! Ha A sorai lineárisan függetlenek, akkor det A 6= 0, ha a sorok lineárisan függ˝o vektorrendszert alkotnak, akkor det A = 0. Azaz egy n-edrend˝u négyzetes mátrix rangja akkor és csakis akkor n, ha determinánsa nem zéró. Kiegészíthetjük a tételt azzal is, hogy egy négyzetes mátrix akkor és csakis akkor invertálható, ha determinánsa nem zéró.
Bizonyítás: Hozzuk elemi sorátalakításokkal az A mátrixot lépcs˝os alakra! Két eset lehetséges. Ha A sorai lineárisan függ˝ok, akkor olyan B mátrixhoz jutunk, melyben van csak zéróból álló sor, tehát determinánsa 0. Az el˝oz˝o következmény miatt: det B = 0 =⇒ det A = 0. Ha A sorai lineárisan függetlenek, akkor háromszög alakú mátrixhoz jutunk (zérótól különböz˝o f˝oátlóbeli elemekkel), s további elemi sorátalakításokkal elérhetjük az egységmátrixot is (egy mátrix akkor és csakis akkor invertálható – azaz sorai lineárisan függetlenek –, ha sorekvivalens az egységmátrixhoz). Az egységmátrix determinánsa 1, azaz 6= 0, s innen az állítás szintén az el˝oz˝oekb˝ol következik. 16.7. Tétel. (Szorzástétel.) Legyenek A és B azonos rend˝u négyzetes mátrixok. Ekkor det(A · B) = (det A) · (det B).
A DETERMINÁNSFÜGGVÉNY TULAJDONSÁGAI
65
Bizonyítás: Az els˝o lépésben azt bizonyítjuk, hogy az állítás igaz, ha A elemi mátrix. Ha az E elemi mátrix az egységmátrixból sorcserével keletkezett, akkor det E = −1, továbbá EB olyan mátrix, mely B-b˝ol sorcserével keletkezett. Tehát det(EB) = − det B = det E det B. Ha E 0 = Ii (λx) (x az egységmátrix i-edik sora), akkor det E 0 = λ · 1, továbbá E 0 B = Bi (λb), ahol b a B i-edik sora, azaz det(E 0 B) = det Bi (λb) = λ det B = det E 0 det B. Végül, ha E 00 elemi mátrix úgy keletkezett, hogy az egységmátrix egy sorának skalárszorosát hozzáadjuk egy másik sorhoz, akkor det E 00 = 1 és det(E 00 B) = det B, amib˝ol ismét következik az állítás. A bizonyítás második lépésében feltesszük, hogy az A mátrix invertálható. Ekkor tudjuk, hogy A felírható elemi mátrixok szorzataként, tehát a bizonyítás els˝o lépését használva: det A = det(E1 · · · Ek ) = det E1 · det(E2 · · · Ek ) = ··· = det E1 · · · det Ek . Azaz det(AB) = = = = =
det(E1 · · · Ek · B) det E1 · det(E2 · · · Ek · B) ··· det E1 · · · det Ek · det B det A · det B.
Hátramaradt annak az esetnek a vizsgálata, amikor A nem invertálható. A bizonyítandó állítás jobb oldalán ekkor 0 szerepel, azt kell belátni, hogy a bal oldal is 0, azaz AB nem invertálható. Ez azonban teljesül, mert rang(AB) ≤ min{rang A, rang B} ≤ rang A < n, ahol n a mátrix rendje. 16.8. Tétel. Négyzetes mátrix és transzponáltja determinánsa megegyezik.
Bizonyítás: Az el˝oz˝o bizonyításhoz hasonlóan, el˝oször elemi mátrixokra, majd invertálható mátrixokra, s végül általánosan látjuk be az állítást. E, E 0 és E 00 jelöljön ugyanolyan típusú elemi mátrixot, mint az el˝oz˝o tétel bizonyításában. det E 0t = det E 0 triviális, az is könnyen látható,
66
MÁTRIXOK, LINEÁRIS EGYENLETRENDSZEREK ÉS DETERMINÁNSOK
hogy det E t = det E. E 00 transzponáltja ugyan nem egyezik meg önmagával, de ez is ugyanilyen típusú elemi mátrix, tehát mindkét mátrix determinánsa 1. Legyen most A invertálható mátrix, s írjuk fel elemi mátrixok szorzataként! det t A = = = = =
det(Ek t · · · E1 t ) (det Ek t ) · · · (det E1 t ) a szorzástétel miatt, (det Ek ) · · · (det E1 ) az els˝o lépés miatt, (det E1 ) · · · (det Ek ) det(E1 · · · Ek ) = det A.
Nem invertálható mátrixra az állítás ismét egyszer˝u, mert mind a mátrixnak, mind a transzponáltjának a determinánsa 0. 16.9. Következmény. Minden sorokra megfogalmazott állítás igaz oszlopokra is. Pl. a determinánsfüggvény az oszlopok lineáris függvénye.
17. Aldeterminánsok, kofaktorok 17.1. Definíció. Ha egy mátrixból bizonyos sorokat és oszlopokat elhagyunk úgy, hogy a kapott mátrix négyzetes mátrix, akkor ennek a mátrixnak a determinánsát az eredeti aldeterminánsának nevezzük. Legyen A ∈ Mn×n . Az A mátrixból az i-edik sor és a j-edik oszlop elhagyása után kapott (n − 1) × (n − 1)-es Aij mátrix determinánsát az i-edik sor j-edik eleméhez adjungált aldeterminánsnak nevezzük. A (−1)i+j det Aij szám az i-edik sor j-edik elemének kofaktora vagy algebrai aldeterminánsa. 17.2. Tétel. Legyen A ∈ Mn×n , továbbá rögzített i-re és j-re jelölje aij -t b. Ha az i-edik sor minden b-t˝ol különböz˝o eleme zérus, vagy a j-edik oszlop minden b-t˝ol különböz˝o eleme zérus, akkor det A = b(−1)i+j det Aij .
Bizonyítás: b = 0-ra az állítás triviális, feltehetjük, hogy a továbbiakban b 6= 0. El˝oször tegyük fel, hogy b az els˝o sor els˝o eleme, és az els˝o oszlopban minden további elem zérus. X det A = ε(σ)a1σ(1) a2σ(2) · · · anσ(n) = σ
mivel aj1 értéke j 6= 1-re 0, ezért a determináns egyenl˝o: =
X σ(1)=1
ε(σ)a11 a2σ(2) · · · anσ(n) =
ALDETERMINÁNSOK, KOFAKTOROK
67
ahol az összegzés már csak az (1, σ(2), . . . , σ(n)) permutációkra terjed ki. Minden tagból kiemelhet˝o a11 , tehát tovább folytatva a megkezdett sort: = a11
X
ε(σ)a2σ(2) · · · anσ(n) =
σ
Az (1, 2, . . . , n) számok (1, σ(2), . . . , σ(n)) permutációjának a paritása ugyanaz, mint a (2, . . . , n) számok (σ(2), . . . , σ(n)) permutációjának, mert az el˝obbiben az 1 minden további számot megel˝oz. Ez azt jelenti, hogy = a11 det A11 . Transzponálással a tétel állítását megkapjuk arra az esetre, amikor az els˝o oszlopban az els˝o elemen kívül mindegyik 0. Most az általános esetet látjuk be. i − 1 egymás utáni sorcserével elérhetjük, hogy a b-t tartalmazó sor az els˝o sorba kerüljön, s a többi sor egymáshoz viszonyított helyzete nem változik. Hasonlóan, j − 1 egymás utáni oszlopcserével pedig elérhet˝o, hogy b az els˝o oszlopban legyen. Az így kapott mátrixot jelölje C. Aij = C11 . Ekkor det C = (−1)(i−1)+(j−1) det A = (−1)i+j det A. Alkalmazzuk a bizonyítás els˝o részét: det A = (−1)i+j det C = (−1)i+j b det C11 = (−1)i+j b det Aij
17.3. Tétel. (Cramer-szabály.) Legyen A ∈ Mn×n , oszlopai legyenek (A1 , . . . , An ), továbbá x1 b1 x2 b2 X = .. , és B = .. . . . xn bn Ha AX = B, akkor (det A) · xi = det(A1 · · · Ai−1 B Ai+1 · · · An ).
Bizonyítás: Jelölje (E1 , . . . , En ) Rn természetes bázisát, melyet most oszloponként írunk. Legyen C a következ˝o mátrix: ¡ ¢ C = E1 . . . Ei−1 X Ei+1 . . . En .
68
MÁTRIXOK, LINEÁRIS EGYENLETRENDSZEREK ÉS DETERMINÁNSOK
AEj = Aj és AX = B-b˝ol következik, hogy ¡ ¢ AC = A1 . . . Ai−1 B Ai+1 . . . An . A szorzástétel miatt ¡ ¢ det A det C = det A1 . . . Ai−1 B Ai+1 . . . An . C alakja a következ˝o
1 . . . x1 . . . .. .. . . C = 0 . . . x i . . . . .. .. . 0 . . . xn . . .
0 .. . 0 , .. . 1
ahol xi az i-edik sor i-edik eleme. A megel˝oz˝o lemmából: det C = xi (−1)i+i det In−1 = xi .
17.4. Tétel. Legyen A invertálható mátrix, az inverzét jelölje B = (bij )! Ekkor fennáll, hogy bij =
(−1)i+j det Aji . det A
Bizonyítás: A bizonyítás során legyen j rögzítve, továbbá legyen b1j .. Bj = . bnj a B mátrix j-edik oszlopa. Mivel AB = In , ezért ABj = Ej szintén teljesül. Alkalmazzuk a Cramer-szabályt: ¡ ¢ det Abij = det A1 . . . Ai−1 Ej Ai+1 . . . An . A 17.2. lemmát használva: det Abij = 1 · (−1)j+i det Aji . Mivel xi = bij , ezért az állítást beláttuk. A paragrafus következ˝o formulájával egy determináns kiszámítását nála alacsonyabb rend˝u determináns kiszámítására vezetjük vissza.
ALDETERMINÁNSOK, KOFAKTOROK
69
17.5. Tétel. (Kifejtési tétel.) Legyen A ∈ Mn×n , 1 ≤ i ≤ n pedig rögzített természetes szám. Ekkor teljesül, hogy n X det A = (−1)i+k aik · det Aik . k=1
Bizonyítás: Rn természetes bázisa legyen (e1 , . . . , en ) sorokként írva. A i-edik sorát a következ˝oképpen tudjuk felírni: n X aik ek . k=1
Ezért det A =
n X
aik det Ai (ek ), a determináns linearitása miatt
k=1
=
n X
aik (−1)i+k det Aik , a 17.2. lemma miatt.
k=1
Megjegyzés. Analóg állítás fogalmazható meg egy oszlopindex rögzítése után. (Oszlop szerinti kifejtés, míg a tételben sor szerinti kifejtés van.) 17.6. Tétel. (Ferde kifejtési tétel.) Legyen A ∈ Mn×n , 1 ≤ i 6= j ≤ n pedig rögzített természetes számok. Ekkor teljesül, hogy n X
(−1)i+k aik · det Ajk = 0.
k=1
Bizonyítás: Legyen B az a mátrix, amely a A mátrixtól csak abban különbözik, hogy a j-edik sora megegyezik az A i-edik sorával. Így B-ben két egyenl˝o sor van, az i-edik és a j-edik. Továbbá Ajk = Bjk minden k-ra. Alkalmazzuk B-re a kifejtési tételt, megkapjuk A-ra a ferde kifejtési tételt. 17.7. Tétel. Legyen
x11 x12 . . . x1k .. .. ∈ M . n×k . xn1 xn2 . . . xnk
mátrix, ahol k ≤ n. A mátrix oszlopai akkor és csakis akkor lineárisan függ˝ok, ha a sorokból képezhet˝o minden k-adrend˝u determináns értéke 0. ( ⇐⇒ a mátrix oszlopai akkor és csakis akkor lineárisan függetlenek, ha a sorokból képezhet˝o k-adrend˝u nem nulla érték˝u determináns.)
70
MÁTRIXOK, LINEÁRIS EGYENLETRENDSZEREK ÉS DETERMINÁNSOK
Bizonyítás: Ha az oszlopok függ˝o vektorrendszert alkotnak, akkor a sorokból képezhet˝o minden k × k-as mátrix oszlopai is lineárisan függ˝ok, s ekkor ennek a mátrixnak a determinánsa zérus. A megfordítást a következ˝oképpen láthatjuk be. El˝oször válasszunk ki a mátrixban maximális rend˝u el nem t˝un˝o aldeterminánst. Az általánosság megszorítása nélkül feltehetjük, hogy ez a bal fels˝o sarokban van (sorcserék és oszlopcserék az állítást nem érintik). ∗ .. D = 6 0 . . ∗ ∗ ∗ ... ∗
Ennek a determinánsnak a rendje kisebb, mint k, tehát van még legalább 1 olyan oszlop, ami a determinánsban nem szerepel. Azt állítjuk, hogy a determinánsban szerepl˝o oszlopok s még egy oszlop (mondjuk a pontosan mellette elhelyezked˝o) lineárisan függ˝o rendszert alkotnak. Ehhez meg kell konstruálni azt a nem triviális együtthatórendszert, amivel az oszlopokat lineárisan kombinálva megkapjuk a zéróvektort. Ehhez el˝oször képezzünk az el nem t˝un˝o determinánstól 1-gyel nagyobb rend˝u D0 determinánst egy sor és egy oszlop hozzávételével: ∗ .. D 6= 0 . ∗ . x1 . . . x r xr+1
Azt állítjuk, hogy a keresett együtthatók az új determináns x1 , . . . , xr+1 elemekhez tartozó kofaktorai. Ez triviálistól különböz˝o együtthatórendszer, mert az utolsó elem kofaktora pontosan D 6= 0, továbbá az x1 , . . . , xr+ 1 elemekt˝ol nem függenek. Kombináljuk ezzel az együtthatórendszerrel az oszlopokat. Azt kell ellen˝orizni, hogy minden sorban megkapjuk a nullát. Ez a D-ben szerepet játszó sorokra a D0 -re alkalmazott ferde kifejtési tételb˝ol, míg a többi sorra a kifejtési tételb˝ol következik. Tételünk közvetlen következménye az alábbi állítás: 17.8. Tétel. Egy mátrix rangja megegyezik maximális rend˝u el nem t˝un˝o aldeterminánsa rendjével. Ezzel a tétellel a mátrixok rangszámtételére egy új bizonyítást adtunk.
4. fejezet Lineáris leképezések 18. Lineáris leképezések alaptulajdonságai 18.1. Definíció. Legyenek V és W ugyanazon F test feletti vektorterek. A ϕ: V → W leképezést lineáris leképezésnek mondjuk, ha teljesül, hogy ∀x, y ∈ V és ∀α ∈ F esetén: (L1)
ϕ(x + y) = ϕ(x) + ϕ(y)
(L2)
ϕ(αx) = αϕ(x).
Jelölje L(V ; W ) az összes V → W lineáris leképezés halmazát! A ϕ ∈ L(V ; W ) lineáris leképezést lineáris izomorfizmusnak nevezzük, ha bijektív, ilyenkor V -t és W -t izomorf vektortereknek mondjuk. Speciálisan, ha W = V , akkor lineáris operátorról, vagy lineáris transzformációról, míg ha W = F, lineáris formáról szólunk.
Megjegyzés. Az L1 és L2 tulajdonságok egyetlen formulába foglalhatók: ϕ(αx + βy) = αϕ(x) + βϕ(y),
x, y ∈ V, α, β ∈ F.
Ebb˝ol indukcióval az alábbi általános formulát nyerjük: ϕ(α1 x1 + · · · + αk xk ) = α1 ϕ(x1 ) + · · · + αk ϕ(xk ),
xi ∈ V, αi ∈ F; i = 1, . . . , k.
18.2. Tétel. Legyen ϕ : V → W lineáris leképezés. V zérusvektorának képe W zérusvektora.
Bizonyítás: ϕ(0) = ϕ(0 + 0) = ϕ(0) + ϕ(0), azaz ϕ(0) = 0. 18.3. Tétel. Lineáris leképezés lineárisan függ˝o vektorrendszert lineárisan függ˝o vektorrendszerbe visz át. 71
72
LINEÁRIS LEKÉPEZÉSEK
Bizonyítás: Legyen (a1 , . . . , ak ) lineárisan függ˝o vektorrendszer! Ekkor a zérusvektor el˝oáll nem triviális lineáris kombinációjukként: α1 a1 + · · · + αk ak = 0. Alkalmazzuk mindkét oldalra a ϕ lineáris leképezést: α1 ϕ(a1 ) + · · · + αk ϕ(ak ) = 0. Mivel a fenti lineáris kombinációban az eredeti együtthatórendszer szerepel, ezért ez a lineáris kombináció is nem triviális, ami a (ϕ(a1 ) . . . , ϕ(ak )) vektorrendszer függ˝oségét jelenti. Az alábbiakban definiált leképezések lineárisak:
Példa. Az identikus leképezés. Egy V vektortér önmagára való ϕ : V → V, x 7→ ϕ(x) = x identikus leképezése. Példa. A zéró leképezés. Ha V és W ugyanazon test feletti vektorterek, és V minden vektorához W zérusvektorát rendeljük. Példa. Origó középpontú hasonlóság. Legyen V valós vektortér, k ∈ R rögzített szám. Legyen ϕ : V → V, v 7→ ϕ(v) = kv.
Példa. A mátrixszorzás. Legyen A ∈ Mm×n mátrix. Legyen LA : Rn → Rm , LA (X) = AX.
Példa. A differenciálás. Legyen V az (a, b) nyílt intervallumon differenciálható valós függvények vektortere, míg W az (a, b)-n értelmezett összes valós függvények vektortere. A D : V → W, f 7→ D(f ) = f 0 deriválás lineáris leképezés.
Példa. Az integrál, mint a fels˝o határ függvénye. Legyen V az [a, b] intervallumon folytonos függvények tere. A ϕ : V → V leképezést értelmezzük a következ˝o módon: Z x f 7→ ϕ(f ) = F, F (x) = f (t)dt; x ∈ [a, b]. a
Példa. A sík origó körüli elforgatása. A V síkot kétféleképpen is vektortérnek gondolhatjuk: V = C, mint C fölötti egydimenziós vektortér; vagy V = R2 , mint R fölötti kétdimenziós vektortér. Az elforgatást el˝oször a C egydimenziós vektortérben értelmezzük. Legyen α ∈ R, továbbá ϕ : C → C, z 7→ ϕ(z) = z · (cos α + i sin α). (Gondoljunk a komplex számok szorzásának geometriai interpretációjára, ld. az ábrát!) Vegyük
LINEÁRIS LEKÉPEZÉSEK ALAPTULAJDONSÁGAI
73
=
z · (cos α + i sin α)
z
cos α + i sin α 1
<
4.1. ábra. Elforgatás a komplex számsíkon.
észre, hogy a középpontos hasonlóság speciális esetével állunk szemben. A fentiek alapján könnyen levezethetjük az origó körüli elforgatás képletét R2 -ben is. Legyen z = x + iy, (x, y ∈ R). (x + iy) · (cos α + i sin α) = (cos α · x − sin α · y) + i(sin α · x + cos α · y). Tehát ha az elforgatás ϕ : R2 → R2 ,
(x, y)t 7→ (x0 , y 0 )t ,
akkor x0 = cos α · x − sin α · y y 0 = sin α · x + cos α · y; illet˝oleg mátrixalakban:
µ ¶ µ ¶ µ ¶ cos α − sin α x x 7→ · . y sin α cos α y
Helyettesítsünk a fenti formulákba α = ±π/2-t: a középiskolából jól ismert „szabályt” kapjuk a π/2 szög˝u elforgatásra.
Példa. Vetítés altérre. Lineáris leképezés R3 mer˝oleges vetítése a koordinátatengelyekre vagy a koordinátasíkokra. Például, mer˝oleges vetítés az xy síkra: R3 → R2 , R3 3 (x, y, z) 7→ (x, y) ∈ R2 . 18.4. Tétel. Legyenek V és W ugyanazon F test feletti vektorterek. L(V ; W ) vektortér F felett, ha két lineáris leképezés összegét és egy lineáris leképezés skalárral való szorzatát a következ˝oképpen értelmezzük: (ϕ + ψ)(x) = ϕ(x) + ψ(x), x ∈ V (αϕ)(x) = αϕ(x), x ∈ V, α ∈ F.
74
LINEÁRIS LEKÉPEZÉSEK
Bizonyítás: Könnyen látható, hogy az összeadás és skalárral való szorzás el˝oz˝o definíciói valóban lineáris leképezést értelmeznek. Ellen˝oriznünk kell a vektortér axiómák teljesülését. El˝oször belátjuk, hogy α(ϕ + ψ) = αϕ + αψ. Valóban: [α(ϕ + ψ)](x) = α[(ϕ + ψ)(x)] = α[ϕ(x) + ψ(x)] = αϕ(x) + αψ(x) = = (αϕ)(x) + (αψ)(x) = (αϕ + αψ)(x). Hasonlóan bizonyítható a többi tulajdonság. 18.5. Tétel. Legyenek U , V , W ugyanazon test fölötti vektorterek. Ha ϕ ∈ L(U ; V ), ψ ∈ L(V ; W ), akkor ψ ◦ ϕ ∈ L(U ; W ).
Bizonyítás: Triviális számolás. 18.6. Tétel. Legyen ϕ ∈ L(V ; W ) lineáris izomorfizmus. ϕ−1 : W → V szintén lineáris izomorfizmus.
Bizonyítás: Mivel ϕ bijektív, ezért létezik inverze, s az inverze is bijektív, azt kell belátni, hogy ez lineáris leképezés. Legyen ϕ−1 (u1 ) = v1 , ϕ−1 (u2 ) = v2 . Mivel ϕ(v1 + v2 ) = ϕ(v1 ) + ϕ(v2 ) = u1 + u2 , ezért ϕ−1 (u1 + u2 ) = v1 + v2 , azaz ϕ−1 (u1 + u2 ) = v1 + v2 = ϕ−1 (u1 ) + ϕ−1 (u2 ). Hasonlóan igazolható a homogenitás: ϕ(αv1 ) = αϕ(v1 ) = αu1 , azaz
ϕ−1 (αu1 ) = αv1 = αϕ−1 (u1 ).
18.7. Tétel. (A véges dimenziós vektorterek struktúratétele.) Az F test feletti n dimenziós V vektortér izomorf Fn -hez, az F elemeib˝ol képzett skalár n-esek teréhez.
Bizonyítás: Rögzítsünk V -ben egy bázist: (v1 , . . . , vn ). Értelmezzük a következ˝o leképezést: ϕ : V → Fn , x1 v1 + · · · + xn vn 7→ (x1 , . . . , xn ), azaz tetsz˝oleges vektorhoz rendeljük hozzá a rögzített bázisra vonatkozó koordinátáit. Egyszer˝uen megmutatható, hogy így lineáris leképezést definiáltunk. (Ld. két vektor összegének koordinátái, vektor skalárszorosának koordinátái!) Mivel bázisból a tér bármely vektora pontosan egyféleképpen kombinálható, továbbá tetsz˝oleges skalár n-esb˝ol kombinálhatunk vektort, ezért ez a leképezés bijektív is.
LINEÁRIS LEKÉPEZÉS KÉPTERE ÉS MAGTERE
75
18.8. Következmény. Izomorf vektorterek dimenziója ugyanaz. 18.9. Tétel. (A lineáris kiterjesztés tétele.) Legyenek V és W ugyanazon test fölötti vektorterek, (v1 , . . . , vn ) bázis V -ben, (w1 , . . . , wn ) tetsz˝oleges vektorrendszer W -ben. Egyértelm˝uen létezik olyan ϕ: V → W lineáris leképezés, hogy ϕ(vi ) = wi (i = 1, . . . , n). — Azaz a lineáris leképezést bázison felvett értéke egyértelm˝uen meghatározza.
Bizonyítás: Értelmezzük a ϕ leképezést a következ˝oképpen: ϕ : V → W, x1 v1 + · · · + xn vn 7→ x1 w1 + · · · + xn wn . Egyszer˝uen ellen˝orizhet˝o, hogy ez a leképezés lineáris, továbbá ϕ(vi ) = wi . Az egyértelm˝uség bizonyítása maradt hátra. Tegyük fel, hogy ψ ∈ L(V, W ) is rendelkezik a tételben leírt tulajdonsággal! Belátjuk, hogy tetsz˝oleges vektoron ugyanazt az értéket veszi fel, mint az el˝obb definiált ϕ. Valóban: ψ(x1 v1 + · · · + xn vn ) = x1 ψ(v1 ) + · · · + xn ψ(vn ) = x1 w1 + · · · + xn wn .
19. Lineáris leképezés képtere és magtere 19.1. Definíció. Legyen ϕ ∈ L(V ; W ) lineáris leképezés. A ker ϕ = {v ∈ V |ϕ(v) = 0} ⊂ V halmazt a ϕ lineáris leképezés magjának vagy magterének nevezzük, míg az im ϕ = {w ∈ W |∃v ∈ V : ϕ(v) = w} ⊂ W halmazt a ϕ képterének. (Utóbbira a ϕ(V ) jelölés is használatos.) 19.2. Tétel. Legyen ϕ ∈ L(V ; W ) lineáris leképezés. im ϕ W altere, míg ker ϕ a V altere.
Bizonyítás: Egyik halmaz sem üres, mert a zérusvektort mindkett˝o triviálisan tartalmazza. Elegend˝o tehát azt belátni, hogy mindkét halmaz zárt az összeadásra és a skalárral való szorzásra. Teljesüljön, hogy x, y ∈ ker ϕ. ϕ(x + y) = ϕ(x) + ϕ(y) = 0 + 0 = 0, ϕ(αx) = αϕ(x) = α · 0 = 0, tehát x + y, αx ∈ ker ϕ. Most legyen z, v ∈ im ϕ! Ekkor léteznek olyan x, y vektorok V -ben, hogy ϕ(x) = z, ϕ(y) = v. ϕ(x + y) = ϕ(x) + ϕ(y) = z + v, ϕ(αx) = αϕ(x) = αz, azaz z + v, αz ∈ im ϕ.
76
LINEÁRIS LEKÉPEZÉSEK
19.3. Definíció. Egy lineáris leképezés rangján képterének dimenzióját, míg nullitásán magterének dimenzióját értjük.
Példa. Legyen V1 ⊂ V altér és a π leképezés legyen a π : V → V /V1 , x 7→ π(x) = x + V1 ún. kanonikus projekció. (Err˝ol könnyen meggy˝oz˝odhetünk, hogy lineáris leképezés.) ker π = V1 – Gondoljunk arra, hogy a V /V1 faktortér zérusvektora a 0 + V1 = V1 lineáris sokaság.
Példa. Legyen ϕ : P n → P n , p 7→ ϕp = p0 . Figyelembe véve, hogy a deriválás a polinomok fokszámát eggyel csökkenti: im ϕ = P n−1 , ker ϕ pedig megegyezik a konstans polinomok halmazával. Példa. Tekintsük R3 mer˝oleges vetítését az xy síkra: ϕ : R3 → R3 ,
(x, y, z) 7→ ϕ(x, y, z) = (x, y, 0).
A leképezés képtere az xy sík, míg magtere a z tengely. 19.4. Tétel. Legyen ϕ ∈ L(V ; W )! Ha ker ϕ = { 0 }, akkor ϕ injektív, továbbá lineárisan független vektorrendszer képe lineárisan független vektorrendszer.
Bizonyítás: El˝oször belátjuk, hogy a feltételek mellett különböz˝o vektorok képe különböz˝o. Ha x, y ∈ V és ϕ(x) = ϕ(y), akkor 0 = ϕ(x) − ϕ(y) = ϕ(x − y). x − y tehát a ker ϕ eleme. A feltétel szerint ker ϕ-nek azonban egyetlen eleme van, s ez a zérusvektor, azaz x = y. Legyenek v1 , . . . , vn ∈ V lineárisan független vektorok. Kombináljuk ezen vektorok képvektoraiból a zérusvektort: x1 ϕ(v1 ) + · · · + xn ϕ(vn ) = 0 ∈ W. A linearitás miatt: ϕ(x1 v1 + · · · + xn vn ) = 0, azaz x1 v1 + · · · + xn vn ∈ ker ϕ. ker ϕ egyetlen eleme azonban a zérusvektor, azaz x1 v1 + · · · + xn vn = 0 ∈ V. A feltétel miatt (x1 , . . . , xn ) lineárisan független vektorrendszer, azaz mindegyik együttható nulla. A képvektorokból W zérusvektorát tehát csak triviálisan lehet kombinálni. 19.5. Tétel. Legyen ϕ ∈ L(V ; W )! Ha (v1 , . . . , vn ) bázis V -ben, akkor (ϕ(v1 ), . . . , ϕ(vn )) im ϕ generátorrendszere.
LINEÁRIS LEKÉPEZÉS KÉPTERE ÉS MAGTERE
77
Bizonyítás: Legyen w ∈ im ϕ. Ekkor létezik olyan v ∈ V vektor, hogy ϕ(v) = w. Kombináljuk v-t a V bázisából: x1 v1 + · · · + xn vn = v. Ekkor a linearitást használva: w = ϕ(v) = x1 ϕ(v1 ) + · · · + xn ϕ(vn ), amit bizonyítani kellett. 19.6. Tétel. (Homomorfiatétel.) Legyen ϕ ∈ L(V ; W ) lineáris leképezés. V / ker ϕ ∼ = im ϕ
Bizonyítás: Legyen tehát ϕ ∈ L(V ; W ). Értelmezzük a következ˝o leképezést: ϕ : V / ker ϕ → im ϕ, v + ker ϕ 7→ ϕ(v). A definíció nem függ a lineáris sokaság reprezentánsának választásától, mert ha v1 + ker ϕ = v2 + ker ϕ, akkor v1 − v2 ∈ ker ϕ, azaz 0 = ϕ(v1 − v2 ) = ϕ(v1 ) − ϕ(v2 ). Azt is könny˝u ellen˝orizni, hogy ϕ lineáris leképezés. Nyilvánvaló, hogy ϕ szürjektív. Másrészt ϕ magtere a zérustér, mert ha ϕ(ker ϕ + v) = ϕ(v) = 0, akkor v ∈ ker ϕ, azaz ker ϕ + v = ker ϕ. Innen következik, hogy ϕ injektív is, tehát izomorfizmus. 19.7. Tétel. (A nullitás+rang tétel.) Legyen ϕ ∈ L(V ; W ) lineáris leképezés. Ekkor dim ker ϕ + dim im ϕ = dim V.
Bizonyítás: Következik az el˝oz˝o tételb˝ol, s a faktortér dimenziójára vonatkozó tételb˝ol. A „nullitás+rang” tétel egy egyszer˝u alkalmazásaként újabb bizonyítást adunk a homogén lineáris egyenletrendszerek megoldásterér˝ol szóló tételre. 19.8. Tétel. Legyen Ax = 0 homogén lineáris egyenletrendszer (A ∈ Mm×n ), x ∈ Rn . A megoldástér dimenziója n − rang A.
Bizonyítás: Jelölje (E1 , . . . , En ) Rn természetes bázisát, A1 , . . . , An pedig A oszlopait! Ekkor AE1 = A1 , . . . , AEn = An is teljesül. Ez azt jelenti, hogy im LA -t A oszlopai generálják, vagyis: rang LA = rang A. Alkalmazzuk a „nullitás+rang” tételt az LA operátorra: dim ker LA + dim im LA = n. dim ker LA a megoldástér dimenzióját adja, dim im LA pedig A rangját, az el˝oz˝o példában leírtakat figyelembe véve.
78
LINEÁRIS LEKÉPEZÉSEK
20. A lineáris leképezések mátrixreprezentációja 20.1. Definíció. Legyen ϕ ∈ L(V ; W ), továbbá legyen (v1 , . . . , vm ) V egy bázisa, (w1 , . . . , wn ) W egy bázisa. A ϕ lineáris leképezésnek a rögzített bázisokra vonatkozó mátrixa az az n × m típusú mátrix, melynek elemeit a következ˝o összefüggés értelmezi: ϕ(vi ) =
n X
cji wj ,
j=1
azaz az i-edik oszlop megegyezik vi képének (w1 , . . . , wn ) bázisra vonatkozó koordinátáival. A V = W esetben ha mást nem mondunk, akkor csak egy bázist rögzítünk (amit a definíció szerint kétszer használunk). 20.2. Tétel. (A definíció jelöléseivel.) Ha a v ∈ V vektor koordinátái a rögzített bázisra vonatkozóan (x1 , . . . , xm ), a lineáris leképezés mátrixa pedig a C mátrix, akkor ϕ(v) koordinátái a W -ben rögzített bázisra vonatkozóan x1 .. C · . , xm azaz ha a v koordinátáiból képzett oszlopvektort X jelöli, akkor ϕ(v) koordinátáinak oszlopvektorát LC (X) adja. Bizonyítás: Ã m ! Ã n ! m m X n n X m X X X X X ϕ xi v i = xi cji wj = xi cji wj = cji xi wj i=1
i=1
j=1
i=1 j=1
j=1 i=1
20.3. Tétel. Legyenek ϕ, ψ ∈ L(V ; W ) lineáris leképezések, valamint rögzítsük V és W egy-egy bázisát! Ha ϕ mátrixa erre a bázispárra A, ψ mátrixa pedig B, akkor ϕ + ψ mátrixa A + B, αϕ mátrixa pedig αA, ahol α tetsz˝oleges skalár.
Bizonyítás: Egyszer˝u számítás a definíció alapján. 20.4. Tétel. Legyen dim V = m, dim W = n! Az L(V ; W ) vektortér izomorf a Mm×n vektortérrel; ha egy lineáris leképezéshez hozzárendeljük egy rögzített bázispárra vonatkozó mátrixát, akkor a két vektortér között izomorfizmust kapunk. (Következésképpen: dim L(V ; W ) = n · m.)
Bizonyítás: Az el˝oz˝o tétel szerint az a leképezés, mely minden lineáris leképezéshez hozzárendeli egy rögzített bázispárra vonatkozó mátrixát, lineáris leképezés. Azt kell még belátnunk, hogy ez a leképezés bijektív is. Legyen (v1 , . . . , vm ) V rögzített bázisa, (w1 , . . . , wn ) W rögzített bázisa, A ∈ Mm×n . A lineáris kiterjesztés tétele szerint egyértelm˝uen létezik olyan lineáris leképezés, mely a vi vektorhoz a n X aji wj j=1
vektort rendeli. Ennek a mátrixa a megadott mátrix.
79
BÁZISCSERE
20.5. Tétel. Legyenek U , V , W ugyanazon test feletti m, n, p dimenziós vektorterek, továbbá ϕ ∈ L(U ; V ), ψ ∈ L(V ; W ). Rögzítsünk U -ban, V -ben és W -ben egy-egy bázist! ϕ mátrixa (a rögzített bázisokra vonatkozóan) legyen A ∈ Mn×m , ψ mátrixa pedig B ∈ Mp×n . Ekkor ψ ◦ ϕ mátrixa B · A.
Bizonyítás: Jelöljük el a bázisokat: (a1 , . . . , am ) U -ban; (b1 , . . . , bn ) V -ben; (c1 , . . . , cp ) W -ben. Ã n ! X (ψ ◦ ϕ)(ai ) = ψ aji bj = j=1
=
n X
aji ψ(bj ) =
j=1
n X
aji
j=1
p X
bkj ck =
k=1
A szorzatleképezés mátrixa k-adik sorának i-edik eleme tehát
à n p X X j=1 n X
! bkj aji
ck .
k=1
bkj aji , ami nem más, mint a
j=1
BA szorzatmátrix megfelel˝o eleme. 20.6. Következmény. Legyen ϕ ∈ L(V ; W ) lineáris izomorfizmus, s rögzítsünk V -ben és W ben egy-egy bázist! Ha ϕ mátrixa a rögzített bázispárra vonatkozóan A, akkor ϕ−1 mátrixa ugyanezen bázispárra vonatkozóan A−1 .
21. Báziscsere 21.1. Definíció. Legyen A = (a1 , . . . , an ) illetve A0 = (a01 , . . . , a0n ) a V vektortér két bázisa. Értelmezzük az S = (sji ) ∈ Mn×n mátrixot a következ˝oképpen: a0i
=
n X
sji aj .
j=1
Az S mátrixot az A → A0 báziscsere (bázistranszformáció) mátrixának nevezzük. Úgy is fogalmazhatunk, hogy a báziscsere mátrixának i-edik oszlopában a0i koordinátái vannak az (a1 , . . . , an ) bázisra vonatkozóan. 21.2. Tétel. Egy báziscsere mátrixa mindig invertálható mátrix.
Bizonyítás: (A definícióban alkalmazott jelölésekkel.) S oszlopai lineárisan függetlenek, hiszen az oszlopok A0 bázisvektorainak koordinátái az A bázisban, és az a leképezés, mely egy vektorhoz hozzárendeli (egy rögzített bázisra vonatkozó) koordinátáit, izomorfizmus. S rangja tehát n, azaz invertálható. 21.3. Tétel. Legyen A = (a1 , . . . , an ) illetve A0 = (a01 , . . . , a0n ) a V vektortér két bázisa. Ha egy tetsz˝oleges vektor A-ra vonatkozó (x1 , . . . , xn ) koordinátáiból képzett oszlopvektor X; A0 -re vonatkozó (x01 , . . . , x0n ) koordinátáiból képzett oszlopvektor pedig X 0 , akkor fennáll, hogy X 0 = S −1 · X.
80
LINEÁRIS LEKÉPEZÉSEK
Bizonyítás: Legyen x tetsz˝oleges vektor! n X
x =
x0i a0i
=
i=1
à n n X X
=
j=1
azaz xj =
n X
n X i=1
x0i
sji aj =
j=1
!
sji x0i
n X
aj ,
i=1
sji x0i , mátrixalakban X = S · X 0 . S inverzével balról szorozva adódik állításunk.
i=1
21.4. Tétel. Legyen ϕ ∈ L(V ; V ) lineáris operátor, továbbá B = (b1 , . . . , bm ) ill. B 0 = (b01 , . . . , b0m ) a V két bázisa. Jelölje a B → B 0 báziscsere mátrixát S. Ha a ϕ lineáris leképezés mátrixa a B bázisra vonatkozóan A, a B 0 bázisra vonatkozóan pedig A0 , akkor fennál, hogy A0 = S −1 AS. ¡ ¢ ¡ ¢ ¡ 0 ¢ Bizonyítás: Legyen S = sij , A = αij , A0 = αij ; tehát a definíciónak megfelel˝oen: b0i
=
n X
sji bj , ϕ(bi ) =
j=1
n X
αji bj ,
ϕ(b0i )
=
j=1
n X
0 0 αji bj .
j=1
Számítsuk ki ϕ(b0i )-t kétféleképpen: Ã n ! n X X 0 ϕ(bi ) = ϕ sji bj = sji ϕ(bj ) = j=1
=
n X
sji
j=1
j=1
n X
αkj bk =
k=1
à n n X X
! αkj sji bk ,
j=1
k=1
másrészt: ϕ(b0i )
=
n X j=1
=
0 0 αki bj
n X
à n X
k=1
j=1
n X
=
j=1 0 skj αji
0 αji
!
n X
skj bk =
k=1
bk .
Mind a két esetben a ϕ(b0i ) vektort az B bázisban kombináltuk, tehát az együtthatók is megegyeznek: n n X X 0 αkj sji = skj αji , j=1
j=1 0
ami a mátrixszorzás definíciója szerint AS = SA -t jelenti, s ez a bizonyítandó állítással ekvivalens.
81
BÁZISCSERE
21.5. Definíció. Az A és B ugyanolyan típusú négyzetes mátrixokat hasonlónak nevezzük, ha létezik olyan invertálható S mátrix, hogy B = S −1 AS. Egy lineáris operátort diagonalizálhatónak nevezünk, ha van olyan bázis, melyben mátrixa diagonális. Egy mátrixot akkor nevezünk diagonalizálhatónak, ha hasonló egy diagonális mátrixhoz. 21.6. Tétel. Hasonló mátrixok rangja és determinánsa megegyezik.
Bizonyítás: Mindkét mátrix ugyanannak a lineáris operátornak más-más bázisra vonatkozó mátrixa. Mivel a mátrixok rangja megegyezik a lineáris operátor képterének a dimenziójával, ezért mind a két mátrixra ugyanannyi. A determinánsok megegyezése a determinánsok szorzástételének egyszer˝u következménye: det(S −1 AS) = det S −1 · det A · det S = det A · det S −1 S} = det A. | {z =det I=1
21.7. Definíció. Egy lineáris transzformáció determinánsán valamely bázisra vonatkozó mátrixának determinánsát értjük. (Az el˝oz˝o tétel szerint ez az érték független a bázis választásától.)