1.
A vektor és a vektortér fogalma
Célunk: a vektor és a vektortér fogalmának minél tágabb értelmezése. Ez azért hasznos, mert így a síkvektorok körében használatos egyes fogalmak és tételek átvihet®k lesznek egyéb objektumokból (pl. függvényekb®l) álló halmazokra is.
1.1. A síkvektorok halmaza A vektortér fogalmának általánosításához induljunk ki az összes síkvektor halmazából (jel.:
E2 ).
Gy¶jtsük össze ennek a halmaznak néhány tulajdonságát!
i) Az elemek irányított szakaszok, amelyeket nyíllal szemléltethetünk. ii) Az elemeknek van nagyságuk és irányuk. iii) Bármely két elemnek értelmezve van az összege, és ez az összeg halmazbeli, azaz annak egy adott eleme. iv) Bármely elemnek értelmezve van egy valós számmal való szorzása (a skalárszorosa), és a skalárszoros is a halmaz eleme. v) Az elemek között értelmezve van skaláris szorzás. Vigyázat: ez nem ugyanaz, mint az el®bbi pontban említett skalárral való szorzás! A skaláris szorzás eredménye nem a halmaz eleme, hanem egy valós szám. Ezeknek a tulajdonságoknak számos fontos következményük van, pl. az öszeadás és a skalárral való szorzás m¶veletével lineáris kombinációkat képezhetünk, értelmes a síkvektorok lineáris függetlensége, a bázis fogalma stb.
1.2. A vektortér általános deníciója A vektortér fogalmának általánosításához kiválasztjuk a síkvektorok fenti tulajdonságai közül azokat, amelyeket a leglényegesebbnek tartunk, és az általános megfogalmazáshoz elengedhetetlenek. A továbbiakban minden olyan struktúrát, amely ezekkel a tulajdonságokkal rendelkezik, vektortérnek fogunk nevezni. Ezek a kiválasztott tulajdonságok az iii) és iv), azaz a síkvektorokra értelmezett összeadás és skalárral való szorzás m¶velete. Röviden: ha valamely tetsz®leges halmazon értelmezni tudunk a fentiekkel megegyez® tulajdonságú két m¶veletet (amelyeket összeadásnak és skalárral való szorzásnak nevezünk), akkor az így kapott struktúrát (a halmazt a két m¶velettel ellátva) vektortérnek fogjuk nevezni, és a halmaz elemeit vektoroknak. Ahhoz, hogy összeadást értelmezhessünk valamilyen nem síkvektorokból álló, hanem
1
egyéb, pl. függvényekb®l álló halmazon, tisztáznunk kell, hogy mit is értünk összeadáson. A síkvektorok összeadásakor két síkvektorhoz hozzárendelünk egy harmadikat, azaz az összeadás m¶velete nem más, mint egy
E2 × E2 → E2
leképezés. Ha tehát van egy tet-
X halmazunk, akkor az összeadás értelmezése azt jelenti, hogy deniálunk egy X × X → X leképezést. Egy ilyen leképezést azonban csak akkor fogunk összeadásnak sz®leges
nevezni, ha tulajdonságaiban hasonlítani fog a síkvektorok összeadásához. A síkvektorok összeadásának négy jól ismert alapvet® tulajdonsága van: 1.
a + b = b + a ∀a, b ∈ E2
2.
(a + b) + c = a + (b + c) ∀a, b, c ∈ E2
3. A nullvektorra igaz az, hogy
a ∈ E2 elemhez amelyre a + (−a) = 0.
4. Minden
Ha tudunk olyan
a + 0 = a ∀a ∈ E2
létezik negatív elem
X ×X → X
E2 -ben,
azaz olyan elem (jelölje
−a),
leképezést deniálni, amely szintén rendelkezik mindezen
négy tulajdonsággal, akkor ezt a m¶veletet
X -beli
összeadásnak fogjuk nevezni.
A másik m¶velet, a síkvektorok skalárral való szorzása során egy síkvektorhoz és egy valós számhoz rendelünk egy síkvektort, ez a m¶velet tehát egy
E2 × IR → E2
leképezés.
Tulajdonságai a következ®k: 1.
λ · (a + b) = λ · a + λ · b ∀a, b ∈ E2
2.
(λ + µ) · a = λ · a + µ · a ∀a ∈ E2
3.
λ · (µ · a) = (λ · µ) · a = µ · (λ · a) ∀a ∈ E2
(Megjegyezzük, hogy a 2.
és
és
∀λ ∈ IR
∀λ, µ ∈ IR és
∀λ, µ ∈ IR
tulajdonságban két különböz® típusú összeadás szerepel az
egyenl®ség két oldalán.) Ha tudunk olyan
X ×IR → X
leképezést deniálni, amely szintén
rendelkezik mindezen három tulajdonsággal, akkor ezt a m¶veletet
X -beli
skalárral való
szorzásnak fogjuk nevezni. Ezek után megfogalmazzuk a vektortér általános denícióját:
1.1 Deníció. X→X
és egy
X egy tetsz®leges halmaz, amelyen értelmezve ⊙ : X × IR → X m¶velet a következ® tulajdonságokkal: Legyen
1.
x ⊕ y = y ⊕ x ∀x, y ∈ X
2.
(x ⊕ y) ⊕ z = x ⊕ (y ⊕ z)
van egy
⊕ : X×
∀x, y, z ∈ X
3. Létezik nullelem (nullvektor), azaz olyan 2
0X ∈ X
elem, amelyre
x⊕0X = x ∀x ∈ X
x ∈ X elemhez x ⊕ (−x) = 0X , ahol 0X
4. Minden
létezik negatív elem, azaz olyan elem (jelölje -x), amelyre a 3. tulajdonság szerini nullvektor.
5.
λ ⊙ (x ⊕ y) = (λ ⊙ x) ⊕ (λ ⊙ y)
6.
(λ + µ) ⊙ x = (λ ⊙ x) ⊕ (µ ⊙ x) ∀x ∈ X
7.
λ ⊙ (µ ⊙ x) = (λ · µ) ⊙ x = µ ⊙ (λ ⊙ x)
Ekkor az
(X, ⊕, ⊙)
∀x, y ∈ X
és
és
∀λ ∈ IR
∀λ, µ ∈ IR
∀x ∈ X
és
∀λ, µ ∈ IR
rendezett hármast vektortérnek, az
X
elemeit pedig vektoroknak ne-
vezzük.
1.2 Megjegyzés.
A m¶veleti jelek köré írt karika azt hivatott kiemelni, hogy újonnan
deniált m¶veletekr®l: tetsz®leges vektortér elemein értelmezett összeadásr®l és skalárral való szorzásról van szó. A kés®bbiekben, amikor már egyértelm¶ lesz, hogy egy m¶veleti jel mit fejez ki, a karikákat elhagyjuk. Azt a lazaságot is elkövetjük, hogy az vektortér helyett egyszer¶en csak az
X
(X, ⊕, ⊙)
vektortér megfogalmazást illetve jelölést fogjuk
használni, amikor nem akarjuk hangsúlyozni a m¶veleteket.
Továbbá, ha összeadás és
szorzás is szerepel egy kifejezésben, és nincs kitéve zárójel, akkor mindig a szorzást kell el®bb elvégezni, hasonlóan ahhoz, ahogyan a valós számoknál már megszokhattuk. A fenti deníciós tulajdonságokból levezethet® néhány további alapvet® tulajdonság. Pl. belátható, hogy minden vektortérben csak egyetlen nullvektor létezik, továbbá minden elemhez csak egyetlen negatív elem tartozik.
Ha
(X, ⊕, ⊙)
egy vektortér, akkor el®fordulhat, hogy az
X
halmaz valamely részhalmaza
maga is vektorteret alkot ugyanazon m¶veletekkel.
1.3 Deníció. (Y, ⊕, ⊙),
ha
Legyen
Y ⊂ X.
(Y, ⊕, ⊙)
vektortér.
Azt mondjuk, hogy az
(X, ⊕, ⊙)
vektortérnek altere
Belátható, hogy ahhoz, hogy egy vektortér részhalmazáról eldöntsük, hogy maga is vektortér-e ugyanazon m¶veletekkel, azaz alteret kaptunk-e, elég a két m¶veletre való zártságot ellen®rizni, mert ha az igaz, akkor a hét m¶veleti tulajdonság a részhalmazon automatikusan teljesül.
1.3. Példák vektorterekre Különböz® konkrét
• X := E2
X
halmazokhoz megadunk m¶veleteket. Vektorteret kapunk-e?
+ a síkvektorok szokásos összeadása és skalárral való szorzása - VT
3
• X :=
az egységnyi hosszúságú síkvektorok halmaza + a síkvektorok szokásos össze-
adása és skalárral való szorzása - NEM VT
• X := IR • X := C I
+ a valós számok szokásos összeadása és szorzása - VT
+ a komplex számok szokásos összeadása és szorzása
• X := IR2
+ a számpárokon már értelmezett összeadás és skalárral való szorzás - VT
• X := IRn , n ∈ IN
tetsz. + a szám-n-eseken már értelmezett összeadás és skalárral
való szorzás - VT
• X := Pn
(legfeljebb
n-edfokú
polinomok) + a függvények szokásos összeadása és
skalárral való szorzása - VT
• X := P˜n
(szigorúan
n-edfokú
polinomok) + a függvények szokásos összeadása és
skalárral való szorzása - NEM VT
• X = C[a, b]
(az
[a, b] ⊂ IR
intervallumon értelmezett folytonos valós függvények)+
a függvények szokásos összeadása és skalárral való szorzása - VT
• X := D(a, b)
(az
(a, b) ⊂ IR
intervallumon értelmezett dierenciálható valós függ-
vények) + a függvények szokásos összeadása és skalárral való szorzása - VT
• X := R[a, b]
(az
[a, b] ⊂ IR
intervallumon értelmezett Riemann-integrálható valós
függvények) + a függvények szokásos összeadása és skalárral való szorzása - VT
1.4. Fontos fogalmak vektorterekben Az általános vektortérfogalom bevezetése után mindazok a fogalmak és a síkvektorok azon tulajdonságai, amelyek az összeadás és a skalárral való szorzás m¶veletével kapcsolatosak, értelmesek lesznek bármilyen vektortérben. Nézzünk meg néhány alapvet® deníciót.
Legyen
(X, ⊕, ⊙)
egy tetsz®leges vektortér.
1. Lineáris kombináció
1.4 Deníció.
Az
x 1 , x2 , . . . x n ∈ X
vektorok lineáris kombinációjának nevezzük az
α1 ⊙ x1 ⊕ α2 ⊙ x2 ⊕ . . . ⊕ αn ⊙ xn , alakú kifejezést.
4
αi ∈ IR, i = 1, 2, . . . , n
2. Lineáris függetlenség
1.5 Deníció.
Azt mondjuk, hogy az
x1 , x2 , . . . xn ⊂ X
vektorok lineárisan függetlenek,
ha
α1 ⊙ x1 ⊕ α2 ⊙ x2 ⊕ . . . ⊕ αn ⊙ xn = 0X ⇔ αi = 0, i = 1, 2, . . . , n. A deníció tetsz®leges (tehát akár végtelen sok elem¶) vektorhalmazra a következ®képpen szól:
1.6 Deníció.
Y ⊂X
Azt mondjuk, hogy az
halmaz lineárisan független, ha
Y
bármely
véges részhalmaza lineárisan független. 3. Lineáris burok
1.7 Deníció.
Az
x1 , x2 , . . . , xn ∈ X
vektorok lineáris burkának nevezzük az
összes lineáris kombinációjának a halmazát. Jelölése: Megjegyezzük, hogy
span[x1 , x2 , . . . , xn ]
x1 , x2 , . . . , xn
span[x1 , x2 , . . . , xn ].
mindig altere az
(X, ⊕, ⊙)
vektortérnek.
4. Vektortér generálórendszere:
1.8 Deníció. ha
X
A
G⊂X
halmazt az
minden eleme el®állítható
G
(X, ⊕, ⊙)
vektortér generálórendszerének nevezzük,
elemeinek lineáris kombinációjával.
5. Vektortér bázisa
1.9 Deníció.
B ⊂ X halmazt az (X, ⊕, ⊙) vektortér bázisának nevezzük, (X, ⊕, ⊙) vektortérnek, és B lineárisan független halmaz.
A
rálórendszere az
ha
B
gene-
Belátható, hogy egy vektortérben minden bázis azonos elemszámú (számosságú). A bázist más szóval koordináta-rendszernek nevezzük.
6. Vektortér dimenziója
1.10 Deníció.
(X, ⊕, ⊙) vektortér dimenziójának a benne lév® bázisok elemszámát dimX . Ha dimX < +∞, akkor a vektorteret véges dimenziós vektor-
Az
nevezzük. Jelölése: térnek nevezzük.
A bevezet®ben tárgyalt síkvektoroknak vannak egyéb speciális tulajdonságai is, amelyeket ott felsoroltunk. Ezekkel nem feltétlenül rendelkezik bármilyen vektortér. Pl. nem biztos, hogy van hosszuk és irányuk az elemeknek, továbbá nem tartozik lényegileg a vektorfogalomhoz, hogy értelmes a skaláris szorzat. A kés®bbiekben még a hosszúság és a skaláris szorzás fogalmát általánosítjuk.
5
1.4.1. A véges dimenziós vektorterek kapcsolata az
IRn
vektortérrel
Ebben az alfejezetben megmutatjuk, hogy a véges dimenziós vektorterek között kitüntetett szerepe van az
vektortérnek.
n dimenziós vektortér (n ∈ IN tetsz.) Ekkor X -ben létezik n elem¶ bázis: B := {b1 , . . . , bn } ⊂ X . A B halmaz generálórendszere az (X, ⊕, ⊙) vektortérnek, azaz tetsz®leges x ∈ X elemet el® lehet állítani a B elemeinek lineáris kombinációjával, jelölje az együtthatókat rendre α1 , . . . , αn :
Legyen
(X, ⊕, ⊙)
IRn
egy tetsz®leges
x = α1 b1 + . . . + αn bn . (Itt már elhagytuk a karikákat a m¶veleti jelekr®l, s®t, a valós számok szorzásához hasonlóan a szorzást jelöl® pontot is elhagyjuk.) Továbbá,
B
lineárisan független rendszer,
amib®l következik, hogy a fenti el®állítás egyértelm¶. Tegyük fel ugyanis, hogy a fenti
x
elemet más együtthatókkal is megkaphatjuk:
x=α ˜ 1 b1 + . . . + α ˜ n bn . Ekkor a fenti két egyenl®séget kivonva egymásból, a
0X = (α1 − α ˜ 1 )b1 + . . . + (αn − α ˜ n )bn egyenl®séget kapjuk. Mivel a
b1 , . . . , b n
neáris kombináció csak akkor adhatja
vektorok lineárisan függetlenek, a jobb oldali li-
X
nullvektorát, ha mindegyik együttható nulla.
Ebb®l az következik, hogy nincs két különböz® el®állítás. A fenti gondolatmenetb®l az következik, hogy ha ezen bázis segítségével n-est, nevezetesen, a a fenti
x
B
X
X -ben rögzítettünk egy B
minden elemének egyértelm¶en megfeleltethetünk egy szám-
bázisbeli el®állításában szerepl® együtthatókból állót.
elemnek megfeleltethetjük az
(α1 , . . . , αn ) ∈ IR
n
elemet.
rosához a megfelel®
n
IR
-beli elemek összegét rendeli, és bármely
IRn -beli
X
X -beli
elem
X -beli elem skalárszo-
elem skalárszorosát rendeli.
Fontos következmény, hogy bármely vektortérrel, azaz
Azaz pl.
Ez a megfeleltetés
(bijekció) ráadásul még annyiban is speciális, hogy m¶velettartó, azaz két összegéhez a megfelel®
bázist, akkor
n (véges) dimenziós X
vektortér azonosítható az
elemei megfeleltethet®k szám-n-eseknek, és ha
X
IRn
elemein összeadást
és skalárral való szorzást kell elvégezni, akkor a m¶veleteket a megfelel® szám-n-esekkel is elvégezhetjük. Ilyen értelemben elegend® a véges dimenziós vektorterek közül csak az
IRn
vektortérrel foglalkozni. Ez az azonosíthatóság végtelen dimenziós vektorterekre már
6
nem igaz, így pl. nem azonosíthatunk minden folytonos függvényt egy szám-n-essel.
2.
Lineáris leképezések
Ebben a fejezetben vektorterek között ható leképezésekr®l (függvényekr®l) lesz szó. Ezek között a legegyszer¶bbek és a gyakorlatban igen fontosak a lineáris leképezések.
2.1 Deníció.
Legyen
(X1 , ⊕1 , ⊙1 )
és
(X2 , ⊕2 , ⊙2 )
két vektortér. Az
f : X1 → X2
leké-
pezést lineárisnak nevezzük, ha igaz rá a következ® két tulajdonság: 1.
f (x1 ⊕1 x2 ) = f (x1 ) ⊕2 f (x2 ) ∀x1 , x2 ∈ V1 ,
2.
f (λ ⊙1 x) = λ ⊙2 f (x) ∀x ∈ X1 , ∀λ ∈ IR.
Az
X1 → X2
képez® lineáris leképezések halmazát
Hom(X1 , X2 )
jelöli.
Megjegyezzük, hogy egy lineáris leképezésnek nemcsak az értelmezési tartománya vektortér, de a képtere is:
2.2 Állítás.
Ha
f : X1 → X2
lineáris leképezés, akkor
f
képtere (R(f )) altere
X2 -nek.
Biz.: Belátandó, hogy
R(f )
zárt az összeadásra és a skalárral való szorzásra.
y1 és y2 tetsz®leges R(f )-beli elemek. Ekkor létezik x1 , x2 ∈ X1 , amelyekre f (x1 ) = y1 , f (x2 ) = y2 . Az f linearitása miatt y1 + y2 = f (x1 ) + f (x2 ) = f (x1 + x2 ), ami eleme R(f )-nek, tehát y1 + y2 ∈ R(f ). 2.) Skalárral való szorzás: Legyen y ∈ R(f ) tetsz®leges. Ekkor létezik x ∈ X1 : f (x) = y . Tetsz®leges λ ∈ IR esetén f linearitása miatt λy = λf (x) = f (λx), ami eleme R(f )-nek, tehát λy ∈ R(f ).
1.) Összeadás: Legyenek
A legegyszer¶bb esetben
X1
és
X2
is
IR,
azaz a leképezés valós-valós függvény.
hattuk, hogy ezek között a linearitás deníciójának csak az tesznek eleget, ahol
Legyen most
a ∈ IR
X1 = IR2
és
f (x) = ax
Lát-
alakú függvények
rögzített szám.
X2 = IR,
azaz
f : IR2 → IR
(az
f
függvény számpárokhoz
számokat rendel):
f : (x1 , x2 ) 7→ y
2.3 Tétel. alakú, ahol
f : IR2 → IR függvény pontosan a1 , a2 ∈ IR rögzített számok. Egy
7
akkor lineáris, ha
f (x1 , x2 ) = a1 x1 + a2 x2
Biz.: (⇐) Ha az
f
függvény
f (x1 , x2 ) = a1 x1 + a2 x2
alakú, akkor
1.
f ((x1 , x2 ) + (˜ x1 , x˜2 )) = f (x1 + x˜1 , x2 + x˜2 ) = a1 (x1 + x˜1 ) + a2 (x2 + x˜2 ) = (a1 x1 + a2 x2 ) + (a1 x˜1 + a2 x˜2 ) = f (x1 , x2 ) + f (˜ x1 , x˜2 ) ∀(x1 , x2 ), (˜ x1 , x˜2 ) ∈ IR2
esetén,
2.
f (λ · (x1 , x2 )) = f (λx1 , λx2 ) = a1 λx1 + a2 λx2 = λ(a1 x1 + a2 x2 ) = λf (x1 , x2 ) ∀(x1 , x2 ) ∈ IR2 , ∀λ ∈ IR esetén. Tehát f lineáris. (⇒) Belátjuk, hogy ha f lineáris, akkor csak a fenti alakú lehet. Tudjuk, bázist alkotnak az (1, 0), (0, 1) elemek. Ezek segítségével felírhatjuk:
hogy
IR2 -ben
f (x1 , x2 ) = f (x1 · (1, 0) + x2 · (0, 1)) Mivel
f
lineáris, ezért tagonként alkalmazhatjuk
f -et,
és az
x1
és
x2
szorzó kihozható:
f (x1 · (1, 0) + x2 · (0, 1)) = x1 · f (1, 0) + x2 · f (0, 1). Vezessük be az
a1 := f (1, 0), a2 := f (0, 1)
jelöléseket. Ezzel
f (x1 , x2 ) = a1 x1 + a2 x2 .
x := (x1 , x2 ), a = (a1 , a2 ) jelölések bevezetésével, hogy pontosan akkor lineáris, ha f (x) = a · x alakú, ahol a pont az
Ezt úgy is megfogalmazhatjuk az egy
R
2
f : IR2 → IR
függvény
-beli skaláris szorzást jelenti. (Vegyük észre a valós lineáris függvényekkel való hason-
lóságot!)
Vizsgáljuk végül azt az általános esetet, amikor
f : IRn → IRm
típusú.
ekhez hasonlóan belátható a következ®
2.4 Tétel.
Egy
f : IRn → IRm
függvény pontosan akkor lineáris, ha az
f (x1 , x2 , . . . , xn ) = (y1 , . . . ym )
8
Ekkor a fenti-
jelöléssel
y1 = a11 x1 + a12 x2 + . . . + a1n xn y2 = a21 x1 + a22 x2 + . . . + a2n xn .. .
ym = am1 x1 + am2 x2 + . . . + amn xn alakú, ahol
aij , i = 1, 2, . . . , m, j = 1, 2, . . . , n
rögzített valós számok.
2.1. Mátrixok és kapcsolatuk az IRn → IRm lineáris leképezésekkel Az
IRn → IRm
lineáris leképezések áttekinthet®bbé válnak a márixok segítségével.
A
mátrixot az els® félévben számtáblázatként deniáltuk. Vegyük észre, hogy ez nem matematikai deníció, ezért pontosítani szükséges.
2.5 Deníció. nevezünk. Az Azaz egy
M : {1, 2, . . . , m} × {1, 2, . . . , n} → IR függvényt m × n-es m × n-es mátrixok halmazát az IRm×n szimbólummal jelöljük. Egy
m × n-es
mátrixnak
mátrix precízen úgy értelmezhet®, mint olyan függvény, amely index-
párokhoz rendel valós számokat; az els® index 1-t®l m-ig, a második 1-t®l n-ig fut. Egy ilyen leképezést valóban táblázat formájában kényelmes megadni: készítünk egy m sorból és n oszlopból álló táblázatot, és az i-edik sor j-edik oszlopába írjuk azt a számot, amelyet az
M
mátrix az
(i, j)
párhoz rendel. Pl. az
M = [2 6 8] 1 × 3-as
táblázat formájában
megadott mátrix a következ® leképezést jelenti:
M (1, 1) = 2, M (1, 2) = 6, M (1, 3) = 8. Tekintsük az
IRn → IRm
lineáris leképezések 2.4 Tétel szerinti általános alakját.
Vilá-
gos, hogy egy ilyen alakú függvényt azonosítanak a koordináta-függvények kifejezésében szerepl®
aij
szorzók. Ez
m-szer n
db valós számot jelent, ahol fontos, hogy melyik szám
melyik helyen szerepel. Ezért a lineáris leképezést megadhatjuk egy a mátrix
M (i, j)
eleme az
yi
koordináta-függvényben
xj
a11 a12 . . . a1n a21 a22 . . . a2n M = .. . am1 . . . . . . amn
9
m × n-es
mátrixszal:
el®tt álló együttható lesz:
M (i, j) jelölés helyett szokásosabb a megfelel® tehát M (i, j) helyett az mij jelölést alkalmazzuk.
A mátrix elemeit az indexszel jelölni,
kisbet¶vel és kett®s
Pl. Milyen lineáris leképezést határoz meg az
[ M=
mátrix? Azt az
f : IR3 → IR2
1 2 3 2 3 4
]
leképezést, amelyre
f (x1 , x2 , x3 ) = (x1 + 2x2 + 3x3 , 2x1 + 3x2 + 4x3 )
2.2. M¶veletek lineáris leképezésekkel Valós függvények körében ismeretes a függvények összegének, skalárral való szorzatának és kompozíciójának a fogalma. Mindezek a m¶veletek értelmezhet®k általánosan tetsz®leges vektorterek között ható függvényekre is.
1. Összeadás X1 és X2 vektortér. Az f : X1 ⊃→ X2 és g : X1 ⊃→ X2 függvények h : X1 ⊃→ X2 függvényt értjük, amelyre D(h) = D(f ) ∩ D(g), és
Legyen a
összegén azt
h(x) = f (x) + g(x) ∀x ∈ D(h). Azaz minden pontban összeadjuk a két függvényértéket, ahogy a valós függvények összeadásánál. (Ez megtehet®, mert a függvényértékek egy vektortér elemei). Jelölése:
h =: f + g .
Vizsgáljuk speciálisan az
2.6 Tétel.
IRn → IRm
f, g : IRn → IRm f + g mátrixát úgy
Ha
leképezés, és
lineáris leképezések esetét.
lineáris leképezések, akkor kapjuk, hogy az
f
és
g
f +g
is
Rn → IRm
lineáris
mátrixának a megfelel® elemeit
összeadjuk. Az állítás igazságát csak arra az esetre gondoljuk meg, amikor
g
is
IR → IR 2
2
f, g : IR2 → IR2 .
lineáris leképezések, akkor a következ® alakúak:
f (x1 , x2 ) = (a11 x1 + a12 x2 , a21 x1 + a22 x2 ),
10
Ha
f
és
és
g(x1 , x2 ) = (b11 x1 + b12 x2 , b21 x1 + b22 x2 ). f
Tehát az
[
leképezésnek az
A= mátrix felel meg, a
g -nek
B=
IR → IR 2
2
f
]
pedig a
[
mátrix. Adjuk össze az
a11 a12 a21 a22
és
g
b11 b12 b21 b22
]
függvényt. Ez az összeadás fenti deníciója szerint az az
függvény lesz, amely egy
(x1 , x2 ) ∈ IR2
elemhez az
f (x1 , x2 ) + g(x1 , x2 ) összeget
rendeli, azaz
(f +g)(x1 , x2 ) = f (x1 , x2 )+g(x1 , x2 ) = (a11 x1 +a12 x2 +b11 x1 +b12 x2 , a21 x1 +a22 x2 +b21 x1 +b22 x2 ) = ((a11 + b11 )x1 + (a21 + b21 ))x2 , (a21 + b21 )x1 + (a22 + b22 )x2 ). Látható, hogy az összegleképezés is lineáris, és mátrixa
[ C= azaz valóban összeadódtak
A
és
B
a11 + b11 a12 + b12 a21 + b21 a22 + b22
] ,
megfelel® elemei.
2. Skalárral való szorzás f : X1 → X2 λ D(h) = D(f ), és Az
skalárszorosán azt a
h : X1 → X2
függvényt értjük, amelyre
h(x) = λ · f (x) ∀x ∈ D(h). Azaz minden függvényértéket szorzunk a
λ számmal, ahogy valós függvényeknél szokásos.
(Ennek is van értelme, mert a függvényértékek egy vektortér elemei.) Jelölése:
h =: λ · f .
Vizsgáljuk ismét speciálisan az
IRn → IRm
2.7 Tétel.
lineáris leképezés, akkor a
Ha
f : IRn → IRm
lineáris leképezések esetét.
áris leképezés, amelynek a mátrixát úgy kapjuk, hogy szorozzuk.
11
f
IRn → IRm
line-
mátrixának minden elemét
λ-val
λ-szorosa
is
Csak az
f : IR2 → IR2
esetre gondoljuk meg. Az
f (x1 , x2 ) = (a11 x1 + a12 x2 , a21 x1 + a22 x2 ) λ-szorosa
leképezés
(λ · f )(x1 , x2 ) = λ · f (x1 , x2 ) = (λa11 x1 + λa12 x2 , λa21 x1 + λa22 x2 ), amir®l látható, hogy lineáris, és mátrixa
[
vagyis valóban úgy kaptuk, hogy az
λa11 λa12 λa21 λa22
f
leképezés
]
A
, mátrixának minden elemét
λ-val
szo-
roztuk.
2.8 Megjegyzés.
Hom(IRn , IRm ) halmazon tehát van összeadás és skalárral való szorn m zás, és ezen m¶veletekre a Hom(IR , IR ) halmaz zárt. Belátható a vektortereknél látott n m hét m¶veleti tulajdonság is, így Hom(IR , IR ) vektorteret alkot ezen m¶veletekkel. Általánosan is igaz, hogy akármilyen X1 , X2 vektorterekr®l van szó, a Hom(X1 , X2 ) tér az A
el®bbi módon deniált összeadás és skalárral való szorzás m¶veletével vektorteret alkot.
3. Kompozíció (összetett függvény) Legyenek
X1 , X 2
és
kompozícióján azt a
D(g)},
X3 vektorterek. Az f : X1 → X2 és g : X2 → X3 függvények h : X1 → X3 függvényt értjük, amelyre D(h) = {x ∈ D(f ) : f (x) ∈
és
h(x) = g(f (x)) ∀x ∈ D(h). Jelölése:
h =: g ◦ f .
Mit lehet mondani egy
f : IRn → IRm
és
g : IRm → IRl
lineáris leképezés kompozíciójáról?
Az egyszer¶ség kedvéért azt az esetet nézzük meg részletesebben, amikor azaz mindkét lineáris leképezés
IR2 → IR2
típusú. Legyen tehát
f (x1 , x2 ) = (a11 x1 + a12 x2 , a21 x1 + a22 x2 ) és
g(y1 , y2 ) = (b11 y1 + b12 y2 , b21 y1 + b22 y2 ).
12
n = m = l = 2,
A
g◦f
kompozíció felírásához a
sítsük be az
(x1 , x2 )
g
függvény argumentumában
y1
y2
és
helyébe helyette-
f-képét:
(g◦f )(x1 , x2 ) = (b11 (a11 x1 +a12 x2 )+b12 (a21 x1 +a22 x2 ), b21 (a11 x1 +a12 x2 )+b22 (a21 x1 +a22 x2 )) Az eredmény koordináta-függvényeiben
x1
és
x2
együtthatóit leolvasva látható, hogy
g◦f
a következ® mátrixszal azonosítható:
[
b11 a11 + b12 a21 b11 a12 + b12 a22 b21 a11 + b22 a21 b21 a12 + b22 a22
]
i-edik sorában és j -edik oszlopában (i, j = 1, 2) lév® elemét úgy kaphatjuk meg, hogy a B mátrix i-edik sorában lév® vektort skalárisan szorozzuk az A n m m mátrix j -edik oszlopában lév® vektorral. Általában pedig, ha f : IR → IR és g : IR → IRl lineáris leképezések, akkor (g ◦ f ) : IRn → IRl lineáris leképezés lesz, amelynek mátrixa ∑ l × n-es, és i-edik sorának j-edik eleme a m k=1 bik akj , i = 1, . . . , l, j = 1, . . . n képlettel
Ennek a mátrixnak az
adható meg.
2.2.1. M¶veletek mátrixokkal Most tekintsük az összes
m-szer n-es
mátrix halmazát önmagában. Ezen a halmazon is
deniálhatunk m¶veleteket!
1. Összeadás Kézenfekv®, hogy két mátrix összegét deniáljuk úgy, hogy az összegmátrix az összeadandóknak megfelel® lineáris leképezések összegét adja meg.
2.9 Deníció.
Az
A, B ∈ IRm×n
mátrixok
A+B
összegén azt a
C ∈ IRm×n
mátrixot
értjük, amelynek elemeire
cij := aij + bij ,
i = 1, 2, . . . , m, j = 1, 2, . . . , n.
2. Skalárral való szorzás Egy mátrix skalárszorosán értsük azt a mátrixot, amely a mátrixnak megfeleltetett lineáris leképezés skalárszorosának felel meg.
2.10 Deníció.
Az
A ∈ IRm×n
mátrix
λ ∈ IR
számszorosán azt a
értjük, amelynek elemeire
bij := λ · aij ,
i = 1, 2, . . . , m, j = 1, 2, . . . , n. 13
B ∈ IRm×n
mátrixot
2.11 Megjegyzés.
Ezen két m¶velettel ellátva az
a m¶veletek fenti deníciója biztosítja, hogy
m×n
IR
m×n
IR
Hom(IRn , IRm )
m¶velettartó bijekció van. A
IRm×n
halmaz vektorteret alkot, továbbá
és a
Hom(IRn , IRm )
vektortér között
vektortér ilyen értelemben azonosítható az
vektortérrel.
3. Mátrixszorzás Két mátrix egymással való szorzatát csak arra az esetre értelmezzük, amikor a megfelel® lineáris leképezéseknek értelmes a kompozíciója, és úgy deniáljuk, hogy a szorzatmátrix a kompozícióleképezést reprezentálja.
2.12 Deníció.
A ∈ IRl×m
Az
és
B ∈ IRm×n mátrixok A · B
szorzatán azt a
C ∈ IRl×n
mátrixot értjük, amelynek elemeire
cij :=
m ∑
aik bkj ,
i = 1, 2, . . . , l, j = 1, 2, . . . , n.
k=1 Vegyük észre, hogy ha adva van egy lineáris leképezés
IRn
IRn -b®l IRm -be,
akkor egy
x ∈
vektor képét is meg tudjuk kapni mátrixszorzás segítségével: a leképezés mátrixával
megszorozzuk az
x
vektort mint
n × 1-es
oszlopmátrixot.
2.3. Lineáris leképezések invertálása, az inverz mátrix A lineáris leképezés függvény, ezért értelmes az a kérdés, hogy egy lineáris leképezésnek mikor létezik inverze. Idézzük fel, hogy mit értettünk általában egy mazba képez®
f
X
halmazból
Y
hal-
f az egész azaz egy R(f )-beli
függvény inverzén. (Az egyszer¶ség kedvéért tegyük fel, hogy
X -en értelmezve van.) Láttuk, hogy f akkor invertálható, ha injektív, elemet csak egyetlen X -beli elemhez rendel hozzá. Az f függvény inverze deníció szerint −1 az az f : R(f ) → X függvény, amelyre minden y ∈ R(f ) pontban f −1 (y) = x, ahol y = f (x). Vagyis ez az f függvény fordítottja. Emlékeztetünk két fontos állításra:
2.13 Állítás.
Ha
tásfüggvény), és
f
f ◦ f −1 = idR(f ) (az R(f ) → R(f ) X → X képez® identitásfüggvény).
invertálható, akkor
f −1 ◦ f = idX
(az
2.14 Állítás.
Egy
2.15 Állítás.
Az inverz függvény egyértelm¶.
f
függvény inverze mindig invertálható, és
képez® identi-
(f −1 )−1 = f .
Biz.: A bizonyítás indirekt. Tegyük fel, hogy az
f˜−1 ̸= f −1 .
f˜−1 : R(f ) → X
függvény is inverze
f -nek,
Ekkor
f˜−1 = f˜−1 ◦ idR(f ) = f˜−1 ◦ (f ◦ f −1 ) = (f˜−1 ◦ f ) ◦ f −1 = idX ◦ f −1 = f −1 . 14
de
Tehát a két inverz függvény nem lehet különböz®.
X1 , X2 vektorterek, és f : X1 → X2 lineáris leképezés, akkor láttuk, hogy f képtere al−1 tere X2 -nek. Így ha f invertálható, akkor az f inverz leképezés értelmezési tartománya, D(f −1 ) is mindig vektortér (hiszen D(−1 ) = R(f )). A továbbiakban az f : IRn → IRm
Ha
típusú lineáris leképezések inverzével foglalkozunk.
2.16 Állítás.
Ha
f : IRn → IRm
lineáris és invertálható, akkor
f −1 : IRm ⊃→ IRn
is
lineáris.
Biz.: Vizsgáljuk meg a linearitás két tulajdonságát! 1. Igaz-e, hogy Vezessük be az
f −1 (a + b) = f −1 (a) + f −1 (b) ∀a, b ∈ D(f −1 )? x := f −1 (a) és y := f −1 (b) jelölést. Mivel f lineáris, f (x) + f (y) = f (x + y),
azaz
a + b = f (f −1 (a) + f −1 (b)). Alkalmazzuk mindkét oldalra az
f −1
függvényt! Ezzel a belátandó tulajdonágot kapjuk:
f −1 (a + b) = f −1 (a) + f −1 (b). 2. Igaz-e, hogy Mivel
f
f −1 (λa) = λf −1 (a) ∀a ∈ D(f −1 ), ∀λ ∈ IR?
lineáris,
f (λx) = λf (x). Az el®bb bevezetett jelölést alkalmazva
f (λf −1 (a)) = λf (f −1 (a)) = λa. Alkalmazzuk ismét mindkét oldalra az
f −1
függvényt! Ezzel
f −1 (λa) = λf −1 (a), ami éppen a belátandó állítás.
2.17 Megjegyzés. Y
Ez az állítás jóval általánosabban is igaz: minden
vektorterek) lineáris függvény inverze is lineáris.
15
f : X → Y (X
és
Ismeretes, hogy egy
f : IRn → IRm
0m ∈ IRm
nullvektort rendeli
vektor, és
f
linearitása miatt
0n ∈ IRn nullvektorhoz mindig a n hozzá. (Hiszen f (0n ) = f (0 · x), ahol x ∈ IR tetsz®leges f (0 · x) = 0 · f (x) = 0m . Itt kétszer is kihasználtuk azt az lineáris függvény a
egyszer¶en belátható tényt, hogy egy vektortér bármely elemét 0-val szorozva a vektortér nullvektorát kapjuk.) Egyszer¶en belátható, hogy az invertálható lineáris függvényekre ennél több is igaz:
2.18 Tétel. Az f : IRn → IRm lineáris függvény pontosan akkor invertálható, ha a 0m ∈ IRm vektort csak a 0n ∈ IRn vektorhoz rendeli hozzá. Biz.: (⇒) Tegyük fel, hogy az
f
lineáris leképezés invertálható. Ekkor semmilyen értéket nem
⇒ csak a 0n helyen veszi fel. n (⇐) Tegyük fel, hogy f a 0m ∈ IR vektort csak a 0n ∈ IR vektorhoz rendeli hozzá. Belátandó, hogy f injektív, azaz f (x1 ) = f (x2 ) esetén x1 = x2 . Tegyük fel, hogy f (x1 ) = f (x2 ). Ekkor f (x1 ) − f (x2 ) = 0m . Mivel f , lineáris, így f (x1 − x2 ) = 0m . De f a 0m -et csak a 0n -hez rendeli, így x1 − x2 = 0n ⇒ x1 = x2 . vehet fel két különböz® helyen, így a nullvektort sem
m
Ennek következménye az alábbi állítás. (A továbbiakban feltesszük, hogy vagyis az egész
2.19 Állítás.
Rm -be Ha az
R(f ) = IRm ,
beleképez.)
f : IRn → IRm
lineáris függvény invertálható, és
R(f ) = Rm ,
akkor
n = m. Bizonyítás helyett csak a legegyszer¶bb eseteket gondoljuk végig.
m < n? f : IR2 → IR.
1. Miért nem lehet Legyen el®ször
Tudjuk, hogy ha
f
lineáris, akkor
f (x1 , x2 ) = a1 x1 + a2 x2 a1 x1 +a2 x2 fügvényérték milyen (x1 , x2 ) esetén lehet 0? Természetesen nem csak akkor, ha x1 = 0 és x2 = 0. Ezért az el®bbi állítás értelmében f nem lehet invertálható. 3 2 Legyen most f : IR → IR . Az ilyen típusú lineáris függvény
alakú. Az
f (x1 , x2 , x3 ) = (a1 x1 + a2 x2 + a3 x3 , b1 x1 + b2 x2 + b3 x3 ) alakú. A jobb oldali vektor megint nem csak
x1 = x2 = x3 = 0
ez azt jelentené, hogy az
a1 x1 + a2 x2 + a3 x3 = 0 b1 x1 + b2 x2 + b3 x3 = 0 16
esetén lehet nulla, hiszen
lineáris egyenletrendszernek egyetlen megoldása van. Ez pedig nem lehetséges, mert ehhez az együtthatómátrix rangjának 3-nak kellene lennie (ennyi az ismeretlenek száma), de csak két sora van.
m
Általában is belátható, hogy 2.
Miért nem lehet
m > n?
esetén a függvény nem lehet invertálható.
Mert ekkor az 1.
pont értelmében az
f −1 : IRm → IRn
függvény nem lehetne invertálható.
Ez az oka annak, hogy csak
Tudjuk, hogy egy
f : IRn → IRn
f : IRn → IRn
függvények invertálhatóságával foglalkozunk.
lineáris függvény megfelel egy
szorzásnak. Mivel a függvény inverze szintén megfelel egy
n × n-es
2.20 Deníció.
Egy
IRn → IRn
n × n-es
képez, az inverz leképezésnek is
mátrix.
A ∈ IRn×n
mátrixot invertálhatónak nevezünk, ha a neki megfelel®
f : IRn → IRn lineáris leképezés invertálható. Ekkor az f −1 : IRn → IRn −1 mátrixát az A mátrix inverzének nevezzük. Jelölése: A . Nyilvánvalóan
mátrixszal való
A · A−1 = I
és
lineáris leképezés
A−1 · A = I .
Vizsgáljuk meg, hogy milyennek kell lennie egy mátrixnak ahhoz, hogy a mátrix, vagyis a
m = n esetre alinvertálható, ha f (x) = 0n
neki megfeleltetett lineáris leképezés invertálható legyen! A 2.18 tételt az kalmazva, egy csak az
f : IR → IR
x = 0n
n
n
lineáris leképezés pontosan akkor
helyen áll fenn. Mivel
A · x = 0n
f (x) = A · x,
ahol
A
a lineáris leképezés mátrixa,
x = 0n vektorra. Erre a lineáris egyenletrendszerek elméletéb®l tudjuk a választ: az A · x = 0n lineáris egyenletrendszernek csak akkor egyedüli megoldása a 0n vektor, ha det A ̸= 0. Vagyis egy A mátrix pontosan akkor invertálható, ha det A ̸= 0.
ezért az a kérdés, hogy
milyen feltétel mellett áll fenn csak az
Szükségünk lehet mátrixszorzatok invertálására is.
Ezzel kapcsolatos a következ® állí-
tás.
2.21 Állítás.
Többtényez®s mátrixszorzat inverze az egyes tényez®k inverzének fordított
sorrendben vett szorzata. Ezt elég két mátrixra ellen®riznünk: lássuk be tehát, hogy
(AB)−1 = B −1 A−1 . Kihasználva a mátrixszorzás asszociativitását:
(AB)(B −1 A−1 ) = A(BB −1 )A−1 = AA−1 = I. 17
2.22 Megjegyzés.
Az inverz mátrix kiszámításával az el®z® félévben foglalkoztunk.
2.4. A transzponált mátrix A transzponált mátrix fogalmával az els® félévben már találkoztunk.
Emlékeztet®ül a
deníció:
2.23 Deníció.
Az
A ∈ IRm×n
mátrix transzponáltjának nevezzük azt az
AT ∈ IRn×m
mátrixot, amelynek elemeire
aTij := aji , Ez tehát az a mátrix, amelyet
i = 1, 2, . . . n, j = 1, 2, . . . , m.
A sorainak és oszlopainak a felcserélésével kapunk.
Mi lehet
a transzponált mátrix jelentése, azaz mint lineáris leképezés, mit fejez ki a transzponált mátrix? Ehhez emlékeztet®nek el®ször felidézzük az
IRn -beli vektorok skaláris szorzatának
a fogalmát.
2.24 Deníció.
Az
x, y ∈ IRn
vektorok skaláris szorzatán az
⟨x, y⟩ :=
n ∑
xi yi
i=1
számot értjük. Gondoljuk meg a következ®t: vajon igaz-e tetsz®leges
x
és
y ∈ IR
n
A ∈ IRn×n
mátrixra, hogy minden
vektor esetén fennáll az
⟨x, Ay⟩ = ⟨Ax, y⟩ egyenl®ség? Ellenpéldával könnyen megmutatható, hogy nem lehet mindig igaz, hiszen pl. az
[ A=
1 2 3 4
] ,
x = (0, 1),
y = (1, 0)
⟨x, Ay⟩ = 3 ̸= ⟨Ax, y⟩ = 2. Vizsgáljuk meg, mi annak a feltétele a 2 × 2-es mátrixok körében 2 igaz legyen minden x, y ∈ IR esetén! Kiszámolva a két oldalt:
megválasztásal
hogy
⟨x, Ay⟩ = x1 a11 y1 + x1 a12 y2 + x2 a21 y1 + x2 a22 y2 ,
18
⟨x, Ay⟩ = ⟨Ax, y⟩
és
⟨Ax, y⟩ = y1 a11 x1 + y1 a12 x2 + y2 a21 x1 + y2 a22 x2 . Látható, hogy a két kifejezés minden
a21 ,
azaz az
A
x, y ∈ IR2
mátrix szimmetrikus, másképpen
vektorra csak akkor teljesül, ha
T
A=A .
a12 =
Vagyis a mátrix szorzót csak
akkor vihetjük át a skaláris szorzatban a másik vektorra, ha az
A
mátrix egyenl® a saját
transzponáltjával. Mindig igaz viszont a következ®: ha
A ∈ IRm×n ,
akkor az
⟨x, Ay⟩ = ⟨AT x, y⟩ egyenl®ség fennáll minden
x ∈ IRm és y ∈ IRn esetén.
Tehát ha a mátrix szorzót át akarjuk
tenni a skaláris szorzatban a másik vektorra, akkor a mátrixot transzponálni is kell.
2.25 Deníció. leképezést az
f
Ha
f : IRn → IRm
lineáris leképezés, akkor az
lineáris
leképezés adjungáltjának nevezzük, ha
⟨x, f (y)⟩ = ⟨f ∗ (x), y⟩ Ha tehát az
f ∗ : IRm → IRn
f
lineáris leképezés mátrixa
A,
∀x ∈ IRm , y ∈ IRn . akkor az
A
f∗
mátrix transzponáltja az
adjungált leképezést reprezentálja.
2.5. Lineáris leképezések tetsz®leges véges dimenziós vektorterek között Láttuk, hogy egy
f : IRn → IRm
lineáris leképezést megadhatunk egy
m × n-es mátrixszal.
Most látni fogjuk, hogy tetsz®leges véges dimenziós vektortérb®l véges dimenziós vektortérbe képez® lineáris operátor is mindig reprezentálható mátrixszal.
Legyen
m.
f : X1 → X2
lineáris leképezés, ahol
Már volt róla szó, hogy egy
azonosítható az rögzítünk
n
IR
X1 -ben
,
is
X2 pedig az és X2 -ben is
neáris kombinációjával. egy
f˜ : IRn → IRm
X1 , X2
vektorterek, és dimX1
= n,
n
dimX2
= X1
n dimenzió vektortér azonosítható IR -nel, tehát IRm vektortérrel. Ez az azonosítás úgy történik, hogy egy bázist, és az elemeket el®állítjuk a báziselemek li-
Ilyen módon az
f : X1 → X2
lineáris leképezés azonosítható
szintén lineáris leképezéssel, ez pedig megfeleltethet® egy
m × n-es
mátrixnak. Keressük ezen mátrix elemeit.
X1 vektortérben kiválasztott bázis B1 = {a1 , a2 , . . . , an }, az X2 -beli bázis pedig B2 = {b1 , b2 , . . . , bm }. Tegyük fel, hogy az x ∈ X1 vektor el®állítása x = x1 a1 + . . . + xn an ,
Legyen az
19
x-et az (x1 , x2 , . . . , xn ) ∈ IRn szám-n-essel azonosíthatjuk. Az x vektor képét jelölje y , azaz y = f (x). Az y az X2 vektortérben van, így felírható a b1 , . . . , bm báziselemek lineáris kombinációjaként: y = y1 b1 + . . . + ym bm . Azt keressük, hogy mi a kapcsolat az (x1 , x2 , . . . , xn ) vektor és az (y1 , . . . , ym ) vektor között, pontosabban milyen mátrixszal szorozva kapjuk meg az (x1 , x2 , . . . , xn ) vektorból az (y1 , . . . , ym ) vektort. Az y = f (x) egyenl®ségben y és x helyébe is írjuk be a felbontásukat:
azaz
y1 b1 + . . . + ym bm = f (x1 a1 + . . . + xn an ). Az az
f leképezés lineáris, ezért a jobb oldalon f -et tagonként alkalmazhatjuk, és kihozhatjuk x1 , . . . xn szorzókat: y1 b1 + . . . + ym bm = x1 f (a1 ) + . . . + xn f (an ).
X2 -ben vannak (ezek az X1 -beli báziselemek f -képei), tehát mindegyiket felírhatjuk a b1 , . . . , bm vektorok Vegyük észre, hogy a jobb oldalon szerepl®
f (a1 ), . . . , f (an )
(1)
vektorok
lineáris kombinációjaként:
f (a1 ) = α11 b1 + . . . + α1m bm . . .
f (an ) = αn1 b1 + . . . + αnm bm Ezeket az összegeket beírva az (1) egyenl®ség jobb oldalába, mindkét oldalon az
X2 -beli
báziselemek egy-egy lineáris kombinációja lesz. Mivel a báziselemek lineárisan függetlenek, az egyenl®ség pontosan akkor áll fenn, ha az egyes báziselemek együtthatója mindkét oldalon megegyezik. Ebb®l az
y1 = α11 x1 + . . . + αn1 xn . . .
ym = α1m x1 + . . . + αnm xn összefüggésekhez jutunk. Ebb®l már látható, hogy a keresett mátrix
α11 α21 . . . αn1 α12 α22 . . . α2n A= .. . α1m α2m . . . αnm
20
alakú. Azaz a mátrix
i-edik
ai
oszlopában az
f -képének a B2 -bázisbeli koorX1 -beli n darab báziselem képét kell
báziselem
dinátái vannak. A mátrix felírásához tehát csak az
ismernünk. A kapott mátrix alakja természetesen függ attól, hogy milyen bázist adtunk meg
X1 -ben és X2 -ben.
(B1 , B2 ) bázispárhoz tartozó mátrixreprezentá-
Ezért a leképezés
ciójáról beszélünk.
2.6. Mátrixok sajátértékei és sajátvektorai Azt mondjuk, hogy az
x ∈ IR
n
,
x ̸= 0n
A ∈ IRn×n
vektor, amelyre
λ ∈ IR szám a sajátértéke, ha létezik olyan Ax = λx. Ekkor az x vektort az A mátrix λ számhoz
mátrixnak a
tartozó sajátvektorának nevezzük. Megjegyezzük, hogy a sajátérték komplex szám is lehet, és a sajátvektorok is lehetnek komplex elem¶ vektorok. Ebben a fejezetben azonban mi csak valós sajátértékekkel fogunk foglalkozni, és mindig csak valós elem¶ sajátvektorokat keresünk.
[
Pl. 1. Az
2 0 0 2
A=
]
mátrix minden vektort a kétszeresére nyújt. Azaz minden
2
IR
A-nak
sajátértéke a 2, és sajátvektora
-beli nemnulla vektor.
[
2. Határozzuk meg az
A=
7 −2 4 1
]
mátrix sajátértékeit és sajátvektorait!
λ sajátérték ⇔ létezik x ̸= 0n , amelyre Ax = λx. Az Ax = λx egyenlet másképpen úgy is írható: Ax − λx = 0n .
Megoldás:
A bal oldalon
x kiemelhet®
a következ®képpen:
(A − λI)x = 0n , ahol
I
jelöli a
2 × 2-es
identitásmátrixot.
oldalú) lineáris egyenletrendszert jelent az Összegezve: a
λ
Ez az egyenlet egy homogén (azaz
x
2.26 Megjegyzés.
•
x ̸= 0n
A
mátrixnak, ha az
(A − λI)x = 0n
megoldása.
A KroneckerCapelli-tételb®l következik, hogy egy
mogén lineáris egyenletrendszernek mindig van megoldása.
•
Világos, hogy mindig megoldása az
jobb
sajátvektorra.
szám pontosan akkor sajátértéke az
homogén lineáris egyenletrendszernek létezik
0n
x = 0n
21
(triviális megoldás).
Bx = 0n
ho-
•
Ha
|B| ̸= 0,
•
Ha
|B| = 0,
akkor a megoldás egyértelm¶ (azaz csak a triviális megoldás van). akkor végtelen sok megoldás van (azaz csak ekkor van nemtriviális
megoldás).
(A − λI)x = 0n egyenletrendszernek pontosan akkor amikor |A − λI| = 0. A kérdés tehát az, hogy milyen λ esetén lesz
Bennünket az utolsó eset érdekel: az
x ̸= 0n megoldása, |A − λI| = 0.
van
[
A példában
A − λI =
7 −2 4 1
]
[
λ 0 0 λ
−
]
[ =
7 − λ −2 4 1−λ
]
Ennek determinánsa:
7 − λ −2 |A − λI| = 4 1−λ Azt keressük, hogy ez milyen
λ
= (7 − λ)(1 − λ) + 8 = λ2 − 8λ + 15.
értékekre 0, azaz meg kell oldani a
λ2 − 8λ + 15 = 0 másodfokú egyenletet. A megoldóképletb®l:
λ1,2 =
8±
√ 64 − 60 ⇒ λ1 = 5, λ2 = 3. 2
Ezek tehát a keresett sajátértékek. Most rátérünk a hozzájuk tartozó sajátvektorok meghatározására.
λ1 = 5-höz tartozó sajátvektorok meghatározása: u sajátvektor, ha Au = λ1 u, azaz (A − λ1 I)u = 0. Ez egy homogén lineáris egyenletrendszer, amelyben keressük az ismeretlen u vektor u1 és u2 elemét. A megoldandó egyenletrendszer tehát:
A
2u1 − 2u2 = 0 4u1 − 4u2 = 0 A második egyenlet nem független az els®t®l.
(Ennek így is kell lennie, mert végtelen
sok megoldást kell kapnunk.) Minden olyan nemnulla kielégíti az els® egyenletet, azaz amelyre
[ u=
p p
u1 = u2 .
(u1 , u2 )
számpár megoldás, amely
Így az összes megoldás
] ,
p ∈ IR, p ̸= 0
22
tetsz®leges.
Ezzel megadtuk a
λ1 = 5-höz
tartozó sajátvektorokat. Ellen®rzésképpen:
[
azaz az
A
][
7 −2 4 1
p p
]
[
5p 5p
=
] ,
(p, p) alakú vektorokat. tartozó v sajátvektorok. A megoldás:
mátrix valóban 5-szörösére nyújtja a
Hasonlóan számíthatók ki a
λ2 = 3-hoz [
v=
q 2q
] ,
q ∈ IR, q ̸= 0
tetsz®leges.
Vegyük észre, hogy a sajátvektorról kikötöttük, hogy az nem lehet a nullvektor, de a sajátérték lehet nulla: nevezetesen, ha
A továbbiakban jelölje
σ(A)
az
A
|A| = 0
(hiszen ekkor
A − λI = A).
mátrix sajátértékeinek a halmazát.
Egyes speciális mátrixok sajátértékeit könny¶ meghatározni. Pl. legyen gonális mátrix, a f®átlóban a
d1 , d2 , . . . , dn
d1
0 D= . .. 0 D
Egy
mátrix jelölése röviden:
λ
szám pontosan akkor
dia-
számokkal:
A
D ∈ IRn×n
0
...
d2
0
...
0
diag[d1 , d2 , . . . , dn ]. sajátértéke D -nek,
0
0 dn . . .
Számítsuk ki a sajátértékeit! ha
|D − λI| = 0.
A
D − λI
mátrix a
következ® diagonálmátrix lesz:
D=
d1 − λ
0
...
0
0
d2 − λ
0
. . .
0
0 dn − λ
. . .
0
...
Ismeretes, hogy egy diagonális mátrix determinánsa a f®átlóban lév® elemek szorzata,
|D − λI| = (d1 − λ)(d2 − λ) · · · (dn − λ). Ez lesz nulla: λ1 = d1 , λ2 = d2 . . . , λn = dn . Azaz D σ(D) = {d1 , d2 , . . . , dn }.
azaz
a szorzat pedig
λ
következ® értékeire
sajátértékei a f®átlóban lév® számok:
Mik lesznek a hozzájuk tartozó sajátvektorok, ha nincs két egyforma elem a f®átlóban?
23
λ1 = d1 sajátértékhez amelyre Du = d1 u. Ez a
A
tartozó sajátvektor olyan nemnulla
u = (u1 , u2 , . . . , un )
vektor,
következ® egyenletrendszert jelenti:
d1 u1 = d1 u1 d2 u2 = d1 u2 . . .
dn un = d1 un n darab független egyenlet a sajátvektor elemeire. Az els® egyenletnek minden u1 ∈ IR szám eleget tesz. A többi egyenlet megoldása: u2 = 0, u3 = 0, . . . , un = 0. Azaz: u1 = p ∈ IR tetsz®leges, ui = 0, i = 2, 3, . . . , n. Így a d1 sajátértékhez tartozó sajátvektor n pl. az (1, 0, . . . , 0) ∈ IR vektor. Hasonlóan, a λi sajátértékhez tartozó sajátvektorok azok a vektorok, amelyek i-edik eleme
Ez
tetsz®leges, és a többi elemük nulla.
Megjegyezzük, hogy a háromszögmátrixokra is igaz, hogy sajátértékeik a f®átlóban lév® elemek.
Feladat.
Tegyük fel, hogy
Megoldás: Legyen
x
egy
λ ∈ σ(A).
λ-hoz
Mutassuk meg, hogy ekkor
tartozó sajátvektora az
A-nak.
λ2 ∈ σ(A2 )!
Ekkor
A2 x = A(Ax) = A(λx) = λ · Ax = λ2 x. x ̸= 0n A2 -nek.
Mivel téke
(hiszen sajátvektora
A-nak),
ezért ez pontosan azt jelenti, hogy
λ2
sajátér-
A következ® állítás a különböz® sajátértékekhez tartozó sajátvektorok egy fontos tulajdonságáról szól.
2.27 Tétel.
Az
A ∈ IRn×n
mátrix különböz®,
λ1 , λ 2 , . . . , λ k
sajátértékekhez tartozó saját-
vektorai lineárisan függetlenek.
Biz.: Teljes indukcióval!
• k = 1-re nyilvánvalóan igaz az állítás, hiszen egy darab nemnulla vektor önmagában lineárisan független.
•
k ∈ IN-re, és mutassuk meg, hogy akkor igaz k + 1-re része indirekt. Tegyük fel, hogy a k + 1 darab sajátvek-
Tegyük fel, hogy az állítás igaz is. A bizonyításnak ez a
24
tor (amelyeket jelöljön
α1 , α2 , . . . , αk+1
x1 , x2 , . . . , xk )
lineárisan összefügg®.
Ekkor léteznek olyan
nem csupa nulla számok, hogy
α1 x1 + α2 x2 + . . . αk xk + αk+1 xk+1 = 0n . Tegyük fel, hogy itt az
A
α1 ̸= 0,
(2)
és szorozzuk meg az egyenl®ség mindkét oldalát balról
mátrixszal.
Aα1 x1 + Aα2 x2 + . . . Aαk xk + Aαk+1 xk+1 = 0n . A bal oldali tagokban az
αi szorzókat el®rehozzuk, és kihasználjuk, hogy Axi = λi xi :
α1 λ1 x1 + α2 λ2 x2 + . . . αk λk xk + αk+1 λk+1 xk+1 = 0n .
(3)
λk+1 -gyel:
A (2) egyenl®séget szorozzuk végig
α1 λk+1 x1 + α2 λk+1 x2 + . . . αk λk+1 xk + αk+1 λk+1 xk+1 = 0n ,
(4)
majd vonjuk ki (3)-b®l (4)-et:
α1 (λ1 − λk+1 )x1 + α2 (λ2 − λk+1 )x2 + . . . αk (λk − λk+1 )xk = 0n , az utolsó tag ugyanis kiesett. A kapott egyenl®ségben a bal oldal els® tagjának együtt-
λk különböz®sége valamint α1 ̸= 0 miatt nem lehet nulla, így viszont a bal oldalon az x1 , x2 , . . . , xk vektorok egy nemtriviális lineáris kombinációja áll. Ez ellentmond annak a feltevésnek, hogy ezen x1 , x2 , . . . , xk sajátvektorok lineárisan függetlenek. Így a k + 1 darab sajátvektor nem lehet lineárisan összefügg®. Ebb®l az állításból következik, hogy ha egy mátrixnak van n darab különböz® sajátn értéke, akkor az azokhoz tartozó sajátvektorok bázist alkotnak IR -ben. hatója
λ1
és
2.6.1. Mátrixok spektrálfelbontása Megmutatható, hogy ha az sajátértéke, akkor
A
A ∈ IRn×n
mátrixnak van
n
darab különböz®,
λ1 , λ 2 , . . . , λ n
felírható
A = S · diag[λ1 , λ2 , . . . , λn ] · S −1 alakban, ahol
S
oszlopaiban sorra az
játvektorai vannak. Az
A
A
mátrix
λ1 , λ2 , . . . , λn
sajátértékeihez tartozó sa-
mátrix ilyen alakú felírását spektrálfelbontásnak nevezzük.
25
[
Pl. Adjuk meg a már látott
]
7 −2 4 1
A= mátrix spektrálfelbontását, ha lehet.
Megoldás: Láttuk, hogy
A-nak van két különböz® sajátértéke: λ1 = 5 és λ2 = 3. ⇒ A-nak
létezik spektrálfelbontása. Mindkét sajátértékhez keressünk egy-egy sajátvektort!
λ1 = 5-höz: Láttuk, hogy minden (p, p), p ̸= 0 vektor sajátvektor. (1, 1). (Bármelyik sajátvektort választhatjuk.) 2. λ2 = 3-hoz: Láttuk, hogy minden (q, 2q) vektor sajátvektor. Legyen Ezzel a keresett X mátrix: [ ] 1 1 S= 1 2 1.
Számítsuk ki
X
1 1 1 0 1 2 0 1
]
[ →
1 0 2 −1 0 1 −1 1
→(1.)−(2.)
[
inverze tehát:
S −1 = Ezzel
A
1 1 1 0 0 1 −1 1
(2.)−(1.)
[
S
pl.
u :=
v := (1, 2).
inverzét, pl. GaussJordan-eliminációval:
[
Az
Legyen pl.
2 −1 −1 1
]
]
]
spektrálfelbontása:
[ A=
1 1 1 2
] [ ·
5 0 0 3
] [ ·
2 −1 −1 1
]
Kés®bb visszatérünk arra a kérdésre, hogy mi mindenre jó a fenti mátrixfelbontás.
2.7. Speciális mátrixok Egyes speciális tulajdonságú mátrixok a gyakorlatban igen fontosak. Az els® félévben szó esett a diagonális, szimmetrikus és antiszimmetrikus mátrixokról.
A lineáris egyenlet-
rendszerek kapcsán megimerkedhettünk a háromszögmátrixokkal. Most további speciális mátrixfajtákról lesz szó. Megjegyezzük, hogy csak valós elem¶ mátrixokkal foglalkozunk, azonban a deníciók egy része általánosítható komplex elem¶ mátrixokra is.
26
2.28 Deníció.
Egy
A ∈ IRn×n
mátrixot ortogonális mátrixnak nevezünk, ha sor- (vagy
oszlop-)vektorai egymásra páronként mer®leges egységvektorok, azaz skaláris szorzatuk nulla, és hosszúságuk 1. Belátható, hogy egy mátrix pontosan akkor ortogonális, ha inverze a transzponáltja, azaz
A ∈ IRn×n
ortogonális mátrix
⇐⇒ AT = A−1 ,
azaz
AT A = AAT = I.
Ebb®l az is egyszer¶en következik, hogy egy ortogonális mátrixnak csak 1 vagy -1 lehet a determinánsa, hiszen a
det A · det AT = det I = 1
det A = det AT , feltételekb®l
(det A)2 = 1
következik, azaz
det A
értéke 1 vagy -1.
Példák ortogonális mátrixokra:
•
•
[
Identitásmátrix:
A
ϕ
Az
x
cos ϕ − sin ϕ sin ϕ cos ϕ
]
tengelyre való tükrözés mátrixa:
[
•
]
szög¶ elforgatás mátrixa:
[
•
1 0 0 1
Tükrözés a
ϕ/2
1 0 0 −1
]
irányszög¶ egyenesre:
[
cos ϕ sin ϕ sin ϕ − cos ϕ
]
Vegyük észre, hogy ez a mátrix szimmetrikus, azaz a transzponáltja saját maga. De mivel ortogonális is, a transzponáltja egyben az inverze, amib®l következik, hogy az inverze saját maga. Speciálisan, ha
ϕ = 90o ,
27
akkor a
45o -os
egyenesre tükrözünk,
[
ennek mátrixa:
0 1 1 0
]
Az ortogonális mátrixok fontos fajtája a permutációs mátrix.
2.29 Deníció.
Egy
A ∈ IRn×n
mátrixot permutációs mátrixnak nevezünk, ha minden
oszlopában és sorában pontosan egy elem 1, a többi 0. Az ilyen mátrixok egy vektor elemeit felcserélik, más szóval permutálják. Pl. az
1 0 0 A= 0 0 1 0 1 0 mátrix bármely háromdimenziós vektor második és harmadik elemét cseréli fel. Permutációs mátrix pl. az identitásmátrix és a már el®bb látott,
45o -os
egyenesre való tükrözés
mátrixa is.
2.30 Deníció.
Egy
A ∈ IRn×n
mátrixot normális mátrixnak nevezünk, ha
A
kommutál
a transzponáltjával, azaz
AT A = AAT . Nyilvánvalóan, minden ortogonális mátrix normális. (Fordítva nem igaz.) Igaz továbbá, hogy minden szimmetrikus mátrix is normális, mivel ezekre
A = AT , és így az AAT = AT A
feltétel automatikusan teljesül.
2.31 Deníció. k ∈ IN
hatvány,
A ∈ IRn×n mátrixot nilpotens mátrixnak nevezünk, ha létezik olyan k amelyre A = 0. A legkisebb ilyen tulajdonságú k számot a nilpotens Egy
mátrix fokszámának nevezzük. Megjegyezzük, hogy ha egy mátrixnál
An = 0,
akkor
Am = 0
is igaz minden
m > n
esetén.
[
Pl. az
A= mátrix nilpotens, ugyanis
0 1 0 0
]
A2 = 0.
Speciálisan, minden olyan tridiagonális mátrix, amelynek nullák vannak a f®átlójában, nilpotens. Olyan nilpotens mátrix is létezik azonban, amelynek nincs egyetlen nulla eleme
[
sem, pl.
A=
6 −9 4 −6 28
] ,
hiszen könnyen meggy®z®dhetünk róla, hogy ennek a mátrixnak a négyzete is a nullmátrix.
Egy
A ∈ IRn×n
mátrixra egyenérték¶ek a következ® állítások:
1.
A
2.
det(A − λI) = λn .
3.
A
nilpotens.
egyetlen sajátértéke a nulla.
A gyakorlatban (pl. mátrixok is.
széls®érték-számításhoz) fontosak a pozitív (ill.
negatív) denit
Ezek bizonyos szempontból a pozitív (negatív) valós számokhoz hasonló
tulajdonságokkal rendelkeznek.
2.32 Deníció. ha minden
Egy
x ∈ IRn
A ∈ IRn×n
mátrixot pozitív (negatív) denit mátrixnak nevezünk,
vektorra
⟨Ax, x⟩ ≥ 0 (ill. ⟨Ax, x⟩ ≤ 0), és egyenl®ség csak akkor van, ha
x
a nullvektor. Ha az
vektorokra pozitív, másokra negatív, akkor az
A
⟨Ax, x⟩
skaláris szorzat egyes
x
mátrixot indenitnek nevezzük.
A deníció alapján általában nehéz megvizsgálni, hogy egy mátrix pl.
pozitív denit
mátrix-e. Szimmetrikus mátrixra azonban könnyen ellen®rizhet® feltétel adható:
2.33 Tétel. Az
(Sylvester tétele)
A ∈ IRn×n
szimmetrikus mátrix pontosan akkor pozitív denit, ha összes bal fels®
sarokaldeterminánsa pozitív. A következ® mátrixfajtára szükségünk lesz a lineáris egyenletrendszerek iterációs megoldásánál.
2.34 Deníció.
Az
A ∈ IRn×n mátrixot szigorúan domináns f®átlójú mátrixnak nevezzük,
ha
|aii | >
n ∑
|aij |,
i = 1, . . . , n,
j=1,j̸=i
vagyis ha minden sorában a f®átlóban lév® elem abszolút értékben nagyobb, mint a sorban lév® összes többi elem abszolút értékének az összege. Pl. az
−10 1 3 A= 0 8 5 2 3 6
29
mátrix szigorúan domináns f®átlójú. Megmutatható, hogy az ilyen mátrix mindig reguláris.
2.35 Deníció.
A
P ∈ IRn×n
mátrixot projektormátrixnak nevezzük, ha
P 2 = P.
A projektormátrix tehát olyan lineáris leképezésnek felel meg, amelyet kétszer alkalmazva ugyanolyan, mintha csak egyszer alkalmaznánk. Ilyen pl. a
1 0 0 P = 0 1 0 0 0 0 mátrix, hiszen négyzetre emelve önmagát kapjuk.
(x, y, z) ∈ IR
3
vektort megszorozva az
vektort levetít az
xy -síkra.
(x, y, 0)
Ezzel a mátrixszal egy tetsz®leges
vektort kapjuk, azaz a mátrix minden
(Innen ered a projektor, azaz vetít® elnevezés.)
A fenti mátrix szinguláris, hiszen determinánsa 0.
Vajon minden projektormátrix
szinguláris?
2.36 Állítás.
Az egyetlen reguláris projektormátrix az identitásmátrix.
Biz.: Tegyük fel, hogy
P
projektormátrix reguláris. Ekkor létezik inverze. Mivel
P
projektor,
így
P 2 − P = P (P − I) = 0. Szorozzuk meg az egyenlet mindkét oldalát balról a
P −1
inverz mátrixszal:
P −1 P (P − I) = 0. Itt
P −1 P = I ,
P − I különbség hogy P = I.
tehát a bal oldalon a
egyenl®sége pontosan azt jelenti,
van.
Ennek nullmátirxszal való
Dierenciálegyenletek közelít® megoldása során találkozhatunk az alábbi mátrixfajtákkal.
2.37 Deníció.
A ∈ IRm×n
Megjegyezzük, hogy ha
monoton mátrix, ha
v ∈ IRn ,
akkor a
Ax ≥ 0
v ≥ 0
csak
x≥0
esetén áll fenn.
jelölés így értend®:
v
minden eleme
nagyobb vagy egyenl®, mint 0. Mátrixokra is ugyanezt a jelölést fogjuk alkalmazni. Mir®l lehet felismerni egy négyzetes monoton mátrixot?
2.38 Állítás. akkor
A
Ha az
A ∈ IRn×n
négyzetes mátrixnak létezik inverze, és az valós elem¶,
pontosan akkor monoton, ha
A−1 ≥ 0. 30
2.39 Deníció. egyenl®, mint
A ∈ IRn×n Z-mátrix, ha nulla, azaz aij ≤ 0, ha i ̸= j .
2.40 Deníció.
A ∈ IRn×n
a f®átlóján kívül minden eleme kisebb vagy
M-mátrix, ha Z-mátrix, létezik inverze, és az nemgenatív.
Megjegyezzük, hogy az M-mátrix elnevezés a monoton szó kezd®bet¶jéb®l ered, ugyanis egy M-mátrix mindig monoton is (A
−1
≥0
miatt). Pl.
2 −1 0 A = −1 2 −1 0 −1 2 mátrix M-mátrix, mivel a f®átlón kívül minden eleme
A−1 =
2.41 Állítás.
1 2
3 4 1 2 1 4
1 1 2
1 4 1 2 3 4
≤ 0,
és inverze
≥ 0.
Egy M-mátrix f®átlója pozitív elem¶.
Biz.: Tegyük fel, hogy
aii ≤ 0 valamely i indexre.
(i-edik eleme 1, a többi 0). Ezt az
A·ei ≤ 0, ahol ei az i-edik egységvektor −1 −1 egyenl®tlenséget balról A -gyel szorova (A ≥ 0) Ekkor
A−1 Aei = ei . Itt a bal oldalon álló vektor elemei nempozitívak, a jobb oldalon állóé pedig nemnegatívak
⇒ ei = 0.
Az
ei
azonban nem nullvektor, így ellentmondásra jutottunk.
A tárgyalt mátrixfajták közül különösen kedvez® tulajdonságúak a diagonálmátrixok, hiszen ezeknek könny¶ meghatározni a determinánsát, sajátértékeit, sajátvektorait, valamint egyszer¶en invertálhatók és hatványra emelhet®k. Ha egy mátrix nem diagonális, akkor gyakran lehet®ség van arra, hogy felírjuk egy diagonális mátrixot tartalmazó mátrixszorzat alakjában.
2.42 Deníció. felírható
P DP
−1
A ∈ IRn×n mátrixot n×n alakban, ahol P ∈ IR
Egy
diagonalizálható mátrixnak nevezünk, ha egy invertálható mátrix, és
D ∈ IR
n×n
A
egy
diagonálmátrix. Korábban szó esett a mátrixok spektrálfelbontásáról.
IRn×n
mátrixnak van
bontása, ahol
D
n
Azt tanultuk, hogy ha egy
A = SDS −1 alakú felaz A mátrix sajátértékei
db különböz® sajátértéke, akkor létezik
olyan diagonálmátrix, amelynek a f®átlójában
31
A ∈
vannak, az
S
mátrix oszlopvektorai pedig
A
egy-egy sajátvektora. (Ezek lineárisan füg-
getlen vektorok, mert különböz® sajátértékekhez tartozó sajátvektorok mindig lineárisan függetlenek, ezért biztosan létezik níció szerinti
P
S
inverze.) Vagyis ekkor
mátrix oszlopvektorai az
A
A
sajátvektorai.
A spektrálfelbontás létezéséhez nem szükséges, hogy létezzen hanem elegend®, ha van
n
diagonalizálható, és a de-
n
db különböz® sajátérték,
db lineárisan független sajátvektora a mátrixnak (tehát lehet
többszörös sajátértéke!), ekkor is diagonalizálható a mátrix.
Az állítás megfordítása is
igaz, azaz fennáll a következ®
2.43 Tétel.
Egy
A ∈ IRn×n
mátrix pontosan akkor diagonalizálható, ha van
n
db lineá-
risan független sajátvektora.
Biz.: (⇒) Tegyük fel, hogy
A diagonalizálható. Ekkor létezik olyan P ∈ IRn×n invertálható −1 mátrix, amelyre A = P DP , ahol D = diag[d1 , d2 , . . . , dn ] diagonális mátrix. Szorozzuk meg az egyenl®séget P -vel jobbról: AP = P D. A két oldalon lév® mátrix megfelel® oszlopvektorai egyenl®ek, azaz
Api = di pi , i = 1, 2, . . . , n. Ez éppen azt jelenti, hogy tékekkel, és mivel
P
P
oszlopvektorai az
invertálható,
det P ̸= 0,
A
sajátvektorai a
sajátér-
ezért ezen oszlopok lineárisan függetlenek
(különben a determináns nulla lenne). Következésképpen van sajátvektora
d1 , d2 , . . . , dn
n
db lineárisan független
A-nak.
(⇐) Tegyük fel, hogy
A-nak
van
n
db lineárisan független sajátvektora.
Jelölje
P
az
ezekb®l mint oszlopvektorokból összeállított mátrixot. Ekkor
AP = P D, D a megfelel® sajátértékeket tartalmazza a f®átlóban. Szorozzuk meg az egyenl®séget jobbról P inverzével (amely létezik, mert az oszlopai lineárisan függetlenek, tehát det P ̸= 0). Ebb®l A = P DP −1 , ahol
ami éppen
A
diagonalizálhatóságát jelenti.
Megjegyezzük, hogy a szimmetrikus mátrixok mind diagonalizálhatók. S®t, minden normális mátrix diagonalizálható.
32
2.7.1. Mátrixok Jordan-alakja Egy négyzetes mátrixnak nem mindig van annyi lineárisan független sajátvektora, amekkora a mérete.
Láttuk, hogy ekkor a mátrix nem diagonalizálható.
Azonban igaz a
következ®: minden mátrix felírható olyan mátrixszorzat alakjában, amelyben a középs® mátrix majdnem diagonális: a f®átlón kívül csak közvetlenül a f®átló fölött tartalmazhat nemnulla elemet. Ezt nevezzük a mátrix Jordan-alakjának.
2.44 Tétel. P ∈ IRn×n
A ∈ IRn×n
Minden
invertálható mátrix, és
négyzetes mátrix felírható
J
J1 0 . . . 0 0 J2 . . . 0 J = .. . 0 . . . 0 Jp
ahol
λi 1 . . . 0 0 λi 1 0 Ji = .. 1 . 0 . . . 0 λi Ji
elnevezése: az
A
alakban, ahol
a következ® alakú blokkdiagonális mátrix:
ha a mátrix i-edik sajátértékét
A = P JP −1
λi -vel
,
,
jelöljük, a különböz® sajátértékek számát pedig
p-vel.
mátrix i-edik Jordan-blokkja.
A Jordan-blokkok mérete megegyezik a sajátérték multiplicitásával.
2.8. Mátrixfüggvények A mátrixfüggvények olyan függvények, amelyek mátrixhoz mátrixot rendelnek. A valós függvények többsége csak olyan mátrixfüggvényekre általánosítható, amelyek négyzetes mátrixokra vannak értelmezve. Ezek közül tekintjük át a legfontosabbakat.
2.8.1. Mátrixpolinomok A polinomok a legegyszer¶bb és legkönnyebben kezelhet® függvények. Tekintsük a
p(x) = ak xk + ak−1 xk−1 + . . . a1 x + a0 p polinom A helyen n × n-es mátrixok egész
valós polinomot. Megfogalmazzuk, mit értünk a értékén, ahol
A ∈ IR
n×n
.
Tudjuk, hogy az
33
vett helyettesítési kitev®s hatványra
n × n-es
emelhet®k, és az eredmény szintén
mátrix lesz. Ezt a mátrixot tetsz®leges valós
n × n-es mátrixszal. Így p polinomban az x helyébe. Az a0
számmal szorozhatjuk, és az eredményt összeadhatjuk egy másik tetsz®leges négyzetes mátrixot behelyettesíthetünk a konstanst
a0 I -vel
I
helyettesítjük, ahol
az
n × n-es
identitásmátrix:
p(A) := ak Ak + ak−1 Ak−1 + . . . a1 A + a0 I. Speciálisan, ha a mátrix diagonális, akkor könnyen belátható, hogy a f®átlóban álló számokat kell csak behelyettesíteni a polinomba, azaz a
D = diag[d1 , d2 , . . . , dn ]
mátrixra
p(D) = diag[p(d1 ), p(d2 ), . . . , p(dn )]. Ha a mátrix diagonalizálható, azaz
A = P DP −1
alakú, akkor szintén egyszer¶
p(A)
kiszámítása:
p(A) = P p(D)P −1 , ahol a
p(D)
mátrix a
p
polinom a
D
diagonálmátrixra alkalmazva, vagyis a
D
f®átlójá-
ban lév® számokat kell csak behelyettesíteni a polinomba. (Számokat behelyettesíteni a polinomba lényegesen egyszer¶bb, mint mátrixokat.)
Láttuk, hogy ha egy mátrix nem
diagonalizálható, akkor is mindig Jordan-alakra hozható (A a fenti összefüggés (p(A)
= P p(J)P −1 ),
= P JP −1 ).
Ekkor is igaz
csak ekkor a középs® mátrixban a f®átló fölött
közvetlenül is lehetnek nemnulla elemek, azonban az ilyen mátrix is viszonylag könnyen behelyettesíthet® bármely polinomba.
2.8.2. Mátrixok hatványsorai A mátrixokat behelyettesíthetjük hatványsorba is. A valós függvények között különösen fontos szerepet tölt be az exponenciális függvény, amelyet az
∑ xk x2 x3 + + ... = exp(x) = 1 + x + 2! 3! k! k=0 ∞
hatványsorral deniálunk. Hatványsorral deniáltuk továbbá a
Tekintsük az az
A
f (x) =
∑∞ k=0
mátrix hatványsora,
sin
és
cos
függvényt is.
ak xk hatványsorral megadott függvényt. Ha A ∈ IRn×n , akkor f (A) az A mátrixnak az f (x) sorba való behelyettesítését je-
lenti. Fontos hangsúlyozni, hogy ez nem azt jelenti, hogy a mátrix minden egyes elemét behelyettesítjük a hatványsorba!
34
Speciális mátrixok hatványsora könnyen kiszámítható. f®átlóbeli elemeket kell behelyettesíteni a sorba.
P DP −1 ),
A diagonálmátrixokban csak a
Ha a mátrix diagonalizálható (A
=
akkor
f (A) = P f (D)P −1 , ha pedig nem diagonalizálható, akkor Jordan-alakra hozható (A
= P JP −1 ),
és
f (A) = P f (J)P −1 . A mátrix hatványsora nilpotens mátrixokra pontosan kiszámítható, mert egy nilpotens mátrix összes
m > n kitev¶j¶ hatványa nullmátrix lesz.
n-edfokú
Így a végtelen mátrixsor
véges polinommá egyszer¶södik.
2.45 Megjegyzés.
Könnyen látható, hogy ha
rix sajátértékeit úgy kapjuk, hogy
f (A) = P f (D)P
−1
diagonalizálható, akkor az
sajátértékeit behelyettesítjük
számok, ahol
mát-
Ugyanis ekkor
diagonálmátrixszal.
f (D) mátrix f®átlójában lév® számok, λ1 ,. . . , λn az A mátrix sajátértékei.
ezek pedig éppen az
diagonalizálható az
sajátértékei tehát az
f (λn )
f -be.
f (A)
f (D)
, azaz
f (A)
A
A
f (A) f (λ1 ), . . ., Az
2.9. Koordináta-transzformációk Egy vektortérben számtalan módon választhatunk meg bázist a vektorok szám-n-esekkel való reprezentálására. Érdemes tudnunk, hogy az egyik bázisból (más szóval koordinátarendszerb®l) milyen képletek segítségével térhetünk át egy másikba.
Legyen adva egy
{b1 , b2 , . . . , bn }.
X n-dimenziós
Azt keressük, hogy milyen összefüggés
bázisbeli koordinátái között.
B1 = {a1 , a2 , . . . , an } és B2 = van egy X -beli vektor B1 és B2
vektortérben két bázis:
Ezt a függvénykapcsolatot koordináta-transzformációnak
nevezzük. Tegyük fel, hogy az
(β1 , β2 , . . . , βn )
x∈X
vektort a
B1
bázisban az
(α1 , α2 , . . . , αn ),
a
B2 -ben
pedig a
szám-n-essel azonosíthatjuk, azaz
x = α1 a1 + α2 a2 + . . . + αn an = β1 b1 + β2 b2 + . . . + βn bn .
35
(5)
A bal oldalon az
a1 , a2 , . . . , an
báziselemeket kifejezhetjük a
b1 , b 2 , . . . , b n
báziselemek li-
neáris kombinációjaként:
a1 = γ11 b1 + γ12 b2 + . . . + γ1n bn a2 = γ21 b1 + γ22 b2 + . . . + γ2n bn . . .
an = γn1 b1 + γn2 b2 + . . . + γnn bn Ezeket az összegeket beírva (5)-ben
a1 , a 2 , . . . , a n
helyére, mindkét oldalon a
b1 , b2 , . . . , bn
vektorok lineáris kombinációja fog szerepelni. Az együtthatók egyeztetéséb®l az
α1 γ11 + α2 γ21 + . . . + αn γn1 = β1 α1 γ12 + α2 γ22 + . . . + αn γn2 = β2 . . .
α1 γ1n + α2 γ2n + . . . + αn γnn = βn összefüggésekhez jutunk. Látható, hogy az új koordináták lineáris függvényei a régieknek, azaz az
α = (α1 , α2 , . . . , αn ), β = (β1 , β2 , . . . , βn )
jelöléssel
Kα = β, ahol az
K ∈ IRn×n
mátrix elemei leolvashatók az el®bbi egyenletekb®l:
γ11 γ21 . . . γn1 γ12 γ22 . . . γn2 K= . .. . . . γ1n γ2n . . . γnn Vagyis az
K
mátrix
i-edik
oszlopába az
ai
vektor
B2 -beli
koordinátái kerülnek.
Ezt a
márixot a koordináta-transzformáció mátrixának nevezzük.
A gyakorlatban azok a koordináta-transzformációk a legfontosabbak, amelyek meg®rzik a vektorok hosszát, azaz amelyekre igaz az, hogy bármely
x∈X
vektor
koordináta-vektora között fennáll a
√ √ 2 2 2 β1 + β2 + . . . + βn = α12 + α22 + . . . + αn2
36
B1
és
B2
bázisbeli
egyenl®ség. Másképpen, ismét az
α = (α1 , α2 , . . . , αn )
jelölést használva
⟨Kα, Kα⟩ = ⟨α, α⟩, ahol a zárójel skaláris szorzást jelöl. Ezt az egyenl®séget a mátrix transzponáltjával felírva:
⟨α, K T Kα⟩ = ⟨α, α⟩. Belátható, hogy ez minden
T
K =K
−1
α
vektorra pontosan akkor áll fenn, ha
KT K = I,
azaz
, vagyis a koordináta-transzformáció mátrixa ortogonális. Ezért az ortogonális
koordináta-transzformációk a legfontosabbak a gyakorlatban.
(Ilyen pl.
a síkvektorok
esetében, ha mindkét bázisvektort elforgatjuk ugyanazzal a szöggel.)
3.
Vektorterek további struktúrákkal
Ebben a fejezetben olyan vektorterekr®l lesz szó, amelyekben az elemek bizonyos speciális tulajdonságokal rendelkeznek.
3.1. A vektorok normája, a normált tér A síkvektorok fontos tulajdonsága a hosszúságuk (nagyságuk). Egy tetsz®leges vektortérben nem biztos, hogy van hosszuk az elemeknek, de a gyakorlatban azok a vektorterek a legfontosabbak, amelyekben értelmes ez a fogalom. Az ilyen vektortereket normált tereknek fogjuk nevezni.
Ahhoz, hogy egy tetsz®leges vektortérben értelmezhessük az elemek hoszúságát, gondoljuk meg, hogy milyen tulajdonságokkal rendelkezik a síkvektorok hagyományos értelemben vett (Pitagorasz-tétellel számított) hosszúsága (euklideszi hosszúság). Jelöljük ehhez egy
a = (a1 , a2 )
vektor hosszúságát
|a|-val.
1. A hosszúság mindig nemnegatív, és csak akkor 0, ha a nullvektorról van szó, azaz
|a| ≥ 0 ∀a ∈ E2 ,
és
|a| = 0 ⇔ a = 0.
2. Két vektor összege nem lehet hosszabb, mint az összeadandók hosszának az összege, azaz
|a + b| ≤ |a| + |b| ∀a, b ∈ E2 .
37
3. Ha egy vektort
λ ∈ IR
számmal szorzunk, akkor a vektor hossza
|λ|-szorosára
vál-
tozik, tehát
|λ · a| = |λ| · |a| ∀a ∈ E2 , ∀λ ∈ IR. Úgy gondoljuk, hogy ezek a tulajdonságok jelentik a hosszúság lényegét. Felmerül a kérdés, hogy csak az euklideszi hosszúság rendelkezik-e ezekkel a tulajdonságokkal, vagy más módon is lehetne-e olyan számot a vektorokhoz rendelni, amely hasonló tulajdonságú, és ezért szintén használható lenne a vektorok hosszúságának a jellemzésére. Próbálkozzunk egyéb skalárérték¶ függvényekkel, és vizsgáljuk meg a fenti három tulajdonságot.
i.)
A vektorok irányszöge - nem tesz eleget a fenti tulajdonságoknak, hiszen pl.
nem
igaz az, hogy csak a nullvektornak nulla az irányszöge. Ez tehát nem használható a hoszszúság jellemzésére. ii.) A vektorokhoz hozzárendelhetjük az x és y tengelyre es® vetületük közül a hosszabbik vetület hosszúságát.
a 7→ max{|a1 |, |a2 |} Ez már jó lesz! iii.) A két vetület hosszúságát összeadva szintén nemnegatív számot kapunk:
a 7→ |a1 | + |a2 | Szintén mindhárom tulajdonság teljesül.
Ezért a továbbiakban a hossz fogalmát az el®bbiek alapján a következ®képpen általánosíthatjuk.
3.1 Deníció.
Legyen
X
vektortér.
Ekkor egy
∥ · ∥ : X → IR
függvényt normának
nevezünk, ha igaz rá a következ® három tulajdonság: 1.
∥x∥ ≥ 0
∀x ∈ X,
2.
∥x + y∥ ≤ ∥x∥ + ∥y∥ ∀x, y ∈ X.
3.
∥λ · x∥ = |λ| · ∥x∥
és
∥x∥ = 0 ⇔ x = 0X .
∀x ∈ X, ∀λ ∈ IR. x ∈ X vektorhoz hozzárendel, az x vektor normá(X, ∥ · ∥) rendezett párt normált térnek nevezzük.
Azt a számot, amelyet ez a függvény egy jának nevezzük, és Az
E2
∥x∥-vel
jelöljük. Az
vektortéren tehát már három normát is ismerünk. Ezekre a következ® jelölések és
elnevezések használatosak:
38
2.
∥a∥1 := |a1 | + |a2 | √ ∥a∥2 := a21 + a22
3.
∥a∥max
1.
vagy
(els® norma) (második vagy euklideszi norma)
∥a∥∞ := max{|a1 |, |a2 |}
(maximumnorma)
IRn -en
Ugyanezen háromfajta norma megfelel®je
2.
x = (x1 , x2 , . . . , xn ) ∑ ∥x∥1 := ni=1 |xi | √ ∑n 2 ∥x∥2 := i=1 xi
3.
∥x∥max
használjuk. Az 1.
is értelmezhet®, mindhármat gyakran
jelöléssel
∥x∥∞ := max{|x1 |, |x2 |, . . . , |xn |}
vagy
3.2. Operátornormák, mátrixnormák Láttuk, hogy m¶veletekkel
Hom(IRn , IRm ), azaz az IRn → IRm lineáris leképezések halmaza a megfelel® n m vektortér. Lehetne-e az X = Hom(IR , IR ) vektortérben is értelmezni az
elemek nagyságát? A legfontosabb speciális eset az, amikor
m = n (Hom(IRn , IRn ),
amit röviden csak a
n
Hom(IR ) szimbólummal jelölünk), ezért részletesebben csak ezzel foglalkozunk. Jelölje ∥ · ∥IRn bármelyik IRn -beli vektornormát, és 0n az IRn nullvektorát. Belátható, hogy ∥f ∥ := norma
Hom(IRn )-en.
sup x∈IRn ,x̸=0n
Ezt a normát az
∥ · ∥IRn
∥f (x)∥IRn ∥x∥IRn
vektornorma által indukált operátornormá-
nak nevezzük.
∥f (x)∥IRn hányados azt mutatja meg, hogy az f leképezés ∥x∥IRn n ∈ IR elemet. Ha az összes x-re vesszük ezt a hányadost,
Mit fejez ez ki szemléletesen? Az hányszorosára nyújtja meg az
x
majd ezen hányadosok szupremumát, akkor ez azt mutatja meg, hogy az
f
leképezés leg-
feljebb hányszorosára nyújt meg egy elemet.
Belátható, hogy a fenti szuprémum ekvivalens a következ®kkel:
sup x∈IRn ,x̸=0n
∥f (x)∥IRn ∥f (x)∥IRn ∥f (x)∥IRn = = sup = sup ∥x∥IRn x∈IRn ,∥x∥IRn =1 ∥x∥IRn x∈IRn ,∥x∥IRn =1 =
Megjegyezzük, hogy más-más
max
x∈IRn ,∥x∥IRn =1
IRn -beli
∥f (x)∥IRn
vektornorma más operátornormát indukál, tehát
egy lineáris operátornak nem feltétlenül ugyanannyi pl. a maximumnorma és az euklideszi
39
norma által indukált normája.
Megjegyezzük, hogy a
Hom(IRn , IRm )
vektortéren is értelmezhet® a szupremumnorma:
ekkor a számlálóban és a nevez®ben különböz® vektortérbeli normák szerepelnek.
f : IRn → IRn lineáris operátor megfelel egy A ∈ IRn×n mátrixszal azaz f (x) = A · x, tehát a sup-norma az A mátrixszal is kifejezhet®:
Tudjuk, hogy az való szorzásnak,
∥f ∥ =
sup x∈IRn ,x̸=0n
∥A · x∥IRn . ∥x∥IRn
A szupremumot nem mindig könny¶ kiszámítani, ezért érdemes tudnunk, hogy az indukált operátornormákat a leképezés mátrixának elemib®l egyszer¶bben is ki lehet számolni: 1. Els® norma (másképpen oszlopnorma): a leképezés mátrixának minden oszlopában összeadjuk az elemet abszolút értékét, és a legnagyobb ilyen oszlopösszeget választjuk.
∥A∥max :=
n ∑
max j∈{1,2,...,n}
|aij |
i=1
2. Második norma (spektrálnorma):
∥A∥2 := ahol
AT
az
A
mátrix transzponáltja,
√ |λmax (AT A)|, λmax (AT A)
pedig az
AT A
mátrix legnagyobb
abszolút érték¶ sajátértéke. 3. Maximumnorma (sornorma): a legnagyobb sorösszeg.
∥A∥1 :=
Láttuk, hogy az
IRn×n
n ∑
max i∈{1,2,...,n}
|aij |
j=1
halmaz is vektortér a mátrixokon értelmezett összeadás és skalárral
való szorzás m¶veletével, és ez a vektortér azonosítható a szupremum tehát
IRn×n -en
is norma: (az adott
IRn -beli
Hom(IRn )
vektortérrel. A fenti
norma által) indukált mátrix-
normának nevezzük. Az indukált mátrixnormák rendelkeznek a következ® három fontos tulajdonsággal: i) Az
Ax mátrix-vektor szorzatra mindig igaz,
és a jobb oldali második norma valamelyik
∥Ax∥ ≤ ∥A∥ · ∥x∥ (itt a bal oldali vektornorma, és az A mátrix normája
hogy
az ezen vektornorma által indukált mátrixnorma!)
40
ii) Az identitásmátrix normája 1, azaz
∥I∥ = 1.
iii) Két mátrix szorzatának normája nem nagyobb, mint a tényez®k normájának a szorzata:
∥AB∥ ≤ ∥A∥ · ∥B∥.
Ezen a vektortéren azonban további, nem indukált normák is használatosak.
Ezek a
mátrixnormák nem írhatók fel egy adott vektornormához tartozó szupremumnormaként. Nem indukált mátrixnormát kapunk pl., ha vesszük a mátrix lehet® legnagyobb abszolút érték¶ elemét:
∥A∥ := max |aij |; i,j
vagy ha az összes mátrixelem abszolút értékét összeadjuk:
n ∑
∥A∥ :=
|aij |.
i,j=1 Ezek tehát mind rendelkeznek a norma három tulajdonságával, de fontos tudni, hogy általában nem rendelkeznek az i)-iii) tulajdonságokkal. Ez az oka, hogy a nem indukált mátrixnormákat ritkán használjuk.
3.3. Az euklideszi tér Ismeretes, hogy a síkvektorok körben nemcsak az összeadás és a skalárral való szorzás m¶velete van értelmezve, hanem egy további igen fontos m¶velet is: a skaláris szorzás. Ez a m¶velet azonban nem síkvektort ad eredményül, hanem az
a · b = |a| · |b| · cos γ deníció szerint (γ a két vektor közrezárt szöge) egy valós számot. Ez a m¶velet tehát egy
E × E → IR
leképezést jelent.
Idézzük fel a skaláris szorzás m¶veleti tulajdonságait! 1.
a·b=b·a
∀a, b ∈ E2 ;
2.
(a + b) · c) = a · b + a · c ∀a, b, c ∈ E2
3.
(αa) · b = α · (a · b) ∀a, b ∈ E2 , ∀α ∈ IR.
Könnyen meggondolható, hogy a 2. és 3. tulajdonság ekvivalens a következ® tulajdonsággal:
(αa + βb) · c = α · (a · c) + β · (b · c) ∀α, β ∈ IR, ∀a, b, c ∈ E2 .
41
a · a ≥ 0, a · a = |a| · |a| · cos 0 = |a|2 .
Azt is megállapítottuk továbbá, hogy
a = 0,
ugyanis
és egyenl®ség akkor és csak akkor van, ha
A skaláris szorzat használható például arra, hogy segítségével kiszámítsuk két vektor közbezárt szögét. Speciálisan, azt is könnyen megvizsgálhatjuk, hogy mer®leges-e egymásra a két vektor, ennek feltétele ugyanis az
a·b=0
egyenl®ség.
A továbbiakban szeretnénk a skaláris szorzás fogalmát értelmezni más vektorterekben is.
3.2 Deníció.
Legyen
X
egy tetsz®leges vektortér, és legyen értelmezve egy
függvény a következ® tulajdonságokkal (ezt a függvényt jelölje
⟨·, ·⟩):
1.
⟨x, y⟩ = ⟨y, x⟩ ∀x, y ∈ X ;
2.
⟨αx + βy, z⟩ = α⟨x, z⟩ + β⟨y, z⟩ ∀x, y, z ∈ X, ∀α, β ∈ IR;
3.
⟨x, x⟩ ≥ 0 ∀x ∈ X
Ezen
X × X → IR
és
X × X → IR
⟨x, x⟩ = 0 ⇔ x = 0X .
függvényt skaláris szorzatnak nevezzük, és az
(X, ⟨·, ·⟩)
rendezett párt
(valós) euklideszi térnek nevezzük.
3.3 Megjegyzés. •
A fenti három m¶veleti tulajdonság néhány következménye:
A 2. tulajdonság akkor is igaz, ha az összeg hátul áll, azaz:
⟨x, αy + βz⟩ = α⟨x, y⟩ + β⟨x, z⟩, ugyanis, felhasználva az 1. és 2. tulajdonságot,
⟨x, αy + βz⟩ = ⟨αy + βz, x⟩ = α⟨y, x⟩ + β⟨z, x⟩ = α⟨x, y⟩ + β⟨x, z⟩. • ⟨0X , y⟩ = 0 ∀y ∈ X és ⟨x, 0X ⟩ = 0 ∀x ∈ X . (Pl. az els® állítás igazolása: ⟨0X , y⟩ = ⟨x − x, y⟩ = ⟨x, y⟩ + ⟨−x, y⟩ = ⟨x, y⟩ + ⟨(−1)x, y⟩ = ⟨x, y⟩ − 1 · ⟨x, y⟩ = 0.) Példák euklideszi terekre:
• X := IRn ,
⟨x, y⟩ :=
∑n i=1
xi yi .
Lássuk be, hogy ez valóban skaláris szorzat!
∑ ∑ ⟨x, y⟩ = ni=1 xi yi = ni=1 yi xi = ⟨y, x⟩ ∑n ∑n ∑n 2. ⟨αx + βy, z⟩ = i=1 yi zi = α⟨x, z⟩ + β⟨y, z⟩ i=1 xi zi + β i=1 (αxi + βyi )zi = α ∑n 2 3. ⟨x, x⟩ = i=1 xi ≥ 0 ⇔ xi = 0 ∀i = 1, 2, . . . , n, azaz x = 0n . ∫b • X := C[a, b], ⟨f, g⟩ := a f · g. 1.
42
3.4. Norma euklideszi terekben Legyen
(X, ⟨·, ·⟩)
egy euklideszi tér. Ekkor az elemeknek mindig értelmezhet® a normája
a következ®képpen:
x ∈ X, Vegyük észre, hogy ez a norma normának). A
C[a, b]
IRn -ben
∥x∥ :=
√
⟨x, x⟩.
a második normát adja (ezt neveztük euklideszi
függvénytérben a
√ ∫
b
∥f ∥ :=
f2 a
normát kapjuk. A skaláris szorzat és a norma értelmezése után értelmezhetjük egy tetsz®leges euklideszi térben a közbezárt szög fogalmát is:
3.4 Deníció. szögének azt a
Egy
γ
(X, ⟨·, ·⟩)
euklideszi térben az
és
y ∈ X
vektorok közbezárt
szöget nevezzük, amelyre
cos γ =
3.5 Deníció.
x ∈ X
⟨x, y⟩ . ∥x∥ · ∥y∥
(X, ⟨·, ·⟩) ⟨x, y⟩ = 0.
Azt mondjuk, hogy az
vektorok mer®legesek egymásra, ha
euklideszi térben az
x ∈ X
és
y ∈ X
3.5. A CauchySchwarzBunyakovszkij-egyenl®tlenség Az euklideszi terekben fennáll egy fontos egyenl®tlenség, az ún. CauchySchwarzBunyakovszkij-egyenl®tlenség:
3.6 Tétel.
Egy
(X, ⟨·, ·⟩)
euklideszi térben bármely
a, b ∈ X
elemekre fennáll:
⟨a, b⟩2 ≤ ⟨a, a⟩ · ⟨b, b⟩. Ezt bizonyítás helyett csak a következ® két speciális esetre gondoljuk meg: 1.
X = E2 -ben
a CSB-egyenl®tlenség:
(a · b)2 ≤ |a|2 · |b|2
∀a, b ∈ E2 .
Biz.: (a · b)2 = (|a| · |b| · cos γ)2 = |a|2 · |b|2 cos2 γ ≤ |a|2 · |b|2 ,
43
ugyanis
cos2 γ ∈ [0, 1].
Megjegyzés:
Látható, hogy egyenl®ség pontosan akkor van, ha
cos γ = 1
vagy -1, azaz a
két vektor egy egyenesbe esik (lineárisan összefügg®).
2.
X = IRn -ben
a CSB-egyenl®tlenség:
n n n ∑ ∑ ∑ 2 2 b2i ) ∀a, b ∈ IRn . ai )( ai bi ) ≤ ( (
Biz.:
i=1
i=1
i=1
Deniáljuk a következ®,
x-t®l
függ® függvényt:
yi (x) := (ai x + bi )2 , és legyen
Y (x) :=
n ∑
n ∑ yi (x) = (ai x + bi )2 .
i=1
i=1
A négyzetösszeget kifejtve
Y (x) =
n ∑
(a2i x2 + 2ai bi x + b2i ),
i=1 amely az
Y (x) = Ax2 + 2Bx + C alakban is felírható, ahol
A=
n ∑
a2i ,
B=
i=1 Nyilvánvalóan,
Y (x) ≥ 0
n ∑
ai bi
és
C=
i=1
minden
x ∈ IR
pontban, mivel
n ∑
b2i .
i=1
yi (x) ≥ 0 ∀i = 1, . . . , n.
Az
Ax2 + 2Bx + C ≥ 0 egyenl®tlenség azonban minden egyenlet
D = 4B − 4AC 2
x ∈ IR
pontban csak akkor állhat fenn, ha a másodfokú
diszkriminánsa nem pozitív, azaz
4B 2 − 4AC ≤ 0. Ez pedig (4-gyel osztva) éppen a belátandó egyenl®tlenséget jelenti.
44
4.
Alakzatokhoz köt®d® integrálfogalmak
A zikai alkalmazásokban fontosak a különböz® térbeli alakzatokhoz (térgörbe, felület) köt®d® integrálfogalmak. A térgörbéhez köt®d® integrálfogalmak a Matematika tantárgy e féléves anyagában szerepelnek, ezért ezek közül csak a legfontosabbat, a vektorérték¶ függvény vonalintegrálját tárgyaljuk röviden. A felülethez köt®d® integrálfogalmakról viszont részletesen lesz szó.
A térgörbét úgy deniáljuk, mint egy folytonos függvényt.
IR3 -ba
intervallumon értelmezett
IR3 -ba
képez®
A térpontok, amelyekb®l a görbe áll, ennek a függvénynek az ér-
tékkészletét alkotják. A felület egy értelmezett
IR-beli
IR2 -beli
összefügg® halmazon (általában téglalapon)
képez® folytonos függvényként értelmezhet®. Látni fogjuk, hogy az új
integrálfogalmakat az alakzat értelmezési tartományán vett Riemann-integrálokként értelmezzük.
Sok esetben az alakzat
IR3 -beli ponthalmazként van megadva (azaz valójában az értékkész-
letét ismerjük), és nekünk kell megkeresnünk a hozzá tartozó függvényt. Ezt az eljárást paraméterezésnek, a függvény értelmezési tartományát pedig paraméterhalmaznak nevezzük.
El®ször azzal foglalkozunk, hogy hogyan lehet paraméterezni egy alakzatot, azaz
hogyan tudunk egy térbeli alakzatot függvényként megadni.
4.1. Térgörbe paraméterezése L ⊂ IR3 R(r) = L.
Legyen adva egy amelyre
1. példa: p0 ∈ IR3
és
ponthalmaz a térben. Olyan
r : [a, b] → IR3
A legegyszer¶bb térgörbe az egyenesszakasz.
p1 ∈ IR3 .
leképezést keresünk,
Legyen ennek két végpontja
Nyilvánvalóan, a szakasz összes pontja el®áll
p0 + (p1 − p0 ) · u alakban, ahol
u ∈ [0, 1].
Tehát a szakasz megadható a következ® függvényként:
r(u) = p0 + (p1 − p0 ) · u, Ebben az esetben tehát a paraméterhalmaz a
[0, 1]
u ∈ [0, 1]. intervallum.
Ω bal oldali végpontjában a paraméterez® függvény értéke r(0) = p0 , a jobb oldali végpontban pedig r(1) = p1 . A két végpont között az u paraméter értékét 0-
Vegyük észre, hogy az
45
p1 felé haladva futja be a szakaszt. Azt mondjuk, hogy ezen paraméterez® függvényhez p0 → p1 irányítottság tartozik. Úgy is lehet paraméterezni a szakaszt, hogy a paraméterez® függvény p1 → p0 irányban ról 1-re növelve az
r(u) pont a p0
fel®l a
fussa be a szakasz pontjait:
r˜(u) = p1 + (p0 − p1 ) · u, Vegyük észre, hogy minden
u ∈ [0, 1]
pontban
u ∈ [0, 1].
r˜(u) = r(1 − u).
A szakasz irányítottságának jelent®sége lesz a vonalintegrál kiszámításánál. Ha a feladatban nincs megadva, hogy milyen irányítottságúnak vegyük a görbét, akkor az tetsz®legesen megválasztható.
2. példa:
Paraméterezzük az
xy -síkban
fekv® egységsugarú kört!
A körüljárás iránya
pozitív (az óramutató járásával ellentétes) legyen.
Megoldás: Célszer¶ paraméterként szöget választani, pl. a kör középpontjába húzott helyvektor
x
tengellyel bezárt szögét:
u ∈ [0, 2π].
r(u) = (cos u, sin u, 0),
De ezen kívül még számtalan egyéb paraméterezése van ugyanezen körnek!
4.2. Felület paraméterezése Legyen adva egy amelyre
Ω ⊂ IR
2
F ⊂ IR3
összefügg® halmaz, és
Megjegyezzük, hogy
[a, b] × [c, d]
Példa.
ponthalmaz a térben. Olyan
Ω
Φ : Ω → IR3
függvényt keresünk,
R(Φ) = F .
leggyakrabban két valós intervallum Descartes-szorzata, azaz
alakban adható meg. Az ilyen halmazt
2
IR
Ω=
-beli intervallumnak nevezzük.
Tekintsük annak a hengernek a palástját, amelynek alapja a 0 középpontú
R
m. A palást bármely pontjához elegend® két adat, pl. a pont xy síkra es® vetületének az x tengellyel bezárt szöge (jelölje u), valamint a pont magassága (jelölje v ). Ha u 0 és 2π között változhat, v pedig 0 és m között, akkor minden (u, v) paraméterpárnak megfelel a palást egy pontja. Azaz most legyen Ω = [0, 2π] × [0, m], és sugarú kör, és magassága
a paraméterez® függvény
Φ(u, v) = (R cos u, R sin u, v),
u ∈ [0, 2π], v ∈ [0, m].
A felületnek szintén adható irányítás. (Ez alól csak bizonyos speciális felületek kivételek, amelyek nem irányíthatók.
Az irányíthatóság pontos denícióját itt nem tisztázzuk.)
46
Φ : Ω → IR3 egy felület, Ω = [a, b] × [c, d], és (u0 , v0 ) ∈ Ω. A p : IR ⊃→ IR3 , p(u) = Φ(u, v0 ), u ∈ [a, b] függvényt a Φ(u0 , v0 ) ponton átmen® u-paramétervonalnak, a q : IR ⊃→ IR3 , q(v) = Φ(u0 , v), v ∈ [c, d] függvényt pedig a Φ(u0 , v0 ) ponton átmen® v -paramétervonalnak nevezzük. Ha Φ kell®en ′ ′ sima függvény, akkor p (u0 ) és q (v0 ) az u- és v -paramétervonal érint®vektorai a Φ(u0 , v0 ) ′ ′ pontban. Ekkor n1 := p (u0 ) × q (v0 ) a felület Φ(u0 , v0 ) pontjához tartozó érint®síkjának ′ ′ egy normálvektora lesz. Természetesen az n2 := q (v0 ) × p (u0 ) vektor is normálvektor. Nyilvánvalóan, n2 = −n1 , és az egyik kiválasztása jelenti a felület irányítását. Ennek a Az irányítás a következ®képpen értelmezhet®.
Legyen
vektorérték¶ függvények felületi integráljának a kiszámításánál lesz jelent®sége.
4.3. Vonalintegrál Ebben az alfejezetben röviden áttekintjük, hogy mit értünk egy vektormez® vonalintegrálján.
Tegyük fel, hogy a tér minden pontjához egy vektort rendeltünk, azaz meg van adva egy
f : IR3 → IR3
vektormez®.
Lehet ez pl.
egy er®tér.
Ha kíváncsiak vagyunk arra,
hogy ebben az er®térben mekkora egy adott térgörbe mentén végzett munka, akkor azt az er®tér vonalintegrálja mutatja meg a görbe mentén. A meteorológiában vonalintegrállal deniáljuk a cirkulációnak nevezett mennyiséget is: ez a sebességmez® zárt görbére vett vonalintegrálja, és a leveg® vagy a folyadék forgómozgásának leírására használatos.
4.1 Deníció. térgörbe, és
r : [a, b] → IR3 egy szakaszonként folytonosan dierenciálható f : IR3 → IR3 folytonos vektormez®. Az f : IR3 → IR3 vektormez® r görbére Legyen
vonatkozó vonalintegráljának az
∫
b
⟨f (r(u)), r′ (u)⟩du
a
Riemann-integrált nevezzük. Jelölése:
∫ r
f.
Megjegyezzük, hogy abban a speciális esetben, amikor a vektormez® a görbe minden
f (r(u)) ⇑ r′ (u) ∀u ∈ [a, b], továbbá c konstanssal egyenl®: ∥f (r(u))∥ = c, akkor
pontjában egyállású a görbe érint®vektorával, azaz hosszúsága is minden pontban ugyanazzal a az integrandusban
⟨f (r(u)), r′ (u)⟩ = ∥f (r(u))∥ · ∥r′ (u)∥ = c · ∥r′ (u)∥ ∀u ∈ [a, b], vagyis
∫
∫
∫
′
⟨f (r(u)), r (u)⟩du = c ·
f= r
b
a
a 47
b
∥r′ (u)∥du,
ahol az
∫b a
∥r′ (u)∥du integrál éppen az r
görbe ívhossza. Itt felhasználtuk, hogy egyállású
vektorok skaláris szorzata a hosszuk szorzatával egyenl®.
4.4. Felszínszámítás Miel®tt rátérünk a felületekhez köt®d® integrálfogalmak tárgyalására, érdemes szót ejteni egy felület felszínének a kiszámításáról. Az itt leírtakra szükségünk lesz a felületi integrálok értelmezéséhez.
Ω ⊂ IR2 összefügg® halmaz, Φ : Ω → IR3 egy felület, és (u0 , v0 ) ∈ Ω. A Φ 3 függvény IR -ba képez, ezért jellemezhet® három koordinátafüggvénnyel, jelölje ezeket X, Y és Z , azaz X(u, v) Φ(u, v) = Y (u, v) .
Legyen
Z(u, v) IR2 ⊃→ IR képeznek. Korábban bevezettük az u- és v -paraméter3 vonal fogalmát (p(u) és q(v)). Ezen paramétervonalak (IR ⊃→ IR függvények) érint®vektorai az (u0 , v0 ) ∈ Ω pontban X, Y és Z segítségével a következ®képpen adhatók meg: Az
X, Y
és
Z
függvények
∂u X(u0 , v0 ) p′ (u0 ) = ∂u Y (u0 , v0 ) ∂u Z(u0 , v0 ) Ebb®l a felület
Φ(u0 , v0 )
pontbeli
és
∂v X(u0 , v0 ) q ′ (v0 ) = ∂v Y (u0 , v0 ) ∂v Z(u0 , v0 )
n0 = p′ (u0 ) × q ′ (v0 )
normálvektora az
i j k n = ∂u X(u0 , v0 ) ∂u Y (u0 , v0 ) ∂u Z(u0 , v0 ) ∂v X(u0 , v0 ) ∂v Y (u0 , v0 ) ∂v Z(u0 , v0 )
determinánsként számítható ki.
Φ sima felület, és tekintsük az értelmezési tartományában az (u0 , v0 ), (u0 +∆u, v0 ), u0 , v0 + ∆v és (u0 + ∆u, v0 + ∆v) csúcspontokkal jellemezhet® téglalapot. Ennek területe ∆u · ∆v . Tudjuk, hogy egy Φ : Ω → IR függvény megváltozását kis távolságon jól közelíti
Legyen
a parciális deriváltvektor és az elmozdulás szorzata. Ebb®l
∂u X Φ(u0 + ∆u, v0 ) − Φ(u0 , v0 ) ≈ ∂u Y · ∆u =: a ∂u Z 0,0
48
∂v X Φ(u, v + ∆v) − Φ(u, v) ≈ ∂v Y · ∆v := b, ∂v Z 0,0
és
X , Y és Z függvények parciális deriváljait az (u0 , v0 ) helyen kell venni. Ezért ha ∆u és ∆v kell®en kicsi, akkor az (u0 , v0 ), (u0 + ∆u, v0 ), (u0 , v0 + ∆v) és (u0 + ∆u, v0 + ∆v) csúcspontú téglalap képének felszíne közelít®leg az a és b oldalú paralelogramma területe, vagyis az a × b vektoriális szorzat hossza: ahol a 0,0 index arra utal, hogy az
∂u X ∂v X × ∂v Y ∥ = ∆u · ∆v · ∥n∥. ∥a × b∥ = ∥ · ∆u · ∆v ∂ Y u ∂u Z 0,0 ∂v Z 0,0 Ebb®l már természetes módon adódik a felület teljes területének a kiszámítása: osszuk
∆u ill. ∆v , és ∆u · ∆v terület¶
fel tengellyel párhuzamos egyenesekkel, amelyek egymástól való távolsága
i = 1, 2 . . . , I, j = 1, 2 . . . , J . Ezzel cellákra daraboltuk a halmazt. Egy cella képe a Φ felületen egy görbevonalú cella, amelynek a felszínét számítottuk ki az el®bb. Ha ezek területét összegezzük, akkor a Φ felület
metszéspontjai az
(ui , vj )
pontok,
felszínének egy közelít®összegét kapjuk:
∂u X ∂v X ∥ ∂u Y × ∂v Y ∥ · ∆u · ∆v j=1 ∂u Z i,j ∂v Z i,j
I ∑ J ∑ i=1
ahol a parciális deriváltakat az
(ui , vj )
helyen kell érteni. Ez az összeg a felosztás minden
határon túli s¶rítésével az
∫ ∥∂u Φ(u, v) × ∂v Φ(u, v)∥dudv
S := Ω
kétdimenziós Riemann-integrálhoz tart, ahol a
∂u X ∂u Φ = ∂u Y , ∂u Z
jelöléseket használtuk. Az
S
integrált a
Φ
∂v X ∂v Φ = ∂ v Y ∂v Z
felület felszínének nevezzük. Az
S
képletében
az integrálandó függvényt könnyebben kezelhet® alakra hozhatjuk, ha felhasználjuk az alábbi, tetsz®leges
a, b
térvektorokra fennálló összefüggést, ahol
49
γ
jelölje az
a
és
b
vektor
egymással bezárt szögét:
∥a × b∥2 = ∥a∥2 · ∥b∥2 · sin2 γ = ∥a∥2 · ∥b∥2 · (1 − cos2 γ) = = ∥a∥2 · ∥b∥2 − ∥a∥2 · ∥b∥2 cos2 γ = ∥a∥2 · ∥b∥2 − (⟨a, b⟩)2 . ∫ √ S= ∥∂u Φ∥2 · ∥∂v Φ∥2 − (⟨∂u Φ, ∂v Φ⟩)2 dudv.
Ez alapján
Ω
4.5. Felszíni integrál Legyen
Ω ⊂ IR2
összefügg® halmaz,
Φ : Ω → IR3
sima felület. Tegyük fel, hogy a felület
minden pontjához hozzárendeltünk egy valós számot, azaz legyen
Φ(Ω).
Tegyük fel, hogy
g folytonos.
A
g : IR3 ⊃→ IR, D(g) :=
g skalárfüggvény Φ felületre vett felszíni integrálját
a következ®képpen értelmezzük:
Ω halmazt ∆u·∆v terület¶ cellákra osztjuk az u- és v-tengellyel párhuzamos egyenesekkel, amelyek metszéspontjai az (ui , vj ) pontok, i = 1, 2 . . . , I, j = 1, 2, . . . , J .
1. Az
g értékét az (ui , vj )-nek megfelel® felületi ∆u, vj ), (ui , vj + ∆v), (ui + ∆u, vj + ∆v) sarokpontú cella
2. Megszorozzuk
pontban az
(ui , vj ), (ui +
képének a közelít® terüle-
tével:
g(Φ(ui , vj )) · ∥∂u Φi,j × ∂v Φi,j ∥ · ∆u∆v 3. Összegezzük ezeket valamennyi cellára:
I ∑ J ∑
g(Φ(ui , vj )) · ∥∂u Φi,j × ∂v Φi,j ∥ · ∆u∆v.
i=1 j=1
4. Ha
∆u, ∆v → 0,
akkor ezen összeg a következ® integrálhoz tart:
∫ g(Φ(u, v)) · ∥∂u Φ(u, v) × ∂v Φ(u, v)∥dudv. Ω
A fenti integrált a
g
skalármez®
Φ felületre vett felszíni integráljának nevezzük, és
∫ Φ
g -vel
jelöljük. Alkalmazás: Ezt a típusú integrált alkalmazzuk pl. arra, hogy egy lemez tömegeloszlásából (egységnyi felületre es® tömeg, amely a lemezen pontról pontra változhat) kiszámítsuk a lemez teljes tömegét.
50
4.6. Felületi integrál Legyen
Ω ⊂ IR2
összefügg® halmaz,
Φ : Ω → IR3
sima felület. Tegyük fel, hogy a felület
f : IR3 ⊃→ IR3 , D(f ) := függvény Φ felületre vett integ-
minden pontjához hozzárendeltünk egy vektort, azaz legyen
Φ(Ω).
Tegyük fel, hogy
f
folytonos. Az
f
vektorérték¶
rálját a következ®képpen értelmezzük:
Ω halmazt ∆u·∆v terület¶ cellákra osztjuk az u- és v-tengellyel párhuzamos egyenesekkel, amelyek metszéspontjai az (ui , vj ) pontok, i = 1, 2 . . . , I, j = 1, 2, . . . , J .
1. Az
2. Képezzük az 3. A
Φ(ui , vj )
f (Φ(ui , vj ))
vektort az
(ui , vj )
pontokban.
ponthoz tartozó érint®sík normálvektora
∂u Φi,j × ∂v Φi,j .
A
∆S i,j := (∂u Φi,j × ∂v Φi,j )∆u∆v Φ(ui , vj ) ponthoz tartozó felszínvektornak nevezzük. (∆S hossza a felület′ ′ területe, iránya mer®leges a felületre, a p (ui ), q (vj ) vektorokkal jobbsodrású
vektort a elem
rendszert alkot.) 4. Minden
(ui , vj )
pontban képezzük a következ® skaláris szorzatot:
⟨f (Φ(ui , vj ), ∆S i,j ⟩. Ez nem más, mint az
f (Φ(ui , vj )) vektor felületre mer®leges komponensének a nagy-
sága szorozva a felületelem területével. 5. Összegezünk minden cellára:
I ∑ J ∑
⟨f (Φ(ui , vj )), ∆S i,j ⟩.
i=1 j=1
6. Ha
∆u, ∆v → 0,
akkor a fenti összeg a következ® integrálhoz tart:
∫ ⟨f (Φ(u, v)), ∂u Φ(u, v) × ∂v Φ(u, v)⟩dudv. Ω
Φ
∫
Ezt nevezzük az
f
vektormez®
Megjegyzés: Ha
f
minden pontban egyállású a felszínvektorral, és nagysága ugyanaz a
felületre vett felületi integráljának, és
51
Φ
f -fel
jelöljük.
c
konstans, akkor
∫
∫ ⟨f (Φ(u, v)), ∂u Φ(u, v) × ∂v Φ(u, v)⟩dudv =
f= ϕ
Ω
∫
∫ ∥f (Φ(u, v))∥·∥∂u Φ(u, v)×∂v Φ(u, v)∥dudv = c
=
∥·∥∂u Φ(u, v)×∂v Φ(u, v)∥dudv = c·S,
Ω
Ω
azaz a vektor
c
nagyságát megszorozzuk a felület teljes felszínével.
Alkalmazás: Ezt a típusú integrált alkalmazzák pl.
a zikában mágneses er®tér adott
felületen átmen® uxusának a kiszámítására.
4.7. Integrálátalakító tételek A valós függvényekre vonatkozó NewtonLeibniz-formulát általánosítjuk. Ismeretes, hogy ha az
f : IR ⊃→ IR
függvény folytonosan dierenciálható, akkor
∫
b
f ′ = f (b) − f (a),
a azaz a függvény deriváltjának az integrálja
f -nek
a halmaz határán való megváltozásával
egyenl®.
Az egyik általánosítás: Legyen
Φ : IR2 ⊃→ IR3
sima felület, amelyet egy
irányított görbe határol (a felszínvektorok irányából nézve
4.2 Tétel. Ha
sima vektormez®, akkor
∫
∫ rotf =
f,
Φ
rotf
f -re alkalmaztunk egy az f vonalintegráljával.
(az
felület határán
A másik általánosítás: Legyen
r
dierenciáloperátort) felületi integrálja egyenl® a
Φ : IR2 ⊃→ IR3
zárt, sima felület, amely egy
térrészt vesz körül (a felszínvektorokat kifelé irányítjuk).
4.3 Tétel. Ha
(GaussOszrogradszkij-tétel)
f : IR ⊃→ IR3 3
pozitív irányítású legyen).
(Stokes-tétel)
f : IR3 ⊃→ IR3
azaz a
r
r : IR ⊃→ IR3
sima vektormez®, akkor
∫
∫ divf =
V
f, Φ
52
V ⊂ IR3
azaz a
V
tértartományon integrálva a
kalmaztunk az
f -re),
divf
függvényt (egy másik dierenciáloperátort al-
ez az integrál a térrész határán vett felületi integrálba megy át.
53