G´asp´ar Csaba, Moln´arka Gy˝oz˝o
Line´ aris algebra ´ es t¨ obbv´ altoz´ os f¨ uggv´ enyek
Sz´echenyi Istv´an Egyetem, 2005
1
1
Vektorterek
Ebben a fejezetben a geometriai vektorfogalom (”ir´any´ıtott szakasz”) er˝os ´altal´anos´ıt´as´at v´egezz¨ uk el. Egym´ast´ol eg´eszen k¨ ul¨onb¨oz˝o matematikai objektumokat is vektoroknak fogunk nevezni, ha defini´alva vannak rajtuk bizonyos egyszer˝ u m˝ uveletek, melyek ugyanolyan (al´abb specifik´alt) tulajdons´agokkal rendelkeznek. Ily m´odon a bevezet´esre ker¨ ul˝o vektorfogalom a k¨oz¨ons´eges ¨osszead´as ´es szorz´as j´ol ismert tulajdons´agait terjeszti ki a sz´amokn´al sokkal ´altal´anosabb strukt´ ur´akra.
1.1
Vektorterek ´ es altereik
Defin´ıci´ o: Az X nem¨ ures halmazt (val´os) vektort´ernek nevezz¨ uk, ha X elemei k¨ozt ´ertelmezett egy ¨ osszead´ as, R ´es X elemei k¨ozt pedig egy skal´ arral val´o szorz´as u ´gy, hogy a k¨ovetkez˝o ´all´ıt´asok (az u ´n. vektort´er-axi´ om´ ak) teljes¨ ulnek. A vektort´ er-axi´ om´ ak: Tetsz˝oleges x, y, z ∈ X, λ, µ ∈ R eset´en: • x+y =y+x
(az ¨osszead´as kommutat´ıv)
• x + (y + z) = x + (y + z)
(az ¨osszead´as asszociat´ıv)
• l´etezik X-ben egy 0 z´erusvektor, melyre x + 0 = x teljes¨ ul minden x ∈ X eset´en; • az ¨osszead´as invert´alhat´o, azaz b´armely x ∈ X vektorhoz van oly x−1 ∈ X vektor, hogy ¨osszeg¨ uk a z´erusvektor: x + x−1 = 0 • λ · (µ · x) = (λµ) · x • λ · (x + y) = λ · x + λ · y,
(λ + µ) · x = λ · x + µ · x
• 1·x=x K¨onnyen l´athat´o, hogy az axi´om´ak k¨ozt szerepl˝o addit´ıv inverz, azaz az x−1 vektor ´epp (−1) · x-szel egyezik, melyet a k´es˝obbiekben r¨oviden csak (−x)-szel jel¨ol¨ unk. Ha nem okoz f´elre´ert´est, a skal´arral val´o szorz´ast jelz˝o szorz´opontot elhagyjuk. Defin´ıci´ o: Legyen X vektort´er. Az X0 ⊂ X r´eszhalmazt alt´ernek nevezz¨ uk, ha maga is vektort´er az X-beli m˝ uveletekre n´ezve. Megjegyz´es: Egy X0 ⊂ X r´eszhalmaz alt´er volt´anak eld¨ont´esekor, mivel a vektorokt´ol megk¨ovetelt m˝ uveleti azonoss´agok nyilv´an X0 -ban is teljes¨ ulnek, el´eg csak azt ellen˝orizni, hogy vajon minden x, y ∈ X0 , λ ∈ R eset´en teljes¨ ul-e, hogy x + y ∈ X0 , ´es λx ∈ X0 . Ezt a tulajdons´agot nevezz¨ uk m˝ uveleti z´arts´ agnak. Ha ez teljes¨ ul, akkor X0 alt´er X-ben. 2
Nyilv´anval´o, hogy maga X ´es az egyelem˝ u {0} halmaz alterek X-ben. Ezeket trivi´ alis altereknek nevezz¨ uk. Az is nyilv´anval´o, hogy ak´arh´any alt´er metszete is alt´er (az uni´ora ez nem ´all!). Al´abb p´eld´akat mutatunk vektorterekre: a vektort´er-axi´om´ak teljes¨ ul´ese k¨onnyen ellen˝orizhet˝o. 1. A val´ os sz´amok R halmaza egy´ uttal val´os vektort´er is a szok´asos ¨osszead´asra ´es szorz´asra n´ezve. 2. A komplex sz´amok C halmaza egy´ uttal val´os vektort´er is a szok´asos ¨osszead´asra ´es szorz´asra n´ezve. 3. A rendezett val´os sz´amp´arok R2 halmaza val´os vektort´er az al´abbi ¨osszead´asra ´es szorz´asra n´ezve: (x1 , x2 ) + (y1 , y2 ) := (x1 + y1 , x2 + y2 ) tetsz˝oleges (x1 , x2 ), (y1 , y2 ) ∈ R2 eset´en, ´es λ · (x1 , x2 ) := (λx1 , λx2 ) tetsz˝oleges (x1 , x2 ) ∈ R2 , λ ∈ R eset´en. Az R2 vektort´er elemei azonos´ıthat´ok a geometriai s´ık pontjaival. R¨ogz´ıtve a s´ıkon egy koordin´atarendszert, minden pontnak megfelel egy ´es csakis egy val´os, rendezett sz´amp´ar, ti. a pont koordin´at´aib´ol k´epezett sz´amp´ar. A s´ık pontjai viszont azonos´ıthat´ok a r¨ogz´ıtett koordin´atarendszer orig´oj´ab´ol az illet˝o pontokba mutat´o ir´any´ıtott szakaszokkal (a pontok helyvektoraival). Ebben a megfeleltet´esben az R2 -ben fentebb defini´alt ¨osszead´as ´epp a j´ol ismert paralelogramma szab´allyal meghat´arozott ¨osszegvektor, m´ıg a skal´arral val´o szorz´as a ny´ ujt´asnak felel meg. L´atjuk teh´at, hogy ebben a speci´alis esetben visszakapjuk a geometriai s´ıkvektor-fogalmat. K¨onnyen l´athat´o az is, hogy a s´ık nemtrivi´alis alterei az orig´ora illeszked˝o egyenesek (´es csak azok). 4. A rendezett val´os sz´amh´armasok R3 halmaza val´os vektort´er az al´abbi ¨oszead´asra ´es szorz´asra n´ezve: (x1 , x2 , x3 ) + (y1 , y2 , y3 ) := (x1 + y1 , x2 + y2 , x3 + y3 ) tetsz˝oleges (x1 , x2 , x3 ), (y1 , y2 , y3 ) ∈ R3 eset´en, ´es λ · (x1 , x2 , x3 ) := (λx1 , λx2 , λx3 ) tetsz˝oleges (x1 , x2 , x3 ) ∈ R3 , λ ∈ R eset´en. Az R3 vektort´er elemei azonos´ıthat´ok a geometriai t´er pontjaival. R¨ogz´ıtve a t´erben egy koordin´atarendszert, minden pontnak megfelel egy ´es csakis egy val´os, rendezett sz´amh´armas, ti. a pont koordin´at´aib´ol k´epezett sz´amh´armas. A t´er pontjai pedig azonos´ıthat´ok a r¨ogz´ıtett koordin´atarendszer orig´oj´ab´ol az illet˝o pontokba mutat´o ir´any´ıtott szakaszokkal (a pontok helyvektoraival). ´Igy – az el˝oz˝o p´eld´aval anal´og m´odon – R3 elemei a geometriai t´ervektoroknak is felfoghat´ok, ahol az ¨osszead´ast a paralelogramma szab´allyal, a skal´arral val´o szorz´ast a ny´ ujt´assal defini´aljuk. K¨onnyen l´athat´o az is, hogy a geometriai t´er nemtrivi´alis alterei az orig´ora illeszked˝o egyenesek ´es s´ıkok (´es csak azok): ´ıgy pl. az orig´o mint egyelem˝ u halmaz kiv´etel´evel, a geometriai t´er semmilyen korl´atos r´eszhalmaza sem alt´er. ´ 5. Altal´ anos´ıtva az el˝oz˝o k´et p´eld´at, a rendezett val´ os sz´ am-n-esek Rn halmaza val´os vektort´er az al´abbi ¨osszead´asra ´es szorz´asra n´ezve: (x1 , x2 , ..., xn ) + (y1 , y2 , ..., yn ) := (x1 + y : 1, x2 + y2 , ..., xn + yn ) tetsz˝oleges (x1 , x2 , ..., xn ), (y1 , y2 , ..., yn ) ∈ Rn eset´en, ´es λ · (x1 , x2 , ..., xn ) := (λx1 , λx2 , ..., λxn ) tetsz˝oleges (x1 , x2 , ..., xn ) ∈ Rn , λ ∈ R eset´en.
3
Itt m´ar igen sokf´ele alt´er l´etezik, de ezek nem olyan szeml´eletesek, mint az el˝oz˝o k´et p´eld´aban. K¨onnyen ellen˝orizhet˝o, hogy pl. mindazon rendezett val´os sz´am-n-esek, melyek els˝o komponense 0-val egyenl˝o, alteret alkotnak Rn -ben. Hasonl´oan, mindazon rendezett val´os sz´am-n-esek, melyek komponenseinek ¨osszege 0-val egyenl˝o, szint´en alteret alkotnak Rn -ben. Nem alkotnak viszont alteret azon rendezett val´os sz´am-n-esek, melyek komponenseinek ¨osszege adott, de 0-t´ol k¨ ul¨onb¨oz˝o sz´am. 6. Tov´abb ´altal´anos´ıtva az el˝oz˝oeket, a val´ os sorozatok halmaza szint´en val´os vektort´er a szok´asos ¨osszead´asra ´es skal´arral val´o szorz´asra n´ezve: (xn ) + (yn ) := (xn + yn ), tetsz˝oleges (xn ), (yn ) ⊂ R eset´en, ´es λ · (xn ) := (λxn ), tetsz˝oleges (xn ) ⊂ R ´es λ ∈ R eset´en. Ennek a vektort´ernek egy nemtrivi´alis altere pl. a korl´atos val´os sorozatok halmaza; tov´abbi, m´eg sz˝ ukebb alt´erek pl. a (val´os) konvergens sorozatok ´es a z´erussorozatok halmaza. Nem alt´er viszont a monoton sorozatok halmaza (k´et monoton sorozat ¨osszege nem felt´etlen monoton), ´es nem alt´er azon konvergens sorozatok halmaza, melyek egy adott, z´erust´ol k¨ ul¨onb¨oz˝o sz´amhoz tartanak. 7. M´eg tov´abbi ´altal´anos´ıt´assal m´ar a ”hagyom´anyos” (geometriai) vektorfogalomt´ol eg´eszen t´avoles˝o vektorterekhez jutunk. Legyen [a, b] ⊂ R egy adott intervallum: akkor az ¨osszes, [a, b]-n ´ertelmezett val´ os f¨ uggv´enyek halmaza vektorteret alkot a szok´asos f¨ uggv´eny¨osszead´asra ´es sz´ammal val´o szorz´asra n´ezve. Ennek egy fontos altere az [a, b]-n folytonos f¨ uggv´enyek halmaza, melyet C[a, b]-vel jel¨ol¨ unk. Enn´el sz˝ ukebb alteret alkotnak a k-szor folytonosan differenci´ alhat´ o f¨ uggv´enyek (k pozit´ıv eg´esz): ezt C k [a, b]-vel jel¨olj¨ uk. Tov´abbi (m´eg sz˝ ukebb) alt´er az [a, b]-n ´ertelmezett polinomok (azaz az x → a0 + a1 x + a2 x2 + ... + an xn alak´ u f¨ uggv´enyek) P[a, b] halmaza. Ennek egy altere a legfeljebb k-adfok´ u polinomok Pk [a, b] halmaza (k nemnegat´ıv eg´esz): ugyanakkor a pontosan k-adfok´ u polinomok halmaza nem alkot alteret (k´et k-adfok´ u polinom ¨osszege alacsonyabb foksz´am´ u is lehet).
1.2
Line´ aris kombin´ aci´ o, line´ aris f¨ uggetlens´ eg
Elnevez´es: Legyen X vektort´er, x1 , x2 , ..., xN ∈ X tetsz˝oleges vektorok, λ1 , λ2 , ..., λN ∈ R tetsz˝oleges egy¨ utthat´ok (sz´amok), ahol N tetsz˝oleges pozit´ıv eg´esz. A λ1 x1 + λ2 x2 + ... + λN xN ∈ X vektort a fenti vektorok egy line´ aris kombin´ aci´ oj´ anak nevezz¨ uk. Ha a line´aris kombin´aci´o mindegyik egy¨ utthat´oja z´erus, akkor azt trivi´ alis line´aris kombin´aci´onak, ha legal´abb egy egy¨ utthat´o z´erust´ol k¨ ul¨onb¨ozik, akkor azt nemtrivi´alis line´aris kombin´aci´onak nevezz¨ uk. A k¨ovetkez˝o ´all´ıt´as azon m´ ulik, hogy line´aris kombin´aci´ok line´aris kombin´aci´oja nyilv´anval´oan maga is line´aris kombin´aci´o: ´ ıt´ 1. All´ as: Legyen X vektort´er, A ⊂ X tetsz˝oleges r´eszhalmaz. Akkor az A-beli vektorok ¨osszes line´aris kombin´aci´oinak halmaza alteret alkot X-ben. Ezt az A halmaz line´ aris burk´ anak vagy az A halmaz ´ altal gener´ alt alt´ernek nevezz¨ uk ´es [A]-val jel¨olj¨ uk. Megjegyz´es: [A] a legsz˝ ukebb olyan alt´er, mely A-t tartalmazza. Val´oban, minden A-t tartalmaz´o alt´ernek tartalmaznia kell az ¨osszes 4
A-beli vektorok line´aris kombin´aci´oj´at is, azaz az [A] alt´er ¨osszes elem´et. P´elda R2 -ben: Egyetlen (az orig´ot´ol k¨ ul¨onb¨oz˝o) pont line´aris burka a pontot az orig´oval ¨osszek¨ot˝o egyenes. K´et olyan pont line´aris burka, melyek az orig´oval nem esnek egy egyenesbe, a teljes s´ıkkal egyezik. P´elda R5 -ben: Az (1,0,0,0,0), (0,3,0,0,0) ´es (2,2,0,0,0) vektorok line´aris burka az {(x, y, 0, 0, 0) ∈ R5 : x, y ∈ R}. P´elda a polinomok ter´eben: A 2, 2x ´es a −5x2 kifejez´esekkel defini´alt polinomok line´aris burka a legfeljebb m´asodfok´ u polinomok alter´evel egyezik. Defin´ıci´ o: Legyen X vektort´er. Azt mondjuk, hogy az x ∈ X vektor line´ arisan f¨ ugg az x1 , x2 , ..., xN ∈ X vektorokt´ ol, ha el˝o´all azok valamilyen line´aris kombin´aci´ojak´ent. Azt mondjuk, hogy X-beli vektorok egy v´eges rendszere line´ arisan ¨ osszef¨ ugg˝ o, ha van k¨ozt¨ uk olyan vektor, mely line´arisan f¨ ugg a t¨obbit˝ol, ill. line´ arisan f¨ uggetlen, ha k¨oz¨ ul¨ uk egyik vektor sem f¨ ugg line´arisan a t¨obbit˝ol. Nyilv´anval´o, hogy a 0 z´erusvektor minden vektort´ol line´arisan f¨ ugg. A k¨ovetkez˝o p´eld´ak ´all´ıt´asai egyszer˝ u meggondol´asokkal ad´odnak: P´elda R2 -ben: K´et olyan pont, melyek az orig´oval egy egyenesbe esnek, line´arisan ¨osszef¨ ugg˝ok. Ha nem esnek egy egyenesbe, akkor 2 line´arisan f¨ uggetlenek. H´arom vektor R -ben mindig line´arisan ¨osszef¨ ugg˝o. P´elda R4 -ben: A (0,1,0,0) ´es a (0,0,0,3) vektorok line´arisan f¨ uggetlenek. Ugyanakkor a (4,5,6,0), (1,1,3,0), ´es a (2,3,0,0) vektorok line´arisan ¨osszef¨ ugg˝ok, mert (4, 5, 6, 0) = 2 · (1, 1, 3, 0) + (2, 3, 0, 0). P´eld´ ak a polinomok ter´eben: Az x3 + 2x5 ¨ot¨odfok´ u polinom nem f¨ ugg line´arisan m´asodfok´ u polinomok semmilyen rendszer´et˝ol. Az 1 + x, 2 2 2 3 x + x , −1 + x polinomok line´arisan ¨osszef¨ ugg˝ok, de az 1 + x, x + x , −1 + x polinomok m´ar line´arisan f¨ uggetlenek. L´atni kell azonban, hogy bonyolultabb esetekben a line´aris f¨ uggetlens´eg ´es ¨osszef¨ ugg˝os´eg ellen˝orz´ese nagyon f´arads´agos lehet. Ezt egyszer˝ us´ıti le a k¨ovetkez˝o t´etel, mely szerint el´eg a z´erusvektort megpr´ob´alni el˝o´all´ıtani a sz´obanforg´o vektorok line´aris kombin´aci´ojak´ent: 2. T´ etel: Legyen X vektort´er. Az x1 , x2 , ..., xN ∈ X vektorok pontosan akkor line´arisan ¨osszef¨ ugg˝ok, ha l´etezik olyan nemtrivi´alis line´aris kombin´aci´ojuk, mely a z´erusvektorral egyenl˝o. M´assz´oval, a fenti vektorok pontosan akkor line´arisan f¨ uggetlenek, ha csak a trivi´alis line´aris kombin´aci´ojuk egyenl˝o a z´erusvektorral, azaz λ1 x1 + λ2 x2 + ... + λN xN = 0 csak u ´gy lehets´eges, ha λ1 = λ2 = ... = λN = 0. Bizony´ıt´as: Legyenek az x1 , x2 , ..., xN ∈ X vektorok line´arisan ¨osszef¨ ugg˝ok: az ´altal´anoss´ag csorb´ıt´asa n´elk¨ ul feltehet˝o, hogy ´epp x1 fejezhet˝o ki a t¨obbi line´aris kombin´aci´ojak´ent: x1 = λ2 x2 + ... + λN xN . Ekkor a z´erusvektor el˝o´all x1 , x2 , ..., xN nemtrivi´alis line´aris kom5
bin´aci´ojak´ent, hiszen x1 − λ2 x2 − ... − λN xN = 0. Megford´ıtva, tegy¨ uk fel, hogy λ1 x1 + λ2 x2 + ... + λN xN = 0 egy nemtrivi´alis line´aris kombin´aci´o. Akkor valamelyik λk biztosan nem z´erus, feltehet˝o, hogy ´epp λ1 6= 0. Akkor x1 kifejezhet˝o a t¨obbi vektor line´aris kombin´aci´ojak´ent, mert x1 = − λλ12 x2 − ... − λλN1 xN . A t´etel ´ertelm´eben teh´at az x1 , x2 , ..., xN ∈ X vektorok line´aris f¨ uggetlens´eg´enek eld¨ont´ese eset´en elegend˝o a λ1 , λ2 , ..., λN egy¨ utthat´okra fel´ırt λ1 x1 +λ2 x2 +...+λN xN = 0 egyenletet vizsg´alni. Ha tal´alunk olyan megold´ast is, hogy valamelyik egy¨ utthat´o z´erust´ol k¨ ul¨onb¨ozik, akkor a sz´obanforg´o vektorok line´arisan ¨osszef¨ ugg˝ok, ha ilyen nincs, akkor line´arisan f¨ uggetlenek. Ily m´odon a line´aris f¨ uggetlens´eg k´erd´es´et egy speci´alis egyenlet megoldhat´os´ag´anak probl´em´aj´ara vezett¨ uk vissza: ilyen probl´em´akkal a k¨ovetkez˝o fejezetben r´eszletesen is foglalkozunk.
1.3
Vektorterek b´ azisa, dimenzi´ oja
Defin´ıci´ o: Legyen X vektort´er. Az A ⊂ X r´eszhalmazt az X vektort´er egy b´ azis´ anak nevezz¨ uk, ha line´arisan f¨ uggetlen, ´es az eg´esz teret gener´alja, azaz [A] = X. A b´azis sz´amoss´ag´at az X vektort´er dimenzi´ oj´ anak nevezz¨ uk. Meg´allapodunk abban, hogy a trivi´alis {0} alteret 0-dimenzi´osnak nevezz¨ uk. Egy´altal´an nem nyilv´anval´o, hogy ilyen halmaz l´etezik. A k¨ovetkez˝o, igen m´ely t´etel azonban pozit´ıvan v´alaszol erre: 3. T´ etel: Minden, a trivi´alis {0}-t´ol k¨ ul¨onb¨oz˝o vektort´ernek l´etezik b´azisa. Egy adott vektort´er minden b´azisa azonos sz´amoss´ag´ u, azaz a dimenzi´o egy´ertelm˝ uen meghat´arozott. A t´etelb˝ol nyomban ad´odik, hogy v´eges, pl. n-dimenzi´os vektort´erben b´armely N > n sz´am´ u vektor line´arisan ¨osszef¨ ugg˝o. Ellenkez˝o esetben ui. volna egy N -dimenzi´os altere, ´ıgy az eg´esz t´er dimenzi´oja is legal´abb N volna. P´elda: R egydimenzi´os, b´armely nemnulla sz´am mint egyelem˝ u halmaz, b´azist alkot. C mint val´os vektort´er, k´etdimenzi´os. Egy b´azisa pl: {1, i}. Egy m´asik b´azisa: {1 + i, 1 − i} ´ P´elda R2 -ben: R2 k´etdimenzi´os, egy b´azisa pl. {(1, 0), (0, 1)}. Altal´ aban, b´armely k´et pont, mely az orig´oval nem esik egy egyenesbe, b´azist alkot a s´ıkon. P´elda Rn -ben: Rn n-dimenzi´os, egy b´azisa pl. {(1, 0, 0, ..., 0), (0, 1, 0, ..., 0), ..., (0, 0, ..., 0, 1)} (ezt standard b´ azisnak nevezz¨ uk). P´eld´ ak a polinomok ter´eben: A polinomok tere v´egtelen dimenzi´os. A legfeljebb k-adfok´ u polinomok altere (k + 1)-dimenzi´os, egy b´azis´at 2 k az 1, x, x , ..., x alappolinomok alkotj´ak.
6
1.4
Skal´ aris szorzat ´ es norma Rn -ben
Defin´ıci´ o: Az x := (x1 , x2 , ..., xn ) ∈ Rn , y := (y1 , y2 , ..., yn ) ∈ Rn vektorok skal´ aris szorzat´ anak a k¨ovetkez˝o sz´amot nevezz¨ uk: hx, yi :=
n X
xk yk = x1 y1 + x2 y2 + ... + xn yn
k=1
Az x ∈ Rn vektor norm´aja vagy abszol´ ut ´ert´eke: ||x|| :=
q
hx, xi =
v u n uX t x2
k
=
q
x21 + x22 + ... + x2n
k=1
Az x, y ∈ Rn vektorok t´avols´ag´anak pedig az ||x − y|| sz´amot nevezz¨ uk. K¨ovetkez´esk´epp ||x|| az x vektor t´avols´aga a 0 z´erusvektort´ol. Ezekkel a fogalmakkal a m´ar ismert Cauchy-egyenl˝otlens´eg az al´abbi t¨om¨or alakba ´ırhat´o: |hx, yi| ≤ ||x|| · ||y|| A skal´aris szorzatnak s´ıkbeli vektorok eset´en szeml´eletes jelent´ese van. Legyenek x = (x1 , x2 ), y = (y1 , y2 ) ∈ R2 tetsz˝oleges vektorok. Kifejezve a vektorok koordin´at´ait a vektorok hossz´aval ´es ir´anysz¨og´evel (ld. az 1. ´abr´at): x1 = r cos t, x2 = r sin t,
y1 = R cos T, y2 = R sin T,
a k´et vektor skal´aris szorzat´ara a k¨ovetkez˝o kifejez´es ad´odik: hx, yi = Rr cos T cos t + Rr sin T sin t = Rr cos(T − t) = ||x|| · ||y|| · cos φ,
1.´abra: Jel¨ol´esek k´et s´ıkvektor skal´aris szorzat´anak szeml´eltet´es´ehez 7
ahol φ a k´et vektor ´altal bez´art sz¨og. Az al´abbiakban ¨osszefoglaljuk a skal´aris szorzat alapvet˝o tulajdons´agait. Ezek a defin´ıci´ob´ol azonnal ad´odnak, ´es azt mutatj´ak, hogy a skal´aris szorzattal a k¨oz¨ons´eges szorz´ashoz hasonl´o m´odon sz´amolhatunk: ´ ıt´ 4. All´ as: Tetsz˝oleges x, y, z ∈ Rn vektorok ´es λ ∈ R eset´en: hx + y, zi = hx, zi + hy, zi hx, yi = hy, xi hλx, yi = λ · hx, yi hx, xi ≥ 0, ´es hx, xi = 0 pontosan akkor teljes¨ ul, ha x = 0 A norma legfontosabb tulajdons´agai pedig a k¨ovetkez˝ok: ´ ıt´ 5. All´ as: Tetsz˝oleges x, y ∈ Rn vektorok ´es λ ∈ R eset´en: ||x|| ≥ 0, ´es ||x|| = 0 pontosan akkor teljes¨ ul, ha x = 0 ||λx|| = |λ| · ||x|| ||x + y|| ≤ ||x|| + ||y|| (h´aromsz¨og-egyenl˝ otlens´eg) Ezek k¨oz¨ ul csak a h´aromsz¨og-egyenl˝otlens´eg nem nyilv´anval´o. Haszn´alva a skal´aris szorzat el˝oz˝oekben ¨osszefoglalt azonoss´agait: ||x + y||2 = hx + y, x + yi = hx, xi + hx, yi + hy, xi + hy, yi = ||x||2 + 2hx, yi + ||y||2 A jobboldal a Cauchy-egyenl˝otlens´eggel becs¨ ulhet˝o fel¨ ulr˝ol, innen: ||x + y||2 ≤ ||x||2 + 2||x||||y|| + ||y||2 , ahonnan a h´aromsz¨og-egyenl˝otlens´eg m´ar ad´odik. ´ Erdemes k¨ ul¨on is megjegyezni a fenti bizony´ıt´asban levezetett azonoss´agot: ´ ıt´ 6. All´ as: Tetsz˝oleges x, y ∈ Rn vektorok eset´en: ||x + y||2 = ||x||2 + 2hx, yi + ||y||2 , melyhez teljesen hasonl´oan ad´odik az is, hogy: ||x − y||2 = ||x||2 − 2hx, yi + ||y||2 , 8
2.´abra: Jel¨ol´esek a koszinuszt´etelhez Megjegyz´es: Ez ut´obbi azonoss´ag s´ıkbeli vektorok eset´en a j´ol ismert koszinuszt´etelt adja (ld. a 2. ´abr´at). Az ´abra jel¨ol´eseivel, a h´aromsz¨og a, b ill. c oldal´anak hossza ||x||, ||y|| ill. ||x − y||. Mivel pedig hx, yi = ||x|| · ||y|| · cos θ, az´ert innen: c2 = a2 − 2ab cos θ + b2 . ´ ıt´asban Megjegyz´es: A k´es˝obbiekben t´ ulnyom´or´eszt a skal´aris szorzatnak ´es a norm´anak nem a defin´ıci´oj´at haszn´aljuk, hanem a 4. ´es 5. All´ ´ ¨osszefoglalt tulajdons´agokat. Ilyen tulajdons´ag´ u h., .i ´es ||.|| f¨ uggv´enyek bevezet´ese m´as vektorterekben is lehets´eges. Igy pl. l´attuk, hogy az [a, b]R korl´atos ´es z´art intervallumon folytonos f¨ uggv´enyek C[a, b] halmaza vektort´er a szok´asos f¨ uggv´enym˝ uveletekre n´ezve: itt ´ ıt´asban ¨osszefoglalt tulajdons´agokkal. ´Igy jutunk az az hf, gi := ab f g el˝o´ır´assal skal´aris szorzatot defini´alunk, mely rendelkezik 4. All´ a q euklideszi terek fogalm´ahoz. Egy euklideszi t´erben az ||x|| := hx, xi defin´ıci´oval mindig lehet norm´at defini´alni, mely rendelkezik a ´ ıt´asban ¨osszefoglalt tulajdons´agokkal. Azonban norm´at egy´eb m´odon is lehet bevezetni, skal´aris szorzat n´elk¨ 5. All´ ul. ´Igy pl. az eml´ıtett C[a, b] f¨ uggv´enyt´erben az ||f || := max{|f (x)| : x ∈ [a, b]} el˝o´ır´as is k¨onnyen ellen˝orizhet˝oen norm´at ad, melyr˝ol viszont megmutathat´o, hogy nem sz´armaztathat´o semmilyen skal´aris szorzatb´ol. A norm´aval ell´atott vektortereket norm´ alt tereknek nevezz¨ uk. Az euklideszi ´es norm´alt terek tanulm´anyoz´asa meghaladja a jegyzet kereteit: a tov´abbiakban e terek k¨oz¨ ul egyed¨ ul a v´eges dimenzi´os Rn terekkel foglalkozunk.
1.5
Ortogonalit´ as, ortogon´ alis vet¨ ulet
Defin´ıci´ o: Azt mondjuk, hogy az x, y ∈ Rn , vektorok mer˝ olegesek vagy ortogon´ alisak, ha hx, yi = 0. Ezt a t´enyt ´ıgy jel¨olj¨ uk: x ⊥ y. Az ortogonalit´as a geometriai mer˝olegess´egfogalom ´altal´anos´ıt´asa, mert s´ık- ill. t´erbeli vektorok eset´en az el˝oz˝o szakasz szerint k´et nemz´erus vektor skal´aris szorzata pontosan akkor z´erus, ha az ´altaluk bez´art sz¨og koszinusza 0, azaz, ha a k´et vektor mer˝oleges. Nyilv´anval´o, hogy egyed¨ ul a z´erusvektor ortogon´alis saj´at mag´ara, mert egy vektor ¨onmag´aval vett skal´aris szorzata megegyezik saj´at norm´aj´anak n´egyzet´evel. 9
´ ıt´as azonnali k¨ovetkezm´enyek´epp: A 6. All´ ´ ıt´ 7. All´ as (Pitagor´ asz t´ etele): Tetsz˝oleges x, y ∈ Rn , x ⊥ y vektorok eset´en: ||x + y||2 = ||x||2 + ||y||2
Az ´all´ıt´as k¨onnyen ´altal´anos´ıthat´o kett˝on´el t¨obb vektorra: 8. K¨ ovetkezm´ eny: Tetsz˝oleges x1 , x2 , ..., xm ∈ Rn , (m ≤ n) p´aronk´ent ortogon´alis vektor eset´en: ||
m X
xj ||2 =
j=1
Val´oban, ||
Pm
j=1
Pm
xj ||2 = h
j=1
xj ,
Pm
k=1
xk i =
Pm Pm j=1
k=1 hxj , xk i
m X
||xj ||2
j=1
=
Pm
k=1 hxk , xk i
=
Pm
k=1
||xk ||2 .
Az ortogon´alis vektoroknak – csak´ ugy mint a s´ık- ill. a t´ervektorok eset´eben – kit¨ untetett szerep¨ uk van. A k¨ovetkez˝o ´all´ıt´asokban ezeket foglaljuk ¨ossze. ´ ıt´ 9. All´ as: Minden x1 , x2 , ..., xm ∈ Rn (m ≤ n) p´aronk´ent ortogon´alis nemz´erus vektorokb´ol ´all´o vektorrendszer line´arisan f¨ uggetlen. Pm Bizony´ıt´as: Ha ui. os´eget annak baloldal´aval skal´arisan szorozva ´es a p´aronk´enti ortogonalit´ast j=1 λj xj = 0, akkor ezt az egyenl˝ Pm 2 2 felhaszn´alva j=1 |λj | ||xj || = 0, ad´odik, ahonnan sz¨ uks´egk´epp λ1 = ... = λm = 0. ´ ıt´ 10. All´ as: Ha egy x ∈ Rn vektor ortogon´alis egy e1 , e2 , ..., em ∈ Rn gener´atorrendszer minden elem´ere, akkor sz¨ uks´egk´epp x = 0. P Bizony´ıt´as: Ha ui. x = nj=1 λj ej , alak´ u, akkor az egyenl˝os´eg mindk´et oldal´at skal´arisan szorozva x-szel, kapjuk, hogy ||x||2 = 0, azaz x = 0. ´ ıt´asban ¨osszefoglalt tulajdons´agait, nyomban ad´odik, hogy: Haszn´alva a skal´aris szorzatnak a 4. All´ ´ ıt´ 11. All´ as: Egy tetsz˝oleges M ⊂ X halmaz ¨osszes elem´ere ortogon´alis vektorok alteret alkotnak X-ben. Ezt az alteret M halmaz ortogon´alis kieg´esz´ıt˝ o alter´enek nevezz¨ uk, ´es az M ⊥ szimb´olummal jel¨olj¨ uk. ´ ıt´as r¨oviden u Ezzel a fogalommal a 10. All´ ´gy fogalmazhat´o meg, hogy egy tetsz˝oleges e1 , e2 , ..., em ∈ Rn gener´atorrendszer ortogon´alis kieg´esz´ıt˝o altere a trivi´alis {0} alt´er. 10
Defin´ıci´ o: Az e1 , e2 , ..., en ∈ Rn b´azist ortogon´ alis b´ azisnak nevezz¨ uk, ha ek ⊥ ej minden k 6= j eset´en. Az ortogon´alis b´azist ortonorm´ altnak nevezz¨ uk, ha m´eg ||ek || = 1 is teljes¨ ul minden k = 1, 2, ..., n-re. Nyilv´anval´o, hogy pl. a standard b´azis egy´ uttal ortonorm´alt b´azis is Rn -ben. 12. T´ etel: B´armely {0} 6= X0 ⊂ Rn alt´ernek van ortonorm´alt b´azisa. Bizony´ıt´as: Legyen e1 ∈ X0 egy tetsz˝oleges, 1 norm´aj´ u vektor. Ezekut´an v´alasszunk egy 1 norm´aj´ u e2 vektort az {e1 }⊥ ∩ X0 alt´erb˝ol, ⊥ majd egy 1 norm´aj´ u e3 vektort az {e1 , e2 } ∩ X0 alt´erb˝ol, ´es ´ıgy tov´abb. Ily m´odon p´aronk´ent ortogon´alis, ez´ert line´arisan f¨ uggetlen X0 -beli ⊥ vektorok rendszer´ehez jutunk. Az elj´ar´as v´eget ´er, ha az {e1 , e2 , ...em } ∩ X0 alt´er m´ar nem tartalmaz 1 norm´aj´ u vektort, azaz a trivi´alis 0 alt´errel egyenl˝o. Ekkor {e1 , e2 , ...em } gener´alja is az X0 alteret. Val´oban, ha valamely x ∈ X0 vektor nem lenne el˝o´all´ıthat´o e1 , ..., em P line´aris kombin´aci´ojak´ent, akkor az x − m erus eleme lenne az {e1 , e2 , ...em }⊥ ∩ X0 alt´ernek, mivel mindegyik j=1 hx, ej iej vektor egy nemz´ ek -ra ortogon´alis (k = 1, 2, ..., m): hx −
m X
hx, ej iej , ek i = hx, ek i −
j=1
m X
hx, ej ihej , ek i = hx, ek i − hx, ek i = 0
j=1
Teh´at {e1 , e2 , ...em } egy gener´atorrendszer X0 -ban, ´es mivel p´aronk´ent ortogon´alis, az´ert line´arisan f¨ uggetlen is, azaz b´azist alkot X0 -ban. A konstrukci´o miatt pedig e b´azis elemei mind 1 norm´aj´ uak, teh´at a b´azis ortonorm´alt. Az ortonorm´alt b´azisok kit¨ untetett szerep´et vil´ag´ıtja meg a k¨ovetkez˝o p´elda. Legyen e1 , e2 , ..., en ∈ Rn egy tetsz˝oleges (nem felt´etlen ortogon´alis) b´azis, ´es x ∈ Rn tetsz˝oleges vektor. Ha x-et el˝o akarjuk ´all´ıtani az e1 , e2 , ..., en b´azisvektorok line´aris kombin´aci´ojak´ent: x = λ1 e1 + λ2 e2 + ... + λn en , akkor ez a λ1 , ..., λn egy¨ utthat´okra egy n-ismeretlenes algebrai egyenletrendszer megold´as´at jelenti. A helyzet l´enyegesen egyszer˝ us¨odik, ha az e1 , e2 , ..., en b´azis ortonorm´alt. Ekkor ui. ´erv´enyes a k¨ovetkez˝o t´etel: 13. T´ etel: Legyen e1 , e2 , ..., en ∈ Rn egy ortonorm´alt b´azis, ´es x ∈ Rn tetsz˝oleges vektor, akkor: x=
n X
hx, ej iej
j=1
Bizony´ıt´as: Jel¨olje y a jobboldali vektort: y :=
Pn
j=1 hx, ej iej .
hx − y, ek i = hx, ek i −
n X
Meg kell mutatnunk, hogy x = y. Tetsz˝oleges k = 1, 2, ..., n indexre:
hx, ej ihej , ek i = hx, ek i − hx, ek i · hek , ek i = 0,
j=1
11
´ ıt´as). Teh´at az x − y vektor ortogon´alis az e1 , e2 , ..., en b´azis minden elem´ere, ez´ert sz¨ uks´egk´epp x − y = 0 (9. All´ K¨ovetkez´esk´epp az egy¨ utthat´ok egyenletmegold´as n´elk¨ ul, egy-egy skal´aris szorzat kisz´am´ıt´as´aval ad´odnak. A fenti el˝o´all´ıt´as lehet˝ov´e teszi az elemi geometri´ab´ol j´ol ismert mer˝ oleges vet¨ ulet fogalm´anak ´altal´anos´ıt´as´at: 14.T´ etel: Legyen X0 ⊂ Rn egy tetsz˝oleges alt´er. Akkor minden x ∈ Rn vektor egy´ertelm˝ uen el˝o´all x = x0 + x⊥ es 0 alakban, ahol x0 ∈ X0 ´ ⊥ ⊥ x0 ∈ X0 . Ezt az x0 vektort az x vektornak az X0 alt´erre vett ortogon´ alis vet¨ ulet´enek nevezz¨ uk. Bizony´ıt´as: Legyen e1 , e2 , ..., em egy ortonorm´alt b´azis X0 -ban (ilyen van, ld. a 12.T´etelt), ´es jel¨olje: x0 :=
m X
hx, ej iej
j=1
Akkor az x⊥ := x − x0 val´oban ortogon´alis X0 -ra, mert mindegyik ek b´azisvektorra ortogon´alis: hx − x0 , ek i = hx −
m X
hx, ej iej , ek i = hx, ek i −
j=1
m X
hx, ej ihej , ek i = hx, ek i − hx, ek i = 0,
j=1
amivel a k´ıv´ant el˝o´all´ıt´as l´etez´es´et igazoltuk. M´ar csak az egy´ertelm˝ us´eget kell bel´atni. Ha x = x0 + x⊥ es x = y0 + y0⊥ k´et olyan felbont´as, 0 ´ ⊥ ⊥ ⊥ ⊥ ⊥ ´ hogy x0 , y0 ∈ X0 ´es x0 , y0 ∈ X0 , akkor innen x0 − y0 = −(x0 − y0 ) k¨ovetkezik. Amde a baloldali vektor X0 -beli, m´ıg a jobboldali X0⊥ -beli, ⊥ azaz egym´asra ortogon´alisak. Ez´ert csak u ´gy lehetnek egyenl˝ok, ha mindketten a 0 z´erusvektorral egyenl˝ok, azaz x0 = y0 ´es x⊥ at 0 = y0 . Teh´ a t´etelben szerepl˝o ortogon´alis felbont´as val´oban egy´ertelm˝ u. Speci´alisan, ha X0 egydimenzi´os, ´es egy 0 6= e ∈ Rn vektor gener´alja, akkor a t´etelb˝ol ad´odik, hogy egy tetsz˝oleges x ∈ Rn vektor e e vektor (ui. a ||e|| vektor norm´aja ´epp 1). ir´any´ u ortogon´alis vet¨ ulete az hx,eie ||e||2 A t´etel m´asik k¨ovetkezm´enye, hogy tetsz˝oleges X0 ⊂ Rn alt´er, eset´en X0 ´es az X0⊥ alterek dimenzi´oinak ¨osszege ´eppen n. Val´oban, vegy¨ unk fel mindk´et alt´erben egy e1 , ..., em ∈ X0 ill. f1 , ..., fk ∈ X0⊥ ortonorm´alt b´azist, akkor X0 m-dimenzi´os, ´es X0⊥ k-dimenzi´os. Ezek egyes´ıt´ese, azaz az e1 , ..., em , f1 , ..., fk vektorrendszer tov´abbra is p´aronk´ent ortogon´alis (ez´ert line´arisan f¨ uggetlen) vektorokb´ol ´all, tov´abb´a n n a 14.T´etel ´ertelm´eben gener´alj´ak is az R teret, ´ıgy b´azist alkotnak R -ben. Ez´ert e b´azis elemsz´ama ´epp n, teh´at val´oban, n = m + k. V´egezet¨ ul megmutatjuk, hogy az ortogon´alis vet¨ ulet rendelkezik egyfajta minimumtulajdons´aggal, mely a k´et- ´es h´aromdimenzi´os terekben az elemi geometri´ab´ol m´ar j´ol ismert: 15.T´ etel: Legyen X0 ⊂ Rn egy tetsz˝oleges alt´er, x ∈ Rn pedig egy tetsz˝oleges vektor. Jel¨olje x0 az x vektor X0 -ra vett ortogon´alis vet¨ ulet´et. Akkor x0 az x vektorhoz legk¨ozelebb es˝o X0 -beli vektor, azaz minden y ∈ X0 eset´en ||x − x0 || ≤ ||x − y||. 12
Bizony´ıt´as: Tetsz˝oleges y ∈ X0 eset´en nyilv´an x − y = (x0 − y) + (x − x0 ). A jobboldali els˝o z´ar´ojeles tag X0 -beli, m´ıg a m´asodik a 14. T´etel ´ertelm´eben X0⊥ -beli. A Pitagor´asz-t´etel miatt ez´ert ||x − y||2 = ||x0 − y||2 + ||x − x0 ||2 . Elhagyva a jobboldalr´ol a nemnegat´ıv ||x0 − y||2 tagot, a jobboldal csak cs¨okkenhet, innen az ´all´ıt´as ad´odik.
13
1.6
Feladatok
1. Vektorteret alkotnak-e a szok´asos f¨ ugg´enym˝ uveletekre n´ezve az al´abbi R → R t´ıpus´ u f¨ uggv´enyek? (a) a korl´atos f¨ uggv´enyek (b) a monoton f¨ uggv´enyek (c) a 2π-periodikus f¨ uggv´enyek (d) a trigonometrikus polinomok, azaz az x → a0 + a1 cos x + a2 cos 2x + ... + an cos nx + b1 sin x + b2 sin 2x + ... + bn sin nx alak´ u f¨ uggv´enyek (a0 , ..., an , b1 , ..., bn ∈ R, n ∈ N ) (e) azon folytonos f¨ uggv´enyek, melyek egy adott x0 helyen z´erus ´ert´eket vesznek fel (f ) a nemnegat´ıv f¨ uggv´enyek Megold´as 2. A val´os sorozatok vektorter´eben alteret alkotnak-e az al´abbi sorozatok? (a) a fel¨ ulr˝ol korl´atos sorozatok (b) az alulr´ol korl´atos sorozatok (c) a Cauchy-sorozatok (d) a +∞-be vagy a −∞-be tart´o sorozatok Megold´as 3. Igazoljuk, hogy a geometriai t´er semmilyen korl´atos r´eszhalmaza nem lehet alt´er (az orig´o mint egy pontb´ol ´all´o trivi´alis alt´er kiv´etel´evel). Megold´as 4. Line´arisan f¨ uggetlenek-e az al´abbi formul´akkal megadott f¨ uggv´enyek? (a) x2 + 3x3 − 1, 2x2 + 6, x (b) ex , sh x, ch x, 1, e−2x 14
(c) log(1 + ex ), x, 1, log
q
e−x +1 ex +1
Megold´as ´ ıtsuk el˝o az x → sin3 x f¨ 5. All´ uggv´enyt sin x, sin 2x ´es sin 3x line´aris kombin´aci´ojak´ent. Megold´as 6. Line´arisan f¨ uggetlenek-e az a := (1, −2, 0, 5), b := (1, 3, −1, 0), c := (1, −1, 1, −1), d := (0, 7, 1, −17) R4 -beli vektorok? Ha igen, bizony´ıtsuk ezt be. Ha nem, ´all´ıtsuk el˝o valamelyiket a t¨obbi line´aris kombin´aci´ojak´ent. Megold´as 7. Hat´arozzuk meg adott n ∈ N mellett a trigonometrikus polinomok, azaz az x → a0 + a1 cos x + a2 cos 2x + ... + an cos nx + b1 sin x + b2 sin 2x + ... + bn sin nx alak´ u f¨ uggv´enyek alkotta vektort´er dimenzi´oj´at, ´es egy b´azis´at. Megold´as 8. Tekints¨ uk Rn -nek (n > 2) azon vektorok alkotta alter´et, melyek ortogon´alisak az (1, −1, 0, 0, ..., 0), (−1, 2, 0, 0, ..., 0), (1, 1, 0, 0, ..., 0) vektorok mindegyik´ere. Hat´arozzuk meg ennek az alt´ernek a dimenzi´oj´at. Megold´as 9. Hat´arozzuk meg az a := (1, −1, 1, −1, 1, −1, ...) ∈ Rn vektornak az e := (1, 1, 1, ...., 1) ∈ Rn ir´any´ u ortogon´alis vet¨ ulet´et. Megold´as 10. Mutassuk meg, hogy ha x, y ∈ Rn egyenl˝o hossz´ us´ag´ u vektorok, akkor x + y ´es x − y sz¨ uks´egk´epp ortogon´alisak. Megold´as 11. Igazoljuk, hogy tetsz˝oleges x = (x1 , x2 , ..., xn ) ∈ Rn vektor eset´en: n X
xk ≤
√ n · ||x||.
k=1
Megold´as
15
Megold´ asok 1. (a) igen, (b) nem (k´et monoton f¨ uggv´eny ¨osszege nem felt´etlen monoton), (c) igen, (d) igen, (e) igen, (f ) nem (k´et nemnegat´ıv f¨ uggv´eny k¨ ul¨onbs´ege nem felt´etlen nemnegat´ıv). 2. (a) nem, (b) nem, (c) igen, (d) nem. 3. Ha A ⊂ R3 korl´atos, akkor befoglalhat´o egy orig´o k¨ozep˝ u, el´eg nagy R sugar´ u g¨ombbe. Ha pedig x ∈ A, x 6= 0 tetsz˝oleges, akkor α · x biztosan nincs A-ban, ha α > 2R , ´ ıgy A nem lehet alt´ e r. |x|
4. (a) igen, (b) nem (ex kifejezhet˝o sh x ´es ch x line´aris kombin´aci´ojak´ent), (c) nem (az utols´o kifejez´es – egyszer˝ us´ıt´es ut´an – − 21 · x -szel egyenl˝o). 5.
1 − cos 2x 1 1 1 1 3 1 = sin x − sin x cos 2x = sin x − (sin 3x + sin(−x)) = sin x − sin 3x 2 2 2 2 4 4 4 1 ahol felhaszn´altuk a sin α cos β = 2 (sin(α + β) + sin(α − β)) azonoss´agot. sin3 x = sin x sin2 x = sin x
6. Az ilyen t´ıpus´ u feladatok ´altal´aban u ´gy oldhat´ok meg, hogy megpr´ob´aljuk el˝o´all´ıtani a z´erusvektort a sz´oban forg´o vektorok line´aris kombin´aci´ojak´ent. Ez a line´aris kombin´aci´o egy¨ utthat´oira egy homog´en line´aris egyenletrendszert jelent, a k´erd´es pedig az, hogy van-e ennek nemtrivi´alis megold´asa: ha igen, a vektorok line´arisan ¨osszef¨ ugg˝ok, ha nincs, akkor pedig f¨ uggetlenek. Jelen feladat egyszer˝ ubben is kezelhet˝o: vegy¨ uk ´eszre, hogy b − a = (0, 5, −1, −5) ´es c − a = (0, 1, 1, −6). Ez ut´obbi k´etszeres´et az el˝obbihez adva ´epp a d vektort kapjuk: d = 2 · (c − a) + b − a = −3a + b + 2c. Teh´at a vektorok line´arisan ¨osszef¨ ugg˝ok. 7. Az 1, cos x, cos 2x, ..., cos nx, sin x, sin 2x, ..., sin nx kifejez´esekkel ´ertelmezett f¨ uggv´enyek rendszere nyilv´an gener´alja a trigonometrikus polinomokat. Line´aris f¨ uggetlens´eg¨ uk a k¨ovetkez˝ok´epp l´athat´o: ha a0 + a1 cos x + a2 cos 2x + ... + an cos nx + b1 sin x + b2 sin 2x + ... + bn sin nx ≡ 0, akkor ezt az egyenl˝os´eget cos kx-szel szorozva ´es a (0, 2π) intervallumon integr´alva a baloldalon a ak cos kx tag kiv´etel´evel minden tag elt˝ unik, innen sz¨ uks´egk´epp ak = 0, ´es hasonl´oan, sin jx-szel szorozva ´es a (0, 2π) intervallumon integr´alva a baloldalon a bj sin jx tag kiv´etel´evel minden tag elt˝ unik, innen sz¨ uks´egk´epp bj = 0 (k = 0, 1, ..., n, j = 1, 2, ..., n). Teh´at a fenti f¨ uggv´enyrendszer b´azis, ´ıgy a sz´oban forg´o t´er dimenzi´oja (2n + 1).
16
8. Az els˝o k´et vektor line´arisan f¨ uggetlen, de a harmadik m´ar line´arisan f¨ ugg az els˝o kett˝ot˝ol. ´Igy e h´arom vektor egy k´etdimenzi´ os n alteret gener´al R -ben. A sz´obanforg´o alt´er ennek ortogon´alis kieg´esz´ıt˝o altere, ´ıgy (n − 2)-dimenzi´os. 9.
1 − 1 + 1 − 1 + 1... ha, ei e= 2 e= ae = 2 ||e|| 1 + 12 + ... + 12
(
0, 1 e, n
ha n p´aros ha n p´aratlan
10. A skal´aris szorzat tulajdons´agait haszn´alva: hx + y, x − yi = hx, xi + hy, xi − hx, yi − hy, yi = ||x||2 − ||y||2 = 0, azaz (x + y) ⊥ (x − y). 11. Jel¨olje e := (1, 1, ..., 1) ∈ Rn . A Cauchy-egyenl˝otlens´eget haszn´alva: n X
xk = hx, ei ≤ ||x|| · ||e|| =
k=1
17
√
n · ||x||.
3.´abra: Pontok t´avols´aga, vektorok sz¨oge
2
Vektorgeometria
Az el˝oz˝o fejezetben bevezetett fogalmakat ´es t´eteleket most speci´alisan a k´et- ´es h´aromdimenzi´os t´erben alkalmazzuk. Eml´ekeztet¨ unk r´a, hogy a h´aromdimenzi´os geometriai t´erben a nemtrivi´alis alterek az orig´ora illeszked˝o egyenesek ´es s´ıkok, ´ıgy a line´aris algebra a geometriai t´erben az egyenesek ´es s´ıkok k´enyelmes le´ır´as´at teszi lehet˝ov´e. Ebben a fejezetben – t¨ort´eneti okokb´ol – az R2 ´es R3 vektort´er elemeit pontoknak fogjuk nevezni, m´ıg ”vektor” alatt az orig´ob´ol egy pontba h´ uzott ir´any´ıtott szakaszt ´ert¨ unk (ami az illet˝o pont helyvektora, b´ar ezek k¨olcs¨on¨osen egy´ertelm˝ uen megfeleltethet˝ok egym´asnak). Ez´ert pl. k´et pont t´avols´ag´ar´ol ugyanakkor k´et vektor ´altal bez´art sz¨ogr˝ol fogunk besz´elni. Szok´asos m´eg – ´es ebben a fejezetben mi is ´ıgy tesz¨ unk – a pontokat, vektorokat ´all´o, f´elk¨ov´er bet˝ ukkel, m´ıg a skal´ar (sz´am) param´etereket d˝olt, nem vastag´ıtott bet˝ ukkel jel¨olni. A k¨ovetkez˝o szakaszokban mindig felt´etelezz¨ uk, hogy a geometriai s´ıkon ill. t´erben adott egy r¨ogz´ıtett (mer˝oleges) koordin´atarendszer, ´ıgy a s´ık (t´er) pontjai k¨olcs¨on¨osen egy´ertelm˝ uen megfeleltethet˝ok mind R2 (ill. R3 ) elemeinek, mind pedig az illet˝o pontok helyvektorainak. ´Igy pl. egy x ∈ R3 elem alatt egyszerre ´ert¨ unk: (a) egy rendezett sz´amh´armast, (b) egy t´erbeli pontot, ill. (c) egy t´erbeli helyvektort, ahogy ´epp a legk´enyelmesebb.
2.1
S´ıkvektorok, egyenesek a s´ıkon
Az al´abbi eredm´enyek minden tov´abbi meggondol´as n´elk¨ ul ad´odnak az el˝oz˝o fejezet ´altal´anos eredm´enyeib˝ol. Mindazon´altal javasoljuk az Olvas´onak annak ´atgondol´as´at, hogy a most k¨ovetkez˝o ´all´ıt´asok mely kor´abbi ´all´ıt´asokon m´ ulnak! ´ ıt´ 1. All´ as: Az x, y ∈ R2 pontok t´avols´aga ||x − y||, m´ıg az x ´es y vektorok ´altal bez´art θ sz¨ogre teljes¨ ul a cos θ =
hx, yi ||x|| · ||y||
egyenl˝os´eg, felt´eve, hogy a egyik vektor hossza sem 0 (ld. a 3. ´abr´at).
18
4.´abra: Adott ir´any´ u ortogon´alis vet¨ uletvektor
´ ıt´ 2. All´ as: Legyenek a, e ∈ R2 , e 6= 0 . Az a vektor e ir´any´ u ortogon´alis vet¨ ulete (ld. a 4. ´abr´at): ae =
ha, ei ·e ||e||2
Amennyiben az e ir´anyvektor egys´egnyi hossz´ us´ag´ u, akkor a formula leegyszer˝ us¨odik: ae = ha, ei · e. ´ ıt´ 3. All´ as: Legyen a = (a1 , a2 ) ∈ R2 tetsz˝oleges vektor. Az a vektor 90o -kal val´o elforgatottja: a⊥ = (−a2 , a1 ). K¨ovetkez´esk´epp, ha 0 6= e ∈ R2 , akkor egy tetsz˝oleges x ∈ R2 vektor az al´abbi m´odon bonthat´o fel egy e ir´any´ u ´es egy arra mer˝oleges vektor ¨osszegek´ent: x=
hx, ei hx, e⊥ i ⊥ · e + ·e ||e||2 ||e||2
Amennyiben az e ir´anyvektor egys´egnyi hossz´ us´ag´ u (ekkor e⊥ is az), a formula leegyszer˝ us¨odik: x = hx, ei · e + hx, e⊥ i · e⊥ . ´ ıt´ 4. All´ as: Legyenek a, e ∈ R2 , e 6= 0 tetsz˝oleges vektorok. Akkor az x=a+t·e
(t ∈ R)
pontok egy egyenest alkotnak, mely illeszkedik az a pontra, ´es p´arhuzamos az e vektorral. Az e vektort az egyenes ir´ anyvektor´ anak, a fenti formul´at pedig az egyenes param´eteres vektoregyenlet´enek nevezz¨ uk. Nyilv´anval´o, hogy ez az egyenlet nem egy´ertelm˝ uen meghat´arozott: ugyanannak az egyenesnek a ´es e v´alaszt´as´at´ol f¨ ugg˝oen t¨obb, k¨ ul¨onb¨oz˝o alak´ u egyenlete is lehet. Ha a = (a1 , a2 ), e = (e1 , e2 ), akkor az egyenes param´eteres vektoregyenlete nyilv´an ekvivalens az al´abbi (skal´ar) egyenletrendszerrel: x1 = a1 + t · e1 19
x2 = a2 + t · e2 ahonnan a t param´eter kik¨ usz¨ob¨ol´es´evel az
x1 − a 1 x2 − a2 = e1 e2 nemparam´eteres egyenletet nyerj¨ uk (felt´eve, hogy e1 , e2 = 6 0). Innen x2 -t kifejezve, az egyenes j´ol ismert ir´anyt´enyez˝os egyenlet´ehez jutunk: x2 = a2 + m · (x1 − a1 ), ahol m = ee21 , az egyenes ir´anyt´enyez˝oje (ir´anysz¨og´enek tangense). Megjegyz´es: A jel¨ol´estechnika e t´eren nem egys´eges. Egyik fajta jel¨ol´esi konvenci´o szerint a pontok koordin´at´ait indexekkel jel¨olj¨ uk, mint id´aig is tett¨ uk: x = (x1 , x2 ), e = (e1 , e1 ), s.´ı.t. A m´asik elterjedt konvenci´o, hogy az egyes komponenseket bet˝ ukkel k¨ ul¨onb¨oztetj¨ uk meg: az egyenes egy tetsz˝oleges pontj´anak koordin´at´ai (x, y), egy pontja (ax , ay ), ir´anyvektora (ex , ey ). Ezzel a jel¨ol´estechnik´aval az egyenes param´eteres egyenletrendszer´enek alakja: x = ax + t · ex y = ay + t · ey Jegyezz¨ uk m´eg meg, hogy az egyenes param´eteres egyenletrendszer´eb˝ol azonnal leolvashat´o az egyenes egy pontj´anak koordin´at´ai ´es az ir´anyvektor koordin´at´ai is. Ugyanez vonatkozik a fentebb le´ırt nemparam´eteres alakra is. P´elda: Az (1,2) ponton ´atmen˝o, (3,–1) ir´any´ u egyenes param´eteres egyenletrendszere: x = 1 + 3t y =2−t
P´elda: Hat´arozzuk meg azon egyenes egyenlet´et, mely illeszkedik a (–1,3) pontra, ´es mer˝oleges az x = 5 − 2t y = −2 + 3t egyenesre! Megold´ as: A adott egyenes ir´anyvektora (–2,3). Egy erre mer˝oleges vektor: (3,2), ez j´o lesz a keresett egyenes ir´anyvektor´anak. Innen a keresett egyenes egyenletrendszere: x = −1 + 3t 20
y = −3 + 2t
A gyakorlatban sokszor el˝ofordul, hogy az egyenes ir´anyvektora explicite nem adott, viszont k´et k¨ ul¨onb¨oz˝o pl. a ´es b pontja is ismert. Ekkor ir´anyvektor gyan´ant az e := b − a vektor nyilv´an megfelel˝o, innen nyerj¨ uk a k´et ponton ´atmen˝o egyenes egyenlet´et: ´ ıt´ 5. All´ as: Legyenek a, b ∈ R2 tetsz˝oleges s´ıkbeli pontok. Az a ´es b pontokon ´atmen˝o egyenes param´eteres vektoregyenlete: x = a + t · (b − a)
(t ∈ R).
Megjegyezz¨ uk, hogy ha a t param´eter csak a [0, 1] intervallumot futja be, akkor a fenti formul´aval defini´alt x pontok ´epp az a ´es b v´egpont´ u szakasz pontjait futj´ak be. P´elda: Az (1,–2) ´es a (6,5) pontokon ´atmen˝o egyenes param´eteres egyenletrendszere: x = 1 + 5t y = −2 + 7t, de ugyancsak ezt az egyenest hat´arozza meg az al´abbi egyenletrendszer is: x = 6 + 5t y = 5 + 7t.
K´et egyenes sz¨og´en az ir´anyvektoraik ´altal bez´art θ hegyessz¨oget ´ertj¨ uk. Ha a k´et egyenes param´eteres vektoregyenlete x = a + t · e |he,f i| ill. x = b + τ · f , akkor nyilv´an: cos θ = ||e||·||f || .
2.2
T´ ervektorok, egyenesek a t´ erben
Az el˝oz˝o szakasz meggondol´asai (a vektor elforgat´as´at kiv´eve) a h´aromdimenzi´os geometriai t´erben is minden tov´abbi n´elk¨ ul alkalmazhat´ok. ´Igy jutunk a t´erbeli vektorokra ill. t´erbeli egyenesekre vonatkoz´o alapvet˝o ´all´ıt´asokhoz, melyet az al´abbiakban foglalunk ¨ossze. Megjegyezz¨ uk, hogy a fejezet h´atralev˝o r´esz´eben a skal´aris szorzat ill. a norma ´ertelemszer˝ uen az R3 -beli skal´aris szorzatot ´es norm´at jelenti. 21
Szok´asos m´eg a standard b´azis elemeinek al´abbi jel¨ol´ese: i := (1, 0, 0), j := (0, 1, 0), k := (0, 0, 1). ´ ıt´ 6. All´ as: Az x, y ∈ R3 pontok t´avols´aga ||x − y||, m´ıg az x ´es y vektorok ´altal bez´art θ sz¨ogre teljes¨ ul a hx, yi ||x|| · ||y||
cos θ = egyenl˝os´eg, felt´eve, hogy a egyik vektor hossza sem 0.
´ ıt´ 7. All´ as: Legyenek a, e ∈ R3 , e 6= 0 . Az a vektor e ir´any´ u ortogon´alis vet¨ ulete: ae =
ha, ei ·e ||e||2
Amennyiben az e ir´anyvektor egys´egnyi hossz´ us´ag´ u, akkor a formula leegyszer˝ us¨odik: ae = ha, ei · e. ´ ıt´ 8. All´ as: Legyenek a, e ∈ R3 , e 6= 0 tetsz˝oleges vektorok. Akkor az x=a+t·e
(t ∈ R)
pontok egy egyenest alkotnak, mely illeszkedik az a pontra, ´es p´arhuzamos az e vektorral. Az e vektort az egyenes ir´ anyvektor´ anak, a fenti formul´at pedig az egyenes param´eteres vektoregyenlet´enek nevezz¨ uk. Ha a = (a1 , a2 , a3 ), e = (e1 , e2 , e3 ), akkor az egyenes param´eteres vektoregyenlete nyilv´an ekvivalens az al´abbi (skal´ar) egyenletrendszerrel: x1 = a1 + t · e1 x2 = a2 + t · e2 x3 = a3 + t · e3 ahonnan a t param´eter kik¨ usz¨ob¨ol´es´evel az
x1 − a1 x 2 − a2 x 3 − a3 = = e1 e2 e3
(nemparam´eteres) egyenletp´art nyerj¨ uk (felt´eve, hogy e1 , e2 , e3 6= 0).
22
Megjegyz´es: A s´ıkbeli egyenesek eset´ehez hasonl´oan, itt is k´etf´ele jel¨ol´estechnika terjedt el: a pontok (vektorok) koordin´at´ait 1-t˝ol 3ig terjed˝o indexekkel k¨ ul¨onb¨oztethetj¨ uk meg, mint a fenti param´eteres egyenletrendszerben, de szok´asos az egyes koordin´at´ak k¨ ul¨onb¨oz˝o bet˝ ukkel (pl. x, y, z-vel) val´o jel¨ol´ese is. Ez ut´obbi esetben az egyenes param´eteres egyenletrendszer´enek alakja: x = ax + t · ex y = ay + t · ey z = az + t · ez ahol a = (ax , ay , az ), e = (ex , ey , ez ). Jegyezz¨ uk m´eg meg, hogy az egyenes param´eteres egyenletrendszer´eb˝ol azonnal leolvashat´o az egyenes egy pontj´anak koordin´at´ai ´es az ir´anyvektor koordin´at´ai is. A gyakorlatban sokszor el˝ofordul, hogy az egyenes ir´anyvektora explicite nem adott, viszont k´et k¨ ul¨onb¨oz˝o pl. a ´es b pontja is ismert. Ekkor ir´anyvektor gyan´ant az e := b − a vektor nyilv´an megfelel˝o, innen nyerj¨ uk a k´et ponton ´atmen˝o egyenes egyenlet´et: ´ ıt´ 9. All´ as: Legyenek a, b ∈ R3 tetsz˝oleges t´erbeli pontok. Az a ´es b pontokon ´atmen˝o egyenes param´eteres vektoregyenlete: x = a + t · (b − a)
(t ∈ R).
Itt is igaz marad, hogy ha a t param´eter csak a [0, 1] intervallumot futja be, akkor a fenti formul´aval defini´alt x pontok ´epp az a ´es b v´egpont´ u szakasz pontjait futj´ak be. K´et egyenes sz¨og´en most is az ir´anyvektoraik ´altal bez´art θ hegyessz¨oget ´ertj¨ uk. Ha a k´et egyenes param´eteres vektoregyenlete x = a + t · e |he,f i| ill. x = b + τ · f , akkor nyilv´an: cos θ = ||e||·||f || . Azonban a s´ıkbeli esett˝ol elt´er˝oen, e k´et egyenes nem felt´etlen metszi egym´ast (akkor sem, ha nem p´arhuzamosak), azok lehetnek kit´er˝ok is. K´et egyenes metsz˝o ill. kit´er˝o volt´anak eld¨ont´ese legk´ezenfekv˝obb m´odon u ´gy lehets´eges, hogy megpr´ob´aljuk a k´et egyenes k¨oz¨os pontj´at megkeresni. Legyen a k´et egyenes param´eteres vektoregyenlete x = a + t · e ill. x = b + τ · f , akkor a k¨oz¨os pont koordin´at´ai mindk´et vektoregyenletet kiel´eg´ıtik, azaz a + t · e = b + τ · f . A probl´ema teh´at annak eld¨ont´es´ere reduk´al´odott, hogy a k´etismeretlenes, de h´arom egyenletb˝ol ´all´o t · ex − τ · fx = bx − ax t · ey − τ · fy = by − ay t · ez − τ · fz = bz − az rendszernek van-e megold´asa. Bizonyos kiv´eteles esetekt˝ol eltekintve, c´elhoz vezet, ha megoldjuk pl. az els˝o k´et egyenlet alkotta rendszert, ´es behelyettes´ıt´essel megn´ezz¨ uk, hogy a megold´as kiel´eg´ıti-e a harmadik egyenletet. Enn´el a megk¨ozel´ıt´esn´el sokkal g´epiesebb elj´ar´ast is fogunk mutatni a k¨ovetkez˝o szakaszban bevezet´esre ker¨ ul˝o vektori´ alis szorzat fogalm´anak haszn´alat´aval. 23
2.3
Vektori´ alis szorzat
Defin´ıci´ o: Az a = (a1 , a2 , a3 ), b = (b1 , b2 , b3 ) ∈ R3 vektorok vektori´ alis szorzat´ an az a × b := (a2 b3 − a3 b2 , a3 b1 − a1 b3 , a1 b2 − a2 b1 ) ∈ R3 vektort ´ertj¨ uk. P´elda: i × j = k, j × k = i, k × i = j. A defin´ıci´o azonnali k¨ovetkezm´enye, hogy b´armely vektor ¨onmag´aval vett vektori´alis szorzata a z´erusvektorral egyenl˝o: a × a = 0. K¨onnyen l´athat´o, az is, hogy a a ´es b harmadik komponense 0, azaz a = (a1 , a2 , 0), b = (b1 , b2 , 0), akkor a vektori´alis szorzatvektornak csak a harmadik komponense lehet z´erust˝ol k¨ ul¨onb¨oz˝o, mert ekkor a × b := (0, 0, a1 b2 − a2 b1 ). Ekkor pedig nyilv´an ||a × b|| := |a1 b2 − a2 b1 | = |h(a1 , a2 ), (−b2 , b1 )i| = |h(a1 , a2 ), (b1 , b2 )⊥ i| Ha pedig az (a1 , a2 ) ´es (b1 , b2 ) vektorok θ sz¨oget z´arnak be, akkor az (a1 , a2 ) ´es az elforgatott (b1 , b2 )⊥ vektor ´altal bez´art sz¨og nyilv´an π2 − θ, innen a skal´aris szorzat tulajdons´agai alapj´an: ||a × b|| := ||a|| · ||b|| · | cos( π2 − θ)| = ||a|| · ||b|| · | sin θ|. Mivel pedig a vektorok hossza ´es egym´assal bez´art sz¨oge szempontj´ab´ol a koordin´atarendszer megv´alaszt´asa k¨oz¨omb¨os, az´ert a k¨ovetkez˝o, most m´ar tetsz˝oleges t´erbeli vektorokra vonatkoz´o ´all´ıt´ast kaptuk: ´ ıt´ 10. All´ as: Tetsz˝oleges a, b ∈ R3 eset´en ||a × b|| := ||a|| · ||b|| · | sin θ|, ahol θ az a ´es b vektorok sz¨og´et jel¨oli. A k¨ovetkez˝o t´etel a vektori´alis szorzatvektornak a vektorgeometria szempontj´ab´ol legfontosabb tulajdons´ag´at fejezi ki: 11. T´ etel: A vektori´alis szorzatvektor mindk´et t´enyez˝oj´ere ortogon´alis, azaz tetsz˝oleges a, b ∈ R3 eset´en ha × b, ai = 0 ´es ha × b, bi = 0. Bizony´ıt´as: Csak az els˝o egyenl˝os´eget igazoljuk, a m´asik hasonl´oan v´egezhet˝o el: ha × b, ai = h(a2 b3 − a3 b2 , a3 b1 − a1 b3 , a1 b2 − a2 b1 ), (a1 , a2 , a3 )i = a1 a2 b3 − a1 a3 b2 + a2 a3 b1 − a1 a2 b3 + a1 a3 b2 − a2 a3 b1 = 0. K´et vektor vektori´alis szorzata teh´at automatikusan mer˝oleges mindk´et vektorra. Ir´any´ıt´asa az i × j = k egyenl˝os´eg alapj´an k¨onnyen megjegyezhet˝o a k¨ovetkez˝o m´odon: jobb kez¨ unk els˝o h´arom ujj´at ny´ ujtsuk ki egym´asra mer˝olegesen u ´gy, hogy h¨ uvelykujjunk az els˝o, mutat´oujjunk a m´asodik vektor ir´any´aba mutasson, ekkor k¨oz´eps˝o ujjunk a vektori´alis szorzatvektor ir´any´at mutatja. Ezt a (fizik´ab´ol ´atvett) szab´alyszer˝ us´eget jobbk´ezszab´ alynak nevezz¨ uk. Most pedig ¨osszefoglaljuk a vektori´alis szorzatra vonatkoz´o azonoss´agokat. Ezek teljes¨ ul´es´et a defin´ıci´o alapj´an az Olvas´o k¨onnyen ellen˝orizheti: 24
´ ıt´ 12. All´ as: Tetsz˝oleges a, b, c ∈ R3 ´es λ ∈ R eset´en: a × b = −b × a (λa) × b = a × (λb) = λ · (a × b) a × (b + c) = a × b + a × c, ´es (a + b) × c = a × c + b × c Vagyis a sz´amokra vonatkoz´o j´ol ismert azonoss´agok ´erv´enyesek maradnak azzal a jelent˝os k¨ ul¨onbs´eggel, hogy a vektori´alis szorzat nem kommutat´ıv (a t´enyez˝ok felcser´el´es´evel el˝ojelet v´alt), ´es nem is asszociat´ıv. Most m´ar egyszer˝ uen megoldhatjuk az el˝oz˝o szakaszban felvetett probl´em´at, azaz annak eld¨ont´es´et, hogy k´et adott, x = a + t · e ´es x = b + τ · f vektoregyenlet˝ u egyenes kit´er˝o-e vagy sem. A k´et egyenes p´arhuzamoss´aga k¨onnyen ellen˝orizhet˝o, ´ıgy feltehet˝o, hogy az egyenesek vagy metszik egym´ast, vagy kit´er˝oek. Az n := e × f vektor mindk´et egyenesre mer˝oleges. Tekints¨ uk most a (b − a) vektort. Ha a k´et egyenes metszi egym´ast, akkor (b − a) is k¨oz¨os s´ıkjukban van, ´ıgy n ortogon´alis (b − a)-ra. Ha a k´et egyenes kit´er˝o, akkor (b − a)-nak n ir´any´ u mer˝oleges vet¨ ulete nem 0, ´espedig ´epp a norm´altranszverz´alis szakasz hossza (azaz a k´et egyenest ¨osszek¨ot˝o, mindk´et egyenesre mer˝oleges szakasz hossza). Teh´at el´eg a he × f , b − ai kifejez´est ki´ert´ekelni: ha ez nem 0, akkor a k´et egyenes kit´er˝o, egy´ebk´ent pedig egy s´ıkban vannak. Megjegyz´es: Az el˝oz˝o gondolatmenetben fell´ep˝o he × f , gi alak´ u kifejez´est az e, f , g vektorok vegyesszorzat´ anak is nevezik, ´es egyszer˝ uen ´ eke egy sz´am, melynek abszol´ efg-vel jel¨olik. Ert´ ut ´ert´eke – elemi geometriai meggondol´asok alapj´an – az e, f , g vektorok ´altal kifesz´ıtett paralellepipedon (paralellogramma alap´ u ferde has´ab) t´erfogat´aval egyezik, enn´elfogva pontosan akkor 0, ha a h´arom vektor egy s´ıkba esik.
2.4
S´ıkok a t´ erben
A t´erbeli egyenesek mint´aj´ara a s´ıkok is le´ırhat´ok param´eteres vektoregyenlettel. Legyenek e, f ∈ R3 k´et line´arisan f¨ uggetlen (teh´at nem 3 egy egyenesbe es˝o) vektor, a ∈ R pedig adott pont. Akkor az x := a + u · e + v · f
(u, v ∈ R)
pontok egy s´ıkot alkotnak, mely illeszkedik az a pontra ´es p´arhuzamos az e ´es az f vektorokkal. Sokkal egyszer˝ ubb ´es elterjedtebb azonban a s´ıkokat egy, az adott s´ıkra mer˝oleges u ´n. norm´alvektor seg´ıts´eg´evel le´ırni. Jel¨olj¨on n 6= 0 egy ilyen norm´alvektort, ´es legyen a ∈ R3 a s´ık egy tetsz˝oleges pontja. Nyilv´anval´o, hogy egy x ∈ R3 pont akkor ´es csakis van rajta a s´ıkon, ha az x − a k¨ ul¨onbs´egvektor p´arhuzamos a s´ıkkal, azaz, ha x−a mer˝oleges az n norm´alvektorra. Innen nyerj¨ uk az adott pontra illeszked˝o, adott norm´alvektor´ u s´ık u ´n norm´ alegyenlet´et (ld. az 5.´abr´at): hx − a, ni = 0, melyet kifejtve kapjuk az al´abbi egyenletet: (x1 − a1 ) · n1 + (x2 − a2 ) · n2 + (x3 − a3 ) · n3 = 0 25
5.´abra: Egy pontj´aval ´es norm´alvektor´aval adott s´ık
Megjegyz´es: Csak´ ugy mint az egyenesekn´el, a jel¨ol´esi konvenci´ok itt sem egys´egesek. Sokszor szok´as a s´ık egy pontj´at (x, y, z)-vel jel¨olni: ekkor a s´ık norm´alegyenlete (x − ax ) · nx + (y − ay ) · ny + (z − az ) · nz = 0 alak´ u,. ahol most (ax , ay , az ) a s´ık egy pontja, ´es (nx , ny , nz ) a norm´alvektor. P´elda: Az orig´ora illeszked˝o, az x = 2 − 3t, y = t, z = 1 + 4t egyenesre mer˝oleges s´ık norm´alegyenlete: −3x + y + 4z = 0, mivel az egyenes (−3, 1, 4) ir´anyvektora egy´ uttal a s´ık norm´alvektora is. Gyakran el˝ofordul, hogy a norm´alvektor maga nem adott, viszont a s´ıknak h´arom pontj´at (a, b, c) is ismerj¨ uk: ha e h´arom pont nem esik egy egyenesbe, akkor meghat´arozza a s´ıkot. Ekkor els˝o l´ep´esben norm´alvektort kell keresn¨ unk. Nyilv´anval´o, hogy a (b − a) ´es a (c − a) k¨ ul¨onbs´egvektorok mindketten p´arhuzamosak a s´ıkkal, ´es line´arisan f¨ uggetlenek is, mivel nem esnek egy egyenesbe. K¨ovetkez´esk´epp ezek vektori´alis szorzata, az n := (b − a) × (c − a) vektor mer˝oleges az eg´esz s´ıkra, ´ıgy v´alaszthat´o norm´alvektornak. ´Igy nyerj¨ uk a h´arom pontra illeszked˝o s´ık norm´alegyenlet´et (ld. a 6.´abr´at): ´ ıt´ 13. All´ as: Az a, b, c ∈ R3 (nem egy egyenesbe es˝o) pontok ´altal meghat´arozott s´ık norm´alegyenlete: hx − a, (b − a) × (c − a)i = 0, P´elda: Hat´arozzuk meg az (1,0,0), (0,1,0), (0,0,1) pontokra (azaz az i, j, k vektorok v´egpontjaira) illeszked˝o s´ık norm´alegyenlet´et. Megold´ as: A norm´alvektor: n = (k − i) × (j − i) = k × j − i × j − k × i + i × i = −j × k − i × j − k × i = −i − k − j = (−1, −1, −1), innen a s´ık egyenlete: −(x − 1) − y − z = 0, azaz x + y + z = 1. 26
6.´abra: H´arom pontj´aval adott s´ık
V´egezet¨ ul ¨osszefoglalunk n´eh´any, a t´erbeli pontokkal, egyenesekkel ´es s´ıkokkal kapcsolatos n´eh´any t´ıpusprobl´em´at ´es azok egy-egy lehets´eges megold´asi m´odszer´et. Pont ´es s´ık t´avols´aga: A d ∈ R3 pontnak az hx − a, ni = 0 s´ıkt´ol m´ert t´avols´aga ´epp a (d − a) k¨ ul¨onbs´egvektor n ir´any´ u ortogon´alis |hd−a,ni| vet¨ uletvektor´anak hossza (ld. a 7.´abr´at), azaz ||n|| K¨ovetkez´esk´epp az a, b, c, d ∈ R3 pontok akkor ´es csakis akkor vannak egy s´ıkon, ha hd − a, (b − a) × (c − a)i = 0. (Gondoljuk ´at a kiv´eteles eseteket is!) Ez az eredm´eny u ´jabb megold´asi m´odszer´et adja az egyenesek kit´er˝o jelleg´enek eld¨ont´es´ere: nyilv´anval´o, hogy k´et egyenes akkor ´es csakis akkor esik egy s´ıkba, ha k´et-k´et k¨ ul¨onb¨oz˝o pontja egy s´ıkon van. Adott pontra ´es adott egyenesre illeszked˝ o s´ık. Az x = a + t · e egyenesre ´es az azon k´ıv¨ ul es˝o b ∈ R3 pontra illeszked˝o s´ık nyilv´an p´arhuzamos mind a (b − a) k¨ ul¨onbs´egvektorral, mind pedig az e ir´anyvektorral, ´ıgy norm´alvektora n := (b − a) × e-nek v´alaszthat´o. K´et adott s´ıkkal p´arhuzamos egyenes: Az hx − a, ni = 0 ´es az hx − b, mi = 0 s´ıkokkal p´arhuzamos egyenes mer˝oleges mindk´et s´ık norm´alvektor´ara, ´ıgy ir´anyvektora e := n × m-nek v´alaszthat´o. Egyenes ´es s´ık d¨of´espontja. Az x = a + t · e egyenes ´es az hx − b, ni = 0 s´ık d¨of´espontja az az x ∈ R3 pont, mely kiel´eg´ıti mindk´et egyenletet. Az ezt jellemz˝o t param´eter ´ıgy az ha + t · e − b, ni = 0 egyenletb˝ol hat´arozhat´o meg, ahonnan t = hb−a,ni . Ezt a t sz´amot he,ni behelyettes´ıtve az egyenes egyenlet´ebe, a d¨of´espont m´ar ad´odik.
7.´abra: Pont ´es s´ık t´avols´aga 27
2.5
Feladatok
1. Hat´arozzuk meg annak az egyenesnek az egyenlet´et, mely illeszkedik a (2, 3, −1) pontra, ´es p´arhuzamos az x = 1, y = −t, z = 1 + t egyenessel. Megold´as 2. Hat´arozzuk meg annak az egyenesnek az egyenlet´et, mely illeszkedik az (1, 0, 1) pontra, ´es mer˝oleges az x + y − 5z = 50 s´ıkra. Hat´arozzuk meg a d¨of´espont koordin´at´ait is. Megold´as 3. P´arhuzamos-e az x = 3 + 4t, y = −1 − 2t, z = 7t egyenes a 3x − y − 2z = 23 s´ıkkal? Megold´as 4. Mi a (11,11,11) pont mer˝oleges vet¨ ulete az x + y + z = 1 s´ıkon? Megold´as 5. Adottak az A1 := (x1 , y1 ), A2 := (x2 , y2 ), A3 := (x3 , y3 ), ∈ R2 s´ıkbeli pontok, melyek nem egy egyenesre illeszkednek. Hogyan d¨onthetj¨ uk el, hogy egy A := (x, y) ∈ R2 pont a fenti 3 pont meghat´arozta h´aromsz¨og belsej´eben fekszik-e vagy sem? Megold´as 6. Legyenek a := (1, 10, 1000) ´es b := (−1, 0.1, −0.001). Hat´arozzuk meg az (a × b) × (b × a) vektort. Megold´as 7. Legyenek a := (−1, 2, 1) ´es b := (3, 1, 1). B´azist alkotnak-e R-ban a b, b × a ´es a b × (b × a) vektorok? Megold´as 8. Az x + 2y + 3z = 4 ´es a 3x + 2y + z = −4 s´ıkok metsz´esvonala mer˝oleges-e az (1, 1, 1) pont helyvektor´ara? Megold´as 9. Melyik az az egyenes, mely p´arhuzamos az x − y + 2z = 1 ´es az x + y − 2z = 1 s´ıkokkal, ´es illeszkedik az orig´ora? Megold´as 10. ´Irjuk fel a A1 := (−2, −3, 5), A2 := (−3, 5, −2) ´es az A3 := (5, −2, −3) pontokra illeszked˝o s´ık egyenlet´et. Altere-e ez a s´ık R3 -
28
nak? Megold´as 11. ´Irjuk fel annak a s´ıknak az egyenlet´et, mely illeszkedik az orig´ora ´es az x = t, y = 2t + 1, z = 3t + 2 egyenlet˝ u egyenesre. Megold´as 12. Hat´arozzuk meg annak az egyenesnek az egyenlet´et, mely illeszkedik az (1, 1, 1) pontra, ´es mer˝oleges az x = 1 + t, y = t, z = −1 − t ´es az x = 1 − t, y = t, z = −1 + t egyenlet˝ u egyenesekre. Megold´as˝ u 13. Hat´arozzuk meg az x − y + 4z = 0 ´es az x + y + 4z = 0 s´ıkok metsz´esvonal´at. Megold´as 14. Egy s´ıkon vannak-e az (1, 10, 100), (100, 1, 10), (10, 100, 1) ´es a (37, 37, 37) pontok? Megold´as 15. Egy s´ıkban vannak-e az x = 1 + 2t, y = 1 − 3t, z = 1 + 4t egyenes valamint a P := (1, 2, 3) ´es a Q := (5, −4, 11) pontok? Megold´as 16. Metszik-e egym´ast az x = 1 + 3t, y = 2 + 2t, z = 3 + t ´es az x = 3 + t, y = 2 + 2t, z = 1 + 3t egyenesek? Ha igen, mi a metsz´espont? Ha nem, mi´ert nem? Megold´as
29
Megold´ asok 1. Az adott egyenes ir´anyvektora az egyenlet´eb˝ol kiolvashat´o: e = (0, −1, 1), ahonnan a keresett egyenes egyenlete: x = 2, y = 3 − t, z = −1 + t. 2. Az egyenes ir´anyvektora p´arhuzamos kell, hogy legyen a s´ık norm´alvektor´aval, azaz az e := (1, 1, −5) v´alaszt´as megfelel. Innen az egyenes egyenlete: x = 1 + t, y = t, z = −1 − 5t. A d¨of´espont az egyenesnek olyan (egyel˝ore ismeretlen t param´eternek megfelel˝o) pontja, mely a s´ık egyenlet´et is kiel´eg´ıti, azaz, melyre (1 + t) + t − 5(1 − 5t) = 50 teljes¨ ul. Innen t sz´am´ıthat´o: t-re t = 2 ad´odik. K¨ovetkez´esk´epp a d¨of´espont koordin´at´ai: (1 + 2, 2, 1 − 5 · 2) = (3, 2, −9). 3. Az egyenes ´es a s´ık p´arhuzamoss´aga azzal egyen´ert´ek˝ u, hogy az egyenes ir´anyvektora ´es a s´ık norm´alvektora mer˝olegesek. Jelen esetben e = (4, −2, 7) ´es n = (3, −1, −2). Mivel pedig he, ni = 0, az´ert e ⊥ n, teh´at az egyenes p´arhuzamos a s´ıkkal. 4. A vet¨ uleti pont egyezik az (11,11,11) pontra illeszked˝o, a s´ık norm´alvektor´aval p´arhuzamos egyenes ´es a s´ık d¨of´espontj´aval. A s´ık norm´alvektora (1,1,1), ´ıgy az egyenes egyenlete: x = 11 + t, y = 11 + t, z = 11 + t. A d¨of´espont koordin´at´ai kiel´eg´ıtik a s´ık egyenlet´et, azaz (11 + t) + (11 + t) + (11 + t) = 1, innen t = − 32 . K¨ovetkez´esk´epp a d¨of´espont koordin´at´ai: (11 − 32 , 11 − 32 , 11 − 32 ) = ( 13 , 13 , 13 ). 3 3 3 3 5. K¨onnyen l´athat´o, hogy a t · A1 + (1 − t) · A2 pontok akkor ´es csak akkor vannak rajta az A1 A2 szakaszon, ha 0 ≤ t ≤ 1. M´assz´oval, a t1 · A1 + t2 · A2 pontok akkor ´es csak akkor vannak rajta az A1 A2 szakaszon, ha t1 , t2 ≥ 0 ´es t1 + t2 = 1. Innen k¨onnyen l´athat´o, hogy a t1 · A1 + t2 · A2 + t3 A3 pontok akkor ´es csak akkor esnek az A1 A2 A3 h´aromsz¨ogbe, ha t1 , t2 , t3 ≥ 0 ´es t1 + t2 + t3 = 1. Ezen ´eszrev´etel ut´an az algoritmus a k¨ovetkez˝o lehet: megk´ıs´erelj¨ uk el˝o´all´ıtani az A pontot ill annak x, y koordin´at´ait a k¨ovetkez˝o alakban: t1 x1 + t2 x2 + t3 x3 = x t1 y1 + t2 y2 + t3 y3 = y t1 + t2 + t3 = 1 azaz megoldjuk a fenti 3-ismeretlenes egyenletrendszert az ismeretlen t1 , t2 , t3 egy¨ utthat´okra. (Megold´as mindig van, mert mivel A1 , A2 , A3 nem esnek egy egyenesbe, az´ert az (A2 − A1 ) ´es az (A3 − A1 ) vektorok line´arisan f¨ uggetlenek, ´ıgy b´azist alkotnak R2 -ben, teh´at minden vektor, ´ıgy (x, y) is el˝o´all ezek line´aris kombin´aci´ojak´ent: x = α(x2 − x1 ) + β(x3 − x1 ), y = α(y2 − y1 ) + β(y3 − y1 ), ahonnan t1 = −α − β, t2 = α, t3 = β.) Ha az ´ıgy kapott t1 , t2 , t3 egy¨ utthat´ok mindegyike pozit´ıv, akkor az A pont a h´aromsz¨og belsej´eben van, egy´ebk´ent nem. Megjegyz´es: A fenti t1 , t2 , t3 sz´amokat az A pont baricentrikus koordin´ at´ ainak nevezz¨ uk. Az algoritmus ´ertelemszer˝ uen ´altal´anos´ıthat´o tetsz˝oleges, de konvex soksz¨ogekre. A feladatban megadott probl´ema egy´ebk´ent gyakran el˝ofordul pl. a sz´am´ıt´og´epes grafik´aban. 6. Az eredm´eny (sz´amol´as n´elk¨ ul) a z´erusvektor, mivel (a × b) × (b × a) = −(a × b) × (a × b) = 0. 30
7. Mivel a ´es b nem p´arhuzamosak, ´ıgy egy k´etdimenzi´os alteret (s´ıkot) gener´alnak: b × a mer˝oleges erre a s´ıkra, b × (b × a) pedig mind a-ra, mind b × a-ra mer˝oleges. A h´arom vektor teh´at p´aronk´ent ortogon´alis, egyik sem z´erusvektor, ´ıgy line´arisan f¨ uggetlenek. Mivel pedig R3 h´aromdimenzi´os, az´ert e h´arom vektor b´azist alkot R3 -ban. 8. A metsz´esvonal mindk´et s´ık norm´alvektor´ara mer˝oleges, ´ıgy az ir´anyvektornak az e := (1, 2, 3) × (3, 2, 1) = (−4, 8, −4) v´alaszt´as megfelel. Ez pedig mer˝oleges az (1, 1, 1) vektorra, mert h(−4, 8, −4), (1, 1, 1)i = 0. 9. Az egyenes mer˝oleges mindk´et s´ık norm´alvektor´ara, ´ıgy az ir´anyvektornak az e := (1, −1, 2) × (1, 1, −2) = (0, 4, 2) v´alaszt´as megfelel. A keresett egyenes az orig´ora illeszkedik, ´ıgy egyenlete: x = 0, y = 4t, z = 2t. Ugyanennek az egyenesnek egy m´asik egyenlete: x = 0, y = 2t, z = t. 10. Az A2 − A1 = (−1, 8, −7) ´es az A3 − A1 = (7, 1, −8) vektorok a s´ıkkal p´arhuzamosak: a s´ık norm´alvektora teh´at kett˝oj¨ uk vektori´alis szorzat´anak vehet˝o: (−1, 8, −7) × (7, 1, −8) = (−57, −57, −57). Ehelyett c´elszer˝ ubb a vele p´arhuzamos n := (1, 1, 1) vektort venni. A s´ık illeszkedik pl. A1 -re, ´ıgy egyenlete (x + 1) + (y − 8) + (z + 7) = 0, azaz x + y + z = 0. Innen l´athat´o, hogy a s´ık illeszkedik az orig´ora is, ´ıgy alt´er R3 -ban. 11. A s´ık tartalmazza az orig´ot ´es pl. a (0, 1, 2) pontot (az egyenes t = 0 param´eter˝ u pontj´at), ´ıgy p´arhuzamos a (0, 1, 2) vektorral, tov´abb´a p´arhuzamos az egyenes (1, 2, 3) ir´anyvektor´aval is. Norm´alvektora teh´at e k´et vektor vektori´alis szorzat´anak vehet˝o: n := (0, 1, 2) × (1, 2, 3) = (−1, 2, −1). A s´ık illeszkedik az orig´ora is, ´ıgy egyenlete: −x + 2y − z = 0. 12. A s´ık norm´alvektora mindk´et egyenes ir´anyvektor´ara mer˝oleges, ´ıgy e kett˝o vektori´alis szorzat´anak vehet˝o: (1, 1, −1) × (−1, 1, 1) = (2, 0, 2). Egyszer˝ ubb ennek 21 -szeres´et v´alasztani: n := (1, 0, 1). A s´ık illeszkedik az (1, 1, 1) pontra is, ´ıgy egyenlete: (x − 1) + (z − 1) = 0, azaz x + z = 2. 13. A metsz´esvonal ir´anyvektora mindk´et s´ık norm´alvektor´ara mer˝oleges, ´ıgy kett˝oj¨ uk vektori´alis szorzat´anak vehet˝o: (1, −1, 4) × (1, 1, 4) = (−8, 0, 2). Egyszer˝ ubb ennek 21 -szeres´et v´alasztani: e := (−4, 0, 1). Mivel mindk´et s´ık illeszkedik az orig´ora, az´ert a metsz´esvonal is. ´Igy a metsz´esvonal egyenlete: x = −4t, y = 0, z = −t. 14. A feladat g´epies megold´asa: a (99, −9, −90) ´es a (9, 90, −99) k¨ ul¨onbs´egvektorok p´arhuzamosak az els˝o 3 pont ´altal meghat´arozott s´ıkkal, ´ıgy annak norm´alvektora e k´et vektor vektori´alis szorzat´anak vehet˝o: (99, −9, −90) × (9, 90, −99) = 9 · 9 · (111, 111, 111). Egyszer˝ ubb 1 ennek 81·111 -szeres´et v´alasztani: n := (1, 1, 1). A s´ık illeszkedik pl. az (1, 10, 100) pontra ´ıgy egyenlete (x − 1) + (y − 100) + (z − 100) = 0, azaz x + y + z = 111. Ezt pedig a negyedik pont koordin´at´ai kiel´eg´ıtik, teh´at a n´egy pont egy s´ıkon van. 31
J´oval gyorsabban c´elhoz ´er¨ unk, ha ´eszrevessz¨ uk, hogy a 4. pont ´epp az els˝o h´arom pont ´altal meghat´arozott h´aromsz¨og s´ ulypontja, ´ıgy sz¨ uks´egk´epp vel¨ uk egy s´ıkon van. 15. Az egyenesre illeszkedik pl. az A := (1, 1, 1) pont is (t = 0 mellett). ´Igy az egyenes, az A ´es a P pont olyan s´ıkra illeszkednek, melynek norm´alvektora mer˝oleges az egyenes (2, −3, 4) ir´anyvektor´ara ´es a P − ul¨onbs´egvektorra is, ´ıgy kett˝oj¨ uk vektori´alis A = (0, 1, 2) k¨ 1 szorzat´anak vehet˝o: (2, −3, 4) × (0, 1, 2) = (−10, −4, 2). C´elszer˝ u ennek − 2 -´et venni: n := (5, 2, −1). A s´ık illeszkedik pl. az (1, 1, 1) pontra is, ´ıgy egyenlete: 5(x − 1) + 2(y − 1) − (z − 1) = 0, azaz 5x + 2y − z = 6. Ezt pedig a Q pont koordin´at´ai kiel´eg´ıtik, teh´at az egyenes ´es a k´et pont egy s´ıkon van. 16. A mindk´et egyenessel p´arhuzamos s´ık norm´alvektora az ir´anyvektorok vektori´alis szorzat´anak vehet˝o: (3, 2, 1) × (1, 2, 3) = (4, −8, 4). C´elszer˝ u ennek 14 -´et venni: n := (1, −2, 1). Ha a s´ıkra illeszkedik pl. az els˝o egyenes (1, 2, 3) pontja is, akkor a s´ık egyenlete: (x − 1) − 2(y − 2) + (z − 3) = 0, azaz x − 2y + z = 0. Ezt pedig mindk´et egyenes minden pontja kiel´eg´ıti, teh´at a k´et egyenes val´oban egy s´ıkon van, ´es mivel ir´anyvektoraik nem p´arhuzamosak, az´ert metsz˝ok. A metsz´espont koordin´at´ai kiel´eg´ıtik mindk´et egyenes egyenlet´et: 1 + 3t1 = 3 + t2 2 + 2t1 = 2 + 2t2 3 + t1 = 1 + 3t2 Az egyenletrendszer megoldhat´o, megold´asa k¨onnyen l´athat´oan t1 = t2 = 1. Innen a metsz´espont koordin´at´ai: (4, 4, 4). Megjegyz´es: Voltak´eppen felesleges volt a k¨oz¨os s´ık egyenlet´et meghat´arozni. A metsz´espont l´etez´ese ui. egy´ uttal azt jelenti, hogy a k´et egyenes egy s´ıkon van.
32
3
Line´ aris lek´ epez´ esek, m´ atrixok
Ebben a fejezetben vektorterek k¨oz¨ott hat´o speci´alis lek´epez´eseket, u ´n. line´ aris lek´epez´eseket tanulm´anyozunk. Bevezetj¨ uk a t´eglalap alak´ u sz´amt´abl´azatokat (m´atrixokat), ´es m˝ uveleteket ´ertelmez¨ unk k¨oz¨ott¨ uk. Kider¨ ul, hogy minden m´atrix egy´ uttal egy-egy speci´alis line´aris lek´epez´esk´ent is felfoghat´o. Az elm´elet kit˝ un˝oen alkalmas a sokismeretlenes line´aris egyenletrendszerek vizsg´alat´ara ´es megold´as´ara, de term´eszetes m´odon felbukkan t¨obbv´altoz´os anal´ızisben is (ezt majd a k¨ovetkez˝o fejezetben l´atjuk), ´es egy sereg m´as probl´emak¨or vizsg´alat´aban (pl. nemline´aris egyenletrendszerek k¨ozel´ıt˝o megold´asa; egyenl˝otlens´eg-rendszerek; differenci´alegyenlet-rendszerek stb).
3.1
Line´ aris lek´ epez´ esek
Legyenek X, Y vektorterek. Defin´ıci´ o: Az A : X → Y f¨ uggv´enyt line´ aris lek´epez´esnek nevezz¨ uk, ha a dom A ´ertelmez´esi tartom´any alt´er X-ben; A(x + y) = A(x) + A(y) minden x, y ∈ dom A eset´en, ´es: A(λx) = λ · A(x) minden x, y ∈ dom A, λ ∈ R eset´en. A tov´abbiakban, ha A line´aris lek´epez´es, akkor A(x) helyett egyszer˝ uen csak Ax-et ´ırunk, amennyiben ez nem okoz f´elre´ert´est. A defin´ıci´o azonnali k¨ovetkezm´enyek´ent: ´ ıt´ 1.All´ as: Ha A : X → Y line´aris lek´epez´es, akkor (a) tetsz˝oleges x = λ1 x1 + λ2 x2 + ... + λn xn line´aris kombin´aci´o eset´en Ax = λ1 Ax1 + λ2 Ax2 + ... + λn Axn ; (b) az im A k´ept´er is alt´er (Y -ban). Az ´all´ıt´as (a) pontja miatt nyilv´an mindig teljes¨ ul, hogy A0 = 0. (Itt 0 alatt a baloldalon ´ertelemszer˝ uen az X t´er z´erusvektora, m´ıg a jobboldalon az Y t´er z´erusvektora ´ertend˝o.) Az al´abbiakban p´eld´akat mutatunk line´aris lek´epez´esekre. Ezekb˝ol vil´agosan l´atszik, hogy – bizonyos ´ertelemben – a line´aris lek´epez´esek a ”lehet˝o legegyszer˝ ubb” f¨ uggv´enyek. 1. Legyen A : R → R, Ax := a · x (ahol a ∈ R adott konstans). Akkor A line´aris lek´epez´es. K¨onnyen l´athat´o tov´abb´a, hogy minden R → R line´aris lek´epez´es ilyen alak´ u (a := A(1) v´alaszt´assal). ´Igy pl. az A(x) := a · x + b el˝o´ır´assal ´ertelmezett lek´epez´es b 6= 0 eset´en m´ar nem line´aris lek´epez´es. 2. Tekints¨ uk az [a, b] intervallumon folytonos f¨ uggv´enyek C[a, b] halmaz´at, ´es az ugyanitt folytonosan differenci´alhat´o f¨ uggv´enyek C 1 [a, b]
33
halmaz´at. M´ar l´attuk, hogy ezek vektorterek a szok´asos f¨ uggv´enym˝ uveletekre n´ezve. Legyen D : C 1 [a, b] → C[a, b] a differenci´al´as oper´atora, azaz Df := f 0 minden f ∈ C 1 [a, b]-re. Akkor D line´aris lek´epez´es. 3. Legyen I : C[a, b] → R, If := ab f (x)dx. Akkor I line´aris lek´epez´es. Elnevez´es: A sz´am´ert´ek˝ u line´aris lek´epez´eseket – mint a fenti I lek´epez´est is – gyakran line´ aris funkcion´ aloknak nevezz¨ uk. R
4 Legyen δ : C(R) → R, δf := f (0), azaz rendelj¨ uk hozz´a f -hez a 0-beli helyettes´ıt´esi ´ert´ek´et. Akkor δ line´aris lek´epez´es. (Diracf´ele δ-funkcion´al). 5. Az R2 s´ık minden pontj´ahoz rendelj¨ uk hozz´a az orig´o k¨or¨ uli, adott t sz¨og˝ u elforgat´as u ´tj´an kapott pontot. Ezzel egy R2 → R2 line´aris lek´epez´est defini´altunk. Ugyanakkor az orig´ot´ol k¨ ul¨onb¨oz˝o pont k¨or¨ uli forgat´as m´ar nem eredm´enyez line´aris lek´epez´est. 6. Az R3 t´er minden pontj´ahoz rendelj¨ uk hozz´a a pontnak egy adott, az orig´ora illeszked˝o s´ıkra vett ortogon´alis vet¨ ulet´et. Ezzel egy R3 → R3 line´aris lek´epez´est defini´altunk. Ha viszont a s´ık nem illeszkedik az orig´ora, akkor az ´ıgy defini´alt lek´epez´es m´ar nem line´aris. 7. Legyen a ∈ R3 adott vektor ´es minden x ∈ R3 eset´en jel¨olje Ax := x × a. Az ´ıgy defini´alt A : R3 → R3 lek´epez´es line´aris lek´epez´es.
3.2
M´ atrixok, m˝ uveletek m´ atrixokkal
Defin´ıci´ o: Az n sorb´ol ´es m oszlopb´ol ´all´o t´eglalap alak´ u
a11 a12 a21 a22 ... ... an1 an2
... a1m ... a2m ... ... ... anm
sz´amt´abl´azatot n × m -es m´atrixnak nevezz¨ uk. A m´atrix elemeire k´et indexszel hivatkozunk, az els˝ot sor-, a m´asodikat oszlopindexnek nevezz¨ uk. Elnevez´esek: Ha n = m, akkor a m´atrixot n´egyzetes m´ atrixnak, ha n = 1, akkor sorvektornak, ha m = 1, akkor oszlopvektornak nevezz¨ uk. Az A m´atrix z´erusm´atrix, ha minden eleme z´erus (jele 0). n×n-es m´atrixok eset´en az n sz´amot a m´atrix rendj´enek nevezz¨ uk. Az A n´egyzetes m´atrix diagon´alm´atrix, ha csak a bal fels˝o sarokt´ol a jobb als´o sarokig tart´o, u ´n. f˝odiagon´alisban l´ev˝o elemek k¨ ul¨onb¨ozhetnek 0-t´ol, azaz,
34
ha a k¨ovetkez˝o alak´ u:
a11 0 0 a22 ... ... 0 0
... 0 ... 0 ... ... ... ann
Az n × n-es
1 0 ... 0
0 1 ... 0
... ... ... ...
0 0 ... 1
diagon´alm´atrixot n × n-es egys´egm´atrixnak nevezz¨ uk ´es I-vel fogjuk jel¨olni. Jel¨ ol´esek: Az n×m -es m´atrixok halmaz´at Mn×m -mel jel¨olj¨ uk. Egy A ∈ Mn×m m´atrixot gyakran az elemekre utal´o A = [akj ] szimb´olummal jel¨ol¨ unk (k = 1, 2, ..., n, j = 1, 2, ..., m). Defin´ıci´ o: Legyenek A = [akj ], B = [bkj ] ∈ Mn×m tetsz˝oleges m´atrixok, λ ∈ R tetsz˝oleges sz´am. Az A ´es B m´atrixok ¨osszeg´en az
A + B :=
a11 + b11 a12 + b12 a21 + b21 a22 + b22 ... ... an1 + bn1 an2 + bn2
... a1m + b1m ... a2m + b2m ... ... ... anm + bnm
∈ Mn×m
m´atrixot, az A m´atrix λ-szoros´an a
λ · A :=
λa11 λa12 λa21 λa22 ... ... λan1 λan2
... λa1m ... λa2m ... ... ... λanm
∈ Mn×m
m´atrixot ´ertj¨ uk. A defin´ıci´o azonnali k¨ovekezm´enyek´ent: ´ ıt´ 2. All´ as: Az n × m-es m´atrixok Mn×m halmaza az ¨osszead´asra ´es a skal´arral val´o szorz´asra n´ezve vektorteret alkot. Ennek nulleleme a z´erusm´atrix, dimenzi´oja nm. Egy b´azis´at (a standard b´azist) mindazon n × m -es m´atrixok alkotj´ak, melyek elemei k¨ozt egyetlen 1-es van, a t¨obbi elem¨ uk z´erus. 35
A most k¨ovetkez˝o defin´ıci´oban a szorz´ast az eddigi komponensenk´enti m˝ uveletekt˝ol teljesen elt´er˝oen defini´aljuk. Ennek c´elja, hogy a m´atrixszorz´as a f¨ uggv´enykompoz´ıci´oval legyen ¨osszhangban: ezt a t´emak¨ort majd a k¨ovetkez˝o szakaszban r´eszletezz¨ uk. Defin´ıci´ o: Legyenek A = [akj ] ∈ Mn×m , B = [bkj ] ∈ Mm×r tetsz˝oleges m´atrixok, λ ∈ R. Az A ´es B m´atrixok A · B szorzat´an azt a C = [ckj ] ∈ Mn×r m´atrixot ´ertj¨ uk, melynek kj-edik elem´et az al´abbi ¨osszeg defini´alja: ckj :=
m X
aki bij ,
i=1
azaz ckj az A m´atrix k-adik sor´anak ´es a B m´atrix j-edik oszlop´anak skal´aris szorzata. L´atjuk teh´at, hogy nem minden m´atrixp´ar eset´eben ´ertelmes a fenti szorz´as: ehhez az kell, hogy az els˝o m´atrix oszlopainak sz´ama megegyezz´ek a m´asodik m´atrix sorainak sz´am´aval. Ha nem okoz f´elre´ert´est, akkor a m´atrixszorz´ast jel¨ol˝o szorz´opontot a k´es˝obbiekben elhagyjuk.
P´elda: Legyenek !
A :=
1 0 0 0
!
AB :=
0 1 0 0
Akkor:
, ´es B :=
, ´es BA :=
0 1 0 0
!
0 0 0 0
. !
.
Ez azt is mutatja, hogy a m´atrixszorz´as ´altal´aban – a val´os sz´amok k¨ozti szorz´ast´ol elt´er˝oen – nem kommutat´ıv (m´eg akkor sem, ha mindk´et sorrendben vett szorzat ´ertelmes). Ha k´et n´egyzetes m´atrixra m´egis teljes¨ ul, hogy AB = BA, akkor azt mondjuk, hogy A ´es B felcser´elhet˝ ok. A p´elda tov´abbi tanuls´aga, hogy a szorzatm´atrix akkor is lehet z´erus, ha egyik t´enyez˝oje sem az. Ett˝ol eltekintve, a m´atrixszorz´as teljes´ıti a szok´asos m˝ uveleti azonoss´agokat: ´ ıt´ 3.All´ as: A m´atrixszorz´as asszociat´ıv, azaz, ha A ∈ Mn×m , B ∈ Mm×p , C ∈ Mp×q tetsz˝oleges m´atrixok, akkor (AB)C = A(BC). Tov´abb´a a m´atrixszorz´as az ¨osszead´as felett disztribut´ıv: ha A, B ∈ Mn×m , C ∈ Mm×p , akkor (A + B)C = AC + BC , ´es ha A, B ∈ Mn×m , C ∈ Mp×n , akkor C(A + B) = CA + CB. P P P Bizony´ıt´as: Az (AB)C m´atrix kj-edik eleme: ((AB)C)kj = pi=1 (AB)ki ci j = pi=1 m ıg az A(BC) m´atrix kj-edik eleme: r=1 akr bri cij , m´ Pm Pm Pp (A(BC))kj = u=1 aku (BC)uj ci j = u=1 v=1 aku buv cvj . A disztributivit´as igazol´as´at – gyakorlatk´eppen – az Olvas´ora hagyjuk.
36
A szorz´as nem-kommutat´ıv volt´anak tov´abbi k¨ovetkezm´enye, hogy egy sor egyszer˝ u azonoss´ag, mely sz´amokra igaz, ´erv´eny´et veszti m´atrixok eset´eben. ´Igy pl. ha A, B ∈ Mn×n , akkor ´altal´aban (A + B)2 6= A2 + 2AB + B 2 : egyenl˝os´eg csak akkor ´all fenn, ha A ´es B felcser´elhet˝ok. Egy´ebk´ent pedig csak annyi igaz, hogy (A + B)2 = A2 + AB + BA + B 2 . A k¨ovetkez˝o ´all´ıt´as, mely a m´atrixszorz´as defin´ıci´oj´ab´ol nyomban ad´odik, a z´erus- ´es az egys´egm´atrix k¨ ul¨onleges szerep´ere mutat r´a: a n´egyzetes m´atrixok k¨oz¨ott ezek u ´gy viselkednek, mint a sz´amok k¨ozt a 0 ´es az 1. Pontosabban: ´ ıt´ 4.All´ as: Az n×n-es z´erusm´atrix (0), ´es az n×n-es egys´egm´atrix (I) tetsz˝oleges A ∈ Mn×n m´atrixszal felcser´elhet˝o, ´espedig A0 = 0A = 0, ´es AI = IA = A. Jegyezz¨ uk m´eg meg az al´abbi speci´alis m´atrixszorz´asokat: (a) Azonos m´eret˝ u n´egyzetes m´atrixok szorzata ugyanolyan m´eret˝ u n´egyzetes m´atrix. (b) n × n-es m´atrix ´es n × 1-es oszlopvektor szorzata n × 1-es oszlopvektor. (c) 1 × n-es sorvektor szorzata n × 1-es oszlopvektorral egy 1 × 1-es m´atrixot, azaz egyetlen sz´amot eredm´enyez (skal´aris szorzat). (d) n × 1-es oszlopvektor szorzata 1 × n-es sorvektorral egy n × n-es m´atrixot ad (diadikus szorzat).
3.3
M´ atrixszorz´ as ´ es line´ aris lek´ epez´ esek
Nyilv´anval´o, hogy a rendezett sz´am-n-esek ´es az n × 1-es m´atrixok (oszlopvektorok) k¨oz¨ott k¨olcs¨on¨osen egy´ertelm˝ u megfeleltet´es l´etes´ıthet˝o. Enn´elfogva a tov´abbiakban Rn elemeit azonos´ıtjuk Mn×1 elemeivel: egy-egy rendezett sz´am-n-est ak´ar Rn , ak´ar Mn×1 elem´enek is tekinthet¨ unk. Ilyen ´ertelemben, ha adott egy A ∈ Mn×m m´atrix, ´es x ∈ Rm tetsz˝oleges, akkor az x → Ax hozz´arendel´es egy Rm → Rn lek´epez´est defini´al. A m´atrixszorz´as el˝oz˝oekben r´eszletezett tulajdons´agai miatt ez a lek´epez´es line´ aris. Azaz minden n × m-es m´atrix felfoghat´o egy m n R → R line´aris lek´epez´esnek. Azt mondjuk, hogy a fenti lek´epez´es m´atrixa A. Megford´ıtva, minden Rm → Rn line´aris lek´epez´eshez tal´alhat´o egy n × m-es m´atrix, mely a fenti ´ertelemben el˝o´all´ıtja ezt a line´aris lek´epez´est. Val´oban, legyen A : Rm → Rn egy line´aris lek´epez´es. Jel¨olje e1 , e2 , ..., em a standard b´azist Rm -ben, ´es tekints¨ uk azt az n × m-es m´atrixot, melynek oszlopai az Ae1 , Ae2 , ..., Aem oszlopvektorok: ekkor ez a m´atrix ´epp az A line´aris lek´epez´es m´atrixa. Ily m´odon k¨olcs¨on¨osen egy´ertelm˝ u megfeleltet´est l´etes´ıtett¨ unk Mn×m elemei ´es az Rm → Rn line´aris lek´epez´esek k¨oz¨ott. Ugyanazt az objektumot m´atrixnak avagy line´aris lek´epez´esnek fogjuk tekinteni a tov´abbiakban, aszerint, hogy melyik k´enyelmesebb. Speci´ alis eset: Tekints¨ uk az I ∈ Mn×n egys´egm´atrixot. Tetsz˝oleges x ∈ Rn eset´en k¨onnyen ellen˝orizhet˝oen Ix = x, azaz az egys´egm´atrix ´epp az Rn t´er identikus lek´epez´es´enek m´atrixa. Legyenek A ∈ Mn×m , B ∈ Mm×r tetsz˝oleges m´atrixok, x ∈ Rr tetsz˝oleges (oszlop)vektor. A m´atrixszorz´as asszociativit´asa miatt A(Bx) = (AB)x 37
Ugyanakkor, A-t ´es B-t lek´epez´esk´ent fogva fel, A(Bx) az A ◦ B ¨osszetett f¨ uggv´eny az x vektorra alkalmazva. K¨ovetkez´esk´epp az A ◦ B o¨sszetett f¨ uggv´eny m´atrixa ´epp az AB szorzatm´atrix. Most n´eh´any p´eld´at mutatunk line´aris lek´epez´esek m´atrix´anak meghat´aroz´as´ara. 1. Az R2 s´ık minden pontj´ahoz rendelj¨ uk hozz´a az orig´o k¨or¨ uli, adott t sz¨og˝ u elforgat´as u ´tj´an kapott pontot. M´ar l´attuk, hogy ezzel egy R2 → R2 line´aris lek´epez´est defini´alunk. Hat´arozzuk meg ennek m´atrix´at. Megold´ as: Legyen (x, y) ∈ R2 tetsz˝oleges, x := r cos θ, y := r sin θ, ahol r az (x, y) pont helyvektor´arak hossza, θ pedig az ir´anysz¨oge. Akkor az elforgatott pont koordin´at´ai nyilv´an: x0 = r cos(θ + t) = r(cos θ cos t − sin θ sin t) = x cos t − y sin t y 0 = r sin(θ + t) = r(sin θ cos t + cos θ sin t) = x sin t + y cos t ahonnan teh´at
x0 y0
!
cos t − sin t sin t cos t
=
!
x y
!
K¨ovetkez´esk´epp az orig´o k¨or¨ uli t sz¨og˝ u elforgat´as m´atrixa az al´abbi 2 × 2-es m´atrix (´ un. forgat´ om´ atrix): cos t − sin t sin t cos t
!
2. Az R3 t´er minden pontj´ahoz rendelj¨ uk hozz´a a pontnak egy adott, az orig´ora illeszked˝o s´ıkra vett ortogon´alis vet¨ ulet´et. M´ar tudjuk, hogy ezzel egy R3 → R3 line´aris lek´epez´est defini´altunk. Hat´arozzuk meg ennek m´atrix´at. Megold´ as: Jel¨olje n := (n1 , n2 , n3 ) ∈ R3 a sz´obanforg´o s´ık norm´alvektor´at, egyszer˝ us´eg kedv´e´ert tegy¨ uk fel, hogy ez egys´egnyi hossz´ u, 3 azaz ||n|| = 1. Akkor egy tetsz˝oleges x := (x1 , x2 , x3 ) ∈ R pont n ir´any´ u ortogon´alis vet¨ ulete: P x := hx, ni · n, azaz: n1 n21 n1 n2 n1 n3 x1 2 n n n n n n P x = (x1 n1 + x2 n2 + x3 n3 ) · 2 = 1 2 2 3 x2 1 n3 n1 n3 n2 n3 n23 x3
Mivel pedig a s´ıkra vett ortogon´alis vet¨ ulet helyvektora x − P x, az´ert ennek m´atrixa I − P , ahol I a 3 × 3-as egys´egm´atrix, P pedig a fenti egyenl˝os´egb˝ol ad´od´o n21 n1 n2 n1 n3 n22 n2 n3 n1 n2 n1 n3 n2 n3 n23 38
m´atrix (ami ´epp a norm´alvektornak ¨onmag´aval vett diadikus szorzata). 3. Legyen a ∈ R3 adott vektor ´es minden x ∈ R3 -hez rendelj¨ uk hozz´a az x × a vektort. Ezzel line´aris lek´epez´est defini´altunk. Hat´arozzuk meg ennek m´atrix´at. Megold´ as: A vektori´alis szorzat defin´ıci´oj´ab´ol ad´od´oan:
x2 a3 − x3 a2 0 a3 −a2 x1 a1 x2 x × a = x3 a1 − x1 a3 = −a3 0 x1 a2 − x2 a1 a2 −a1 0 x3 teh´at a vektori´alis szorz´as m´atrixa:
3.4
0 a3 −a2 0 a1 −a3 a2 −a1 0
M´ atrixok inverze ´ es determin´ ansa
Defin´ıci´ o: Az A ∈ Mn×n n´egyzetes m´atrix invez´enek azt az A−1 ∈ Mn×n m´atrixot nevezz¨ uk, melyre A−1 A = I teljes¨ ul. Ha ilyen A−1 m´atrix l´etezik, akkor A-t regul´arisnak, ellenkez˝o esetben szingul´ arisnak nevezz¨ uk. Nem minden n´egyzetes m´atrixnak van inverze. ´Igy pl. a z´erusm´atrixnak nincs, ui. b´armilyen m´atrixszal szorozva balr´ol a z´erusm´atrixot, a szorzat mindig a z´erusm´atrix, ´es sohasem az egys´egm´atrix. Ugyanakkor pl. az egys´egm´atrix regul´aris, inverze ¨onmag´aval egyezik. Az inverz a reciprok fogalm´anak er˝os ´altal´anos´ıt´asa. Ugyanakkor, ha az A ∈ Mn×n m´atrixot Rn → Rn line´aris lek´epez´esnek tekintj¨ uk, akkor A−1 mint lek´epez´es, megegyezik A inverz´evel (ez indokolja az elnevez´est is). Val´oban, A−1 A = I k¨ovetkezt´eben minden x ∈ Rn eset´en A−1 (Ax) = Ix = x. K¨ovetkez´esk´epp egy n´egyzetes A m´atrix pontosan akkor regul´aris, ha mint lek´epez´es egy-egy-´ertelm˝ u, ´es ekkor az −1 inverz egy´ertelm˝ uen meghat´arozott (b´ar ez a defin´ıci´ob´ol nem l´atszik azonnal). Tov´abb´a, ha A regul´aris, akkor A is az, ´es (A−1 )−1 = A. Ez ut´obbib´ol pedig m´eg az is nyomban ad´odik, hogy ha A regul´aris m´atrix, akkor az A−1 inverz m´atrixszal A-t nemcsak balr´ol szorozva kapunk egys´egm´atrixot, hanem ugyanez ´all a jobbr´ol val´o szorz´asra is: AA−1 = I. R¨oviden, egy regul´aris m´atrix mindig felcser´elhet˝o az inverz´evel. Szorzat inverze kisz´am´ıthat´o a t´enyez˝ok inverzeinek seg´ıts´eg´evel (a reciprok sz´am´ıt´as´ahoz hasonl´oan), de mivel a m´atrixszorz´as ´altal´aban nem kommutat´ıv, az´ert a t´enyez˝ok sorrendje nem k¨oz¨omb¨os: ´ ıt´ 5. All´ as: Ha A, B ∈ Mn×n mindketten regul´arisak, akkor AB is az, ´es (AB)−1 = B −1 A−1 Bizony´ıt´as: Val´oban, az asszociativit´ast felhaszn´alva: B −1 A−1 AB = B −1 (A−1 A)B = B −1 IB = B −1 B = I. Megjegyezz¨ uk, hogy ugyanakkor (A + B)−1 sohasem egyenl˝o A−1 + B −1 -gyel! 39
A regularit´as ´es az inverz fogalm´anak jelent˝os´eg´ere az al´abbi fontos p´elda mutat r´a. Legyen A = [akj ] ∈ Mn×n adott m´atrix, b ∈ Rn adott oszlopvektor. Akkor az Ax = b m´atrixegyenlet (x ∈ Rn ) a m´atrixszorz´as defin´ıci´oja miatt ekvivalens az al´abbi n-ismeretlenes line´aris egyenletrendszerrel: a11 x1 + a12 x2 + ... + a1n xn = b1 a21 x1 + a22 x2 + ... + a2n xn = b2 .............................. an1 x1 + an2 x2 + ... + ann xn = bn Ha a rendszer A m´atrixa regul´aris, ´es ismerj¨ uk az A−1 inverz m´atrixot, akkor A−1 -gyel balr´ol szorozva a fenti egyenlet mindk´et oldal´at, kapjuk, hogy A−1 Ax = A−1 b, azaz x = A−1 b; az egyenletrendszer megold´as´at teh´at explicit formula adja. Sajnos, nagym´eret˝ u egyenletrendszerek eset´eben az inverz m´atrix meghat´aroz´asa semmivel sem k¨onnyebb probl´ema, mint az eredeti egyenletrendszer megold´asa. (Az inverz m´atrix meghat´aroz´as´ara ´altal´anos algoritmust a 3.6.szakaszban adunk.) Mindazon´altal az x = A−1 b explicit megold´oformula hasznos lehet, ha ugyanazt az egyenletrendszert egym´as ut´an t¨obb k¨ ul¨onb¨oz˝o jobboldal mellett kell megoldani. N´eha, bizonyos speci´alis m´atrixoszt´alyok eset´en, az inverz egyszer˝ uen meghat´arozhat´o. Erre mutatunk k´et p´eld´at: 1. Diagon´ alm´atrix inverze: Ha a diagon´alm´atrix diagon´alelemei mind 0-t´ol k¨ ul¨onb¨oznek, akkor a m´atrix regul´aris, ´es
a11 0 0 a22 ... ... 0 0
... 0 ... 0 ... ... ... ann
−1
=
a−1 0 11 0 a−1 22 ... ... 0 0
... 0 ... 0 ... ... ... a−1 nn
−1
Ez a m´atrixszorz´as defin´ıci´oj´anak felhaszn´al´as´aval k¨onnyen ellen˝orizhet˝o. 2. Forgat´ om´atrix inverze: A 2 × 2-es forgat´om´atrixok mindig regul´arisak, ´espedig: cos t − sin t sin t cos t
!−1
=
cos t sin t − sin t cos t
!
azaz egy t sz¨og˝ u forgat´as inverze megegyezik egy (−t) sz¨og˝ u forgat´assal, a szeml´elettel teljes ¨osszhangban. V´eg¨ ul n´eh´any ´all´ıt´ast mondunk ki a regul´aris m´atrixok jellemz´es´ere:
40
´ ıt´ 6. All´ as: Egy A ∈ Mn×n m´atrix pontosan akkor regul´aris, ha (mint lek´epez´es) csak a z´erusvektort viszi a z´erusvektorba, azaz Ax = 0 csak u ´gy lehets´eges, ha x = 0. Bizony´ıt´as: Legyen A regul´aris. Nyilv´an mindig A0 = 0, ha pedig x 6= 0, akkor az egy-egy-´ertelm˝ us´eg miatt Ax 6= 0. Megford´ıtva, tegy¨ uk fel, hogy A csak a z´erusvektort viszi a z´erusvektorba Megmutatjuk, hogy ekkor A egy-egy-´ertelm˝ u, azaz regul´aris. Legyen x1 6= x2 , akkor x1 − x2 6= 0, ´ıgy A(x1 − x2 ) = Ax1 − Ax2 6= 0, azaz Ax1 6= Ax2 , teh´at A val´oban egy-egy-´ertelm˝ u. Az ´all´ıt´as l´enyege, hogy a linearit´as miatt el´eg az egy-egy-´ertelm˝ us´eget egyetlen vektor, nevezetesen a z´erusvektor eset´eben ellen˝orizni. Defin´ıci´ o: Egy A ∈ Mn×n m´atrix ill. line´aris lek´epez´es magter´enek a ker A := {x ∈ Rn : Ax = 0} halmazt nevezz¨ uk, mely A linearit´as´ab´ol ad´od´oan mindig alt´er Rn -ben. Ezzel a jel¨ol´essel az el˝oz˝o ´all´ıt´as r¨oviden u ´gy fogalmazhat´o meg, hogy az A ∈ Mn×n m´atrix pontosan akkor regul´aris, ha ker A = {0}. ´ ıt´ 7. All´ as: Egy A ∈ Mn×n m´atrix pontosan akkor regul´aris, ha (mint lek´epez´es), line´arisan f¨ uggetlen vektorokat line´arisan f¨ uggetlen vektorokba visz. Bizony´ıt´as: Legyen A regul´aris, ´es legyenek x1 , x2 , ..., xm ∈ Rn line´arisan f¨ uggetlenek (m ≤ n). Tekints¨ unk egy tetsz˝oleges λ1 Ax1 + λ2 Ax2 + ... + λm Axm line´aris kombin´aci´ot. Ha ez a z´erusvektor, akkor A(λ1 x1 + λ2 x2 + ... + λm xm ) = 0, ´ıgy az el˝oz˝o ´all´ıt´as ´ertelm´eben ´ az xj vektorok line´aris f¨ sz¨ uks´egk´epp λ1 x1 + λ2 x2 + ... + λm xm = 0. Am uggetlens´ege miatt ez´ert λ1 = λ2 = ... = λm = 0, azaz Ax1 , Ax2 , ..., Axm val´oban line´arisan f¨ uggetlenek. Megford´ıtva, ha A line´arisan f¨ uggetlen vektorokat line´arisan f¨ uggetlen vektorokba visz, akkor semmilyen x 6= 0 vektort nem vihet a z´erusvektorba: ha ui. x el˝o´all x = λ1 e1 + λ2 e2 + ... + λn en (nemtrivi´alis!) line´aris kombin´aci´ok´ent, ahol e1 , e2 , ..., en b´azist alkotnak Rn -ben, akkor Ax el˝o´all az Ae1 , Ae2 , ..., Aen vektorok nemtrivi´alis line´aris kombin´aci´ojak´ent: Ax = λ1 Ae1 + λ2 Ae2 + ... + λn Aen , ´ıgy nem lehet a z´erusvektorral egyenl˝o. Az ´all´ıt´as egyszer˝ u k¨ovetkezm´enye, hogy egy A ∈ Mn×n m´atrix pontosan akkor regul´aris, ha k´epter´enek dimenzi´oja n-nek egyenl˝o, azaz, ha a k´ept´er a teljes Rn -nel egyezik. Val´oban, a k´ept´er dimenzi´oja n-n´el nagyobb nyilv´an nem lehet, ´ıgy ha e1 , e2 , ..., en b´azist alkot Rn -ben, ´es A regul´aris, akkor Ae1 , Ae2 , ..., Aen line´arisan f¨ uggetlen rendszer l´ev´en maga is b´azist alkot Rn -ben, teh´at a k´ept´er n-dimenzi´os. Az Olvas´ora b´ızzuk annak v´egiggondol´as´at, hogy ha A ∈ Mn×n szingul´aris, akkor k´epter´enek dimenzi´oja n-n´el hat´arozottan kisebb. A regularit´as eld¨onthet˝o egy, a fentiekn´el sokkal g´epiesebb (b´ar meglehet˝osen sz´am´ıt´asig´enyes) m´odon is. Ehhez bevezetj¨ uk a m´atrix determin´ans´anak fogalm´at. A defin´ıci´ot rekurz´ıv m´odon fogalmazzuk meg:
41
Defin´ıci´ o: Az egyetlen a ∈ R sz´am alkotta 1 × 1-es m´atrix determin´ansa legyen maga az a sz´am. Ha pedig az (n − 1)-edrend˝ u m´atrixok determin´ans´at m´ar defini´altuk, akkor tetsz˝oleges A := [akj ] ∈ Mn×n m´atrix eset´en defini´aljuk az A m´atrix determin´ans´at a det A := a11 D11 − a12 D12 + a13 D13 − ... ± a1n D1n , formul´aval, ahol D1j jelentse annak az (n − 1)-edrend˝ u m´atrixnak a determin´ans´at, melyet A-b´ol az els˝o sor ´es a j-edik oszlop elhagy´as´aval kaptunk. A determin´ans teh´at mindig egyetlen sz´ am: jegyezz¨ uk meg, hogy ha A := [akj ] ∈ M2×2 egy m´asodrend˝ u m´atrix, akkor det A = a11 a22 − a12 a21 . Bizony´ıt´as n´elk¨ ul megeml´ıtj¨ uk, hogy det (AB) = det (A) · det (B) mindig teljes¨ ul. Ugyanakkor ´altal´aban det (A + B) 6= det (A) + det (B)! P´elda:
1 −2 3 det 0 2 1 = 1 · 0 0 3
−2 1 0 3
!
− (−2) ·
0 1 0 3
!
+
0 2 0 0
!
= 6.
Megjegyz´es: A defin´ıci´o m´ar viszonylag kis n ´ert´ekek mellett is gyakorlati szempontb´ol haszn´alhatatlan. K¨onnyen l´athat´o, hogy a determin´ansnak a defin´ıci´o szerinti kisz´am´ıt´asa n!-n´al is t¨obb m˝ uveletet ig´enyel. ´Igy pl. egy 100-adrend˝ u determin´ans kisz´am´ıt´asa – b´armilyen ma ´es a bel´athat´o j¨ov˝oben haszn´alatos sz´am´ıt´og´epek mellett is! – t¨obb id˝ot venne ig´enybe, mint a Vil´agegyetem jelenleg ismeretes ´eletkora. Szerencs´ere vannak algoritmusok, melyek enn´el l´enyegesen kevesebb m˝ uvelet ´ar´an sz´am´ıtj´ak ki a determin´anst. Ezek r´eszleteivel azonban e jegyzet keretein bel¨ ul nem foglalkozhatunk. A determin´ans sz´amunkra legfontosabb tulajdons´ag´at az al´abbi t´etel mutatja, melyet bizony´ıt´as n´elk¨ ul adunk meg (a 2-rend˝ u eset a feladatok k¨oz¨ott szerepel): 8. T´ etel: Egy A ∈ Mn×n m´atrix pontosan akkor regul´aris, ha det A 6= 0, m´assz´oval, pontosan akkor szingul´aris, ha det A = 0.
3.5
Line´ aris egyenletrendszerek megoldhat´ os´ aga
Ebben a szakaszban a m´atrixok regularit´as´anak ´es az Ax = b egyenlet megoldhat´os´ag´anak kapcsolat´at vizsg´aljuk, ahol A = [akj ] ∈ Mn×n adott m´atrix, b ∈ Rn adott jobboldal.
42
M´ar l´attuk, hogy a fenti t¨om¨or m´atrixegyenlet ekvivalens az al´abbi n-ismeretlenes line´aris egyenletrendszerrel: a11 x1 + a12 x2 + ... + a1n xn = b1 a21 x1 + a22 x2 + ... + a2n xn = b2 .............................. an1 x1 + an2 x2 + ... + ann xn = bn Az egyenletrendszert homog´ennak nevezz¨ uk, ha b = 0, azaz b1 = b2 = ... = bn = 0. Nyilv´anval´o, hogy ekkor x1 = x2 = ... = xn = 0 mindig megold´as: ezt trivi´alis megold´asnak nevezz¨ uk, m´ıg a homog´en egyenlet minden olyan megold´as´at, ahol legal´abb egy xj z´erust´ol k¨ ul¨onb¨ozik, nemtrivi´ alis megold´asnak nevezz¨ uk. A homog´en egyenletek eset´eben a jellemz˝o probl´ema az, hogy l´etezik-e nemtrivi´alis megold´as, m´ıg az inhomog´en egyenlet eset´en az a k´erd´es, hogy van-e egy´altal´an megold´asa, ´es ha igen, akkor h´any. Nyilv´anval´o, hogy a megold´as l´etez´ese (tetsz˝oleges jobboldal mellett) azzal ekvivalens, hogy A k´eptere a teljes Rn t´er. A homog´en egyenlet nemtrivi´alis megold´as´anak l´etez´ese pedig, m´as megfogalmaz´asban, azt jelenti, hogy az A lek´epez´es egy z´erusvektort´ol k¨ ul¨onb¨oz˝o vektort is a z´erusvektorba visz. Ily m´odon az el˝oz˝o szakasz eredm´enyei minden tov´abbi n´elk¨ ul alkalmazhat´ok, ´es az al´abbi fontos t´etelekhez jutunk: 9. T´ etel: Az A ∈ Mn×n m´atrix pontosan akkor regul´aris, ha az Ax = b egyenletnek minden jobboldal mellett l´etezik megold´asa. Ekkor a megold´as egy´ertelm˝ u is (´espedig A−1 b-vel egyenl˝o). 10. T´ etel: Az A ∈ Mn×n m´atrix pontosan akkor regul´aris, ha az Ax = 0 homog´en egyenletnek csak a trivi´alis megold´asa l´etezik. M´assz´oval, A pontosan akkor szingul´aris, ha a homog´en egyenletnek l´etezik nemtrivi´alis megold´asa. Ekkor pedig v´egtelen sok nemtrivi´alis megold´as is l´etezik (b´armely x megold´as eset´en annak tetsz˝oleges konstansszorosa is megold´as). A t´etelek alkalmaz´ask´ent egy egyszer˝ u elegend˝o felt´etelt mutatunk egy m´atrix szingularit´as´ara: 11. K¨ ovetkezm´ eny: Ha az A ∈ Mn×n m´atrixnak valamelyik sora vagy oszlopa csupa 0-b´ol ´all, akkor a m´atrix szingul´aris. Bizony´ıt´as: Ha valamelyik, pl. a k-adik sor csupa 0, akkor az ek standard b´aziselem mellett az Ax = ek egyenletnek nincs megold´asa, hiszen Ax k-adik eleme biztosan 0, ez´ert a m´atrix szingul´aris. Ha pedig valamelyik, pl. a k-adik oszlop csupa 0, akkor Aek = 0, azaz a homog´en egyenletnek van nemtrivi´alis megold´asa, ez´ert a m´atrix ekkor is szingul´aris.
43
3.6
Megold´ asi algoritmus: a Gauss-elimin´ aci´ o
Tekints¨ uk az al´abbi line´aris egyenletrendszert: a11 x1 + a12 x2 + a13 x3 + ... + a1n xn = b1 a21 x1 + a22 x2 + a23 x3 + ... + a2n xn = b2 a31 x1 + a32 x2 + a33 x3 + ... + a3n xn = b3 .............................. an1 x1 + an2 x2 + an3 x3 + ... + ann xn = bn ahol feltessz¨ uk, hogy az A m´atrix regul´aris. A Gauss-elimin´aci´o (vagy kik¨ usz¨ob¨ol´eses m´odszer) l´ep´esei a k¨ovetkez˝ok: 1. Osszuk le az 1. egyenletet az a11 u ´n. f˝oegy¨ utthat´oval: x1 + a012 x2 + a013 x3 + ... + a01n xn = b01 a21 x1 + a22 x2 + a23 x3 + ... + a2n xn = b2 a31 x1 + a32 x2 + a33 x3 + ... + a3n xn = b3 .............................. an1 x1 + an2 x2 + an3 x3 + ... + ann xn = bn 2. Az 1. sor ak1 -szeres´et vonjuk ki a k-adik sorb´ol (k = 2, 3, ..., n), ez´altal kik¨ usz¨ob¨olj¨ uk x1 -et a 2.,3.,...,n. egyenletb˝ol. Eredm´eny¨ ul az al´abbi szerkezet˝ u egyenletrendszerhez jutunk: x1 + a012 x2 + a013 x3 + ... + a01n xn = b01 a022 x2 + a023 x3 + ... + a02n xn = b02 a032 x2 + a033 x3 + ... + a03n xn = b03 .............................. a0n2 x2 + a0n3 x3 + ... + a0nn xn = b0n 3. A 2.,3.,...,n. egyenlet m´ar csak (n − 1) ismeretlent tartalmaz, ´ıgy az 1., 2. pont l´ep´eseit megism´etelhetj¨ uk: x2 -t kik¨ usz¨ob¨olj¨ uk a 3.,4.,...,n. egyenletb˝ol, majd hasonl´oan, x3 -at a 4.,5.,...,n. egyenletb˝ol, ´es ´ıgy tov´abb. V´eg¨ ul a k¨ovetkez˝o alak´ u egyenletrendszert kapjuk: x1 + a ˜12 x2 + a ˜13 x3 + ... + a ˜1n xn = ˜b1 x2 + a ˜23 x3 + ... + a ˜2n xn = ˜b2 x3 + ... + a ˜3n xn = ˜b3 .............................. xn = ˜bn 44
4. Az utols´o egyenletb˝ol xn m´aris ismert: ezt visszahelyettes´ıtve az (n − 1)-edik egyenletbe, xn−1 sz´am´ıthat´o; xn -et ´es xn−1 -et visszahelyettes´ıtve az (n − 2)-edik egyenletbe, xn−2 sz´am´ıthat´o, ´es ´ıgy tov´abb, ´ıgy az egyes ismeretleneket index szerint cs¨okken˝o sorrendben hat´arozzuk meg. Ezt a m˝ uveletsort a Gauss-elimin´aci´o visszahelyettes´ıt´esi r´esz´enek, m´ıg az el˝oz˝o l´ep´eseket elimin´ aci´ os r´esznek nevezz¨ uk. Az algoritmust az al´abbi egyszer˝ u p´eld´an szeml´eltetj¨ uk: P´elda: Oldjuk meg az al´abbi egyenletrendszert: 2x1 − 6x2 + 10x3 = −12 2x1 − 5x2 + 3x3 = −4 3x1 − 2x2 + x3 = 3 Megold´ as: Osszuk le az 1. egyenletet 2-vel: x1 − 3x2 + 5x3 = −6 2x1 − 5x2 + 3x3 = −4 3x1 − 2x2 + x3 = 3 Az 1. egyenlet 2-szeres´et vonjuk ki a 2. egyenletb˝ol, majd az 1. egyenlet 3-szoros´at vonjuk ki a 3. egyenletb˝ol, ezzel a 2. ´es 3. egyenletb˝ol kik¨ usz¨ob¨olj¨ uk x1 -et: x1 − 3x2 + 5x3 = −6 x2 − 7x3 = 8 7x2 − 14x3 = 21 A 2. egyenletet m´ar nem kell a f˝oegy¨ utthat´oval leosztani, l´ev´en az 1-gyel egyenl˝o. Vonjuk ki a 2. egyenlet 7-szeres´et a 3. egyenletb˝ol, ezzel a 3. egyenletb˝ol x2 -t is kik¨ usz¨ob¨olt¨ uk: x1 − 3x2 + 5x3 = −6 x2 − 7x3 = 8 35x3 = −35 Elosztva a 3. egyenletet 35-tel, az elimin´aci´os r´eszt befejezt¨ uk: x1 − 3x2 + 5x3 = −6 x2 − 7x3 = 8 x3 = −1
45
Az utols´o egyenletb˝ol x3 m´ar ki van sz´am´ıtva. Visszahelyettes´ıtve a 2. egyenletbe, innen x2 is sz´am´ıthat´o (ugyanide jutunk, ha a 3. egyenlet 7-szeres´et hozz´aadjuk a 2. egyenlethez): x1 − 3x2 + 5x3 = −6 x2 = 1 x3 = −1 V´eg¨ ul, x2 -t ´es x3 -t az 1. egyenletbe helyettes´ıtve vissza, x1 is sz´am´ıthat´o: x1 x2 x3
= 2 = 1 = −1
Ezzel az egyenletrendszer megold´as´at el˝o´all´ıtottuk. Visszahelyettes´ıt´essel meggy˝oz˝odhet¨ unk r´ola, hogy az ´ıgy nyert megold´as val´oban kiel´eg´ıti az eredeti egyenletrendszert. Vegy¨ uk ´eszre, hogy a sz´am´ıt´as v´egrehajt´as´ahoz az x1 , x2 , x3 szimb´olumokat ´es az egyenl˝os´egjeleket u ´jra meg u ´jra le´ırni felesleges: a ´ sz´am´ıt´asokat voltak´eppen csak az egy¨ utthat´okon, azok m´atrix´an hajtjuk v´egre. Igy a fenti sz´am´ıt´asi l´ep´esek az al´abbi t¨om¨or form´aba ´ırhat´ok (a m´atrix utols´o oszlopa el˝otti f¨ ugg˝oleges vonal csak a jobb ´attekinthet˝os´eget szolg´alja):
2 −6 10 −12 1 −3 2 −5 3 −4 → 2 −5 3 −2 1 3 3 −2
5 3 1
−6 1 −3 5 −4 0 1 −7 → 3 0 7 −14
1 −3 1 → 0 0 0
5 0 1
−6 1 −3 5 −6 1 −3 5 −6 8 → 0 1 −7 8 → 0 1 −7 8 → 21 0 0 35 −35 0 0 1 −1
1 0 0 −6 1 → 0 1 0 0 0 1 −1
2 1 −1
uveletet ig´enyel (ez a becsl´es ann´al pontosabb, min´el nagyobb a m´atrix Megmutathat´o, hogy a Gauss-elimin´aci´o v´egrehajt´asa kb. 13 n3 m˝ n rendje), ami azt mutatja, hogy numerikus szempontb´ol a Gauss-elimin´aci´o nem ”olcs´o”: ha az ismeretlenek sz´ama dupl´aj´ara n˝o, akkor a sz¨ uks´eges m˝ uveletsz´am kb. nyolcszoros´ ara emelkedik. Az algoritmust ebben a form´aban nem mindig lehet v´egrehajtani, ui. lehets´eges, hogy valamelyik f˝oegy¨ utthat´o, mellyel osztanunk k´ene, 0-val egyenl˝o. Legyen pl. a11 = 0. Ekkor az els˝o ´es valamelyik k´es˝obbi egyenlet cser´ej´evel el´erhet˝o, hogy az u ´j egyenletrendszer els˝o egyenlet´enek f˝oegy¨ utthat´oja ne legyen 0, ellenkez˝o esetben a m´atrix els˝o oszlopa csupa 0-b´ol ´allna, de ekkor a m´atrix szingul´aris volna, kiindul´o felt´etel¨ unkkel ellent´etben. Ugyanez ´all az elimin´aci´o tov´abbi l´ep´eseiben fell´ep˝o (egyre kisebb m´eret˝ u) egyenletrendszerekre. A numerikus sz´am´ıt´as pontoss´ag´anak szempontj´ab´ol az a c´elszer˝ u, hogy a f˝oegy¨ utthat´ok, melyekkel leosztjuk az egyenleteket, abszol´ ut ´ert´ekben min´el nagyobbak legyenek (hogy az oszt´as sz´am´ıt´asi hib´aja min´el kisebb legyen). Ez´ert az egyenletek cser´ejekor c´elszer˝ u az 46
aktu´alis, mondjuk k-adik egyenletet azzal a k´es˝obbi pl. r-edik egyenlettel felcser´elni, melyre |ark | a lehet˝o legnagyobb (r = k, k + 1, ..., n) m´eg akkor is, ha akk 6= 0. Ezt a megold´asi strat´egi´at r´eszleges f˝ oelemkiv´ alaszt´ asnak nevezz¨ uk, ´es ez m´ar minden regul´aris A m´atrix eset´en m˝ uk¨odik. Valamivel t¨obb sz´am´ıt´asi munk´aval j´ar, de m´eg nagyobb pontoss´agot biztos´ıt a teljes f˝ oelemkiv´ alaszt´ as, amikor a k-adik egyenlettel val´o elimin´aci´os l´ep´eskor az ¨osszes h´atral´ev˝o |apq | ´ert´ek maximum´at keress¨ uk (p, q = k, k+1, ..., n), ´es ekkor nemcsak az egyenleteket cser´elj¨ uk meg, hanem az ismeretlenek sorrendj´et is megv´altoztatjuk, hogy a f˝oegy¨ utthat´o az im´ent meghat´arozott maxim´alis abszol´ ut ´ert´ek˝ u elem legyen. A Gauss-elimin´aci´o egy v´alfaja a Gauss-Jordan-elimin´ aci´ o, amikor az aktu´alis pl. k-adik egyenlet seg´ıts´eg´evel nemcsak a k´es˝obbi egyenletekb˝ol k¨ usz¨ob¨olj¨ uk ki a k-adik ismeretlent, hanem a megel˝oz˝oekb˝ol is, ´ıgy a visszahelyettes´ıt´esi l´ep´esek elmaradnak, ´es az elimin´aci´o befejezt´evel azonnal nyerj¨ uk az ismeretlenek ´ert´ekeit. P´elda: Tekints¨ uk az el˝oz˝o p´elda egyenletrendszer´et. Az algoritmus els˝o k´et l´ep´ese egyezik a Gauss-elimin´aci´o els˝o k´et l´ep´es´evel, elt´er´es csak a 3. l´ep´est˝ol van:
2 −6 10 −12 1 −3 3 −4 2 −5 → 2 −5 3 −2 1 3 3 −2
5 3 1
−6 1 −3 5 −4 1 −7 → 0 3 0 7 −14
−6 1 0 −16 18 1 0 −16 18 8 → 0 1 −7 8 → 0 1 −7 8 → 21 0 0 35 −35 0 0 1 −1
1 0 0 2 → 0 1 0 1 0 0 1 −1 A Gauss-elimin´aci´o szingul´aris m´atrix´ u egyenletrendszerek megold´as´ara is alkalmas. Ekkor az a jellemz˝o, hogy az elimin´aci´o valamelyik l´ep´es´eben az egyik egyenlet ¨osszes egy¨ utthat´oja z´eruss´a v´alik. Amennyiben az illet˝o egyenlet jobboldala nem z´erus, akkor az egyenletrendszernek nincs megold´asa; ha a jobboldal is z´erus, akkor van megold´as, s˝ot, ekkor mindig v´egtelen sok megold´as van. Ekkor ui. valamelyik ismeretlen (esetleg t¨obb is) szabadon megv´alaszthat´o, a t¨obbi pedig ezek f¨ uggv´eny´eben fejezhet˝o ki. Az elmondottakat egy p´eld´an szeml´eltetj¨ uk: P´elda: Oldjuk meg a k¨ovetkez˝o egyenletrendszert: x1 − 2x2 + x3 = 1 −2x1 + x2 + x3 = 4 x1 + x2 − 2x3 = 1
47
Megold´ as: A Gauss-elimin´aci´o l´ep´eseit az el˝oz˝o p´eld´akban megismert t¨om¨or jel¨ol´esm´oddal ´ırjuk le:
1 −2 1 −2 1 1 1 1 −2
1 −2 1 1 0 −3 3 4 → 0 3 −3 1
1 −2 1 1 1 −2 1 1 1 1 −1 −2 → 0 1 −1 −2 6 → 0 0 3 −3 0 0 0 0 6 0
Az utols´o egyenlet egy¨ utthat´oi mind 0-val lettek egyenl˝ok, de a jobboldal nem z´erus. Ez ellentmond´as, ´ıgy az egyenletrendszernek nincs megold´asa. Ha viszont a megfelel˝o homog´en egyenletet tekintj¨ uk: x1 − 2x2 + x3 = 0 −2x1 + x2 + x3 = 0 x1 + x2 − 2x3 = 0 akkor m´ar tudjuk, hogy van nemtrivi´alis megold´as, hiszen a m´atrix szingul´aris (ezt ak´ar a determin´ans z´erus volt´ab´ol l´athatjuk, ak´ar onnan, hogy ha a m´atrix regul´aris volna, az el˝oz˝o egyenletrendszernek is lenne, ´espedig egyetlen megold´asa). L´assuk, hogyan m˝ uk¨odik a Gauss-elimin´aci´o ebben az esetben:
1 −2 1 −2 1 1 1 1 −2
0 1 −2 1 0 0 −3 3 → 0 0 3 −3
0 1 −2 1 0 1 −2 1 0 0 → 0 1 −1 0 → 0 1 −1 0 0 0 3 −3 0 0 0 0 0
Az utols´o egyenlet a semmitmond´o 0 = 0 egyenl˝os´egg´e egyszer˝ us¨od¨ott. Valamelyik, c´elszer˝ uen az utols´o ismeretlent ´ıgy tetsz˝olegesen megv´alaszthatjuk: x3 := t, ahol t ∈ R tetsz˝oleges sz´am. Ezt be´ırva a 3. egyenlet hely´ere, a visszahelyettes´ıt´esek m´ar neh´ezs´eg n´elk¨ ul elv´egezhet˝ok: 1 0 0 t 1 −2 0 −t 1 −2 1 0 1 0 t 1 −1 0 → 0 1 0 t → 0 0 0 0 1 t 0 0 1 t 0 0 1 t Teh´at v´egtelen sok nemtrivi´alis megold´as van, ´es ezek ´altal´anos alakja: x1 = t, x2 = t, x3 = t. V´eg¨ ul megmutatjuk, hogyan haszn´alhat´o a Gauss-elimin´aci´o m´ atrixinvert´ al´ asra. Legyen A ∈ Mn×n egy regul´aris m´atrix. Ekkor ´erv´enyes az AA−1 = I
48
m´atrixegyenl˝os´eg. Jel¨olje az egyel˝ore ismeretlen A−1 inverz m´atrix oszlopait a1 , a2 , ... , an , az I egys´egm´atrix oszlopait pedig e1 , e2 , ... ,en (ezek ´epp a standard b´azis elemei Rn -ben): A · a1
a2
...
an =
e1
e2
...
en
A m´atrixszorz´as defin´ıci´oja ´ertelm´eben ez a m´atrixegyenl˝os´eg ekvivalens n db vektoregyenl˝os´eggel, ´espedig: Aak = ek
(k = 1, 2, ..., n)
Azt kaptuk teh´at, hogy a fenti n db egyenletrendszert megoldva, a megold´ asvektorokb´ ol mint oszlopokb´ ol ¨ ossze´ all´ıtott m´ atrix ´epp az eredeti A m´ atrix inverz´evel egyezik. Teh´at egy m´atrixinverzi´ohoz n db speci´alis jobboldal´ u, de azonos m´atrix´ u egyenletrendszert kell megoldani. Ez t¨ort´enhet egyidej˝ uleg is, mivel az elimin´aci´os l´ep´esekkel egyid˝oben a jobboldalakon v´egrehajtand´o m˝ uveleteket egyszerre mindegyik jobboldallal megtehetj¨ uk. Az elj´ar´as a fentiekben haszn´alt t¨om¨or jel¨ol´esm´oddal igen szeml´eletes: az elimin´aci´o elej´en a baloldali r´eszm´atrix az eredeti m´atrix, a jobboldali pedig az egys´egm´atrix, m´ıg az elimin´aci´o befejezt´evel a baloldali r´eszm´atrixb´ol egys´egm´atrix lesz, ekkor a jobboldali r´eszm´atrix az inverz m´atrixszal lesz egyenl˝o. P´elda: Sz´am´ıtsuk ki az al´abbi m´atrix inverz´et: −3 −2 0 3 2 A := 0 −2 0 1 Megold´ as: Az algoritmus l´ep´esei t¨om¨or jel¨ol´esm´oddal:
1 2/3 0 −1/3 0 0 1 2/3 0 −1/3 0 0 −3 −2 0 1 0 0 0 1 0 3 2 0 1 0 → 0 3 2 3 2 0 1 0 → 0 → 0 0 4/3 1 −2/3 0 1 0 0 1 −2 0 1 −2 0 1 0 0 1
0 0 1 2/3 0 −1/3 0 0 1 2/3 0 −1/3 0 0 1 2/3 0 −1/3 0 1/3 0 → 0 1 2/3 0 1/3 0 1 2/3 0 1/3 0 → 0 1 2/3 → 0 → 0 0 1 −6 −4 9 0 4/3 1 −2/3 0 1 0 0 1/9 −2/3 −4/9 1
1 2/3 0 −1/3 0 0 1 0 0 1 0 4 3 −6 → 0 1 0 → 0 0 0 1 −6 −4 9 0 0 1 49
−3 −2 4 4 3 −6 −6 −4 9
Az inverz m´atrix teh´at:
A−1
−3 −2 4 3 −6 = 4 −6 −4 9
amit az A−1 A m´atrixszorz´as elv´egz´es´evel k¨onnyen ellen˝orizhet¨ unk.
3.7
Saj´ at´ ert´ ek, saj´ atvektor
Defin´ıci´ o: Azt mondjuk, hogy az A ∈ Mn×n n´egyzetes m´atrixnak a λ sz´am saj´ at´ert´eke, az s ∈ Rn , s 6= 0 vektor pedig a λ-hoz tartoz´o saj´ atvektora, ha As = λs (ezt az egyenletet saj´ at´ert´ekegyenletnek nevezz¨ uk). A defin´ıci´oban az s 6= 0 kit´etel ´erthet˝o: ha ui, s gyan´ant a z´erusvektort is megengedj¨ uk, akkor a defin´ıci´o ´ertelm´et veszti, hiszen ekkor minden sz´am saj´at´ert´ek lenne az s = 0 saj´atvektorral. A defin´ıci´o neh´ez, mert egyszerre k´et u ´j fogalmat is bevezet. K´es˝obb l´atni fogunk olyan t´eteleket, melyek seg´ıts´eg´evel a saj´at´ert´ekek a saj´atvektorokt´ol elk¨ ul¨on´ıtve hat´arozhat´ok meg. ´ A fenti fogalmak szeml´eletes jelent´ese a k¨ovetkez˝o. Altal´ aban, ha x ∈ Rn egy tetsz˝oleges vektor, az x ´es az Ax vektorok egym´ashoz k´epesti ir´any´ar´ol nem lehet semmit ´all´ıtani. Abban a kiv´eteles helyzetben, amikor valamely nemz´erus s vektorra s ´es As p´arhuzamosak (azaz egyik valamilyen sz´amszorosa a m´asiknak), akkor az ilyen s vektort saj´atvektornak, az ar´anyoss´agi t´enyez˝ot pedig saj´at´ert´eknek nevezz¨ uk. Vil´agos, hogy a saj´atvektorok legfeljebb egy konstans szorz´o erej´eig lehetnek egy´ertelm˝ uek: ha ui. s egy saj´atvektor λ saj´at´ert´ekkel, akkor As = λs, de ekkor tetsz˝oleges α nemz´erus sz´amra A(αs) = λαs, azaz αs is saj´atvektor, ugyanazzal a λ saj´at´ert´ekkel. P´elda: Az
1 2 2 1
!
m´atrixnak a 3 saj´at´ert´eke, egy hozz´atartoz´o saj´atvektor pedig
1 1
!
, mert
1 2 2 1
!
1 1
!
= 3·
1 1
!
.
Tov´ abbi p´eld´ak: (a) A 0 z´erusm´atrixnak a 0 sz´am saj´at´ert´eke (´es csak az): minden nemz´erus vektor saj´atvektor. (b) Az I egys´egm´atrixnak az 1 sz´am saj´at´ert´eke (´es csak az): minden nemz´erus vektor saj´atvektor. (c) Ha A diagon´alm´atrix, akkor A saj´at´ert´ekei a f˝o´atl´oban szerepl˝o sz´amok (´es csak azok): a saj´atvektorok a standard b´azis elemei. Megjegyz´es: Egy´altal´an nem nyilv´anval´o, hogy minden m´atrixnak l´etezik-e saj´at´ert´eke. Ha csak val´os elem˝ u m´atrixokra ´es vektorokra szor´ıtkozunk, mint ahogy eddig is tett¨ uk, ez nem is igaz, de komplex elem˝ u m´atrixok ´es vektorok eset´en m´ar igaz (ekkor a saj´at´ert´ekek is ´altal´aban komplex sz´amok). L´atni fogjuk ugyanis, hogy a saj´at´ert´ekek el˝o´allnak egy speci´alis n-edfok´ u egyenlet megold´asak´ent. E jegyzet keretein bel¨ ul azonban tov´abbra is csak val´os elem˝ u m´atrixokkal ´es vektorokkal foglalkozunk, ´es ´altal´aban csak val´os saj´at´ert´ekek lesznek 50
sz´amunkra ´erdekesek. A saj´at´ert´ekekkel a regularit´as egyszer˝ uen megfogalmazhat´o: ´ ıt´ 12. All´ as: Egy A ∈ Mn×n n´egyzetes m´atrix pontosan akkor szingul´aris, ha a 0 saj´at´ert´eke. Bizony´ıt´as: A 0 ui. pontosan akkor saj´at´ert´ek, ha valamely s 6= 0 vektorra As = 0 teljes¨ ul, azaz, ha a homog´en egyenletnek van nemtrivi´alis megold´asa. Most pedig bebizony´ıtunk egy alapvet˝o jelent˝os´eg˝ u t´etelt, melynek alapj´an a saj´at´ert´ekek – elvben – meghat´arozhat´ok: 13. T´ etel: Egy A ∈ Mn×n n´egyzetes m´atrix saj´at´ert´ekei (´es csak azok) kiel´eg´ıtik a det(A − λI) = 0 n-edfok´ u egyenletet (az u ´n. karakterisztikus egyenletet). Bizony´ıt´as: Az As = λs saj´at´ert´ekegyenlet ui. azzal ekvivalens, hogy az (A − λI)s = 0 homog´en egyenletnek l´etezik nemtrivi´alis megold´asa (ti. az s saj´atvektor), ami pedig pontosan akkor teljes¨ ul, ha a rendszer (A − λI) m´atrixa szingul´aris, azaz determin´ansa 0. A determin´ans defin´ıci´oj´ab´ol nyomban ad´odik, hogy det(A − λI) a λ-nak egy n-edfok´ u polinomja, teh´at a karakterisztikus egyenlet val´oban egy n-edfok´ u algebrai egyenlet: az algebra alapt´etele miatt ennek mindig l´etezik (´altal´aban komplex) megold´asa. K¨ovetkez´esk´epp b´armely n´egyzetes m´atrixnak van (´altal´aban komplex) saj´at´ert´eke. Ha a saj´at´ert´ekeket m´ar meghat´aroztuk, a saj´atvektorok kisz´am´ıt´asa egyszer˝ u: ekkor ui. m´ar csak az (A − λI)s = 0 homog´en egyenletnek kell a nemtrivi´alis megold´asait megkeresni.
−3 2 1 2 atrix saj´at´ert´ekeit ´es saj´atvektorait. P´elda: Hat´arozzuk meg az A := 1 −3 m´ 1 2 −3 Megold´ as: A karakterisztikus polinom:
−3 − λ 2 1 h i 2 3 2 1 −3 − λ 2 det(A − λI) = det = (−3 − λ) (3 + λ) − 4 − 2 · (−3 − λ − 2) + (2 + 3 + λ) = −λ − 9λ − 20λ = 0. 1 2 −3 − λ Ennek megold´asai a saj´at´ert´ekek: 0, −4 ´es −5. A λ = 0 saj´at´ert´ekhez tartoz´o saj´atvektor az al´abbi egyenlet nemtrivi´alis megold´asa:
−3 2 1 2 (A − 0 · I)s = 1 −3 s = 0, 1 2 −3 51
1 ahonnan a saj´atvektor (konstans szorz´o erej´eig egy´ertelm˝ uen): s = 1 1 Hasonl´oan, a λ = −4 saj´at´ert´ekhez tartoz´o saj´atvektor az al´abbi egyenlet nemtrivi´alis megold´asa:
1 2 1 (A + 4 · I)s = 1 1 2 s = 0, 1 2 1
−3 ahonnan a saj´atvektor (konstans szorz´o erej´eig egy´ertelm˝ uen): s = 1 1 V´eg¨ ul, a λ = −5 saj´at´ert´ekhez tartoz´o saj´atvektor az al´abbi egyenlet nemtrivi´alis megold´asa:
2 2 1 (A + 5 · I)s = 1 2 2 s = 0, 1 2 2
2 ahonnan a saj´atvektor (konstans szorz´o erej´eig egy´ertelm˝ uen): s = −3 2 Speci´ alis eset: asodrend˝ u m´atrixok eset´en a karakterisztikus egyenlet m´asodfok´ u, ´ıgy asa ´attekinthet˝o. Legyen A := ! M´ ! annak megold´ a11 a12 a11 − λ a12 , akkor a karakterisztikus egyenlet: det(A − λI) = det = λ2 − (a11 + a22 )λ + (a11 a22 − a12 a21 ) = 0, azaz a21 a22 a21 a22 − λ λ2 − sp(A)λ + det(A) = 0. ahol sp(A) jel¨oli a m´atrix nyom´at, azaz a f˝o´atl´obeli elemek ¨osszeg´et. Innen a gy¨ok¨ok ´es az egy¨ utthat´ok k¨ozti ismert ¨osszef¨ ugg´es alapj´an a λ1 ´es λ2 saj´at´ert´ekekre fenn´allnak az al´abbi ¨osszef¨ ugg´esek: λ1 + λ2 = sp(A) λ1 λ2 = det(A). A saj´at´ert´ekek ´es saj´atvektorok rendszere a line´aris algebra egyik legfontosabb fogalomk¨ore. Sz´amos alkalmaz´asa k¨oz¨ ul r¨oviden v´azolunk egyet, mely a numerikus matematik´aval kapcsolatos. A gyakorlatban az egyenletrendszerek sz´am´ıt´og´epes megold´asa sor´an mindig elk¨ovet¨ unk 52
numerikus hib´akat, mivel a sz´amok ´abr´azol´asa ´ertelemszer˝ uen csak v´eges sok ´ert´ekes jeggyel t¨ort´enik. A hib´ak egy m´asik forr´asa, hogy egy-egy egyenletrendszer egy¨ utthat´oi ´es/vagy jobboldal´anak elemei maguk is csak pontatlanul ismertek (pl. az´ert, mert valamilyen m´er´es eredm´enyei). Term´eszetesen az a k´ıv´anatos, hogy ha csak ”kicsit” hib´azunk az adatokban ´es/vagy az egyenletmegold´as sor´an, akkor ez csak ”kicsi” hib´at okozzon a megold´asban. Sajnos ez nem mindig van ´ıgy. A k¨ovetkez˝okben p´eld´at mutatunk olyan (igen egyszer˝ u ´es kism´eret˝ u) u ´n. rosszul kond´ıcion´alt egyenletrendszerre, ahol az adatok kis hib´aja ´ori´asi hib´at okoz a megold´asban. Eg´eszen term´eszetes ig´eny, hogy ezt a jelens´eget m´eg az egyenletmegold´as el˝ott fel tudjuk ismerni ´es valamilyen ”m´er˝osz´am” alapj´an jellemezni tudjuk. Ez a m´er˝osz´am lesz a kond´ıci´ osz´ am, mely bizonyos m´atrixok eset´en a saj´at´ert´ekekb˝ol sz´armaztathat´o. Rosszul kond´ıcion´alt egyenletrendszerek: Tekints¨ uk a k¨ovetkez˝o modellfeladatot: 1000x + 999y = 1 999x + 998y = 1 Megold´asa k¨onnyen ellen˝orizhet˝oen: x = 1, y = −1, ´es ez az egyetlen megold´as, mivel a rendszer determin´ansa nem 0. Tekints¨ uk most ugyanezt az egyenletrendszert, de egy kicsit megv´altoztatott jobboldallal: 1000x + 999y = 1 999x + 998y = 0.999 melynek egyetlen megold´asa: x = 0.001, y = 0, ami eg´eszen t´avol ´all az el˝oz˝o megold´ast´ol. A jelens´eg a rosszul kond´ıcion´ alt egyenletek tipikus esete. Kider¨ ult (a r´eszletekkel itt nem foglalkozhatunk), hogy az A m´atrix kond´ıcion´alts´ag´anak m´er˝osz´amak´ent j´ol haszn´alhat´o a cond(A) :=
|λ|max |λ|min
u ´n. kond´ıci´osz´am, legal´abbis akkor ha az A m´atrix ¨onadjung´alt (azaz szimmetrikus a f˝o´atl´oj´ara, ld. a k¨ovetkez˝o szakaszt). Itt |λ|max ill. |λ|min jelenti a m´atrix legnagyobb ill. legkisebb abszol´ ut ´ert´ek˝ u saj´at´ert´ek´enek abszol´ ut ´ert´ek´et. Defin´ıci´o szerint cond(A) ≥ 1, ´es a kond´ıci´osz´am nem v´altozik, ha a m´atrixot b´armely nemz´erus skal´arral megszorozzuk, azaz ´erz´ektelen a m´atrixelemek ”m´ert´ekegys´eg´ere”. ´ Altal´ anos szab´alyk´ent elmondhat´o, hogy min´el nagyobb a kond´ıci´osz´am, ann´al ´erz´ekenyebb az egyenlet az adatok ill. a sz´am´ıt´as hib´aj´ara. 5 10 k¨or¨ uli vagy enn´el m´eg nagyobb kond´ıci´osz´am m´ar nagyon rosszul kond´ıcion´alt egyenletre utal: k¨onnyen ellen˝orizhet˝o, hogy a fenti 1 , igy a kond´ıci´osz´am cond(A) ≈ 4 · 106 . modellfeladatban a m´atrix saj´at´ert´ekei λ1 ≈ 2000 ´es λ2 ≈ − 2000 Egy m´asik p´elda rosszul kond´ıcion´alt m´atrixokra az al´abbi m´atrixsorozat:
1 3
1 2 1 3 1 4
1 3 1 4 1 5
...
...
...
1 n
1 n+1
1 n+2
1
1 2
1 Hn := [ ]= k+j−1
53
... ... ... ... ...
1 n 1 n+1 1 n+2
... 1 2n−1
∈ Mn×n
Hn -t n-edrend˝ u Hilbert-m´atrixnak nevezz¨ uk. A Hilbert-m´atrixok term´eszetes m´odon felbukkannak bizonyos f¨ uggv´enyk¨ozel´ıt´esi probl´em´akban (ld. a k¨ovetkez˝o fejezet 4.7.szakasz´at). Hn kond´ıci´osz´ama a m´atrix rendj´enek n¨ovel´es´evel nagyon gyorsan n˝o: cond(H6 ) ≈ 1.5 · 107 , de m´ar cond(H10 ) ≈ 1.6 · 1013 . Nagyon rossz kond´ıcion´alts´aguk miatt a Hilbert-m´atrixok j´ol alkalmazhat´ok pl. k¨ ul¨onf´ele egyenletmegold´o algoritmusok tesztel´es´ere.
3.8
¨ Onadjung´ alt m´ atrixok
Defin´ıci´ o: Az A ∈ Mn×m , A = [akj ] m´atrix transzpon´ altj´ anak (vagy adjung´ altj´ anak) a sorok ´es oszlopok felcser´el´es´evel nyert A∗ := [ajk ] ∈ Mm×n m´atrixot nevezz¨ uk. Az A ∈ Mn×n n´egyzetes m´atrix szimmetrikus (vagy ¨ onadjung´ alt), ha A∗ = A. M´assz´oval, az A m´atrix ¨onadjung´alt, ha elemeit a f˝o´atl´ora t¨ ukr¨ozve, a m´atrix nem v´altozik, azaz akj = ajk teljes¨ ul minden k, j = 1, 2, ..., nre. ´Igy pl. az n × n-es z´erusm´atrix ´es az egys´egm´atrix ¨onadjung´altak. Megjegyz´esek: (a) A sz´ohaszn´alat sajnos nem egys´eges. N´eha egy m´atrix adjung´altj´anak azt a m´atrixot nevezik, melynek kj-edik eleme a k-adik sor ´es j-edik oszlop elhagy´as´aval kapott (n − 1)-edrend˝ u m´atrix determin´ansa. Ezt a fajta adjung´altat azonban nem A∗ -gal, hanem az adj(A) szimb´olummal szok´as jel¨olni. E jegyzet keretein bel¨ ul az adjung´alt m´atrix mindig a fenti defin´ıci´oval meghat´arozott m´atrixot, teh´at a sorok ´es az oszlopok felcser´el´es´evel kapott m´atrixot fogja jelenteni. (b): Komplex elem˝ u m´atrixok eset´en az adjung´alt m´atrix nem a sorok ´es az oszlopok felcser´el´es´evel kapott m´atrixot, hanem annak (elemenk´ent k´epzett) komplex konjug´altj´at jelenti. Mivel e jegyzetben csak val´os elem˝ u m´atrixokat vizsg´alunk, a konjug´al´asnak nincs ”hat´asa”, ´ıgy ezt fel sem t¨ untett¨ uk a defin´ıci´oban. Az adjung´alt m´atrix ´es a skal´aris szorzat k¨ozt ´erdekes kapcsolat ´all fenn: ´ ıt´ 14. All´ as: Ha A ∈ Mn×n tetsz˝oleges m´atrix, akkor minden x, y ∈ Rn eset´en hAx, yi = hx, A∗ yi teljes¨ ul. K¨ovetkez´esk´epp, ha A ¨onadjung´alt, akkor hAx, yi = hx, Ayi teljes¨ ul minden x, y ∈ Rn -re. Pn Pn Pn Pn ∗ Bizony´ıt´as: Val´oban, a baloldal: hAx, yi = (Ax)k yk = akj xj yk , m´ıg a jobboldal: hx, A∗ yi = k=1 k=1 j=1 p=1 xp (A y)p = Pn Pn Pn Pn ∗ p=1 q=1 xp (A )pq yq = p=1 q=1 aqp xp yq . Az al´abbiakban ¨osszefoglaljuk az adjung´al´asra vonatkoz´o azonoss´agokat: ´ ıt´ 15. All´ as: Ha A, B ∈ Mn×n tetsz˝oleges m´atrixok, akkor (a) (A + B)∗ = A∗ + B ∗ (b) (c · A)∗ = c · A∗ minden c ∈ R-re 54
(c) (AB)∗ = B ∗ A∗ (d) (A∗ )∗ = A (e) ha A regul´aris, akkor A∗ is az, ´es (A∗ )−1 = (A−1 )∗ Bizony´ıt´as: Az ´all´ıt´asok az utols´o kiv´etel´evel k¨ozvetlen¨ ul ad´odik a defin´ıci´ob´ol: ezek ellen˝orz´es´et az Olvas´ora b´ızzuk. Az (e) ´all´ıt´ast ´ıgy −1 ∗ ∗ igazolhatjuk: a jobboldali m´atrixra teljes¨ ul, hogy (A ) A = (AA−1 )∗ = I ∗ = I (itt felhaszn´altuk a (c) ´all´ıt´ast), teh´at A∗ inverze l´etezik, ´espedig ´epp (A−1 )∗ -gal egyenl˝o. Az ¨onadjung´alt m´atrixoknak sz´amos fontos tulajdons´aguk van, ´ıgy pl.: ´ ıt´ 16. All´ as: Ha A ∈ Mn×n ¨onadjung´alt, akkor a k¨ ul¨onb¨oz˝o saj´at´ert´ekekhez tartoz´o saj´atvektorok ortogon´alisak. Bizony´ıt´as: Legyenek λ1 6= λ2 , ´es As1 = λ1 s1 , As2 = λ2 s2 . Az els˝o saj´at´ert´ekegyenletet s2 -vel, a m´asodikat s1 -gyel szorozva skal´arisan, ´ ıt´as miatt megegyeznek, innen: (λ1 − λ2 ) · hs1 , s2 i = 0. kapjuk, hogy hAs1 , s2 i = λ1 hs1 , s2 i, ´es hAs2 , s1 i = λ2 hs2 , s1 i. A baloldalak a 14. All´ Mivel pedig λ1 6= λ2 , az´ert innen sz¨ uks´egk´epp hs1 , s2 i = 0, azaz s1 ´es s2 ortogon´alisak. Elnevez´es: A Q : Rn → R, Q(x) := hAx, xi f¨ uggv´enyt az A ∈ Mn×n ¨onadjung´alt m´atrixhoz tartoz´o kvadratikus alaknak nevezz¨ uk. A m´atrixszorz´as defin´ıci´oja alapj´an k¨onnyen ellen˝orizhet˝o, hogy a kvadratikus alak az A m´atrix ´es az x vektor elemeivel a k¨ovetkez˝o form´aban ´all´ıthat´o el˝o: n n hAx, xi =
XX
akj xk xj
k=1 j=1
Defin´ıci´ o: Az A ∈ Mn×n ¨onadjung´alt m´atrix pozit´ıv szemidefinit, ha a hozz´atartoz´o kvadratikus alak csak nemnegat´ıv ´ert´ekeket vesz fel: pozit´ıv definit, ha a kvadratikus alak pozit´ıv minden x 6= 0 eset´en. Hasonl´oan, az A m´atrix negat´ıv szemidefinit, ha a hozz´atartoz´o kvadratikus alakra Q(x) ≤ 0 teljes¨ ul; negat´ıv definit, ha Q(x) < 0 minden x 6= 0 eset´en. V´eg¨ ul az A m´atrixot indefinitnek nevezz¨ uk, ha a kvadratikus alak pozit´ıv ´es negat´ıv ´ert´ekeket egyar´ant felvesz. 2 1 1 2
P´elda: Az A :=
!
m´atrix pozit´ıv definit.
Bizony´ıt´as: Legyen A := h
2 1 1 2
!
x y
!
,
x y
x y
!
∈ R2 tetsz˝oleges vektor, akkor
!
i=h
2x + y y + 2x
!
,
x y
!
1 3 3 i = 2x2 + yx + xy + 2y 2 = 2 · (x2 + xy + y 2 ) = 2 · ((x + y)2 + y 2 ) ≥ y 2 , 2 4 2
ahonnan az ´all´ıt´as m´ar k¨ovetkezik. 55
Tov´ abbi p´eld´ak: A z´erusm´atrix pozit´ıv szemidefinit, ugyanakkor negat´ıv szemidefinit is. Az egys´egm´atrix pozit´ıv definit. Egy diagon´alm´atrix pozit´ıv (negat´ıv) definit, ha a diagon´alelemei mind pozit´ıvak (negat´ıvak). A definits´eg eld¨ont´ese sz´amos alkalmaz´as (´ıgy pl. a t¨obbv´altoz´os sz´els˝o´ert´ekfeladatok) eset´eben alapvet˝o fontoss´ag´ u. L´atni kell ugyanakkor, hogy a defin´ıci´o alapj´an ezt a´ltal´aban nagyon neh´ez megtenni. Ezen seg´ıt a k¨ovetkez˝o t´etel, mely szerint a definits´eg eld¨ont´es´ehez el´eg ismerni a saj´at´ert´ekek el˝ojel´et: 17. T´ etel: A ∈ Mn×n ¨onadjung´alt m´atrix pontosan akkor • pozit´ıv (ill. negat´ıv) szemidefinit, ha minden saj´at´ert´eke nemnegat´ıv (ill. nempozit´ıv); • pozit´ıv (ill. negat´ıv) definit, ha minden saj´at´ert´eke pozit´ıv (ill. negat´ıv); • indefinit, ha van pozit´ıv ´es negat´ıv saj´at´ert´eke is. Bizony´ıt´as: Csak a pozit´ıv definits´eget vizsg´aljuk, a t¨obbi eset hasonl´oan kezelhet˝o. Legyen A pozit´ıv definit. Tekints¨ uk a saj´at´ert´ekegyenletet: As = λs. Mindk´et oldalt szorozzuk meg skal´arisan az s saj´atvektorral: 0 < Q(s) = hAs, si = λ · hs, si = λ||s||2 , innen sz¨ uks´egk´epp λ > 0. A megford´ıt´ast (azt, hogy ha A minden saj´at´ert´eke pozit´ıv, akkor A pozit´ıv definit is) nem bizony´ıtjuk. A definits´eg eld¨ont´ese sokszor m´eg a 17. T´etel seg´ıts´eg´evel is neh´ez, b´ar a t´etel alkalmaz´as´ahoz nem kell ismerni magukat a saj´at´ert´ekeket, csak azok el˝ojel´et. A k¨ovetkez˝o t´etel, melyet bizony´ıt´as n´elk¨ ul k¨ozl¨ unk, lehet˝ov´e teszi a pozit´ıv ´es negat´ıv definits´eg meg´allap´ıt´as´at eg´eszen g´epies m´odon, egy sor determini´ans kisz´am´ıt´as´aval: 18. T´ etel: Legyen A = [akj ] ∈ Mn×n ¨onadjung´alt m´atrix ´es jel¨olje Ak a m´atrix bal fels˝o sark´anak elemeib˝ol ´all´o k × k-as m´atrixot (k = 1, 2, ..., n; az Ak m´atrixokat az eredeti A m´atrix minorm´ atrixainak nevezz¨ uk):
Ak :=
a11 a12 a21 a22 ... ... ak1 ak2
... a1k ... a2k ... ... ... akk
Akkor az A m´atrix pontosan akkor • pozit´ıv definit, ha minden minorm´atrix´anak determin´ansa pozit´ıv, azaz det(Ak ) > 0 (k = 1, 2, ..., n); 56
• negat´ıv definit, ha minorm´atrixainak determin´ansai v´altakoz´o el˝ojel˝ uek, pontosabban: sign(det(Ak )) = (−1)k ”sign” az el˝ojelf¨ uggv´enyt jel¨oli.
(k = 1, 2, ..., n), ahol
A 2 × 2-es m´atrixok speci´alis esete: M´asodrend˝ u ¨onadjung´alt m´atrixok eset´en a definits´eg az el˝oz˝o t´etel haszn´alata n´elk¨ ul is k¨onnyen eld¨onthet˝o. Legyen A = [akj ] ∈ M2×2 egy o¨nadjung´alt m´atrix: m´ar l´attuk, hogy ekkor fenn´allnak a λ1 + λ2 = sp(A),
λ1 λ2 = det(A).
o¨sszef¨ ugg´esek. Ezt az eredm´enyt kombin´alva a 17. T´etellel, azonnal ad´odik, hogy: 19. K¨ ovetkezm´ eny Az A ∈ M2×2 ¨onadjung´alt m´atrix pontosan akkor • definit, ha det(A) > 0; • szemidefinit, ha det(A) ≥ 0; • indefinit, ha det(A) < 0; • pozit´ıv definit, ha det(A) > 0, ´es sp(A) > 0; • negat´ıv definit, ha det(A) > 0, ´es sp(A) < 0.
3.9
N´ eh´ any speci´ alis m´ atrixoszt´ aly
Defin´ıci´ o: A P ∈ Mn×n m´atrixot projektorm´ atrixnak vagy r¨oviden projektornak nevezz¨ uk, ha P 2 = P . Nyilv´anval´o, hogy a z´erusm´atrix ´es az egys´egm´atrix projektorm´atrixok (trivi´alis projektorok). Geometriai jelent´es´eb˝ol az is nyilv´anval´o, hogy a s´ıkra val´o vet´ıt´es m´atrixa projektorm´atrix (ezt a defin´ıci´o alapj´an is k¨onny˝ u ellen˝orizni). A projektorok egyszer˝ us´eg¨ uk miatt j´atszanak fontos szerepet, ugyanakkor megmutathat´o, hogy egy sor m´atrix (´ıgy pl. minden ¨onadjung´alt m´atrix) el˝o´all´ıthat´o projektorm´atrixok line´aris kombin´aci´ojak´ent. ´ ıt´ 20. All´ as: Ha P ∈ Mn×n projektor, akkor I − P is az. Bizony´ıt´as: (I − P )2 = I 2 − IP − P I + P 2 = I − 2P + P = I − P . ´ ıt´ 21. All´ as: Ha P ∈ Mn×n projektor, akkor P saj´at´ert´ekei csak a 0 ´es az 1 lehetnek. ´ Bizony´ıt´as: Ha P s = λs, akkor P 2 s = λP s = λ2 s. Amde P s = P 2 s, innen λ(1 − λ)s = 0, ez´ert s 6= 0 miatt sz¨ uks´egk´epp λ(1 − λ) = 0, ahonnan az ´all´ıt´as m´ar k¨ovetkezik. 57
Nemtrivi´alis projektorra a legegyszer˝ ubb p´elda a di´ ad, azaz egyetlen v vett diadikus szorzata: v12 a1 v2 v v v22 2 1 P := ... ... vn v1 vn v2
= (v1 , v2 , ..., vn ) ∈ Rn egys´egnyi hossz´ us´ag´ u vektor ¨onmag´aval ... v1 vn ... v2 vn ... ... ... vn2
A m´atrixszorz´as defin´ıci´oja alapj´an k¨onnyen l´athat´o, hogy minden x ∈ Rn eset´en P x = hx, vi · v. Innen P 2 x = hx, vi · P v = hx, vi · hv, vi · v = P x (mert ||v|| = 1), teh´at a fent P m´atrix val´oban projektor. Legyen most A ∈ Mn×n egy ¨onadjung´alt m´atrix, saj´at´ert´ekei legyenek λ1 , λ2 , ..., λn , a hozz´atartoz´o saj´atvektorok pedig s1 , s2 , ..., sn , melyekr˝ol feltehet˝o, hogy egys´egnyi norm´aj´ uak (ellenkez˝o esetben osszuk el a saj´atvektort a hossz´aval, ´ıgy m´ar egys´egnyi norm´aj´ u saj´atvektorhoz ´ ıt´as), ez´ert jutunk). Ha a saj´at´ert´ekek mind k¨ ul¨onb¨oz˝ok, akkor m´ar tudjuk, hogy a saj´atvektorok egym´asra p´aronk´ent ortogon´alisak (16. All´ b´azist alkotnak Rn -ben. Bizony´ıt´as n´elk¨ ul megjegyezz¨ uk, hogy ez minden ¨onadjung´alt m´atrix eset´eben igaz marad: Rn -ben l´etezik A saj´atvektoraib´ol ´all´o ortonorm´alt b´azis, akkor is, ha a saj´at´ert´ekek k¨oz¨ott vannak egyenl˝ok (ez esetben e saj´at´ert´ekekhez t¨obb, egym´asra p´aronk´ent ortogon´alis saj´atvektor is l´etezik). Alapvet˝o jelent˝os´eg˝ u t´etel, hogy ekkor A el˝o´all a fenti t´ıpus´ u projektorok line´aris kombin´aci´ojak´ent: 22. T´ etel: Ha A ∈ Mn×n ¨onadjung´alt, λ1 , λ2 , ..., λn saj´at´ert´ekekkel ´es s1 , s2 , ..., sn ortonorm´alt saj´atvektorrendszerrel, akkor tetsz˝oleges x ∈ Rn eset´en ´erv´enyes az al´abbi el˝o´all´ıt´as: Ax =
n X
λk hx, sk isk
k=1
Bizony´ıt´ as: Val´oban, m´ar l´attuk, hogy az s1 , s2 , ..., sn ortonorm´alt b´azisban ´erv´enyes az x = nk=1 hx, sk isk egyenl˝os´eg minden x ∈ Rn vektor mellett (1. fejezet, 13. T´etel). Az egyenl˝os´eg mindk´et oldal´at balr´ol az A m´atrixszal szorozva, a k´ıv´ant el˝o´all´ıt´ashoz jutunk. P
A fenti el˝o´all´ıt´ast az A ¨onadjung´alt m´atrix spektr´ alel˝ o´ all´ıt´ as´ anak nevezz¨ uk. A jobboldali ¨osszeg minden egyes tagj´aban hx, sk isk nem m´as, mint egy projektor (az sk saj´atvektornak ¨onmag´aval vett diadikus szorzata) alkalmazva az x vektorra. Teh´at A el˝o´all di´adok line´aris kombin´aci´ojak´ent. Egy´ uttal azt is l´atjuk, hogy az ¨onadjung´alt m´atrixok egy´ertelm˝ uen meg vannak hat´arozva a saj´at´ert´ekeik ´es saj´atvektoraik rendszer´evel: ezek ismeret´eben a m´atrix rekonstru´alhat´o. A spektr´alel˝o´all´ıt´as jelent˝os´eg´et az adja, hogy ezzel az A m´atrix b´armely hatv´anya igen egyszer˝ uen el˝o´all´ıthat´o. Az egyenl˝os´eg mindk´et oldal´at A-val ism´etelten szorozva nyomban ad´odik, hogy tetsz˝oleges m term´eszetes sz´amra: Am x =
n X
λm k hx, sk isk ,
k=1
58
teh´at Am x l´enyeg´eben ugyanannyi m˝ uvelet ´ar´an sz´am´ıthat´o ki mint Ax. Megjegyezz¨ uk, hogy ugyanakkor a m´atrixszorz´asok t´enyleges (defin´ıci´o szerinti) elv´egz´ese igen m˝ uveletig´enyes: k¨onnyen l´athat´o, hogy m´ar k´et n-edrend˝ u m´atrix ¨osszeszorz´asa is kb. n3 algebrai m˝ uveletet ig´enyel. Ezek alapj´an lehets´eges egy (¨onadjung´alt) m´atrixnak m´as, nem-hatv´any alak´ u, de hatv´anysorral el˝o´all´ıthat´o f¨ uggv´eny´et defini´alni. ´Igy pl. bevezethet˝o a m´atrixok exponenci´alis f¨ uggv´enye az eA x :=
n X
eλk hx, sk isk ,
k=1
´es az ´ıgy defini´alt m´atrix-exponenci´alisra a megszokott (eA )k = ekA teljes¨ ul. Ennek a konstrukci´onak pl. a differenci´alegyenletrendszerek vizsg´alat´aban van nagy szerepe. M´eg nagyobb jelent˝os´ege van annak, hogy a spektr´alel˝o´all´ıt´as ismeret´eben a m´atrix inverze is ugyanilyen k¨onnyed´en hat´arozhat´o meg: −1
A x=
n X
1 hx, sk isk , k=1 λk
Szorozzuk meg ui. balr´ol a jobboldalt A-val: eredm´eny¨ ul ´epp x-et kapunk (ism´et a 1. fejezet 13. T´etele alapj´an), k¨ovetkez´esk´epp a jobboldal −1 val´oban A x-szel egyenl˝o. K¨ovetkez´esk´epp a saj´at´ert´ekek ´es saj´atvektorok ismeret´eben az ¨onadjung´alt m´atrix´ u Ax = b egyenlet megold´asa explicit m´odon kifejezhet˝o: x = A−1 b =
n X
1 hb, sk isk , k=1 λk
´espedig a Gauss-elimin´aci´on´al sokkal kevesebb (kb. 2n2 ) m˝ uvelet ´ar´an. Mindehhez azonban, hangs´ ulyozzuk, az A m´atrix saj´atrendszer´enek ismerete sz¨ uks´eges, ennek meghat´aroz´asa pedig – ´altal´aban – m´eg az inverz meghat´aroz´as´an´al is nehezebb probl´ema. Ez´ert e m´odszer csak speci´alis m´atrixok eset´en alkalmazhat´o, amikor a saj´atrendszer valamilyen egy´eb meggondol´asok alapj´an m´ar rendelkez´esre ´all. Defin´ıci´ o: Az A ∈ Mn×n m´atrixot nilpotensnek nevezz¨ uk, ha valamely pozit´ıv hatv´anya a z´erusm´atrixszal egyenl˝o (ekkor persze minden, enn´el nagyobb kitev˝oj˝ u hatv´anya is z´erus). P´elda: Az
0 1 0 A := 0 0 1 ∈ M3×3 0 0 0 59
´ m´atrix nilpotens, A3 = 0. Altal´ aban, ha A ∈ Mn×n olyan, hogy a f˝o´atl´oja feletti ´atl´o elemei 1-gyel, az ¨osszes t¨obbi elem 0-val egyenl˝o, akkor A nilpotens m´atrix: hatv´anyoz´askor az 1-esek ´atl´oja mintegy ”felfel´e cs´ uszik”, ´es az n-edik hatv´anyn´al m´ar teljesen ”kics´ uszik” a n m´atrixb´ol: A = 0. A nilpotens m´atrixok jelent˝os´eg´et az adja, hogy lehets´eges ilyen m´atrixok v´egtelen hatv´anysor´aval dolgozni ´es ismert, sorokra vonatkoz´o erem´enyeket alkalmazni, mik¨ozben a m´atrix nilpotens volta miatt a v´egtelen m´atrix-hatv´anysor val´oj´aban egy v´eges ¨osszeg. Ilyen t´ıpus´ u eredm´enyek k¨oz¨ ul az egyik legegyszer˝ ubb az al´abbi; k´et m´asikat pedig feladatk´ent fogalmazunk meg a fejezet v´eg´en. ´ ıt´ 23. All´ as: Ha az A ∈ Mn×n m´atrix nilpotens, akkor az I − A m´atrix invert´alhat´o, ´es: −1
(I − A)
=
∞ X
Ak ,
k=0
(ahol a jobboldali form´alisan v´egtelen sor csak v´eges sok tag ¨osszege, mivel alkalmas kitev˝ot˝ol kezdve az ¨osszes m´atrixhatv´any a z´erusm´atrixszal egyenl˝o). Bizony´ıt´as: Legyen m egy olyan kitev˝o, melyre Am = 0. Akkor a jobboldal az I + A + A2 + ... + Am−1 v´eges ¨osszeggel egyenl˝o. Ezt jobbr´ol (I − A)-val szorozva: (I + A + A2 + ... + Am−1 )(I − A) = I + A + A2 + ... + Am−1 − A − A2 − ... − Am−1 − Am = I − Am = I, teh´at defin´ıci´o szerint (I − A) invert´alhat´o, ´es inverze I + A + A2 + ... + Am−1 . 1 k = ∞ os´eg pontos megfelel˝oje. Az |a| < 1 felt´etelt az el˝oz˝o Az ´all´ıt´as a val´os anal´ızisb˝ol ismert, az |a| < 1 sz´amokra ´erv´enyes 1−a k=0 a egyenl˝ ´all´ıt´asban az A m´atrix nilpotens volt´anak felt´etele helyettes´ıti: megjegyezz¨ uk azonban, hogy az ´all´ıt´as enn´el t´agabb m´atrixoszt´alyokra is igaz marad (ennek r´eszleteivel nem foglalkozunk).
P
Defin´ıci´ o: Az A ∈ Mn×n m´atrixot ortogon´ alis m´ atrixnak nevezz¨ uk, ha oszlopai mint (oszlop)vektorok, ortonorm´alt rendszert alkotnak Rn -ben. P´elda: Az Olvas´o k¨onnyen ellen˝orizheti, hogy M2×2 forgat´om´atrixai (ld. a 3.3. szakaszt) azaz az cos t − sin t sin t cos t
!
alak´ u m´atrixok minden t ∈ R eset´en ortogon´alis m´atrixok. Az ortogon´alis m´atrixok k¨ ul¨onleges szerepe – amint azt a forgat´om´atrixok p´eld´aj´an m´ar l´attuk – abban ´all, hogy inverz¨ uk rendk´ıv¨ ul 60
egyszer˝ uen hat´arozhat´o meg: ´ ıt´ 24. All´ as Ha az A ∈ Mn×n m´atrix ortogon´alis, akkor invert´alhat´o, ´es A−1 = A∗ . Bizony´ıt´as: Az A∗ A szorzatm´atrix kj-edik eleme az A∗ m´atrix k-adik sor´arak (teh´at az A m´atrix k-adik oszlop´anak) ´es az A m´atrix j-edik oszlop´anak skal´aris szorzata. Haszn´alva az oszlopvektorok ortonorm´alts´ag´at, innen az ad´odik, hogy A∗ A ´epp az I egys´egm´atrixszal egyenl˝o, teh´at A val´oban invert´alhat´o, ´es A−1 = A∗ .
61
3.10
Feladatok
1. Keress¨ unk olyan (val´os elem˝ u) J ∈ M2×2 m´atrixot, melyre J 2 = −I. Megold´as 2. Igazoljuk, hogy ha A, B ∈ Mn×n felcser´elhet˝o regul´aris m´atrixok, akkor (a) A−1 ´es B is felcser´elhet˝ok; (b) A ´es B −1 is felcser´elhet˝ok; (c) A−1 ´es B −1 is felcser´elhet˝ok. Megold´as 3. Igazoljuk, hogy ha A, B ∈ Mn×n tetsz˝oleges n´egyzetes m´atrixok, akkor sp(AB) = sp(BA), ahol sp(M ) jel¨oli az M m´atrix f˝odiagon´alis´aban ´all´o elemek ¨osszeg´et, azaz a m´atrix nyom´ at. Megold´as 4. Az el˝oz˝o feladat eredm´eny´enek felhaszn´al´as´aval igazoljuk, hogy AB − BA = I semmilyen n´egyzetes A, B m´atrixokra sem teljes¨ ul. Megold´as 5. Igazoljuk 2 × 2-es m´atrixokra, hogy egy m´atrix pontosan akkor szingul´aris, ha a determin´ansa z´erus. Megold´as
1 3 2 6. Regul´arisak-e az al´abbi m´atrixok? (a) A := 0 1 5 , 0 0 2 Megold´as
1 −1 1 1 1 3 (b) A := 1 −3 −1
7. Oldjuk meg Gauss-elimin´aci´oval az al´abbi egyenletrendszert: x + 4y + 2z = 5 −3x + 2y + z = −1 4x − y − z = 2
62
Megold´as 8. Sz´am´ıtsuk ki Gauss-elimin´aci´oval az al´abbi m´atrix inverz´et:
1 0 1 A := 0 0 2 −1 3 2 Megold´as 9. Hogyan alakul a tx + y + z = 1 x + ty + z = t x + y + tz = t2 egyenletrendszer megoldhat´os´aga a t val´os param´eter k¨ ul¨onb¨oz˝o ´ert´ekei mellett? Megold´as 10. Sz´am´ıtsuk ki az al´abbi m´atrix saj´at´ert´ekeit ´es saj´atvektorait:
−2 1 1 1 A := 1 −2 1 1 −2 Megold´as 11. Mutassuk meg, hogy ha t 6= kπ (k ∈ Z), akkor az At :=
cos t − sin t sin t cos t
!
forgat´om´atrixnak nincs val´os saj´at´ert´eke.
Megold´as 12. Igazoljuk, hogy ha λ saj´at´ert´eke az A ∈ Mn×n m´atrixnak, akkor λk saj´at´ert´eke Ak -nak (k ∈ N), tov´abb´a, ha A m´eg regul´aris is, akkor λ−1 saj´at´ert´eke A−1 -nek. Megold´as 13. Mutassuk meg, hogy a vektori´alis szorz´as m´atrix´anak a 0 mindig saj´at´ert´eke. Mi a hozz´atartoz´o saj´atvektor? 63
Megold´as 14. Definits´eg szempontj´ab´ol oszt´alyozzuk az A :=
1 1 1 2
!
´es a B :=
−3 8 8 3
!
¨onadjung´alt m´atrixokat.
Megold´as 15. Igazoljuk, hogy ha A, B ∈ Mn×n ¨onadjung´altak ´es felcser´elhet˝ok, akkor AB is ¨onadjung´alt. Megold´as 16. Mutassuk meg, hogy ha A ∈ Mn×n nilpotens m´atrix, akkor minden saj´at´ert´eke sz¨ uks´egk´epp 0. Megold´as 17. Mutassuk meg, hogy ha A ∈ Mn×n nilpotens m´atrix, ´es |c| < 1, akkor (cI + A)m → 0 elemenk´ent, ha m → +∞. Megold´as 18. Egy n´egyzetes A m´atrixot antiszimmetrikusnak nevez¨ unk, ha A∗ = −A. Igazoljuk, hogy ha A regul´aris ´es antiszimmetrikus, akkor nem lehet val´os saj´at´ert´eke! Megold´as 19. Legyen A ∈ Mn×n olyan m´atrix, hogy minden saj´at´ert´ek´enek abszol´ ut ´ert´eke 1-n´el kisebb. Igazoljuk, hogy ekkor I − A regul´aris. Megold´as 20. Van-e olyan 3 × 3-as val´os elem˝ u m´atrix, melynek saj´at´ert´ekei az i, 2i ´es a 3i imagin´arius sz´amok? Megold´as
64
Megold´ asok !
0 1 1. Ilyen m´atrix a k¨ovetkez˝o: J = −1 0 Megjegyz´es: A J 2 = −I egyenl˝os´eg a komplex i2 = −1 egyenl˝os´eg pontos megfelel˝oje. Ily m´odon a komplex!sz´amok egy´ertelm˝ uen a b m´atrixot, akkor ez a reprezent´alhat´ok 2 × 2-es m´atrixokkal. Feleltess¨ uk meg a z = a + ib komplex sz´amnak a Z := aI + bJ = −b a megfeleltet´es ¨osszeg- ´es szorzattart´o. 2. (a) Jel¨olje C := A−1 B, akkor CA = A−1 BA = A−1 AB = B, innen C = BA−1 . (b) Jel¨olje C := AB −1 , akkor BC = BAB −1 = ABB −1 = A, innen C = B −1 A. (c) A−1 B −1 = (BA)−1 = (AB)−1 = B −1 A−1 3. sp(AB) =
Pn
k=1 (AB)kk
=
Pn
k=1
Pn
j=1
Akj Bjk , ´es sp(BA) =
Pn
p=1 (BA)pp
=
Pn
p=1
Pn
q=1
Bpq Aqp = sp(AB).
4. Ugyanis sp(AB − BA) = sp(AB) − sp(BA) = 0, m´ıg sp(I) = n 6= 0. 5. Legyen A :=
a11 a12 a21 a22
!
, ´es vizsg´aljuk az Ax = 0 homog´en egyenletet: a11 x1 + a12 x2 = 0 a21 x1 + a22 x2 = 0
Az els˝o egyenletet a21 -gyel, a m´asodikat a11 -gyel szorozva, ´es az ´ıgy nyert egyenleteket kivonva, kapjuk, hogy: (a11 a22 − a12 a21 )x2 = 0 Haonl´oan, az els˝o egyenletet a22 -vel, a m´asodikat a12 -vel szorozva, ´es az ´ıgy nyert egyenleteket kivonva, kapjuk, hogy: (a11 a22 − a12 a21 )x1 = 0
65
Ha teh´at a determin´ans nem 0, akkor csak a trivi´alis x1 = x2 = 0 megold´as l´etezik. Ha viszont a determin´ans 0, akkor van nemtrivi´alis megold´as is. 6. (a) regul´aris (mert det(A) = 1 · 1 · 2 6= 0), (b) szingul´aris (mert det(A) = 1 · (−1 + 9) − (−1) · (−1 − 3) + 1 · (−3 − 1) = 0). Megjegyz´es: A (b) esetben a m´atrix szingularit´asa u ´gy is bel´athat´o, hogy az Ax = 0 homog´en egyenletnek van nemtrivi´alis megold´asa, pl. (2, 1, −1). 7. A sz´am´ıt´as s´em´aja a k¨ovetkez˝o:
1 4 2 2 1 −3 4 −1 −1
5 1 4 2 −1 → 0 14 7 2 0 −17 −9
5 1 4 2 1 14 → 0 1 2 0 −17 −9 −18
5 1 4 2 1 1 → 0 1 2 1 0 0 −2 −18
1 4 0 1 1 0 0 0 1 0 0 → 0 1 0 0 0 1 2 0 0 1
5 1 4 2 1 → 0 1 21 0 0 1 −1
1 0 2
A megold´as teh´at: x = 1, y = 0, z = 2. 8. A sz´am´ıt´as s´em´aja a k¨ovetkez˝o:
1 0 1 1 0 1 1 0 0 0 0 2 0 1 0 → 0 0 2 0 3 3 −1 3 2 0 0 1
1 0 0 1 0 1 0 1 0 → 0 0 2 1 0 1 0 1 1
1 0 1 3
0 0 1 0 → 0 13
Cser´elj¨ uk meg a 2. ´es 3. egyenletet (a hozz´ajuk tartoz´o jobboldalakkal egy¨ utt, hogy az elimin´aci´ot folytatni tudjuk:
1 0 1 1 0 0 1 0 1 1 1 0 1 1 3 0 3 → 0 1 1 0 0 2 0 1 0 0 0 1 Az inverz m´atrix teh´at:
1 1 3 0
1 − 21 0 1 = 3 − 12 13 1 0 0 2
A−1
66
0 0 1 0 0 1 0 3 → 0 1 0 1 0 0 0 1 2
1 1 3 0
− 12 0 − 12 13 1 0 2
5 1 → 2
9. Ha a rendszer determin´ansa nem 0, akkor a rendszer egy´ertelm˝ uen megoldhat´o. Vizsg´aljuk meg teh´at, hogy milyen t ´ert´ekek mellett z´erus a determin´ans. A determin´ans kifejt´ese: t(t2 − 1) − (t − 1) + (1 − t) = (t − 1)(t2 + t − 2) Ez´ert a determin´ans pontosan akkor z´erus, ha t = 1 vagy t2 + t − 2 = 0, azaz A t = 1 esetben az egyenlet: x + y + z = x + y + z = x + y + z = ennek pedig v´egtelen sok megold´asa van: k´et ismeretlen, pl. A t = −2 esetben az egyenlet: −2x x x
t = 1 vagy t = −2. 1 1 1
y ´es z szabadon megv´alaszthat´o, ezekut´an x = 1 − y − z. + y + z = 1 − 2y + z = −2 + y − 2z = 4
¨ Osszeadva az egyenleteket, a baloldalak ¨osszege 0, a jobboldalak´e 1, ami nem lehets´eges. Ekkor teh´at az egyenletrendszernek nincs megold´asa. 10. A karakterisztikus egyenlet:
−2 − λ 1 1 2 1 −2 − λ 1 det(A − λI) = det = (−2 − λ)[(2 + λ) − 1] − (−2 − λ − 1) + (1 + 2 + λ) = 1 1 −2 − λ = −(λ + 2)3 + 2 + λ + 2 + λ + 1 + 1 + 2 + λ = −λ3 − 6λ2 − 9λ = −λ(λ + 3)2 = 0 A saj´at´ert´ekek a karakterisztikus egyenlet gy¨okei, teh´at a 0 ´es a −3 sz´amok. A λ = 0 saj´at´ert´ekhez tartoz´o saj´atvektor a
−2 1 1 1 (A − 0 · I)s = 1 −2 s = 0 1 1 −2
67
1 homog´en egyenlet nemtrivi´alis megold´asa. Ilyen megold´as (konstans szorz´ot´ol eltekintve) egyetlenegy van, az s = 1 vektor. 1 A λ = −3 saj´at´ert´ekhez tartoz´o saj´atvektor a
1 1 1 (A + 3 · I)s = 1 1 1 s = 0 1 1 1 homog´en egyenlet alis megold´ et ismeretlen is megv´alasztat´o szabadon, ´ıgy k´et, line´arisan f¨ uggetlen megold´as is nemtrivi´ asa. Itt most k´ −1 −1 l´etezik: az s = es az s = 0 ,´ 1 vektor. 1 0 11. A karakterisztikus egyenlet: λ2 − sp(At )λ + det(At ) = λ2 − 2λ cos t + 1 = 0,
innen λ = cos t ±
√ cos2 t − 1. Val´os megold´as teh´at csak akkor van, ha | cos t| = 1, azaz, ha t = kπ alak´ u, ahol k eg´esz sz´am.
12. Ha As = λs, akkor A2 s = λAs = λ2 s, A3 s = λA2 s = λ3 s, ´es ´ıgy tov´abb, Ak s = λAk−1 s = λk s. Ha pedig A m´eg regul´aris is, akkor As = λs-b´ol s = λA−1 s, azaz A−1 s = λ−1 s k¨ovetkezik. 13. Jel¨olje A ∈ M3×3 az x → x × a lek´epez´es m´atrix´at, akkor Aa = a × a = 0. Teh´at 0 saj´at´ert´ek, a hozz˝ utartoz´o saj´atvektor pedig ´epp az a vektor. 14. Az A m´atrix pozit´ıv definit, mert determin´ansa ´es nyoma egyar´ant pozit´ıv. A B m´atrix indefinit, mert determin´ansa negat´ıv. 15. Ekkor (AB)∗ = B ∗ A∗ = BA = AB, azaz AB val´oban ¨onadjung´alt. 16. Legyen N ∈ N akkora, hogy AN = 0. Ha most λ saj´at´ert´eke A-nak, a hozz´atartoz´o saj´atvektor pedig s, akkor As = λs: innen A2 s = λAs = λ2 s, A3 s = λA2 s = λ3 s, ´es ´ıgy tov´abb, AN s = λAN −1 s = λN s. Mivel pedig AN = 0, az´ert λN s = 0, innen s 6= 0 miatt sz¨ uks´egk´epp λ = 0. 17. Legyen N ∈ N akkora, hogy AN = 0. Mivel A ´es I nyilv´an felcser´elhet˝o, a binomi´alis t´etel alkalmazhat´o az (cI + A)m m´atrixhatv´anyra,
68
´es: m
(cI + A) =
m X k=0
m k
! k m−k m−k
A c
I
=
N −1 X k=0
m k
!
cm−k Ak !
m v´egtelenbe tart A jobboldalon most m´ar a tagok sz´ama m-t˝ ol f¨ uggetlen, ´es minden tag elemenk´ent 0-hoz tart, ha m → +∞ (ui. k ugyan, ha m → +∞, de csak polinomi´alis sebess´eggel (l´ev´en m-nek egy N -n´el alacsonyabb fok´ u polinomja), m´ıg |c| < 1 miatt cm−k exponenci´alis sebess´eggel tart 0-hoz, ´ıgy kett˝oj¨ uk szorzata m´eg mindig 0-hoz tart. 18. Tegy¨ uk fel, hogy λ egy val´os saj´at´ert´eke A-nak. Legyen As = λs (s = 6 0). Szorozzuk meg az egyenl˝os´eg mindk´et oldal´at skal´arisan s-sel: hAs, si = λ||s||2 . M´asr´eszt hAs, si = hs, A∗ si = −hs, Asi = −λ||s||2 . Innen s 6= 0 miatt sz¨ uks´egk´epp λ = 0, azaz a m´atrix nem lehet regul´aris. 19. Ekkor ui. I − A saj´at´ert´ekei 1 − λ alak´ uak, ahol λ saj´at´ert´eke A-nak (val´oban, ha As = λs, akkor (I − A)s = s − λs = (1 − λ)s, ´es megford´ıtva, ha (I − A)s = (1 − λ)s, akkor ebb˝ol As = λs k¨ovetkezik). Mivel pedig |λ| < 1, az´ert 1 − λ 6= 0, teh´at I − A val´oban regul´aris. 20. Nincs. A karakterisztikus polinom ui. egy pontosan 3-fok´ u polinom, melynek hat´ar´ert´eke a −∞-ben −∞, a +∞-ben pedig +∞ (ha a harmadfok´ u tag el˝ojele pozit´ıv) ill. a −∞-ben +∞, a +∞-ben pedig −∞ (ha a harmadfok´ u tag el˝ojele negat´ıv). Mindk´et esetben legal´abb egy val´os gy¨oke van (Bolzano t´etele miatt), teh´at nem lehet mindh´arom saj´at´ert´ek tiszta k´epzetes.
69
4
T¨ obbv´ altoz´ os f¨ uggv´ enyek
Ebben a fejezetben Rn → R t´ıpus´ u f¨ uggv´enyek anal´ızis´evel foglalkozunk. L´atni fogjuk, hogy m´ar a folytonoss´ag ´es k¨ ul¨on¨osen a differenci´alhat´os´ag fogalma l´enyegesen bonyolultabb a megfelel˝o egyv´altoz´os fogalmakn´al. A sz´els˝o´ert´ek probl´em´ak eset´eben az anal´ızisbeli ´es a line´aris algebrai eszk¨oz¨ok egy term´eszetes ¨osszekapcsol´od´as´at figyelhetj¨ uk meg. V´eg¨ ul a Riemann-integr´al fogalm´at ´altal´anos´ıtjuk t¨obbv´altoz´os f¨ uggv´enyek eset´ere.
4.1
T¨ obbv´ altoz´ os f¨ uggv´ enyek bevezet´ ese
Legyen f : Rn → R egy lek´epez´es, jel¨olje Ω ⊂ Rn az ´ertelmez´esi tartom´any´at. f -et egyar´ant tekinthetj¨ uk olyan lek´epez´esnek, mely t¨ obb v´ altoz´ ohoz rendel egy sz´amot, vagy olyannak, amely vektorhoz rendel sz´amot, ahogy az ´epp k´enyelmesebb. Egy-egy konkr´et lek´epez´es megad´asa ´altal´aban explicit formul´akkal t¨ort´enik (pl. f : R2 → R, f (x, y) := ex+y ), ritk´abban implicit m´odon. Ez ut´obbi ´altal´anos alakja: g(x1 , x2 , ..., xn , y) = 0, ahol g egy (n + 1)-v´altoz´os kifejez´es. Amennyiben ebb˝ol az egyenl˝os´egb˝ol az utols´o v´altoz´o (y) egy´ertelm˝ uen kifejezhet˝o az els˝o n v´altoz´o f¨ uggv´eny´eben, akkor a fenti egyenletet ezen n-v´altoz´os f¨ uggv´eny implicit alakj´anak nevezz¨ uk. Hasonl´oan az egyv´altoz´os f¨ uggv´enyekhez, az {(x1 , x2 , ..., xn , f (x1 , ..., xn ) : (x1 , x2 , ..., xn ) ∈ Ω} ⊂ Rn+1 halmazt az f f¨ uggv´eny grafikonj´ anak nevezz¨ uk. Sajnos, ennek csak n = 1 ´es n = 2 esetben van szeml´eletes jelent´ese: el˝obbi esetben a grafikon ´altal´aban egy s´ıkg¨orbe, m´ıg a m´asodikban egy t´erbeli fel¨ ulet. K´etv´altoz´os f¨ uggv´enyek eset´eben egy m´asik szeml´eltet´esi forma a szintvonalas ´ abr´ azol´ as, ahol az ´ertelmez´esi tartom´any azon pontjait t¨ untetj¨ uk fel, melyekben a f¨ uggv´eny´ert´ekek egy-egy el˝ore meghat´arozott ´ert´ekkel egyenl˝ok (ezt a technik´at a t´erk´epeken mindm´aig el˝oszeretettel haszn´alj´ak). Ez olykor h´aromv´altoz´os f¨ uggv´enyek eset´eben is alkalmazhat´o (itt a f¨ uggv´enyt a szintfel¨ uletek rendszere szeml´elteti). Sz´am´ıt´og´epes grafika seg´ıts´eg´evel oly m´odon is lehet szeml´eltetni a f¨ uggv´enyeket, hogy az ´ertelmez´esi tartom´any ´es/vagy a grafikon pontjait az ott ´erv´enyes f¨ uggv´eny´ert´ekt˝ol f¨ ugg˝oen m´as-m´as sz´ın˝ ure sz´ınezz¨ uk. Ilyen ´abr´azol´asi m´odokat pl. a MAPLE vagy a MATLAB matematikai szoftverek messzemen˝oen t´amogatnak. P´elda: A k¨ovetkez˝o formula implicit m´odon egy olyan k´etv´altoz´os lek´epez´est defini´al, melynek grafikonja egy orig´o k¨oz´eppont´ u, egys´egnyi sugar´ u f´elg¨omb-fel¨ ulet: x2 + y 2 + z 2 − 1 = 0 (|x|, |y| ≤ 1, z ≥ 0) √ A lek´epez´es explicit alakja: z = f (x, y) = 1 − x2 − y 2 , szintvonalai pedig az xy-s´ıkon orig´o k¨ozep˝ u koncentrikus k¨or¨ok.
70
4.2
Folytonoss´ ag
A folytonoss´agot az egyv´altoz´os f¨ uggv´enyek folytonoss´ag´anak mint´aj´ara defini´aljuk. Ehhez el˝obb azonban be kell vezetni a vektorsorozatok konvergenci´aj´anak fogalm´at: (2) (n) Defin´ıci´ o: Azt mondjuk, hogy az (xm ) ⊂ Rn , xm := (x(1) espedig az x := (x(1) , x(2) , ..., x(n) ) ∈ Rn m , xm , ..., xm ) vektorsorozat konvergens, ´ (j) j (j) vektorhoz tart, ha mindegyik (xm ) komponens-sorozat tart az x limeszvektor megfelel˝o x komponens´ehez, azaz x(j) (j = 1, 2, ..., n, m → x m → +∞).
Nyilv´anval´o, hogy xm → x pontosan akkor teljes¨ ul, ha az ||xm − x|| sz´ amsorozat 0-hoz tart. Ezekut´an a folytonoss´ag m´ar neh´ezs´eg n´elk¨ ul defini´alhat´o. A defin´ıci´o l´enyege itt is – ak´arcsak egyv´altoz´os esetben – az, hogy a f¨ uggv´eny ”konvergenciatart´o” legyen: Defin´ıci´ o: Azt mondjuk, hogy az f : Ω → R f¨ uggv´eny folytonos az x ∈ Ω helyen, ha minden (xm ) ⊂ Ω, xm → x vektorsorozat eset´en f (xm ) → f (x). Sajnos, a jel¨ol´estechnika e t´eren sem egys´eges. Als´o indexszel pl. hol az Rn -beli vektorok komponenseit jel¨olj¨ uk, hol egy vektorsorozat index´et (ekkor a komponenseket jobb h´ıj´an z´ar´ojelben tett fels˝o indexekkel jel¨olj¨ uk). Elterjedt ez´ert – legal´abbis 2- ´es 3-v´altoz´os f¨ uggv´enyek eset´eben –, hogy a vektorkomponenseket k¨ ul¨onb¨oz˝o bet˝ ukkel jel¨olj¨ uk (pl. x, y, z), ekkor az index a f´elre´ert´es vesz´elye n´elk¨ ul sorozat-elemet jel¨olhet. A Lipschitz-f´ele felt´etel teljes¨ ul´ese most is elegend˝o a folytonoss´aghoz: ´ ıt´ 1. All´ as: Ha van oly C ≥ 0 sz´am, hogy minden x1 , x2 ∈ Ω eset´en |f (x1 ) − f (x2 )| ≤ C · ||x1 − x2 || teljes¨ ul, akkor f folytonos Ω minden pontj´aban. Bizony´ıt´as: Ekkor ui. minden x ∈ Ω ´es xm → x vektorsorozat eset´en |f (x) − f (xm )| ≤ C · ||x − xm || → 0, azaz f (xm ) → f (x). K¨onnyen l´athat´o, hogy a szok´asos f¨ uggv´enym˝ uveletek a folytonoss´agot megtartj´ak, azaz folytonos f¨ uggv´enyekb˝ol a szok´asos f¨ uggv´enym˝ uveletekkel nyert f¨ uggv´enyek maguk is folytonosak (ahol egy´altal´an ´ertelmezettek). S˝ot, folytonos egyv´altoz´os f¨ uggv´enyekb˝ol ”¨osszerakott” f¨ uggv´enyek szint´en folytonosak: ´ ıt´ 2. All´ as Legyenek f1 , f2 , ..., fn : R → R folytonos (egyv´altoz´os) f¨ uggv´enyek. Akkor az f (x1 , x2 , ..., xn ) := f1 (x1 ) + f2 (x2 ) + ... + fn (xn )
71
´es az f (x1 , x2 , ..., xn ) := f1 (x1 ) · f2 (x2 ) · ... · fn (xn ) el˝o´ır´assal ´ertelmezett f : Rn → R (n-v´altoz´os) f¨ uggv´enyek szint´en folytonosak. Ha pedig f : Rn → R folytonos n-v´altoz´os f¨ uggv´eny, g : R → R pedig folytonos egyv´altoz´os f¨ uggv´eny, akkor az ¨osszetett g ◦ f f¨ uggv´eny is folytonos (n-v´altoz´os) f¨ uggv´eny. K¨ovetkez´esk´epp folytonos f¨ uggv´enyekb˝ol ”k´eplettel” nem is lehet m´ast mint folytonos f¨ uggv´enyt ´ertelmezni. A defin´ıci´o egyszer˝ us´ege ellen´ere a folytonoss´ag ill. szakad´as meg´allap´ıt´asa m´ar k´etv´altoz´os esetben sem mindig mag´at´ol ´ertet˝od˝o. Jellemz˝oen az okozhat neh´ezs´eget, ha egy f¨ uggv´enyt egyes helyeken elt´er˝o m´odon defini´alunk, tipikusan ott, ahol egy formula ´ertelm´et veszti (pl. 0-val val´o oszt´as vagy negat´ıv sz´amb´ol val´o gy¨okvon´as stb. miatt). A jelens´eget k´et p´eld´an kereszt¨ ul ´erz´ekeltetj¨ uk: P´elda: (a) Tekints¨ uk az al´abbi el˝o´ır´assal ´ertelmezett k´etv´altoz´os f¨ uggv´enyt: (
f (x, y) :=
x2 y 2 x2 +y 2
ha x2 + y 2 6= 0 ha x = y = 0
0
Az orig´on k´ıv¨ ul a f¨ uggv´eny nyilv´an minden¨ utt folytonos, a k´erd´es az, hogy az orig´oban folytonos-e. Megmutatjuk, hogy f folytonos az orig´oban. Legyenek ui. xn , yn → 0 tetsz˝oleges z´erussorozatok, akkor: |f (xn , yn )| =
x2n yn2 x2n (x2n + yn2 ) ≤ = x2n → 0, x2n + yn2 x2n + yn2
teh´at f (xn , yn ) → 0 = f (0, 0), azaz f val´oban folytonos az orig´oban. (b) Tekints¨ uk most az al´abbi f¨ uggv´enyt, melyet majdnem ugyan´ ugy defini´alunk, mint az el˝obb: (
f (x, y) :=
xy x2 +y 2
ha x2 + y 2 6= 0 ha x = y = 0
0
Az orig´on k´ıv¨ ul a f¨ uggv´eny most is minden¨ utt folytonos, azonban az orig´oban nem folytonos. Hogy ezt megmutassuk, el´eg egyetlen olyan xn , yn → 0 z´erussorozat-p´art tal´alni, melyre f (xn , yn ) nem tart 0-hoz. Legyen pl. xn := yn := n1 , akkor nyilv´an xn , yn → 0, de f (xn , yn ) =
1 n 1 n2
· n1 1 1 ≡ . 2 + n2
Ez´ert f val´oban nem folytonos az orig´oban. L´athat´o teh´at, hogy a folytonoss´ag nem mindig ´allap´ıthat´o meg ”r´an´ez´esre”. Szeml´eltet´esk´ent javasoljuk az Olvas´onak, hogy a fenti k´et f¨ uggv´eny grafikonj´at ´all´ıtsa el˝o pl. a MAPLE seg´ıts´eg´evel, ´es figyelje meg az orig´o k¨or¨ uli viselked´es¨ uket. 72
4.3
T¨ obbv´ altoz´ os f¨ uggv´ enyek differenci´ alhat´ os´ aga
Az egyv´altoz´os f : R → R f¨ uggv´eny egy x ∈ R helyen vett a := f 0 (x) deriv´altj´anak szok´asos defin´ıci´oja: f (x + h) − f (x) =a h→0 h lim
´ ez a defin´ıci´o k¨onnyen a´ltal´anos´ıt´asra alkalmatlan, hiszen t¨obbv´altoz´os f f¨ uggv´eny eset´en h vektor, ´es a vele val´o oszt´as ´ertelmetlen. Am l´athat´oan ekvivalens az al´abbival: f (x + h) − f (x) − a · h lim = 0, h→0 |h| ´es ezt m´ar k¨onny˝ u ´altal´anos´ıtani. Ennek a defin´ıci´onak a szeml´eletes jelent´ese a k¨ovetkez˝o: a f¨ uggv´eny´ert´ek f (x + h) − f (x) v´altoz´asa kis h ´ert´ekek mellett j´ol k¨ozel´ıthet˝o az a · h szorzattal, abban az ´ertelemben, hogy kett˝oj¨ uk k¨ ul¨onbs´ege nemcsak, hogy 0-hoz tart, de m´eg |h|-val osztva is a 0-hoz tart, mikor h → 0. R¨oviden: f (x + h) − f (x) k¨ozel´ıt˝oen ar´anyos h-val, ´es a deriv´alt ´epp az ar´anyoss´agi t´enyez˝o. Ez a megfogalmaz´as m´ar ´ertelemszer˝ uen ´altal´anos´ıthat´o t¨obbv´altoz´os f¨ uggv´enyek eset´ere: Defin´ıci´ o: Legyen f : Ω → R egy n-v´altoz´os f¨ uggv´eny, ´es legyen x ∈ Ω az ´ertelmez´esi tartom´any bels˝ o pontja, azaz tegy¨ uk fel, hogy n nemcsak maga x, de m´eg egy x k¨oz´eppont´ u, valamely r > 0 sugar´ u {y ∈ R : ||x − y|| < r} g¨omb pontjai is mind Ω-ba esnek. Azt mondjuk, hogy az f f¨ uggv´eny differenci´alhat´o az x helyen, ´es deriv´ altja az a ∈ Rn vektor, ha f (x + h) − f (x) − ha, hi = 0. h→0 ||h|| lim
A fenti a ∈ Rn vektort az f f¨ uggv´eny x helyen vett gradiensvektor´ anak vagy r¨oviden gradiens´enek nevezz¨ uk, ´es a grad f (x) szimb´olummal (n´eha 5f (x)-szel) jel¨olj¨ uk. A deriv´altra – mint az v´arhat´o – az egyv´altoz´os deriv´althoz hasonl´o ¨osszef¨ ugg´esek igazak. Megjegyezz¨ uk azonban, hogy a defin´ıci´o gyakorlati sz´am´ıt´asokra teljesen alkalmatlan: ezt a probl´em´at majd a k¨ovetkez˝o szakaszban, a parci´alis deriv´altak fogalm´anak bevezet´es´evel k¨ usz¨ob¨olj¨ uk ki. A k¨ovetkez˝okben ¨osszefoglaljuk a t¨obbv´altoz´os deriv´alt legfontosabb tulajdons´agait. Az ´all´ıt´asok a defin´ıci´ob´ol az egyv´altoz´os esettel anal´og m´odon k¨ovetkeznek, ´ıgy a bizony´ıt´asokat elhagyjuk. ´ ıt´ 3. All´ as: Ha f, g : Ω → R differenci´alhat´ok az x ∈ Ω helyen, akkor f + g, f g ´es hogy g(x) 6= 0), ´es: grad(f + g)(x) = grad f (x) + grad g(x) 73
f g
is differenci´alhat´ok x-ben (ut´obbin´al felt´eve,
grad(f g)(x) = (grad f (x)) · g(x) + f (x) · (grad g(x)) f (grad f (x)) · g(x) − f (x) · (grad g(x)) grad (x) = g g 2 (x)
4.4
Parci´ alis ´ es ir´ anymenti deriv´ alt, a m´ asodik deriv´ alt m´ atrixa
Legyen f : Ω → R egy n-v´altoz´os f¨ uggv´eny, ´es legyen x ∈ Ω az ´ertelmez´esi tartom´any bels˝o pontja. Legyen e ∈ Rn egy tetsz˝oleges, 1 norm´aj´ u (ir´any)vektor. A k´es˝obbiekben kiemelt szerepet fog j´atszani a k¨ovetkez˝o egyv´altoz´os f¨ uggv´eny: ge (t) := f (x + t · e) Megjegyz´es: Ezeknek a ge f¨ uggv´enyeknek n = 2 eset´en igen szeml´eletes jelent´es¨ uk van. K´epzelj¨ unk el egy hegyes-v¨olgyes terepet. Ez 2 felfoghat´o egy f : R → R f¨ uggv´eny grafikonjak´ent: minden s´ıkbeli (x, y) pont eset´en f (x, y) jelentse a terepmagass´agot. Helyezz¨ unk egy megfigyel˝ot a terep (x, y, f (x, y)) pontj´ara. Ekkor a ge f¨ uggv´eny grafikonja az ezen a ponton ´athalad´o, v´ızszintesen e ir´any´ uu ´tvonal, azaz a ge f¨ uggv´eny ´ert´ekei a terepmagass´agok egy kit¨ untetett e ir´anyban. Ily m´odon egyetlen t¨obbv´altoz´os f¨ uggv´eny vizsg´alat´at visszavezetj¨ uk sok (m´eghozz´a v´egtelen sok) egyv´ altoz´ os f¨ uggv´eny egyidej˝ u vizsg´alat´ara. Els˝o eredm´eny¨ unk ezen ge f¨ uggv´enyek deriv´altjaira vonatkozik. A sz´ohaszn´alat egyszer˝ us´ıt´ese ´erdek´eben bevezetj¨ uk egy x ∈ Rn pont k¨ ornyezet´enek fogalm´at: ezalatt egy tetsz˝oleges olyan Rn -beli halmazt ´ert¨ unk, mely tartalmaz egy x k¨oz´eppont´ u (nemnulla sugar´ u) g¨omb¨ot. Ily m´odon R-ben egy x sz´am k¨ornyezete olyan sz´amhalmaz, mely tartalmaz egy x k¨oz´eppont´ u, pozit´ıv hossz´ us´ag´ u intervallumot. ´ ıt´ 4. All´ as: Ha az f : Ω → R differenci´alhat´o az x ∈ Ω bels˝o pont egy k¨ornyezet´eben, akkor az ¨osszes fenti ge f¨ uggv´eny differenci´alhat´o a 0 egy k¨ornyezet´eben, ´espedig: ge0 (t) = hgrad f (x + t · e), ei Bizony´ıt´as: Legyen τ ∈ R tetsz˝oleges, ´ırjuk fel a ge -re vonatkoz´o k¨ ul¨onbs´egi h´anyadost: g(t + τ ) − g(t) f (x + te + τ e) − f (x + te) f (x + te + τ e) − f (x + te) − hgrad f (x + t · e), τ ei |τ | = = · + hgrad f (x + t · e), ei τ τ ||τ e|| τ Jel¨olje h := τ e, akkor innen: g(t + τ ) − g(t) f (x + te + h) − f (x + te) − hgrad f (x + t · e), hi |τ | = · + hgrad f (x + t · e), ei τ ||h|| τ
74
Ha most τ → 0, akkor h → 0; ekkor a jobboldal els˝o tagja az f f¨ uggv´eny deriv´alhat´os´aga miatt 0-hoz tart, m´ıg a baloldal ge0 (t)-hez. Innen az ´all´ıt´as ad´odik. Megjegyz´es: Az ´all´ıt´as voltak´eppen az ¨osszetett f¨ uggv´eny deriv´al´asi szab´aly´at ´altal´anos´ıtja. A fenti ge f¨ uggv´eny ui. f -nek ´es a t → x + te vektor´ert´ek˝ u f¨ uggv´enynek a kompoz´ıci´oja. Ez ut´obbi f¨ uggv´eny deriv´altj´at ´ertelemszer˝ uen e-nek defini´alva, az ´all´ıt´as pontos megfelel˝oje az ¨osszetett f¨ uggv´eny deriv´altj´ara vonatkoz´o formul´anak (a szorz´as szerep´et a skal´aris szorzat veszi ´at). A dolog tov´abb ´altal´anos´ıthat´o: legyen h := (h1 , ..., hn ) : R → Rn egy vektorf¨ uggv´eny, ahol a hj komponensf¨ uggv´enyek differenci´alhat´o egyv´altoz´os f¨ uggv´enyek. A h vek0 0 0 torf¨ uggv´eny deriv´altj´at h := (h1 , ..., hn )-nek defini´alva, k¨onnyen megmutathat´o, hogy az f ◦ h ¨osszetett f¨ uggv´eny deriv´altja egy t helyen a hgrad f (h(t)), h0 (t)i sz´am. Erre az ´altal´anosabb eredm´enyre azonban e jegyzet keretein bel¨ ul nem lesz sz¨ uks´eg¨ unk. Elnevez´es: A fenti ge f¨ uggv´eny 0-ban vett deriv´altj´at az f f¨ uggv´eny x-ben vett e ir´any menti deriv´altj´anak nevezz¨ uk, ´es a ´ (ritk´abban ∂e f (x)-szel) jel¨olj¨ uk. A 4. All´ıt´as ´ertelm´eben teh´at:
∂f (x) ∂e
szimb´olummal
∂f (x) = hgrad f (x), ei ∂e Az ´all´ıt´as egy´ uttal a gradiensvektor komponenseinek k´enyelmes kisz´am´ıt´as´ara is alkalmas. Legyen e := ek , (ahol e1 , ..., en jel¨oli Rn standard b´azis´at). Akkor ge deriv´altja egy, csak a k-adik xk v´altoz´ora vonatkoz´o k¨ ul¨onbs´egi h´anyados hat´ar´ert´eke. Ugyanakkor hgrad f (x), ei ´epp a gradiensvektor k-adik komponense. Kaptuk teh´at, hogy a gradiensvektor k-adik komponens´et u ´gy sz´ am´ıthatjuk ki, hogy f -et mint egyv´ altoz´ os f¨ uggv´enyt deriv´aljuk, csak a k-adik v´ altoz´ ot tekintve ”val´ odi” v´ altoz´ onak, m´ıg az ¨ osszes t¨ obbit konstansnak tekintj¨ uk. ∂f (x) szimb´olummal Elnevez´es: Az ek ir´any menti deriv´altat az f f¨ uggv´eny k-adik v´altoz´oja szerinti parci´ alis deriv´ altj´ anak nevezz¨ uk, ´es a ∂x k 0 jel¨olj¨ uk. Tov´abbi haszn´alatos jel¨ol´esek: Dk f (x), ∂k f (x), fxk (x). Ha a v´altoz´okat nem indexszel, hanem k¨ ul¨on bet˝ ukkel jel¨olj¨ uk (tipikusan ∂f 0 x, y, z), akkor a parci´alis deriv´altakat ´ertelemszer˝ uen ´ıgy jel¨olj¨ uk: ∂x , ∂x f , fx , ´es ´ıgy tov´abb.
Ezeket a fogalmakat haszn´alva, azt kaptuk, hogy a gradiensvektor komponensei a parci´alis deriv´altak (az ´attekinthet˝os´eg kedv´e´ert az argumentumokat elhagyva): grad f = (D1 f, D2 f, ..., Dn f )
1. P´elda: Legyen f (x, y, z) := x2 sin(5y + z 3 ), akkor ∂f = 2x sin(5y + z 3 ) ∂x 75
∂f = 5x2 cos(5y + z 3 ) ∂y ∂f = 3z 2 x2 cos(5y + z 3 ) ∂z
2. P´elda: Legyen f : Rn → R, f (x) := ||x||2 =
Pn
j=1
x2j . Akkor k = 1, 2, ..., n-re ∂f = 2xk , ∂xk
innen pedig: grad f (x) = 2x
3. P´elda: Legyen f : Rn → R, f (x) := ||x|| =
qP
n j=1
x2j . Akkor k = 1, 2, ..., n-re ∂f 2xk = qPn , 2 ∂xk 2 x j=1 j
azaz: grad f (x) =
x ||x||
4. P´elda: Legyen f : Rn → R, f (x) := hAx, xi, ahol A = [akj ] ∈ Mn×n egy ¨onadjung´alt m´atrix. Alkalmazzuk most a t¨obbv´altoz´os f¨ uggv´enyek deriv´altj´anak defin´ıci´oj´at: tetsz˝oleges h ∈ Rn eset´en f (x + h) − f (x) = hAx + Ah, x + hi − hAx, xi = hAx, xi + hAx, hihAh, xi + hAh, hi − hAx, xi = 2hAx, hi + hAh, hi Mivel pedig a Cauchy-egyenl˝otlens´eg miatt | hAh,hi| ≤ ||h|| ´espedig:
||Ah||·||h|| ||h||
= ||Ah|| → 0, ha h → 0, az´ert innen a gradiensvektor m´ar meghat´arozhat´o,
grad f (x) = 2Ax. 76
A gradiensvektornak – legal´abbis n = 2 ´es n = 3 esetben – szeml´eletes jelent´ese van, de ez elt´er az egyv´altoz´os f¨ uggv´enyek deriv´altj´anak jelent´es´et˝ol: ´ ıt´ 5. All´ as: A gradiensvektor a f¨ uggv´eny legmeredekebb v´ altoz´ as´ anak ir´ any´ aba mutat, azaz tetsz˝oleges e ∈ Rn egys´egvektor eset´en ∂f (x) ∂e
≤
∂f ∗ (x) , ∂e
ahol e∗ a grad f (x) ir´anyba mutat´o egys´egvektor (felt´eve, hogy grad f (x) 6= 0). grad f (x) , innen a jobboldal: Bizony´ıt´as: Nyilv´an e∗ = ||grad f (x)|| ∂f ∗ (x) ∂e
=
hgrad f (x), grad f (x)i = ||grad f (x)|| ||grad f (x)||
A baloldali kifejez´es pedig: ∂f (x) ∂e
= |hgrad f (x), ei|
Az ´all´ıt´as most m´ar a Cauchy-egyenl˝otlens´eg egyenes k¨ovetkezm´enye. V´eg¨ ul a m´asodrend˝ u deriv´altat ´altal´anos´ıtjuk t¨obbv´altoz´os f¨ uggv´enyekre. Tegy¨ uk fel, hogy az f : Ω → R f¨ uggv´eny az x ∈ Ω bels˝o pontban k´etszer differenci´alhat´o, azaz mindegyik parci´alis deriv´altf¨ uggv´enye differenci´alhat´o. K´epezz¨ uk a xj szerinti parci´alis deriv´altf¨ uggv´eny xk szerinti parci´alis deriv´altj´at az x helyen (j, k = 1, 2, ..., n). Az ´ıgy kapott sz´amokat az f f¨ uggv´eny x helyen vett m´ asodrend˝ u parci´ alis ∂2f 00 deriv´ altjainak nevezz¨ uk, ´es a ∂xk ∂xj (x) szimb´olummal jel¨olj¨ uk. Tov´abbi haszn´alatos jel¨ol´esek: Dk Dj f (x), Dkj f (x), ∂kj f (x), fxk xj (x). Ha j = k, akkor a megfelel˝o, u ´n. tiszta m´ asodrend˝ u parci´ alis deriv´ altakat m´eg ´ıgy is jel¨olik: eset´en a Dk Dj f (x) deriv´altakat vegyes m´ asodrend˝ u parci´ alis deriv´ altaknak is nevezik.)
∂2f (x) ∂x2k
vagy Dk2 f (x). (Megk¨ ul¨onb¨oztet´es¨ ul, j 6= k
Elnevez´es: A m´asodrend˝ u parci´alis deriv´altakb´ol ¨ossze´all´ıtott
D2 f (x) :=
D11 f (x) D12 f (x) D21 f (x) D22 f (x) ... ... Dn1 f (x) Dn2 f (x) 77
... D1n f (x) ... D2n f (x) ... ... ... Dnn f (x)
∈ Mn×n
m´atrixot az f f¨ uggv´eny x helyen vett m´ asodik deriv´ alt m´ atrix´ anak vagy Hesse-f´ele m´ atrix´ anak nevezz¨ uk. ´ enyes ui. az al´abbi t´etel, melyet bizony´ıt´as n´elk¨ A Hesse-m´atrix a legt¨obb gyakorlati esetben ¨ onadjung´ alt (szimmetrikus). Erv´ ul k¨ozl¨ unk: 6. T´ etel: Ha az f f¨ uggv´eny m´asodrend˝ u parci´alis deriv´altjai mind l´eteznek ´es folytonosak valamely x ∈ Ω pontban, akkor ott Dkj f (x) = Djk f (x), azaz a parci´alis deriv´al´asok sorrendje felcser´elhet˝o. P´elda: Verifik´aljuk a fenti t´etelt a k¨ovetkez˝o konkr´et esetben. Legyen f (x, y) := x6 + x2 sin y 4 + e2y . Akkor: ∂f = 6x5 + 2x sin y 4 , ∂x
∂f = 4x2 y 3 cos y 4 + 2e2y ∂y
innen pedig: ∂2f = 8xy 3 cos y 4 , ∂y∂x
4.5
´es
∂2f = 8xy 3 cos y 4 . ∂x∂y
T¨ obbv´ altoz´ os f¨ uggv´ enyek lok´ alis sz´ els˝ o´ ert´ ekei
Defin´ıci´ o: Azt mondjuk, hogy az f : Ω → R f¨ uggv´enynek lok´ alis maximuma (ill. minimuma) van az x0 ∈ Ω pontban, ha x0 -nak van olyan Ω0 k¨ornyezete, hogy f (x) ≤ f (x0 ) (ill. f (x) ≥ f (x0 )) teljes¨ ul minden x ∈ Ω0 eset´en. A k¨ovetkez˝o t´etel pontos analogonja az egyv´altoz´os f¨ uggv´enyekre vonatkoz´o megfelel˝o t´etelnek: 7. T´ etel: Ha az f f¨ uggv´eny differenci´alhat´o az Ω ´ertelmez´esi tartom´any egy x0 bels˝o pontj´aban, ´es ott lok´alis sz´els˝o´ert´eke (maximuma vagy minimuma) van, akkor x0 -ban mindegyik parci´alis deriv´alt elt˝ unik, azaz grad f (x0 ) = 0. Bizony´ıt´as: Tekints¨ uk Rn -ben az ek standard b´azisvektort, ´es jel¨olje gk (t) := f (x0 + t · ek ). K¨onnyen l´athat´o, hogy gk -nak a 0-ban szint´en ´ ıt´as ´ertelm´eben ez´ert gk0 (0) = hgrad f (x0 ), ek i = Dk f (x0 ) = 0. sz´els˝o´ert´eke van (´espedig ugyanolyan t´ıpus´ u, mind f -nek x0 -ban). A 4. All´ Ez igaz minden k = 1, 2, ..., n-re, ´es ezzel az ´all´ıt´ast igazoltuk. A t´etel megford´ıt´asa nem igaz! Abb´ol, hogy egy f¨ uggv´enynek valahol mindegyik parci´alis deriv´altja elt˝ unik, ´altal´aban nem k¨ovetkezik, hogy ott a f¨ uggv´enynek lok´alis sz´els˝o´ert´eke lenne. Ellenp´eldak´ent tekints¨ uk az f (x, y) := x2 − y 2 el˝o´ır´assal ´ertelmezett f¨ uggv´enyt. Az orig´oban a f¨ uggv´eny´ert´ek ´es mindk´et parci´alis deriv´alt z´erussal egyenl˝o, a f¨ uggv´enynek itt m´egsincs sz´els˝o´ert´eke: minden x 6= 0, y = 0 78
8.´abra: P´elda nyeregfel¨ uletre ´es nyeregpontra koordin´at´aj´ u helyen f pozit´ıv, m´ıg minden x = 0, y 6= 0 helyen negat´ıv ´ert´eket vesz fel. Szeml´eletesen: a f¨ uggv´enynek az orig´oban az (1, 0) ir´any szerint lok´alis minimuma, m´ıg a (0, 1) ir´any szerint lok´alis maximuma van. Az ilyen tulajdons´ag´ u helyet nyeregpontnak nevezz¨ uk. Az elnevez´est a fenti f¨ uggv´eny grafikonj´anak nyeregfel¨ uletre eml´ekeztet˝o alakja indokolja (ld. a 8. ´abr´at). Most megmutatjuk, hogy – az egyv´altoz´os esethez hasonl´oan – ha az els˝orend˝ u parci´alis deriv´altak elt˝ un´es´en k´ıv¨ ul a m´asodik deriv´altra tov´abbi felt´etelek teljes¨ ulnek, akkor ez m´ar biztos´ıtja a sz´els˝o´ert´ekhely l´etez´es´et, s˝ot, a sz´els˝o´ert´ek jellege is eld¨onthet˝o. Figyelj¨ uk meg, hogy m´ıg egyv´altoz´os esetben ehhez el´eg volt a m´asodik deriv´alt el˝ ojel´et vizsg´alni, addig t¨obbv´altoz´os esetben a m´asodik deriv´alt m´atrix definits´eg´enek vizsg´alata sz¨ uks´eges. 8. T´ etel: Ha az f f¨ uggv´eny k´etszer folytonosan differenci´alhat´o az Ω ´ertelmez´esi tartom´any egy x0 bels˝o pontj´aban, grad f (x0 ) = 0, 2 tov´abb´a a D f (x0 ) Hesse-m´atrix definit, akkor f -nek az x0 helyen biztosan lok´alis sz´els˝o´ert´eke van, ´espedig lok´alis minimuma, ha D2 f (x0 ) pozit´ıv definit, ill. lok´alis maximuma, ha D2 f (x0 ) negat´ıv definit. f -nek nincs sz´els˝o´ert´eke (m´egpedig nyeregpontja van), ha D2 f (x0 ) indefinit. Bizony´ıt´as: Legyen e = (e1 , e2 , ..., en ) ∈ Rn tesz˝oleges egys´egvektor. Vezess¨ uk be most is a ge (t) := f (x0 + t · ek ) el˝o´ır´assal ´ertelmezett ´ ıt´as k¨ovetkezt´eben f¨ uggv´enyt. A 4. All´ ge0 (t) = hgrad f (x0 + t · e), ei =
n X
Dj f (x0 + t · e) · ej ,
j=1
ez´ert ge0 (0) = 0. ´ ıt´ast (most m´ar a parci´alis deriv´altf¨ uggv´enyekre), M´eg egyszer deriv´alva ge -t, a jobboldali szumma minden tagj´aban u ´jra alkalmazhatjuk a 4. All´ 79
innen a t = 0 helyen: ge00 (0)
=
n X
hgrad Dj f (x0 ), ei =
j=1
n X n X
Dkj f (x0 ) · ej · ek
k=1 j=1
´ Amde a jobboldalon, mint az k¨onnyen ellen˝orizhet˝o, ´epp a Hesse-m´atrix kvadratikus alakja ´all (az e vektorra alkalmazva), azaz ge00 (0) = hD2 f (x0 )e, ei Ezekut´an a t´etel ´all´ıt´asa m´ar egyszer˝ uen l´athat´o. M´ar tudjuk, hogy ge0 (0) = 0. Ha most D2 f (x0 ) pozit´ıv definit, akkor ge00 (0) > 0, ´ıgy az egyv´altoz´os ge f¨ uggv´enynek a 0-ban lok´alis minimuma van. Ez igaz minden e ir´ anyra, ´ıgy f -nek x0 -ban val´oban lok´alis minimuma van. A lok´alis minimum esete ugyan´ıgy l´athat´o be. V´eg¨ ul, ha D2 f (x0 ) indefinit, akkor a kvadratikus alak pozit´ıv ´es negat´ıv ´ert´eket egyar´ant felvesz, teh´at van olyan ir´any mely szerint x0 -ban f -nek lok´alis minimuma, ´es olyan ir´any is, mely szerint lok´alis maximuma van, azaz x0 nyeregpontja f -nek: ekkor teh´at nincs lok´alis sz´els˝o´ert´ek. Speci´ alis eset: K´etv´altoz´os f¨ uggv´enyek eset´eben a Hesse-m´atrix 2 × 2-es m´atrix, melynek definits´eg´et az el˝oz˝o fejezet 19. K¨ovetkezm´enye alapj´an nagyon k¨onny˝ u eld¨onteni. Innen nyerj¨ uk a k´etv´altoz´os f¨ uggv´enyekre vonatkoz´o al´abbi t´etelt: 9. K¨ ovetkezm´ eny: Ha a k´etv´altoz´os f f¨ uggv´eny k´etszer folytonosan differenci´alhat´o az Ω ´ertelmez´esi tartom´any egy (x0 , y0 ) bels˝o ∂f pontj´aban, ∂f (x , y ) = (x , y ) = 0, tov´ a bb´a a D2 f (x0 ) Hesse-m´atrix determin´ansa pozit´ıv, akkor f -nek az (x0 , y0 ) helyen biztosan 0 0 0 0 ∂x ∂y lok´alis sz´els˝o´ert´eke van, ´espedig lok´alis minimuma, ha m´eg sp(D2 f (x0 , y0 )) > 0, ill. lok´alis maximuma, ha m´eg sp(D2 f (x0 , y0 )) < 0 is teljes¨ ul. f -nek nincs sz´els˝o´ert´eke (m´egpedig nyeregpontja van), ha a D2 f (x0 ) Hesse-m´atrix determin´ansa negat´ıv. A fenti t´eteleket n´eh´any p´eld´aval illusztr´aljuk: 1. P´elda: Keress¨ uk meg az f (x, y) := 2x2 − xy − 3y 2 + 5x − 1 el˝o´ır´assal ´ertelmezett k´etv´altoz´os f¨ uggv´eny lok´alis sz´els˝o´ert´ekeit. Megold´ as: Az els˝orend˝ u parci´alis deriv´altak: ∂f = 4x − y + 5, ∂x
∂f = −x − 6y. ∂y
Innen kapjuk, hogy a Hesse-m´atrix konstans m´atrix: 2
D f (x, y) =
80
4 −1 −1 −6
!
Lok´alis sz´els˝o´ert´ek ott lehet, ahol mindk´et parci´alis deriv´alt elt˝ unik: azonban e hely(ek)et fel sem ´erdemes t´erk´epezni, mert a Hesse-m´atrix minden¨ utt negat´ıv definit (mert determin´ansa negat´ıv), ´ıgy lok´alis sz´els˝o´ert´ek sehol sincs, a f¨ uggv´enynek nyeregpontja van ott, ahol az els˝orend˝ u parci´alis deriv´altak elt˝ unnek. 2. P´elda: Legyenek (x1 , y1 ), (x2 , y2 ), ..., (xN , yN ) ∈ R2 adott s´ıkbeli pontok. Keress¨ uk azt az (x, y) ∈ R2 pontot, melyre a N X
((x − xj )2 + (y − yj )2 )
j=1
t´avols´ag-n´egyzet¨osszeg a lehet˝o legkisebb. P 2 2 Megold´ as: Jel¨olje f (x, y) := N ıgy defini´alt k´etv´altoz´os f f¨ uggv´eny minimumhely´et. j=1 ((x − xj ) + (y − yj ) ), meg kell keresni az ´ Minimumhely ott lehet, ahol mindk´et parci´alis deriv´alt elt˝ unik, azaz N X ∂f = 2 (x − xj ) = 0, ∂x j=1
ahonnan x = Hesse-m´atrix
1 N
PN
j=1
xj , y =
1 N
PN
j=1
N X ∂f = 2 (y − yj ) = 0, ∂y j=1
yj , teh´at (x, y) a pontrendszer s´ ulypontja. Itt pedig f -nek val´oban lok´alis minimuma van, mert a 2
D f (x, y) =
2N 0 0 2N
!
= 2N · I
nyilv´an pozit´ıv definit. Megjegyz´esek: (a) A fenti p´elda nemcsak az R2 s´ıkon defini´alhat´o, hanem Rn -ben is (tetsz˝oleges n ∈ N-re): a minimumhelyet mindig az adott vektorrendszer s´ ulypontja adja. (b) A p´elda a t´avols´agn´egyzetek ¨osszeg´enek minimaliz´al´as´ara vonatkozik. A t´ avols´ ag¨ osszegek minimaliz´al´asa eg´eszen m´as – ´es sokkal nehezebb – feladat! 3. P´elda: Egy kerti (t´eglatest alak´ u) medenc´et szeretn´enk ´ep´ıteni. A medence bels˝o oldalait ki kell csemp´ezni. Hogyan v´alasszuk meg a medence m´ereteit, hogy a t´erfogata 32 m3 , a csemp´ez´es k¨olts´ege (ami a kicsemp´ezend˝o fel¨ ulettel egyenesen ar´anyosnak vehet˝o) pedig a lehet˝o legkisebb legyen? Megold´ as: Jel¨olje x, y a medence alapj´anak m´ereteit, z pedig a m´elys´eg´et. Akkor kicsemp´ezend˝o fel¨ ulet nagys´aga: F = xy + 2xz + 2yz 81
Azonban x, y ´es z nem f¨ uggetlenek, a t´erfogat el˝o´ırt: V = xyz, ahonnan az egyik hossz´ us´agadat pl. z kifejezhet˝o a m´asik kett˝o f¨ uggv´eny´eben: V . Ezt be´ırva a fel¨ uletet megad´o formul´aba, F m´ar csak x-t˝ol ´es y-t´ol f¨ ugg: z = xy F (x, y) = xy +
2V 2V + y x
Ezzel a kifejez´essel ´ertelmezett f¨ uggv´enyt kell minimaliz´alni. Sz´els˝o´ert´ek ott lehet, ahol mindk´et parci´alis deriv´alt elt˝ unik, azaz: ∂F 2V =y− 2 =0 ∂x x ∂F 2V =x− 2 =0 ∂y y Ennek az x, y-ra√n´ezve nemline´aris egyenletnek megold´as´ara nyilv´an teljes¨ ul, hogy x2 y = xy 2 = V , ahonnan egyetlen megold´as ad´odik, 3 ´espedig x = y = 2V . Sz´am´ıtsuk ki a Hesse-m´atrixot: 2
D F (x, y) = 2
− 4V x3 1
1 − 4V y3
!
2
Ennek determin´ansa a fenti helyen: 16V − 1 = 16V − 1 = 3, azaz pozit´ıv. Nyoma nyilv´an negat´ıv, ´ıgy a fenti helyen val´oban lok´alis x3 y 3 4V 2 minimum van. A konkr´et adatokkal: x = y = 4 m, ahonnan a medence m´elys´ege: z = 2 m. 4. P´elda: Szimmetrikus trap´ez keresztmetszet˝ u egyenes csatorn´at ´ep´ıt¨ unk. Bels˝o oldalait (minden¨ utt azonos vastags´aggal) ki kell betonozni. Hogyan v´alasszuk meg a trap´ez m´ereteit, hogy a csatorna keresztmetszete el˝o´ırt T nagys´ag´ u, a betonoz´as foly´om´eterenk´enti k¨olts´ege pedig a lehet˝o legkisebb legyen? Megold´ as: Jel¨olje a a csatorna sz´eless´eg´et a fen´eken (azaz a trap´ez r¨ovidebb p´arhuzamos oldal´at), b a csatorna oldalfal´anak hossz´at (azaz a trap´ez sz´arait). Jel¨olje tov´abb´a m a csatorna m´elys´eg´et (a trap´ez magass´ag´at), α pedig az oldalfal lejt´esi sz¨og´et (a trap´ez sz´ara ´es hosszabbik p´arhuzamos oldala ´altal bez´art sz¨oget). A foly´om´eterenk´enti betonoz´asi k¨olts´eg nyilv´an ar´anyos az (a + 2b) hossz-¨osszeggel, ezt ´ a ´es b egym´ast´ol nem f¨ kell teh´at minimaliz´alni. Am uggetlenek, a trap´ez T ter¨ ulete el˝o´ırt. C´elszer˝ u ´att´erni az m ´es az α v´altoz´okra, azaz minden adatot ezek f¨ uggv´eny´eben kifejezni. Elemi trigonometriai ¨osszef¨ ugg´esek alapj´an: 2a + 2b cos α · m = (a + b cos α) · m 2 Az els˝o egyenl˝os´egb˝ol b azonal kifejezhet˝o: ezt be´ırva a m´asodik egyenl˝os´egbe, ezekut´an onnan a is kifejezhet˝o m ´es α seg´ıts´eg´evel: m = b sin α,
T =
b=
m , sin α
a= 82
T − m · ctg α m
´Igy a minimaliz´aland´o (a + 2b) mennyis´eg is kifejezhet˝o m ´es α f¨ uggv´eny´eben: f (m, α) :=
T 2m − m · ctg α + m sin α
Sz´els˝o´ert´ek ott lehet, ahol az els˝orend˝ u parci´alis deriv´altak elt˝ unnek, azaz ahol ∂f m 2m cos α 1 − 2 cos α = − =m· =0 2 2 ∂α sin α sin α sin2 α ∂f T 2 = − 2 − ctg α + =0 ∂m m sin α Az els˝o egyenletb˝ol azonnal kapjuk, hogy cos α = 21 , azaz α = 60◦ . Ezt be´ırva a m´asodik egyenletbe, m is sz´am´ıthat´o: m = A m´asodrend˝ u deriv´altakat kisz´am´ıtva a fenti α, m ´ert´ekek mellett, kapjuk, hogy:
q
T √ . 3
∂2f 2 sin3 α − (1 − 2 cos α) · 2 sin α cos α >0 =m· ∂α sin4 α ∂2f 2T = 3 >0 ∂m m ∂2f 1 − 2 cos α = =0 ∂α∂m sin2 α Ez´ert a Hesse-m´atrix pozit´ıv definit (mert determin´ansa ´es nyoma is pozit´ıv), ´ıgy f -nek a fenti helyen val´oban lok´alis minimuma van. A minimumhoz tartoz´o a, b ´ert´ekek a,qb kifejez´eseib˝ol most m´ar minden tov´abbi n´elk¨ ul ad´odnak. A r´eszletsz´am´ıt´asok levezet´es´et az √ 2 Olvas´ora b´ızzuk. Az eredm´eny: a = b = 3 T 3.
4.6
Felt´ eteles sz´ els˝ o´ ert´ ek feladatok
Az el˝oz˝o szakasz k´et utols´o p´eld´aj´an is megfigyelhet˝o, hogy a gyakorlati sz´els˝o´ert´ek feladatokban el´egg´e tipikus, hogy a sz´oba j¨ohet˝o ”v´altoz´ok” nem f¨ uggetlenek, k¨oz¨ott¨ uk valamilyen k´enyszerkapcsolat el˝o´ırt: a 3. P´elda eset´eben a medence t´erfogata, a 4. P´elda eset´eben pedig a csatorna keresztmetszete. Ilyenkor az egyik lehets´eges megold´asi technika az, amit az el˝oz˝o szakaszban alkalmaztunk: a k´enyszerfelt´eteli egyenl˝os´egb˝ol kifejezz¨ uk az egyik v´altoz´ot, ´es ezt be´ırjuk az illet˝o v´altoz´o ¨osszes el˝ofordul´asi hely´ere. Egy m´asik – bizonyos ´ertelemben sokkal term´eszetesebb – megold´asi m´odszer a probl´em´at u ´n. felt´eteles sz´els˝ o´ert´ek feladatk´ent kezelni, melyet az al´abbiakban v´azolunk. 83
Defin´ıci´ o: Legyenek f, g : Rn → R adott f¨ uggv´enyek. Azt mondjuk, hogy az f f¨ uggv´enynek az x0 ∈ Rn helyen lok´ alis felt´eteles maximuma (ill. minimuma) van a g(x) = 0 felt´etel mellett, ha g(x0 ) = 0, ´es x0 -nak van oly Ω0 k¨ornyezete, hogy minden olyan x ∈ Ω0 eset´en, melyre g(x) = 0, teljes¨ ul, hogy f (x) ≤ f (x0 ) (ill. f (x) ≥ f (x0 )). ´Igy pl. az el˝oz˝o szakasz 3. P´eld´aj´aban a felt´etel az, hogy a medence t´erfogata 32 m3 legyen, azaz most g(x, y, z) = xyz − 32. A felt´eteles sz´els˝o´ert´ekek l´etez´es´ere ad sz¨ uks´eges felt´etelt az al´abbi alapvet˝o jelent˝os´eg˝ u t´etel, mely az u ´n. Lagrange-f´ele multiplik´ ator m´ odszert alapozza meg: 10. T´ etel: Ha f, g : Rn → R folytonosan differenci´alhat´o f¨ uggv´enyek az x0 ∈ Rn pont egy k¨ornyezet´eben, f -nek x0 -ban lok´alis felt´eteles sz´els˝o´ert´eke van a g(x) = 0 felt´etel mellett, tov´abb´a grad g(x0 ) 6= 0, akkor a grad f (x0 ) ´es a grad g(x0 ) vektorok p´arhuzamosak, azaz van oly λ ∈ R sz´am (az u ´n. Lagrange-f´ele multiplik´ ator vagy Lagrange-szorz´ o), hogy grad f (x0 ) = λ · grad g(x0 ) Bizony´ıt´as: A szigor´ u bizony´ıt´as meghaladja e jegyzet kereteit, mert itt nem t´argyalt t´etelekre ´ep¨ ul. R¨oviden v´azolunk viszont egy nem eg´eszen korrekt levezet´est, mely mindazon´altal j´ol szeml´elteti a t´etel elm´eleti h´atter´et. Csak a felt´eteles maximum eset´evel foglalkozunk, a felt´eteles minimum esete hasonl´oan kezelhet˝o. A t¨obbv´altoz´os deriv´alt defin´ıci´oj´ab´ol ad´od´oan, x0 egy kis k¨ornyezet´eben l´ev˝o x := x0 + h alak´ u vektorokra: g(x) ≈ g(x0 ) + hgrad g(x0 ), hi. ´Igy teh´at a g(x) = 0 felt´etel nem minden x-re teljes¨ ul x0 egy k¨ornyezet´eb˝ol, hanem csak azokra, melyek x = x0 + h alak´ uak, ahol hgrad g(x0 ), hi = 0, azaz h ortogon´alis a gradiensvektorra. Ezekre a h-kra teljes¨ ul, hogy f (x0 + h) ≤ f (x0 ) ´ Amde f (x0 + h) ≈ f (x0 ) + hgrad f (x0 ), hi, innen kapjuk, hogy minden (el´eg kis norm´aj´ u) grad g(x0 )-ra ortogon´alis h vektor eset´en f (x0 ) + hgrad f (x0 ), hi ≤ f (x0 ), azaz: hgrad f (x0 ), hi ≤ 0 h hely´ebe (−h)-t ´ırva, ellenkez˝o ir´any´ u egyenl˝otlens´eget kapunk. Mindk´et egyenl˝otlens´eg csak u ´gy teljes¨ ulhet, ha minden (el´eg kis norm´aj´ u) grad g(x0 )-ra ortogon´alis h vektor eset´en hgrad f (x0 ), hi = 0, 84
azaz a grad f (x0 ) vektor ortogon´alis az ¨osszes ilyen h-ra. Ebb˝ol m´ar k¨ovetkezik, hogy a grad f (x0 ) ´es a grad g(x0 ) vektorok sz¨ uks´egk´epp egym´as sz´amszorosai. Javasoljuk az Olvas´onak, hogy a fenti ”bizony´ıt´ast” gondolja ´at n ≤ 3 eset´en (amikor az ortogonalit´as a geometriai mer˝olegess´eggel egyezik, ´ıgy a dolog el´egg´e szeml´eletes) olyan felt´etel mellett, amikor g els˝ofok´ u polinom, azaz a g(x) = 0 felt´etelt egy egyenes vagy egy s´ık pontjai teljes´ıtik. Ekkor a k´ıv´ant eredm´eny korrekt m´odon levezethet˝o. A t´etel gyakorlati alkalmaz´asa rendszerint a k¨ovetkez˝o s´em´aban foglalhat´o ¨ossze. Bevezetve az L(x, λ) := f (x) − λ · g(x) formul´aval ´ertelmezett (n + 1)-v´altoz´os f¨ uggv´enyt (a Lagrange-f¨ uggv´enyt), fel´ırjuk ´es megoldjuk az al´abbi, ´altal´aban nemline´aris egyenletrendszert: ∂L ∂f ∂g (x, λ) = (x) − λ · (x) = 0 (k = 1, 2, ..., n) ∂xk ∂xk ∂xk ∂L (x, λ) = −g(x) = 0 ∂λ A felt´eteles sz´els˝o´ert´ekhely(ek) a megold´asok k¨oz¨ott van(nak): ez(eke)t azt´an k¨ ul¨on-k¨ ul¨on kell vizsg´alni ´es meg´allap´ıtani, hogy ott val´oban felt´eteles sz´els˝o´ert´ek van-e, ´es ha igen, milyen t´ıpus´ u. A m´odszert n´eh´any p´eld´an kereszt¨ ul szeml´eltetj¨ uk. 1. P´elda: Keress¨ uk meg az f (x, y) := 2xy kifejez´essel ´ertelmezett f¨ uggv´eny felt´eteles maximumhely´et a g(x, y) := x + 3y − 12 = 0 felt´etel mellett. 1. Megold´as: A probl´em´at visszavezethetj¨ uk felt´etel n´elk¨ uli sz´els˝o´ert´ek feladatra. A felt´etelb˝ol pl. x kifejezhet˝o: x = 12 − 3y, ezt visszahelyettes´ıtve f kifejez´es´ebe, egyv´altoz´os sz´els˝o´ert´ek feladatot nyer¨ unk: f (20 − 3y, y) = 2 · (12 − 3y)y = 24y − 6y 2 =: F (y) Sz´els˝o´ert´ek ott lehet, ahol az els˝o deriv´alt 0, azaz F 0 (y) = 24 − 12y = 0, teh´at az y = 2 helyen. Itt pedig val´oban lok´alis maximum van, mert F 00 (y) = −12 < 0. Az ´ıgy kapott y ´ert´eket a felt´etelbe visszahelyettes´ıtve kapjuk, hogy x = 6, azaz a felt´eteles sz´els˝o´ert´ekhely koordin´at´ai: x = 6, y = 2. 85
2. Megold´as: A Lagrange-f´ele m´odszert alkalmazzuk. A Lagrange-f¨ uggv´eny: L(x, y, λ) = 2xy − λ · (x + 3y − 12) Felt´eteles sz´els˝o´ert´ek ott lehet, ahol a Lagrange-f¨ uggv´eny parci´alis deriv´altjai elt˝ unnek, azaz: ∂L = 2y − λ = 0 ∂x ∂L = 2x − 3λ = 0 ∂y x + 3y = 12 Az els˝o k´et egyenletb˝ol: 3λ = 6y = 2x, innen x = 3y. Ezt be´ırva a 3. egyenletbe: x + 3y = 6y = 12, innen y = 2, x = 6. Megjegyezz¨ uk, hogy a 10. T´etel alapj´an nem lehet meg´allap´ıtani, hogy a lehets´eges helye(ke)n val´oban van-e lok´alis felt´eteles sz´els˝o´ert´ek, ´es ha igen, az minimum-e vagy maximum. Ezt egy´eb meggondol´asokkal (pl. felt´etel n´elk¨ uli sz´els˝o´ert´ek feladatra val´o ´at´ır´assal) lehet vizsg´alni. 2. P´elda: Legyen A ∈ Mn×n egy ¨onadjung´alt m´atrix. Jel¨olje S az n-dimenzi´os egys´egg¨omb fel¨ ulet´et, azaz az 1 norm´aj´ u vektorok halmaz´at: n S := {x ∈ R : ||x|| = 1}. Hat´arozzuk meg az hAx, xi kvadratikus alak maximumhely´et az S halmazon. Megold´ as: A probl´ema egy felt´eteles sz´els˝o´ert´ekfeladat: meghat´arozand´o az f : Rn → Rn , f (x) := hAx, xi f¨ uggv´eny felt´eteles maxi2 mumhelye a g(x) := ||x|| − 1 = 0 felt´etel mellett. A Lagrange-f¨ uggv´eny: L(x, λ) = hAx, xi − λ · (||x||2 − 1) Kisz´am´ıtva az x szerinti gradiensvektort, az al´abbi egyenletrendszerre jutunk: 2Ax − λ · 2x = 0,
||x||2 = 1
azaz Ax = λx, ||x|| = 1, teh´at a maximumhely sz¨ uks´egk´epp saj´atvektora A-nak, ´es a Lagrange-f´ele multiplik´ator ´epp a hozz´atartoz´o saj´at´ert´ek. Megjegyezz¨ uk, hogy a felt´etelf¨ uggv´enyt defini´alhattuk volna pl. g(x) := ||x|| − 1 = 0 alakban is, de akkor a Lagrangemultiplik´ator jelent´ese nem annyira szeml´eletes. 3. P´elda: Tekints¨ uk ism´ert az el˝oz˝o szakasz 3. P´eld´aj´at: Egy kerti (t´eglatest alak´ u) medenc´et szeretn´enk ´ep´ıteni. A medence bels˝o oldalait ki kell csemp´ezni. Hogyan v´alasszuk meg a medence m´ereteit, hogy a t´erfogata 32 m3 , a csemp´ez´es k¨olts´ege (ami a kicsemp´ezend˝o fel¨ ulettel egyenesen ar´anyosnak vehet˝o) pedig a lehet˝o legkisebb legyen? 86
Megold´ as: A probl´ema felt´eteles sz´els˝o´ert´ek feladatk´ent azonnal megfogalmazhat´o. Jel¨olje ism´et x, y a medence alapj´anak m´ereteit, z pedig a m´elys´eg´et, akkor kicsemp´ezend˝o fel¨ ulet nagys´aga: F = xy + 2xz + 2yz A t´erfogat: V = xyz = 32, ´ıgy minimaliz´aland´o az F (x, y, z) := xy + 2xz + 2yz formul´aval ´ertelmezett f¨ uggv´eny a g(x, y, z) := xyz − 32 = 0 felt´etel mellett. A Lagrange-f¨ uggv´eny: L(x, y, z, λ) := xy + 2xz + 2yz − λ · (xyz − 32) A felt´eteles minimumhelyen teh´at teljes¨ ulnek az al´abbi egyenl˝os´egek: ∂L = y + 2z − λyz = 0 ∂x ∂L = x + 2z − λxz = 0 ∂y ∂L = 2x + 2y − λxy = 0 ∂z xyz = 32 Az 1. ´es 2. egyenletb˝ol λ-t kifejezve: λ=
1 2 1 2 + = + , z y z x
innen x = y. Ezt a 3. egyenletbe be´ırva kapjuk, hogy λ = x4 , amit vissza´ırva a 2. egyenletbe: x + 2z − 4z = 0, azaz z = x2 . V´eg¨ ul innen ´es a 4. egyenletb˝ol most m´ar ad´odik, hogy x = y = 4, z = 2. 4. P´elda: Tekints¨ uk ism´ert az el˝oz˝o szakasz 4. P´eld´aj´at: Szimmetrikus trap´ez keresztmetszet˝ u egyenes csatorn´at ´ep´ıt¨ unk. Bels˝o oldalait (minden¨ utt azonos vastags´aggal) ki kell betonozni. Hogyan v´alasszuk meg a trap´ez m´ereteit, hogy a csatorna keresztmetszete el˝o´ırt T nagys´ag´ u, a betonoz´as foly´om´eterenk´enti k¨olts´ege pedig a lehet˝o legkisebb legyen? 87
Megold´ as: Jel¨olje ism´et a a csatorna sz´eless´eg´et a fen´eken (azaz a trap´ez r¨ovidebb p´arhuzamos oldal´at), b a csatorna oldalfal´anak hossz´at (azaz a trap´ez sz´arait). Jel¨olje α az oldalfal lejt´esi sz¨og´et (a trap´ez sz´ara ´es hosszabbik p´arhuzamos oldala ´altal bez´art sz¨oget). A foly´om´eterenk´enti betonoz´asi k¨olts´eg nyilv´an ar´anyos az (a + 2b) hossz-¨osszeggel. Mivel a csatorna m m´alys´ege nyilv´an m = b sin α, a csatorna keresztmetszete (a trap´ez ter¨ ulete): T = (a + b cos α) · b sin α. A probl´ema teh´at a k¨ovetkez˝o felt´eteles sz´els˝o´ert´ekfeladatk´ent fogalmazhat´o meg: minimaliz´aljuk az f (a, b, α) := a + 2b el˝o´ır´assal ´ertelmezett f¨ uggv´enyt a g(a, b, α) := (a + b cos α) · b sin α − T = ab sin α + b2 cos α sin α − T = ab sin α +
b2 sin 2α − T = 0 2
felt´etel mellett. A Lagrange-f¨ uggv´eny: L(a, b, α, λ) = a + 2b − λ(ab sin α +
b2 sin 2α − T ) 2
A felt´eteles minimumhelyen teh´at teljes¨ ulnek az al´abbi egyenl˝os´egek: ∂L = 1 − λb sin α = 0 ∂a ∂L = 2 − λ(a sin α + 2b sin α cos α) = 0 ∂b ∂L = −λ(ab cos α + b2 cos 2α) = 0 ∂α b2 ab sin α + sin 2α = T 2 Az 1. ´es a 2. egyenletb˝ol λ-t kifejezve: λ=
1 2 = , b sin α a sin α + 2b sin α cos α
1 ahonnan kapjuk, hogy a = 2b(1 − cos α). Ezt be´ırva a 3. egyenletbe: 2b cos α − 2b cos2 α + bcos2 α − b2 sin2 α = 0, ahonnan cos α = q , azaz 2 √ α = 60◦ . Ezt vissza´ırva az im´ent nyert a = 2b(1−cos α) egyenl˝os´egbe, kapjuk, hogy a = b. V´eg¨ ul innen, ´es a 4. egyenletb˝ol: a = b = 23 T 3.
´ L´atjuk teh´at, hogy ugyanazt a probl´em´at legt¨obbsz¨or felt´eteles ´es felt´etel n´elk¨ uli sz´els˝o´ert´ek feladatk´ent is meg lehet fogalmazni. Altal´ anos 88
´eszrev´etelk´ent meg´allap´ıthat´o, hogy a felt´eteles sz´els˝o´ert´ek feladatk´ent val´o megfogalmaz´as sokkal term´eszetesebb ´es sokkal g´epiesebb is. Azonban a Lagrange-multiplik´ator m´odszer ´altal szolg´altatott egyenletrendszer mindig nagyobb m´eret˝ u, ´es gyakorlati megold´asa sokszor nehezebb. A felt´etel n´elk¨ uli sz´els˝o´ert´ek feladatk´ent val´o megfogalmaz´as nem mindig k´ezenfekv˝o (ld. az el˝oz˝o szakasz 4. P´eld´aj´at), de ha ez m´ar megt¨ort´ent, a megoldand´o egyenletrendszer kisebb m´eret˝ u (nincs benne a Lagrange-multiplik´ator ´es egy tov´abbi v´altoz´ot kifejezhet¨ unk ´ a felt´eteli egyenletb˝ol, ´ıgy az ismeretlenek sz´ama 2-vel kevesebb), ´es ´altal´aban k¨onnyebb megoldani. Igy gyakorlati sz´els˝o´ert´ek feladatok eset´en c´elszer˝ u mindk´et megk¨ozel´ıt´est k´eszenl´etben tartani.
4.7
N´ eh´ any alkalmaz´ as
Line´ aris regresszi´o Legyenek (x1 , y1 ), (x2 , y2 ), ..., (xN , yN ) adott sz´amp´arok (pl. m´er´esi adatok). Tegy¨ uk fel, hogy az x-ek ´es y-ok k¨ozt k¨ozel line´aris kapcsolat van, azaz yk ≈ a · xk + b, ahol a, b egyel˝ore ismeretlen param´eterek. Feladatunk teh´at meghat´arozni a-t ´es b-t u ´gy, hogy az y = ax + b egyenlet˝ u egyenes a ”lehet˝o legjobban” illeszkedj´ek az (xk , yk ) (k = 1, 2, ..., N ) adatokra. A fenti probl´ema jellemz˝oen statisztikai probl´ema, ´es sz´amos gyakorlati alkalmaz´asban felbukkan, ahol egym´ast´ol f¨ ugg˝o adatokat kell ki´ert´ekelni. Ilyen probl´em´ak gyakran el˝ofordulnak a biol´ogi´aban, orvostudom´anyban, k¨ozgazdas´agban stb. A probl´ema igazi neh´ezs´ege az, hogy a ”lehet˝o legjobb” illeszked´es el´egg´e intuit´ıv, ´es sz´amos k¨ ul¨onb¨oz˝o m´odon lehet ´ertelmezni. Els˝o pillanatra tal´an a legterm´eszetesebb az illeszked´es hib´aj´at a max{|ax1 + b − y1 |, |ax2 + b − y2 |, ..., |axN + b − yN |} sz´ammal, azaz a maxim´alis abszol´ ut elt´er´essel m´erni. Ennek matematikai kezel´ese azonban el´egg´e neh´ezkes, k¨ ul¨on¨osen nagy N eset´en. Technikailag legk¨onnyebb az al´abbi hiba haszn´alata: E(a, b) :=
N X
(axk + b − yk )2
k=1
Ez is j´ol m´eri az illeszked´es hib´aj´at abban az ´ertelemben, hogy ha az adatok t¨ort´enetesen illeszkednek az egyenesre, akkor nyilv´an E(a, b) = 0, ´es min´el ink´abb t´avol esnek az egyenest˝ol, E(a, b) ´ert´eke ann´al nagyobb. K´ezenfekv˝o teh´at ”legjobban illeszked˝o” egyenesnek azt nevezni, melyre E(a, b) minim´alis: ezt regresszi´ os egyenesnek nevezz¨ uk. A probl´ema egy lehets´eges megold´asa teh´at a fenti E(a, b) k´etv´altoz´os f¨ uggv´eny minimaliz´al´asa. Minimum ott lehet, ahol mindk´et parci´alis deriv´alt elt˝ unik, azaz N X ∂E = 2 (axk + b − yk )xk = 0 ∂a k=1
89
N X ∂E = 2 (axk + b − yk ) = 0 ∂b k=1
Innen a-ra ´es b-re a k¨ovetkez˝o egyenletrendszert nyerj¨ uk: a
N X
x2k
+b
k=1
a
N X
N X
xk =
k=1
xk + b
k=1
N X
xk y k
k=1
N X
1=
k=1
N X
yk
k=1
Az egyenletrendszernek egyetlenegy megold´asa van, mert a rendszer determin´ansa pozit´ıv, ui. a Cauchy-egyenl˝otlens´eg szerint (
N X
1 · xk )2 ≤ (
k=1
N X
12 ) · (
k=1
N X
x2k ),
k=1
´es egyenl˝os´eg csak akkor fordul el˝o, ha az (1, 1, ..., 1) ´es az (x1 , x2 , ..., xN ) vektorok egym´as sz´amszorosai, azaz mindegyik xk egyenl˝o; m´assz´oval, ha az (x1 , y1 ), ..., (xN , yN ) adatpontok egy f¨ ugg˝oleges egyenesen helyezkednek el (ekkor egy´ uttal ez a legjobban k¨ozel´ıt˝o egyenes is, de ez nem ´ırhat´o fel y = ax + b alakban). K¨ovetkez´esk´epp ett˝ol a speci´alis esett˝ol eltekintve az egyenletrendszer megold´asa val´oban egy´ertelm˝ u. Az ´ıgy ad´od´o a, b param´eterek mellett pedig val´oban minimuma van E-nek, mert a m´asodik deriv´alt m´atrixa: 2
D F (x, y) = 2 ·
PN 2 k=1 xk PN k=1
xk
! PN xk k=1 PN , k=1
1
´es ez pozit´ıv definit, mivel m´ar l´attuk, hogy determin´ansa pozit´ıv, nyoma pedig nyilv´an szint´en pozit´ıv. F¨ uggv´enyek k¨ozel´ıt´ese polinomokkal Legyen f : [0, 1] → R adott folytonos f¨ uggv´eny. Keress¨ unk olyan p(x) := a0 + a1 x + a2 x2 + ... + an xn legfeljebb n-edfok´ u polinomot, mely a ”lehet˝o legjobban” k¨ozel´ıti f -et! A k´erd´es most is az, hogy hogyan defini´aljuk a ”lehet˝o legjobb” k¨ozel´ıt´est. Ennek egyik legegyszer˝ ubb m´odja, ha a k¨ozel´ıt´es hib´aj´at az E(a0 , a1 , ...., an ) :=
Z 1 X n
(
0
aj xj − f (x))2 dx
j=0
n´egyzetintegr´al ´ert´ek´evel m´erj¨ uk. Val´oban, ha f maga egy legfeljebb n-edfok´ u polinom, akkor a p := f v´alaszt´as mellett E = 0. K´ezenfekv˝o teh´at ”legjobban illeszked˝o” polinomnak azt a p polinomot nevezni, melyre a fenti E minim´alis. 90
A probl´ema egy lehets´eges megold´asa teh´at a fenti (n + 1)-v´altoz´os E f¨ uggv´eny minimaliz´al´asa. Minimum ott lehet, ahol az ¨osszes els˝orend˝ u parci´alis deriv´alt elt˝ unik, azaz n Z 1 X ∂E =2 (aj xj − f (x))xk dx = 0 ∂ak 0 j=1
(k = 0, 1, ..., n)
ahonnan az ismeretlen a0 , a1 , ..., an egy¨ utthat´okra a k¨ovetkez˝o egyenletrendszert nyerj¨ uk: n X
1 · aj = bk j=0 k + j + 1
(k = 0, 1, ..., n),
ahol bk := 01 f (x)xk dx. A rendszer m´atrixa (n + 1)-edrend˝ u Hilbert-m´atrix: R
Hn+1 =
1 2 1 3
1 2 1 3 1 4
1 3 1 4 1 5
...
...
...
1 n+1
1 n+2
1 n+3
1
.... .... .... .... ....
1 n+1 1 n+2 1 n+3
... 1 2n+1
,
Bizony´ıt´as n´elk¨ ul megeml´ıtj¨ uk, hogy Hn+1 pozit´ıv definit, ´ıgy az egyenletrendszer egy´ertelm˝ uen megoldhat´o (b´ar, mint m´ar l´attuk, nagyon rosszul kond´ıcion´alt: az adatok ill. a sz´am´ıt´asok kis hib´aja a sz´am´ıtott egy¨ utthat´okban nagy v´altoz´asokat eredm´enyez). Az ´ıgy ad´od´o a0 , a1 , ..., an param´eterek mellett pedig val´oban minimuma van E-nek, mert a m´asodik deriv´alt m´atrixa k¨onnyen l´athat´oan D2 E = 2Hn+1 , teh´at szint´en pozit´ıv definit.
4.8
T¨ obbsz¨ or¨ os integr´ alok
Ebben a szakaszban az integr´alfogalmat ´altal´anos´ıtjuk t¨obbv´altoz´os f¨ uggv´enyekre. M´ar most megjegyezz¨ uk, hogy a k´erd´esk¨or szabatos matematikai t´argyal´asa nagyon neh´ez, ´es eddigi matematikai eszk¨ozeinkkel nem is lehets´eges. Ezzel a m´ert´ek- ´es az integr´alelm´elet foglalkozik. Ugyanakkor az alkalmaz´asok szempontj´ab´ol legt¨obb esetben nincs sz¨ uks´eg ezekre az eszk¨oz¨okre, csak n´eh´any, az integr´alokra vonatkoz´o t´etelre. Ez´ert ezen szakasz t´argyal´asm´odj´aban az al´abbi kompromisszumot tessz¨ uk. Lesznek t´etelek, melyeket bizony´ıt´as n´elk¨ ul mondunk ki ´es fogadunk el, ´es lesznek olyanok is, melyek bizony´ıt´as´aban a szeml´eletet r´eszes´ıtj¨ uk el˝onyben, ´es a levezet´es nem minden l´ep´es´et igazoljuk. Viszont a bizony´ıt´as n´elk¨ ul kimondott ill. felhaszn´alt ´all´ıt´asokra ill. k¨ovetkeztet´esekre minden esetben fel fogjuk h´ıvni a figyelmet. Az integr´alfogalmat el˝osz¨or k´etv´altoz´os, ´espedig t´eglalapon ´ertelmezett f¨ uggv´enyekre ´altal´anos´ıtjuk, de l´atni fogjuk, hogy ugyanez a konstrukci´o tetsz˝oleges n-v´altoz´os f¨ uggv´enyek eset´eben is v´egigvihet˝o, ´ertelemszer˝ u v´altoztat´asokkal. 91
A t´emak¨orben valamennyire j´artas Olvas´oinknak felh´ıvjuk a figyelm´et, hogy a kimond´asra ker¨ ul˝o defin´ıci´ok egy r´esze nem t¨orekszik teljes ´altal´anoss´agra (pl. egy tartom´any felbont´as´anak fogalma vagy az integr´alk¨ozel´ıt˝o ¨osszegek ´ertelmez´ese eset´eben). C´eljainknak ez is megfelel: igyekezt¨ unk az anyagot u ´gy fel´ep´ıteni, hogy a lehet˝o legkevesebb el˝oismeretet k¨oveteljen. Legyenek teh´at [a, b], [c, d] ⊂ R v´eges intervallumok, ´es jel¨olje T a T := [a, b] × [c, d] = {(x, y) ∈ R2 : a ≤ x ≤ b,
c ≤ y ≤ d}
t´eglalapot. Legyen a = x0 < x1 < ... < xN = b ´es c = y0 < y1 < ... < yM = d az [a, b] ill. a [c, d] intervallumok egy-egy – nem felt´etlen egyenk¨oz˝ u – felbont´asa. Jel¨olje ∆xk := xk − xk−1 ill. ∆yj := yj − yj−1 a l´ep´esk¨oz¨oket (k = 1, 2, ..., N , j = 1, 2, ..., M ). Akkor a PM P Tkj := [xk−1 , xk ]×[yj−1 , yj ] t´eglalapok az eredeti T t´eglalap egy felbont´as´at szolg´alatj´ak: T ter¨ ulete nyilv´an megegyezik a N j=1 ∆xk ∆yj k=1 ter¨ ulet¨osszeggel. Defin´ıci´ o: Az (N,M )
S−
(f ) :=
N X M X (min)
fkj
∆xk ∆yj
k=1 j=1
sz´amot az f f¨ uggv´enynek a fenti felbont´ashoz tartoz´o als´ o integr´ alk¨ ozel´ıt˝ o¨ osszeg´enek nevezz¨ uk. Hasonl´oan, az (N,M ) (f ) S+
:=
N X M X (max)
fkj
∆xk ∆yj
k=1 j=1 (min)
sz´amot az f f¨ uggv´enynek a fenti felbont´ashoz tartoz´o fels˝ o integr´ alk¨ ozel´ıt˝ o¨ osszeg´enek nevezz¨ uk, ahol fkj minim´alis ill. maxim´alis ´ert´ek´et a Tkj t´eglalapon. (N,M )
Nyilv´an minden f folytonos f¨ uggv´eny ´es T minden felbont´asa eset´en S−
(N,M )
(f ) ≤ S+
(max)
ill. fkj
jel¨oli az f f¨ uggv´eny
(f ).
Defin´ıci´ o: Az als´o integr´alk¨ozel´ıt˝o ¨osszegek halmaz´anak S− (f )-fel jel¨olt fels˝o hat´ar´at (szupr´emum´at) az f f¨ uggv´eny als´ o integr´ alj´ anak nevezz¨ uk. Hasonl´oan, a fels˝o integr´alk¨ozel´ıt˝o ¨osszegek halmaz´anak S+ (f )-fel jel¨olt als´o hat´ar´at (infimum´at) az f f¨ uggv´eny fels˝ o integr´ alj´ anak nevezz¨ uk. Nyilv´an minden f folytonos f¨ uggv´eny eset´en S− (f ) ≤ S+ (f ). Defin´ıci´ o: Azt mondjuk, hogy az f f¨ uggv´eny Riemann-integr´ alhat´ o a T t´eglalapon, ha als´o ´es fels˝o integr´alja egyenl˝o. Ezt a k¨oz¨os ´ert´eket R R f -nak T -n vett Riemann-integr´alj´anak nevezz¨ uk ´es az T f , T f (x, y)dxdy szimb´olumok valamelyik´evel jel¨olj¨ uk. 92
Vil´agos, hogy a defin´ıci´o ne´ezs´eg n´elk¨ ul ´altal´anos´ ıthat´o kett˝on´el t¨obb Rv´ altoz´os f¨ uggv´enyekre is. K´et- ´es h´aromv´altoz´os f¨ uggv´enyek eset´en RR RR (ut´obbi esetben T egy t´eglatest) szok´asos m´eg a ol´esek is. Elterjedt sz´ohaszn´alat k´etv´altoz´os T f (x, y)dxdy ill. az T f (x, y, z)dxdydz jel¨ f¨ uggv´eny Riemann-integr´alj´at kett˝os, h´aromv´altoz´os f¨ uggv´eny Riemann-integr´alj´at h´ armas integr´ alnak nevezni. Bizony´ıt´as n´elk¨ ul megeml´ıtj¨ uk, hogy – az egyv´altoz´os f¨ uggv´enyek eset´ehez hasonl´oan – minden, a T t´eglalapon folytonos f¨ uggv´eny Riemann-integr´alhat´o is. A most bevezetett integr´alfogalom az anal´ızis egyik legfontosabb fogalma. Sz´amos fizikai jelent´ese k¨oz¨ ul megeml´ıt¨ unk kett˝ot: (a) Ha V egy h´aromdimenzi´os t´eglatest, f pedig valamilyen, V -ben eloszlott anyag koncentr´aci´of¨ uggv´enye, azaz f (x, y, z) jelenti az anyag RRR koncentr´aci´oj´at az (x, y, z) ∈ V pontban, akkor az f (x, y, z)dxdydz h´ a rmas integr´ a l az illet˝ o anyag teljes t¨omege a V t´erfogatban. V Hasonl´oan, ha f az energias˝ ur˝ us´eg eloszl´as´at ´ırjale, akkor ez a h´armas integr´al a teljes energi´at jelenti. 2 (b) Legyen Ω ⊂ R egy korl´atos, ¨osszef¨ ugg˝o halmaz, T ⊃ Ω egy b˝ovebb t´eglalap. K´epzelj¨ unk el egy Ω alak´ u, minden¨ utt egyenletesen v´ekony ´es homog´en lemezb˝ol k´esz¨ ult s´ıkidomot. Ennek a lemezdarabnak a s´ ulypontja (Mx , My ), ahol x · f (x, y)dxdy RR , T f (x, y)dxdy
RR
Mx =
T
RR
My =
R TR
y · f (x, y)dxdy T f (x, y)dxdy
´es f az Ω tartom´any karakterisztikus f¨ uggv´enye, azaz f (x, y) = 1, ha (x, y) ∈ Ω, ill. f (x, y) = 0, ha (x, y) nincs Ω-ban. A Riemann-integr´al fenti defin´ıci´oja az egyv´altoz´os f¨ uggv´enyek Riemann-integr´alj´anak pontos megfelel˝oje. L´atni kell azonban, hogy a defin´ıci´o gyakorlati sz´am´ıt´asokra teljesen alkalmatlan. Szeml´eletes jelent´es´et viszont j´ol mutatja a k¨ovetkez˝o t´etel, melyet bizony´ıt´as n´elk¨ ul mondunk ki: 11. T´ etel: Tekints¨ uk az [a, b] ´es [c, d] intervallumok felbont´asainak egy korl´ atlanul finomod´ o sorozat´ at, azaz tegy¨ uk fel, hogy a maxk=1,...,N ∆xk ´es a maxj=1,...,M ∆yj sz´amok is 0-hoz tartanak. Legyen fkj egy tetsz˝oleges f¨ uggv´eny´ert´ek, melyet f a Tkj t´eglalapon felvesz. Akkor a N X M X
fkj ∆xk ∆yj
k=1 j=1
Riemann-¨ osszegek sorozata az f¨ uggetlen¨ ul).
RR
T f (x, y)dxdy
Riemann-integr´alhoz tart (a konkr´et felbont´ast´ol ´es az fkj f¨ uggv´eny´ert´ekek megv´alaszt´as´at´ol
A t´etel egy´ uttal a T t´eglalapon vett Riemann-integr´al k¨ozel´ıt˝o kisz´am´ıt´as´ara is elj´ar´ast ad: el´eg egy ”kell˝oen finom” felbont´as mellett egy Riemann-¨osszeget kisz´am´ıtani. Arra n´ezve viszont, hogy ez milyen pontosan k¨ozel´ıti a Riemann-integr´alt, a t´etel nem mond semmit. A pontoss´aggal nem fogunk foglalkozni, mert a kett˝os integr´alok kisz´am´ıt´as´at egyv´ altoz´ os integr´ alok egym´ as ut´ ani kisz´ am´ıt´ as´ ara vezetj¨ uk 93
vissza, a k¨ovetkez˝o t´etel seg´ıts´eg´evel: 12. T´ etel: Ha f folytonos f¨ uggv´eny T -n, akkor Z Z
f (x, y)dxdy =
Z b
Z d
a
c
T
Bizony´ıt´as v´azlat: K¨ozel´ıts¨ uk az
RR
T f (x, y)dxdy
!
f (x, y)dy dx =
Z d
Z b
c
a
!
f (x, y)dx dy
integr´alt az al´abbi Riemann-¨osszeggel: N X M X
f (xk , yj )∆xk ∆yj
k=1 j=1
¨ Osszegezve el˝osz¨or j szerint, minden r¨ogz´ıtett k indexre: M X
f (xk , yj )∆yj ≈
Z d
j=1
c
f (xk , y)dy
∆xk -val szorozva, ´es k szerint ¨osszegezve: N X M X
f (xk , yj )∆yj ∆xk ≈
k=1 j=1
A jobboldalon szint´en egy Riemann-¨osszeg ´all, ´espedig az F (x) := Ez´ert: N X M X
f (xk , yj )∆yj ∆xk ≈
k=1 j=1
Z b
N X
Z d
k=1
c
Rd c
!
f (xk , y)dy · ∆xk
f (x, y)dy formul´aval ´ertelmezett F f¨ uggv´eny egy Riemann-¨osszege.
F (x)dx =
a
Z b
Z d
a
c
!
f (x, y)dy dx
Ha most a felbont´as korl´atlanul finomodik, akkor a k¨ozel´ıt˝o egyenl˝os´egek pontos egyenl˝os´egekbe mennek ´at: ezt azonban nem bizony´ıtjuk. A m´asik egyenl˝os´eget ugyanilyen meggondol´asokkal l´athatjuk be. A t´etel azonnali k¨ovetkezm´enye, hogy ha f (x, y) = g(x) · h(y) alak´ u, akkor a kett˝os integr´al kisz´am´ıt´asa k¨ ul¨on¨osen egyszer˝ u: 13. K¨ ovetkezm´ eny: Legyenek g : [a, b] → R, h : [c, d] → R folytonos f¨ uggv´enyek, ´es legyen f (x, y) = g(x) · h(y). Akkor: Z Z
f (x, y)dxdy = T
Z b
!
g(x)dx ·
a
94
Z d c
!
h(y)dy
A 12. T´etel ´es a 13. K¨ovetkezm´eny ´ertelemszer˝ uen ´altal´anos´ıthat´o kett˝on´el t¨obb v´altoz´os f¨ uggv´enyek eset´ere. A fenti t´etelek alkalmaz´as´at az al´abbi p´eld´akon illusztr´aljuk: 1. P´elda: Legyen T := [0, 2] × [0, 1]. Sz´ am´ıtsuk ki a T (x + xy 2 )dxdy kett˝os integr´alt. RR R 2 R1 2 2 Megold´ as: o integr´alban az integr´al´as y szerint t¨ort´enik, x-et konstansnak tekintve: T (x + xy )dxdy = 0 0 (x + xy )dy dx. A bels˝ RR
Z 1 0
xy 3 (x + xy )dy = xy + 3 "
#1
2
= 0
4x 3
Most m´ar a k¨ uls˝o integr´al is kisz´am´ıthat´o, ´es: Z Z
2
(x + xy )dxdy =
Z 2
T
0
4x2 4x dx = 3 6 "
#2 0
8 = . 3
Elj´arhattunk volna u ´gy is, hogy el˝obb x szerint integr´alunk: Z 2 0
x2 (x + xy )dx = (1 + y ) · 2 "
2
#2
2
= 2 · (1 + y 2 ), 0
majd pedig y szerint, ´ıgy kapjuk, hogy Z Z
2
(x + xy )dxdy = T
Z 1 0
y3 2 · (1 + y )dy = 2 · y + 3 "
#1
2
0
8 = . 3
os integr´alt a 0 ≤ x ≤ π, 0 ≤ y ≤ π2 egyenl˝otlens´egek ´altal meghat´arozott T t´eglalapon. 2. P´elda: Sz´am´ıtsuk ki a T x · sin(x + y)dxdy kett˝ Megold´ as: C´elszer˝ u (de nem k¨otelez˝o) el˝osz¨or y szerint integr´alni. t := x + y helyettes´ıt´essel: RR
Z π/2
x · sin(x + y)dy = x ·
0
Z x+π/2
sin tdt = x · (− cos(
x
π + x) + cos x) = x · (sin x + cos x). 2
Most x szerint integr´alunk, parci´alis integr´al´ast alkalmazva: legyenek u := x, v 0 := sin x + cos x, akkor u0 = 1, ´es v = − cos x + sin x, innen: Z Z T
x · sin(x + y)dxdy = [x · (− cos x + sin x)]π0 −
Z π 0
(− cos x + sin x)dx = π − [− sin x − cos x]π0 = π − 2.
A megold´ashoz a 13. K¨ovetkezm´eny alkalmaz´as´aval is eljuthatunk: Z Z
x · sin(x + y)dxdy = T
Z π Z π/2 0
(x · sin x cos y + x · cos x sin y)dydx =
0
Z π 0
95
x sin xdx ·
Z π/2 0
!
Z π
cos ydy + 0
x cos xdx ·
Z π/2 0
!
sin ydy
A fell´ep˝o (egyv´altoz´os) integr´alokat kisz´am´ıtva, a jobboldal ´ert´ek´ere a k¨ovetkez˝o ad´odik: π · 1 + (−2) · 1 = π − 2. 1 os integr´alt. 3. P´elda: Legyen T := [0, 1] × [0, 1]. Sz´am´ıtsuk ki a T (x+y+1)2 dxdy kett˝ Megold´ as: El˝osz¨or y szerint integr´alva (t := x + y + 1 helyettes´ıt´essel), majd x szerint integr´alva:
RR
Z Z T
! Z 2 Z x+2 Z 2 Z 1 1 1 1 dx = dxdy = dy dt dx = (x + y + 1)2 0 0 x+1 t2 0 (x + y + 1)2 Z 2
−
0
1 1 4 + dx = [− log |x + 2| + log |x + 1|]10 = log x+2 x+1 3
Az Riemann-integr´alt most t´eglalapn´al ´altal´anosabb halmazok eset´ere fogjuk defini´alni. Legyen T ism´et t´eglalap, Ω ⊂ T egyel˝ore tetsz˝oleges ´ (korl´atos) halmaz, ´es f : Ω → R adott folytonos f¨ uggv´eny. Ertelmezz¨ uk az als´o ´es fels˝o integr´alk¨ozel´ıt˝o ¨osszegeket ugyan´ ugy mint id´aig, azzal a k¨ ul¨onbs´eggel, hogy az ¨osszegekbe csak azon Tkj t´eglalapoknak megfelel˝o tagok ker¨ ulnek, melyekre Tkj ⊂ Ω: (N,M )
S−
(f ) :=
X
(min)
fkj
∆xk ∆yj
Tkj ⊂Ω (N,M )
S+
(f ) :=
X
(max)
fkj
∆xk ∆yj
Tkj ⊂Ω
Ezekut´an a Riemann-integr´alt ´es a Riemann-¨osszegeket is ay el˝obbiekhez hasonl´oan lehet defini´alni. A helyzet most bonyolultabb, mert a felbont´as s˝ ur´ıt´es´evel az integr´alk¨ozel´ıt˝o ¨osszegekben figyelembe vett Tkj t´eglalapok ¨osszess´ege ´altal´aban nem marad ´alland´o, hanem egy olyan ΩN M halmazt alkot, mely bizonyos ´ertelemben ”konverg´al” Ω-hoz, ha a felbont´as korl´atlanul finomodik. A Tkj t´eglalapok ter¨ uleteinek ¨osszegei ekkor – a gyakorlat sz´am´ara fontos esetek t´ ulnyom´o t¨obbs´eg´eben – egy sz´amhoz tartanak, melynek szeml´eletes jelent´ese az Ω halmaz ter¨ ulete. A geometriai ter¨ ulet fogalma mindazon´altal nem ´altal´anos´ıthat´o tetsz˝ oleges Ω halmazra: ezen k´erd´esek r´eszleteivel a m´ert´ekelm´elet foglalkozik. Jelen jegyzet keretein bel¨ ul csak egy nagyon speci´alis esetet t´argyalunk, mikor Ω bizonyos egyenesek ´es bizonyos folytonos egyv´altoz´os f¨ uggv´enyek grafikonjai ´altal hat´arolt halmaz (ezeket norm´ altartom´ anyoknak nevezz¨ uk). Itt ki lesz haszn´alva Ω k´etdimenzi´os volta: az eredm´eny magasabb dimenzi´os terekre csak neh´ezkesen ´altal´anos´ıthat´o. 14. T´ etel: Legyenek g, h : [a, b] → R folytonos f¨ uggv´enyek, melyekre g ≤ h teljes¨ ul az [a, b] intervallumon. Tekints¨ uk az Ω := {(x, y) ∈ R2 : a ≤ x ≤ b, g(x) ≤ y ≤ h(y)}
96
norm´altartom´anyt. Legyen f : Ω → R folytonos f¨ uggv´eny, akkor Z Z
f (x, y)dxdy = T
Z b
Z h(x)
a
g(x)
!
f (x, y)dy dx
unk. Az Bizony´ıt´as v´azlat: A 12. T´etel bizony´ıt´as-v´azlat´ahoz hasonl´o gondolatmenetet k¨ovet¨ ¨osszege: N X X
RR
T f (x, y)dxdy
integr´al egy Riemann-
f (xk , yj )∆yj ∆xk ,
k=1 j
ahol a j szerinti ¨osszegez´es – r¨ogz´ıtett k mellett – olyan j indexekre terjed ki, melyekre g(xk ) ≤ yj ≤ h(xk ). Ekkor a j szerinti ¨osszeg az R h(xk ) al egy Riemann-¨osszege, ez´ert: g(xk ) f (xk , y)dy integr´ X
f (xk , yj )∆yj ≈
Z h(xk )
j
g(xk )
f (xk , y)dy
∆xk -val szorozva, ´es k szerint ¨osszegezve: N X X
f (xk , yj )∆yj ∆xk ≈
k=1 j
A jobboldalon szint´en egy Riemann-¨osszeg ´all, ´espedig az F (x) := Ez´ert: N X X
f (xk , yj )∆yj ∆xk ≈
k=1 j
Z b
N X
Z h(xk )
k=1
g(xk )
R h(xk ) g(xk )
!
f (xk , y)dy · ∆xk
f (x, y)dy formul´aval ´ertelmezett F f¨ uggv´eny egy Riemann-¨osszege.
F (x)dx =
Z b
Z h(xk )
a
g(xk )
a
!
f (x, y)dy dx
Ha most a felbont´as korl´atlanul finomodik, akkor a k¨ozel´ıt˝o egyenl˝os´egek pontos egyenl˝os´egekbe mennek ´at: ezt azonban nem bizony´ıtjuk. Megjegyz´esek: (a) A t´etelben az integr´al´asok sorrendje – ´ertelemszer˝ uen – most nem cser´elhet˝o fel. (b): Hasonl´o t´etel fogalmazhat´o meg az Ω := {(x, y) ∈ R2 : a ≤ y ≤ b, g(y) ≤ x ≤ h(x)} t´ıpus´ u (teh´at v´ızszintes egyenesek k¨oz¨otti) norm´altartom´anyra is. Ez esetben tetsz˝oleges f : Ω → R folytonos f¨ uggv´enyre: Z Z
f (x, y)dxdy = T
Z b
Z h(y)
a
g(y)
97
!
f (x, y)dx dy.
P´eld´ ak: RR 1. Legyen Ω egy orig´o k¨ozep˝ u R sugar´ u k¨or. Sz´am´ıtsuk ki az √ Ω 1 dxdy kett˝os integr´alt. √ Megold´ as: Ω norm´altartom´any, az [−R, R] → R, x → − R2 − x2 ´es a [−R, R] → R, x → R2 − x2 f¨ uggv´enyek grafikonjai hat´arolj´ak. Innen: Z Z Z R Z √R2 −x2 ! Z R√ Z R √ 2 − x2 dx = 4 · 1 dxdy = R R2 − x2 dx 1 dy = 2 · √ − R2 −x2
−R
Ω
−R
0
A jobboldalon x = R sin t helyettes´ıt´est alkalmazva: Z π/2 q
Z π/2
Z π/2
1 + cos 2t 1 π dt = 4R2 · · = R2 π. 2 2 2 Ω 0 0 0 Az azonosan 1 f¨ uggv´enynek az Ω tartom´anyon vett integr´alja teh´at Ω ter¨ ulet´evel egyezik, ami a Riemann-¨osszegekkel val´o k¨ozel´ıt´es ´ertelm´eben szeml´eletesen nyilv´anval´o. Z Z
1 dxdy = 4 ·
2. Sz´am´ıtsuk ki az Megold´ as: Z Z
RR
2
Ω (x
(x + y) dxdy = Ω
2
R2
−
R2
2
sin t · R cos t dt = 4R
2
2
cos t dt = 4R
2
+ y) dxdy integr´alt, ahol Ω az y = x2 ´es az y 2 = x egyenlet˝ u parabol´ak ´altal hat´arolt tartom´any.
Z 1
Z √x
0
x2
! 2
(x + y)dy dx =
Z 1" 0
y2 x y+ 2
#√x
2
dx =
Z 1
(x
0
x2
x4 2x7/2 x2 3 x5 33 x + − · = . + − x4 − )dx = 2 2 7 4 2 5 140 "
5/2
#
3. Hat´arozzuk meg az egys´egnyi sugar´ u f´elk¨or s´ ulypontj´at. √ uggv´eny grafikonja legyen. Megold´ as: Helyezz¨ uk a f´elk¨ort a koordin´atarendszerbe u ´gy, hogy a f´elk¨orvonal a [−1, 1] → R, x → 1 − x2 f¨ Ekkor a s´ ulypont koordin´at´ai: RR RR y · f (x, y)dxdy Ω x · f (x, y)dxdy Mx = R R , My = R ΩR , Ω f (x, y)dxdy Ω f (x, y)dxdy ahol Ω jel¨oli a sz´oban forg´o f´elk¨ort. A nevez˝o ´epp e f´elk¨or ter¨ ulete, azaz π2 . Tov´abb´a: Z Z
x · f (x, y)dxdy =
Z 1 −1
Ω
Z √1−x2
!
x dy dx =
Z 1
√ x 1 − x2 dx = 0,
−1
0
mert az integrandusz p´aratlan f¨ uggv´eny. A m´asik integr´al: Z Z
y · f (x, y)dxdy = Ω
Z 1 −1
Z √1−x2 0
!
y dy dx =
Z 1 1 −1
2
y
98
2
√1−x2 0
" #1 1 Z1 1 x3 2 2 dx = · (1 − x )dx = · x − = 2 −1 2 3 −1 3
Innen a s´ ulypont koordin´at´ai: Mx = 0, My =
4 . 3π
Speci´ alis eset: integr´al´as pol´arkoordin´ at´ ak szerint Ha az integr´al´asi tartom´any k¨or vagy k¨orszer˝ u tartom´any (k¨orcikk, k¨orgy˝ ur˝ u), akkor az integr´al´as sokszor egyszer˝ us´ıthet˝o pol´arkoordin´at´ak alkalmaz´as´aval. Ekkor az Ω tartom´anyt t´eglalapok helyett k¨orcikkekkel fedj¨ uk le. Pontosabban, legyen Ω0 egy orig´o k¨oz´eppont´ u R sugar´ u k¨or, ahol R akkora, hogy Ω0 ⊃ Ω teljes¨ ulj¨on. Legyen 0 = r0 < r1 < ... < rM = R a [0, R], 0 = φ0 < φ1 < ... < φN = 2π pedig a [0, 2π] intervallum egy felbont´asa. Ezek l´etrehoznak egy olyan felbont´as´at Ω0 -nak, mely csupa k¨orcikkb˝ol ´all. Az [rj−1 , rj ] sug´ar- ´es a [φk−1 , φk ] sz¨ogintervallum ´altal meghat´arozott Bkj k¨orcikk ter¨ ulete: rj−12+rj ∆rj ∆φk , ahol ∆rj := rj − rj−1 , ∆φk := φk − φk−1 . Legyen f : Ω → R tetsz˝oleges folytonos f¨ uggv´eny. Tetsz˝o√ leges (x, y) ∈ R2 eset´en jel¨olje r ´es φ az (x, y) pont pol´ arkoordin´ at´ ait, azaz aokat y 2 2 a sz´amokat, melyekre x = r cos φ ´es y = r sin φ (nyilv´an r = x + y ´eRs Rtgφ = x ). Jel¨olje F az f f¨ uggv´eny pol´ arkoordin´ at´ as alakj´ at, azaz az F (r, φ) := f (r cos φ, r sin φ) el˝o´ır´assal ´ertelmezett f¨ uggv´enyt. Akkor az al egy Riemann-¨osszege (a k¨orcikk-felbont´asra Ω f (x, y)dxdy integr´ n´ezve): X X rj−1 + rj rj−1 + rj f (rj cos φk , rj sin φk ) · F (rj , φk ) · ∆rj ∆φk = ∆rj ∆φk , 2 2 k,j k,j ahol az o¨sszegz´es csak azokra a k, j indexp´arokra terjed ki, melyekre a Bkj k¨orcikk Ω-ban van: Bkj ⊂ Ω. Ha a felbont´as el´eg finom, akkor P rj−1 +rj ≈ rj , ´ıgy a jobboldali ¨osszeg k¨ozel´ıt˝oen: k,j F (rj , φk ) · rj ∆rj ∆φk alakba ´ırhat´o, mely viszont az (r, φ) → r · F (r, φ) lek´epez´es egy 2 Riemann-¨osszege. Igazolhat´o, hogy ha a felbont´as korl´atlanul finomodik, akkor a k¨ozel´ıt˝o egyenl˝os´egek pontos egyenl˝os´egekkel v´althat´ok fel, ´ıgy nyert¨ uk, hogy: ˜ az Ω tartom´any pol´arkoordin´at´as megfelel˝oj´et, azaz Ω ˜ := {(r, φ) ∈ R2 : (r cos φ, r sin φ) ∈ Ω. Legyen f : Ω → R 15. T´ etel: Jel¨olje Ω folytonos f¨ uggv´eny, jel¨olje F ennek pol´arkoordin´at´as alakj´at, azaz F (r, φ) := f (r cos φ, r sin φ). Akkor Z Z
f (x, y)dxdy =
Z Z
Ω
˜ Ω
F (r, φ)rdrdφ
˜ tartom´any m´ar norm´altartom´any az (r, φ) s´ıkon, ´espedig Ω-n´al egyA t´etelt jellemz˝oen akkor lehet j´ol alkalmazni, ha a transzform´alt Ω szer˝ ubb. ´Igy pl. egy orig´o k¨ozep˝ u R sugar´ u negyedk¨or megfelel˝oje az (r, φ) s´ıkon a [0, 1] × [0, π2 ] t´eglalap; az R1 , R2 sugar´ u k¨or¨ok k¨oz¨otti k¨orgy˝ ur˝ utartom´any megfelel˝oje az (r, φ) s´ıkon a [R1 , R2 ] × [0, 2π] t´eglalap, ´es ´ıgy tov´abb. 1. P´elda: Hat´arozzuk meg az egys´egsugar´ u f´elk¨or s´ ulypontj´at. Megold´ as: A feladatot most pol´arkoordin´at´ak haszn´alat´aval oldjuk meg. A f´elk¨ornek az az (r, φ) s´ıkon a 0 ≤ r ≤ 1, 0 ≤ φ ≤ π egyenl˝otlens´egek ´altal meghat´arozott t´eglalap felel meg. Ez´ert: Z Z
1 dxdy = Ω
Z πZ 1 0
Z π
rdrdφ =
0
0
99
Z 1
1 dφ ·
rdr = 0
π 2
Z Z
x dxdy = Ω
Z Z
0
y dxdy = Ω
Z πZ 1 Z πZ 1 0
innen ism´et megkaptuk a s´ ulypont koordin´at´ait: (0,
r cos φ · rdrdφ =
0
r sin φ · rdrdφ =
xy dxdy = Ω
0
1/2
cos φ dφ ·
0
Z π
2
r dr = 0 0
Z 1
sin φ dφ ·
0
2
r dr = 0
2 3
4 ). 3π
RR
Z π/2 Z 1
Z 1
0
2. P´elda: Sz´am´ıtsuk ki az alt, ahol Ω az Ω xy dxdy integr´ ´ erve pol´arkoordin´at´akra: Megold´ as: Att´ Z Z
Z π
r cos φ r sin φ rdrdφ =
1 2
Z π/2
≤ r ≤ 1, 1 ≤ φ ≤ !
cos φ sin φ dφ ·
0
100
π 2
egyenl˝otlens´egek ´altal meghat´arozott k¨orgy˝ ur˝ ucikk.
! ! Z π/2 Z 1 1 15 r3 dr = sin 2φ dφ · r3 dr = . 2 0 128 1/2 1/2
Z 1
!
4.9
Feladatok
1. Igazoljuk, hogy az (
f (x, y) :=
x · sin y1 + y · sin x1 , 0,
ha xy 6= 0 ha xy = 0
formul´aval ´ertelmezett f¨ uggv´eny folytonos az orig´oban. Megold´as 2. Igazoljuk, hogy az f (x, y) :=
√
0,
x2 +y 2 x2 +y 2 +1−1
,
ha x2 + y 2 6= 0 ha x2 + y 2 = 0
formul´aval ´ertelmezett f¨ uggv´eny nem folytonos az orig´oban. Megold´as 3. Legyen f : Rn → R, f (x) := log ||x|| (x 6= 0). Sz´am´ıtsuk ki a gradiensvektort. Megold´as 4. Mutassuk meg, hogy (a) az u(x, y) := log √
1 x2 +y 2
(b) az u(x, y, z) := √
formul´aval ´ertelmezett (k´etv´altoz´os) f¨ uggv´enyre
1 x2 +y 2 +z 2
∂2u ∂x2
+
formul´aval ´ertelmezett (h´aromv´altoz´os) f¨ uggv´enyre
∂2u ∂y 2
∂2u ∂x2
≡ 0 teljes¨ ul ((x, y) 6= (0, 0));
+
∂2u ∂y 2
+
∂2u ∂z 2
≡ 0 teljes¨ ul ((x, y, z) 6= (0, 0, 0)).
Megold´as 5. Hol ´es milyen t´ıpus´ u lok´alis sz´els˝o´ert´eke van az f : R2 → R, f (x, y) := x2 + xy + y 2 − 5x − 4y + 1 f¨ uggv´enynek? Megold´as 6. Egy t´eglatest egy cs´ ucsba ¨osszefut´o ´eleinek ¨osszhossza 24 cm. Legfeljebb mekkora a t´erfogata? Megold´as 7. Van egy 2 m´eteres madzagunk, ezzel ´atk¨ot¨ unk egy t´eglatest alak´ u csomagot, m´eghozz´a k´et ir´anyban is. Legfeljebb mekkora lehet a csomag t´erfogata? 101
Megold´as 8. Tervezz¨ unk egy 16 m3 t´erfogat´ u t´eglatest alak´ u medenc´et. A fen´ek kicsemp´ez´ese olyan csemp´evel t¨ort´enik, melynek n´egyzetm´eter´ara feleakkora mint az oldalfalakra ker¨ ul˝o csemp´e´e. Hogyan v´alasszuk meg a m´ereteket, hogy a csemp´ez´es k¨olts´ege minim´alis legyen? Megold´as 9. Legyen Ω az egys´egk¨or. Sz´am´ıtsuk ki az Megold´as
RR
Ω (x
+ y)2 dxdy integr´alt.
102
Megold´ asok 1. Legyenek xn , yn → 0 tetsz˝oleges z´erussorozatok, akkor: |f (xn , yn ) − f (0, 0)| ≤ |xn | · | sin
1 1 | + |yn | · | sin | ≤ |xn | + |yn | → 0, yn xn
teh´at f val´oban folytonos az orig´oban. 2. Legyenek xn , yn → 0 tetsz˝oleges z´erussorozatok, akkor: q
|f (xn , yn ) − f (0, 0)| ≤
(x2n + yn2 ) · ( x2n + yn2 + 1 + 1) x2n + yn2 + 1 − 1
→ 2 6= 0
teh´at f nem folytonos az orig´oban. 3. grad f (x) =
x ||x||2
4. (a) Nyilv´an u(x, y) = − 12 log(x2 + y 2 ), innen
Hasonl´oan:
x ∂u =− 2 , ∂x x + y2
∂2u (x2 + y 2 ) − x · 2x2 −x2 + y 2 = − = − ∂x2 (x2 + y 2 )2 (x2 + y 2 )2
∂u y =− 2 , ∂y x + y2
∂2u (x2 + y 2 ) − y · 2y 2 −y 2 + x2 = − = − , ∂y 2 (x2 + y 2 )2 (x2 + y 2 )2
´ıgy kett˝oj¨ uk ¨osszege val´oban azonosan z´erus (ahol ´ertelmezett). (b) Nyilv´an u(x, y, z) = (x2 + y 2 + z 2 )−1/2 , innen ∂u = −x · (x2 + y 2 + z 2 )−3/2 , ∂x
∂2u −x2 − y 2 − z 2 + 3x2 2 2 2 −3/2 2 2 2 −5/2 = −(x + y + z ) + x · 3x · (x + y + z ) = ∂x2 (x2 + y 2 + z 2 )5/2
∂u = −y · (x2 + y 2 + z 2 )−3/2 , ∂y
∂2u −x2 − y 2 − z 2 + 3y 2 2 2 2 −3/2 2 2 2 −5/2 = −(x + y + z ) + y · 3y · (x + y + z ) = ∂y 2 (x2 + y 2 + z 2 )5/2
Hasonl´oan:
103
´es
∂u = −z · (x2 + y 2 + z 2 )−3/2 , ∂z
∂2u −x2 − y 2 − z 2 + 3z 2 2 2 2 −3/2 2 2 2 −5/2 = −(x + y + z ) + z · 3z · (x + y + z ) = ∂z 2 (x2 + y 2 + z 2 )5/2
A h´arom kifejez´es ¨osszege teh´at val´oban azonosan z´erus (ahol ´ertelmezett). 5. Sz´els˝o´ert´ek ott lehet, ahol mindk´et v´altoz´o szerinti parci´alis deriv´alt z´erus, azaz ∂f = 2x + y − 5 = 0, ∂x
∂f = x + 2y − 4 = 0 ∂y
azaz az (x, y) = (2, 1) helyen. A m´asodik deriv´alt m´atrix konstans m´atrix: D2 f (x, y) =
2 1 1 2
!
,
m´egpedig pozit´ıv definit (nyoma ´es determin´ansa egyar´ant pozit´ıv). Az (x, y) = (2, 1) helyen a f¨ uggv´enynek teh´at lok´alis minimuma van. 6. A feladat egy felt´eteles sz´els˝o´ert´ekfeladat: maximaliz´aland´o a V (x, y, z) := xyz t´erfogat a g(x, y, z) := x + y + z − 24 = 0 felt´etel mellett. A Lagrange-f¨ uggv´eny: L(x, y, z, λ) = xyz − λ(x + y + z − 24). Felt´eteles sz´els˝o´ert´ek ott lehet, ahol L parci´alis deriv´altjai elt˝ unnek, azaz: ∂L = yz − λ = 0 ∂x ∂L = xz − λ = 0 ∂y ∂L = xy − λ = 0 ∂z ∂L = −(x + y + z − 24) = 0 ∂λ Innen x = y = z = 8 cm (teh´at, ha a t´eglatest kocka), azaz a t´erfogat legfeljebb 1024 cm3 . Az Olvas´o bizony´ıtsa be, hogy itt val´oban lok´alis felt´eteles maximum van. 7. A feladat egy felt´eteles sz´els˝o´ert´ekfeladat: maximaliz´aland´o a V (x, y, z) := xyz t´erfogat a g(x, y, z) := 2x + 4y + 2z − 2 = 0 felt´etel
104
mellett. A Lagrange-f¨ uggv´eny: L(x, y, z, λ) = xyz − λ(2x + 4y + 2z − 2). Felt´eteles sz´els˝o´ert´ek ott lehet, ahol L parci´alis deriv´altjai elt˝ unnek, azaz: ∂L = yz − 2λ = 0 ∂x ∂L = xz − 4λ = 0 ∂y ∂L = xy − 2λ = 0 ∂z
Innen x = z =
1 3
m, y =
1 6
∂L = −(2x + 4y + 2z − 2) = 0 ∂λ 1 m. A t´erfogat teh´at legfeljebb 54 m3 . Az Olvas´o bizony´ıtsa be, hogy itt val´oban lok´alis felt´eteles maximum van.
8. A feladat egy felt´eteles sz´els˝o´ert´ekfeladat: minimaliz´aland´o a f (x, y, z) := 21 xy + 2xz + 2yz k¨olts´eg a V (x, y, z) := xyz − 16 = 0 felt´etel mellett. A Lagrange-f¨ uggv´eny: L(x, y, z, λ) = 12 xy + 2xz + 2yz − λ(xyz − 16). Felt´eteles sz´els˝o´ert´ek ott lehet, ahol L parci´alis deriv´altjai elt˝ unnek, azaz: ∂L 1 = y + 2z − λyz = 0 ∂x 2 ∂L 1 = x + 2z − λxz = 0 ∂y 2 ∂L = 2x + 2y − λxy = 0 ∂x ∂L = −(xyz − 16) = 0 ∂λ 1 1 Az els˝o k´et egyenletb˝ol: λ = 2z + y1 = 2z + x1 , innen x = y. Ezt be´ırva a 3. egyenletbe, kapjuk, hogy λ = x4 . Innen, ´es a 2. egyenletb˝ol: x z = 4 . V´eg¨ ul a 4. egyenlet alapj´an: x = y = 4 m, z = 1 m. Az Olvas´ora b´ızzuk annak bel´at´as´at, hogy itt val´oban felt´eteles lok´alis minimum van. ´ erve pol´arkoordin´at´akra: 9. Att´ Z Z
(x + y)2 dxdy = Ω
Z 2π Z 1 0
0
(r cos t + r sin t)2 rdrdt =
Z 2π Z 1 0
r3 (cos2 t + 2 cos t sin t + sin2 t) drdt =
0
Z 2π 0
105
Z 1
(1 + sin 2t)dt ·
0
r3 dr =
π . 2