8. Fejezet
Differenci´ alsz´ am´ıt´ as Ez a fejezet az eddig tanult line´aris algebra tananyag alkalmaz´asak´ent megmutatja, hogy hogyan vihet˝o a´t a deriv´alt fogalma t¨obbv´altoz´os f¨ uggv´enyekre. L´atni fogjuk, hogy a deriv´alt tulajdonk´eppen az els˝o f´el´evben megismert ´erint˝o approxim´aci´o fogalm´anak term´eszetes kiterjeszt´ese a line´aris algebra eszk¨ozeivel. T´argyalni fogjuk a deriv´alt legfontosabb tulajdons´agait, majd r´at´er¨ unk a t¨obbv´altoz´os f¨ uggv´enyek sz´els˝o´ert´ekeinek meghat´aroz´as´ara.
8.1
M´ atrixok norm´ aja
Ebben a bevezet˝o jelleg˝ u szakaszban a line´aris lek´epez´esek, illetve a m´atrixok norm´aj´aval, ´es azok legfontosabb tulajdons´agaival ismerked¨ unk meg. Amint azt l´atni fogjuk, ezzel a norm´aval ell´atva a lek´epez´esek vektortere ugyanolyan norm´alt teret alkot, amilyenre m´ar sz´amos p´eld´at l´attunk az anal´ızis tanulm´anyaink sor´an. Igy lehet˝os´eg¨ unk ny´ılik a m´atrixok ter´enek topol´ogiai jelleg˝ u vizsg´alat´ara, amelyre az alkalmaz´asok (p´eld´aul Neumann-sorok) szempontj´ab´ol is nagy sz¨ uks´eg¨ unk lesz. L´enyeges szempont a tov´abbiakban, hogy az euklideszi terek egy ortonorm´alt b´azis´at r¨ogz´ıtettnek tekintj¨ uk, ´es nem tesz¨ unk k¨ ul¨onbs´eget egy line´aris lek´epez´es, illetve annak az adott b´azisban vett m´atrixa k¨oz¨ott. Ugyanarra gondolunk teh´at, ha ak´ar lek´epez´esr˝ol, ak´ar m´atrixr´ol besz´el¨ unk. Ez elvi probl´em´at sem okozhat, hiszen izomorf vektorterek azonos´ıt´as´ar´ol van sz´o. Ha valamikor a b´azis megv´altoztat´asa ker¨ ulne sz´oba, akkor erre k¨ ul¨on felh´ıvjuk a figyelmet. Egy´ebk´ent, hacsak m´ast nem mondunk, vektort´eren mindig val´os test feletti vektorteret ´ert¨ unk. Legyenek teh´at a tov´abbiakban X ´es Y euklideszi terek, ´es dim X = p, illetve dim Y = q. Tov´abbra is haszn´aljuk az L(X, Y ) jel¨ol´est az X t´eren ´ertelmezett, Y t´erbe k´epez˝o line´aris lek´epez´esek vektorter´ere. Ha t¨ort´enetesen X = Y , akkor a r¨ovidebb L(X) jel¨ol´esm´oddal ´el¨ unk. Tekints¨ unk egy A ∈ L(X, Y ) line´aris lek´epez´est. 8.1.1 Defin´ıci´ o. Az A lek´epez´es norm´aj´an az egys´egg¨ omb felsz´ın´en felvett ´ert´ekei abszol´ ut ´ert´ekeinek fels˝ o hat´ ar´ at ´ertj¨ uk, azaz kAk = sup kAxk . kxk=1
213
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
214
Vil´agos, hogy a defin´ıci´oban supremum helyett maximum is ´ırhat´o, hiszen egy folytonos f¨ uggv´eny egy kompakt halmazon Weierstrass t´etele ´ertelm´eben felveszi a legnagyobb ´ert´ek´et. (L´asd az 1. gyakorlatot.) Els˝o pillant´asra nem vil´agos, hogy a norm´at mi´ert ´eppen ´ıgy ´ertelmezz¨ uk. Amint azt l´atni fogjuk, ez a defin´ıci´o val´oban norm´at defini´al, de ezt nagyon sok m´as m´odon is meg lehetne tenni. Mondhatn´ank p´eld´aul azt, hogy a norm´at defini´aljuk a legnagyobb abszol´ ut ´ert´ek˝ u oszlop abszol´ ut ´ert´ek´evel, azaz kAk = max
1≤j≤p
q X
a2ij
i=1
!1/2
,
(8.1)
vagy ´eppen vehetn´enk norm´anak az elemek abszol´ ut ´ert´ekeinek maximum´at is, teh´at kAk =
max
1≤i≤q,1≤j≤p
|aij | .
(8.2)
Nem neh´ez bel´atni, hogy a (8.1) ´es (8.2) rel´aci´ok t´enyleg kiel´eg´ıtik a norma axi´om´ait (l´asd a 2. gyakorlatot). Az a´ltalunk bevezetett defin´ıci´o mellett az sz´ol, hogy, amint azt l´atni fogjuk, igen praktikus tulajdons´agai vannak, valamint szimmetrikus m´atrixokra nagyon sz´ep algebrai jelent´ese is van. Tov´abbi ´erv az, hogy a fenti k´et rel´aci´o a norm´at a m´atrix elemeinek seg´ıts´eg´evel ´ertelmezi, ´ıgy a norma f¨ ugghet a b´azis megv´alaszt´as´at´ol. A 8.1.1 Defin´ıci´o azonban a lek´epez´es norm´aj´at vezeti be, amely nem v´altozik u ´ j b´azisra t¨ort´en˝o a´tt´er´eskor, ha a skal´aris szorzatot m´ar r¨ogz´ıtett¨ uk. T´erj¨ unk teh´at r´a az a´ltalunk ´ertelmezett norma tulajdons´againak o¨sszefoglal´as´ara. ´ ıt´ 8.1.2 All´ as. Az L(X, Y ) vektort´er a 8.1.1 Defin´ıci´ oban bevezetett norm´ aval norm´ alt teret alkot, azaz kAk ≥ 0 ,
´es
kAk = 0 akkor ´es csak akkor, ha A = 0 ,
tov´ abb´ a kA + Bk ≤ kAk + kBk ,
(8.3)
illetve kλAk = |λ| · kAk b´ armely A, B ∈ L(X, Y ), ´es λ skal´ ar mellett. Bizony´ıt´ as. A (8.3) egyenl˝otlens´eg abb´ol ad´odik, hogy sup kAx + Bxk ≤ sup kAxk + sup kBxk ,
kxk=1
kxk=1
kxk=1
m´ıg a m´asik k´et rel´aci´o a defin´ıci´o nyilv´anval´o k¨ovetkezm´enye. 2 Megjegyezz¨ uk, hogy a (8.3) egyenl˝otlens´eget a szok´asoknak megfelel˝oen h´aromsz¨ogegyenl˝otlens´egnek nevezz¨ uk. ´ ıt´ 8.1.3 All´ as. Minden x ∈ X eset´en kAxk ≤ kAk · kxk .
´ ´ 8.1. MATRIXOK NORMAJA
215
Bizony´ıt´ as. Az a´ll´ıt´as trivi´alis ha x = 0. Ha x 6= 0, akkor, minthogy x/kxk egys´egnyi norm´aj´ u vektor, a defin´ıci´o alapj´an azt kapjuk, hogy
x
,
kAk ≥ A kxk
ami az a´ll´ıt´asunkat igazolja. 2 Az is k¨onnyen bel´athat´o a defin´ıci´o alapj´an, hogy kAk ´eppen azzal a legkisebb λ nemnegat´ıv sz´ammal egyezik meg, amelyre minden x mellett ´erv´enyes az kAxk ≤ λkxk egyenl˝otlens´eg (l´asd a 3. gyakorlatot). ´ ıt´ 8.1.4 All´ as. Ha A ´es B olyan lek´epez´esek, hogy a BA szorzat ´ertelmes, akkor kBAk ≤ kBk · kAk . Bizony´ıt´ as. Val´oban, b´armely x vektor mellett k(BA)xk = kB(Ax)k ≤ kBk · kAxk ≤ kBk · kAk · kxk az el˝oz˝o a´ll´ıt´asunk alapj´an. Innen azonnal ad´odik az a´ll´ıt´as. 2 A norma n´eh´any praktikus tulajdons´ag´anak megismer´ese ut´an t´erj¨ unk r´a annak vizsg´alat´ara, hogy vajon milyen algebrai jelent´est hordoz egy m´atrix norm´aja. Amint azt l´atni fogjuk, sok esetben k¨onnyebb a norma meghat´aroz´asa az algebrai jelent´ese, mint k¨ozvetlen¨ ul a defin´ıci´o alapj´an. ´ ıt´ 8.1.5 All´ as. Tekints¨ unk egy q × p m´eret˝ u A m´ atrixot. Akkor kAk megegyezik az ∗ A A m´ atrix legnagyobb saj´ at´ert´ek´enek n´egyzetgy¨ ok´evel. Bizony´ıt´ as. A line´aris algebr´ab´ol j´ol ismert, hogy A ∗ A szimmetrikus pozit´ıv szemidefinit m´atrix, teh´at a saj´at´ert´ekei nemnegat´ıv val´os sz´amok. Legyen most v1 , . . . , vp az X vektort´ernek egy olyan ortonorm´alt b´azisa, amelyben A ∗ A diagon´alis alak´ u. A v1 , . . . , vp vektorok az A∗ A m´atrix saj´atvektorai, a megfelel˝o saj´at´ert´ekeket jel¨olje λ1 , . . . , λp . A saj´at´ert´ekek k¨oz¨ott azonosak is el˝ofordulhatnak, mindegyiket annyiszor ´ırtuk ki, amennyi a multiplicit´asa. Tegy¨ uk fel, hogy √ a saj´at´ert´ekek k¨oz¨ott a legnagyobb ´eppen λk . Azt kell igazolnunk, hogy kAk = λk . Tekints¨ unk egy tetsz˝oleges x ∈ X vektort, amely egys´egnyi norm´aj´ u, ´es amelyet a v1 , . . . , vp b´azisban az x=
p X
xi vi
i=1
line´aris kombin´aci´o a´ll´ıt el˝o. Ekkor kAxk
2
∗
= hAx, Axi = hx, A Axi = h =
p X i=1
λi x2i ≤
p X
p X i=1
xi vi ,
p X i=1
λi xi vi i
λk x2i = λk ,
i=1
√ hiszen kxk = 1. Ez azt jelenti, hogy kAxk ≤ λk minden egys´egnyi norm´aj´ u x √ vektor eset´en, azaz kAk ≤ λk . M´asr´eszt ha a fenti levezet´esben az x vektornak ´eppen a vk b´azisvektort v´alasztjuk, akkor azt kapjuk, hogy kAvk k2 = hvk , A∗ Avk i = hvk , λk vk i = λk ,
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
216 azaz kAk ≥
√ λk , ami az a´ll´ıt´asunkat bizony´ıtja.
2
8.1.6 K¨ ovetkezm´ eny. Tegy¨ uk fel, hogy A szimmetrikus m´ atrix. Jel¨ olje λ min , illetve λmax az A legkisebb, illetve legnagyobb saj´ at´ert´ek´et. Ekkor λmin kvk2 ≤ hv, Avi ≤ λmax kvk2 minden v ∈ X eset´en. Nevezetesen kAk megegyezik a |λ max | ´es |λmin | k¨ oz¨ ul a nagyobbikkal. Bizony´ıt´ as. Tekints¨ uk az X egy olyan ortonorm´alt b´azis´at, amely az A saj´atvektoraib´ol a´ll. Ebben a b´azisban a fenti kvadratikus alak n´egyzet¨osszegk´ent a´ll el˝o, azaz ha a v vektor koordin´at´ai ebben a b´azisban v 1 , . . . , vp , akkor hv, Avi =
p X
λi vi2 ,
i=1
ahol a λi egy¨ utthat´ok az A megfelel˝o saj´at´ert´ekei. Innen azonnal ad´odik a fenti P egyenl˝otlens´eg, hiszen pi=1 vi2 = kvk2 . ´ ıt´as k¨ozvetlen k¨ovetkezm´enye, hiszen ekkor A ∗ A = Az kAk el˝oa´ll´ıt´asa a 8.1.5 All´ A2 , ´es A2 saj´at´ert´ekei ´eppen az A saj´at´ert´ekeinek n´egyzetei. 2 A k´es˝obbiekben egy felt´eteles sz´els˝o´ert´eken alapul´o m´odszerrel is tal´alkozunk majd a norma meghat´aroz´as´ara. 8.1.7 P´ elda. A norma seg´ıts´eg´evel megfogalmazhatjuk a geometriai sorok o¨sszegk´eplet´enek m´atrixokra ´erv´enyes a´ltal´anos´ıt´as´at is. Megmutatjuk, hogy ha kAk < 1, akkor I − A invert´alhat´o, ahol I az egys´egm´atrix, tov´abb´a (I − A)
−1
=
∞ X
Ak .
(8.4)
k=0
Itt a v´egtelen sor konvergenci´aja norm´aban ´ertend˝o, azaz azt mondjuk, hogy P∞ Pn k k a es az o¨sszege az S m´atrix, ha az S n = k=0 A sor konvergens, ´ k=0 A r´eszlet¨osszegekre igaz, hogy lim kSn − Sk = 0 .
n→∞
Az abszol´ ut konvergens sorokr´ol sz´ol´o t´etelhez teljesen hasonl´oan megmutathat´o, P∞ k hogy a aj´anak el´egs´eges (de nem sz¨ uks´eges) felt´etele a k=0 A sor konvergenci´ P∞ k kA k numerikus sor konvergenci´ a ja. Ez ut´ o bbi azonban eset¨ unkben nyk=0 ilv´anval´o, hiszen nemnegat´ıv tag´ u sorr´ol van sz´o, ´es a r´eszlet¨oszszegek az kA k k ≤ P k k ´ ıt´ast) fel¨ kAk egyenl˝otlens´eg alapj´an (l´asd a 8.1.4 All´ ulr˝ol becs¨ ulhet˝ok a ∞ k=0 kAk konvergens geometriai sor r´eszlet¨osszegeivel. Teh´at az o¨sszehasonl´ıt´o krit´erium szerint a (8.4) alatti v´egtelen sor konvergens. Megmutatjuk, hogy a fenti sor o¨sszege ´eppen az I − A m´atrix inverze. Az eddigi jel¨ol´eseinket haszn´alva Sn (I − A) = I − An+1 → I , hiszen An+1 → 0 a felt´etel¨ unk szerint. M´asr´eszt nyilv´anval´oan S n (I −A) → S(I −A), hiszen kSn (I − A) − S(I − A)k ≤ kI − Ak · kSn − Sk → 0 .
´ ´ AG ´ 8.2. DIFFERENCIALHAT OS
217
Ez azt jelenti, hogy S(I − A) = I, azaz S = (I − A) −1 , amit igazolnunk kellett. Megjegyezz¨ uk, hogy a (8.4) formula fontos szerepet j´atszik az elm´eleti k¨ozgazdas´agtanban. Az irodalomban a (8.4) alatti v´egtelen sort Neumann-sornak is nevezik . A k¨ozgazdas´agi input-output modellekben, ha A jel¨oli a fajlagos r´aford´ıt´asi m´atrixot, akkor az (I − A) −1 m´atrixot az A Leontief-inverz´enek nevezik. Fontos k´erd´es ezekben a modellekben, hogy melyek azok a m´atrixok, amelyeknek l´etezik csupa nemnegat´ıv elem˝ u Leontief-inverze. Az ilyen m´atrixokat produkt´ıvnak nevezik. Amint azt a (8.4) formul´ab´ol azonnal l´athatjuk, a nemnegat´ıv elem˝ u A fajlagos r´aford´ıt´asi m´atrix produkt´ıv, ha teljes¨ ul r´a az kAk < 1 felt´etel. 8.1.8 P´ elda. Az elm´eleti k¨ozgazdas´agtan irodalm´aban gyakran el˝ofordul a domin´ans saj´at´ert´ek fogalma, amely egy m´atrix abszol´ ut ´ert´ekben legnagyobb saj´at´ert´ek´et jelenti. K´es˝obbi tanulm´anyainkban l´atni fogjuk, hogy egy nemnegat´ıv elem˝ u m´atrix produktivit´as´anak sz¨ us´eges ´es el´egs´eges felt´etele az, hogy a domin´ans saj´at´ert´eke kisebb, mint 1 (ez a nevezetes Perron-Frobenius-t´etel). Nem a´rt felh´ıvni a figyelmet arra, hogy ez a fogalom a´ltal´aban nem egyezik meg a m´atrix norm´aj´aval. Ha λ jel¨oli az A m´atrix domin´ans saj´at´ert´ek´et, akkor mindenesetre |λ| ≤ kAk , a´m egyenl˝os´eg pontosan akkor ´erv´enyes, ha A alkalmas b´azisban diagon´alis alakra hozhat´o (l´asd a 7. gyakorlatot). Tekints¨ uk p´eld´aul a nem diagonaliz´alhat´o A=
"
1 1 0 1
#
´ m´atrixot. Ekkor az A m´atrixnak λ = 1 k´etszeres √ saj´at´ert´eke, de a 8.1.5 All´ıt´as alapj´an k¨onnyen ellen˝or´ızhet˝o, hogy kAk = (1 + 5)/2.
8.2
Differenci´ alhat´ os´ ag
Ebben a szakaszban bevezetj¨ uk a t¨obbv´altoz´os f¨ uggv´enyek deriv´altj´anak fogalm´at. Vegy¨ uk ´eszre, hogy a fogalom term´eszetes a´ltal´anos´ıt´asa az els˝o ´eves anal´ızisben megismert ´erint˝ o approxim´ aci´ o fogalm´anak, ´es tulajdonk´eppen semmi u ´ jat nem tartalmaz. Puszt´an a line´aris lek´epez´es fogalm´at haszn´aljuk az egydimenzi´os esetn´el a´ltal´anosabb ´ertelemben. 8.2.1 Defin´ıci´ o. Legyenek X ´es Y euklideszi terek, ´es tekints¨ uk az f : X → Y lek´epez´est, amely ´ertelmezve van az x ∈ X pont egy k¨ ornyezet´eben. Azt mondjuk, hogy f differenci´alhat´o az x pontban, ha tal´ alhat´ o olyan A ∈ L(X, Y ) line´ aris lek´epez´es, hogy b´ armely v ∈ X, x + v ∈ D f eset´en f (x + v) = f (x) + Av + r(v) , ahol limv→0 kr(v)k/kvk = 0. Ebben az esetben az A lek´epez´est az f deriv´ altj´ anak nevezz¨ uk az x pontban. Jel¨ ol´ese A = f 0 (x). Megjegyezz¨ uk, hogy az ´erint˝o approxim´aci´o fogalm´ahoz hasonl´oan a fenti defin´ıci´o azt fogalmazza meg, hogy az x pont egy k¨ornyezet´eben az f f¨ uggv´eny
218
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
j´ol, azaz kis ord´o nagys´agrendben k¨ozel´ıthet˝o az A line´aris lek´epez´essel. Vil´agos ugyanis a defin´ıci´ob´ol, hogy az r : X → Y f¨ uggv´eny kis ord´o nagys´agrend˝ u az x k¨ornyezet´eben. Nem l´atszik a defin´ıci´ob´ol, hogy a deriv´alt egy´ertelm˝ uen meghat´arozott, azaz csak egyetlen olyan A line´aris lek´epez´es l´etezhet, amely kiel´eg´ıti a fenti defin´ıci´ot. Erre ad v´alaszt az al´abbi a´ll´ıt´as. ´ ıt´ 8.2.2 All´ as. A deriv´ alt egy´ertelm˝ uen meghat´ arozott. Bizony´ıt´ as. Tegy¨ uk fel, hogy az A ´es B line´aris lek´epez´esek egyar´ant eleget tesznek a defin´ıci´o k¨ovetelm´enyeinek, azaz, ha x + v ∈ D f , u ´ gy f (x + v) = f (x) + Av + r(v) f (x + v) = f (x) + Bv + q(v) , ahol r ´es q kis ord´o f¨ uggv´enyek. Ekkor a C = A − B jel¨ol´essel a Cv = r(v) − q(v) = o(v) egyenl˝os´eghez jutunk, amely ugyancsak kis ord´o f¨ uggv´eny. Teh´at tetsz˝oleges v 6= 0 vektor mellet ko( n1 v)k kC( n1 v)k kCvk = →0, = kvk k n1 vk k n1 vk
ha n → ∞. Ez azt jelenti, hogy Cv = 0, azaz C = A − B = 0. 2 Nyilv´anval´o, hogy ha f differenci´alhat´o az x pontban, akkor ott folytonos is. (L´asd a 8. gyakorlatot.) Azt is bel´atjuk, hogy egy line´aris lek´epez´es minden¨ utt differenci´alhat´o, ´es a deriv´altja saj´at maga. ´ ıt´ 8.2.3 All´ as. 0 f (x) = f .
Ha f line´ aris, akkor minden x ∈ X pontban differenci´ alhat´ o, ´es
Bizony´ıt´ as. Val´oban, alkalmazzuk a defin´ıci´ot az A = f , r = 0 szereposzt´as mellett. 2 8.2.4 P´ elda. Tekints¨ uk az f : X → R, f (x) = hx, Bxi kvadratikus alakot, ahol B ∈ L(X) szimmetrikus transzform´aci´o. Megmutatjuk, hogy f minden x ∈ X pontban differenci´alhat´o, ´espedig f 0 (x) = 2Bx. Val´oban, b´armely v ∈ X vektor mellett f (x + v) − f (x) = hx + v, B(x + v)i − hx, Bxi = hv, Bxi + hx, Bvi + hv, Bvi = hv, 2Bxi + hv, Bvi ,
´ ıt´asunk igazol´as´ahoz teh´at el´eg megmutatni, hogy hv, Bvi hiszen B szimmetrikus. All´ kis ord´o nagys´agrend˝ u. Ez azonban egyszer˝ uen l´athat´o a |hv, Bvi| ≤ kBk · kvk2 egyenl˝otlens´egb˝ol. Megjegyezz¨ uk, hogy ebben a p´eld´aban 2Bx azt az L(X, R) = X ∗ t´erbeli line´aris f¨ uggv´enyt jelenti, amelynek m´atrixa az a sorvektor, amelynek elemei ´eppen a 2Bx koordin´at´ai. Nevezetesen 2Bx(v) = hv, 2Bxi
´ ´ AG ´ 8.2. DIFFERENCIALHAT OS
219
b´armely v ∈ X eset´en. Az al´abbiakban o¨sszefoglaljuk a deriv´alt legfontosabb tulajdons´agait. A k¨ovetkez˝o a´ll´ıt´as egyszer˝ uen ad´odik a defin´ıci´ob´ol. ´ ıt´ 8.2.5 All´ as. Tegy¨ uk fel, hogy az f ´es g f¨ uggv´enyek egyar´ ant differenci´ alhat´ ok az x ∈ X pontban, ´es legyen λ ∈ R tetsz˝ oleges. Akkor f + g, illetve λf is differenci´ alhat´ ok az x pontban, ´es (f + g)0 (x) = f 0 (x) + g 0 (x) (λf )0 (x) = λf 0 (x)
Az al´abbi t´etel az o¨sszetett f¨ uggv´eny deriv´al´asi szab´aly´at a´ltal´anos´ıtja euklideszi terekre. Vegy¨ uk ´eszre azonban, hogy e t´etel bizony´ıt´asa szinte sz´o szerint megegyezik az anal´ızisben tanulttal. Legyenek teh´at X, Y ´es Z euklideszi terek, ´es tekints¨ uk az f : X → Y , valamint a g : Y → Z f¨ uggv´enyeket. Tegy¨ uk fel, hogy x bels˝o pontja az f ´ertelmez´esi tartom´any´anak, ´es f (x) is bels˝o pontja a g ´ertelmez´esi tartom´any´anak. 8.2.6 T´ etel. Ha f differenci´ alhat´ o az x pontban, tov´ abb´ a g differenci´ alhat´ o az f (x) pontban, akkor g ◦ f is differenci´ alhat´ o az x pontban, ´espedig (g ◦ f )0 (x) = g 0 (f (x))f 0 (x) . Bizony´ıt´ as. A felt´eteleink azt jelentik, hogy f (x + v) = f (x) + f 0 (x)v + r(v) , illetve g(f (x) + u) = g(f (x)) + g 0 (f (x))u + q(u) , ahol r ´es q egyar´ant kis ord´o nagys´agrend˝ uek. Ha most v ∈ X tetsz˝oleges, akkor az u = f (x + v) − f (x) jel¨ol´essel g(f (x + v)) − g(f (x)) = g 0 (f (x))u + q(u)
= g 0 (f (x))(f (x + v) − f (x)) + q(u)
= g 0 (f (x))(f 0 (x)v + r(v)) + q(u)
= g 0 (f (x))f 0 (x)v + g 0 (f (x))r(v) + q(u) . Azt kell igazolni, hogy g 0 (f (x))r(v) + q(u) kis ord´o nagys´agrend˝ u v szerint. Ezt tagonk´ent mutatjuk meg. Az els˝o tagra ez a meg´allap´ıt´as nyilv´anval´o, hiszen kr(v)k kg 0 (f (x))r(v)k ≤ kg 0 (f (x))k lim =0. v→0 kvk v→0 kvk lim
A m´asodik tag kis ord´o nagys´agrend˝ u u szerint. Ez azonban v szerint is igaz, ugyanis kq(u)k = kvk
(
0, kq(u)k kf (x+v)−f (x)k kuk kvk
,
ha f (x + v) − f (x) = 0 ha f (x + v) − f (x) 6= 0
.
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
220
Mivel az f folytonoss´aga miatt v → 0 eset´en u → 0 is fenn´all, az´ert lim
v→0
kq(u)k =0, kvk
hiszen az kf (x + v) − f (x)k kf 0 (x)v + r(v)k kr(v)k = ≤ kf 0 (x)k + kvk kvk kvk t¨ort korl´atos. 2 Ha eset¨ unkben dim X = p, dim Y = q ´es dim Z = r, akkor g 0 (f (x)) r × q, illetve f 0 (x) q × p m´eret˝ u m´atrixok, ´es ennek megfelel˝oen a (g ◦ f ) 0 (x) szorzatm´atrix r × p m´eret˝ u. 8.2.7 T´ etel. Legyen f : X → R differenci´ alhat´ o az x pontban, ´es tegy¨ uk fel, hogy 0 az x pontban az f f¨ uggv´enynek lok´ alis sz´els˝ o´ert´eke van. Akkor f (x) = 0. Bizony´ıt´ as. A felt´etel¨ unk mellett tetsz˝oleges v ∈ X eset´en a g : R → R, g(t) = f (x + tv) f¨ uggv´enynek a 0 pontban lok´alis sz´els˝o´ert´eke van. M´asr´eszt a 8.2.6 T´etel szerint g differenci´alhat´o a 0 pontban, ´es 0 = g 0 (0) = f 0 (x)v . Ez ´eppen azt jelenti, hogy f 0 (x) = 0. 2 A f¨ uggv´eny ´ertelmez´esi tartom´any´anak azon pontjait, ahol a f¨ uggv´eny differenci´alhat´o, ´es a deriv´alt z´erus, kritikus pontoknak nevezz¨ uk. 8.2.8 P´ elda. Legyen B ∈ L(X) szimmetrikus transzform´aci´o, ´es tekints¨ uk a Q(x) = hx, Bxi kvadratikus alakot. Keress¨ uk meg a Q sz´els˝o´ert´ekeit. A 8.2.4 P´elda szerint Q differenci´alhat´o, ´es Q 0 (x) = 2Bx. A 8.2.7 T´etel alapj´an a kritikus pontok a Q0 (x) = 2Bx = 0 homog´en line´aris egyenletrendszer megold´asai, azaz a ker B alt´er elemei. Vil´agos, hogy ezek a kritikus pontok minimumhelyek, ha B pozit´ıv szemidefinit, maximumhelyek, ha B negat´ıv szemidefinit, illetve egyik¨ uk sem sz´els˝o´ert´ekhely, ha B indefinit.
8.3
Parci´ alis deriv´ altak
Term´eszetes k´erd´es a deriv´alt fogalm´anak bevezet´ese ut´an, hogy vajon hogyan hat´arozhat´o meg a deriv´alt m´atrixa. Ezt a k´erd´est vizsg´aljuk meg ebben a szakaszban. Legyenek teh´at a tov´abbiakban X ´es Y olyan euklideszi terek, amelyekre dim X = p, ´es dim Y = q. Tekints¨ unk egy olyan f : X → Y f¨ uggv´enyt, amely
´ ´ 8.3. PARCIALIS DERIVALTAK
221
differenci´alhat´o az x ∈ X pontban. Ekkor a a m´atrixa q × p m´eret˝ u. Mivel f1 f2 f = .. . fq
defin´ıci´o szerint f 0 (x) ∈ L(X, Y ), azaz
,
ahol az fi f¨ uggv´enyek az f koordin´ataf¨ uggv´enyei, az´ert az f 0 (x) m´atrix sorait az egyes koordin´ataf¨ uggv´enyek deriv´altjai alkotj´ak, azaz
f (x) = 0
f10 (x) f20 (x) .. . fq0 (x)
.
Elegend˝o teh´at megvizsg´alni, hogy hogyan a´ll´ıthat´o el˝o egyetlen koordin´ataf¨ uggv´eny deriv´altj´anak a m´atrixa. Ez´ert feltehet˝o, hogy Y = R. Megjegyezz¨ uk, hogy az f differenci´alhat´os´ag´ab´ol k¨ovetkezik a koordin´ataf¨ uggv´enyek differenci´alhat´os´aga, ´es ford´ıtva, ha az f minden koordin´ataf¨ uggv´enye differenci´alhat´o, akkor f is differenci´alhat´o (l´asd a 9. gyakorlatot). Tekints¨ unk teh´at egy f : X → R f¨ uggv´enyt, ´es jel¨olje e 1 , . . . , ep az X r¨ogz´ıtett ortonorm´alt b´azis´at. 8.3.1 Defin´ıci´ o. Legyen x ∈ X az f ´ertelmez´esi tartom´ any´ anak bels˝ o pontja. Azt mondjuk, hogy f parci´ alisan differenci´ alhat´ o az i-ik v´ altoz´ o szerint az x pontban, ha l´etezik a 1 lim (f (x + tei ) − f (x)) = Di f (x) t→0 t hat´ ar´ert´ek, ´es ez v´eges. A Di f (x) hat´ ar´ert´eket az f parci´ alis deriv´ altj´ anak nevezz¨ uk az x pontban. Ha bevezetj¨ uk a g(t) = f (x+tei ) f¨ uggv´enyt a sz´amegyenesen, akkor az f parci´alis differenci´alhat´os´aga az i-ik v´altoz´o szerint az x pontban azt jelenti, hogy g differenci´alhat´o a 0 pontban, ´es g 0 (0) = Di f (x). Ennek az a szeml´eletes tartalma, hogy az f f¨ uggv´enyt csak az i-ik v´altoz´oj´aban vizsg´aljuk, a t¨obbi v´altoz´ot r¨ogz´ıtett konstansnak tekintj¨ uk az x pontban. 8.3.2 P´ elda. A defin´ıci´o figyelmes a´tolvas´as´aval l´athatjuk, hogy el˝osz¨or a behelyettes´ıt´est v´egezz¨ uk el, csak ut´ana a form´alis deriv´al´ast. Tekints¨ uk p´eld´aul az f : R2 → R, f (x, y) = e
x−y+2
q
3 + x2 + y 2 (2x − 3y − 6)5 sin2 (π + x) cos2 (π + y)
f¨ uggv´enyt, ´es hat´arozzuk meg az y szerinti parci´alis deriv´altj´at az orig´oban. Minden sz´amol´as n´elk¨ ul azonnal l´athat´o, hogy D 2 f (0, 0) = 0, ugyanis az x = 0 tengely ment´en az f f¨ uggv´eny azonosan nulla. ´ ıt´ 8.3.3 All´ as. Ha f differenci´ alhat´ o az x pontban, akkor f minden v´ altoz´ oja szerint parci´ alisan differenci´ alhat´ o az x pontban, ´espedig Di f (x) = f 0 (x)ei .
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
222
Bizony´ıt´ as. Val´oban, a differenci´alhat´os´ag miatt 1 r(tei ) 1 (f (x + tei ) − f (x)) = (f 0 (x)(tei ) + r(tei )) = f 0 (x)ei + , t t t amib˝ol t → 0 mellett azonnal ad´odik az a´ll´ıt´as.
2
8.3.4 P´ elda. Megjegyzend˝o, hogy a fenti a´ll´ıt´as nem ford´ıthat´o meg. Nevezetesen nem neh´ez p´eld´at mutatni olyan f¨ uggv´enyre, amely valamely pontban parci´alisan differenci´alhat´o az o¨sszes v´altoz´oja szerint, de a f¨ uggv´eny m´eg csak nem is folytonos abban a pontban. Tekints¨ uk p´eld´aul a s´ıkon az f (x, y) =
(
2xy x2 +y 2
,
0,
ha x2 + y 2 6= 0 k¨ ul¨onben
f¨ uggv´enyt. K¨onnyen l´athat´o, hogy D 1 f (0, 0) = D2 f (0, 0) = 0, azonban f nem folytonos az orig´oban. Val´oban, f a koordin´atatengelyek ment´en z´erus, m´ıg a 45 ◦ -os egyenes ment´en 1, ´ıgy f az orig´o b´armely k¨ornyezet´eben egyar´ant felveszi a 0 ´es az 1 ´ert´ekeket is. A parci´alis deriv´altak ismerete m´ar lehet˝ov´e teszi a deriv´alt m´atrix´anak fel´ep´ıt´es´et. Amint l´athatjuk, ha f : X → R az x pontban differenci´alhat´o f¨ uggv´eny, akkor f 0 (x) olyan 1 × p m´eret˝ u m´atrix, amelynek i-ik eleme ´eppen D i f (x). Ezen ´eszrev´etel alapj´an a keresett m´atrix m´ar k¨onnyen megadhat´o. 8.3.5 K¨ ovetkezm´ eny. Tegy¨ uk fel, hogy az f : X → Y f¨ uggv´eny differenci´ alhat´ o az x pontban. Akkor az eddigi jel¨ ol´eseinket megtartva
f 0 (x) =
D1 f1 (x) D2 f1 (x) . . . Dp f1 (x) D1 f2 (x) D2 f2 (x) . . . Dp f2 (x) .. .. . . D1 fq (x) D2 fq (x) . . . Dp fq (x)
Megjegyezz¨ uk, hogy a deriv´alt fentebb megadott m´atrix´at n´eha az f Jacobim´atrix´anak nevezik az x pontban. Amikor f val´os sz´am´ert´ek˝ u f¨ uggv´eny, teh´at a Jacobi-m´atrixa csak egyetlen sort tartalmaz, akkor a Jacobi-m´atrix helyett elterjedt a gradiens vektor elnevez´es is. Mi azonban a tov´abbiakban is kiz´ar´olag a deriv´alt elnevez´est haszn´aljuk. 8.3.6 P´ elda. Tekints¨ uk p´eld´aul azt az f : R 2 → R2 f¨ uggv´enyt, amely a s´ık pontjainak pol´aris koordin´at´ait der´eksz¨og˝ u koordin´at´akra v´altja, azaz f (r, θ) = ´es legyen g : R2 → R3 a k¨ovetkez˝o:
"
r cos θ r sin θ
#
,
x2 − xy 2 g(x, y) = y − xy . 2xy
´ ´ AG ´ 8.4. FOLYTONOS DIFFERENCIALHAT OS
223
Hat´arozzuk meg a (g ◦ f )0 (1, π/3) m´atrixot. A 8.3 K¨ovetkezm´eny szerint 0
f (r, θ) = tov´abb´a
"
cos θ −r sin θ sin θ r cos θ
Igy a 8.2.6 T´etel alapj´an
#
,
2x − y −x g 0 (x, y) = −y 2y − x . 2y 2x
(g ◦ f )0 (1, π/3) =
=
√ " # √ 1 −√ 3/2 √ −1/2 1/2 − 3/2 − √3/2 3 − 1/2 · √ 3/2 1/2 3 1 √ √ 1/2 − √3/2 1/2 − √3/2 3/2 − √ 3/2 1/2 + 3/2 , 3 1
amely term´eszetesen 3 × 2 m´eret˝ u.
8.3.7 P´ elda. Az o¨sszetett f¨ uggv´eny deriv´al´asi szab´aly´anak gyakorta haszn´alt speci´alis esete az, amikor f : R → Rp ´es g : Rp → R differenci´alhat´o f¨ uggv´enyek. Ekkor p (g ◦ f )0 (t) =
X
Di g(f (t))fi0 (t) ,
i=1
ahol t ∈ R, ´es az fi f¨ uggv´enyek az f koordin´ataf¨ uggv´enyei. 8.3.8 P´ elda. A 8.2.7 T´etel szerint a sz´els˝o´ert´eknek nyilv´an sz¨ uks´eges felt´etele a parci´alis deriv´altak elt˝ un´ese. Keress¨ uk meg p´eld´aul az f : R 2 → R, f (x, y) = 5x2 + xy 2 − y 4 formul´aval defini´alt f¨ uggv´eny sz´els˝o´ert´ekeit. A kritikus pontokat a D1 f (x, y) = 10x + y 2 = 0 D2 f (x, y) = 2xy − 4y 3 = 0 egyenletrendszer megold´as´aval nyerj¨ uk. Ennek egyetlen megold´asa az orig´o, amely azonban nyilv´an nem lok´alis sz´els˝o´ert´ek, hiszen az f f¨ uggv´eny az orig´o b´armely k¨ornyezet´eben egyar´ant felvesz pozit´ıv ´es negat´ıv ´ert´ekeket is. Ez´ert az f f¨ uggv´enynek nincs sz´els˝o´ert´eke.
8.4
Folytonos differenci´ alhat´ os´ ag
Az el˝oz˝o szakaszban m´ar l´attunk p´eld´at arra, hogy a parci´alis deriv´altak l´etez´ese nem felt´etlen¨ ul jelenti a f¨ uggv´eny differenci´alhat´os´ag´at. Most azt fogjuk megvizsg´alni, hogy milyen p´otl´olagos felt´etelek mellett igazolhat´o a differenci´alhat´os´ag.
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
224
Mindenekel˝ott megjegyezz¨ uk, hogy ha f : X → R differenci´alhat´o valamely x pontban, akkor f 0 (x) a defin´ıci´o szerint az X ∗ du´alis t´er egy eleme. Azonban X ∗ ´es X term´eszetes m´odon izomorfak, ezt az izomorfizmust az X b´azisa, illetve az X ∗ du´alis b´azisa k¨oz¨otti bijekci´o adja meg. Ez´ert az f 0 : X → X ∗ lek´epez´es u ´ gy is 0 tekinthet˝o, mint egy f : X → X lek´epez´es. Form´alisan n´ezve itt arr´ol van sz´o, hogy az f 0 (x) sorvektorokat oszlopvektorok gyan´ant kezelj¨ uk. 8.4.1 Defin´ıci´ o. Legyen M az X euklideszi t´er valamely ny´ılt r´eszhalmaza, ´es tegy¨ uk fel, hogy az f : X → R f¨ uggv´eny differenci´ alhat´ o az M halmaz minden pontj´ aban. Azt mondjuk, hogy f folytonosan differenci´ alhat´ o az x ∈ M pontban, 0 ha f : X → X folytonos az x pontban. 8.4.2 T´ etel. Az f f¨ uggv´eny akkor ´es csak akkor folytonosan differenci´ alhat´ o az x ∈ M pontban, ha itt a parci´ alis deriv´ altjai l´eteznek ´es folytonosak. Bizony´ıt´ as. El˝osz¨or a sz¨ uks´egess´eget igazoljuk. Tekints¨ uk az x ∈ M pontot, ´es legyen > 0. Ekkor az f 0 folytonoss´aga miatt l´etezik olyan δ > 0, hogy x, y ∈ M , ´ ıt´as folyt´an a parci´alis kx − yk < δ eset´en kf 0 (x) − f 0 (y)k < . Ekkor a 8.3.3 All´ deriv´altak l´eteznek, ´es |Di f (x) − Di f (y)| = k(f 0 (x) − f 0 (y))ei k
≤ kf 0 (x) − f 0 (y)k <
b´armely i = 1, . . . , p mellett. Ez ´eppen a parci´alis deriv´altak folytonoss´ag´at jelenti. T´erj¨ unk r´a az elegend˝os´eg bizony´ıt´as´ara. Legyen adott x ∈ M ´es > 0. Ekkor a parci´alis deriv´altak folytonoss´aga alapj´an van olyan δ > 0, hogy minden x, y ∈ M , kx − yk < δ eset´en |Di f (x) − Di f (y)| < /p b´armely i = 1, . . . , p mellett. (Ez nyilv´an megtehet˝o u ´ gy, hogy minden i eset´en v´alasztunk egy ilyen δ sz´amot, majd az ´ıgy kapott p darab δ k¨oz¨ ul kiv´alasztjuk a legkisebbet.) V´alasszunk ezut´an egy olyan v ∈ X vektort, amelyre kvk < δ. Ha v koordin´at´ai rendre a v1 , . . . , vp val´os sz´amok, u ´ gy vezess¨ uk be a
v1 . ..
v = i
vi 0 .. . 0
,
´es v 0 = 0 jel¨ol´eseket (i = 1, . . . , p). Ekkor a Lagrange-f´ele k¨oz´ep´ert´ek-t´etel szerint vannak olyan 0 < ti < 1 sz´amok, hogy f (x + v) − f (x) = =
p X i=1
p X i=1
f (x + v i ) − f (x + v i−1 ) =
Di f (x + v i−1 + ti vi ei )vi =
´ ˝ DERIVALTAK ´ 8.5. MASODREND U p X
Di f (x)vi +
i=1
225
p X i=1
Di f (x + v i−1 + ti vi ei ) − Di f (x) vi .
Itt a m´asodik szumma kis ord´o nagys´agrend˝ u v → 0 eset´en, hiszen 1 kvk
p p X X |vi | i−1 Di f (x + v + ti vi ei ) − Di f (x) vi ≤ <. p kvk i=1 i=1
Ez ´eppen azt jelenti, hogy f differenci´alhat´o az x ∈ X pontban. Mivel f 0 (x) = [D1 f (x), . . . , Dp f (x)], az´ert az o¨sszetett f¨ uggv´eny folytonoss´aga szerint f 0 folytonos is az x pontban. 2
8.5
M´ asodrend˝ u deriv´ altak
M´ar l´attuk, hogy az egyv´altoz´os esethez hasonl´oan a deriv´alt z´erus volta a sz´els˝o´ert´eknek csak sz¨ uks´eges felt´etele. Ebben a szakaszban bevezetj¨ uk a m´asodik deriv´alt fogalm´at, amelyre sz¨ uks´eg¨ unk lesz az el´egs´eges felt´etelek megfogalmaz´as´ahoz. Tekints¨ unk egy X euklideszi teret ´es egy f : X → R differenci´alhat´o f¨ uggv´enyt. 0 Amint azt m´ar eml´ıtett¨ uk, ilyenkor a deriv´alt f¨ uggv´eny olyan f : X → X f¨ uggv´enynek is tekinthet˝o, amelynek koordin´ataf¨ uggv´enyei a D i f parci´alis deriv´altak. 8.5.1 Defin´ıci´ o. Azt mondjuk, hogy f k´etszer differenci´ alhat´ o az x ∈ X pontban, 0 ha f : X → X differenci´ alhat´ o az x pontban.
Vil´agos, hogy ha f k´etszer differenci´alhat´o az x pontban, akkor f 00 (x) ∈ L(X) az X euklideszi t´er egy line´aris transzform´aci´oja. Ez azt jelenti, hogy a m´atrixa egy p × p m´eret˝ u n´egyzetes m´atrix. Mivel
D1 f .. 0 f = . , Dp f az´ert f 00 (x) m´atrixa fel´ırhat´o a parci´alis deriv´altf¨ uggv´enyek parci´alis deriv´altjaival, azaz a m´asodrend˝ u parci´alis deriv´altak seg´ıts´eg´evel. 8.5.2 K¨ ovetkezm´ eny. Ha f : X → R k´etszer differenci´ alhat´ o az x pontban, akkor itt l´eteznek a m´ asodrend˝ u parci´ alis deriv´ altjai, ´es
f (x) = 00
D11 f (x) D12 f (x) . . . D1p f (x) D21 f (x) D22 f (x) . . . D2p f (x) .. .. . . Dp1 f (x) Dp2 f (x) . . . Dpp f (x)
.
ahol Dij f (x) = Dj (Di f )(x). ´ Erdemes megjegyezni, hogy a fenti m´atrixot az irodalomban n´eha az f f¨ uggv´eny Hesse-m´atrix´anak nevezik az x pontban. Mi azonban tov´abbra is a m´asodik deriv´alt elnevez´est haszn´aljuk.
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
226
8.5.3 P´ elda. Legyen f : X → R k´etszer differenci´alhat´o az x ∈ X pont egy k¨ornyezet´eben, ´es legyen v ∈ X adott. Tekints¨ uk a g(t) = f (x + tv) f¨ uggv´enyt a sz´amegyenesen. Ekkor az o¨sszetett f¨ uggv´eny deriv´al´asi szab´alya alapj´an g is k´etszer differenci´alhat´o a 0 pont egy k¨ornyezet´eben, ´es itt g 00 (t) = hv, f 00 (x + tv)vi , ahol t ∈ R. 8.5.4 P´ elda. Legyen p´eld´aul f : R3 → R az f (x, y, z) = 2x2 y + xyz − y 2 z 2 formul´aval ´ertelmezett f¨ uggv´eny. A 8.5 K¨ovetkezm´eny szerint a m´asodik deriv´altat az 4y 4x + z y −2z 2 x − 4yz f 00 (x, y, z) = 4x + z y x − 4yz −2y 2
m´atrix adja meg. A fenti p´eld´aban az f 00 (x) m´atrix szimmetrikus. Megmutatjuk, hogy ez a´ltal´aban is ´erv´enyes.
8.5.5 T´ etel. (Young t´ etele) Tegy¨ uk fel, hogy f : X → R k´etszer folytonosan differenci´ alhat´ o az x ∈ M pontban. Akkor f 00 (x) szimmetrikus m´ atrix. Bizony´ıt´ as. Nyilv´an el´eg a bizony´ıt´ast k´etv´altoz´os f¨ uggv´enyekre elv´egezni. Tegy¨ uk fel, hogy f : R2 → R k´etszer folytonosan differenci´alhat´o az (x, y) pontban. Legyen v ∈ R r¨ogz´ıtett, ´es tekints¨ uk az F (t) = f (t, y + v) − f (t, y) ,
G(t) = f (x + v, t) − f (x, t)
f¨ uggv´enyeket. A feltev´es¨ unk szerint ezek differenci´alhat´ok az x, illetve az y pont egy k¨ornyezet´eben, ´es F (x + v) − F (x) = G(y + v) − G(y) . (8.5) A Lagrange-f´ele k¨oz´ep´ert´ekt´etel szerint tal´alhat´o olyan 0 < t < 1 sz´am, amelyre F (x + v) − F (x) = F 0 (x + tv)v , azaz az F defin´ıci´oj´ara tekintettel F (x + v) − F (x) = (D1 f (x + tv, y + v) − D1 f (x + tv, y)) v = (D12 f (x + tv, y)v + o(v)) v .
Innen a m´asodik deriv´alt folytonoss´aga alapj´an F (x + v) − F (x) = D12 f (x, y) . v→0 v2 lim
Teljesen hasonl´o gondolatmenettel az ad´odik, hogy lim
v→0
G(y + v) − G(y) = D21 f (x, y) . v2
´ ˝ DERIVALTAK ´ 8.5. MASODREND U
227
Ez´ert a (8.5) egyenl˝os´egb˝ol azonnal k¨ovetkezik, hogy D12 f (x, y) = D21 f (x, y) , azaz a m´asodik deriv´alt szimmetrikus m´atrix. 2 A k¨ovetkez˝o t´etel¨ unk l´enyeg´eben a Taylor-formula kiterjeszt´ese t¨obbv´altoz´os f¨ uggv´enyekre. 8.5.6 T´ etel. Tegy¨ uk fel, hogy f k´etszer folytonosan differenci´ alhat´ o az x ∈ X pont egy k¨ ornyezet´eben. Akkor 1 f (x + v) = f (x) + f 0 (x)v + hv, f 00 (x)vi + o(kvk2 ) , 2 ahol
o(kvk2 ) =0. v→0 kvk2 lim
Bizony´ıt´ as. Legyen adott > 0. A m´asodik deriv´alt folytonoss´aga miatt az x pontnak van olyan k¨ornyezete, amelyben kf 00 (x + v) − f 00 (x)k < . Vezess¨ uk be a sz´amegyenesen a g(t) = f (x + tv) f¨ uggv´enyt. Mivel ekkor g egy els˝ofok´ u f¨ uggv´eny ´es az f kompoz´ıci´ojak´ent a´ll el˝o, az o¨sszetett f¨ uggv´eny differenci´alhat´os´aga alapj´an vil´agos, hogy g k´etszer folytonosan differenci´alhat´o a 0 egy k¨ornyezet´eben, ´es g 0 (0) = f 0 (x)v
g 00 (0) = hv, f 00 (x)vi .
Alkalmazzuk a g f¨ uggv´enyre a Taylor-formul´at, akkor tal´alhat´o olyan t ∈ [0, 1] pont, amelyre 1 g(1) = g(0) + g 0 (0) + g 00 (t) . 2 Mivel g 00 (t) = hv, f 00 (x + tv)vi, innen azt kapjuk, hogy 1 1 f (x + v) = f (x) + f 0 (x)v + hv, f 00 (x)vi + hv, (f 00 (x + tv) − f 00 (x))vi . 2 2 Itt az r(v) = 1/2hv, (f 00 (x + tv) − f 00 (x))vi jel¨ol´essel vil´agos, hogy 1 |r(v)| ≤ kf 00 (x + tv) − f 00 (x)kkvk2 < kvk2 2 Ez ´eppen azt jelenti, hogy r(v) = o(kvk 2 ), amit igazolnunk kellett.
2
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
228
8.6
A sz´ els˝ o´ ert´ ek m´ asodrend˝ u felt´ etelei
Egyv´altoz´os f¨ uggv´enyek eset´eben a deriv´alt valamely z´erushelye biztosan sz´els˝o´ert´ekhely, ha ott a m´asodik deriv´alt nem nulla, s˝ot az el˝ojel azt is eld¨onti, hogy maximumr´ol, vagy minimumr´ol van sz´o. Ebben a szakaszban l´atni fogjuk, hogy t¨obbv´altoz´os f¨ uggv´enyekre anal´og felt´etelek ´erv´enyesek, csup´an a m´asodik deriv´alt el˝ojele helyett a megfelel˝o szimmetrikus m´atrix definits´eg´evel van dolgunk. Tekints¨ unk teh´at egy X euklideszi teret, valamint egy f : X → R k´etszer folytonosan differenci´alhat´o f¨ uggv´enyt. Els˝o t´etel¨ unk a sz´els˝o´ert´ek sz¨ uks´eges felt´etel´et fogalmazza meg. 8.6.1 T´ etel. m´ atrix.
Ha x az f lok´ alis minimumhelye, akkor f 00 (x) pozit´ıv szemidefinit
Bizony´ıt´ as. Legyen v ∈ X tetsz˝oleges vektor, ´es tekints¨ uk a g(t) = f (x + tv) egyv´altoz´os f¨ uggv´enyt. A felt´etel¨ unk szerint a 0 pont a g lok´alis minimumhelye. M´asr´eszt a 8.2.6 T´etel szerint g k´etszer differenci´alhat´o, ez´ert 0 ≤ g 00 (0) = hv, f 00 (x)vi , ´es ´eppen ezt kellett igazolnunk. 2 Term´eszetesen anal´og t´etel ´erv´enyes maximum eset´ere is, akkor a m´asodik deriv´alt negt´ıv szemidefinit. Ezut´an r´at´er¨ unk az el´egs´eges felt´etel bizony´ıt´as´ara. 8.6.2 T´ etel. Tegy¨ uk fel, hogy f : X → R olyan k´etszer folytonosan differenci´ alhat´ o f¨ ugv´eny, amelyre f 0 (x) = 0, valamint f 00 (x) pozit´ıv definit. Akkor x az f lok´ alis minimumhelye. Bizony´ıt´ as. A Taylor-formula alapj´an (l´asd a 8.5.6 T´etelt) az x valamely k¨ornyezet´eben 1 (8.6) f (x + v) − f (x) = hv, f 00 (x)vi + o(kvk2 ) 2 Jel¨olje λ az f 00 (x) m´atrix legkisebb saj´at´ert´ek´et, akkor a felt´etel¨ unk szerint λ pozit´ıv, ´es a 8.1 K¨ovetkezm´eny alapj´an hv, f 00 (x)vi ≥ λkvk2 minden v ∈ X vektor mellett. Legyen δ > 0 olyan, hogy b´armely kvk < δ eset´en o(kvk2 ) λ < . kvk2 3
Ezeket a (8.6) egyenl˝os´egbe visszahelyettes´ıtve azt kapjuk, hogy f (x + v) − f (x) ≥
λ kvk2 > 0 , 6
hacsak kvk < δ, v 6= 0. Ez ´eppen azt jelenti, hogy x az f lok´alis (szigor´ u) minimumhelye. 2 00 Mag´at´ol ´ertet˝od˝oen az f (x) negat´ıv definits´ege lok´alis maximumot jelent. 8.6.3 P´ elda. Felvet˝odhet a k´erd´es, hogy mi´ert nem haszn´altuk a 8.6.1 T´etel bizony´ıt´as´anak m´odszer´et a 8.6.2 T´etelre is. Abb´ol ugyanis az ad´odna, hogy b´armely
´ O ˝ ERT ´ EK ´ MASODREND ´ ˝ FELTETELEI ´ 8.6. A SZELS U
229
v ∈ X mellett a g(t) = f (x + tv) f¨ uggv´enynek a 0 pontban lok´alis minimumhelye van. Ebb˝ol azonban nem k¨ovetkezik, hogy az f f¨ uggv´enynek az x pontban lok´alis mimimumhelye lenne, amint azt az al´abbi p´elda is mutatja. Tekints¨ uk a s´ıkon az f (x, y) = (y − x2 )(y − 2x2 ) f¨ uggv´enyt. K¨onnyen ellen˝or´ızhet˝o, hogy az orig´o kritikus pont. M´asr´eszt e f¨ uggv´eny az y = x2 , ´es y = 2x2 parabol´ak k¨oz¨ott negat´ıv ´ert´ekeket, azokon k´ıv¨ ul pedig pozit´ıv ´ert´ekeket vesz fel. Ez´ert b´armely, az orig´on a´tmen˝o egyenesre lesz˝ uk´ıtve a 0 pontban az f f¨ uggv´enynek lok´alis minimuma van, de az orig´o az f f¨ uggv´enynek nem lok´alis minimumhelye, hiszen f az orig´o b´armely k¨ornyezet´eben egyar´ant felvesz pozit´ıv ´es negat´ıv ´ert´ekeket is. Mellesleg 00
f (0, 0) =
"
0 0 0 2
#
nyilv´anval´oan pozit´ıv szemidefinit. 8.6.4 P´ elda. Vizsg´aljuk most meg a h´aromv´altoz´os f (x, y, z) = xy 2 z 3 (7 − x − 2y − 3z) f¨ uggv´enyt. Ekkor a kritikus pontokra a D1 f (x, y, z) = y 2 z 3 (7 − 2x − 2y − 3z) = 0
D2 f (x, y, z) = 2xyz 3 (7 − x − 3y − 3z) = 0
D3 f (x, y, z) = 3xy 2 z 2 (7 − x − 2y − 4z) = 0
egyenletrendszer ad´odik, amelynek egyik megold´asa az a m´asodik deriv´alt −2 −2 −3 f 00 (1, 1, 1) = −2 −6 −6 −3 −6 −12
(1, 1, 1) pont. Ezen a helyen
.
Az A − λI m´atrix elemi b´azistranszform´aci´oj´anak elv´egz´ese ut´an az utols´o sorban a λ3 + 20λ2 + 59λ + 42
polinomhoz jutunk. Ennek term´eszetesen csak val´os gy¨okei vannak, amelyek sz¨ uks´egk´eppen mind negat´ıvok, hiszen a polinomnak minden egy¨ utthat´oja pozit´ıv. Ez azt jelenti, hogy a m´asodik deriv´alt negat´ıv definit, azaz az (1, 1, 1) pontban az f f¨ uggv´enynek lok´alis maximuma van. 8.6.5 P´ elda. K´etv´altoz´os f¨ uggv´enyek eset´eben a m´asodik deriv´alt definits´ege egyszer˝ uen ellen˝or´ızhet˝o. Tekints¨ uk ugyanis az 00
f (x, y) =
"
D11 f (x, y) D12 f (x, y) D21 f (x, y) D22 f (x, y)
#
m´atrixot az (x, y) kritikus pontban, ´es vezess¨ uk be a D(x, y) = D11 f (x, y)D22 f (x, y) − (D12 f (x, y))2 kifejez´est. Ekkor a k¨ovetkez˝o esetek lehets´egesek.
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
230
• D(x, y) < 0 eset´en a karakterisztikus polinom gy¨okei ellenkez˝o el˝ojel˝ uek, ´ıgy a m´asodik deriv´alt indefinit. Ilyenkor az (x, y) pontban nincs sz´els˝o´ert´ek. • D(x, y) > 0 eset´en a karakterisztikus polinom gy¨okei azonos el˝ojel˝ uek, ´ıgy a m´asodik deriv´alt definit m´atrix. M´eghozz´a pozit´ıv definit, ha D 11 f (x, y) > 0 (azaz (x, y) lok´alis minimumhely), illetve negat´ıv definit, ha D 11 f (x, y) < 0 (azaz (x, y) lok´alis maximumhely). • D(x, y) = 0 eset´en minden lehets´eges. Az f (x, y) = x 3 + y 3 eset´eben az orig´o nem sz´els˝o´ert´ekhely, m´ıg az f (x, y) = x 4 + y 4 , illetve ennek negat´ıvj´anak eset´eben az orig´o minimumhely, illetve maximumhely. K¨onnyen ellen˝or´ızhet˝o azonban, hogy mindh´arom esetben D(0, 0) = 0. 8.6.6 P´ elda. Tegy¨ uk fel, hogy valamely k´ıs´erlet kimenetel´ere p sz´am´ u megfigyel´est v´egezt¨ unk, ´es az x1 , . . . , xp k¨ ul¨onb¨oz˝o helyeken az y1 , . . . , yp ´ert´ekek ad´odtak. Az az elk´epzel´es¨ unk, hogy ezekre a tapasztalati adatokra line´aris modell illeszthet˝o, azaz egy olyan y = mx + b egyenlet˝ u egyenest keres¨ unk, amelyre mx1 + b = y1
...
mxp + b = yp
Term´eszetesen az adatok nem k¨ovetik a mi hipot´ezis¨ unket, ez´ert a´ltal´aban ilyen egyenes nem l´etezik. Ha ezt “m´er´esi hib´anak” tudjuk be, ´es megel´egsz¨ unk egy j´o k¨ozel´ıt´essel, akkor egy olyan egyenest keres¨ unk, amely az adatainkat “j´ol” k¨ozel´ıti. J´o k¨ozel´ıt´esen azt ´ertj¨ uk, hogy az f (m, b) =
p X i=1
(mxi + b − yi )2
n´egyzet¨osszeg minim´alis. Ezt a k¨ozel´ıt˝o elj´ar´ast legkisebb n´egyzetek m´odszer´enek nevezz¨ uk. A minimumhelyre a parci´alis deriv´altakb´ol a D1 f (m, b) = D2 f (m, b) =
p X
i=1 p X i=1
2xi (mxi + b − yi ) = 0 2(mxi + b − yi ) = 0
egyenletrendszer ad´odik. Innen a p X
xi yi = m
i=1
p X i=1
yi = m
p X
i=1 p X
x2i + b
p X
xi
i=1
xi + bp
(8.7)
i=1
egyenletrendszert kapjuk, amib˝ol az m ´es b ismeretlenek m´ar k¨onnyen meghat´arozhat´ok. Vil´agos, hogy ´ıgy minimumhoz jutunk, hiszen f teljes n´egyzetek o¨sszegek´ent a´ll el˝o.
¨ ´ ´ 8.7. AZ IMPLICITFUGGV ENY-T ETEL
231
Ezt a minimumhelyet deriv´al´as n´elk¨ ul, puszt´an algebrai eszk¨oz¨okkel is megkaphatjuk. Ha bevezetj¨ uk az
x1 .. x= . , xp
x1 1 .. A = . ... , xp 1
jel¨ol´eseket, akkor az Rp t´erben
y1 .. y= . , yp
z=
"
m b
#
f (z) = kAz − yk2 alakban ´ırhat´o. Ez nyilv´an pontosan akkor minim´alis, ha az Az−y vektor ortogon´alis az im A alt´erre. Ez azt jelenti, hogy az R 2 mindk´et ei b´azisvektor´ara hy − Az, Aei i = 0. Innen egyszer˝ u a´talak´ıt´assal az hA∗ y, ei i = hA∗ Az, ei i egyenlet ad´odik i = 1, 2 mellett, amib˝ol A∗ y = A∗ Az . Itt A∗ A nyilv´an invert´alhat´o, hiszen 2 rang´ u 2 × 2-es m´atrix. K¨ovetkez´esk´eppen "
m b
#
= z = (A∗ A)−1 A∗ y .
A kijel¨olt m˝ uveletek elv´egz´es´evel k¨onnyen ellen˝or´ızhet˝o, hogy ´ıgy is a (8.7) alatti egyenletrendszer megold´as´ahoz jutottunk.
8.7
Az implicitf¨ uggv´ eny-t´ etel
Sz´amos feladatban felmer¨ ul˝o probl´ema, hogy valamely implicit m´odon megadott f (x, y) = 0 egyenletb˝ol az y v´altoz´o mikor fejezhet˝o ki mint az x f¨ uggv´enye. M´ask´ent megfogalmazva, mikor tal´alhat´o olyan g adott tulajdons´ag´ u f¨ uggv´eny, amelyre a fenti egyenlet azonoss´ag lesz, azaz f (x, g(x)) = 0 teljes¨ ul. P´eld´aul a mikro¨okon´omi´aban k´ezenfekv˝onek t˝ unik (b´ar nem nyilv´anval´o) az a feltev´es, hogy a hasznoss´agi illetve a termel´esi f¨ uggv´eny szintvonalai (k¨oz¨omb¨oss´egi g¨orb´ei) k´et term´ek k¨oz¨otti f¨ uggv´enykapcsolatot fejeznek ki. Ezzel a k´erd´esk¨orrel foglalkozunk a k¨ovetkez˝o szakaszban. 8.7.1 T´ etel. (Implicitf¨ uggv´ eny-t´ etel) Legyenek X, Y ´es Z euklideszi terek, dim X = p, dim Y = dim Z = q, legyen (x0 , y0 ) ∈ X × Y adott pont, legyen f : X × Y → Z adott f¨ uggv´eny, f (x0 , y0 ) = 0, legyen f folytonosan differenci´ alhat´ o az (x0 , y0 ) pont egy k¨ ornyezet´eben, ´es tegy¨ uk fel, hogy D 2 f (x0 , y0 ) ∈ L(Y ) m×m-m´eret˝ u invert´ alhat´ o m´ atrix. Akkor l´etezik az x0 pontnak olyan U , az y0 pontnak olyan V k¨ ornyezete, ´es l´etezik pontosan egy olyan g : U → V folytonosan differenci´ alhat´ o f¨ uggv´eny, amelyre
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
232
• U × V ⊂ D(f ), D(g) = U , R(g) = V , • g(x0 ) = y0 , • ∀x ∈ U eset´en f (x, g(x)) = 0 , • ∀x ∈ U eset´en g 0 (x) = −D2 f (x, g(x))−1 D1 f (x, g(x)). ´ Atfogalmaz´ as: Az f −1 (0) ∩ (U × V ) = {(x, y) ∈ X × Y : f (x, y) = 0} ∩ (U × V ) ⊂ X × Y halmaz (rel´ aci´ o) az U halmazon ´ertelmezett differenci´ alhat´ o f¨ uggv´eny, azaz f −1 (0) ∩ U × V = g : U → Y folytonosan differenci´ alhat´ o f¨ uggv´eny. 8.7.2 Megjegyz´ es. • A fenti t´etel igaz a 0 helyett ∀ z ∈ Z eset´en: az f −1 (z) ∩ (U × V ) ⊂ X × Y halmaz (rel´aci´o) az U halmazon ´ertelmezett differenci´alhat´o f¨ uggv´eny. • A t´etel nem a´ll´ıtja, hogy az f −1 (z) az eg´esz X-en f¨ uggv´eny, csup´an azt, hogy az x0 egy k¨ornyezet´eben az. • A t´etelt ilyen a´ltal´anosan most nem bizony´ıtjuk. A k¨ozgazdas´agtanban azonban sokszor el´eg a fenti t´etel k´etdimenzi´os speci´alis esete is, amely viszonylag k¨onnyen bel´athat´o. 8.7.3 T´ etel. (Implicitf¨ uggv´ eny-t´ etel, speci´ alis eset) Legyenek I, J ⊆ R ny´ılt intervallumok, (x0 , y0 ) ∈ I × J adott pont, legyen f : I × J → R adott f¨ uggv´eny, amelyre f ((x0 , y0 )) = 0, tegy¨ uk fel, hogy az f : I × J → R f¨ uggv´eny folytonosan diffhat´ o az (x0 , y0 ) ∈ I × J egy k¨ ornyezet´eben, ´es a D2 f ((x0 , y0 )) 6= 0. Akkor l´etezik az x0 pontnak olyan U = [x0 − δ, x0 + δ] ´es az y0 pontnak olyan V = [y0 −ε, y0 +ε] k¨ ornyezete, ´es l´etezik pontosan egy g : [x 0 −δ, x0 +δ] → [y0 −ε, y0 +ε] folytonosan differenci´ alhat´ o f¨ uggv´eny, hogy • [x0 − δ, x0 + δ] × [y0 − ε, y0 + ε] ⊂ I × J, ´es R(g) ⊂ [y0 − ε, y0 + ε] , • g(x0 ) = y0 , • ∀x ∈ [x0 − δ, x0 + δ] eset´en f (x, g(x)) = 0 , D1 f (x,g(x)) . • ∀x ∈ (x0 − δ, x0 + δ) eset´en g 0 (x) = − D 2 f (x,g(x))
Bizony´ıt´ as. Nyilv´an feltehet˝o, hogy D 2 f (x0 , y0 ) > 0. Mivel az f folytonosan differenci´alhat´o az (x0 , y0 ) ∈ I × J pont egy k¨ornyezet´eben, az´ert ∃ γ, ε > 0 sz´amok, hogy ∀ (x, y) ∈ [x0 − γ, x0 + γ] × [y0 − ε, y0 + ε] eset´en D2 f (x, y) > 0, ´ıgy ∀ x ∈ [x0 − γ, x0 + γ] eset´en az [y0 − ε, y0 + ε] intervallumon D2 f (x, ·) > 0, ´ıgy az f (x, ·) : [y0 − ε, y0 + ε] → R f¨ uggv´eny szigor´ uan monoton n¨oveked˝o. Mivel f (x0 , y0 ) = 0 , az´ert f (x0 , y0 − ε) < 0 ´es f (x0 , y0 + ε) > 0. Mivel az f folytonos, az´ert ∃δ ∈ (0, γ), hogy ∀x ∈ [x 0 − δ, x0 + δ] eset´en f (x, y0 − ε) < 0 ´es f (x, y0 + ε) > 0.
¨ ´ ´ 8.7. AZ IMPLICITFUGGV ENY-T ETEL
233
Mivel az f (x, ·) : [y0 − ε, y0 + ε] → R f¨ uggv´eny folytonos, az´ert a Bolzano-t´etel szerint l´etezik, mivel szigor´ uan monoton, az´ert pontosan egy y x ∈ [y0 − ε, y0 + ε] l´etezik, amelyre f (x, yx ) = 0. Legyen g : [x0 − δ, x0 + δ] → [y0 − ε, y0 + ε] az a f¨ uggv´eny, amelyre ∀x ∈ [x0 − δ, x0 + δ] eset´en g(x) := yx . A g defin´ıci´oj´ab´ol k¨ovetkezik, hogy ∀x ∈ [x 0 − δ, x0 + δ] eset´en f (x, g(x)) = 0, mivel ∀x ∈ [x0 − δ, x0 + δ] eset´en pontosan egy fenti tulajdons´ag´ u y x tal´alhat´o, az´ert pontosan egy ilyen g f¨ uggv´eny l´etezik. Megmutatjuk, hogy a g f¨ uggv´eny differenci´alhat´o ∀ x ∈ (x 0 − δ, x0 + δ) pontban. Legyen z ∈ (x0 − δ, x0 + δ) tetsz˝oleges pont, ekkor a Lagrange-k¨oz´ep´ert´ekt´etel szerint l´etezik olyan u az x ´es a z k¨oz¨ott, valamint v a g(x) ´es a g(x) k¨oz¨ott, melyekre 0 = f (z, g(z)) − f (x, g(x)) =
= f (z, g(z)) − f (x, g(z)) + f (x, g(z)) − f (x, g(x)) = = D1 f (u, g(z)) · (z − x) + D2 f (x, v) · (g(z) − g(x)).
´Igy D2 f (x, v) 6= 0 miatt D1 f (u, g(z)) g(z) − g(x) =− . z−x D2 f (x, v) Ha most tudn´ank, hogy a fenti egyenl˝os´eg jobboldala korl´atos, akkor abb´ol m´ar ad´odna, hogy a g f¨ uggv´eny folytonos. Ez sajnos az eddigiekb˝ol nem k¨ovetkezik, de k¨onnyen l´athat´o, hogy ha a bizony´ıt´as elej´en k¨or¨ ultekint˝obben v´alasztjuk meg a δ-t ´es az ε-t, akkor a fenti egyenl˝os´eg jobboldala korl´atos lesz. Nevezetesen a D 1 f ´es a D2 f (x0 , y0 )-beli folytonoss´aga ´es D2 f ((x0 , y0 )) > 0 miatt a δ ´es ε > 0 sz´amok v´allaszthat´ok olyan kicsire, hogy ∀ (x, y) ∈ [x 0 − δ, x0 + δ] × [y0 − ε, y0 + ε] eset´en D2 f ((x, y)) ≥
D2 f ((x0 , y0 )) ´es |D1 f (x, y)| ≤ |D1 f (x0 , y0 )| + 1. 2
Ekkor ∀ (x, y), (u, v) ∈ [x0 − δ, x0 + δ] × [y0 − ε, y0 + ε] eset´en D1 f (x, y) |D1 (x0 , y0 )| + 1 − D f (u, v) ≤ 2 D f (x , y ) =: K, 2
2
0
0
amit ´eppen akartunk. Ezek szerint ha a δ-t ´es az ε-t a fentiek szerint v´alasztjuk meg, akkor a g f¨ uggv´eny folytonos. Tov´abb´a mivel az f 0 ´es a g folytonos f¨ uggv´enyek, az´ert ∀ α > 0 eset´en l´etezik az x-nek olyan W k¨ornyezete, hogy ∀ z ∈ W eset´en D1 f (x, g(x)) D1 f (u, g(z)) D f (x, g(x)) − D f (x, v) < α, 2
Mivel pedig
g(z)−g(x) z−x
2
= − DD1 f2(u,g(z)) ert f (x,v) , az´
g(z) − g(x) D1 f (x, g(x)) + < α, z−x D2 f (x, g(x))
ez´ert a g f¨ uggv´eny differenci´alhat´o az x pontban ´es g 0 (x) =
D1 f (x, g(x)) . D2 f (x, g(x))
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
234
Innen pedig a g, a D1 f ´es a D2 f folytonoss´aga alapj´an ad´odik, hogy g 0 is folytonos. Mivel f (x0 , y0 ) = 0 , ´ıgy a g(x0 )-ra vonatkoz´o egy´ertelm˝ us´egi felt´etel miatt g(x0 ) = y0 . Ezzel a t´etelt bebizony´ıtottuk. 2 8.7.4 P´ elda. Tekints¨ uk a s´ıkon az f (x, y) = ex+y + x + y − 1 = 0 egyenletet. Vil´agos, hogy f (0, 0) = 0, ´es D 2 f (0, 0) = 2, ´ıgy teljes¨ ulnek az implicitf¨ uggv´eny-t´etel felt´etelei. Teh´at tal´alhat´o egyetlen olyan folytonosan differenci´alhat´o y = g(x) f¨ uggv´eny a 0 pont k¨ornyezet´eben, amelyre a fenti egyenlet azonoss´ag. Erre a f¨ uggv´enyre a t´etel¨ unkb˝ol g 0 (x) = −
1 (ex+g(x) + 1) = −1 ex+g(x) + 1
ad´odik, azaz g(x) = −x, amelyet y hely´ere ´ırva val´oban azonoss´aghoz jutunk. 8.7.5 P´ elda. Az y v´altoz´o kifejezhet˝os´eg´et nem algebrai ´ertelemben kell ´erten¨ unk, teh´at el˝ofordulhat, hogy a g f¨ uggv´eny l´etez´es´et igazolni tudjuk, de azt algebrai a´talak´ıt´asokkal a fenti egyenletb˝ol nem tudjuk el˝oa´ll´ıtani. Tekints¨ uk p´eld´aul az ex+y − 2 cos y + 1 = 0 egyenletet. Meg lehet mutatni, hogy ez az egyenlet egy folytonosan differenci´alhat´o f¨ uggv´enyt defini´al, azaz l´etezik pontosan egy olyan g folytonosan differenci´alhat´o f¨ uggv´eny, amelyre g(0) = 0, ´es ex+g(x) − 2 cos g(x) + 1 = 0 minden x eset´en, de persze az y v´altoz´o a fenti egyenletb˝ol algebrai a´talak´ıt´asokkal nem fejezhet˝o ki. 8.7.6 P´ elda. (Egy mikro¨okon´omiai p´elda: A helyettes´ıt´esi hat´arar´any): A mikro¨okon´omi´aban a hasznoss´agi f¨ uggv´eny a j´osz´agt´eren ´ertelmezett olyan f¨ uggv´eny, amely a fogyaszt´o preferenci´ait fejezi ki. Felt´eve, hogy k´et j´osz´agunk van, legyen u : R2+ → R egy hasznoss´agi f¨ uggv´eny, ekkor egy adott α ∈ R hasznoss´agi szinthez tartoz´o k¨oz¨omb¨oss´egi g¨orbe az u−1 (α) = {(x1 , x2 ) : u(x1 , x2 ) = α} ⊂ R2+ szinthalmaz. Ez a halmaz (rel´aci´o) nem biztos, hogy f¨ uggv´eny, de ha az u-ra teljes¨ ulnek a fenti t´etel felt´etelei, akkor egy U k¨ornyezetben az, azaz u −1 (α) = g : U → R f¨ uggv´eny, ami differenci´alhat´o is, ´es g 0 (x1 ) = −
D1 u(x1 , g (x1 )) D2 u(x1 , g (x1 ))
(a mikro¨okon´omi´aban a g f¨ uggv´enyt x 2 -vel szokt´ak jel¨olni, ekkor az el˝obbi D1 u(x1 ,x2 (x1 )) 2 ıt´esi o¨sszef¨ ugg´es a k¨ovetkez˝o alak´ u: x 02 (x1 )(= dx dx1 ) = − D2 u(x1 ,x2 (x1 )) ), azaz helyettes´ hat´arr´ata megyegyezik a hat´arhasznok h´anyados´anak az ellentettj´evel.
¨ ´ ´ 8.7. AZ IMPLICITFUGGV ENY-T ETEL
235
Ebb˝ol ad´odik az is, hogy ha u : R2+ → R f¨ uggv´eny monoton n¨oveked˝o, (a deriv´altja nemnegat´ıv) akkor a g : U → R f¨ uggv´eny monoton cs¨okken˝o. K¨onnyen l´athat´o tov´abb´a, hogy ha az u : R2+ → R f¨ uggv´eny konk´av, akkor a g : U → R f¨ uggv´eny konvex, ´ıgy a g 0 deriv´alt f¨ uggv´eny n˝o, mivel g 0 negat´ıv, az´ert abszol´ ut´ert´ekben cs¨okken, azaz a helyettes´ıt´esi hat´arar´any abszol´ ut´ert´ekben cs¨okken. Ugyanez mondhat´o el a termel´esi f¨ uggv´enyek eset´eben: Egy f : R2+ → R termel´esi f¨ uggv´enyre felt´eve a fenti t´etel felt´eteleit, azt kapjuk, hogy egy k¨ornyezetben az f −1 (α) halmaz f¨ uggv´eny, azaz f −1 (α) = D1 f (x1 ,g(x1 )) 0 , (a g : U → R f¨ uggv´eny, ami differenci´alhat´o is, ´es g (x1 ) = − D 2 f (x1 ,g(x1 )) D1 f (x1 ,x2 (x1 )) dx2 ) = −D ,) azaz mikro¨okon´omi´aban megszokott jel¨ol´esekkel: x 02 (x1 )(= dx 1 2 f (x1 ,x2 (x1 )) a technikai helyettes´ıt´esi hat´arr´ata megyegyezik a hat´arterm´ekek h´anyados´anak az ellentettj´evel.
8.7.7 P´ elda. (Egy makro¨okon´omiai p´elda: Az IS ´es az LM g¨orb´ek): 1. Az IS (investment–saving) g¨orbe: A beruh´az´as a kamatl´abt´ol f¨ ugg: I(i), a megtakar´ıt´as a kibocs´at´ast´ol f¨ ugg: S(Y ). Legyen F : R+ × R+ → R az a f¨ uggv´eny, amelyre ∀ Y, i ∈ R+ eset´en F (Y, i) := S(Y ) − I(i), ekkor az S(Y ) = I(i) egyenl˝os´egnek eleget t´ev˝o kamatl´ab–j¨ovedelem p´arok halmaza az F −1 (0) = {(Y, i) ∈ R2+ : F (Y, i) = 0} ⊂ R2+ halmaz (rel´aci´o), amely, ha az F f¨ uggv´enyre igazak a fenti t´etel felt´etelei, akkor egy k¨ornyezetben differenci´alhat´o f¨ uggv´eny: F −1 (0) = i : U → R. K´erd´es, hogy milyen az i f¨ uggv´enyalakja? Mivel a fenti t´etel szerint az i 0 (Y )(= 0 D1 F (Y,i(Y )) S (Y ) di , ez´ert felt´eve, hogy S 0 (Y ) > 0 ´es I 0 (i) < 0, (azaz dY ) = − D2 (Y,i(Y )) = − I 0 (i) a megtakar´ıt´as a kibocs´at´as eset´en n˝o, a beruh´az´as a kamatl´ab n¨oveked´ese eset´en cs¨okken,) ad´odik, hogy i0 (Y ) < 0, azaz az i cs¨okken˝o f¨ uggv´eny. (Ha a korm´anyzat a kibocs´at´ast n¨oveli, akkor a kamatl´ab cs¨okken.) 2. Az LM (liquidity–money) g¨orbe: A p´enzkereslet a kibocs´at´ast´ol ´es a kamatl´abt´ol f¨ ugg: M D (Y, i), a p´enzk´ın´alat a´lland´o: M/P. Legyen F : R+ × R+ → R az a f¨ uggv´eny, amelyre ∀ Y, i ∈ R+ eset´en F (Y, i) := MD (Y, i) − M/P , ekkor az MD (Y, i) = M/P egyenl˝os´egnek eleget t´ev˝o kamatl´ab-j¨ovedelem p´arok halmaza az F −1 (0) = {(Y, i) ∈ R2+ : F (Y, i) = 0} ⊂ R2+ halmaz (rel´aci´o), amely, ha az F f¨ uggv´enyre igazak a fenti t´etel felt´etelei, akkor egy k¨ornyezetben f¨ uggv´eny: F −1 (0) = Y : U → R,
D2 M (Y (i),i) D2 F (Y (i),i) ert felt´eve, amely differenci´alhat´o´es Y 0 (i)(= dY di ) = − D1 F (Y (i),i) = − D1 M (Y (i),i) , ez´ hogy D1 M (Y, i) > 0 ´es D2 M (Y, i) < 0, ( azaz a p´enzkereslet a kibocs´at´as n¨oveked´ese eset´en n˝o, a kamat n¨oveked´ese eset´en cs¨okken,) ad´odik, hogy Y 0 (i) > 0, azaz az Y n¨ovekv˝o f¨ uggv´eny. (Ha a k¨ozponti bank a kamatl´abat n¨oveli, akkor a kibocs´at´as n˝o.)
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
236
8.8
Felt´ eteles sz´ els˝ o´ ert´ ek
Sz´amos sz´els˝o´ert´ek probl´ema vezet olyan feladathoz, amelyben az f f¨ uggv´eny sz´els˝o´ert´ek´et egy adott K halmazon kell meghat´arozni. Ilyen esetekben az f 0 (x) = 0 felt´etel m´ar nem felt´etlen¨ ul sz¨ uks´eges felt´etele a sz´els˝o´ert´eknek, hiszen elk´epzelhet˝o, hogy az f f¨ uggv´eny a sz´els˝o´ert´ek´et a K halmaz hat´ar´an veszi fel. Tekints¨ uk p´eld´aul az f (x, y) = x + y f¨ uggv´enyt, ´es keress¨ uk az f minimum´at az |x| ≤ 1, |y| ≤ 1 felt´etelek mellett. Ha bevezetj¨ uk a n
K = (x, y) ∈ R2 : |x| ≤ 1, |y| ≤ 1
o
halmazt (amely egy orig´o k¨oz´eppont´ u, k´et egys´egnyi oldal´ u n´egyzet), akkor a feladatunk az f minimumhely´enek megkeres´ese a K halmazon. K¨onnyen l´athat´o, hogy f a minimum´at ezen a halmazon az (x, y) = (−1, −1) pontban veszi fel, de f deriv´altja term´eszetesen sehol sem nulla. Az f f¨ uggv´enynek persze az eg´esz R 2 t´eren nincs minimuma. Legyenek teh´at X ´es Y val´os euklideszi terek, dim X = p, dim Y = q, ´es tegy¨ uk fel, hogy q ≤ p. Tekints¨ uk az f : X → R ´es F : X → Y folytonosan differenci´alhat´o f¨ uggv´enyeket. Legyen a ∈ Y tetsz˝oleges adott pont. Keress¨ uk az f f¨ uggv´eny lok´alis minimumhely´et az F (x) = a felt´etel mellett, jel¨ol´esben f (x) → min
(8.8)
F (x) = a . Ha bevezetj¨ uk a
K = {x ∈ X : F (x) = a} = F −1 (a) jel¨ol´est, akkor a fenti feladat az f (x) → min x∈K
alakban is fel´ırhat´o. 8.8.1 Defin´ıci´ o. Azt mondjuk, hogy az x 0 ∈ X pont a (8.8) feladat megold´ asa, ha egyr´eszt F (x0 ) = a, m´asr´eszt az x pontnak van olyan U k¨ornyezete, hogy f (x0 ) ≤ f (x) b´armely x ∈ U ∩ K eset´en. 8.8.2 Defin´ıci´ o. A (8.8) feladat Lagrange-f¨ uggv´eny´en az L : X × Y → R, L(x, y) = f (x) + hy, F (x)i f¨ uggv´enyt ´ertj¨ uk. Nyilv´anval´o, hogy a Lagrange-f¨ uggv´eny mindk´et v´altoz´oja szerint folytonosan differenci´alhat´o. Az egyszer˝ ubb jel¨ol´esm´od ´erdek´eben a k¨ovetkez˝okben az L els˝o, illetve m´asodik v´altoz´o szerinti parci´alis deriv´altj´an az x, illetve az y szerinti deriv´altakat ´ertj¨ uk.
´ ´ O ˝ ERT ´ EK ´ 8.8. FELTETELES SZELS
237
8.8.3 T´ etel. (Lagrange-f´ ele multiplik´ ator-t´ etel) Tegy¨ uk fel, hogy x 0 a (8.8) feladat megold´ asa, ´es im F 0 (x0 ) = Y , azaz az F 0 (x0 ) m´ atrix sorai line´ arisan f¨ uggetlenek. Ekkor tal´ alhat´ o olyan y ∈ Y vektor, hogy D1 L(x0 , y) = f 0 (x0 ) + F 0 (x0 )∗ y = 0 .
(8.9)
Legyenek az Y egy ortonorm´alt b´azis´ara n´ezve az y ∈ Y vektornak a koordin´at´ai λ1 , ...λq , ekkor a (8.9) egyenletet az f 0 (x0 ) +
q X
λi fi0 (x0 ) = 0
(8.10)
i=1
alakban is fel´ırhatjuk, ahol az fi f¨ uggv´enyek az F koordin´ataf¨ uggv´enyei. Ezek szerint a fenti t´etel u ´ gy is fogalmazhat´o, hogy az optim´alis pontban a felt´eteli f¨ uggv´enyek deriv´aljainak van olyan line´aris kombin´aci´oja amely a c´elf¨ uggv´eny deriv´altj´at a´ll´ıtja el˝o. A λ1 , ...λq egy¨ utthat´okat Lagrange-f´ele multiplik´ atoroknak nevezz¨ uk. A fenti t´etelben term´eszetesen a D 2 L(x0 , y) = a felt´etel is teljes¨ ul, hiszen D2 L(x0 , y) = F (x) = a. Ha ezt az egyenletet a (8.10) egyenlethez csatoljuk, akkor az x ´es y koordin´at´aib´ol a´ll´o p + q darab ismeretlenre p + q darab egyenlet ad´odik, azaz
D1 f (x0 ) D1 fi (x0 ) 0 q X .. . . .. λi + = .. . i=1 Dp f (x0 ) Dp fi (x0 ) 0
(8.11)
α1 f1 (x0 ) .. .. = . . . αp fq (x0 )
A Lagrange-f´ele multiplik´ator-t´etelt is csak a k´etdimenzi´os speci´alis esetben bizony´ıtjuk be. Ekkor a t´etelnek igen szeml´eletes a tartalma. Legyenek I, J ⊂ R ny´ılt intervallumok, legyenek f 0 : I ×J → R ´es f1 : I ×J → R adott f¨ uggv´enynyek, tekints¨ uk a fenti (8.8) feladatnak a k¨ovetkez˝o speci´alis eset´et: f0 (x, y) → min
(8.12)
f1 (x, y) = α .
8.8.4 T´ etel. (Lagrange-f´ ele multiplik´ ator-t´ etel, speci´ alis eset) Legyen (x0 , y0 ) ∈ I × J a (8.12) feladat megold´ asa, legyen az f 0 : I × J → R f¨ uggv´eny differenci´ alhat´ o az (x0 , y0 ) pontban, legyen az f1 : I × J → R f¨ uggv´eny olyan, amelyre teljes¨ ulnek az implicitf¨ uggv´eny-t´etel felt´etelei, azaz folytonosan differenci´ alhat´ o az (x0 , y0 ) pont egy k¨ ornyezet´eben ´es a D2 f1 (x0 , y0 ) 6= 0. Akkor ∃ λ ∈ R Lagrange-szorz´ o, hogy D1,2 L((x0 , y0 ), λ) = (0, 0), azaz f00 (x0 , y0 ) + λf10 (x0 , y0 ) = (0, 0), azaz
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
238
D1 f0 (x0 , y0 ) + λD1 f1 (x0 , y0 ) = 0 ´es D2 f0 (x0 , y0 ) + λD2 f1 (x0 , y0 ) = 0, tov´ abb´ a λ=−
D2 f0 (x0 , y0 ) , D2 f1 (x0 , y0 )
valamint felt´eve, hogy D2 f0 (x0 , y0 ) 6= 0, teljes¨ ul, hogy D1 f0 (x0 , y0 ) D1 f1 (x0 , y0 ) = D2 f0 (x0 , y0 ) D2 f1 (x0 , y0 ) Bizony´ıt´ as. Mivel az f1 f¨ uggv´enyre, ´ıgy az f1 − α f¨ uggv´enyre is fenn´allnak az implicitf¨ uggv´eny-t´etel felt´etelei, az´ert ∃ [x 0 − δ, x0 + δ] k¨ornyezet, hogy az f1−1 (α) ⊂ [x0 − δ, x0 + δ] × J halmaz (rel´aci´o) f¨ uggv´eny, azaz ∃! g : [x 0 − δ, x0 + δ] → J f¨ uggv´eny, hogy g(x0 ) = y0 , ∀x ∈ [x0 − δ, x0 + δ] eset´en f1 (x, g(x)) = α, valamint D1 f1 (x0 ,y0 ) g 0 (x0 ) = − D . 2 f1 (x0 ,y0 ) Legyen h : [x0 − δ, x0 + δ] → R az a f¨ uggv´eny, amelyre ∀ x ∈ [x 0 − δ, x0 + δ] eset´en h(x) := f0 (x, g(x)). Mivel az f0 differenci´alhat´o az (x0 , y0 ) pontban ´es g(x0 ) = y0 , az´ert a h is differenci´alhat´o az x 0 pontban, ´es 0
h (x0 ) =
f00 (x0 , g(x0 ))
·
"
1 g 0 (x0 )
#
= [D1 f0 (x0 , y0 ), D2 f0 (x0 , y0 )] ·
"
1 0 g (x0 )
#
= D1 f0 (x0 , y0 ) + D2 f0 (x0 , y0 ) · g 0 (x0 ) D1 f1 (x0 , y0 ) = D1 f0 (x0 , y0 ) − D2 f0 (x0 , y0 ) · D2 f1 (x0 , y0 ) D2 f0 (x0 , y0 ) = D1 f0 (x0 , y0 ) − D1 f1 (x0 , y0 ) · . D2 f1 (x0 , y0 ) Tov´abb´a, mivel egyr´eszt az (x0 , y0 ) a fenti feladat megold´asa, m´asr´eszt g(x 0 ) = y0 ´es ∀x ∈ [x0 −δ, x0 +δ] eset´en f1 (x, g(x)) = α, az´ert az x0 a h f¨ uggv´eny minimumhelye. Ez´ert h0 (x0 ) = 0, azaz D1 f0 (x0 , y0 ) − D1 f1 (x0 , y0 ) ·
D2 f0 (x0 , y0 ) = 0. D2 f1 (x0 , y0 )
(8.13)
D2 f0 (x0 ,y0 ) Ezek szerint a λ := − D v´alaszt´assal egyr´eszt a λ defin´ıci´oj´ab´ol nyilv´an 2 f1 (x0 ,y0 )
D2 f0 (x0 , y0 ) + λD2 f1 (x0 , y0 ) = 0, m´asr´eszt a 8.13 szerint D1 f0 (x0 , y0 ) + λD1 f1 (x0 , y0 ) = 0 . Szint´en a 8.13 szerint ha D2 f0 (x0 , y0 ) 6= 0, akkor D1 f1 (x0 , y0 ) D1 f0 (x0 , y0 ) = . D2 f0 (x0 , y0 ) D2 f1 (x0 , y0 )
2
´ ´ O ˝ ERT ´ EK ´ 8.8. FELTETELES SZELS
239
8.8.5 Megjegyz´ es. A fenti t´etelben tegy¨ uk fel, hogy nem csak az f 1 : I × J → R f¨ uggv´enyre, hanem az f0 : I × J → R f¨ uggv´enyre is teljes¨ ulnek az implicitf¨ uggv´enyt´etel felt´etelei. Ekkor a t´etel jelent´ese igen szeml´eletes ´es u ´ gy fogalmazhat´o, hogy ha az (x0 , y0 ) a fenti feladat megold´asa, akkor a k´et f¨ uggv´eny szintvonalai ´erintik egym´ast az (x0 , y0 ) pontban. Ugyanis ekkor egyr´eszt, mint a bizony´ıt´asban m´ar l´attuk, mivel az f 1 f¨ uggv´enyre, ´ıgy az f1 −α f¨ uggv´enyre is fenn´allnak az implicitf¨ uggv´eny-t´etel felt´etelei, az´ert ∃ [x 0 − δ, x0 + δ] k¨ornyezet, hogy az f −1 (α) ⊂ [x0 − δ, x0 + δ] × J halmaz (rel´aci´o) differenci´alhat´o f¨ uggv´eny, azaz ∃! g 1 : [x0 − δ, x0 + δ] → J f¨ uggv´eny, hogy g1 (x0 ) = y0 , D1 f1 (x0 ,y0 ) 0 . ∀x ∈ [x0 − δ, x0 + δ] eset´en f1 (x, g1 (x)) = α, valamint g1 (x0 ) = − D 2 f1 (x0 ,y0 ) M´asr´eszt, ha az f0 f¨ uggv´enyre is fenn´allnak az implicitf¨ uggv´eny-t´etel felt´etelei, akkor ugyan´ıgy ∃ [x0 −δ0 , x0 +δ0 ] k¨ornyezet, hogy az f −1 (f0 (x0 , x0 )) ⊂ [x0 −δ0 , x0 + δ0 ] × I halmaz (rel´aci´o) differenci´alhat´o f¨ uggv´eny, azaz ∃! g 0 : [x0 − δ0 , x0 + δ0 ] → I f¨ uggv´eny, hogy g0 (x0 ) = y0 , ∀x ∈ [x0 − δ0 , x0 + δ0 ] eset´en f0 (x, g(x)) = f0 (x0 , y0 ), D1 f0 (x0 ,y0 ) . valamint g00 (x0 ) = − D 2 f0 (x0 ,y0 ) A t´etel szerint D1 f1 (x0 , y0 ) D1 f0 (x0 , y0 ) = , ez´ert D2 f0 (x0 , y0 ) D2 f1 (x0 , y0 ) g00 (x0 ) = g10 (x0 ) , mivel g0 (x0 ) = y0 = g1 (x0 ), az´ert ez azt jelenti, hogy a k´et f¨ uggv´eny szintvonalai ´erintik egym´ast az (x0 , y0 ) pontban. Az itt elmondottak j´ol illusztr´alhat´ok a k¨ovetkez˝ u p´eld´an kereszt¨ ul. 8.8.6 P´ elda. Oldjuk meg a k¨ovetkez˝o feladatot: x · y → max 2
(8.14)
2
x +y =1.
A fenti t´etel jel¨ol´eseivel f0 (x, y) = x · y ´es f1 (x, y) = x2 + y 2 . A feladat Lagrangef¨ uggv´enye L(x, y) = x · y + λ(x2 + y 2 ) , tov´abb´a D1 f0 (x, y) = y ´es D2 f0 (x, y) = x, tov´abb´a D1 f1 (x, y) = 2x ´es D2 f1 (x, y) = 2y. Ez´ert ha (x0 , y0 )megold´asa (8.14) -nak, akkor a Lagrange-elv szerint l´etezik λ ∈ R, hogy D1,2 L((x0 , y0 ), λ) = [y0 , x0 ] + λ · [2x0 , 2y0 ] = (0, 0), azaz [y0 , x0 ] = −λ · [2x0 , 2y0 ]. Az x0 sz´am nyilv´an nem lehet 0, mivel ekkor y 0 is 0 lenne, ellentmond´asban az x20 + y02 = 1 felt´etellel. ´Igy x0 = (−λ) · 2y0 = (−λ) · 2 · (−λ) · 2x0 = 4λ2 · x0 alapj´an 4λ2 = 1. Innen λ = ± 21 , teh´at x0 = y0 vagy x0 = −y0 . Behelyettes´ıtve az egyenl˝os´eg-felt´etelbe, mindenk´eppen azt kapjuk, hogy 2x 20 = 1, azaz a megold´asok csak r r r r r r r r m m m m m m m m , − , , − , ,− ,− , 2 2 2 2 2 2 2 2 m k¨oz¨ ul ker¨ ulhetnek ki. Az f f¨ uggv´eny ´ert´eke az els˝o k´et helyen 2 , a m´asodik m k´et helyen − 2 . Mivel kompakts´agi megfontol´asok miatt 8.14 -nak u ´ gyis van
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
240
megold´asa, ez´ert a fenti els˝o k´et sz´amp´ar val´oban a megold´asokat szolg´altatja. A m´aq sik k´etqsz´amp´ar a minimum asa. L´athat´o tov´abb´a, hogy p´eld´aul q feladat q megold´ m m m m 0 0 g0 2, 2 = −1 = g1 2, 2 8.8.7 P´ elda. Mutassuk meg, hogy egy h´aromsz¨og sz¨ogeire cos α cos β cos γ ≤
1 , 8
´es egyenl˝os´eg csak szab´alyos h´aromsz¨ogekre ´erv´enyes. Eset¨ unkben legyen f (α, β, γ) = cos α cos β cos γ, ´es F (α, β, γ) = π − α − β − γ. Ekkor a Lagrange-f¨ uggv´eny az L(α, β, γ, y) = cos α cos β cos γ + y(π − α − β − γ) alakot o¨lti. A megold´asra teh´at a − sin α cos β cos γ − y = 0
− cos α sin β cos γ − y = 0
− cos α cos β sin γ − y = 0
sz¨ uks´eges felt´etel ad´odik. Ha m´eg figyelembe vessz¨ uk, hogy F (α, β, γ) = π − α − β − γ = 0, akkor az egyenletrendszer egyetlen megold´asa α = β = γ = π/3, azaz a felt´etelt csak a szab´alyos h´aromsz¨ogek el´eg´ıtik ki. K¨onnyen bel´athat´o, hogy ebben a p´eld´aban a feladat felt´etel n´elk¨ uli sz´els˝o´ert´ekfeladatt´a alak´ıthat´o a´t. Val´oban, az F (α, β, γ) = 0 egyenletb˝ol γ = π − α − β. Ezt az f f¨ uggv´enybe helyettes´ıtve f (α, β) = − cos α cos β cos(α + β) . Ekkor a sz´els˝o´ert´ek sz¨ uks´eges felt´etele D1 f (α, β) = sin α cos β cos(α + β) + cos α cos β sin(α + β) = 0 D2 f (α, β) = cos α sin β cos(α + β) + cos α cos β sin(α + β) = 0 . Ennek az egyenletrendszernek 0 ´es π k¨oz¨ott egyetlen megold´asa van, m´eghozz´a α = β = π/3. Azonnal l´athat´o, hogy ez val´oban maximumhely, hiszen itt 00
f (π/3, π/3) =
"
−1 −1/2 −1/2 −1
#
ami nyilv´anval´oan negat´ıv definit. 8.8.8 Megjegyz´ es. A fenti p´eld´ak nagyon egyszer˝ uek voltak, ink´abb csak szeml´eltett´ek a t´etelt. Ha a felt´eteli halmaz t¨obb egyenletb˝ol a´ll, akkor a (8.11), azaz az L0 (x0 , y) = 0 egyenletrendszer olyan bonyolult, amelyb˝ol a megold´as am´ ugy sem hat´arozhat´o meg. Ez´ert a Lagrange-f´ele multiplik´ator-t´etel az alkalmaz´asok szempontj´ab´ol ink´abb elvi jelent˝os´eg˝ unek tekinthet˝o, azaz az igazi feladata az, hogy m´as tudom´anyokban adott elm´eleteket al´at´amasszon. Erre mutatunk p´eld´at a k¨ovetkez˝okben a mikro¨okon´omi´ab´ol.
´ ´ O ˝ ERT ´ EK ´ 8.8. FELTETELES SZELS
241
8.8.9 P´ elda. A mikro¨okon´omi´aban k¨ozponti szerepet j´atszanak a felt´eteles sz´els˝o´ert´ek feladatok, ´ıgy a Lagrange-f´ele multiplik´ator-t´etel, ugyanis a fogyaszt´okr´ol felteszik, hogy a hasznoss´agukat maximaliz´alj´ak, a termel˝okr˝ol pedig felteszik, hogy a profitjukat maximaliz´alj´ak. I. A fogyaszt´ oi viselked´ es 1. A Marshall-f´ ele megk¨ ozel´ıt´ es: A fogyaszt´o adott j¨ovedelem szint mellett a hasznoss´ag´at maximaliz´alja. Legyen a fogyaszt´o hasznoss´agi f¨ uggv´enye u : R n+ → R, legyen p ∈ Rn+ az a´rak vektora, ekkor a k¨olts´egf¨ uggv´enye a hp, .i : R n+ → R line´aris funkcion´al, (adott x ∈ R term´ek k¨olts´ege hp, xi,) legyen m ∈ R a fogyaszt´o j¨ovedelme. A feladat: u(x) → max
(8.15)
hp, xi = m .
A feladat Lagrange-f¨ uggv´enye az az L : R n+ × R → R f¨ uggv´eny, amelyre ∀ x ∈ n en R+ , ∀ λ ∈ R eset´ L(x, y) = u(x) + λ · (hp, xi − m) . uggv´enyeire fenn´alnak a Ha az x0 ∈ intRn+ a 8.15 feladat megold´asa, ´es a feladat f¨ Lagrange-f´ele multiplik´ator-t´etel felt´etelei, akkor u0 (x0 ) + λ · p = 0, azaz ∀i = 1, ..., n eset´en
λ=−
Di u(x0 ) , pi
amely szerint az optim´alis pontban minden term´ek parci´alis hat´arhaszn´anak ´es az a´r´anak az ar´anya megegyezik. Tov´abb´a ebb˝ol ad´odik az is, hogy ∀i, j = 1, ..., n eset´en Di u(x0 ) pi = , Dj u(x0 ) pj amely szerint az optim´alis pontban b´armely k´et term´ek hat´arhaszn´anak az ar´anya megegyezik az a´rak ar´any´aval. A tov´abbiakban k¨ovess¨ uk a fenti 8.8.5 Megjegyz´es menet´et: Legyen i, j = 1, 2, ..., n tetsz˝oleges, ´es tekints¨ uk csup´an az i ´es j-dik term´eket, azaz a t¨obbi term´ek mennyis´eg´et r¨ogz´ıts¨ uk valamely adott szinten, ekkor u : R 2+ → R. Az egyszer˝ us´eg kedv´e´ert legyen i = 1, j = 2. A feladat ekkor az el˝oz˝o (8.15) feladatnak a k¨ovetkez˝o speci´alis esete: u(x1 , x2 ) → max
(8.16)
p1 x1 + p 2 x2 = m .
Legyen (x01 , x02 ) ∈ intR2+ megold´as. Az el˝obb l´attuk, hogy ebben a pontban p1 D1 u(x01 , x02 ) . = 0 0 p2 D2 u(x1 , x2 )
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
242
Tegy¨ uk fel, hogy az u : R2+ → R f¨ uggv´enyre fenn´allnak az implicitf¨ uggv´enyt´etel felt´etelei, ekkor (mint a 8.7.6 P´eld´aban m´ar l´attuk,) az u −1 (u(x01 , x02 )) ⊂ R2+ k¨oz¨omb¨oss´egi g¨orbe az x01 egy k¨ornyezet´eben differenci´alhat´o f¨ uggv´eny, azaz ∃! g 0 differenci´alhat´o f¨ uggv´eny, hogy g 0 (x01 ) = x02 , az x01 egy k¨ornyezet´eben u(x1 , g0 (x1 )) = u(x01 , x02 ), valamint D1 u(x01 , x02 ) . g00 (x01 ) = − D2 u(x01 , x02 ) Tov´abb´a (most ebben a speci´alis esetben az implicitf¨ uggv´eny-t´etel alkalmaz´asa 2 n´elk¨ ul is) l´athat´o, hogy f1 : R+ → R, f1 (x1 , x2 ) = p1 x1 + p2 x2 k¨olts´egvet´esi f¨ uggv´enyre az f1−1 (m) = g1 : R → R (affin) f¨ uggv´eny, amelyre g1 (x1 ) = − pp21 x1 + pm2 , ´ıgy p1 g10 (x1 ) = − . p2 Mivel a Lagrange-f´ele multiplik´ator-t´etel szerint g00 (x01 ) = −
D1 u(x01 ,x02 ) D2 u(x01 ,x02 )
=
p1 p2
, az´ert
p1 D1 u(x01 , x02 ) = − = g10 (x01 ) . 0 0 p2 D2 u(x1 , x2 )
A mikro¨okon´omi´aban szok´asos jel¨ol´esekkel le´ırva: g00 (x01 )(= x02 (x01 ) =
dx2 p1 )=− , dx1 p2
azaz megkaptuk a mikro¨okon´omia egy sarkalatos t¨orv´eny´et, amely szerint az optim´alis pontban a 2. term´eknek az 1. term´ekre vonatkoz´o helyettes´ıt´esi hat´arr´at´aja megegyezik a´rar´anyaik reciprok´anak az ellentettj´evel. Mivel g0 (x01 ) = x02 = g1 (x01 ), az´ert ez azt jelenti, hogy az optim´alis pontban a hasznoss´agi f¨ uggv´eny k¨oz¨omb¨oss´egi g¨orb´eje ´erinti a k¨olts´egvet´esi egyenest. ´Igy szeml´eletesen az optim´alis pontot u ´ gy ”kapjuk meg”, hogy a hasznoss´agi f¨ uggv´eny k¨oz¨omb¨oss´egi g¨orb´eit addig toljuk, am´ıg nem ´erinti a k¨olts´egvet´esi egyenest. 2. A Hicks-f´ ele megk¨ ozel´ıt´ es: A fogyaszt´o adott hasznoss´agi szint mellett a k¨olts´eg´et (kiad´as´at) minimaliz´alja. Ez mondhat´o a fenti megk¨ozel´ıt´es du´alis´anak. Legyen u ˆ ∈ R adott hasznoss´agi szint. A feladat: u(x) → max
(8.17)
hp, xi = u ˆ.
A feladat Lagrange-f¨ uggv´enye az az L : R n+ × R → R f¨ uggv´eny, amelyre ∀ x ∈ n R+ , ∀ µ ∈ R eset´ en L(x, y) = hp, xi + µ · (u(x) − u ˆ) . Ha az x0 ∈ intRn+ a 8.17 feladat megold´asa, ´es a feladat f¨ uggv´enyeire fenn´alnak a Lagrange-f´ele multiplik´ator-t´etel felt´etelei, akkor p + µ · u0 (x0 ) = 0, azaz ∀i = 1, ..., n eset´en
µ=−
pi , Di u(x0 )
´ ´ O ˝ ERT ´ EK ´ 8.8. FELTETELES SZELS
243
azaz a (8.15) feladat Lagrange szorz´oj´anak a reciproka. A levonhat´o k¨ovetkeztet´edek ´ıgy ugyanazok. P´eld´aul v´egs˝o k¨ovetkeztet´esk´ent azt kapjuk, hogy az optim´alis pontban a k¨olts´egvet´esi egyenes ´erinti a hasznoss´agi f¨ uggv´eny k¨oz¨omb¨oss´egi g¨orb´ej´et. Azonban most ez azt jelenti, hogy az optim´alis pontot u ´ gy ”kapjuk meg”, hogy a k¨olts´egvet´esi egyenest addig toljuk, am´ıg nem ´erinti a hasznoss´agi f¨ uggv´eny k¨oz¨omb¨oss´egi g¨orb´ej´et. II. A termel˝ oi viselked´ es A k¨ olts´ egminimaliz´ al´ asi feladat Legyen a termel˝o termel´esi f¨ uggv´enye f : R n+ → R, legyen p ∈ Rn+ az a´rak vektora, legyen y ∈ R adott termel´esi szint. A feladat: f (x) → max
(8.18)
hp, xi = y .
Ez form´alisan ugyanaz a feladat, mint a (8.17). A feladat Lagrange-f¨ uggv´enye az az L : Rn+ × R → R f¨ uggv´eny, amelyre ∀ x ∈ Rn+ , ∀ µ ∈ R eset´en L(x, y) = hp, xi + µ · (f (x) − y) . Ha az x0 ∈ intRn a 8.18 feladat megold´asa, ´es a feladat f¨ uggv´enyeire fenn´alnak a Lagrange-f´ele multiplik´ator-t´etel felt´etelei, akkor p + µ · f 0 (x0 ) = 0, azaz ∀i = 1, ..., n eset´en
pi . Di (x0 ) A levonhat´o k¨ovetkeztet´esek ugyanazok, mint az el˝oz˝o feladatok eset´eben. Egyr´eszt az optim´alis pontban minden minden termel´esi t´enyez˝o parci´alis hat´arterm´ek´enek ´es az a´r´anak az ar´anya megegyezik. M´asr´eszt ebb˝ol ad´odik az is, hogy ∀i, j = (x0 ) = ppji , amely szerint b´armely k´et termel´esi t´enyez˝o parci´alis 1, ..., n eset´en DDijf(x 0) hat´arterm´ek´enek az ar´anya megegyezik az a´raik ar´any´aval. V´eg¨ ul csak k´et term´eket vizsg´alva, ha az f f¨ uggv´enyre teljes¨ ulnek az implicitf¨ uggv´eny-t´etel felt´etelei, akkor dx2 ) = − pp21 , azaz az optim´alis pontban a 2. term´eknek az 1. g00 (x01 )(= x02 (x01 ) = dx 1 term´ekre vonatkoz´o helyettes´ıt´esi hat´arr´at´aja megegyezik a´rar´anyaik reciprok´anak az ellentettj´evel, amely szerint az optim´alis pontban a k¨olts´egvet´esi egyenes ´erinti a hasznoss´agi f¨ uggv´eny k¨oz¨omb¨oss´egi g¨orb´ej´et. µ=−
8.8.10 Megjegyz´ es. Meglep˝onek t˝ unhet, hogy azt a roppant egyszer˝ u rajzolgat´ast, ami a mikro¨okon´omia egyik kiindul´opontja, csak k´et f´el´ev matematika tanul´as ut´an lehet elmagyar´azni (s˝ot a magyar´azatunk egy kicsit hi´anyos is abban az ´ertelemben, hogy mind az implicitf¨ uggv´eny-t´etelt, mind a Lagrange-f´ele multiplik´ator-t´etelt csak a speci´alis k´etdimenzi´os esetben bizony´ıtottuk be). Vegy¨ uk ´eszre azonban, hogy olyan egyszer˝ unek t˝ un˝o ´es szeml´eletes fogalomnak, mint a k¨oz´episkol´ab´ol j´ol ismert sz´amegyenesnek a gondos bevezet´ese az anal´ızis egyik legm´elyebb ter¨ ulete, tov´abb´a a szint´en nagyon egyszer˝ unek t˝ un˝o, m´ar az a´ltal´anos iskol´aban megismert ´erint˝o fogalm´anak, azaz a deriv´altnak – amely az anal´ızis egyik k¨ozponti fogalma – a bevezet´ese rengeteg munk´at ig´enyel, k¨ ul¨on¨osen a t¨obbv´altoz´os esetben.
´ ´ ıTAS ´ 8. FEJEZET DIFFERENCIALSZ AM´
244
1. Gyakorlatok, feladatok 1. Mutassuk meg, hogy az Rp t´er egys´egg¨ombj´enek felsz´ıne kompakt halmaz, ´es az x → |Ax| lek´epez´es folytonos ezen a halmazon b´armely q × p m´eret˝ u A m´atrix eset´en. 2. Bizony´ıtsuk be, hogy a (8.1) ´es (8.2) egyenl˝os´egek val´oban norm´at defini´alnak a line´aris lek´epez´esek ter´en. 3. Igazoljuk a norma k¨ovetkez˝o karakteriz´aci´oj´at: kAk = inf{λ > 0 : |Ax| ≤ λ|x|
∀x ∈ X } .
´ ıt´as, ha a norm´at a (8.1), vagy (8.2) alatti norm´ak 4. Igaz marad-e a 8.1.4 All´ valamelyik´ere cser´elj¨ uk? 5. Mutassuk meg, hogy minden ortogon´alis m´atrix egys´egnyi norm´aj´ u. 6. Bizony´ıtsuk be, hogy norm´alis m´atrixok eset´eben a norma megegyezik a saj´at´ert´ekek abszol´ ut ´ert´ekeinek maximum´aval, azaz kAk = max{|λ| : λ az A saj´at´ert´eke} . 7. Jel¨olje λ az A m´atrix domin´ans saj´at´ert´ek´et. Igazoljuk, hogy |λ| ≤ kAk, ´es az egyenl˝os´eg pontosan akkor teljes¨ ul, ha A diagonaliz´alhat´o. (Vesd o¨ssze a 6. gyakorlattal.) 8. K¨ozvetlen¨ ul a defin´ıci´o alapj´an ellen˝orizz¨ uk, hogy ha az f : X → Y f¨ uggv´eny differenci´alhat´o az x ∈ X pontban, akkor ott folytonos is. 9. Mutassuk meg, hogy ha az f koordin´ataf¨ uggv´enyei f 1 , . . . , fq , u ´ gy f akkor ´es csak akkor differenci´alhat´o az x pontban, ha itt mindegyik koordin´ataf¨ uggv´enye is differenci´alhat´o. 10. Mutassuk meg, hogy a g(t) = f (x + tv) differenci´alhat´os´aga b´armely v mellett a 0 pontban nem felt´etlen¨ ul jelenti az f differenci´alhat´os´ag´at az x pontban. Tekints¨ uk ugyanis az f (x, y) =
(
1 0
ha y = x2 , (x, y) 6= (0, 0) k¨ ul¨onben
f¨ uggv´enyt. Igazoljuk, hogy ekkor b´armely v ∈ R 2 mellett a g(t) = f (tv) f¨ uggv´eny differenci´alhat´o a 0 pontban, ´es g 0 (0) = 0. Azonban f m´eg csak nem is folytonos az orig´oban, hiszen annak b´armely k¨ornyezet´eben egyar´ant felveszi a 0 ´es az 1 ´ert´ekeket is. 11. Hat´arozzuk meg az f (x, y) = f¨ uggv´eny sz´els˝o´ert´ekeit.
1 2 + + 8xy x y
´ ´ O ˝ ERT ´ EK ´ 8.8. FELTETELES SZELS
245
12. Mutassuk meg, hogy a 8.6.4 P´eld´aban az (1, 1, 1) pont kiv´etel´evel egyetlen m´as kritikus pont sem sz´els˝o´ert´ek. 13. Tekints¨ uk az X val´os euklideszi t´eren az f (x) = kxk f¨ uggv´enyt. Vizsg´aljuk meg, hogy f milyen pontokban differenci´alhat´o, ´es adjuk meg a deriv´altj´at. 14. Hat´arozzuk meg az f (x, y, z) = xyz f¨ uggv´enynek a maximum´at az egys´egg¨ombb˝ol az x + y + z = 0 s´ık a´ltal kimetszett halmazon. Ebben az esetben a felt´etelt az " # x2 + y 2 + z 2 − 1 F (x, y, z) = x+y+z f¨ uggv´eny hat´arozza meg. 15. Hat´arozzuk meg az A=
"
1 1 0 1
#
m´atrix norm´aj´at felt´eteles sz´els˝o´ert´ek feladatk´ent. Legyen f (x) = kAxk 2 , ´es F (x) = kxk2 − 1, ahol x ∈ R2 , ´es keress¨ uk meg a megfelel˝o feladat megold´as´at. ´ ıt´ast 16. Az el˝oz˝o feladat gondolatmenet´et felhaszn´alva bizony´ıtsuk be a 8.1.5 All´ a 8.8.3 T´etel seg´ıts´eg´evel. A norm´at az kAxk2 → max kxk2 = 1
felt´eteles sz´els˝o´ert´ek feladat megold´asak´ent a´ll´ıtsuk el˝o. 17. Irjunk egy adott k¨orbe olyan h´aromsz¨oget, amely oldalainak n´egyzet¨osszege maxim´alis. Oldjuk meg a probl´em´at felt´eteles sz´els˝o´ert´ek feladatk´ent.