9. TÖBBVÁLTOZÓS FÜGGVÉNYEK DIFFERENCIÁLSZÁMITÁSA 9.1 Metrika és topológia Rk -ban Definíció. A k-dimenziós euklideszi tér nek nevezzük és Rk val jelöljük a valós számokból alkotott k-tagú x = (x1 , x2 , . . . , xk ) sorozatok halmazát, azaz 1
^
2
^
k
^
Rk := R × R × · · · × R = { x = (x1 , x2 , . . . , xk ) : xi ∈ R (i = 1, 2, . . . , k) }. Az x = (x1 , x2 , . . . , xk ) sorozatokat a tér pontjai nak mondjuk, az x1 , x2 , . . . , xk számok az x = (x1 , x2 , . . . , xk ) pont koordinátái. R1 -et természetes módon azonosíthatjuk R-rel. R2 = R × R-et egy koordinátarendszer bevezetése után egy síkra lehet bijektíven leképezni, ezért R2 -et euklideszi síknak nevezhetjük. Hasonlóan, koordinátarendszer réven azonosíthatjuk R3 -at a közönséges térrel. Rk pontjait vektoroként is felfoghatjuk, úgy, hogy a koordinátarendszer felvétele után az egyes pontoknak a kezdőpontból hozzájuk vezető helyzetvektorukat feleltetjük meg. Ezek szabad vektorok, ömagukkal párhuzamosan eltolhatók. Műveletek Rk -ban: Definíció. Az x = (x1 , x2 , . . . , xk ), y = (y1 , y2 , . . . , yk ) ∈ Rk vektorok összegét és az x ∈ Rk vektor λ ∈ R skalárral való szorzatát x + y : = (x1 + y1 , x2 + y2 , . . . , xk + yk ) λx : = (λx1 , λx2 , . . . , λxk ) -val definiáljuk. Könnyű ellenőrizni, hogy e műveletek teljesítik az alábbi tulajdonságokat: Bármely x, y, z ∈ Rk mellett, a 0 = (0, 0, . . . , 0) zérusvektorral és −x = (−1)x vektorral teljesül, hogy x + (y + z) x+y x+0 x + (−x)
= (x + y) + z, = y + x, = x, = 0.
(az összeadás előbbi 4 tulajdonságát Abel-csoport axiómáknak mondjuk ). Bármely x, y ∈ Rk , λ, µ, 1 ∈ R esetén, λ(x + y) (λ + µ)x (λµ)x 1x
= λx + λy, = λx + µx, = λ(µx) = x.
(ezek a tulajdonságok a skalárral való szorzás axiómái ). Az összeadás és skalárral való szorzás axiómái együttesen alkotják a lineáris tér, vagy vektortér axiómák at. Definíció. Az x = (x1 , x2 , . . . , xk ), y = (y1 , y2 , . . . , yk ) ∈ Rk vektorok skaláris vagy belső szorzatát hx, yi := x1 y1 + x2 y2 + · · · + xk yk -val definiáljuk. Könnyű ellenőrizni, hogy a skaláris szorzat teljesíti az alábbi tulajdonságokat. Bármely x, y, z ∈ Rk és bármely λ ∈ R esetén hx + y, zi hλx, yi hx, yi hx, xi
= hx, zi + hy, zi, = λhx, yi, = hy, xi, ≥ 0 és hx, xi = 0 akkor és csakis akkor, ha x = 0. 1
2
Ez a 4 tulajdonság alkotja a skaláris szorzás axiómáit. Állítás [Cauchy-Schwarz egyenlőtlenség] Bármely két x, y ∈ Rk vektor esetén érvényes a Cauchy-Schwarz egyenlőtlenség: p p |hx, yi| ≤ hx, xi hy, yi. Bizonyítás. A belső szorzat utolsó tulajdonsága miatt hx + λy, x + λyi ≥ 0 amiből a szorzás elvégzése után hx, xi + λhy, xi + λhx, yi + λ2 hy, yi ≥ 0. Jelölje Q(λ) a baloldalon levő λ-ben másodfokú polinomot, akkor Q(λ) = hx, xi + λhy, xi + λhx, yi + λ2 hy, yi ≥ 0. Ha hy, yi = 0, akkor az utolsó tulajdonság miatt y = 0, így egyenlőtlenségünk teljesül, mert mindkét oldaán zérus áll. Ha hy, yi 6= 0, akkor Q(λ) ≥ 0 miatt Q diszkriminánsa kisebb vagy egyenlő mint nulla, amiből 4hx, yi2 − 4hx, xi hy, yi ≤ 0 s ebből átrendezéssel adódik a bizonyítandó egyenlőtlenség. ¤ p Definíció. Az kxk = hx, xi számot az x = (x1 , x2 , . . . , xk ) ∈ Rk vektor hosszának (vagy normájának ill. abszolút értékének ) nevezzük. A norma segítségével a Cauchy-Schwarz egyenlőtlenséget |hx, yi| ≤ kxk kyk
(x, y ∈ Rk )
alakba írhatjuk át. A Cauchy-Schwarz egyenlőtlenség felhasználásával könnyen igazolhatjuk a norma tulajdonságait: bármely x, y ∈ Rk és bármely λ ∈ R esetén kxk ≥ 0 és kxk = 0 akkor és csakis akkor, ha x = 0 kλxk = |λ| kxk kx + yk ≤ kxk + kyk. Definíció. Az x, y ∈ Rk pontok távolságát d(x, y) = kx − yk -nal definiáljuk. Definíció. Egy a ∈ Rk pont ε > 0 sugarú (nyílt) környezetén a K(a, ε) := { x ∈ Rk : d(x, a) = kx − ak < ε } halmazt értjük. k = 1 esetén K(a, ε) az a pontra nézve szimmetrikus 2ε hosszúságú ]a − ε, a + ε[ nyílt intervallum. k = 2 esetén K(a, ε) az a = (a1 , a2 ) pont körüli ε sugarú nyílt körlap. k = 3 esetén K(a, ε) az a = (a1 , a2 , a3 ) pont körüli ε sugarú nyílt gömb. Környezetek segítségével értelmezhetjük Rk -ban a belső, határ, izolált, torlódási pont fogalmát, továbbá nyílt és zárt halmazokat (a definíció szó szerint ugyanaz, de benne a pont, környezet jelentése általánosabb). Sorozatok Rk -ban. Definíció. Egy a : N → Rk függvényt Rk -beli sorozatnak nevezünk.
3
Jelölések a(n) = an = (an,1 , an,2 , . . . , an,k ) (n ∈ N),
a = (an ).
Definíció. Az (an ) (Rk -beli) sorozatot konvergensnek nevezzük, ha van olyan b ∈ Rk , hogy bármely ε > 0hoz létezik olyan N (ε) ∈ R szám, hogy kan − bk < ε ha n > N (ε). b-t a sorozat határérték ének (limeszének) nevezzük és az an → b (n → ∞)
vagy lim an = b n→∞
jelölést használjuk. N (ε)-t az ε-hoz tartozó küszöbszámnak nevezzük. Egy Rk -beli sorozatot divergensnek nevezünk, ha nem konvergens. Állítás [Rk -beli sorozat koordinátánként konvergens] an = (an,1 , an,2 , . . . , an,k ) → b = (b1 , b2 , . . . , bk ) (n → ∞) akkor és csakis akkor, ha an,i → bi (n → ∞) minden i = 1, 2, . . . , k mellett. Ez azt jelenti, hogy egy vektorsorozat akkor és csakis akkor konvergens, ha a sorozat minden koordinátája konvergens és határértéke a határvektor megfelelő koordinátája. Bizonyítás. Mivel minden j = 1, 2, . . . , k mellett v u k uX √ |an,j − bj | ≤ kan − bk = t (an,i − bi )2 ≤ k max |an,j − bj |, i=1
1≤j≤k
Ebből látható, hogy kan − bk < ε akkor |an,j − bj | < ε minden j = 1, 2, . . . , k mellett. √ Fordítva, ha |an,j − bj | < ε minden j = 1, 2, . . . , k mellett akkor max |an,j − bj | < ε így kan − bk = k ε 1≤j≤k
igazolva állításunkat.
¤
Példa.
µ an =
1 1 ,1 + 2 n n
¶ → (0, 1) ha n → ∞.
9.2 Többváltozós függvények határértéke és folytonossága Egy D ⊂ Rk halmaz torlódási pontjainak halmazát D0 -vel jelöljük. Definíció. Legyen f : D ⊂ Rk → R és legyen x0 ∈ D0 (a D halmaz torlódási pontja). Azt mondjuk, hogy f -nek van (véges) határértéke az x0 pontban, ha van olyan a ∈ R szám, hogy minden ² > 0-hoz van olyan δ(²) > 0, hogy |f (x) − a| < ²
ha
0 < kx − x0 k < δ(²) és x ∈ D
teljesül. Az a ∈ R számot az f függvény x0 pontbeli határértékének nevezzük, és jelölésére az a = lim f (x) vagy f (x) → a ( ha x → x0 )-t használjuk.
x→x0
A határérték, ha létezik, akkor egyértelmű. Átviteli elv, műveletek, egyenlőtlenségek és határérték kapcsolata most is érvényes. A határérték fogalma a ∈ Rb -re hasonlóan kiterjeszthető, mint egy változónál.
4
Definíció. Az f : D ⊂ Rk → R függvényt értelmezési tartományának x0 ∈ D pontjában folytonosnak nevezzük, ha bármely ² > 0-hoz van olyan δ(²) > 0, hogy |f (x) − f (x0 )| < ²
ha
kx − x0 k < δ(²) és x ∈ D
teljesül. Itt is érvényes az átviteli elv: az f : D ⊂ Rk → R függvény az x0 ∈ D pontban akkor és csakis akkor folytonos, ha bármely (xn ) : N → D az x0 -hoz konvergáló sorozat esetén f (xn ) → f (x0 ) ha n → ∞. Folytonos függvények tulajdonságai ugyanazok mint az egyváltozós esetben. 9.3 Többváltozós függvények differenciálhatósága Definíció. Az f : D ⊂ Rk → R függvényt az x0 ∈ D belső pontban (totálisan) differenciálhatónak nevezzük, ha van olyan A ∈ Rk vektor melyre lim
x→x0
f (x) − f (x0 ) − hA, x − x0 i = 0. kx − x0 k
Az f 0 (x0 ) := A vektort az f függvény x0 pontbeli deriváltjának nevezzük. Geometriai jelentés: a függvény f (x) − f (x0 ) növekményét az hA, x − x0 i lineáris függvény jól közelíti (mivel a definíció szerint az f (x) − f (x0 ) − hA, x − x0 i különbség olyan kicsi hogy még kx − x0 k-val elosztva is nullához tart, ha x → x0 ), a függvény által meghatározott felületnek az x0 pontban van érintősík ja, ez éppen az xk+1 = f (x0 ) + hA, x − x0 i hipersík az Rk+1 térben. Definíció. Az f : D ⊂ Rk → R függvényt az x0 ∈ D belső pontban az e (ahol e egy Rk -beli egységvektor) irány mentén differenciálhatónak nevezzük, ha létezik a f (x0 + te) − f (x0 ) t (véges) határérték. E határértéket De f (x0 )-lal jelöljük, és az f függvény e iránymenti deriváltjának nevezzük az x0 pontban. lim
t→0
De f (x0 ) jelentése: az f függvény változási sebessége az e irányában. Ha speciálisan e = ui = (0, . . . , 0, 1, 0, . . . , 0) az i-edik tengely irányába mutató egységvektor (az ui vektor i-edik koordinátája 1, a többi 0) akkor a Dui f (x0 ) iránymenti deriváltat az f függvény i-edik változója szerinti parciális deriváltjának nevezzük az x0 pontban. Jelölésére az ∂i f (x0 ) szimbólumot használjuk. Egyéb jelölések: ∂xi f (x0 ),
∂f (x0 ), ∂xi
fxi (x0 )
Definíció. Az f : D ⊂ Rk → R függvényt az x0 ∈ D belső pontban parciálisan differenciálhatónak nevezzük, ha ∂i f (x0 ) minden i = 1, . . . , n-re létezik.
5
Mivel (xi = x0,i + t jelöléssel) f (x0,1 , . . . , x0,i + t, . . . , x0,k ) − f (x0,1 , . . . , x0,i , . . . , x0,k ) t f (x0,1 , . . . , xi , . . . , x0,k ) − f (x0,1 , . . . , x0,i , . . . , x0,k ) = lim xi →x0,i xi − x0,i
Dui f (x0 ) = lim
t→0
így ∂i f (x0 )-t úgy számítjuk ki, hogy az i-edik változó szerint differenciálunk, miközben a többi változót konstansnak tekintjük. Példa parciális deriváltak kiszámítására, és a fogalmak felírására két változó esetén(ld. előadás) TÉTEL [iránymenti derivált kiszámítása] Ha f : D p ⊂ Rn → R az x0 ∈ D belső pontban (totálisan) differenciálható, akkor bármely e = (e1 , . . . , ek ) ∈ Rk , kek = e21 + · · · + e2k = 1 irány mentén is differenciálható x0 -ban, és az iránymenti deriváltjára De f (x0 ) = hA, ei = A1 e1 + · · · + Ak ek 0
áll fenn, ahol A = f (x0 ). Speciálisan, ha e = ui = (0, . . . , 1, . . . , 0) (ahol az 1 az i-edik helyen áll), akkor Dui f (x0 ) = ∂i f (x0 ) = Ai így De f (x0 ) = ∂1 f (x0 )e1 + · · · + ∂k f (x0 )ek . Ez azt jelenti, hogy (totális) differenciálhatóság ⇒ parciális differenciálhatóság. Az is következik, hogy f 0 (x0 ) = A = (∂1 f (x0 ), . . . , ∂k f (x0 )) azaz az f 0 (x0 (totális) derivált (vektor) koordinátái a parciális deriváltak. Bizonyítás. A differenciálhatóság ε(x) := f (x) − f (x0 ) − hA, x − x0 i jelöléssel f (x) − f (x0 ) = hA, x − x0 i + ε(x) és a differenciálhatóság definíciója miatt lim x|tox0
ε(x) = 0. Innen kx − x0 k
f (x0 + te) − f (x0 ) hA, tei + ε(x0 + te) |t| ε(x0 + te) = = hA, ei + → hA, ei t t t kx0 + te − x0 k ha t → 0 bizonyítva állításunkat. TÉTEL [(totális) differenciálhatóság ⇒ folytonosság] Ha f : D ⊂ Rk → R az x0 ∈ D belső pontban (totálisan) differenciálható, akkor f folytonos x0 -ban. Bizonyítás. Az előző bizonyításban használt ε(x) segítségével kapjuk, hogy f (x) − f (x0 ) = hA, x − x0 i +
ε(x) kx − x0 k → 0 kx − x0 k
ha x → x0 , mivel ekkor a jobboldali összeg mindkét tagja nullához tart. Megjegyzés. f parciális differenciálhatóságából 6⇒ f folytonossága. Ellenpélda a ½ 0 ha x1 x2 6= 0 f (x1 , x2 ) = 1 ha x1 x2 = 0 ahol ∂1 f (0, 0) = ∂2 f (0, 0) = 0, de f nem folytonos (0, 0)-ban. A parciális deriváltak folytonossága viszont garantálja a (totális) differenciálhatóságot, így a folytonosságot is. TÉTEL [parc. deriv. folytonossága ⇒ (totális) differenciálhatóság ] Ha az f : D ⊂ Rk → R függvénynek az x0 ∈ D belső pont egy környezetében folytonos parciális deriváltjai vannak (ekkor azt úgy mondjuk, hogy a függvény folytonosan parciálisan differenciálhato e környezetben) akkor f az x0 pontbanban (totális) differenciálható, (így folytonos is).
6
Bizonyítás. Az egyszerűség kedvéért csak két változó esetén bizonyítunk. f (x1 , x2 ) − f (x0,1 , x0,2 ) = [f (x1 , x2 ) − f (x1 , x0,2 )] + [f (x1 , x0,2 ) − f (x0,1 , x0,2 )] . A szögletes zárójelben levő különbségekre az egyváltozós Lagrange-féle középértéktételt használva kapjuk, hogy f (x1 , x2 ) − f (x0,1 , x0,2 ) = ∂2 f (x1 , ξ2 )(x2 − x0,2 ) + ∂1 f (ξ1 , x0,2 )(x1 − x0,1 ) ahol ξ1 az x1 és x01 közötti érték, ξ2 pedig x2 és x0,2 között van. A parciális deriváltak x0 = (x0,1 , x0,2 ) pontbeli folytonossága miatt ∂1 f (ξ1 , x0,2 ) = ∂1 f (x0,1 , x0,2 ) + ε1 ,
∂2 f (x1 , ξ2 ) = ∂2 f (x0,1 , x0,2 ) + ε2
ahol εi → 0 (i = 1, 2) ha (x1 , x2 ) → (x0,1 , x0,2 ). Így f (x1 , x2 ) − f (x0,1 , x0,2 ) = ∂1 f (x0,1 , x0,2 )(x1 − x0,1 ) + ∂2 f (x0,1 , x0,2 )(x2 − x0,2 ) + ε ahol ε = ε1 (x1 − x0,1 ) + ε2 (x2 − x0,2 ). Állítśunk bizonyítva lesz, ha megmutatjuk, hogy ε p (1) → 0 ha (x1 , x2 ) → (x0,1 , x0,2 ). 2 (x1 − x0,1 ) + (x2 − x0,2 )2 Mivel p
(x1 − x0,1
ε x1 − x0,1 x2 − x0,2 = ε1 p + ε2 p 2 2 2 + (x2 − x0,2 ) (x1 − x0,1 ) + (x2 − x0,2 ) (x1 − x0,1 )2 + (x2 − x0,2 )2
)2
εi → 0 és a εi -k utáni törtek abszolút értéke≤ 1, így valóban fennáll (1).
¤
TÉTEL [láncszabály: összetett függvény differenciálhatósága] Ha a gi : D ⊂ Rk → R (i = 1, 2, . . . , l) függvények differenciálhatók az x0 ∈ D belső pontban, és f : E ⊂ Rl → R differenciálható az y0 = g(x0 ) ∈ E belső pontban, ahol g(x) := (g1 (x), g2 (x), . . . , gl (x)) (x ∈ D), akkor a h(x) := f (g(x)) összetett függvény (mely x0 ∈ D egy környezetében biztosan értelmezve van) differenciálható x0 ∈ D-ben és ∂i h(x0 ) =
l X
∂j f (g(x0 ))∂i gj (x0 ) (i = 1, 2, . . . , k).
j=1
Utóbbi képletet nevezzük láncszabálynak. Bizonyítás.9.4 Magasabbrendű parciális deriváltak Tegyük fel, hogy az f : D ⊂ Rk → R függvénynek az x0 ∈ D belső pont egy környezetében létezik pl. az i-edik változó szerinti ∂i f parciális derivált. Ha ez parciálisan differenciálható pl. az j-edik változó szerint, úgy a e deriválást elvégezve kapjuk a ∂j ∂i f (x0 ) := ∂j (∂i f (x0 )) második parciális deriváltját f -nek az x0 pontban az i-edik és j-edik váltzozók szerint (ebben a sorrendben). Hasonlóan ha a ∂j ∂i f (x) drivált létezik x0 egy környezetében és ez parciálisan differenciálható pl. a l-edik változó szerint, úgy a e deriválást elvégezve kapjuk a ∂l ∂i ∂j f (x0 ) := ∂l (∂i ∂j f (x0 )) harmadik parciális deriváltat. Hasonlóan értelmezhetjük a negyed- és magasabbrendű parciális deriváltakat is. Egyéb jelölések a magasabbrendű deriváltakra: ∂xj ∂xi f (x0 )
∂2f (x0 ), ∂xj ∂xi
fxi xj (x0 )
7
Példa. Számítsuk ki az f (x, y) = x2 + y 2 exy ((x, y) ∈ R2 ) függvény összes első és másodrendű parciális deriváltját, és hasonlítsuk össze a ∂1 ∂2 f (x, y) és ∂2 ∂1 f (x, y) vegyes deriváltakat. TÉTEL [Young tétel: a vegyes parciális deriváltak függetlensége a deriválás sorrendjétől] Ha az f : D ⊂ Rk → R függvénynek az x0 ∈ D belső pont egy környezetében az összes m ≥ 2-edik parciális deriváltjai léteznek és folytonosak az x0 pontban, akkor a függvény m-edik parciális deriváltjai az x0 pontban a differenciálás sorrendjétől függetlenek. 9.5 Többváltozós függvények szélsőértéke Definíció. Azt mondjuk, hogy az f : D ⊂ Rk → R függvénynek lokális (helyi) maximuma (minimuma) van az x0 ∈ D pontban, ha van olyan ε > 0 hogy f (x0 ) ≥ f (x) (f (x0 ) ≤ f (x)) teljesül minden x ∈ K(x0 , ε) ∩ D esetén. Azt mondjuk, hogy az f : D ⊂ Rk → R függvénynek szigorú lokális (helyi) maximuma (minimuma) van az x0 ∈ D pontban, ha van olyan ε > 0 hogy f (x0 ) > f (x) (f (x0 ) < f (x)) teljesül minden x ∈ K(x0 , ε) ∩ D, x 6= x0 esetén. Azt mondjuk, hogy az f : D ⊂ Rk → R függvénynek globális (vagy abszolút) maximuma (minimuma) van az x0 ∈ D pontban, ha f (x0 ) ≥ f (x) (f (x0 ) ≤ f (x)) teljesül minden x ∈ D esetén. Azt mondjuk, hogy az f : D ⊂ Rk → R függvénynek szigorú globális (vagy abszolút) maximuma (minimuma) van az x0 ∈ D pontban, ha f (x0 ) > f (x) (f (x0 ) < f (x)) teljesül minden x ∈ D, x 6= x0 esetén. TÉTEL [a szélsőérték létezésének elegendő feltétele] Korlátos zárt halmazon folytonos függvény felveszi a függvényértékek infimumát és supremumát függvényértékként, ami azt jelenti, hogy a függvénynek van minimuma és maximuma (az illető korlátos zárt halmazon). TÉTEL [a szélsőérték elsőrendű szükséges feltétele] Ha f : D ⊂ Rk → R f¨ggvénynek az x0 ∈ D belső pontban lokális szélsőértéke van, és léteznek f első parciális deriváltjai x0 -ban, akkor (2)
∂1 f (x0 ) = ∂2 f (x0 ) = · · · = ∂k f (x0 ) = 0.
Az (2) feltételnek elegettevő x0 pontokat az f függvény stacionárius pontjainak nevezzük. Bizonyítás. Legyen ϕi (t) := f (x0,1 , . . . , x0,i + t, . . . , x0,k ) (i = 1, . . . , k) ahol x0 = (x0,1 , . . . , x0,k ) és |t| elég kicsi. Feltevésünk szerint a ϕi (t = 0-ban differenciálható) függvényeknek lokális szélsőértéke van t = 0 ban, ´így 0 = ϕ0i (0) = ∂i f (x0 ) (i = 1, . . . , k) igazolva áll´ításunkat. TÉTEL [a szélsőérték másodrendű elegendő feltétele] Tegyük fel, hogy az f : D ⊂ Rk → R összes második parciális deriváltjai folytonosak az x0 ∈ D belső pont egy környezetében, továbbá (3) azaz x0 stacionárius pontja f -nek.
∂1 f (x0 ) = ∂2 f (x0 ) = · · · = ∂k f (x0 ) = 0,
8
I. Ha a (4)
Q(h) = Q(h1 , . . . , hk ) :=
k X k X
∂j ∂i f (x0 )hi hj
j=1 i=1
kvadratikus függvény pozitív definit, azaz Q(h) > 0 minden h ∈ Rk , h 6= 0 esetén, akkor f -nek szigorú lokális minimuma van x0 -ban, II. ha a Q kvadratikus függvény negatív definit, azaz Q(h) < 0 minden h ∈ Rk , h 6= 0 esetén, akkor f -nek szigorú lokális maximuma van x0 -ban, III. ha a Q kvadratikus függvény indefinit, azaz Q(h) felvesz pozitív és negatív értéket is, akkor f -nek nincs szélsőértéke x0 -ban. Bizonyítás.Két változó esetén egyszerű ellenőrizni egy kvadratikus függvény pozitív vagy negatív definitségét. Ekkor Q(h1 , h2 ) = Ah21 + 2Bh1 h2 + Ch22 ahol A = ∂1 ∂1 f (x0 ), B = ∂1 ∂2 f (x0 ), C = ∂2 ∂2 f (x0 ). Itt már felhasználtuk azt, hogy feltételeink mellett a vegyes második parciális deriváltak az x0 pontban egyenlők. Tegyük fel, hogy Q pozitív definit, akkor A < 0 nem lehet, mert pl. h2 = 0-t véve Q(h1 , 0) = Ah21 < 0 volna minden h1 6= 0 mellett. A = 0 sem lehet, mert akkor C = 0 esetén Q(h1 , h2 ) = 2Bh1 h2 nyilvánvalóan felvesz pozitív és negatív értékeket is ha B 6= 0, míg B = 0 esetén Q azonosan zérus. Ha ha C < 0, akkor Q(h1 , h2 ) = 2Bh1 h2 + Ch22 negatív értékeket is felvesz h1 = 0, h2 6= 0 mellett. Végül, ha C > 0 volna akkor a "µ ¶2 µ ¶2 # B B 2 Q(h1 , h2 ) = 2Bh1 h2 + Ch2 = C h2 + h1 − h21 C C átalakítást használva látjuk, hogy Q(h1 , h2 ) ≥ 0 csak B = 0 esetén teljesül, ekkor viszont Q(h1 , h2 ) = Ch22 nulla lenne tetszőleges h1 és h2 = 0 mellett ami ellentmond a pozitív definitségnek. Így A > 0 és
"µ Q(h1 , h2 ) = A
B h1 + h2 A
¶2
µ +
C B2 − 2 A A
#
¶ h22
mutatja, hogy a C B2 − 2 > 0, vagy AC − B 2 > 0 A A a pozitív definitség szükséges és elegendő feltétele. Ezzel igazoltuk azt, hogy a Q(h1 , h2 ) kvadratikus függvény akkor és csakis akkor pozitív definit, ha ¯ ¯ ∂ ∂ f (x0 ) ∂1 ∂2 f (x0 ) (5) ∆1 := ∂1 ∂1 f (x0 ) > 0, ∆2 := ¯¯ 1 1 ∂1 ∂2 f (x0 ) ∂2 ∂2 f (x0 )
¯ ¯ ¯ > 0. ¯
Hasonlóan bizonyíthatjuk azt, hogy Q(h1 , h2 ) akkor és csakis akkor negatív definit, ha (6)
∆1 < 0, ∆2 > 0.
Az előzőek alapján könnyű belátni, hogy a (7)
∆2 < 0
egyenlőtlenség elegendő Q indefinítségéhez. Példa. f (x, y) = x3 + y 3 − 3xy
(x, y) ∈ R2 lokális szélsőértékeinek meghatározása.
9
9.6 Feltételes szélsőérték Definíció. Legyenek f : D ⊂ Rk+m → R, hi : D ⊂ Rk+m → R i = 1, . . . , m adott függvények. Azt mondjuk, hogy az f függvénynek az x0 ∈ D pontban a h1 (x) = 0, h2 (x) = 0, . . . , hm (x) = 0 feltételek mellett lokális feltételes maximuma (minimuma) van, ha van olyan ε > 0 hogy f (x0 ) ≥ f (x) (f (x0 ) ≤ f (x)) teljesül minden x ∈ D ∩ K(x0 , ε) mellett, melyre h1 (x) = · · · = hm (x) = 0. TÉTEL [a feltételes szélsőérték szükséges feltétele] Tegyük fel, hogy az f, hi : D ⊂ Rk+m → R (i = 1, . . . , m), az f függvénynek az x0 ∈ D belső pontban a h1 (x) = 0, h2 (x) = 0, . . . , hm (x) = 0 feltételek mellett lokális feltételes szélsőértéke van, továbbá az f és hi (i = 1, . . . , m) parciális deriváltjai folytonosak x0 egy környezetében és a (∂j hi (x0 )) (j = 1, . . . , k + m, i = 1, . . . , m) mátrixnak van nemzérus m-edrendű aldeterminánsa. Akkor vannak olyan λ1 , . . . λm ∈ R valós számok, hogy az F (x) := f (x) + λ1 h1 (x) + · · · + λm hm (x)
(x ∈ D)
függvényre ∂1 F (x0 ) = · · · = ∂k+m F (x0 ) = 0. A λ1 , . . . λm számokat Lagrange-féle multiplikátoroknak nevezzük, az F függvényt a feltételes szélsőérték probléma Lagrange-féle függvényének nevezzük. A feltételes szélsőérték probléma megoldása úgy történik, hogy a ∂1 F (x0 ) = 0, ∂2 F (x0 ) = 0, . . . , ∂k+m F (x0 ) = 0, h1 (x) = 0, h2 (x) = 0, . . . , hm (x) = 0 k + 2m db. egyenletből álló rendszert megoldjuk az x1 , . . . , xk+m , λ1 , . . . λm ismeretlenekre, a kapott x1 , . . . , xk+m megoldások adják a feltételes szélsőérték lehetséges helyeit. Megjegyzés. Van másodrendű elegendő feltétel is a feltételes szélsőértékre, de azt nem tanuljuk. Példa. Határozza meg az f (x, y) = x + 2y feltételes szélsőértékeit a
((x, y) ∈ R2 )
h(x, y) = x2 + y 2 − 1 = 0
körvonal
feltétel mellett. Megjegyzés. Érdemes a feladatot geometriailag is szemléltetni, abból leolvasható az hogy minimum vagy maximum van-e a kiszámolt pontokban.