1
2. Diferenciální počet funkcí více proměnných 2.1. Druhé parciální derivace funkce více proměnných Mějme reálnou funkci n reálných proměnných. Značme X = [x1 , ..., xn ], f (X) = f (x1 , ..., xn ). Parciální derivace 2. řádu 2. parciální derivace funkce f podle proměnných xi a xj je parciální derivace podle proměnné xj ∂f stanovená z funkce . Vypočteme ji tedy tak, že funkci ∂xi f nejprve zderivujeme podle xi a pak podle xj : 2 ∂ f ∂ ∂f = . ∂xi ∂xj ∂xj ∂xi Pořadí derivování P o z n á m k a Pokud jsou všechny druhé parciální derivace funkce f v okolí bodu X spojitými funkcemi, nezáleží při výpočtu druhé parciální derivace na pořadí deri∂2f ∂2f (X) = (X). vování, tj. ∂xj ∂xi ∂xi ∂xj Hessova matice
2
Druhé parciální derivace zapisujeme do tzv. Hessovy matice: ∂2f ∂2f ∂2f ... ∂x1 ∂xn , ∂x1 ∂x2 ∂x21 ∂2f ∂2f ∂2f ... ∂x2 ∂xn Hf = ∂x2 ∂x1 , ∂x22 ... ... ... ... 2 2 ∂ f ∂ f ∂2f ... ∂xn ∂x1 , ∂xn ∂x2 ∂x2 n
.
Podle předchozí poznámky je pro vhodné funkce Hessova matice symetrická podle hlavní diagonály. 2.2. Konvexní, konkávní funkce Množina M je konvexní, pokud s každými dvěma body body x, y obsahuje i každý bod tx+(1−t)y pro t ∈ (0, 1). Funkce f je (ryze) konvexní, rep. konkávní na konvexní množině M ⊂ D(f ) , pokud pro každé x, y ∈ M, t ∈ (0, 1) platí: (<) f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y), (>) resp. f (tx + (1 − t)y) ≥ tf (x) + (1 − t)f (y). Platí: Funkce je v konvexní množině M ryze konvexní, resp. ryze konkávní, jakmile je Hessova matice pozitivně, resp. negativně definitní ve všech bodech M .
3
Je-li v nějakém bodě otevřené konvexní množiny M lokální minimum (maximum) dané funkce, jde zárověň o (globální, absolutní) minimum (maximum) vzhledem k M. 2.3. Volné extrémy funkcí více proměnných Funkce má v bodě C lokální maximum (minimum), má-li tam maximum (minimum) vzhledem k nějakému okolí bodu C. Funkce musí být na příslušném okolí bodu C definovaná. Je tedy bod C určitě vnitřním bodem definičního oboru funkce. Nutná podmínka lokálního extrému Má-li funkce f lokální extrém v bodě C, ve kterém existují všechny parciální derivace, jsou nutně všechny parciální derivace v tomto bodě nulové. P o z n á m k a Nulové hodnoty parciálních derivací jsou nutnou, ne však postačující podmínkou pro lokální extrém. Pokud v takovém bodě lokální extrém nenastává (a 2. parciální derivace jsou v okolí tohoto bodu spojité), říkáme, že v tomto bodě nastává sedlo dané funkce. Podezřelé body Podezřelé body (z lokálních extrémů) jsou tedy body, ve kterých je každá parciální derivace nulová (nebo nee-
4
xistuje - takové příklady nebudeme počítat). Postačující podmínka lokálního extrému Nechť ve vnitřním bodě C definičního oboru funkce f platí pro všechna i = 1, 2, ..., n ∂f (C) = 0, ∂xi a funkce f má v okolí bodu C spojité 2. parciální derivace. (a) Pokud je Hessova matice H(C) indefinitní, v bodě C má funkce f sedlo. (b) Pokud je Hessova matice H(C) pozitivně definitní, má v bodě C funkce f lokální minimum. (c) Pokud je Hessova matice H(C) negativně definitní, má v bodě C funkce f lokální maximum. P o z n á m k a V případě, že determinant Hessovy matice je v uvažovaném bodě C nulový, nelze použít postačující podmínku lokálního extrému, extrém může a nemusí v daném bodě nastat. P o z n á m k a Je-li H(X) pozitivně (negativně) definitní pro všechna X z konvexní množiny M , jde o absolutní extrém vzhledem k M . 2.4. Vázané extrémy funkcí více proměnných
5
Vázané extrémy jsou extrémy funkce f (n proměnných) vzhledem k množině popsané rovnicemi g1 (X) = 0,
g2 (X) = 0,
....,
gr (X) = 0,
r < n.
Rovnice gi (X) = 0 se nazývají vazební rovnice, množina všech řešení této soustavy rovnic (tj. množina, na které hledáme extrémy) se nazývá vazba. Metoda Lagrangeových multiplikátorů Její princip spočívá v tom, že podezřelé body hledáme jako body vazby, v nichž má tzv. Lagrangeova funkce (viz dále) parciální derivace podle všech proměnných rovny nule. Sestrojíme tzv. Lagrangeovu funkci (ozn. L): L(λ1 , ..., λr , x1 , ..., xn ) = = f (x1 , ..., xn ) + λ1 · g1 (x1 , ..., xn ) + ... + λn · gr (x1 , ..., xn ), kde λ1 , ..., λr jsou zatím neznámé konstanty (tzv. Lagrangeovy multiplikátory). Vypočítáme parciální derivace funkce L podle všech proměnných a položíme = 0; spolu s vazebními rovnicemi tvoří tyto rovnice soustavu n + r (obvykle nelineárních). Jejím řešením obdržíme podezřelé body. Platí: Má-li funkce L(x1 , ..., xn ) (n proměnných) lokální minimum (maximum) v bodě [c1 , ..., cn ], pak má v tomto bodě funkce f vázané lokální minimum (maximum).
6
Ohraničená Hessova matice (”bordered hessian”) je matice 2. parc. derivací L vzhledem k λ1 , ..., λr , x1 , ..., xn v tomto pořadí: ∂g1 ∂g1 ... 0 ... 0 ∂x1 ∂xn 0 ∂g2 ∂g2 ... 0 ... ∂x1 ∂xn ... ... ... ... ... ... 0 ∂gr ∂gr ... ... 0 ∂x1 ∂xn 2 HB = ∂g1 ∂gr ∂ 2 L . ∂ L , ... ∂x1 ∂xn ∂x1 ... ∂x1 ∂x21 ∂g1 ∂gr ∂2L ∂2L ∂x2 ... ∂x2 ∂x2 ∂x1 , ... ∂x2 ∂xn ... ... ... ... ... ... 2 ∂gr ∂g1 ∂ L ∂2L ... , ... ∂xn ∂xn ∂xn ∂x1 ∂x2 n
Sestrojíme posloupnost determinantů (minorů): ∂g1 ∂g1 0 ... 0 ∂x1 ∂x2 0 ∂g2 ∂g2 ... 0 ∂x1 ∂x2 ... ... ... ... ... ∂gr ∂gr , D2 = 0 ... 0 ∂x1 ∂x2 ∂g1 ∂gr ∂2L ∂2L , ∂x1 ∂x2 ∂x21 ∂x1 ... ∂x1 ∂g1 ∂gr ∂2L ∂2L ∂x ... ∂x2 ∂x2 ∂x1 , ∂x2 2 2
7
0 0 ... 0 D3 = ∂g 1 ∂x1 ∂g1 ∂x2 ∂g1 ∂x 3 ...
... ... ... ...
0 0 ... 0
...
∂gr ∂x1 ∂gr ∂x2 ∂gr ∂x3
... ...
∂g1 ∂x1 ∂g2 ∂x1
∂g1 ∂x2 ∂g2 ∂x2
∂g1 ∂x3 ∂g2 ∂x3
∂gr ∂x1 ∂2L , ∂x21 ∂2L ∂x2 ∂x1 , ∂2L ∂x3 ∂x1 ,
∂gr ∂x2 ∂2L ∂x1 ∂x2 , ∂2L , ∂x22 ∂2L ∂x3 ∂x2 ,
∂gr ∂x3 ∂2L ∂x1 ∂x3 ∂2L ∂x2 ∂x3 ∂2L ∂x23
...
...
...
,
Dn = |HB|. Pokud mají všechny determinanty počínaje Dr+1 v podezřelém bodě C shodné znaménko, a to (−1)r , f má v tomto bodě lokální vázané minimum. Pokud v podezřelém bodě C determinaty střídají znaménko, počínaje Dr+1 = (−1)r+1 , f má v tomto bodě lokální vázané maximum. 2.5 Kvazikonvexní, kvazikonkávní funkce Funkce f se nazývá kvazikonvexní, resp. kvazikonkávní, pokud pro každé reálné číslo k je množina {X; f (X) ≤ k}, resp. {X; f (X) ≥ k} konvexní.
8
Platí: Funkce f je kvazikonvexní (kvazikonkávní), pokud pro každou dvojici bodů x, y a t ∈ (0, 1) platí: f (x) ≥ f (y) ⇒ f (tx + (1 − t)y) ≤ f (x), resp.f (x) ≥ f (y) ⇒ f (tx + (1 − t)y) ≥ f (y). Fce f se nazývá ryze kvazikonvexní, resp. r. kvazikonkávní, pokud pro každou dvojici bodů x, y a t ∈ (0, 1) platí: f (x) ≥ f (y) ⇒ f (tx + (1 − t)y) < f (x), resp.f (x) ≥ f (y) ⇒ f (tx + (1 − t)y) > f (y). Platí: Funkce f je kvazikonvexní, právě když −f je kvazikonkávní. Nechť f má spojité 2. parc. derivace. Ohraničená Hessova matice (”bordered hessian”) fce f : ∂f ∂f ... 0 ∂x1 ∂xn 2 ∂2f ∂ f ∂f , ... 2 ∂x1 ∂x1 ∂xn ∂x1 ∂2f ∂2f HBf = ∂f . ∂x2 ∂x2 ∂x1 , ... ∂x2 ∂xn ... ... ... ... ∂2f ∂2f ∂f ∂xn ∂xn ∂x1 , ... ∂x2 n
Sestrojíme posloupnost determinantů (minorů): ∂f ∂f 0 ∂x1 ∂x2 ∂f ∂2f ∂2f , B2 = ∂x1 ∂x1 ∂x2 , ∂x21 ∂f ∂2f ∂2f ∂x ∂x ∂x , ∂x2 2
2
1
2
9
0 ∂f ∂x 1 B3 = ∂f ∂x 2 ∂f ∂x3 ...
∂f ∂x1 ∂2f , ∂x21 ∂2f ∂x2 ∂x1 , ∂2f ∂x3 ∂x1 ,
∂f ∂x2 ∂2f ∂x1 ∂x2 , ∂2f , ∂x22 ∂2f ∂x3 ∂x2 ,
∂f ∂x3 ∂2f ∂x1 ∂x3 ∂2f ∂x2 ∂x3 ∂2f ∂x23
,
Bn = |HBf |. Označme K = {[x1 , ..., xn ] ∈ R n ; x1 , ..., xn > 0}. Pokud jsou všechny determinanty záporné v K, f je v K ryze kvazikonvexní. Pokud determinaty střídají znaménko v K počínaje +1, f je v K ryze kvazikonkávní. Např. lineární funkce, Cobb-Douglasova funkce je kvazikonkávní. Platí: (Ryze) konkávní fce je (ryze) kvazikonkávní, opačná implikace neplatí. Platí: Pokud je funkce ryze kvazikonkávní (kvazikonvexní) v konvexní množině M pak v bodě podezřelém z lokálního extrému nastává absolutní vázané maximum (minimum) vzhledem k M . Platí: Pokud je funkce ryze kvazikonkávní (kvazikonvexní) na konvexní vazbě M , pak v bodě podezřelém z vázaného extrému nastává absolutní vázané maximum (minimum).