Eötvös Loránd Tudományegyetem Természettudományi Kar
Nemesné Jónás Nikolett Lagrange-féle multiplikátor módszer és alkalmazása Matematika BSc, Matematikai elemz® szakirány
Témavezet®:
Szekeres Béla János, tudományos segédmunkatárs MTA-ELTE Numerikus Analízis és Nagy Hálózatok Kutatócsoport
Budapest, 2017
Köszönetnyilvánítás Ezúton szeretnék köszönetet mondani témavezet®mnek, Szekeres Béla Jánosnak, aki felkeltette érdekl®désem a téma iránt, és segítségével, hasznos tanácsaival hozzájárult a szakdolgozatom elkészüléséhez. Köszönettel tartozom a családomnak az egyetemi éveim alatt nyújtott kitartó támogatásukért.
2
Tartalomjegyzék
1. Bevezetés
4
2. Szükséges el®ismeretek
5
2.1. Parciális deriváltak és széls®értékek kapcsolata . . . . . . . . . . . . . . . .
5
2.2. Feltételes széls®érték probléma . . . . . . . . . . . . . . . . . . . . . . . . .
6
3. A Lagrange-multiplikátor módszer alkalmazásai
10
3.1. Többváltozós függvény, egy feltétel . . . . . . . . . . . . . . . . . . . . . . 10 3.2. Háromváltozós függvény, két feltétel . . . . . . . . . . . . . . . . . . . . . . 18 3.3. Feltételek egyenl®tlenségként . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4. További gyakorlati példák
22
4.1. Maximális terméshozam . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 4.2. Henger felületének minimalizálása . . . . . . . . . . . . . . . . . . . . . . . 25 4.3. Maximális entrópia számítása . . . . . . . . . . . . . . . . . . . . . . . . . 26
3
1. fejezet Bevezetés A széls®érték feladatok fontos gyakorlati alkalmazása a matematikai analízisnek. Szakdolgozatom témája ezzel kapcsolatos, feltételes széls®értékek keresése Lagrange-multiplikátor módszerrel. A dolgozat els® fejezetében áttekintem az elmélethez kapcsolódó deníciókat és tételeket a [1] munka alapján. A második fejezetben egyszer¶ példákon keresztül mutatom be a Lagrange-multiplikátor módszer alkalmazását. A harmadik fejezetben pedig néhány gyakorlatban is el®forduló alkalmazást vizsgálok: terméshozam optimalizálása adott költség- és hozamfüggvények mellett, adott térfogatú henger felületének minimalizálása, illetve entrópiafüggvény maximalizálása.
4
2. fejezet Szükséges el®ismeretek
2.1. Parciális deriváltak és széls®értékek kapcsolata
2.1.1. Deníció. Az f függvénynek lokális minimuma (maximuma) van az a ∈ Rn pontban, ha van a-nak olyan K környezete, amiben f értelmezve van, és minden x ∈ K -ra: f (a) ≤ f (x) (illetve(f (a) ≥ f (x)). Ebben az esetben az f függvény lokális minimumhelyének (maximumhelyének) nevezzük az a ∈ Rn pontot. 2.1.2. Megjegyzés. Ha minden a-n kívüli x ∈ K -ra f (x) < f (a) (illetve f (x) > f (a)), akkor szigorúan lokális maximumról, maximumhelyr®l (illetve szigorúan lokális minimumról, minimumhelyr®l) beszélünk. Ezeket közösen lokális széls®értéknek, széls®értékhelynek nevezzük.
2.1.3. Tétel. Ha az f függvénynek az a ∈ Rn pontban lokális széls®értéke van, és létezik mindegyik parciális deriváltja a-ban, akkor ezek a parciális deriváltak elt¶nnek ebben az a pontban, azaz: ∂i f (a) = 0, ∀i = 1...n-re. 2.1.4. Tétel. Legyen A ⊂ Rn halmaz korlátos és zárt, f : A 7→ R folytonos. Tegyük fel, hogy f-nek A belsejének minden pontjában léteznek a parciális deriváltjai. Ekkor f a maximumát (vagy minimumát) A határán, vagy pedig olyan bels® pontban veszi fel, ahol a parciális deriváltak nullák. 5
2.1.5. Deníció. Jacobi-mátrixnak nevezzük egy n-változós függvény els®rend¶ parciális deriváltjait tartalmazó mátrixot. J=
∂f1 ∂x1
...
∂fm ∂x1
...
.. .
...
∂f1 ∂xn
.. .
∂fm ∂xn
.
2.1.6. Deníció. Legyen f(x), x ∈ D(⊂ Rn ) n-változós függvény, melynek létezik minden másodrend¶ parciális deriváltja az a ∈ D pontban. Hesse-mátrixnak nevezzük az f függvény másodrend¶ parciális deriváltjaiból alkotott négyzetes mátrixot. Hf (a) =
∂2f (a) ∂x21 ∂2f ∂x2 ∂x1
.. .
(a)
∂2f (a) ∂xn ∂x1
∂2f (a) ∂x1 ∂x2 ∂2f ∂x22
(a)
.. .
∂2f (a) ∂xn ∂x2
...
∂2f (a) ∂x1 ∂xn
...
∂2f (a) ∂x2 ∂xn
...
∂2f (a) ∂x2n
.
...
.. .
2.2. Feltételes széls®érték probléma
A feltételes széls®érték keresésekor úgy keressük az adott f (x) függvény széls®értékét, hogy közben egy, vagy több feltételnek is teljesülnie kell.
2.2.1. Tétel. (Lagrange-féle multiplikátor-módszer) Legyen f(x), x ∈ D(⊂ Rn ) nváltozós függvény folytonosan dierenciálható az a ∈ D pontban, továbbá gi , ∀i = 1...m folytonosan dierenciálható függvények, melyek értelmezve vannak az a pontban, és teljesül rá, hogy gi (a) = 0, valamint gi0 (a) Jacobi-mátrix sorvektorai lineárisan függetlenek. Ha fnek feltételes széls®értéke van az a-ban a g1 (x) = 0, g2 (x) = 0, . . . , gm (x) = 0 feltétel m P mellett, akkor az L(x) = f (x) + λ1 g1 (x) + λ2 g2 (x) + . . . + λm gm (x) = f (x) + λi gi (x) i=1 Lagrange függvény összes parciális deriváltja elt¶nik az a pontban: ∂L (a) = 0, (i = 1, 2 . . . n). ∂xi
Ez a Lagrange-féle multiplikátor módszer szükséges feltétele.
2.2.2. Megjegyzés. A tételben szerepl® λi skalárok a Lagrange-multiplikátorok, amelyek közül legalább az egyik nem nulla. 6
A bizonyítás el®tt szükséges az egyváltozós implicitfüggvény-tétel ismerete:
2.2.3. Tétel. (Egyváltozós implicitfüggvény-tétel) Tegyük fel, hogy a kétváltozós, valós érték¶ f függvény elt¶nik az (a, b) ∈ R2 pontban, és folytonos az (a, b) egy környezetében. Tegyük fel, hogy a ∂2 f parciális derivált létezik, véges és nullától különböz® az (a, b) pont egy környezetében. Ekkor léteznek olyan δ és pozitív számok, hogy: 1. Minden x ∈ (a − δ, a + δ)-hoz létezik egyetlen ϕ(x) ∈ (b − , b + ) szám, melyre f (x, ϕ(x)) = 0, továbbá
2. az így deniált ϕ függvény folytonos az (a − δ, a + δ) intervallumban.
A 2.2.1 Tétel bizonyítása. A bizonyítást n = 2, m = 1 és feltételes minimum esetén végezzük, de a feltételes maximum esete is hasonlóan gondolható meg. A feltételek alapján a g := g1 : R2 → R függvény folytonosan dierenciálható, és az a := (a1 , a2 ) pontban g(a1 , a2 ) = 0. Ebben a pontban a rangfeltétel
rang(∂1 g(a1 , a2 ), ∂2 g(a1 , a2 )) = 1. Ezért feltehetjük, hogy ∂2 g(a1 , a2 ) 6= 0. Ekkor az egyváltozós implicitfüggvény-tétel szerint létezik a1 -nek K(a1 ) és a2 -nek K(a2 ) környezete, és létezik olyan ϕ : K(a1 ) → K(a2 ) dierenciálható függvény, amelyre minden x ∈ K(a1 ) esetén g(x, ϕ(x)) = 0, és ϕ(a1 ) = a2 . Ez azt jelenti, hogy H = (x, y) ∈ R2 | g(x, y) = 0 ⊃ (x, ϕ(x)) ∈ R2 | x ∈ K(a1 ) =: H ∗ .
(2.1)
Azaz g(a1 , ϕ(a1 )) = 0, melyet deriválva teljesül, hogy ∂1 g(a1 , a2 ) + ϕ0 (a1 )∂2 g(a1 , a2 ) = 0.
(2.2)
Mivel az f függvény H halmazra vett lesz¶kítésének lokális minimuma van az (a1 , a2 ) ∈ H pontban, ezért létezik r > 0, hogy az (a1 , a2 ) pont Kr (a1 , a2 ) környezetére minden (x, y) ∈ Kr (a1 , a2 ) ∩ H esetén f (x, y) ≥ f (a1 , a2 ). 7
(2.3)
A (2.1) alapján x ∈ K(a1 ) esetén (x, ϕ(x)) ∈ H ∗ ⊂ H . Felhasználva, hogy ϕ folytonos K(a1 )-en, meggondolható, hogy létezik olyan K ∗ (a1 ) ⊂ K(a1 ) környezet, hogy
minden x ∈ K ∗ (a1 ) esetén (x, ϕ(x)) ∈ Kr (a1 , a2 ) ∩ H . Így (2.3)-ból következik, hogy minden x ∈ K ∗ (a1 ) esetén f (x, ϕ(x)) ≥ f (a1 , ϕ(a1 )) = f (a1 , a2 ). Ez azt jelenti, hogy a h : K ∗ (a1 ) → R, h(x) := f (x, ϕ(x))
valós függvénynek lokális minimuma van az a1 pontban. A h függvény dierenciálható (dierenciálható függvények kompozíciója), ezért h0 (a1 ) = 0. A kompozíciófüggvény deriválási szabályai alapján h0 (x) = f 0 (x, ϕ(x)) · (x0 , ϕ0 (x)) = = h(∂1 f (x, ϕ(x)), ∂2 f (x, ϕ(x))) , (1, ϕ(x))i = = ∂1 f (x, ϕ(x)) + ϕ0 (x)∂2 f (x, ϕ(x)).
Ezért h0 (a1 ) = ∂1 f (a1 , a2 ) + ϕ0 (a1 )∂2 f (a1 , a2 ) = 0.
(2.4)
Legyen λ ∈ R tetsz®leges szám, és szorozzuk meg λ-val a (2.2) egyenl®séget, majd adjuk össze a (2.4) egyenl®séggel, így nyerjük az alábbi azonosságot ∂1 f (a1 , a2 ) + λ∂1 g(a1 , a2 ) + ϕ0 (a1 ) [∂2 f (a1 , a2 ) + λ∂2 g(a1 , a2 )] = 0.
(2.5)
A λ szám megválasztható úgy, hogy ∂2 f (a1 , a2 ) + λ∗ ∂2 g(a1 , a2 ) = 0 (2.6) ∂2 f (a1 , a2 ) ∗ a λ := − megfelel® . Ha a λ∗ esetén (2.5)-ben a szögletes zárójelben lév® ∂2 g(a1 , a2 )
tényez® 0, akkor
∂1 f (a1 , a2 ) + λ∗ ∂1 g(a1 , a2 ) = 0
8
(2.7)
is teljesül. Összesítve az eredményeket, azt kapjuk, hogy ha az f függvénynek feltételes minimuma van a g = 0 feltétel mellett, az a = (a1 , a2 ) pontban, akkor az F := f + λ∗ g függvénynek az els® változó szerinti parciális deriváltja 0 (ezt mutatja (2.7)), és a második változó szerinti parciális deriváltja is 0 (ezt mutatja (2.6)). Tehát F 0 (a) = F 0 (a1 , a2 ) = (∂1 F (a1 , a2 ), ∂2 F (a1 , a2 )) = 0.
2.2.4. Tétel. (Elégséges feltétel) A 2.2.1 Tétel feltételei mellett az L Lagrange-függvény Hesse-mátrixa az a pontban pozitív denit, akkor az f függvénynek lokális minimuma van az a pontban, a gi = 0, i = 1...m feltétel mellett, ha pedig az L Lagrange-függvény Hessemátrixa az a pontban negatív denit, akkor az f függvénynek lokális minimuma van az a pontban a gi = 0, i = 1...m feltétel mellett.
9
3. fejezet A Lagrange-multiplikátor módszer alkalmazásai
3.1. Többváltozós függvény, egy feltétel
3.1.1. Példa. Határozzuk meg az f (x, y) = x2 +y2 függvény széls®értékhelyét a g(x, y) = x + y = 10 feltétel mellett.
Els®ként felírjuk a Lagrange-függvényt, majd meghatározzuk az els®rend¶ parciális deriváltakat, amiket egyenl®vé teszünk nullával. L(x, y) = x2 + y 2 + λ(x + y − 10). ∂L = 2x + λ = 0, ∂x ∂L = 2y + λ = 0. ∂y
(3.1) (3.2)
A (3.1) és (3.2) egyenletekb®l lehetséges széls®érték helyeket kapunk, de ezek még függnek a bevezetett λ multiplikátortól: −λ , 2 −λ y= . 2
x=
10
(3.3) (3.4)
λ 2
A (3.3), (3.4) formulákból következik, hogy − = x = y , továbbá az x+y = 10 feltétel miatt x = y = 5.
Az f (x, y) = x2 + y 2 függvény széls®értékei az x + y = 10 feltétel mellett az (x, y) = (5, 5) pont, aminek értéke: f (5, 5) = 52 + 52 = 25 + 25 = 50.
Ez az érték a függvény minimuma, mivel a feltételnek megfelel® (x, y) pontpárokat behelyettesítve 50-nél nagyobb értékeket kapunk.
3.1.2. Példa. Határozzuk meg az f (x, y) = x + 2y függvény széls®értékhelyét a g(x, y) = x2 + y 2 = 4 feltétel mellett. Els®ként felírjuk a Lagrange-függvényt, majd meghatározzuk
az els®rend¶ parciális deriváltakat. L(x, y, λ) = x + 2y + λ(x2 + y 2 − 4).
Els®rend¶ parciális deriváltak, amiket egyenl®vé teszünk nullával: ∂L = 1 + 2xλ = 0, ∂x
11
(3.5)
∂L = 2 + 2yλ = 0. ∂y
(3.6)
Az (3.5) és (3.6) egyenletekb®l lehetséges széls®értékhelyeket kapunk, de ezek még függnek a bevezetett λ multiplikátortól: −1 , 2λ −1 y= . λ
x=
(3.7) (3.8)
A (3.7) és (3.8) értékeket a feltételbe visszahelyettesítve kapunk a λ-ra megfelel® értékeket, amiket a parciális deriváltakba beírva megkapjuk a keresett (x, y) helyet: √ 5 , λ1 = 4 √ 5 λ2 = − . 4
(3.9) (3.10)
Mindkét λ esetén vissza kell helyettesítenünk a parciális deriváltakba, hogy az összes lehetséges széls®értékhelyet megkapjuk: √ 5 esetén: • λ1 = 4 √ 5 1 + 2x = 0, 4 √ 5 2 + 2y = 0. 4
(3.11) (3.12)
A (3.11) és (3.12) egyenletekb®l álló egyenletrendszert megoldva kapjuk az egyik lehetséges széls®érték helyet: (x1 , y1 ) =
• λ2 = −
−2 −4 √ ,√ . 5 5
√ ! 5 esetén hasonlóan járunk el: 4 √ ! 5 1 + 2x − = 0, 4
12
(3.13)
√ ! 5 2 + 2y − = 0. 4
(3.14)
A (3.13) és (3.14) egyenletekb®l álló egyenletrendszert megoldva kapjuk a másik lehetséges széls®értékhelyet: (x2 , y2 ) =
2 4 √ ,√ . 5 5
Az a g(x, y) = x2 + y 2 = 4 feltétel mellett az (x1 , y1 ) = f (x, y)= x + 2y függvénynek −2 −4 2 4 √ ,√ és (x2 , y2 ) = √ , √ pontokban van széls®értéke, aminek értékei: 5
5
5
5
• (x1 , y1 ) esetében minimuma van: −2 −4 −4 −2 −10 f √ ,√ = √ +2 √ = √ ≈ −4, 47. 5 5 5 5 5 • (x2 , y2 ) esetében maximuma van: 2 4 4 2 10 f √ ,√ = √ +2 √ = √ ≈ 4, 47. 5 5 5 5 5
13
3.1.3. Példa. Határozzuk meg az f (x, y) = xy függvény széls®értékét a g(x, y) = 3x2 + y 2 = 6 feltétel mellett. Ahogyan eddig, el®ször a Lagrange-függvényt írjuk fel, majd
kiszámoljuk a parciális deriváltakat: L(x, y) = xy + λ(3x2 + y 2 − 6).
(3.15)
∂L = y + λ6x = 0, ∂x ∂L = x + λ2y = 0. ∂y
(3.16) (3.17)
A (3.16) és a (3.17) egyenleteket rendezve kapjuk az alábbi összefüggést: y = −λ6x,
(3.18)
x = −λ2y.
(3.19)
Felhasználva a (3.19) formulát, y -ra a következ® egyenl®séget kapjuk: y = 12λ2 y.
(3.20)
Ha y nulla, akkor a (3.19) miatt x-nek is nullának kell lennie, de ez nem teljesítené a feltételt, így y 6= 0. Tehát a (3.20) egyenl®ség csak akkor teljesülhet, ha 12λ2 = 1.
Helyettesítsük be a (3.18) egyenletet a feltételbe, majd hozzuk megfelel® alakra: 3x2 + (−λ6x)2 = 6 3x2 + 36λ2 x2 = 6,
ami ekvivalens azzal, hogy 3x2 + 3(12λ2 )x2 = 6.
(3.21)
Mivel 12λ2 = 1, ezért (3.21) a következ®t jelenti: 3x2 + 3x2 = 6.
(3.22)
√
(3.22)-ból következik, hogy x = ±1, y = ± 3. Az f (x, y) = xy függvény széls®értékhelye és annak értéke a g(x, y) = 3x2 + y 2 = 6 feltétel mellett a következ®k: 14
√ √ f (1, 3) = 3, √ √ f (−1, 3) = − 3,
√ √ f (1, − 3) = − 3 √ √ f (−1, − 3) = 3 √ √ Az (x, y) = (1, 3) és a (x, y) = (−1, − 3) pontokban maximuma, míg a (x, y) = √ √ (1, − 3) és a (x, y) = (−1, 3) pontokban pedig minimuma van.
3.1.4. Példa. Keressük meg az f (x, y, z) = x2 − y2 széls®értékét a g(x, y, z) = x2 + 2y2 + 3z 2 = 1 feltétel mellett. A Lagrange-függvény felírása után meghatározzuk a parciális
deriváltakat: L(x, y, z) = x2 − y 2 + λ(x2 + 2y 2 + 3z 2 − 1). ∂L = 2x + 2λx = 0, ∂x ∂L = −2y + 4λy = 0, ∂y ∂L = 6λz = 0. ∂z A (3.25) egyenlet csak akkor teljesülhet, ha λ = 0 vagy z = 0.
15
(3.23) (3.24) (3.25)
• Els®ként nézzük meg azt az esetet, amikor λ = 0. Ebben az esetben, a (3.23) és a
(3.24) formulákból következik, hogy x = 0 és y = 0. Így a feltételb®l azt kapjuk, 1 3
hogy z = ± √ . 1 (x1 , y1 , z1 ) = 0, 0, √ , 3 1 (x2 , y2 , z2 ) = 0, 0, − √ . 3 • Másodszor nézzük meg azt az esetet, amikor a λ 6= 0. A (3.25) egyenletb®l kö-
vetkezik, hogy z = 0. Mivel a z változó csak a feltételben szerepel, így további esetszétválasztásra van szükségünk. 1 2
1. Ha x = 0. Ekkor a feltételb®l következik, hogy y = ± √ , azaz
1 (x3 , y3 , z3 ) = 0, √ , 0 , 2 1 (x4 , y4 , z4 ) = 0, − √ , 0 . 2
1. Ha x 6= 0. Ebben az esetben a (3.23) egyenl®ség csak akkor teljesül, ha λ = 1. Ezzel együtt (3.24) csak akkor igaz, ha y = 0. Ezeket a feltételbe visszahelyettesítve megkapjuk az utolsó két széls®értékhelyet: (x5 , y5 , z5 ) = (1, 0, 0), (x6 , y6 , z6 ) = (−1, 0, 0).
Végeredményben kapott széls®értékhelyek, és ott a függvény értéke: 1 f 0, 0, √ = 0, 3 1 1 f 0, 0, √ =√ , 2 2 f (1, 0, 0) = 1,
1 f 0, 0, − √ = 0, 3 1 1 f 0, 0, − √ = −√ , 2 2 f (−1, 0, 0) = 1.
3.1.5. Példa. Határozzuk meg az f (x, y, z) = x + y + 2z függvény széls®értékhelyét a g(x, y, z) = x2 + y 2 + z 2 = 3 feltétel mellett. El®ször felírjuk a Lagrange függvényt a λ
16
multiplikátor bevezetésével, majd meghatározzuk az x, y , és z szerinti parciális deriváltakat: L(x, y, z) = x + y + 2z + λ(x2 + y 2 + z 2 − 3).
(3.26)
∂L = 1 + 2xλ = 0, ∂x ∂L = 1 + 2yλ = 0, ∂y
(3.27)
∂L = 2 + 2zλ = 0. ∂z
(3.29)
(3.28)
A (3.27), (3.28) és a (3.29) által alkotott egyenletrendszert elvégezve kapuk egy lehetséges (x, y, z) széls®érték helyet, de ezek függnek λ-tól: 1 , 2λ 1 y=− , 2λ 1 z=− . λ
x=−
(3.30) (3.31) (3.32)
Ezeket a feltételbe visszahelyettesítve kapunk λ-ra két megfelel® értéket: 1 λ1 = − √ , 2
(3.33)
1 λ2 = √ . 2
(3.34)
A (3.33) és (3.34) segítségével megkapjuk a feltételt kielégít® széls®értékhelyeket: 1 2
1. λ1 = − √ esetén: √
! √ 2 2 √ , , 2 . 2 2
(x1 , y1 , z1 ) = 1 2
2. λ2 = √ esetén: √
(x2 , y2 , z2 ) =
! √ 2 2 √ − ,− ,− 2 . 2 2
17
Ebben a két pontban a függvény értéke a következ®: √
f
! √ √ √ √ √ 2 2 √ 2 2 f , , 2 = + + 2 2 = 3 2, ami a függvény maximuma, 2 2 2 2 ! √ √ √ √ √ √ 2 2 √ 2 2 − ,− ,− 2 = − − − 2 2 = −3 2, ami pedig a függvény minimuma. 2 2 2 2
3.2. Háromváltozós függvény, két feltétel
Olyan eset is adódhat, amikor két feltételt is gyelembe kell vennünk. Ekkor két λ multiplikátort is be kell vezetnünk. A következ® példában egy ilyen esetet vizsgálunk.
3.2.1. Példa. Határozzuk meg az f (x, y, z) = x2 + 3xy + 2y2 + 4y + 0.5z 2 + 12 függvény széls®értékét a g1 (x, y, z) = x + y + z = 4 és a g2 (x, y, z) = x − z = 2 feltételek mellett. Els®ként írjuk fel a Lagrange-függvényt, majd határozzuk meg az els®rend¶ parciális deriváltakat. L(x, y, z) = x2 + 3xy + 2y 2 + 4x + 0.5z 2 + 12 + λ1 (x + y + z − 4) + λ2 (x − z − 2).
Az els®rend¶ parciális deriváltak, amiket egyenl®vé teszünk nullával: ∂L = 2x + 3y + 4 + λ1 + λ2 = 0, ∂x
(3.35)
∂L = 3x + 4y + λ1 = 0, ∂y
(3.36)
∂L = z + λ1 − λ2 = 0. ∂z
(3.37)
A (3.35), (3.36) és a (3.37) egyenletekb®l lehetséges széls®értékhelyeket kapunk, de ezek még függnek a bevezetett λ1 , λ2 multiplikátoroktól: x = λ1 + 4λ2 + 16, y = −λ1 − 12 − 3λ2 , z = −λ1 + λ2 .
18
A fenti (x, y, z) értéket a g1 és g2 feltételekb®l álló egyenletrendszerbe visszahelyettesítjük, és így kapunk λ1 -re, és λ2 -re megfelel® eredményeket: λ1 = −4, λ2 = −2.
A λ1 , és λ2 értékeket, a (3.35), (3.36) és a (3.37) parciális deriváltakba behelyettesítve megkapjuk a feltételeknek eleget tev® (x, y, z) megoldásokat: x = 4, y = −2, z = 2.
Az f (x, y, z) függvény széls®értékhelye a g1 és a g2 feltétel mellett az (x, y, z) = (4, −2, 2), az értéke pedig : 42 + 3 · 4 · (−2) + 2 · (−2)2 + 4 · 4 + 0, 5 · 22 + 12 = 30. Ez az érték a függvény minimuma, mert a feltételt kielégít® pontokat behelyettesítve nagyobb értéket kapunk, például az (x, y, z) = (2, 2, 0) pont esetén a függvény értéke : 22 + 3 · 2 · 2 + 2 · 22 + 4 · 2 + 0, 5 · 02 + 12 = 44.
3.3. Feltételek egyenl®tlenségként
Amikor a feltétel, vagy a feltételek nem egyenl®ség, hanem egyenl®tlenség formájában vannak megadva, a tartomány peremét, és a belsejét is külön-külön meg kell vizsgálni. Ennek oka, hogy a lehetséges széls®értékek vagy a tartomány belsejében, vagy a peremen találhatók a 2.1.4 Tétel szerint.
3.3.1. Példa. Határozzuk meg az f (x, y) = (x − 1)2 + (y − 3)2 függvény széls®értékhelyét a g1 (x, y) = x + y ≤ 2 és a g2 (x, y) = y ≥ x feltételek mellett. Ahogyan eddig, els®ként felírjuk a Lagrange-függvényt, majd meghatározzuk az els®rend¶ parciális deriváltakat, majd ezeket egyenl®vé tesszük nullával: L(x, y) = (x − 1)2 + (y − 3)2 + λ1 (x + y − 2) + λ2 (x − y).
19
∂L = 2(x − 1) + λ1 + λ2 = 0, ∂x ∂L = 2(y − 3) + λ1 − λ2 = 0. ∂y
(3.38) (3.39)
Azoknál a feladatoknál, ahol egyenl®tlenséggel vannak megadva a feltételek, ott több esetet kell megvizsgálnunk. A lehetséges esetek a λ multiplikátorok és a feltételek alapján kerülnek szétválasztásra: λ1 (x + y − 2) = 0, λ2 (x − y) = 0. • I. eset: amikor a tartomány belsejében nézzük meg a lehetséges széls®értékeket. λ1 = 0, λ2 = 0:
Mivel mindkét λ nulla, ezért a 2(x − 1) = 0 és a 2(y − 3) = 0 egyenleteket megoldva kapunk x-re, és y -ra lehetséges értéket: (x, y) = (1, 3). Ezt a pontot még ellen®riznünk kell, hogy teljesítik-e a feltételeket: 1 + 3 = 4 2: nem teljesíti a feltételt, így ez a pont nem megfelel® széls®értékhely. • II. eset: λ1 = 0, λ2 6= 0:
Mivel λ2 6= 0, ezért a második feltételb®l képzett λ2 (x − y) = 0 akkor és csak akkor lehet 0, ha (x − y) = 0, ami ekvivalens azzal, hogy x = y . Ezek alapján a 2(x − 1) + λ2 = 0, (y − 3) − λ2 = 0.
egyenletrendszert megoldva kapjuk, hogy λ2 = −2, majd ezt felhasználva kapjuk a következ® lehetséges széls®értékhelyet: (x, y) = (2, 2), amit még ellen®riznünk kell. A g1 (x, y) = x + y ≤ 2 feltételbe visszahelyettesítve láthatjuk, hogy ezt a pont nem teljesíti, emiatt ez
is hamis megoldás. • III. eset: λ1 6= 0, λ2 = 0:
20
Ennél az esetnél mivel λ1 6= 0, ezért a g1 feltételb®l indulunk ki. λ1 (x + y − 2) = 0 csak akkor lehet, ha (x + y − 2) = 0, amib®l következik, hogy x = 2 − y . Hasonlóan a II. esethez megoldjuk a 2(x − 1) + λ1 = 0, (y − 3) + λ1 = 0
egyenletrendszert, ami után megkapjuk a λ1 = −2 + 2y és az (x, y) = (0, 2) eredményt. Ez az (x, y) eredmény megfelel® széls®értékhely, mert a g1 és a g2 feltételt is teljesíti. Az f (x, y) = (x − 1)2 + (y − 3)2 függvénynek ebben a pontban az értéke: f (0, 2) = (0 − 1)2 + (2 − 3)2 = 2. • IV. eset, amikor egyik λ érték sem nulla: λ1 6= 0, λ2 6= 0.
Ekkor a λ1 (x + y − 2) = 0 és λ2 (x − y) = 0 egyenletekb®l kiindulva kapunk x-re és y -ra megfelel® értéket. Mivel egyik λ se nulla, ezért az x + y − 2 = 0, x−y =0
egyenletrendszert kell megoldanunk, amib®l következik, hogy x = 1, y = 1, λ1 = 2, λ2 = −2. A kapott (x, y) = (1, 1) értéket ellen®riznünk kell. Visszahelyettesítjük a g1 és a g2 feltételbe, és láthatjuk, hogy mindkett®t teljesíti, így az eredeti függvénynek az (1, 1)
pontban is van széls®értéke, aminek értéke: f (1, 1) = (1 − 1)2 + (1 − 3)2 = 4.
Végeredményben a négy eset megvizsgálása után azt kaptuk eredményül, hogy az eredeti f (x, y) = (x − 1)2 + (y − 3)2 függvénynek a g1 és a g2 feltétel mellett maximuma van az (x, y) = (1, 1) pontban, értéke 4, és minimuma van az (x, y) = (0, 2) pontban, ahol az
értéke 2.
21
4. fejezet További gyakorlati példák
4.1. Maximális terméshozam
4.1.1. Példa. Egy gazdaság A,B,C tábláján a talajtól függ®en más-más fajta m¶trágyát használ. Megállapították, hogy az A táblán a holdankénti terméshozam és a m¶trágya mennyisége közötti kapcsolatot a 4 + 3x − 2x2 , a B táblán a 4 + 5y − y 2 , a C táblán pedig a 2 + 6z − 3z 2 formulák tükrözik. Az A, B, C táblák nagysága rendre: 500, 200, és 100 hold
nagyságú. A különböz® m¶trágyafajták milyen mennyisége mellett lesz a terméshozam maximális a 3 táblán együtt, azon feltétel mellett, hogy a m¶trágya beszerzésére 20000 Ft áll rendelkezésre, és a m¶trágyák egységára 40, 30, 20 Ft?
Megoldás. A feladatban a maximális terméshozamot kell meghatározni úgy, hogy teljesüljön a feltétel az adott adatok mellett. A feltétel függvénye a következ® lesz: g(x, y, z) = 500 · 40x + 200 · 30y + 100 · 20z = 20000x + 6000y + 2000z ≤ 20000 (4.1)
ami a következ®k alapján áll össze: Az A táblára az x fajta m¶trágya kell, aminek az egységára 40 Ft, a tábla nagysága 500 hold, ezért: A := 500 · 40x.
22
A másik kett®, B és C táblákra vonatkozó összefüggésekre hasonlóan adódik, hogy: B := 200 · 30y , C := 100 · 20z .
Ezek összege legfeljebb 20000, mert a beszerzésre ekkora keretösszeg áll rendelkezésre, továbbá x, y, z ≥ 0.
(4.2)
Amit pedig maximalizálnunk kell, az F (x, y, z) = 500(4 + 3x − 2x2 ) + 200(4 + 5y − y 2 ) + 100(2 + 6z − 3z 2 ).
Ez a terméshozam és a m¶trágyák mennyisége közti kapcsolatot adja meg, gyelembe véve a táblák nagyságát. A (4.1) és a (4.2) feltételek egy tetraédert határoznak meg. Ebben az esetben a (2.1.4) Tétel szerint meg kell néznünk, hogy a célfüggvény a tartomány belsejében vagy a peremén veszi fel a széls®értékét. Amennyiben a tartomány belsejében, úgy a 2.1.3. Tétel szerint teljesül a következ® egyenletrendszer: ∂F = 1500 − 2000x = 0, ∂x ∂F = 1000 − 400y = 0, ∂y ∂F = 600 − 600z = 0. ∂z
(4.3) (4.4) (4.5)
A (4.3), (4.4) és a (4.5) egyenletekb®l kapunk x, y, z -re lehetséges értékeket, amit le kell ellen®riznünk, hogy teljesíti-e a feltételt. x=
1500 3 = , 2000 4
y=
1000 = 2.5, 400
z=
600 = 1. 600
A feltételbe visszahelyettesítve kapjuk, hogy 23
20000 · 34 + 6000 · 2.5 + 2000 · 1 = 32000 20000,
ezért maximum csak a peremen lehet, ami azt jelenti, hogy a feltétel az alábbi lesz: g(x, y, z) = 500 · 40x + 200 · 30y + 100 · 20z = 20000x + 6000y + 2000z = 20000. (4.6)
A maximalizálandó F függvény és a (4.6) feltételb®l álló Lagrange-függvény a következ®: L(x, y, z) = 500(4 + 3x − 2x2 ) + 200(4 + 5y − y 2 ) + 100(2 + 6z − 3z 2 )+ +λ(20000x + 6000y + 2000z − 20000).
Az x, y és z szerinti parciális deriváltak: ∂L = 500(3 − 4x) + 20000λ = 0, ∂x ∂L = 200(5 − 2y) + 6000λ = 0, ∂y
(4.7)
∂L = 100(6 − 6z) + 2000λ = 0. ∂z
(4.9)
(4.8)
A (4.7), (4.8) és a (4.9) egyenletek megoldásaként kapjuk, hogy 3 + 10λ, 4 5 y = + 15λ, 2 10 z = 1 + λ. 3
x=
(4.10) (4.11) (4.12)
Ezek az (x, y, z) értékek még függnek λ-tól, de a feltételbe visszahelyettesítve kapunk λ-ra helyes értéket, amib®l már következik a feladat megoldása: 3 5 10 20000 + 10λ + 6000 + 15λ + 2000 1 + λ = 20000. 4 2 3
A (4.13) egyenletb®l ekvivalens átalakításokkal kapjuk λ-ra a következ® értéket: λ=−
18 . 445
24
(4.13)
Ezt a λ-t felhasználva megkapjuk a helyes megoldást: 3 −18 123 x = + 10 = ≈ 0, 345, 4 445 356 5 −18 337 y = + 15 = ≈ 1, 893, 2 445 178 10 −18 77 z =1+ = ≈ 0, 865. 3 445 89
A feladatban kért maximális terméshozam az (x, y, z) = (0.345, 1.893, 0.865) mennyiségek mellett teljesül.
4.2. Henger felületének minimalizálása
4.2.1. Példa. Határozzuk meg, hogy adott V térfogat esetén milyen sugár és magasság mellett lesz a henger felülete minimális. Kör alapú henger felülete: A = 2πr2 + 2πrh,
ahol r a sugár és h a magasság. A térfogat adott, ami legyen: V = πr2 h.
Ezek az adatok alapján fel tudjuk írni a Lagrange-függvényt, ahol A a minimalizálandó függvény, V pedig a feltétel: L(r, h) = 2πr2 + 2πrh + λ(πr2 h − V ).
Készítsük el a parciális deriváltakat, amiket egyenl®vé teszünk nullával: ∂L = 4πr + 2πh + λπrh = 0, ∂r
(4.14)
∂L = 2πr + λπr2 = 0. ∂h
(4.15)
Vegyük észre, hogy a (4.14) és a (4.15) formulákat átrendezve, fel tudjuk írni a kett® egyenlet arányát, amib®l kapunk h-ra és r-re egy helyes összefüggést: 4πr + 2πh = −λπrh, 2πr = −λπr2 .
25
Most vegyük ezek arányát, és hozzuk egyszer¶bb alakra: 4πr + 2πh −λπrh = , 2πr −λπr2
amib®l következik, hogy h 2r + h = . r r
(4.16)
A (4.16) formulából ekvivalens átalakítással a következ® összefüggést kapjuk: h = 2r.
(4.17)
Azaz a henger felülete minimális lesz (4.17) összefüggés esetén, ami azt jelenti, hogy a magasság kétszerese a sugárnak. Ezek után még vissza kell helyettesítünk a térfogatot meghatározó összefüggésbe, hogy r-re, és h-ra megkapjuk a megfelel® értéket: V = πr2 h = πr2 2r. r 3 V r= , 2π r 3 V h = 2r = 2 . 2π
4.3. Maximális entrópia számítása
4.3.1. Példa. Legyen X a természetes számokon értelmezett valószín¶ségi változó, melynek eloszlása P {X = i} = pi ,
i = 0, 1, 2, . . .
Célunk az entrópia maximalizálása, az E{X} = 13.5 várható érték feltétel mellett, ahol az entrópia függvény az alábbi formulával adott: H(X) = −
∞ X
pi log(pi).
(4.18)
i=0
Továbbá felhasználjuk az alábbi két feltételt: ∞ X
pi = 1,
i=0
26
(4.19)
azaz, hogy {pi }i∈N eloszlás, illetve a várható értéke: E {X} =
∞ X
(4.20)
i · pi = 13.5,
i=0
ahol pi az i-dik elemi esemény valószín¶sége. A (4.18), (4.19) és (4.20) formulák segítségével fel tudjuk írni a Lagrange függvényt a feladat megoldásához: L=−
∞ P
pi log(pi) + λ1
∞ P
i=0
i · pi
i=0
∞ P − 13.5 + λ2 pi − 1 . i=0
Els®ként megnézzük a Lagrange-függvény pi szerinti deriváltját: ∂L = −log(pi ) − 1 + λ1 · i + λ2 = 0, ahol i = 0, 1, 2, . . . ∂pi
(4.21)
A (4.21) egyenletb®l ekvivalens átalakításokkal kifejezzük pi -t: log (pi ) = −1 + λ1 · i + λ2 2 −1 elog(pi ) = |{z} eλi ·i · e|λ{z }
αi
pi = αi · β,
β
i = 0, 1, 2, . . .
(4.22)
Ezzel beláttuk, hogy {pi : i = 0, 1, 2, . . .} egy mértani sor, ami az eloszlásparaméterek (α és β ) meghatározásánál segítségünkre lesz, ugyanis fel tudjuk használni az alábbi, mértani sor összegképletére vonatkozó azonosságot: ∞ X i=0
pi =
1 . (1 − p)
Ez alapján tudjuk kiszámolni λ2 -re vonatkozó összefüggést: ∞ X i=0
pi =
∞ X
i
α ·β =β
i=0
∞ X i=0
αi =
β . (1 − α)
A (4.19) és (4.23) egyenletek alapján ki tudjuk fejezni β -t: β = 1 − α.
27
(4.23)
A α eloszlásparamétert a (4.20) és (4.22) azonosságok felhasználásával számolhatjuk ki: ∞ X
i · pi =
i=0
∞ X i=0
∞ X
∞ X
i · αi · β = β i · αi = β · α i · α(i−1) = β · α i=0 i=0 0 1 1 =β·α· . =β·α· 1−α (1 − α)2
∞ X
!0 αi
=
i=0
Mivel az el®z® lépésben kaptuk, hogy β = 1 − α, ezért végeredményben: ∞ X
i · pi =
i=0
α , 1−α
azaz E {X} =
α 13.5 2 = 13.5, amib®l következik, hogy α = és β = . 1−α 14.5 29
Innen adódnak a Lagrange-multiplikátorok értékei:
13.5 λ1 = log2 (α) = log2 , 14.5 2 . λ2 = log2 (β) = log2 29
A fentiekben azt mutattuk meg, hogy a {pi : i = 0, 1, 2 . . .} a feltételes entrópiafüggvény széls®értékhelye, azt azonban nem tudjuk, hogy minimum, vagy maximum. Ezért legyen {pi }i∈N eloszlás a következ® alakú 1 , ha i = 13 vagy i = 14, 2 pi = 0, egyébként
Világos, hogy erre teljesülnek a (4.19) és (4.20) feltételek, azaz {pi }i∈N valóban valószín¶ségi eloszlás és a várható értéke 13,5. Az entrópia értéke: 1 − (log(13) + log(14)) < 0. 2
Mivel −
∞ X i=0
i ∞ X 2 13.5 pi logpi = − · log 29 14.5 i=0
2 29
13.5 14.5
i ! > 0,
hiszen az összeg minden tagja negatív. Ezzel megmutattuk, hogy az entrópia függvénynek maximuma van a {pi : i = 0, 1, 2 . . .} széls®értékhelyen. 28
Irodalomjegyzék [1] Laczkovich Miklós - T. Sós Vera: Analízis II., Nemzeti Tankönyvkiadó, 2007 [2] Fekete Zoltán - Zalay Miklós: Többváltozós függvények analízise, M¶szaki Könyvkiadó, 2007 [3] Pang-Ning Tan, Michael Steinbach, Vipin Kumar: Bevezetés az adatbányászatba, Panem Kft, 2011 [4] http://www.uni-miskolc.hu/ matente/oktatasi%20tananyagok/ /FELTETELES_OPTIMALIZALAS.pdf [5] https://en.wikipedia.org/wiki/Lagrange_multiplier
29
30