Matematika
1
NYME KTK, Egyetemi kiegészít˝o alapképzés 2004/2005. tanév, I. évf. I.félév Budapest El˝oadó: Dr. Takách Géza NyME FMK Informatikai Intézet 9400 Sopron, Bajcsy Zs. u. 9. GT fszt. 3. (99) 518 640 (30) 5600 785
[email protected] http://inf.nyme.hu/˜takach http://www.inf.nyme.hu
4. konzultáció: Kétváltozós függvények széls˝oértéke • Parciális deriválás • Széls˝oértékszámítás • Regressziószámítás • Széls˝oérték korlátos zárt halmazon
Parciális függvény, parciális derivált A kétváltozós függvények minden számpárhoz egy számot rendelnek. Pl.: z = g(x, y) = 2x2 y 3 + 3xy + 2x − 5y + 1 vagy f (x, y) = 2x + y. Definíció. Az f (x, y) kétváltozós függvény y = b-hez tartozó parciális függvénye az fx = fx (x) = f (x, b) egyváltozós függvény, az x = a-hoz tartozó parciális függvénye az fy = fy (y) = f (a, y) egyváltozós függvény. Tehát az egyik változót lerögzítjük. Kétváltozós függvények grafikonja egy felület: az értelmezési tartomány a sík , ill. a sík egy részhalmaza, és minden x, y ponthoz a felület (x, y, z) pontja tartozik, ahol z = f (x, y). A parciális függvény grafikonja a felületb˝ol az y = b illetve x = a (függ˝oleges) síkok által kimetszett síkgörbe. függvénygrafikon – domborzat, parciális függvény – út (Észak-Déli, illetve Kelet-Nyugati)
2
Definíció. Egy kétváltozós függvény parciális deriváltjain a parciális függvények deriváltjait értjük. Jelölés: fx0 ill. fy0 . Mivel a parciális derivált függ attól is, hogy hogyan rögzítettük le a másik változót, szokás kétváltozós függvénynek is tekinteni. Pl. fx0 (1, 3) azt jelenti, hogy az f (x, 3) = fx függvényt deriváljuk, majd x = 1-et behelyettesítünk. A gyakorlatban azonban általánosan van szükségünk fx0 (x, y)-ra; ezt úgy kapjuk meg, ha y-t számnak képzeljük, és úgy deriválunk, mintha egyváltozós függvényr˝ol lenne szó, amely csak x-t˝ol függ. A fenti g(x, y) = 2x2 y 3 + 3xy + 2x − 5y + 1-re gx0 (x, y) = 4xy 3 + 3y + 2. Hasonlóan gy0 (x, y) = 6x2 y 2 + 3x − 5. Az egyváltozós esethez hasonlóan beszélhetünk magasabbrend˝u parciális deriváltakról. Itt azonban nem egy, hanem négy másod00 rend˝u parciális derivált van. Ha f (x, y)-t el˝oször x szerint deriváljuk, majd y szerint, akkor kapjuk fxy (x, y)-t, ha mindkétszer y 00 szerint, akkor fyy (x, y)-t, stb. Ellen˝orzési pont, hogy általában 00 00 fxy (x, y) = fyx (x, y)
.
Széls˝oértékszámítás Definíció. Az f függvénynek lokális minimuma van az m ∈ M helyen, ha létezik m-nek olyan K környezete, hogy tetsz˝oleges x ∈ M ∩ K esetén f (x) > f (m). f -nek globális minimuma van az m ∈ M helyen, ha tetsz˝oleges x ∈ M esetén f (x) > f (m). A lokális és globális maximum fogalmát hasonlóképpen értelmezhetjük. Tétel. Legyen az (a, b) pont az f (x, y) függvény értelmezési tartományának egy bels˝o pontja. Ha f (x, y)-nak széls˝oértéke van az (a, b) helyen, akkor els˝orend˝u parciális deriváltjai az (a, b) helyen nullák, azaz fx0 (a, b) = fy0 (a, b) = 0. Ha az f (x, y) függvény els˝orend˝u parciális deriváltjai az (a, b) helyen nullák, továbbá a másodrend˝u parciális deriváltakra 00 00 00 00 D(a, b) = fxx (a, b)fyy (a, b) − fxy (a, b)fyx (a, b) > 0, 00 00 (a, b) < 0. akkor f -nek széls˝oértéke van az (a, b) helyen. Méghozzá minimuma, ha fxx (a, b) > 0, és maximuma, ha fxx
3 Bizonyítás. Csak a szükségességet látjuk be: ha f (x, y)-nak széls˝oértéke van az (a, b) helyen, akkor az f (a, y) és az f (x, b) parciális függvényeknek is széls˝oértéke van az x = a illetve az y = b helyen. Tehát a parciális deriváltak az (a, b) helyen nullák. ♦ 00 00 00 00 A D(a, b) = fxx (a, b)fyy (a, b) − fxy (a, b)fyx (a, b) > 0 feltétel azt fejezi ki, hogy a két parciális függvénynek ugyanolyan típusú széls˝oértéke legyen. Az olyan tulajdonságú pontot, ahol az egyik parciális függvénynek minimuma, a másiknak pedig maximuma van, nyeregpontnak nevezzük.
Ha az els˝orend˝u parciális deriváltak nullák, de D(a, b) < 0, akkor biztosan nincs széls˝oérték, ha pedig D(a, b) = 0, akkor további vizsgálat szükséges.
Regressziószámítás F ELADAT: Adott néhány pont a síkban. Keresünk egy adott típusú függvényt, amelynek grafikonja "elég közel" halad az adott pontokhoz. Általában a legkisebb négyzetek elvét alkalmazzuk, és azt követeljük meg, hogy az adott pontok és a függvénygrafikon függ˝oleges irányban mért "távolságainak" négyzetösszege minimális legyen.
4
Lineáris regresszió: Itt a kérdéses függvény y = ax + b, azaz a grafikon egyenes. Módszer: Jelölje az adott pontokat Pi (xi , yi ). A függ˝oleges irányban mért "távolságok": ei = axi + b − yi . P e2i → min P 2 P 2 Mivel az (xi , yi ) pontok koordinátái adottak, ei csak a-tól és b-t˝ol függ, vagyis ei = f (a, b) kétváltozós függvény. A minimum létezésének szükséges feltétele, hogy fa0 = 0 és fb0 = 0 teljesüljön. Ezzel egy kétismeretlenes egyenletrendszerhez jutunk a és b ismeretlenekkel. Belátható, hogy ezen egyenletrendszernek egyetlen megoldása létezik, és az tényleg minimumot szolgáltat. A fentiekben leírt módszer könnyen átvihet˝o más függvénytípusokra, pl. y = ax2 + bx + c egyenlet˝u parabola, y = abx , y = axc bx vagy y = a(1 − e−bx ) egyenlet˝u exponenciális függvény hasonlóan illeszthet˝o az adott pontokhoz. (Ez utóbbi exponenciális függvényt szokás telít˝odési függvénynek nevezni). Természetesen több ismeretlen paraméter (pl. a, b, c) esetén kett˝onél több változós széls˝oértékfeladatot kellene megoldani. A regressziószámítás célja, hogy felfedje két mennyiség (pl. egy üzem dolgozóinak száma és az üzem éves bevétele) között fenálló esetleges függvénykapcsolatot, természetesen néhány "mérés" (adat) alapján. Ezen függvénykapcsolat alapján aztán el˝orejelzéseket lehet adni további x értékekhez tartozó y-okra. A gyakorlatban igazi függvénykapcsolatra nem számíthatunk, egyes x értékekhez több y érték is tartozhat (még akkor is, ha minden egyes x-hez csak egy y van az adatok között). A regressziós függvény ennek ellenére felírható, és a statisztika eszközeivel vizsgálható, hogy az adatok között fenálló, a regressziós függvény által leírt kapcsolat milyen szoros, és hogy milyen biztonsággal lehet el˝orejelzésre használni.
Széls˝oérték korlátos zárt halmazon Rögzítsünk egy M ⊂ Rn halmazt, továbbá egy olyan n-változós f függvényt, amely M minden pontjában értelmezve van és differenciálható. (Nálunk n = 1 vagy n = 2 lesz.) Tétel. (Weierstrass) Ha M korlátos és zárt, akkor f -nek van globális minimuma és maximuma M -en. Tudjuk, hogy ha m a M értelmezési tartomány bels˝o pontja és f -nek lokális széls˝oértéke van m-ben, akkor f els˝orend˝u parciális deriváltjai m-ben nullák (illetve f 0 (m) = 0 az egyváltozós esetben). Ez módot ad M azon bels˝o pontjainak meghatározására, ahol lokális széls˝oértékek lehetnek. A másodrend˝u deriváltak segítségével azt is megállapíthatjuk, hogy melyik helyen van minimum, maximum, ill. nincs széls˝oérték. Ha csak véges sok lokális széls˝oérték van, akkor a globális széls˝oérték nem más, mint a legnagyobb lokális széls˝oérték, tehát behelyettesítéssel eldönthetjük, hogy hol van globális széls˝oérték. Az értelmezési tartomány határán azonban széls˝oérték lehet akkor is, ha a derivált(ak) nem nulla. Például a [0, 1] zárt intervallumon értelmezett g(x) = 2x + 3 függvénynek lokális minimuma van a 0-ban, lokális maximuma az 1-ben. Lemma. Az [a, b] zárt intervallumon értelmezett g(x) egyváltozós függvénynek pontosan akkor van lokális minimuma a-ban, ha g 0 (a) > 0, b-ben pedig pontosan akkor, ha g 0 (b) < 0.
Feladat. Határozzuk meg az f (x) = x3 − 6x2 − 15x + 3 függvény lokális és globális széls˝oértékeit a [-10, 6] intervallumon! 5 Megoldás. f 0 (x) = 3x2 − 12x − 15 = 0 ⇒ x = −1 vagy x = 5 f 00 (x) = 6x − 12 ⇒ x = −1 helyen maximum, az x = 5 helyen minimum van. Határon: Mivel f 0 (−10) > 0 és f 0 (6) > 0, ezért az x = −10 helyen minimum, az x = 6 helyen maximum van. Behelyettesítés: f (−10) = −1447, f (−1) = 11, f (5) = −97, f (6) = −87 ⇒ x = −10-ben minimum és az x = −1 helyen maximum. Kétváltozós függvények esetén szorítsuk meg az f függvényt M határára, és állapítsuk meg az ottani lehetséges (glob´lis) széls˝oérték-helyeket. Ez általában már csak egyváltozós széls˝oérték-számítás, de továbbra is egy korlátos zárt halmazon. A globális széls˝oértékek megállapításához a bels˝o és határpontokban lév˝o lehetséges lokális széls˝oérték-helyek mindegyikén számuljuk ki a függvény helyettesítési értékét. Feladat. Határozzuk meg az f (x, y) = x2 + 2xy + 8y − 4x függvény globális széls˝oértékeit az M = {(x, y)| 0 ≤ x ≤ 3, 0 ≤ y ≤ 1} halmazon! Megoldás. Az fx0 = 2x + 2y − 4 = 0 fy0 = 2x + 8 = 0 egyenletrendszer megoldása a (−4, 6) pont, azonban ez nincs M -ben. Tehát M bels˝o pontjaiban nincs lokális széls˝oérték sem. Az M tartomány egy téglalap, határát négy szakasz alkotja: Ha x = 0, akkor az f (y) = 8y, (0 ≤ y ≤ 1) egyváltozós függvény széls˝oértékeit keressük. Mivel f (y) monoton n˝o, y = 0-ban minimuma, y = 1-ben maximuma van. Tehát az f (x, y)-nak a (0, 0) pont lehetséges minimumhelye, a (0, 1) pont lehetséges maximumhelye. Ha x = 3, akkor f (y) = 14y − 3, (0 ≤ y ≤ 1) szintén monoton n˝o, így f (x, y)-nak az (1, 0) pont lehetséges minimumhelye, az (1, 1) pont lehetséges maximumhelye. Ha y = 0, akkor az f (x) = x2 −4x, (0 ≤ x ≤ 3) egyváltozós függvényt vizsgáljuk. f 0 (x) = 2x−4 pozitív a (2, 3] intervallumon, negatív a [0, 2) intervallumon, így f (x)-nek lokális minimuma van x = 2-ben, lokális maximuma van x = 0-ban és x = 3-ban. Tehát az f (x, y)-nak a (2, 0) pont lehetséges minimumhelye, a (0, 0) és a (3, 0) pontok lehetséges maximumhelyei. Ha y = 1, akkor hasonlóan kapjuk, hogy f (x, y)-nak az (1, 1) pont lehetséges minimumhelye, a (0, 1) és a (3, 1) pontok lehetséges maximumhelyei. Ezek után behelyettesítünk a lehetséges széls˝oértékhelyeken: f (0, 0) = 0 f (0, 1) = 8 f (1, 1) = 7 f (2, 0) = −6 f (3, 0) = −3 f (3, 1) = 11 Ennek alapján a (2, 0) globális minimumhely, a (3, 1) globális maximumhely.
Feladat.
∗
Határozzuk meg az el˝oz˝o feladatbeli függvény lokális széls˝oértékeit!
6
Megoldás. Vizsgáljuk meg a fenti hat lehetséges széls˝oértékhelyet: A (0, 0) és a (3, 0) pontok biztosan nem lokális széls˝oértékhelyek, mert az egyik parciális függvénynek minimuma, a másiknak maximuma van, ahogyan azt az el˝oz˝o feladatban is kiszámoltuk (nyeregpontok). A (0, 1) pontban mindkét parciális függvénynek maximuma van, ami lokális maximumhelyre utal. Valóban, fx0 < 0 és fy0 > 0 nemcsak a (0, 1) pontban, hanem egy környezetében is fennáll. Tehát ha az M -beli (a, b) pont elég közel van a (0, 1) ponthoz, akkor f (0, 1) > f (0, b) > f (a, b). Hasonlóan indokolható, hogy a (3, 1)-ben is maximum van. Az (1, 1) ill. a (2, 0) pontban az fy0 = 2x + 8 képletbe helyettesítve kapjuk, hogy az f (y) parciális függvénynek maximuma ill. minimuma van. Ez el˝oz˝oekhez hasonlóan kapjuk, hogy az (1, 1) nyeregpont, a (2, 0) pedig minimumhely. Feladat. Határozzuk meg az f (x, y) = x2 + 2y 2 + 3 függvény globális széls˝oértékeit az M = {(x, y)|x2 + y 2 ≤ 1} halmazon! Megoldás. Az fx0 = 2x = 0 fy0 = 4y = 0 egyenletrendszer megoldása a (0, 0) pont, lehetséges széls˝oértékhely. Az M tartomány egy körlap, határát az x2 + y 2 = 1 egyenlet˝u kör alkotja. A függvényt úgy szorítjuk meg a körvonalra, hogy a körvonal egyenletének segítségével kiküszöböljük ez egyik változót f (x, y)-ból: f (y) = y 2 + 4, (−1 ≤ y ≤ 1). f 0 (y) = 2y-ból f (y)-nak y = 0 minimumhelye, y = 1 és y = −1 maximumhelyei. Az ezen y értékeknek megfelel˝o pontok, azaz (1, 0), (−1, 0), (0, 1), (0, −1) az f (x, y) lehetséges széls˝oértékhelyei. Behelyettesítéssel kapjuk, hogy a (0, 1), (0, −1) (nem szigorú) globális maximumhelyek, a (0, 0) pedig globális minimumhely.