Matematické algoritmy (K611MAG) pondělí 25. listopadu verze: :47

Koˇ reny neline´ arn´ıch funkc´ı Matematické algoritmy (K611MAG)

Jan Pˇrikryl 9. pˇrednáˇska 11MAG pondˇel´ı 25. listopadu 2013 verze:2013-11-25 16:47

Obsah 1 Neline´ arn´ı rovnice

1

1.1

Formulace u ´lohy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1

1.2

Existence a jednoznaˇcnost . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2

1.3

Podm´ınˇenost ˇreˇsen´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4

1.4

Iteraˇcn´ı metody a jejich konvergence . . . . . . . . . . . . . . . . . . . . . . . . .

5

2 Iteraˇ cn´ı metody

7

2.1

Metoda p˚ ulen´ı intervalu neboli bisekce . . . . . . . . . . . . . . . . . . . . . . . .

7

2.2

Metoda postupn´ ych aproximac´ı . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

2.3

Newtonova metoda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.4

Metoda seˇcen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3 Dodatky

16

3.1

Bezpeˇcné metody . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3.2

Numerick´ y v´ ypoˇcet koˇren˚ u polynomu . . . . . . . . . . . . . . . . . . . . . . . . . 16

3.3

Numerické ˇreˇsen´ı soustav nelineárn´ıch rovnic . . . . . . . . . . . . . . . . . . . . 17

1 1.1

ˇ sen´ı neline´ Reˇ arn´ıch rovnic Formulace u ´ lohy

Pro detailnˇejˇs´ı obezn´ amen´ı s pojmy, uvádˇen´ ymi n´ıˇze, doporuˇcuji i zde konzultovat knihu Michaela T. Heathe [3], pˇr´ıpadnˇe nˇejakou z ˇcesk´ ych uˇcebnic ˇci mnoha skript o numerické matematice, která v posledn´ıch letech vyˇsla – napˇr´ıklad [1], [2] (ˇcásti tohoto skripta jsou dostupné i on-line).

1

Mnohé ze zde pouˇzit´ ych obr´ azk˚ u jsme pˇrevzali právˇe z [3]. Budeme se zde zab´ yvat pˇredevˇs´ım numerick´ ymi metodami pro (pˇribliˇzné) ˇreˇsen´ı neline´ arn´ı rovnice f (x) = 0, (1) ˇ sit line´ kde f : R → R je re´ aln´ a neline´ arn´ı funkce jedné reálné promˇenné. Reˇ arn´ı rovnice tvaru ax + b = c, tj. ax + b − c = 0, jsme se nauˇcili jiˇz na stˇredn´ı ˇskole. Seznámili jsme se tam i s ˇreˇsen´ım nˇekter´ ych neline´ arn´ıch rovnic, napˇr´ıklad kvadratické rovnice ax2 + bx + c = 0 nebo rovnice sin x = 0. K ˇreˇsen´ı vˇetˇsiny nelineárn´ıch rovnic vˇsak potˇrebujeme pouˇz´ıt nˇekterou vhodnou numerickou metodu. ˇ sen´ım nebo koˇ Reˇ renem uvedené rovnice nebo také nulov´ ym bodem funkce f naz´ yváme takové reálné ˇc´ıslo x∗ , pro které plat´ı f (x∗ ) = 0. Nelineárn´ı rovnice mohou m´ıt právˇe jedno ˇreˇsen´ı (rovnice x − sin x = 0), v´ıce ˇreˇsen´ı (rovnice x2 − 1 = 0), nebo nemus´ı m´ıt ˇzádné ˇreˇsen´ı (rovnice sin x = 2). Budeme se také zab´ yvat speci´ aln´ım rovnicemi tvaru x = g(x),

(2)

ˇ sen´ı takové rovnice se naz´ kde opˇet g : R → R a tedy f (x) = x − g(x). Reˇ yvá také pevn´ ym bodem funkce g. Speciáln´ı situace nast´ av´ a také, je-li uvaˇzovaná funkce f polynom. Hledáme pak totiˇz ˇcasto i jeho komplexn´ı koˇreny. Pro polynomy existuj´ı tedy i speciáln´ı numerické metody, jimiˇz se zde vˇsak nem˚ uˇzeme extra zab´ yvat. V praxi se setkáme i se soustavami nelineárn´ıch rovnic, jejichˇz ˇreˇsen´ım pak nen´ı ˇc´ıslo, ale vektor hodnot. Existuj´ı numerické metody i pro ˇreˇsen´ı takov´ ych soustav, z ˇcasov´ ych d˚ uvod˚ u se jimi ale zde také zab´ yvat nebudeme. Pˇr´ıpadné zájemce odkazujeme na Heathovu knihu [3] nebo na M´ıkovu uˇcebnici [1] ˇci skripta [2].

1.2

Existence a jednoznaˇ cnost

Existence a jednoznaˇcnost ˇreˇsen´ı nelineárn´ıch rovnic je podstatnˇe komplikovanˇejˇs´ı záleˇzitost neˇz je tomu u line´ arn´ıch rovnic a jejich soustav. V mnoha pˇr´ıpadech je obt´ıˇzné stanovit existenci nebo poˇcet ˇreˇsen´ı neline´ arn´ı rovnice. Zat´ımco u soustav lineárn´ıch rovnic mus´ı b´ yt poˇcet ˇreˇsen´ı roven nule, jedné nebo b´ yt nekoneˇcn´ y, nelineárn´ı rovnice mohou m´ıt jak´ ykoli poˇcet ˇreˇsen´ı, a to dokonce i pro jedinou rovnici. Pˇr´ıklad 1 (Existence koˇren˚ u). Uvaˇzujeme-li koˇreny následuj´ıc´ıch rovnic na celém R, pak rovnice • ex + 1 = 0 nem´ a ˇz´ adné ˇreˇsen´ı • e−x − x = 0 m´ a pr´ avˇe jedno ˇreˇsen´ı • x2 − 4 sin x = 0 m´ a dvˇe ˇreˇsen´ı • x3 + 6x2 + 11x − 6 = 0 m´ a tˇri ˇreˇsen´ı • sin x = 0 m´ a nekoneˇcnˇe mnoho ˇreˇsen´ı Jakkoli je tedy obt´ıˇzné z´ıskat jak´ akoli globáln´ı tvrzen´ı o poˇctu ˇreˇsen´ı nelineárn´ı rovnice, máme pˇresto k dispozici nˇekter´ a uˇziteˇcn´ a lokáln´ı kritéria zaruˇcuj´ıc´ı existenci aspoˇ n jednoho koˇrene rovnice na daném intervalu. Jedno takové praktické kritérium je zaloˇzeno na matematické vˇetˇe, která pocház´ı od B. Bolzana a ˇr´ık´ a: 2

y

x2

x1 a

b x

f(x)

Obr´ azek 1: Pˇr´ıklad neline´ arn´ı funkce s koˇreny x1 a x2 na intervalu [a, b]. Tento interval je pro danou funkci f (x) uz´ avˇerou koˇrene.

Vˇ eta 2 (Bolzanova vˇeta). Necht’ funkce f je spojit´ a na uzavˇreném omezeném intervalu [a, b] a necht’ plat´ı f (a)·f (b) < 0 (tj. f (a) a f (b) maj´ı opaˇcn´ a znaménka). Pak funkce f m´ a na intervalu (a, b) alespoˇ n jeden nulový bod. Takov´ y interval [a, b], v jehoˇz koncov´ ych bodech má funkce f opaˇcná znaménka, budeme naz´ yvat uz´ avˇ erou ˇreˇsen´ı neline´ arn´ı rovnice f (x) = 0. Jak uvid´ıme pozdˇeji, v ˇradˇe numerick´ ych metod pro ˇreˇsen´ı neline´ arn´ıch rovnic hraje d˚ uleˇzitou roli právˇe postupné zuˇzován´ı takové pˇredem nalezené uzávˇery. Jak ovˇsem poˇc´ ateˇcn´ı uzávˇeru naj´ıt, je v´ıceménˇe záleˇzitost´ı pokus˚ u a omyl˚ u. Jedna z moˇznost´ı je odhadnout nˇejak poˇcáteˇcn´ı interval, na nˇemˇz budeme chován´ı funkce f zkoumat (i kdyˇz to jeˇstˇe nebude uz´ avˇera koˇrene), a pak procházet t´ımto intervalem po nˇejak´ ych vhodnˇe volen´ ych kroc´ıch, postupnˇe poˇc´ıtat hodnoty f (x) a sledovat, kdy v nich dojde ke zmˇenˇe znaménka. Poznamenejme jeˇstˇe, ˇze pr´ avˇe zm´ınˇené kritérium udává pouze postaˇcuj´ıc´ı, nikoli nutnou podm´ınku existence koˇrene. Nemˇelo by n´ as tedy od hledán´ı koˇrene pˇredem odrazovat to, ˇze jsme nenaˇsli jeho uzávˇeru. V ˇradˇe pˇr´ıpad˚ u totiˇz ani pro dan´ y koˇren uzávˇera neexistuje. Jako pˇr´ıklad staˇc´ı vz´ıt triviáln´ı rovnici x2 = 0 s jedin´ ym koˇrenem x = 0. Zde pro vˇsechna x máme x2 ≥ 0 a ke zmˇenˇe znaménka tedy nem˚ uˇze doj´ıt. Obrat’me svoji pozornost nyn´ı k rovnici (2). Zde lze k d˚ ukazu existence pevného bodu na daném intervalu vyuˇz´ıt opˇet klasické matematiky, konkrétnˇe tzv. vˇety o kontrakci. ˇ Definice 3 (Kontrakce). Rekneme, ˇze funkce g : R → R je na mnoˇzinˇe S ⊆ R kontrakce, pokud existuje konstanta L ∈ R, 0 < L < 1 taková, ˇze pro vˇsechna x, y ∈ S plat´ı |g(x) − g(y)| ≤ L|x − y|. Vˇ eta 4 (O existenci pevného bodu). Jestliˇze je funkce g kontrakce na uzavˇrené mnoˇzinˇe S ⊆ R a g(S) ⊆ S, pak m´ a g v S pevný bod, a to pr´ avˇe jeden. Pokud ˇctenáˇri vad´ı, ˇze jsme v´ yˇse uvedenou definici a vˇetu formulovali pro obecnou mnoˇzinu S, m˚ uˇze si pod S pˇredstavovat nˇejak´ y interval. Z uvedené vˇety ihned plyne, ˇze pokud v rovnici (1) m˚ uˇzeme ps´ at f (x) = x − g(x), kde g je kontrakce na nˇejaké uzavˇrené mnoˇzinˇe S taková, ˇze zobrazuje S do sebe samé, m´ a rovnice f (x) = 0 na mnoˇzinˇe S právˇe jedno ˇreˇsen´ı, totiˇz pevn´ y 3

bod funkce g. Brzy uvid´ıme, ˇze tato skuteˇcnost nám dává moˇznost odvodit nˇekteré numerické metody pro ˇreˇsen´ı neline´ arn´ıch rovnic. Poznamenejme jeˇstˇe, ˇze pokud pro vˇsechna x ∈ S existuje derivace funkce g a plat´ı |g 0 (x)| < 1, d´ a se ukázat, ˇze g na S je kontrakce. Z matematického ˇci logického hlediska jsou naˇse u ´vahy o uzávˇeˇre spojité funkce ˇci pˇredpoklady vˇety o kontrakci pouze postaˇcuj´ıc´ı podm´ınky, nikoli vˇsak podm´ınky nutné. Nen´ı tedy nikde psáno, ˇze funkce f nem˚ uˇze m´ıt nulov´ y bod v intervalu, kter´ y nen´ı uzávˇerou, nebo ˇze funkce g, která nen´ı kontrakce, nem˚ uˇze m´ıt pevn´ y bod. V praxi tedy m˚ uˇze b´ yt uˇziteˇcné vyuˇz´ıt soudob´ ych moˇznost´ı naˇseho softwarového vybaven´ı a pˇri ˇreˇsen´ı nelineárn´ıch rovnic si nejprve nechat vykreslit graf funkce f pro rovnici (1) nebo grafy y = x a y = g(x) pro rovnici (2). • funkce f (x) = x2 má nulov´ y bod x = 0 na

Pˇr´ıklad 5 (Nesplnˇené postaˇcuj´ıc´ı podm´ınky). intervalu [−1, 1], kter´ y nen´ı uz´ avˇera

• funkce g(x) = sin x m´ a pevn´ y bod x = 0, ale v okol´ı tohoto bodu to nen´ı kontrakce Doposud jsme se soustˇredili pˇrev´ aˇznˇe na existenci koˇren˚ u nelineárn´ıch rovnic a ne na jejich jednoznaˇcnost, protoˇze se obecnˇe m´ a za to, ˇze nelineárn´ı rovnice mohou m´ıt v´ıce neˇz jedno ˇreˇsen´ı, pˇrinejmenˇs´ım glob´ alnˇe. Jednoznaˇcnost koˇrene nás pˇresto m˚ uˇze zaj´ımat, alespoˇ n lokálnˇe, napˇr´ıklad na daném intervalu. Pˇripomeˇ nme si, ˇze z lineárn´ı algebry v´ıme, ˇze soustava lineárn´ıch rovnic s regul´ arn´ı matic´ı m´ a vˇzdy pr´ avˇe jedno ˇreˇsen´ı. Pro nelineárn´ı funkce f plat´ı podobné tvrzen´ı o regularitˇe, pˇrinejmenˇs´ım lok´ alnˇe. Pokud totiˇz funkce f má v daném bodˇe x∗ nenulovou derivaci, pak existuje otevˇren´ y interval kolem tohoto bodu, v nˇemˇz je funkce f ostˇre monotónn´ı, tedy rostouc´ı nebo klesaj´ıc´ı. V takové situaci v okol´ı bodu x∗ tedy m˚ uˇze existovat nejv´ yˇse jeden koˇren. Pokud vˇsak v nˇejakém koˇrenu x∗ m´ a funkce f nulovou derivaci, má tento koˇren jisté zvláˇstn´ı vlastnosti, které ovlivˇ nuj´ı jak podm´ınˇenost ˇreˇsené u ´lohy, tak také chován´ı pouˇzité numerické metody. Nulov´ y bod x∗ funkce f , pro kter´ y plat´ı zároveˇ n f (x∗ ) = 0 a f 0 (x∗ ) = 0 se naz´ yv´ a n´ asobný koˇren rovnice f (x) = 0. Geometricky to znamená, ˇze graf funkce f má v tomto bodˇe vodorovnou teˇcnu spl´ yvaj´ıc´ı s osou x. Koˇreny, které nejsou násobné, se naz´ yvaj´ı jednoduché. Koˇren x1 z Obr´ azku1 je tedy jednoduch´ y, koˇren x2 je násobn´ y. Pojem násobnosti lze pro hladké funkce f dále upˇresnit. Pokud plat´ı f (x∗ ) = f 0 (x∗ ) = f 00 (x∗ ) = · · · = f (m−1) (x∗ ) = 0, ale f (m) 6= 0, ˇrekneme, ˇze n´ asobnost koˇrene x∗ je m. Pˇr´ıklad 6 (Pevné body). Ovˇeˇrte si n´ asleduj´ıc´ı tvrzen´ı: • funkce g(x) = sin x m´ a jedin´ y pevn´ y bod x = 0 • funkce g(x) = x2 m´ a pevné body x = 0 a x = 1 • koˇren x = 0 rovnice sin x = 0 je jednoduch´ y • koˇren x = 0 rovnice x2 = 0 je dvojnásobn´ y • koˇren x = 1 rovnice x3 − 3x2 + 3x − 1 = 0 je trojnásobn´ y

1.3

Podm´ınˇ enost ˇ reˇ sen´ı

Abychom mohli kvantitativnˇe mˇeˇrit citlivost ˇreˇsen´ı nelineárn´ıch rovnic na data (funkˇcn´ı hodnoty), mus´ıme pracovat s absolutn´ım ˇc´ıslem podm´ınˇenosti, coˇz je obdoba jiˇz zavedeného ˇc´ısla podm´ınˇenosti z minulé pˇredn´ aˇsky, kde ale m´ısto relativn´ıch zmˇen v ˇcitateli i jmenovateli vystupuj´ı absolutn´ı odchylky. Je to d´ ano t´ım, ˇze hodnota funkce f v koˇrenu rovnice je rovna nule. 4

Obr´ azek 2: Podm´ınˇenost koˇren˚ u neline´ arn´ı rovnice f (x) = 0. Vlevo: dobˇre podm´ınˇená u ´loha, vpravo: ˇspatnˇe podm´ınˇen´ au ´loha.

Dá se ukázat, ˇze pokud m´ a funkce f v okol´ı koˇrene x∗ derivaci, je pak toto ˇc´ıslo podm´ınˇenosti pˇribliˇznˇe 1 Cp,abs ≈ 0 ∗ . |f (x )| Pokud je ve jmenovateli f 0 (x∗ ) = 0 (násobn´ y koˇren), klademe Cp,abs = ∞. Z definice ˇc´ısla podm´ınˇenosti pak vypl´ yv´ a, ˇze pokud najdeme bod x ˜ takov´ y, ˇze |f (˜ x)| < , m˚ uˇze odchylka |˜ x − x∗ | tohoto bodu od koˇrene rovnice f (x) = 0 m´ıt velikost /|f 0 (x∗ )|. Pro malé hodnoty |f 0 (x∗ )| tedy m˚ uˇze b´ yt tato odchylka od koˇrene velká, i kdyˇz funkˇcn´ı hodnota sama je malá. ˇ arkované kˇrivky vyznaˇcuj´ı oblast nejistoty kolem kaˇzdé plnˇe Celou situaci ilustruje Obr´ azek 2. C´ nakreslené kˇrivky, takˇze nulov´ y bod dané funkce m˚ uˇze b´ yt kdekoli mezi body, v nichˇz ˇcárkované kˇrivky prot´ınaj´ı vodorovnou osu. Mal´ y interval nejistoty pro nulov´ y bod na levém obrázku je dán t´ım, ˇze dan´ a kˇrivka strmˇe roste (takˇze pˇrevrácená hodnota derivace je malá), kdeˇzto velk´ y interval nejistoty pro nulov´ y bod na pravém obrázku plyne z pomalého r˚ ustu (a tedy velké pˇrevrácené hodnoty derivace). Vˇsimnˇete si také toho, ˇze ˇs´ıˇre pásu nejistot kolem funkˇcn´ıch hodnot je na obou obr´ azc´ıch stejn´ a. Máme-li násobn´ y koˇren x∗ , je f 0 (x∗ ) = 0, takˇze ˇc´ıslo podm´ınˇenosti násobného koˇrene je nekoneˇcné. To d´ av´ a smysl, protoˇze nepatrná zmˇena v f m˚ uˇze zp˚ usobit, ˇze z násobného koˇrene se stane v´ıce neˇz jeden koˇren nebo naopak násobn´ y koˇren zmiz´ı. Staˇc´ı si k tomu nakreslit napˇr´ıklad funkci f (x) = x2 a posunout ji o malé nahoru nebo dol˚ u. pˇr´ıklad,obr´ azek Podm´ınˇenost neline´ arn´ı rovnice ovlivˇ nuje náˇs pohled na pˇribliˇzné ˇreˇsen´ı x ˜: máme usilovat o to, aby |f (˜ x)| byla mal´ a, nebo sp´ıˇse o to, aby bylo malé |˜ x − x∗ |, jakkoli pˇresné ˇreˇsen´ı x∗ pˇredem nezn´ ame? Jak uˇz to u numerick´ ych metod b´ yvá, obˇe uvedené veliˇciny nejsou nutnˇe malé souˇcasnˇe, z´ avis´ı to jeˇstˇe na podm´ınˇenosti. Tato skuteˇcnost ovlivˇ nuje volbu algoritm˚ u numerick´ ych metod, o nichˇz budeme hovoˇrit ve zbytku této pˇrednáˇsky. V kaˇzdém pˇr´ıpadˇe je uˇziteˇcné z´ıskat pˇredem nˇejakou informaci o podm´ınˇenosti ˇreˇsené u ´lohy.

1.4

Iteraˇ cn´ı metody a jejich konvergence

Numerické metody pro ˇreˇsen´ı neline´ arn´ıch rovnic jsou vesmˇes metody iteraˇcn´ı. Iterace (z lat. iterare, opakovat) znamen´ a postupné opakován´ı urˇcitého postupu, bˇehem kterého se postupnˇe generuje posloupnost hodnot x0 , x1 , . . . , xk , . . . taková, ˇze v naˇsem pˇr´ıpadˇe (hledáme koˇren x∗ nelineárn´ı rovnice) postupnˇe z´ısk´ avané hodnoty konverguj´ı k hledanému ˇreˇsen´ı, xk → x∗ pro k → ∞. Pˇri skuteˇcném v´ ypoˇctu samozˇrejmˇe nem˚ uˇzeme j´ıt s k do nekoneˇcna a iteraˇcn´ı postup zastav´ıme po urˇcitém dostateˇcnˇe velkém poˇctu krok˚ u pomoc´ı vhodnˇe zvoleného zastavovac´ıho

5

kritéria. Z´ısk´ ame tak pˇribliˇznou hodnotu hledaného koˇrene. Term´ın iterace se v numerické matematice pouˇz´ıv´ a nejen k oznaˇcen´ı v´ yˇse uvedeného postupu jako celku, ale naz´ yvá se tak také kaˇzd´ y jeho krok a naz´ yvaj´ı se tak také postupnˇe poˇc´ıtané hodnoty xk , tedy aproximace hledaného koˇrene. Abychom mohli porovn´ avat efektivitu iteraˇcn´ıch metod, potˇrebujeme nˇejak charakterizovat jejich rychlost konvergence, tj. rychlost konvergence posloupnosti iterac´ı xk k hledanému koˇrenu rovnice. Chyba(nepˇresnost) k-té iterace, kterou budeme oznaˇcovat ek , se obvykle definuje jako ek = xk − x∗ , kde xk je aproximace (pˇribl´ıˇzen´ı) hledaného ˇreˇsen´ı z´ıskaná v iteraci k a x∗ je skuteˇcné (pˇresné) ˇreˇsen´ı. Nˇekteré z pouˇz´ıvan´ ych metod neprodukuj´ı pˇr´ımo konkrétn´ı pˇribliˇzné ˇreˇsen´ı xk , ale pouze interval, kter´ y s urˇcitost´ı obsahuje pˇresné ˇreˇsen´ı, pˇriˇcemˇz délka tohoto intervalu se bˇehem iteraˇcn´ıho procesu postupnˇe zmenˇsuje. U takové metody pak ek definujeme jako délku tohoto intervalu po k-té iteraci. V obou pˇr´ıpadech pak ˇrekneme, ˇze daná iteraˇcn´ı metoda konverguje s rychlost´ı r (také: metoda je ˇrádu r), jestliˇze pro nˇejakou koneˇcnou kladnou konstantu C > 0 plat´ı |ek+1 | lim = C. k→∞ |ek |r Speciálnˇe se rozliˇsuj´ı n´ asleduj´ıc´ı pˇr´ıpady: • pokud r = 1 a C < 1, je konvergence line´ arn´ı, • pokud r > 1, je konvergence superline´ arn´ı, • pokud r = 2, je konvergence kvadratick´ a, • pokud r = 3, je konvergence kubick´ a, atd. Jeden z d˚ uvod˚ u, proˇc rozliˇsujeme mezi lineárn´ı a superlineárn´ı konvergenc´ı, je ten, ˇze, asymptoticky pro velk´ a k, line´ arnˇe konvergentn´ı posloupnost z´ıskává po kaˇzdé iteraci jist´ y stále stejn´ y poˇcet pˇresn´ ych ˇc´ıslic, kdeˇzto superlineárnˇe konverguj´ıc´ı posloupnost v jednotliv´ ych iterac´ıch z´ıskává poˇcet pˇresn´ ych ˇc´ıslic, kter´ y st´ ale roste. Pˇresnˇeji m˚ uˇzeme ˇr´ıci, ˇze lineárnˇe konvergentn´ı posloupnost z´ısk´ av´ a v kaˇzdé iteraci − log(C) pˇresn´ ych ˇc´ıslic, kdeˇzto superlineárnˇe konverguj´ıc´ı posloupnost m´ a po kaˇzdé iteraci r-kr´ at v´ıce pˇresn´ ych ˇc´ıslic neˇz mˇela pˇred touto iterac´ı. Speciálnˇe pak plat´ı, ˇze u kvadraticky konvergentn´ı metody se poˇcet pˇresn´ ych ˇc´ıslic po kaˇzdé iteraci zdvojnásob´ı (pro dostateˇcnˇe velk´ a k). Pˇr´ıklad 7 (Rychlosti konvergence). Jestliˇze ˇcleny následuj´ıc´ıch posloupnost´ı pˇredstavuj´ı velikosti chyb postupnˇe generovan´ ych iteraˇcn´ıch aproximac´ı, jsou rychlosti konvergence takové, jak je u jednotliv´ ych posloupnost´ı uvedeno. • 10−2 , 10−3 , 10−4 , 10−5 , . . .

line´ arn´ı, C = 10−1

• 10−2 , 10−4 , 10−6 , 10−8 , . . .

line´ arn´ı, C = 10−2

• 10−2 , 10−3 , 10−5 , 10−8 , . . .

superlineárn´ı, ale ne kvadratická

• 10−2 , 10−4 , 10−8 , 10−16 , . . .

kvadratická

V teorii numerick´ ych metod se dokazuj´ı vˇety o konvergenci, které nám umoˇzn ˇuj´ı ˇr´ıci, kdy pro danou rovnici ta ˇci ona metoda konverguje a jak rychle. Nedávaj´ı nám ale explicitnˇe pokyny pro to, kdy m´ ame iteraˇcn´ı proces zastavit a prohlásit v´ ysledné pˇribliˇzné ˇreˇsen´ı za dostateˇcnˇe ” pˇresné“. Navrhnout vhodné zastavovac´ı kritérium je pomˇernˇe sloˇzitá záleˇzitost, a to z ˇrady 6

d˚ uvod˚ u. D´ıky teorii m˚ uˇzeme v z´ asadˇe vˇedˇet, ˇze se chyba |ek | postupnˇe zmenˇsuje, ale protoˇze neznáme pˇresné ˇreˇsen´ı, nen´ı tu moˇznost pˇr´ımo zjistit, jak veliké |ek | je. Rozumnou náhraˇzkou tu m˚ uˇze slouˇzit relativn´ı zmˇena v postupn´ ych iterac´ıch, tedy |xk+1 − xk | . |xk | Pokud se tato veliˇcina stane dostateˇcnˇe malou, znamená to, ˇze se pˇribliˇzné hodnoty ˇreˇsen´ı uˇz pˇrestaly v´ yznamnˇe mˇenit a nem´ a tedy cenu pokraˇcovat. Na druhé stranˇe bychom chtˇeli m´ıt jistotu, ˇze jsme skuteˇcnˇe z´ıskali dobré pˇribliˇzné ˇreˇsen´ı a ˇze tedy aspoˇ n je hodnota f (xk ) pˇrimˇeˇrenˇe malá. Jak uˇz jsme si ale mohli povˇsimnout, obˇe dvˇe tyto uvedené veliˇciny nemus´ı b´ yt malé souˇcasnˇe, roli tu hraje podm´ınˇenost u ´lohy. Dále se zde projevuje také pˇr´ıpadná zmˇena mˇeˇr´ıtka u promˇenné x a funkce f . Ze vˇsech tˇechto d˚ uvod˚ u je vytvoˇren´ı zcela spolehlivého zastavovac´ıho kritéria velmi obt´ıˇzné a mus´ıme se také spoléhat na dalˇs´ı informace, které o ˇreˇsené u ´loze v´ıme. U iteraˇcn´ıch metod, které budeme vzápˇet´ı v této pˇrednáˇsce popisovat, proto zpravidla vynecháváme jak´ ykoli test na konvergenci a m´ısto toho pouze naznaˇcujeme jist´ y neurˇcen´ y poˇcet iterac´ı s t´ım, ˇze iteraˇcn´ı proces je tˇreba ukonˇcit poté, co se vyhov´ı urˇcitému vhodnému kritériu, jehoˇz volba je (bohuˇzel) na uˇzivateli.

2

Numerick´ e metody ˇ reˇ sen´ı neline´ arn´ıch rovnic

Budeme se zab´ yvat numerick´ ym (pˇribliˇzn´ ym) ˇreˇsen´ım nelineárn´ı rovnice (1): pro danou spojitou ∗ funkci f : R → R hled´ ame bod x ∈ R takov´ y, ˇze f (x∗ ) = 0.

2.1

Metoda p˚ ulen´ı intervalu neboli bisekce

V poˇc´ıtaˇcové aritmetice s koneˇcnou pˇresnost´ı nemus´ı existovat strojové ˇc´ıslo x∗ takové, ˇze f (x∗ ) je pˇresnˇe nula. Alternativn´ı moˇznost je hledat nˇejak´ y velmi mal´ y interval [a, b], ve kterém f mˇen´ı znaménko. Jak jsme jiˇz uvedli v odstavci 1.2, taková uz´ avˇera zaruˇcuje, ˇze pˇr´ısluˇsná spojitá funkce mus´ı nˇekde uvnitˇr tohoto intervalu m´ıt nulov´ y bod. Metoda p˚ ulen´ı intervalu neboli metoda bisekce zaˇc´ın´ a od nˇejaké poˇc´ ateˇcn´ı uzávˇery a postupnˇe sniˇzuje jej´ı velikost do té doby, aˇz je ˇreˇsen´ı uzavˇreno s poˇzadovanou pˇresnost´ı (resp. tak, jak to aritmetika poˇc´ıtaˇce dovol´ı). V kaˇzdé iteraci se nejprve stanov´ı stˇred aktu´ aln´ıho intervalu a pro dalˇs´ı iteraci se ponechá pouze jedna z polovin intervalu podle toho, jaké znaménko má funkˇcn´ı hodnota ve stˇredu. Tato polovina pak tvoˇr´ı opˇet (jiˇz kratˇs´ı) uz´ avˇer, s n´ımˇz vstupujeme do dalˇs´ı iterace. Metodu bisekce formálnˇe m˚ uˇzeme zapsat jako Algoritmus 1, v nˇemˇz jako vstupn´ı data figuruje funkce f , uzávˇera [a, b] a chybová tolerance ∆tol pro délku v´ ysledného intervalu obsahuj´ıc´ıho koˇren. Uvedeme jeˇstˇe p´ ar pozn´ amek k implementaci metody bisekce ve v´ yˇse uvedeném algoritmu: Pˇredevˇs´ım, zd´ a se, ˇze nejpˇrirozenˇejˇs´ı vzorec pro v´ ypoˇcet stˇredu intervalu [a, b] by byl m = (a+b)/2. Jenˇze v poˇc´ıtaˇcové aritmetice nen´ı v extrémn´ıch pˇr´ıpadech zaruˇceno, ˇze takto poˇc´ıtan´ y bod m v˚ ubec padne do intervalu [a, b]. Komu se to zdá divné, m˚ uˇze si v aritmetice se dvˇema des´ıtkov´ ymi ˇc´ıslicemi zkusit podle tohoto vzorce spoˇc´ıtat stˇred intervalu [0.67, 0.69] (vyjde m = 0.7). Kromˇe toho m˚ uˇze u tohoto vzorce meziv´ ysledek a + b pˇrekroˇcit rozsah poˇc´ıtaˇce i v situac´ıch, kdy stˇred intervalu v rozsahu poˇc´ıtaˇce leˇz´ı. Jakkoli jde o extrémn´ı pˇr´ıpady, je na tomto jednoduchém pˇr´ıkladu vidˇet, ˇze poˇc´ıtaˇcová implementace algoritm˚ u nen´ı jen pouhé pˇrepisován´ı vzoreˇck˚ u v nˇejakém vhodném programovac´ım jazyce. Vzorec pouˇzit´ y v Algoritmu 1 se uveden´ ym problém˚ um vyh´ yb´ a. 7

Algoritmus 1 Metoda p˚ ulen´ı intervalu Require: Funkce f , uz´ avˇera [a, b], chybová tolerance ∆tol Ensure: x∗ : f (x∗ ) ≈ 0 while (b − a) > ∆tol do b−a m←a+ 2 if sgn f (a) = sgn f (m) then a←m else b←m end if end while Dále, pokud jde o testov´ an´ı toho, zda dvˇe hodnoty f (x1 ) a f (x2 ) maj´ı stejné znaménko, je na poˇc´ıtaˇci lepˇs´ı pouˇz´ıvat funkci signum neˇz matematicky ekvivalentn´ı testován´ı, zda souˇcin f (x1 ) · f (x2 ) je kladn´ y nebo z´ aporn´ y. Takov´ y souˇcin m˚ uˇze totiˇz také pˇrekroˇcit rozsah poˇc´ıtaˇce smˇerem k nekoneˇcnu a v okol´ı koˇrene smˇerem k nule. Poznamenejme pro poˇrádek, ˇze je sgn(x) = 1 pro x ≥ 0 a sign(x) = −1 pro x < 0. Pˇr´ıklad 8 (Metoda bisekce). Metodu p˚ ulen´ı intervalu ukáˇzeme na pˇr´ıkladu hledán´ı koˇrene rovnice f (x) = x2 − 4 sin x = 0. Jako poˇcáteˇcn´ı uz´ avˇeru vezmeme interval [a, b], kde a = 1 a b = 3. Záleˇz´ı tu pouze na tom, aby se funkˇcn´ı hodnoty v tˇechto dvou bodech liˇsily ve znaménku. Vypoˇc´ıtáme hodnotu funkce ve stˇredn´ım bodˇe intervalu, tedy v m = 2 a zjist´ıme, ˇze f (m) má opaˇcné znaménko neˇz f (a), takˇze si podrˇz´ıme levou polovinu poˇc´ ateˇcn´ıho intervalu a poloˇz´ıme pro dalˇs´ı krok b = m. Pak tento postup opakujeme tak dlouho, aˇz se interval uzávˇery z´ uˇz´ı na poˇzadovanou velikost. Následuj´ıc´ı tabulka ukazuje moˇznou posloupnost iterac´ı. a

f (a)

b

f (b)

1.000000 1.000000 1.500000 1.750000 1.875000 1.875000 1.906250 1.921875 1.929688 1.933594 1.933594 1.933594 1.933594

-2.365884 -2.365884 -1.739980 -0.873444 -0.300718 -0.300718 -0.143255 -0.062406 -0.021454 -0.000846 -0.000846 -0.000846 -0.000846

3.000000 2.000000 2.000000 2.000000 2.000000 1.937500 1.937500 1.937500 1.937500 1.937500 1.935547 1.934570 1.934082

8.435520 0.362810 0.362810 0.362810 0.362810 0.019849 0.019849 0.019849 0.019849 0.019849 0.009491 0.004320 0.001736

Interval, u kterého jsme iterace ukonˇcili, má délku menˇs´ı neˇz 0.0005 a m˚ uˇzeme tedy ˇr´ıci, ˇze nalezen´ y koˇren je s touto pˇresnost´ı roven x∗ ≈ 1.934. Na závˇer jeˇstˇe nˇekolik pozn´ amek k metodˇe p˚ ulen´ı intervalu. 8

• V metodˇe p˚ ulen´ı se nikde nevyuˇz´ıvaj´ı velikosti funkˇcn´ıch hodnot, pouze jejich znaménka. • Pokud v´ ypoˇcet zaˇcneme s uz´ avˇerou spojité funkce, pak metoda konverguje vˇzdy, ale dosti pomalu. • V kaˇzdé iteraci se délka uz´ avˇery sniˇzuje na polovinu, takˇze rychlost konvergence je line´ arn´ı, s r = 1 a C = 0.5. • V kaˇzdé iteraci bisekce z´ısk´ av´ ame jednu dalˇs´ı pˇresnou dvojkovou ˇc´ıslici v pˇribliˇzném ˇreˇsen´ı. • Pro dan´ y poˇc´ ateˇcn´ı interval [a, b] je délka intervalu po k iterac´ıch rovna (b − a)/2k , takˇze k dosaˇzen´ı chybové tolerance tol je zapotˇreb´ı zhruba

log2

b−a tol

iterac´ı, nez´ avisle na vlastnostech pouˇzité funkce f .

2.2

Metoda postupn´ ych aproximac´ı

Metoda postupných aproximac´ı nebo také metoda prosté iterace slouˇz´ı k hledán´ı pevn´ ych bod˚ u funkce g z rovnice (2). Pˇripomeˇ nme tedy, ˇze pro funkci g : R → R se pevným bodem naz´ yv´ a takové ˇc´ıslo x∗ (pokud existuje), pro které plat´ı x∗ = g(x∗ ). D˚ uvodem tohoto n´ azvu je skuteˇcnost, ˇze x∗ se po aplikaci funkce g nezmˇen´ı. Zat´ımco u nelineárn´ı rovnice f (x) = 0 hled´ ame bod, v nˇemˇz graf funkce f prot´ıná osu x (tedy pˇr´ımku y = 0), pˇri hledán´ı pevného bodu funkce g chceme naj´ıt bod, v nˇemˇz graf funkce g protne diagonáln´ı pˇr´ımku ´ y = x. Ulohy na hled´ an´ı pevného bodu dost ˇcasto pocházej´ı pˇr´ımo z praxe, ale pro nás zde maj´ı v´ yznam také z toho d˚ uvodu, ˇze ˇreˇsen´ı nelineárn´ı rovnice (1) lze zpravidla pˇrevést na hledán´ı pevného bodu odpov´ıdaj´ıc´ı neline´ arn´ı funkce g, tedy na ˇreˇsen´ı rovnice (2). Metoda postupn´ ych aproximac´ı (prosté iterace) pro ˇreˇsen´ı této rovnice je zaloˇzena na opakovaném (iteraˇcn´ım) pouˇzit´ı vzorce xk+1 = g(xk ) s vhodnˇe zvolen´ ym poˇc´ ateˇcn´ım pˇribl´ıˇzen´ım (poˇcáteˇcn´ı aproximac´ı) x0 . Chceme-li ˇreˇsit rovnici f (x) = 0 metodou postupn´ ych aproximac´ı, pak ji nejprve mus´ıme pˇrevést na u ´lohu o pevném bodu pro nˇejakou vhodnˇe vybranou funkci g. Takov´ ych moˇznost´ı b´ yv´ a pro danou f v´ıce, ale ne vˇsechny jsou stejnˇe vhodné pro z´ıskán´ı iteraˇcn´ıho schématu k ˇreˇsen´ı v´ ychoz´ı rovnice. V´ ysledn´ a iteraˇcn´ı metoda se pro r˚ uzné volby g m˚ uˇze liˇsit nejen co do rychlosti konvergence, ale také v tom, zda v˚ ubec konverguje ˇci nikoli. ´ Pˇr´ıklad 9 (Ulohy na pevn´ y bod). Nelineárn´ı rovnice f (x) = x2 − x − 2 = 0 má koˇreny x∗ = 2 a x∗ = −1. Mezi ekvivalentn´ı u ´lohy na hledán´ı pevného bodu patˇr´ı u ´lohy (2) s funkcemi (ovˇeˇrte si to) 1. g(x) = x2 − 2, √ 2. g(x) = x + 2 (ekvivalence pouze pro nezáporné pevné body, srv. (2)), 9

Obr´ azek 3: Pevn´ y bod (2, 2) nelineárn´ıch funkc´ı.

Obr´ azek 4: Metoda postupn´ ych aproximac´ı pro prvn´ı a druhou funkci g.

3. g(x) = 1 + (2/x), 4. g(x) = (x2 + 2)/(2x − 1). Na obr. 3 je vykreslen pr˚ ubˇeh kaˇzdé z tˇechto funkc´ı spolu s pˇr´ımkou y = x. Vˇsimnˇeme si, ˇze funkce g jsou konstruov´ any tak, ˇze jejich grafy vesmˇes prot´ınaj´ı pˇr´ımku y = x v pevném bodˇe (2, 2). Pr˚ ubˇeh pˇr´ısluˇsn´ ych iteraˇcn´ıch schémat metody postupn´ ych aproximac´ı je graficky znázornˇen na ˇ Obrázc´ıch 4 a 5. Sipka ve svislém smˇeru odpov´ıdá v´ ypoˇctu hodnoty dané funkce v nˇejakém bodˇe a vodorovná ˇsipka smˇeˇruj´ıc´ı k pˇr´ımce y = x vyznaˇcuje, ˇze se v´ ysledek pˇredchoz´ıho v´ ypoˇctu hodnoty funkce g pouˇzije jeko argument pro pˇr´ıˇst´ı v´ ypoˇcet funkˇcn´ı hodnoty. U prvn´ı z uveden´ ych funkc´ı vid´ıme, ˇze i pˇres to, ˇze poˇc´ ateˇcn´ı bod je velmi bl´ızko ˇreˇsen´ı, postupné aproximace diverguj´ı. U ostatn´ıch tˇr´ı funkc´ı je vidˇet, ˇze postupné iterace konverguj´ı k pevnému bodu, i kdyˇz byly odstartovány v bodˇe, kter´ y je od ˇreˇsen´ı relativnˇe daleko. Zdá se pˇritom, ˇze rychlosti konvergence pro tyto tˇri funkce se mohou liˇsit. 10

Obr´ azek 5: Metoda postupn´ ych aproximac´ı pro tˇret´ı a ˇctvrtou funkci g.

Jak lze z graf˚ u funkc´ı na Obr´ azc´ıch 4 a 5 vidˇet, chován´ı metody prosté iterace se m˚ uˇze znaˇcnˇe odliˇsovat, od divergence pˇres pomalou konvergenci k rychlé konvergenci. Nejjednoduˇsˇs´ı (i kdyˇz ne nejobecnˇejˇs´ı) zp˚ usob, jak charakterizovat chován´ı iteraˇcn´ıho schématu xk+1 = g(xk ) pro ˇreˇsen´ı u ´lohy na pevn´ y bod tvaru x = g(x), je pokusit se vz´ıt v u ´vahu derivaci funkce g v hledaném ˇreˇsen´ı x∗ za pˇredpokladu, ˇze funkce g je hladká a tato derivace existuje. Dá se ukázat, ˇze pokud x∗ = g(x∗ ) a |g 0 (x∗ )| < 1, pak iteraˇcn´ı schéma metody postupn´ ych aproximac´ı lok´ alnˇ e ∗ konverguje. To znamen´ a, ˇze existuje nˇejak´ y interval obsahuj´ıc´ı x takov´ y, ˇze metoda prosté iterace s funkc´ı g konverguje, pokud je odstartována z nˇejakého x0 , jeˇz leˇz´ı uvnitˇr tohoto inˇ ık´ tervalu. R´ ame také, ˇze metoda konverguje pro dostateˇcnˇe bl´ızké poˇcáteˇcn´ı pˇribl´ıˇzen´ı. Naproti tomu pokud |g 0 (x∗ )| > 1, pak metoda prosté iterace diverguje pro jakékoli poˇcáteˇcn´ı pˇribl´ıˇzen´ı kromˇe x∗ . D˚ ukaz tohoto tvrzen´ı je zaloˇzen na vˇetˇe o stˇredn´ı hodnotˇe funkce, ale z ˇcasov´ ych d˚ uvod˚ u jej zde neuvád´ıme, jakkoli nen´ı sloˇzit´ y (viz [1], [2] nebo [3]). Plyne z nˇej ale také to, ˇze pokud metoda ˇ ım konverguje, je jej´ı asymptotick´ a rychlost konvergence lineárn´ı s konstantou C = |g 0 (x∗ )|. C´ menˇs´ı je tato konstanta, t´ım je konvergence rychlejˇs´ı, a ideáln´ı by tedy pro danou rovnici (1) bylo naj´ıt ekvivalentn´ı formulaci (2) s funkc´ı g, pro niˇz by platilo g 0 (x∗ ) = 0. V takovém pˇr´ıpadˇe se d´ a pomoc´ı Taylorova rozvoje opˇet pomˇernˇe snadno ukázat, ˇze konvergence je nejménˇe kvadratick´ a. V pˇr´ıˇst´ım odstavci si pop´ıˇseme jeden systematick´ y zp˚ usob takové volby funkce g pro rovnici f (x) = 0. Pˇr´ıklad 10 (Konvergence metody postupn´ ych aproximac´ı). Pro ˇctyˇri u ´lohy na pevn´ y bod z pˇredcházej´ıc´ıho pˇr´ıkladu m´ ame n´ asleduj´ıc´ı v´ ysledky: 1. g 0 (x) = 2x, takˇze g 0 (2) = 4 a metoda postupn´ ych aproximac´ı tedy diverguje. √ 2. g 0 (x) = 1/(2 x + 2), takˇze g 0 (2) = 1/4 a metoda postupn´ ych aproximac´ı konverguje linárnˇe s konstantou C = 1/4. Kladné znaménko derivace g 0 (2) vede k tomu, ˇze se iterace pˇribliˇzuj´ı k pevnému bodu z jedné strany. 3. g 0 (x) = −2/x2 , takˇze g 0 (2) = −1/2 a metoda postupn´ ych aproximac´ı konverguje lineárnˇe s konstantou C = 1/2. Z´ aporné znaménko derivace g 0 (2) vede k tomu, ˇze se iterace pˇribliˇzuj´ı k pevnému bodu po spir´ ale, stˇr´ıdavˇe vˇzdy z opaˇcné strany. 4. g 0 (x) = (2x2 − 2x − 4)/(2x − 1)2 , takˇze g 0 (2) = 0 a metoda postupn´ ych aproximac´ı konverguje kvadraticky. 11

Obr´ azek 6: Newtonova metoda pro ˇreˇsen´ı nelineárn´ı rovnice.

2.3

Newtonova metoda

Metoda bisekce nepouˇz´ıv´ a jiné vlastnosti funkˇcn´ıch hodnot neˇz jejich znaménka, coˇz vede k tomu, ˇze konverguje vˇzdy, ale pomalu. Pokud se vyuˇzij´ı také velikosti funkˇcn´ıch hodnot, m˚ uˇzeme odvodit rychleji konverguj´ıc´ı metody, které nám v kaˇzdé iteraci budou dávat pˇresnˇejˇs´ı aproximaci koˇrene ˇreˇsené rovnice. V prvn´ı ˇradˇe se zde vyuˇz´ıvá aproximace funkce f vystupuj´ıc´ı v rovnici pomoc´ı prvn´ıch dvou ˇclen˚ u jej´ıho Taylorova rozvoje, tedy f (x + h) ≈ f (x) + f 0 (x)h, coˇz je lineárn´ı funkce h, kter´ a aproximuje f v okol´ı bodu x. Nahrad´ıme tud´ıˇz nelineárn´ı funkci f touto line´ arn´ı funkc´ı, jej´ıˇz nulov´ y bod v h se snadno vypoˇc´ıtá, je to h = −f (x)/f 0 (x), pokud 0 ovˇsem f (x) 6= 0. Je jasné, ˇze koˇreny obou tˇechto funkc´ı nejsou obecnˇe identické, takˇze popsan´ y postup mus´ıme iteraˇcnˇe opakovat. To vede k iteraˇcn´ı metodˇe, které se ˇr´ıká Newtonova metoda (nebo také Newtonova-Raphsonova), jej´ıˇz algoritmus uvád´ıme jako Algoritmus 2. Algoritmus 2 Newtonova metoda x0 = poˇc´ ateˇcn´ı aproximace for k = 0, 1, 2, . . . xk+1 = xk − f (xk )/g 0 (xk ) end Ne obrázku 6 ukazujeme, ˇze Newtonova metoda se dá interpretovat jako aproximace funkce f pobl´ıˇz xk teˇcnou ke grafu funkce vedenou v bodˇe (xk , f (xk )). Jako dalˇs´ı aproximaci ˇreˇsen´ı pak bereme nulov´ y bod této line´ arn´ı teˇcné funkce a proces postupnˇe opakujeme. Nˇekdy se Newtonovˇe metodˇe proto také ˇr´ık´ a metoda teˇcen. Pˇr´ıklad 11 (Newtonova metoda). Newtonovu metodu pˇredvedeme opˇet na hledán´ı koˇrene rovnice f (x) = x2 − 4 sin x = 0. Derivace této funkce je f 0 (x) = 2x − 4 cos x, takˇze iteraˇcn´ı schéma je d´ ano vzorcem xk+1 = xk −

x2k − 4 sin xk . 2xk − 4 cos xk 12

Jako poˇcáteˇcn´ı pˇribl´ıˇzen´ı zvol´ıme x0 = 3 a postupnˇe obdrˇz´ıme posloupnost iterac´ı, která je uvedena dále. Pˇritom hk = −f (xk )/(xk ) oznaˇcuje zmˇenu xk v kaˇzdé iteraci. Iteraˇcn´ı proces m˚ uˇzeme ukonˇcit, kdyˇz bude |hk |/|xk | nebo |f (xk )|, nebo oboj´ı, menˇs´ı neˇz námi pˇredepsan´ a tolerance. k

xk

f (xk )

f 0 (xk )

hk

0 1 2 3 4

3.000000 2.153058 1.954039 1.933972 1.933754

8.435520 1.294772 0.108438 0.001152 0.000000

9.959970 6.505771 5.403795 5.288919 5.287670

-0.846942 -0.199019 -0.020067 -0.000218 0.000000

Na Newtonovu metodu se m˚ uˇzeme také d´ıvat jako na speciáln´ı zp˚ usob pˇrevodu nelineárn´ı rovnice f (x) = 0 na u ´lohu o pevném bodˇe pro jistou funkci g, tedy x = g(x), kde za funkci g vol´ıme g(x) = x − f (x)/f 0 (x). a pevn´ y bod hled´ ame metodou postupn´ ych aproximac´ı. Abychom vyˇsetˇrili konvergenci metody, potˇrebujeme tedy nejprve zn´ at derivaci funkce g, coˇz je po u ´pravˇe g 0 (x) = f (x)f 00 (x)/(f 0 (x))2 (pokud f 0 (x) 6= 0). Je-li tedy x∗ jednoduch´ y koˇren, tj. f (x∗ ) = 0 a f 0 (x∗ ) 6= 0, pak g 0 (x∗ ) = 0. Newtonova metoda m´ a tedy pro jednoduché koˇreny asymptoticky kvadratickou rychlost konvergence, tedy r = 2. Kvadratická rychlost konvergence Newtonovy metody znamená, ˇze asymptoticky (v bl´ızkosti koˇrene) se chyba metody po kaˇzdé iteraci umocn´ı na druhou. Jinak také m˚ uˇzeme ˇr´ıci, ˇze se poˇcet pˇresn´ ych (spr´ avn´ ych) ˇc´ıslic pˇribliˇzného ˇreˇsen´ı po kaˇzdé iteraci zdvojnásob´ı. Naproti tomu pro násobné koˇreny je Newtonova metoda pouze lineárnˇe (lokálnˇe) konvergentn´ı s konstantou C = 1−(1/m), kde m je n´ asobnost poˇc´ıtaného koˇrene. Opˇet ale mus´ıme zd˚ uraznit, ˇze tyto u ´vahy o konvergenci plat´ı pouze lok´ alnˇe v nˇejakém vˇetˇs´ım nebo menˇs´ım okol´ı hledaného koˇrene a ˇze Newtonova metoda, kter´ a nen´ı odstartována dostateˇcnˇe bl´ızko ke koˇreni, nemus´ı konvergovat v˚ ubec. Jednoduch´ y pˇr´ıklad je situace, kdy nˇekdy bˇehem iterac´ı bude f 0 (xk ) relativnˇe malé (graf funkce f bude m´ıt v bodˇe xk témˇeˇr vodorovnou teˇcnu) a v d˚ usledku toho bude následuj´ıc´ı iterace m´ıt tendenci leˇzet nˇekde daleko od posledn´ıho pˇribl´ıˇzen´ı. Pˇr´ıklad 12 (Newtonova metoda pro n´ asobn´ y koˇren). Následuj´ıc´ı dva pˇr´ıklady ukazuj´ı oba typy v´ yˇse popsaného chov´ an´ı Newtonovy metody. Prvn´ı z nich ukazuje kvadratickou konvergenci k jednoduchému koˇrenu, druh´ y line´ arn´ı konvergenci k násobnému koˇrenu. Násobnost koˇrene ve druhém z uveden´ ych pˇr´ıklad˚ u je 2, takˇze C = 1/2.

13

k 0 1 2 3 4 5

2.4

f (x) = x2 − 1

f (x) = x2 − 2x + 1

xk 2.0 1.25 1.025 1.0003 1.00000005 1.0

xk 2.0 1.5 1.25 1.125 1.0625 1.03125

Metoda seˇ cen

Jistou nev´ yhodou Newtonovy metody je, ˇze za jej´ı kvadratickou konvergenci plat´ıme t´ım, ˇze v kaˇzdém iteraˇcn´ım kroku mus´ıme kromˇe funkˇcn´ı hodnoty poˇc´ıtat také hodnotu derivace. V´ ypoˇcet hodnot derivace pˇritom m˚ uˇze b´ yt nepohodln´ y nebo ˇcasovˇe nároˇcn´ y, takˇze bychom mohli uvaˇzovat o tom, ˇze hodnoty derivac´ı budeme nahrazovat diferenˇcn´ımi pod´ıly vypl´ yvaj´ıc´ımi z definice derivace funkce, tedy bychom mohli pro vhodné dostateˇcnˇe malé h klást napˇr´ıklad f 0 (x) ≈

f (x + h) − f (x) . h

To by ovˇsem znamenalo poˇc´ıtat v kaˇzdé iteraci jednu funkˇcn´ı hodnotu nav´ıc, a to jen proto, abychom z´ıskali pˇribliˇznou informaci o hodnotˇe derivace. Lepˇs´ı je zaloˇzit podobnou diferenˇcn´ı aproximaci derivace na funkˇcn´ıch hodnotách, které jsme uˇz bˇehem iterac´ı stejnˇe vypoˇc´ıtali, a klást f (xk ) − f (xk−1 ) f 0 (xk ) ≈ . xk − xk−1 Tento postup vede k metodˇe seˇcen, jej´ıˇz algoritmus uvád´ıme jako Algoritmus 3. Na obrázku 7 vid´ıme, ˇze metoda seˇcen se d´ a interpretovat jako aproximován´ı funkce f pˇr´ımkou procházej´ıc´ı pˇredchoz´ımi dvˇema iteracemi, tedy seˇcnou, pˇriˇcemˇz za nové pˇribl´ıˇzen´ı bereme nulov´ y bod této lineárn´ı funkce. Na rozd´ıl od Newtonovy metody zde ovˇsem potˇrebujeme dvˇe poˇcáteˇcn´ı aproximace. Algoritmus 3 Metoda seˇcen x0 , x1 = poˇc´ ateˇcn´ı aproximace for k = 0, 1, 2, . . . xk+1 = xk − f (xk )(xk − xk−1 )/(f (xk ) − f (xk − +)) end Pˇr´ıklad 13 (Metoda seˇcen). Metodu seˇcen budeme ilustrovat opˇet na hledán´ı koˇrene rovnice f (x) = x2 − 4 sin x = 0. Za potˇrebná dvˇe poˇc´ ateˇcn´ı pˇribl´ıˇzen´ı vezmeme x0 = 1 a x1 = 3, vypoˇc´ıtáme pˇr´ısluˇsné funkˇcn´ı hodnoty a za dalˇs´ı pˇribliˇzné ˇreˇsen´ı vezmeme pr˚ useˇc´ık pˇr´ımky spojuj´ıc´ı tyto dvˇe funkˇcn´ı hodnoty s nulou. Cel´ y postup pak opakujeme, pˇriˇcemˇz pouˇzijeme toto novˇe z´ıskané pˇribl´ıˇzen´ı koˇrene a tu novˇejˇs´ı ze dvou pˇredch´ azej´ıch iterac´ı, takˇze v kaˇzdém iteraˇcn´ım kroku potˇrebujeme vypoˇc´ıtat pouze jednu novou funkˇcn´ı hodnotu. Posloupnost proveden´ ych iterac´ı je uvedena v tabulce, kde hk oznaˇcuje zmˇenu xk v pˇr´ısluˇsné iteraci. 14

Obr´ azek 7: Metoda seˇcen pro ˇreˇsen´ı nelineárn´ı rovnice.

k

xk

f (xk )

hk

0 1 2 3 4 5 6 7 8

1.000000 3.000000 1.438070 1.724805 2.029833 1.922044 1.933174 1.933757 1.933754

-2.365884 8.435520 -1.896774 -0.977706 0.534305 -0.061523 -0.003064 0.000019 0.000000

-1.561930 0.286735 0.305029 -0.107789 0.011130 0.000583 -0.000004 0.000000

Protoˇze kaˇzdé nové pˇribliˇzné ˇreˇsen´ı, které dává metoda seˇcen, závis´ı na dvou pˇredchoz´ıch iterac´ıch, je vyˇsetˇrov´ an´ı konvergence metody o nˇeco sloˇzitˇejˇs´ı a detaily jsme nuceni zde vypustit. Uvád´ıme alespoˇ n, ˇze se d´ a dok´ azat, ˇze chyby metody splˇ nuj´ı pro jistou kladnou konstantu c > 0 vztah |ek+1 | lim = c, k→∞ |ek | · |ek−1 | coˇz znamená, ˇze posloupnost iterac´ı metodou seˇcen lokálnˇe konverguje a rychlost konvergence je superlineárn´ı. Pˇresnˇeji (viz [1], [2] a [3]) se dá ukázat, ˇze asymptotická rychlost konvergence metody seˇcen je1 √ 1+ 5 ≈ 1,618. r= 2 Stejnˇe jako u Newtonovy metody je i u metody seˇcen ke konvergenci nutno iterace odstartovat dostateˇcnˇe bl´ızko koˇrene. Porovnáme-li metodu seˇcen s Newtonovou metodou, vid´ıme, ˇze metoda seˇcen má v´ yhodu v tom, ˇze v kaˇzdé iteraci potˇrebuje vypoˇc´ıtat pouze jednu novou funkˇcn´ı hodnotu. Za nev´ yhodu bychom mohli povaˇzovat to, ˇze vyˇzaduje dvˇe startovac´ı hodnoty a ˇze v˚ uˇci Newtonovˇe metodˇe konverguje pomaleji, i kdyˇz st´ ale superlineárnˇe. Menˇs´ı pracnost proveden´ı jedné iterace vyváˇz´ı u metody seˇcen zpravidla to, ˇze k dosaˇzen´ı koneˇcného v´ ysledku mus´ıme provést vˇetˇs´ı poˇcet iterac´ı. Dá se tedy ˇr´ıci, ˇze nalezen´ı pˇribliˇzné hodnoty ˇreˇsen´ı nelineárn´ı rovnice metodou seˇcen je ˇcasto ménˇe pracné neˇz pouˇzit´ı Newtonovy metody. 1

Pokud v´ am to ˇc´ıslo pˇripad´ a povˇedomé, pˇripom´ın´ am, ˇze je to hodnota zlatého ˇrezu.

15

3 3.1

Dodatky Bezpeˇ cn´ e metody

Rychle konverguj´ıc´ı metody pro numerické ˇreˇsen´ı nelineárn´ıch rovnic jako jsou napˇr´ıklad Newtonova metoda ˇci metoda seˇcen (dalˇs´ı takové metody lze naj´ıt v literatuˇre [1, 2, 3]) nejsou bezpeˇcné v tom smyslu, ˇze pokud nejsou odstartovány dostateˇcnˇe bl´ızko koˇrene, nemus´ı konvergovat. Bezpeˇcnou metodou v tomto smyslu je metoda p˚ ulen´ı intervalu, která je ale pomal´ a a tedy nákladn´ a. Jakou metodu tedy volit? ˇ sen´ım tohoto dilematu jsou hybridn´ı metody, které jsou zahrnuty ve vˇetˇsinˇe modern´ıho maReˇ tematického softwaru a které v sobˇe kombinuj´ı vlastnosti obou v´ yˇse popsan´ ych typ˚ u metod. Jejich algoritmy jsou ale ovˇsem sloˇzitˇejˇs´ı. Tyto metody mohou napˇr´ıklad pracovat s rychle konvergentn´ı metodou a pˇritom doc´ılit toho, ˇze iterace z˚ ustávaj´ı uvnitˇr poˇcáteˇcn´ı uzávˇery koˇrene. Pokud následuj´ıc´ı aproximace ˇreˇsen´ı rychl´ ym algoritmem padne mimo interval uzávˇery, vrát´ıme se a provedeme jednu iteraci bezpeˇcnou metodou, napˇr´ıklad bisekc´ı. Pak se m˚ uˇze zkusit opˇet pouˇzitá rychl´ a metoda, tentokr´ at ovˇsem uˇz na menˇs´ım intervalu a s vˇetˇs´ı nadˇej´ı na u ´spˇech. ke konci v´ ypoˇctu uˇz by mˇely iterace bˇeˇzet tou rychlou metodou. Uveden´ y postup je jen zˇr´ıdka horˇs´ı neˇz pouˇzit´ a pomal´ a metoda, zpravidla je mnohem rychlejˇs´ı. Populárn´ı implementace v´ yˇse popsaného hybridn´ıho postupu dnes pocház´ı od Brenta (v literatuˇre také tedy Brentova metoda) a kombinuje v sobˇe bezpeˇc´ı bisekce s rychlejˇs´ı konvergenc´ı tzv. inverzn´ı kvadratick´ e interpolace (v´ıce k tomu viz [3]). D´ıky tomu, ˇze se zde vyh´ ybáme Newtonovˇe metodˇe, nejsou k v´ ypoˇctu zapotˇreb´ı hodnoty derivace. Soudob´ y kvalitn´ı software mus´ı pˇri implementaci metody vz´ıt v u ´vahu také to, ˇze se jej´ı algoritmus realizuje v poˇc´ıtaˇcové aritmetice, tedy napˇr. ohl´ıdat moˇzn´ a pˇrekroˇcen´ı rozsahu poˇc´ıtaˇce nebo nepˇrimˇeˇrenˇe pˇr´ısné poˇzadavky na pˇresnost v´ ysledku. Dobrou implementaci v´ yˇse popsaného postupu pˇredstavuje napˇr´ıklad funkce fzero v Matlabu. Poznamenáv´ ame jeˇstˇe, ˇze jakousi kombinac´ı metody bisekce a metody seˇcen je metoda regula falsi (z lat., doslova pravidlo falˇse). Kaˇzd´ y jej´ı krok zaˇc´ıná t´ım, ˇze body xk a xk−+ tvoˇr´ı uzávˇeru hledaného koˇrene, ale m´ısto aby se v kaˇzdém kroku interval uzávˇery p˚ ulil, vypoˇc´ıt´ a se nejprve xk+1 pomoc´ı vzorce metody seˇcen. Pr˚ ubˇeh funkce se tedy na daném intervalu opˇet nahrad´ı seˇcnou. Pak se z takto z´ıskan´ ych tˇr´ı bod˚ u zachovaj´ı ty dva, v nichˇz má funkce f opaˇcn´ a znaménka, a postup se opakuje. Metoda regula falsi je dalˇs´ı vˇzdy konvergentn´ı metodou, mus´ıme ji ovˇsem odstartovat z uz´ avˇery koˇrene. Jej´ı konvergence je pouze lineárn´ı a m˚ uˇze, ale nemus´ı b´ yt rychlejˇs´ı neˇz metoda p˚ ulen´ı. Lze také ukázat, ˇze v nˇekter´ ych pˇr´ıpadech m˚ uˇze jeden z krajn´ıch bod˚ u uzávˇery z˚ ust´ avat bˇehem iterac´ı trvale beze zmˇeny a aˇckoli druh´ y bod konverguje ke koˇrenu rovnice, uzávˇera se nem˚ uˇze zmenˇsit pod jistou mez.

3.2

Numerick´ y v´ ypoˇ cet koˇ ren˚ u polynomu

Aˇz dosud jsme se zab´ yvali metodami pro nalezen´ı jednoho nulového bodu obecné reálné funkce jedné reálné promˇenné. Pokud je uvaˇzovaná funkce polynom p(x) stupnˇe n, pak potˇrebujeme ˇcasto naj´ıt vˇsechny jeho nulové body, z nichˇz nˇekteré mohou b´ yt komplexn´ı, i kdyˇz polynom sám má reálné koeficienty. O koˇrenech polynom˚ u nám algebraická teorie ˇr´ıká podrobnˇejˇs´ı informace neˇz známe o nulov´ ych bodech obecn´ ych funkc´ı. Pˇredevˇs´ım je zde tzv. z´ akladn´ı vˇeta algebry, podle n´ıˇz kaˇzd´ y polynom stupnˇe n m´ a v komplexn´ı rovinˇe právˇe n nulov´ ych bod˚ u (koˇren˚ u), pokud kaˇzd´ y z nich poˇc´ıt´ ame tolikr´ at, kolik ˇcin´ı jeho násobnost. Dále se dá ukázat, ˇze pokud má reáln´ y polynom komplexn´ı koˇreny, vyskytuj´ı se tyto koˇreny vˇzdy ve dvojic´ıch komplexnˇe 16

sdruˇzen´ ych ˇc´ısel, tedy jako x ± ıy. Pro hledán´ı koˇren˚ u polynom˚ u nen´ı nezbytné pouˇz´ıvat komplexn´ı aritmetiku, leckdy lze poˇc´ıtat jejich reálné a imagin´ arn´ı ˇc´ asti x a y oddˇelenˇe. Pro v´ ypoˇcet koˇren˚ u polynom˚ u existuje ˇrada moˇznost´ı: • Pouˇzijeme nˇekterou z popsan´ ych obecn´ ych metod(napˇr. Newtonovu metodu) a nalezneme jeden koˇren x1 . Pak d´ ale pracujeme s redukovan´ ym polynomem p(x)/(x−x1 ), jehoˇz stupeˇ n je o jedniˇcku niˇzˇs´ı. Postup opakujeme tak dlouho, dokud nestanov´ıme vˇsechny koˇreny. Metoda se komplikuje, pokud naraz´ıme na komplexn´ı koˇren. • K danému polynomu sestav´ıme jeho doprovodnou matici, coˇz je speciáln´ı matice maj´ıc´ı vlastn´ı ˇc´ısla shodn´ a s koˇreny polynomu. Pak nˇejakou vhodnou numerickou metodou algebry stanov´ıme jako koˇreny daného polynomu vlastn´ı ˇc´ısla této matice. Tento postup, kter´ y je pouˇzit ve funkci roots v Matlabu, je spolehliv´ y, ale nen´ı tak efektivn´ı jako pouˇzit´ı numerick´ ych metod odvozen´ ych speciálnˇe pro v´ ypoˇcet koˇren˚ u polynomu. • Pouˇzijeme nˇekterou ze speci´ aln´ıch metod pro v´ ypoˇcet nulov´ ych mod˚ u polynom˚ u. Najdou se mezi nimi jak bezpeˇcné metody, které izoluj´ı koˇreny napˇr´ıklad ve sjednoceni disk˚ uv komplexn´ı rovinˇe (ty jsou ovˇsem podobnˇe jako bisekce pouze lineárnˇe konvergentn´ı), tak rychle konverguj´ıc´ı metody (i rychlejˇs´ı neˇz je Newtonova metoda). O tˇechto speciáln´ıch metod´ ach se lze pouˇcit napˇr´ıklad v [1, 2].

3.3

Numerick´ eˇ reˇ sen´ı soustav neline´ arn´ıch rovnic

ˇ sen´ı soustav neline´ Reˇ arn´ıch rovnic je obt´ıˇznˇejˇs´ı, neˇz je tomu u jedné rovnice, a to z ˇrady d˚ uvod˚ u: • Chován´ı soustavy m˚ uˇze b´ yt mnohem rozmanitˇejˇs´ı neˇz chován´ı jedné rovnice (a jejich koˇren˚ u). Teoretick´ a anal´ yza existence a poˇctu ˇreˇsen´ı je tak mnohem sloˇzitˇejˇs´ı. • Konvenˇcn´ı metody pouˇz´ıvané pro jednu rovnici se leckdy daj´ı v´ıceménˇe pˇr´ımoˇcaˇre zobecnit i pro soustavy, ale u soustav nen´ı jednoduch´ y zp˚ usob, jak zobecnit pojem uzávˇery ˇreˇsen´ı, takˇze zde nen´ı jednoduché sestrojit bezpeˇcné, globálnˇe konverguj´ıc´ı metody. Urˇcité moˇznosti zde ale existuj´ı, nicménˇe se vymykaj´ı moˇznostem tohoto textu a nenajdou se ani v bˇeˇzn´ ych uˇcebnic´ıch. Nicménˇe v Matlabu je pro ˇreˇsen´ı soustav nelineárn´ıch rovnic k dispozici vcelku spolehliv´ a funkce fsolve. • Pracnost numerického ˇreˇsen´ı soustav nelineárn´ıch rovnic roste nelineárnˇe s poˇctem neznám´ ych. Tak napˇr´ıklad jeden iteraˇcn´ı krok Newtonovy metody pro soustavu o n neznám´ ych znamená obecnˇe v´ ypoˇcet n2 hodnot derivac´ı a jedno ˇreˇsen´ı souatavy n lineárn´ıch rovnic o n neznám´ ych, coˇz je samo o sobˇe obecnˇe ˇrádovˇe n3 aritmetick´ ych operac´ı. Také organizaˇcn´ı struktura algoritm˚ u je mnohem sloˇzitˇejˇs´ı. Jak jsme uvedli jiˇz na zaˇc´ atku tohoto textu, studium problematiky soustav se zde vymyká naˇsim ´ ˇcasov´ ym moˇznostem. Uvodn´ ı informace m˚ uˇze zájemce naj´ıt v doporuˇcené literatuˇre [1], [2], [3].

Reference ˇ Numerické metody algebry. Praha: SNTL, 1982. [1] MÍKA, Stanislav. MVST. 17

ˇ 2002. [2] MÍKA, Stanislav a Marek BRANDNER. Numerické metody I. Plzeˇ n: FAV ZCU, [3] HEATH, M. T. Scientific Computing: An Introductory Survey. 2nd Edition. New York: McGraw-Hill, 2002, 563 s.

18

Matematické algoritmy (K611MAG) pondělí 25. listopadu verze: :47

Recommend Documents