Matematika pro chemicke´ inˇzenyry ´ Drahoslava Janovska´
´ ı a nelinearn´ ´ ı regrese Linearn´ ´ sky ZS 2016-2017 Pˇrednaˇ ˇ ´ Sponzorovano grantem VSCHT Praha, PIGA 413-17-6642, 2016
´ ´ a bude se zkouˇset pˇri ustn´ Povinna´ latka. Bude v p´ısemkach ´ ı zkouˇsce ´ e´ oznaˇcen´ı) (ˇzadn ˇ sene´ pˇr´ıklady k procviˇcen´ı - dobrovolne´ F Reˇ ˇ ı ved ˇ et ˇ v´ıc. Tato latka ´ ´ set, F Pro studenty, kteˇr´ı chtej´ se nebude pˇrednaˇ ´ nebude v p´ısemkach, nebude se zkouˇset.
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
Obsah
1
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´ ´ Nahodn a´ veliˇcina, distribuˇcn´ı funkce ´ Stˇredn´ı hodnota a rozptyl nahodn e´ veliˇciny ´ Kovariance nahodn´ ych veliˇcin
2
´ Zaklady regresn´ı analyzy ´ ´ ´ ı regrese Zakladn´ ı model linearn´ Ekvivalentn´ı model Metoda nejmenˇs´ıch cˇ tvercu˚
3
´ ı regrese Nelinearn´
4
ˇ ımu studiu Literatura k dals´
ˇ ımu studiu Literatura k dals´
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´ ´ u˚ jsme obvykle schopni - Pˇri ˇreˇsen´ı chemicko-inˇzen´yrsk´ych problem ˇ prob´ıhaj´ıc´ıho v zaˇr´ızen´ı, ale... odvodit model procesu nebo deje ˇ - Casto nejsme schopni urˇcit numericke´ hodnoty parametru, ˚ ktere´ v modelu vystupuj´ı ´ ´ ı nebo Z matematickeho hlediska mohou b´yt modely ruzn ˚ e´ povahy: linearn´ ´ ı algebraicke´ rovnice, obyˇcejne´ diferencialn´ ´ ı rovnice nebo parcialn´ ´ ı nelinearn´ ´ ı rovnice. diferencialn´ ´ zavislost ´ ˇ ych parametru. Zaj´ıma´ nas modelu na mnoˇzineˇ bezrozmern´ ˚ ´ ame ´ ´ Pˇredpoklad zavislost ve tvaru y = f (x, a),
(1)
´ ˇ ych, a = (a1 , . . . , aP ) je kde x = (x1 , x2 , . . . , xn ) je vektor nezavisle promenn´ ´ ˇ a´ vektor parametru, promenn ˚ jejichˇz hodnoty je tˇreba urˇcit, a y je zavisle ´ ame, ´ ´ ˇ e´ xi se meˇ ˇ r´ı s prakticky (odezva). Pˇredpoklad zˇ e nezavisle promenn ´ ı s chybou meˇ ˇ ren´ı zavisle ´ ˇ e´ y. zanedbatelnou chybou ve srovnan´ promenn
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
´ ˇ ˇ ı funkce Nahodn a´ velicina, distribucn´
´ ˇ F Nahodn a´ velicina ´ ´ a´ funkce, definovana´ na mnoˇzineˇ vˇsech Nahodn a´ veliˇcina X je realn ´ ıch jevu˚ Ω s hodnotami v R. Je to tedy funkce, ktera´ pˇriˇrazuje elementarn´ ´ ´ ´ ´ e´ cˇ ´ıslo X (ω). kaˇzdemu nahodn emu pokusu ω ∈ Ω realn ´ ˇ ıme na diskretn´ ´ ı – jejich obor hodnot je koneˇcna´ nebo Nahodn e´ veliˇciny del´ spoˇcetna´ mnoˇzina, a na spojite´ – jejich obor hodnot je nespoˇcetna´ mnoˇzina. ˇ ´ ˇ a´ nab´yva´ urˇcite´ hodnoty nebo Pravdepodobnost, se kterou nahodn a´ promenn ´ intervalu hodnot, se naz´yva´ rozdelen´ ˇ ı je obsaˇzena v urˇcitem ˇ ´ ˇ pravdepodobnosti. Zakladn´ ı moˇznost, jak popsat pravdepodobnostn´ ı ˇ ı nahodn ´ rozdelen´ e´ veliˇciny X , je urˇcit jej´ı distribuˇcn´ı funkci. ´ ´ Distribuˇcn´ı funkc´ı nahodn e´ veliˇciny X nazveme realnou funkci F (x), x ∈ R, definovanou vztahem F (x) = P(X ≤ x). ˇ Tedy hodnota distribuˇcn´ı funkce v bodeˇ x je pravdepodobnost toho, zˇ e ´ nahodn a´ veliˇcina X bude m´ıt hodnotu menˇs´ı nebo rovnou tomuto x.
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
´ ˇ ˇ ı funkce Nahodn a´ velicina, distribucn´
F Pˇr´ıklad
Pˇr´ıklad: Hran´ı rulety ´ pˇritom padne licha. ´ Sledujme dva hody kuliˇckou a pozorujme, kolikrat ´ ı nahodn ´ Diskretn´ a´ veliˇcina X ma´ za hodnoty poˇcet kol, v nichˇz padlo liche´ ´ ıch jevu˚ tohoto nahodn ´ ´ cˇ ´ıslo. Prostor elementarn´ eho pokusu (oznaˇc´ıme S sudou a L lichou) ma´ cˇ tyˇri prvky: ω1 = SS,
ω2 = SL,
ω3 = LS,
ω4 = LL
´ a nahodn a´ veliˇcina ma´ tyto hodnoty: X (ω1 ) = 0,
X (ω2 ) = X (ω3 ) = 1,
X (ω4 ) = 2 .
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
´ ˇ ˇ ı funkce Nahodn a´ velicina, distribucn´
ˇ ı funkce F Vlastnosti distribucn´
Vlastnosti distribuˇcn´ı funkce: 0 ≤ F (x) ≤ 1, je neklesaj´ıc´ı, ´ je zprava spojita, ma koneˇcneˇ nebo nejv´ysˇ e spoˇcetneˇ mnoho bodu˚ nespojitosti limx→−∞ F (x) = 0, limx→∞ F (x) = 1.
ˇ ımu studiu Literatura k dals´
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
´ ˇ ˇ ı funkce Nahodn a´ velicina, distribucn´
ˇ F Pravdepodobnostn´ ı funkce ´ ı nahodn ´ Diskretn´ a´ veliˇcina X ma´ koneˇcneˇ nebo nejv´ysˇ e spoˇcetneˇ mnoho ˇ ´ hodnot {x1 , x2 , . . . , xn , . . . }. Pravdepodobnosti, zˇ e tyto hodnoty nahodn a´ ´ tj. P(X = xi ) > 0 a plat´ı pro neˇ veliˇcina nabude, jsou kladne, X P(X = xi ) = 1. xi
ˇ ıkame ´ ´ zˇ e nahodn ´ ˇ ı diskretniho ´ R´ take, a´ veliˇcina X ma rozdelen´ typu. ˇ ´ ı Funkce p(x) = P(X = x) se naz´yva´ pravdepodobnostn´ ı funkce diskretn´ ´ nahodn e´ veliˇciny X. Je definovana´ pouze na oboru hodnot ´ {x1 , x2 , . . . , xn , . . . } nahodn e´ veliˇciny X a plat´ı X p(xi ) > 0 , p(xi ) = 1 . xi
ˇ ˇ ´ Pravdepodobnostn´ ı funkce umoˇznuje urˇcit distribuˇcn´ı funkci F nahodn e´ veliˇciny X : X X F (x) = P(X = xi ) = p(xi ), −∞ < x < ∞ . xi ≤x
xi ≤x
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
´ ˇ ˇ ı funkce Nahodn a´ velicina, distribucn´
F ´ ı nahodn ´ Tedy distribuˇcn´ı funkce diskretn´ e´ veliˇciny je nespojita´ v bodech x1 , x2 , . . . ´ xi ma´ skok velikosti P(X = xi ), v kaˇzdem v intervalech hxi ; xi+1 ) je vˇzdy konstantn´ı. ´ ˇ ı pravdepodobnosti ˇ ´ Spojita´ nahodn a´ veliˇcina X ma´ rozdelen´ spojiteho typu, ´ ´ a´ funkce f (x) takova, ´ zˇ e distribuˇcn´ı funkci F (x) lze existuje-li nezaporn a´ realn ´ rit ve tvaru vyjadˇ Z ∞ F (x) = f (t)dt, −∞ < x < ∞ . −∞
´ a´ x a naz´yva´ se hustota Funkce f (x) je definovana´ pro vˇsechna realn ˇ ´ ´ pravdepodobnosti nahodn e´ veliˇciny X . Lze ukazat, zˇ e takto definovana´ ´ distribuˇcn´ı funkce F spojite´ nahodn e´ veliˇciny je spojita´ pro vˇsechna x a ve vˇsech bodech, v nichˇz ma´ derivaci, je f (x) = F 0 (x).
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
´ ˇ Stˇredn´ı hodnota a rozptyl nahodn e´ veliciny
ˇ ıselne´ charakteristiky nahodn ´ ˇ F C´ ych ´ velicin ´ Stˇredn´ı hodnota nahodn e´ veliˇciny X je charakteristikou jej´ı polohy (myˇsleno ˇ a´ ve smyslu polohy hodnot veliˇciny X na cˇ ´ıselne´ ose), je to jista´ prum ˚ ern ´ ´ ´ hodnota, kolem n´ızˇ nahodn a´ veliˇcina nahodn eˇ kol´ısa. ´ ´ ım rozdelen´ ˇ ım pravdepodobnosti, ˇ Je-li X nahodn a´ veliˇcina s diskretn´ ktera´ ˇ nab´yva´ hodnoty x1 , x2 , . . . a ma´ pravdepodobnostn´ ı funkci p(x), pak jej´ı stˇredn´ı hodnota je cˇ ´ıslo X E(X ) = xi · p(xi ) . xi
´ ˇ ım pravdepodobnosti ˇ Je-li X nahodn a´ veliˇcina se spojit´ym rozdelen´ as hustotu f (x), je jej´ı stˇredn´ı hodnota cˇ ´ıslo Z ∞ E(X ) = xf (x)dx . −∞
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
´ ˇ Stˇredn´ı hodnota a rozptyl nahodn e´ veliciny
F ´ ı nahodn ´ Rozptyl charakterizuje kol´ısan´ e´ veliˇciny kolem jej´ı stˇredn´ı hodnoty. ´ Rozptylem nahodn e´ veliˇciny X nazveme cˇ ´ıslo: D(X ) = E(X − E(X ))2 . Dosad´ıme-li do tohoto vztahu vzorec pro stˇredn´ı hodnotu pro veliˇcinu s ´ ım a potom se spojit´ym rozdelen´ ˇ ım, dostaneme pro rozptyl: diskretn´ ´ ı nahodn ´ Je-li X diskretn´ a´ veliˇcina, je X D(X ) = (xi − E(X ))2 p(xi ) . xi
´ Je-li X spojita´ nahodn a´ veliˇcina, je Z ∞ (x − E(X ))2 f (x)dx . D(X ) = −∞
Vˇzdy plat´ı D(X ) ≥ 0.
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
´ ˇ Stˇredn´ı hodnota a rozptyl nahodn e´ veliciny
F
ˇ Rozptyl se take´ znaˇc´ı σ 2 . Odmocnineˇ z rozptylu se ˇr´ıka´ smerodatn a´ odchylka. Tedy p σ = D(X ) . ´ nab´yva´ nahodn ´ ˇ Je-li σ male, a´ veliˇcina s velkou pravdepodobnost´ ı hodnot, velmi bl´ızk´ych sve´ stˇredn´ı hodnoteˇ E(X ). Rozptyl se cˇ asto poˇc´ıta´ podle vzorce D(X ) = E(X 2 ) − (E(X ))2 , ´ ım rozdelen´ ˇ ım pro veliˇcinu s diskretn´
D(X ) =
ˇ ım pro veliˇcinu se spojit´ym rozdelen´
D(X ) =
tedy X
xi2 p(xi ) − (E(X ))2 ,
Zxi ∞ −∞
x 2 f (x)dx − (E(X ))2 .
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
´ ˇ F Dvojice nahodn ych ´ velicin
´ ˇ ˇr´ıkame, ´ ´ Uvaˇzujme dvojici nahodn´ ych veliˇcin, nekdy zˇ e tvoˇr´ı nahodn´ y vektor ˇ ´ (X , Y ) nebo take´ dvourozmernou nahodnou veliˇcinu. Distribuˇcn´ı funkc´ı ´ ´ nahodn e´ veliˇciny (X , Y ) nazveme realnou funkci F (x.y ) definovanou v R2 vztahem F (x, y) = P(X ≤ x, Y ≤ y ). ˇ e´ nahodn ´ Stˇredn´ı hodnotou dvourozmern e´ veliˇciny (X , Y ) budeme naz´yvat dvojici (E(X ), E(Y )).
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
´ ˇ Kovariance nahodn ych ´ velicin
´ ˇ F Kovariance nahodn ych ´ velicin ´ Kromeˇ cˇ ´ıseln´ych charakteristik jednotliv´ych nahodn´ ych veliˇcin X a Y jsou ´ duleˇ souvislost: ˚ zite´ cˇ ´ıselne´ charakteristiky, ktere´ vyjadˇruj´ı jejich vzajemnou ´ Kovariance nahodn´ ych veliˇcin X a Y je cˇ ´ıslo cov(X , Y ) = E([X − E(X )] · [Y − E(Y )])
⇒
cov(X , X ) = E([X − E(X )]2 ) = D(X ) . ˇ vzorec K v´ypoˇctu kovariance slouˇz´ı nejˇcasteji cov(X , Y ) = E(X · Y ) − E(X ) · E(Y ),
kde E(X · Y ) =
XX xi
xi yj p(xi , yj ) .
yj
´ ı zavislosti ´ Kovariance je m´ırou linearn´ veliˇcin X a Y . Pro zhodnocen´ı takove´ ´ ˇ sinou vhodnejˇ ˇ s´ı tzv. korelaˇcn´ı koeficient %(X , Y ), zavislosti je ale vetˇ %(X , Y ) = p
cov(X , Y ) p . D(X ) D(Y )
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
´ ˇ Kovariance nahodn ych ´ velicin
ˇ ı matice F Kovariancn´ ´ ı-li Y na X Pro korelaˇcn´ı koeficient vˇzdy plat´ı −1 ≤ % ≤ 1. Napˇr´ıklad zavis´ ´ e, ˇ tj. Y = aX + b, plat´ı: linearn 1
´ zavislosti ´ je-li grafem teto rostouc´ı pˇr´ımka, cˇ ili a > 0, je % = 1,
2
´ zavislosti ´ je-li grafem teto klesaj´ıc´ı pˇr´ımka, cˇ ili a < 0, je % = −1
Je-li kovariance X a Y rovna nule, je take´ jejich korelaˇcn´ı koeficient roven ´ ´ Pro takove´ veliˇciny pak plat´ı nule a takove´ veliˇciny naz´yvame nekorelovane. E(X · Y ) = E(X ) · E(Y ) . Matice
cov(X , X ) cov(Y , X )
cov(X , Y ) cov(Y , Y )
=
D(X ) cov(Y , X )
cov(X , Y ) D(Y )
´ se naz´yva´ kovarianˇcn´ı matice dvojice nahodn´ ych veliˇcin X a Y . ˇ emu ´ ´ Kovarianˇcn´ı matice je analogie k jednorozmern rozptylu nahodn e´ veliˇciny X.
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
Regresn´ı funkce ˇ e´ x Funkci η(x) = E(Y (x)) definovanou na definiˇcn´ım oboru A ⊂ R promenn ´ nazveme regresn´ı funkc´ı. Regres´ı rozum´ıme zavislost stˇredn´ı hodnoty ´ nahodn e´ veliˇciny Y (x) na veliˇcineˇ x. ´ ame, ´ ´ ´ ´ ´ Pˇredpoklad zˇ e zname tvar regresn´ı funkce, a na zaklad eˇ nahodn eho ˇ odhadujeme jej´ı neznam ´ e´ parametry: v´yberu ´ ˇ e. ´ Pro kaˇzde´ Vybereme n hodnot xj , j = 1, . . . , n, xj ∈ A, nezavisle promenn ˇ r´ıme) realizaci (hodnotu) yj nahodn ´ xj napozorujeme (nameˇ e´ veliˇciny Yj : xj , j = 1, . . . , n, ∈ A
−→
yj = Y (xj ) .
´ poslouˇz´ı k odhadu Z´ıskane´ dvojice hodnot (x1 , y1 ), . . . , (xn , yn ) nam ´ ych parametru˚ regresn´ı funkce. neznam´ ´ ı pˇr´ıpad: Jednoducha´ linearn´ ´ ı regresn´ı funkce ma´ tvar Specialn´ η(x) = β1 + β2 x , ´ funkce, jejichˇz hodnoty hledame. ´ kde β1 , β2 jsou parametry teto Grafem ´ ı regresn´ı funkce je pˇr´ımka se smernic´ ˇ ´ jednoduche´ linearn´ ı β2 , ˇr´ıkame, zˇ e jde o pˇr´ımkovou regresi.
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
´ ´ ı regrese Zakladn´ ı model linearn´
´ ´ ı regrese Zakladn´ ı model linearn´ ´ ı regrese by mel ˇ splnovat: ˇ Model linearn´ ´ ı funkc´ı tvaru 1. Regresn´ı funkce η(x) je linearn´ η(x) =
p X
βk fk (x) ,
k =1
´ e´ funkce a βk , k = 1, . . . , p, neznam ´ e´ parametry. kde fk (x) jsou znam ´ ı vzhledem k parametrum. Funkce η je linearn´ ˚ ´ 2. Hodnoteˇ xj je pˇriˇrazena nahodn a´ veliˇcina Yj , pro kterou plat´ı E(Yj ) = η(xj ) ,
D(Yj ) = σ 2 ,
j = 1, . . . , n ,
´ zˇ e rozptyl nahodn ´ ´ ı na xj a Druha´ rovnice znamena, e´ veliˇciny Y nezavis´ je tedy konstantn´ı, coˇz muˇ ˚ ze napˇr. znamenat, zˇ e vˇsechny realizace ´ ˇ reny se stejnou y1 , . . . , yn nahodn´ ych veliˇcin Y1 , . . . , Yn jsou nameˇ pˇresnost´ı. ´ ˇ e´ xj , j = 1, . . . , n, nejsou vˇsechny stejne. ´ 3. Hodnoty nezavisle promenn
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
´ ´ ı regrese Zakladn´ ı model linearn´
4. Matice F = (fij ) , kde fij = fi (xj ) , i = 1, . . . , p, j = 1, . . . , n. ma´ hodnost ˇ s´ı neˇz poˇcet p . Poznamenejme, zˇ e poˇcet n dvojic (xj , yj ) mus´ı b´yt vetˇ ´ ych parametru˚ p, pˇresneji, ˇ melo ˇ by platit n − p > 2 . neznam´ ´ ´ t.j. 5. Nahodn e´ veliˇciny Y1 , . . . , Yn jsou nekorelovane, cov(Yi , Yj ) = 0,
i, j = 1, . . . , n,
i 6= j .
´ Maticoveˇ zapsano Cy = σ 2 E n , ´ kde En je jednotkova´ matice ˇradu n, Cy je matice kovariance veliˇcin Y1 , . . . , Yn . F Pˇr´ıklad Pro regresn´ı pˇr´ımku, tj. regresn´ı funkci tvaru η(x) = α + βx je ´ ych parametru˚ p = 2 a β1 = α, f1 = 1, β2 = β, f2 = x . poˇcet neznam´
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
Ekvivalentn´ı model
F Ekvivalentn´ı model
Popsan´y model v ekvivalentn´ım tvaru Yj = η(xj ) + εj =
p X
βk fkj + εj ,
j = 1, . . . , n ,
(2)
k =1
´ ˇ e, ´ hodnoty kde hodnoty x1 , . . . , xn jsou hodnotami nenahodn e´ promenn ˇ ı podm´ınku 3. modelu. Pro nahodn ´ fkj = fk (xj ) splnuj´ e´ chyby εj , j = 1, . . . , n , ´ ´ a pro kovarianˇcn´ı matici Cε nahodn eho vektoru ε = (ε1 , . . . , εn ) plat´ı E(εj ) = 0 ,
j = 1, . . . , n ,
Cε = σ 2 E n = Cy .
Rovnici (2) lze zapsat maticoveˇ − → − → → Y = FT β + − ε .
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
ˇ ıch ctverc ˇ Metoda nejmens´ u˚
ˇ ıch ctverc ˇ Metoda nejmens´ u˚
´ ych parametru˚ β1 , . . . , βp v popsanem ´ modelu linearn´ ´ ı Odhady neznam´ regrese budeme hledat metodou nejmenˇs´ıch cˇ tvercu˚ . Oznaˇcme tyto odhady ˇ e´ funkce nahodn ´ ´ ˇ Y1 , . . . , Yn . b1 , . . . , bp , coˇz jsou v´yberov eho v´yberu Minimalizujeme souˇcet cˇ tvercu˚ odchylek napozorovan´ych hodnot yj od stˇredn´ıch hodnot ηj = η(xj ), tedy souˇcet cˇ tvercu˚ p n n X X X Q(β1 , . . . , βp ) = (yj − ηj )2 = yj − βk fkj j=1
j=1
k =1
Odhady b1 , . . . , bp tedy najdeme jako ˇreˇsen´ı soustavy rovnic ∂Q = 0, ∂βk
k = 1, . . . , p.
´ ıch rovnic. Tato soustava se naz´yva´ soustavou normaln´
!2 .
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
ˇ ıch ctverc ˇ Metoda nejmens´ u˚
´ tvaru Soustavu pro hledane´ odhady b1 , . . . , bp zap´ısˇ eme v pˇrehlednem b1 S11 b1 S21
+ +
b2 S12 b2 S22
+ +
··· ···
+ +
bp S1p bp S2p
b1 Sp1
+
b2 Sp2
+
···
+
bp Spp
Ski
=
kde
Sky
=
n X j=1 n X
= = .. . =
fkj fij ,
i, k = 1, . . . , p ,
fkj yj ,
k = 1, . . . , p .
j=1
Zˇrejmeˇ Sik = Ski pro i, k = 1, . . . , p .
S1y S2y Spy ,
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
ˇ ıch ctverc ˇ Metoda nejmens´ u˚
ˇ Maticove: − → − → ´ ı rovnice lze zapsat Je-li y = (y1 , . . . , yn )T , b = (b1 , . . . , bp )T , pak normaln´ ve tvaru − → − → (3) F FT b = F y . Podle pˇredpokladu je h(F ) = p, pak take´ h(F F T ) = p a F F T je typu p × p, − → ´ ı =⇒ existuje (F F T )−1 , a tedy z rovnice (3) lze vyjadˇ ´ rit vektor b : regularn´ − → − → b = (F F T )−1 F y , − → ´ ımi vektor b je jednoznaˇcneˇ urˇcen a jeho jednotlive´ sloˇzky jsou linearn´ kombinacemi hodnot y1 , . . . , yn . ´ ´ ska ”Linearn´ ´ ı Pozor! V´ypoˇcet je extremn eˇ numericky nestabiln´ı, viz pˇrednaˇ algebra”.
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
ˇ ıch ctverc ˇ Metoda nejmens´ u˚
F Pˇr´ıklad
´ ı poˇcatkem, ´ Necht’ regresn´ı pˇr´ımka prochaz´ η(x) = a x , pak fij = x a β1 = a . − → Oznaˇcme x = (x1 , . . . , xn )T , F = (x1 , . . . , xn ) . Pak F F T = (x1 , . . . , xn ) · (x1 , . . . , xn )T =
n X
xj2
=⇒
(FF T )−1 = Pn
j=1
j=1
Odhad parametru a je T −1
a = (F F )
− → Fy =
!
1 Pn
j=1
xj2
1
Pn j=1 xj yj − →T − → x y = Pn . 2 j=1 xj
xj2
.
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
ˇ ıch ctverc ˇ Metoda nejmens´ u˚
F Pˇr´ıklad Rust ˚ ledov´ych krystalu˚ Ledove´ krystaly byly uloˇzeny do boxu s konstantn´ı teplotou -5◦ C. C´ılem bylo ´ analyzovat rust ıc´ı tabulce jsou uvedena ˚ krystalu˚ jako funkci cˇ asu. V nasleduj´ ˇ rena´ data, y je delka ´ ´ nameˇ krystalu˚ v mikronech, x je cˇ as v sekundach. ˇ ren´ı. Uvedena jsou i opakovana´ meˇ S vyuˇzit´ım pˇr´ımkove´ regrese y = β0 + β1 x urˇcete parametry β0 a β1 . x[s] 50 60 70 80 90 95 100 105 110 115 120
y [mm] 19 20, 21 17, 22 25, 28 21, 25, 31 25 30, 29, 33 35, 32 30, 28, 30 31, 36, 30 36, 25, 28
x[s] 125 130 135 140 145 150 155 160 165 170 180
y [mm] 28 31, 32 34, 25 26, 33 31 36, 33 41, 33 40, 30, 37 32 35 38
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
ˇ ıch ctverc ˇ Metoda nejmens´ u˚
ˇ sen´ ˇ ı F Re ´ ı data zap´ısˇ eme maticoveˇ Experimentaln´ 19 20 21 17 y = X = . .. 35 38
1 1 1 1 .. . 1 1
50 60 60 70 .. . 170 180
,
ˇ ric´ıch bodu˚ je kde y ∈ Rn je vektor a X ∈ Rn×p matice. Celkov´y poˇcet meˇ n = 43 a p reprezentuje poˇcet parametru, ˚ v tomto pˇr´ıpadeˇ dva: β0 , β1 . Prvn´ı ´ ˇradku ´ ´ sloupec matice X ma´ v kaˇzdem jen 1. Poˇcet navzajem ruzn´ ˚ ych ˇ ric´ıch bodu˚ je m = 22. Protoˇze se mnoho experimentu˚ opakuje, je m meˇ ˇ ric´ıch bod podstatneˇ menˇs´ı, neˇz celkov´y poˇcet meˇ Pu˚ n. Oznaˇcme ni poˇcet ˇ ren´ı pro kaˇzde´ xi , i = 1, . . . , m, pˇriˇcemˇz n = m meˇ i=1 ni . Parametry modelu ´ ˇ muˇ e: ˚ zeme spoˇc´ıtat nasledovn 14.19 b = β0 , β1 = (X T X )−1 X T y = . 0.1346 Z´ıskali jsme model y = 14.19 + 0.1346 x .
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
ˇ ıch ctverc ˇ Metoda nejmens´ u˚
ˇ ı nestranny´ odhad linearn´ ´ ı parametricke´ funkce Nejleps´
´ ´ ´ ı funkce parametru˚ Uloha Hledame nejlepˇs´ı nestrann´y odhad linearn´ − → T β = (β1 , . . . , βp ) . Uvaˇzujme parametrickou funkci γ=
p X
→ − → − ck βk = c T · β ,
k =1
− → − → ´ y nenulov´y vektor ( c 6= 0) . kde c = (c1 , . . . , cp )T je znam´ ´ ım odhadem parametricke´ funkce Tvrzen´ı Nejlepˇs´ım nestrann´ym linearn´ → − → → − →T − − → − ˇ a´ funkce (statistika) g = c T · b , kde b je ˇreˇsen´ım c · β je v´yberov ´ ıch rovnic. E(g) = γ a ”nejlepˇs´ı” znamena, ´ zˇ e rozptyl D(g) je normaln´ ´ ı ve tˇr´ıdeˇ nestrann´ych odhadu. minimaln´ ˚
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
´ ı regrese Nelinearn´
C´ıl:
´ ı empiricke´ formuli odhad parametru˚ a1 , . . . , an v nelinearn´ y = f (x, a) .
Budeme minimalizovat souˇcet cˇ tvercu˚ odchylek S(a) =
m X
f (x j , a) − y j
2
=
j=1
m X
qj2 (a) ,
j=1
´ ˇ reneho ´ ˇ z souˇcet kde qj je residuum j−teho meˇ bodu. Oznaˇcme a+ bod, v nemˇ ´ ´ cˇ tvercu˚ S(a) nab´yva´ sveho minima. Hodnotu a+ hledame jako limitu tzv. minimizuj´ıc´ı posloupnosti ak tak, aby platilo S(ak+1 ) < S(ak ) .
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
´ ´ Tayloruv cˇ leny vyˇssˇ ´ıho ˇradu neˇz 1): ˚ rozvoj funkce f (zanedbame f (x, a) ≈ f (x, ak ) + gradTa f (x, ak ) (a − ak ) f (x, a) ≈ f (x, ak ) +
⇐⇒
n X ∂f (x, ak ) (aj − ajk ) . ∂aj j=1
Vyhodnot’me aproximativn´ı formuli y − f (x, ak ) =
n X ∂f (x, ak ) 4ajk . ∂aj j=1
Oznaˇcme Γ(a) Jacobiovu matici, ∂f (x 1 , a) ∂f (x 1 , a) ∂a1 ∂a2 . . Γ(a) = . ∂f (x m , a) ∂f (x 1 , a) ∂a1 ∂a2
...
...
∂f (x 1 , a) ∂an .. .
. ∂f (x m , a) ∂an
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
Hledane´ ˇreˇsen´ı: −1 4+ ak = − ΓT (ak ) Γ(ak ) ΓT (ak )q(ak ) , kde q = (q1 , . . . , qm ). Pomoc´ı 4+ ak vypoˇcteme dalˇs´ı iteraci ak+1 = ak + λ4+ ak , Prvn´ı hodnota: λ = 1. Je-li S(a
k +1
λ ∈ (0, 1i .
k
ˇ ıme λ. ) ≥ S(a ), zmens´
´ ıme pro V´ypoˇcet provad´ ΓT (ak ) Γ(ak ) 4+ ak = −ΓT (ak ) q(ak ) . | {z } matice n × n
Proces ukonˇc´ıme, je-li ||4+ ak || menˇs´ı, neˇz zadana´ pˇresnost.
ˇ ımu studiu Literatura k dals´
´ ı experimentaln´ ´ ıch dat Vyhodnocovan´
´ Zaklady regresn´ı analyzy ´
´ ı regrese Nelinearn´
ˇ ımu studiu Literatura k dals´
ˇ ımu studiu Literatura k dals´
D. R. Cox, Christl A. Donnelly: Principles of Applied Statistics. Cambridge University Press, 2011. Kub´ıcˇ ek M., Dubcova´ M., Janovska´ D.: Numericke´ metody a algoritmy, ˇ VSCHT Praha, 2005 (second edition). Harvey Motulsky, Arthur Christopoulos: Fitting Models to Biological Data using Linear and Nonlinear Regression. A practical guide to curve fitting. 2003, GraohPad Software Inc. San Diego CA, www.graphpad.com. J. Pavl´ık a kol.: Aplikovana´ statistika. Vysoka´ sˇ kola chemicko-technologicka´ v Praze, Praha 2005. Anders Rasmuson, Bengt Andersson, Louise Olsson, Ronnie Andersson: Mathematical Modeling in Chemical Engineering. Cambridge University Press, 2014.