8 NELINEÁRNÍ REGRESNÍ MODELY 8.2 Úlohy Úlohy jsou rozděleny do pěti kapitol: B8 (farmakologická a biochemická data), C8 (chemická a fyzikální data), E8 (environmentální, potravinářská a zemědělská data), H8 (hutní a mineralogická data) a S8 (ekonomická a sociologická data).
8.2.1 Analýza farmakologických a biochemických dat – pokračovací úlohy Úloha B8.06 Růstová křivka obvodu hlavy dívek (Kompendium) Sledování růstu a jeho změn patří k základnímu hodnocení prospívání dětí všech věkových kategorií. Tělesný růst je citlivým ukazatelem zdraví jedince a růstová odchylka může znamenat závažnou poruchu ve vývoji dítěte nebo příznaky nějaké nemoci. Jedním z růstových ukazatelů je i obvod hlavy dítěte, který má pro svůj těsný vztah k velikosti mozku vysokou informační hodnotu, a to především v prvních letech života dítěte. Měří se pásovou mírou vedenou těsně nad obočím a přes největší klenutí týla s přesností na 1 mm, tzv. frontookcipitální obvod hlavy. Zjištěná data obsahují obvod hlavy u dívek do tří let od narození v závislosti na jejich stáří v měsících (zdroj: CAV 1991). Cílem je najít nelineární regresní model, který co nejlépe vystihuje závislost obvodu hlavy na věku dívek. Za tím účelem byly navrženy následující nelineární regresní modely: Model A:
Model B:
Model D: y = β1 exp(-exp(β2 - β3x)) Model F:
Model C: Model E:
β
β exp
β x
exp
Za výběrová kritéria mezi modely vezměte střední kvadratickou chybu predikce MEP, Akaikovo informační kritérium AIC, koeficient determinace D a směrodatnou odchylku reziduí s(e). Vyšetřete rovněž statistickou významnost odhadů regresních parametrů. Nakreslete graf proložení vypočtené regresní křivky experimentálními body. Jak lze posoudit těsnost proložení? Vystihněte rovněž predikční schopnost modelu pomoci parametru K. ○Data: x značí věk dívek v měsících, y značí obvod hlavy dívek v cm: x y 1 36.4 ... ... 36 49.0
Úloha B8.07 Aktivita enzymu benazepril v závislosti na čase růstovou křivkou (04 Fialová) V bioequivalenční studii byl psům aplikován přípravek s účinnou látkou benazepril. V plazmě byl stanovován benazepril, jeho metabolit benazeprilát a na biochemickém kitu pak aktivita angiotensin converting enzym (ACE). Aktivita ACE po podání přípravku sníží nejvyšší obsah benazeprilátu v plazmě. Při snižování koncentrace benazeprilátu v plazmě se zvyšuje aktivita enzymu. Zvyšování aktivity enzymu v závislosti na čase je třeba popsat nelineárním regresním modelem růstové křivky, a tak zjistit nejlepší model růstové
funkce, který popisuje tento vzestup. ◯ Data: Aktivita ACE v psí plasmě Čas x [h]
ACE aktivita y [jednotky]
1 1 4 4 12 12 24 24 75 75 120 120 144 144
1,3 1,2 1,3 1,3 1,4 1,6 2,0 2,0 7,9 9,5 12,4 12,5 13,0 13,4
Úloha B8.08 Výstavba nelineárního regresního modelu růstové křivky (10 Kalhousová)
Na internetu byla nalezena závislost růstu chlapců do 18 let v oboru pediatrické auxologie http://ojrech.cz/kompendium/heigt.html. Najděte nejlepší vhodný model, který odpovídá naměřené závislosti tělesné výšky na věku chlapců, a prokažte tento model pomoci těsnosti proložení vypočtené křivky danými hodnotami a současně dokažte spolehlivost odhadů parametrů regresního modelu nalezené růstové funkce. ◯ Data: Věk x [rok] 0 0,5 1 2 3 4 5 5,5 6 7 8 9 10 11 12 13 14 15 16 17 18
Tělesná výška y [cm] 50,4 68,0 81,6 87,6 95,6 99,6 103,1 108,6 115,0 122,3 127,4 133,0 138,4 143,5 148,6 154,7 161,6 169,5 174,6 177,6 179,0
Úloha B8.09 Obsah specifického proteinu po centrifugaci v závislosti na sacharózovém gradientu (18 Škopová) Ultracentrifugací dochází v sacharózovém gradientu k separaci celých virových částic od částic nesestavených a rozvolněných. Zároveň dochází ke koncentrování produktu viru chřipky. Povrch viru chřipky je z 90% tvořen hlavním povrchovým antigenem/proteinem viru, zvaným hemaglutinin. Z dostupných pramenů byl navržen regresní model 2
⎛ x − β3 ⎞ , β ⎟⎟ y = 1 ⋅ exp( −0,5 ⋅ ⎜⎜ β2 ⎝ β2 ⎠
kde y je hodnota koncentrace hemaglutinimu v µg/ml a x je koncentrace sacharózy v g/l. Určete odhady parametrů navrženého regresního modelu. ◯ Data: Koncentrace sacharózy x [µg/ml]
Koncentrace hemaglutininu y [g/l]
Koncentrace sacharózy x [µg/ml]
Koncentrace hemaglutininu y [g/l]
400,6 404,2 409,8 415,0 421,0 425,4 430,4 435,1 441,0 445,2
19,8 35,8 60,9 97,3 146,1 206,0 272,9 339,7 397,1 436,2
450,1 449,9 460,1 465,0 469,7 474,5 480,3 485,4 490,0 500,1
450,0 436,2 397,1 339,7 272,9 206,0 146,1 97,3 60,9 19,8
Úloha B8.10 Tvorba růstové křivky kmenu laktobacilů ve specifickém médiu (18 Škopová) Byla sledována rychlost růstu kmenu laktobacilu (Lactobacillus rhamnosus LBK7) v kultivačním médiu RMS bujónu při konstantní teplotě. Kultivace bakteriálního kmenu probíhala v Erlenmayerově baňce, medium bylo naočkováno 1 % obj. inokula a kultivace probíhala při 37 °C po dobu 48 hodin. Každé dvě hodiny byl sterilně odebrán vzorek, u kterého se stanovoval počet jednotek tvořících kolonie. Z dostupných pramenů byl navržen regresní model
y=
β1 ( x 2 + β 2 x )
x 2 + β3 x + β 4
+ β5 ,
kde y je log(KTJ/ml) a x je doba kultivace v hodinách. Určete odhady parametrů navrženého regresního modelu včetně jejich věrohodnosti. ◯ Data: Počet kolonií Doba kultivace Počet kolonií Doba kultivace log(KTJ/ml) y x [h] log(KTJ/ml) y x[h] 4,36 0 9,96 26 5,32 2 9,95 28 6,14 4 9,96 30 6,96 6 9,96 32 7,62 8 9,96 34 8,06 10 9,97 36 8,62 12 9,96 38 9,05 14 9,95 40 9,28 16 9,97 42 9,5 18 9,97 44
9,64 9,78 9,84
20 22 24
9,96 9,94
46 48
Úloha B8.11 Tvorba nelineárního regresního modelu rozkladu léčiva v čase (41 Vykydal) Rozklad léčiva je důležitou součástí stabilitní studie léčiv. Byl studován rozklad léčiva ve vodném roztoku média č.1 o koncentraci 100 µM a 10 µM a ve vodném roztoku média č.2 o koncentraci 100 µM. Vždy po deseti minutách byla zaznamenána hmotnost léčiva v hmotnostních procentech. Nezávisle proměnnou x je čas v desítkách minut, závisle proměnnou y je průměr zbytkové hmotnosti, odhadnutý vždy ze čtyřech měření. Už z prvního přiblížení lze usoudit, že se jedná o klesající exponenciální závislost, kde v exponentu bude čas vynásobený parametrem, jehož hodnotu je třeba vyčíslit. V případě rozkladu léčiva v médiu č. 1 o koncentraci 100 μM byla postupně testována vhodnost následujících modelů. Protože Model 1: exp se ukázal nepoužitelným, bylo třeba testovat další dva modely: exp Model 2: Model 3:
100 exp
◯ Data: Čas x 0 10 20 30 40 50 60 90 120 150 180
y/100- vz1 100,00 87,30 66,08 52,37 44,51 37,50 30,93 14,43 11,57 10,44 9,60
Medium č.1 , 100 µM y/100- vz2 y/100- vz3 100,00 100,00 90,95 80,90 66,79 56,87 59,33 41,52 50,49 31,59 41,67 25,32 33,68 21,02 19,95 12,88 14,89 7,85 12,38 6,19 10,65 5,19
Čas x 0 10 20 30 40 50 60 90 120 150 180
y/10-vz1 100,00 82,29 73,46 64,82 54,45 51,8 48,23 38,16 31,85 26,21 21,86
Medium č.1 , 10 µM y/10-vz2 y/10-vz3 100,00 100,00 89,38 85,07 79,09 76,81 71,08 69,94 55,77 54,83 54,85 53,45 52,63 50,59 41,56 38,81 33,40 31,41 26,75 25,95 22,52 22,51
y/10-vz4 100,00 90,37 80,80 74,89 60,02 58,5 54,72 35,24 30,18 25,58 24,13
y/10-průměr 100,00 86,78 77,54 70,18 56,27 54,65 51,54 38,44 31,71 26,12 22,76
y/100-vz1 100,00
Medium č.2 , 100 µM y/100-vz2 y/100-vz3 100,00 100,00
y/100-vz4 100,00
y/100-průměr 100,00
Čas x 0
y/100- vz4 100,00 82,62 57,62 43,20 33,77 28,54 21,64 12,74 8,87 6,05 5,14
y/100-průměr 100,00 85,44 61,84 49,10 40,09 33,26 26,82 15,00 10,79 8,77 7,64
10 20 30 40 50 60 90 120 150 180
97,10 93,42 88,29 88,29 85,62 83,51 75,01 67,81 60,12 57,42
96,64 92,93 89,14 86,65 84,50 82,82 73,70 67,17 60,47 56,45
97,99 94,07 89,49 88,18 85,30 83,52 74,70 64,18 60,73 55,99
96,05 92,73 90,29 87,01 84,52 80,04 74,03 67,64 59,91 58,19
96,95 93,29 89,30 87,53 84,99 82,47 74,36 66,70 60,31 57,01
Úloha B8.12 Stanovení růstové křivky kmene Enterococcus hirae ATCC 10541 (49 Hromádková) Přístrojem Malthus byla stanovena růstová křivka kmene Enterococcus Hirae ATCC 10541, který byl připraven v koncentraci 108. Přístrojem se stanovuje účinnost desinfekčních přípravků na principu elektrické vodivosti y. Každých 6 minut je zaznamenána vodivost y ve zkumavce, tj. 10 řad po 6 sloupcích tvoří celkem 60 zkumavek. Změna vodivosti je způsobena růstem mikroorganismů. Výsledkem je stanovení detekčního času x, který určuje počet mikroorganismů v jednotkách log/cfu. Byl stanoven detekční čas 1,6 hodiny, což odpovídá počtu mikroorganismů 8,5 log/cfu. Cílem úlohy je určení nejvhodnějšího modelu růstové křivky kmene Enterococcus hirae stanovené pomocí přístroje Malthus. ◯ Data: Detekční čas x [min] Naměřená vodivost y 1.00 12.30 6.00 12.50 12.00 13.10 18.00 14.20 24.00 15.60 30.00 16.80 36.00 18.20 42.00 19.30 48.00 20.40 54.00 21.80 60.00 23.10 66.00 24.70 72.00 25.60 78.00 27.10 84.00 28.20 90.00 29.80 96.00 31.30
8.2.2 Analýza chemických a fyzikálních dat – pokračovací úlohy Úloha C8.20 Obsah n-alkanů (a iso-alkanů) v parafinu v závislosti na počtu uhlíkových atomů (Kompendium) Ve vzorku parafinu byly chromatograficky stanoveny relativní obsahy n-alkanů y1 a iso-alkanů y2 v závislosti na počtu uhlíkových atomů v řetězci, a to v rozmezí 23 až 44 uhlíkových atomů. Pro stanovení byla použita methylsilikonová nepolární kapilární kolona 10 m/0.25 mm a FID detektor v teplotním režimu 240 - 340̊C, při teplotě detektoru 300̊C a teplotě dávkovače 280̊C. Jako nosného plynu bylo užito dusíku o průtoku 0.7 ml/min s dělicím faktorem 1:10. Rozhodněte, který z následujících dvou regresních modelů lépe popisuje uvedenou
závislost Model 1:
exp
-
Model 2:
exp
exp
-
Uveďte všechny statistiky grafické a numerické analýzy reziduí při vyšetřování těsnosti proložení nelineární regresní křivky. Jak se provádí analýza vlivných bodů? Rozeberte postup výstavby nelineárního regresního modelu. ○Data: Počet atomů uhlíku v řetězci x snížený o 22, obsah n-alkanů y1 (resp. iso-alkanů y2) [%]: y1 y2 x 1 0.03 0.05 ... ... ... 22 0.06 0.12
Úloha C8.21 Měření průběhu pronikání iontu Ca++ přes plasmovou membránu Je třeba postavit nelineární regresní model o průběhu pronikání vápenatého iontu plasmovou membranou. Data byla adaptována z knihy: Rawlings, John 0.; Pantula, Sastry G.; Dickey, David A.: Applied Regression Analysis: A Research Tool, Second Edition. Springer. Jako modely budou použity a vzájemně porovnávány dvě Weibullovy růstové modely: Model A:
y = β1 (1 − e
−(
x
β2
)β3
),
Model B: y = β1 (1 − e
−(
x
β2
)
).
◯ Data: Koeficienty βi jsou odhadovány pomocí počátečních odhadů p1=3, p2=3, p3=1,5. Čas x (min) Vápník y (nmol/mt) 0,45 0,3875 1,3 1,1248 2,4 1,3999 4 2,7689 6,1 2,9524 8,05 3,4800 11,15 3,6488 13,15 4,6993 15 3,7264
Úloha C8.22 Adsorpční izotermy fenolu na granulované aktivní uhlí (05 Freisleben) K vyjádření a posouzení adsorpční kapacity adsorbentu se používá adsorpční izotermy, což je závislost množství adsorbované látky a na její rovnovážné koncentraci v kapalné fázi cr za konstantní teploty. Je třeba nalézt nejvhodnější regresní model, který nejlépe vystihuje adsorpční izotermu pro adsorpci fenolu na granulované aktivní uhlí. Nejčastěji používanými regresními modely bývají Freundlichova izoterma a = Kcr
(1/ n )
a Langmuirova izoterma a = am
◯ Data: a [g / kg GAC] 11.0 13.2 28.5 35.1 45.5 98.8 177.2 305.9
cr [g / l] 10.8 15.0 21.5 25.7 32.6 47.1 58.8 71.1
b ⋅ cr . 1 + b ⋅ cr
564.1
93.8
Úloha C8.23 Vhodnost regresních modelů a odhady parametrů při atomizaci molybdenu (06 Galuszková) Mineralizací zeminy lučavkou královskou jsme získali vzorek, který byl podroben elektrotermické atomizaci rozmezí atomizačních teplot od 2660 do 2880oC. Na výstupu AAS byl sledován signál. Rozhodněte, který z uvedených regresních modelů lépe popisuje závislost výstupního signálu na teplotě elektrotermické atomizace. Stanovte 95% intervalové odhady neznámých parametrů. ◯ Data: x je teplota atomizace oC, y je výstupní signál z AAS 2840 2820 2800 2780 2760 2740 2720 2700 2680 2660 x 2880 y1 0,1271 0,1094 0,0980 0,0895 0,0805 0,0708 0,0632 0,0578 0,0521 0,0482 0,0448
Úloha C8.24 Stanovení stupně rozkladu kalcinátu měřením vodivosti vodného výluhu (11 Kovaříková) Při kalcinaci FeSO4 x H2O na červený pigment dochází k přeměně, rozkladu Fe+2 na Fe+3 ve formě Fe2O3. Stupeň rozkladu je významným technologickým parametrem ovlivňujícím výslednou kvalitu červeného pigmentu a také ekonomiku provozu. Klasické stanovení stupně rozkladu vychází z analytického stanovení podílu celkového a dvojmocného železa ve vzorku kalcinátu. Metoda je časově náročná; při provozních pokusech je třeba v krátkém časovém úseku zpracovat desítky vzorků. Při zachování totožných vstupních surovin je možné odhadnout stupeň rozkladu kalcinátu z hodnoty vodivosti vodného výluhu kalcinátu. Protože ke změně vstupních surovin dochází zpravidla 1x ročně, je třeba parametry modelu, popisujícího závislost stupeň rozkladu (stanoveného analyticky) proti měrné vodivosti (měřené přímo) aktualizovat. Proměnné: stupeň rozkladu železa v procentech x (%), měrná vodivost y (mS). Stupeň rozkladu je omezená proměnná horní a spodní hranicí (0 – 100 %), protože data pochází z řízeného procesu, je možné očekávat hodnotu stupně rozkladu v rozmezí 80 – 100 %. ◯ Data: y (mS) 1,6 7,03 10,49 6,02 10,16 5,97 9,63 0,99 7,31 2,4 5,92 6,6 7,51 4,64 4,26 3,51 3,1 4,55 3,78 3,93 5,03 4,16
x (%) 100 83,16 59,26 89,01 64,63 90,49 65,5 100 87,9 99,28 90,12 89,6 88,98 99,73 99,59 99,75 99,84 98,25 98,72 98,57 96,13 98,07
3,7 5,05 4,21 3,03
98,39 97,04 98,41 99,3
Úloha C8.25 Stanovení počáteční hodnoty aktivity radionuklidu Ag 110m (12 Lahodová) Použijte exponenciální model pro stanovení počáteční hodnoty aktivity radionuklidu Ag110m. Aktivita byla měřena 7x v rozmezí od 300 – 7200 s. Porovnejte výsledky z analýzy rozličných programů. ◯ Data: Nezávisle proměnnou je čas x v sekundách, závisle proměnnou y je aktivita v becquerelech. Čas x (s) 300 600 1200 1800 3600 5400 7200
Aktivita y (Bq) 1.8588E+07 1.3598E+07 7.0365E+06 3.5556E+06 4.9936E+05 6.8670E+04 9.2550E+03
Úloha C8.26 Stanovení mocninného modelu příkonu dávkového ekvivalentu radioaktivního materiálu (12 Lahodová) Při transportu radioaktivního materiálu je třeba znát příkon dávkového ekvivalentu ze vzdálenosti 1 metru. Nedostatek místa způsobil, že byl příkon dávkového ekvivalentu měřen pouze ze vzdálenosti 50 cm a pro kontrolu i ve vzdálenostech 10, 20, 30 a 40. Z naměřených hodnot určete příkon dávkového ekvivalentu ve vzdálenosti 1 m a ověřte závislost příkonu na vzdálenosti. ◯ Data: Nezávisle proměnnou je vzdálenost x v cm, závisle proměnnou příkon dávkového ekvivalentu y v mSv/h. Vzdálenost x (cm) 50 40 30 20 10
Příkon dávkového ekvivalentu y (mSv/h) 8.71 15.90 29.40 53.70 203.00
Úloha C8.27 Kalibrace zásobní nádrže na LPG (13 Nešpůrek) U podzemní skladovací nádrže na LPG byla provedena kalibrace objemu pomocí průtokoměru. Zásobní nádrž má tvar ležaté bečky, obsahuje bezpečnostní vestavby a je vybavena stavoznakem. Byla změřena závislost nastavované proměnné x, což je výška sloupce v mm na stavoznaku proti odezvě y, což je objem nádrže v m3. Z navržených funkčních závislostí nalezených na internetu vyberte nejvhodnější model popisující danou závislost. Vyšetřete regresní triplet a míru těsnosti proložení regresní křivky. Návrh modelů:
Model 1:
Model 2:
.
◯ Data: Výška sloupce na stavoznaku x v mm 0 100 200
Objem nádrže y v m3 0.000 0.861 2.407
Výška sloupce na stavoznaku x v mm 1500 1600 1700
Objem nádrže y v m3 42.300 45.833 49.327
300 400 500 600 700 800 900 1000 1100 1200 1300 1400
4.380 6.681 9.247 12.033 15.004 18.129 21.381 24.736 28.171 31.666 35.198 38.749
1800 1900 2000 2100 2200 2300 2400 2500 2600 2700 2800
52.763 56.118 59.370 62.495 65.466 68.252 70.818 73.119 75.091 76.638 77.499
Úloha C8.28 Závislost koheze modifikovaného asfaltu na teplotě (13 Nešpůrek) U vzorku modifikovaného silničního asfaltu byla dle ČSN EN 13588 měřena koheze y v J.cm-2. Měření bylo provedeno při různých teplotách x v oC. Z navržených regresních modelů vyberte takový, který nejlépe prokládá daná data. Návrh modelů koheze asfaltu Model 1: Model 2: Model 3: ◯ Data: Teplota x v oC 60 70 50 40 66
Model 4: Koheze y v J.cm-2 0.56 0.34 0.51 0.37 0.46
Teplota x v oC 58 53 63 48 56
Koheze y v J.cm-2 0.54 0.57 0.43 0.49 0.59
Úloha C8.29 Stanovení závislosti bodu měknutí asfaltu na čase při kontrole výroby oxidovaného asfaltu (13 Nešpůrek) Směs vakuového destilačního zbytku ropy a vakuové destilační frakce byla podrobena laboratorní oxidaci, kdy byl do speciálního míchaného reaktoru při teplotě 260 – 270 oC vháněn vzduch. Při reakci dochází k dehydrogenaci výše uvedené směsi a důsledkem toho je tvrdnutí směsi čili zvyšování bodu měknutí asfaltu. Oxidované asfalty se vyrábí v několika různých gradacích daných rozmezím bodu měknutí. A právě tato gradace závisí při stejném výchozím složení nástřiku za jinak stejných podmínek (teplota v reaktoru, množství přiváděného vzduchu, násada suroviny) pouze na době oxidace. Z navržených regresních modelů vyberte nejvhodnější model oxidace dat, který nejlépe prokládá experimentální data. Návrh modelů: Model 1. exp Model 2. β exp Model 3. exp Model 4. exp ◯ Data: Doba oxidace x (h) 2 4 6 7 8 10 11.5
Bod měknutí y (oC) 33.1 37.9 47.4 55.2 61.4 77.4 96.4
Úloha C8.30 Nalezení parametrů závislosti výskytu infekce HIV ve světě od roku 1980 (15 Raška) Vyšetřete soubor dat obsahující globální odhad nárůstu výskytu HIV ve světě od roku 1980. Nelineární regresí se pokuste nalézt vhodnou funkci pro proložení počtu výskytů této infekce. ◯ Data: Rok x HIV případy y (v milionech) 1980 0,2 1981 0,6 1982 1,1 1983 1,8 1984 2,7 1985 3,9 1986 5,3 1987 6,9 1988 8,7 1989 10,7 1990 13,0 1991 15,5 1992 18,5 1993 21,9 1994 25,9 1995 30,6 1996 36,2
Úloha C8.31 Odhad parametrů Gaussovského píku na klesající chromatografické křivce (15 Raška) Vyšetřete soubor dat, který je tvořen dvěma Gaussovskými píky na klesající exponenciální chromatografické křivce. Nelineární regresí proveďte odhad parametrů tohoto navrženého modelu exp
exp
exp
◯ Data: x
y
x
y
x
y
x
y
x
y
x
y
x
y
1
97,62227
41
91,2851
81
113,7037
121
29,11021
161
47,80123
201
29,58864
241
10,3251
2
97,80724
42
97,2241
82
106,8407
122
23,02099
162
47,46305
202
27,29462
242
4,79099
3
96,62247
43
93,5173
83
107,0034
123
25,65091
163
51,04166
203
21,91439
243
8,3771
4
92,59022
44
94,1016
84
102,4629
124
28,50295
164
54,58065
204
19,08159
244
6,26445
5
91,23869
45
101,918
85
96,09296
125
25,23701
165
57,53001
205
24,9029
245
2,70621
6
95,32704
46
98,4313
86
94,57555
126
26,13828
166
61,42089
206
19,82341
246
8,36233
7
90,3504
47
110,421
87
86,98824
127
33,5326
167
62,79032
207
16,75551
247
8,98366
8
89,46235
48
107,663
88
84,90154
128
29,25195
168
68,51455
208
18,24558
248
3,36257
9
91,7252
49
111,729
89
81,18023
129
27,09847
169
70,23053
209
17,23549
249
1,18275
10
89,86916
50
116,512
90
76,40117
130
26,52999
170
74,42776
210
16,34934
250
4,87536
11
86,88076
51
120,761
91
67,092
131
25,52401
171
76,59911
211
13,71285
12
85,9436
52
123,955
92
72,67155
132
26,69218
172
81,62053
212
14,75676
13
87,60686
53
124,244
93
68,10848
133
24,55269
173
83,42208
213
13,97169
14
86,25839
54
130,8
94
67,99088
134
27,71763
174
79,17451
214
12,42867
15
80,74976
55
133,296
95
63,34094
135
25,20297
175
88,56985
215
14,35519
16
83,03551
56
130,779
96
60,55253
136
25,61483
176
85,66525
216
7,70331
17
88,25837
57
132,057
97
56,18687
137
25,06893
177
86,55502
217
10,23441
18
82,01316
58
138,658
98
53,64482
138
27,6393
178
90,65907
218
11,78315
19
82,74098
59
142,925
99
53,70307
139
24,94851
179
84,2729
219
13,87768
20
83,30034
60
142,722
100
48,07893
140
25,86806
180
85,7222
220
4,5357
21
81,2785
61
144,125
101
42,21258
141
22,48183
181
83,10702
221
10,05928
22
81,85506
62
147,438
102
45,65181
142
26,90045
182
82,16884
222
8,42482
23
80,75195
63
148,265
103
41,69728
143
25,39919
183
80,42568
223
10,53312
24
80,09573
64
152,052
104
41,24946
144
17,90614
184
78,15692
224
9,60225
25
81,07633
65
147,386
105
39,21349
145
23,76039
185
79,79691
225
7,87751
26
78,81542
66
149,207
106
37,71696
146
25,89689
186
77,84378
226
6,25812
27
78,38596
67
148,954
107
36,68395
147
27,64231
187
74,50327
227
8,89987
28
79,93386
68
144,588
108
37,30393
148
22,86101
188
71,57289
228
7,87775
29
79,48474
69
148,123
109
37,43277
149
26,47003
189
65,88031
229
12,51191
30
79,95942
70
148,014
110
37,45012
150
23,72888
190
65,01385
230
10,66205
31
76,10691
71
143,889
111
32,64648
151
27,54334
191
60,19582
231
6,0354
32
78,3983
72
140,909
112
31,84347
152
30,52683
192
59,66726
232
6,79066
33
81,4306
73
143,443
113
31,39951
153
28,07261
193
52,95478
233
8,78354
34
82,48867
74
139,394
114
26,68912
154
34,92815
194
53,87792
234
4,60029
35
81,65462
75
135,988
115
32,25323
155
28,29194
195
44,91274
235
8,40091
36
80,84323
76
136,393
116
27,61008
156
34,19161
196
41,09909
236
7,21656
37
88,68663
77
126,726
117
33,58649
157
35,41207
197
41,68018
237
10,01741
38
84,74438
78
124,449
118
28,10714
158
37,09336
198
34,53379
238
7,33128
39
86,83934
79
122,865
119
30,26428
159
40,9833
199
34,86419
239
6,52786
40
85,97739
80
113,856
120
28,01648
160
39,53923
200
33,14787
240
2,842
Úloha C8.32 Odhad parametrů závislosti pH na teplotě u CBF média (18 Škopová) Experimentálně byla zjištěna hodnota pH media v závislosti na teplotě bioreaktoru, když měření bylo prováděno přímo v bioreaktoru. Pomocí dostupných pramenů byl navržen regresní model, který je vyjádřen β vztahem: y = β1 ⋅ x 2 , kde y je hodnota pH a x je teplota v °C. ◯ Data: Teplota x °C y pH Teplota x °C y pH 21,3 6,40 28,0 7,17 22,0 6,48 28,8 7,26 22,3 6,52 29,6 7,34 22,6 6,56 30,5 7,44 23,1 6,62 31,3 7,52 23,4 6,65 32,7 7,66 24,2 6,75 33,5 7,74 25,6 6,91 34,2 7,80 25,9 6,94 35,0 7,88 26,8 7,04
Úloha C8.33 Tvorba regresního modelu závislosti tenze nasycených par na teplotě (19 Štrajt) Tenze nasycených par je funkcí teploty a závislost tlaku nasycených par na teplotě je popsána řadou rovnic, např. Augustova, Antoineova a další. Uvedené rovnice obsahují parametry, jejichž hodnoty se získávají z experimentálních dat doposud obvykle po linearizaci modelu. Srovnejte hodnoty parametrů Augustovy rovnice, určených nelineární regresí s hodnotami parametrů po linearizaci a oba vztahy porovnejte. K odhadu hodnot parametrů použijte následující regresní modely
exp
Model 1.
Model 2.
exp
◯ Data: Teplota x (°C) 31 43 55 62 76 87 94 33 49 56 65 82 51 45 90
Tlak y (kPa) 4,492 8,639 15,73 21,84 40,18 62,49 81,46 5,03 11,74 16,51 25 51,33 12,96 9,583 70,11
Úloha C8.34 Nelineární regrese gaussovských signálů z preparativní LC (30 Krátká) Byla provedena optimalizace preparativní LC dělení dvousložkové směsi substituovaných nitroanilinů. Po dělení směsi na optimální náplňové koloně ze siliky byly objemové frakce o objemu 2 ml analyzovány UVspektrofotometrem při 260 nm v daných časových intervalech. Byl získán signál dvou gaussovských píků. Využitím nelineární regrese modelu gaussovského píku vypočítejte odhady retenčních časů, rozptylů a výšek obou píků. Diskutujte čtyři různé matematické regresní modely a věrohodnost jejich parametrů: Model 1: Model 2: Model 4:
Model 3: ◯ Data: x [min] 1,0 2,0 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2
Absorbance y [AU] -0,001 0,001 0,000 0,001 0,001 0,007 0,007 0,024 0,029 0,075 0,100 0,190 0,275 0,360 0,500
x [min] 5,9 6,0 6,1 6,2 6,3 6,4 6,5 6,6 6,7 6,8 6,9 7,0 8,0 9,0 10,0
Absorbance y [AU] 0,370 0,260 0,181 0,128 0,073 0,058 0,028 0,019 0,016 -0,006 -0,001 0,003 0,001 0,070 -0,003
x [min] 12,6 12,7 12,8 12,9 13,0 13,1 13,2 13,3 13,4 13,5 13,6 13,7 13,8 13,9 14,0
Absorbance y [AU] 2,360 2,630 2,740 2,917 2,960 2,881 2,870 2,700 2,440 2,260 1,950 1,700 1,477 1,178 0,969
4,3 4,4 4,5 4,6 4,7 4,8 4,9 5,0 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8
0,760 0,910 1,242 1,499 1,691 1,896 1,980 2,030 1,980 1,860 1,740 1,543 1,267 0,981 0,760 0,595
11,0 11,1 11,2 11,3 11,4 11,5 11,6 11,7 11,8 11,9 12,0 12,1 12,2 12,3 12,4 12,5
0,037 0,028 0,055 0,090 0,138 0,200 0,302 0,402 0,507 0,690 0,880 1,104 1,393 1,590 1,870 2,132
14,1 14,2 14,3 14,4 14,5 14,6 14,7 14,8 14,9 15,0 16,0 17,0 18,0 19,0 20,0
0,780 0,560 0,457 0,342 0,222 0,156 0,130 0,070 0,045 0,042 0,002 -0,003 0,057 0,000 -0,028
Úloha C8.35 Vyšetření experimentálních dat homogenní autokatalytické reakce (30 Krátká) Měřením obsahu produktu B v reakční směsi v daných časových intervalech se zjišťovalo, zda konverze A → B, probíhající v kapalném prostředí je autokatalytická. Počáteční koncentrace látky A byla c(Ao) = 2,0 mol/L a látky B c(Bo) = 0,16 mol/L. Rychlostní konstanta chemické reakce je k = 0,05 L/mol*h. Aplikujte nelineární regresi na uvedené kinetické modely a nalezněte nejlepší regresní model. Model 1: 1
Model 2:
exp
◯ Data: x [h] 0,00 0,01 0,02 0,03 0,05 0,08 0,10 0,50 0,80 1,00 1,50 2,00
y=c(B)-c(Bo) [mol/L] 0,0000 0,0010 0,0005 0,0005 0,0012 0,0011 0,0069 0,0120 0,0290 0,0091 0,0391 0,0558
x [h] 2,50 3,00 4,00 6,00 8,00 10,00 15,00 20,00 25,00 30,00 35,00 40,00
y=c(B)-c(Bo) [mol/L] 0,0382 0,0495 0,0627 0,1834 0,1421 0,1993 0,2600 0,4303 0,4008 0,6287 0,6541 0,7965
x [h] 45,00 50,00 55,00 60,00 65,00 70,00 75,00 80,00 85,00 90,00 95,00 100,00
y=c(B)-c(Bo) [mol/L] 0,8054 0,8829 0,8231 0,9338 0,9613 0,9054 0,9932 0,9874 0,9722 0,9522 0,9904 1,0000
Úloha C8.36 Navržení regresního modelu jaderné přeměny v čase (46 Lengyel) Na základě naměřených dat časové závislosti poklesu četnosti impulzů roztoku methyljodidu, značeného radionuklidem 131I – β- zářič, určete poločas jaderné přeměny 131I. ◯ Data: Hodnoty poklesu aktivity 131I v závislosti na čase x Čas [hod] y [Imp/Min]
0 5678
4 5587
7 5549
10 5485
15 5377
24 5230
30 5080
45 4850
60 4567
80 4270
120 3685
150 3320
180 2985
200 2765
Úloha C8.37 Navržení regresního modelu pro teplotní závislost zářivé energie uhlíkového vlákna (46 Lengyel) Metodou nelineární regrese je třeba vybrat vhodný dvouparametrový model teplotní závislosti zářivé energie , uhlíkového vlákna. Teplotní závislost zářivé energie lze vyjádřit mocninným regresním modelem kde y je zářivá energie a x teplota. Nezávisle proměnnou x je teplota v 1000 Kelvinech a závisle proměnnou y je energie emitovaná z cm2 za sekundu z uhlíkového vlákna. ◯ Data: Data převzata z http://www.itl.nist.gov/div898//strd/nls/data/daniel_wood.shtml Teplota x 1,309 1,471 1,490 1,565 1,611 1,680 Energie y 2,138 3,421 3,597 4,340 4,882 5,660
Úloha C8.38 Navržení regresního modelu dosahu α-částic, protonů, deuteronů v závislosti na jejich počáteční energii ve vzduchu (46 Lengyel) Z experimentálních dat závislosti dosahu jaderných částic α-částic, protonů, deuteronů ve vzduchu na jejich počáteční energii je třeba vyčíslit optimální parametry navržených regresních modelů pro jednotlivé jaderné částice. Na základě grafické závislosti dosahu jaderných částic lze soudit, že optimální regresní model bude v polynomickém tvaru buď nebo v mocninném tvaru , kde y je dosah v cm a x je počáteční energie částice v MeV. Postupně pro každou jadernou částici je třeba vyčíslit odhady parametrů p1, p2 a p3 podle prvního modelu a parametry p1 a p2 podle druhého modelu. Za počáteční odhady parametrů regresního modelu podle obou vztahů a pro každou částici zvolíme: p1 = p2 = p3 = 1, resp. p1 = p2 = 1. ◯ Data: Data dosahu jaderných částic, protonů, deuteronů a α částic, ve vzduchu v závislosti na jejich počáteční energii byla převzata z publikace V. Majer a kol., Základy jaderné chemie, Praha 1981. x [MeV] y protonů [cm] y deuteronů [cm] y α-částic [cm] 0,2 0,29 0,28 0,17 1 2,3 1,72 0,57 2 7,2 4,61 1,05 5 33,9 20,8 3,48 10 114,8 67,8 10,55 15 238,5 138,2 21,17 30 477 71
Úloha C8.39 Porovnání regresních modelů rotační enantiomerace 3-brom-2,4,6-trimethylfenyladamantylketonu na čase (50 Pokorný) Ve studii jsou porovnávány dva navržené regresní modely závislosti rotační enantiomerace 3-brom-2,4,6trimethylfenyladamantyl-ketonu na čase. Vyšetřením zjistěte, zda v datech nejsou vybočující body. Vytvořením obou nelineárních regresních modelů uvedené závislosti rozhodněte, který z navržených regresních modelů lépe popisuje uvedenou závislost Byly navrženy dva nelineární regresní modely A a B: Model 1: exp s počátečními parametry b1 = 450; b2 = 0,001 a exp s počátečními parametry b1 = 1; b2 = 450; b3 = 0,001. Model 2: Příklad je čerpán z bakalářské práce M. Holíka, MU Brno „Nelineární regrese v chemické kinetice“ na internetových stránkách http:/cheminfo.chemi.muni.cz/ktfch/holik/Pomucky/nelin_regr.pdf. ◯ Data: Čas x (s) Enantiomerace y (Α/Mdeg) Čas x (s) Enantiomerace y (Α/Mdeg) 0 464 2700 200 120 444 2940 186 240 425 3180 172 360 412 3540 155 480 395 3900 139 660 375 4260 125 900 357 4620 113
1260 1500 1740 1980 2220 2460
311 288 267 247 231 212
4980 5340 5700 6060 6420 6780
102 93 84 77 68 62
Úloha C8.40 Stanovení koncentrací ropných látek na motorovou naftu jako standard (55 Huzlík) Pro účely stanovení koncentrací ropných látek (index C10-C40) se používá souhrnné integrace píků všech uhlovodíků od n-alkanu C10 do C40. Bylo integrováno s potlačením detekce základní linie a jako kalibrační látka byla použita motorová nafta NM4B, impregnační kapalina na pražce IPO 90 a kerosin. Pokuste se navrhnout rovnici pro kalibrační křivku. Při odvozování tvaru kalibrační křivky lze předpokládat, že v systému existuje sorpce na povrchu nádob, ve kterých se připravují kalibrační roztoky. „Koncentrace“ míst schopných vázat analyt je omezená a lze ji chápat jako maximálně možný počet molů stanovované látky pevně vázaný ve vrstvě určité tloušťky (např. monomolekulární vrstva) na povrchu celé nádoby pod hladinou rozpouštědla, vztažený na celkový objem roztoku. O aktuální koncentraci sorbovaného analytu je proto třeba snížit celkovou koncentraci roztoku danou množstvím analytu a rozpouštědla použitých k jeho přípravě. Při odvození regresního modelu předpokládejme, že sorpce je dána reakcí druhého řádu
C10-40
+
↔ C10−40 .S
S
V rovnováze platí
K=
[C10−40 .S ] [C10−40 ]⋅ [S ]
(1.1)
kde [C10-40] aktuální koncentrace analytu v roztoku, [S] aktuální koncentrace míst volných pro sorpci (volná sorpční kapacita), [C10-40.S] koncentrace nasorbovaného analytu. Z materiálové bilance plyne pro celkovou koncentraci analytu v roztoku cA = [C10-40] + [C10-40.S] (1.2) a pro celkovou koncentraci míst volných k dispozici pro sorpci (sorpční kapacitu) (1.3) S0 = [S] + [C10-40.S] Za předpokladu lineární závislosti plochy píků na aktuální koncentraci platí
A = b0 + b1 ⋅ [C10−40 ]
(1.4)
a po dosazení ze vztahů (1.1), (1.2) a (1.3) do (1.4) bude výslední regresní model
(
A = p1 + p 2 ⋅ c A − p3 − p 4 + kde p1=b0, p2 =
(c A + p3 − p4)2 + 4 ⋅ p3 ⋅ p4
)
(1.5)
b1 1 , p3 = , p4=S0. K 2
◯ Data: Vzhledem k velikosti odezvy A byly ke kalibraci použity hodnoty odezvy vydělené číslem 1 000 000 – A-tr. Název vzorku c [mg/l] A-tr A IPO 90 0 162 418 0.162418 IPO 90 16 411 006 0.411006 NM4B 31 501 813 0.501813 IPO 90 64 1 211 508 1.211508 NM4B 155 1 637 894 1.637894 NM4B 309 4 520 061 4.520061 IPO 90 320 5 265 180 5.26518 IPO 90 640 10 849 049 10.849049
NM4B IPO 90 KEROSEN NM4B
773 1 600 7 800 15 330
13 199 058 28 553 043 171 429 020 473 880 462
13.199058 28.553043 171.42902 473.880462
Úloha C8.41 Hledání regresního modelu teplotní závislosti počátečních rychlostí polymerace styrenu (59 Kováčik) Pro počáteční rychlost polymerace styrenu v závislosti na teplotě v rozmezí 120-150°C byly navrženy tyto regresní modely: exp
Model C3P:
1198 exp Model C2P: Model EF: exp Model HCM: Model LF: Model QF: / ln Model VPM: exp Analýzou regresního tripletu nelineární regrese rozhodněte, který z předložených modelů nejlépe odpovídá naměřeným datům. K rozlišení mezi modely užijte především kritérií těsnosti proložení, střední kvadratické chyby predikce MEP a Akaikova informačního kritéria AIC. Posuďte kvalitu nalezených odhadů parametrů, kvalitu dosažené těsnosti proložení a predikční schopnost jednotlivých regresních modelů. Komentujte i citlivost jednotlivých parametrů modelů. Nulté přiblížení parametrů řešte u každého modelu individuálně. ◯ Data: x [K] 393,16 398,16 403,16 408,16 413,16 418,16 423,16 y [%/h] 13,06 18,18 23,45 33,32 49,39 53,12 65,88
Úloha C8.42 Odhad bodu ekvivalence nelineární regresí lineárních větví konduktometrické titrační křivky NaOH roztokem HCl (59 Kováčik) Nalezněte intervalový odhad bodu ekvivalence analýzou dvou přímkových větví konduktometrické titrace NaOH kyselinou chlorovodíkovou. Rovnice přímkových úseků jsou y1 = a+b*V pro V
0 980
1 920
2 890
3 890
4 830
5 830
6 750
7 710
8 720
9 640
10 640
11 560
12 540
13 550
V HCl [mL] y [mS]
14 460
15 450
16 390
17 350
18 350
19 340
20 250
21 250
22 240
23 400
24 650
25 950
26 1110
27 1550
8.2.3 Analýza environmetálních, potravinářských a zemědělských dat – pokračovací úlohy Úloha E8.19 Vztah mezi tloušťkou a výškou semenáčků lesních dřevin Obecný vztah mezi tloušťkou a výškou semenáčků lesních dřevin je vyjádřen výškovými křivkami. Určete
optimální výškovou křivku pro jednoleté semenáčky buku lesního. Pro konstrukci a porovnání výškových křivek byly použity dvě funkce: 1.3
Model 1. Funkce Naeslundova
Model 2. Funkce Michajlovova
)+1.3
◯ Data: Průměr kořenového krčku x [mm], výška y [cm]: x y 5.7 36 ... ... 6.0 46
Úloha E8.20 Sledování dvou říčních profilů křivkou postupových dob průtoků (KPDP) (…) Při sledování dvou říčních profilů slouží KPDP k vyjádření vztahu mezi vodním stavem čili výškou hladiny x popř. průtoku na horním profilu a postupovou dobou y, což je čas, který uplyne mezi výskytem vrcholu v horním a dolním profilu. KPDP má charakteristický průběh pro sledovanou řeku či úsek toku, jde o konkávní křivku. Křivka postupových dob průtoků znázorňuje obrázek studované závislosti. Je třeba nalézt model, který nejtěsněji prokládá data získaná v letech 1977 – 1994 na dvou profilech řeky Berounky u Křivoklátu a Berouna užitím následujících tří modelů: Model 1: ln Model 2 (polynom): … Model 3 (spline): proložení bodů více polynomy druhého popř. třetího stupně
◯ Data: x [cm] 321 80 444 374 393 278 242 266 250 283 266 280 278 118 235 140
y [h] 0.5 4.5 3.5 5.5 3.75 4 4.5 4 3 4 4 3 3.25 2.5 4 4.25
x [cm] 410 565 250 160 262 173 240 138 142 50 223 201 272 285 293 198
y [h] 4 0.25 3 2 5 6.5 8 3.5 4.5 6 5.5 3.5 5.5 4.25 4 2.5
x [cm] 249 257 189 281 117 460 267 223 172 194 191 210 337 172 91 58
y [h] 2 7.25 5 2 4 6.25 7.5 5.5 6 4 4.5 4 4 4.75 3 2.5
x [cm] 86 243 234 213 247 72 100 116 163 120 358 161 192
y [h] 0.5 3 11.5 4 3.75 4 4 5.5 2 1.5 0 2.65 3.4
Úloha E8.21. Model časové závislosti růstu plodiny (06 Galuszková) V časovém období 10 měsíců byl sledován růst popínavé rostliny y (cm). Na základě analýzy regresního tripletu rozhodněte, který z testovaných růstových modelů (Schnuteho model, Mitscherlichův, Gompertzův a logistický) nejlépe odpovídá naměřeným datům.
◯ Data: x je časové období (měsíce), y je nárůst popínavé rostliny (cm). 1 2 3 4 5 6 x 40 49 63 78 100 121 y
7 144
8 154
9 160
Úloha E8.22 Nalezení nejvhodnějšího modelu růstového modelu (14 Novotný) Pro data ze smrkového porostu z Orlických hor je třeba vybrat nejvhodnější regresní model růstové křivky. Závisle proměnnou veličinou je výška stromů y, nezávisle proměnnou věk x. Obvyklé testované modely růstové křivky jsou Schnuteho model
1
exp 1
Mitscherlichův model
pro p4 > 1. exp
Richardsův model Gompertzův model
1 exp
exp exp
Logistický model ◯ Data: Vstupní data
1
exp
Rok
Věk x
1974 1975
pro p4 = -1. pro p4 < 1. . pro p4 = 1. Výška stromu y pořadového čísla
1.
3.
5.
7.
13.
14.
16.
17.
18.
16 17
317 335
270 309
132 160
298 336
236 261
363 388
193 244
104 133
89 111
1976
18
385
343
195
368
298
419
288
166
125
1977
19
432
376
225
383
343
460
313
203
146
1978
20
454
417
259
418
378
502
335
243
175
1979
21
484
479
312
454
416
538
379
291
212
1980
22
513
529
342
492
463
582
416
319
248
1981
23
548
588
362
526
495
623
427
352
284
1982
24
596
637
371
558
525
632
443
401
308
1983
25
629
680
397
582
567
652
505
453
327
1984
26
659
728
434
620
614
707
565
503
376
1985
27
713
777
472
661
659
769
615
548
427
1986
28
739
817
518
701
699
826
678
601
476
1987
29
781
860
569
746
747
898
736
655
544
1988
30
834
907
603
792
775
964
788
703
605
1989
31
865
947
642
830
802
1031
839
747
663
1990
32
907
993
690
862
842
1097
895
795
724
1991
33
953
1043
732
896
890
1152
940
848
790
1992
34
991
1084
772
925
937
1199
979
905
845
1993
35
1032
1090
810
950
966
1235
1007
963
909
1994
36
1074
1118
850
976
1001
1293
1060
1008
961
1995
37
1117
1146
881
998
1036
1378
1121
1062
1018
1996
38
1172
1192
905
1031
1072
1428
1138
1105
1060
1997
39
1201
1223
951
1063
1123
1488
1151
1139
1103
1998
40
1235
1255
985
1084
1166
1557
1198
1178
1159
1999
41
1269
1283
1012
1098
1206
1607
1245
1210
1213
2000
42
1320
1303
1042
1135
1249
1665
1299
1257
1268
2001
43
1368
1343
1072
1170
1298
1722
1351
1302
1328
Úloha E8.23 Parametry Korfovy růstové funkce mladého smrkového porostu v Orlických horách (14 Novotný) V roce 2002 byly v Orlických horách měřeny výškové přírůsty y v mladých smrkových porostech. Úkolem je nalézt nejlepší odhady parametrů Korfovy růstové funkce pro tato data. Korfova růstová funkce má tvar exp
1 kde y je závisle proměnná výška stromu, x je věk stromu ◯ Data: Výška stromu y pořadového čísla Rok Věk 1. 3. 5. 7. 13. 14. 1974 16 317 270 132 298 236 363 1975 17 335 309 160 336 261 388 1976 18 385 343 195 368 298 419 1977 19 432 376 225 383 343 460 1978 20 454 417 259 418 378 502 1979 21 484 479 312 454 416 538 1980 22 513 529 342 492 463 582 1981 23 548 588 362 526 495 623 1982 24 596 637 371 558 525 632 1983 25 629 680 397 582 567 652 1984 26 659 728 434 620 614 707 1985 27 713 777 472 661 659 769 1986 28 739 817 518 701 699 826 1987 29 781 860 569 746 747 898 1988 30 834 907 603 792 775 964 1989 31 865 947 642 830 802 1031 1990 32 907 993 690 862 842 1097 1991 33 953 1043 732 896 890 1152 1992 34 991 1084 772 925 937 1199 1993 35 1032 1090 810 950 966 1235 1994 36 1074 1118 850 976 1001 1293 1995 37 1117 1146 881 998 1036 1378 1996 38 1172 1192 905 1031 1072 1428 1997 39 1201 1223 951 1063 1123 1488 1998 40 1235 1255 985 1084 1166 1557 1999 41 1269 1283 1012 1098 1206 1607 2000 42 1320 1303 1042 1135 1249 1665 2001 43 1368 1343 1072 1170 1298 1722
16. 193 244 288 313 335 379 416 427 443 505 565 615 678 736 788 839 895 940 979 1007 1060 1121 1138 1151 1198 1245 1299 1351
17. 104 133 166 203 243 291 319 352 401 453 503 548 601 655 703 747 795 848 905 963 1008 1062 1105 1139 1178 1210 1257 1302
18. 89 111 125 146 175 212 248 284 308 327 376 427 476 544 605 663 724 790 845 909 961 1018 1060 1103 1159 1213 1268 1328
Úloha E8.24 Tvorba modelu pro odhad věku stromu dle jeho výčetní tloušťky (17 Russ) Při statistické inventarizaci lesů pro LS Prášily v národním parku Šumava byl sledován vztah mezi střední tloušťkou x a věkem y u rychle rostoucích jehličnatých dřevin. Pro 5 cm tloušťkové intervaly x, reprezentované střední hodnotou byl vypočten průměrný věk y. Pro analýzu byly pak využity pouze plochy (stromy) z hospodářského souboru tak, aby byly zaručeny stanovištně podobné podmínky u všech
vzorníkových stromů. Cílem úlohy je najít nejvhodnější nelineární regresní model, s jehož pomocí bude možné definovat funkci pro odhad věku stromu dle jeho výčetní tloušťky. ◯ Data: Data výčetních tloušťek x (nezávisle proměnná) a odpovídajícího věku y (závisle proměnná) měřených vzorníkových stromů. x DBH [cm] y Věk [roky] 10 14 15 34 20 51 25 59 30 69 35 76 40 85 45 89 50 102 55 107 60 112 65 120 70 125 75 130 80 133 85 140 90 142 95 144 100 145
Úloha E8.25 Tvorba modelu vyhlazení výškového grafikonu a predikční dopočet chybějících výšek (17 Russ) Při statistické inventarizaci lesa se zřídka měří výšky všech stromů na ploše. Často to je neproveditelné s ohledem na podmínky v porostu, kdy například vrchol některých stromů je v zákrytu a nelze jej změřit nebo je to časově náročné. Z toho důvodu se většinou měří jen vzorek stromů rovnoměrně rozložený napříč tloušťkovým spektrem stromů na ploše a pro ostatní stromy se výška modeluje na základě vyrovnaného výškového grafikonu, což je graf poměru výčetní tloušťky a výšky stromu. K vyhlazení výškového grafikonu se běžně používají regresní postupy. Cílem úlohy je najít nelineární regresní model, pomocí kterého bude možné dopočítat chybějící výšky neměřených stromů. ◯ Data: Data výčetních tloušťek x (nezávisle proměnná) a odpovídajících výšek y (závisle proměnná) měřených vzorníkových stromů. x DBH mm y Výška m 347 27.4 466 29 272 25.4 353 27.5 275 23.2 323 27.3 435 28.8 306 23.5 454 28.9 474 30.3 377 27.5 345 27 286 25.7
352 427 232 465 310 254 483
27.6 32.5 20 32.4 25.1 25.7 29.8
Úloha E8.26 Hledání nejlepšího regresního modelu k výpočtu objemu kmene (17 Russ) Je třeba provést porovnání několika vybraných regresních modelů pro výpočet objemu kmene. Ve vybraném borovém porostu bylo provedeno měření kmenového profilu x pokácených vzorníkových stromů metodou měření po sekcích. Následně byly vypočteny objemy těchto stromů y. Cílem této studie je vzájemně porovnat vybrané funkce a určit nejvhodnější růstovou funkci pro naměřená experimentální data: Model Korsuňovy růstové funkce exp ln ln Model Michajlovovy růstové funkce 1.3 exp ◯ Data: Číslo stromu 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
x DBH (mm) 259 254 228 223 193 239 247 331 261 148 195 208 341 243 220 209 209 285 203 193 238 194 175 210 140 221 231 290 162 251 264
y Objem (m3) 0.553 0.534 0.435 0.416 0.302 0.477 0.507 0.827 0.561 0.130 0.309 0.359 0.866 0.492 0.405 0.363 0.363 0.652 0.340 0.302 0.473 0.305 0.233 0.366 0.100 0.408 0.446 0.671 0.184 0.523 0.572
32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
200 178 294 232 248 258 300 231 168 189 249 205 259 205 247 234 334 250 245 290 200 266 225 212 256 248 132 198 204 300 338 202 288 290 220 202 355 255 227 346 323 263 211 236 328 249 235 286 180
0.328 0.244 0.686 0.450 0.511 0.549 0.709 0.446 0.206 0.286 0.515 0.347 0.553 0.347 0.507 0.458 0.839 0.519 0.500 0.671 0.328 0.580 0.424 0.374 0.542 0.511 0.069 0.321 0.344 0.709 0.854 0.336 0.664 0.671 0.405 0.336 0.919 0.538 0.431 0.885 0.797 0.568 0.370 0.465 0.816 0.515 0.462 0.656 0.252
81 82 83 84 85 86 87 88 89 90
321 289 242 294 216 299 299 283 289 237
0.789 0.667 0.488 0.686 0.389 0.705 0.705 0.645 0.667 0.469
Úloha E8.27 Tvorba modelu výškových křivek stromů dle jejich průměru (21 Souček) Pro výpočet výškových křivek stromů dle jejich průměru na pokusné ploše byly použity různé regresní funkce s rozdílným počtem nelineárních parametrů: Model logaritmické funkce
ln Prodanův model
.
Naeslundův model
1.3 .
.
Který model výškové křivky prokládá data nejlépe? Má rozdílný počet neznámých parametrů vliv na přesnost jejich odhadu? ◯ Data: Průměr x Výška y 23 22.5 26.2 23.5 12.7 18 29.5 24.5 29.2 24.5 21.5 22.5 26.1 24 15.1 19 25.4 24.2 15.7 19.5 18.6 20 17.9 21 25.7 24.5 26.1 23 17.7 19.5 13.2 18.5 22 23 26.3 23.5 19.7 21 31 24.5 25.1 22.5 29.6 25 24.7 23.5 24.4 22.5 14.7 18.5 21.3 22 23.3 23
27.4 19.8 13.5 13.7 25.6 12.3 20.2 24 19.3 16.8 21.7 17.7 23.2 14 21.4 30.7 37.7 25.7 23.1 23.4 25.1 26.6 19.5 20.7 16.2 25.5 31 23.4 26.5 14.6 21.9 29.9 29.9 27.8 21.7 14.6 25.1 28.1 29 21 27.8 28.8 23.2 28.5 29.7 12.8 15.7 26.6 29.7
24.5 21.5 20 20 24 18 22 23.5 20.5 21.5 23 22 23 19.5 23 25.5 26 23.5 24 24 24.5 24 23 23.5 20.5 23.5 25 24 25 17 24 25 25.5 25 23 18.5 24 25 24.5 23.5 25 25.5 23.5 25 26 16.5 20 25 25
23.3 24.4 16.3 24 27 37.6 29.4 38.5 29.4 22.3
24 24.5 20.5 25 25 26.5 25.5 26 25 23.5
Úloha E8.28 Tvorba modelu výškových křivek stromů a výška nasazení zelené koruny na pokusné ploše (21 Souček) Výpočet výškových křivek stromů (výška stromů y1, výška nasazení zelené koruny y2) dle jejich průměru x na pokusné ploše byly použity různé regresní funkce s rozdílným počtem nelineárních parametrů: ln
Model logaritmické funkce
.
Naeslundův model
Prodanův model
.
◯ Data: Průměr x 48 44 36 32 16 28 12 32 20 16 36 16 16 20 36 44 28 28 12 12 24 24 24 28 20 24 32 24
Výška y1 31 31 28 26 17 26 18.5 30.5 23 15 28 17 16 17 30 30 27 29 9 14 21 26 27 32 22 24 28 22
Koruna y2 20 18 11 17 11 12 11 12 16 10 13 12 10 9 16 19 11 18 9 9 14 9 16 16 15.5 15 15 14
1.3 .
32 28 28 28 36 12 20 28 16 20 40 44 16 24 12 28 20 28 36 12
29 28.5 27 27 33 14 23 30 20.5 28 30 31.5 21 19 14 26 22 28 32.5 10
18 18 18 14 18 9 14.5 14 9 15 17 19 13 11 9 17.5 16 12 13 8
Úloha E8.29 Stanovení růstové křivky nárůstu populace bizonů v Yellowstonském národním parku v letech 1902 – 1931 (50 Pokorný) Populace bizonů během let 1902 až 1931 zažila prudký vzestup. Růstová křivka populace bizonů má v tomto období sigmoidální charakter. Populace byla limitována mnoha faktory, jako je množstvím potravy, vody, rozlohou, apod. Vyšetřením zjistěte, který z obecných vztahů růstové křivky nejlépe odpovídá růstu populace bizonů v Yellowstonském národním parku v letech 1902 – 1931. K rozlišení mezi nelineárními regresními modely využijte především kriteria těsnosti proložení. Příklad je převzat z projektu Intermath/ILAP univerzity v Karolíně (USA), který hodnotil nárůst populace severoamerických bizonů v Yellowstonském národním parku v minulém století. Data jsou z http://www.faculty.salisbury.edu/~dccathcart/MATH465/ClassSessions/bisondata.pdf, a počet hodnot údajů 26. Byly použity obecné nelineární regresní modely: Model A (Schnuteho): Model B (Mitscherlichův): Model C (Richardsův): Model D (Gompertzův): Model E (Logistický):
◯ Data: x 1 2 3 4
Rok 1902 1903 1904 1905
y=
β1 [1 + β 4 exp (β 2 β 3 − β 3 x)]1 β
y=
β1 [1 − exp ( β 2 β 3 − β 3 x)]
4
y=
y = β1 exp [− exp ( β 2 − β 3 x)]
y=
Populace y (ks) 44 47 51 74
x 14 15 16 17
β1 [1 + exp ( β 2 − β 3 x)]1 β
4
β1 1 + exp ( β 2 − β 3 x) Rok 1917 1919 1920 1921
Populace y (ks) 397 504 501 602
5 6 7 8 9 10 11 12 13
1907 1908 1909 1910 1911 1912 1913 1915 1916
84 95 118 149 168 192 215 270 348
18 19 20 21 22 23 24 25 26
1922 1923 1925 1926 1927 1928 1929 1930 1931
647 748 830 931 1008 1057 1109 1124 1192
Úloha E8.30 Stanovení časové závislosti koncentrace pracových částic PM2.5 v ovzduší v městské lokalitě (55 Huzlík) Na lokalitě Arboretum v Brně byly v období 4. 4. 2005 až 5. 3. 2006 měřeny 24hodinové koncentrace prachových částic PM2.5 v ovzduší. Pokuste se navrhnout regresní model pro časovou závislost těchto koncentrací v měřeném období. Je třeba znázornit časový průběh koncentrací PM2.5 značený y za celé měřené období. Z grafu výsledků měření prachových částic vyplývá, že v chladnějším období jsou koncentrace vyšší než v teplejším období. Nejjednodušším vyjádřením časového chodu koncentrací y je proložení bodů sin 2 , kde je střední koncentrace PM2.5 za celé goniometrickou funkcí, např. sinem, je střední odchylka koncentrací PM2.5 od střední hodnoty v teplém a studeném období, měřené období, je parametr charakterizující délku periody časové závislosti, je parametr charakterizující polohu „podzimní“ střední hodnoty koncentrace PM2.5. Za předpokladu, že délka periody časové závislosti bude shodná s délkou obsahovat číslo 1. Na základě statistických testů v souvislosti roku, bude interval spolehlivosti parametru s regresním modelem mezi povětrnostními podmínkami a koncentracemi pevných částic lze bod číslo dne 335 vyloučit jako odlehlý, kdy byly pravděpodobně zcela odlišné rozptylové podmínky, než u ostatních dní měření. ◯ Data: v datech je uvedena část tabulky, kde x je pořadové číslo dne měření od 1. 1. 2005 a y je příslušná koncentrace prachových částic. Datum Den x y 4.4.2005 94 35.8 5.4.2005 95 41.1 6.4.2005 96 37.3 7.4.2005 97 38 8.4.2005 98 27.9 9.4.2005 99 8.9 10.4.2005 100 13.9 23.5.2005 143 18.2 24.5.2005 144 16.2 25.5.2005 145 20.6 26.5.2005 146 20.6 27.5.2005 147 26.2 28.5.2005 148 20.6 29.5.2005 149 22.8 27.6.2005 178 19.1 28.6.2005 179 13.4 29.6.2005 180 17.9 30.6.2005 181 25.8 1.7.2005 182 18.2 2.7.2005 183 22.2 3.7.2005 184 29.6
22.8.2005 23.8.2005 24.8.2005 25.8.2005 26.8.2005 27.8.2005 28.8.2005 10.10.2005 11.10.2005 12.10.2005 13.10.2005 14.10.2005 15.10.2005 16.10.2005 28.11.2005 29.11.2005 30.11.2005 1.12.2005 2.12.2005 3.12.2005 4.12.2005 16.1.2006 17.1.2006 18.1.2006 19.1.2006 20.1.2006 21.1.2006 22.1.2006 27.2.2006 28.2.2006 1.3.2006 2.3.2006 3.3.2006 4.3.2006 5.3.2006
234 235 236 237 238 239 240 283 284 285 286 287 288 289 332 333 334 335 336 337 338 381 382 383 384 385 386 387 423 424 425 426 427 428 429
25.7 20 27 30.4 12.6 23.9 22.8 35.4 41.1 49.1 51.2 42.8 48.5 12.4 49.5 34.5 41.3 86 58.8 33.4 39.5 43.2 55.1 58.1 33.6 59.5 22.2 33 30.4 47.1 31 32.7 34 22.1 37.2
8.2.4 Analýza hutnických a mineralogických dat – pokračovací úlohy Úloha H8.02 Odhady parametrů závislosti vodivosti termistoru na teplotě (Kompendium) Meyer a Roth odvodili závislost vodivosti y termistoru na teplotě x ve formě
exp
) , která říká, že
vodivost termistoru y se zvyšuje s teplotou x [̊C]. Regresní model by měl vykazovat aditivní chyby. Jelikož však rezidua vykazují evidentní heteroskedasticitu, jeví se zde pravděpodobnější případ multiplikativních , který je třeba ověřit. Rozhodněte, který ze chyb. Pak bude platit i alternativní model log dvou navržených modelů platí, vyšetřete regresní triplet a odhadněte neznámé parametry vybraného modelu. Uveďte pět možných komplikací procesu nelineární regrese. ○Data: Teplota x [̊C], vodivost termistoru y [Ω-1]:
x 50 ... 125
y 34.78 ... 2.87
8.2.5 Analýza matematických modelů a fyzikálních dat – pokračovací úlohy Úloha S8.16 Model sigmoidální růstové křivky k testování algoritmů (Ratkowsky) (Kompendium) Nelineární regresní model se týká prokládání sigmoidální růstové křivky daty, ve kterých nezávisle proměnnou tvoří čas x a závisle proměnnou y výtěžnost pastviny. Ratkowsky99 navrhl následující model 1 exp ◯ Data: Nezávisle proměnná x, závisle proměnná y. Pro počáteční odhady parametrů β1 , β2 , β3 jsou doporučeny hodnoty 100, 1.0, 0.1, nebo 75, 2.5, 0.07: x y 9 8.93 ... ... 42 30.35
Úloha S8.17 Změna tepelného odporu koberců vlivem opotřebení (01 Bajzík) Základní užitnou vlastností koberců je její tepelná izolace, která může být charakterizována tepelným odporem R [Km2W-1], tj. odporem y vůči vedení tepla. Používáním dochází k opotřebení koberců, a tím i ke změně tepelných vlastností. Cílem této úlohy je modelovat změny tepelného odporu pomocí simulovaného opotřebení. Pro simulaci opotřebení bylo použito zařízení tetrapod. Tepelný odpor byl měřen po 10, 20, 30, 40, 50, 100 a 200 tisících otáčkách, cyklech x. Navržené modely k testování jsou Model A: y = β1 + β 2 e
− β3 x
,
β
Model B: y = β1 − β 2 x 3 ,
Model C: y = β1 −
β2 1 + β3 x
◯ Data: Koeficienty βi jsou odhadovány počátečním odhadem, které jsou pro všechny modely shodné 100, 30, 0,0001. Počet cyklů x Tepelný odpor y 0 124,2 10000 101,2 20000 95,6 30000 90,1 40000 89,9 50000 88,8 100000 88,1 200000 86,6
Úloha S8.18 Ověření kvality čisté páry (08 Jelínková) Při sterilizaci pomocí čisté páry (SIP) je jedním z požadavků ověření kvality páry porovnání naměřených hodnot teploty a tlaku s tabelovanými. Je přitom stanovena maximální přípustná odchylka naměřených hodnot od hodnot tabelovaných. Podmínkou k vyhodnocení je měření teploty a tlaku vždy v jednom místě zařízení. Ve většině případů se experimentální hodnoty nacházejí mezi hodnotami tabelovanými a k porovnání konkrétních hodnot je třeba provádět pro každou naměřenou hodnotu extrapolaci hodnot tabelovaných. Navrhněte model tabelovaných hodnot, kde nezávisle proměnou bude tlak x a závisle proměnou teplota y. ◯ Data:
Tlak x [bar] 1,00 1,20 1,40 1,60 1,80 2,00 2,20 2,40 2,60 2,80 3,00 3,20 3,40 3,60 3,80 4,00 4,20 4,40 4,60 4,80 5,00
Teplota y [°C] 99,63 104,81 109,32 113,32 116,93 120,23 123,27 126,09 128,73 131,20 133,54 135,76 137,86 139,87 141,79 143,62 145,39 147,09 148,73 150,31 151,85
Úloha S8.19 Závislost tlaku čisté páry na teplotě (08 Jelínková) Při sterilizaci pomocí čisté páry (SIP) je prováděna kontrola účinnosti parní sterilizace sledováním tlaku čisté páry. Naměřený tlak a teplota čisté páry se porovnává s tabelovanými hodnotami. Z výsledných rozdílů lze posoudit, zda pára je přehřátá a nebo zda je přesycená. Dle těchto údajů je možné upravit vstupní parametry páry. Podmínkou k vyhodnocení je měření teploty x a tlaku y na stejném místě zařízení. Ve většině případů se experimentální hodnoty nacházejí mezi hodnotami tabelovanými a pro porovnání konkrétních hodnot je třeba provádět pro každou naměřenou hodnotu extrapolaci hodnot tabelovaných. Navrhněte model tabelovaných hodnot, kde nezávisle proměnou bude teplota a závisle proměnou tlak. ◯ Data: Teplota x [°C] 100 102 104 106 108 110 112 114 116 118 120 122 124 126 128 130
Tlak y [bar] 1,01325 1,08776 1,16675 1,25042 1,33898 1,4326 1,5316 1,6361 1,7464 1,8628 1,9854 2,1145 2,2503 2,3932 2,5434 2,7012
132 134 136 138 140
2,8668 3,0406 3,2227 3,4137 3,6136
Úloha S8.20 Tvorba modelu při kalibraci ultrazvukového čidla (19 Štrajt) Byla naměřena data pro závislost odezvy ultrazvukového signálu y na vzdálenosti měřících kovových ploch x. . Pomocí nelineární regrese proveďte věrohodný odhad Byl navržen regresní model ve tvaru
parametrů tohoto modelu. ◯ Data: Převzata z internetu http://www.itl.nist.gov/div898/handbook/pmd/section6/pmd631.htm. y x yt 92.9 0.5 9.638465 78.7 0.625 8.871302 64.2 0.75 8.01249 64.9 0.875 8.056054 57.1 1 7.556454 43.3 1.25 6.580274 31.1 1.75 5.576737 23.6 2.25 4.857983 31.05 1.75 5.572253 23.775 2.25 4.875961 17.7375 2.75 4.211591 13.8 3.25 3.714835 11.5875 3.75 3.404042 9.4125 4.25 3.06798 7.725 4.75 2.779388 7.35 5.25 2.711088 8.025 5.75 2.832843 90.6 0.5 9.518403 76.9 0.625 8.769265 71.6 0.75 8.461678 63.6 0.875 7.974961 54 1 7.348469 39.2 1.25 6.26099 29.3 1.75 5.412947 21.4 2.25 4.626013 29.175 1.75 5.401389 22.125 2.25 4.703722 17.5125 2.75 4.184794 14.25 3.25 3.774917 9.45 3.75 3.074085 9.15 4.25 3.024897 7.9125 4.75 2.812917 8.475 5.25 2.911185 6.1125 5.75 2.472347 80 0.5 8.944272 79 0.625 8.888194
63.8 57.2 53.2 42.5 26.8 20.4 26.85 21 16.4625 12.525 10.5375 8.5875 7.125 6.1125 5.9625 74.1 67.3 60.8 55.5 50.3 41 29.4 20.4 29.3625 21.15 16.7625 13.2 10.875 8.175 7.35 5.9625 5.625 81.5 62.4 32.5 12.41 13.12 15.56 5.63 78 59.9 33.2 13.84 12.75 14.62 3.94 76.8 61 32.9
0.75 0.875 1 1.25 1.75 2.25 1.75 2.25 2.75 3.25 3.75 4.25 4.75 5.25 5.75 0.5 0.625 0.75 0.875 1 1.25 1.75 2.25 1.75 2.25 2.75 3.25 3.75 4.25 4.75 5.25 5.75 0.5 0.75 1.5 3 3 3 6 0.5 0.75 1.5 3 3 3 6 0.5 0.75 1.5
7.98749 7.563068 7.293833 6.519202 5.176872 4.516636 5.181699 4.582576 4.057401 3.539068 3.246152 2.930444 2.66927 2.472347 2.441823 8.608136 8.203658 7.797435 7.449832 7.092249 6.403124 5.422177 4.516636 5.418718 4.598913 4.094203 3.63318 3.297726 2.859196 2.711088 2.441823 2.371708 9.027735 7.899367 5.700877 3.522783 3.622154 3.944617 2.372762 8.831761 7.739509 5.761944 3.720215 3.570714 3.823611 1.984943 8.763561 7.81025 5.735852
13.87 11.81 13.31 5.44 78 63.5 33.8 12.56 5.63 12.75 13.12 5.44 76.8 60 47.8 32 22.2 22.57 18.82 13.95 11.25 9 6.67 75.8 62 48.8 35.2 20 20.32 19.31 12.75 10.42 7.31 7.42 70.5 59.5 48.5 35.8 21 21.67 21 15.64 8.17 8.55 10.12 78 66 62 58
3 3 3 6 0.5 0.75 1.5 3 6 3 3 6 0.5 0.75 1 1.5 2 2 2.5 3 4 5 6 0.5 0.75 1 1.5 2 2 2.5 3 4 5 6 0.5 0.75 1 1.5 2 2 2.5 3 4 5 6 0.5 0.625 0.75 0.875
3.724245 3.436568 3.648287 2.332381 8.831761 7.968689 5.813777 3.544009 2.372762 3.570714 3.622154 2.332381 8.763561 7.745967 6.913754 5.656854 4.711688 4.750789 4.338202 3.73497 3.354102 3 2.582634 8.70632 7.874008 6.9857 5.932959 4.472136 4.507771 4.394315 3.570714 3.228002 2.703701 2.723968 8.396428 7.713624 6.964194 5.98331 4.582576 4.655105 4.582576 3.954744 2.858321 2.924038 3.181195 8.831761 8.124038 7.874008 7.615773
47.7 37.8 20.2 21.07 13.87 9.67 7.76 5.44 4.87 4.01 3.75 24.19 25.76 18.07 11.81 12.07 16.12 70.8 54.7 48 39.8 29.8 23.7 29.62 23.81 17.7 11.55 12.07 8.74 80.7 61.3 47.5 29 24 17.7 24.56 18.67 16.24 8.74 7.87 8.51 66.7 59.2 40.8 30.7 25.7 16.3 25.99 16.95
1 1.25 2.25 2.25 2.75 3.25 3.75 4.25 4.75 5.25 5.75 3 3 3 3 3 3 0.5 0.75 1 1.5 2 2.5 2 2.5 3 4 5 6 0.5 0.75 1 1.5 2 2.5 2 2.5 3 4 5 6 0.5 0.75 1 1.5 2 2.5 2 2.5
6.906519 6.14817 4.494441 4.590207 3.724245 3.109662 2.785678 2.332381 2.206808 2.002498 1.936492 4.918333 5.075431 4.250882 3.436568 3.474191 4.014972 8.414274 7.395945 6.928203 6.308724 5.458938 4.868265 5.442426 4.879549 4.207137 3.398529 3.474191 2.956349 8.983318 7.829432 6.892024 5.385165 4.898979 4.207137 4.955805 4.32088 4.029888 2.956349 2.805352 2.91719 8.167007 7.694154 6.387488 5.540758 5.069517 4.037326 5.098039 4.117038
13.35 8.62 7.2 6.64 13.69 81 64.5 35.5 13.31 4.87 12.94 5.06 15.19 14.62 15.64 25.5 25.95 81.7 61.6 29.8 29.81 17.17 10.39 28.4 28.69 81.3 60.9 16.65 10.05 28.9 28.95
3 4 5 6 3 0.5 0.75 1.5 3 6 3 6 3 3 3 1.75 1.75 0.5 0.75 1.75 1.75 2.75 3.75 1.75 1.75 0.5 0.75 2.75 3.75 1.75 1.75
3.653765 2.935984 2.683282 2.57682 3.7 9 8.031189 5.958188 3.648287 2.206808 3.597221 2.249444 3.897435 3.823611 3.954744 5.049752 5.094114 9.038805 7.848567 5.458938 5.459853 4.14367 3.223352 5.329165 5.356305 9.016651 7.803845 4.080441 3.170173 5.375872 5.38052
Úloha S8.21 Stanovení nelineárního regresního modelu tepelné roztažnosti mědi na teplotě (50 Pokorný) Úloha ověřuje vyhodnocení tepelné roztažnosti mědi v institutu NIST, USA. Byl nalezen nelineární regresní model, popisující závislost tepelné roztažnosti mědi na teplotě. Postavte nelineární regresních model a výsledky odhadů neznámých parametrů porovnejte s výsledky studie tepelné roztažnosti mědi institutu NIST. Pokuste se tento nelineární regresní model ověřit i dalším softwarem a porovnat tak správnost výpočtů. Navržený nelineární regresní model má tvar
s počátečními odhady parametrů
b1 = 10;b2 = -1, b3 = 0.05, b4 = -0.00001, b5 = -0.05, b6 = 0.001, b7 = -0.000001. ◯ Data: Převzato z knihovny dat http://www.itl.nist.gov/div898/strd/nls/data/hahn1.shtml, počet měření 236.
Teplota x (k) 14.13 18.97 20.15 20.41 21.46 24.33
Koef. tepel. y 0.08 0.214 0.367 0.248 0.375 0.471
Teplota x (k) 54.5 54.98 55.02 55.16 60.41 60.9
Koef. tepel. y 4.574 4.703 4.765 4.757 5.556 5.602
Teplota x (k) 107.32 114.26 117.37 118.82 119.63 120.25
Koef. tepel. y 11.023 11.615 11.6 11.946 12.035 12.005
24.41 28.78 28.93 29.57 31.3 33.43 33.84 33.91 34.82 37.41 39.12 39.22 39.7 40.03 44.09 44.18 44.66 45.07 48.83 49.87 50.24 175.7 179.86 180.67 190 192.11 198.44 202.14 206.76 209.07 211.27 213.32 217.78 219.14 220.55 221.05 221.39 223.26 223.88 226.44 226.86 229.65 231.5 237.12 250.99 253.24 258.27 262.52 265.05
0.591 0.796 0.943 0.892 1.089 1.504 1.418 1.429 1.547 1.903 2.15 2.204 2.278 2.241 2.902 2.813 2.951 2.894 3.624 3.782 3.697 14.462 14.464 14.755 14.951 14.947 15.168 15.19 15.473 15.379 15.381 15.455 15.483 15.59 15.55 15.528 15.499 15.627 15.639 15.908 15.651 15.746 15.814 16.114 16.131 16.062 16.216 16.075 16.315
61.38 65.51 66.25 70.53 72.08 72.77 73.42 75.25 75.7 85.15 86.84 89.57 91.14 94.33 94.88 95.52 96.4 96.4 96.44 97.06 97.19 340.77 345.65 346.62 347.19 348.78 349.52 350.13 351.18 358.18 358.72 362.75 370.77 371.03 372.72 373.11 373.79 377.98 393.32 394.77 396.24 411.82 416.59 419.51 421.59 422.02 422.47 422.61 427.38
5.87 6.307 6.421 7.03 7.169 7.267 7.422 7.695 7.898 8.92 9.136 9.47 9.484 9.835 9.959 9.944 10.072 9.957 10.04 10.055 10.163 17.06 17.122 17.159 17.116 17.164 17.165 17.121 17.123 17.134 17.135 17.206 17.282 17.25 17.368 17.311 17.355 17.349 17.339 17.576 17.483 17.668 17.764 17.767 17.803 17.765 17.768 17.736 17.756
122.04 127.08 128.48 133.27 133.55 133.61 134.03 139.08 141.94 143.84 147.73 156.92 158.63 158.67 161.84 161.91 163.19 163.48 171.31 171.65 172.74 522.62 523.03 524.43 524.7 528.99 531.08 544.47 546.75 548.75 549.53 551.64 552.22 553.56 555.74 560.11 574.02 575.29 576 612.99 620.77 622.05 623.86 625.55 628.34 631.5 638.59 641.36 646.89
11.87 12.478 12.596 12.861 12.982 12.97 12.786 13.138 13.303 13.436 13.564 13.922 13.871 13.926 13.994 14.167 14.067 13.974 14.404 14.44 14.452 18.357 18.519 18.426 18.566 18.481 18.486 18.627 18.584 18.645 18.61 18.706 18.523 18.669 18.617 18.665 18.924 18.87 18.795 19.133 19.086 19.28 19.1 19.111 19.09 19.101 19.074 19.239 19.324
268.01 268.62 268.99 269.44 271.78 271.8 271.97 273.13 273.46 273.66 273.77 282.1 321.31 321.69 330.14 330.9 333.03 333.47 334.61 336.25 337.23 339.15 339.33 339.79
16.347 16.181 16.438 16.334 16.43 16.387 16.549 16.337 16.423 16.345 16.445 16.388 16.872 16.83 16.926 17.071 16.907 16.966 17.024 16.915 17.003 16.965 16.978 17.009
428.58 429.66 432.68 441.75 447.41 448.53 448.7 450.1 450.35 451.92 455.56 468.22 472.89 473.78 476.69 484.02 487.27 495.47 511.12 514.78 515.65 519.47 519.54 522.47
17.808 17.848 17.868 17.858 17.877 17.793 17.912 17.979 17.974 18.007 17.993 18.09 18.046 18.123 18.085 18.185 18.276 18.271 18.49 18.236 18.237 18.523 18.404 18.291
646.9 647.04 647.61 652.59 656.2 663.97 746.9 747.35 747.78 748.29 748.43 749.21 749.27 750.14 750.51 845.97 847.54 848.23 849.75 849.93 850.98 851.37 851.61
19.252 19.268 19.286 19.371 19.33 19.398 20.049 20.062 19.972 19.89 20.107 20.007 20.065 19.929 20.088 20.83 20.935 20.935 21.074 21.035 21.085 20.743 20.93
8.3 Kontrolní hodnoty (ADSTAT, NCSS2000) 8.3.1 Analýza farmakologických a biochemických dat B8.06 Model F: b1 = 51.59(0.075), b2 = 2.2096(0.043), b3 = 5.2688(0.1207), RSC = 0.1393, D = 99.95%,
8.3.2 Analýza chemických a fyzikálních dat C8.20 y1: 2. model b1 = -9.25 (0.25), b2 = -7.78E-03 (5.65E-04), b3 = -9.225 (0.206), b4 =-7.61E-03 (2.59E-04), RSC = 0.870, D = 99.37%, MEP = 0.0589, AIC = -63.06. y2: 2. model b1 = -8.256 (1.148), b2 = -4.70E-04 (7.73E-05), b3 = -8.928 (1.236), b4 = -6.47E-03 (8.74E-04), RSC = 5.417, MEP = 0.378, D = 91.27%, AIC = -22.831.
8.3.3 Analýza environmetálních, potravinářských a zemědělských dat
E8.19 Model 2: b1 = 5.3568(0.483), b2 = -0.0969(0.0108), RSC = 102.16, D = 93.63%, AIC = 31.83.
8.3.4 Analýza hutnických a mineralogických dat H8.02 Model A: b1 = 5.378E-06(2.29E-07), b2 = 6215.3(35.58), b3 = 346.33(1.19), RSC = 2.016E-4, D = 100.00%, MEP = 2.0938E-5, AIC = -174.51, s(e) = 3.938E-3. Model B: b1 = 5.2239(0.0281), b2 = 2660.6(24.11), b3 = 343.27(1.94), RSC = 1.073E-06, D = 100.00%, MEP = 1.0183E-07, AIC = -258.28, s(e) = 2.87E-4. Model B je lepší než model A.
8.3.5 Analýza matematických modelů a fyzikálních dat S8.16 b1 = 72.46 (1.73), b2 = 2.62 (0.09), b3 = 0.067 (0.003), RSC = 8.0565, AIC = 5.003, D = 99.83%, MEP = 2.095.
8.4 Kontrolní otázky (z látky učebnice100 na str. 781 až 869) 8.1 Vyjmenujte základní nelineární regresní modely vyskytující se v přírodních a technických vědách. 8.2 Popište formulaci nelineárního regresního modelu. 8.3 Co to je přeurčenost modelu a jak se odstraní? 8.4 Které modely chyb u nelineárních regresním modelů znáte? 8.5 Jak formulujeme kritérium regrese pro aditivní, multiplikativní a kombinované chyby? 8.6 Popište geometrii nelineární regrese: minimum v eliptickém hyperparaboloidu a způsoby jeho hledání. 8.7 Popište rozličné tvary hyperparaboloidu a vysvětlete na něm podmíněnost parametrů v modelu. 8.8 Vysvětlete postup hledání lokálního a globálního minima derivačními metodami minimalizace účelové funkce metodou nejmenších čtverců. 8.9 Vysvětlete postup hledání lokálního a globálního minima nederivačními metodami minimalizace účelové funkce metodou nejmenších čtverců. 8.10 Uveďte třídění a obsahy minimalizačních algoritmů. 8.11 Popište metodu simplexovou k minimalizaci účelové funkce metodou MNČ. 8.12 Popište metodu Newton-Raphsonovu k minimalizaci účelové funkce metodou MNČ. 8.13 Popište metodu LETAGROP k minimalizaci účelové funkce metodou MNČ. 8.14 Uveďte pět možných komplikací procesu nelineární regrese. 8.15 Vysvětlete statistickou analýzu nelineární regrese. 8.16 Jak souvisí vychýlení odhadů parametrů s nelinearitou regresního modelu? 8.17 Uveďte metody výpočtu intervalů spolehlivosti odhadovaných parametrů β. 8.18 Jaké testy hypotéz o odhadech parametrů znáte a k čemu tyto testy slouží? 8.19 Uveďte všechny statistiky grafické a numerické analýzy reziduí při vyšetřování těsnosti proložení nelineární regresní křivky. 8.20 Jak se provádí analýza vlivných bodů? 8.21 Rozeberte postup výstavby nelineárního regresního modelu. 8.22 Jak se posuzuje kvalita nalezených odhadů parametrů? 8.23 Jak posuzujete kvalitu dosažené těsnosti proložení? 8.24 Jak posuzujete predikční schopnost nalezeného regresního modelu? A jak správnost navrženého modelu?
8.5 Doporučená literatura [1] Endrenyi L. (ed.): Kinetic Data Analysis. Plenum Press, New York 1983, str. 47. [2] Magel R. C., Hertsgaard D.: Commun. Statist. 16, 85 (1987). [3] Criado J. M. a kol.: J. Thermal. Anal. 29, 243 (1984). [4] Anscombe F. J.: J. Royal Stat. Soc. B29, 1 (1967). [5] Gallant A. R.: Nonlinear Statistical Models. J. Wiley, New York 1987. [6] Bard Y.: Nonlinear Parameter Estimation. Academic Press, New York 1974. [7] Bates D. M., Watts D. G.: J. Roy. Stat. Soc. B42, 1 (1980). [8] Nash J. C.: J. Inst. Math. Applics. 19, 231 (1977). [9] Hiebert K.: ACM Trans Math. Software 7, 1 (1981). [10] Kuester J. L., Mize J. N.: Optimization Techniques in FORTRAN. McGraw Hill, New York 1973. [11] Wolfe M. A: Numerical Methods for Unconstrained Optimization. Van Nostrand, New York 1978. [12] Gill P. d., Murray W., Wright M. M.: Practical Optimization. Academic Press, London 1981. [13] Schmidt R.: Advances in Nonlinear Parameter Optimization. Springer, Berlin 1982. [14] Nakagawa T., Oyanagi Y.: Program System SALS for Nonlinear Least Squares Fitting, ISE-TR-13. University of Tsukuba, Japan 1980. [15] Rosenbrock M. M., Storey C.: Computational Techniques for Engineers. Pergamon Press, Oxford 1966. [16] Powell M. D. J.: Computer J. 7, 155 (1964). [17] Spendley W., Hext G. R., Himworth F. R.: Technometrics 4, 441 (1962). [18] Nelder J. A., Mead R.: Computer J. 7, 308 (1965). [19] Routh M. W., Schwartz P. A., Denton M. B.: Anal. Chem. 49, 1422 (1977). [20] Ryan P. B., Barr P. L., Tod M. D.: Anal. Chem. 49, 1461 (1977). [21] Marsili-Libelli S., Castelli M.: Appl. Mathematics and Comput. 23, 341 (1987). [22] Volkov I. A., Grabov P. I., Potapov A. B.: Zavod. Labor. 5, 60 (1985). [23] Lindstrom F. T.: Amer. Statist. 34, 183 (1980). [24] Spendley W., in Fletcher R. (ed.): Optimization. Academic Press London 1969. [25] Price W. L.: J. Opt. Theor. Appl. 40, 333 (1983). [26] Bokachevsky I. O. a kol.: Technometrics 28, 209 (1986). [27] Henckroth M. V. a kol.: AICHE Journal 22, 744 (1976). [28] Pronzato L. a kol.: Math. and Computation Simulation 26, 412 (1984). [29] Sillén L. G., Ingri N.: Acta Chem. Scand. 16, 173 (1962). [30] Meloun M., Čermák J.: Talanta 31, 947 (1984). [31] Peckham G., Computer J. 13, 418 (1970). [32] Ralston M. L., Jennrich R. I.: Technometrics 20, 7 (1978). [33] Dennis J. E., Gay D. M., Welsch R. E.: ACM Trans. Math. Software 7, 348 (1981). [34] Ramsin H., Wedin P.: BIT 17, 72 (1977). [35] Jennrich R. I. Sampson P. F.: Technometrics 10, 63 (1968). [36] Schmidt R.: Advances in Nonlinear Parameter Optimization. Springer-Verlag, Berlin 1982. [37] Dennis J. E., Welsch R. E.: Commun. Statist. B7, 345 (1978). [38] Gill P. E., Murray W.: SIAM J. Numer. Anal. 15, 977 (1978). [39] Chambers J. M.: Biometrika 60, 1 (1973). [40] Nash J. C.: Compact Numerical Methods for Computers, Adam Hilger LTD., Bristol 1979. [41] Wharton M., Olson D. K.: A generalized nonlinear least-squares fitting, Program Rept. ORNL ITM6545, Oak Ridge Natl. Lab., 1978. [42] Moré J. J.: in Lecture Notes in Mathematics 630, EE: D. Watson Springer-Verlag, Berlin 1978, str. 105. [43] Linquist S. G.: Proc. Conf. COMPSTAT 80, Physica Verlag, Wien 1980. [44] Meyer R. R., Roth D. M.: J. Inst. Math. Applics 9, 218 (1973). [45] Dennis J. E., Mei H. H. W.: J. Opt. Theor. Appl. 28, 453 (1979). [46] Militký J., Čáp J.: Proc. Conf. CEF 87, Taormina, Sicilia, May 1987. [47] Beck J. V., Arnold K. J.: Parameter Estimation in Engineering and Science. J Wiley, New York 1977. [48] Gallant A. R.: J. Amer. Statist. Assoc. 72, 523 (1977) [49] Demidenko E. Z.T.: Linějnaja i nelinějnaja regresija. Finansy i Statistika. Moskva 1981. [50] Stanley G. M., Mah R. S. H.: Chem Eng. Sci. 36, 259 (1981).
[51] Gorskij V. G.: Zavod. Labor. No. 1, 50 (1987). [52] Brown K. M., Dennis J. E.: Numer. Math 18, 289 (1972) a Miller A. J. in McNeil D., ed.: Interactive Statistics. North Holland, Amsterdam 1979, str. 39. [53] Ratkowsky D. A.: Nonlinear Regression Modelling. Marcel Dekker Inc., New York 1983. [54] Lukšan L.: SPONA - Soubor programů pro optimalizaci a nelineární aproximaci. Výzkumná zpráva č. V4, Centrální výpočetní středisko ČSAV, Praha 1976. [55] James F., Ross M.: Comp. Phys. Commun., 10, 343 (1976). [56] Bates D. M., Wats D. G.: J. Roy. Stat. Soc. B42, 1 (1986). [57] Donaldson J. R., Schanabel R. B.: Technometrics 29, 67 (1987). [58] Cook R. D. a kol.: Biometrika 73, 615 (1986). [59] Box M. J.: J. Roy. Stat. Soc. B32, 171 (1971). [60] Morton R.: Biometrika 74, 679 (1987). [61] Clarke G. P. Y.: J. Amer. Statist. Assoc. 82, 221 (1987). [62] Schwartz L.: Anal. Chim. Acta 122, 291 (1980). [63] Lyoness R. M.: Commun. Statist. 16, 997 (1987). [64] Himmelbau D. M.: Process Analysis by Statistical Methods. Wiley New York 1970. [65] Meloun M., Havel J., Högfeldt E.: Computation of Solution Equilibria, Ellis Horwood, Chichester 1988. [66] Hamilton W. C.: Statistics in Physical Science. Ronald Press, New York, 1964. [67] Militký J. a kol.: Proc. 2nd Int. Statist. Conference, Tampere University Press, 1987. [68] White H., Dorniwotz I.: Ecometrica 52, 143 (1984). [69] Hestens M. R., Stiefel E.: J. Res. of the NBS, 49, 409 (1952). [70] Dixon L. C. W.: J. Inst. Math. Appl. 15, 9 (1975). [71] Fletcher R.: Comput J. 13, 317 (1970). [72] Gill P. E., Murray W.: J. Inst. Maths. Appl. 9, 91 (1972). [73] Oren S. S., Luenberger D. G.: Management Sci. 20, 845 (1974). [74] Oren S. S.: Management Sci. 20, 863 (1974). [75] Huang H. Y., Chambliss J. P.: J. Optimization Theory Appl. 13, 620 (1974). [76] Bass R.: Math. of Comp. 26, 129 (1972). [77] Jacobson D. H., Oksma W.: J. Math. Anal. Appl. 38, 535 (1972). [78] Davison E. J., Wong P.: Automatica 11, 297 (1975). [79] Ritter K.: Computing 14, 79 (1975). [80] Davidon W. C.: Math. Programming 9, 1 (1975). [81] Swann W. H.: Central Instrument Laboratory Research Note 64, 3 (1964). [82] Powell M. J. D.: Comput J. 7, 155 (1964). [83] Zangwill W. I.: Comput J. 10, 293 (1967). [84] Brodlie K. W.: J. Inst. Maths. Appl. 15, 385 (1975). [85] Nazareth L.: Res. Report LBL 2692, University of California 1973. [86] Mifflin R.: Math. Programming 9, 100 (1975). [87] Dennemeyer R. F., Mookini E. H.: J. Optimization Theory Appl. 16, 67 (1975). [88] Gill P. E., Murray: Math. Programming 7, 311 (1974). [89] Bosarge W. E., Falb P. L.: J. Optimization Theory Appl. 4, 156 (1969). [90] Fletcher R.: Res. Report R-6799, AERE Harwell, 1971. [91] Meloun M., Javůrek M.: Talanta 32, 973 (1985). [92] Box G. P., W. G. Hunter, J. S. Hunter: Statistics for Experimenters. J. Wiley, New York, 1978. str. 483487. [93] Bennett L., Swartzendruber L., Brown H.: Superconductivity Magnetization Modeling, NIST 1994. [94] Eckerle K.: Circular Interference Transmittance Study, NIST (1975). [95] Rust B.: NIST 1996. [96] Chwirut D.: Ultrasonic Reference Block Study, NIST (1975). [97] Lanczos C.: Applied Analysis. Englewood Cliffs, NJ., Prentice Hall, 1956, str. 272-280. [98] More J. J., Garbow B. S., Hillstrom K. E.: Testing unconstrained optimization software. ACM Transactions on Mathematical Software. 7(1), (1981), s. 17-41. v knize Osborne, M. R.: Some aspects of nonlinear least squares calculations. In Numerical Methods for Nonlinear Optimization, Lootsma (ed). Academic Press, New York 1972, s. 171-189.
[99] Ratkowsky D.A.: Nonlinear Regression Modeling. Marcel Dekker, New York 1983, str. 61-88. [100] Meloun M., Militký J.: Statistické zpracování experimentálních dat, Plus Praha 1994 (1. vydání), EAST PUBLISHING, Praha 1998 (2. vydání), Academia Praha 2004 (3. vydání).