Fakulta chemicko – technologická Katedra analytické chemie Licenční studium statistické zpracování dat
Tvorba lineárních a kalibračních modelů při analýze dat
Pavel Valášek
Školní rok 2001 – 02
OBSAH 1 POROVNÁNÍ DVOU REGRESNÍCH PŘÍMEK U JEDNODUCHÉHO REGRESNÍHO MODELU........................................................................................................................... 3 1.1
Úkol................................................................................................................................................................... 3
1.2
Zpracovávaná data .......................................................................................................................................... 3
1.3 Lineární regresní model .................................................................................................................................. 4 1.3.1 Data získaná pro laboratorní pícku........................................................................................................... 4 1.3.2 Data získaná pro provozní pec ................................................................................................................. 9 1.4 Porovnání modelů.......................................................................................................................................... 14 1.4.1 Společný lineární model......................................................................................................................... 14 1.4.2 Test shody dvou lineárních modelů ....................................................................................................... 17 1.5 Závěr............................................................................................................................................................... 18 1.5.1 Statistický............................................................................................................................................... 18 1.5.2 Aplikační............................................................................................ Chyba! Záložka není definována.
2
VALIDACE NOVÉ ANALYTICKÉ METODY ........................................................... 19
2.1
Úkol................................................................................................................................................................. 19
2.2
Zpracovávaná data ........................................................................................................................................ 19
2.3 Lineární regresní model ................................................................................................................................ 20 2.3.1 Regresní diagnostika .............................................................................................................................. 22 2.4 Závěr............................................................................................................................................................... 24 2.4.1 Statistický............................................................................................................................................... 24 2.4.2 Aplikační............................................................................................ Chyba! Záložka není definována.
3
LINEÁRNÍ REGRESE POLYNOMEM ..................................................................... 25
3.1
Úkol................................................................................................................................................................. 25
3.2
Zpracovávaná data ........................................................................................................................................ 25
3.3 Nalezení stupně polynomu ............................................................................................................................ 3.3.1 Stupeń polynomu 2 ................................................................................................................................ 3.3.2 Stupeń polynomu 3 ................................................................................................................................ 3.3.3 Stupeń polynomu 4 ................................................................................................................................ 3.3.4 Stupeń polynomu 5 ................................................................................................................................ 3.3.5 Stupeń polynomu 6 ................................................................................................................................ 3.3.6 Závěr ...................................................................................................................................................... 3.4
26 26 26 26 27 27 27
Metoda racionálních hodností – korekce hodností ..................................................................................... 28
3.5 Závěr............................................................................................................................................................... 30 3.5.1 Statistický............................................................................................................................................... 30 3.5.2 Aplikační............................................................................................ Chyba! Záložka není definována.
1
4
VÍCEROZMĚRNÝ LINEÁRNÍ REGRESNÍ MODEL................................................. 31
4.1
Úkol................................................................................................................................................................. 31
4.2
Zpracovávaná data ........................................................................................................................................ 31
4.3 Lineární regresní model ................................................................................................................................ 32 4.3.1 Regresní diagnostika .............................................................................................................................. 33 4.4 Závěr............................................................................................................................................................... 36 4.4.1 Statistický............................................................................................................................................... 36 4.4.2 Aplikační............................................................................................ Chyba! Záložka není definována.
5
LINEÁRNÍ KALIBRAČNÍ MODEL ........................................................................... 37
5.1
Úkol................................................................................................................................................................. 37
5.2
Data pro kalibrační model ............................................................................................................................ 37
5.3
Regresní diagnostika ..................................................................................................................................... 38
5.4
Kalibrace......................................................................................................................................................... 39
5.5 Závěr............................................................................................................................................................... 40 5.5.1 Statistický............................................................................................................................................... 40 5.5.2 Aplikační............................................................................................ Chyba! Záložka není definována.
6
NELINEÁRNÍ KALIBRAČNÍ MODEL ...................................................................... 41
6.1
Úkol................................................................................................................................................................. 41
6.2
Data pro kalibrační model ............................................................................................................................ 41
6.3
Regresní diagnostika ..................................................................................................................................... 42
6.4
Kalibrace ........................................................................................................................................................ 43
6.5
Závěr............................................................................................................................................................... 44
7
ROZLIŠENÍ MEZI LINEÁRNÍ A NELINEÁRNÍ KALIBRACÍ .................................. 45
7.1
Úkol................................................................................................................................................................. 45
7.2
Data pro kalibrační model ............................................................................................................................ 45
7.3
Regresní diagnostika ..................................................................................................................................... 46
7.4 Kalibrace ........................................................................................................................................................ 47 7.4.1 Porovnání kalibračních závislostí........................................................................................................... 47 7.5
Závěr............................................................................................................................................................... 48
2
Porovnání dvou regresních přímek u jednoduchého regresního modelu
1
1.1 Úkol Záměrem tohoto hodnocení je porovnání zjištěných závislostí mezi vzorky pigmentů, které byly připraveny v laboratorní pícce a které jsou vyráběny kontinuální výrobou. K testování byla vybrána závislost obsahu celkového železa v zelené skalici na odstínovém úhlu (ho) pigmentu. Je nutné podotknout, že vzorky byly připraveny a analyzovány při stejných podmínkách, a vlastní měření barevných vlastností (v tomto případě ho) prováděla pouze jedna laborantka aby se předešlo případné vyšší variabilitě získaných výsledků. 1.2
Zpracovávaná data
K hodnocení jsem použil statistický program QCExpert K dispozici bylo u laboratorní pícky 12 hodnot a u provozní pece 20 hodnot. Tabulka I. [x – celkové Fe ve skalici (%)]; [y - odstínový úhel ho pigmentu] – Laboratorní pícka x 18.01 18.48 18.7 18.89 19.16 18.1
y 19.79 20.3 20.49 20.86 20.26 19.8
x 18.22 18.39 18.65 18.55 18.2 18.6
y 20.01 19.94 20.35 20.22 19.9 20.74
Tabulka II. [x – celkové Fe ve skalici (%)]; [y - odstínový úhel ho pigmentu] – Provozní pec x 18.61 18.51 18.46 18.52 18.51 18.53 18.60 18.58 18.56 18.55
y 20.39 20.04 19.71 20.79 20.82 20.43 20.73 20.74 20.46 20.68
x 18.55 18.57 18.52 18.56 18.60 18.65 18.55 18.62 18.71 18.69
y 20.80 20.97 20.65 20.30 20.60 21.15 20.21 20.84 21.00 21.21
3
1.3
Lineární regresní model
1.3.1 Data získaná pro laboratorní pícku Nejprve byla u dat ověřena normalita a pak provedena regresní diagnostika na odhalení vlivných bodů.
Obr. I - 1
Obr. I - 2
Obr. I – 3
Obr. I – 4
Na základě grafických diagnostik byly určeny dva vlivné body (12 – O, 5 - OE) a jeden je podezřelý z vlivu (4). Numerickým hodnocením na základě Atkinsonovy vzdálenosti, AndrewsPregibonovy diagnostiky byl určen bod 5 také jako vlivný. Vzhledem k počtu dat a testovaných parametrů jsem pro další hodnocení odstranil dvě odlehlé hodnoty (5,12).
4
Jak je vidět po odstranění dvou odlehlých hodnot ukazují grafy regresní přímky, predikovaných hodnot a reziduí dobrý regresní model.
Obr. I – 5
Obr. I – 6
Obr. I – 7
Obr. I – 8
Obr. – 9
Obr. - 10
5
1.3.1.1 Regresní diagnostika Název úlohy :
Laboratorní pícka
Hladina významnosti : Kvantil t(1-alfa/2,n-m) : Kvantil F(1-alfa,m,n-m) : Absolutní člen : Počet platných řádků : Počet parametrů : Metoda : Transformace :
0.05 2.30600413519908 5.31765507155526 Ano 10 2 Nejmenší čtverce Bez transformace
Základní analýza Charakteristiky proměnných Proměnná Průměr Fe 18.419
Směr.Odch. 0.2852854321
Kor.vs.Y 0.9543512405
Významnost 1.797640 E-005
Průměrný čtverec 0.106284 0.09680201008 0.009481989925
Rozptyl 0.1180933333 0.107557789 0.01053554436
Analýza rozptylu Průměr Y : Zdroj Celková variabilita Variabilita vysvětlená modelem Reziduální variabilita Hodnota kritéria F : Kvantil F (1-alfa, m-1, n-m) : Pravděpodobnost : Závěr :
20.166 Součet čtverců 1.06284 0.9680201008 0.09481989925 81.67231633 5.317655072 1.797640 E-005 Model je významný
Odhady parametrů Proměnná Abs
Fe
Odhad -1.008218269
Směr.Odch. 2.3432403
Závěr Pravděpodobnost Nevýznamný 0.6783577532
Spodní mez -6.411740092
Horní mez 4.395303553
Odhad 1.14958566
Směr.Odch. 0.1272049177
Spodní mez 0.8562505937
Horní mez 1.442920726
6
Závěr Významný
Pravděpodobnost 1.797640725E-005
Statistické charakteristiky regrese Vícenásobný korelační koeficient R : Koeficient determinace R^2 : Predikovaný korelační koeficient Rp : Střední kvadratická chyba predikce MEP : Akaikeho informační kritérium :
0.9543512405 0.9107862903 0.8442682756 0.01655179059 -42.58361077
Analýza klasických reziduí Reziduální součet čtverců : Průměr absolutních reziduí : Reziduální směr. odchylka : Reziduální rozptyl : Šikmost reziduí : Špičatost reziduí :
0.09481989925 0.07701055304 0.1088691297 0.01185248741 0.149242777 2.418013433
Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : Kvantil F (1-alfa, m-1, n-m) : Pravděpodobnost : Závěr :
81.67231633 5.317655072 1.797640725E-005 Model je významný
Scottovo kritérium multikolinearity Hodnota kritéria SC : Závěr :
81.85744577 Model je nekorektní!
Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : Kvantil Chi^2(1-alfa,1) : Pravděpodobnost : Závěr :
0.3239768934 3.841458829 0.5692274225 Rezidua vykazují homoskedasticitu.
Jarque-Berrův test normality Hodnota kritéria JB : Kvantil Chi^2(1-alfa,2) : Pravděpodobnost : Závěr :
0.3898664469 5.991464547 0.822889606 Rezidua mají normální rozdělení.
Waldův test autokorelace Hodnota kritéria WA : Kvantil Chi^2(1-alfa,1) : Pravděpodobnost : Závěr :
0.2711826143 3.841458829 0.5692274225 Autokorelace je nevýznamná
7
Durbin-Watsonův test autokorelace Hodnota kritéria DW : Závěr :
1.538718243 Rezidua nejsou autokorelována
Znaménkový test reziduí Hodnota kritéria Sg : Kvantil N(1-alfa/2) : Pravděpodobnost : Závěr :
2.318049884 1.959963999 0.02044661015 V reziduích je trend!
Závěr: Na základě testu modelu byl model určen jako významný, ale testem na multikolinearitu byl model určen jako nekorektní, i když číslo podmíněnosti K a VIF faktor multikolinearitu neprokazují. Absolutní člen regresní přímky byl také určen jako nevýznamný, a na základě tohoto hodnocení se může z rovnice lineární přímky vypustit a takto upravený model má tvar Odstínový úhel [ho]= 1.0948 (+0.0017) . Celkové Fe [x] Znaménkovým testem byl určen trend v reziduích, což detekuje, že navržený model není zcela v pořádku – z grafických diagnostik tento závěr není zcela patrný, protože rezidua jsou chaoticky uspořádána. Jen pro ověření jsem vypustil bod č.4 (byl detekován jako podezřelý z vlivu) a pro tyto hodnoty znaménkový test reziduí již vykazuje, že v reziduích trend není a tudíž je model v pořádku. Znaménkový test reziduí po odstranění vlivného bodu č.4. Hodnota kritéria Sg : 0.6827364296 Kvantil N(1-alfa/2) : 1.959963999 Pravděpodobnost : 0.4947734057 Závěr : V reziduích není trend.
Pro větší věrohodnost této závislosti je nutno provést ještě několik měření, ale pro porovnání s jiným modelem lze použít.
8
1.3.2
Data získaná pro provozní pec
Nejprve byla u dat tak jako u prvního modelu ověřena normalita a pak provedena regresní diagnostika na odhalení vlivných bodů.
Obr . I –11
Obr. I - 11
Obr. I – 12
Obr.I - 13
Na základě grafických diagnostik byly určeny čtyři vlivné body (5 – O; 3 – OE; 19, 20 - E . Pro další hodnocení modelu jsem z dat odstranil pouze odlehlé body 3 a 5. Extrémy (19,20) jsem v datech ponechal.
9
Jak je vidět po odstranění odlehlých bodů ukazují grafy regresní přímky, predikovaných hodnot a reziduí v celku dobrý regresní model.
Obr. I – 14
Obr. I - 15
Obr. I – 16
Obr. I - 17
Obr. I – 18
Obr. I - 19
10
1.3.2.1 Regresní diagnostika Název úlohy :
Provozní pec
Hladina významnosti : Kvantil t(1-alfa/2,n-m) : Kvantil F(1-alfa,m,n-m) : Absolutní člen : Počet platných řádků : Počet parametrů : Metoda : Transformace :
0.05 2.11990529922106 4.49399847766554 Ano 18 2 Nejmenší čtverce Bez transformace
Základní analýza Charakteristiky proměnných Proměnná Průměr Fe 18.58222222
Směr.Odch. 0.05704029077
Kor.vs.Y 0.6566666942
Významnost 0.003073133
Průměrný čtverec 0.09556820988 0.04121007743 0.05435813245
Rozptyl 0.1011898693 0.04363419963 0.05755566965
Analýza rozptylu Průměr Y : Zdroj Celková variabilita Variabilita vysvětlená modelem Reziduální variabilita Hodnota kritéria F : Kvantil F (1-alfa, m-1, n-m) : Pravděpodobnost : Závěr :
20.66611111 Součet čtverců 1.720227778 0.7417813937 0.9784463841 12.12994651 4.493998478 0.003073133113 Model je významný
Odhady parametrů Proměnná Abs
Fe
Odhad -47.384092
Směr.Odch. 19.53898122
Spodní mez -88.80488183
Horní mez -5.963302181
Odhad 3.662113299
Směr.Odch. 1.051483189
Spodní mez 1.433068514
Horní mez 5.891158083
11
Závěr Významný
Pravděpodobnost 0.02750789072
Závěr Významný
Pravděpodobnost 0.003073133113
Statistické charakteristiky regrese Vícenásobný korelační koeficient R : Koeficient determinace R^2 : Predikovaný korelační koeficient Rp : Střední kvadratická chyba predikce MEP : Akaikeho informační kritérium :
0.6566666942 0.4312111473 0.28419124 0.06840856181 -48.41889882
Analýza klasických reziduí Reziduální součet čtverců : Průměr absolutních reziduí : Reziduální směr. odchylka : Reziduální rozptyl : Šikmost reziduí : Špičatost reziduí :
0.9784463841 0.1998198741 0.247291122 0.06115289901 0.02920146146 1.843327626
Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : Kvantil F (1-alfa, m-1, n-m) : Pravděpodobnost : Závěr :
12.12994651 4.493998478 0.003073133113 Model je významný
Scottovo kritérium multikolinearity Hodnota kritéria SC : Závěr :
18.01108349 Model je nekorektní!
Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : Kvantil Chi^2(1-alfa,1) : Pravděpodobnost : Závěr :
0.714791117 3.841458829 0.3978578508 Rezidua vykazují homoskedasticitu.
Jarque-Berrův test normality Hodnota kritéria JB : Kvantil Chi^2(1-alfa,2) : Pravděpodobnost : Závěr :
1.091022621 5.991464547 0.5795453801 Rezidua mají normální rozdělení.
Waldův test autokorelace Hodnota kritéria WA : Kvantil Chi^2(1-alfa,1) : Pravděpodobnost : Závěr :
0.001211745305 3.841458829 0.3978578508 Autokorelace je nevýznamná
12
Durbin-Watsonův test autokorelace Hodnota kritéria DW : Závěr :
1.848780164 Rezidua nejsou autokorelována
Znaménkový test reziduí Hodnota kritéria Sg : Kvantil N(1-alfa/2) : Pravděpodobnost : Závěr :
1.214781645 1.959963999 0.2244493833 V reziduích není trend.
Odstínový úhel [ho]= -47,384 (+19,539) + 3,662 (+1,051) . Celkové Fe [x] Závěr: Na základě testu modelu byl model určen jako významný, ale testem na multikolinearitu byl model opět určen jako nekorektní, i když číslo podmíněnosti K a VIF faktor multikolinearitu neprokazují. Jednotlivé parametry regresní přímky byly určeny jako významné. Znaménkovým testem nebyl určen trend v reziduích, což detekuje, že navržený model je zcela v pořádku – z grafických diagnostik tento závěr je taká zcela patrný, protože rezidua jsou náhodně uspořádána.
13
1.4
1.4.1
Porovnání modelů
Společný lineární model
Obr.I - 20 1.4.1.1 Regresní diagnostika Název úlohy :
Společný model
Hladina významnosti : Kvantil t(1-alfa/2,n-m) : Kvantil F(1-alfa,m,n-m) : Absolutní člen : Počet platných řádků : Počet parametrů : Metoda : Transformace :
0.05 2.05552943864224 4.22520127312487 Ano 28 2 Nejmenší čtverce Bez transformace
Základní analýza Charakteristiky proměnných Proměnná Průměr Fe 18.52392857
Směr.Odch. 0.188470241
Kor.vs.Y 0.7647580418
Významnost 2.152412E-006
Průměrný čtverec 0.15681875 0.09171620847 0.06510254153
Rozptyl 0.1626268519 0.09511310508 0.06751374677
Analýza rozptylu Průměr Y : Zdroj Celková variabilita Variabilita vysvětlená modelem Reziduální variabilita Hodnota kritéria F : Kvantil F (1-alfa, m-1, n-m) : Pravděpodobnost : Závěr :
20.4875 Součet čtverců 4.390925 2.568053837 1.822871163 36.62869934 4.225201273 2.152412581E-006 Model je významný
14
Odhady parametrů Proměnná Abs
Odhad -9.824213801
Směr.Odch. 5.008658457
Spodní mez -20.11965871
Horní mez 0.4712311052
Odhad 1.636354496
Směr.Odch. 0.2703750703
Spodní mez 1.08059058
Horní mez 2.192118412
Závěr Pravděpodobnost Nevýznamný 0.06061823008
Fe Závěr Významný
Pravděpodobnost 2.152412581E-006
Statistické charakteristiky regrese Vícenásobný korelační koeficient R : Koeficient determinace R^2 : Predikovaný korelační koeficient Rp : Střední kvadratická chyba predikce MEP : Akaikeho informační kritérium :
0.7647580418 0.5848548625 0.5337231333 0.07312095538 -72.49016732
Analýza klasických reziduí Reziduální součet čtverců : Průměr absolutních reziduí : Reziduální směr. odchylka : Reziduální rozptyl : Šikmost reziduí : Špičatost reziduí :
1.822871163 0.2187984108 0.2647837407 0.07011042934 0.01402913843 1.910871907
Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : Kvantil F (1-alfa, m-1, n-m) : Pravděpodobnost : Závěr :
36.62869934 4.225201273 2.152412581E-006 Model je významný
Scottovo kritérium multikolinearity Hodnota kritéria SC : Závěr :
40.47597031 Model je nekorektní!
Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : Kvantil Chi^2(1-alfa,1) : Pravděpodobnost : Závěr :
1.405930352 3.841458829 0.2357331545 Rezidua vykazují homoskedasticitu.
15
Jarque-Berrův test normality Hodnota kritéria JB : Kvantil Chi^2(1-alfa,2) : Pravděpodobnost : Závěr :
1.449369316 5.991464547 0.4844773208 Rezidua mají normální rozdělení.
Waldův test autokorelace Hodnota kritéria WA : Kvantil Chi^2(1-alfa,1) : Pravděpodobnost : Závěr :
1.373763261 3.841458829 0.2357331545 Autokorelace je nevýznamná
Durbin-Watsonův test autokorelace Hodnota kritéria DW : Závěr :
1.517871027 Rezidua nejsou autokorelována
Znaménkový test reziduí Hodnota kritéria Sg : Kvantil N(1-alfa/2) : Pravděpodobnost : Závěr :
0.5777466649 1.959963999 0.5634351687 V reziduích není trend.
16
1.4.2 Test shody dvou lineárních modelů Vzhledem k tomu, že absolutní člen u společného modelu vyšel nevýznamný, tak jsem k dalšímu porovnání použil hodnot modelu bez absolutního členu. Z následujícího obrázku není zcela zjevné, že oba soubory dat mají shodné rozptyly, a tak tato shoda byla ověřena F- testem (byl použit stat. program ADSTAT), takže k testování Chowowým testem bude postačující Fisherovo-Snedecorovo rozdělení s m a n-2m stupni volnosti. Fisher-Snedecor F-test: Počet stupňů volnosti
v1 v2 Tabulkový kvantil F(1-alfa/2, v1, v2) F-statistika Závěr: Vypočtená hladina významnosti
9 17 2.9849 1.1670 Rozptyly se považují za shodné 0.374
Jacknife F-test Počet stupňů volnosti
v1 v2 Tabulkový kvantil F(1-alfa/2, v1, v2) F-statistika Závěr Vypočtená hladina významnosti
2 26 4.2655 1.7327E-01 Rozptyly se považují za shodné 0.842
Porovnání modelů Provozní pec Lineární (Laboratorní pec)
Laboratorní pec Lineární (Provozní pec)
Společný Lineární (Společný)
21.4 21.2 21 20.8
ho
20.6 20.4 20.2 20 19.8 19.6 19.4 17.9
18
18.1
18.2
18.3
18.4
18.5
Celk. Fe
17
18.6
18.7
18.8
18.9
19
Testační kritérium: Fc =
(RSC − RSC1 − RSC2)(n − 2m) = 11.350 (RSC1 + RSC2)(m)
Hodnoty:
m = 2; ∑n = 28; n1 = 10; n2 = 18
b11
1.0948
=
(+0.0017) ∧
RSC1 =
0.09701
b02 b12
-47.384 3.662
= =
σ1 = 0.10382 (+19.538) (+1.051) ∧
RSC2 =
0.9784
b13 RSC
1.1060 2.0926
= =
σ2
= 0.2472
(+0.0022)
Kvantil F-rozdělení F0.95 (2,24) = 3.403 (určeno z tabulek) je nižší než Fc, a je tedy nutno nulovou hypotézu o shodě parametrů dvou lineárních modelů zamítnout.
1.5
Závěr
1.5.1 Statistický Porovnáním těchto dvou lineárních modelů bylo prokázáno, že se závislost odstínového úhlu a celkového Fe ve skalici se statisticky výrazně liší pro provozní a laboratorní pec. 1.5.2 Aplikační Na základě zjištění neshody lineárních modelů je nutno k modelování provozních situací, které ovlivňují optické parametry pigmentů na laboratorní peci, přistupovat velmi obezřetně, z důvodů právě zjištěné skutečnosti rozdílnosti modelů. Jak již bylo uvedeno, při hodnocení dat pro laboratorní pícku je nutné provést ještě několik měření (při shodných podmínkách), a následné opětovné porovnání obou modelů. Poznámka: Data byla také hodnocena programem ADSTAT ve kterém vycházejí oba jednotlivé modely na základě Scottova kritéria multikolinearity M jako korektní.
18
2 2.1
Validace nové analytické metody Úkol
V provozní laboratoři se měří množství PO 34− (jako množství P2O5 – mg/l) ve vodě, která je určena pro parní kotel. Analýza se provádí tzv. žlutou kolorimetrií, při které se měří absorbance žlutého fosformolybdenanového komplexu. Vzhledem k časové náročnosti a stáří přístroje bylo navrhnuto tuto metodu nahradit novou, která je podstatně méně časově náročná a jejíž princip spočívá v porovnání vybarveného komplexu s definovanou škálou etalonů - PALINTEST. Je nutné prověřit výsledky obou metod před zavedením do praxe.
2.2
Zpracovávaná data
K hodnocení jsem použil statistický program QCExpert K dispozici bylo 37 vzorků, které byly proměřeny oběma metodami.. Tabulka II. [x – obsah P2O5 (mg/l) - kolorimetricky]; [y - obsah P2O5 (mg/l) - PALINTEST ] x 0.85 1.8 4.2 1.95 2.6 6.25 7.95 9.1 2.05 4.95 5.6 7.85 7.25 5.1 2.95 4.45 7.65 8.5 9.1
y 1 2 5 2 3 6 8 9 2 5 6 8 7 5 3 5 8 9 10
x 3.1 16.8 5.05 6.15 8.65 7.55 6.75 4.95 6.05 8.6 15.4 11.5 9.6 4.1 7.8 8.6 7.65 7.85 -
y 3 18 5 6 9 8 7 5 6 9 16 12 10 5 8 9 8 9 -
19
2.3
Lineární regresní model
Nejprve byla u dat provedena regresní diagnostika na odhalení vlivných bodů.
Obr. II. – 1
Obr. II. - 2
Obr. II. – 3
Obr. II. - 4
Na základě grafických diagnostik bylo určeno pět vlivných bodů (3, 13, 21, 33 – O; 30, 37 - E ). Tyto body byly detekovány i numerickým hodnocení pomocí Atkinsonovy vzdálenosti, AndrewsPregibonovy diagnostiky. Pro další hodnocení modelu jsem z dat odstranil pouze odlehlé body 3, 13, 21, 33. Extrémy (30, 37) jsem v datech ponechal. Odstranění vlivných bodů jsem provedl, protože při vlastním stanovením jde pouze o subjektivní srovnání vybarvení roztoku s řadou etalonů. Dalším zdůvodněním odstranění těchto bodů je i to, že analýzu jednotlivých vzorků prováděli tři laborantky, u kterých by bylo nejprve nutno provést tes opakovatelnosti a reprodukovatelnosti výsledků pomocí statistického modelu ANOVA.
20
Po odstranění odlehlých hodnot je patrné z příslušných grafů, že se jedná o dobrý lineární model.
Obr. II. – 5
Obr. II. - 6
Obr. II. – 7
Obr. II. - 8
Obr. II. – 9
Obr. II. - 10
21
2.3.1
Regresní diagnostika
Název úlohy :
Validace nové metody
Hladina významnosti : Kvantil t(1-alfa/2,n-m) : Kvantil F(1-alfa,m,n-m) : Absolutní člen : Počet platných řádků : Počet parametrů : Metoda : Transformace :
0.05 2.03951344639575 4.15961509802907 Ano 33 2 Nejmenší čtverce Bez transformace
Analýza rozptylu Průměr Y : Zdroj Celková variabilita Variabilita vysvětlená modelem Reziduální variabilita Hodnota kritéria F : Kvantil F (1-alfa, m-1, n-m) : Pravděpodobnost : Závěr :
6.727272727 Součet čtverců 334.5454545 332.1361564 2.409298124 4273.535411 4.159615098 8.799953107E-035 Model je významný
Průměrný čtverec 10.13774105 10.06473201 0.07300903406
Rozptyl 10.45454545 10.37925489 0.07529056638
Odhady parametrů Proměnná Abs
x
Odhad -0.04746194044
Směr.Odch. 0.1144331982
Závěr Pravděpodobnost Nevýznamný 0.6811763297
Spodní mez -0.2808499869
Horní mez 0.1859261061
Odhad 1.044946221
Směr.Odch. 0.01598454529
Spodní mez 1.012345526
Horní mez 1.077546916
Závěr Významný
Statistické charakteristiky regrese Vícenásobný korelační koeficient R : Koeficient determinace R^2 : Predikovaný korelační koeficient Rp : Střední kvadratická chyba predikce MEP : Akaikeho informační kritérium :
0.9963926403 0.9927982937 0.9921092721 0.07999415636 -82.36667901
22
Pravděpodobnost 0
Analýza klasických reziduí Reziduální součet čtverců : Průměr absolutních reziduí : Reziduální směr. odchylka : Reziduální rozptyl : Šikmost reziduí : Špičatost reziduí :
2.409298124 0.1969941271 0.2787818041 0.07771929432 0.6573599065 4.41600912
Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : 4273.535411 Kvantil F (1-alfa, m-1, n-m) : 4.159615098 Pravděpodobnost : 8.799953107E-035 Závěr : Model je významný Scottovo kritérium multikolinearity Hodnota kritéria SC : Závěr :
4273.707434 Model je nekorektní!
Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : Kvantil Chi^2(1-alfa,1) : Pravděpodobnost : Závěr :
0.2587777247 3.841458829 0.6109611204 Rezidua vykazují homoskedasticitu.
Jarque-Berrův test normality Hodnota kritéria JB : Kvantil Chi^2(1-alfa,2) : Pravděpodobnost : Závěr :
6.372466998 5.991464547 0.04132723724 Rezidua nemají normální rozdělení!
Waldův test autokorelace Hodnota kritéria WA : Kvantil Chi^2(1-alfa,1) : Pravděpodobnost : Závěr :
0.6941351788 3.841458829 0.6109611204 Autokorelace je nevýznamná
Durbin-Watsonův test autokorelace Hodnota kritéria DW : Závěr :
1.397045734 Rezidua jsou pozitivně autokorelována!
Znaménkový test reziduí Hodnota kritéria Sg : Kvantil N(1-alfa/2) : Pravděpodobnost : Závěr :
1.410882485 1.959963999 0.1582792675 V reziduích není trend.
23
Podstatou validace nové metody je lineární model y = b0 + b1x s nulovým úsekem b0 = 0 a jednotkovou směrnicí b1 = 1. Proměnná Odhad b0 -0.04746194044 b1 1.044946221 Kvantil t(1-alfa/2,n-m) :
Směr.Odch. 0.1144331982 0.01598454529 2.03951344639575
Vztah pro interval spolehlivosti: b0 – t1-α/2 .
D(b0) ≤ b0 ≤ b0 + t1-α/2 .
D(b0)
Pak pro úsek : -0.28084 ≤ b0 ≤ 0.18592 Pak pro směrnici : 1.0123 ≤ b1 ≤ 1.07754
2.4
Závěr
2.4.1 Statistický Interval spolehlivosti pro úsek obsahuje nulu, a tudíž nelze úsek b0 považovat za významně odchýlený od nuly. Interval spolehlivosti pro směrnici neobsahuje jedničku (tudíž lze říci, že nová metoda mírně nadhodnocuje a bylo by nutno použít opravný koeficient 1 / b1 ), ale odchylka od jedničky je minimální a vzhledem k tomu, že se v podstatě jedná o porovnání objektivního a subjektivního měření je to nad očekávání dobré, protože lineární regrese je strašně přísná a je možné, že párové porovnání výsledků by to prohlásilo za shodné bez problémů. 2.4.2 Aplikační Na základě statistického závěru byla nová analytická metoda pro kontrolu obsahu P2O5 v kotelní vodě shledána za způsobilou i díky tomu, že naměřené hodnoty jsou hluboko pod vnitropodnikovou normou – max. 50 mg/l.
24
3
Lineární regrese polynomem
3.1 Úkol K řízení kalcinačního režimu při výrobě železitých červení je důležitý parametr „stupeň rozkladu“, který je sledován třikrát za směnu v analytické laboratoři provozu. Pro kontinuální sledování tohoto režimu jsem navrhl vypracovat metodiku kontinuálního sledování tohoto parametru na základě závislosti obsahu Fe2+(g/l) a měrná vodivosti (mS/cm) suspenze rozplaveného kalcinátu za určitých zjednodušujících fyzikálních podmínek týkající se vodivosti doprovodných iontů. 3.2
Zpracovávaná data
K hodnocení jsem použil statistický program QCExpert K dispozici bylo 29 naměřených hodnot Tabulka III. [x – měrná vodivost (mS/cm)]; [y – obsah Fe2+ (g/l) ] x 10.5 11.6 11.8 11.4 11.2 11.2 12.0 11.2 11.8 11.6 11.3 11.7 11.5 9.8 12.3
y 3.4 4.1 4.8 4.6 4.2 3.9 5.2 4.2 5.2 4.1 3.7 4.0 4.0 3.0 5.0
x 11.3 10.0 11.2 11.8 12.6 12.9 11.5 11.2 11.1 11.1 9.2 10.4 10.6 17.1
y 3.8 3.5 4.3 3.9 5.0 5.1 3.7 4.6 4.2 4.2 3.6 3.6 4.1 11.6
25
3.3
Nalezení stupně polynomu
Pro nalezení optimálního stupně polynomu n byla použita MNČ a při výpočtu byl měněn stupeň polynomu a sledována hodnota MEP a AIC, která musí být pro optimální n co nejmenší – MEP má větší váhu než AIC. 3.3.1
Stupeń polynomu 2
Proměnná Abs x x^2
Odhad 12.08728569 -2.021398535 0.1164900226
Směr.Odch. 2.943611528 0.4550906426 0.01728945894
Vícenásobný korelační koeficient R : Koeficient determinace R^2 Predikovaný korelační koeficient Rp : Střední kvadratická chyba predikce MEP : Akaikeho informační kritérium : 3.3.2
0.9714210667 0.9436588889 0.923066762 0.1649701103 -55.29163033
Stupeń polynomu 3
Proměnná Abs x x^2 x^3
Odhad 8.62241866 -1.174492699 0.04900847041 0.001744260495
Směr.Odch. 26.54583285 6.463588783 0.513993357 0.01327786618
Vícenásobný korelační koeficient R : Koeficient determinace R^2 : Predikovaný korelační koeficient Rp : Střední kvadratická chyba predikce MEP : Akaikeho informační kritérium : 3.3.3
Závěr Významný Významný Významný
Závěr Nevýznamný Nevýznamný Nevýznamný Nevýznamný
0.9714410704 0.9436977533 -2.91758346 8.400584613 -53.31164158
Stupeń polynomu 4
Proměnná Abs x x^2 x^3 x^4
Odhad 288.9375975 -95.00736115 11.66713231 -0.6279898078 0.01258173416
Směr.Odch. 276.2673226 92.27694803 11.40902054 0.6179156487 0.01234276264
Vícenásobný korelační koeficient R : Koeficient determinace R^2 : Predikovaný korelační koeficient Rp : Střední kvadratická chyba predikce MEP : Akaikeho informační kritérium :
Závěr Nevýznamný Nevýznamný Nevýznamný Nevýznamný Nevýznamný
0.9726429142 0.9460342385 0.9157145326 0.180735703 -52.5407962
26
3.3.4
Stupeń polynomu 5
Proměnná Abs x x^2 x^3 x^4 x^5
Odhad 1040.040897 -416.3327322 66.13747621 -5.198235378 0.2022003205 -0.003108514014
Směr.Odch. 3382.876328 1445.246599 244.7514197 20.52191307 0.8511413442 0.01395166594
Vícenásobný korelační koeficient R : Koeficient determinace R^2 : Predikovaný korelační koeficient Rp : Střední kvadratická chyba predikce MEP : Akaikeho informační kritérium : 3.3.5
Závěr Nevýznamný Nevýznamný Nevýznamný Nevýznamný Nevýznamný Nevýznamný
0.972702629 0.9461504044 -61.69261888 134.4335494 -50.60328846
Stupeń polynomu 6
Proměnná Abs x x^2 x^3 x^4 x^5 x^6
Odhad 82966.67139 -42856.7854 9164.946289 -1038.153687 65.66436005 -2.197595417 0.0303795191
Směr.Odch. 49783.02806 25769.29834 5521.284019 626.5209336 39.69226459 1.330361283 0.01841588912
Vícenásobný korelační koeficient R : Koeficient determinace R^2 : Predikovaný korelační koeficient Rp : Střední kvadratická chyba predikce MEP : Akaikeho informační kritérium :
Závěr Nevýznamný Nevýznamný Nevýznamný Nevýznamný Nevýznamný Nevýznamný Nevýznamný
0.9728661866 0.9464686171 -1700.914308 3649.462812 -48.77516607
3.3.6 Závěr Optimální stupeň polynomu je n = 2 kdy je MEP a AIC mají nejmenší hodnoty. Model však vykazuje multikolinearitu a není tedy možno použít metodu MNČ, ale metodu MRH.
27
3.4
Metoda racionálních hodností – korekce hodností
Název úlohy :
Lineární regrese polynomem
Hladina významnosti : Kvantil t(1-alfa/2,n-m) : Kvantil F(1-alfa,m,n-m) : Absolutní člen : Počet platných řádků : Počet parametrů : Metoda : Transformace :
0.05 2.05552943864224 3.36901635949544 Ano 29 3 Korekce hodnosti omezení=0.6931 Polynom 2. stupně
Odhady parametrů Proměnná Abs
x
x^2
Odhad 12.03172749
Směr.Odch. 5.852241363
Spodní mez 0.002273089146
Horní mez 24.0611819
Odhad -2.381100145
Směr.Odch. 0.9130430043
Spodní mez -4.257886919
Horní mez -0.5043133715
Odhad 0.1467229543
Směr.Odch. 0.03588570501
Spodní mez 0.07295883127
Horní mez 0.2204870774
Závěr Významný
Pravděpodobnost 0.04995981532
Závěr Významný
Pravděpodobnost 0.01489683678
Závěr Významný
Pravděpodobnost 0.0003709132344
Statistické charakteristiky regrese Vícenásobný korelační koeficient R : Koeficient determinace R^2 : Predikovaný korelační koeficient Rp : Střední kvadratická chyba predikce MEP : Akaikeho informační kritérium :
0.8816508088 0.7773081487 0.7536591459 0.5282356355 -15.43505986
28
Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : Kvantil F (1-alfa, m-1, n-m) : Pravděpodobnost : Závěr :
45.37663088 3.369016359 3.312502639E-009 Model je významný
Scottovo kritérium multikolinearity Hodnota kritéria SC : Závěr :
13.87230002 Model je nekorektní!
Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : Kvantil Chi^2(1-alfa,1) : Pravděpodobnost : Závěr :
58.59443559 3.841458829 1.942890293E-014 Rezidua vykazují heteroskedasticitu!
Jarque-Berrův test normality Hodnota kritéria JB : Kvantil Chi^2(1-alfa,2) : Pravděpodobnost : Závěr :
36.6891179 5.991464547 1.079093992E-008 Rezidua nemají normální rozdělení!
Waldův test autokorelace Hodnota kritéria WA : Kvantil Chi^2(1-alfa,1) : Pravděpodobnost : Závěr :
0.3363791917 3.841458829 1.942890293E-014 Autokorelace je nevýznamná
Durbin-Watsonův test autokorelace Hodnota kritéria DW : Závěr :
1.271659502 Rezidua jsou pozitivně autokorelována!
Znaménkový test reziduí Hodnota kritéria Sg : Kvantil N(1-alfa/2) : Pravděpodobnost : Závěr :
1.67257437 1.959963999 0.09441111596 V reziduích není trend.
29
3.5
Závěr
3.5.1 Statistický U dat nebyla vyšetřena diagnostika na odhalení vlivných bodů, protože při jejich odstranění by mohlo dojít k narušení polynomické závislosti. (diagnostika by se musela provádět pro každý model zvlášť). Pro hledanou závislost byl nalezen polynomický model ve tvaru: Fe2+ = 12.0317 (+ 5.8522) – 2.3811 (+ 0.913) . vodivost (x) + 0.1467 (+ 0.0358) . vodivost2 (x2) Model byl na základě testů určen jako významný, ale Scottový testem na multikolinearitu byl model označen jako nekorektní, i když multikolinearita byly detekována pouze VIF faktorem (76.919). 3.5.2 Aplikační Na základě zjištěné závislosti byla zhotovena tabulka závislosti stupně rozkladu na vodivosti, kterou obsluha kalcinační pece používá k řízení kalcinačního režimu při výrobě železitých pigmentů. Je nutno však podotknout, že při změně suroviny se tato závislost podstatně změní, protože dojde ke změně prvkového složení suroviny.
30
Vícerozměrný Lineární regresní model
4
4.1 Úkol Pro koncového zákazníka je jedním z nejdůležitějších parametrů pigmentu „Barva a její číselné hodnoty“. Vzhledem k technologii výroby železitých pigmentů je možno barevné parametry převážně ovlivnit pouze při kalcinaci. Na základě této skutečnosti jsem si vybral k hodnocení vliv parametrů, sledovaných při kalcinaci na sytost C* pigmentové suspenze kalcinátu. 4.2
Zpracovávaná data
K hodnocení jsem použil statistický program QCExpert K dispozici bylo 50 naměřených vzorků (řádků) Tabulka IV. [x1 – stupeň rozkladu (%)];[x2 – otáčky pece (s)]; [x3 – teplota kalcinátu (oC)]; [y – C* - sytost suspenze (-) ] y 18.01 18.28 17.06 17.53 17.22 18.01 17.97 16.43 16.53 19.48 19.66 17.10 17.55 14.83 16.79 17.75 17.41 17.88 18.57 18.38 19.14 15.71 17.66 15.56 15.32
x1 93.30 94.70 94.40 94.80 96.20 96.50 96.60 96.20 95.90 95.40 95.90 96.20 96.00 96.40 95.90 95.90 97.10 95.60 95.20 95.40 94.40 95.95 97.00 97.10 97.10
x2 360 360 360 370 370 370 370 370 350 350 350 350 350 350 350 350 350 350 350 350 350 350 355 355 355
x3 880 880 870 870 890 890 890 890 890 880 880 880 890 880 880 880 890 890 890 890 880 880 880 870 890
y 15.54 15.57 18.75 15.52 17.43 15.97 17.35 16.55 19.03 20.62 16.65 17.39 18.43 17.76 17.07 16.30 16.40 16.15 16.12 16.07 19.62 17.67 16.53 16.85 17.19
31
x1 96.40 97.00 94.20 96.40 97.00 96.20 96.10 95.90 96.30 93.08 95.00 95.65 96.00 96.90 96.10 95.80 96.50 96.40 95.50 95.90 95.50 94.60 95.30 95.80 95.00
x2 355 355 355 355 355 355 350 350 350 350 350 350 350 350 350 350 355 355 355 355 350 350 350 350 350
x3 890 890 880 880 880 880 880 880 890 870 880 870 880 880 880 880 890 890 880 880 880 880 880 880 870
4.3
Lineární regresní model
Nejprve byla provedena diagnostika vlivných hodnot
Obr. IV. – 1
Obr. IV. - 2
Obr. IV. – 3
Obr. IV. - 4
Obr. IV. – 5
Obr. IV. - 6
Na základě těchto grafických diagnostik jsou řádky 1, 4, 5, 6, 7, 8, 24, 35 – označeny jako extrémy, ale tyto extrémy z dat vyloučeny nebudou. Zobrazení Wiliamsova grafu zobrazilo řádky 10, 11, 14, 34 jako odlehlé, tak tuto skutečnost ostatní grafické diagnostiky nepotvrdily.
32
4.3.1
Regresní diagnostika
Obr. IV. – 7
Obr. IV. - 8
Obr. IV. – 9
Obr. IV. - 10
Název úlohy :
Vícenásobná lineární regrese
Hladina významnosti : Kvantil t(1-alfa/2,n-m) : Kvantil F(1-alfa,m,n-m) : Absolutní člen : Počet platných řádků : Počet parametrů : Metoda :
0.05 2.01289559891854 2.80684492880651 Ano 50 4 Nejmenší čtverce
Základní analýza Charakteristiky proměnných Proměnná Průměr St.r (%) 95.7936 otáčky pece [s] 353.9 teplota kalcinátu 882
Směr.Odch. 0.9160847479 6.168550916 6.38876565
33
Kor.vs.Y -0.4985230622 -0.08857385485 -0.1071902244
Významnost 0.0002291278 0.5407530475 0.4587436123
Indikace multikolinearity Proměnná Abs St.r (%) otáčky pece [s] teplota kalcinátu
Vlas. čísla kor. m. 0.5518957211 1 0.9678811392 1.48022314
Podmíněnost kappa 1 1.811936498 1.753739162 2.682070332
VI faktor 1 1.23212513 1.02696949 1.26160040
Vícenás. kor. 0 0.434043919 0.162053204 0.455363583
Analýza rozptylu Průměr Y : Zdroj Celková variabilita Variabilita vysvětlená modelem Reziduální variabilita Hodnota kritéria F : Kvantil F (1-alfa, m-1, n-m) : Pravděpodobnost : Závěr :
17.2872 Součet čtverců 79.047208 21.3530437 57.6941643 5.674981874 2.806844929 0.002154853273 Model je významný
Průměrný čtverec 1.58094416 0.4270608739 1.153883286
Rozptyl 1.613208327 0.4357764019 1.177431925
Závěr Významný
Pravděpodobnost 0.00486233423
Závěr Významný
Pravděpodobnost 0.00023045560
Závěr Nevýznamný
Pravděpodobnost 0.5103128274
Závěr Nevýznamný
Pravděpodobnost 0.2988125349
Odhady parametrů Proměnná Abs
St.r
Odhad 71.60304754 2
Směr.Odch. 4.19790827
Spodní mez 22.89518449
Horní mez 20.3109106
Odhad -0.774731361
Směr.Odch. 0.1938566679
Spodní mez -1.164944595
Horní mez -0.3845181273
otáčky pece Odhad -0.01743954325
teplota kal.
Směr.Odch. 0.02628358524
Spodní mez -0.0703456563
Horní mez 0.0354665698
Odhad 0.02955817792
Směr.Odch. 0.02812761698
Spodní mez -0.02705977852
Horní mez 0.08617613435
34
Statistické charakteristiky regrese Vícenásobný korelační koeficient R : Koeficient determinace R^2 : Predikovaný korelační koeficient Rp : Střední kvdratická chyba predikce MEP : Akaikeho informační kritérium :
0.5197405802 0.2701302707 0.1537598136 1.337858481 15.15665122
Analýza klasických reziduí Reziduální součet čtverců : Průměr absolutních reziduí : Reziduální směr. odchylka : Reziduální rozptyl : Šikmost reziduí : Špičatost reziduí :
57.6941643 0.907962787 1.11992007 1.254220963 0.1387352775 2.214301115
Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : Kvantil F (1-alfa, m-1, n-m) : Pravděpodobnost : Závěr :
5.674981874 2.806844929 0.002154853273 Model je významný
Scottovo kritérium multikolinearity Hodnota kritéria SC : Závěr :
8.757303058 Model je nekorektní!
Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : Kvantil Chi^2(1-alfa,1) : Pravděpodobnost : Závěr :
0.114675581 3.841458829 0.7348825792 Rezidua vykazují homoskedasticitu.
Jarque-Berrův test normality Hodnota kritéria JB : Kvantil Chi^2(1-alfa,2) : Pravděpodobnost : Závěr :
2.442216351 5.991464547 0.2949031812 Rezidua mají normální rozdělení.
Waldův test autokorelace Hodnota kritéria WA : Kvantil Chi^2(1-alfa,1) : Pravděpodobnost : Závěr :
0.3828417415 3.841458829 0.7348825792 Autokorelace je nevýznamná
Durbin-Watsonův test autokorelace Hodnota kritéria DW : Závěr :
1.792277523 Rezidua nejsou autokorelována
35
Znaménkový test reziduí Hodnota kritéria Sg : Kvantil N(1-alfa/2) : Pravděpodobnost : Závěr :
4.4
0.7041536742 1.959963999 0.4813370771 V reziduích není trend.
Závěr
4.4.1 Statistický Pro hledanou závislost byl nalezen lineární model ve tvaru: C* = 71.603 (+ 4,1979) – 0.7747 (+ 0.1938) . st.r (x1) – 0.0174 (+ 0.0262) . otáčky pece (x2) – 0.0295 (+ 0.0281) . teplota kalcinátu (x3) Jako významné byly určeny pouze parametry – absolutní člen a stupeň rozkladu. Ostatní parametry modelu (otáčky kalcinační pece a teplota kalcinátu) byly určeny jako nevýznamné a opravený model má tvar C* = 83.458 (+ 16.618) – 0.6911 (+ 0.1734) . st.r (x1) Model byl na základě testů určen jako významný, ale Scottový testem na multikolinearitu byl model označen jako nekorektní, i když multikolinearita nebyla detekována VIF faktorem ani číslem podmíněnosti K. 4.4.2
Aplikační
Statistickým hodnocením byly parametry (otáčky pece a teplota kalcinátu) určeny jako nevýznamné, ale z hlediska chemizmu jsou tyto parametry důležité, protože charakterizují dobu zdržení materiálu v peci a energii dodanou chemickému rozkladu - a tudíž mají vliv na stupeň rozkladu. Tyto poznatky nebyly ani zcela detekovány analýzou párových korelací. Nevýznamnost těchto parametrů je pravděpodobně způsobena špatným odečtem příslušných hodnot v době odběru vzorku.
36
5
Lineární kalibrační model
5.1 Úkol V provozní laboratoři se provádí kolorimetrické stanovení obsahu Fe2+ v napájecí vodě pro parní kotel. K tomuto stanovení se využívá měření absorbance roztoku po přídavku a výpočtu příslušné koncentrace na základě kalibrační křivky.Tato kalibrační křivka se zhotovuje z 10-ti měření roztoků různé koncentrace, které se připravují ze standardního roztoku Mohrovy soli. Úkolem je sestrojení kalibračního modelu a zjištění koncentrací Fe2+ ve čtyřech neznámých vzorcích. Absorbance neznámých vzorků: A1 = 0.0212, A2 = 0.0689, A3 = 0.1252, A4 = 0.0986 5.2
Data pro kalibrační model
K hodnocení jsem použil statistický program ADSTAT- Lineární diagnostika, Kalibrace K dispozici bylo 10 naměřených hodnot Tabulka V. x 0.005 0.01 0.015 0.025 0.03 0.035 0.045 0.05 0.055 0.06
[x – koncentrace Fe2+ (mg/l)]; [y – Absorbance (-) ] y 0.008 0.0185 0.0278 0.047 0.052 0.065 0.0825 0.0925 0.1002 0.1125
37
5.3 Regresní diagnostika Regresní diagnostika spočívá v určení vlivných a odlehlých hodnot.
Obr. V. – 1
Obr. V. – 2
Obr. V. – 3 Obr. V. – 4 Na základě těchto grafických diagnostik jsem určil bod č.5 jako odlehlý. Bod č.10 se je podezřelý z vlivu a na základě hodnocení pomocí L-R grafu je identifikován jako odlehlý. – ostatní grafické diagnostiky bod č.10 jako odlehlý nevykazují. Numerickým hodnocením byl určen jako odlehlý pouze bod č.5. Pro další šetření kalibrační křivky jsem bod č.5 odstranil, i když je zde porušeno pravidlo o počtu minimálním hodnot. Metoda nejmenších čtverců MNČ – odhady parametrů Parametr Odhad s Kvantil t H0: β = 0 Abs. -0.000808 0.000955 -0.84584 Akceptována x 1.8609 0.025320 73.492 Zamítnuta -34 Počáteční podmínky: Omezení P = 1 .10 (MNČ) na hladině významnosti α = 0,05 Tabulkové kvantily : t(1-α/2,n-m) = 2.306 χ2(1-α,m) = 5.991
y = -0.000808(± 0.000955) + 1.8609(±0.02532)x
38
5.4
Kalibrace
Obr.V. – 5 – kalibrační přímka Určení statistických charakteristik proměnných (hladina významnosti α = 0,05) Proměnná x y
Průměr 0.03333 0.06155
Směrodatná odchylka 0.02046 0.03803
Určení parametrů kalibrace (H0: βj = 0 vs. HA: βj <>0) Parametr úsek směrnice
Odhad -0.0003731 1.8579
Analýza reziduí Reziduální součet čtverců RSC Odhad reziduálního rozptylu s2(e) Odhad sm. odchylky reziduí s(e)
Směrodatná odchylka 0,00066954 0.01738 7.0869.10-6 1.0124.10-6 1.0062.10-3
39
H0 Akceptována Zamítnuta
Určení kalibračních mezí Kritická úroveň Limita detekce Mez stanovitelnosti
yc yd ys
0.0012 0.0027 0.0120
xc xd xs
0.00085 0.00167 0.00670
Kalibrační tabulka Absorbance 0.0212 0.0689 0.1252 0.0986 5.5
Odhad c[mg/l] 0.0116 0.0373 0.0676 0.0053
LD 1.0179.10-2 3.5934.10-2 6.6042.10-2 5.1852.10-2
LH 1.3045.10-2 3.8639.10-2 6.9138.10-2 5.4693.10-2
Závěr
5.5.1 Statistický Jako významná byla určena pouze směrnice přímky a nalezená kalibrační závislost má pak tvar: y = 1.8579 (+ 0.017384) . x Přímkový kalibrační model, má limitu detekce yd = 0.0027 a xd = 0.00167. Z čehož vyplívá, že minimální koncentrace, která jde odlišit od šumu je 0.001672 mg/l a odpovídající úroveň signálu (absorbance) 0.0027 .
5.5.2
Aplikační
Takto stanovená kalibrační přímka je jednoduše použitelná pro laboratorní stanovení obsahu Fe2+ v napájecí vodě pro parní kotel. Bylo dohodnuto, že stanovení kalibrační přímky se bude opakovat každý měsíc, aby tím se vyloučily a detekovaly případné poruchy přístroje.
40
6
Nelineární kalibrační model
6.1 Úkol Stanovení p-dichlorbenzenu v chlorbenzenu se provádí metodou plynové chromatografie na vnitřní standard toluen. Proměřením kalibračních roztoků byla získána nelineární závislost poměru ploch p-dichlorbenzenu a vnitřního standardu na procentickém obsahu p-dichlorbenzenu. Odezvy neznámých vzorků: n1 = 0.024, n2 = 0.048, n3 = 0.056 6.2
Data pro kalibrační model
K hodnocení jsem použil statistický program ADSTAT- Lineární diagnostika, Kalibrace – kvadratický spline K dispozici bylo 12 naměřených hodnot Tabulka V. x 0.01 0.02 0.03 0.04 0.05 0.08 0.1 0.15 0.2 0.3 0.4 0.5
[x – obsah p-DCB (%)]; [y – odezva (-) ] y 0.013 0.027 0.04 0.048 0.053 0.07 0.09 0.12 0.15 0.22 0.27 0.32
41
6.3 Regresní diagnostika Regresní diagnostika spočívá v určení vlivných a odlehlých hodnot.
Obr. VI. – 1
Obr. VI. – 2
Obr. VI. – 3
Obr. VI. – 4
Na základě těchto grafických diagnostik jsem určil bod č.1 jako odlehlý. Bod č.12 jako extrém. Pro kontrolu jsem testoval, jak by vypadal model v případě odstranění bodu č. 1 a došel k závěru na základě hodnot AIC a MEP ( jsou mírně vyšší než u základního modelu), že bod č.1 odstranit nelze, protože by došlo k zkreslení kalibrační závislosti. Metoda nejmenších čtverců MNČ – odhady parametrů Parametr Odhad s Kvantil t H0: β = 0 Abs. 0.012679 0.00235 5.3953 Zamítnuta x 0.77463 0.03032 25.548 Zamítnuta x2 -0.32076 0.06170 -5.1987 Zamítnuta -34 Počáteční podmínky: Omezení P = 1 .10 (MNČ) na hladině významnosti α = 0,05 Tabulkové kvantily : t(1-α/2,n-m) = 2.262 χ2(1-α,m) = 7.815
42
6.4
Kalibrace
Obr.VI. – 5 – kalibrační přímka Parametry kalibrace Koeficienty rovnice : f[i]*x2+g[i]*x+h[i] pro k[i-1] < x <= k[i] k[i] 0.05
f[i] -0.32076
Analýza reziduí Reziduální součet čtverců RSC Odhad reziduálního rozptylu s2(e) Odhad sm. odchylky reziduí s(e)
g[i] 0.77463
h[i] 0.012679
1.6171.10-4 1.7968.10-5 4.2388.10-3
43
Určení kalibračních mezí Kritická úroveň Limita detekce
yc yd
0.017995 0.022658
xc xd
0.006882 0.012952
Kalibrační tabulka odezva 0.024 0.048 0.056 6.5
Odhad obsahu [%] 0.0116 0.0373 0.0676
LD
LH
8.3369.10-3 4.1663.10-2 5.2733.10-2
2.0382.10-2 5.1057.10-2 6.1688.10-2
Závěr
Nalezená kalibrační závislost má pak tvar: y = -0.32076 (+ 0.0617) .x2 + 0.7746 (+ 0.03032) .x + 0.01267 (+ 0.00235) Všechny parametry kalibrační závislosti byly určeny jako statisticky významné a model má limitu detekce yd = 0.02266 a xd = 0.01295. Z čehož vyplývá, že minimální obsah p-DCB, který jde odlišit od šumu, je 0.01295 % a odpovídající úroveň odezvy je 0.02266 . Byly testovány i jiné typy kalibračních závislostí (Lineární spline s jedním a dvěma uzly), ale kvadratický spline má nejužší proložení konfidenčních intervalů okolo kalibrační křivky.
44
7
Rozlišení mezi lineární a nelineární kalibrací
7.1 Úkol Stanovení fenolů se provádí pomocí spektrofotometrie. Proměřením kalibračních roztoků byla získána závislost absorbance a koncentrace standardních roztoků . Úkolem je prověřit, o jakou kalibrační závislost se jedná. Absorbance neznámých vzorků neznámých vzorků: n1 = 0.12, n2 = 0.42, n3 = 0.56 7.2
Data pro kalibrační model
K hodnocení jsem použil statistický program ADSTAT- Lineární diagnostika, Kalibrace – přímková, lineární spline, kvadratický spline. K dispozici bylo 9 naměřených hodnot Tabulka V. x 0.08 0.159 0.227 0.315 0.398 0.495 0.598 0.707 0.836
[x – koncentrace fenolu (mg/l)]; [y – Absorbance (-) ] y 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45
45
7.3 Regresní diagnostika Regresní diagnostika spočívá v určení vlivných a odlehlých hodnot.
Obr. VII. – 1
Obr. VII. – 2
Obr. VII. – 3
Obr. VII. – 4
Na základě těchto grafických diagnostik lze určil bod č.2 jako odlehlý, bod č. 3 – podezřelý a bod č.9 jako extrém. Numerickým hodnocením byl na základě Cookovy a Atkinsonovy vzdálenosti taktéž určen bod č. 2 jako odlehlý. Pro kontrolu jsem testoval, jak by vypadal model v případě odstranění bodu č. 2 a došel k závěru na základě hodnot AIC a MEP ( jsou mírně nižší než u základního modelu), že bod č.2 odstranit lze, i když pro další testování zůstane pouze 8 hodnot.
46
7.4
Kalibrace
7.4.1 Porovnání kalibračních závislostí Vhodnost použitého modelu lze posoudit jak z grafického zobrazení kalibrace, tak pomocí odhadu směrodatné odchylky reziduí s((e) a limity detekce xd – pro optimální model jsou tyto hodnoty nejmenší Limita Odhad směrodatné odchylky Model detekce xd reziduí s(e) Přímkový
0.013627
0.09017
0.003973
0.03975
0.003132
0.03322
Kvadratický spline
0.001441
0.01278
Kvadratický spline - 1 uzel
0.001508
0.01815
Lineární spline - 1 uzel Lineární spline - 2 uzly
47
Parametry kalibrace Koeficienty rovnice : f[i]*x2+g[i]*x+h[i] pro k[i-1] < x <= k[i] k[i] 0.0836
f[i] -0.2170
g[i] 0.7266
Analýza reziduí Reziduální součet čtverců RSC Odhad reziduálního rozptylu s2(e) Odhad sm. odchylky reziduí s(e)
h[i] -0.00589
1.0394.10-5 2.0788.10-6 1.4418.10-3
Určení kalibračních mezí Kritická úroveň Limita detekce
yc yd
-0.001139 0.003358
xc xd
0.006562 0.01278
Kalibrační tabulka Absorbance 0.12 0.42 0.56 7.5
Odhad koncentrace [mg/l] 0.18329 0.07574 1.2323
LD
LH
0.18005 0.75195 1.7448
0.18646 0.76330 1.3392
Závěr
Nalezená kvadratická kalibrační závislost pro má pak tvar: y = -0.00589 (+ 0.00185) .x2 + 0.7266 (+ 0.00895) .x - 0.21701(+ 0.0094181) Všechny parametry kalibrační závislosti byly regresní diágnostikou určeny jako statisticky významné a model má limitu detekce yd = 0.003358 a xd = 0.01278. Z čehož vyplívá, že minimální obsah fenolů, který jde odlišit od nuly je 0.01278 mg/l a odpovídající úroveň Absorbance je 0.003358. Odhad koncentrace pro absorbanci 0.56 je vypočítaný na základě zjištěné kalibrační závislosti, ale při konstrukci kalibrační křivky byla detekována pouze maximální absorbance 0.45. Pro ověření správnosti kalibrační křivky je nutno změřit i roztoky s vyšší absorbancí než je v tomto příkladu uvedeno.
48