Vojtěch Janoušek:
III. Statistické zpracování a
interpretace analytických dat
Úvod
III. Zpracování a interpretace analytických dat •
Statistické vyhodnocení analytických dat
•
Zdroje chyb, přesnost a správnost analýzy
•
Systematické chyby, náhodné chyby
•
Odhady střední hodnoty a směrodatné odchylky
•
Grafická prezentace dat
•
Zákon o šíření chyb
•
‚Detekční limity‘
Statistické zpracování dat
Statistické zpracování analytických dat
Chyby měření •
systematické chyby (míra správnosti měření = accuracy)
•
náhodné chyby (míra přesnosti = precision)
•
hrubé chyby (odlehlé hodnoty = ouliers)
Statistické zpracování dat
Statistické zpracování analytických dat
a)
obě analýzy nesprávné, XRF nepřesná
b)
obě analýzy správné, XRF nepřesná
Skutečná hodnota je 40 ppm. (Potts, 1987)
Statistické zpracování dat
Statistické zpracování analytických dat
Systematické chyby – lze testovat pomocí statistických testů, např. Dixonův, χ2
•
chyby metody (neadekvátnost použitého modelu pro daný experiment,…)
•
chyby měřidel (nepřesná kalibrace, nepřesný přístroj,…)
•
chyby pozorování (nepřesnost v odečítání,…)
•
chyby při vyhodnocování (zaokrouhlování, chyby použitých konstant) Statistické zpracování dat
Statistické zpracování analytických dat
Náhodné chyby •
kolísají náhodně co do velikosti i znaménka
•
nedají se předvídat a jsou popsány určitým pravděpodobnostním rozdělením
•
náhodná veličina spojitá/nespojitá
•
frekvenční křivka: graf hodnot pozorování xi versus jejich četnost (spojitá/nespojitá)
•
odhad parametrů rozdělení pomocí střední hodnoty (μ) a směrodatné odchylky (S)
Statistické zpracování dat
Statistické zpracování analytických dat
Normální rozdělení
Intervaly spolehlivosti pro μ ± 1σ 68.27 % ± 2σ 95.44 % ± 3σ 99.74 %
Statistické zpracování dat
Statistické zpracování analytických dat
Odhady střední hodnoty •
Aritmetický průměr
1 n x = ∑ xi n i =1 •
Geometrický průměr
g=n
n
∏x
i
i =1
Statistické zpracování dat
Statistické zpracování analytických dat
Odhady střední hodnoty •
Medián hodnota přesně uprostřed rozdělení četností (dělí frekvenční křivku na dvě poloviny o stejném počtu hodnot, tj. n/2)
•
Modus nejčastější hodnota (maximum frekvenční křivky)
Statistické zpracování dat
Statistické zpracování analytických dat
Odhad směrodatné odchylky •
Směrodatná odchylka pro malý počet měření se n nahrazuje n-1
•
S=
1 n 2 ( x − x ) ∑ i n i =1
Relativní směrodatná odchylka
Sr =
S .100% x
Statistické zpracování dat
Statistické zpracování analytických dat
Odhad směrodatné odchylky II. •
Směrodatná odchylka aritmetického průměru (standard error of the mean)
S Sx = = n
n 1 2 ( x − x ) ∑ i n.( n − 1) i =1
Statistické zpracování dat
Statistické zpracování analytických dat
Hmotová spektrometrie
(Thirlwall 1991)
• odhad přesnosti měření směrodatná odchylka aritmetického průměru (2 s.e.)
• odhad správnosti měření opakovaná měření standardu, jeho směrodatná odchylka Statistické zpracování dat
Statistické zpracování analytických dat
Grafická prezentace •
Histogramy absolutní (relativní) četnost
Statistické zpracování dat
Statistické zpracování analytických dat
Grafická prezentace •
Krabicový graf (boxplot, box and whiskers plot)
•
Box and percentile plot
Statistické zpracování dat
Statistické zpracování analytických dat
Grafická prezentace
•
•
Stripplot
... atd Statistický jazyk R (Ihaka a Gentleman, 1996) Statistické zpracování dat
Zákon o šíření chyb
Zákon o šíření chyb ⎛ ∂f σ f = ∑ ⎜⎜ i ⎝ ∂x i
2
⎞ ⎟⎟ .σ xi 2 ⎠
Sčítání, odčítání hodnot zatížených chybou: t * ±σ * = t1 + t 2 − t 3 ± σ t1 + σ t2 + σ t3 2
Statistické zpracování dat
2
2
Zákon o šíření chyb
Šíření chyb při násobení konstantou: t * ±σ * = c.t ± c.σ t
Násobení, dělení hodnot zatížených chybou: σ t3 σ t1 σ t2 t1.t 2 t * ±σ * = ±t 2 + 2 + 2 t3 t1 t2 t3 2
2
2
Statistické zpracování dat
Zákon o šíření chyb
Vážený průměr: t ±σt
∑t w = ∑w i
i
i
1 ∑ wi
±
i
i
i
kde váha wi: wi =
1
σ 2t
i
Statistické zpracování dat
Zákon o šíření chyb
Porovnávání stáří t1, t2 zatížených chybou: Porovnává se rozdíl obou stáří Δ a chyba tohoto rozdílu na zvolené hladině významnosti k. Pokud:
Δ = t1 − t 2 ≤ kσ Δt lze považovat obě stáří za statisticky stejná
Statistické zpracování dat
Zákon o šíření chyb
Z daného horninového komplexu byla získána stáří 1000 ± 100 a 1200 ± 50 mil. let. •
Určete chybu jejich rozdílu a zda jsou statisticky stejná na hladině významnosti 95 %
•
Spočtěte jejich vážený průměr a jeho chybu
Statistické zpracování dat
Zákon o šíření chyb
⎛ ∂f σ f = ∑ ⎜⎜ i ⎝ ∂x i
2
⎞ ⎟⎟ .σ xi 2 ⎠
t1 − t 2 ≤ kσ Δt
t * ±σ * = t1 + t 2 − t 3 ± σ t1 + σ t2 + σ t3 2
t ±σt
∑t w = ∑w i
i
i
±
i
i
1 ∑ wi
2
wi =
2
1
σ 2t
i
i
1: 112 Ma, ano 2: 1160 ± 90 Ma (2σ) Statistické zpracování dat
‚Detekční limity‘
Signál pozadí je charakterizován střední hodnotou xB a směrodatnou odchylkou σ B Potom:
xB + 2σ B
optimistický odhad spodního limitu stanovitelnosti je uváděný např. výrobci některých analytických přístrojů.
xB + 3σ B
spodní limit detekce je vhodný pro kvalitativní nebo semikvantitativní analýzu.
xB + 6σ B
spodní limit stanovitelnosti odpovídá nejmenšímu signálu, který je možno kvantitativně měřit.
xB + 10σ B
limit kvantifikace je používán místo spodního limitu stanovitelnosti např. při právních sporech nebo v komerčních posudcích. Statistické zpracování dat
Použitá a doporučená literatura
•
IHAKA, R. & GENTLEMAN, R., 1996. R: A language for data analysis and graphics. Journal of Computational and Graphical Statistics, 5, 299-344.
•
MELOUN, M. & MILITKÝ, J., 2002. Statistické kompendium zpracování analytických dat. Academia Praha..
•
POTTS, P. J., 1987. A Handbook of Silicate Rock Analysis:Blackie & Son Ltd., Glasgow and London, 1-622.
•
ROCK, N. M. S. et al. 1987. Nonparametric estimation of averages and errors for small data-sets in isotope geoscience: a proposal. Chemical Geology (Isotope Geoscience Section), 66, 163-177.
•
ROCK, N. M. S., 1988. Numerical Geology. A Source Guide, Gloassary and Selective Bibliography to Geological Uses of Computers and Statistics. Lecture Notes in Earth Sciences 18:Springer, Berlin, 1-427.
•
THIRLWALL, M. F., 1991. Long-term reproducibility of multicollector Sr and Nd isotope ratio analysis. Chemical Geology (Isotope Geoscience Section), 94, 85-104.
Statistické zpracování dat