Energeticky efektivní budovy 2015 sympozium Společnosti pro techniku prostředí 15. října 2015, Buštěhrad
VYUŽITÍ STATISTIKY V POŽÁRNÍM ZKUŠEBNICTVÍ Otto Dvořák Architektura a interakce budov s životním prostředím, UCEEB, ČVUT, Buštěhrad
ANOTACE Příspěvek specifikuje aplikaci vybraných statistických testů k ověření, platnosti nulové hypotézy, odlehlosti naměřených dat z řady měření za podmínek opakovatelnosti, homogenity zkušebních vzorků pro mezilaboratorní porovnávací zkoušky (MPZ), aplikaci grafů Z a Zeta-skóre k názornému grafickému porovnání výsledků jednotlivých účastníků MPZ.
SUMMARY The article specifies application of selected statistical tests to verification of the null hypothesis, measured data outliers from a series of measurements under repeatibility conditions, test samples homogenity for interlaboratory proficiency testing (IPT), application of the Z - score and Zeta - score graphs to help to visual graphical comparison of individual IPT participants.
ÚVOD I neakreditované výzkumné laboratoře musí aplikovat principy managementu, politiky jakosti, vedení záznamů z měření/zkoušek a vyhodnocování nejistot kvantitativních výsledků atd. v souladu s ČSN EN ISO/IEC 17025 [1], [2], [4]. Nedílnou důležitou součástí jejich práce je též analýza naměřených dat s ohledem na přesnost a shodnost. Využívají k tomu vybrané statistické nástroje.
TERMINOLOGIE K popisu přesnosti zk. metod/metod měření používá norma ČSN EN ISO 5725 - 2 [2] dvou termínů: správnost a shodnost. Přesnost (accuracy): těsnost shody mezi výsledkem zkoušky a přijatou referenční hodnotou. Zahrnuje kombinaci náhodných složek a složek ze zdrojů systematických chyb. Shodnost (precision): těsnost shody mezi nezávislými výsledky zkoušek získanými za specifických zkuš. podmínek. Závisí pouze na rozdělení náhodných chyb. Vychýlení nebo též strannost (bias): rozdíl mezi střední hodnotou výsledků zkoušek/měření a přijatou referenční hodnotou. K variabilitě výsledků přispívají více či méně: - obsluha zařízení/přístroje, - zkušební zařízení/přístroj, - kalibrace přístrojů, - podmínky prostředí (teplota a barom. tlak okolí, proudění vzduchu atd).
57
Vztah mezi uvedenými termíny názorně vyjadřuje schema na obr. 1. X= µ + δ + e Naměřená hodnota
referenční hodnota
systematická náhodná chyba chyba (vychýlení) (shodnost) přesnost
Obr. 1 Složky přesnosti při zkoušce/měření veličiny X
ZÁKLADNÍ STATISTIKA Před vlastní statistickou analýzou naměřených dat je účelné data vizuálně překontrolovat, např. pomocí bodového grafu (na vodorovné ose se vynesou v měřítku výsledky měření jako tučné body). Pro větší počet výsledků měření (n > 10) lze zkonstruovat histogram (na ose y počet měření jako sloupce se stejným počtem bodů, na ose x stupnice naměřených dat). Pro základní sumarizaci dat je u pož. testů nutno počítat výběrový aritm. průměr, medián a modus (spíše výjimečně), variační rozpětí, výběrovou směrodatnou odchylku, směrodatnou odchylku výběrového aritmetického průměru a/nebo relativní směrodatnou odchylku. Výběrový aritmetický průměr ( ̅𝑥): 1 1 x x1 x 2 ...x n xi n n i
x i
n
i
(1)
Pokud by počet n byl celkový, výsledek výpočtu lze označit za střední hodnotu základního souboru (population mean): namísto ̅𝒙 se potom označuje symbolem µ. ~ Medián ( x ): Je definován jako hodnota znaku stojícího přesně uprostřed souboru, který byl uspořádán podle velikosti. Jeho stanovení je u souborů s lichým počtem členů jednoduché. Stačí seřadit hodnoty podle velikosti a najít střed (např. n = 23, pak medián je hodnotou 12. znaku). Je využitelný např. tam, kde se vyskytují hodnoty nižší např. než mez detekce přístroje. U souborů se sudým počtem znaků je medián průměrem dvou sousedních středních hodnot. x (s vlnovkou). Medián se označuje symbolem ~ ⏞: Modus (𝒙) Představuje hodnotu, která se v souboru vyskytuje nejčastěji (má nejvyšší četnost) a je pro soubor charakteristická.
58
U intervalového rozložení četností nalezneme modus většinou mezi hodnotami intervalu s nejvyšší četností, tzv. modální interval a přibližnou hodnotu modusu lze vypočítat podle vzorce:
xˆ L
D1 h D1 D2
(2)
kde L je dolní hranice modálního intervalu, D1 je rozdíl četností modálního intervalu a četností jemu předcházejícímu intervalu, D2 je rozdíl četností modálního a následujícího intervalu, h je šířka intervalu (vymezení intervalu, podle kterého bylo provedeno rozdělení). Variační rozpětí (R): je nejjednodušší mírou variability.
R x max x min
(3)
Naměřená data veličiny X seřadíme podle velikosti. R je rozdílem mezi největší xmax a nejmenší naměřenou hodnotou xmin. Výběrová směrodatná odchylka (s): Výběrová směrodatná odchylka s je mírou rozptylu jednotlivého výsledku měření kolem výběr. aritmetického průměru. Pro menší počet opakovaných měření (n < 10) ji lze vypočítat z rozpětí R podle vzorce (4) a při větším počtu měření n z rozptylu podle vzorce (5).
s R kn
(4)
kde kn je Dien- Dixonův koeficient s velikostí podle počtu měření n, viz tab. 1. Tab. 1 Hodnoty kn pro výpočet výběr. směrodatné odchylky z rozpětí
s
N
2
3
4
5
6
7
8
9
10
kn
0,886
0,591
0,486
0,430
0,395
0,370
0,351
0,337
0,325
(x
i
x) 2
i
n 1
x i
2 i
1 ( x i ) 2 n i n 1
(5)
Směrodatná odchylka výběrového průměru ( s x ) Vypočteme ho podle vzorce (6). Udává interval kolem výběr. aritmetického průměru x , ve kterém se s určitou pravděpodobností nalézá aritmetický průměr základního souboru X .
59
sx
( x x)
2
i
s n
i
n(n 1)
x
1 ( xi ) 2 n i n(n 1)
2 i
i
(6)
Relativní směrodatná odchylka (sr): Označuje se též jako variační koeficient (vk). Častěji se vyjadřuje v procentech. vzorce je patrno, že vyjadřuje její podíl z aritm. průměru.
s 100(%) x
sr
Ze
(7)
LINEÁRNÍ REGRESE A KORELACE V praxi požárních testů/měření se může jednat o stanovení např. dvou veličin, z nichž jedna je závislá na druhé, podle vztahu y = f(x). Pokud je tato závislost lineární lze vyjádřit rovnici přímky ve známém tvaru. (8) y bx a kde b je směrnice přímky, a je úsek, který přímka vytíná na ose y. Pro výpočet parametrů a a b lineární regrese se obvykle užívá metoda nejmenších čtverců. Pro výpočet lze aplikovat vzorce (9) a (10):
yi
a
b
i
n
b
xi i
n
y bx
( xi x )( yi y )
i
( xi x )
2
i
(9)
n xi yi xi yi i
i
n xi2 i
i
( xi ) 2
(10)
i
Metodou lineární regrese vypočítáme parametry přímky proložené naměřenými body tak, aby pokud možno co nejvíce ležely na této přímce. Jak těsně naměřené body leží na přímce můžeme vyjádřit tzv. korelačním koeficientem (r) s velikostí od -1 do +1. Čím více se korelační koeficient blíží 1, tím je těsnost závislosti vyšší. Korelační koeficient lze vypočítat podle vzorce (11):
r
n x i y i x i y i i
2 n x i x i i i
i 2
i
2 2 n y i y i i i
(11)
K interpretaci vypočtené hodnoty r se užívá tzv. koeficient determinace, což je druhá mocnina koeficientu korelace vynásobená 100.
60
STATISTICKÉ TESTY VÝZNAMNOSTI Ve statistice mají slova „ významnost“, „významný“ specifický význam. Významná diference znamená diferenci, která pravděpodobně nevznikla čistě náhodným výběrem. Lze ji odhalit testy významnosti. Jestliže je jedna řada dat významně odlišná od druhé, odlišnost závisí nejenom na velikosti průměrné odchylky, ale též na počtu dat a jejich rozptylu. Takové řady dat se naměří např. při testování vlivu určitého faktoru na výsledek zkuš. metody, při porovnávání dvou rozdílných zkuš. metod nebo přístrojů či obsluhy a v neposlední řadě při mezilaboratorních porovnávacích zkouškách (MPZ). Významnost je tak funkcí velikosti výběru. Naštěstí jsou k dispozici statistické tabulky s kritickými hodnotami rozdílů mezi průměry a kritickými t-hodnotami a kritickými F-hodnotami pro rozdíly v rozptylu. Podle statistické teorie se ověřuje platnost: - nulové hypotézy: výsledek podle “staré metody A = výsledku podle nové metody B“, - alternativní hypotézy: výsledek podle „staré metody A ≠ výsledku podle nové metody B“. Možnost, že A a B jsou pouze odlišné (dvoustranný test) je 2x větší než případ, že A je větší (nebo menší) než B (jednostranný test). Test na homogenitu zkušebního vzorku Základním předpokladem pro pozitivní výsledky např. MPZ je, aby pilotní laboratoř připravila účastníkům homogenní vzorky. Pokud má být připraveno pro n účastníků a k zkušebních vzorků pro např. chemickou analýzu, lze připravit n . k zkušebních vzorků celkem a z nich odebrat náhodným způsobem k vzorků ke kontrolní analýze např. se dvěma opakováními na každém vzorku. Zadání: - počet kontrolních vzorků: k - počet opakování: 2 - jednotlivé výsledky: yij, když i = 1,2,…,k a j = 1, 2 (počet opakování) Výpočty: - průměrů jednotlivých měření i: -
celkového průměru:
-
celkového rozptylu:
-
rozptylu reziduálního:
-
Testovací charakteristiky:
𝑥̅𝑖 = 𝑥̅̅ =
1 𝑘
1 𝑛
∑2𝑗=1 𝑦𝑖𝑗
∑𝑘𝑖=1 𝑥𝑖 2
(12) (13)
𝑅𝐴 = 𝑛 . ∑𝑘𝑖=1(𝑥𝑖 − 𝑥)2
(14)
𝑅𝑅 = ∑𝑘𝑖=1 ∑2𝑗=1(𝑦𝑖𝑗 − 𝑥𝑖 )2
(15)
F=
Vyhledání v tabulkách [5]: Kvantilu Fα /𝑑̅/, když N = k.n
61
𝑅𝐴 (𝑁−𝑘) 𝑅𝑅 (𝑘−1)
(16)
Hodnocení: Když je F > Fα, jsou rozdíly mezi zkušebními vzorky významné – nevhodné pro MPZ. Pokud je tomu naopak, jsou zkuš. vzorky vhodné. F-test (Fisherův test) Jím se porovnává rozptyl výsledků např. s1 a s2 s cílem zjistit, zda jsou vhodné a zda je možné např. obě řady dat spojit do jedné. Fhodnota= s12/ s22
Postup: Vypočte se
(17)
Když v čitateli musí být větší číslo. Z tabulek [5] se odečte hodnota Fkrit při znalosti (n1-1) a (n2-1) stupňů volnosti pro první a druhou řadu dat s 95 % konfidenční úrovní. Pokud data pocházejí ze stejného základního souboru, potom bude platit, že Fkrit ≥ Fhodnota, což znamená, že rozptyl dat v obou řadách není významně odlišný (nulová hypotéza je akceptována). t-test (Studentův test) Jedná se o statistický postup používaný k porovnání průměrných hodnot obou řad s podobnými směrodatnými odchylkami podle F - testu. Aplikace je jednoduchá při použití excelovské tabulky s vloženými funkcemi a dostupností statist. tabulek s kritickými hodnotami tkritt. [5]. Testování probíhá tak, že se vypočtou nejprve t-hodnoty podle následujících vzorců: t=
/x̅ −μ/
(18)
s/√n
- pro dvoustranný test t=
/d̅ .√n /
(19)
sd
- pro jednostranný test - pro rozdíl mezi nezávislými výběrovými průměry t=
̅̅̅− /(x x2 1 ̅̅̅)/
(20)
1 1 + n1 n2
𝑠𝑝 .√
kde 𝐱̅ je výběrový průměr, μ je průměr základního souboru (střední hodnota), /d/ je absolutní hodnota rozdílu mezi párovými průměry, s je výběrová směrodatná odchylka zkuš. výsledků, 𝐱̅ 𝟏 , 𝐱̅ 𝟐 jsou nezávislé výběr. aritmetické průměry, n1, n2 jsou počty měření prvního a druhého výběru, sc je sdružená stand. směrodatná odchylka podle vzorce (21) , s1 a s2 jsou výběrové směrodatné odchylky řady 1 a 2. (21) s𝑐 =
√s1 2 (n1 −1)+s2 2 (n2 −1) (n1 + n2 )−2
62
Následně statistik porovná vypočtenou t-hodnotu s kritickou hodnotou tkrit odečtenou z tabulek [3]. K vyhledání kritických hodnot je zapotřebí znát: – – –
jednostranný nebo dvojstranný test (podle směru diference), stupeň volnosti ν = n-1, s jakou jistotou si žádáme výsledek.
Pro pož. laboratoř běžně dostačuje 95 % konfidencí úroveň. Např. pro 10 měření (ν=9) a 95 % konfidenční úroveň lze z tabulek odečíst tkrit= 2,26. Když je thodnota > tkrit lze nulovou hypotézu zamítnout se závěrem, že je zde významná diference mezi novou a starou zkušební metodou. To však ještě nemusí znamenat, že by nová metoda měla být zavržena. Záleží na tom, jestli v principu danému účelu vyhovuje. Test významnosti je pouze část informace ke zvážení. Test na odlehlé hodnoty ve výběrové řadě- Grubsův test Pokud neznáme směrodatnou odchylku základního souboru σ a střední hodnotu základního souboru m, lze aplikovat následující postup pro např. jednostranný test: - výsledky měření veličiny setřídíme do uspořádaného výběru y1 ≤ y2 ≤ y3 ≤ ….≤ yn, - vypočteme výběrový průměr podle (1) a výběrovou směrodatnou odchylku podle vztahu (5), - pro rozhodnutí, zda y1 a yn hodnoty patří do základního souboru s normálním rozdělením vypočteme veličiny Gn a G1 podle vzorce (22): 𝐺𝑛 =
𝑦𝑛 − 𝑦̅ 𝑠
a 𝐺1 =
𝑦̅ − 𝑦1 𝑠
(22)
Výsledky porovnáme s hodnotou h z následující tabulky č. 1 pro známé n (rozsah výběru) a zvolenou hladinu významnosti α (v požární laboratoři obvykle 0,05). Tab. č. 2 Mezní hodnoty h pro rozsah výběru n a při hladině významnosti α = 0,05 [3] 3 4 5 6 7 8 9 10 11 12 Rozsah výběru n 1,155 1,481 1,715 1,887 2,020 2,126 2,215 2,290 2,355 2,412
Mezní hodnota h
Pokud Un ≥ h a/nebo U1 ≥ h, podezřelý výsled/ek/y vyloučíme, v opačném případě ne. Cochranův test na odlehlost dat z hlediska přesnosti Tímto testem lze prověřit, zda např. jedna laboratoř neposkytla výsledky z větším rozptylem (s menší přesností) než ostatní laboratoře, jejichž výsledky statistik uspořádá a vepíše do tabulky. Výsledky jsou v tabulce uspořádány tak, aby v první řádce byla laboratoř s nejnižšími a v poslední řádce s nejvyššími naměřenými hodnotami (pořádková statistika = order statistic). Pro výsledky jednotlivých laboratoří vypočítá jejich výběrové rozptyly (variance) a z nejvyššího odhadu smax2 konstruuje Cochranovo kritérium podle vzorce (23) 𝑝
C = smax2 /∑𝑖=1 𝑠𝑖2 ,
(23)
63
které následně porovnává s tabelovanými kritickými hodnotami Cαkrit (j, ν) [2], [3] na hladinách významnosti α = 1% a α = 5 % pro počet stupňů volnosti ν = n - 1. Pokud jedna laboratoř poskytla odlehlý výsledek, počet laboratoří i se snižuje na i = n - 1 a provede se druhé kolo testování. Pokud se ve druhém kole zjistí laboratoř s vybočenými výsledky, zahrne je do zpracování. Zbylé výsledky se považuji za přesné. Odlehlý výsledek je výsledek, do kterého se promítají nenáhodné chyby, např. hrubé. Nezahrnují se do statistického vyhodnocení. Platí následující pravidla: C > Cα=0,01,crit(p, ν) Laboratoř poskytla odlehlý výsledek Cα=0,01,krit(p, ν) > C > Cα=0,05,crit (p, ν) Laboratoř poskytla vybočený výsledek Cα=0,05,krit (p, ν) > C Výsledek laboratoře je zatížen pouze náhodnou chybou Vysvětlivky: i je počet laboratoří, i = 1, 2,..,,.p Deanův a Dixonův test na odlehlost dat z hlediska správnosti Tímto testem lze prověřit, zda laboratoř neposkytla významně odlišné hodnoty výsledků v porovnání s ostatními (nesprávné) než ostatní laboratoře. Statistik uspořádá dodané výsledky a vepíše do tabulky. Z nich konstruuje Dean-Dixonovo kritérium podle následujících vzorců: Qn =(xn –xn-1)/R, pro horní okraj,
(24)
Q1 =(x2 -x1)/R, pro dolní okraj,
(25)
Následně porovná výsledky s kritickou hodnotou Qα v tabulkách [5]pro příslušné n a α. Pokud je Qn nebo Q1 > Qα , je naměřený výsledek odlehlý a vylučuje se. Určení z-score a zeta-score Laboratoře lze názorně hodnotit pomocí grafů z a zeta –score [8], když zscore =
(𝑦̅𝑖 −𝜇)
(26)
𝜎
̅𝒊 je průměrný výsledek i-té laboratoře, μ je správná/ referenční /vztažná hodnota pro kde 𝒚 testovanou úroveň, σ je „terčová“ hodnota, směrodatná odchylka určující přípustnou úrovně znaku v MPZ. Možnosti určení μ: - po dohodě zúčastněných laboratoří, - vlastnost vzorku je známa (jedná se o certifikovaný materiál, CRM), - porovnáním naměřených výsledků s CRM. Možnosti určení σ, která specifikuje přípustnou odchylku úroveň znaku v MPZ: - jako směrodatnou odchylku reprodukovatelnosti sR , - jako taxativně stanovenou přesnost zkuš. metody podle zkuš. postupu. Výsledky měření veličiny (i odlehlé) setřídíme do uspořádaného výběru pro jednotlivé úrovně (vzestupně), podle vzorce (26) vypočteme z-score a z nich jsou sestrojeny grafy. Odlehlé výsledky jsou patrny mimo vyznačený interval způsobilosti zetascore =
(𝑦̅𝑖 −𝜇)
(27)
2 + 𝑢2 ) √(𝑢𝜇 𝑖
kde uμ je standardní nejistota vztažné hodnoty. ui je stand. nejistota výsledku laboratoře
64
Odhad rozšířené nejistoty výsledků stanovení Stručnou informaci k možnému postupu odhadu čtenář nalezne v odkazu [4].
ZÁVĚR Jsou uvedeny stručně vybrané jednoduché statistické testy vhodné pro hodnocení významnosti výsledků požárních testů. Potřebné výpočty významně ulehčí a zrychlí aplikace komerčních SWs, např. Microsoft Excel Worksheet, ANOVA atd. Nutno zdůraznit, že statistika je v tomto případě významný pracovní nástroj, ne cíl. Podrobnější informace k další související problematice, např. validaci nově vyvinutých nebo zaváděných zk. metod, možnostem verifikace zkuš. zařízení, určení míry opakovatelnosti a míry reprodukovatelnosti zkuš. metody atd. čtenář nalezne v použité literatuře. Je zřejmé, že znalost základních statistických metod hodnocení výsledků zkoušek je pro vysokoškolského pracovníka této laboratoře nutností a musí být jedním z kvalifikačních předpokladů.
LITERATURA [1] ČSN EN ISO/IEC 17025: 2005 Posuzování shody – Všeobecné požadavky na způsobilost zkušebních a kalibračních laboratoří. [2] DVOŘÁK, O. Způsobilost výzkumných laboratoří k měření při experimentálních zkouškách a chemických analýzách v oblasti požární ochrany. Sborník příspěvků z mezinárodní konference Požární ochrana 2015. Ostrava: VŠB – TUO, 2015, s. 53-55. [3] ČSN ISO 5725-2: 1997 Přesnost (správnost a shodnost) metod a výsledků měření – Část 2: Základní metoda pro stanovení opakovatelnosti a reprodukovatelnosti normalizované metody měření. [4] DVOŘÁK, O. Odhady nejistot v laboratořích RP1 UCEEB. Stručný úvod. Buštěhrad: 2015, Basecamp.com/2201322/projects/2396472/attechments [5] LÍKEŠ J., LAGA J. Základní statistické tabulky. Praha: SNTL, 1967. [6] ANDĚL, J. Matematická statistika. Praha: SNTL, [7] JANKO, J. Statistické tabulky. Praha: Nakladatelství ČAV, 1958. [8] ČSN EN ISO/IEC 17043: 2010 Posuzování shody – Všeobecné požadavky na zkoušení způsobilosti.
PODĚKOVÁNÍ Tento příspěvek vznikl za podpory Evropské unie, projektu OP č. CZ.1.05/2.1.00/03.0091 – Univerzitní centrum energeticky efektivních budov.
65
VaVpI