Jihočeská univerzita Pedagogická fakulta katedra fyziky
Zpracování a prezentace výsledků měření (KFY/ZPM) stručný učební text
Pavel Kříž
České Budějovice
2005 Úvod Předmět Zpracování a prezentace výsledků měření (ZPM) volně navazuje na předmět Fyzikální praktikum I – Úvod do fyzikálního praktika (FPR1), určený pro studenty magisterských oborů s aprobací fyzika pro základní nebo střední školu. Dále také navazuje na předměty Základní fyzikální měření I – Úvod do fyzikálního měření (ZFMB1) a Statistické vyhodnocování experimentálních dat I a II (SVEB1 a SVEB2) určené pro studenty bakalářského oboru Měřicí a výpočetní technika akreditovaného na katedře fyziky Pedagogické fakulty Jihočeské univerzity v Českých Budějovicích. Oproti výše zmíněným předmětům je zde více času věnováno konkrétním příkladům zpracování fyzikálního měření a další prezentaci výsledků v různých formách. Při zpracovávání konkrétních hypotetických měření se studenti učí využívat především osobní počítač a jeho různé softwarové vybavení. Jedná se především o aplikace produktů firmy Microsoft, konkrétně o tabulkový kalkulátor Microsoft Excel a o program pro tvorbu prezentací Microsoft PowerPoint. Zbytek časové dotace v příslušném semestru je věnován zásadám tvorby konferenční vývěsky, tzv. posteru, v prostředí aplikace CorelDRAW. Vlastní zpracování hypotetických měření je zaměřeno především na zautomatizování postupů při zpracování a vytváření aplikačních tabulek a grafů. Do těchto tabulek by jejich budoucí uživatel pouze vyplnil hodnoty získané vlastním měřením a software by automaticky vypočítal příslušné hodnoty studovaných veličin a jejich odchylek a sestrojil příslušné grafy včetně jejich popisek. Aplikační tabulky a grafy jsou pak vytvářeny v takové formě, aby je bylo možné jednoduchým způsobem vkládat do jiných softwarových aplikací pro prezentaci dat, např. pomocí schránky Windows. Hodnocení přesnosti veličin V této části bude stručně shrnuta teorie získávání měřené nebo vypočítávané veličiny a získávání chyb těchto veličin ze souboru experimentálně zjištěných hodnot. Podrobnější teoretický rozbor je uveden v literatuře, která byla doporučena u jednotlivých předmětů zmíněných v úvodu, např. [1, 2, 3]. Hodnota libovolné fyzikální veličiny zjištěná měřením se vždy o něco liší od její skutečné hodnoty. Jejich rozdíl se nazývá skutečná, nebo také absolutní chyba měření. Pokud bychom tuto chybu znali, mohli bychom určit skutečnou hodnotu měřené veličiny. To ovšem není z principu možné. Proto se snažíme určit alespoň nejpravděpodobnější hodnotu měřené veličiny a její pravděpodobnou chybu.
Podle příčin vzniku dělíme chyby na systematické a náhodné [1]. Systematická chyba ovlivňuje výsledek měření zcela určitým způsobem, s jistou pravidelností. Měřená hodnota veličiny je v takovém případě buď neustále vyšší nebo nižší než hodnota skutečná. Systematické chyby mají původ v použité metodě (např. využití zjednodušujících předpokladů), v měřicích přístrojích (lze ji korigovat cejchováním nebo korekčními křivkami) a samozřejmě v pozorovateli (např. nedokonalost oka, reakční doba atd.). Systematická chyba se navíc s rostoucím počtem měření nezmenšuje, proto je vhodné provést důslednou analýzu tohoto druhu chyb a pokusit se je co nejvíce eliminovat ještě před vlastním měřením. Náhodné chyby jsou výsledkem působení přesně nedefinovaných vlivů při měření přibližně za stejných podmínek. Proto měření fyzikálních veličin představuje statistický proces s náhodnou proměnnou. Výhodou je, že vliv náhodných chyb na výsledek měření klesá s rostoucím počtem opakovaných měření. Vlastní teorie chyb vychází z teorie pravděpodobnosti a matematické statistiky a je předmětem kurzů SVEB1 a SVEB2, proto se jí zde nebudeme podrobněji zabývat, pouze provedeme stručné shrnutí. Rozdělení chyb měření se řídí Gaussovým normálním rozdělením, viz [2, 4], se střední hodnotou rovnou nule a nenulovou hodnotou směrodatné odchylky σ (ve valné většině případů). Důležitou hodnotou je i hodnota tzv. mezní chyby κ , která je rovna trojnásobku směrodatné odchylky. Její význam spočívá v 99,7% pravděpodobnosti, že naměřená hodnota se od aritmetického průměru neliší o více než je tato chyba κ. Prakticky to znamená, že ze souboru naměřených dat vypustíme ta měření, která se odlišují od aritmetického průměru o více než ±κ. Poté je ovšem nutné znovu statisticky zpracovat nový, takto korigovaný soubor dat. V některé literatuře, např. [5], je kromě směrodatné odchylky neboli střední kvadratické chyby σ uváděna i tzv. pravděpodobná chyba ϑ . Je definována tak, že pravděpodobnost naměření hodnoty, která se od aritmetického průměru liší o méně než ±ϑ, je 50%. Mezi oběma chybami platí vztah: ϑ = 0,674 σ 2/3·σ. Tato chyba je tedy „opticky“ příznivější. Získáme-li měřením soubor naměřených hodnot xk, kde k = 1…n, pak po případné korekci pro nás tento soubor představuje náhodný výběr ze souboru všech možných hodnot naměřené veličiny. Z teorie statistického zpracování náhodného výběru [2, 4, 6] vyplývají následující nejdůležitější vztahy: –
aritmetický průměr x x=
1 n ⋅ ∑ xk , n k =1
(1)
–
výběrová směrodatná odchylka jednoho měření s s=
–
n 1 2 ⋅ ∑ ( xk − x ) n − 1 k =1
výběrová směrodatná odchylka aritmetického průměru sx n
sx =
–
(2)
s = n
∑( x k =1
− x)
k
2
(3)
n ⋅ ( n − 1)
pravděpodobná chyba aritmetického průměru sϑ n
2 2 sϑ = ⋅ sx = ⋅ 3 3
∑( x k =1
k
− x)
2
(4)
n ⋅ ( n − 1)
Aritmetický průměr zde představuje nejpravděpodobnější hodnotu měřené veličiny.
n 3 4 5 6 7 8 9 10 11 12 15 20 30 50 100 Tab. 1
t(P, n) P = 68,3% 1,32 1,20 1,15 1,11 1,09 1,09 1,07 1,06 1,06 1,05 1,04 1,03 1,02 1,01 1,00 1,00
P = 95% 4,30 3,18 2,78 2,57 2,45 2,37 2,31 2,26 2,23 2,20 2,15 2,08 2,05 2,01 1,98 1,96
P = 99% 9,92 5,84 4,60 4,03 3,71 3,50 3,36 3,25 3,17 3,11 2,98 2,86 2,76 2,68 2,63 2,58
P = 99,73% 19,21 9,22 6,62 5,51 4,90 4,53 4,27 4,09 3,96 3,85 3,63 3,45 3,28 3,16 3,08 3,00
Studentův součinitel t = t(P, n)
Často se u získaných výsledků udává tzv. interval spolehlivosti, což je interval x − t ⋅ sx ; x + t ⋅ sx ,
(5)
v němž bude při daném počtu měření n ležet se zvolenou pravděpodobností P hodnota měřené veličiny. Součinitel t = t(P, n) je tzv. Studentův součinitel [6, 7], který je závislý právě na počtu měření n a zvolené pravděpodobnosti P. Hodnoty tohoto součinitele pro různá n a P jsou uvedeny v tab. 1. Ve velké většině případů postačuje provádět 10 až 20 měření, přičemž pravděpodobnost P postačuje 68,3%. Potom Studentův součinitel t je pouze o 6% až 3% odlišný od jedné a proto se při uvádění intervalu spolehlivosti nemusí uvažovat. Neměříme-li přímo hledanou veličinu, ale počítáme ji z několika naměřených veličin (např. určování hustoty materiálu tělesa tvaru válce z hmotnosti tělesa, výšky tělesa a průměru tělesa), je počítání nejpravděpodobnější hodnoty a směrodatné odchylky aritmetického průměru počítané veličiny poněkud složitější. Nechť je hledaná veličina u vázaná s měřenými veličinami x, y, z,… symbolickým vztahem u = u(x, y, z,…).
(6)
Nejdříve je nutné určit aritmetické průměry a směrodatné odchylky skutečně měřených veličin x, y, z,….Potom nejpravděpodobnější hodnota hledané veličiny je u = u ( x , y , z ,...) .
(7)
Horní mez směrodatné odchylky vypočtené veličiny je dána tzv. lineárním zákonem hromadění chyb [4]
( su ) max =
∂u ∂u ∂u ⋅ sx + ⋅ sy + ⋅ s z + ... . ∂x ∂y ∂z
(8)
Výsledkem teorie pravděpodobnosti je pro výběrovou směrodatnou odchylku odlišný vztah 2
2
2
∂u ∂u ∂u su = ⋅ s x2 + ⋅ s y2 + ⋅ s z2 + ... , ∂x ∂x ∂y
(9)
který je označován jako kvadratický (Gaussův) zákon hromadění chyb [4] a je pro výběrovou směrodatnou odchylku příznivější než zákon lineární. Využití vztahu (9) pro výpočet směrodatných odchylek veličin ve zvláštních případech je uvedeno v literatuře, např. [3, 4]. Grafická analýza dat měření Při měření funkčních závislostí fyzikálních veličin můžeme provést buď regresní analýzu této závislosti nebo přehlednější, ovšem méně přesnou, analýzu grafickou. Nechť uvažované veličiny x, y mají závislost y = f(x), kterou přesně neznáme. Při měření získáme n uspořádaných dvojic [xi, yi], které jsou zatížené chybami. Nejčastějším případem grafického znázornění je zobrazení těchto dvojic v pravoúhlém (kartézském) souřadnicovém systému, i když existují i jiné
systémy, např. polární. V pravoúhlém systému je obrazem každého jednotlivého měření bod. Tím získáme n bodů, které představují tzv. bodový graf, ze kterého budeme vycházet při konstrukci spojitého grafu hledané funkční závislosti, protože valná většina fyzikálních veličin má spojitý průběh bez diskrétních nespojitostí. Na druhou stranu mohou jisté děje probíhat nespojitě, např. ty, které souvisejí s počtem částic apod.). Je-li jedna veličina funkcí dvou veličin, potřebovali bychom trojrozměrný graf, který neumožňuje přesnější grafickou analýzu. V takovém případě je vhodnější využít dvourozměrného zobrazení, kde vykreslíme graf závislosti veličiny na jedné nezávisle proměnné pro konstantní hodnoty druhé nezávisle proměnné, přičemž využijeme jejích konstantních hodnot ve zvolené řadě. Tím získáme v podstatě sérii řezů trojrozměrného grafu rovinami, na kterých druhá nezávisle proměnná veličina nabývá daných konstantních hodnot. Tvar grafu hledané funkční závislosti výrazně ovlivňuje volba stupnice na souřadnicových osách. V praxi se nejvíce využívá 4 funkcí, které přiřazují hodnotě fyzikální veličiny hodnotu na stupnici příslušné souřadnicové osy. Jedná se především o funkce 1. lineární
a + b·x (rovnoměrná stupnice),
2. logaritmickou
a + b·log x
nebo
a + b·ln x (logaritmická stupnice),
3. kvadratickou
a + b·x2 (kvadratická stupnice),
4. lineárně lomenou
a + b / x (lineárně lomená stupnice),
přičemž b 0 a a 0 určuje hodnotu zobrazované veličiny v uvažovaném počátku stupnice. Nejčastěji se používají první typ na obou osách (např. milimetrový papír), nebo druhý typ na obou osách (např. logaritmický papír), nebo kombinace prvního a druhého typu (např. semilogaritmický papír). Při vlastní tvorbě grafu je potřeba dodržovat následující zásady: 1. posoudíme průběh naměřené závislosti a rozhodneme se pro typ stupnic, 2. zhodnotíme rozsah hodnot měřených veličin a vhodně zvolíme počátek a míru os tak, aby graf pokrýval významnou část plochy vymezenou oběma osami, 3. vytvoříme stupnice ve zvolených jednotkách a popíšeme osy (většinou značkou fyzikální veličiny lomenou její jednotkou – např. R / kΩ), 4. pečlivě vyneseme hodnoty naměřených veličin, při různých závislostech vynášených do jednoho grafu použijeme různé značky, popř. různé barvy. Tím získáme bodový graf naměřených hodnot. Při hrubých odchylkách některých bodů je třeba zjistit příčinu odchylky, abychom neodstranili body, které popisují nějaký významný fyzikální jev, např. hrubě měřenou rezonanci. Někdy je vhodné k jednotlivým bodům vynášet i výběrovou
směrodatnou odchylku ve formě svislých chybových úseček. Známe-li skutečnou závislost, je vhodné do bodového grafu vykreslit i graf analytické funkce, čímž můžeme snáze posoudit shodu a případné odchylky. Regresní analýza dat měření V dnešní době počítačů se od grafické analýzy dat měření upouští. Neznámou fyzikální závislost veličin y = f(x) totiž můžeme hledat také analyticky pomocí statistického odhadu (predikce) zvaného regrese nebo regresní analýza. Při zpracovávání vycházíme z n uspořádaných dvojic [xi, yi], přičemž platí yi = f(xi) + ε i, kde ε i je náhodná chyba i–tého měření. Hledaná funkce obsahuje určitý počet neznámých parametrů y = f(x, b0, b1,…, bk). Tyto parametry se nazývají regresní koeficienty [2, 4]. Využijeme metodu nejmenších čtverců, která získává hodnoty těchto koeficientů na základě minima tzv. reziduálního (zbytkového) součtu čtverců, tj. n
[
(
S e = ∑ yi − f xi , b0∗ , b1∗ ,..., bk∗ i =1
)]
2
,
(10)
∗ ∗ ∗ kde b0 , b1 ,..., bk jsou statistické odhady regresních koeficientů. Aby funkce Se nabývala minima,
musí být parciální derivace funkce podle jednotlivých odhadů regresních koeficientů rovny nule, tzn. ∂S e = 0 pro všechna j = 0, 1,…, k. ∂b ∗j
(11)
Tak získáme soustavu normálních rovnic, jejímž řešením jsou hledané odhady regresních koeficientů. Nejjednodušším případem funkční závislosti je lineární funkce tvaru y = a + b·x,
(12)
pro níž je řešení uvedeno v řadě publikací, např. [2, 4, 6]. Protože se jedná o jednoduchou snadno řešitelnou funkci, je vhodné i jiné typy závislostí převést (pokud to lze) pomocí speciálních substitucí na lineární typ. Příklady takových funkcí a příslušných substitucí jsou uvedeny v tab. 2. Při hodnocení kvality regrese se kromě reziduálního součtu čtverců (10) používá ještě totální (celkový) součet čtverců n
S t = ∑ ( yi − y ) . 2
i =1
Pro vlastní hodnocení se užívají následující veličiny: 1. Koeficient determinace r2, definovaný vztahem
(13)
r 2 = 1−
Se , St
(14)
Tento koeficient je nezáporný, menší nebo roven jedné. Hodnoty blízké jedné se považují za vhodné kritérium přijetí zvoleného modelu. Tento koeficient není vhodné použít u lineární regresní funkce. 2. Koeficient korelace r je odmocninou z koeficientu determinace a používá se u lineární regresní funkce. 3. Reziduální rozptyl s2, definovaný vztahem s2 =
Se , n − ( k + 1)
(15)
kde k + 1 je počet odhadovaných regresních koeficientů a f = n – (k + 1) > 0, tj. počet měření zmenšený o počet regresních koeficientů, se nazývá počet stupňů volnosti reziduálního součtu čtverců Se. 4. Směrodatná odchylka s je odmocninou rozptylu a má význam odhadu směrodatné odchylky kteréhokoliv měření yi. Pro hodnocení regrese má větší význam než koeficient determinace (14).
Nelineární regresní funkce y =a+
b x
y = ab x y = a + b ln x y = ax b y = ae bx b
y = ae x Tab. 2
Substituce 1 =ξ x ln y = η, ln a = A, ln b = B ln x = ξ ln y = η , ln a = A, ln x = ξ ln y = η , ln a = A 1 ln y = η, ln a = A, = ξ x
Linearizovaná regresní funkce y = a + bξ
η = A + Bx y = a + bξ η = A + bξ η = A + bx η = A + bξ
Příklady funkcí, které lze vhodnými substitucemi převést na lineární
Lineární regresní funkce jedné nezávisle proměnné pomocí aplikace Microsoft Excel V prostředí programu Microsoft Excel lze velmi jednoduše zjišťovat parametry lineární regresní funkce (12). První možností je proložení bodového grafu tzv. spojnicí trendu. Po označení naměřených hodnot v bodovém grafu vybereme z místní nabídky možnost Přidat spojnici trendu, na kartě Typ vybereme Lineární a na kartě Možnosti zaškrtneme Zobrazit rovnici regrese a Zobrazit koeficient spolehlivosti R. Na obrazovce se objeví regresní přímka, zápis
regresní funkce, ze kterého můžeme vyčíst hodnoty regresních parametrů, a koeficient determinace r2. Počet zobrazených desetinných míst můžeme upravit formátováním. Chceme-li s regresními koeficienty dále počítat, tzn. vypočítávat z nich hodnoty dalších fyzikálních veličin, je vhodnější využít maticový vzorec s funkcí listu LINREGRESE, viz např [8]. Nejdříve vybereme oblast 5 x 2 buňky (viz Tab. 3) a v řádku vzorců zvolíme statistickou funkci LINREGRESE. Objeví se dialogové okno, ve kterém vyplníme pole hodnot y, pole hodnot x a dva logické parametry B a Stat. V případě, že zvolíme B = 0 (NEPRAVDA), bude regresní přímka procházet počátkem souřadnicové soustavy. V opačném případě, tzn. B = 1 (PRAVDA), nebo bude-li parametr B vynechán, nemusí regresní přímka nutně tímto počátkem procházet. Je-li parametr Stat = 1 (PRAVDA), budou vypsány i hodnoty dalších regresních statistik. V opačném případě, tzn. Stat = 0 (NEPRAVDA), nebo bude-li parametr Stat vynechán, nebudou další statistiky vypsány a zjistíme pouze hodnoty regresních koeficientů. Po zmáčknutí kombinace kláves CTRL + SHIFT + ENTER se provede výpočet a ve vybrané oblasti se vypíší hodnoty hledaných parametrů a jiných regresních statistik. Význam jednotlivých hodnot je zřejmý z Tab. 3, popř. z nápovědy aplikace Microsoft Excel. regresní koeficient b, viz (12) směrodatná chyba koeficientu b Se sb = b ⋅ f ⋅ St koeficient determinace r2, viz (14) f ⋅ St Se totální součet čtverců St, viz (13) F statistika – F =
Tab. 3
regresní koeficient a, viz (12) směrodatná chyba koeficientu a s a = sb ⋅
1 n 2 ⋅ ∑ xi n i =1
směrodatná chyba odhadu y – s y =
Se f
počet stupňů volnosti f, viz (15) zbytkový součet čtverců Se, viz (10)
Význam hodnot vrácených maticovou funkcí LINREGRESE v oblasti 5 x 2 buňky
V prvním přiblížení je důležité věnovat pozornost především hodnotám regresních koeficientů a a b, jejich směrodatným chybám sa a sb, koeficientu determinace r2 a zbytkovému součtu čtverců Se.
Literatura [1]
Brož, J. a kol.: Základy fyzikálních měření, I. díl. SPN, Praha 1983.
[2]
Pavelka, L., Doležalová, J.: Pravděpodobnost a statistika. Vysoká škola báňská, Technická Univerzita, Ostrava 1995.
[3]
Procházková, E.: Úvod do fyzikálního praktika. Pedagogická fakulta, Jihočeská univerzita, České Budějovice 1991.
[4]
Vybíral, B.: Zpracování dat fyzikálních měření. Studijní text pro soutěžící FO, studující fyziku na UHK a ostatní zájemce o fyziku. MAFY, Hradec Králové 2002.
[5]
Horák, Z.: Praktická fyzika. SNTL, Praha 1958.
[6]
Rektorys, K.: Přehled užité matematiky. SNTL, Praha 1963; 6. vydání: Prométheus, Praha 1995.
[7]
Čmelík, M., Machonský, L., Burianová, L.: Úvod do fyzikálních měření. Technická univerzita, Liberec 2001.
[8]
Šedivý, P.: Teplotní závislosti fyzikálních veličin. Studijní text pro soutěžící FO a ostatní zájemce o fyziku. MAFY, Hradec Králové 2002.