Foutenleer 1
dr. P.S. Peijzel
In dit hoofdstuk zal een inleiding in de foutenleer gegeven worden. Foutenleer is een onderdeel van statistiek dat gebruikt wordt om een uitspraak te kunnen doen over fouten in metingen en de betrouwbaarheid van meetresultaten. Een uitgebreidere uitleg is te vinden in het dictaat ‘Foutenleer’ op practicum.chem.uu.nl Na de kerstvakantie ontvang je de opgaven. De uitwerkingen dienen uiterlijk 2 februari 2007 om 15.00 uur bij mij ingeleverd te zijn. Het inleveren dient op papier te gebeuren, stuur dus geen e-mail! Laat bij elke vraag ook zien hoe je aan je antwoord komt, en geef dus niet alleen het antwoord. Opdrachten die na 2 februari worden ingeleverd zullen niet beoordeeld worden. Voor vragen en opmerkingen:
[email protected]
Foutenleer 1
1
3
Inleiding
Wetenschappelijk onderzoek wordt meestal uitgevoerd volgens onderstaande vier stappen: (a) Eerst zien we een interessant of onbekend verschijnsel. (b) Een mogelijke verklaring (hypothese) wordt bedacht voor het waargenomen verschijnsel. (c) Experimenten worden (1) ontworpen, en (2) uitgevoerd om de hypothese te testen. (d) De resultaten van de experimenten worden gecontroleerd om te zien of ze de hypothese kunnen bevestigen. De meeste experimenten die je zult doen in het eerste jaar van je studie zullen vallen onder stap (c2) en (d). Meestal zijn zowel het te bestuderen onderwerp als de relevante achtergrondtheorie bekend. Je voert de metingen uit en controleert of de resultaten in overeenstemming zijn met de theorie. Het doen van hypotheses (stap b) en het ontwerpen van experimenten (stap c1) is een belangrijk onderdeel van wetenschappelijk onderzoek en dit zul je later in je studie nog vaker tegenkomen. Een experiment kan alleen maar goed zijn wanneer het onderscheid kan maken tussen de voorspellingen van twee verschillende theorie¨en. Dit klinkt eenvoudiger dan het is, want het houdt in dat je een uitspraak moet doen over de kwaliteit van de behaalde resultaten. Aan de hand van een eenvoudig voorbeeld zal dit duidelijk worden: Stel, je hebt een gas bij verminderde druk en je wilt identificeren welke stof het is. Bij normale druk en kamertemperatuur kan het een gas of een vloeistof zijn. Je hebt een massaspectrometer tot je beschikking en je besluit om deze te gebruiken om de molaire massa van het gas te bepalen. Je meet een molaire massa van 43.9 g. Is dit voldoende om het gas te identificeren? Het antwoord is: waarschijnlijk wel. Maar je moet eerst nog wel weten hoe nauwkeurig die massa gemeten is. In bijna elke meting zit een onnauwkeurigheid. Wanneer je de lengte van een persoon meet, dan zul je het resultaat opgeven met een nauwkeurigheid van ca. 1 cm. In het geval van overdreven nauwkeurig meten zou je dit zelfs op ca. 0.1 cm kunnen doen. Het ‘ca.’ deel is de ‘fout’ in de meting. En het begrip fout betekent hier dus de onzekerheid in het antwoord, en er wordt niet bedoeld dat je een fout gemaakt hebt bij het meten (hoewel dat wel gebeurd kan zijn, uiteraard). Het betekent dat je het resultaat van de meting niet met een absolute nauwkeurigheid kan weergeven. De groot van de fout in een meetuitkomst heeft invloed op hoe je de resultaten van een meting kan interpreteren. Wanneer de bepaalde massa een fout had van ca. 1.5 g, dan was het resultaat van de meting 43.9 ± 1.5 g, dus de stof die je meet heeft een molaire massa tussen de 42.4 en de 45.4 g. Dit kunnen meerdere stoffen zijn. Zo zijn er bijvoorbeeld: kooldioxide (44.01 g), propaan (44.07 g), ethanol (45.06 g) of ethylamine (45.09 g). Wanneer de fout nog groter zou zijn, is zelfs argon een mogelijkheid. Aan de andere kant, wanneer de fout slechts ca. 0.15 g zou
4
Foutenleer 1
zijn, blijft alleen kooldioxide als optie over. Hieruit blijkt meteen een belangrijk gegeven: Alleen de uitkomst van een meting zegt niet zo veel wanneer er niet iets gezegd wordt over de onzekerheid in het resultaat. Sterker nog, de berekende resultaten van een experiment zijn waardeloos zonder een schatting van hun betrouwbaarheid. Een schatting van de kwaliteit van een meetresultaat is een belangrijk onderdeel in de analytische chemie. Net zoals je bij synthese een uitspraak doet over de zuiverheid van een product, zo doe je in de analytische en fysische chemie een uitspraak over de betrouwbaarheid van een meetuitkomst. Foutenleer is de wetenschap die zich bezighoudt met statistiek en fouten in metingen. In dit hoofdstuk zullen een paar van de belangrijkste basisbegrippen uit de foutenleer toegelicht worden.
2
Juistheid en precisie
We beginnen meteen met twee termen die vaak door elkaar gehaald worden: Juistheid (accuracy) en precisie (precision). De juistheid van een resultaat geeft aan hoe dicht dit bij de theoretische waarde ligt. De precisie is een maat voor hoe reproduceerbaar de meetresultaten van dezelfde meting zijn. Een juiste meting komt goed overeen met de ‘ware’ waarde, terwijl een precieze meting reproduceerbare resultaten geeft. Precieze metingen zijn niet per se juist. In onderstaande afbeelding wordt dit ge¨ıllustreerd aan de hand van de resultaten van vier titraties. Meting A is precies, maar niet juist. Meting B is gemiddeld wel juist (het gemiddelde ligt dicht bij het correcte resultaat), maar niet precies. Meting C is niet juist, en ook niet precies. Meting D is zowel juist als precies.
Foutenleer 1
3
5
Toevallige en systematische fouten
Het is onvermijdelijk dat er tijdens metingen meetfouten optreden. De fouten kunnen in twee categorie¨en worden ingedeeld: Systematische fouten kunnen ontstaan door foute calibratie (nulpunt verkeerd ingesteld), een beperking in de theorie, verontreiniging van het monster of drift in het meetapparaat of zelfs een verkeerd gekozen meetmethode. Systematische fouten zorgen voor telkens dezelfde afwijking, welke dus ook niet opvallen bij herhaling van de meting. Toevallige fouten ontstaan door onnauwkeurigheden tijdens het meetproces. Ze zijn dan ook onvoorspelbaar. Door toevallige fouten geven herhaalde metingen nooit precies hetzelfde resultaat. Ze ontstaan onder andere door willekeurige fluctuaties in bijvoorbeeld de temperatuur, of elektronische ruis. Een andere oorzaak van toevallige fouten is de experimentator zelf, omdat ook die niet altijd een (analoog) instrument op precies dezelfde manier afleest (hoewel dit ook systematisch kan zijn!). In onderstaande figuur staat een histogram waarin een serie meetresultaten is uitgezet. De gemiddelde waarde van deze metingen ligt dicht bij 15. Wanneer 15 ook de ‘ware’ waarde is, dan vertonen de resultaten bij benadering een Gaussische verdeling rond het gemiddelde. Wanneer de ware waarde echter 23 is, dan is het duidelijk dat de hele set metingen een afwijking vertoont en dit suggereert de aanwezigheid van een systematische fout.
Dit hoofdstuk zal een inleiding geven in de statistiek van toevallige fouten en er zal aan de hand van voorbeelden duidelijk worden gemaakt wat de praktische gevolgen van fouten in metingen zijn. Je zou kunnen denken dat systematische fouten eenvoudig te ontdekken zijn, maar meestal is het juist moeilijker om ze aan te tonen. Dit komt uiteraard ook doordat we meestal niet weten wat de ‘ware’ uitkomst van een meting is, en dan weten we dus ook niet of we er dicht bij in de buurt zitten met ons antwoord. Systematische fouten worden
6
Foutenleer 1
snel duidelijk wanneer twee verschillende meetmethoden voor dezelfde fysische grootheid significant verschillende resultaten geven. Een bekend voorbeeld hiervan is het verschil in de gevonden waarden voor de lading van het elektron in het oliedruppel experiment van Millikan en de verhouding tussen de Faraday en Avogadro’s constante. Het verschil werd uiteindelijk verklaard door een verkeerd aangenomen waarde voor de viscositeit van lucht, waaruit de straal van de oliedruppels werd afgeleid.
4
Nog iets over systematische fouten
Toevallige fouten zijn onvermijdelijk en zullen dan ook in ieder experiment optreden. Maar, met behulp van statistiek (foutenleer) kan er goed mee gewerkt worden en hun effect kan worden geminimaliseerd door een experiment vaker uit te voeren. Voor systematische fouten ligt dit helaas niet zo eenvoudig, en daar zijn twee redenen voor: • hoewel we (meestal) weten dat er een systematische fout kan zijn, weten we niet hoe groot deze is. • soms weten we niet eens dat er een systematische fout optreedt. Het is belangrijk om je te realiseren dat systematische fouten niet lastige zaken zijn die af en toe optreden, maar dat het complicaties zijn die in ieder experiment voor kunnen komen. Wanneer je een titratie uitvoert, is de calibratie van de buret alleen correct tot op een bepaalde nauwkeurigheid. Alle volumina die je afleest zijn dus waarschijnlijk te klein of te groot. Mechanische balansen kunnen verslechteren bij gebruik. Ze kunnen dan nog steeds met dezelfde precisie worden afgelezen als wanneer ze nieuw waren, maar elke meting kan de zelfde afwijking vertonen. In veel experimenten worden in de achterliggende theorie benaderingen gedaan. Je kan bijvoorbeeld uitgaan van ideale gassen, en voor waterstof werkt dit vrij goed, en voor kooldioxide niet altijd. In elk meetresultaat zit dan een kleine systematische fout. De grootte van zo’n fout wordt ook nog door de experimentele condities bepaald. Afwijkingen van de ideale gaswet treden met name bij hogere drukken op. Het is vaak moeilijk om systematische fouten te identificeren en om een schatting van hun grootte te maken. Dit betekent niet dat deze fouten genegeerd kunnen worden. Integendeel: systematische fouten zijn een groter obstakel bij het verzamelen van betrouwbare data dan toevallige fouten, omdat voor toevallige fouten statistische verklaringen en verwerkingsmethoden zijn.
Foutenleer 1
5
7
Hoe om te gaan met toevallige fouten
Herhaalde metingen van dezelfde waarde bevatten gewoonlijk een fout. Wanneer deze fout een toevallige fout is, wordt de grootte ervan bepaald door toeval en de uitkomsten zullen verspreid zijn rondom een gemiddelde. De resultaten vertonen dan meestal een Gaussische of ‘normale’ verdeling. Toevallige fouten zijn volledig onvoorspelbaar en onvermijdelijk. Ze kunnen niet worden vermeden door het experiment zorgvuldiger uit te voeren, maar hun effect kan worden verminderd door het experiment te herhalen en statistiek toe te passen op de resultaten. Wanneer voldoende metingen beschikbaar zijn (vaak is zes een goed minimum) dan kunnen deze resultaten geanalyseerd worden om het gemiddelde te bepalen. Ook kunnen we de kans dat de ware waarde binnen een bepaald tolerantiegebied van het gemiddelde ligt bepalen. In de praktijk wordt in verband met de beschikbare tijd soms een kleiner aantal metingen gedaan. Dit gaat dan soms uiteraard wel ten koste van de betrouwbaarheid. Deze analyse is vanzelfsprekend en moet altijd worden gedaan wanneer door toevallige fouten een significante spreiding in de meetresultaten is ontstaan. De benodigde berekeningen kunnen met een eenvoudige rekenmachine of spreadsheet uitgevoerd worden. Bij toevallige fouten wordt ervan uit gegaan dat de ware waarde, dat is het gemiddelde µ van een groot aantal metingen voor x alleen gemeten kan worden binnen een bepaalde tolerantie of standaarddeviatie σ, en dat de kans P (x)dx voor het meten van een waarde tussen x en x + dx de normale verdeling volgt. De functie P (x) ziet er als volgt uit: √ P (x) = 2πσ 2 exp[−(x − µ)2 /2σ 2 ]
(1)
en heeft de eigenschap dat 67% van een oneindig groot aantal metingen van x liggen in het gebied µ ± σ, 95% ligt binnen µ ± 2σ en 99% ligt binnen µ ± 3σ. In paragraaf 6 zal uitgelegd worden hoe uit een set metingen het gemiddelde en de standaarddeviatie berekend kunnen worden. Paragraaf 7 gaat over het vergelijken van resultaten van een meting met een literatuurwaarde. In paragraaf 8 zal aandacht besteed worden aan het doorwerken van fouten, wanneer fouten in meerdere gemeten grootheden gecombineerd worden.
8
6
Foutenleer 1
Schatting van het gemiddelde en de standaarddeviatie
Het uitrekenen van het gemiddelde en de standaarddeviatie voor een set meetwaarden is vrij eenvoudig. Wanneer we een set (onafhankelijke) metingen x1 , x2 , . . . xn hebben dan worden het gemiddelde x¯ en de standaarddeviatie s berekend als respectievelijk: n
1 1X x¯ = (x1 + x2 + . . . + xn ) = xi n n i=1 v u u s = t
(2)
n
1 X (xi − x¯)2 n − 1 i=1
(3)
De factor (n-1) in vergelijking 3 wordt veroorzaakt door het feit dat alleen (n − 1) van de xi metingen onafhankelijk zijn wanneer het gemiddelde bekend is. Een manier om een meetresultaat weer te geven is: s x = x¯ ± √ (4) n Een voorbeeld: Stel dat je de energie van de vibratie van de C–O binding in koolmonoxide een aantal keer hebt bepaald en je vond de waarden 2140, 2145, 2139, 2150, 2146, 2142 en 2144 cm−1 . Dan zou je het eindresultaat noteren als 2143.7 ± 1.4 cm−1 .
De waarde √sn is de standaarddeviatie in het gemiddelde (ook weergegeven met sg ). We gebruiken deze waarde om te bepalen op hoeveel decimalen we een resultaat weergeven. Je berekent eerst sg en dit noteer je met slechts 1 significant cijfer. Is dit echter een 1 of een 2, dan noteer je een extra cijfer (is dit weer een 1 of een 2, dan doe je dit NIET nog een keer). Het aantal cijfers achter de komma dat je nodig hebt om sg te noteren bepaalt de notatie van het eindresultaat. In bovenstaand voorbeeld was de standaarddeviatie in het gemiddelde 1.4 cm−1 . We noteren het gemiddelde dan met 1 cijfer achter de komma. Vergeet ook niet de eenheden bij de meting (en dus ook bij de standaarddeviatie) te noteren!!
7
Vergelijking van resultaten van verschillende experimenten
Vaak worden metingen uitgevoerd aan een grootheid waarvoor al eerder betrouwbare waarden gevonden zijn. Belangrijk is dan hoe je jouw eigen gevonden waarden kunt vergelijken met de resultaten van anderen. We kunnen hier twee gevallen onderscheiden: het vergelijken van een serie metingen met een nauwkeurig bekende literatuurwaarde, en het vergelijken van een serie metingen met een serie metingen van iemand anders. Dit laatste is ingewikkelder dan het eerste geval en we zullen ons hier dus beperken tot het eenvoudigste geval, waar we de gemiddelde meetwaarde vergelijken met een literatuurwaarde of met een theoretisch voorspelde waarde µ. Wanneer je een groot aantal metingen hebt verricht, bij voorbeeld meer dan 50 en er alleen willekeurige fouten optreden dan is te verwachten dat de gemeten waarden een normale
9
Foutenleer 1
verdeling vormen rond x = µ en dat er een kans van 95% is dat die waarden liggen binnen 1.96σ √ √ van de ware waarde, en een kans van 99% dat die waarden liggen binnen 2.58σ van n n de ware waarde. In de praktijk doe je minder metingen en dan wordt niet de normale verdeling gebruikt, maar de Student’s t. De berekende standaarddeviatie wordt in dit geval ook s genoemd, en niet σ, en in plaats van µ gebruiken we x¯ om het gemiddelde aan te duiden. Wanneer x¯ en s bekend zijn, dan is het mogelijk om betrouwbaarheidsintervallen voor µ te berekenen. Die intervallen zijn gedefinieerd als: tn s µ = x¯ ± √ n
(5)
In deze vergelijking staat tn voor de waarde van de Student’s t bij n vrijheidsgraden. Het aantal vrijheidsgraden is in dit geval het aantal metingen min 1. Dit is zo omdat wanneer het gemiddelde en alle behalve ´e´en meetwaarde bekend is, die laatste waarde ook vaststaat. In bijvoorbeeld tabel 4-2 in “Harris” zijn voor verschillende betrouwbaarheden de waarden van tn te vinden. Wanneer van onze n metingen het gemiddelde x¯ en de standaarddeviatie s bekend zijn, en we willen deze waarde vergelijken met een literatuurwaarde binnen een zekere betrouwbaarheid, dan voeren we de zogenaamde t-toets uit. Bereken:
|¯ x − literatuurwaarde| √ n (6) s en vergelijk deze tberekend met de waarde voor tn die je opzoekt in tabel 4-2 in “Harris” (voor n-1 vrijheidsgraden en de gewenste betrouwbaarheid). Wanneer tberekend kleiner is dan tn , dan kan je met de gekozen betrouwbaarheid zeggen dat er geen significant verschil is tussen de gemeten waarde en de literatuurwaarde. Wanneer er gekozen was voor een betrouwbaarheid van 95% dan wil dat dus ook zeggen dat er een kans van 5% is dat deze uitspraak niet gerechtvaardigd is. In plaats van gebruik van de tabel in “Harris” heeft een programma als Excel ook statistische functies om een t-toets uit te voeren. tberekend =
Een statistische toets zoals de t-toets doet dus geen uitspraak of een meetwaarde de juiste meetwaarde is, het is alleen mogelijk om een uitspraak te doen over de betrouwbaarheid van een uitkomst. De verantwoordelijkheid voor de interpretatie ligt nog steeds bij jezelf!
8
Propagatie van toevallige fouten
Soms is het resultaat van een meting een hoeveelheid die je direct hebt gemeten. De fout hierin is dan de fout in de meting. Soms wordt het eindresultaat echter verkregen door combinatie van verschillende metingen. De eindberekening is dan een combinatie van optellen, aftrekken, vermenigvuldigen, delen en machtsverheffen van de verschillende waarnemingen. De fouten in verschillende waarnemingen zijn meestal niet even groot en in dat geval kan niet worden volstaan met optellen of vermenigvuldigen van de fouten om de fout in het eindantwoord te bepalen. De meest directe methode is het opnemen van foutenmarges in de formule waarmee het eindresultaat wordt berekend. Wanneer er echter veel rekenstappen zijn, dan is dit niet meer zo eenvoudig, en bovendien veel werk.
10
Foutenleer 1
Er zijn echter een paar regels over doorwerkende fouten. Let wel op dat het hier gaat om toevallige fouten. De doorwerking van systematische fouten wordt hier buiten beschouwing gelaten. Wanneer van elke meting de fout in die meting bekend is, dan zijn er wiskundige regels om te bepalen wat de fout in het eindantwoord is.
8.1
Lineaire combinaties
In dit geval wordt het eindantwoord y berekend uit een lineaire combinatie van gemeten waarden a, b, c, etc. door: y = k + k a a + kb b + kc c + . . .
(7)
waarbij k, ka , kb , kc , etc. constanten zijn. De variantie (dat is het kwadraat van de standaarddeviatie) heeft de belangrijke eigenschap dat de variantie van de som of het verschil van onafhankelijke meetwaarden gelijk is aan de som van hun varianties. Wanneer σa , σb , σb , etc. de standaarddeviaties zijn in a, b, c, etc., dan is de standaarddeviatie in y, σy gegeven als: p (ka σa )2 + (kb σb )2 + (kc σc )2 + . . . (8) σy =
8.2
Vermenigvuldiging/deling
Wanneer y berekend wordt uit een vermenigvuldiging of deling, bijvoorbeeld: y = k
ab cd
(9)
waarbij a, b, c, en d onafhankelijke meetwaarden zijn en k een constante is, dan is er het volgende verband tussen de relatieve standaarddeviaties: r σy σa 2 σb 2 σc 2 σd 2 = + + + (10) y a b c d In het geval van machtsverheffen, bijvoorbeeld b3 , dan kan dat niet geschreven worden als b × b × b omdat de drie b’s niet onafhankelijk zijn. In het geval van: y = bn is het verband tussen de standaarddeviaties: σy nσb = y b
8.3
(11)
(12)
Andere functies
Wanneer y een functie is van x, y = f (x), dan verhouden de standaarddeviaties in x en y zich als: dy σy = σx (13) dx