FOUTENLEER
Faculteit Scheikunde - Universiteit Utrecht 2005
FOUTENLEER INHOUDSOPGAVE 1. Spreiding in meetresultaten.................................................................................................................5 2. De meetuitkomsten zelf.....................................................................................................................12 3. De beperkte nauwkeurigheid van meetapparatuur ............................................................................17 4. Het noteren van het resultaat van de meting .....................................................................................24 5. De standaarddeviatie in een samengestelde grootheid......................................................................28 6. Polynoom-fit m.b.v. de kleinste kwadraten methode (i.h.b. lineaire regressie)................................34 7. Verdelingsfuncties.............................................................................................................................43 8. Verwachtingswaarden .......................................................................................................................53 9. Betrouwbaarheidsinterval, Hypothesen, Toetsen..............................................................................58 10. Literatuur over Foutenleer en Statistiek..........................................................................................72 11. Tabellen...........................................................................................................................................74 APPENDIX: OEFENOPGAVEN. ........................................................................................................79 FORMULE-OVERZICHT FOUTENLEER 2004 ..............................................................................85
Dr. J.L. Derissen en Drs. P.H. van Roon Onderwijs Instituut Chemische Wetenschappen Faculteit Scheikunde UU Editie 2005
foutenleer- 5
1. Spreiding in meetresultaten 1.a. Meting aan één voorwerp of homogene stof Als men een fysische of chemische eigenschap van een voorwerp of van een homogeen deel van een stof enige keren meet, dan ziet men dat gewoonlijk niet steeds dezelfde meetuitkomst wordt verkregen. We noemen dit fenomeen spreiding. Voorbeeld Meting van de massa van een messing blokje, om de minuut gemeten op dezelfde analytische balans, leverde: 58.5773 58.5771
58.5771
58.5770
58.5772
58.5769 (gram).
Meting van dezelfde massa op 6 verschillende balanzen, vlak na elkaar gemeten, leverde op: 58.5773 58.5758
58.5774
58.5771
58.5762
58.5769 (gram).
Er van uitgaande dat de massa van het blokje slechts één bepaalde, unieke waarde kan hebben, kan er gespeculeerd worden over de oorzaken van de spreiding in deze meetuitkomsten. We kunnen o.a. bedenken: - temperatuurfluctuaties (geeft verschillen in de opwaartse druk van de lucht op het blokje) - luchtcirculatie in de balansen - aanraken met vette vingers en daardoor verontreinigen van het blokje - verschillende afstelling van de balansen (bijvoorbeeld van het nulpunt) - variatie in de elektronica van de balansen (veroorzaakt ruis, stroomverschillen) - gebruik van 2 typen balansen: elektronisch (4x) en mechanisch (2x). Merk op dat wanneer er een ruwere meting van deze massa met deze balansen had plaats gevonden, er wèl steeds dezelfde waarde zou zijn uitgekomen: alle meetwaarden zijn dan bijvoorbeeld 58.58 gram. We durven zelfs de volgende stelling te poneren: Als er bij herhaalde meting van een continue grootheid steeds dezelfde uitkomst wordt gevonden, dan is er waarschijnlijk te grof gemeten! We kunnen opmerken dat uit het bovenstaande voorbeeld ook blijkt dat we nooit kunnen vaststellen hoe groot de massa echt is. In het voorbeeld zijn de cijfers 58.57 als "zeker" te beschouwen, maar de volgende decimalen zijn onzeker: waarschijnlijk is het 5e cijfer een 7 of misschien ook wel een 6, terwijl vanaf het 6e cijfer niets meer over de getalwaarde te zeggen valt. (De "echte" massa zou een oneindig groot aantal decimalen hebben, die allemaal zeker zijn, binnen de klassieke fysica). Opgave 1.1 De temperatuur van kokend water werd door een tiental studenten gemeten in het kader van een experiment over kookpuntsverhoging. Ze gebruikten daarvoor tien verschillende van de gebruikelijke laboratoriumthermometers. De meetuitkomsten, gesorteerd naar toenemende temperatuur, blijken te variëren van 99.6 tot 100.7 oC: 99.6
99.8
100.0
100.1
100.1
100.2
100.4
100.5
100.6
100.7 oC.
Noem zoveel mogelijk oorzaken voor het feit dat de 10 studenten niet allemaal dezelfde meetuitkomst vonden. Noem ook oorzaken van het feit dat de meetuitkomsten van 100.0 oC afwijken.
foutenleer- 6 Opgave 1.2 Bij meting van de Faraday (= de lading van een mol elektronen) m.b.v. een elektrolyseproef, waarbij telkens de lading (= stroomsterkte * tijdsduur) nodig om een bepaalde hoeveelheid zilver neer te slaan werd bepaald, vonden 5 studenten de volgende meetuitkomsten (in C/mol): A:
99310
100490
98220
B:
96634
97522
97423
C:
92794
97730
95851
D:
96147
96642
96343
E:
98815
98043
88084
Geef een aantal mogelijke oorzaken van de spreiding in deze meetuitkomsten.
1.b. Meting aan een verzameling voorwerpen of stoffen Als één eigenschap van een verzameling voorwerpen of stoffen o.i.d. gemeten wordt, dan treedt er nog een extra spreiding op in de meetuitkomsten ten gevolge van verschillen in de individuen. Voorbeeld Meting van de buretdruppelgrootte van op het oog identieke buretten van hetzelfde merk en type. Telkens werden 100 druppels afgeteld en daarvan werd het volume afgelezen. De grootte van één druppel wordt gesteld op 1 / 100 maal dit volume. Verkregen meetwaarden, in ml, zijn o.a.: Buret 1: 4.30 4.17 4.03 4.18 4.21 4.16 4.15 4.34 4.28 4.08 (gemiddeld 4.190) Buret 2: 4.31 4.40 4.17 4.24 4.35 4.28 4.37 4.48 4.40 4.34 (gemiddeld 4.334) Buret 3: 4.21 4.05 4.04 4.17 4.20 4.13 4.17 4.27 4.13 4.19 (gemiddeld 4.156) Buret 4: 4.11 4.19 4.30 4.12 4.30 4.25 4.22 4.24 4.23 4.24 (gemiddeld 4.220) Buret 5: 4.08 4.15 4.19 4.18 3.95 4.00 4.02 4.15 4.06 3.96 (gemiddeld 4.074)
Als mogelijke oorzaken voor het feit dat er voor één buret enigszins verschillende meetuitkomsten worden verkregen kan men o.a. aangeven: - de meting is door verschillende personen uitgevoerd - buretstanden moeten tussen twee schaalstreepjes geschat worden - misschien zijn er af en toe 99 of 101 druppels geteld - snel of langzaam druppelen heeft wellicht invloed - er blijft misschien af en toe een halve druppel aan de kraan hangen. Als mogelijke oorzaken van het feit dat er voor verschillende buretten verschillende gemiddelde meetuitkomsten worden verkregen kan o.a. worden bedacht: - iedere buretkraan is toch ietsje anders, hetgeen invloed kan hebben op de druppelgrootte - er kunnen vet- of stofdeeltjes in een of meerdere kranen gezeten hebben - verschillen in de schaalverdelingen van de buretten. Concluderend kunnen we stellen: a. spreiding in meetuitkomsten is niet te vermijden b. de oorzaken van de spreiding zijn velerlei en vaak niet allemaal te achterhalen.
foutenleer- 7
1.c. Het weergeven van de spreiding in meetuitkomsten De eenvoudigste manier om de spreiding in de meetuitkomsten te laten zien is het vermelden van alle meetuitkomsten. Voor het verkrijgen van een snel overzicht is het dan prettig als ze volgens opklimmende of afdalende waarden worden gesorteerd, waarbij wel moet worden bedacht dat dan de meetvolgorde verloren gaat. Voorbeeld De 12 meetuitkomsten voor de massa van het messing blokje uit par. 1.a.: 58.5758
58.5762
58.5769
58.5769
58.5770
58.5771
58.5771
58.5771
58.5772
58.5773
58.5773
58.5774
Men heeft nu een compleet beeld van alle meetuitkomsten. Een nadeel is dat dit bij veel meetuitkomsten veel opschrijfwerk en ruimte vraagt. Men heeft ook geen snel totaaloverzicht van de meetuitkomsten. Minder compleet, maar wel illustratief, is het vermelden van alleen maar de laagste en de hoogste waarde, of zelfs van alleen maar het verschil tussen die twee waarden, de zogenaamde spreidingsbreedte (Engels: range): w = xmax - xmin
(1.1)
w = 58.5774 - 58.5758 = 0.0016 g in het bovenstaande voorbeeld van het messing blokje. Men kan een grafische voorstelling maken van de meetuitkomsten, bijvoorbeeld in de vorm van een staafdiagram (voor elke meetuitkomst een staafje ter lengte van de waarde) of een histogram (voor elke klasse (= groepje dicht bij elkaar liggende waarden) een staafje met oppervlak gelijk aan het aantal metingen in de klasse). Voor het construeren van histogrammen bestaan normvoorschriften (zie NEN 1047). In paragraaf 7 wordt een voorschrift hiervoor gegeven, en een uitgewerkt voorbeeld. Voorbeeld Staafdiagram van de 15 meetuitkomsten voor de Faraday uit opgave 1.2:
120000 100000 80000 60000 40000 20000 0 1
2 3
4 5
6 7 8
9 10 11 12 13 14 15
foutenleer- 8
Een statistisch kenmerk voor de spreiding is de variantie en/of de standaarddeviatie. Om deze te berekenen moet men eerst het gemiddelde berekenen van de n meetuitkomsten: xg = Σ xi / n NB.
(1.2)
We noteren in dit dictaat om typografische redenen xg in plaats van het meer gebruikelijke x met een liggend streepje erboven.
Met Σ wordt telkens bedoeld de sommatie over alle n meetuitkomsten. Daarna berekent men de zogenaamde variantie s2: s2 = Σ (xi - xg )2 / (n-1) Vervolgens neemt men de wortel eruit en krijgt de standaarddeviatie s: s = √{Σ (xi - xg )2 / (n-1)}
(1.3) (1.4)
Voor de variantie s2 is het soms handig om de volgende, geheel equivalente uitdrukking te gebruiken s2 = {Σxi2 - (Σxi)2 / n} / (n-1) (1.5) Opdracht: Bewijs de equivalentie van (1.3) en (1.5) Voorbeeld De buretdruppelgrootte van buret 1 waarvoor n = 10 metingen werden verricht: Meetuitkomsten: 4.30 4.17 4.03 4.18 4.21 4.16 4.15 4.34 4.28 4.08 (in 10-2 ml). Voor de berekening van de standaarddeviatie s is het handig een tabel op te stellen. Zie hieronder. (xi - xg)2
xi2
Meting no.
xi
(xi - xg)
1
4.30
0.11
0.0121
18.4900
2
4.17
-0.02
0.0004
17.3889
3
4.03
-0.16
0.0256
16.2409
4
4.18
-0.01
0.0001
17.4724
5
4.21
0.02
0.0004
17.7241
6
4.16
-0.03
0.0009
17.3056
7
4.15
-0.04
0.0016
17.2225
8
4.34
0.15
0.0225
18.8356
9
4.28
0.09
0.0081
18.3184
10
4.08
-0.11
0.0121
16.6464
41.90
0.00
0.0838
175.6448
Som =
We berekenen : Het gemiddelde xg = 41.90 / 10 = 4.190 (via formule 1.2) De variantie s2 = 0.0838 / 9 = 0.00931 (via formule 1.3) De standaarddeviatie s = 0.0965 (via formule 1.4) Volgens de alternatieve formule (1.5) wordt berekend voor de variantie: s2 = {175.6448 - (41.90)2 / 10 } / 9 = 0.00931. Intypen van de meetuitkomsten op een rekenmachientje met statistische mogelijkheden levert (Casio fx-550): n = 10; Σx = 41.9; Σx2 = 175.6448; xg = 4.19; σn = 0.091542339; σn-1 = 0.096494098. Merk daarbij op dat de door ons hierboven gedefinieerde standaarddeviatie s dus het getal is dat verschijnt na indrukken van de toets waarop σn-1 staat.
foutenleer- 9 Opgave 1.3 Bereken het gemiddelde, de variantie en de standaarddeviatie voor de meting van de massa van het messingblokje uit het eerste voorbeeld. Neem daarbij de 6 meetuitkomsten die met de 6 verschillende balansen verkregen zijn: 58.5773
58.5758
58.5774
58.5771
58.5762
58.5769 g.
Doe de berekening met behulp van het spreadsheetprogramma EXCEL, zowel in tabelvorm precies zoals in het voorbeeld hierboven met de formules 1.2 t/m 1.5 , als door middel van het gebruik van de statistische standaardfuncties AVERAGE, VAR en STDEV van EXCEL. Zorg daarbij voor een ordelijk werkblad, waarop ook m.b.v. tekst staat wat alle getallen betekenen. Antwoorden: xg = 58.576783; s2 = 4.136665 * 10-7 ; s = 6.431691 * 10-4. Met zakrekenmachientjes wordt vaak iets anders gevonden, bijvoorbeeld s = 0.0004472 of zelfs 0! Ga als dat bij Uw machientje ook zo is de oorzaak van deze onjuiste uitkomst na! Maak voor een correcte berekening zonodig gebruik van de invariantie van s voor het optellen van een constante bij de meetuitkomsten!
1.d. Wat is de betekenis van de standaarddeviatie? De standaarddeviatie werd ingevoerd als statistische maat voor de spreiding. Het is echter moeilijk om enig "gevoel" voor de betekenis van deze maat te krijgen; een groot deel van dit dictaat houdt zich dan ook juist daarmee bezig. Een vuistregel is: Als het aantal metingen n voldoende groot is, (bijvoorbeeld ca. 20 of meer), en als de meetuitkomsten een zogenaamde normale verdeling vormen (later te behandelen), dan ligt ca. 2/3 deel van het aantal meetuitkomsten in het interval tussen xg - s en xg + s. Opgave 1.4 Ga dit na voor het voorbeeld van de 75 meetuitkomsten in paragraaf 7.a. Bepaal daartoe m.b.v. EXCEL zowel het gemiddelde als de standaarddeviatie, en tel het aantal waarden dat in het betreffende interval ligt.
1.e. De term "fout" In de fysica en de chemie wordt de grootheid die we "standaarddeviatie" hebben genoemd zeer vaak aangeduid met de term "fout", of nader gespecificeerd als "toevallige fout". Ook wordt het woord "onnauwkeurigheid" hiervoor gebezigd. Deze ook in de dagelijkse omgangstaal gebruikte termen zijn nogal vaag, en geven dan ook vaak aanleiding tot verwarring of begripsproblemen, daar waar de term "fout" in meer dan een betekenis gebruikt wordt. In het kader van de statistische bewerking van meetuitkomsten wordt de term "fout" uitdrukkelijk niet gebruikt in de betekenis van "blunder" of "persoonlijke fout". In het Engels heeft men daar minder last van omdat men in die taal naast elkaar de woorden "error" en "mistake" gebruikt. Dit laatste woord uitsluitend voor persoonlijke fouten en blunders. Als we in het vervolg naar meetuitkomsten gaan kijken, dan gaan we ervan uit dat de metingen op een correcte wijze zijn uitgevoerd.
foutenleer- 10
Alle afwijkingen ten gevolge van geknoei, onervarenheid, onoplettendheid en niet traceerbare vreemde uitschieters in de meetuitkomsten moeten we in onze mathematisch-statistische beschouwingen uitsluiten. Dus bij middelen, berekenen van standaarddeviaties, uitvoeren van toetsen, bij lineaire regressie etc. wordt ervan uitgegaan dat de spreiding in de meetuitkomsten beslist niet wordt veroorzaakt door te vermijden tekortkomingen van de experimentator. Het noemen van onjuist of ondoordacht handelen, verkeerd aflezen, rekenfouten en dergelijke oorzaken hoort dus in een statistische foutendiscussie beslist niet thuis! In een laboratoriumjournaal kan men deze wel vermelden, omdat van dit soort fouten vaak een groot leereffect uitgaat. 1.f. Uitschieters. De aanwezigheid van spreiding in meetuitkomsten is een zeer normale zaak. De oorzaak ligt in oncontroleerbare fluctuaties in de meetapparatuur, de meetomstandigheden, de monsters, de waarnemer. Dat wil dus ook zeggen dat we gewoonlijk spreken over relatief kleine schommelingen rond de gemiddelde waarde. Het komt echter helaas toch af en toe voor dat een meetuitkomst onverwacht en onverklaarbaar veel afwijkt van de overige meetuitkomsten. In zo'n geval spreken we van een uitschieter of wat ouderwets van een uitbijter (Engels: outlier). Zo'n uitschieter wordt uit de reeks metingen geschrapt. Eerst gaat men echter zorgvuldig en eerlijk na of de meetuitkomst toch niet te "herstellen" is, d.w.z. of de oorzaak van de afwijking te achterhalen en de meetuitkomst te corrigeren is. Metingen zijn gewoonlijk namelijk kostbaar in tijd en/of geld. Er zijn uiteraard grensgevallen waarbij men twijfelt of er sprake is van een uitschieter of niet. Een objectief rekenkundig criterium daarvoor is te berekenen met behulp van een uitschietertoets, bijvoorbeeld de Q-toets van Dixon. Deze wordt behandeld in de paragraaf over toetsen (par. 9.h). Gewoonlijk is echter "gezond verstand" voldoende. Voorbeeld Titratie-uitkomsten voor één monster, onder zoveel mogelijk identieke omstandigheden verkregen: 23.12 23.15 23.13 23.10 23.13
22.78 23.11 ml NaOH oplossing.
De op een na laatste meetuitkomst wordt weggelaten in de berekeningen (wel genoteerd in het labjournaal!).
1.g. Standaarddeviatie in het gemiddelde Volledigheidshalve vermelden we hier vast de later (in par. 8b) afgeleide uitdrukking voor de standaarddeviatie in het gemiddelde van n metingen: sg = s van xg = s / √n. (1.6) Deze waarde wordt in eindresultaten vaak vermeld, vermoedelijk vanwege het flatterende feit dat ze een factor √n kleiner is dan de waarde van s zelf. De factor s / √n wordt ook gebruikt bij het berekenen van een betrouwbaarheidsinterval, zie (9.1). De numerieke uitkomst voor sg wordt ook toegepast bij het bepalen van het juiste aantal te vermelden decimalen van het eindresultaat van een meting (afkappen). Zie de verg. (8.11 en 8.12).
foutenleer- 11
1.h. Minimaliseren van de spreiding Een serie meetuitkomsten noemen we beter dan een andere serie als zijn spreiding significant kleiner is. De spreiding wordt daarbij gekwantificeerd door middel van de uit de meetuitkomsten berekende standaarddeviatie s. Bij de vergelijking van de spreidingen van 2 meetseries mogen we echter niet zonder meer concluderen dat meetserie 1 beter is dan meetserie 2 als s1 < s2. Het verschil tussen de twee standaarddeviaties moet ook nog significant zijn. Men kan hiervoor een toets uitvoeren, de F-toets. 1.i. De variatie-coëfficient Als maat voor de spreiding wordt ook wel de variatie-coëfficient gebruikt. Dat is de procentuele standaarddeviatie, gerekend als percentage van het gemiddelde: cv = (s/xg) . 100%
(1.7)
Voorbeeld no. x
x -xg
(x-xg)2
1
7.08
-0.05
0.0025
2
7.21
+0.08
0.0064
(1.4): s = √ (0.0182 / 9) = 0.045
3 4
7.12 7.09
-0.01 -0.04
0.0001 0.0016
(1.7): cv = (0.045 / 7.13) . 100% = 0.63 %
5 6
7.16 7.14
+0.03 +0.01
0.0009 0.0001
(1.6): sg = s / √10 = 0.045 / √10 = 0.014
7
7.07
-0.06
0.0036
8
7.14
+0.01
0.0001
9
7.18
+0.05
0.0025
10
7.11
-0.02
0.0004
som
71.30
0
0.0182
(1.2): xg = 71.30 / 10 = 7.13
Opgave 1.5 Bepaal voor de 15 meetuitkomsten uit opgave 1.2 het gemiddelde, de standaarddeviatie, de variatiecoëfficient en de standaarddeviatie in het gemiddelde. Gebruik de standaardfuncties AVERAGE , VAR en STDEV van EXCEL en de formules 1.6 en 1.7. Opmerking: U kunt ook uit het Tools pakket “Data Analysis” de optie Descriptive Statistics gebruiken. Daarmee kunt U alle hier gewenste grootheden, en nog een paar meer, in één keer berekenen. Het is wel nodig om goed te bekijken wat alle output betekent. Bereken daarom eerst zoals hierboven bedoeld de gevraagde grootheden, en vergelijk deze dan met wat deze Excel optie U levert.
Merk op dat de variatie-coëfficient onbepaald wordt als het gemiddelde nul of heel klein is! In de fysica en de chemie wordt deze maat dan ook vrijwel niet gebruikt, wel in de econometrie.
foutenleer- 12
2. De meetuitkomsten zelf 2.a. De "ware waarde", resp. de "gezochte waarde" Als men een meting uitvoert, dan is men in principe geïnteresseerd in een zo juist mogelijke waarde van de gemeten grootheid. Als men bijvoorbeeld vraagt naar het aantal inwoners van een gemeente, dan kan men in beginsel dit aantal op een bepaald moment door telling exact vaststellen, hoewel het in de praktijk moeilijk kan zijn om dit ook echt uit te voeren. (Men vindt het meestal ook helemaal niet nodig om het exact te weten, maar accepteert een zekere onnauwkeurigheid). Voor zo'n discrete grootheid is het vaak mogelijk om de meetuitkomst volkomen exact weer te geven, en in die gevallen is er voor statistiek weinig plaats meer. Als telling van alle individuen niet mogelijk is, moet men zijn toevlucht nemen tot steekproeven en/of schattingen. Dan wordt het mogelijk en noodzakelijk om statistische uitspraken te doen. In de chemie en de klassieke fysica is het zelden zo dat de gemeten grootheid telbaar is. Gewoonlijk meten we grootheden waarvan de uitkomsten continu zijn, en die dus in principe weergegeven zouden moeten worden met een zeer groot, misschien wel oneindig, aantal decimalen. Zo'n ideale meetuitkomst met een "oneindig aantal decimalen", een volkomen theoretisch begrip, noemen we de "ware waarde". Die kan principieel niet worden gemeten. We zullen ons moeten behelpen met een "zeer nauwkeurige" waarde, de beste waarde die op een zeker moment met de meest geavanceerde methode en apparatuur verkregen kan worden. Zo is bijvoorbeeld thans de numerieke waarde van de lading van een mol elektronen (de Faraday) maximaal nauwkeurig bepaald op 9.648456 *104 C/mol. Dit kan in berekeningen van de titer bij een coulometrische titratie als "ware waarde" worden beschouwd, maar bijvoorbeeld voor de bepaling van de elementaire lading van een elektron kan het best nog te onnauwkeurig zijn. De hierboven besproken "ware waarde" - een slechts in theorie bestaande, oneindig nauwkeurige ideale meetuitkomstmoet onderscheiden worden van het ook wel gebezigde praktische begrip "gezochte waarde". Hieronder kunnen we verstaan een meetuitkomst die zo nauwkeurig is dat ze voor onze doeleinden geschikt is. Dus niet te onnauwkeurig en niet onnodig nauwkeurig. Voorbeeld De afstand Utrecht CS-Uithof bedraagt 7 km (voor berekening van de fietsduur goed genoeg). De afstand Utrecht CS(uitgang stad)-Uithof Bestuursgebouw bedraagt 6.85 km (voor berekening van de kosten van een raillijn). In deze gevallen kunnen we spreken van een gezochte waarde. Opgave 2.1 Men bepaalt door meting het getal π op drie decimalen nauwkeurig. De omtrek van een cirkel met straal 1.000 m blijkt te zijn: 6.284 m. Bepaal hieruit het getal π en vergelijk die uitkomst met de "ware waarde". (Waar vindt U die en hoe wordt die trouwens bepaald?). Met EXCEL krijgt U π via de functie-aanroep = PI().
foutenleer- 13
2.b. Gemiddelden Het resultaat van een meetprocedure is gewoonlijk een aantal meetuitkomsten: x1, x2, x3,....xn. Ervan uitgaand dat ieder van deze meetuitkomsten met dezelfde zorg verkregen is, zijn ze allemaal even waardevol. We hebben in de vorige paragraaf al gezien dat de kleine onderlinge verschillen veroorzaakt worden door oncontroleerbare fluctuaties in de meetprocedure (apparatuur, omstandigheden) of door variërende omstandigheden bij de waarnemer. Ieder van de meetuitkomsten is een benadering van de "ware waarde", die principieel onbekend is. Een axioma luidt: Het gemiddelde van een aantal meetuitkomsten levert in het algemeen een beter resultaat dan één willekeurige afzonderlijke meetuitkomst. Het gemiddelde is des te beter naarmate het aantal meetuitkomsten toeneemt. Het is in een meetserie best mogelijk dat één bepaalde meetuitkomst "toevallig" dichter bij de ware waarde ligt dan het gemiddelde van de meetuitkomsten, we zullen dit echter nooit zeker weten als de ware waarde onbekend is. Meestal is de “ware waarde” onbekend. Het gewone rekenkundige gemiddelde is één voorbeeld van een maat voor wat de centrale tendentie van een aantal meetuitkomsten wordt genoemd. De centrale tendentie geeft op de een of andere wijze het midden weer van de verzameling meetuitkomsten. Er zijn andere centrummaten, zoals het meetkundig gemiddelde, de modus en de mediaan. Het rekenkundig gemiddelde is gelijk aan de som van de meetuitkomsten, gedeeld door het aantal meetuitkomsten: xg = Σ xi / n (2.1) Om typografische redenen zullen we in dit dictaat in plaats van het meer gebruikelijk symbool x met een streepje erboven schrijven: xg. Dit gemiddelde wordt in de mathematische statistiek zoals die in chemie en fysica wordt gebruikt steeds gehanteerd. Het meetkundig gemiddelde is de ne machtswortel uit het product van de n meetuitkomsten. De modus is de meest voorkomende van de meetuitkomsten. Het is gewoonlijk nodig om de metingen eerst te groeperen in klassen. Het begrip wordt o.a. gehanteerd in de economie (modale werknemer etc.). De mediaan is de middelste van de meetuitkomsten, als die in opklimmende of afdalende waarde gesorteerd staan. (Bij even aantal de helft van de som der middelste twee). Toepassingen zijn te vinden in bevolkingsstatistieken (mediane studieduur bijvoorbeeld). Het harmonisch gemiddelde H is gedefinieerd m.b.v. 1 / H = (1/n) . Σ 1/xi. Opmerking Het rekenkundig gemiddelde is erg gevoelig voor uitschieters (waarden die om de een of andere reden sterk van de overige afwijken). Mediaan en modus zijn dat niet!
foutenleer- 14 Opgave 2.2 Bepaal het rekenkundig gemiddelde, het meetkundig gemiddelde, het harmonisch gemiddelde, de modus en de mediaan van de volgende 101 studentinkomens (in fl./jaar) (reken desgewenst om in eur; 1 euro = fl. 2.20371) 8000 (2x); 9000 (4x); 10000 (10x); 11000 (24x); 12000 (20x); 13000 (12x); 14000 (10x); 15000 (8x); 16000 (5x); 1700 0(4x); 20000 (2x). Gebruik van EXCEL de functies AVERAGE, GEOMEAN, HARMEAN, MODE en MEDIAN. Het kan nuttig zijn om LN, LOG, SUM en EXP te gebruiken, als U problemen krijgt met een of meer van die functies. Opmerking: al naar het ons uitkomt kunnen we één van deze resultaten gebruiken om te argumenteren!
2.c. Steekproef en populatie, meetverwachting Meestal heeft men bij een meetprocedure de keus om zelf het aantal metingen te bepalen. Praktische begrenzingen daarbij komen voort uit de beschikbare middelen en tijd. Een punt dat bij chemische analyses vaak een rol speelt is dat de hoeveelheid van een beschikbaar monster beperkt is. Men voelt wellicht aan dat naarmate er meer meetuitkomsten verkregen en gemiddeld worden, het gemiddelde in het algemeen een betere benadering van de ware waarde zal geven. Voor het limietgeval van oneindig veel metingen kan gedefinieerd worden dat het gemiddelde nadert tot wat de meetverwachting, symbool μ, genoemd wordt: als n → ∞ dan xg → μ (2.2) Nu kunnen ook de termen populatie en steekproef geïntroduceerd worden. De populatie wordt gevormd door de verzameling van alle mogelijke meetuitkomsten. Deze is vaak oneindig groot, omdat men veel soorten metingen in principe eindeloos kan herhalen. Een steekproef is een deelverzameling van n meetuitkomsten uit de populatie. Dat is dus het beperkte aantal meetuitkomsten n dat we gewoonlijk echt verkregen hebben. De meetverwachting μ is het gemiddelde van de populatie. Het (steekproef)gemiddelde xg is het rekenkundig gemiddelde van de n meetuitkomsten van de steekproef. 2.d. Systematische afwijkingen Opgemerkt kan worden dat de meetverwachting μ gelijk is aan de ware waarde xw, als er tenminste geen sprake is van wat "systematische afwijkingen" (ook wel systematische fouten) genoemd worden. In feite wordt een systematische afwijking δ gedefinieerd als het verschil tussen de meetverwachting μ en de ware waarde xw: δ = μ - xw
(2.3)
Systematische afwijkingen zijn dus afwijkingen van de ware waarde die onafhankelijk van het aantal metingen zijn. Ze zijn niet onderhevig aan oncontroleerbare fluctuaties, maar ontstaan op een voorspelbare en/of verklaarbare wijze. Ze kunnen vele oorzaken hebben. Men komt ze gewoonlijk op het spoor als een grootheid vaak en met een andere methode gemeten wordt, en er dan een te sterk afwijkende gemiddelde meetuitkomst gevonden wordt. Het zoeken naar de oorzaken kan uiterst moeizaam zijn. We zullen een aantal veel voorkomende voorbeelden behandelen.
foutenleer- 15
Apparatuurafwijkingen - Men meet de tijd met een stopwatch waarvan de veer te strak is en die dus te snel loopt: altijd wordt een te grote meetuitkomst gevonden. - Men meet de stroomsterkte met een instrument dat niet nul aangeeft als er geen stroom loopt. Er is hier sprake van een zogenaamde "nulpuntsfout". - Men meet de lengte van een staafje met een lineaal waarop 1.00 cm in werkelijkheid 1.02 cm bedraagt. Er is sprake van een "schaalfout". - Een volpipet van 10 ml levert bij correct gebruik slechts 9.95 ml vloeistof af. Ook hier kan sprake zijn van een schaalfout. Veel van deze apparatuurafwijkingen zijn te controleren m.b.v. een zogenaamde ijkprocedure. Daarbij wordt de meetuitkomst van het betreffende apparaat of instrument vergeleken met de meetuitkomst van een veel nauwkeuriger apparaat, of met de meetuitkomst van een nauwkeuriger andere procedure. Daarna kan men de eigen meetuitkomst zonodig corrigeren. De correctieprocedure kan bijvoorbeeld het optellen van een constante of het vermenigvuldigen met een constante zijn. Voorbeeld Het volume vloeistof dat uit een volpipet stroomt, wordt geijkt door zuiver water te nemen, en het uitgestroomde water zeer nauwkeurig te wegen met behulp van een analytische balans. Rekening houdend met de temperatuur en met behulp van de voor zuiver water zeer nauwkeurig bekende dichtheid d, wordt uit de gemeten massa m het uitgestroomde volume V berekend: V = m/d. Dit volume V wordt vergeleken met het op de pipet vermelde.
Methode-afwijkingen Hiertoe rekent men o.a. verwaarlozingen, sommige modelveronderstellingen etc. die er oorzaak van kunnen zijn dat de meetverwachting systematisch afwijkt van de ware waarde. Enige voorbeelden: - Men past de ideale gaswet toe om de druk van een gas te berekenen. In werkelijkheid kan de gasdruk best wat anders zijn dan op deze wijze uit het volume, de temperatuur en de hoeveelheid stof berekend wordt. - Bij de titratie van een sterk zuur met een sterke base gebruikt men als indicator fenolftaleïne, dat echter de kleuromslag niet bij pH = 7 maar bij ca. 8.5 vertoont, dus steeds iets te laat. - In een calorimetrieproef verwaarloost men de temperatuurafhankelijkheid van de verdampingswarmte van een vloeistof. In werkelijkheid varieert die enige procenten over een meetgebied van 100 graden. - De trillingen van een molecuul, waarmee het vibratiespectrum wordt berekend, zijn niet precies harmonisch. Daardoor ontstaan er kleine afwijkingen tussen de berekende en de gemeten frequenties. - Voor water is de dissociatie-evenwichtsconstante Kw = 1.00 .10-14 bij 25 oC. Bij 20 oC is de pKw = 14.15; bij 15 oC is deze 14.35! Veel van deze afwijkingen zijn te corrigeren door betere (gewoonlijk meer gecompliceerde) modellen in te voeren voor de beschrijving van de gemeten eigenschappen.
foutenleer- 16
Afwijkingen t.g.v. de waarnemer Ook door de wijze van handelen van de waarnemer kunnen systematische afwijkingen tussen meetverwachting en ware waarde veroorzaakt worden. Voorbeelden: - Een gedeeltelijk kleurenblinde ziet een indicatoromslag steeds te laat. - Eer men een kleuromslag kan zien, is de reactie steeds al iets verder gevorderd. - Een traag persoon reageert steeds wat (meer) te laat bij het indrukken van een stopwatch. Remedies voor het minimaliseren van dit soort afwijkingen zijn bijvoorbeeld te bereiken door automatisering. Kort samengevat kan men systematische afwijkingen opsporen en corrigeren door: - meten met onafhankelijke, nauwkeuriger methoden en apparatuur. - nameten van reeds nauwkeurig bekende grootheden. - elimineren van de afhankelijkheid van een menselijke waarnemer. - uitvoeren van blanco proeven. Een blanco bepaling is in de analytische chemie een bepaling die wordt verricht precies zoals en zoveel mogelijk gelijktijdig met de werkelijke bepaling, maar onder weglating van de te bepalen stof. Ze wordt gedaan met toevoeging van alle reagentia in dezelfde hoeveelheden en in dezelfde volgorde als bij de werkelijke bepaling. Er moet dan "nul" (=blanco) uitkomen. Zonodig kan men dan achteraf corrigeren, bijvoorbeeld door het nulpunt van het aanwijsapparaat bij te stellen.
2.e. Persoonlijke fouten Meetuitkomsten kunnen ook nadelig beïnvloed worden door persoonlijke fouten van de waarnemer. Hieronder verstaan we een hele serie van vermijdbare handelingen, zoals: - geknoei, verwisseling van monsters, vergissingen, afwijken van correcte procedures, etc. - niet uitvoeren van noodzakelijke controles of ijkprocedures - toepassen van verkeerde modellen of veronderstellingen - rekenfouten (factoren 2 of 10, verkeerd afronden, verkeerd intikken, teveel afkappen). Al deze zaken zijn te vermijden door oefening en door zorgvuldig en gedisciplineerd gedrag. Het consequent en goed bijhouden van een laboratoriumjournaal draagt hiertoe in belangrijke mate bij. In foutendiscussies horen beschouwingen over deze persoonlijke fouten slechts op een uiterst summiere wijze een plaats te krijgen. Metingen die onder deze factoren geleden hebben, horen overgedaan te worden! 2.f. Nog een paar termen In Engelstalige leerboeken treft men nog een paar termen aan: 1. "accuracy", gerelateerd aan "correctness". Het karakteriseert het verschil tussen de beste meetuitkomst en de ware waarde. Voor de beste meetuitkomst moet eigenlijk de meetverwachting worden genomen, maar in de praktijk neemt men het gemiddelde van een voldoende groot aantal meetuitkomsten. De Nederlandse term is “juistheid”, dus een term die verband houdt met de systematische afwijking. 2. "precision", gerelateerd aan "reproducability". Die wordt gerepresenteerd door de standaarddeviatie; het is dus een term voor de toevallige fout. De Nederlandse term is “precisie”.
foutenleer- 17
3. De beperkte nauwkeurigheid van meetapparatuur
3.a. Algemene opmerkingen Bij het meten van grootheden maken we veelvuldig gebruik van meetapparatuur. Daaronder verstaan we in dit verband niet alleen apparaten met min of meer grote kasten eromheen en knoppen eraan, maar ook allerlei eenvoudige instrumenten als pipetten, stopwatches, thermometers en dergelijke. Apparatuur maakt het mogelijk om waarnemingen te doen min of meer onafhankelijk van de zintuiglijke beperkingen van de persoon die de metingen uitvoert. Er zijn ook tal van grootheden -neem elektrische- die men anders niet zou kunnen meten. Maar, ieder apparaat heeft niet alleen mogelijkheden, het kent ook zijn beperkingen. Een eerste uitgangspunt bij het gebruik van een apparaat is dat het correct wordt gehanteerd. Daartoe bestaan er gewoonlijk gebruiksaanwijzingen of procedures, die meestal in handleidingen vermeld staan. Het lezen van deze handleidingen is vaak niet zeer boeiend, terwijl veel handleidingen slecht geschreven en/of onvolledig of juist te gedetailleerd zijn. Helaas moet worden opgemerkt dat tegen de gebruiksprocedures uit laksheid of onwetendheid veel gezondigd wordt, met nadelige gevolgen voor de kwaliteit van de meetuitkomsten. De door de fabrikanten vermelde prestaties van een apparaat zijn gewoonlijk slechts te verkrijgen onder optimale meetomstandigheden! Voorbeelden -Wil men met een volpipet van 10 ml met de daarop vermelde onnauwkeurigheid van slechts 0.02 ml pipetteren, dan moet men zich strikt houden aan de voorschriften omtrent ontvetten, spoelen, afvegen, uitstroomhoek, uitstroomtijd, temperatuur. -Wegen met een analytische balans op 0.1 mg vereist trillingsvrije plaatsing in een tochtvrije omgeving, met een constante (binnen 1 oC) temperatuur, terwijl het te wegen voorwerp niet met de handen gehanteerd mag worden.
Bij veel metingen wordt de te bepalen grootheid zeer indirect gemeten. Een goed voorbeeld daarvan is de pH meting, waarbij een gecompliceerde elektrochemische cel en een elektronische mV meter worden gehanteerd (zie verder in par. 3.b). Een ander voorbeeld is het meten van het equivalent geleidingsvermogen van een oplossing: Met behulp van een brugschakeling, die in een conductometer is ingebouwd, en een stroommeter, wordt de weerstand R van de oplossing, die zich in een meetcel bevindt, bepaald. De kwaliteit van de meter en de ingebouwde referentieweerstanden moet zeer hoog zijn om de weerstand R op 0.3 % te kunnen meten. De meetcel bevat twee platina elektroden op vaste afstand van elkaar. Om de weerstand van de oplossing tussen de elektroden nauwkeurig te meten, moeten deze vetvrij zijn en mogen er geen fijne luchtbelletjes aan het oppervlak aanwezig zijn. De temperatuur moet constant zijn, want R varieert ongeveer 2 % per graad.
Bij het gebruik van apparatuur zijn de volgende twee aspecten altijd van belang: 1. De grootte van de systematische afwijking δ. Hoe vaak we ook meten, er blijft een verschil tussen de meetverwachting μ en de "ware waarde" xw
foutenleer- 18 . Dat
kan liggen aan de meetprincipes of aan beperkingen van onderdelen van de apparatuur.
In een goede handleiding wordt de grootte van deze afwijking vermeld, meestal met "beter dan" of "kleiner dan" een bepaalde waarde, omdat deze niet voor ieder apparaat afzonderlijk door de fabrikant kan worden vastgesteld. De gehanteerde termen zijn o.a. "accuracy", "tolerantie" en “juistheid”. Zie ook par. 2f. De waarde van δ wordt bepaald door ijken, d.w.z. door vergelijken met een veel nauwkeuriger apparaat of procedure. Voorbeeld Men controleert de systematische afwijking van de golflengteschaal van een spectrofotometer voor het zichtbare gebied (400-700 nm) door het spectrum van bijvoorbeeld een erbiumnitraatoplossing op te meten. Daarbij moeten er scherpe absorptiepieken optreden bij 364.0 379.4 487.1 523.0 652.5 nm (L. Holleck, L. Hartinger: Angewandte Chemie 67 (1955) 648-651).
Bij het gebruik van apparatuur kunnen we o.a. de volgende categoriëen van systematische afwijkingen aangeven: - nulpuntsfouten (niet nul aangeven als er geen signaal is). - schaalfouten (een bekende is die t.g.v. temperatuurverschillen van de kwikdraad bij een thermometer), of een metermaat die in werkelijkheid 1.004 m lang is. - niet-lineariteit van een in principe lineaire schaal (bijv. een buretbuis die niet overal even dik is). - onstabiliteit ( pH elektroden zijn daar berucht om). - drift, het verlopen van de aanwijzing met de tijd (bijvoorbeeld door opwarmen). - diversen, zoals strooilicht bij optische apparatuur, dichtheidsverschillen bij het wegen etc. In alle gevallen kan men via ijkprocedures op zijn minst inzicht in de grootte van de betreffende afwijkingen krijgen. In goede handleidingen, en ook in speciale leerboeken (bijvoorbeeld Findlay par. 10.a.2 en Alkemade par. 10.c.2) wordt hieraan veel aandacht besteed. Voorbeelden van ijkprocedures - pH meter inregelen op de elektrodenkarakteristiek, met buffers van bekende pH (4.00 7.00 10.00). - Extinctie op een spectrofotometer op nul stellen met een blanco oplossing. - Spectrofotometerlineariteit verifiëren met oplossingen van kaliumchromaat van bekende concentraties. -Celconstante bepalen bij conductometrie m.b.v. metingen aan KCl oplossingen van bekende concentraties. - Balans controleren met ijkgewichten. - Maatkolf ijken door waterinhoud te wegen bij bekende temperatuur.
foutenleer- 19
2. De grootte van de standaarddeviatie s van de meetuitkomsten. Men spreekt in dit verband vaak van de "reproducability" of de "error" of de “precision” of de "(meet)fout". De grootte wordt bepaald door het uitvoeren van zeer veel metingen, en berekening van s uit de meetuitkomsten. Voorbeeld Men bepaalt de standaarddeviatie s van de aanwijzing van een aantal stroommeters bijvoorbeeld door ze in serie in een schakeling te zetten, en s te berekenen uit de verkregen meetuitkomsten. Men verkrijgt dan de standaarddeviatie voor stroommeting met een willekeurig apparaat uit deze verzameling. Wil men de standaarddeviatie weten voor de stroommeting met een bepaald apparaat, dan moet eenzelfde stroom herhaaldelijk met dat apparaat gemeten worden. In alle gevallen moet men natuurlijk wel de nulaanwijzing eerst controleren en zonodig bijstellen.
Men mag zich gelukkig prijzen als in een apparatuurhandleiding beide waarden, zowel δ als s, vermeld staan! Dat is bijvoorbeeld zo bij de Hitachi 100-60 spectrofotometer, zie par. 3.b. 3.b. De nauwkeurigheid van enige laboratoriuminstrumenten Van een aantal veel gebruikte laboratoriuminstrumenten en apparaten hebben we de specificaties van de nauwkeurigheid in de apparaathandleiding of in normaalbladen opgezocht. Veel gebruikte normaalbladen zijn de NEN-bladen (Nederlandse Eenheids Norm, uitgegeven door het Nederlands Normalisatie Instituut te Delft). Daarnaast bestaan Europese ISO normen, Duitse DIN normen etc.. We vatten enige ervan hier kort samen. A. Maatglaswerk Dat moet altijd gebruikt worden bij de standaard temperatuur van 20 oC. Het hoort eerst met een ontvettingsmiddel vetvrij te worden gemaakt, en zonodig te worden gedroogd. Norm NEN 1750
NEN 1753
NEN 1754
NEN 1755
soort glaswerk Maatkolf
Volpipet
Meetpipet
Buret
maat (ml)
klasse A
klasse B
tolerantie (ml)
tolerantie (ml)
10
0.025
0.05
50
0.06
0.12
100
0.10
0.20
250
0.15
0.30
1000
0.4
0.8
1
0.007
0.015
5
0.015
0.030
10
0.020
0.040
25
0.03
0.06
1
0.006
0.010
2
0.010
0.020
5
0.03
0.05
10
0.05
0.10
50
0.050
0.10
foutenleer- 20 Met tolerantie wordt meestal een waarde bedoeld die samengesteld is uit een combinatie van systematische en toevallige fout. De Fa. Brand hanteert: Tol. ≅ (δ + 2 s ). Volgens NEN 1759 is bij maatcylinders hoog model de tolerantie gelijk aan het interval tussen twee maatstreepjes. Voor bekerglazen met maatstrepen erop bestaan geen NEN normen.
Opgave 3.1 Bij 20 oC werd op 10 manieren een volume water van 10 ml afgemeten en nagewogen. Het volume van voorwerpen gemaakt van (zacht) glas kan bij deze temperatuur berekend worden via: volume = 1.0028 maal de massa van de inhoud aan water. De volgende meetuitkomsten werden verkregen (in grammen): no.
Soort
meting 1
meting 2
meting 3
1
Bekerglas 50 ml met strepen
10.90
10.25
11.14
2
Maatcylinder 100 ml laag model
9.60
9.46
9.92
3
Maatcylinder 100 ml hoog model
9.68
9.56
9.98
4
Maatcylinder 25 ml
9.73
9.76
10.11
5
Maatcylinder 10 ml laag model
9.83
10.03
9.94
6
Maatcylinder 10 ml hoog model
9.79
9.88
9.89
7
Meetpipet 10 ml klasse A
9.90
9.93
10.00
8
Buret 50 ml klasse A
10.04
10.02
10.02
9
Volpipet 10 ml klasse B
9.99
9.98
9.97
10
Volpipet 10 ml klasse A
10.01
10.00
9.98
Ga na in hoeverre die meetuitkomsten overeenkomen met de toleranties uit de bovengenoemde NEN bladen. Ga na wat voor elk van de meetwijzen de grootte-orde van de standaarddeviatie van een meetuitkomst is.
B. Balansen In het laboratorium onderscheiden we analytische balansen en laboratorium-bovenwegers voor ruwere metingen. Voor de analytische balans A200S van Sartorius gelden o.a. de volgende specificaties: Weegbereik:
202 g, met aflezing in 0.1 mg op digitale schaal
Reproduceerbaarheid:
< 0.1 mg (dit is de standaarddeviatie van de meetuitkomsten)
Lineariteitsafwijking:
< 0.2 mg (dat is ten naaste bij de systematische afwijking van de echte massa)
Meettijd:
3 seconden
Voor de laboratorium-bovenweger 1002 MP9 van Sartorius zijn de specificaties: Weegbereik:
505 g, met aflezing in 0.1 g op digitale schaal
Reproduceerbaarheid:
< 0.1 g
Lineariteitsafwijking:
< 0.1 g
Meettijd:
2 seconden
We zien dat vooral de analytische balansen meetinstrumenten zijn met een verschrikkelijk hoge nauwkeurigheid: de meetonnauwkeurigheid is slechts van de orde van 1 op 106, een nauwkeurigheid die door vrijwel geen andere standaard gebruiksapparatuur geëvenaard wordt! C. Thermometers Aan NEN 3128 kunnen we ontlenen dat gewone glazen thermometers met kwikvulling op ieder
foutenleer- 21
punt van de schaal niet meer van de ware temperatuur mogen afwijken dan 1 schaaldeel, terwijl dat ook geldt voor elk temperatuurinterval van niet meer dan 50 oC. Het nulpunt moet, na 24 uur verwarmen en 7 uur weer afkoelen, niet meer dan 1 schaaldeel veranderen. In het algemeen is dit soort thermometers zonder zeer veel extra werk en voorzorgen te gebruiken voor temperatuurmetingen maximaal op 0.1 oC nauwkeurig. Het nulpunt kan gemakkelijk geijkt worden met smeltend ijs; voor het 100 oC punt kan kokend water gebruikt worden, als tenminste rekening wordt gehouden met de heersende luchtdruk en er uitgekookt water wordt gebruikt. Er bestaan naast kwikthermometers allerlei andere soorten thermometers, ieder met hun eigen kwalificaties. Men raadplege een boek over instrumentenkennis (zie par. 10.c). Overigens merken we op dat, nu alternatieven beschikbaar komen in de vorm van betaalbare elektronische thermometers, het gebruik van kwikthermometers steeds meer wordt ontraden in verband met de milieuproblemen die optreden bij breuk. Wij gebruiken in onze practicum laboratoria vanaf 1998 geen kwikthermometers meer. De nauwkeurigheid van elektronische thermometers kan erg uiteen lopen, van ca. 1 tot minder dan 0.0001 graad. Men moet ook deze thermometers zonodig ijken! Een vuistregel is dat de meetonnauwkeurigheid een paar maal de grootteorde van de laatste uitgelezen digit bedraagt. D. Spectrofotometers We geven als voorbeelden de specificaties van een goed enkelstraalsinstrument, de Novaspec II van Pharmacia , en die van een goed dubbelstraals scannend routine-apparaat, de Hitachi 100-60. Novaspec II Pharmacia-LKB Meetbereik:
325-900 nm
Spectrale bandbreedte:
6 nm
Golflengte nauwkeurigheid:
2 nm (dat is de maximale afwijking van de echte golflengte)
Golflengte reproduceerbaarheid:
1 nm (dat is de standaarddeviatie van veel meetuitkomsten)
Fotometrische lineariteit:
in extinctie: 0.005 of 0.5 % (grootste) (= de syst. fout).
Fotometrische reproduceerbaarheid:
in extinctie: 0.5 % (de standaarddeviatie in de extinctie)
Drift:
minder dan 0.002 per uur in extinctie, bij extinctie = 0
Hitachi 100-60 Meetbereik:
190-870 nm
Spectrale bandbreedte:
2 nm
Golflengte nauwkeurigheid:
0.4 nm (dat is de maximale afwijking van de echte golflengte)
Golflengte reproduceerbaarheid:
0.2 nm (dat is de standaarddeviatie van veel meetuitkomsten)
Fotometrische lineariteit:
in extinctiegebied 0.0-0.5: 0.002 (de syst. afwijking) in extinctiegebied 0.5-1.0: 0.004 in transmissie: 0.003 (=0.3%)
Fotometrische reproduceerbaarheid:
in extinctiegebied 0.0-0.5: 0.001 (de standaarddeviatie in de extinctie) in extinctiegebied 0.5-1.0: 0.002 in transmissie: 0.0015 (=0.15%)
Drift:
minder dan 0.0004 per uur in extinctie, bij extinctie = 0
foutenleer- 22
In dit voorbeeld komt het geweldige prijsverschil (fl. 4500 vs. fl. 20000) tussen deze twee apparaten tot uiting in de meetnauwkeurigheid en de toepassingsmogelijkheden E. pH meting De meetopstelling bestaat uit een glaselektrode die selectief en gevoelig is (verandering van ca. 59 mV per pH eenheid) voor waterstofionen, een referentie-elektrode waarvan de potentiaal zeer constant is (gewoonlijk een verzadigde calomel elektrode of een zilver / zilverchloride elektrode) en een elektronische mV meter met een zeer hoge inwendige weerstand. Vaak zijn de referentieelektrode en de glaselektrode in één omhulsel met twee contacten tot een combi-elektrode samengevoegd. Het meetsysteem is de mV meter plus de elektrochemische cel: Ag, AgCl (s) | HCl (0.1 M) | glasmembraan | meetoplossing || KCl (verz.), Hg2Cl2(s) | Hg. Een potentiaalverschil van 0.1 mV komt overeen met een pH verschil van ca. 0.0017 pH eenheid. Van dit systeem is de mV meter (de "pH meter") gewoonlijk uitermate betrouwbaar en nauwkeurig. De onnauwkeurigheid hiervan is te verwaarlozen bij die van de andere delen van het meetsysteem. Ook de calomelelektrode is, mits goed gevuld met verzadigde KCl oplossing, weinig aan storingen onderhevig, en de potentiaal is erg constant, hoewel wat temperatuurgevoelig. De zwakke schakel in de meetketen is de glaselektrode. De afgegeven potentiaal is erg gevoelig voor allerlei storingen: roeren heeft invloed, allerlei zouten hebben invloed, aanraken met de vingers heeft invloed, de elektrode vervuilt, vooral door eiwitten, en droog staan is funest. Het gevolg is dat zonder zeer veel extra voorzorgen met gewone glaselektroden de pH gewoonlijk een afwijking tot rond 0.05 eenheid van de ware waarde kan vertonen. (De "ware waarde" kan men met een standaard waterstofelektrode moeizaam, maar dicht, benaderen). Bij het afregelen van de mV meter moet men de meteraanwijzing met bufferoplossingen van bekende pH zo instellen dat pH = 7.00 correspondeert met 0.0 mV en dat de schaaldeelgrootte correspondeert met de analytische gevoeligheid (in te stellen met twee ijkbuffers, van pH = 4.00 en 7.00 bijvoorbeeld). Daarnaast moet de temperatuur juist worden afgesteld, vanwege de T-factor in RT / F uit de Wet van Nernst. Ons inziens kan voor een routine pH bepaling de standaarddeviatie in het algemeen op rond 0.05 pH eenheid gesteld worden. Dat steekt schril af bij de afleesnauwkeurigheid, die bijvoorbeeld bij de Ankersmit A161 meters 0.001 pH eenheid bedraagt! In feite worden dan onnodig nauwkeurige mV meters gebruikt. Let er verder op dat bij hoge pH de zogenaamde alkalimetaal-ionenfout optreedt. Afhankelijk van het type glas van de elektrode moet de meetuitkomst worden gecorrigeerd. Bijvoorbeeld: voor oplossingen die 0.1 M aan Na+ zijn moet bij een pH in de buurt van 12 bij de meetuitkomst voor een glaselektrode van Corning 015 glas 0.3 pH eenheid bij de afgelezen meetuitkomst worden opgeteld! Bij iedere elektrode hoort een correctietabel. Andere complicaties bij pH meten: ionsterkte van de oplossing; temperatuurafhankelijkheid van Kw. Zo is pKw bij 20 oC niet 14.00 maar 14.15!
foutenleer- 23
3.c. Afleesfout De aanwijzing van een meetinstrument wordt gewoonlijk op een analoge of een digitale schaal weergegeven. Soms gebeurt dat indirect, bijvoorbeeld door het signaal door te geven aan een schrijver ("recorder") of een computer, die dan voor verdere verwerking zorgt. Onder de afleesfout verstaan we het kleinste interval dat op een analoge schaal nog kan worden afgelezen. Dat is tussen twee niet te dicht op elkaar staande streepjes ongeveer 0.2 schaaldeel. Houd bij het aflezen rekening met "parallax", het feit dat de streepjes zich schijnbaar verplaatsen als men er niet recht voor staat. Voor een digitale schaal kunnen we de afleesfout stellen op één eenheid van het laatst gerepresenteerde cijfer (digit), als dat cijfer tenminste niet verandert. Is dat wel zo, dan moeten we uit de veranderingen zelf een waarde voor de afleesfout schatten. Soms flatteren fabrikanten de meetnauwkeurigheid van een apparaat wat door het aanbrengen van te nauwkeurige afleesschalen, al of niet voorzien van elektronische demping of integratie. Gewoonlijk is in onze meetsystemen de afleesfout kleiner dan de standaarddeviatie van onafhankelijk verkregen meetuitkomsten. Voor de schatting van de totale standaarddeviatie nemen we veelal de grootste van de twee, omdat er geen goede manier bestaat om dit soort standaarddeviaties ‘op te tellen’. Voorbeeld: Afgelezen wordt op een Ankersmit A161 pH meter: pH = 6.083. Afleesfout volgens de fabrikant = 0.001. De standaarddeviatie van het glaselektrodesysteem wordt door die fabrikant geschat op 0.05 pH eenheid. In berekeningen nemen we : pH = 6.08 met standaarddeviatie in de pH = 0.05.
Voorbeeld Afgelezen werd op een Novaspec II: extinctie = 0.782. De afleesfout = 0.001 (daarop kapt de display af). De standaarddeviatie (reproduceerbaarheid) volgens de apparaatspecificatie = 0.5 % in de extinctie. In berekeningen nemen we dus standaarddeviatie s in de extinctie = 0.004, hetgeen 0.5 % is van 0.782, en niet de kleinere afleesfout van 0.001!
Opgave 3.2 Met 5 combi-elektrodes van één bepaald type en één pH meter wordt van een oplossing 5 keer de pH gemeten. De meetuitkomsten zijn: 4.361 4.342 4.324 4.286 4.319. Welke waarde geeft U op (of gebruikt U in verdere berekeningen) voor de standaarddeviatie in de pH?
foutenleer- 24
4. Het noteren van het resultaat van de meting 4.a. De eenheden Zoveel mogelijk worden alle meetuitkomsten genoteerd in SI eenheden, voorzien van de gebruikelijke voorvoegsels voor machten van 10. Hiervoor verwijzen we naar Uw VWO leerstof. Het is ook gewenst dat de meetuitkomst en de standaardeviatie op dezelfde wijze genoteerd worden, met dezelfde macht van 10. Dus wel: de gemeten spanning = 4.032 V met s = 0.007 V, maar niet: de gemeten spanning = 4.032 V met s = 7 mV. In sommige onderzoeksdisciplines wijkt men traditioneel toch nog steeds af van SI eenheden. Zo worden in de kernfysica energieën vaak gegeven in eV (electronvolt) in plaats van in Joules. In het laboratorium geeft men bij vacuümdestillaties de druk in mm kwik in plaats van in Pascal, omdat die ook vaak met een kwikmanometer gemeten wordt. Bij de infraroodspectroscopie worden de absorpties weergegeven bij hun golfgetal in cm-1 en niet bij hun frequentie in Hz. Het is onze opvatting dat een academicus met de diverse soorten eenheden flexibel moet kunnen omgaan. Om de wat oudere wetenschappelijke literatuur te kunnen gebruiken moet men trouwens zeer vaak allerlei oude eenheden soepel in andere kunnen omrekenen. Gelukkig kunnen omrekentabellen, zoals die bijvoorbeeld in het "Handbook of Chemistry and Physics" vermeld staan onder "Units, conversion factors", ons daarbij behulpzaam zijn. 4.b. Het aantal significante cijfers In het VWO werd in veel gevallen de regel gehanteerd dat het eindresultaat van een samengestelde grootheid in een berekening evenveel significante (= betekenisvolle) cijfers moet bevatten als het minst nauwkeurige gegeven. Hoe het aantal significante cijfers van dit gegeven was verkregen, daarbij werd niet stil gestaan. Ook faalt die regel wel eens. Voorbeeld Als de pH = 4.205 dan volgt [H+] = 6.2373483 . 10-5 mol/l. Als de pH = 4.206 dan volgt [H+] = 6.2230028 . 10-5 mol/l. Dus nu levert een onzekerheid in het vierde significante cijfer van de pH al een onzekerheid in het derde significante cijfer van de [H+] op, zodat de eenvoudige VWO regel hier niet opgaat. Dat is meestal zo als we logarithmen of e-machten gebruiken!
Het is altijd de bedoeling om een meetuitkomst zo correct mogelijk te noteren: de juiste eenheden, niet teveel maar ook niet te weinig significante cijfers, en op een juiste manier afgerond. We proberen de meetuitkomst zo te noteren dat het laatste cijfer, en niet meer en niet minder dan dat, onzeker is. Die onzekerheid moet corresponderen met de onnauwkeurigheid van het experiment.
foutenleer- 25
Om het aantal significante cijfers van de uiteindelijke meetuitkomst (gewoonlijk van de gemiddelde meetuitkomst xg) correct te bepalen, moet men eerst een goede schatting hebben van de standaarddeviatie s, en van de standaarddeviatie sg in dat gemiddelde. Voor die laatste geldt sg = s / √n (4.1) Zoals later (par. 8.b ) zal blijken is de standaarddeviatie s die uit het beperkte aantal metingen dat we gewoonlijk doen berekend wordt, niet erg nauwkeurig. Vaak is het aantal metingen n maar 5 à 10, en een standaarddeviatie in s van 30 % is dan heel gewoon. Daarom hanteren we voor kleine aantallen metingen de praktijkregel: sg wordt genoteerd met slechts één significant cijfer, tenzij dat een 1 of een 2 zou zijn; in die gevallen noteren we er twee. Voorbeeld sg werd berekend als: 0.1357 V.
We noteren sg =
0.14 V
0.7853 V
0.8 V
0.6128 V
0.6 V
4.3854 V
4
2.345 V
2.3 V
V
Vervolgens worden voor de gemiddelde meetuitkomst xg evenveel decimalen genoteerd als voor sg, de standaarddeviatie in het gemiddelde. Voorbeeld Als sg = 0.13 V en xg werd berekend als 22.1834
V
dan noteren we xg = 22.18 V
0.8
V
220.138
V
220.1 V
6
V
21.7554
V
22
V
2.4
V
22.3281
V
22.3
V
2218.1
V
er werd te ruw afgekapt!
0.06 V
Opgave 4.1 Noteer de volgende meetuitkomsten met het juiste aantal significante cijfers (ze zijn gegeven in kg): xg sg xg sg 16.33227
0.15003
16.33227
0.31283
16.33227
3.1283
16.33227
0.000005
0.99283
0.27432
0.99283
1.72583
2412.13247
0.27432
2412.13247
16.501
2412.13247
1050
We merken nog op dat het afkappen van tussenresultaten in berekeningen zoveel mogelijk achterwege moet blijven. Bij het gebruik van rekenmachientjes is het dus aan te bevelen om tussenresultaten in een geheugen op te slaan. In elk geval moeten tussenresultaten minstens één en liefst twee cijfers meer bevatten dan het eindresultaat, wil er niet onnodig informatie verloren gaan.
foutenleer- 26
4.c. Afronden Nadat het aantal significante cijfers is bepaald, moet er gewoonlijk nog worden afgerond. Om te bereiken dat iedereen dat op dezelfde wijze doet, en om geen informatie onnodig verloren te laten gaan, bestaan er genormaliseerde regels daarvoor. Daartoe kijken we naar de cijfers die overblijven na het afkappen. Er zijn 3 gevallen: 1. Is dit restant < 500....enz. dan nemen we het afgekapte resultaat. Voorbeeld: 4.3128 afgekapt als 4.3 || 128 wordt 4.3 1.0006 afgekapt als 1.00 || 06 wordt 1.00 2. Is dit restant > 500...enz. dan wordt het cijfer waarvóór afgekapt werd met 1 opgehoogd. Voorbeeld: 4.3612 afgekapt als 4.3 || 612 wordt 4.4 1.0076 afgekapt als 1.00 || 76 wordt 1.01 3. Is dit restant = 500....enz. dan wordt een oneven cijfer vóór de 5 veranderd in het even getal dat het dichtst bij de meetuitkomst ligt. Voorbeeld: 0.2850 afgekapt als 0.28 || 50 wordt 0.28 3.5000 afgekapt als 3. || 5000 wordt 4 54.500 afgekapt als 54. || 500 wordt 54 We zien dus dat het afronden steeds in één keer wordt gedaan, dus niet 28.7498 wordt 28.750 wordt 28.75 wordt 28.8, maar in één keer 28.7498 wordt 28.7 als de meetuitkomst op 1 decimaal achter de punt moet worden gegeven. We noemen de macht van 10 van het laatste significante cijfer het afrondingsinterval (zie ook bij de histogrammen, appendix 1.1, punt 2). Opgave 4.2 Kap eerst af en rond daarna de volgende gemiddelden xg af, als gegeven is dat sg = 0.3: 28.652
5.586
0.768
12.553
1.997
1.913
121.55
121.45
0.032
Over het afronden kan worden opgemerkt dat de nauwkeurigheid van het resultaat er natuurlijk enigszins door afneemt. Men kan laten zien dat het effect op de nauwkeurigheid echter meestal niet meer dan 1 % bedraagt (zie bijv. ref. in par. 10a.6 pag. 72). 4.d. Hoe wordt de meetuitkomst genoteerd? In het algemeen zou het beste zijn om alle meetuitkomsten te noteren. Zijn dat er meer dan enkele, dan wordt dat onoverzichtelijk. In dat geval geven we altijd de drie kengetallen: het aantal metingen (n), de gemiddelde meetuitkomst (xg) en de standaarddeviatie (s). De lezer kan dan zelf wel de standaarddeviatie in het gemiddelde, of een betrouwbaarheidsinterval (dit wordt later behandeld) voor de meetverwachting uitrekenen. Men beschikt dan ook over alle relevante gegevens om toetsen uit te voeren.
foutenleer- 27 Voorbeeld Voor de massa van een soort metalen kogeltjes werd gemeten: 1.234
1.236
1.238
1.270
1.235
1.239
1.230
1.235
1.238
1.231 g.
We geven na verwijdering van de evidente uitschieter 1.270: n = 9; sg = 1.2351 g; s = 0.0031 g; sg wordt dan 0.0010 g. We geven nu dus 4 decimalen, want sg = 0.0010 g met twee significante cijfers, hetgeen we hier dus met 4 decimalen voor zowel sg als xg noteren. We kunnen alles ook in de zogenaamde “wetenschappelijke“ notatie noteren, met machten van 10, namelijk sg = 0.10 * 10-2 g. We zien dan direct de twee significante cijfers achter de decimaalpunt. Opgave 4.3 Van een merk azijn werd door middel van titratie het azijnzuurgehalte bepaald. De meetuitkomsten waren, in massa %: 4.12
4.08
4.03
3.90
4.15
4.08
4.10
4.09
4.01
4.06
3.70
3.99
4.06
Geef met behulp van deze metingen de drie kengetallen zo correct mogelijk weer.
Met correct noteren wordt dus bedoeld dat de meetuitkomsten worden genoteerd: - zonder uitschieters - correct afgekapt - correct afgerond Zo mogelijk geven we in elk geval de drie kengetallen: - het aantal metingen (n) - het gemiddelde (xg) - de standaarddeviatie (s) met vermelding van de (SI) eenheid waarin deze grootheden zijn uitgedrukt. Opmerking achteraf: Vaak is het toch prettig als een meetuitkomst met één decimaal meer bekend is dan met bovenstaande procedure bepaald wordt. Met name als men ermee verder wil rekenen is dat aan te raden. In feite wordt dan net gehandeld als met een tussenresultaat van de berekeningen.
foutenleer- 28
5. De standaarddeviatie in een samengestelde grootheid 5.a. Probleemstelling In de vorige paragrafen hebben we ons o.a. bezig gehouden met de berekening van de standaarddeviatie in de meetuitkomsten. Het ging daarbij om directe meetuitkomsten, dat wil zeggen dat er geen mathematische bewerkingen nodig waren om te komen tot de einduitkomst waarin we geïnteresseerd waren. We hadden een meetinstrument waarop de gewenste grootheid steeds direct was af te lezen, bijvoorbeeld een thermometer of een pH meter. In de chemie en in de fysica is dit soort metingen echter relatief zeldzaam. Vaak meten we meer dan één grootheid en passen dan een mathematische bewerking toe om een samengestelde grootheid te weten te komen. Wel is het zo dat door het koppelen van computers aan meetinstrumenten de situatie op dit gebied gaandeweg aan het veranderen is. Voorbeeld De warmte W die in een calorimeter wordt ontwikkeld als een stroom van I Ampère gedurende t seconden door een weerstand van R Ohm gaat is te berekenen als W = I2.R.t Joules. Als de standaarddeviaties in de meetuitkomsten van I, R en t bekend zijn, moet die in W berekend kunnen worden.
We zullen in deze paragraaf nagaan hoe we uit de bekende standaarddeviaties van de meetuitkomsten van de direct gemeten grootheden (de onafhankelijke variabelen) de standaarddeviatie van de berekende uitkomst van een samengestelde grootheid (de afhankelijke variabele) kunnen berekenen. In de praktijk van het meten wordt de te behandelen techniek op twee manieren toegepast: à priori, vóór de meting, en à posteriori, na de meting. 1. à priori Voordat we met de metingen beginnen is het zeer zinvol om ons af te vragen hoe nauwkeurig alle sub-grootheden gemeten moeten worden, willen we de gewenste nauwkeurigheid van de samengestelde eindgrootheid halen. Bedenk daarbij dat onnodig nauwkeurig meten vaak duur is en/of veel tijd kost. Voorbeeld Bij de meting van de warmte W m.b.v. een zekere calorimeter zijn de grootte-orden van de te meten grootheden vooraf al ongeveer bekend: I ≈ 0.2 A; t ≈ 50 s; R ≈ 1000 Ω, zodat W ≈ 2000 J bedraagt. We beschikken over een stopwatch voor de tijdmeting, waarvoor st geschat wordt op 0.2 s, en over een stroommeter die een geschatte sI heeft van 0.003 A. Als we de warmte W willen weten met een standaarddeviatie van ongeveer 100 J, hoe groot mag dan de standaarddeviatie van de weerstand R zijn? (die standaarddeviatie moeten we bijvoorbeeld weten als we in het elektronicamagazijn vragen om een weerstand). We zullen later, in opgave 5.3, uitwerken hoe we dit probleem oplossen.
foutenleer- 29
2. à posteriori In alle gevallen waarin het eindresultaat niet direct gemeten wordt moet het uit de directe metingen berekend kunnen worden. Daarbij gaan we ook na hoe groot de standaarddeviatie in het eindresultaat wordt. Voorbeeld Met een spectrofotometer meten we de transmissie T (dat is de verhouding tussen de doorgelaten intensiteit en de invallende intensiteit van de betreffende straling) van een gekleurde oplossing, die zich in een cuvet met een bekende breedte b bevindt. Met behulp van de Wet van Lambert-Beer kan de concentratie c van de oplossing worden berekend, als ook de molaire extinctie-coëfficient ε bekend is. Immers er geldt: c = A / (ε.b) waarbij de extinctie A is gedefinieerd als A = - 10log T. Het probleem is hoe de standaarddeviatie in c te berekenen, als de standaarddeviaties in ε, in b en in T bekend zijn (uit de meetuitkomsten berekend en/of in de apparatuurhandleiding opgezocht).
Ook op dit voorbeeld zullen we later in deze paragraaf terugkomen. We zullen in par. 5.b een algemene formule geven die op iedere functie van een aantal direct gemeten grootheden toe te passen is. Deze formule is in bijzondere gevallen tot gemakkelijk te onthouden vormen te reduceren. 5.b. Algemene Foutendoorwerkingsformule (Gauss) We veronderstellen steeds dat tussen een berekende uitkomst u en de direct gemeten grootheden x, y, z, ...enz. een bekend verband geldt: u = f (x,y,z,..).
(5.1)
Hierin is f een eenduidige, continue, naar alle variabelen x,y,z,...enz. differentieerbare functie. De variabelen x, y, z,... moeten onafhankelijk zijn. Dit betekent o.a. dat we, om de ene variabele te meten, geen waarden voor een van de andere variabelen nodig mogen hebben. We gaan ervan uit dat er gemiddelde meetuitkomsten xg, yg, zg voor x, voor y, voor z enz. bekend zijn, alsmede de standaarddeviaties in die gemiddelde meetuitkomsten: sgx, sgy, sgz, enz. (berekend m.b.v. formule (4.1). Uit de gemeten uitkomsten van x, y, z,...berekenen we de beste uitkomst voor de grootheid u door in de functie u die gemiddelde meetuitkomsten in te vullen: u best = f (xg, yg, zg,..)
(5.2)
De standaarddeviatie voor ubest, genoteerd als su, benaderen we met behulp van de "foutendoorwerkingsformule" (Engels: law of propagation of errors): s2u ≈ s2gx . (∂u/∂x)2
+
s2gy . (∂u/∂y)2
+
s2gz . (∂u/∂z)2
+
....
(5.3)
Hierbij moeten de partiële afgeleiden (∂u/∂x), (∂u/∂y),... enz. geëvalueerd worden voor de beste meetuitkomsten , dus voor xg, yg,... enz.
foutenleer- 30
Let vooral op de kwadraten in de formule! Het betekent dus dat de varianties van de onafhankelijke grootheden opgeteld kunnen worden, waarbij elke variantie met een "gewichtsfactor" gelijk aan het kwadraat van "zijn" partiële afgeleide vermenigvuldigd moet worden. In par. 5e wordt de equivalente formule (5.7) gegeven, die zeer geschikt is voor numeriek werk. Als we het voorbeeld van de extinctiemeting uit par. 5.a nu uitwerken, dan krijgen we het volgende: Als c = -10log T / (εb), en de gemiddelde meetuitkomsten met de standaarddeviaties daarin zijn bijvoorbeeld: T = 0.300 met sT = 0.010; b = 1.000 cm met sb = 0.010 cm; ε = 4500 mol cm-1 met sε = 10 mol cm-1, dan krijgen we (vul 5.3 in): s2c = s2T. (∂c/∂T)2+ s2b. (∂c/∂b)2 + s2ε.(∂c/∂ε)2. Bedenkend dat 10log T = 0.434294 ln T , dan krijgen we na differentiëren: s2c = s2T. (-0.434294/(ε.b.T))2 + s2b.(10log T/(ε.b2))2 + s2ε.(10log T/(ε2.b))2 Invullen van de gegeven waarden levert: c = 1.1619.10-4 mol / l en s2c = 0.012.(-0.0003217)2 + (0.01)2.(0.0001162)2 +102.(2.582.10-8)2 s2 = 1.03491.10-11 + 1.3502.10-12 + 6.6667.10-14 = 1.1766.10-11 zodat c
sc = 3.430.10-6 mol / l , en dus sc / c = 0.0295. (de rekenuitkomsten zijn hier nog niet afgekapt en afgerond). We zien aan dit voorbeeeld dus dat de concentratie c met een relatieve standaarddeviatie van slechts ongeveer 3 % gemeten kan worden. Dat is voor apparatuur als de "Spectronic 20" ongeveer het maximaal haalbare. Voor de "Novaspec II" komen we op ongeveer 1 %. Opgave 5.1 Voor de dissociatieconstante Kz van een zwak zuur geldt: Kz = α2. c / (1-α) Hierin is c de oorspronkelijke zuurconcentratie en α de ionisatiegraad van het zuur. Gemeten zijn de gemiddelde meetuitkomsten: cg = 0.0984 mol/l en sgc = 0.0003 mol/l; αg = 0.0140 en sgα = 0.0010. De grootheden α en c werden onafhankelijk gemeten. a. Bereken de beste waarde voor Kz en van de standaarddeviatie van Kz. b. Bereken de waarde van pKz (= - 10log Kz) en van de standaarddeviatie in pKz. Gebruik daarbij de resultaten van a.
Opgave 5.2 De straal van een gegeven bol wordt gemeten met een schuifmaat als R = 2.035 cm met sR = 0.025 cm. De dichtheid d van het materiaal waarvan de bol is gemaakt wordt gemeten met een flotatiemethode, en bedraagt gemiddeld 2.450 g cm-3 met als standaarddeviatie daarin = 0.003 g cm-3. Bereken met behulp van deze meetuitkomsten de beste waarde voor de massa van de bol en de standaarddeviatie daarvan. Rond correct af! Vergelijk uw uitkomst wat nauwkeurigheid betreft met het wegen van de bol op een analytische balans! [Gegeven is ook: Vbol = (4/3). π. R3 met π = 3.141592654. In Excel is π te berekenen met = PI()].
foutenleer- 31 Opgave 5.3 Bereken voor het voorbeeld van de calorimeter uit par. 5.a de waarde van de relatieve standaarddeviatie van de weerstand, sR/R, die u aan het elektronicamagazijn moet opgeven.
Opgave 5.4a Leid formule (1.6) of (4.1) af.
5.c. Enige bijzondere gevallen van de algemene foutendoorwerkingsformule (Waarschuwing: Als U deze regels niet goed beheerst, dan is het veel veiliger om de algemene formule 5.3 toe te passen!).
Geval 1: sommen en/of verschillen Als de functie u een willekeurige lineaire combinatie is van de direct gemeten onafhankelijke variabelen, dus u = ax + by + cz +......enz., dan gaat de algemene formule over in de gemakkelijk te onthouden vorm: s2u = a2 . s2gx + b2 . s2gy + c2 . s2gz + .....
(5.4)
Men zegt wel: "kwadratisch optellen van de absolute fouten". De formule is vooral handig als de coëfficienten a, b, c,.. +1 of -1 zijn. Opgave 5.4b Leid formule ( 5.4) af uit de algemene formule (5.3).
Opgave 5.5 Bij een titratie wordt het volume titrant bepaald door de standen van het vloeistofniveau in de buret aan het begin en aan het eind af te lezen. Gewoonlijk lezen we slechts eenmaal af en maken we à priori een schatting van de standaarddeviatie van zo’n volumebepaling, bijvoorbeeld 0.02 ml. We kunnen ze echter ook meten, bijvoorbeeld door een aantal verschillende personen te laten aflezen. Meetgegevens van 5 verschillende personen, beginstand / eindstand combinaties, waren: 0.70 / 25.82; 0.69 / 25.84; 0.74 / 25.83; 0.72 / 25.80; 0.70 / 25.80 ml. Bereken het gemiddelde titrantvolume, en de standaarddeviatie in het gemiddelde volume.
Geval 2: producten en/of quotiënten met exponenten Als de functie u de vorm heeft: u = k.xa.yb.zc...enz., dan gaat de algemene formule (5.3) over in de vorm: s2u / u2 = a2. s2gx / x2 + b2. s2gy / y2 + c2. s2gz / z2 + ..... (5.5) Ook in dit geval is de formule pas echt eenvoudig in de gevallen dat de exponenten a, b, c, .. +1 of 1 zijn. We spreken dan van "kwadratisch optellen van de relatieve fouten". Opgave 5.6 Leid formule (5.5) uit de algemene formule (5.3) af.
foutenleer- 32 Voorbeeld Van een monster, dat als enige base NaOH bevat, wordt m = 120.2 mg getitreerd met zoutzuur van titer t = 0.1004 mol/l. De standaarddeviatie in de weging bedroeg 0.2 mg, en die in de titer was 0.0002 mol/l. Het benodigde volume V aan HCl oplossing blijkt 25.05 ml, met een standaarddeviatie van 0.03 ml. Alle gegeven waarden zijn gemiddelden en standaarddeviaties daarin. Bereken het gehalte G aan NaOH in % in het monster, alsmede de standaarddeviatie daarin. Uitwerking: G = Molmassa NaOH * VHCl * tHCl / m = 39.9972 * 25.05 * 0.1004 / 120.2 * 100% = 83.69 %. s2G / G2 = s2M / M2 + s2V / V2 + s2t / t2 + s2m / m2 s2G / G2 = 0.00012 / 39.99722 + 0.032 / 25.052 + 0.00022 / 0.10042 + 0.22 / 120.22 sG = 0.0024 . Het gehalte aan NaOH is dus 83.69 % met een standaarddeviatie van 0.24 %. Opgave 5.7 Bij de jodometrische bepaling van de Faraday geldt de formule: F = I.t / (m.V). Hierin zijn:
F = de Faraday, in C/mol I = de stroomsterkte, in mA. t=
de tijd tot de indicatoromslag, in s.
V= het volume natriumthiosulfaat, in ml. m = de molariteit van de natriumthiosulfaatoplossing, in mol / l. Gemeten werd: I = 95.0 met sI = 0.1 mA t=
510
V = 5.00
met st = 1 s met sV = 0.02 ml
m = 0.1000 met sm = 0.0005 mol / l. Alle vermelde waarden zijn gemiddelden en de standaarddeviaties daarin. a. Bereken de waarde voor de Faraday, en de standaarddeviatie daarvan. Pas zowel (5.3) als (5.5) toe. b. Welke grootheid draagt het meest bij tot die standaarddeviatie, en komt dus als eerste eventueel in aanmerking om nauwkeuriger gemeten worden?
5.d. Afhankelijke grootheden In de afleiding van de algemene foutendoorwerkingsformule, (5.3), wordt gebruik gemaakt van het feit dat de gemeten grootheden x, y, z, ..enz. onafhankelijk zijn. Dat wil o.m. zeggen dat ze niet uit elkaar te berekenen mogen zijn. Bij het toepassen van deze formule, of de eenvoudiger vormen (5.4) of (5.5) die eruit zijn afgeleid, moeten we hier terdege mee rekening houden. Er worden helaas veel fouten gemaakt doordat wèl met afhankelijke grootheden wordt gerekend. Voorbeeld Bij de spectrofotometrische bepaling van de pK van een zuur-base indicator geldt de volgende relatie tussen de gemeten grootheden: pK = pHA - 10log { (A - Az) / (Ab - A) } De grootheden A, Az, Ab zijn de extincties bij één golflengte gemeten voor indicatoroplossingen bij pHA, bij zeer lage pH, resp. bij zeer hoge pH. Het is beslist verkeerd om nu twee hulpvariabelen x en y als volgt in te voeren: x = A - Az; y = Ab - A; en dan die twee variabelen in de formule te substitueren, en daarna de algemene foutendoorwerkingsformule (5.3) toe te passen met als variabelen x en y. De variabelen x en y zijn afhankelijk, want y = Ab + Az - x. Men kan door in beide gevallen (met en zonder invoering van x en y) de formule toe te passen zien dat er een verschillend resultaat komt. Probeer dat!
foutenleer- 33 Opgave 5.8 We nemen nogmaals het geval van de ijking van een calorimeter: W = I2.R.t. De gemiddelde meetwaarden en hun standaarddeviaties zijn: I = 0.520 A met sI = 0.020 A; R = 248.0 Ω met sR = 0.5 Ω;
t = 866.8 s met st = 0.2 s.
a. Bereken de relatieve standaarddeviatie in W door formule (5.3) toe te passen, met als variabelen I, R en t. b. Bereken de relatieve standaarddeviatie in W door formule (5.3) toe te passen, maar nu met als variabelen I, V en t. Daarbij is een nieuwe variabele V ingevoerd, de spanning, berekend met de Wet van Ohm: V = I . R. De warmte W is dus nu geschreven als W = I.V.t. c. Geef commentaar op de twee uitkomsten.
5.e. Het berekenen van de (partiële) afgeleiden Het berekenen van de partiële afgeleiden (∂u/∂x) enz. geeft nogal eens problemen, waardoor veel onnodige fouten worden gemaakt. Met nadruk moet worden gesteld dat het beslist gewenst is de regels voor het differentiëren van functies, met producten en quotiënten enz. en inclusief de kettingregel etc. behoorlijk onder de knie te hebben. Naast deze hierboven bedoelde zogenaamde analytische wijze van differentiëren kan het nuttig zijn om grafisch of numeriek te differentiëren. Bij het grafisch differentiëren wordt een grafiek van de betreffende functie u getekend, en wordt in het gewenste punt xg, yg,... de raaklijn getekend. Van deze raaklijn wordt de richtingscoëfficient (= tangens) bepaald. Let daarbij terdege op de eenheden waarin de schalen zijn verdeeld. De methode is vooral geschikt voor functies van één variabele die moeilijk differentieerbaar zijn, bijvoorbeeld omdat er geen expliciete functie voor bekend is. Bij het numeriek differentiëren, al of niet per computer, wordt het differentiaalquotient (∂u/∂x) benaderd door een differentiequotient (Δu/Δx). Hierbij moet in principe Δx zo klein mogelijk worden genomen, immers, in het limietgeval voor Δx → 0 nadert het differentiequotient tot het differentiaalquotient. In het praktische rekenen in het kader van de foutenleer nemen we gewoonlijk voor Δx de waarde van sgx, voor Δy nemen we sgy, ...enz. Daarbij moeten we er zeer op bedacht zijn dat er voldoende nauwkeurig gerekend wordt. De nauwkeurigheid van 10 cijfers op een rekenmachientje of zelfs van 12 cijfers op een PC is hiervoor zonder speciale voorzorgen vaak te klein! We berekenen in concreto voor de afgeleide (∂u/∂x): (∂u/∂x) ≈ (Δu/Δx) = {f(xg+ sgx, yg, zg,...) - f(xg, yg, zg, ..) } / sgx
(5.6)
We doen dit om de beurt voor alle variabelen x, y, z,...enz. De formule (5.3) vereenvoudigt in dit geval tot: s2u = Δu2x + Δu2y + Δu2z waarin Δux = f(xg+ sgx, yg, zg,...) - f(xg, yg, zg, ..) enz. Opgave 5.9 a. Maak wederom opgave 5.1, maar differentieer nu numeriek. b. Idem opgave 5.2. Controleer zowel de afgeleiden zelf, als de totaaluitkomst m.b.v. formule 5.7.
(5.7)
foutenleer- 34
6. Polynoom-fit m.b.v. de kleinste kwadraten methode (i.h.b. lineaire regressie). 6.a. Inleiding In het voorgaande hebben we steeds meetuitkomsten beschouwd voor telkens één grootheid, bijvoorbeeld temperatuur, druk, stroomsterkte etc. In de nu volgende paragraaf beschouwen we de situatie dat er tussen twee meetgrootheden een mathematische relatie bestaat. Deze relatie manifesteert zich bijvoorbeeld in een grafiek waarin de grootheid y tegen de grootheid x wordt uitgezet, in de vorm van een verzameling waarnemingsparen {xi, yi}, waarbij voor iedere ingestelde waarde van xi een bijbehorende waarde yi gemeten wordt. Voorbeeld Er worden een aantal oplossingen bereid van kopersulfaat. Van iedere oplossing i is de concentratie ci zeer nauwkeurig bekend, bijvoorbeeld door inwegen. Voor elke oplossing i wordt de extinctie Ai bij 810 nm gemeten. Een grafiek van de gemeten Ai waarden tegen de bekende ci waarden geeft een bij benadering lineair verband te zien tussen deze twee meetgrootheden, als de Wet van Lambert-Beer geldt.
Met behulp van de zogenaamde regressierekening is het mogelijk om een functie y = f(x) te bepalen, die "zo goed mogelijk" door de puntenverzameling {xi, yi} in deze grafiek loopt. We spreken wel van "het fitten" van een curve of een lijn door de punten. Voor het bepalen van een dergelijke "beste" curve of lijn is een tweetal zaken nodig: a. Een juiste keuze van het type van de functie (lineair, polynoom, logarithmisch, e-macht o.i.d). Deze keuze is niet een statistisch, maar een fysisch of chemisch probleem: uit de aard van de grootheden en het theoretisch model dat we hanteren zal de keuze van het type functie volgen. b. Een nadere omschrijving van wat we precies met "beste" aanpassing van de functie aan de meetparen bedoelen. Deze problematiek heeft wel betrekking op de statistiek. In deze paragraaf zullen we een bijzonder geval uitvoerig behandelen: namelijk het zoeken van de beste rechte lijn door een aantal meetpunten. Op het practicum kunt U gebruik maken van een computerprogramma dat de beste polynoom -daarvan is een rechte lijn een bijzonder geval- door een aantal meetpunten kan berekenen en tekenen. We zullen nadere voorwaarden aangeven waaraan de meetpunten moeten voldoen. De methode die wordt toegepast is die der kleinste kwadraten. Daarbij worden niet alleen de parameters bepaald die de polynoom vastleggen, maar ook verkrijgen we standaarddeviaties voor die parameters. We zullen ter illustratie een aantal voorbeelden uit de praktijk van het practicum geven.
foutenleer- 35
6.b. Lineaire regressie: y = ax + b, ongewogen 6.b.1. Uitgangspunten Bij de nu te geven behandeling van het eenvoudigste geval van het bepalen van de beste rechte lijn door een aantal meetpunten maken we een vrij groot aantal veronderstellingen. Die veronderstellingen zijn nodig om het probleem mathematisch eenvoudig hanteerbaar te maken. Het complete mathematische model is het volgende: a. We beschikken over tenminste 3 paren meetuitkomsten {xi, yi}. b. Er wordt van uitgegaan dat er tussen de 2 variabelen y en x het lineaire verband bestaat: y = ax + b, of ook wel geschreven als f (x) = a0 + a1.x. Dat verband kan gebaseerd zijn op een fysisch of chemisch model, of geïndiceerd worden door de ligging van de meetpunten in een grafiek. c. De lijn gaat niet exact door de oorsprong, dus de parameter b is niet exact nul. d. De standaarddeviatie in de gemeten x-waarden is verwaarloosbaar. We stellen s in xi = 0 voor alle waarnemingen. In de praktijk van het meten is deze standaarddeviatie natuurlijk nooit nul, maar het is wel vaak zo dat de ene variabele -die we dan x noemen- aanzienlijk nauwkeuriger gemeten of gecontroleerd wordt dan de andere. In de chemie is dat vaak het geval voor metingen aan oplossingen, waarvan de concentraties nauwkeurig bereid worden, bijvoorbeeld bij een verdunningsreeks. We stellen dan alle sc = 0 voor deze verdunningsreeks. e. De standaarddeviatie in de gemeten y waarden is constant, d.w.z. ze heeft dezelfde waarde voor alle waarnemingen. Hoewel dat in de praktijk lang niet altijd het geval is, wordt deze veronderstelling ter wille van de eenvoud veelvuldig gemaakt. Als de verschillen in die standaarddeviaties te groot worden, dan moet er een gewogen procedure worden gevolgd. Zie par. 6.d. De standaarddeviatie in de yi waarden hoeft niet bekend te zijn. f. De meetparen {xi, yi} zijn ongecorreleerd, d.w.z. de meetwaarden moeten geen relatie tot elkaar hebben. Bijvoorbeeld "drift" kan er de oorzaak van zijn dat volgende paren meetuitkomsten invloed van vorige ondergaan. De verschillen tussen de berekende waarden uit het mathematisch model (de waarden van yi = axi + b) en de gemeten waarden yi noemen we de residuen of differenties di. Let erop dat dat in de grafiek van y tegen x niet de loodrechte afstanden van de rechte lijn tot de meetpunten zijn! Zie figuur 6.1. Figuur 6.1 y y = ax + b yi
di{
}b
)) ϕ
x
tg ϕ = a
foutenleer- 36
6.b.2. De lijnparameters en hun standaarddeviatie De "beste lijn" wordt gevonden door toepassing van het zogenaamde kleinste kwadratencriterium: de parameters a en b uit de vergelijking y = ax + b worden zodanig berekend dat de grootheid M = Σ ( di - <μd> )2 minimaal wordt. Bedenkend dat di = yi - (axi + b), dan wordt aan deze minimaliseringseis voldaan als de partiële afgeleiden van M naar a en naar b nul zijn. Uit deze voorwaarden kan men twee vergelijkingen opstellen waaruit a en b kunnen worden opgelost. Ook de standaarddeviaties in a en b kunnen, door gebruik te maken van foutendoorwerkingsformule (5.3) en van verg. (6.5), worden berekend. Gevonden wordt (n is het aantal meetparen in de verzameling {xi, yi} ), zie par 10a1,3,4 voor details:
Hierin is:
a = { n Σ xiyi - Σ xi . Σ yi } / { n Σ xi2 - (Σ xi )2 }
(6.1)
b = {Σ xi2 . Σ yi - Σxi . Σ xiyi } / { n Σ xi2 - (Σ xi )2 }
(6.2)
sa2 = sd2 . n / { n Σ xi2 - (Σ xi )2 }
(6.3)
sb2 = sd2 . Σ xi2 / { n Σ xi2 - (Σ xi )2 }
(6.4)
sd2 = Σ di2 / (n-2)
(6.5)
Men kan ook laten zien dat de lijn gaat door het "zwaartepunt" X,Y van de meetparen. Het zwaartepunt wordt berekend met als coördinaten: X = Σ xi / n en Y = Σ yi / n.
(6.6a)
Voorbeeld Voor de ijklijn verkregen bij een spectrofotometrische bepaling van ijzer(III) met thiocyanaat werden de volgende meetuitkomsten verkregen: [Fe3+] in %:
0.100 0.200 0.300 0.400 0.500
0.600 0.700 0.800 0.900 1.000 de x-waarden
Extinctie:
0.175 0.220 0.265 0.304 0.345
0.383 0.426 0.470 0.514 0.557 de y-waarden.
Maak eerst een grafiek!!! (zie appendix 6.1). Voor de berekening van a, sa, b en sb wordt dan een tabel opgezet:
Som:
i
xi
yi
x i2
x iy i
y i2
axi + b
di
di 2
1 2 3 4 5 6 7 8 9 10
0.100 0.200 0.300 0.400 0.500 0.600 0.700 0.800 0.900 1.000 5.500
0.175 0.220 0.265 0.304 0.345 0.383 0.426 0.470 0.514 0.557 3.659
0.01 0.04 0.09 0.16 0.25 0.36 0.49 0.64 0.81 1.00 3.85
0.0175 0.0440 0.0795 0.1216 0.1725 0.2298 0.2982 0.3760 0.4626 0.5570 2.3587
0.030625 0.048400 0.070225 0.092416 0.119025 0.146689 0.181476 0.220900 0.264196 0.310249 1.484201
0.1770 0.2190 0.2610 0.3029 0.3449 0.3869 0.4289 0.4708 0.5128 0.5548
-0.002036 +0.000994 +0.004024 +0.001055 +0.000085 -0.003885 -0.002855 -0.000824 +0.001206 +0.002236 0.000000
4.1469. 10-6 0.9878. 10-6 16.194. 10-6 1.1120. 10-6 0.0072. 10-6 15.092. 10-6 8.1487. 10-6 0.6795. 10-6 1.4544. 10-6 5.0010. 10-6 52.824. 10-6
Invullen in de formules voor a, b, sd, sa, sb, X, Y levert op:
foutenleer- 37 a = (10 * 2.3587 - 5.5 * 3.659) / (10 * 3.85 - 5.5 * 5.5) = 0.419697 b = (3.85 * 3.659 - 5.5 * 2.3587 ) / (....) = 0.1350667. Bereken nu alle yi = axi + b waarden, en de di waarden. sd2 = 5.2824. 10-5 / 8 = 6.603. 10-6 = (2.5696. 10-3)2 sa2 = (6.603. 10-6 * 10) / (....) = 8.0036. 10-6 = (2.8291. 10-3)2 sb2 = (6.603. 10-6 * 3.85) / (....) = 3.0814. 10-6 = (1.7554. 10-3)2 X = 5.5 / 10 = 0.55 en Y = 3.659 / 10 = 0.3659 Controleer altijd aan de hand van een grafiek of er geen rekenfouten zijn gemaakt!!. We geven ook de reproductie van de output van het practicum-computerprogramma POWERFIT waarin dezelfde gegevens zijn ingevoerd, en een grafiek is getekend. Zie appendix 6.1. Vergelijk bovenstaande berekening met die output zorgvuldig, getal voor getal.
6.b.3. De correlatie-coëfficient Wanneer men een serie meetuitkomsten {xi, yi} in een grafiek uitzet, dan is daar met de kleinste kwadratenmethode altijd een beste rechte lijn door te construeren, ook al is er eventueel sprake van een zeer grote spreiding van de meetpunten rond die lijn (een "puntenwolk"). Er is daarom behoefte aan een kwantitatief criterium dat aangeeft in hoeverre het veronderstelde lineaire verband tussen x en y meer of minder goed benaderd wordt. Zo'n criterium geeft de waarde van de correlatie-coëfficient r. Deze is gedefinieerd als: r = SX,Y / (SX . SY) of als r = Σ {(xi - X). (yi - Y)} / {√ Σ(xi - X)2. √ Σ(yi - Y)2} Hierin zijn X en Y weer de coördinaten van het zwaartepunt van de meetparen, en de grootheden SX en SY zijn de "standaarddeviaties" van de meetwaarden rond het zwaartepunt X,Y van de "puntenwolk": S2X = Σ (xi - X)2 / (n-1) en S2Y = Σ (yi - Y)2 / (n-1). Analoog wordt ook SX,Y gedefinieerd; SX,Y heet de covariantie van x en y.
(6.6b)
Let op dat deze “standaarddeviaties” SX en SY dus geen meet-onnauwkeurigheden representeren! In Excel wordt de correlatiecoëfficient met R genoteerd, vaak wordt ook R2 uitgevoerd. Enig omwerken van de net genoemde formules levert een hanteerbaar rekenvoorschrift voor de correlatie-coëfficient : r = {n .Σxiyi - Σxi .Σyi} / √ {[ n .Σxi2 - (Σxi)2 ] . [ n .Σyi2 - (Σyi)2 ]}
(6.7)
Men kan ook bewijzen dat r = a. SX / SY
(6.7b)
waarin a de helling van de lijn is, en deze uitdrukking ter berekening gebruiken. Voorbeeld In het rekenvoorbeeld van de vorige subparagraaf betreffende de ijzerbepaling krijgen we dan m.b.v. invullen van formule 6.7: r = {10 * 2.3587 - 5.5 * 3.659 } / √{ (10 * 3.85 - 5.5 * 5.5) . (10 * 1.484201 - 3.659 * 3.659) } = 0.9998 en m.b.v. invullen van 6.7.b: r = 0.419697 * 0.302765035 / 0.12709266 = 0.999818
foutenleer- 38
Verder geldt dat de waarde voor de correlatiecoëfficient altijd tussen -1 en +1 ligt, waarbij de waarden -1 of +1 verkregen worden voor lijnen die exact door de meetpunten lopen. Een negatieve helling tenslotte leidt tot een negatieve correlatiecoëfficient, en een positieve helling tot een positieve correlatiecoëfficient. Voor het correct berekenen van r moet men met zeer grote nauwkeurigheid rekenen, meestal met ca. 12 significante cijfers. In het algemeen geldt ook dat hoe dichter de absolute waarde van de correlatiecoëfficient de waarde 1 nadert, hoe dichter de meetpunten bij de berekende lijn liggen. Op het practicum hanteren we de vuistregel: Uit ervaring met ijklijnen voor oplossingen in de analytische chemie is gebleken dat de absolute waarde van de correlatiecoëfficient groter dan 0.999 moet zijn, wil er van een enigszins behoorlijke kwaliteit sprake zijn. Opgave 6.1 Bij een AAS bepaling van Ca2+ meet men voor de ijklijn de volgende waarden: [Ca2+] in mg / l : 0.000
1.000
2.000
4.000
8.000
Extinctie:
0.004
0.040
0.065
0.110
12.000 0.221
0.311
16.000
20.000
0.420
0.534
Bepaal met de methode der kleinste kwadraten de beste rechte lijn door de meetpunten. Handel als volgt: 1.
Bereken de parameters van de rechte lijn en hun standaarddeviatie, en bereken ook de correlatiecoëfficient. Stel een tabel op als in het voorbeeld, en pas alle formules 6.1 / 6.7 toe. Doe dat m.b.v. een spreadsheet van EXCEL. Zet de metingen ook in een grafiek uit. Doe dat met EXCEL, mbv. de CHART wizard (Let op, neem grafiektype XY(Scatter). Gebruik de optie Add Trendline van het menu Chart.
2.
Doe de berekeningen ook met het practicum-computerprogramma POWERFIT.
3.
Doe de berekening ook met het lineaire regressie programma van EXCEL. Gebruik daartoe de optie Regression onder Data Analysis in het menu Tools.
4.
Ga na of U alle uitvoergegevens van beide programma’s kunt interpreteren!
Het is ook mogelijk om statistische toetsen voor de correlatiecoëfficient uit te voeren. De berekende waarde r van de correlatiecoëfficient is immers slechts een schatting gebaseerd op één stel meetparen {xi, yi} van de "ware waarde" daarvoor. Zie par 10.b.5. 6.c. Fitten van curven. Als door de meetpunten beter een curve dan een rechte lijn getrokken kan worden, dan kan men bijvoorbeeld een polynoom bepalen die zo goed mogelijk door de meetpunten gaat: y = f(x) = a0 + a1.x + a2.x2 + a3.x3 + ......
(6.8)
Met behulp van de kleinste kwadratenmethode worden de waarden van de parameters aj en hun standaarddeviaties berekend. We behandelen de mathematiek hiervan niet, maar verwijzen naar het boek van Green en Margerison (par. 10.a.5). Het is natuurlijk altijd mogelijk om door n meetparen een (n-1)e graads polynoom exact te fitten, met standaarddeviaties van nul voor de parameters!
foutenleer- 39
Ook geldt algemeen dat hoe hoger de graad van de polynoom is, hoe beter de curve door de punten gaat. Maar het ophogen van de graad van de polynoom is niet altijd zinvol; bij een zekere graad geeft verhoging van de graad met 1 nog wel een betere fit, maar de verbetering is statistisch niet significant meer. Men kan met behulp van een F-toets nagaan welke graad polynoom in een bepaald geval de "beste" is, d.w.z. een hogere graad is niet significant beter. In het op het practicum in gebruik zijnde computerprogramma POWERFIT bestaat deze mogelijkheid. 6.d. Fitten met gewichten Als de gemeten xi - en / of de yi -waarden niet allemaal even nauwkeurig zijn (dat wil dus zeggen dat hun standaarddeviaties niet gelijk zijn), dan moeten de nauwkeuriger waarden dus zwaarder tellen in het bepalen van de loop van de te fitten curve of rechte lijn. Men kan daartoe aan elke waarneming een gewicht toekennen. Men kan bewijzen dat de beste fit wordt verkregen als deze gewichten omgekeerd evenredig worden genomen met de varianties van de meetuitkomsten. De berekeningen worden hierdoor aanzienlijk gecompliceerder, en zijn slechts met een gespecialiseerd computerprogramma uit te voeren. Als de nauwkeurigheden niet teveel verschillen, dan voert men de berekeningen toch meestal ongewogen uit. Dat heeft vooral wat invloed op de berekende standaarddeviaties, die enigszins onderschat worden. In de gevallen dat er toch gewogen wordt, gebeurt dat ook meestal slechts voor de yi - waarden, omdat de xi - waarden toch zeer vaak verwaarloosbare standaarddeviaties hebben. Het computerprogramma POWERFIT kan werken met gewichten voor de yi - waarden. Voor de expliciete formules voor deze gewogen kleinste kwadratenfit (alleen yi) van een rechte lijn verwijzen we naar het boek van Squires (par.10.a.3), en voor zowel gewogen xi als yi naar het boek van Green en Margerison (10.a.5).
6.e. Inverse toepassing van de ijklijn Vooral in de analytische chemie, maar ook elders, wordt veelvuldig gebruik gemaakt van ijklijnen of calibratielijnen. Daarbij worden eerst voor een aantal zelf gekozen en bereide concentraties de meetsignalen bepaald. De zo verkregen meetuitkomsten worden in grafiek gezet, en er wordt een al dan niet rechte lijn door geconstrueerd. Vervolgens wordt het meetsignaal Ms van een of meer monsteroplossingen bepaald, en door inverse toepassing van de lijn wordt de onbekende concentratie cs van deze monsteroplossing bepaald. Zie figuur 6.2.
foutenleer- 40
Figuur 6.2 y y = ax+b
+ + M
s
+ + c
s
x
We behandelen hier nu het voorbeeld van een rechte ijklijn, die uit n ongewogen paren meetuitkomsten werd geconstrueerd. Als het meetsignaal van het monster Ms bedroeg, dan vinden we via de uitdrukking voor de ijklijn : (y = ax + b): cs = ( M s - b ) / a
(6.9)
We zijn uiteraard ook geïnteresseerd in de standaarddeviatie van cs. Bij het bepalen daarvan moet rekening worden gehouden met de onnauwkeurigheid van het meetsignaal Ms, maar ook moet verdisconteerd worden dat de lijnparameters a en b zelf onnauwkeurig zijn. Het doorwerken van de standaarddeviaties in deze drie grootheden is gecompliceerd, mede doordat a en b afhankelijk zijn. We verwijzen naar Agterdenbos et al. (par. 10.c.3) voor een afleiding. Het resultaat wordt: s in cs = sd. a-1. √ ( n-1 + N-1 + E)
(6.10)
Hierin is n het aantal paren meetuitkomsten {xi, yi} waaruit de ijklijn werd geconstrueerd, N is het aantal keren dat het monster volledig werd opgewerkt en gemeten ( Ms is de gemiddelde meetuitkomst voor deze N keren), sd en a zijn gedefinieerd als in par. 6.b.2, en E is een excentriciteitsparameter, die des te groter wordt naarmate de meting voor het monster verder uit het zwaartepunt van de ijkpunten ligt (voor SX en X zie formule 6.6b): E is ook gelijk aan:
E = (cs - X)2 / Σ (xi -X)2
(6.11a)
E = (cs - X)2 / { (n−1). S2X }
(6.11b)
Volledigheidshalve vermelden we hier dat voor het (1- α).100 % betrouwbaarheidsinterval van de meetverwachting μs van de concentratie van het monster wordt gevonden: cs - tν,α . sd. a-1. √ ( n-1 + N-1 + E) ≤ μs ≤ cs + tν,α . sd. a-1. √ ( n-1 + N-1 + E)
(6.12)
Hierin is het aantal vrijheidsgraden ν in de t-factor gelijk aan n + N -3. Zie verder par. 9a.
foutenleer- 41 Voorbeeld Zie de ijklijn van het Fe(III) thiocyanaat uit 6.b.2 en appendix 6.1, en de daarvoor berekende waarden voor n, a , b en sd. Voor X werd berekend 0.55 en voor Sx 0.30277 (zie 6.6b). Een monster werd 3 keer opgewerkt. De drie extinctiemeetuitkomsten waren: As = 0.357; 0.361 en 0.362. Dit geeft een gemiddelde As = 0.360. We berekenen m.b.v. (6.9): cs = (0.360 - 0.1350667) / 0.419697 = 0.53599 We krijgen m.b.v. (6.11a) of (6.11b): E = 2.3954. 10-4. Dat levert: s in cs = 0.004031 m.b.v. (6.10) en voor het 95 % betrouwbaarheidsinterval m.b.v. (6.12), met ν = 10+3-3 = 10 en t = 2.228: 0.5270 ≤ cs ≤ 0.5450. Zie ook de computeroutput van POWERFIT in appendix 6.1, en speciaal daarin het gebruik van optie 7 (inverse toepassing). Opgave 6.2 Gebruik de ijklijn voor de Ca2+ bepaling uit opgave 6.1. Voor een monsteroplossing met Ca2+ werd eenmaal een extinctie gemeten: Extinctie = 0.150. Bereken op grond daarvan de concentratie aan Ca2+ in mg / l, en de standaarddeviatie daarvan. Bereken ook het 95 % betrouwbaarheidsinterval voor deze meetverwachting van [Ca2+]. Pas daartoe formule (6.12) toe; doe de berekeningen met EXCEL, en gebruik voor deze opgave voor de tν,α-factor de waarde 2.447. Let op, dit getal hangt van het voorbeeld af! Doe de berekening ook met POWERFIT, en vergelijk.
6.f. Lineariseren Het komt geregeld voor dat de variabelen x en y niet lineair afhankelijk zijn, maar dat wel door een eenvoudige transformatie een lineair verband verkregen kan worden. Voorbeeld Voor een vloeistof wordt de dampdruk P gemeten als functie van de absolute temperatuur T. Als P tegen T wordt uitgezet, dan ontstaat een kromme. Men zou door die kromme uiteraard een polynoom kunnen fitten. Als echter een grafiek wordt gemaakt van ln P tegen 1/T, dan voorspelt de Wet van Clausius-Clapeyron dat dit ten naaste bij een rechte lijn moet worden. Deze transformatie wordt uitgevoerd om de verdampingswarmte ΔHvap te kunnen berekenen uit de helling van de rechte. Deze helling is immers gelijk aan - ΔHvap / R. Ga dit na (zie Uw kolleges Fysische Chemie). Opgave 6.3 Voor di-ethylether zijn in het Handbook de volgende dampdrukken vermeld: t=
-74.3
-48.1
-27.7
-11.5
graden Celcius
p= 1 10 40 100 mm Hg Bepaal m.b.v. lineaire regressie en toepassing van de formule van Clausius-Clapeyron de waarde van ΔHvap en de standaarddeviatie daarin.
Bij het lineariseren moet men er wel in principe rekening mee houden dat ook de standaarddeviaties mee moeten worden gelineariseerd. Men moet, volgens de methoden van het doorwerken van fouten, de standaarddeviaties in de nieuwe variabelen berekenen. Dat kan consequenties hebben voor het gewichtenschema dat men in de kleinste kwadratenberekening moet hanteren. In de praktijk wordt dit meestal, al of niet terecht, over het hoofd gezien! De standaarddeviaties worden daardoor meestal onderschat.
foutenleer- 42
Appendix 6.1: Voorbeeld van een OUTPUT van "POWERFIT".
foutenleer- 43
7. Verdelingsfuncties 7.a. Constructie van een histogram: VOORSCHRIFT: In een histogram worden de meetuitkomsten overzichtelijk gepresenteerd, in de vorm van een kolommendiagram. De meetuitkomsten worden daartoe ingedeeld in klassen. Een klasse omvat alle meetuitkomsten die een waarde hebben die ligt tussen de klassegrenzen. Die metingen worden verder als gelijkwaardig beschouwd; slechts het aantal metingen in een klasse is dan nog van belang. De breedte van een kolom in het diagram is de klassebreedte, het oppervlak van de kolom representeert het aantal meetuitkomsten in de klasse. Men handelt als volgt (enigszins aangepaste voorschrift n.a.v. NEN 1047): 1. Bepaal het aantal meetuitkomsten n (na verwijdering van eventuele uitschieters). Sorteer daartoe de meetuitkomsten eerst in opklimmende volgorde. 2. Bepaal a, het afrondingsinterval. Dat is de macht van 10 waarop de meetuitkomsten zijn afgerond, dus a = 1, 10, 100,... of 0.1, 0.01 ...etc. 3. Bepaal de spreidingsbreedte w (= de “range” = xmax - xmin). 4. Bereken de klassebreedte h = w / √n. 5. Rond h af zodanig dat de breedte van de klasse gemakkelijk te tekenen valt op mm papier. Dat is bij gebruik van een computerprocedure natuurlijk niet nodig. 6. De laagste waarde in een klasse is telkens een veelvoud van h. 7. De hoogste waarde in een klasse is telkens een veelvoud van h, verminderd met a. 8. "Turf" de aantallen meetuitkomsten voor de klassen. Plaats daartoe elke meetuitkomst in zijn klasse. 9. Maak een grafiek, waarin op de horizontale as de klassen staan aangegeven, en op de verticale as de aantallen meetuitkomsten per klasse (dit kan zowel absoluut als relatief zijn). 10. Zet voor elke klasse een oppervlak uit in de vorm van een kolom. De eenheid voor dit oppervlak = 1 meetuitkomst. Het oppervlak wordt gelijk aan het aantal meetuitkomsten in de betreffende klasse bij een absoluut histogram; bij een relatief histogram is het gelijk aan de betreffende fracte van 1. Opgave 7.1a Voor de waarde van de Faraday werden door een groep van 75 studenten de volgende meetuitkomsten verkregen, in C/mol, en gesorteerd in opklimmende volgorde: 89000
89000
89400
89550
89800
90270
90700
90870
91000
91200
91320
92000
92000
92200
92300
92300
92400
92500
93050
93100
93130
93200
93500
93600
94000
94000
94150
94300
94600
94660
95200
95300
95890
95900
95990
96190
96200
96210
96270
96400
96600
96800
97000
97100
97100
97100
97270
97310
97400
97500
97600
97800
97900
98000
98100
98200
98250
98300
98490
98600
98700
98820
98900
99000
99190
99300
99680
99700
100000 100000
100000
100000
102000
103000
103000
foutenleer- 44 Bepaal het gemiddelde en de standaarddeviatie. Er is berekend dat Σx = 7176360 en dat Σx2 = 6.8754180*1011. Teken een histogram van deze meetuitkomsten. Gebruik daarbij bovenstaand voorschrift. Maak ook een histogram door gebruik te maken van de optie “Histogram” van EXCEL. Deze is te vinden onder de Toolsoptie “Data Analysis”, die is te activeren via Add-Ins (het Analysis ToolPak activeren). Uitwerking: Berekend wordt: n = 75; a = 10; w = 14000; h = 1616.58. Met de afgeronde waarde h = 2000 krijgt men 5,6,13,11,18,15,4,3 meetuitkomsten in de klassen. Het volgende histogram wordt verkregen:
1
2
3
4
5
6
7
8
Met afgeronde waarde h = 1500 krijgt men 5,6,7,10,7,14,14,9,0,3 meetuitkomsten in de klassen. Het volgende histogram wordt nu verkregen:
1
2
3
4
5
6
7
8
9
10
Het “mooiste” histogram (zonder lege klassen) wordt hier min of meer toevallig verkregen met h = 2000. We zouden hier toch steeds de voorkeur aan geven omdat een schaalverdeling met als eenheid h = 1500 erg onhandig in het aflezen is. Het doel van een histogram is immers om in één oogopslag een overzicht van de verdeling van de meetuitkomsten over de uitkomstenruimte te krijgen; een handige schaalverdeling is daarbij te prefereren.
foutenleer- 45
EXCEL neemt, als U de klassen (“bin ranges”) niet zelf definieert, voor de waarde van h: 1750, en maakt 9 klassen. Het resultaat ligt dan tussen beide bovenstaande oplossingen in. Opgave 7.1b
Maak het bij bovenstaand voorbeeld behorende histogram met Excel. 7.b. Van histogram naar verdelingsfunctie
In paragraaf 7a hebben we een histogram leren kennen als een manier om de spreiding van de meetuitkomsten weer te geven. Het histogram geeft visueel aan hoe de meetuitkomsten over de uitkomstenruimte verdeeld zijn. Een histogram werd getekend in de vorm van een kolommendiagram. De breedte van een kolom is representatief voor de meetuitkomsten van een klasse: alle metingen waarvan de meetuitkomsten tussen de ondergrens en de bovengrens van de betreffende klasse liggen, behoren ertoe. Bijvoorbeeld in de bovenste figuur van par. 7.a behoren tot klasse nummer 5 alle 18 metingen met een meetuitkomst vanaf 96000 tot en met 97990 C/mol. Het oppervlak van een kolom representeert het relatieve aantal metingen dat tot die klasse behoort. Zo is in het zojuist genoemde voorbeeld het relatieve aantal metingen dat tot klasse nummer 5 behoort gelijk aan 18 / 75 = 0.24. Het oppervlak van kolom 5 is dan ook 24 % van het totale oppervlak van alle kolommen van het histogram. Bij een toenemend aantal metingen zal het histogram kolommen krijgen die steeds smaller worden. Zie de figuur op de volgende pagina. Steeds blijft echter gelden dat voor een bepaalde kolom het relatieve aantal metingen dat in de betreffende klasse valt gelijk is aan het relatieve oppervlak van de betreffende kolom. Als men de middens (van de bovenzijden) van de kolommen met elkaar verbindt, dan ontstaat een gebroken lijn die frequentiepolygoon wordt genoemd. In het limietgeval van oneindig veel metingen constateren we: a. de klassebreedte wordt infinitesimaal klein. b. de frequentiepolygoon gaat steeds meer op een vloeiende kromme lijken. c. het oppervlak van een kolom is nog steeds evenredig met het relatieve aantal metingen van de betreffende klasse.
foutenleer- 46
Als de meetvariabele x wordt genoemd kunnen we formuleren: a. de klassebreedte wordt Δx → 0, en de meetvariabele x wordt continu. b. de frequentiepolygoon gaat over in een functie, voor te stellen als f(x). c. het relatieve aantal metingen in een kolom die van xa loopt tot xa+Δx, dus met een meetuitkomst tussen xa en xa+Δx, is gelijk aan het oppervlak van de kolom, dus gelijk aan f(x).Δx.
foutenleer- 47
Uit het onder c. vermelde volgt dat we het relatieve aantal metingen met een meetuitkomst tussen bijvoorbeeld xa en xb kunnen voorstellen als de som van alle oppervlakken van de kolommen van xa tot xb, en met behulp van de functie f(x) dus als de integraal van xa tot xb over die functie f(x): xb
Relatieve aantal metingen met meetuitkomst tussen xa en xb =
∫ f(x) dx
(7.1)
xa
Vanzelfsprekend moet de som van alle relatieve aantallen metingen 1 zijn, zodat we voor de functie f(x) een zogenaamde normaliseringseis hebben: Relatieve aantal metingen met meetuitkomst tussen ∞ en -∞ =
∞ ∫ f(x) dx = 1 −∞
(7.2)
We zijn er hier even van uitgegaan dat de uitkomstenruimte van -∞ tot +∞ loopt. Men moet de integratiegrenzen in andere gevallen aanpassen aan het domein van de variabele. Een andere eis waaraan de functie f(x) moet voldoen is dat ze steeds positief is, omdat anders de correspondentie met relatieve aantallen metingen niet gelegd kan worden. Uiteraard moet de functie f(x) ook integreerbaar zijn.
De vorm van de functie f(x) zou afgeleid kunnen worden uit experimenten door bijvoorbeeld een polynoom te "fitten" aan het experimenteel bepaalde histogram van veel metingen. Dat is een ongebruikelijke methode. Veeleer maakt men gebruik van allerlei modelfuncties die in de mathematische statistiek gebruikt worden. Die functies bevatten meestal een of enige nader te specificeren parameters die zodanig gekozen kunnen worden dat de functie de experimentele frequentiepolygoon dicht benadert. We zullen in de volgende paragrafen enige van die mathematische kansdichtheidsfuncties f(x) en hun eigenschappen nader bestuderen, namelijk de exponentiële verdeling en de normale of Gauss verdeling.
foutenleer- 48
7.b. Enige Verdelingsfuncties 7.b.1. De exponentiële verdeling
De functie f(x) heeft de volgende gedaante: f(x) = λ. exp (-λx) met λ > 0 en x ≥ 0
(7.3)
De parameter λ, die positief moet zijn, bepaalt in sterke mate hoe steil de functie afloopt Getekend is hieronder, mbv. EXCEL, de functie met λ = 2:
Exponentiële verdeling. f(x)
2 1.5 1
Reeks1
0.5 0 0
2
4
6 x
De exponentiële verdeling komen we veel tegen bij tijdsafhankelijke functies. In de chemie bijvoorbeeld in de reactiekinetiek, in de fysica bijvoorbeeld bij stralingsprocessen. Bewezen kan worden dat de verwachtingswaarde gelijk is aan 1 / λ, en dat de variantie = 1 / λ2. Zie hierover paragraaf 8. Voorbeeld De wachttijd aan een bepaald loket voldoet aan een exponentiële verdeling met parameter λ = 2 minuten-1. Bereken de kans dat U bij het betreffende loket 1.5 minuut of langer moet wachten. Die kans is gelijk aan de integraal van 1.5 tot ∞ over de functie 2.0 exp (-2.0 x). Het resultaat van deze integraal is 0.049787; dus de gevraagde kans is practisch 5%. Via de EXCEL functie EXPONDIST(1.5;2;TRUE) vindt U 0.950213 voor het (cumulatieve) oppervlak tussen 0 en 1.5. Opgave 7.1 Een zwakke radioactieve bron zendt per milliseconde gemiddeld 3.80 pulsen uit. De kansdichtheidsfunctie voor het tijdsverschil Δt tussen de ontvangst van de verschillende pulsen in een scintillatieteller blijkt te zijn:
f(Δt) = 3.80 exp (-3.80 Δt), met Δt in milliseconden.
a. Schets deze functie voor Δt = 0 tot 4; neem stapjes van 0.1, maak gebruik van de MS-EXCEL functie EXPONDIST. b. Bereken de kans dat (= het relatieve aantal metingen waarvoor) er gedurende 1 ms of langer geen pulsen in de teller worden ontvangen. Bereken de gewenste integraal zowel zelf als m.b.v. EXPONDIST.
foutenleer- 49
7.b.2. De normale- of Gauss verdeling
Bij veel soorten metingen komt het voor dat de meetuitkomsten een min of meer klokvormige verdeling vertonen: meetuitkomsten in de buurt van een centrale waarde komen het meest voor; waarden evenveel groter of kleiner dan die centrale waarde komen minder vaak, maar ongeveer even vaak voor; waarden erg veel afwijkend van de centrale waarde komen erg weinig voor:
Deze verdeling blijkt o.a. op te treden als een groot aantal oncontroleerbare factoren op volkomen willekeurige wijze de metingen beïnvloeden. Men kan bijvoorbeeld denken aan temperatuurfluctuaties, trillingen, wrijvingsverschijnselen, stofdeeltjes, luchtbelletjes etc. etc. De mathematische vorm van de functie die de normale verdeling beschrijft is de volgende: f(x) = [σ√(2π)]−1. exp{ -0.5 (x-μ)2 / σ2 }
(7.4)
De twee parameters μ en σ definiëren respectievelijk de plaats van de symmetrie-as en de breedte van de klokvorm: de lijn x = μ is de verticale symmetrie-as en σ is de afstand van de symmetie-as tot het buigpunt. Zie de figuur hierboven, die met de EXCEL functie NORMDIST werd berekend met σ = 1 en μ = 0. We noteren f(x) ook als N(μ,σ2). Opgave 7.2 Teken de normale verdeling met de parameters μ = 1.5; σ = 0.5 en de normale verdeling met de parameters μ = 1.5; σ = 1.00. Bereken daartoe zelf een aantal waarden voor f(x) en zet die uit.
Voor de normale verdeling beschikken we over tabellen die een gedeelte van het oppervlak onder de verdeling geven, gewoonlijk als functie van de excentriciteit z (gedefinieerd als z = (x-μ) / σ). Die tabellen worden gegeven voor de zogenaamde standaardnormale verdeling, dat is de normale verdeling met μ = 0 en σ = 1.
foutenleer- 50
De tabellen geven de waarde voor de verdelingsfunctie F(a), de integraal als functie van de bovengrens a: a
F(a) = ∫ 1/√(2π) . exp (-z2/2 ) dz
(7.5)
-∞
Om van de getabelleerde waarden gebruik te kunnen maken is het nodig om een transformatie naar de standaard normale verdeling uit te voeren: de onafhankelijke variabele x moet naar z worden getransformeerd via z = (x-μ) / σ. Dat betekent dat x over een afstand μ naar z = 0 moet worden getransleerd, en daarna moet nog worden gedeeld door σ. Men kan z zien als het aantal malen σ dat in x gaat, als vanuit het midden x = μ van de verdeling wordt gerekend. Door de transformatie z = (x-μ) / σ gaat de normale verdeling N(μ,σ2) over in de standaardnormale verdeling N(0,1). Voorbeeld 7.5
∫
2 [3√(2π)]−1. exp {-0.5 (x-1.5)2 / (32)} dx
=
1.5
∫
[√(2π)]−1 . exp (-z2/2 ) dz
0
De integraal werd omgezet met behulp van de transformatie z = (x-1.5) / 3, dus dz = dx /3. We zoeken daarom op in de tabel voor z = (7.5 - 1.5) / 3 = 2: F(2) = 0.9772 We zoeken daarom op in de tabel voor z = (1.5 - 1.5) / 3 = 0: F(0) = 0.5000 Zodat de integraal wordt: 0.9772 - 0.5000 = 0.4772. Met behulp van EXCEL is deze integraal gemakkelijk te evalueren: Maak gebruik van het menu Insert, paste function: NORMDIST, als volgt: = NORMDIST( 7.5; 1.5; 3; TRUE) - NORMDIST(1.5; 1.5; 3; TRUE) = (0.97725 - 0.50000) = 0.47725. De functie NORMDIST(a; xg, σ, Boolean) berekent voor het TRUE geval de integraal van - ∞ tot de opgegeven waarde a, voor het geval FALSE de functiewaarde f(a) voor de opgegeven waarde a.
We vermelden nog de waarde van een paar veel toegepaste integralen: μ+σ
∫
f(x) dx = 0.682; 68.2 % van het oppervlak ligt tussen μ − σ en μ + σ
μ−σ μ + 2σ
∫
f(x) dx = 0.954 ; 95.4 % van het oppervlak ligt tussen μ − 2σ en μ + 2σ
μ − 2σ μ +3σ
∫ μ − 3σ
f(x) dx = 0.997; 99.7 % van het oppervlak ligt tussen μ − 3σ en μ + 3σ
foutenleer- 51 Opgave 7.3 Genereer 25000 getallen, random getrokken uit een normale verdeling met μ = 8 en σ = 2. Gebruik daartoe van EXCEL onder de optie Data analysis van het menu Tools de juiste Randomgenerator. a. Controleer de verkregen getallen op uitschieters: sorteer ze daartoe (menu Data, optie Sort) en verwijder eventuele uitschieters. b. Bereken xg en s, m.b.v. AVERAGE en STDEV. Verifieer of het gemiddelde en de standaarddeviatie die aldus berekend worden erg dicht liggen bij de twee parameters van de normale verdeling! c. Tel het aantal getallen dat ligt tussen xg - s en xg + s, en vergelijk dit aantal zowel met de “2/3 vuistregel” van par. 1d als met het theoretisch verwachte aantal voor een normale verdeling (bereken dit laatste mbv. NORMDIST). d. Maak m.b.v. de optie Histogram van Data Analysis een standaard EXCEL histogram van de 25000 getallen, en ga na of dit op een nette normale verdeling lijkt. Opmerking Het is eventueel aardig om deze opgave ook eens te maken met bijvoorbeeld maar 100 random-normaal verdeelde getallen!! Alle uitkomsten moeten dan wat minder “mooi” op de theoretische uitkomsten lijken.
Opgave 7.4 Uit gegevens van het CBS blijkt dat de lengte van Nederlandse vrouwen bij goede benadering normaal verdeeld is, met μ = 168 cm en σ = 6 cm. Bereken: a. Hoeveel % van de Nederlandse vrouwen is langer dan 176 cm? b. Hoeveel % van de Nederlandse vrouwen is kleiner dan 156 cm? c. Hoeveel % van de Nederlandse vrouwen heeft een lengte tussen 158 en 178 cm? Gebruik voor de gewenste integralen zowel de tabel voor de normale verdeling (zie par. 11a) als de functie NORMDIST van EXCEL.
7.b.3. De Student t-verdeling
Voor relatief kleine aantallen meetuitkomsten, bijvoorbeeld minder dan ongeveer 25, moet een andere verdelingsfunctie gebruikt worden, de zogenaamde Student- of t-verdeling, ontdekt door W.S. Gossett in 1908 die onder het pseudoniem "Student" werkte. Meer precies blijkt dat de grootheid (xg -μ) / (s/√n) een t-verdeling heeft, in tegenstelling tot (xg -μ) / (σ/√n) die een standaardnormale verdeling N(0,1) heeft. Het blijkt dat de vorm van deze functie afhankelijk is van een parameter ν die het aantal vrijheidsgraden heet, (ν = hier het aantal metingen -1). De t-verdeling is lager en breder dan de corresponderende normale verdeling, en des te lager en breder naarmate ν kleiner is. Zie onderstaande figuur 7.4
foutenleer- 52
Figuur 7.4 In het limietgeval van n → ∞ gaat de t-verdeling over in de normale verdeling. Ga dit na in de tabellen in par. 11a en 11b. De expliciete gedaante van de functie is erg ingewikkeld (zie boven de corresponderende tabel van par. 11). Gewoonlijk wordt alleen gebruik gemaakt van oppervlakken onder een deel van de curve, namelijk bij het uitvoeren van de t-toets en bij het bepalen van betrouwbaarheids-intervallen. Zie par. 9. Ook m.b.v. EXCEL is de cumulatieve functie te evalueren: TDIST(x; ν; tails). Hierin is x de waarde tot welke de integraal gezocht wordt, ν het aantal vrijheidsgraden en tails geeft aan of men het cumulatieve oppervlak met uitsluiting van 1 of 2 “staarten” wil, in verband met een eenzijdige of een tweezijdige toets. We zien dit in par. 9 nog. Opgave 7.5 Bereken het oppervlak onder de t-verdeling met ν = 10 vrijheidsgraden, dat zich uitstrekt van t = -1.372 tot t = +3.169. Gebruik zowel de tabel 11.b als de functie TDIST van EXCEL. Antwoord: 0.89497.
foutenleer- 53
8. Verwachtingswaarden 8a. Verwachtingswaarden
Voor de kansdichtheidsfunctie f(x) hebben we in paragraaf 7 een drietal eigenschappen gezien: 1. f(x) dx ≥ 0
: de kans op een willekeurige meetuitkomst tussen x en x+dx is altijd ≥ 0
∞ 2. ∫ f(x) dx = 1 -∞
: het totaal van de kansen op alle meetuitkomsten = 1 b
3. P ( a ≤ x < b ) =
∫ f(x) dx a
: de kans op een meetuitkomst die ligt tussen a en b = het oppervlak onder f(x) van a tot b
De kansdichtheidsfunctie stelt ons ook in staat om zogenaamde verwachtingswaarden te berekenen. De verwachtingswaarde E van een functie g(x) wordt als volgt gedefinieerd: ∞ E{g(x)} ≡ < g(x) > ≡ ∫ g(x) . f(x) dx (8.1) -∞ In woorden: de verwachtingswaarde van een functie g(x), met symbool E van "expectation" of < > voor verwachtingswaarde, is de gemiddelde waarde van g(x), gemiddeld over de hele uitkomstenruimte van x. Daarbij wordt dus aan het voorkomen van elke x een "gewicht" of "kans" toegekend ter grootte van f(x) dx. Voorbeeld Voor discrete functies zijn we wel enigszins vertrouwd hiermee, bijvoorbeeld bij het gebruik van dobbelstenen. De kans is hier natuurlijk P(wi) = 1/6 voor wi = 1, 2, 3, 4, 5, 6, en i = 1....6. Voor de verwachtingswaarde van een worp, de “gemiddelde” meetuitkomst of meetverwachting, krijgen we: i=6
< w > = 1. 1/6 + 2. 1/6 + 3. 1/6 + 4. 1/6 + 5. 1/6 + 6. 1/6 = Σ wi . P(wi) = 21/6 = 3.5 i=1
Voor de verwachtingswaarde van het kwadraat van een worp, het gemiddelde van de kwadraten van de worpen, berekenen we op deze wijze analoog: i=6
< w2> = 12. 1/6 + 22. 1/6 + 32. 1/6 + 42. 1/6 + 52. 1/6 + 62. 1/6 = Σ w2i . P(wi) = 91/6 = 15.1666 i=1
We zien hieruit als algemene uitdrukking voor een willekeurige verwachtingswaarde
voor het geval van een discrete kans P(xi): < g(x) > = Σ g(xi) . P(xi) Hierbij moet de som genomen worden over alle mogelijke waarden van xi, de hele uitkomstenruimte.
(8.2)
Analoog gaat in het geval van een continue variabele x de sommatie over alle xi over in de integratie over alle x, en de discrete kans P(xi) gaat over in de continue kans f(x) dx, hetgeen leidt tot formule (8.1). We zullen nu een aantal in de chemie en fysica veel gebruikte bijzondere gevallen behandelen.
foutenleer- 54
8.a.1.
De verwachtingswaarde van x zelf, ook wel meetverwachting of (populatie)gemiddelde genoemd.
Deze wordt gedefinieerd als: E (x) = < x > = ∫ x . f(x) dx Als f(x) de normale verdeling is, dan krijgen we:
(8.3)
∞
E(x) = < x > = ∫ x . (σ√2π)−1. exp (-0.5 (x-μ)2 / σ2) dx
(8.4)
-∞
Uitwerken van deze integraal (probeer dat zelf maar niet!) levert < x > = μ, hetgeen natuurlijk ook zonder enig rekenwerk te zien was, want de gemiddelde waarde over alle mogelijke meetuitkomsten is bij de symmetrische normale verdeling met zijn top op μ natuurlijk gelijk aan μ. Opgave 8.1 Bereken de meetverwachting voor de exponentiële verdeling f(x) = λ exp (- λx), (0< x <∞). Antwoord: 1 / λ.
8.a.2. De (populatie)variantie van x
De variantie van x wordt gedefinieerd als de verwachtingswaarde van het kwadraat van het verschil tussen x en het populatiegemiddelde van x. Het wordt genoteerd als var (x), en geformuleerd als (8.5) var (x) = < (x - <x>)2 > = < x2 > - < x >2 In het geval van de normale verdeling krijgen we: (8.6) var (x) = ∫ (x-<x>)2) . (σ√2π)-1. exp (-0.5 (x-μ)2 / σ2) dx Deze integraal kan weer uitgewerkt worden, en als men bedenkt dat <x> = μ, en ∫ f(x) dx = 1, en dat de integratiegrenzen -∞ en ∞ zijn, dan levert de integraal op: (8.7) var (x) = σ2 2 Bij de normale verdeling is de variantie dus gelijk aan σ , waarbij we kunnen bedenken dat de parameter σ de breedte van de verdeling aangeeft, immers σ is net de afstand tussen de symmetrieas x = μ en een buigpunt. (Ga dit na!). Opgave 8.2 Bereken de variantie voor de exponentiële verdeling. Aanwijzing: splits het kwadraat en bereken de drie integraaltermen afzonderlijk. Antwoord: 1 / λ2. Opgave 8.3 a. Bereken de variantie en de verwachtingswaarde voor de standaard normale verdeling. Antw.: 1 resp. 0. b. Bereken de gemiddelde snelheid en de variantie van de snelheid voor de atomen in een atomair gas dat aan de Maxwell vergelijking voldoet. Zoek deze onderwerpen op in het Fysische Chemieboek van Atkins. Gegeven is dat ∫ x2. exp (-x2) dx = 0.25 √π, dat ∫ x . exp (-x2) dx = 0.5 en dat ∫ exp (-x2) dx = 0.5 √π. (integratiegrenzen 0 en ∞ ). Opgave 8.4 Bereken <x> en var (x) voor een zogenaamde χ2 (=chi-kwadraat) verdeling met ν = 4 resp. 2 vrijheidsgraden. De formule van die verdeling is: Gν (x) = { x-1+ν/2 . e-x/2 } / { 2ν/2 . [(ν-2)/2]! }, hetgeen voor ν = 4 levert: G4(x) = 0.25 x. e-x/2; en voor ν = 2: G2(x) = 0.5 e-x/2 ; met (0 ≤ x < ∞). Teken die verdelingen in een grafiek. Gebruik het grafiekenprogramma van Excel. Gegeven is dat ∫ xn e-ax dx = n! / an+1 als a>0, en n = positief geheel getal (integratiegrenzen 0 en ∞ ). Antwoorden: <x> = ν; var(x) = 2ν.
foutenleer- 55
8.b. Gemiddelde en variantie van populatie of van steekproef
Bij het uitvoeren van een meetprocedure wordt gewoonlijk maar een beperkt aantal metingen verricht. In veel gevallen zijn in principe zelfs oneindig veel metingen mogelijk, zoals bijvoorbeeld in het geval van het wegen van een voorwerp. Maar tijd en kosten vormen gewoonlijk beperkende voorwaarden voor het doen van veel metingen. We volstaan dan ook meestal met het uitvoeren van een steekproef, dat is een beperkt aantal van n metingen. De steekproef is een deelverzameling van de populatie, de verzameling van alle mogelijke metingen. Voorbeeld Van een scheepslading van 5000 ton ijzererts moet het ijzergehalte zorgvuldig geanalyseerd worden. De hele populatie bestaat in dit geval bijvoorbeeld uit 5.1010 mogelijke meetuitkomsten aan monsters van 1 gram. In de praktijk worden er bijvoorbeeld eerst 100 ertsmonsters van 10 kg genomen. Deze worden ieder afzonderlijk gemalen, en van elk van deze 100 gemalen monsters worden 3 analysemonsters van 1 gram genomen, zodat de uiteindelijke meting wordt uitgevoerd met een (toch nog erg grote) steekproef van 300 meetuitkomsten. Uit kostenoogpunt beperkt men de analyse tot 10 van deze monsters, die men random kiest.
Aan een populatie van meetuitkomsten, die altijd uit de volledige verzameling van alle mogelijke meetuitkomsten bestaat, kan gewoonlijk een kansdichtheidfunctie worden toegevoegd. Men maakt een histogram, bepaalt de (relatieve) frequentiepolygoon, en past daar een functie op. Daarbij benadert men de meetverwachting <x> door het experimenteel gevonden steekproefgemiddelde xg, en de populatievariantie var (x) door de steekproefvariantie s2. Het is inderdaad zo dat wanneer de steekproef overgaat in de hele populatie (dus als n aangroeit tot alle mogelijke waarnemingen), de steekproefvariantie overgaat in de populatievariantie, en het steekproefgemiddelde overgaat in het populatiegemiddelde. Voor xg en s gelden dan ook weer als verwachtingswaarden: < xg > = < x > (= μ voor de normale verdeling) (8.8) < s2 > = var (x) ( = σ2 voor de normale verdeling) (8.9) Men zegt dat xg en s2 schatters zijn voor μ en σ2. Voor het steekproefgemiddelde en de steekproefvariantie kan men twee belangrijke eigenschappen afleiden: (8.10) var (xg) = (1/n ) . var (x) ( = σ2 / n voor de normale verdeling) var (s2) = 2σ4 / (n-1) (alleen voor de normale verdeling) (8.11) Wat nauwkeuriger beschouwd blijkt te gelden: Als x normaal verdeeld is met parameters μ en σ, dan heeft xg een normale verdeling met parameters μ en σ/√n. Zie ook fig. 8.1. De variabele (n-1) . s2 / σ2 volgt een zogenaamde χ2 verdeling met als parameter ν = n-1. Hierin is ν het aantal “vrijheidsgraden”. Voor deze laatste verdeling geldt dat de verwachtingswaarde van de variabele = ν en de variantie = 2ν. Zie ook opgave 8.4 hiervoor.
foutenleer- 56 Opgave 8.5a Bewijs eigenschap (8.8). Aanwijzing: Schrijf xg uit als som en bedenk dat <xi> = <x> voor alle xi. Opgave 8.5b Bewijs formule 8.10. Aanwijzing: Schrijf xg uit als som, en bedenk dat var (constante.x) = constante2. var (x), en dat var (xi) = var (x) voor alle xi. Opgave 8.6 Bewijs eigenschap (8.9). Aanwijzing: Schrijf s2 op, werk de kwadraten uit, en bedenk dat (xi-xg)2 = { (xi-μ)-(xg-μ)}2 en dat Σ(xi-μ) = n(xg-μ).
Uit formule 8.11 zien we dat s2 zelf in veel gevallen een erg grote variantie (= spreiding = onnauwkeurigheid) heeft, vanwege de factor σ4, zodat s gewoonlijk maar in 1 decimaal opgegeven hoeft te worden (zoals we in de paragraaf over het afronden (paragraaf 4.b) stelden). Voorbeeld Denk aan een meetserie waarvoor bijvoorbeeld n = 5 en s = 0.050. Veronderstel dat deze metingen een deelverzameling zijn van een populatie met een normale verdeling met σ = 0.055. Dan is s2 = 25*10-4 en var (s2) = 457.5*10-8. Dus de standaarddeviatie in s2 = volgens formule 8.11 = 21.39*10-4, dus van dezelfde orde van grootte als s2 zelf! Dus hoewel s in dit voorbeeld toevallig erg dicht in de buurt van σ ligt, is deze waarde erg onzeker!
Van formule 8.10 wordt gebruik gemaakt bij het schatten van de standaarddeviatie in het gemiddelde, ook als men maar één gemiddelde meet! Er geldt namelijk dat var (xg) = σ2 / n, hetgeen we benaderen door s2 / n. Dit is een betere benadering naarmate n groter wordt. De formule wordt nu geschreven in de vorm: s2 in xg ≈ s2 / n = {Σ (xi - xg)2 } / { n ( n-1 ) }, zodat ook geldt: (zie ook formule 1.6) sg = s in xg ≈ s / √n
(8.12)
Op grond van dit model kan men dus een schatting maken van de standaarddeviatie van het gemiddelde, op grond van slechts één serie metingen leidend tot dit gemiddelde!! Opgave 8.7 Een groep van 8 studenten meet de waarde van de Faraday. De meetuitkomsten zijn: 95750 96620 94780 97290 99510 93260 94280 96200 C/mol. Bepaal de "beste uitkomst" en de "fout" daarin.
N.B. In de dagelijkse spreektaal spreekt men wel van "beste uitkomst". Men bedoelt dan in feite het steekproefgemiddelde. Het woord "fout" is dan synoniem voor standaarddeviatie. Als men het heeft over de fout in de beste uitkomst, dan wordt sg bedoeld. In dit verband komt men slordig taalgebruik overvloedig tegen!!
foutenleer- 57 Opgave 8.8 Uit 1000 analyses van een groot gehomogeniseerd ertsmonster blijkt dat het percentage Fe = 37.41% met een standaarddeviatie van 0.50 % Fe. Beschouw deze uitkomsten als populatiewaarden. Voor 6 steekproeven hieruit, elk van n = 5 metingen, bedroegen de meetuitkomsten, in % Fe: 1.
37.9
37.5
36.3
37.9
37.5
2.
37.1
38.6
37.0
36.6
37.2
3.
37.2
38.2
37.3
37.6
36.6
4.
36.8
37.4
37.9
37.3
38.1
5.
36.9
37.5
38.2
37.9
38.1
6. 37.2 37.7 37.0 36.6 37.0 A. Bepaal voor elk van deze 6 steekproeven de waarde van xg en van s2. B. Bepaal de variantie van deze 6 xg waarden, en bepaal de variantie van de 6 s2 waarden. Vergelijk die uitkomsten met de theoretische waarden hiervoor die verkregen worden m.b.v. de formules 8.10 en 8.11. C. Ga na of voor de gecombineerde steekproef van alle 30 bovenstaande meetuitkomsten de waarden van xg en van s2 inderdaad beter op μ en σ2 lijken, dan die voor de afzonderlijke steekproeven van 5 metingen.
Als de meetuitkomsten van x een normale verdeling vormen met parameters μ en σ2, dan vormen de steekproefgemiddelden met n metingen per steekproef weer een normale verdeling. Nu echter is zoals uit formule 8.10 blijkt de variantie niet meer σ2 , maar σ2 / n. De meetverwachting is wel weer μ. De verdeling van xg is dus veel "smaller" dan die van x: Figuur 8.1
σ / √n
σ
x=µ
x
xg = µ
xg
Let op dat de variabele (xg - μ) / ( s / √n) een tn-1 verdeling heeft; de variabele (xg - μ) / ( σ / √n) heeft een N(0,1) verdeling. Voor de t-verdeling geldt dat <x> = 0 en dat var(x) = 1 + 2 / (ν - 2), waarbij ν > 2 moet zijn.
foutenleer- 58
9. Betrouwbaarheidsinterval, Hypothesen, Toetsen. 9.a.
Betrouwbaarheidsinterval voor een meetverwachting en voor een (populatie)-variantie
Uit de kansverdeling voor het gemiddelde is gemakkelijk het zogenaamde betrouwbaarheidsinterval voor de meetverwachting μ af te leiden. Dat is het interval waarbinnen deze populatieparameter met een zekere waarschijnlijkheid ligt. We stelden in par. 8 dat de variabele (xg - μ) / ( s/√n) een tn-1 verdeling heeft. Dan is de waarschijnlijkheid dat deze variabele een uitkomst tussen bepaalde waarden t- en t+ heeft gelijk te stellen aan (1-α). 100%. Men kan daarbij ofwel de waarde α kiezen, ofwel de waarden t- en t+ kiezen, die gewoonlijk in absolute waarde aan elkaar gelijk genomen worden. Meestal kiest men α, een klein getal, bijvoorbeeld 0.05 of 0.01, terwijl de waarden t- en t+ dan uit de kansverdeling volgen. Het getal α heet de onbetrouwbaarheid, het heeft te maken met de kans die men wil hebben dat een grootheid een bepaalde uitkomst heeft. Voorbeeld In een bepaald geval meet men xg = 8.120, s = 0.162 en n= 11, en men kiest een waarde voor α, bijvoorbeeld 0.05, dus de waarschijnlijkheid (1-α). 100 % is 95 % . Voor n = 11 is het aantal vrijheidsgraden ν =10. Uit de t-tabel (par. 11b) of met behulp van de Excel functie TINV(0.05;10) vindt men dan voor de absolute waarde van ten t+ de waarde 2.228. Men kan dan zeggen dat de uitkomst voor de variabele (xg - μ) / ( s/√n) met een waarschijnlijkheid van 95% tussen - 2.228 en + 2.228 ligt.
Opmerking Men spreekt, bijvoorbeeld in de Excel functie TINV, van een tweezijdige kans (two-tailed), omdat men gebruik maakt van de (hier symmetrische) kansverdeling waarbij men aan beide uiteinden van de grafiek van deze functie de (staart) weglaat. In de figuur van de t-verdeling boven tabel 11b is de eenzijdige kans α = 0.025 aangegeven als het oppervlak van het rechter “staartje” onder de curve. De bijbehorende t+waarde is 2.093 voor ν = 19.
We schrijven dus: met P(α) = (1-α). 100% kans ligt (xg - μ) / ( s/√n) tussen t- en t+ of anders opgeschreven: met P(α) = (1-α). 100% kans is t- ≤ (xg - μ) / ( s/√n) ≤ t+ Dit is om te schrijven als: met P(α) = (1-α). 100% kans is: xg - tν,a . s/√n ≤ μ ≤ xg + tν,a . s/√n
(9.1)
waarin tν,a de absolute waarde is van t- en t+ die dus geldt voor een kans P(α) en ν vrijheidsgraden.
foutenleer- 59
Hiermee is dus een interval gevonden voor de onbekende meetverwachting μ, dat rechtstreeks uit de meetuitkomsten n, xg en s kan worden afgeleid, en dat uiteraard afhankelijk is van de waarschijnlijkheid waarmee men μ wil weten. Voorbeeld: Gemeten werd voor de Faraday: xg = 96400; s = 2000; n = 20. Bereken het 95% betrouwbaarheids-interval voor de meetverwachting μ van de Faraday. Uit n = 20 volgt dus dat ν = 19; voor α = 0.05 (waarschijnlijkheid = 0.95) vinden we m.b.v. TINV(0.05;19) dan t± = 2.0930 en t . s/√n is dus 936.02. Dan is met 95 % kans 95440 ≤ μ ≤ 97360. Dit is het gevraagde betrouwbaarheidsinterval.
Opgave 9.1a Voor het azijnzuurgehalte in azijn wordt door titratie gevonden (in g/100 ml): 3.992
4.012
3.988
4.023
4.020
4.008
4.038
4.025.
Bereken het 95% betrouwbaarheidsinterval voor de meetverwachting μ van het azijnzuurgehalte. Antw.: 3.996 ≤ μ ≤ 4.029; t = 2.4469. Opgave 9.1b Voor de meting van het equivalent geleidingsvermogen van azijnzuur vonden 9 studenten de volgende uitkomsten (in Ω-1 mol-1 cm2):
395.6
397.0
389.3
392.6
398.7
402.3
386.7
393.0
399.0.
Als deze uitkomsten worden beschouwd als een steekproef uit een populatie met een normale verdeling, bereken dan het interval waarin het populatiegemiddelde μ met een waarschijnlijkheid van 99% ligt.
In par. 6.g werd reeds het betrouwbaarheidsinterval vermeld voor de meetverwachting van een resultaat voor een monster dat met behulp van een lineaire ijklijn wordt verkregen (formule 6.12). De formule lijkt qua structuur erg op (9.1): cs - tν,α . sd. a-1. √ ( n-1 + N-1 + E) ≤ μs ≤ cs + tν,α . sd. a-1. √ ( n-1 + N-1 + E)
(6.12)
Opgave 9.1c Maak van opgave 6.2 het tweede deel betreffende het 95 % betrouwbaarheidsinterval. Voor de populatievariantie σ2 wordt het (1-α) * 100 % betrouwbaarheidsinterval uit de χ2- verdeling als volgt berekend: ν s2 / χ2ν,α/2 ≤ σ2 ≤ ν s2 / χ2ν, 1−α/2
(9.2)
Merk op dat dit geen symmetrisch interval is, want de χ2- verdeling is niet symmetrisch. Men neemt wel steeds links en rechts α/2 voor de waarschijnlijkheid. Opgave 9.1d De meetgegevens zijn dezelfde als in opgave 9.1b, maar bepaal nu ook het 99% betrouwbaarheidsinterval zowel voor de variantie als voor de standaarddeviatie van het azijnzuurgehalte. Gebruik de Excel functie CHIINV. Let op dat die “one tailed” is.
foutenleer- 60
9.b.Hypothesen
De statistiek stelt ons onder andere in staat om waarschijnlijkheidsuitspraken te doen over populaties, bijvoorbeeld: De waarschijnlijkheid dat een bepaalde student voor een zekere concentratiemeting een uitkomst lager dan 0.0900 mol/l vindt is 25%.
Een ander soort statistische uitspraak is het aangeven van een betrouwbaarheidsinterval. Een voorbeeld hiervan: De kans dat, op grond van deze steekproef van 5 metingen, de verwachtingswaarde van de concentratie aan waterstofchloride van deze oplossing ligt tussen 0.0800 M en 0.0900 M is 95%.
Bovengenoemde soorten waarschijnlijkheidsuitspraken behoren tot het domein van de zogenaamde statistische hypothesen, en het onderzoek naar de geldigheid van dit soort waarschijnlijkheidsuitspraken heet het toetsen van hypothesen. Het doel van het toetsen van hypothesen is: het maken van een keuze tussen twee onderling tegenstrijdige uitspraken over de waarde van een populatie-parameter. De twee conflicterende hypothesen in een statistische toets worden de nulhypothese (Ho) en de alternatieve hypothese (Ha of H1) genoemd. Ze sluiten elkaar uit, en vullen elkaar aan. Voorbeelden: In een onderzoek wordt getoetst of een groep mensen gemiddeld langer is dan 1.75 m: Ho : μ > 1.75 m (nulhypothese) Ha : μ ≤ 1.75 m (alternatieve hypothese) In een onderzoek wordt getoetst of de gemiddelde uitkomsten van twee meetpopulaties van elkaar verschillen: Ho : μ1 - μ2 = 0 (nulhypothese) Ha : μ1 - μ2 ≠ 0 (alternatieve hypothese).
Men spreekt van een éénzijdige toets als de alternatieve hypothese aangeeft dat de waarde van de te toetsen grootheid boven òf onder de aangegeven waarde ligt. Voorbeeld Ho : μ = 100 (nulhypothese) Ha : μ < 100 (alternatieve hypothese, eenzijdig)
In het geval de alternatieve hypothese betrekking heeft op waarden die zowel boven als onder de door Ho aangegeven waarde liggen spreken we van een tweezijdige toets: Voorbeeld Ho : μ = 100 (nulhypothese) Ha : μ ≠ 100 (alternatieve hypothese, tweezijdig)
foutenleer- 61
Een statistische toets kan uit de aard der zaak nooit volledige zekerheid omtrent een hypothese geven. Ze kan slechts aangeven met welke waarschijnlijkheid de nulhypothese waar en de alternatieve hypothese onwaar is. De waarschijnlijkheid dat de nulhypothese waar is, wordt meestal aangegeven met de waarde 1-α (betrouwbaarheidsniveau, confidence level). Bijvoorbeeld is 1-α = 0.95. De waarschijnlijkheid van het ten onrechte verwerpen van Ho is dan α, bijvoorbeeld 0.05. De grootheid α wordt de onbetrouwbaarheid genoemd. Het volgende schema kan men hierover opstellen : Ho is waar
Ha is waar
_________________________________________________________________________ Ho wordt geaccepteerd
juiste beslissing kans = 1-α
onjuiste beslissing kans = β (fout van de 2e soort) __________________________________________________________________________ Ho wordt verworpen
onjuiste beslissing juiste beslissing kans = α kans = 1-β e (fout van de 1 soort) __________________________________________________________________________ We zullen in het bestek van deze inleiding in de foutenleer en de statistiek niet ingaan op de merites en de waarde van β, die optreden bij het waar zijn van de alternatieve hypothese. Zie Lit. 10.a.5,7. Bij het toetsen van hypothesen wordt in het algemeen de volgende standaardprocedure gehanteerd: 1. Formuleer de nulhypothese Ho en accepteer Ho als waar 2. Zoek een geschikte statistische toetsvariabele en zijn verdelingsfunktie 3. Stel de grootte van de onbetrouwbaarheid α vast 4. Bepaal het acceptatiegebied voor de toetsvariabele als de nulhypothese geldt 5. Bepaal de actuele waarde van de toetsvariabele, en vergelijk met 4. 6. Neem de statistische beslissing: accepteer of verwerp Ho definitief. In de volgende paragrafen zullen we enige voorbeelden van zulke toetsen behandelen. Het eerste voorbeeld zullen we zeer uitvoerig aan de hand van de net geformuleerde 6 stappen uitwerken. De volgende voorbeelden geven we beknopt weer.
foutenleer- 62
9.c. De u-toets voor één populatiegemiddelde (σ bekend)
Doel van deze toets is: Onderzoek naar het significant zijn van het verschil tussen een onbekend populatiegemiddelde μ (waarvoor door meting een steekproefgemiddelde xg beschikbaar is), en een referentiewaarde μo, voor het geval dat de populatievariantie σ2 bekend is. Voorbeeld Een docent onderzoekt of de gemiddelde uitkomst van de meting van het getal van Avogadro door de studenten van zijn practicum afwijkt van een geaccepteerde literatuurwaarde, die 6.023 * 1023 deeltjes per mol bedraagt. Bekend was reeds (uit jarenlange ervaring) dat de resultaten van dit soort studentmetingen een normale verdeling vormen met populatievariantie σ2 = (0.250 * 1023)2. De docent neemt uit de uitkomsten een steekproef van n = 25 studentmetingen, en vindt dat xg = 6.162 * 1023. Wat kan hij concluderen over al of niet significant afwijken van de literatuurwaarde?
We passen de 6 punten uit het voorschrift toe: 1. Formuleer de nulhypothese Ho , accepteer Ho
Het gaat om de waarde van het populatiegemiddelde μ: Ho : μ = 6.023 * 1023 Voor het vervolg van de procedure accepteren we voorlopig Ho, d.w.z. we stellen μ = μo = 6.023 * 1023 2. Zoek een geschikte statische toetsvariabele en zijn verdelingsfunctie. Voor een steekproefgemiddelde xg hebben we gezien dat dit normaal verdeeld is, met variantie σ2/n, en
met populatiegemiddelde μ. De statistische variabele u = (xg - μ) / (σ / √ n) is standaard-normaal verdeeld (par. 8), dus N(0;1). Als xg uit de steekproef ongeveer gelijk aan 6.023 * 1023 is, zal u ongeveer nul zijn, en zullen we geneigd zijn Ho te accepteren. Is xg echter niet in de buurt van 6.023 * 1023, dan zal u een grote waarde hebben (positief of negatief) en moeten we Ho verwerpen. In schema: verwerp Ho
accepteer Ho
verwerp Ho
grote negatieve u
u dichtbij nul
grote positieve u
Het probleem is om het zogenaamde acceptatiegebied van Ho te bepalen. Dat acceptatiegebied wordt afgebakend door grenswaarden of kritieke waarden van u, dat wil zeggen waarden u+ en u- waarvoor Ho nog net wel / net niet meer geaccepteerd kan worden.
foutenleer- 63
3. Bepaal de onbetrouwbaarheid α. De kritieke waarden u+ en u- hangen samen met de kans α die men bereid is te lopen op een fout van de eerste soort (het ten onrechte verwerpen van een ware Ho). Er geldt: Hoe groter deze waarde α, hoe kleiner het acceptatiegebied van Ho, of ook: Hoe groter deze waarde α, hoe eerder Ho verworpen wordt. (Zie ook figuur 9.1).
Als men α < 0.01 kiest, heeft men een lage kans op een fout van de eerste soort, en is het acceptatiegebied van Hο dus groot. De kans op verwerping van Ho wordt daarmee dan klein, maar de toets werkt dan niet erg discriminerend meer. (We zien dat meer bij onzekere verschijnselen: een voorspelling zekerder maken betekent dat de uitspraak vager wordt, vergelijk het weer van overmorgen). Gewoonlijk kiest men α = 0.05 of α = 0.01 (tweezijdig), of α = 0.025 of α = 0.005 (éénzijdig). 4. Bepaal het acceptatiegebied voor de toetsvariabele als de nulhypothese geldt. Kent men de verdelingsfunctie voor de variabele u en heeft men een waarde voor α gekozen, dan kan
men het acceptatiegebied bepalen, d.w.z. het gebied van de variabele u waarvoor de nulhypothese geaccepteerd kan worden. M.b.v. de verdelingsfunctie van u vinden we als α = 0.025 (eenzijdig) m.b.v. de tabel van de normale verdeling (par. 11): F(u) = 0.9750 → u+ = 1.96, en via de symmetrie u- = -1.96 (alternatief: via de EXCEL functie NORMINV(0.025; 0; 1) wordt gevonden: u- = -1.95996 en NORMINV(0.975; 0; 1) levert u+ = 1.95996. In figuur gebracht: Figuur 9.1:
Uit de grenswaarden u- = -1.96 en u+ = 1.96 berekenen we, bedenkend dat u = (xg - μ) / (σ / √ n) en μ = μo, gebruik makend van de in het voorbeeld gegeven getalwaarden van μ = μo, n en σ voor de grenswaarden van xg: 5.925 * 1023 resp. 6.121 * 1023 (ga dit na!).
foutenleer- 64
5. Bepaal de actuele waarde van de toetsvariabele. Voor de steekproefuitkomst xg berekenen we (bedenk dat μ = μo onder geldigheid van Ho) dat uact = (xg - μο) / (σ / √ n) => (6.162 * 1023 - 6.023 * 1023) / (0.25 * 1023 / √25) = 2.78 6. Neem de statistische beslissing. De zojuist uit de metingen berekende waarde van uact ligt niet in het acceptatiegebied van Ho dat
correspondeert met een u die van -1.96 tot +1.96 loopt. Dus onze acceptatie van Ho was onjuist! Concluderend: In ons voorbeeld geldt dat het gemiddelde van 6.162 * 1023 voor de 25 studenten zo hoog is t.o.v. de literatuurwaarde van 6.023 * 1023, dat de veronderstelling dat de gemeten waarde niet significant
afwijkt van deze literatuurwaarde verworpen dient te worden, m.a.w. de gemeten waarde wijkt teveel af. Maar we lopen toch een zekere (kleine) kans dat dit verwerpen ten onrechte gebeurt! Opmerking: Die kleine kans is te berekenen als 0.27% (via NORMDIST(2.78; 0; 1; true) = 0.9973). Dit komt overeen met de waarde van (1-α) waarvoor uact = 2.78 net gelijk is aan de bijbehorende grenswaarde u+.
Opgave 9.2. Lange ervaring leerde dat bij een zilveranalyse aan een grote partij munten de uitkomst van regelmatig uitgevoerde steekproeven gemiddeld 73.5% Ag bedroeg, en een standaarddeviatie van 0.6% Ag had. Na een wijziging in de productiemethode wordt één nieuwe steekproef van 20 analyses genomen, waarvan de gemiddelde uitkomst 73.2% Ag bedraagt. Indien men mag aannemen dat door de wijziging in de productiemethode de populatie-standaarddeviatie niet is veranderd, mag dan worden aangenomen dat het gehalte aan zilver van de net geanalyseerde partij afwijkt van de normwaarde 73.5 %, dus dat de productiemethode gewijzigd is, of niet? Toets dit m.b.t. een onbetrouwbaarheid α van resp. 0.5% en 2.5%, beide eenzijdig.
foutenleer- 65
9.d. De t-toets voor één populatiegemiddelde (σ onbekend, s bekend)
Doel van deze toets: Onderzoek naar het significant zijn van het verschil tussen een onbekend populatiegemiddelde μ (waarvoor door meting een steekproefgemiddelde xg beschikbaar) is, en een referentiewaarde μo, voor het geval dat de populatievariantie σ2 onbekend is, maar wel een waarde voor s2 gemeten is.
Het verschil met de u-toets uit par. 9.c is dat nu σ2 onbekend is, maar dat wel s2 uit een steekproef bekend is. Dat is bij metingen de normale situatie! We volgen weer de 6 stappen van de toetsprocedure, en geven die nu wat korter weer: 1. Ho : μ = μo. Accepteer Ho 2. We berekenen eerst voor de steekproef van n elementen de waarden voor het steekproefgemiddelde xg en de steekproefvariantie s2. De toetsvariabele wordt nu t = ( xg - μ) / (s / √n). Deze volgt niet de standaardnormale verdeling, doch de Student t-verdeling, met als parameter ν = n-1 “vrijheidsgraden”. (par. 7.2.d). 3. De waarde van α wordt vastgesteld. Deze volgt uit de probleemstelling. Vaak zal α = 0.05 zijn. 4. Het acceptatiegebied voor t volgt uit een t-tabel (par. 11). We zoeken t+ op voor ν = n-1 "vrijheidsgraden" en onbetrouwbaarheid α via F(t) = 1-α of F(t) = 1- α/2 al naar gelang de toets één- of tweezijdig is. Alternatief gebruiken we de EXCEL functie TINV( α; ν). Let op dat hiervoor in Excel de α altijd tweezijdig moet worden opgegeven! 5. Uit de steekproefuitkomsten berekenen we de actuele waarde tact onder Ho: tact = ( xg - μo) / ( s/√n) 6. Als |tact| > t+ dan wordt Ho verworpen. Voorbeeld: Voor een bekende populatie van analyseresultaten van de Faraday geldt dat het populatiegemiddelde μ = 96487 C/mol. De variantie hiervan is onbekend. Een groep van studenten doet 20 metingen van de Faraday op dezelfde meetwijze als voor de populatie hierboven bedoeld, en verkrijgt een gemiddelde van 95500 C/mol, en een standaarddeviatie van 2000 C/mol. Wijkt het gemiddelde van deze groep significant af van het populatiegemiddelde of niet? Toets dit éénzijdig op de 0.5% en 2.5% nivo's.
foutenleer- 66 Uitwerking 1. Ho : μ = μo = 96487 Accepteer Ho. 2. Toetsvariabele = t voor n = 20 waarnemingen 3. α1 = 0.005 eenzijdig en α2 = 0.025 eenzijdig 4. t+,1 = 2.861 (voor ν = n-1 = 19, en 1-α = 0.995 eenz.) en t+,2 = 2.093 (voor ν = n-1 = 19, en 1-α = 0.975 eenz.), uit de ttabel van par. 11. Mbv. Excel: TINV(0.01;19) = 2.8609 (let op: de functie TINV vereist de “probability” als tweezijdig opgegeven!!) Mbv. Excel: TINV(0.05;19) = 2.0930. 5. tact = (95500 - 96487) / (2000/√20) = −2.207 6. Voor het 2.5 % nivo: |tact| > t+ want 2.207 > 2.093, dus acceptatie van Ho was niet juist; er is een significante afwijking tussen de studentmeetuitkomsten en het populatiegemiddelde. Voor het 0.5 % nivo: |tact| < t+ want 2.207 < 2.861, dus acceptatie van Ho was juist; er is geen significante afwijking tussen de studentmeetuitkomsten en het populatiegemiddelde. Dit antwoord is in overeenstemming met de constatering dat bij grotere α de nulhypothese eerder verworpen wordt, omdat het acceptatiegebied dan kleiner is.
Opgave 9.3a Een door een ijkinstituut gecertificeerd zilver- standaardmonster bevat 99.5% Ag. Een nieuwe analysemethode wordt gecontroleerd, aan de hand van de meetuitkomsten behaald voor kleine hoeveelheden van dit referentiemonster. Een steekproef van 20 analyses levert een gemiddelde uitkomst van xg = 99.2% Ag, met een standaarddeviatie s van 0.5% Ag. Mag op grond van deze meetuitkomsten worden aangenomen dat het gehalte aan zilver behaald met de nieuwe analysemethode significant afwijkt van de normwaarde 99.5 %? Toets dit m.b.t. een onbetrouwbaarheid α zowel van 0.5% als van 2.5%, beide eenzijdig.
Opgave 9.3b Het “normale” gehalte van stof X in bloed van kinderen is 5.0 mg / l. Van een bepaalde groep kinderen wordt vermoed dat door een gemeenschappelijke oorzaak hun gehalte aan X te laag is. Er worden bloedmonsters genomen, en bij de analyse daarvan worden de volgende meetuitkomsten gevonden (opklimmend gesorteerd): 4.0 4.1 4.2 4.4 4.4 4.5 4.5 4.7 4.8 4.9 4.9 4.9 5.0 5.2 5.2 mg / l. Geven deze 15 analyseresultaten steun aan het vermoeden van het te lage X-gehalte? Toets met α (eenzijdig) van 0.025.
Als algemene conclusies kunnen we uit deze voorbeelden nog afleiden: - T.g.v. de onbekendheid van σ (waarvoor we slechts een schatting in de vorm van s kennen) wordt het acceptatiegebied van Ho groter: de Ho mag minder gauw verworpen worden bij de t-toets dan bij de u-toets. Dat komt tot uiting in het feit dat de kritieke t+ of t- waarden (absoluut) groter zijn dan de corresponderende u+ of u- waarden. - We zien ook dat voor kleinere α het acceptatiegebied van Ho altijd groter wordt, immers we willen dan een grotere “zekerheid” 1-α eer we Ho verwerpen.
foutenleer- 67
9.e. De t-toets voor 2 populatiegemiddelden (σ's onbekend, s-waarden bekend)
Doel van deze toets (versie 1, homoscedastic): Onderzoek naar het significant zijn van het verschil tussen twee populatiegemiddelden μA en μB, op grond van twee steekproefuitkomsten, als de populatiestandaarddeviaties σA en σB onbekend maar wel gelijk zijn.
We volgen weer de algemene procedure. 1. Ho : μA - μB = 0. Accepteer Ho. 2. De toetsvariabele is t = [(xgA - xgB) - (μA - μB)] / [ S / √ Q]. Hierin is S gelijk aan √{ (nA - 1) s2A + (nB - 1) s2B) / (nA + nB - 2) } en Q is gelijk aan {nΑnΒ / (nΑ + nΒ)}. De xgA en s2A zijn het gebruikelijke steekproefgemiddelde en de steekproefvariantie voor de nA waarnemingen. Evenzo voor B. De variabele t is verdeeld volgens een t-verdeling met ν = νA + νB = nA + nB - 2 vrijheidsgraden. 3. De onbetrouwbaarheid α is tweezijdig, bijvoorbeeld α = 0.05. 4. Het kritieke gebied voor de t-variabele ligt tussen de waarden t- en t+ die in een t-tabel worden opgezocht voor de betreffende ν en α (par. 11), of via Excel met TINV(α; ν). 5. De actuele waarde voor t onder de hypothese H0, is tact = (xgA - xgB) / [S / √Q]. 6. Als |tact| > t+ dan wordt H0 verworpen. Voorbeeld Van twee voorraden oplossing worden de titers bepaald. Gevonden worden: A:
0.131
0.134
0.129
0.126
0.132
0.135
0.138
0.134
0.130
0.129
0.132 en 0.131 mol / l.
B:
0.126
0.124
0.128
0.129
0.130
0.129
0.132
0.126
0.131
0.129
0.132 en 0.128 mol / l.
Ga na of op grond van deze steekproeven geconcludeerd mag worden dat de titers van A en B verschillen, als aangenomen mag worden dat de standaarddeviaties van beide populaties (σA en σB) gelijk zijn. Test met α = 5% (tweezijdig).
Uitwerking Ho : μA = μB We rekenen uit:
nA = 12; nB = 12; xgA = 0.13175; sA = 0.003194455; xgB = 0.12867; sB = 0.002461830; De waarden voor σA en σB verschillen niet significant (dat volgt uit een F-toets : Fact = 1.7 < F+ = 2.9, zie later, in par. 9.g). (nA -1)s2A = 1.1225 * 10-4; S = 2.851767 * 10-3;
Q = 6;
(nB -1)s2B = 6.6667 * 10-5 ; xgA - xgB = 0.0030833; ν = 12 + 12 - 2 = 22;
Dus is de tact = 2.6484; We zoeken op t+ (ν = 22, α = 0.05) = 2.074 (Excel: TINV(0.05;22) geeft 2.073875) → het acceptatiegebied is dus : 2.074 < t < 2.074. De actuele t ligt daarbuiten. De nulhypothese (μA = μB) wordt met α = 0.05 verworpen. Er is reden om aan te nemen dat de twee titers verschillen.
De hele toets kan men met Excel ook ineens doen, als volgt: =TINV(TTEST(a1:a12; b1:b12; 2; 2); 22)<TINV(0.05; 22). Het resultaat is ‘ false’.
foutenleer- 68 Opgave 9.4 Van twee analysemonsters wordt het loodgehalte bepaald door titratie met EDTA. Men vindt: Monster A: 60.34 60.66 60.52 60.40 60.72 60.52 % Pb Monster B: 60.28 60.48 60.26 60.42 60.20 60.16 60.30 % Pb. Ga na of de monsters A en B dezelfde meetverwachting voor het loodgehalte kunnen hebben. Toets met α = 0.02, tweezijdig.
Opmerking Als men eraan twijfelt of de twee onbekende populatievarianties gelijk zijn dan moet men dit natuurlijk
eerst toetsen, m.b.v. de F-toets voor 2 varianties (zie par. 9.g). Indien uit die toets volgt dat de twee populatievarianties inderdaad significant verschillen, dan moet men een iets gemodificeerde vorm van voorgaande toets uitvoeren: Doel van deze toets (versie 2, heteroscedastic): Onderzoek naar het significant zijn van het verschil tussen twee populatiegemiddelden μA en μB, op grond van twee steekproefuitkomsten, als de populatiestandaarddeviaties σA en σB onbekend en ongelijk zijn
De toetsvariabele wordt nu: t = [(xgA - xgB) - (μA - μB)] / R, waarin R = √{s2A / nA + s2B / nB}. Deze variabele t volgt weer een t-verdeling. Het aantal vrijheidsgraden daarvoor is gelijk aan: ν = -2 + (A + B)2 / {A2 / (nA+1) + B2 / (nB+1)}, afgerond naar het dichtstbijzijnde gehele getal. Hierin zijn A en B de volgende afkortingen: A = s2A / nA en B = s2B / nB. Opgave 9.5 Van twee analysemonsters wordt het ijzergehalte bepaald. Men vindt: A:
0.131
0.134
0.129
0.126
0.132
0.135
mol / l.
B:
0.115
0.119
0.124
0.130
0.133
0.135
mol / l.
Ga na of de gehalten van A en B significant kunnen verschillen, met een onbetrouwbaarheid van 5 % (tweezijdig). N.B. In Excel moet nu bij gebruik van de functie TTEST versie 3 gebruikt worden: TTEST(array 1; array2; 2; 3). Daarna TINV(resultaat TTEST;ν) < TINV(α;ν). Deze functies van Excel geven een klein beetje andere uitkomsten dan onze bovenstaande formules! (Oorzaak: ν anders?). De door ons gebruikte formules zijn o.a. ook te vinden in, en gelijk aan de daarin genoemde: J.C. Miller, J.N. Miller: Statistics for Analytical Chemistry. Ellis Horwood, Chichester, 3e Ed. 1993, formules (3.4) en (3.5), pag. 57.
foutenleer- 69
9.f.
χ2−toets
voor één populatievariantie
Doel : Onderzoek naar het significant zijn van het verschil tussen een onbekende populatievariantie σ2, waarvoor een steekproefvariantie s2 gemeten is, en een referentiewaarde σ2o voor deze variantie.
De algemene procedure weer volgend krijgen we: 1. Ho: σ2 = σ2ο en Ha : σ2 ≠ σ2o Accepteer Ho. 2. χ2 = ν s2 / σ2 met ν = n-1, is de toetsvariabele. Deze variabele heeft een zogenaamde χ2 verdeling met ν = n-1 vrijheidsgraden. 3. Voor de onbetrouwbaarheid α neemt men gewoonlijk links α/2 en rechts α/2, hoewel de verdeling niet symmetrisch is. 4. Uit een tabel voor "cumulatieve Chi-Square" waarden volgen de linker- en rechter grenswaarden χ2+ en χ2-, voor de onbetrouwbaarheid α . Men neemt gewoonlijk links F(χ2) = α/2 en rechts F(χ2) = 1 - α/2 (par. 11). Met Excel kan CHINV gebruikt worden. 5. Uit de steekproef volgt χ2act = (n-1). s2 / σ2o 6. Als χ2act niet tussen de grenswaarden ligt,wordt Ho verworpen. Voorbeeld Men wil toetsen of de standaarddeviatie van een zekere populatie gelijk is aan 0.50. Men kiest voor de toets een onbetrouwbaarheid α van 0.025 eenzijdig. Het populatiegemiddelde μ is onbekend. Men neemt een steekproef van 5 waarnemingen, en vindt: 5.36 5.78 5.67 5.81 5.52 g. Uitwerking: n = 5 → ν = 4;
s = 0.188; De waarde van xg is niet van belang. Ho : σ2 = σ2o (= 0.502)
Grenswaarden : χ2- = 0.484 (uit tabel voor F(χ2) = 0.025) en χ2+ = 11.14 (uit tabel voor F(χ2) = 1 - 0.025) Met Excel wordt gevonden: CHIINV(0.975; 4) = 0.484419 en CHIINV(0.025; 4) = 11.14326. (Excel bevat geen Chikwadraattoets voor varianties). χ2act = 4 * 0.1882 / 0.502 = 0.5655 De waarde van χ2act ligt tussen de grenswaarden, dus in het acceptatiegebied van Ho. Op grond van deze steekproefuitkomst kan de veronderstelling dat de standaarddeviatie 0.50 is niet verworpen worden.
Commentaar: Dit ondanks het relatief grote verschil tussen s (= 0.188) en σo (= 0.50)! De oorzaak daarvan ligt in het feit dat een steekproefstandaarddeviate zelf ook weer een relatief zeer grote standaarddeviatie heeft bij een klein aantal waarnemingen. Zie paragraaf 8b, verg. 8.11 daarover.
Opgave 9.6 Gegeven is een achttal meetuitkomsten van de pH van een oplossing, verkregen met 8 verschillende pH electroden van één soort: 4.01 4.08 4.12 3.98 4.08 3.92 4.02 4.11. Toets de bewering van de fabrikant dat de standaarddeviatie voor meting met dit soort elektrode = 0.05, met α = 0.025 eenz.
foutenleer- 70
9.g. De F-toets voor twee populatievarianties
Doel: Onderzoek naar het significant zijn van het verschil tussen twee populatievarianties σ2A en σ2B, op grond van twee steekproefvarianties s2A en s2B. De twee populaties hoeven niet hetzelfde gemiddelde te hebben.
1. Ho: σ2A = σ2B en Ha: σ2A ≠ σ2B Accepteer Ho. 2. De toetsvariabele F = s2A / s2B volgt een F-verdeling met νA = nA-1 en νB = nB-1 vrijheidsgraden 3. 4. 5. 6.
(Let op : F is altijd > 1, zonodig verwisselt men daartoe A en B). Men kiest altijd een eenzijdige onbetrouwbaarheid α, gewoonlijk 0.05. De grenswaarde F+ volgt uit een F-tabel (met onbetrouwbaarheid α) (zie par.11): α,νA,νB → F+ Uit de steekproef volgt Fact = s2A / s2B waarbij men dient te nemen s2A > s2B zodat Fact > 1 Als Fact > F+ wordt Ho verworpen.
Voorbeeld De vraag rijst of twee analysemethoden A en B even nauwkeurig zijn (d.w.z. gelijke standaarddeviaties opleveren bij gelijke aantallen waarnemingen). Men analyseert daartoe 15 monsters. Met methode A vindt men: xgA = 0.108 mol / l;
sA = 0.50 mol / l;
nA = 9
Met methode B vindt men: xgB = 0.120 mol / l;
sB = 0.30 mol / l;
nB = 6
Toets met onbetrouwbaarheid α = 0.05. Uitwerking : Ho : σ2A = σ2B νA = 8 ; ν B = 5 Grenswaarde van F voor ( 0.05, 8, 5) : F+ = 4.82 (zie F-tabel). Met behulp van Excel, eenzijdig opgeven!: FINV(0.05; 8; 5) = 4.818332. Fact = 0.502 / 0.302 = 2.778 Fact < F+ dus Ho kan niet verworpen worden. Op grond van de steekproefuitkomsten mag niet geconcludeerd worden dat methode B nauwkeuriger is dan methode A
Opmerking : Bij deze toets blijkt heel erg hoe noodzakelijk het is om zeer veel waarnemingen te hebben alvorens Ho verworpen mag worden. Ga na dat er hier, onder de conditie nA = nB, ongeveer nA = nB = 13 waarnemingen voor elke methode nodig zijn om te concluderen dat er wel een significant verschil is (als s2A en s2B overigens niet veranderen).
Opgave 9.7 Bij meting van de massa van een bepaald voorwerp vindt men met balans A: 10.0450 10.0452 10.0453 10.0451 10.0448 10.0450 g. Met balans B meet men: 10.0443 10.0446 10.0451 10.0450 10.0445 10.0453 g. Kan men op grond van deze meetuitkomsten met 95 % waarschijnlijkheid concluderen dat balans A nauwkeuriger is? Men kan m.b.v. Excel gebruik maken van: is FINV (FTEST(array1;array2) / 2; νA, νB) < FINV(α; νA, νB)?
foutenleer- 71
9.h. De toets van Dixon voor uitschieters (Q-toets)
Doel : Onderzoek naar het significant zijn van het verschil tussen één verdachte extreme waarde ("uitschieter") en de overige waarden van een steekproef, als het aantal metingen n ≥ 3 en n ≤ 25. Voorschrift: a. Ho: de verdachte meetuitkomst behoort wel tot de populatie
b. Rangschik de n meetuitkomsten volgens opklimmende of dalende waarden, met de verdachte waarde voorop: x1 ...xn c. Kies een waarde voor de onbetrouwbaarheid α, d.w.z. de kans dat een tot de populatie behorende meetuitkomst ten onrechte wordt verworpen. Bijvoorbeeld α = 0.05. d. Als 3 ≤ n ≤ 7 bereken dan Qn = (x2-x1) / (xn-x1) = “gap” / “range”. Als 8 ≤ n ≤ 10 bereken dan Qn = (x2-x1) / (xn-1-x1) Als 11 ≤ n ≤ 13 bereken dan Qn = (x3-x1) / (xn-1-x1) Als 14 ≤ n ≤ 25 bereken dan Qn = (x3-x1) / (xn-2-x1) e. Zoek in de Q-tabel de kritieke waarde Qk op voor de gewenste n en α (zie par. 11e). Als de actuele waarde Qn berekend onder d. groter is dan de kritieke waarde gevonden onder e. dan moet Ho verworpen worden, en hebben we te maken met een uitschieter. Voorbeeld Ga na of er een of meer uitschieters zitten bij de volgende 4 meetuitkomsten: 177 326 161 176. Toets met α = 0.05. Uitwerking Verdacht is de tweede meetuitkomst, 326. De meetuitkomsten worden nu eerst afdalend gerangschikt: 326 177 176 161. De kritieke waarde Qk voor n = 4 en α = 0.05 is 0.765 (tabel ). We berekenen Q4 = (177-326) / (161-326) = 0.903. Q4 > 0.765 → Ho verwerpen. De meetuitkomst 326 hoort niet tot de populatie, en is een uitschieter. We doen de toets nogmaals, met α = 0.05; n = 3. Verdacht is de laatste meetuitkomst 161. We zetten die voorop: 161 176
177
De kritieke waarde Qk voor n = 3 en α = 0.05 is 0.941 (tabel ). Q3 = (176-161) / (177-161) = 0.9375 Q3 < 0.941 → Ho niet verwerpen. De meetuitkomst 161 mag niet verworpen worden.
Opgave 9.8 Ga na of er bij de volgende reeks waarnemingen uitschieters zijn, zowel met onbetrouwbaarheid = 0.05 als met onbetrouwbaarheid = 0.01:
126.9
132.0
127.2
127.6
128.3
129.1
Opmerking: Deze toets wordt ook wel in een wat eenvoudiger vorm gedaan. Zie par. 4-5 :” Q test for bad data” in “Harris” ref. 10a.9. Hierbij wordt voor Q steeds de “gap” / “range” genomen.
foutenleer- 72
10. Literatuur over Foutenleer en Statistiek 10.a. Algemeen
1. B.T. Berendts, H.J.A. Blaauw, B.J.M. Harmsen, J.C. Smit, S.H. Tijs: "Foutenleer en Statistiek" Agon Elsevier, Amsterdam-Brussel, 1973. 2. K. Doerffel: "Statistik in der analytischen Chemie" VEB Deutscher Verlag für Grundstoffindustrie, Leipzig, 1966. 3. G.L. Squires: "Fysisch experimenteren" Aula 480, Het Spectrum N.V., Utrecht-Antwerpen, 1972. 4. D.L. Harnett, J.L. Murphy: "Introductory Statistical Analysis" Addison-Wesley, Reading Mass. USA, 1975. 5. J.R. Green, D. Margerison: "Statistical treatment of Experimental Data" Elsevier, Amsterdam 1978. 6. P. Booster, E.J. van Kampen, H.F. Pronk: "Statistische methoden voor het Laboratorium" Agon-Elsevier, Amsterdam-Brussel, 1972. 7. W. Lederman, E. Lloyd (Ed.): "Handbook of applicable Mathematics. Volume VI: Statistics, Part A" John Wiley & Sons, Chichester, 1984. Speciaal aanbevolen bij deze cursus:
8.
J.W.A. Klaassens, J.A. van Leeuwen: Praktische Statistiek voor het Laboratorium tenHagenStam, Den Haag, 1996. =>>>>>>>>>>>>>Uw leerboek Analytische Chemie: 9. D.C. Harris: “Quantitative Chemical Analysis” Freeman, New York, 6e Ed. 2003. Ch. 3: “Experimental Error” Ch. 4: “Statistics”. Ch. 5: “Calibration Methods” 10. J.C. Miller, J.N. Miller: “Statistics and Chemometrics for Analytical Chemistry”. Ellis Horwood, Chichester, 4e Ed. 2000.
foutenleer- 73
10.b. Normen en toetsen
1.
2.
3.
4.
5.
Nederlands Normalisatie Instituut: NEN 1750 t/m/ 1759: "Laboratoriumglaswerk" Delft, v.a. 1964. Zie de meest recente NNI catalogus. Nederlands Normalisatie Instituut: NEN 3114: "Terminologie voor het beschrijven van meetnauwkeurigheid" Delft, 1973. Nederlands Normalisatie Instituut: NEN 3128: "Staafthermometers" Delft, 1961. Nederlands Normalisatie Instituut: NEN 1047: "Receptbladen voor de statistische verwerking van waarnemingen" Delft, 1968 e.v. NEN 3117: "Statistische termen" Delft, 1968. W.L. Zijp: "Handleiding voor statistische toetsen" Tjeenk Willink, Groningen, 1974.
10.c. Overige
1. C. T. J. Alkemade, A.M. Hogenboom, J.A. Smit: "Inleiding tot fysische Meetmethoden" 2e druk, Oosthoek, Utrecht 1973. 2. B.P. Levitt: "Findlay's practical physical chemistry" 9e Ed., Longman, London, 1973. 3. J. Agterdenbos, F.J.M.J. Maessen, J. Balke: "Confidence regions for the sample content in the case of linear calibration relations" Analytica Chimica Acta 132, (1981) 127-137. 4. O.G. Brink, R.J. Flink: "Algemene Instrumentenkennis" Wolters Noordhoff, Groningen, 1979.
foutenleer- 74
11. Tabellen a. Standaard normale verdeling: cumulatief
Toetsvariabele: u = (xg - μ) / ( σ / ⎟n) Excel: NORMDIST(a; μ; σ; cumulative=true/false) geeft F(a) of f(a).
foutenleer- 75
b. Student t-verdeling: kritieke waarden
Toetsvariabele:
t = (xg - μ) / ( s / √n) en ν = n - 1
Als σA = σB:
t = [(xgA - xgB) - (μA - μB)] / [ S / √ Q] met S = √{ (nA - 1) s2A + (nB - 1) s2B) / (nA + nB - 2) } Q = {nΑnΒ / (nΑ + nΒ)} en ν = nA + nB - 2
Als σA ≠ σΒ :
t = [(xgA - xgB) - (μA - μB)] / R waarin R = √{s2A / nA + s2B / nB} en ν = -2 + {A + B}2 / { A2 / (nA + 1) + B2 / (nB + 1)}2 met A = s2A / nA en B = s2B / nB.
Excel:
TINV(α; ν) geeft de t-factor. Let op:α hier altijd tweezijdig opgeven. TTEST(array1; array2; tails = 1 of 2; type = 1 of 2 of 3) (type = 1: paired; type =2: gelijke sigma’s; type = 3: ongelijke sigma’s)
foutenleer- 76
c. Q-toets van Dixon: kritieke waarden
N.B. Zet de waarnemingen op volgorde; verdachte waarde voorop!
foutenleer- 77
d. Chi-kwadraat verdeling: kritieke waarden
Toetsvariabele: Excel:
χ2 = { (n-1) s2} / σ2 ν = n-1 CHIINV( probability;
ν)
geeft
de
waarde
van
de
parameter
χ2.
foutenleer- 78
e. F-verdeling: kritieke waarden voor α = 0.05
Toetsvariabele: Excel:
F = s2A / s2B, kies A en B zodat F >1 νA = nA - 1 en νB = nB - 1 FINV(probability; νA; νB) levert de kritische F waarde
foutenleer- 79
APPENDIX: OEFENOPGAVEN. • Opgaven met een * vereisen het uitvoeren van toetsen.
1.
Bereken voor ieder van de volgende meetseries de beste uitkomst, en de "fout" daarin. Noteer de uitkomsten ook zo correct mogelijk: A : 64.123 63.12 65 67.0 64.1 63.24 g/l B : 10.80 10.80 10.82 10.80 10.81 % C: 1.82 1.79 1.69 1.43 1.65 1.70 mol/l [par. 1.c / 1.f /2.b / 4.b / 4.c / 4.d / 9.c].
2*. Toets de volgende 2 meetreeksen met α = 0.05 eenzijdig op het al dan niet significant verschillend zijn van hun meetverwachting en van hun populatievariantie: A : 30.3 30.1 30.4 30.2 30.9 30.6 mm B : 29.8 32.4 30.3 29.9 31.6 32.0 30.0 mm Toets ook of de meetverwachting van A significant verschilt van 30.63 en of de populatievariantie van B significant verschilt van 1.0. [par. 9.d / 9.e / 9.f]. 3. *
Combineer de volgende twee meetseries tot één eindresultaat, en bepaal daarvan ook de standaarddeviatie. Onderzoek eerst of U de 2 series mag combineren, en zo ja, hoe dat moet. A : 4.12 4.08 4.10 4.13 4.16 4.14 g/l B : 3.88 3.90 4.12 4.26 4.20 4.00 4.30 g/l [par. 9c, (d, e, f)].
4.
Gemeten werd de volgende "ijklijn" : c = 0.0 2.0 4.0 5.0 6.0 8.0 10.0 ppm Fe A = 0.00 0.16 0.31 0.45 0.48 0.66 0.81 extinctie Bepaal m.b.v. de lineaire kleinste kwadraten methode, ongewogen: de lijnparameters, hun standaarddeviatie, en de correlatiecoëfficient. Er werd ook een monstermeting gedaan: A = 0.41. Bereken het 95 % betrouwbaarheidsinterval voor de meetverwachting van de concentratie Fe in het monster. [par. 6.2 / 6.5].
5.
In het "Handbook" zochten we de dampdruk van water als functie van de temperatuur op: p (mm Hg) : 9.209 17.535 31.824 55.324 92.51 t (o C ) : 10.000 20.000 30.000 40.000 50.000 Bereken hieruit ΔHvap m.b.v. de Wet van Clausius-Clapeyron, en de standaarddeviatie in ΔHvap. Gebruik daarbij alle gegevens. R = 8.31434 J mol-1 K-1 Wet van Clausius-Clapeyron: ln p = -ΔHvap / (RT) + constante. [par. 6.1 / 6.2 / 5.b].
6.
De brekingsindex n van het glas van een dubbelbolle lens wordt berekend m.b.v. 1 / f = (n-1) . (1 / r - 1 / r ). 1 2
Voor een bepaalde lens werd opgemeten: r1 = 30 cm , met standaarddeviatie = 0.05 cm ,, = 0.10 cm r2 = 150 cm , f = 50 cm , ,, = 0.06 cm Bereken de brekingsindex n en de standaarddeviatie daarvan. [par. 5.b (5.e)]
foutenleer- 80
7.
Bij de extractie van een waterige oplossing van een organische stof ⎜Χ met ether geldt: Cn = C0 . w n / (D.e + w)n Hierin zijn : n = aantal keren dat wordt geëxtraheerd :n =2 w = volume van de waterige oplossing : w = 100.0 met s = 0.2 ml e = volume van de toegevoegde ether : e = 50.0 met s = 0.2 ml D = verdelingscoëfficient van X(ether/water) : D = 85.0 met s = 0.5 Cn = aantal g van X na n keer extraheren, in de waterige oplossing C0 = 0.2000 g met s = 0.0002 g. Bereken C2 en de standaarddeviatie daarin. [par 5.b (5.e)].
8.
Gegeven is een normale verdeling van lengten, met μ = 2.54 en σ = 0.12 cm. Hoeveel % van de populatie heeft een lengte tussen 2.20 en 2.50 cm? [par. 7.2.b].
9.
Gegeven is een serie meetuitkomsten, waarvoor berekend werd: n=8 xg = 16.20 s = 0.30 g/ml. Bereken het 95 % betrouwbaarheidsinterval voor μ.
10. Bereken < x > en var (x) voor een chi-kwadraat verdeling met ν = 2 vrijheidsgraden. Teken de functie ook. Zie voor verdere gegevens opgave 8.4 [par. 8.a] 11. Teken een net histogram voor de volgende metingenserie (in kg): 70 80 73 74 71 66 68 74 75 70 73 75 69
77 63 84 67 82 73 73 84 67 76 85 66 73
73 81 74 79 84 78 77 76 80 77 78 74 79
83 66 68 76 65 74 59 79 74 72 68 78 76
71 78 77 85 81 76 75 78 71 79 81 77 83
76 78 82 72 70 76 72 66 77 75 76 67 87
81 74 62 75 78 71 80 74 82 74 84 82 70
68 75 78 77 87 81 75 81 69 63 71 75 85
78 84 90 69 74 79 65 71 76 78 76 79 74
74 76 71 73 80 72 70 77 73 66 74 72
Met welke normale verdeling zou U deze metingen representeren? [par.7.a / 7.2.b]. 12. Men maakt op 2 manieren een oplossing die 12.5 mg X per liter bevat: A: afwegen op anal. balans : 12.5. mg oplossen in maatkolf van 500 ml (klasse A) pipetteren met volpipet van 25 ml (klasse A) oplossen in maatkolf van 50 ml (klasse A) B: afwegen op anal. balans 125.0 mg oplossen in maatkolf van 500 ml (klasse A) pipetteren met volpipet van 10 ml (klasse A) oplossen in maatkolf van 100 ml (klasse A) pipetteren met volpipet van 50 ml (klasse A) oplossen in maatkolf van 100 ml (klasse A) Bereken voor beide manieren de standaardeviatie in de concentratie van X, als U het glaswerk niet van tevoren ijkt. [par. 3.b / 3.c / 5.c]
foutenleer- 81
13. Voor zure regen werd een pH gemeten van 4.55, met een standaarddeviatie van 0.05 gebaseerd op de apparatuur-handleiding. Bereken de waarden waarbinnen met 95 % waarschijnlijkheid de waterstof ionenconcentratie ligt. a. Neem een normale verdeling aan voor de pH b. Neem een normale verdeling aan voor de [H+] [par. 5b/9a] 14. Geef definities of kenmerkende omschrijvingen van de volgende begrippen: a. populatie l. 95 % betrouwbaarheidsinterval b. steekproefvariantie m. verwachtingswaarde c. meetverwachting n. gewogen gemiddelde d. systematische afwijking o. nulhypothese e. standaarddeviatie p. significantieniveau f. histogram q. uitschieter g. ware waarde r. onbetrouwbaarheid h. toevallige fout s. normale verdeling i. correlatiecoëfficient t. frequentiepolygoon j. kansdichtheidsfunctie u. afrondingsinterval k. student t-factor v. modus w. variatie-coëfficient 15. Een bepaald soort metingen voldoet behoorlijk goed aan een gamma verdeling met de parameters α = 2 en β = 1. Bereken het relatieve aantal metingen (in % van het totaal) dat men mag verwachten met een meetuitkomst die ligt in het interval van (de meetverwachting - 0.5 maal de standaarddeviatie) tot (de meetverwachting + 0.5 maal de standaarddeviatie). Gegeven is voor deze gamma verdeling: <x> = α en var(x) = α. Gebruik de Excel functie GAMMADIST (par. 7a, 8a) 16. Bereken van de tabellen uit par. 11 van de normale verdeling, de t-verdeling, *[de Chikwadraat- verdeling en de F-verdeling,] zelf eens een willekeurige regel, met behulp van de Excel functies. Controleer! (par. 7).
foutenleer- 82
OEFENOPGAVEN - UITWERKING 1. A: Meting no. 3 heeft te weinig significante cijfers want: sxg = 0.58 g/l n = 6 xg = 64.4305 s = 1.43 Daarom : n = 5 xg = 64.3166 s = 1.57 sxg = 0.702 → (64.3 met sxg = 0.7) g / l B: n = 5 xg = 10.8060 s = 0.0089 sxg = 0.0040 → (10.806 met sxg = 0.004) %
C:
4e meting uitschietertoets: Q6 = (1.65 - 1.43) / (1.82 - 1.43) = 0.564 > Qg (α = 0.05, n = 6) = 0.560 n = 5 xg = 1.730 s = 0.0718 sxg = 0.032 → (1.73 met sxg = 0.03) mol / l.
2. A: n = 6 xg = 30.41667 s = 0.29269 sxg = 0.11949 B: n = 7 xg = 30.85714 s = 1.10432 sxg = 0.41739 Doe een F-toets: Is σA = σB? Fact = 1.104322 / 0.292692 = 14.236 < {Fg (0.05; 7-1; 6-1) = 4.95} → σA ≠ σ B Doe een t-toets: Is μA = μB? ν = (1.104322 / 7 + 0.292692 / 6)2 / (1.104324 / 49.8 + 0.292694 / 36.7) - 2 = 7.29 → ν = 7 tact = (30.85714 - 30.41667) / √(1.104322 / 7 + 0.292692 / 6) = 1.015
tact < {tg (0.975 eenz.; 7) = 2.365} → μA= μB t-toets: Is μA = 30.63? tact = (30.63 - 30.4167) / (0.29269 / √6) = 1.785 < t (0.975 eenz; 5) = 2.571 → μA = 30.63 kan niet verworpen worden. χ2-toets: Is σB2 = 1.0? χ2act = (7-1) 1.10432 / 1.0 = 7.317 < χ2g (0.975 ; 6) = 14.4 → σB = 1 kan niet verworpen worden.
s = 0.0286 sxg = 0.011675 3. A : n = 6 xg = 4.1217 B: n=7 xg = 4.094 s = 0.1704 sxg = 0.064405 Men ziet onmiddellijk dat μA = μB (95 % wsch.) en σB ≠ σA (95 % wsch). Desgewenst kan men deze hypothesen ook kwantitatief toetsen: F-toets: Fact = 35.5 > {Fg (0.05; 6;5) = 4.95} → σA ≠ σB t-toets : tact = 0.423 < {t (0.975 eenz., ≈ 5) ≈ 2.571} → μA = μB Dus gewogen middelen : wA = 1/s2xgA = 7336.5 wB = 1/s2xgB = 241.1 wA + wB = 7577.7 Gewogen gemiddelde XG = (4.1217 * 7336.5 + 4.094 * 241.1) / (7336.5 + 241.1) = 4.1208 St. dev. in XG = SG = √1 / 7577.7 = 0.01149 Beste waarde = 4.121 met st. dev. = 0.011 (g / l) 4. Lijn tekenen: uitschieter voor c = 5.0 → weglaten! n = 6 X = 5.0 Y = 0.4033 b = - 0.005238 met sb = 0.006550 a = 0.081714 met sa = 0.001082 sd = 0.00905 Sx = 3.741 Sy = 0.306 ρ = 0.99965 xs = 5.0816 95 % interval: 4.749 ≤ μs ≤ 5.414 ppm Fe.
foutenleer- 83
5. Uitzetten: ln p (y - as) vs 1 / T (x - as) Let op: t omzetten in K → K = t + 273.15 x: (3.09450 3.19336 3.29870 y: 4.52734 4.01321 3.46022 n=5 X = 3.30589 * 10-3 Y = 3.41703 a = - 5277.63 met sa = 16.14
3.41122 2.8642
3.5317) * 10-3 2.22018
ΔH = R . a = 8.31434 * 5277.63 = 43880 Verwaarloos st.dev. in R (genoeg significante cijfers nemen) sΔH = R . sa = 8.31434 * 16.42 = 136.5
Dus ΔH = (438.8 met s = 1.4) * 102 J/mol. 6. Uit de formule volgt: (n-1) = r1 .r2 / (f. (r2 - r1)) Invullen levert : n = 1.7500 Noem a = n - 1. Pas formule (5.3) toe, met als variabelen f, r1 en r2. ∂a / ∂f = - (r1.r2 / (r2 - r1)) / f2 -----> 6 . 10-5 ∂a / ∂r1 = r22 / ( f (r2 - r1)2) -----> 1.56 . 10-3 ∂a / ∂r2 = - r21 / ( f (r2 - r1)2) -----> 1.25 . 10-4 s2a = 2.4592 .10-6 → sa = 1.568 * 10-3 → sn = 1.568 * 10-3 dus n = 1.7500 met sn = 0.0016. 7. C2 = C0 (w / (D.e +w))2 ---> C2 = 0.2 (100 / (85 . 50 + 100))2 = 0.0001057 g Pas formule (5.3) toe voor de 4 variabelen C0, w, D, e. ∂C2 / ∂C0 = w2 / (D.e + w)2 -----> 5.2847 * 10-4 ∂C2 / ∂w = 2 C0. D.e.w / ( D.e + w)3 -----> 2.0653 * 10-6 ∂C2 / ∂D = - 2 C0.w2.e / ( D.e + w)3 ---> - 2.4298 * 10-6 ∂C2 / ∂e = - 2 C0 . w2 .D / ( D.e + w)3 ---> - 4.1306 * 10-6 Alles invullen levert: stand. dev. van C2 = 1.529 * 10-6 Dus C2 = 105.7 * 10-6 g met s in C2 = 1.5 * 10-6 g. 8. Zoek op in tabel v.d. normale verdeling (of gebruik Excel) F{(2.54 - 2.20) / 0.12)} = F{2.8333} = 0.9977 F{(2.54 - 2.50) / 0.12)} = F{0.3333} = 0.6306 Percentage = 50 - 13.06 - 0.23 = 36.71 9. xg - t (7, 0.95 tweez.) . s / (√n) ≤ μ ≤ xg + t . s / (√n) , met t = 2.365 (tabel) geeft 15.949 ≤ μ ≤ 16.450 ∞ 10. < x > = ∫ 0.5 x. e-x/2 dx = 2 (= ν) 0 ∞ var (x) = ∫ 0.5 (x - 2)2 . e-x/2 dx = 4 (= 2ν) 0
foutenleer- 84
11. Histogram Klassebreedte 3 kg (min = 59, max = 90) Aantallen: 1, 1, 4, 12, 15, 26, 27, 20, 12, 8, 2, 1. xg = 75.0775 s = 5.7468 n = 129 Normale verdeling met μ = xg en σ = s. Standaardhistogram mbv. Excel levert een histogram met 11 klassen, startend bij 59, met klassebreedte 2.82, en met frequenties 1,0,3,10,12,20,22,29,16,10,5,1. (lelijke klassebreedte!). 12. Relatieve standaarddeviaties kunnen kwadratisch opgeteld worden. A: c = (25 / 500) * (25 / 50) = 12.5 mg / l. (sc / c)2 = (0.1 / 12.5)2 + (0.25 / 500)2 + (0.03 / 25)2 + (0.06 / 50)2 = 0.00006713 sc / c = 0.82 %. B: c = (250 / 500) * (10 / 100) * (50 / 100) = 12.5 mg/l. (sc / c)2 = (0.1 / 250)2 + (0.25 / 500)2 + (0.020 / 10)2 + (0.10 / 100)2 + (0.05 / 50)2 + (0.10 / 100)2 = 0.00000789 dus sc / c = 0.28 %. Dus methode B is nauwkeuriger. ( komt doordat in A een te kleine hoeveelheid is afgewogen). (toleranties die niet in tabel pag. 16 staan werden geschat). 13. pH = 4.55 met σpH = 0.05
[H+] = 2.818 * 10-5 σH+ =σpH * [H+] / 0.434294 (via pH = -0.434294 ln [H+] ) = 0.325 * 10-5
Betrouwbaarheidsinterval voor [H+]: (m.b.v. normale verdeling): 2.818 * 10-5 - (1.96 * 0.325 * 10-5) ≤ μ ≤ 2.818 * 10-5 + (1.96 * 0.325 * 10-5) 2.181 * 10-5 ≤ μ ≤ 3.455 * 10-5 mol/l. Betrouwbaarheidsinterval voor pH: (m.b.v. normale verdeling): 4.55 - (1.96 * 0.05) ≤ μ ≤ 4.55 + (1.96 * 0.05) 4.452 ≤ μ ≤ 4.648 Let op dat uit deze laatste uitkomst iets andere grenzen voor het betrouwbaarheidsinterval van [H+] gevonden worden!: 2.249*10-5 ≤ μ ≤ 3.532*10-5 mol / l. Ga dit even na door de -log te nemen. 14. M.b.v. deze opgave kunt U vrijwel alle in het dictaat voorkomende begrippen onder woorden proberen te brengen. We laten de beantwoording graag aan U over. 15. Standaarddeviatie = √variantie = √2. Gevraagd oppervlak tussen 2 - 0.5√2 =1.2929 en 2 + 0.5 √2= 2.7071, te berekenen als : GAMMADIST(2.7071;2;1;true) - GAMMADIST(1.2929;2;1;true) = 0.381969 (=38.2%). 16. Zelf proberen s.v.p. Alle waarden moeten, correct afgerond, kloppen.
foutenleer- 85
FORMULE-OVERZICHT FOUTENLEER 2004 w = xmax - xmin
(1.1)
xg = Σ xi / n
(1.2)
s2 = Σ (xi - xg )2 / (n-1)
(1.3)
s = √ {Σ (xi - xg )2 / (n-1)}
(1.4)
s2 = {Σxi2 - (Σxi)2 / n} / (n-1)
(1.5)
sg = s in xg = s / √n.
(1.6)
xg = Σ xi / n
(2.1)
als n → ∞ dan xg → μ
(2.2)
δ = μ - xw
(2.3)
sg = s / √n
(4.1)
ubest = f (x,y,z,..).
(5.1)
u = f (xg,yg,zg,..)
(5.2)
s2u ≈ s2gx. (∂u/∂x)2 + s2gy. (∂u/∂y)2 + s2gz. (∂u/∂z)2 + .....
(5.3)
s2u = a2 s2x + b2 s2y + c2 s2z + .....
(5.4)
s2u / u2 = a2. s2x / x2 + b2. s2y / y2 + c2. s2z / z2 + .....
(5.5)
(∂u/∂x) ≈ (Δu/Δx) = { f(xg+ sgx, yg, zg,...) - f(xg, yg, zg, ..) } / sgx
(5.6)
s2u = Δu2x + Δu2y + Δu2z waarin Δux = f(xg+ sgx, yg, zg,...) - f(xg, yg, zg, ..) enz.
(5.7)
a = { n Σ xiyi - Σ xi . Σ yi } / { n Σ xi2 - (Σ xi )2 }
(6.1)
b = {Σ xi2 . Σ yi - Σxi . Σ xiyi } / { n Σ xi2 - (Σ xi )2 }
(6.2)
sa2 = sd2 . n / { n Σ xi2 - (Σ xi )2 }
(6.3)
sb2 = sd2 . Σ xi2 / { n Σ xi2 - (Σ xi )2 }
(6.4)
sd2 = Σ di2 / (n-2)
(6.5)
X = Σ xi / n
en
Y = Σ yi / n.
(6.6a)
S2X = Σ (xi - X)2 / (n-1) en S2Y = Σ (yi - Y)2 / (n-1).
(6.6b)
r = {n .Σxiyi - Σxi .Σyi} / √{[ n .Σxi2 - (Σxi )2) ]. [ n .Σyi2 - (Σyi )2 ]}
(6.7)
r = a. SX / SY
(6.7b)
y = f(x) = a0 + a1.x + a2.x2 + a3.x3 + .......
(6.8)
cs = ( Ms - b ) / a
(6.9)
s in cs = sd. a-1. √( n-1 + N-1 + E)
(6.10)
E = (cs - X)2 / Σ (xi -X)2 = (cs - X)2 / {(n-1) S2X }
(6.11)
cs - tν,α . sd. a-1. √( n-1 + N-1 + E) ≤ μs ≤ cs + tν,α . sd. a-1. √( n-1 + N-1 + E)
(6.12)
ν
=n+N-3
foutenleer- 86 Relatieve aantal metingen met meetuitkomst tussen xa en xb =
xb ∫ f(x) dx xa
(7.1)
Relatieve aantal metingen met meetuitkomst tussen -∞ en +∞ =
∞ ∫ f(x) dx = 1 -∞
(7.2)
f(x) = λ. exp (-λx) met λ > 0
(7.3)
f(x) = [σ√(2π)]−1. exp{ -0.5 (x-μ)2 / σ2 }
(7.4)
F(a) =
a ∫ 1/√(2π) . exp (-z2/2 ) dz -∞
P (j) = λj . e −λ / j! , voor j = 0, 1, 2, 3, ...enz., met λ > 0
(7.5) (7.6)
∞ E{g(x)} ≡ < g(x) > ≡
∫ g(x) . f (x) dx
(8.1)
-∞ < g(x) > = Σ g(xi) . P(xi)
(8.2)
< x > = ∫ x . f(x) dx
(8.3)
∞ E(x) = < x > = ∫ x . (σ√ 2π)−1. exp {-0.5 (x-μ)2 / σ2} dx -∞
(8.4)
var (x) = < (x - <x>)2 > = < x2 > - < x > 2
(8.5)
var (x) = ∫ (x-<x>)2) . (σ√2π)-1. exp {-0.5 (x-μ)2 / σ2} dx
(8.6)
var (x) = σ2
(8.7)
< xg > = < x >
(= μ voor de normale verdeling)
(8.8)
< ( s2 ) > = var (x)
( = σ2 voor de normale verdeling)
(8.9)
var (xg) = (1/n ) . var (x)
( = σ2 / n voor de normale verdeling)
(8.10)
var (s2) = 2σ4 / (n-1) voor de normale verdeling
(8.11)
sg = s in xg ≈ s / √n
(8.12)
xg - tν,α . s/√n ≤ μ ≤ xg + tν,α . s/√n
(9.1)
ν s2 /χ2ν,α/2 ≤ σ2 ≤ ν s2 / χ2ν, 1−α/2
(9.2)
xComb,g = ( xg1 . n1 + xg2 . n2 + .... + xgk . nk ) / ( n1 + n2 +.... + nk)
(9.3)
sComb = √ [{ Σ(xi - xg1)2 + Σ(xj - xg2)2 +....+ Σ(xk - xgk)2 } / ( n1 + n2 +... + nk - k )]
(9.4)
sComb = √ [{ (n1 - 1) s12 + (n2 - 1) s22 + ... + (nk - 1) sk2} / ( n1 + n2 +... + nk - k ) ]
(9.5)
sComb,g
= sComb / √ (n1 + n2 +... + nk)
(9.6)
XGew = Σ wi . xgi
(9.7)
var (XGew ) = Σ w2i . s2gi
(9.8)
wi = (1 / s2gi ) / Σ ( 1 / s2gi)
(9.9)
XGew = {Σ ( 1 / s2gi) . xgi } / Σ ( 1 / s2gi)
(9.10)
var (XGew) = 1 / Σ ( 1 / s2gi)
(9.11)