Leergang CCP Module 1 Statistiek voor het Credit Management - Drs. J.H. Gieskens AC CCM QT -
CCP Mod1 - Reader Statistiek
Pagina 1 van 17
1.
Inleiding: Statistiek
De beeldvorming rond het begrip ‘statistiek’ is zeer divers. Over statistiek kan met groot ontzag worden gesproken, maar evenzo worden er grappen over gemaakt. Er zijn analisten die aan statistische uitkomsten veel waarde hechten maar er zijn ook mensen die statistische cijfers verachten: “Cijfers uit het verleden bieden immers géén garantie voor de toekomst, toch?” Maar . . . wat is statistiek?
Het woord statistiek vormt een samenstel van het Latijnse woord status (stand, positie) en het Griekse achtervoegsel -istès (methode die zich met iets bezig houdt). Statistiek zou derhalve een methode zijn om inzicht in posities te verkrijgen. Deze omschrijving is echter niet echt hands-on, vergelijk daarom eens onderstaande definities van het begrip statistiek:
“Statistiek: methode om door middel van cijfers inzicht in verschijnselen te krijgen.” Van Dale, woordenboek, 1997 Utrecht/Antwerpen.
“Statistiek: leer en methode om door middel van cijfers inzicht te krijgen in massale verschijnselen, met name van maatschappelijke, economische en natuurwetenschappelijke aard en van het weergeven van de resultaten in tabellen of grafische voorstellingen.” Van Dale, groot woordenboek der Nederlandse taal, 2000 Utrecht/Antwerpen.
“Statistiek: de wetenschap die zich bezighoudt met het verzamelen, ordenen, samenvatten, analyseren en presenteren van gegevens en het trekken van conclusies hieruit, met als doel het verschaffen van overzicht van en inzicht in massaverschijnselen. Statistiek is een onderdeel van de wiskunde” Wikipedia, 2008
Het doel van statistiek ligt bij de analyse en de beslissingsondersteuning. De statistiek bewerkt de data (gegevens verzamelen, ordenen, berekenen, analyseren en presenteren) waardoor er inzicht ontstaat op basis waarvan beslissingen kunnen worden genomen. Tevens kan de statistiek door toepassing van kansmodellen op verantwoorde wijze conclusies verbinden aan deelwaarnemingen of steekproeven.
Ook de credit manager kan in zijn dagelijks werk gebruik maken van statistische technieken en cijfers ten behoeve van de beslissingsondersteuning of de performancemeting. Voorbeelden zijn enerzijds de kengetallen die periodiek kunnen worden berekend op basis van het eigen debiteurenbestand. De berekeningen en presentaties van de kengetallen
CCP Mod1 - Reader Statistiek
Pagina 2 van 17
kunnen plaats vinden met behulp van zelf gebouwde modellen in Excel, maar ook met behulp van credit management software zoals Argentis, Credittools, GetPaid, MaxCredible of OnGuard.
Anderzijds kan de credit manager benchmarkgegevens verkrijgen bij het Centraal Bureau voor de Statistiek (CBS) of bedrijfsinformatie over (potentiële) klanten bij de Kamer van Koophandel (KvK). Daarnaast bieden informatieleveranciers zoals Bureau van Dijk, Dun & Bradstreet, EDR, Experian en Graydon zowel bedrijfs- als kredietinformatie over klanten. De via deze leveranciers verkregen informatie kan door middel van statistische berekeningen worden geanalyseerd.
CCP Mod1 - Reader Statistiek
Pagina 3 van 17
2.
Deelgebieden Statistiek
Traditioneel worden in de statistiek de volgende drie deelgebieden onderscheiden: beschrijvende, verklarende en exploratieve statistiek.
Beschrijvende statistiek De beschrijvende statistiek houdt zich in principe bezig met de beschrijving van bepaalde gegevens van een gehele populatie (massa). Een populatie is een verzameling van objecten met een ten aanzien van één of meer aspecten homogeen karakter. Als voorbeeld kan men denken aan een volkstelling en daaraan gerelateerde zaken zoals geslacht, leeftijd, werkloosheid en/of inkomen van de bevolking. De gegevens worden voorts geordend en gecomprimeerd (ingedikt) tot relevante kengetallen. In lijn met het voorbeeld zouden hier de volgende kengetallen kunnen worden samengesteld:
het gemiddeld inkomen per hoofd van de bevolking (BBP per capita),
werkeloosheidspercentage van de bevolking, mannen of vrouwen.
In overzichtelijke tabellen en grafieken kunnen de gegevens tenslotte worden gepresenteerd. Een belangrijk deel van het werk van het Centraal Bureau voor de Statistiek (CBS) betreft dit deelgebied.
Verklarende statistiek In de verklarende statistiek (ook wel inductieve statistiek genoemd) tracht men aan de hand van een steekproef informatie omtrent de gehele populatie te verkrijgen. Om allerlei redenen kan het ongewenst of onmogelijk zijn om de gehele populatie te onderzoeken. In plaats daarvan onderzoekt men een deel van de populatie: de steekproef. Een steekproef is een deelverzameling van de populatie waarop de waarnemingen worden verricht en op basis waarvan de gehele populatie wordt beoordeeld. Men verkrijgt zo echter slechts beperkte informatie over de populatie. De inductieve statistiek geeft geschikte methoden en onderzoekt de kwaliteit daarvan. Bekende methoden zijn toetsen, schattingsmethoden en als combinatie van beide: betrouwbaarheidsintervallen.
Exploratieve statistiek Anders dan in de verklarende statistiek, waar wordt uitgegaan van goed gedefinieerde steekproeven, gaat men in de exploratieve statistiek slechts uit van een set voorhanden zijnde gegevens (data); de deelverzameling. Op deze data worden methoden van de beschrijvende statistiek alsook van de verklarende statistiek toegepast met als nadeel dat men over de verdelingen vaak weinig kan zeggen.
CCP Mod1 - Reader Statistiek
Pagina 4 van 17
3.
Centrummaten
Een centrummaat (ook wel liggingmaat, centrumgetal of maatstaf voor centrale tendentie genoemd) is een term uit de statistiek. Het woord centrum betekent: middelpunt van een gebied of van een verzameling gegevens. Het centrum van een verzameling gegevens kan in de statistiek worden berekend; de uitkomst is per definitie één getal. Het rekenkundig gemiddelde, de mediaan en de modus zijn centrummaten.
3.1
Rekenkundig gemiddelde (RG, μ)
Het rekenkundig gemiddelde wordt in de statistiek aangegeven met de hoofdletters RG of de Griekse letter mu (μ) en is de waarde die men verkrijgt door de som () van een aantal waarnemingen (elementen) te delen door het aantal (n) waarnemingen. Het rekenkundig gemiddelde is een centrummaat.
Formule Als er ‘n’ getallen zijn, wordt het rekenkundig gemiddelde van deze ‘n’ getallen gegeven door de formule: μ=
Voorbeeld Onderstaand overzicht geeft van een twaalftal openstaande facturen (n = 12) het aantal dagen (#) weer dat elk van de factuur open staat.
Factuur
1
2
3
4
5
6
7
8
9
10
11
12
# openst. dgn
31
60
21
30
8
31
32
66
43
45
40
7
Het rekenkundig gemiddelde van het aantal openstaande dagen wordt berekend als: μ = (31+60+21+30+8+31+32+66+43+45+40+7) / 12
= 414 / 12
= 34,5
Binnen het credit management is het echter niet gebruikelijk om met halve dagen te rekenen; de renteverrekening vindt immers plaats op basis van hele dagen. Veelal vindt er dan ook een afronding naar boven plaats. Het rekenkundig gemiddelde bedraagt hier dus 35 dagen.
CCP Mod1 - Reader Statistiek
Pagina 5 van 17
Interpretatie rekenkundig gemiddelde: betekenis en beperkingen a. Het rekenkundig gemiddelde wordt in het dagelijks spraakgebruik aangeduid als “het gemiddelde”. Binnen de wiskunde worden echter meer gemiddelden onderkend zoals het gewogen rekenkundig gemiddelde, het meetkundig gemiddelde, het getrimd gemiddelde en het harmonisch gemiddelde. Rond deze “gemiddelden” heerst er onder wiskundigen discussie of ze al dan niet als centrummaten kunnen worden aangemerkt. Het gewogen gemiddelde en het meetkundig gemiddelde worden in deze reader behandeld in paragraaf 9.4 Bijzondere Gemiddelden. b. Merk op dat het berekende rekenkundig gemiddelde als getal niet hoeft voor te komen in de rij van waarnemingen. Bovenstaand voorbeeld toont aan dan noch het rekenkundig gemiddelde (34,5), noch de afgeronde uitkomst (35) in de rij van waarnemingen voorkomt. c. Het rekenkundig gemiddelde wordt binnen de statistiek als centrummaat superieur geacht boven de mediaan en de modus. Het rekenkundig gemiddelde is immers efficiënt; alle informatie uit de verzameling van waarnemingen wordt in deze maatstaf verwerkt. d. Ondanks de onder voorgaand punt vermelde efficiency, is het rekenkundig gemiddelde gevoelig voor uitschieters in de waarneming. Stel dat de achtste factuur niet 66 maar 660 dagen open staat. Het rekenkundig gemiddelde wordt dan: 84 dagen. In de praktijk blijkt dat uitschieters vaak ontstaan als gevolg van typefouten. In bovenstaand voorbeeld zou als gevolg van een typefout een gemiddelde (84) worden verkregen dat boven de hoogste waarneming (66) ligt. In de volgende paragrafen zullen we zien dat de mediaan en de modus niet of slechts in zeer geringe mate op uitschieters reageren.
Formule rekenkundig gemiddelde in Excel: Voor een groot aantal statistische berekeningen is in het spreadsheet programma Excel een formule opgenomen. Deze formules kunnen worden getypt in een cel maar kunnen ook worden ingevoegd via de knop: fx . De formule voor het rekenkundig gemiddelde in Excel is:
= GEMIDDELDE(n1:nx) In deze formule zijn n1 en nx de eerste respectievelijk de laatste cel in het spreadsheet waarnaar wordt verwezen.
CCP Mod1 - Reader Statistiek
Pagina 6 van 17
3.2
Mediaan (Me)
De mediaan (Me) is de middelste waarneming (element) van een verzameling getallen die naar opklimmende grootte is gerangschikt. De Mediaan is net zoals het rekenkundig gemiddelde een centrummaat. Bij een even aantal elementen is er géén midden; men neemt dan het rekenkundig gemiddelde van de twee om het midden liggende waarnemingen als mediaan. Indien gewenst kan dit gemiddelde worden afgerond naar een getal dat betekenisvol is.
Voorbeeld In de onderstaande tabel staan de 12 waarnemingen (n = 12) uit voorgaand voorbeeld in oplopende volgorde gesorteerd. De waarnemingen betreffen wederom de 12 openstaande facturen. Per factuur wordt het aantal (= #) openstaande dagen weergegeven.
Factuur
1
2
3
4
5
6
7
8
9
10
11
12
# openst. dgn
7
8
21
30
31
31
32
40
43
45
60
66
Omdat n = 12 even is, is er géén middelste getal. De mediaan is nu het rekenkundig gemiddelde van de middelste twee data: (31 + 32) / 2 = 31,5. In voorgaande paragraaf zagen we reeds dat het binnen het credit management niet gebruikelijk is om met halve dagen te rekenen; ook hier dient er een afronding naar boven plaats te vinden. De mediaan in onderhavig voorbeeld is dus 32.
Interpretatie mediaan: betekenis en beperkingen a. Slechts de informatie van de middelste, of middelste twee waarnemingen wordt in deze maatstaf meegenomen. b. Als gevolg van voorgaand punt is de mediaan is een robuuste maatstaf. Dit betekent dat de mediaan niet, of slechts zeer beperkt gevoelig is voor uitschieters (zie ook de opmerkingen onder rekenkundig gemiddelde).
Formule mediaan in Excel: = MEDIAAN(n1:nx) In deze formule zijn n1 en nx de eerste respectievelijk de laatste cel in het spreadsheet waarnaar wordt verwezen.
CCP Mod1 - Reader Statistiek
Pagina 7 van 17
3.3
Modus (Mo)
De modus (Mo) is het getal dat het vaakst voorkomt in een serie van waarnemingen (hoogste frequentie). De modus is een maatstaf om de centrale waarde van een frequentieverdeling aan te geven; het is namelijk de waarde of waarnemingklasse met de grootste frequentie, of met andere woorden, de waarde of klasse die het vaakst voorkomt. De modus is net zoals het rekenkundig gemiddelde en de mediaan een centrummaat.
Voorbeeld We nemen wederom de waarnemingen zoals die bij de mediaan werden gepresenteerd:
Factuur
1
2
3
4
5
6
7
8
9
10
11
12
# openst. dgn
7
8
21
30
31
31
32
40
43
45
60
66
Aan de hand van dit overzicht kunnen we een frequentieverdeling opstellen. Een frequentieverdeling geeft een overzicht van het aantal malen dat een waarneming zich voordoet.
# openst. dgn
7
8
21
30
31
32
40
43
45
60
66
frequentie
1
1
1
1
2
1
1
1
1
1
1
De modus bedraagt 31 in onderhavige reeks van waarnemingen.
Interpretatie modus: betekenis en beperkingen a. Net als bij de mediaan wordt bij de modus niet de informatie uit alle waarnemingen in de maatstaf meegenomen; de informatie van alle andere waarden dan die van de modus zijn niet in de maatstaf betrokken. b. Ook de modus is een robuuste maatstaf. Dit betekent dat de modus niet, of slechts zeer beperkt gevoelig is voor uitschieters (zie ook de opmerkingen onder rekenkundig gemiddelde). c. De modus geeft doorgaans niet het midden van een verzameling van waarnemingen weer. Zo zullen bij een verzameling openstaande facturen het aantal facturen met een gering aantal achterstandsdagen groter zijn dan het aantal facturen met een groot aantal achterstandsdagen. De modus is als centrummaat dan ook alleen zinvol wanneer de meet- of waarnemingsresultaten zich spreiden rond één centrale waarde. Bij een
CCP Mod1 - Reader Statistiek
Pagina 8 van 17
symmetrische verdeling ligt de modus dicht bij het gemiddelde en de mediaan, bij een scheve verdeling niet. d. Soms zijn er twee of meer modi te bepalen uit een reeks van waarnemingen omdat er simpelweg twee of meer waarnemingsklassen zijn met de zelfde frequentie. Een modus hoeft dus niet uniek te zijn. Is dit wel het geval, dan noemen we de verdeling unimodaal. In het geval van twee of meer waarnemingsklassen met een zelfde frequentie noemt men de verdeling multimodaal. De verdeling is bimodaal bij twee waarnemingsklassen met de zelfde frequentie. Ook nu weer doet de kanttekening zoals die onder voorgaand punt werd vermeld opgeld. De modus is als centrummaat alleen zinvol wanneer de meet- of waarnemingsresultaten zich spreiden rond één centrale waarde. Bij een symmetrische verdeling ligt de modus dicht bij het gemiddelde en de mediaan, bij een scheve verdeling niet.
Formule modus in Excel: = MODUS(n1:nx) In deze formule zijn n1 en nx de eerste respectievelijk de laatste cel in het spreadsheet waarnaar wordt verwezen.
Jan Modaal Ondanks dat de modus staat voor de waarneming die het vaakst voorkomt in een serie van waarnemingen (hoogste frequentie) wordt de modus in ons dagelijks taalgebruik vaak verwisseld met ‘gemiddeld’, ‘middelmatig’ of ‘een grote groep van waarnemingen die aan een aantal kenmerken voldoet’. Van deze laatste vormt ‘Jan Modaal’ een treffend voorbeeld. Jan Modaal staat model voor: ‘de Nederlandse gehuwde alleenverdiener die werkzaam is in de marktsector tegen een modaal inkomen en een huishouden heeft dat bestaat uit een nietwerkende partner en twee kinderen tussen de 6 en 11 jaar’. Het modaal inkomen is het bruto inkomen dat net onder de maximum premie-inkomensgrens ligt zoals dit is vastgelegd in de Zorgverzekeringswet (Zvw). Deze grens wordt jaarlijks geïndexeerd op basis van de gemiddelde contractloonstijging bij particuliere bedrijven (marktsector). Het bruto modaal inkomen is volgens het Centraal Planbureau (CPB)*:
Bruto modaal inkomen (EUR)
2007
2008
2009
2010
30.000
31.000
31.930
32.500
)
* Afgeronde cijfers zoals gepubliceerd per ultimo 2008 (www.cpb.nl)
CCP Mod1 - Reader Statistiek
Pagina 9 van 17
Dit modaal inkomen is derhalve niet gelijk aan het statistisch modaal (= meest voorkomende) inkomen. Daarnaast zal het hierboven gedefinieerde modaal inkomen lager liggen dan het gemiddelde loon omdat daarop vooral de weinig voorkomende, maar vaak wel extreme, hoge lonen veel invloed hebben.
4.
Bijzondere gemiddelden
Zoals gesteld in paragraaf 9.3 is het rekenkundig gemiddelde het gemiddelde waarop veelal wordt gedoeld in het dagelijks spraakgebruik. Binnen de statistiek wordt het rekenkundig gemiddelde als centrummaat aangemerkt. Over andere gemiddeldes heerst er onder wiskundigen onenigheid of deze kwalificeren als centrummaat. Twee van deze gemiddeldes, het gewogen rekenkundig gemiddelde en het meetkundig gemiddelde zullen hieronder worden behandeld.
4.1
Gewogen rekenkundig gemiddelde (μg)
Het gewogen rekenkundig gemiddelde wordt verkregen door alle elementen van een reeks getallen te vermenigvuldigen met de bijhorende gewichten (weegfactoren, zijnde positieve getallen), deze producten voorts op te tellen en tenslotte te delen door de som van de gewichten. De waarde van het gewogen rekenkundig gemiddelde wordt zodoende het meest beïnvloed wordt door de getallen met het grootste gewicht.
Formule Als er ‘n’ getallen met bijbehorende ‘g’ gewichten zijn, wordt het gewogen rekenkundig gemiddelde van deze ‘n’ getallen gegeven door de formule: μg =
Voorbeeld Uitgangspunt voor het voorbeeld vormt wederom het overzicht met de openstaande facturen. Dit keer wordt echter het achterstallige bedrag per openstaande factuur vermeld.
CCP Mod1 - Reader Statistiek
Pagina 10 van 17
Factuur
1
2
3
4
5
6
7
8
9
10
11
12
# openstaande dagen
31
60
21
30
8
31
32
66
43
45
40
7
Factuurbedrag (1.000)
1,2
15,1
13,4
18,9
0,8
15,6
3,7
2,5
4,8
17,1
7,0
8,5
μg = (31*1,2)+(60*15,1)+(21*13,4)+(30*18,9)+(8*0,8)+(31*15,6)+(32*3,7)+(66*2,5)+(43*4,8)+(45*17,1)+(40*7)+(7*8,5) 1,2 + 15,1 + 13,4 + 18,9 + 0,8 + 15,6 + 3,7 + 2,5 + 4,8 + 17,1 + 7 + 8,5
μg = 3.880 / 108,6 = 35,7 Binnen het Credit Management wordt veel gebruik gemaakt van het gewogen rekenkundig gemiddelde. Berekeningen van de Days of Sales Outstanding (DSO) en de Weighted Average Days of Sales Outstanding (WADSO) zijn varianten van het gewogen rekenkundig gemiddelde. In Module 2 van de CCP opleiding zal de DSO nader worden behandeld.
4.2
Meetkundig gemiddelde
Het meetkundig gemiddelde (ook wel geometrisch gemiddelde genoemd) is de waarde die men verkrijgt door van het product van een aantal (n) waarnemingen (elementen, getallen) de n-de-machtswortel te nemen.
Formule Het meetkundig gemiddelde van a1, a2, ..., an is:
(a1 * a2 * … * an)
n
Voorbeeld Onderstaand overzicht is het overzicht zoals dit werd gepresenteerd in voorgaande paragrafen:
Factuur
1
2
3
4
5
6
7
8
9
10
11
12
# openst. dgn
31
60
21
30
8
31
32
66
43
45
40
7
CCP Mod1 - Reader Statistiek
Pagina 11 van 17
Het meetkundig gemiddelde van het aantal openstaande dagen wordt berekend als:
(31*60*21*30*8*31*32*66*43*45*40*7)
12
= 28,9
Binnen het credit management wordt slechts in beperkte mate gebruik gemaakt van het meetkundig gemiddelde. Veelal betreft het dan de berekening van de gemiddelde groei van de debiteurenportefeuille. Het meetkundig gemiddelde zoekt immers een evenwicht in de verhoudingen tussen positieve getallen en niet, zoals het rekenkundige gemiddelde, een evenwicht in de verschillen tussen getallen. Daarnaast kleven er nog twee bezwaren aan de berekening van het meetkundig gemiddelde: a.
In praktische toepassingen wordt het meetkundig gemiddelde uitsluitend voor positieve getallen berekend. Omwille van het wortelteken in de formule is het onmogelijk om realistische uitkomsten te verkrijgen in geval van negatieve getallen.
b.
De rekenkracht van calculators en zelfs computers schiet tekort bij grote verzamelingen getallen en/of hoge getallen.
Realistisch voorbeeld meetkundig gemiddelde: groeipercentages Onderstaand staat een overzicht van de groeicijfers van de debiteurenportefeuille over drie jaren: 2,0% (2006), 3,4% (2007) en 3,5% (2008).
Het meetkundig gemiddelde van deze groeicijfers van de debiteurenportefeuille luidt:
(2,0 * 3,4 * 3,5) = 3(23,8) = 2,88
3
Dit betekent dat een jaarlijkse stijging van 2,88% gedurende drie jaar dezelfde eind omvang van de portefeuille zou hebben opgeleverd.
CCP Mod1 - Reader Statistiek
Pagina 12 van 17
5.
Spreidingsmaten
De centrummaten geven inzicht in het ‘midden’ van een verzameling gegevens (rekenkundig gemiddelde) of van een frequentieverdeling (modus en mediaan). Om meer inzicht te verkrijgen in de samenstelling van een gegevensverzameling dient tevens aandacht te worden besteed aan de spreiding (strooiing) van de waarnemingen ten opzichte van het berekende middelpunt. In onderhavige paragraaf zullen de volgende maatstaven voor spreiding
worden
behandeld:
variatiebreedte,
variantie,
standaard
deviatie
en
variatiecoëfficiënt.
5.1
Variatiebreedte
De variatiebreedte (ook wel aangeduid als spreidingsbreedte, variatie of range) is het verschil tussen de grootste en de kleinste waarneming uit een gegevensverzameling. De variatiebreedte wordt veelal berekend in combinatie met de modus.
Voorbeeld: Als uitgangspunt voor de berekening van de variatiebreedte is het voorbeeld uit paragraaf 9.3.3 genomen waarin een modus werd berekend ter grootte van: 31.
# openst. dgn
7
8
21
30
31
32
40
43
45
60
66
frequentie
1
1
1
1
2
1
1
1
1
1
1
De variatiebreedte wordt berekend als het verschil tussen de grootste en kleinste waarneming: 66 – 7 = 59.
5.2
Variantie (VAR)
De variantie is een spreidingsmaatstaf die wordt berekend ten opzichte van het rekenkundig gemiddelde. Om de variantie te kunnen berekenen dienen de volgende berekeningen te worden gemaakt: - bereken het rekenkundig gemiddelde van een reeks waarnemingen (populatie), - trek van elke waarneming uit de reeks het rekenkundig gemiddelde af, - de verkregen verschillen dienen voorts te worden gekwadrateerd, - bereken het rekenkundig gemiddelde van de kwadraten.
CCP Mod1 - Reader Statistiek
Pagina 13 van 17
Voorbeeld:
Aantal
Waarnemingen
waarnemingen
Rekenkundig
Verschillen
gemiddelde
Kwadraat van verschillen
1
31
34,5
-3,5
12,25
2
60
34,5
25,5
650,25
3
21
34,5
-13,5
182,25
4
30
34,5
-4,5
20,25
5
8
34,5
-26,5
702,25
6
31
34,5
-3,5
12,25
7
32
34,5
-2,5
6,25
8
66
34,5
31,5
992,25
9
43
34,5
8,5
72,25
10
45
34,5
10,5
110,25
11
40
34,5
5,5
30,25
12
7
34,5
-27,5
756,25
Som:
414
0
3.547
Rekenkundig gem:
34,5
0,0
295,6
In onderhavig voorbeeld bedraagt de variantie van de populatie (VAR): 295,6.
Formule variantie in Excel: = VARP(n1:nx) In deze formule zijn n1 en nx de eerste respectievelijk de laatste cel in het spreadsheet waarnaar wordt verwezen.
CCP Mod1 - Reader Statistiek
Pagina 14 van 17
5.3
Standaarddeviatie (s, σ)
Net zoals de variantie is de standaarddeviatie een spreidingsmaatstaf die wordt berekend ten
opzichte
van
het
rekenkundig
gemiddelde.
De
standaarddeviatie
(ook
wel
standaardafwijking genoemd) wordt in de statistiek aangegeven met de kleine letter “s” of de Griekse letter sigma: σ. De standaardafwijking kan beschouwd worden als het gemiddelde van de absolute afwijkingen tussen de waarnemingen uit een reeks en het gemiddelde van die waarnemingsgetallen. De standaarddeviatie is de 2e machtswortel van de variantie en wordt op onderstaande wijze berekend: Standaarddeviatie = s = 2VAR = VAR^1/2
Voorbeeld: Standaarddeviatie = s = 2VAR = 295,6 = 17,2
Formule standaarddeviatie in Excel: = STDEVP(n1:nx) In deze formule zijn n1 en nx de eerste respectievelijk de laatste cel in het spreadsheet waarnaar wordt verwezen.
5.4
Variatiecoëfficiënt
De variatiecoëfficiënt is de gemiddelde afwijking van een reeks waarnemingen uitgedrukt in procenten van het rekenkundig gemiddelde van de reeks getallen. De variatiecoëfficiënt is een maatstaf voor de relatieve spreiding in een verdeling. De standaardafwijking is gebaseerd op het rekenkundig gemiddelde, zodat de spreiding van variabelen met uiteenlopende gemiddelden onvergelijkbaar is. De variatiecoëfficiënt maakt vergelijking van de spreiding van verschillende variabelen mogelijk door de standaarddeviatie te delen door het rekenkundig gemiddelde: Variatiecoëfficiënt = σ / μ = s / RG
Voorbeeld: Variatiecoëfficiënt = σ / μ = s / RG = 17,2 / 34,5 = 0,5 = 50%
CCP Mod1 - Reader Statistiek
Pagina 15 van 17
6.
Voorbeeldopgave statistiek
Een organisatie hanteert voor al haar klanten een standaard betalingstermijn van 30 dagen. Onderstaand treft u een overzicht aan van de openstaande facturen per 30 juni 2008. Factuurnummer
# openstaande dagen
080043
66
080045
61
080059
59
080060
59
080063
53
080068
49
080071
45
080076
41
080080
32
080081
32
080082
32
080084
31
080089
27
080090
26
080092
21
080093
21
080095
18
080097
15
080098
15
080099
12
Gevraagd: a.
Stel de aging list op met brackets van 30 dagen
b.
Hoeveel % van de verzonden facturen is overdue?
c.
Wat is de modus (geef de definitie)?
d.
Bereken de modus (Mo)
e.
Wat is de mediaan (geef de definitie)?
f.
Bereken de mediaan (Me).
g.
Bereken het rekenkundig gemiddelde.
h.
Bereken de variantie (VAR).
i.
Wat is de standaarddeviatie (geef de definitie)?
j.
Bereken de standaarddeviatie (s).
k.
Geef een oordeel over het betalingsgedrag op basis van bovenstaande cijfers. Welke berekening(en) is/zijn op basis van deze cijfers doorslaggevend voor uw oordeel?
CCP Mod1 - Reader Statistiek
Pagina 16 van 17
Antwoorden: a.
b.
Stel de aging list op met brackets van 30 dagen 00 t/m 30 dagen
: 8 facturen
31 t/m 60 dagen
: 10 facturen
61 t/m 90 dagen
: 2 facturen
Hoeveel % van de verzonden facturen is overdue? (10 + 2) / (8 + 10 + 2) = 60%
c.
Wat is de modus (geef de definitie)? Mo = de meest waargenomen variabele uit een verzameling waarnemingen (meest voorkomende waarde van een stochastische variabele).
d.
Bereken de modus (Mo). 32
e.
Wat is de mediaan (geef de definitie)? Me = de middelste waarneming van een verzameling getallen die naar opklimmende grootte gerangschikt is.
f.
Bereken de mediaan (Me). 32
g.
Bereken het rekenkundig gemiddelde. 35,75
h.
Bereken de variantie (VAR). 281,59
i.
Wat is de standaarddeviatie (geef de definitie)? s = standaarddeviatie, standaardafwijking = maatstaf voor variatie tussen een aantal waarnemingen.
j.
Bereken de standaarddeviatie (s). 16,78
k.
Geef een oordeel over het betalingsgedrag op basis van bovenstaande cijfers. Welke berekening(en) is/zijn op basis van deze cijfers doorslaggevend voor uw oordeel?
CCP Mod1 - Reader Statistiek
Pagina 17 van 17