Leidt blind tellen van de voorraad tot minder telfouten dan niet-blind tellen? Een onderzoek naar telmethoden bij inventarisaties
Nyenrode School of Accountancy & Controlling opleiding master Accountancy Naam opstellers: Studentennummers:
R.E. (Dolf) Duivenvoorden 03156927
Begeleider: Examinator: Vakgroep: Datum verdediging:
Drs. P.C. van Batenburg J.H.G Kinds RA Auditing 15 juli 2011
J.C. (Niels) van de Koppel 03156827
Inhoudsopgave VOORWOORD ........................................................................................................................ 3 MANAGEMENT SAMENVATTING .......................................................................................... 4 1
INLEIDING ....................................................................................................................... 6 1.1 AANLEIDING ONDERZOEK ............................................................................................. 6 1.2 VAN AANLEIDING NAAR PROBLEEMSTELLING ................................................................... 7 1.2.1 Onderzoeksdoelstelling ..................................................................................... 7 1.2.2 Relevante onderzoeksvragen ............................................................................ 8 1.3 REIKWIJDTE, METHODIEK EN RELEVANTIE ONDERZOEK .................................................... 9 1.4 EERDER VERRICHT ONDERZOEK .................................................................................. 10 1.5 HOOFDSTUKINDELING ................................................................................................ 11
2
LITERATUUR ................................................................................................................ 12 2.1 VOORRAADADMINISTRATIE ......................................................................................... 13 2.2 TELLEN VAN DE VOORRAAD ........................................................................................ 16 2.2.1 Tellers zijn feilbaar .......................................................................................... 16 2.2.2 Voorraadinventarisatie en de accountantscontrole ........................................... 17 2.3 ANCHORING .............................................................................................................. 22 2.3.1 Tversky en Kahneman (1974).......................................................................... 22 2.3.2 Anchoring in een accountancykader ................................................................ 29 2.3.3 NV COS .......................................................................................................... 35 2.4 AUDIT QUALITY.......................................................................................................... 36
3
CONCEPTUEEL MODEL EN HYPOTHESEN ................................................................ 40 3.1 AFZONDERLIJKE VARIABELEN ...................................................................................... 40 3.1.1 Voorinformatie ................................................................................................. 40 3.1.2 Controlevariabelen .......................................................................................... 41 3.2 CONCEPTUEEL MODEL ............................................................................................... 43 3.3 INVLOED VAN AANWEZIGHEID VAN EN HET SOORT VOORINFORMATIE OP MODELCOËFFICIËNTEN VAN CONTROLEVARIABELEN .................................................................. 44
4
TELPROCEDURES BIJ DE SUPERMARKTKETEN ...................................................... 46 4.1 4.2 4.3
5
TELLINGEN KWARTAALAFSLUITING ............................................................................... 46 INCIDENTELE TELLINGEN VAN DE VOORRAAD ................................................................ 47 KOPPELING NAAR ONDERZOEK .................................................................................... 47
ONDERZOEKSOPZET................................................................................................... 48 5.1 INLEIDING ................................................................................................................. 48 5.2 OPZET EXPERIMENT .................................................................................................. 48 5.2.1 Eerste opzet .................................................................................................... 48 5.2.2 Overige mogelijke onderzoeksvariabelen ......................................................... 49 5.2.3 Uitgesloten controlevariabelen ......................................................................... 51 5.3 UITVOERING EXPERIMENT .......................................................................................... 51
6
ONDERZOEKSRESULTATEN ....................................................................................... 54 6.1 BESCHRIJVING VAN DE RESULTATEN ............................................................................ 54 6.1.1 Karakteristieken van de tellers ......................................................................... 54 6.1.2 Karakteristiek van de data ............................................................................... 56 6.2 AFZONDERLIJKE ANALYSE VAN DE VARIABELEN ............................................................. 57
–1–
6.2.1 Juiste voorinformatie of geen voorinformatie .................................................... 58 6.2.2 Onjuiste voorinformatie of geen voorinformatie ................................................ 58 6.2.3 Blind of niet-blind ............................................................................................. 59 6.2.4 Richting van de fouten in de voorinformatie ..................................................... 59 6.2.5 Hoeveelheid per artikel .................................................................................... 60 6.2.6 Leeftijd, relevante werkervaring en opleiding ................................................... 61 6.2.7 Geslacht .......................................................................................................... 66 6.3 LOGISTISCH MODEL ................................................................................................... 67 6.3.1 Theorie............................................................................................................ 67 6.3.2 Variabelen ....................................................................................................... 68 6.3.3 Model .............................................................................................................. 69 6.4 INVLOED VAN ONDERZOEKSVARIABELE OP CONTROLEVARIABELEN .................................. 72 6.4.1 Vier modellen .................................................................................................. 72 6.4.2 Analyse van de coëfficiënten voor het aantal artikelen ..................................... 74 6.4.3 Analyse van de coëfficiënten voor de opleidings- en ervaringsscore ................ 75 7
CONCLUSIE .................................................................................................................. 77
NAWOORD............................................................................................................................ 79 LITERATUURLIJST ............................................................................................................... 80
–2–
Voorwoord Voor u ligt de masterscriptie die wij geschreven hebben in het kader van onze Master opleiding Accountancy aan de Nyenrode School of Accountancy & Controlling. Vanwege de interesse van ons beiden in de statistische kant van het vakgebied Auditing kwamen wij al snel uit bij dhr. van Batenburg. Na enige mailwisselingen over mogelijke onderwerpen, diende zich een mooie mogelijkheid aan voor een theoretische scriptie gebaseerd op een discussie uit de dagelijkse praktijk. Bij een landelijke opererende supermarktketen bestond een interessant verschil van inzicht tussen de controlerend accountant en de verantwoordelijke functionarissen bij dit bedrijf belast met inventarisatie van de voorraad. Vanuit zijn achtergrond als docent aan de Nyenrode School of Accountancy & Controlling en erkend statisticus kwam het vraagstuk bij dhr. van Batenburg terecht en daardoor uiteindelijk bij ons. Vanaf het begin zijn wij enthousiast geweest over dit onderwerp voornamelijk omdat het een onderwerp is dat raakvlakken heeft met meerdere vakgebieden (psychologie, statistiek en auditing) en er nog relatief weinig literatuur en onderzoek beschikbaar is op het gebied van telmethoden bij inventarisaties van de voorraad. Dit geeft ons de mogelijkheid om vernieuwend onderzoek te doen. Ook de onderzoeksvorm, een experiment, sprak ons erg aan. Helaas is het ons niet gelukt de masterscriptie af te ronden voor de start van het traditionele busy season binnen de accountancy. Om een dergelijk experiment uit te kunnen voeren bij een landelijk opererende supermarktketen moet tussen alle betrokken partijen, volkomen begrijpelijk, het nodige afgestemd worden. Wij zijn de landelijk opererende supermarktketen en in het bijzonder het filiaal waar wij ons experiment hebben uitgevoerd zeer erkentelijk voor het meewerken aan ons onderzoek. In het bijzonder dhr. C. Mulder en zijn enthousiaste medewerkers voor het ter beschikking stellen van hun tijd. Save the best for last, de meeste dank gaat uit naar onze scriptie begeleider dhr. Paul van Batenburg. Paul heeft altijd klaargestaan met deskundige adviezen ten aanzien van de te bewandelen weg en was dan ook een geweldig klankbord voor ons.
–3–
Management samenvatting In deze scriptie wordt verslag gedaan van een onderzoek naar telmethoden bij inventarisaties van de voorraad. De Nederlandse en internationale wet-en-regelgeving bevat geen voorschriften als het gaat om te hanteren telmethoden bij inventarisaties van de voorraad. Accountants worden opgeleid met de gedachte dat bij inventarisaties blind tellen de juiste telmethode is (Jans, 2001). Daarmee wordt bedoeld dat de tellers geen voorinformatie hebben over de te tellen aantallen zoals bijvoorbeeld een voorraadlijst met administratieve hoeveelheden. De voorkeur voor blind tellen is met name gestoeld op de gedachte dat tellers beïnvloed worden door voorinformatie wat de kwaliteit van de telling doet afnemen. Vanuit de praktijk voelt men meer voor het niet-blind tellen (Jansen, 2010). Bij niet-blind tellen kan er in het geval van een verschil tussen de opgenomen waarde in de voorraadadministratie en de getelde waarde, direct herteld worden. In deze scriptie zal de volgende hoofdvraag centraal staan: Leidt blind tellen van de voorraad tot minder telfouten dan niet-blind tellen? Op basis van de anchoring theorie van Tversky en Kahneman (1974) wordt verwacht dat blind tellen bij inventarisaties tot minder telfouten zal leiden dan niet-blind tellen. De hoofdvraag is door middel van een veldexperiment bij een landelijk opererende supermarktketen beantwoord. Tijdens het experiment zijn 803 waarnemingen verzameld. Het blind tellen van de voorraad werd benaderd door de tellers met hardcopy lijsten te laten werken waar geen opgenomen hoeveelheden op staan. Het niet-blind tellen van de voorraad werd gesimuleerd door het tellen van de voorraad met een handterminal waarin de opgenomen hoeveelheden vermeld staan. Er zijn 374 waarnemingen verzameld door tellers zonder voorinformatie en 429 door tellers met voorinformatie. Die voorinformatie was in het experiment gemanipuleerd waardoor sommige tellers onjuiste voorinformatie kregen. Die kon bestaan uit een te lage waarde of uit een te hoge waarde.
–4–
In dit onderzoek is met een logistisch regressiemodel aangetoond dat de kans op een juiste telling met 116% toeneemt indien juiste in plaats van geen voorinformatie wordt verstrekt. De kans op een juiste telling neemt met 56% af indien te lage voorinformatie in plaats van geen voorinformatie wordt vermeld en met 40% indien te hoge voorinformatie in plaats van geen voorinformatie wordt vermeld. De anchoring theorie van Tversky en Kahneman blijkt dus ook voor tellen van de voorraad te gelden. Voorts is gegeven de veelheid aan fouten in voorraadadministraties, de impact van de slechtere tellingen als gevolg van onjuiste voorinformatie groter dan de impact van juiste voorinformatie. Aangezien inventarisaties er op zijn gericht fouten op te sporen zijn de gevolgen van onjuiste voorinformatie groter dan van juiste voorinformatie. Het antwoord op de hoofdvraag luidt dus: Blind tellen van de voorraad leidt tot minder telfouten dan niet-blind tellen. In dit onderzoek is ook aangetoond dat de hoeveelheid telfouten negatief wordt beïnvloed door de hoeveelheden per artikel. Daarnaast is aangetoond dat de (positieve) invloed van opleiding en ervaring op de kwaliteit sterker is bij onjuiste voorinformatie dan zonder voorinformatie. Dit impliceert dat organisaties er goed aan doen om ervaren mensen in te zetten mochten ze, ondanks de uitkomsten van dit onderzoek, besluiten de voorraad niet-blind te tellen.
–5–
1
Inleiding
1.1
Aanleiding onderzoek
Bij veel organisaties vormt de voorraad één van de belangrijkste bezittingen op de balans. Dergelijke organisaties hebben om deze reden een groot belang bij een goed inzicht in deze post. Een belangrijk middel om het goede inzicht in de voorraad te krijgen en te behouden is het aanhouden van een voorraaddaministratie en het valideren van die administratie door fysieke tellingen van de voorraad. Afhankelijk van de soort voorraden en het belang hiervan kiezen organisaties voor periodieke tellingen van de voorraad. Dit kan jaarlijks plaatsvinden, maar ook frequenter zoals per kwartaal, per maand of zelfs dagelijks. In het kader van de wettelijke controle van de jaarrekening zal de accountant ook zekerheid willen verkrijgen over de juiste en volledige weergave van de voorraadwaarde op de balans. De NV COS standaard 501 handelt specifiek over het verkrijgen van voldoende en geschikte controle-informatie door de accountant betreffende het bestaan en de conditie van de voorraad. In dit kader zal de controlerende accountant eisen stellen aan de voorraadadministratie en de inventarisatieprocedures van de te controleren organisaties. Een veel gestelde voorwaarde is dat de organisaties hun personeel bij een inventarisatie van de voorraad ‘blind’ moeten laten tellen (Jans, 2001). Onder blind tellen van de voorraad wordt verstaan dat tellers geen voorinformatie hebben ten aanzien van de opgenomen hoeveelheden in de voorraadadministratie. Met voorinformatie wordt in dit kader bedoeld dat de teller weet welke hoeveelheid in de voorraadadministratie is opgenomen. Deze voorinformatie kan zowel juist als onjuist zijn. Binnen het vakgebied van de accountancy wordt men opgeleid met de gedachte dat blind tellen van de voorraad leidt tot kwalitatief betere tellingen van de voorraad en daarom altijd de voorkeur verdient boven niet-blind tellen van de voorraad (Jans, 2001). De belangrijkste uitleg hiervoor is dat de tellers op deze manier niet naar de aantallen in de voorraadadministratie toe zouden schatten en er achteraf een onafhankelijke hertelling plaats zou vinden indien er verschillen gevonden worden. Voorstanders van niet-blind tellen van de voorraad beargumenteren dat blind tellen van de voorraad minder efficiënt is dan niet-blind tellen van de voorraad (Jansen, 2010). De
–6–
tellers kunnen in het geval van afwijkingen direct ter plaats hertellen, waardoor hertellingen van de voorraad achteraf overbodig worden. De, United States General Accounting Office (GAO)1, vermeldt in ‘Best practices in achieving consistent, accurate physical counts of inventory and related property’ het volgende over blind tellen bij inventarisaties (blind counts) (GAO, 2002): ‘’A blind count refers to the performance of a physical inventory count without the knowledge of, or access to, the on-hand quantity balance in the inventory records. Counters are provided the part number, description, location, and other information necessary to perform the count but not the item quantity information. Inventory items are counted and compared to the on-hand balance in the inventory records. If the blind count agrees with the record on-hand balance, there is a high level of confidence that both the count and the record on-hand balance are accurate.’’ Hoewel accountants worden opgeleid met de gedachte dat blind tellen beter is dan niet-blind tellen bij inventarisaties, is hier weinig wetenschappelijke onderbouwing voor en bestaat er geen wet-en-regelgeving die dit verplicht. In deze scriptie wordt onderzoek gedaan naar de wijze van tellen, teneinde een wetenschappelijke onderbouwing te krijgen voor de keuze om al dan niet blind te tellen.
1.2
Van aanleiding naar probleemstelling
1.2.1 Onderzoeksdoelstelling Met het onderzoek in deze scriptie naar de relatie tussen telmethoden en de kwaliteit van de tellingen bij inventarisatie van de voorraad wordt ingesprongen op leemtes in de wetenschappelijke literatuur en wet-en-regelgeving op het gebied van inventarisaties van de voorraad. Gezien het beperkte wetenschappelijk onderzoek dat naar inventarisaties van de voorraad is verricht vormt het onderzoek in deze scriptie een verkennend onderzoek, waarmee de telmethoden worden onderzocht, maar ook beoogd wordt om aanzet te geven tot grootschaliger onderzoek. Naar aanleiding hiervan is de volgende onderzoeksdoelstelling geformuleerd:
1 GAO is een onafhankelijke instantie die werkt voor het Amerikaanse congres.
–7–
Het onderzoek is gericht op het verkrijgen van kennis en inzicht in de kwaliteit van verschillende telmethoden (blind en niet-blind tellen) bij inventarisaties van de voorraad.
1.2.2 Relevante onderzoeksvragen Zoals hiervoor beschreven, worden voorraadinventarisaties in principe blind uitgevoerd, dat wil zeggen er wordt geteld zonder op voorhand te weten welke hoeveelheid in de voorraadadministratie is opgenomen. Blind tellen van de voorraad is tijdrovender dan tellen van de voorraad met kennis van de opgenomen hoeveelheden, omdat telverschillen na afloop van de telling uitgezocht moeten worden. Wanneer er niet-blind wordt geteld kan de teluitkomst direct met de opgenomen hoeveelheid worden vergeleken. Bij een eventueel verschil kan dan direct herteld worden om de oorzaak van het verschil vast te stellen (fout in voorraadadministratie of telfout). De reden dat ondanks de grotere tijdsbesteding vaak toch voor blind tellen van de voorraad wordt gekozen is waarschijnlijk te herleiden tot het feit dat dit in de accountants- en controllers opleidingen wordt voorgeschreven. Deze voorkeur kan echter niet onderbouwd worden met wetenschappelijk onderzoek of wet-en-regelgeving. In deze scriptie wordt een eerste aanzet gedaan om deze leemte op te vullen. Het onderzoek is gericht op het verkrijgen van kennis en inzicht in de kwaliteit van verschillende telmethoden (blind en niet-blind tellen) bij inventarisaties van de voorraad. De hoofdvraag luidt als volgt: Leidt blind tellen van de voorraad tot minder telfouten dan niet-blind tellen? Bij niet-blind tellen van de voorraad moet onderscheidt worden gemaakt tussen twee varianten. Tellen met juiste voorinformatie en tellen met onjuiste voorinformatie. Bij tellen met juiste voorinformatie zou een eventuele beïnvloeding naar verwachting geen negatieve invloed kunnen hebben op de kwaliteit van de telling. Als men zich zou laten beïnvloeden door deze voorinformatie, dan wordt naar het juiste aantal toe geteld. Bij onjuiste voorinformatie zal eventuele beïnvloeding naar verwachting wel negatieve invloed hebben op de kwaliteit van de telling. Wanneer men zich zou laten beïnvloeden door deze voorinformatie, dan wordt naar het onjuiste aantal toe geteld en wordt een eventuele fout in de voorraadadministratie minder snel opgemerkt. Of dit fenomeen zich in de praktijk daadwerkelijk voordoet, of dat tellers hier niet door zullen worden beïnvloed, moet worden onderzocht om de hoofdvraag te kunnen beantwoorden. Hierbij zal tevens onderzocht worden of het in dit kader nog uitmaakt of de onjuiste
–8–
voorinformatie te hoog of te laag is. Naar aanleiding van hetgeen hierboven is beschreven, is de volgende deelvraag geformuleerd: Welke invloed heeft voorinformatie op de kwaliteit van de telling? Tellen kan worden gezien als een specifieke en redelijk exacte vorm van schatten. Schatten wordt moeilijker naarmate de omvang toeneemt, de materie complexer wordt of de betrouwbaarheid van de opgenomen voorraadwaarden lager wordt. Op basis hiervan bestaat de verwachting dat in onderzoek naar de invloed van voorinformatie op de kwaliteit van de telling gecontroleerd moet worden voor de hoeveelheden per artikelvan de tellen voorraad. Daarnaast zal onafhankelijk van het al dan niet aanwezig zijn van voorinformatie onderzocht worden wat de invloed van de hoeveelheden per artikel van de te tellen voorraad is op de kwaliteit van de telling. Daarom zal de volgende deelvraag onderzocht worden: Welke invloed heeft de hoeveelheid per artikel op de kwaliteit van de telling? Om na het beantwoorden van voornoemde deelvragen nog meer kennis en inzicht te verkrijgen in telmethoden en de kwaliteit van de telling, willen wij gaan onderzoeken of de factoren die van invloed zijn op de kwaliteit van de telling, de kwaliteit anders beïnvloeden bij verschillende telmethoden. Heeft de omvang van de te tellen voorraad meer invloed op de kwaliteit van de telling wanneer met onjuiste voorinformatie wordt geteld dan wanneer zonder voorinformatie wordt geteld? Daarom willen de volgende deelvraag onderzoeken: Hoe beïnvloedt de aard van de informatieverstrekking de relatie tussen de controlevariabelen en de kwaliteit van de telling?
1.3
Reikwijdte, methodiek en relevantie onderzoek
De controle van de accountant op de post voorraad in de balans bestaat uit een controle op zowel het bestaan als op de waardering van de voorraad. In dit onderzoek wordt volledig geabstraheerd van het waarderingsaspect van de voorraden. Dit onderzoek is uitsluitend gericht op tellingen van de voorraad en er wordt alleen onderzoek gedaan naar de telwijzen die gebruikt worden voor de controle van de voorraad.
–9–
Om onderzoek te doen naar de in paragraaf 1.2.2 geformuleerde onderzoeksvragen en uiteindelijk de probleemstelling te beantwoorden zal gebruik worden gemaakt van een experiment als onderzoeksmethode. Een experiment is voor dit onderzoek geschikt omdat de werkelijkheid in een relatief2 afgesloten omgeving goed benaderd kan worden. In deze omgeving kunnen de onderzoeks- en controlevariabelen bovendien redelijk goed beheerst en gemanipuleerd worden, om uiteindelijk de invloed van deze variabelen op de kwaliteit van de telling te onderzoeken. Wij zullen ons onderzoek uitvoeren in een filiaal van een landelijke supermarktketen. Dit filiaal heeft personeel beschikbaar gesteld om onder door ons gewenste omstandigheden tellingen van de voorraad te verrichten. Dit onderzoek is relevant voor het vakgebied auditing omdat er op het gebied van de wijze van inventariseren (telmethoden) slechts zeer beperkt relevant wetenschappelijk onderzoek is verricht en geen specifieke wet-en-regelgeving bestaat. Accountants worden opgeleid met de gedachte dat blind tellen van de voorraad de enige juiste methode van inventariseren is, terwijl dit niet wetenschappelijk is onderbouwd.
1.4
Eerder verricht onderzoek
Zoals al eerder is aangegeven is er slechts in zeer beperkte mate wetenschappelijk onderzoek uitgevoerd naar telmethoden bij voorraadinventarisaties op het vakgebied auditing. Daarentegen is wel relevant wetenschappelijk onderzoek verricht in de aangrenzende vakgebieden psychologie (met name anchoring is hierbij interessant) en logistiek (voorraadbeheersing). Ook waar de vakgebieden psychologie en auditing elkaar overlappen (confirmation bias en outcome knowledge) is relevant wetenschappelijk onderzoek verricht. Deze artikelen zullen behandeld worden in de literatuurstudie voor dit onderzoek om mogelijke uitkomsten van het experiment te toetsen op relevantie en aannemelijkheid. Omdat wetenschappelijk onderzoek naar de kwaliteit van tellingen van de voorraad beperkt is zal kennis genomen worden van wetenschappelijk onderzoek op het gebied van audit quality om op die manier inzicht te verkrijgen in de controlevariabelen die in het onderzoek gehanteerd gaan worden. Hierbij wordt verondersteld dat de kwaliteit 2 Verwezen wordt naar hoofdstuk 5 voor de beperkingen van de setting van het experiment.
– 10 –
van accountantscontroles in zekere zin vergelijkbaar zijn met kwaliteit van tellingen van de voorraad. Tellingen van de voorraad zijn immers een vorm van controle.
1.5
Hoofdstukindeling
Voor dit onderzoek is een uitgebreide literatuurstudie verricht. Deze literatuurstudie wordt besproken in hoofdstuk 2. In hoofdstuk 3 zullen aan de hand van de uit de literatuur opgedane inzichten hypothesen worden geformuleerd en een conceptueel model worden opgesteld. In hoofdstuk 4 zullen de telprocedures bij de landelijk opererende supermarktketen, waar het experiment uitgevoerd zal gaan worden, toegelicht worden. De opzet en uitvoering van het experiment wordt behandeld in hoofdstuk 5, hierin worden ook de beperkingen van dit experiment behandeld en worden gemaakte keuzes gemotiveerd. In hoofdstuk 6 worden de resultaten van het experiment besproken en geanalyseerd. In hoofdstuk 7 worden vervolgens conclusies getrokken, worden de uitkomsten gekoppeld aan de relevante wetenschappelijke literatuur en worden de geformuleerde onderzoeksvragen en de probleemstelling beantwoord. De scriptie zal afgesloten worden met een nawoord in hoofdstuk 8.
– 11 –
2
Literatuur
De post voorraden brengt bij veel organisaties vaak hoge kosten met zich mee. Hierbij moet gedacht worden aan opslagkosten, verzekeringskosten, financieringskosten en verouderingskosten. De redenen dat bedrijven voorraad aanhouden zijn flexibiliteit in de productie, lagere bestelkosten bij grotere bestellingen en onzekerheid omtrent de vraag van de afnemers (Relph, Brzeski en Bradbear, 2002). De noodzaak om voorraad aan te houden enerzijds en voorraadkosten anderzijds maken een effectieve voorraadbeheersing een kritische succesfactor voor bedrijven om te overleven in een competitieve omgeving. De doelstelling van een voorraadbeheersingssysteem is het minimaliseren van de voorraadkosten enerzijds en het beperken van voorraadtekorten anderzijds. Voorraadbeheersingssystemen zijn er in allerlei soorten en maten. Van eenvoudige systemen die waarborgen dat de voorraad maandelijks weer op het gewenste niveau wordt gebracht tot geavanceerde systemen waarbij dagelijks bepaald wordt of en zo ja hoeveel er besteld moet worden aan de hand van statistische analyses waarmee de verwachte vraag wordt geschat. Alle voorraadbeheersingssystemen, van de meest eenvoudige tot de meest complexe, baseren zich op de voorraadadministratie. Een accurate voorraadadministratie is dan ook een belangrijke voorwaarde om de voordelen van een voorraadbeheersingssysteem volledig te kunnen benutten. De nauwkeurigheid van de voorraadadministratie is afhankelijk van een veelheid aan factoren, zoals aard van de producten, soort magazijn (open of gesloten), procedures om de voorraad te beheersen en omloopsnelheid van de producten. Ondanks hoge mate van voorraadbeheersing, blijft de kans op voorraadverschillen groot (DeHoratius en Raman, 2008). Om deze verschillen te kunnen identificeren en corrigeren, zijn periodieke inventarisaties van de voorraad nodig. Bij inventarisaties wordt (een deel van) de voorraad geteld en wordt met de uitkomst van deze telling de voorraadadministratie bijgewerkt. Zoals in hoofdstuk 1 beschreven is, kan de telling zowel blind als niet-blind plaatsvinden. De mogelijkheid bestaat dat bij het niet-blind tellen de telling zelf wordt beïnvloed door de kennis van de uitkomst. In de psychologische wetenschap bestaat dit verschijnsel bekend als anchoring. Dit hoofdstuk is verder als volgt ingedeeld. Eerst zal de literatuur over de oorzaken en gevolgen van fouten in de voorraadadministratie besproken worden. Vervolgens wordt – 12 –
de literatuur over het tellen zelf besproken. Wetenschappelijk onderzoek naar tellen is echter schaars. Hier zal een interessant onderzoek van Raats et al. (2003 en 2006) naar de fallible auditor (feilbare accountant) besproken worden. Dit gaat over een model om een controleur (een teller) te controleren. In dit gedeelte zal ook een zijstap naar NV COS 500 en NV COS 501 gemaakt worden. Na de bespreking van het tellen zal het fenomeen anchoring besproken worden. Dit deel zal worden opgesplitst in twee delen. In het eerste deel zal uitgebreid stil worden gestaan bij het toonaangevende artikel van Tversky en Kahneman uit 1974 (Judgement under Uncertainty: Heuristics and Biases), waarin drie vuistregels van het menselijk brein voor het nemen van beslissingen onder onzekerheid (schatten) worden behandeld (representativeness, availability en adjustment and anchoring). In het tweede deel zal het begrip anchoring in een auditing kader behandeld worden. In dit kader wordt met name aandacht geschonken aan twee begrippen, confirmation bias (het fenomeen dat bevestigende informatie wordt hogere waarde toegekend dan ontkrachtende informatie) en outcome knowledge (het fenomeen dat kennis van de uitkomst de ex ante inschatting van deze uitkomst beïnvloedt). Tevens zal NV COS 520 besproken worden. De literatuurstudie zal worden afgesloten met een bespreking van literatuur op het gebied van audit quality. Voorraadinventarisatie is een vorm van controleren. Om te onderzoeken welke effecten (naast anchoring) nog meer invloed kunnen hebben op de kwaliteit van de telling, zal besproken worden welke factoren volgens de wetenschappelijke literatuur invloed kunnen hebben op de kwaliteit van controles en dus ook invloed zouden kunnen hebben op de kwaliteit van tellingen van de voorraad.
2.1
Voorraadadministratie
Het voeren van een voorraadadministratie klinkt eenvoudig. De inkoop van een artikel wordt als toename in de voorraadadministratie verwerkt en bij verkoop van een artikel als afname van de voorraadadministratie. Indien dit consequent en zorgvuldig gedaan wordt, zou aan het eind van de periode de voorraadadministratie exact gelijk moeten zijn aan de fysiek aanwezige voorraad. In de praktijk blijkt dit echter vrijwel nooit het geval te zijn. DeHoratius en Raman (2008) hebben onderzoek gedaan naar de oorzaken en gevolgen van fouten in de voorraadadministratie. Uit dit onderzoek blijkt dat er zoveel mis kan gaan met de voorraadadministratie, dat het zo goed als onmogelijk is om geen verschillen tussen de voorraadadministratie en de werkelijke voorraad te hebben.
– 13 –
Als belangrijkste redenen voor verschillen tussen de werkelijke voorraad en de voorraadadministratie noemen zij onjuiste verkoopgegevens, onjuiste inkoopgegevens, onjuiste verwerking van retourzendingen, synchronisatiefouten, diefstal door klanten, diefstal door werknemers en ook onjuiste tellingen bij voorraadinventarisaties. Onjuiste verkoopgegevens kunnen ontstaan wanneer een artikel bij verkoop niet wordt aangeslagen, of als een verkoper bij twee gelijk geprijsde artikelen één dubbel aanslaat en de ander niet. Onjuiste inkoopgegevens kunnen ontstaan wanneer een levering van het distributiecentrum niet overeenkomt met de bestelling (die in de administratie wordt verwerkt). Retourzendingen die niet (of niet juist) leiden tot een onvolledige voorraadadministratie. Synchronisatiefouten kunnen ontstaan als interfaces tussen verschillende geautomatiseerde systemen niet goed zijn ingericht of door tijdsverschillen tussen voorraadbewegingen en het daadwerkelijk bijwerken van de administratie. Als bij inventarisaties onjuiste tellingen worden uitgevoerd, zal de administratie naar aanleiding van deze telling foutief worden bijgewerkt. Uit onderzoek van Rinehart (1960) blijkt dat een aanzienlijk deel van de voorraadverschillen wordt veroorzaakt door procedures om voorraadverschillen te corrigeren, zoals inventarisaties. Dit benadrukt het belang om inventarisaties nauwkeurig uit te voeren. Uit het onderzoek van DeHoratius en Raman (2008) blijkt dat ook bij organisaties met sterk geautomatiseerde en efficiënte voorraadsystemen aanzienlijke voorraadverschillen voorkomen. De gevolgen van foutieve informatie in de voorraadadministratie kunnen aanzienlijk zijn, met name in bedrijfstakken waar de marges laag zijn. Uit het onderzoek van DeHoratius en Raman (2008) blijkt dat zelfs kleine voorraadverschillen al tot substantiële gemiste verkopen kunnen leiden. Dit kan het geval zijn wanneer de voorraad niet wordt bijgevuld omdat deze volgens de administratie nog voldoende aanwezig is, terwijl in werkelijkheid de schappen leeg blijken te zijn. Bij grote Amerikaanse handelsondernemingen die door DeHoratius en Raman (2008) zijn onderzocht, blijkt de gemiste omzet meer dan 1% van de totale omzet te zijn. Zoals eerder gememoreerd zijn de gevolgen van foutieve voorraadregistraties groot. Naast mogelijke lege schappen zijn er nog veel meer kostenposten en omzetdervingen mogelijk als gevolg van onjuiste informatie in de voorraadadministratie. Veel bedrijven gebruiken geavanceerde voorraadbeheersingssystemen aan de hand waarvan bestelniveaus, bestelhoeveelheden en soms zelfs prijsstellingen worden bepaald. Indien de voorraadadministratie foutieve informatie bevat zullen de voorraadbeheersingssyste-
– 14 –
men suboptimale beslissingen voorstellen (of nemen) en zullen de voorraadkosten (significant) hoger zijn dan noodzakelijk. Bij productieondernemingen hebben voorraadverschillen niet alleen een negatief effect op de verkopen en de voorraadkosten, maar wellicht ook een verstorend effect op de productieprocessen. Net als het mislopen van voordelen van geautomatiseerde voorraadbeheersingssystemen, kan bij foutieve voorraadadministratie ook niet optimaal geprofiteerd worden van decision support systems die de productieplanning zouden moeten optimaliseren. Voorraadtekorten als gevolg van foutieve informatie kunnen zelfs het hele productieproces stilleggen. Uit het onderzoek van DeHoratius en Raman blijkt dat bij een onderzochte Amerikaanse handelsonderneming met 370.000 verschillende artikelsoorten bij 65% van de artikelsoorten sprake was van verschillen, het gemiddelde absolute voorraadverschil bedroeg 5. DeHoratius en Raman merkten hierbij op dat deze onderneming de interne beheersing rondom de voorraad relatief goed voor elkaar had. Het is aannemelijk dat eventuele verschillen bij ondernemingen die de interne beheersing rondom de voorraden minder op orde hebben, nog veel groter zijn. Verder hebben de onderzoekers aangetoond dat de omvang van voorraadverschillen positief correleren met de jaarlijkse verkopen van een artikelsoort (t=142,58), negatief met de frequentie van voorraadinventarisaties (t=2,96), negatief met de waarde van het artikel (t=23,44) en positief met zowel de dichtheid van het artikel soort (aantal per m3 schapruimte; t=2,80) als de verscheidenheid van artikelsoorten in een winkel (t=2,98). De grote hoeveelheid aan factoren die significante invloed hebben op de aanwezigheid van voorraadverschillen maakt duidelijk dat het niet verwonderlijk is dat voorraadverschillen bij zoveel ondernemingen voorkomen. Gezien de eerder genoemde (financiële) gevolgen van de voorraadverschillen is het voor alle organisaties van groot belang om voorraadverschillen zoveel mogelijk te beperken. Omdat inventarisaties een belangrijke rol spelen bij het opsporen van voorraadverschillen is het zaak om inventarisaties zo efficiënt mogelijk uit te voeren.
– 15 –
2.2
Tellen van de voorraad
2.2.1 Tellers zijn feilbaar In paragraaf 2.1 is het belang van regelmatig en nauwkeurig inventariseren van de voorraad vastgesteld. Onnauwkeurige inventarisaties kunnen zelfs leiden tot de introductie van nieuwe fouten in de voorraadadministratie. Daartegenover staat dat inventariseren vaak een kostbare aangelegenheid is en dat efficiency dus ook erg belangrijk is. Tellers, die niet onbeperkt de tijd hebben, maken fouten, hoe nauwkeurig zij ook willen tellen. Met andere woorden, tellers zijn feilbaar. Om deze fouten te ondervangen zal naast de inventarisatie een (kleinere) hertelling kunnen plaatsvinden door een verondersteld onfeilbare controleur, iemand, die bijvoorbeeld meer tijd per telling of meer ervaring heeft. Raats et al. (2003, 2006) hebben een model ontwikkeld waarin de uitkomsten van een controle die door een feilbare controleur (in casu de teller) gecombineerd kunnen worden met de uitkomsten van onfeilbare controleur om zo tot betrouwbaardere resultaten te komen. Zij noemen dit de repeated audit methode. In hun onderzoek behandelen Raats et al. (2003) een casus waarbij een controleur een steekproef van 500 posten beoordeelt. Hierin wordt een foutfractie van 3,2% aangetroffen met een bovengrens van 4,8%3. Vervolgens wordt een deelwaarneming van 53 posten op de oorspronkelijke steekproef uitgevoerd door een tweede onafhankelijke controleur. Deze tweede controleur wordt aangenomen onfeilbaar te zijn. Deze deelwaarneming bevat twee posten die door de eerste controleur als fout zijn aangemerkt. Deze posten blijken inderdaad ook fout te zijn, daarnaast vindt de tweede controleur nog een post die fout is. Raats et al. hanteren een model dat in 1972 is geïntroduceerd door Tenenbein4, dit model wordt vervolgens uitgebreid opdat het ook meerdere lagen van controles kan verwerken. Er kan bijvoorbeeld sprake zijn van een eerste controle, een tweede controle hierop, beide door feilbare controleurs, waarbij de tweede geacht wordt een betere kwaliteit te leveren dan de eerste en vervolgens een derde controle door een onfeilbare controleur. Een bijzondere uitkomst van het onderzoek is dat de bovengrens van de foutfractie altijd hoger ligt dan zonder controle, ook al vindt de tweede controleur geen aanvullende fouten. Dit wordt veroorzaakt doordat de onderzoekers in hun model de assumptie dat de controleur foutloos controleert, loslaten.
3 Bij 95% betrouwbaarheid.
4 Raats et al. (2003) verwijzen naar: Tenenbein, A., (1971), “A double sampling scheme for estimating from inspection”,
Technometrics, 14, p. 187–202.
– 16 –
In de praktijk van inventarisaties zou een dergelijk model dat door Raats et al. is gebruikt en verfijnd ook toegepast kunnen worden. Hierdoor kan een controle op de telling niet alleen worden gebruikt om een oordeel te geven over de kwaliteit van de telling, maar in samenhang met de uitkomsten van de oorspronkelijke telling kan deze informatie ook worden gebruikt om een oordeel te geven over de kwaliteit van de oorspronkelijke informatie in de voorraadadministratie. Hoewel (gedeeltelijke) hertelling een effectieve methode is om de kwaliteit van de oorspronkelijke telling(en) te meten, wordt de nauwkeurigheid van de telling niet hoger (de bovengrens van de foutfractie ligt altijd hoger). Dit zou wellicht een reden kunnen zijn dat deze statistische controle op inventarisaties in de praktijk zelden wordt toegepast.
2.2.2 Voorraadinventarisatie en de accountantscontrole Inventarisatie speelt een belangrijke rol bij accountantscontroles. NV COS 501.4 stelt niet voor niets: ‘’ Indien de voorraad van materieel belang is voor de financiële overzichten dient de accountant voldoende en geschikte controleinformatie te verkrijgen met betrekking tot het bestaan en de conditie van de voorraad (….). ‘’ NV COS 500 gaat over controle-informatie. Controlestandaard 500.5e definieert controle-informatie als volgt: "Informatie die door de accountant wordt gebruikt om te komen tot de conclusies waarop het oordeel van de accountant is gebaseerd. Controle-informatie omvat zowel de informatie die is opgenomen in de administratie die ten grondslag ligt aan de financiële overzichten als andere informatie.’’ De accountant dient de betrouwbaarheid en toepasbaarheid van de controle-informatie te beoordelen, hoewel dit een zekere mate van professional judgement vereist kan wel een aantal algemeen geldende uitspraken over de betrouwbaarheid gedaan worden.
– 17 –
Dit zijn volgens NV COS 500 A31: –
De betrouwbaarheid van controle-informatie neemt toe wanneer deze is verkregen uit onafhankelijke bronnen buiten de entiteit;
–
De betrouwbaarheid van controle-informatie die intern is gegenereerd neemt toe wanneer de daarmee verband houdende door de entiteit vastgestelde interne beheersingsmaatregelen, met inbegrip van die voor het opstellen en onderhouden daarvan, effectief zijn;
–
Controle-informatie die direct door de accountant wordt verkregen (bijvoorbeeld de waarneming van het toepassen van een interne beheersingsmaatregel) is betrouwbaarder dan controle-informatie die indirect of door gevolgtrekking wordt verkregen (bijvoorbeeld door het verzoeken om inlichtingen over het toepassen van een interne beheersingsmaatregel);
–
Controle-informatie in de vorm van een vastlegging, hetzij op papier, elektronisch, dan wel via een ander medium, is betrouwbaarder dan mondeling verkregen informatie (bijvoorbeeld een tijdens een vergadering gemaakt schriftelijke vastlegging is betrouwbaarder dan een mondelinge weergave van de besproken aangelegenheden achteraf);
–
Controle-informatie die wordt verschaft door originele documenten is betrouwbaarder dan controle-informatie die wordt verschaft door fotokopieën of faxen of door documenten die zijn gefilmd, gedigitaliseerd of op andere wijze zijn omgezet in elektronische vorm, waarvan de betrouwbaarheid kan afhangen van de interne beheersingsmaatregelen bij het opstellen en onderhouden ervan.
In het kader van voorraadinventarisaties is met name de derde uitspraak interessant. Wanneer de accountant zelf de inventarisatie verricht, dan wel zelf de inventarisatie waarneemt levert dit in zijn algemeenheid zeer betrouwbare controle-informatie ten aanzien van het bestaan van de voorraad van de gecontroleerde entiteit.
– 18 –
In NV COS 500 A14 tot en met A25 wordt onderscheid gemaakt tussen verschillende soorten controlewerkzaamheden die de accountant kan verrichten om controleinformatie te verkrijgen: –
inspectie
–
waarneming
–
externe confirmatie
–
herberekening
–
herhalen van de uitvoering
–
cijferanalyses
–
verzoeken om inlichtingen
Het bijwonen of zelf uitvoeren van inventarisatie kan onder de categorieën inspectie, waarneming en herhalen van de uitvoering geschaard worden. NV COS 500 A14 omschrijft inspectie als:
‘’ Inspectie houdt het onderzoeken van vastleggingen of documenten in, hetzij intern of extern, op papier, elektronisch of vastgelegd in andere media dan wel een fysiek onderzoek van een actief. Inspectie van vastleggingen en documenten verschaft controle-informatie in verschillende mate van betrouwbaarheid, afhankelijk van de aard en de bron daarvan, alsmede, in het geval van interne vastleggingen en documenten, van de effectiviteit van de interne beheersingsmaatregelen over de totstandkoming ervan. Een voorbeeld van inspectie gebruikt als een toetsing van interne beheersingsmaatregelen is inspectie van vastleggingen ten behoeve van onderbouwende informatie over de autorisatie ervan. ‘’
– 19 –
Aanvullend geeft NV COS 500 A16 nog het volgende aan:
‘’ Inspectie van materiële activa kan betrouwbare controle-informatie verschaffen over hun bestaan, maar niet noodzakelijk over de rechten en verplichtingen van de entiteit of de waardering van de activa. Inspectie van individuele voorraad items kan gepaard gaan met de waarneming van voorraadopname.’’
Hierbij wordt een belangrijke beperking van voorraadinventarisaties aangestipt. De controle-informatie die hiermee wordt verkregen geeft informatie over het bestaan van de voorraad, maar veel minder over de waardering hiervan. Uiteraard kan de staat van de voorraad wel worden beoordeeld (bederf e.d.) maar blijft toetsing aan marktprijzen volledig buiten beeld. NV COS 500 A17 omschrijft waarneming als volgt: ‘’Waarneming bestaat uit het kijken naar een proces of procedure dat (die) door anderen wordt uitgevoerd, bijvoorbeeld de waarneming door de accountant van voorraadopname door het personeel van de entiteit of van het uitvoeren van interne beheersingsactiviteiten. Waarneming verschaft controle-informatie over de uitvoering van een proces of procedure, maar is beperkt tot het tijdstip waarop de waarneming plaats heeft en door het feit dat de handeling wordt waargenomen invloed kan hebben op de wijze waarop het proces of de procedure wordt uitgevoerd.’’ De genoemde beperkingen hebben geen negatieve effecten op de betrouwbaarheid van de controle-informatie wanneer de inventarisatie op balansdatum wordt verricht. Voor de controle van de jaarrekening is dit immers het belangrijkste moment om het bestaan van de voorraad vast te stellen. NV COS 501 is een soort addendum op NV COS 500 waarin aanvullende beschouwingen worden gegeven over specifieke onderwerpen. Eén van deze onderwerpen is het bijwonen van inventarisaties (NV COS 501.4 tot en met 501.8). De strekking van deze beschouwing is dat aan het bijwonen van een inventarisatie een grote waarde – 20 –
wordt toegekend en dat vervangende werkzaamheden moeten worden verricht, wil het achterwege laten van inventarisatie geen invloed hebben op de te verstrekken accountantsverklaring (NV COS 501.7). NV COS 501 A3 geeft de volgende punten in overweging aan een accountant die een inventarisatie gaat uitvoeren of bijwonen: –
De risico’s van een afwijking van materieel belang die betrekking hebben op de voorraad.
–
De aard van de interne beheersing die verband houdt met de voorraad.
–
De vraag of verwacht wordt dat adequate procedures zullen worden opgesteld en passende instructies zullen worden uitgebracht voor de fysieke voorraadopname
–
De timing van de fysieke voorraadinventarisatie.
–
De vraag of de entiteit een permanent voorraadbeheersysteem onderhoudt.
–
De locaties waar de voorraad zich bevindt, met inbegrip van de materialiteit van de voorraad en de risico’s van een afwijking van materieel belang op de verschillende locaties, bij het nemen van een beslissing omtrent bij welke locaties het bijwonen van de voorraadopname passend is.
–
De vraag of de assistentie van een door de accountant ingeschakelde deskundige nodig is.
De accountant hoeft niet noodzakelijkerwijs de volledige voorraad te inventariseren of de inventarisatie hiervan bij te wonen. Hij beoordeelt op welke locaties de inventarisatie uitgevoerd of bijgewoond moet worden om het risico op fouten in de voorraad in de jaarrekening tot een aanvaardbaar laag niveau terug te brengen (NV COS 501 A3). Bij het bijwonen van inventarisaties en het toetsen van interne beheersingsmaatregelen, stelt de accountant zowel de volledigheid als de juistheid van de voorraadadministratie vast. Dit doet de accountant door zowel vanuit de voorraadadministratie te selecteren en vast te stellen dat de geselecteerde artikelen daadwerkelijke aanwezig zijn, als van de werkelijke voorraad te selecteren en vast te stellen dat de geselecteerde artikelen ook in de voorraadadministratie voorkomen (NV COS 501 A7).
– 21 –
De aandacht die de controlerichtlijnen aan voorraadinventarisatie besteden staat in schril contrast tot de hoeveelheid aanwezige literatuur hierover. De aandacht die de richtlijnen hieraan geven, evenals de relatieve omvang van de voorraden in de balans van veel ondernemingen, geven de relevantie aan van onderzoek naar een effectieve en efficiënte wijze van inventarisatie op het vakgebied auditing.
2.3
Anchoring
2.3.1 Tversky en Kahneman (1974) Tversky en Kahneman hebben gezaghebbend psychologisch onderzoek gedaan en hebben dit onderzoek in het vakgebied van de economie toegepast. Hiervoor heeft Kahneman in 2002 de Nobelprijs voor de economie gekregen. Het in 1974 gepubliceerd onderzoek (Judgement under Uncertainty: Heuristics and Biases) gaat over het maken van beslissingen onder onzekerheid. Het brein vereenvoudigt kansverdelingen om in complexe situaties beslissingen te kunnen nemen, hetgeen soms leidt tot (voorspelbare) niet-rationele beslissingen. Het is niet ondenkbaar dat deze vereenvoudigingen de beslissingen bij inventarisaties ook kunnen beïnvloeden. Een telling is in zekere zin namelijk ook een beslissing. Een teller telt bijvoorbeeld twintig artikelen maar weet dit niet honderd procent zeker, en beslist vervolgens dat er twintig artikelen liggen. Het onderzoek van Tversky en Kahneman is het meest toonaangevende onderzoek op dit gebied, daarom zullen wij hier uitgebreid bij stil staan. In het artikel van Tversky en Kahneman worden drie vuistregels / vereenvoudigingen (heuristics) behandeld. Representativeness, availability en adjustment and anchoring.
Representativeness Veel vraagstukken waar beslissingen onder onzekerheid worden genomen, kunnen worden teruggebracht tot de volgende types: –
Wat is de kans dat object A behoort tot klasse B?
–
Wat is de kans dat gebeurtenis A het gevolg is van handeling B?
–
Wat is de kans dat handeling B leidt tot gebeurtenis A?
– 22 –
Bij het schatten van deze kansen maken mensen veelal gebruik van de representativeness vuistregel, dat wil zeggen, naarmate A meer op B lijkt, wordt de kans dat A tot B behoort, uit B voortvloeit, of tot B leidt groter geschat. In de praktijk leidt dit tot overschatting. Tversky en Kahneman (1974) hebben zes varianten geïdentificeerd waar representativeness tot overschatting van kansen leidt: –
het negeren van ex-ante kansverdelingen;
–
het negeren van de steekproefomvang;
–
het negeren van de mate van voorspelbaarheid;
–
de misvatting van kansen;
–
de illusie van validiteit;
–
de misvatting van regressie.
De eerste variant van representativeness blijkt uit het volgende experiment. Proefpersonen werden een aantal persoonlijkheidskenmerken voorgelegd van professionals die zogenaamd uit een groep van honderd ingenieurs en advocaten afkomstig was. Aan de proefpersonen werd gevraagd om voor elke professional de kans te schatten dat het een ingenieur betrof. Eén groep proefpersonen had te horen gekregen dat de populatie uit zeventig ingenieurs en dertig advocaten bestond, de tweede groep had te horen gekregen dat de populatie juist uit dertig ingenieurs en zeventig advocaten bestond. Op voorhand zou verwacht mogen worden dat de “odds” op een ingenieur in de eerste groep 5,445 keer groter is dan in de tweede groep. Uit het experiment bleek dat proefpersonen in beide groepen de kans op een ingenieur ongeveer even groot schatten, kennelijk wordt geen aandacht geschonken aan ex-ante kansverdelingen. Zelfs als een persoonlijkheidskenmerk helemaal niets zei over het beroep van de professional, gaven de proefpersonen geen waarde meer aan de ex-ante kansverdeling. De kans op een ingenieur werd in dat geval in beide groepen op 50% geschat, in plaats van op 70% in de eerste groep of 30% in de tweede groep. De tweede variant van representativeness wordt aangetoond met het volgende voorbeeld. Proefpersonen werden gevraagd wat de kansen zijn dat een steekproef uit de éne of uit de andere populatie komt. Hierbij werd het volgende voorbeeld gegeven. Een 5
5,44 =
, ⁄ , , ⁄ ,
, zie paragraaf 6.3.1.
– 23 –
vaas bestaat voor twee derde uit ballen van één kleur en voor één derde uit ballen van een andere kleur. Persoon A trekt vijf ballen, vier rode en één witte. Persoon B trekt twintig ballen, twaalf rode en acht witte. Wie is er zekerder dat de vaas voor twee derde uit rode ballen bestaat (in plaats van twee uit derde witte ballen) en welke kans zou de persoon hieraan moeten geven? In werkelijkheid is de kans op twee derde rode ballen voor persoon A 8 tegen 1 en voor persoon B 16 tegen 1. Toch zijn de meeste proefpersonen in de veronderstelling dat de casus van persoon A een sterker bewijs is voor twee derde rode ballen in de vaas dan de casus voor persoon B. Er wordt geen waarde gehecht aan de grotere steekproef van persoon B, maar men laat zich leiden door de duidelijkere verhoudingen bij persoon A. De derde variant van representativeness blijkt uit het feit dat wanneer vijf keer achter elkaar munt is gegooid, de kans op kop groter wordt geschat. Kans wordt gezien als een zelfcorrigerend mechanisme waarbij een afwijking in één richting de kans op de andere richting zou vergroten om het evenwicht te kunnen herstellen. In werkelijkheid is dit niet het geval. Afwijkingen worden hooguit verwaterd naarmate er meer waarnemingen komen. Tversky en Kahneman (1974) halen Tversky en Kahneman (1971)6 aan, waarin onderzoek is verricht naar de statistische intuïtie van wetenschappers. Hieruit blijkt dat ook zij zich schuldig maken aan kansmisvattingen waarbij de representativeness wordt overschat. Er wordt te veel waarde toegekend aan resultaten uit kleine steekproeven. De vierde variant van representativeness wordt met het volgende voorbeeld geïllustreerd. Een groep proefpersonen is gevraagd om op basis van beschrijvingen van lessen van docenten deze lessen een cijfer te geven. Een tweede groep werd gevraagd om op basis van dezelfde beschrijvingen een inschatting te maken van het succes van de docenten over vijf jaar, hetgeen veel minder voorspelbaar is dan het succes van de les zelf. Beide groepen gaven dezelfde uitkomsten. Hieruit blijkt dat de proefpersonen de informatie over één les voldoende nauwkeurig vonden om dezelfde inschatting te maken van deze les als van het succes van de docenten over vijf jaar. Dit terwijl de proefpersonen zich er ongetwijfeld van bewust zouden moeten zijn dat gegevens over één les van een docent weinig voorspellende waarde hebben over vijf jaar.
6 Tversky en Kahneman (1974) verwijzen naar: Tversky, A. en D. Kahneman, (1971), ‘’Belief in the law of small num-
bers’’, Psychological Bulletin, 76, 2, p. 105-110.
– 24 –
De vijfde variant van representativeness betreft de illusie van validiteit. Mensen hebben meer vertrouwen in de juistheid van hun voorspelling als de verwachte output lijkt op of samenhangt met de input. Het maakt hierbij niet uit hoe relevant de input is. De zesde variant van representativeness wordt aangetoond met een herkenbaar voorbeeld van een opleiding. Elke keer dat een goede prestatie is neergezet, geeft een docent lovende kritieken, vaak is de volgende prestatie dan minder. Elke keer dat een slechte prestatie is neergezet, geeft een docent negatieve kritieken, vaak is de volgende prestatie dan beter. Docenten zijn dan geneigd te denken dat negatieve kritieken didactisch beter zijn dan lovende kritieken. Deze conclusie gaat echter voorbij aan regressie naar gemiddelden. Na een uitschieter is de kans groot dat de volgende prestatie dichter bij het gemiddelde ligt. Na een slechte prestatie zal vaak verbetering optreden en na een goede prestatie verslechtering. Representativeness is nuttig als mensen kansen in onzekere situaties moeten schatten, maar omdat dit proces onbewust gebeurd, worden kansen systematisch over dan wel juist onderschat.
Availability Er zijn situaties waarin men de omvang van een verzameling of de kans op een gebeurtenis schat aan de hand van het gemak waarmee voorbeelden of gebeurtenissen kunnen worden bedacht of opgeroepen. Deze vuistregel staat bekend als availability. Availability is een nuttige aanwijzing om de omvang of kans te schatten omdat voorbeelden van onderdelen grote verzamelingen makkelijker op te roepen zijn dan voorbeelden van kleinere verzamelingen. Availability wordt echter ook door andere factoren dan kans en omvang van een verzameling beïnvloed, hierdoor leidt de availability vuistregel tot voorspelbare niet-rationele beslissingen (biases). Tversky en Kahneman (1974) onderkennen de volgende vier varianten van availability die tot foutieve schattingen van kansen en verzamelingen leiden: –
vertekening door herinnerbaarheid van voorvallen;
–
vertekening door de effectiviteit van zoekcriteria;
–
vertekening door voorstelbaarheid;
–
denkbeeldige correlatie.
– 25 –
Wederom hebben Tversky en Kahneman veel sprekende voorbeelden uit onderzoek aangehaald om de varianten van de availabilty vuistregel te illustreren. De eerste variant van de availability vuistregel wordt geïllustreerd door het volgende voorbeeld. Een groep proefpersonen werd gevraagd om na het horen van een lijst met namen van bekende mensen aan te geven of de lijst meer mannelijke of meer vrouwelijke mensen bevatte. Bij lijsten waar de mannen relatief bekender waren schatte de proefpersonen in dat er meer mannen op de lijst stonden en bij meer bekende vrouwen juist andersom. Dit wordt veroorzaakt doordat de bekendere namen makkelijker te herinneren zijn. De tweede variant van de availability vuistregel wordt aangetoond met het volgende experiment. Proefpersonen zijn gevraagd om in te schatten of het waarschijnlijker is dat een willekeurig woord van tenminste drie letters uit een willekeurige tekst met de letter R begint of dat juist de derde letter van dat woord de letter R is. Deze opgave wordt benaderd door woorden uit het geheugen op te roepen die met de letter R beginnen en woorden die als derde letter de letter R hebben de verhouding van woorden die opgeroepen worden wordt als representatief voor alle woorden gezien. Omdat het veel makkelijker is om woorden uit het geheugen op te roepen op basis van de eerste letter dan op basis van de derde letter, worden de woorden die met de letter R beginnen overschat en de woorden die de letter R op de derde positie hebben onderschat. De derde variant van de availability vuistregel gaat over situaties waar een inschatting moet worden gemaakt van zaken die niet in het geheugen zijn opgeslagen. In dergelijke gevallen moeten voorbeelden van dergelijke zaken worden bedacht om een inschatting te maken van de omvang van een verzameling of de kans op een gebeurtenis. Als voorbeeld wordt de volgende opgave gegeven. Er is een groep van tien personen waaruit een commissie moet worden gevormd van k personen, waarbij 2 ≤ k ≤ 8. Wanneer proefpersonen wordt gevraagd om het aantal verschillende commissies dat gevormd kan worden bij een gegeven commissieomvang (k), wordt deze vraag benaderd door in gedachte een aantal commissies van k personen te formuleren. Bij commissies van weinig mensen gaat dit makkelijker dan bij commissies met veel mensen. Bij commissies met twee personen zijn er al vijf mogelijkheden zonder overlappingen, bij commissies van acht personen is er op deze wijze maar één mogelijkheid. Het is dus
– 26 –
moeilijker om grotere commissies te bedenken. Men schatte het aantal mogelijke commissies van twee personen veel hoger in dat het aantal mogelijke commissies van acht personen. In werkelijkheid is het aantal mogelijke commissies van twee en acht personen gelijk. De vierde variant van de availability vuistregel houdt in dat zaken die op elkaar lijken eerder geacht worden te correleren dan wanneer zaken niet op elkaar lijken. Zaken die beter en sneller uit het geheugen kunnen worden opgeroepen of worden bedacht, komen in de praktijk over het algemeen ook vaker voor. Ook zijn zaken die op elkaar lijken vaak gecorreleerd. Hierdoor gebruikt men de vuistregel availability om de omvang van een verzameling of de kans op een gebeurtenis eenvoudig te kunnen schatten. Dit gebeurt echter onbewust en men is niet in staat om systematische denkfouten te voorkomen die het gevolg zijn van deze vuistregel.
Adjustment and anchoring De derde vuistregel die Tversky en Kahneman (1974) beschrijven is adjustment and anchoring. In veel gevallen als mensen een schatting moeten maken beginnen ze bij een initiële waarde (een anchor) en passen zij die aan om tot hun schatting te komen (adjustment). Dit anchor kan door de probleemstelling worden gegeven of het resultaat zijn van een gedeeltelijke berekening. In ieder geval is de aanpassing naar de uiteindelijke schatting meestal onvoldoende. Tversky en Kahneman hebben drie varianten op de anchoring and adjustment vuistregels geïdentificeerd: –
onvoldoende aanpassing;
–
vertekeningen (biases) van kansinschattingen in de beoordeling van aaneensluitende en tegengestelde gebeurtenissen;
–
anchoring bij de inschatting van subjectieve kansverdelingen.
De onvoldoende aanpassing variant van de vuistregel anchoring wordt aangetoond met het volgende voorbeeld. Een groep proefpersonen werd eerst gevraagd of er meer of minder dan tien Afrikaanse landen lid zijn van de Verenigde Naties, vervolgens werd hen gevraagd hoeveel Afrikaanse landen lid zijn van de Verenigde Naties. Het mediane antwoord op deze vraag was 25. Een andere groep proefpersonen werd eerst gevraagd of er meer of minder dan 65 Afrikaanse landen lid zijn van de Verenigde Naties en vervolgens hoeveel Afrikaanse landen er lid waren. Bij deze groep was het
– 27 –
mediane antwoord op de tweede vraag 45. De verschillende schattingen worden veroorzaakt door de afwijkende initiële waarden (anchors) waar de proefpersonen vanuit zijn gegaan. Voor de onderbouwing van de tweede variant van de anchoring vuistregel halen Tversky en Kahneman een onderzoek van Bar-Hillel (1973)7 aan. Bar-Hillel laat zien dat kansen op aaneengesloten gebeurtenissen worden overschat en kansen op een afzonderlijke gebeurtenis juist worden onderschat. Wanneer wordt gevraagd welk van de onderstaande gebeurtenissen het meest waarschijnlijk is wordt de volgende volgorde aangegeven: 1
het trekken van zeven rode knikkers achter elkaar (met terugleggen) uit een vaas met negentig rode en tien witte knikkers;
2
het trekken van één rode knikker uit een vaas met vijftig rode en vijftig witte knikkers;
3
het trekken van ten minste één rode knikker uit zeven pogingen (met terugleggen) uit een vaas met negentig rode knikkers en tien witte knikkers.
In werkelijkheid is de kans juist 48% (1), 50% (2) en 52% (3). Deze schattingsfout wordt verklaard door anchoring. Men hanteert de kans bij één knikker (90% of 10%) als anchor en past deze vervolgens te weinig aan om op de eindschatting te komen. Hierdoor wordt ook de kans op succes bij projecten vaak overschat, het uiteindelijke succes is namelijk afhankelijk van het succes van alle deelprojecten. De kans op succes van een deelproject kan relatief groot zijn, maar dit geldt dan niet automatisch voor de som van de deelprojecten. Op dezelfde wijze worden risico’s bij complexe projecten onderschat. De kans dat een onderdeel niet functioneert kan klein zijn, maar als geldt dat ieder onderdeel moet functioneren om een ramp te voorkomen, kan de kans op die ramp toch vrij groot zijn. De laatste variant van anchoring gaat over de verdeling van mogelijke uitkomsten, de standaard deviatie. Wanneer proefpersonen wordt gevraagd om van een veelheid aan mogelijke uitkomsten (bijvoorbeeld de stand van de beurs over een jaar of het aantal verkeersongelukken in het komende jaar) het 1% en 99% betrouwbaarheidsniveau 7 Tversky en Kahneman (1974) verwijzen naar: Bar-Hillel, M., (1973), On the Subjective Probability of Compound
Events, Organizational Behavior and Human Performance, 9, p. 396-406.
– 28 –
vast te stellen, blijkt de werkelijke uitkomst in ongeveer 30% van de gevallen buiten dit betrouwbaarheidsinterval te liggen. Dit is gedeeltelijk aan de anchoring vuistregel toe te wijzen. Voor het schatten van de betrouwbaarheidsniveaus wordt eerst de best estimate geschat, de aanpassing naar het 1% en 99% betrouwbaarheidsniveau is vervolgens onvoldoende. Hoewel de drie hiervoor beschreven vuistregels (heuristics) meestal effectief zijn, leiden ze tot systematische en voorspelbare fouten. Wanneer een telling wordt gezien als schattingsproces (dit is vaak het geval als de te tellen hoeveelheden groter worden) kunnen de vuistregels van Tversky en Kahneman onbewust worden toegepast. Met name de anchoring vuistregel is in dit verband interessant. Op basis van deze vuistregel mag verwacht worden dat bij een telling met voorinformatie, deze voorinformatie dient als anchor en kan tevens verwacht worden dat de uiteindelijke schatting/telling onvoldoende is aangepast vanuit het anchor richting de werkelijke waarde. Verwacht mag worden dat de kwaliteit van een telling met (mogelijk foute) voorinformatie lager is dan wanneer deze voorinformatie (en daarmee het mogelijke foute anchor) ontbreekt.
2.3.2 Anchoring in een accountancykader Behalve in het vakgebied psychologie is ook in het vakgebied auditing onderzoek gedaan naar anchoring. Voor deze scriptie is literatuuronderzoek gedaan naar twee deelgebieden binnen het anchoring onderzoek in auditing: confirmation bias en outcome knowledge. Bij confirmation bias wordt onderzocht of accountants meer waarde hechten aan informatie die hun hypothesen en aannames bevestigen dan aan informatie die hun aannames en hypothesen juist ontkrachten. Hierbij kan de initiële hypothese als anchor worden gezien en de waarde die aan bevestigende of ontkrachtende informatie wordt gegeven als (on)voldoende aanpassing van dit anchor om tot een eindoordeel te komen. Outcome knowledge is het fenomeen dat mensen informatie over een gebeurtenis anders op waarde schatten als zij de uitkomst van de gebeurtenis weten. Mensen vinden dan informatie die in lijn ligt met de uitkomst belangrijker dan wanneer zij de uitkomst van de gebeurtenis niet kennen. Eveneens vinden mensen informatie die niet in lijn ligt met de uitkomst van de gebeurtenis minder belangrijk dan wanneer zij de uitkomst van de gebeurtenis niet hadden gekend. Met andere woorden het fenomeen outcome knowledge is de beïnvloeding van de ex-ante inschatting door ex-post informatie. Dit fenomeen wordt in de literatuur ook wel aangeduid als het hindsight effect.
– 29 –
Confirmation bias McMillan en White (1993) hebben het fenomeen confirmation bias in samenhang met de professioneel kritische instelling van accountants onderzocht. Onderzochte accountants moesten ratio’s uit een jaarrekening van een onderneming beoordelen en aangeven of zij marktontwikkelingen / beleidswijzigingen of een fout in de jaarrekening als oorzaak voor fluctuaties in financiële ratio’s het meest aannemelijk vonden. Deze aanname geldt als een soort nulhypothese of anchor waaruit een eindoordeel gevormd moest worden. Vervolgens werd verschillende informatie aan de proefpersonen gegeven, zowel informatie die wees op een fout als informatie die de verklaring aan de hand van marktontwikkelingen juist bevestigden. Het blijkt dat accountants van wie de nulhypothese een fout in de jaarrekening was meer waarde toekenden aan zowel bevestigende als ontkrachtende informatie dan accountants die er in eerste instantie vanuit gingen dat er geen fouten in de jaarrekening zaten. Dit kan er op wijzen dat accountants alerter zijn wanneer zij fouten verwachten. Zowel accountants die uitgaan van fouten in de jaarrekening als accountants die niet van fouten in de jaarrekening uitgaan hechten meer waarde aan informatie die wijzen op geen fouten in de jaarrekening. Dit lijkt tegenstrijdig met de professioneel kritische instelling van accountants en met het anchoring principe bij accountants die in eerste instantie van fouten waren uitgegaan. Met andere woorden confirmation bias treedt wel op bij accountants die geen fouten in de jaarrekening verwachten, maar niet bij accountants die wel fouten in de jaarrekening verwachten. Een mogelijke verklaring hiervoor is dat kans op fouten in de jaarrekening ex-ante klein is en dat informatie die dit bevestigt wordt aangegrepen om deze kans in zijn geheel te verwaarlozen. Toegespitst op voorraadinventarisaties impliceert dit dat wanneer men uitgaat van de juistheid van de voorraadadministratie (en dus een kans op fouten klein schat) men meer geneigd is om waarde aan bevestigende informatie toe te kennen en er dus sprake van anchoring zal zijn.
Ook Rabin en Schrag (1999) hebben onderzoek naar confirmation bias gedaan. Hun onderzoek was niet specifiek op accountants gericht, maar algemeen van aard. Zij hebben sterk bewijs gevonden dat confirmation bias altijd optreedt bij het beoordelen van informatie. Men hecht meer waarde aan informatie die hun veronderstelling bevestigt dan aan informatie die hun veronderstelling ontkracht.
– 30 –
Deze afwijking van de bevindingen van McMillan en White (1993) kan worden verklaard doordat de onderzochte accountants in het onderzoek van McMillan en White niet sterk overtuigd waren van de aanwezigheid van fouten in de jaarrekening, waardoor zij de ontkrachtende informatie toch op een hoge waarde schatten. Kinney en Uecker (1982) hebben expliciet onderzoek gedaan naar de effecten van anchoring en aanpassing, zoals beschreven door Tversky en Kahneman (1974), op het oordeel van accountants. Kinney en Uecker lieten accountants het 95% betrouwbaarheidsinterval (eenzijdig) schatten op basis van een steekproefuitkomst. Hieruit bleek dat de maximale foutfractie werd onderschat. Dit is precies in lijn met het onvoldoende aanpassen van kansverdelingen ten opzichte van de best estimate zoals beschreven door Tversky en Kahneman (1974). In een ander experiment lieten Kinney en Uecker (1982) twee jaren van gecontroleerde informatie over de omzet en kostprijs omzet zien (met brutomarges van respectievelijk 19,6% en 17,5%) en één jaar van ongecontroleerde informatie. Zij hanteerden twee versies van de ongecontroleerde informatie. Eén versie met een bruto marge van 14,0% en één versie met een marge van 23,1%). Vervolgens werd aan accountants gevraagd om kritische grenzen te geven ten aanzien van de door hen verwachte brutomarge waarbuiten zij aanvullende werkzaamheden noodzakelijk achtten. Hieruit blijkt dat accountants die ongecontroleerde informatie met een hogere brutomarge hadden ook hogere verwachtingen hadden ten aanzien van werkelijke brutomarge. Dit pleit ervoor om verwachtingen op te bouwen, zonder reeds de ongecontroleerde waarden gezien te hebben. In een situatie van inventarisatie mag op basis hiervan verwacht worden dat de kwaliteit van de telling hoger is wanneer de teller nog geen (ongecontroleerde) voorinformatie heeft gezien.
Outcome knowledge In de psychologieliteratuur is veel onderzoek gedaan naar het hindsight effect in de vorm van het schatten van de ex-ante kans op de daadwerkelijke uitkomst. Hieruit blijkt dat de voorspelbaarheid van de werkelijke uitkomst overschat worden (Fischhoff, 1975; Hasher et al., 1981;). Als de objectieve kans op een 2-1 uitslag van een bepaalde voetbalwedstrijd bijvoorbeeld 4% is en men wordt na afloop van de wedstrijd (die ook in 2-1 is geëindigd) gevraagd wordt wat de kans daarop op voorhand was, wordt deze kans hoger geschat. Onderzoek naar hindsight is op diverse terreinen verricht (o.a. verpleging, medicijnen, voetbal). Het onderzoek naar het hindsight effect in de accountantscontrole is nog zeer beperkt.
– 31 –
Een mogelijke verklaring voor het hindsight effect is dat men kennis van de uitkomst direct integreert met de oorspronkelijke informatie in een poging om een coherent beeld van alle informatie te krijgen. De oorspronkelijke informatie wordt dan als het ware overschreven, waardoor de inschatting met kennis achteraf per definitie zal verschillen zonder deze kennis achteraf (Fischhoff, 1975). Een andere verklaring is dat de oorspronkelijke informatie wel afzonderlijk bewaard blijft, maar het voor het brein niet eenvoudig is deze informatie te raadplegen zonder het door de kennis van de uitkomsten te laten vervuilen (Hasher et al., 1981). Een interessante uitkomst van het hindsight onderzoek in de geneeskunde is dat het hindsight effect veel groter is wanneer de uitkomst verrassender is (dat wil zeggen afwijkt van de oorspronkelijke informatie). Reimers en Butler (1992) halen een medisch onderzoek van Arkes (1981)8 aan waaruit blijkt dat indien symptomen grote voorspellende waarde voor een bepaalde ziekte hebben er niet of nauwelijks sprake is van een hindsight effect, terwijl dit wel het geval is indien deze voorspellende waarde veel kleiner is. Er is ook onderzoek gedaan naar de mogelijkheden om het hindsight effect te elimineren. Wanneer proefpersonen verteld wordt dat de genoemde uitkomsten onjuist waren werd het effect verminderd (Hasher, et al., 1981), ook het dwingen van de proefpersonen om andere mogelijke uitkomsten in overweging te nemen verkleinde het hindsight effect (Slovic & Fischhoff, 1977). Beide methoden konden het hindsight effect echter niet volledig wegnemen, veel andere geprobeerde methoden hadden nog minder effect. Het onderzoek van Reimers en Butler (1992) is één van de eerste onderzoeken naar outcome knowledge bij de accountantscontrole. Reimers en Butler halen Skowronski en Carlston (1989)9 aan waarin gesteld wordt dat mensen over het algemeen meer waarde toekennen aan negatieve gebeurtenissen dan aan positieve gebeurtenissen. Om dit in een accountancykader te toetsen hebben Reimers en Butler twee experimenten uitgevoerd. Eén waar de onverwachte uitkomst een negatieve gebeurtenis is en één waar de onverwachte uitkomst een positieve gebeurtenis is.
8 Reimers en Butler (1992) verwijzen naar: Arkes H.R., R. L. Wortmann, P. Saville en A.R. Harkness, (1981), ‘’Hindsight
Bias Among Physicians Weighing the Likelihood of Diagnoses’’, Joumal of Applied Psychology, 66, 2, p. 252-254. 9 Reimers en Butler (1992) verwijzen naar: Skowronski, J. J. en E.E. Cariston, ‘’Negativity and extremity biases in
impression formation: a review of explanations’’, Psychological Bulletin, 105, 1, p. 131-142.
– 32 –
Het eerste experiment zag er als volgt uit. Deelnemers werden verdeeld in vier groepen. Alle groepen kregen dezelfde informatie over de interne beheersing van een onderneming, hieruit bleek duidelijk dat deze tekortkoming vertoonde. Eén groep kreeg geen extra informatie (groep 1; geen hindsight beslissing), één groep kreeg te horen dat als gevolg van de tekortkomingen een grote fraude had plaatsgevonden (groep 2; verrassende, negatieve uitkomst), één groep kreeg te horen dat tijdens de controle een aantal kleine, niet materiële fouten gevonden was als gevolg van de tekortkomingen (groep 3; voorspelbare uitkomst), de laatste groep wordt gevraagd om eerst over mogelijk fraude na te denken (groep 4; geen hindsight, wel een beslissingshulp om de kwaliteit van het oordeel te verbeteren). Vervolgens werden alle groepen gevraagd om een inschatting te maken van de effectiviteit van de interne beheersing van de onderneming op een schaal van één tot zeven zonder de informatie over de uitkomsten achteraf te gebruiken. Uit dit experiment volgde dat de inschatting van groep 1 en 3 niet significant van elkaar verschilden (4,08 vs. 3,92; p>0,75). De inschatting van groep 2 verschilde daarentegen wel significant van groep 1 (4,08 vs. 2,69; p<0,01). De uitkomst van groep 4 (3,46) verschilde niet significant van de verrassende uitkomst groep, maar ook niet van de geen hindsight groep. De poging om het hindsight effect te elimineren door de deelnemers over fraude na te laten denken heeft dus wel geleid tot een lagere inschatting van de effectiviteit van de interne beheersing, maar niet tot een significant effect. Het tweede experiment had een onverwacht positieve uitkomst. Alle deelnemers kregen informatie over de financiële risico’s van een onderneming als gevolg van asbestclaims. De deelnemers werd vervolgens gevraagd om de kans (op een schaal van 1 tot 7; uitsluitend gebaseerd op deze informatie) te schatten dat er een goedkeurende controleverklaring zonder continuïteitsparagraaf zou worden afgeven. Groep 1 kreeg wederom geen aanvullende informatie, groep 2 kreeg te horen dat de claim uiteindelijk was ingetrokken (verrassende, positieve uitkomst), groep 3 kreeg te horen dat er nog doorgeprocedeerd werd (voorspelbare uitkomst) en groep 4 werd gevraagd om na te denken over de mogelijke uitkomsten van de claim (poging hindsight te elimineren). Uit dit experiment volgde wederom dat de inschattingen van groep 1 en 3 niet significant van elkaar afweken (2,85 vs. 2,23; p>0,10) en dat de inschatting van groep 2 hier wel significant van afweek (2,85 vs. 4,08; p<0,01). De inschatting van groep 4 was zoals verwacht wel lager dan die van groep 1 (2,69), maar het effect was niet significant. Beide experimenten hebben aangetoond dat kennis van de uitkomsten invloed heeft op
– 33 –
de inschatting van de accountant wanneer deze uitkomsten verrassend zijn. Wanneer de uitkomsten niet verrassend zijn treedt dit effect niet op. Deze bevindingen liggen in lijn met bevindingen van eerdere onderzoeken op andere vakgebieden. Ook Emby, Gelardi en Lowe (2002) hebben onderzoek gedaan naar het effect van outcome knowlegde op het beoordelen van het continuïteitsbeginsel. Een groep accountants kreeg informatie over een casus, waarover zij in de rol van peer reviewer een oordeel moesten geven. Een deel van de accountants werd verteld dat de onderneming binnen een jaar faillissement had aangevraagd, een deel werd verteld dat het na een jaar goed ging met de onderneming en een deel kreeg geen informatie of de staat van de onderneming na een jaar. De proefpersonen werd gevraagd om een inschatting te geven (met de kennis van toen) van de waarschijnlijkheid van de continuïteitsveronderstelling. Daarnaast werd de proefpersonen gevraagd om het oordeel van de controlerende accountant te evalueren en het bewijs dat de zittende accountant had verzameld op waarde te schatten. Proefpersonen die informatie hadden dat de onderneming binnen een jaar faillissement aan zou vragen waren sterker geneigd te oordelen dat de controlerende accountant de continuïteitsveronderstelling in twijfel moest trekken dan proefpersonen die geen informatie hadden of informatie hadden dat het na een jaar goed ging met de onderneming, ondanks dat alle proefpersonen dezelfde gegevens werd verstrekt over de informatie die voor de controlerende accountant beschikbaar was. De proefpersonen die informatie over de uitkomsten ontvingen kenden meer waarde toe aan bewijs dat consistent was met de informatie over de uitkomsten dan aan bewijs dat hier niet consistent mee was. Dit suggereert dat de kennis van de uitkomsten, de beoordeling van de informatie zoals deze in eerste instantie beschikbaar was vertekend. Een onderzoek met en zonder kennis van de uitkomsten is vergelijkbaar met blind of niet-blind tellen van de voorraad, zoals gesteld is tellen immers een vorm van schatten. De onderzoeksresultaten van zowel Reimers en Butler (1992) als Emby, Gelardi en Lowe (2002) doen vermoeden dat kennis van uitkomsten (niet-blind tellen, waarbij veel waarde wordt toegekend aan de voorraadadministratie) de schatting (telling) van de werkelijke voorraad zal beïnvloeden. Op basis van deze onderzoeken is de verwachting dan ook dat de kwaliteit van de telling beter is indien de uitkomsten niet bekend zijn, zodat de telling (schatting) van de werkelijke voorraad niet wordt beïnvloed door
– 34 –
een mogelijke gegeven uitkomst. Op basis hiervan mag verwacht worden dat blind tellen betere resultaten oplevert dan niet-blind tellen.
2.3.3 NV COS Standaard 520 van de NV COS gaat over cijferanalyses. Er bestaat geen directe link met inventarisaties en/of anchoring. Toch is dit onderdeel van de Nederlandse controlerichtlijnen relevant. Bij cijferanalyses worden financiële gegevens van de entiteit vergeleken met verwachte resultaten van de entiteit of met verwachtingen van de accountant (NV COS 520 A1). Voorts dient de accountant te beoordelen of de verwachting voldoende nauwkeurig geconcretiseerd kan worden om een afwijking van materieel belang op het gewenste zekerheidsniveau te onderkennen (NV COS 520.5c). De accountant dient onafhankelijk van de te controleren financiële gegevens van zijn verwachting op te stellen. Indien de accountant reeds kennis heeft van de te controleren informatie, wordt zijn verwachting hierdoor beïnvloed (Kinney en Uecker, 1982). De verwachting wordt dan door middel van de anchoring vuistregel bepaald, waarbij de te controleren financiële gegevens als anchor gelden en de aanpassing hierop waarschijnlijk onvoldoende is. De controle van het bestaan van voorraden kan hiermee vergeleken worden. Inventarisatie is een middel om een verwachting ten aanzien van de voorraadpositie te bepalen om deze vervolgens met de voorraad volgens de administratie te vergelijken. Ook hier is het van belang om de verwachting op te bouwen zonder kennis van de in de administratie opgenomen waarde. Dit suggereert dat tellen van de voorraad zonder kennis van de administratie (blind tellen) te prefereren is boven met deze kennis. Wat bijzonder is dat accountancyleerboeken bij cijferanalyses hameren op het belang van het eerst vaststellen van een verwachting (Deckers en Van Kollenburg, 2002), terwijl bij voorraadinventarisaties het verschil tussen blind en nietblind tellen soms niet eens wordt behandeld (Deckers en Van Kollenburg, 2002), laat staan dat een voorkeur wordt uitgesproken.
– 35 –
Omdat tellen bij een toenemende voorraad steeds meer lijkt op schatten, is overwogen om NV COS 540 (de controle van schattingen) ook in de literatuurstudie te betrekken. NV COS 540 7a definieert een schatting als volgt: ‘’ Een benadering van een monetair bedrag indien het niet mogelijk is het bedrag nauwkeurig te bepalen. Deze term wordt gehanteerd zowel voor een bedrag dat wordt gewaardeerd tegen reële waarde wanneer er een schattingsonzekerheid is als voor andere bedragen die een schatting vereisen. Waar het in deze Standaard enkel gaat over schattingen die betrekking hebben op waarderingen tegen reële waarde, wordt de term ‘schattingen van reële waarde’ gehanteerd.’’ De voorraad kan echter wel exact bepaald worden waardoor het uitvoeren van een inventarisatie niet aan bovenstaand omschrijving voldoet. Derhalve wordt NV COS 540 niet verder behandeld in de literatuurstudie.
2.4
Audit quality
In een experiment om de kwaliteit van de telling bij verschillende telmethodieken te onderzoeken kunnen behalve de onderkende experimentele variabelen (soort voorinformatie en omvang) ook andere variabelen invloed hebben op de kwaliteit van de telling. Wanneer deze andere variabelen genegeerd worden kunnen deze de uitkomst van het experiment beïnvloeden zonder dat dit opvalt en dus de bruikbaarheid van de resultaten doen verminderen. De volgende variabelen worden onderkend die mogelijk verstorend kunnen werken en waar naar verwachting voor gecontroleerd moet worden: –
ervaring
–
leeftijd
–
geslacht
Om hier goed voor te controleren wordt er een korte literatuurstudie naar de invloed van deze variabelen verricht. Omdat geen wetenschappelijke literatuur beschikbaar is over onderzoek naar kwaliteit van tellingen van de voorraad, is besloten om literatuur met betrekking tot de kwaliteit van de accountantscontrole te bestuderen. Tellen is immers een vorm van controle en het is mogelijk dat factoren die van invloed zijn op de kwaliteit van de accountantscontrole ook van invloed kunnen zijn op de kwaliteit van
– 36 –
tellingen van de voorraad. Estes en Reames (1988) hebben onderzoek gedaan naar de invloed van persoonlijke eigenschappen op materialiteitsbeslissingen. Hoewel het maken van materialiteitsbeslissingen in beginsel niet hetzelfde is als het uitvoeren van een inventarisatie, is dit onderzoek wel bruikbaar om een beeld te vormen van de invloeden van persoonlijke eigenschappen op de kwaliteit van de telling. De kwaliteit van materialiteitsbeslissingen is een indicatie voor de kwaliteit van de accountantscontrole10. Het is aannemelijk dat factoren die materialiteitsbeslissingen beïnvloeden ook de kwaliteit van de voorraadinventarisatie kunnen beïnvloeden. Estes en Reames hebben twee casussen ontwikkeld die zij aan 596 CPA’s (Amerikaanse equivalent van een registeraccountant) hebben laten lezen. Bij casus één werd gevraagd wat de kans op oninbaarheid van een grote debiteur moest zijn wil deze invloed gaan hebben op het accountantsoordeel. Bij casus twee werd gevraagd bij welk bedrag aan incourante voorraad het ontbreken van een voorziening hiervoor invloed zou hebben op het accountantsoordeel. Daarnaast werden deelnemers ook gevraagd hoe zeker ze van hun beslissing waren. Van de deelnemers aan dit onderzoek werden gegevens verzameld: –
jaren ervaring als openbaar accountant;
–
jaren ervaring als intern accountant;
–
(aantal jaren) opleiding;
–
werkzaam in openbaar beroep;
–
frequentie dat materialiteitsbeslissingen worden gemaakt;
–
geslacht;
–
leeftijd.
Met deze gegevens is een multivariate analyse uitgevoerd waarbij van elke variabele is bekeken wat de invloed op de materialiteitsbeslissing.
10 Er bestaan twee manieren waarop het verband tussen een materialiteitsbeslissing en controlekwaliteit beschouwd kan worden. Men zou kunnen bepleiten dat een lagere materialiteit per definitie een hogere controlekwaliteit met zich mee brengt. Een andere visie is een te lage materialiteit onnodig veel werkzaamheden met zich meebrengt terwijl het gewenste zekerheidsniveau ook met minder werkzaamheden bereikt kan worden. De materialiteitsbeslissing die dan tot de hoogste controle kwaliteit leidt is die beslissing die tot zo min mogelijk werkzaamheden leidt, waarbij nog net voldoende zekerheid wordt verkregen. Het onderzoek van Estes en Reames doet geen uitspraak over de optimale materialiteitsbeslissing maar onderzoekt welke factoren materialiteitsbeslissingen beïnvloeden, zonder uit te spreken of dit beter of slechter is. Dit is geschikt voor ons onderzoek omdat er onderzocht wordt of de onderkende factoren invloed hebben op de kwaliteit van de telling.
– 37 –
Voor ons onderzoek zijn de invloed van geslacht, van leeftijd en van ervaring op de materialiteitsbeslissing interessant. (Accountants)opleiding en frequentie van materialiteitsbeslissingen zijn niet relevant voor ons onderzoek. De accountantsopleiding is (ook mutatis mutandis) niet vergelijkbaar met de opleiding van een teller. Opvallend is dat de meeste van de onderzochte onafhankelijke variabelen niet tot significante effecten op de materialiteitsbeslissingen leiden. Ervaring heeft geen significante invloed op de materialiteitsbeslissing, wel neemt het vertrouwen dat de beslisser heeft in zijn eigen oordeel toe naarmate de beslisser meer ervaring in het openbaar beroep heeft (p=0,015 respectievelijk p=0,028 bij de debiteuren en voorraad casussen). Geslacht heeft geen significante invloed op de materialiteitsbeslissing. Interessant is om te constateren dat vrouwen meer vertrouwen hebben in de materialiteitsbeslissing bij de casus over inbaarheid van debiteuren (p=0,089) en dat mannen meer vertrouwen hebben in de materialiteitsbeslissing bij de casus over incourante voorraad (p=0,010). De onderzoekers kunnen dit inconsistente resultaat niet goed verklaren en denken zelfs aan toeval, echter lijkt dit gezien de significantieniveaus onwaarschijnlijk. Een mogelijke verklaring zou kunnen zijn dat het antwoord in de eerste case in een percentage gegeven moest worden en in de tweede casus in een dollarbedrag. Mogelijk initieert dat andere denkprocessen bij mannen en vrouwen of voelen vrouwen zich vertrouwder bij percentages dan bij absolute bedragen. Dit blijft echter speculatie. De conclusie die voor het experiment bij deze scriptie van belang is, is dat het geslacht in ieder geval geen invloed heeft op de materialiteitsbeslissing zelf. Leeftijd blijkt alleen bij de materialiteitsbeslissing bij de incourante voorraad case significante invloed te hebben. Waarbij oudere accountants bij een lager bedrag vinden dat het ontbreken van een voorziening invloed gaat hebben op het accountantsoordeel (p=0,011). De trend dat oudere accountants voorzichtiger zijn is ook waarneembaar bij de oninbare debiteuren, al is de relatie hier niet significant aangetoond (p=0,615). Francis en Yu (2009) hebben de relatie van kantoorgrootte (een individueel kantoor binnen een big 4 netwerk) en controlekwaliteit onderzocht. Dit onderzoek lijkt ver van het experiment in deze scriptie af te staan, nadere bestudering van het onderzoek leert echter dat ook (controle)ervaring in het onderzoek is betrokken. De auteurs zien de (gezamenlijke) ervaring van het kantoor namelijk als het onderscheid tussen grote en kleine kantoren.
– 38 –
De hypothese van de onderzoekers is dan ook dat grote kantoren meer gezamenlijke ervaring hebben waardoor makkelijker met andere accountants binnen het kantoor overlegd kan worden en het verloop van personeel makkelijker kan worden opgevangen door ervaren medewerkers. Men verwacht dan ook dat dit zal leiden tot een hogere controlekwaliteit. Dit onderzoek naar de invloed van ervaring (van kantoren als geheel) op controlekwaliteit kan vertaald worden naar de invloed van ervaring van tellers op de kwaliteit van de telling. In dit onderzoek is de controlekwaliteit van de uitgevoerde controles op drie manieren onderzocht. Ten eerste is gekeken naar abnormal accruals (Jones 1991)11. Hoge abnormale overlopende balansposten zijn een teken van earnings management en suggereren een lagere kwaliteit van de winst. Ten tweede is gekeken naar de resultaatsontwikkeling. Een kleine winst of kleine winststijging duidt op mogelijke winststuring om verwachtingen van analisten te realiseren. Ten derde is gekeken naar het aantal continuïteitsparagrafen in accountantsverklaringen. Een hogere controlekwaliteit suggereert dat het kantoor beter in staat moet zijn om continuïteitsproblemen te onderkennen. Francis en Yu hebben aangetoond dat de omvang van het kantoor gemeten naar (de log van) de totale fee negatief correleert met omvang van abnormal accruals (p=0,000), negatief correleert met kleine winsten (p=0,006)12, negatief correleert met kleine winststijgingen (p=0,013) en positief correleert met het aantal continuïteitsparagrafen (p=0,013). Hiermee is overduidelijk aangetoond dat kantoorgrootte (en dus ervaring) positief correleert met controlekwaliteit. Op basis hiervan mag worden verwacht dat tellers met een grotere ervaring kwalitatief beter tellen dan tellers met minder ervaring. Deze controlevariabele zullen wij bij de evaluatie van onze resultaten meenemen.
11 Francis en Yu (2009) verwijzen naar: Jones, J.J., (1991), ‘’Earnings management during import relief investigations’’, Journal of Accounting Research, 29, 2, p. 193-228. Abnormal accruals zijn abnormale overlopende balansposten. In deze balansposten heeft het management ruimte om de winst te sturen en zijn daarom een maatstaf voor de kwaliteit van de winst (lagere abnormale overlopende balansposten impliceren een hogere kwaliteit van de winst). Dit begrip is in 1991 voor het eerst door Jones geïntroduceerd. 12 In eerste bleek een significantie van slechts p=0,171. De onderzoekers hebben verklaard waardoor dit kwam en hebben de test vervolgens herhaald zonder de controlevariabele afhankelijkheid van de cliënt. In tweede instantie kon de correlatie wel worden aangetoond. Voor een gedetailleerde verhandeling over de methodologie van de onderzoekers wordt naar het artikel (Francis en Yu, 2009) verwezen.
– 39 –
3
Conceptueel model en hypothesen
3.1
Afzonderlijke variabelen
3.1.1 Voorinformatie Op basis van de literatuurstudie is de verwachting dat bij niet-blinde tellingen een anchoring effect zal optreden. Dit zal ertoe leiden dat tellers met juiste voorinformatie beter tellen dan tellers zonder voorinformatie (de juiste voorinformatie is het anker waar naar toe wordt geteld). Tellers met onjuiste voorinformatie zullen naar verwachting juist slechter tellen dan tellers zonder voorinformatie (de onjuiste voorinformatie is in dat geval het anker waar naar toe wordt geteld). Niet-blind tellen bestaat uit tellen met juiste voorinformatie en tellen met onjuiste voorinformatie. Afhankelijk van de verhouding juiste/onjuiste voorinformatie zal niet-blind tellen tot betere of slechtere resultaten leiden dan blind tellen. De verwachting is dat het hoge fout percentage dat DeHoratius en Raman (2008) hebben aangetroffen ook bij dit onderzoek aangetroffen zal worden en dat daarom blind tellen tot betere resultaten leidt dan niet-blind tellen. Dit resulteert in de volgende drie hypothesen: H1: Tellingen van de voorraad met juiste voorinformatie bevatten minder fouten dan tellingen zonder voorinformatie. H2: Tellingen van de voorraad met onjuiste voorinformatie bevatten meer fouten dan tellingen zonder voorinformatie. H3: Tellingen van de voorraad die blind worden uitgevoerd bevatten minder fouten dan tellingen die niet-blind worden uitgevoerd. Naast de effecten die het al dan niet hebben van voorinformatie en de juistheid van de voorinformatie heeft op de kwaliteit van de telling, zal ook onderzocht worden of het soort onjuiste voorinformatie (een te hoge of een te lage voorraadadministratie) invloed heeft op de kwaliteit van de telling. In de literatuur zijn geen aanknopingspunten gevonden om deze hypothese op te baseren. Daarom is de verwachting dat de invloed van de soort onjuiste voorinformatie niet van invloed is op de kwaliteit van de telling. De hypothese luidt dan ook: H4: Tellingen van de voorraad met te hoge voorinformatie bevatten evenveel fouten als tellingen met te lage voorinformatie.
– 40 –
3.1.2 Controlevariabelen Op basis van onze literatuurstudie verwachten wij dat naast voornoemde onderzoeksvariabelen ook de volgende variabelen invloed zullen hebben op de kwaliteit van de telling: –
aantal artikelen (DeHoratius en Raman; 2008);
–
leeftijd (Estes en Reames; 1988);
–
relevante werkervaring (Francis en Yu; 2009);
–
opleiding;
–
geslacht (Estes en Reames; 1988).
Op basis van het literatuuronderzoek is de verwachting dat het aantal artikelen negatief correleert met de kwaliteit van de telling en dat leeftijd en relevante werkervaring positief correleren met de kwaliteit van de telling. Er wordt geen correlatie verwacht tussen het geslacht van de teller en de kwaliteit van de telling. Dat betekent niet dat dit verband niet onderzocht zal gaan worden. Indien wel sprake is van correlatie zal het geslacht als controlevariabele in het onderzoeksmodel opgenomen worden. Op basis van het literatuuronderzoek kan geen hypothese gevormd worden over de invloed van opleiding van de teller op de kwaliteit van de telling. De aanwezigheid van een verband tussen opleiding en de kwaliteit van de telling zal onderzocht worden om vast te stellen of opleiding mogelijk als controlevariabele in het onderzoeksmodel moet worden meegenomen. Voordat een verklarend opgesteld wordt met zowel de onderzoeks- als de controlevariabelen, zal eerst de invloed van elk van de controlevariabelen op de kwaliteit van de telling onderzocht worden om aan de hand van de uitkomsten van dit onderzoek te beslissen welke controlevariabelen in het uiteindelijke verklarend meegenomen zullen worden. Daarom zijn er hypothesen geformuleerd voor iedere onderkende controlevariabele.
– 41 –
Bij het opstellen van de hypothesen is er vanuit gegaan dat de opleiding van de teller de kwaliteit van de telling niet beïnvloedt. Op basis van het voorgaande zijn de volgende hypothesen geformuleerd: H5: Tellingen van de voorraad van een hogere hoeveelheid per artikel bevat meer fouten dan tellingen van een lagere hoeveelheid per artikel. H6: Tellingen van de voorraad uitgevoerd door oudere tellers bevatten minder fouten dan tellingen uitgevoerd door jongere tellers. H7: Tellingen van de voorraad uitgevoerd door tellers met meer relevante werkervaring bevatten minder fouten dan tellingen uitgevoerd door tellers met minder relevante werkervaring. H8: Tellingen van de voorraad uitgevoerd door tellers met een hogere opleiding bevatten evenveel fouten als tellingen uitgevoerd door tellers met een minder hoge opleiding. H9: Tellingen van de voorraad die door mannen zijn uitgevoerd bevatten evenveel fouten als tellingen die door vrouwen zijn uitgevoerd. Als leeftijd, relevante werkervaring en opleiding alle drie als afzonderlijke controlevariabelen in het model worden opgenomen is het risico groot dat verstoringen optreden als gevolg van correlatie tussen deze controlevariabelen. Daarom zal in het model een proxy opgenomen worden die deze drie variabelen vertegenwoordigt. De proxy zal pas vastgesteld worden nadat de invloed van de afzonderlijke variabelen op de kwaliteit van de telling van de voorraad is onderzocht. Gezien de hypothesen is de verwachting, dat de proxy positief gecorreleerd zal zijn met de kwaliteit van de telling. Dit leidt tot de volgende hypothese:
H10: Tellingen van de voorraad die uitgevoerd worden door oudere tellers met meer relevante werkervaring en een hogere opleiding zullen minder fouten bevatten dan tellingen die uitgevoerd worden door jongere tellers met minder relevante werkervaring en een minder hoge opleiding.
– 42 –
3.2
Conceptueel model
Nadat de invloed van de afzonderlijke variabele is vastgesteld, zal een logistisch model13 opgesteld worden. Welke controlevariabelen hier uiteindelijk in meegenomen zullen worden hangt af van de invloed die de afzonderlijke controlevariabelen hebben. Vooralsnog wordt er vanuit gegaan dat het aantal artikelen en de proxy voor leeftijd, relevante werkervaring en opleiding, de kwaliteit van de telling wel beïnvloeden en dat geslacht de kwaliteit van de telling niet beïnvloedt. Het conceptueel model komt er als volgt uit te zien:
Conceptueel model 1
Leeftijd (CV)
Relevante werkervaring (CV)
+
Aanwezigheid en soort voorinformatie (OV)
+
Leeftijd, ervaring en opleiding (proxy)
+
+
Kwaliteit van de telling
-
Opleiding (CV)
Aantal artikelen (CV)
Om de aanwezigheid en het soort voorinformatie te operationaliseren, zal deze variabele als volgt door een drietal dummyvariabelen vertegenwoordigd worden: Dummy 1
Dummy 2
Dummy 3
Te lage voorinformatie
1
0
0
Te hoge voorinformatie
0
1
0
Juiste voorinformatie
0
0
1
Geen voorinformatie
0
0
0
Op deze manier kan de invloed van alle varianten van de onderzoeksvariabele afzonderlijk worden onderzocht. 13 Zie paragraaf 6.3.1 voor een toelichting op logistische modellen
– 43 –
Er wordt een negatief verband verwacht tussen dummy 1 en de kwaliteit van de telling, een negatief verband tussen dummy 2 en de kwaliteit van de telling en een positief verband tussen dummy 3 en de kwaliteit van de telling Voor dit onderzoek wordt een logistisch model opgesteld, waarin aan de hand van de onderzoeks- en controlevariabelen de kans op een juiste telling kan worden bepaald. Aan de hand hiervan kan er vastgesteld worden of de aanwezigheid en het soort voorinformatie werkelijk invloed heeft op de kwaliteit van de telling, of dat gevonden relaties slechts veroorzaakt worden door de controlevariabelen. Aan de hand van significantie van de coëfficiënt van de onderzoeksvariabele kunnen H1, H2 en H4 definitief getoetst worden. Verder kan aan de hand van de coëfficiënten van de controlevariabelen de onderzoeksvariabelen H5 en H10 definitief worden getoetst.
3.3
Invloed van aanwezigheid van en het soort voorinformatie op modelcoëfficiënten van controlevariabelen
Nadat er een model is opgesteld wordt nog een analyse uitgevoerd. Er zal onderzocht worden in hoeverre de onderzoeksvariabele de coëfficiënten van de controlevariabelen in het opgestelde model beïnvloedt. Hiertoe zal de dataset opgesplitst worden in vier subdatasets. Eén met waarnemingen van tellingen met juiste voorinformatie, één met waarnemingen van tellingen zonder voorinformatie, één met waarnemingen van tellingen met te hoge voorinformatie en één met waarnemingen van tellingen met te lage voorinformatie. Voor alle vier subdatasets zal er een logistisch model opgesteld worden met het aantal artikelen en de proxy voor leeftijd relevante werkervaring en opleiding als onafhankelijke variabele. Vervolgens zal er onderzocht worden of de coëfficiënten van de onderzoeksvariabelen van de verschillende modellen significant van elkaar verschillen. Indien dit het geval is, kunnen uitspraken gedaan worden over de mate van invloed van de gedefinieerde controlevariabelen onder verschillende omstandigheden.
– 44 –
Conceptueel ziet dit er als volgt uit:
Conceptueel model 2 Aanwezigheid en soort voorinformatie (OV) ? Leeftijd, ervaring en opleiding (proxy)
?
+
Kwaliteit van de telling
+ Aantal artikelen (CV)
Op basis van het literatuuronderzoek bestaat geen verwachting ten aanzien van de invloed met betrekking tot de aanwezigheid van en het soort voorinformatie op de mate waarin de proxy voor leeftijd, relevante werkervaring en opleiding en het aantal artikelen de kwaliteit van de telling beïnvloeden. De hypothesen luiden daarom als volgt: H11: De aanwezigheid van en het soort voorinformatie hebben geen invloed op de mate waarin het aantal artikelen de kwaliteit van de telling beïnvloedt. H12: De aanwezigheid van en het soort voorinformatie hebben geen invloed op de mate waarin de proxy voor leeftijd en ervaring de kwaliteit van de telling beïnvloedt. Indien deze hypothesen niet kunnen worden verworpen betekent dit niet dat er geen invloed is, maar slechts dat deze niet aangetoond kan worden. In dat geval kunnen er geen conclusies worden getrokken.
– 45 –
4
Telprocedures bij de supermarktketen
Zoals reeds eerder gememoreerd zal er een experiment uitgevoerd gaan worden bij een landelijk opererende supermarktketen. Door middel van het experiment zullen er data verzameld gaan worden waarmee de in hoofdstuk 3 geformuleerde hypothesen getoetst gaan worden. Omdat het experiment een centrale rol inneemt binnen deze scriptie zal in dit hoofdstuk een algemeen beeld geschetst worden van de procedures bij de landelijk opererende supermarktketen ten aanzien van voorraadinventarisaties. Het experiment zal uitgevoerd gaan worden bij een landelijk opererende supermarktketen die actief is binnen de supermarkt branche. Bij supermarkten is men over het algemeen bekend met voorraadverschillen vanwege uiteenlopende redenen zoals diefstal, breukverlies en bederf. Bij de landelijke opererende supermarktketen bestaan verschillende (tel)procedures.
4.1
Tellingen kwartaalafsluiting
De belangrijkste tellingen van de voorraad vinden eenmaal per kwartaal plaats. Per kwartaal wordt er bij ongeveer 10 procent van het totale winkelbestand een integrale telling uitgevoerd. De winkels worden ieder kwartaal willekeurig geselecteerd. De integrale telling vindt plaats onder leiding van de assistent supermarkt manager en de supermarkt manager. Onder deze twee medewerkers worden enkele toezichthouders aangesteld die verantwoordelijk zijn voor het in goede banen leiden van het telproces van enkele paden (gangen met aan weerskanten schappen gevuld met artikelen). De toezichthouders zijn vaak de meer ervaren medewerkers binnen een filiaal. Bij een integrale telling houdt één supermarkt manager van een ander filiaal altijd toezicht op de gehele telling. Er wordt geteld in paren waarbij één medewerker een handterminal hanteert waarin de opgenomen voorraad staat aangegeven. De andere medewerker telt de fysieke voorraad. Bij de landelijk opererende supermarktketen is de procedure geïmplementeerd dat de medewerker die telt in principe, in eerste instantie, niet te horen krijgt wat de opgenomen voorraad is. Ten behoeve van dit onderzoek is er niet getoetst in hoeverre deze procedure effectief werkt. Bij integrale tellingen van de voorraad zijn medewerkers overigens niet gebonden aan strakke deadlines per schap. Uiteraard wordt er tot op zekere hoogte wel gestuurd op het feit dat paden grof weg in een bepaalde tijd geteld moeten zijn, maar niet zeer strikt.
– 46 –
Er worden twee soorten artikelen onderscheiden, namelijk wichtartikelen (in kilogrammen) en overige artikelen (absolute eenheden). Omdat de medewerkers bekend zijn met voorraadverschillen, wordt de werkelijk getelde hoeveelheid gelijk verwerkt in de handterminal die realtime gesynchroniseerd wordt in de voorraadadministratie. Wij hebben één integrale telling bijgewoond bij een filiaal in Groningen. Het verslag van dit bezoek is opgenomen als bijlage 2 bij deze scriptie.
4.2
Incidentele tellingen van de voorraad
De belangrijkste telling bij de landelijk opererende supermarktketen betreft de hierboven beschreven kwartaal telling. Verder bestaan er bij de landelijk opererende supermarktketen nog incidentele tellingen van de voorraad. De voorraad controle risico telling (VCR telling) is hier een voorbeeld van. Bepaalde artikelen hebben een hoger risico profiel voor wat betreft mogelijke verschillen tussen de opgenomen voorraad en de werkelijke voorraad. Dit kan bijvoorbeeld veroorzaakt worden door een hogere diefstalgevoeligheid. Deze artikelen worden dan ook regelmatig geteld door teamleiders. Een teamleider stuurt voor één bepaalde artikelgroep meerdere uitvoerende medewerkers aan. Verder worden er nog incidentele artikelen geteld indien de voorraad- en omzetstatistieken daar aanleiding toe geven. Indien een courant artikel bijvoorbeeld een week niet verkocht is, geeft dit aanleiding om de werkelijk fysieke voorraad van het desbetreffende artikel vast te gaan stellen door middel van een telling.
4.3
Koppeling naar onderzoek
Op basis van de hierboven geschetste procedures ten aanzien van het tellen en algemene interne beheersing van de voorraad bij de landelijk opererende supermarktketen, is voldoende mogelijkheid gezien om tot een kwalitatief voldoende experiment te komen. De medewerkers zijn bekend met tellingen van de voorraad en er zal naar alle waarschijnlijkheid zowel blind als niet-blind geteld worden. Dit is afhankelijk van de invulling van de samenwerking binnen een groep van twee tellers.
– 47 –
5
Onderzoeksopzet
5.1
Inleiding
Om tot gefundeerde antwoorden te komen op de in hoofdstuk 1 geformuleerde deelvragen, moeten de in hoofdstuk 3 geformuleerde hypothesen onderzocht worden. Voor dit doel is gekozen een (veld)experiment uit te voeren. Om tot een experiment te komen waar de onderzoeksdoelstellingen zo veel mogelijk gerealiseerd konden worden en dat tevens praktisch haalbaar zou zijn voor de supermarktketen, is er veelvuldig overleg geweest. Een verslag van het eerste interview dienaangaande is opgenomen als bijlage 1. In dit hoofdstuk zal een uitzetting worden gegeven van het proces van begin tot eind ten aanzien van planning, uitvoering en evaluatie van het experiment.
5.2
Opzet experiment
5.2.1 Eerste opzet Bij een experiment zoals dat in deze scriptie gebruikt is, zal er altijd sprake zijn van een natuurlijk spanningsveld tussen de partij die middelen beschikbaar stelt (voor een experiment), en de partij die zoveel mogelijke goede data wil verzamelen voor een wetenschappelijk onderzoek. De belangrijkste eis die neergelegd werd door de supermarktketen was dat de belasting van de winkelorganisatie zoveel mogelijk tot een minimum beperkt zou worden. Na enkele besprekingen met de supermarktketen werd duidelijk dat de initiële inschatting ten aanzien van de omvang van het experiment niet haalbaar zou zijn. Dit vanwege het feit dat dit een te groot beslag op de winkelorganisatie zou leggen. Om het experiment in één keer uit te voeren was twee uur beschikbaar gesteld voor de gehele telploeg van (te allen tijde) acht medewerkers, zodat het experiment afgerond zou zijn wanneer het drukker begon te worden in de winkel. Hoewel het aantal waarnemingen dus ingeperkt werd, is het naar onze mening nog voldoende gebleken om op valide gronden hypothesen te kunnen verwerpen en of bevestigen. Voor vervolgonderzoek verdient het evenwel de aanbeveling meer variatie aan te brengen. Een belangrijke eis die doorgaans aan experimenten wordt gesteld, is dat de deelnemers niet mogen weten dat zij deelnemen aan het experiment. Wij zijn uiteindelijk tot de conclusie gekomen dat er aan deze eis, bij dit experiment, niet voldaan kon worden. Het feit dat bij de supermarktketen altijd met handterminals geteld wordt, maakte het al – 48 –
onmogelijk om blind tellen van de voorraad te simuleren zonder dat de deelnemers aan het experiment door hebben dat zij aan experiment meewerken. Verder is het voor de medewerkers van een filiaal ongebruikelijk dat er slechts een achttal paden geteld zouden gaan worden. Dit heeft ons doen besluiten voor de start van het experiment duidelijk aan alle betrokkenen kenbaar te maken dat zij zouden gaan deelnemen aan een experiment over het tellen van voorraden. De beschikbare telploeg van acht medewerkers is verdeeld in een groep met handterminal en een groep zonder terminal. De medewerkers met handterminal zijn uitdrukkelijk geïnstrueerd dat zij kennis moeten nemen van de opgenomen waarden in de voorraadadministratie. De groep tellers zonder handterminal legde de getelde artikelen en hoeveelheden vast op een voor dit onderzoek vervaardigde tellijst. Wij zijn van mening dat het hiervoor geschetste keuzen geen invloed gehad hebben op de bruikbaarheid van de data. Bij een supermarkt zijn medewerkers zeer bekend met het tellen van voorraden in welke setting dan ook. Bovendien was de supermarkt manager gedurende het gehele experiment nadrukkelijk aanwezig waardoor een normale telling goed benaderd werd. De tellers werden tevens op die manier gestimuleerd om hun werkzaamheden op ‘’normale’’ wijze uit te voeren. Bij de eerste opzet van het experiment is er voor gekozen om de zogenaamde wichtartikelen niet mee te laten lopen in het experiment. Omdat deze niet geteld worden in hele eenheden bestaat er geen juiste of onjuiste telling. De bepaling van de aanwezige fysieke voorraad krijgt nog meer kenmerken van een schatting, anders dan eventuele schattingselementen die reeds bestaan bij het tellen van artikelen waarvan de eenheden in stuks luiden. In de volgende paragrafen zal verder uiteen worden gezet op welke wijze het experiment vorm heeft gekregen en welke afwegingen gemaakt zijn om bepaalde controlevariabelen niet op te nemen.
5.2.2 Overige mogelijke onderzoeksvariabelen Er zijn naar onze mening nog twee potentiële interessante onderzoeksvariabelen waarvan uiteindelijk besloten is deze niet in het in paragraaf 3.2 opgenomen conceptueel model op te nemen. In deze paragraaf zal een nadere uiteenzetting gegeven worden waarom deze toch niet zijn meegenomen.
– 49 –
Tijdsdruk Tijdens het eerste interview met medewerkers van de supermarktketen bleek dat zij geïnteresseerd waren in het fenomeen tijdsdruk bij fysieke tellingen van voorraden. In eerdere hoofdstukken van deze scriptie is reeds geconstateerd dat hoge kosten gemoeid zijn met een adequate voorraadbeheersing en inventarisaties. Indien er per saldo minder tijd besteed hoeft te worden aan inventarisaties, en daarmee hetzelfde kwaliteitsniveau behaald kan worden, wordt er geld bespaard. In eerste instantie waren wij ook voornemens deze onderzoeksvariabele in het conceptueel model op te nemen en te onderzoeken in het experiment. Dit heeft ertoe geleid dat bij de uitvoering van de vijf tel ronden van het experiment er bij enkele ronden een maximale tijd is meegegeven. Bij de evaluatie van de data is echter ten aanzien van tijdsdruk een aantal belangrijke zaken aan het licht gekomen: –
Er hebben onvoldoende telrondes plaatsgevonden waarbij een maximale tijd voor de telling was aangegeven.
–
De telploeg van acht medewerkers was te klein om een gefundeerd oordeel te kunnen vellen over de invloed van tijdsdruk op kwaliteit van tellingen.
De combinatie van beschikbare tijd en middelen heeft ons tijdens het experiment zelf al doen besluiten om de potentiële onderzoeksvariabele tijdsdruk een lagere prioriteit te geven. Bij de evaluatie heeft dit er uiteindelijk toe geleid dat deze potentiële onderzoeksvariabele geheel geëlimineerd is.
Perceptie deelnemers betrouwbaarheid voorraadadministratie Een goede onderzoeksvariabele zou de perceptie van de deelnemers aan het experiment ten aanzien van de betrouwbaarheid van de voorraadadministratie zijn. Dit vanwege de veronderstelling dat aan voorinformatie nu eenmaal een andere waarde toegekend zal worden bij wisselende kwaliteiten van voorraadadministraties. Indien een teller al weet dat er nooit verschillen gevonden worden zal de waarde die men toekent aan deze voorinformatie hoger zijn dan bij het tegenovergestelde. Om deze variabele te onderzoeken is deelnemers aan dit experiment gevraagd een oordeel te geven over de betrouwbaarheid van de voorraadadministratie op een schaal van één tot tien. Het aantal deelnemers aan het onderzoek is beperkt, en de antwoorden van de deelnemers bevatten ook nog eens zeer weinig spreiding, waardoor geen zinvolle analyses met de verzamelde data gemaakt konden worden. De beperkte spreiding is waarschijn– 50 –
lijk veroorzaakt doordat deelnemers aan het experiment goed op hoogte zijn van de kwaliteit van de voorraadadministratie. Daarom hebben wij besloten om deze variabele niet in ons onderzoeksmodel op te nemen.
5.2.3 Uitgesloten controlevariabelen In het onderzoeksmodel zoals opgenomen in paragraaf 3.2 is een aantal controlevariabelen niet opgenomen, welke men in eerste instantie wel in het model zou verwachten. In deze paragraaf zal een nader inzicht gegeven worden in de beweegredenen die tot uitsluiting van deze controlevariabelen heeft geleid.
Leereffect Wanneer tellers beter leren tellen zal het aantal fouten afnemen. Indien het telniveau gedurende het experiment wijzigt zal hiervoor gecontroleerd moeten worden in de analyses. De leercurve bij tellingen van de voorraad is echter zeer stijl, bovendien hebben alle tellers ervaring met tellen waardoor ze reeds bij aanvang van het experiment bovenin de leercurve zitten, derhalve verwachten wij niet dat een leereffect optreed en zal hier ook niet voor gecontroleerd worden.
Waarde van artikelen Artikelen die een hogere waarde vertegenwoordigen krijgen van de teller mogelijk meer aandacht waardoor de kwaliteit van de telling toe zou nemen. Ook is het mogelijk dat de teller meer waarde aan de voorraadadministratie toekent bij artikelen met een hoge waarde, waardoor het anchoring effect sterker op zal treden. Indien voor deze effecten niet gecontroleerd zou worden, zou dat de bruikbaarheid van de data negatief kunnen beïnvloeden. De te tellen artikelen vertegenwoordigen echter geen van allen een waarde hoger dan vijf euro, daarom hoeft hiervoor bij de analyse van de resultaten niet voor gecontroleerd te worden.
5.3
Uitvoering experiment
Bij de start van het experiment is samen met de supermarktmanager de selectie bepaald. Bij de selectie van de artikelen is ervoor zorg gedragen voor voldoende spreiding van de te tellen voorraadsoorten. Dit wordt bereikt door de selectie van verschillende typen artikelen. Verder is hierbij gelet op variatie ten aanzien van hoeveelheden.
– 51 –
Omdat tijdens het experiment ook onderzoek gedaan wordt naar de invloed van onjuiste voorinformatie op de kwaliteit van de telling zou men kunnen verwachten dat er fouten aangebracht zouden moeten worden in de voorraadadministratie. Uit interviews met functionarissen van de supermarktketen bleek echter dat er onder andere door diefstal, breukverlies en bederf al regelmatig verschillen ontstaan tussen de werkelijke voorraad en de voorraad volgens de voorraadadministratie. Verder kunnen er nog verschillen ontstaan door onjuiste verwerking van verkooptransacties waardoor de fysieke voorraad hoger is dan de voorraadadministratie. Vanwege deze verschijnselen is er ook voor gekozen voorafgaand aan het experiment geen additionele fouten aan te brengen. De geselecteerde artikelen variëren van vele blikjes tomatenpuree tot enkele flessen speciale olijfolie. De acht tellers hebben per tel ronde allemaal één gangpad geteld, en wisselden vervolgens door. De volgende artikelsoorten (met bijbehorende hoeveelheid artikelen) zijn geteld: –
appelmoes 26 artikelsoorten;
–
sauzen 18 artikelsoorten;
–
olie 27 artikelsoorten;
–
rijst 24 artikelsoorten;
–
pasta’s 25 artikelsoorten;
–
wereldgerechten 18 artikelsoorten;
–
Aziatische gerechten 22. artikelsoorten;
–
tomatenpuree 9 artikelsoorten.
De supermarktmanager heeft zorg gedragen voor de selectie van de tellers. Hierbij is gestreefd naar een zo gevarieerd mogelijke samenstelling. Voor meer evenwichtige data was het overigens wel beter geweest als de handterminals (waarmee niet-blind geteld werd) gerouleerd zouden worden tussen de verschillende tellers. Op dit punt zijn we beperkt doordat de supermarktmanager de medewerkers die dagelijks de terminal werken, nu ook de terminal wilde laten gebruiken. Overigens blijkt uit de analyse in hoofdstuk 6 dat de leeftijd, ervaring en opleidingsniveau van de groep met terminal vergelijkbaar is met de groep zonder terminals.
– 52 –
In paragraaf 3.2 is het conceptueel model uiteengezet. Om een experiment op te zetten waarmee de geformuleerde hypothesen, gebaseerd op het conceptueel model, adequaat getoetst kunnen worden is het van evident belang om de juiste voorraad van de geselecteerde artikelen te weten na het experiment. Hier is praktisch invulling aangegeven doordat alle artikelen door vijf mensen geteld zijn. Indien er veel verschillen tussen de getelde waarden bestonden zijn deze artikelen door de onderzoekers en/of de supermarktmanager hertelt. Op basis van vijf waarnemingen tijdens het reguliere experiment en eventueel één (uitgebreide) additionele waarneming is de juiste fysieke voorraad bekend. Om relevante informatie te verkrijgen over de deelnemers hebben zij na afloop van het experiment allemaal een questionnaire ingevuld. De questionnaire is opgenomen in bijlage 3.
– 53 –
6
Onderzoeksresultaten
6.1
Beschrijving van de resultaten
Voordat statistische analyses op de resultaten uitgevoerd gaan worden, wordt kort stil gestaan bij de verzamelde data. Eerst worden de algemene karakteristieken beschreven worden van de mensen die aan het experiment hebben meegewerkt. Vervolgens worden de karakteristieken van de gevonden data beschreven.
6.1.1 Karakteristieken van de tellers In totaal hebben elf verschillende tellers aan het experiment meegewerkt. Alle tellers hebben tussen 17 en 109 tellingen verricht. Gezien de hoge standaarddeviatie wordt naast het gemiddelde ook de mediaan weergegeven, omdat deze dan een grotere informatiewaarde heeft. De waarden tussen haakjes betreffen de waarden gewogen voor het aantal tellingen dat elke teller heeft verricht. De standaard deviatie is ten opzichte van het ongewogen gemiddelde bepaald omdat tellers anders meerdere keren zouden worden meegenomen bij het bepalen van de standaard deviatie, hetgeen een te lage standaard deviatie zou suggereren. Hierna volgen de karakteristieken van de tellers: gemiddeld
mediaan
4,5
(3,9)
2,0
(2,0)
5,3
25,2
(23,5)
20,0
(20,0)
11,3
VMBO
27%
(14%)
HAVO
45%
(61%)
MBO
27%
(25%)
Man
55%
(46%)
Vrouw
45%
(54%)
Relevante werkervaring (jaren) Leeftijd (jaren)
st.dev.
Opleiding
Geslacht
Zoals in de onderzoekopzet beschreven hebben tellers met óf zonder terminal gewerkt. Er zijn dus geen tellers die een deel van de tellingen zonder en een deel van de tellingen met terminal hebben uitgevoerd.
– 54 –
Om vast te stellen in hoeverre dit een verstorend effect op de analyse zou kunnen hebben, zijn de karakteristieken van beide groepen onderling vergeleken. De waarden tussen haakjes betreffen wederom de waarden gewogen voor het aantal tellingen dat elke teller heeft verricht. zonder terminal
met terminal gem. Relevante werkervaring Leeftijd
3,6
(3,1)
22,4 (21,9)
med. 1,0
(1,0)
18,0 (18,0)
gem. 5,2
(4,8)
27,5 ( 25,4)
med 4,3
(5,5)
22,0 (20,0)
Opleiding VMBO
25% (15%)
33% (17%)
HAVO
50% (64%)
50% (54%)
MBO
25% (21%)
17% (29%)
Man
60% (51%)
50% (40%)
Vrouw
40% (49%)
50% (60%)
Geslacht
Gezien de spreiding in de werkervaring, leeftijd en opleiding van de tellers zijn wij van mening dat de verdeling van de tellers over de groep met terminal en de groep zonder terminal redelijk is. Tegenover de hogere werkervaring en leeftijd in de groep zonder terminal staat een lager gemiddeld opleidingsniveau. Wij denken dat de groepen vergelijkbaar zijn. Deze controlevariabelen zullen in de analyse worden meegenomen.
– 55 –
6.1.2 Karakteristiek van de data Met het experiment zijn totaal 803 waarnemingen verzameld. Hierna volgen de karakteristieken van deze data. % goed
gemiddelde
N
geteld
voorraad
st. dev.
803
77%
13,6
11,7
zonder terminal
374
80%
13,6
12,2
met terminal
429
73%
13,6
11,3
met juiste voorinfo
163
89%
10,9
6,5
met onjuiste voorinfo
266
64%
15,2
13,1
te hoge voorinfo
155
69%
13,5
12,2
te lage voorinfo
111
57%
17,4
14,1
Totaal aantal waarnemingen waarvan
waarvan
waarvan
Grafisch kan dit als volgt worden weergegeven:
400
300
200
Aantal onjuiste tellingen Aantal juiste tellingen
100
0 Geen Juiste Te hoge Te lage voorinformatie voorinformatie voorinformatie voorinformatie
– 56 –
De 803 waarnemingen hebben betrekking op 169 verschillende artikelen die allemaal tussen de drie en zes keer zijn geteld door elf verschillende tellers. Wij zijn van mening dat dit 803 unieke bruikbare waarnemingen zijn en niet 169, 11 of slechts 114. Onze argumentatie hierbij is dat de tellers hun tellingen onafhankelijk van elkaar en niet tegelijkertijd hebben verricht, hierdoor hebben de waarnemingen elkaar niet beïnvloed. Daarnaast richt ons onderzoek zich op het verschijnsel tellen en niet op het verschijnsel inventarisatie. Het feit dat de waarnemingen door slechts elf tellers zijn verricht is een beperkende factor, de resultaten kunnen als gevolg hiervan beïnvloed worden door de persoonskenmerken van de tellers. Wij verwachten hier voldoende voor te kunnen controleren, een vervolgonderzoek verdient evenwel de aanbeveling meer tellers in het onderzoek te betrekken om zo de teller specifieke effecten te minimaliseren.
6.2
Afzonderlijke analyse van de variabelen
In deze paragraaf zullen eerst alle controle- en onderzoeksvariabelen beoordeeld worden om vast te stellen of deze een significante invloed hebben op de kwaliteit van de telling. Daarna zullen de variabelen worden samengevoegd om tot één model te komen. De significantie zal vervolgens getoetst worden met een Χ2-toets. Deze toets wordt passend verondersteld omdat de onderzoeksvariabele (kwaliteit van de telling) een nominale variabele is en de controle en onderzoeksvariabelen in categorieën zijn in te delen, waardoor de verwachte en de werkelijke waarde per categorie goed met elkaar te vergelijken zijn. Telkens zal de statistische nulhypothese dat de variabele geen invloed heeft getoetst worden om vast te stellen of deze verworpen mag worden. Kwantitatieve variabelen zoals aantal artikelen zullen in dit stadium kwalitatief geanalyseerd worden (weinig, gemiddeld en veel artikelen). Als blijkt dat deze variabelen de kwaliteit van de telling significant beïnvloeden, zullen deze in het uiteindelijke model alsnog gekwantificeerd worden.
14 Men zo kunnen redeneren dat één inventarisatie heeft plaatsgevonden en dat er daarom sprake is van één waarneming.
– 57 –
6.2.1 Juiste voorinformatie of geen voorinformatie Hypothese H1 luidde: “Tellingen van de voorraad met juiste voorinformatie bevatten minder fouten dan tellingen zonder voorinformatie.” Bij de tellingen met juiste voorinformatie werd 89% goed geteld, bij de tellingen zonder voorinformatie werd 80% goed geteld. Dit lijkt de hypothese te bevestigen. Goed
Fout
Score
Juiste voorinformatie
145
18
163
89%
Geen voorinformatie
300
74
374
80%
445
92
537
83%
De kans dat deze spreiding door toeval is veroorzaakt is 1,34%. Hiermee is aangetoond dat tellingen van de voorraad met juiste voorinformatie minder fouten bevatten dan tellingen zonder voorinformatie en is hypothese H1 voorlopig bevestigd15.
6.2.2 Onjuiste voorinformatie of geen voorinformatie Hypothese H2 luidde: “Tellingen van de voorraad met onjuiste voorinformatie bevatten meer fouten dan tellingen zonder voorinformatie.” Bij de tellingen met onjuiste voorinformatie werd 64% goed geteld, bij de tellingen zonder voorinformatie werd 80% goed geteld. Dit lijkt de hypothese te bevestigen. Goed
Fout
Score
Onjuiste voorinformatie
170
96
266
64%
Geen voorinformatie
300
74
374
80%
470
170
640
73%
De kans dat deze spreiding door toeval is veroorzaakt is 0,00%. Hiermee is aangetoond dat tellingen van de voorraad met onjuiste voorinformatie meer fouten bevatten dan tellingen zonder voorinformatie en is hypothese H2 voorlopig bevestigd.
15
De hypothese is voorlopig bevestigd, omdat in dit stadium niet uitgesloten kan worden dat de gevonden resultaten door andere factoren wordt veroorzaakt, waarvoor bij afzonderlijke analyse niet voor wordt gecontroleerd. Op basis van ons uiteindelijke model waar we de onderzoeks- en controlevariabelen samenvoegen kunnen we deze hypothese definitief bevestigen of verwerpen.
– 58 –
6.2.3 Blind of niet-blind Hypothese H3 luidde: “Tellingen van de voorraad die blind worden uitgevoerd bevatten minder fouten dan tellingen die niet-blind worden uitgevoerd.” Bij de tellingen die blind werden uitgevoerd werd 80% goed geteld, bij de tellingen die niet-blind werden uitgevoerd werd 73% goed geteld. Dit lijkt de hypothese te bevestigen. Goed
Fout
Score
Met terminal
315
114
429
73%
Zonder terminal
300
74
374
80%
615
188
803
77%
De kans dat deze spreiding door toeval is veroorzaakt is 2,35%. Hiermee is aangetoond dat tellingen van de voorraad die blind worden uitgevoerd minder fouten bevatten dan tellingen die niet-blind worden uitgevoerd en is hypothese H3 voorlopig bevestigd.
6.2.4 Richting van de fouten in de voorinformatie Hypothese H4 luidde: “Tellingen van de voorraad met te hoge voorinformatie bevatten evenveel fouten als tellingen met te lage voorinformatie.” Bij de tellingen die met te hoge voorinformatie werden uitgevoerd werd 69% goed geteld, bij de tellingen die met te lage voorinformatie werden uitgevoerd werd 57% goed geteld. Dit lijkt de hypothese te verwerpen. Goed
Fout
Score
Te hoge voorinformatie
107
48
155
69%
Te lage voorinformatie
63
48
111
57%
170
96
266
64%
De kans dat deze spreiding door toeval is veroorzaakt is 3,98%. Hiermee is aangetoond dat tellingen van de voorraad die met te hoge voorinformatie worden uitgevoerd minder fouten bevatten dan tellingen die met te lage voorinformatie worden uitgevoerd en is hypothese H4 voorlopig verworpen. Een reden dat tellingen die met te hoge voorinformatie worden uitgevoerd minder fouten bevatten dan tellingen die met te lage voorinformatie worden uitgevoerd kan zijn dat men bij te lage voorinformatie, na de telling, ten onrechte genoegen neemt met het te weinig getelde aantal omdat dit met de
– 59 –
(onjuiste) voorinformatie overeenkomt. Bij te hoge voorinformatie echter gaat men echter bij een te lage telling op zoek naar meer artikelen omdat de (te hoge) voorinformatie dit voorschrijft. Omdat deze artikelen niet gevonden zullen worden (ze bestaan niet) zal dat minder snel leiden tot fouten dan in het geval van de te lage voorinformatie. Bovendien geldt voor dit experiment dat het voor de tellers gebruikelijker is dat de opgenomen waarden hoger liggen dan de getelde waarden dan vice versa. Bij de landelijke supermarktketen is men namelijk bekend met te hoog verantwoorde voorraden vanwege onvolledige registratie van breuk, afval en diefstal.
6.2.5 Hoeveelheid per artikel Om vast te stellen of de hoeveelheid per artikel invloed heeft op de kwaliteit van de telling, zijn de onderzochte artikelen eerst in drie categorieën ingedeeld. De reden hiervoor is dat hiermee relevantere analyses gemaakt kunnen worden. Er zijn weinig waarnemingen met erg veel artikelen waardoor één extra correcte of foute telling de score met 25% of 33% zou kunnen beïnvloeden. Dit effect wordt weggenomen wanneer artikelen in categorieën worden samengevoegd. Bij het opstellen van een model met meerdere variabelen kunnen we deze variabele alsnog kwantificeren. Er is gekozen voor de volgende categorieën: lage hoeveelheid per artikel (1-10), gemiddelde hoeveelheid per artikel (11-20) en hoge hoeveelheid per artikel (21 en meer). Deze verdeling is om twee redenen gekozen. Ten eerste zijn dit natuurlijke grenzen waarbij er in de eerste categorie verwacht wordt dat er nagenoeg geen fouten worden gemaakt (de artikelen kunnen op twee handen worden geteld), in de tweede categorie redelijk weinig fouten en in de derde categorie zijn fouten aannemelijk (tellen begint hier meer op schatten te lijken). Ten tweede zijn de waarnemingen op deze wijze voldoende gespreid over de categorieën. De waarnemingen in de verschillende categorieën hebben de volgende karakteristieken. Goed
Fout
Lage hoeveelheid per artikel 318
60
378
84%
7,1
2,3
Gem. hoeveelheid per artikel 245
79
324
76%
14,4
2,7
Hoge hoeveelheid per artikel 52
49
101
51%
35,1
20,7
615
188
803
77%
– 60 –
Score gem.aant. st.dev.
Hypothese H5 luidde: “Tellingen van de voorraad van een hogere hoeveelheid per artikel bevat meer fouten dan tellingen van een lagere hoeveelheid per artikel.” Bij de tellingen van een lage hoeveelheid per artikel werd 84% goed geteld, bij de tellingen van een gemiddelde hoeveelheid per artikel werd 76% goed geteld en bij de tellingen van grote hoeveelheden per artikel werd 51% goed geteld. Dit lijkt de hypothese te bevestigen. De kans dat deze spreiding door toeval is veroorzaakt is 0,00%. Ook de spreiding van de score tussen de categorieën weinig artikelen en gemiddeld aantal artikelen en tussen de categorieën gemiddeld aantal artikelen en veel artikelen is significant (respectievelijk p = 0,0048 en p = 0,0000). Hiermee is aangetoond dat de tellingen van weinig artikelen minder fouten bevatten dan tellingen met veel artikelen en is hypothese H5 bevestigd16.
6.2.6 Leeftijd, relevante werkervaring en opleiding Als leeftijd, relevante werkervaring en opleiding alle drie als afzonderlijke controlevariabelen in het model opgenomen zou worden is het risico groot dat verstoringen op zullen gaan treden als gevolg van correlatie tussen deze controlevariabelen. Daarom zal in het model een proxy ingebouwd worden die deze drie variabelen vertegenwoordigd. Om te onderzoeken hoe deze proxy het beste samengesteld kan worden zal eerst de invloed van deze variabelen afzonderlijk op de kwaliteit van de telling onderzocht worden. Alle variabelen zullen in groepen worden onderverdeeld, waarna onderzocht zal worden of de ene groep beter telt dan de andere groep. De groepen zullen dusdanig gekozen worden dat het aantal waarnemingen redelijk over de groepen is verdeeld en dat de analyse tot zinvolle uitkomsten kan leiden. Het aantal tellers is te beperkt om het effect van leeftijd en relevante werkervaring op de telkwaliteit kwantitatief te onderzoeken. Voor de variabele leeftijd is onderscheid gemaakt naar tellers tot achttien jaar en tellers vanaf achttien jaar.
16 In tegenstelling tot de hypothesen ten aanzien van de onderzoeksvariabelen, gaan we er van uit dat hypothesen ten aanzien van de controlevariabelen definitief kunnen worden bevestigd of verworpen. Wij veronderstellen dat onderzoek naar de afzonderlijke controlevariabelen niet wordt verstoord door andere variabelen en dat gevonden resultaten dus representatief zijn. Indien en alleen indien ons uiteindelijke model hier aanleiding toe geeft, zullen we nog op deze hypothesen terugkomen.
– 61 –
Dit geeft de volgende telresultaten. Leeftijd
Goed
Fout
Score gem.lftd.17 st.dev.
15-18 jaar
261
98
359
73%
17,0
1,4
19-48 jaar
354
90
444
80%
32,0
11,5
615
188
803
77%
Hypothese H6 luidde: “Tellingen van de voorraad uitgevoerd door oudere tellers bevatten minder fouten dan tellingen uitgevoerd door jongere tellers.” Bij de tellingen verricht door oudere tellers werd 80% goed geteld en bij de tellingen verricht door jongere tellers werd 73% goed geteld. De kans dat deze spreiding door toeval is veroorzaakt is 1,94%. Hiermee is aangetoond dat de tellingen van de voorraad verricht door oudere tellers minder fouten bevatten dan tellingen verricht door jongere tellers en is hypothese H6 bevestigd. Voor de variabele werkervaring is onderscheid gemaakt tussen maximaal één jaar werkervaring en meer dan één jaar werkervaring. In het onderzoek wordt verondersteld dat winkelpersoneel na één jaar al zeer hoog in de leercurve is aanbeland en dat meer werkervaring vanaf dat moment geen significante invloed meer heeft op de telvaardigheden. Dit geeft de volgende telresultaten: Goed
Fout
0-1 jaar
245
97
342
72%
0,7
0,4
meer dan 1 jaar
370
91
461
80%
7,6
5,6
615
188
803
77%
Werkervaring
Score
gem.erv. st.dev.
Hypothese H7 luidde: “Tellingen van de voorraad uitgevoerd door tellers met meer relevante werkervaring bevatten minder fouten dan tellingen uitgevoerd door tellers met minder relevant werkervaring.” Bij de tellingen verricht door de tellers met meer relevante werkervaring werd 80% goed geteld en bij de tellingen verricht door de tellers met minder relevante werkervaring werd 72% goed geteld. De kans dat deze spreiding door toeval is veroorzaakt is 0,43%. Hiermee is aangetoond dat de tellingen van de voorraad verricht door tellers met meer relevante werkervaring minder fouten bevatten 17 Deze gemiddelden en standaard deviaties zijn bepaald op basis van de tellers in de groep, niet op basis van het aantal waarnemingen.
– 62 –
dan tellingen verricht tellers met minder relevante werkervaring en is hypothese H7 bevestigd. Voor de variabele opleiding is onderscheid gemaakt naar de opleidingen VMBO, HAVO en MBO. Eén teller liep stage bij de supermarktketen en was bezig met zijn HBO opleiding. Omdat dit de enige HBO teller was en de opleiding nog niet is afgerond is, is besloten deze teller aan de categorie HAVO toe te voegen. Dit geeft de volgende telresultaten: Goed
Fout
VMBO
88
26
114
77%
HAVO
350
136
486
72%
MBO
177
26
203
87%
615
188
803
77%
Opleiding
Score
Hypothese H8 luidde: “Tellingen van de voorraad uitgevoerd door tellers met een hogere opleiding bevatten evenveel fouten als tellingen uitgevoerd door tellers met een minder hoge opleiding.” Bij de tellingen verricht door tellers met een VMBO opleiding werd 77% goed geteld, bij de tellingen verricht door tellers met een HAVO opleiding werd 72% goed geteld en bij de tellingen verricht door tellers met een MBO opleiding werd 87% goed geteld. De kans dat deze spreiding door toeval is veroorzaakt is 0,01%. De onderlinge spreiding tussen VMBO en MBO en tussen HAVO en MBO is ook significant (respectievelijk p = 0,0210 en p = 0,0000). De onderlinge spreiding tussen VMBO en HAVO is niet significant (p = 0,2625). Op basis hiervan kan worden geconcludeerd dat tellers met een MBO achtergrond significant beter tellen dan tellers met een HAVO of VMBO achtergrond. Op basis hiervan kan hypothese H8 bevestigd noch verworpen worden. Omdat aangetoond is dat tellingen van de voorraad verricht door tellers met een MBO opleiding minder fouten bevatten dan tellingen verricht door mensen met alleen een middelbare schoolopleiding, zal dit onderscheid bij het samenstellen van de proxy worden meegenomen. Zowel leeftijd, werkervaring als opleiding lijken significante invloed te hebben op de kwaliteit van de telling. Zoals gesteld zal een proxy worden samengesteld om verstoringen door correlatie tussen controlevariabelen te voorkomen. Er is voor gekozen om de variabele leeftijd niet in deze proxy mee te nemen, omdat deze in de tellerspopulatie
– 63 –
in het experiment te veel correleert met werkervaring. Er is maar één teller ouder dan achttien met maximaal één jaar werkervaring en er is maar één teller met meer dan één jaar werkervaring jonger dan achttien jaar. De proxy wordt als volgt samengesteld. Tellers krijgen één punt voor een MBO opleiding en één punt voor meer dan één jaar werkervaring, op deze wijze krijgen de tellers een opleidings- en ervaringsscore van nul tot en met twee. Recapitulerend kan de score uit onderstaande tabel worden afgeleid: werkervaring (jaren) 0-1
1+
VMBO
0
1
HAVO
0
1
MBO
1
2
opleiding
Om te controleren of deze proxy voldoende onderscheidend vermogen heeft, worden de telresultaten van de verschillende groepen met elkaar vergeleken. Dit geeft de volgende telresultaten. Opl.-/erv.score
Goed
Fout
Score
Terminal
0
245
97
342
72%
71%
1
193
65
258
75%
45%
2
177
26
203
87%
34%
615
188
803
77%
53%
– 64 –
Grafisch kan dit als volgt worden weergegeven.
400 300 200
Aantal onjuiste tellingen Aantal juiste tellingen
100 0 0
1
2
Opleidings- en ervaringsscore
Hypothese H10 luidde: “Tellingen van de voorraad die uitgevoerd worden door oudere tellers met meer relevante werkervaring en een hogere opleiding zullen minder fouten bevatten dan tellingen die uitgevoerd worden door jongere tellers met minder relevante werkervaring en een minder hoge opleiding.” Ondanks het feit dat gekozen is om de variabele leeftijd niet in de proxy mee te nemen, hoeft de hypothese niet aangepast te worden. Gezien de grote mate van correlatie tussen leeftijd en relevante werkervaring, impliceert meer relevante werkervaring automatisch een hogere leeftijd. Bij de tellingen van de voorraad verricht door tellers met een opleidings- en ervaringsscore score van 0 werd 72% goed geteld, bij de tellingen verricht door tellers met een opleidings- en ervaringsscore van 1 werd 75% goed geteld en bij de tellingen verricht door de tellers met een opleidings- en ervaringsscore van 2 werd 87% goed geteld. De kans dat deze spreiding door toeval is veroorzaakt is 0,01%. De onderlinge spreiding tussen de scores nul en één, tussen de scores nul en twee en tussen de scores één en twee is ook significant (respectievelijk p = 0,0235, p = 0,0000 en p = 0,0003). Hiermee is aangetoond dat de tellingen van de voorraad uitgevoerd door tellers met meer relevante werkervaring en een MBO opleiding minder fouten bevatten dan tellingen verricht door tellers met minder relevante werkervaring en uitsluitend een middelbare schoolopleiding. Hiermee is ook het onderscheidende vermogen van onze proxy vastgesteld en kan worden geconcludeerd dat de samengestelde proxy een nuttige en goede contro-
– 65 –
levariabele is in een model om de kwaliteit van de telling te voorspellen. Hypothese H11 is hiermee ook bevestigd. Wat opvalt, is dat de waarnemingen met terminal niet evenredig over de opleidings- en ervaringsscores zijn verdeeld, er zijn relatief veel tellers met een opleidings- en ervaringsscore van nul die met een terminal hebben geteld. Dit kan de slechtere telresultaten van tellingen met terminal voor een deel verklaren, het kan ook zijn dat de scores per opleidings- en ervaringsscore per categorie door het wel of niet tellen met een terminal is beïnvloed. Een model waarin zowel de onderzoeksvariabelen als de controlevariabelen zijn opgenomen zal uitwijzen welk deel door de opleiding en werkervaring wordt veroorzaakt en welk deel door het wel of niet tellen met terminal. De waarnemingen met en zonder terminal moeten voldoende over de drie categorieën van opleidings- en ervaringsscore verdeeld zijn om zinvolle analyses te kunnen uitvoeren.
6.2.7 Geslacht Hypothese H9 luidde: “Tellingen van de voorraad die door mannen zijn uitgevoerd bevatten evenveel fouten als tellingen die door vrouwen zijn uitgevoerd.” Bij de tellingen die door mannen zijn uitgevoerd werd 79% goed geteld, bij de tellingen die door vrouwen zijn uitgevoerd werd 75% goed geteld. Deze percentages liggen dicht bij elkaar en statistische analyse zal moeten uitwijzen of de verschillen significant zijn. Goed
Fout
Score
Mannen
290
79
369
79%
Vrouwen
325
109
434
75%
615
188
803
77%
De kans dat deze spreiding door toeval is veroorzaakt is 21,65%. De verschillen tussen mannen en vrouwen zijn daarmee niet significant. Daarmee kan worden geconcludeerd dat het geslacht geen significante invloed heeft op de kwaliteit van de telling. Daarmee is hypothese H9 niet verworpen18. Op basis hiervan is gekozen om het geslacht niet mee te nemen als controlevariabele in het model.
18 Er is geen significant verschil tussen de kwaliteit van tellingen door mannen en de kwaliteit van tellingen door vrouwen aangetoond. Dit betekent niet dat dit verschil er niet is. Mogelijk zou een grotere steekproef wel significante verschillen aan het licht kunnen brengen. Op basis van onze resultaten is de verwachting dat eventuele (significante) verschillen in telkwaliteiten klein zullen zijn.
– 66 –
Logistisch model
6.3
6.3.1 Theorie Nu de afzonderlijke invloed van de controle- en onderzoeksvariabelen op de kwaliteit van de telling is vastgesteld, kan een model worden opgesteld waarin alle variabelen zijn opgenomen. Hiermee kan de invloed van de onderzoeksvariabele gecorrigeerd voor de invloeden van de controlevariabelen op de kwaliteit van de telling worden vastgesteld. Er is voor gekozen om hier een logistisch model voor te gebruiken. Een logistisch model is ideaal om continue onderzoeks- en controlevariabelen te combineren met een nominale afhankelijke variabele (zoals juiste of onjuiste telling). Naast continue is het ook mogelijk om nominaal verdeelde onderzoeks- en controlevariabelen toe te voegen.
Een logistisch model heeft de volgende vorm:
̂( ) =
1 1+
waarbij z de resultante is van de onderzoeksvariabelen. Grafisch ziet deze functie er als volgt uit.
kans (p)
1
p(z)
0 -6
-4
-2
0 z waarde
– 67 –
2
4
6
De z-waarde correleert met de kans dat de afhankelijke variabele 1 is. Een z-waarde van nul komt overeen met een kans van 50% op 1 (en dus 50% op 0). De functie p(z) is zodanig dat p altijd een waarde tussen 0 en 1 heeft. Z kan uit meerdere variabelen bestaan en wordt dan als volgt vastgesteld. ( ,
,
,
,
)=
+
+
+
+
+
waarbij xi de variabelen zijn en βi de mate waarin zij z (en daarmee de kans van een waarde 1 van de afhankelijke variabele) beïnvloeden. Het spreekt voor zich dat x zowel continu als nominaal kan zijn. Aan de hand van de coëfficiënten βi kan ook de zogenaamde odds ratio worden berekend. De kans dat de afhankelijke variabele 1 wordt (ten opzichte van de kans dat deze variabele 0 wordt) neemt met
toe als xi met 1 toeneemt. Voor het woord odds be-
staat geen goede Nederlandse vertaling. Odds is de kans uitgedrukt als
. Als kans
op een gebeurtenis bijvoorbeeld 90,91% is, bedragen de odds 10 (tegen 1).
6.3.2 Variabelen Op basis van de analyses verricht in paragraaf 6.2 is besloten de volgende inputvariabelen mee te nemen in het model: –
aantal artikelen (controlevariabele); Niet als categorie maar als natuurlijk getal.
–
opleidings- en ervaringsscore (controlevariabele). Zie paragraaf 6.2.6 voor de bepaling van deze proxyvariabele die een waarde tussen nul en twee kan aannemen.
–
soort voorinformatie (onderzoeksvariabele); Met drie dummy variabelen zoals uiteengezet in paragraaf 3.2 (x3 tot en met x5).
Dit is een lichte aanpassing van het conceptueel model, waarin nog van een andere samenstelling van de proxyvariabele was uitgegaan. Gezien de aard van de aanpassing zijn wij van mening dat het conceptueel model nog steeds stand houdt en bruikbaar is.
– 68 –
De gekozen controlevariabelen komen nagenoeg volledig overeen met het in paragraaf 3.2 opgesteld conceptueel model, alleen de samenstelling van de proxyvariabele is anders dan waar in het conceptuele model vanuit was gegaan. Dit komt doordat hypothese H8 is ontkracht en omdat de variabele leeftijd in de dataset geen aanvullende informatiewaarde had naast de variabele opleiding. Verder zijn hypothesen H5, H9 en H10 alle drie bevestigd.
6.3.3 Model De data zijn in een logistische regressietoepassing19 ingevoerd om de coëfficiënten van de variabelen te bepalen. Dit geeft het volgende model om de kans (p) op een juiste telling te bepalen.
̂( ) = waarbij z = ( ,
,
,
,
) = 1,7032 − 0,0480
1 1+
+ 0,3967
− 0,8318
− 0,5089
+ 0,7685
waarbij: x1 = Aantal artikelen x2 = Opleidings- en ervaringsscore x3 = Dummy voor te lage voorinformatie x4 = Dummy voor te hoge voorinformatie x5 = Dummy voor juiste voorinformatie De logistische regressietoepassing heeft met een Χ2-toets de algemene passendheid geschiktheid van het model bepaald. Hieruit volgt een p-waarde van 0,0000, wat inhoudt dat het opgestelde logistisch model zeer passend is voor deze dataverzameling. De logistische regressietoepassing heeft ook de significantie van de gevonden coëfficienten berekend. Hieruit volgen de volgende p-waarden voor ß1, ß2, ß3, ß4 en ß5 (0,000; 0,0010, 0,0008, 0,0266 en 0,0096). Deze p-waarden geven aan dat de logistische correlatie tussen de onafhankelijke en de afhankelijke variabelen zeer significant is. De 19 Er is gebruik gemaakt van de logistische regressie toepassing op http://statpages.org/logistic.html
– 69 –
richtingen van de coëfficiënten komen overeen met de analyses die in paragraaf 6.2 zijn uitgevoerd en met de verwachtingen die in het conceptueel model zijn opgenomen. Om de passendheid van dit model te demonstreren is de p(z) in een grafiek weergegeven, met daarbij de voorspelde waarnemingen. Om te voorkomen dat de waarnemingen uitsluitend de waarden nul en één zouden aannemen (goed of fout geteld), zijn alle waarnemingen op de bijbehorende z-waarde gesorteerd en gegroepeerd per twintig waarnemingen. Per groep hebben is de gemiddelde z-waarde en het percentage juiste tellingen bepaald. In onderstaande grafiek vertegenwoordigt elk blauw punt een groep van twintig waarnemingen en wordt het percentage juiste tellingen vergeleken met het percentage dat verwacht zou mogen worden op basis van het gevonden model.
kans (p)
1
waarneming p(z)
-0,5000
0 0,0000
0,5000
1,0000 1,5000 z waarde
2,0000
2,5000
3,0000
Er is vastgesteld dat te lage voorinformatie negatief correleert met de kwaliteit van de telling (kans op juiste telling neemt met ca. 56%20 af ten opzichte van geen voorinformatie), dat te hoge voorinformatie negatief correleert met de kwaliteit van de telling (kans op juiste telling neemt met ca. 40%21 af ten opzichte van geen voorinformatie) en
20 e-0,8317-1 21 e-0,5088-1
– 70 –
dat juiste voorinformatie positief correleert met de kwaliteit van de telling (kans op juiste telling neemt met ca. 116%22 toe ten opzichte van geen voorinformatie). Uit de volgende analyse blijkt dat deze correlatie meer dan 95% betrouwbaar is, hiertoe zijn de betrouwbaarheidsintervallen zowel in een tabel als grafisch weergegeven. coëfficiënt dummy variabele
gemiddeld
ondergrens
bovengrens
voor te lage voorinformatie (β3)
-0,8317
-1,3183
-0,3455
voor te hoge voorinformatie (β4)
-0,5088
-0,9589
-0,0589
voor onjuiste voorinformatie (β5)
0,7685
0,1867
1,3504
β5
β4
β3 -2,0
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
2,0
Zoals vastgesteld is het verband tussen onjuiste voorinformatie en de kwaliteit van de telling negatief en het verband tussen juiste voorinformatie en de kwaliteit van de telling positief. Op basis van deze analyse kan niet worden geconcludeerd welke soort onjuiste voorinformatie de kwaliteit van de telling negatiever beïnvloedt, het 95% betrouwbaarheidsintervallen van beide coëfficiënten overlappen. Ook bij lagere betrouwbaarheidsintervallen (90%, 80%) overlappen de intervallen. Op basis van dit model zijn hypothesen H1 en H2 (tellingen van de voorraad met juiste voorinformatie bevatten minder fouten dan tellingen zonder voorinformatie en tellingen van de voorraad met onjuiste voorinformatie bevatten meer fouten dan tellingen zonder voorinformatie) definitief bevestigd.
22 e0,7685-1
– 71 –
Hypothese H4 (tellingen van de voorraad met te hoge voorinformatie bevatten evenveel fouten als tellingen met te lage voorinformatie) kan op basis van dit model niet meer worden verworpen. Het model geeft geen directe informatie over H3:(tellingen van de voorraad die blind worden uitgevoerd bevatten minder fouten dan tellingen die niet-blind worden uitgevoerd), maar op basis van de omvang en de significantie van de coëfficiënt voor de soort voorinformatie, mag worden geconcludeerd dat de verbanden gevonden in paragraaf 6.2 standhouden en niet (uitsluitend) door de controlevariabelen zijn veroorzaakt. Derhalve houdt ook de conclusie uit paragraaf 6.2.3 stand en is hypothese H3 definitief bevestigd.
6.4
Invloed van onderzoeksvariabele op controlevariabelen
Om de invloed van de onderzoeksvariabele op controlevariabelen te onderzoeken worden de modellen opgesteld naar analogie van het model uit paragraaf 6.3.3. De variabele ‘soort voorinformatie’ zal hierbij niet als modelinput worden meegenomen, maar als filter op de dataset worden gebruikt om deze in vieren te delen om aan de hand van deze subdatasets afzonderlijke modellen op te stellen. De coëfficiënten van de verschillende subdatasets zullen met elkaar worden vergeleken om te kijken of deze significant van elkaar afwijken.
6.4.1 Vier modellen De modellen die zijn gebaseerd op de subdatasets zijn gebaseerd op aanzienlijk minder waarnemingen dan het model opgesteld in paragraaf 6.3.3. Dit vergroot de kans dat het model onvoldoende passend is, dan wel dat de coëfficiënten niet significant zijn. Daarom zal eerst aan de hand van een Χ2-toets de passendheid van de modellen worden bepaald. Dit geeft de volgende uitkomsten: Model voor waarnemingen: met juiste voorinformatie
Χ2
df
p
N
9,0050
2
0,0111
163
zonder voorinformatie
19,0350
2
0,0001
374
met te hoge voorinformatie
29,1373
2
0,0000
155
met te lage voorinformatie
3,4923
2
0,1744
111
– 72 –
Het model voor waarnemingen met te lage voorinformatie is onvoldoende passend om verdere analyses te maken (p > 0,05). Dit heeft ons doen besluiten om te kijken of het mogelijk is om deze waarnemingen samen te voegen met de waarnemingen bij te hoge voorinformatie tot een categorie waarnemingen met onjuiste voorinformatie om daarmee wel een passend model voor verdere analyses op te stellen. De Χ2-toets voor de passendheid van dit nieuwe model geeft de volgende uitkomsten: Model voor waarnemingen: met onjuiste voorinformatie
Χ2 29,9356
df 2
p
N
0,0000
266
Dit model is wel passend en zal worden betrokken in de verdere analyses. De drie modellen hebben de volgende coëfficiënten: juiste voorinformatie β0 constante β1 aantal artikelen β2 opleidings-/ervaringsscore geen voorinformatie β0 constante β1 aantal artikelen β2 opleidings-/ervaringsscore onjuiste voorinformatie β0 constante β1 aantal artikelen β2 opleidings-/ervaringsscore
coëfficiënt
st.fout
p
-0,0488
0,0286
0,0872
0,3142
0,3873
0,4172
coëfficiënt
st.fout
p
-0,0568
0,0132
0,0000
0,1117
0,1743
0,5214
coëfficiënt
st.fout
p
-0,0418
0,0146
0,0042
0,7512
0,1958
0,0001
2,5146
2,1175
0,7740
Uit de p-waarden die horen bij de gevonden coëfficiënten valt af te leiden dat de verbanden tussen de inputvariabelen en de afhankelijke variabelen niet sterk zijn. Dit wordt veroorzaakt doordat de subdatasets minder waarnemingen bevatten dan de totale dataset. Dit betekent niet dat er geen analyses op kunnen worden uitgevoerd.
– 73 –
Wel verkleint dit de kans om significante verschillen tussen de coëfficiënten van de verschillende subdatasets te onderkennen. Dit komt omdat de hoge p-waarden een gevolg zijn van een hoge standaard fout. Mocht dit onderzoek in de toekomst met meer waarnemingen per categorie worden herhaald is het goed mogelijk dat dan meer significante verschillen tussen de categorieën worden gevonden.
6.4.2 Analyse van de coëfficiënten voor het aantal artikelen De gevonden coëfficiënten en de betrouwbaarheidsintervallen hiervan (bij 95% betrouwbaarheid) zijn als volgt. β1 aantal artikelen
gemiddeld
ondergrens
bovengrens
geen voorinformatie
-0,0568
-0,0826
-0,0310
juiste voorinformatie
-0,0489
-0,1048
0,0072
onjuiste voorinformatie
-0,0418
-0,0703
-0,0132
Grafisch kan dit als volgt worden weergegeven
β1 onjuiste voorinformatie β1 juiste voorinformatie β1 geen voorinformatie -0,12
-0,10
-0,08
-0,06
-0,04
-0,02
0,00
0,02
De gevonden β1 van de verschillende modellen ligt in het 95% betrouwbaarheidsinterval van de overige modellen, op basis hiervan is geconcludeerd dat de coëfficiënten niet significant van elkaar verschillen. Verdere analyse met 90% en 80% betrouwbaarheidsintervallen hebben ook geen significante resultaten opgeleverd.
– 74 –
Hypothese H11 luidde: “De aanwezigheid van en het soort voorinformatie hebben geen invloed op de mate waarin het aantal artikelen de kwaliteit van de telling beïnvloedt.” Deze hypothese kan niet worden verworpen. Op basis van deze dataset kan geen verdere conclusies getrokken worden.
6.4.3 Analyse van de coëfficiënten voor de opleidings- en ervaringsscore De gevonden coëfficiënten en de betrouwbaarheidsintervallen hiervan (bij 95% betrouwbaarheid) zijn als volgt. Β2 opleidings-/ervaringsscore
gemiddeld
ondergrens
bovengrens
geen voorinformatie
0,1117
-0,2299
0,4534
juiste voorinformatie
0,3142
-0,4449
1,0734
onjuiste voorinformatie
0,7512
0,3674
1,1350
Grafisch kan dit als volgt worden weergegeven
β2 onjuiste voorinformatie β2 juiste voorinformatie β2 geen voorinformatie -1,00
-0,50
0,00
0,50
1,00
1,50
2,00
Het 95% betrouwbaarheidsinterval van de β2 van alle modellen overlappen. Op basis hiervan kan geen significant verschil worden aangetoond. Omdat de overlap tussen geen voorinformatie en onjuiste voorinformatie zeer klein is, is besloten om deze analyse te herhalen met een 90% betrouwbaarheidsinterval. Dit geeft de volgende gegevens: Β2 opleidings-/ervaringsscore
gemiddeld
ondergrens
bovengrens
–
geen voorinformatie
0,1117
-0,1750
0,3985
–
onjuiste voorinformatie
0,7512
0,4291
1,0733
– 75 –
Grafisch kan dit als volgt worden weergegeven
β2 onjuiste voorinformatie
β2 geen voorinformatie -0,40
-0,20
0,00
0,20
0,40
0,60
0,80
1,00
1,20
1,40
1,60
Hieruit blijkt dat de 90% betrouwbaarheidsintervallen van β2 voor de modellen voor geen voorinformatie en voor onjuiste voorinformatie niet overlappen, op basis hiervan kan (met een betrouwbaarheid van 90%) geconcludeerd worden dat deze significant van elkaar verschillen. Voor de β2 voor het model met juiste voorinformatie zijn ook analyses met 90% en 80% betrouwbaarheid uitgevoerd, hier zijn geen significante resultaten uit gebleken. Hypothese H12 luidde: “De aanwezigheid van en het soort voorinformatie heeft geen invloed op de mate waarin de proxy voor leeftijd en ervaring23 de kwaliteit van de telling beïnvloedt.” Deze hypothese is verworpen. Het significante verschil tussen de coëfficienten van het model voor tellingen zonder voorinformatie en het model voor tellingen met onjuiste voorinformatie impliceert dat opleiding en ervaring een veel grotere rol speelt bij tellingen van de voorraad met onjuiste voorinformatie dan bij tellingen van de voorraad zonder voorinformatie. Dit suggereert dat organisaties er goed aan doen om bij niet-blinde tellingen van de voorraad ervaren mensen in te zetten. Bij niet-blind tellen van de voorraad is het immers van belang om juist de foute voorinformatie te corrigeren. Bij blinde tellingen van de voorraad bestaat deze noodzaak niet.
23 Het feit dat in paragraaf 6.2.6 voor een wijziging van de proxy is gekozen doet geen afbreuk aan de conclusie. De hypothese blijft verworpen.
– 76 –
7
Conclusie
In deze scriptie staat de volgende hoofdvraag centraal: Leidt blind tellen van de voorraad tot minder telfouten dan niet-blind tellen? Om deze hoofdvraag te kunnen beantwoorden zijn in hoofdstuk 1 de volgende deelvragen geformuleerd: 1) Welke invloed heeft voorinformatie op de kwaliteit van de telling? 2) Welke invloed heeft de hoeveelheid per artikel op de kwaliteit van de telling? 3) Hoe beïnvloedt de aard van de informatieverstrekking de relatie tussen de controlevariabelen en de kwaliteit van de telling. Tijdens het experiment zijn 803 waarnemingen verzameld. Het blind tellen van de voorraad werd benaderd door de tellers met hardcopy lijsten te laten werken waar geen opgenomen hoeveelheden op staan. Het niet-blind tellen van de voorraad werd gesimuleerd door het tellen met een handterminal waarin de opgenomen hoeveelheden vermeld staan. Er zijn 374 waarnemingen verzameld voor het blind tellen en 429 met niet-blind tellen. Ten aanzien van de invloed van voorinformatie op de kwaliteit van de telling (eerste deelvraag), kan uit het experiment geconcludeerd worden dat blind tellen van de voorraad leidt tot minder telfouten dan niet-blind tellen. Hierbij moet opgemerkt worden dat blind-tellen alleen leidt tot minder telfouten indien er fouten bestaan in de te tellen populatie. Uit het experiment is gebleken dat indien er juiste voorinformatie beschikbaar was er in 89% van de gevallen goed geteld is. Het blind-tellen leidde tot 80% goede tellingen en tellen met onjuiste voorinformatie tot 64% goede tellingen. Dit is gezien het doel van inventariseren echter niet relevant, want het is juist van belang om de artikelen die foutief staan geregistreerd juist te tellen. Verder is een model ontworpen waarmee is aangetoond dat de kans op een juiste telling met ca. 116% toeneemt indien er juiste in plaats van geen voorinformatie wordt verstrekt.
– 77 –
De kans op een juiste telling neemt met 56% af indien te lage voorinformatie in plaats van geen voorinformatie wordt vermeld en met 40% af indien te hoge voorinformatie in plaats van geen voorinformatie wordt vermeld. In dit onderzoek is verder aangetoond dat de kwaliteit van de telling negatief wordt beïnvloed door de hoeveelheid per artikel (tweede deelvraag). De artikelen die geteld zijn tijdens het experiment, zijn ingedeeld in drie klassen te weten lage hoeveelheden per artikel, gemiddeld hoeveelheden per artikel en hoge hoeveelheden per artikel. Bij de tellingen van een lage hoeveelheid per artikel werd 84% goed geteld, bij de tellingen van een gemiddeld hoeveelheid per artikel werd 76% goed geteld en bij de tellingen van een hoge hoeveelheid per artikel werd 51% goed geteld. Wat betreft de derde deelvraag zijn de conclusies als volgt. Er is niet aangetoond dat de hoeveelheid per artikel de kwaliteit van de telling anders beïnvloed bij verschillende vormen van informatieverstrekking. Wel is aangetoond dat de (positieve) invloed van opleiding en ervaring op de kwaliteit sterker is bij onjuiste voorinformatie dan zonder voorinformatie. Dit impliceert dat organisaties er goed aan doen om ervaren mensen in te zetten mochten ze, ondanks de uitkomsten van dit onderzoek, besluiten de voorraad niet-blind te tellen. Op grond van de conclusies op de deelvragen is het antwoord op de hoofdvraag bevestigend. De anchoring vuistregel van Tversky en Kahneman (1974) blijkt dus ook voor tellen van de voorraad te gelden. Voorts is gegeven de veelheid aan fouten in voorraadadministraties de impact van de slechtere tellingen als gevolg van de onjuiste voorinformatie groter dan de impact van juiste voorinformatie. Bovendien zijn inventarisatie er op gericht fouten op te sporen, waardoor de gevolgen van onjuiste voorinformatie groter zijn dan juiste voorinformatie. Met name de derde vuistregel van Tversky en Kahneman inzake adjustment and anchoring lijkt hier dus op te gaan. De voorraden die in de handterminals staan vermeld lijken een anchor te zijn waar een te grote waarde aan wordt toegekend. Quod erat demonstrandum: Blind tellen van de voorraad is beter!
– 78 –
Nawoord Terugkijkend op het hele schrijfproces van onze scriptie overheerst toch een gevoel van tevredenheid bij ons beiden. Het onderwerp sprak ons al vanaf het begin aan, met name omdat het voelde als niet eerder verkent terrein. Toch was de opstart fase wel het meest pittige. Bij het literatuuronderzoek hebben wij op een gegeven moment wel op een kruispunt gestaan in hoeverre we er wel mee door moesten gaan. Een geweldige steun in de rug was echter het vrij vlekkeloze verlopen proces van goedkeuring onderzoeksvoorstel. Wij realiseren ons wel terdege dat wij ons daarna verkeken hebben op wat er allemaal bij komt kijken voordat je een experiment zoals het onze, waar toch de nodige bijzonderheden en gevoeligheden bij spelen, gepland en uitgevoerd hebt. Toch is dit, achteraf bezien, logisch gezien het feit dat het een supermarktketen nou eenmaal behoorlijk wat tijd en geld kost om een onderzoek als het onze te faciliteren. Een logisch gevolg van de uitdagingen en strubbelingen die met het experiment samen hingen, was dat wij bepaalde concessies hebben moeten doen aan de opzet van het experiment. De coördinatie en daadwerkelijke voorbereiding in het filiaal zelf verliep daarom wat meer ad hoc dan waar wij zelf naar streefden. Alleen toen het experiment medio maart 2011 daadwerkelijk plaats had gevonden kwam afronding van de scriptie in zicht. Het proces overdenkend kunnen wij toch wel concluderen dat het wel een absolute meerwaarde heeft om een masterscriptie met zijn tweeën te schrijven. Voor ons gevoel hebben wij qua diepgang, zowel op het gebied van de literatuur als de statische analyses, toch een extra slag kunnen maken. Bovendien hebben wij het beide als zeer waardevol ervaren om met elkaar te kunnen sparren over de inhoud van de scriptie en bepaalde keuzes die daarbij gemaakt moesten worden. Wij denken dat onze scriptie een mooie aanleiding kan geven tot breder wetenschappelijk onderzoek op dit gebied. Bij een groter opgezet wetenschappelijk onderzoek kan er ruimte gemaakt worden om een breder conceptueel model te hanteren en tevens meer data te verzamelen. Met een degelijke publicatie op dit gebied in een internationaal A-journal kan de, in onze ogen, leemte op het gebied van telmethoden bij inventarisaties (hopelijk) ingevuld worden.
– 79 –
Literatuurlijst Deckers, F.B.M. en J.C.E.van Kollenburg, (2002), Elementaire theorie accountantscontrole, Groningen, Stenfert Kroese. DeHoratius, N. en A. Raman, (2008), ‘’Inventory record inaccuracy: an empirical analysis’’, Management Science, 54, 4, p. 627-641. Emby, C., A.M.G. Gelardi en D.J. Lowe, (2002), ‘’A research note on the influence of outcome knowledge on audit partners’ judgments’’, Behavioral Research in Accounting, 14, 1, p. 87-103. Estes, R. en D.D. Reams, (1988), ‘’Effects of personal characteristics on materiality decisions: a multivariate analysis’’, Accounting and Business Research, 18, 72, p. 291-296. Fischhoff, B., (1975), ‘’Hindsight ≠ foresight: the effect of outcome knowledge on judgment under uncertainty’’, Journal of Experimental Psychology: Human Perception and Performance, 1, p. 288-299. Francis, J.R. en M.D. Yu, (2009), ‘’Big 4 office size and audit quality’’, The accounting review, 84, 5, p. 1521-1552. Hasher, L., M.S. Attig en J.W. Alba, (1981), ‘’I knew it all along: or, Did I?’’, Journal of Verbal Learning and Verbal Behavior, 20, p. 86-96. Jans, E.O.J., (2001), Grondslagen administratieve organisatie, Groningen, Stenfert Kroese. Jansen, F.J., (2010), ‘’Voorraad schatten met gebruikmaking van regressie’’, Presentatie op symposium Statistical Auditing. (http://www.limperginstituut.nl/powerpoint/2010/ Jansen%20Voorraad%20regressie-schatten.ppt) Kinney Jr, W.R. en Uecker W.C., (1982), ‘’Mitigating the consequences of anchoring in auditor judgements’’, The Accounting Review, 57, 1, p. 55-69.
– 80 –
Koninklijk NIVRA en NOVAA, (2011), Handleiding regelgeving accountancy, Amsterdam McMillan, J.J. en R.A. White, (1993), ‘’Auditors’ belief revisions and evidence search: the effect of hypothesis frame, confirmation bias and professional skepticism’’, The Accounting Review, 68, 3, p. 443-465. Raats V.M. en J.J.A. Moors, (2003), ‘’Double-checking auditors: a bayesian approach’’, The Statistician, 52, 3, p. 351-365. Raats V.M., J.J.A. Moors en B.B. van der Genugten, (2006), ‘’A mixed model for double checking fallible auditors’’, Communications in Statistics – Theory and Methods, 35, p. 1723-1743. Rabin, M en J.L. Schrag, (1999), ‘’First impressions matter: a model of confirmatory bias’’, The Quarterly Journal of Economics, 114, 1, p. 37-82. Reimers, J.L. en S.A. Butler, (1992), ‘’The effect of outcome knowledge on auditors’ judgmental evaluations’’, Accounting, Organizations and Society, 17, 2, p. 185-194. Relph, G. W., Brzeski en G. Bradbear, (2002), ‘’The First steps to inventory management’’, Control, p. 18-22. Rinehart, R.F. (1960), ‘’Effects and causes of discrepancies in supply operations’’, Operations Research, 8, 4, p. 543-564. Slovic, P. en B. Fischhoff, (1977), ‘’On the psychology of experimental surprises’’, Journal of Experimental Psychology: Human Perception and Performance, 3, 4, p. 544-551. Tversky, A en D. Kahneman, (1974), ‘’Judgement under uncertainty: Heuristics and Biases’’, Science, 185, 4157, p. 1124-1131.
– 81 –
United States General Accounting Office, (2002), ‘’Executive Guide: best practices in achieving consistent, accurate physical counts of inventory and related property’’, http://www.gao.gov/new.items/d02447g.pdf (10 juni 2011).
Websites: http://en.wikipedia.org/wiki/Logistic_regression http://en.wikipedia.org/wiki/T_test http://nl.wikipedia.org/wiki/Chi-kwadraattoets http://statpages.org/logistic.html
– 82 –
Bijlage 1: Interviewverslag eerste afspraak landelijke opererende supermarktketen d.d. 30 september 2010 Aanwezig: Dhr. R. Hazewinkel
Teamleider management reporting
Dhr. M. Diepeveen
Medewerker team management reporting
Niels van de Koppel Dolf Duivenvoorden De aanleiding voor het centrale onderzoek in deze scriptie is afkomstig van een praktijk discussie bij een landelijke opererende supermarktketen. Enkele medewerkers verantwoordelijk voor het voorraadbeheersing proces stellen zich op het standpunt dat niet blind tellen van de voorraad de kwaliteit en efficiency van de inventarisaties meer ten goede komt dan dat blind tellen van de voorraad dat doet. Vanuit dit praktijk probleem is het onderzoeksonderwerp voor deze scriptie ontstaan. Om meer duidelijkheid te krijgen over de richtlijnen en procedures met betrekking tot de inventarisaties van de landelijk opererende supermarktketen hebben wij een oriënterend interview afgenomen met dhr. R. Hazewinkel (teamleider management reporting) en dhr. M. Diepeveen (medewerker team management reporting). Dit interviewverslag zal opgebouwd worden aan de hand van de agenda die wij tijdens het interview behandeld hebben.
Introductie Tijdens het introductierondje hebben de aanwezigen zich voorgesteld en kort aangegeven waar zij werkzaam zijn, ervaring toegelicht en andere relevante informatie gedeeld. Ook is de doelstelling van het gesprek aan de orde gekomen.
Introductie scriptie Tijdens dit punt hebben wij de achtergrond en inhoud van ons onderzoek toegelicht. Onderwerp diende zich aan door discussie over blind- en niet-blind tellen van voorraden tussen de controlerende accountant en het hoofd R&D.
Telaanpak Nederland De supermarktketen heeft ongeveer 600 winkels in Nederland. Er wordt gewerkt met kwartaalafsluitingen. Per kwartaal worden er ongeveer 65 winkels geselecteerd voor een integrale telling. De selectie vindt plaats door de afdeling management reporting
– 83 –
die gezeteld is op het hoofdkantoor. Op basis van de uitkomsten van deze steekproeven worden voorraadposities geëxtrapoleerd voor alle winkels.
Telaanpak per winkel Wij hebben de interne handleidingen en procedurebeschrijvingen van de supermarktketen mogen inzien. Deze handleidingen en procedurebeschrijvingen zijn tevens tijdens het interview aan bod gekomen. Bij het telproces per winkel zijn er vier belangrijke functies te onderscheiden: –
(Assistent) Supermarkt Manager; Deze functionaris is tijdens de gehele integrale telling aanwezig binnen de winkel en is verantwoordelijk voor het juiste verloop van de integrale telling. Gedurende het verloop van de integrale telling voert deze functionaris steekproefsgewijs telcontroles uit. Tijdens de integrale telling controleert een supermarkt manager van een andere winkelgroep (filiaal) de opvolging van de juiste procedures en de kwaliteit van de telling.
–
Toezichthouders; De toezichthouders zijn de meer ervaren medewerkers binnen een filiaal. Zij sturen de tellers aan en zijn het eerste aanspreekpunt voor de tellers in het geval van vragen en/of onvolkomenheden. De toezichthouders zijn verantwoordelijk voor enkele paden per filiaal. Zij krijgen voor het gedeelte waarvoor zij verantwoordelijk zijn gedeelten van de moederlijst. Per assortimentsgroep vullen zij de starttijd van het tellen in. De compleet getelde en ondertekende delen van de moederlijst worden bij de (assistent) supermarkt manager ingeleverd.
–
Tellers; De tellers werken in koppels van twee. Er zijn maximaal 30 koppels aan het tellen binnen een filiaal.
–
Medewerkers Group Control; Deze medewerkers hebben de winkels geselecteerd en voeren zogenaamde vliegende (onaangekondigde) controles uit bij de uitvoering van de integrale tellingen van de voorraad.
Zoals eerder gememoreerd worden de integrale tellingen van de voorraad uitgevoerd in koppels, meestal op een zondag wanneer de hele winkel stil ligt. In de periode hier-
– 84 –
voor wordt ervoor gezorgd dat er geen losse artikelen/dozen in de winkel staan maar dat alles in de schappen staat. Voor een integrale telling zijn er 30 handterminals beschikbaar. In deze handterminals worden voorraadgegevens ingelezen van de tellen locaties. Eén medewerker krijgt de beschikking over de handterminal en de andere medewerker gaat de voorraden daadwerkelijk tellen. Tussen beide medewerkers is derhalve een scheiding aangebracht qua verantwoordelijkheden. Tijdens het interview wordt ook aangegeven dat er een bewustzijn is bij de medewerkers dat de opgenomen voorraad in het systeem ook niet heilig zijn, aangezien er vele factoren spelen die de juistheid van de in het systeem opgenomen hoeveelheden beïnvloeden. Hierbij is diefstal de belangrijkste factor. De aantallen/hoeveelheden die door de medewerker geteld worden, worden door de andere medewerker ingegeven in de handterminal. De getelde aantallen/hoeveelheden worden als fysieke voorraad opgenomen in het systeem en ‘’overschrijft’’ de opgenomen voorraad voorafgaand aan de integrale telling. De uitkomsten worden zowel door het filiaal zelf geëvalueerd als door Group Control. Er bestaan bepaalde kritieke grenzen die bepalen in hoeverre er onderzoek gedaan wordt naar de telverschillen. In sommige gevallen, als de telverschillen zeer hoog zijn, dient de integrale telling opnieuw plaats te vinden.
Controleaanpak controlerende accountant Uit het interview is naar voren gekomen dat de controlerende accountant zelf geen steekproef uitvoert op de juiste aantallen in de voorraad. De controlerende accountant steunt op de inventarisatieprocedures van de supermarktketen.
Experiment Tijdens het interview is aandacht besteed aan een mogelijk uit te voeren experiment ten behoeve van onze scriptie. Beide heren geven aan dat het lastig is om voorraadinformatie foutief op te nemen in de handterminals. Een goed alternatief is hiervoor dat telploegen de winkel ingestuurd worden met hardcopy lijsten die wel en niet gemanipuleerd zijn. Er wordt aangegeven dat het aspect tijdsdruk interessant is voor de supermarktketen, omdat dit een directe link heeft met de kosten die met de integrale tellingen van de voorraad gemoeid zijn.
– 85 –
Bijlage 2: Verslag bijwonen integrale telling vestiging Groningen Algemeen Op zaterdagavond was het magazijn en de buitenring in de winkel reeds voorgeteld. Ik werd ontvangen door de supermarkt manager en na een korte introductie van zijn zijde kreeg ik vervolgens de gelegenheid om zelfstandig het telproces in de winkel te observeren. In de winkel heb ik tussentijds vragen kunnen stellen aan de toezichthouders. Tot slot heb ik nog enkele vragen aan de supermarkt manager gesteld. Het proces van de integrale telling maakte een geordende indruk, de winkel was voorafgaand aan de telling opgeruimd en aangevuld, waardoor de magazijnvoorraad minimaal was. Er waren naar schatting ongeveer 40 medewerkers bij de telling betrokken (voornamelijk uitvoerend). De tellers leken niet onder tijdsdruk te staan en leken hun werk serieus te nemen en zodoende nauwkeurig te tellen.
Telprocedure De integrale telling werd uitgevoerd door teams van twee personen, één persoon telt en één persoon hanteert de terminal. In de terminal staan de te tellen artikelen geregistreerd met daarbij de voorraad volgens de voorraadadministratie. Op het moment dat een verschil werd geconstateerd, werd de getelde hoeveelheid in de terminal ingevoerd (in principe zonder hertelling). De winkelindeling is in de terminals geladen. Hierdoor verschijnen automatisch de artikelsoorten op het scherm van de terminal die op dat moment geteld moeten worden. Per gangpad is een teamleider verantwoordelijk voor de telling. De teamleider beantwoordt vragen van tellers en houdt toezicht op het proces. Naast de reguliere schappen is ook nog beperkte voorraad aanwezig in het magazijn en in actieschappen. Het magazijn is voorafgaand aan de inventarisatie geteld, de uitkomsten van deze telling zijn op post-its op de reguliere schappen vermeld opdat ze in de daadwerkelijke inventarisatie bij de schapvoorraad opgeteld kunnen worden. Actieschappen worden na afloop van de reguliere inventarisatie geteld, en bij de eerdere telresultaten opgeteld. Onjuist geplaatste voorraad die tijdens de inventarisatie is
– 86 –
aangetroffen wordt apart gezet en ook na afloop van de reguliere inventarisatie bij de telresultaten opgeteld. Er waren meer telploegen dan terminals. Hierdoor beschikken niet alle telploegen over een terminal. Tellers die niet over een terminal beschikken voeren zelfstandig (dus niet in ploegen van twee) tellingen uit. Deze tellingen worden op post-its geregistreerd. Deze tellingen worden later, als er een terminal beschikbaar komt ingevoerd.
Wichtartikelen Artikelen die op gewicht worden gewaardeerd (bijvoorbeeld groente en fruit), worden per krat geteld. De (hele) kratten hebben standaard gewichten. Delen van kratten worden gewogen en vervolgens wordt het totale gewicht in de terminal ingevoerd.
– 87 –
Bijlage 3: Questionnaire Questionnaire inventarisatie van de voorraad Leeftijd: …..………………………………………………………………………………………………… Geslacht: M / V Functie: ……..……..……………………………………………………………………………………… ……………………………………….. Jaren werkervaring bij supermarktketen: ………..…………………………………………………………………………………………… ….. Opleidingsniveau: …………………………………………………………………………………………………… ………………………… Cijfer voor betrouwbaarheid voorraadadministratie supermarktketen op schaal van 1 tot 10: ………………………. Hartelijk dank voor uw medewerking aan dit experiment! Met vriendelijke groet, Niels van de Koppel Dolf van Duivenvoorden
– 88 –