Kunstmatige intelligentie nuttig bĳ complexe, herhalende en informatie-intensieve taken

Kunstmatige intelligentie nuttig bĳ complexe, herhalende en informatie-intensieve taken Data zĳn overal. De accountantspraktĳk worstelt met de vraag hoe zĳ het beste om kan gaan met relevante data. Kunstmatige intelligentie kan concreet waarde toevoegen aan onze dagelĳkse praktĳk. Martĳn Schut - Forensic Technology, Advisory Gerwin Naber - Forensic Technology, Advisory

1. Kunstmatige intelligentie maakt geautomatiseerde analyses nog effectiever Accountants hebben vaak te maken met systemen waar zeer grote hoeveelheden data opgeslagen staan en/of gegenereerd worden (grootboektransacties, bedrĳfsprocessen, correspondentie). Deze data moeten goed geanalyseerd worden voordat de onderneming ze kan gebruiken voor bĳvoorbeeld bedrĳfsbeslissingen. Bĳ het opstellen of controleren van de jaarrekening is daar vaak niet veel tĳd voor: veelal moeten de geanalyseerde data snel beschikbaar zĳn. Handmatige analyse is dan geen optie. Deze techniek is tĳdrovend en niet efficiënt. Daarom worden geautomatiseerde analyses en tools alom gebruikt. Het summum van de technologie die daarbĳ gebruikt wordt, is kunstmatige, of artificiële intelligentie. Kunstmatige intelligentie kan nog efficiënter en effectiever ingezet worden dan nu het geval is.

34

Spotlight Jaargang 18 - 2011 uitgave 4

Met geavanceerdere methoden kunnen we een grote stap vooruit maken; een vervolgstap naar kennis. Want er zĳn voldoende toepassingen om data (opgeslagen feiten) in informatie om te zetten, maar leveren deze ook kennis op? Om relevant te zĳn willen we die vervolgstap naar kennis maken (accumulatie van informatie) en uiteindelĳk naar wĳsheid (waarde toekennen aan kennis).

2. Al zeventig jaar ervaring De toepassing van kunstmatige intelligentie is in de afgelopen tien jaar in een stroomversnelling terechtgekomen door vooral twee ontwikkelingen: de sterke groei van datavolume en de verdergaande automatisering. Het (continu) analyseren van de steeds grotere hoeveelheden data is een van de grootste automatiseringsuitdagingen van de 21e eeuw.

Deze twee ontwikkelingen bakenen kunstmatige intelligentie af als een uniek werkveld: de automatisering komt als het ware ‘for free’ omdat kunstmatigeintelligentiemethoden in de basis al bedoeld zĳn om op een computer uit te voeren. Dit staat in tegenstelling tot de traditionele manieren. Wat betreft het geautomatiseerd zoeken naar patronen in data heeft kunstmatige intelligentie al zo’n zeventig jaar ervaringskennis op zĳn cv staan. Daar kan geen andere ICT-discipline aan tippen.

Kunstmatige intelligentie is een fenomeen dat onlosmakelĳk is verbonden aan de digitale revolutie waarin we ons bevinden. Het niet toepassen van kunstmatige intelligentie is simpelweg het negeren van een inherente potentie; de vraag is dus niet zozeer waarom, maar hoe we kunstmatige intelligentie moeten gebruiken.

3. Vier zaken bepalen welke patronen en uitzonderingen relevant zĳn Ondernemingen en accountants zĳn vaak geinteresseerd in de uitzonderingen op de regel. Bĳvoorbeeld als de accountant fraude wil detecteren of als de onderneming inefficiënties in bedrĳfsprocessen wil vinden. Kunstmatige intelligentie, zĳnde een techniek die patronen zoekt, kan daar een rol bĳ spelen aangezien het vinden van patronen impliceert wat de uitzonderingen zĳn (per definitie: de rest van de data). Maar welke uitzonderingen zĳn relevant en welke niet? In de praktĳk loopt men meteen tegen een aantal zaken aan die belangrĳk zĳn om te weten voor het beantwoorden van deze vraag: 1. Welke dataset dient als basis voor de analyse? 2. Welk patroon moet gebruikt worden? 3. Klopt het dat er veel meer uitzonderingen zĳn dan niet-uitzonderingen? 4. Hoe kunnen de resultaten doorgrond worden?

Ad 1. Elke analyse vraagt een andere dataset Ten eerste is het van belang dat weloverwogen besloten wordt welke dataset als basis dient voor de analyse. De financiële administratie, vooral de boekingen in het grootboek, krĳgt veel aandacht. De data in het grootboek kennen evenwel een relatief simpele structuur en hebben veelal uitsluitend betrekking op de verantwoording van de uitkomst van een bedrĳfsactiviteit (bĳvoorbeeld de betaling van een crediteur). In hoeverre zĳn data over de omvang, begunstigde en het tĳdstip van een betaling relevant voor het identificeren van een patroon? Wanneer een accountant een relevante uitzondering wil identificeren, dan zĳn data over de toedracht, de totstandkoming van de bedrĳfsactiviteit (bĳvoorbeeld door wie en wanneer is de crediteur en de factuur ingevoerd en goedgekeurd) relevanter. Sinds ‘Enterprise Resource Planning’systemen (ERP-systemen) hun intrede hebben gedaan zĳn dergelĳke data, al dan niet in verschillende modules vastgelegd en zodoende beschikbaar voor analyse.

Samenvatting In dit artikel wordt bekeken wat kunstmatige intelligentie is, waarom we het zouden gebruiken, hoe we het kunnen toepassen en wanneer we het kunnen gebruiken. En hoe verhouden menselĳke en kunstmatige intelligentie zich tot elkaar? De analytische toepassing van kunstmatige intelligentie is binnen de context van dit artikel het meest relevant: het zoeken en vinden in grote hoeveelheden financiële of anderszins bedrĳfsgerelateerde data. Dit is traditioneel het werkgebied van onder meer statistici en wiskundigen. Maar er is een belangrĳk verschil tussen kunstmatige intelligentie en de traditionele benadering, wat mede versterkt wordt door de verdergaande automatisering en sterke groei van datavolume. Dit wordt uiteengezet.

Kunstmatige intelligentie: een rĳke aanvulling op onze dagelĳkse praktĳk Kunstmatige intelligentie is de wetenschap die zich bezighoudt met het creëren van kennis en wĳsheid in een artefact, wat normaal gesproken een computer is. Kunstmatige en menselĳke intelligentie vullen elkaar aan Geavanceerde, intelligente technologie doet steeds vaker zĳn intrede in de accountantspraktĳk voor de analyse van zeer grote hoeveelheden data. Het summum van deze technologie is kunstmatige, of artificiële intelligentie: een verzameling methoden en technieken waarmee we automatisch patronen kunnen herkennen, uitvoeren en genereren. Kunstmatige intelligentie wordt al gebruikt bĳ het zoeken naar uitzonderingen op de regel, bĳvoorbeeld bĳ fraudedetectie en het traceren van inefficiënties in bedrĳfsprocessen. Interessante recente ontwikkelingen binnen de kunstmatige intelligentie zĳn de analyse van ongestructureerde data en van organisatieprocessen. Het succes van kunstmatige intelligentie hangt uiteindelĳk af van het slim inzetten ervan: kunstmatige en menselĳke intelligentie vullen elkaar aan, waarbĳ de menselĳke intelligentie het voortouw neemt. Automatisch patronen herkennen, uitvoeren en genereren Doel van kunstmatige intelligentie is het nabootsen van menselĳke intelligentie. In de praktĳk komt het neer op het gebruik van een verzameling methoden en technieken waarmee we automatisch patronen kunnen herkennen, uitvoeren en genereren. Dit kan betekenen: • het programmeren van computers - het patroon is dan een computerprogramma; • computers laten leren - het computerprogramma genereert zelfstandig een ander computerprogramma; of • het analyseren van data op bepaalde patronen - de computer herkent patronen of leert zelf patronen herkennen. Kunstmatige intelligentie biedt een rĳkdom aan intelligente methoden, technieken en tools die ingezet kunnen worden in onze dagelĳkse praktĳk.

Spotlight Jaargang 18 - 2011 uitgave 4 35

Ad 2. Zelflerende software zoekt relevante uitzonderingen Vervolgens zĳn er verschillende gradaties voor het herkennen van patronen. Soms weten we vooraf wat het patroon is dat we zoeken, bĳvoorbeeld bĳ het controleren op het naleven van bepaalde beleidsregels: voldoen de data eraan of niet? In dat geval kunnen we relatief ‘makkelĳk’ bepalen of gevonden uitzonderingen relevant zĳn of niet. In het overgrote deel van de praktĳksituaties weten we niet wat het (weerbarstige) patroon van de reguliere bedrĳfsactiviteiten is, en dus zĳn de afwĳkingen die we zoeken zogenoemde ‘unknown unknowns’. Een deelgebied van kunstmatige intelligentie dat zich bezighoudt met zelflerende software, kan hiervoor ingezet worden. Ad 3. Besef dat een patroon niet per definitie door ‘de meeste gevallen’ gevormd wordt Ten derde, als we een patroon vinden is het niet noodzakelĳk dat de meeste gevallen hieronder vallen: de meeste gevallen zĳn uitzonderingen. Dit strookt misschien niet met de intuïtie die men heeft bĳ dit werk: men zou verwachten dat de meeste gevallen een patroon volgen. Verwachtingen moeten hierop afgestemd worden. Het opschonen van data is het dusdanig prepareren van data dat het door de computer ingelezen kan worden. Het opschonen is, zoals gezegd, niet alleen voorbereiding. Het bepaalt ook welke patronen en uitzonderingen gevonden zullen worden. Een voorbeeld van patronen en uitzonderingen is opgenomen in het kader.

Ad 4. Resultaten doorgronden Ten slotte moet men zich realiseren dat het vinden van de uitzonderingen slechts de eerste stap is. Als de computer ‘klaar’ is, hebben we veelal een lange lĳst van uitzonderingen waarvan we niet weten of ze relevant, interessant of belangrĳk zĳn. Dan begint dus eigenlĳk het werk voor de menselĳke intelligentie: accountant en onderneming werken nauw samen om deze lĳst in te korten om uiteindelĳk te komen tot een beperkt aantal relevante cases. Dit proces kan natuurlĳk iteratief ondersteund worden met kunstmatige intelligentie, en ook visualisatietechnieken zĳn waardevol voor het genereren van inzicht dat bĳdraagt aan het doorgronden van resultaten en het zodoende genereren van kennis. Bepaal per situatie welke patronen en uitzonderingen relevant zĳn Als deze vier zaken in kaart gebracht zĳn, kan per situatie de vraag beantwoord worden welke patronen en uitzonderingen relevant zĳn.

4. Kunstmatige intelligentie heeft toegevoegde waarde bĳ identificeren van patronengebruik De vraag wanneer kunstmatige intelligentie te gebruiken is, is niet eenduidig te beantwoorden. Voor simpele vraagstukken is het mogelĳk overkill, voor complexe problemen is het soms (nog) niet geavanceerd genoeg. Wel kunnen de situaties waarin kunstmatige intelligentie toegevoegde waarde heeft, gekarakteriseerd worden.

Voorbeeld: meer uitzonderingen dan niet-uitzonderingen De Nederlandse werkwoorden kunnen we regelmatig (allemaal volgens hetzelfde patroon) of onregelmatig (uitzonderingen op dit patroon) vervoegen. Stel dat we alle (of een groot deel van) vervoegde vormen van werkwoorden in willekeurige volgorde in een lange lĳst zetten. Vervolgens laten we een computer (met enige kennis van de Nederlandse taal) deze werkwoorden classificeren in regelmatige en onregelmatig vormen. Als dit correct gebeurt, zullen er uiteindelĳk zo’n 40% regelmatige werkwoorden en 60% onregelmatige werkwoorden gevonden worden. Dus er is in 60% van de gevallen een uitzondering op de regel gevonden.

36


Voorbeelden van situaties die zich goed lenen voor kunstmatige intelligentie In de ene situatie heeft kunstmatige intelligentie meer toegevoegde waarde dan in een andere. Deze situaties lenen zich zeer goed voor kunstmatige intelligentie:

•

Complexe, herhalende en informatieintensieve taken Kunstmatige intelligentie kan goed ingezet worden bĳ taken die complex, herhalend en informatie-intensief van aard zĳn. Bĳ complexe taken kunnen op relatief eenvoudige manier non-lineaire verbanden in kaart worden gebracht. Bĳ herhalende en informatie-intensieve taken kan gezocht worden naar patronen (herhaling) in zeer grote databestanden (informatie-intensief).

•

Logische en organisatorisch consistente omgevingen Kunstmatige intelligentie gedĳt het best in omgevingen die logisch en organisatorisch consistent zĳn. De steeds verdergaande digitalisatie van bedrĳven werkt deze consistentie steeds meer in de hand.

Er is een onderscheid tussen gestructureerde en ongestructureerde data Het verschil tussen gestructureerde en ongestructureerde data is als volgt:

•

Gestructureerde data liggen normaliter vast Gestructureerde data liggen normaliter vast in een databaseformaat en zĳn een opsomming van feiten die relatief eenvoudig te koppelen en te analyseren zĳn. Voorbeelden hiervan zĳn de financiële administratie, subadministraties en andere databases met al dan niet bedrĳfsgerelateerde data.

•

Ongestructureerde data kennen geen eenduidige indeling Ongestructureerde data daarentegen zĳn veelal beschrĳvend van aard en kennen geen eenduidige indeling

waardoor vergelĳking en analyse op voorhand complex is. Voorbeelden van (semi-)ongestructureerde data zĳn de digitale versie van een contract, notulen, een verzameling van spreadsheets, (gescande) brieven en elektronische correspondentie (e-mail).

nodig. De data kunnen nog zo adequaat zĳn, er zit altĳd nog een mens achter het succesvol toepassen van kunstmatige intelligentie. De mens kan genuanceerder anticiperen op tussentĳdse bevindingen, bĳvoorbeeld op basis van ervaring of het inwinnen van inlichtingen bĳ

Wanneer wordt kunstmatige intelligentie gebruikt om relevante (afwĳkingen van) patronen te kunnen identificeren? Er zĳn drie situaties: • de situatie dat de accountant of onderneming uitsluitend beschikt over gestructureerde data; • de situatie dat de accountant of onderneming uitsluitend beschikt over ongestructureerde data; en • de situatie dat we beschikken over een combinatie van gestructureerde en ongestructureerde data.

5. Uitsluitend gestructureerde data? Kunstmatige intelligentie helpt bĳ identificeren relaties Wanneer er uitsluitend gestructureerde data zĳn, kan kunstmatige intelligentie helpen bĳ het identificeren van relaties. Zo kan kunstmatige intelligentie de samenhang vaststellen van de feiten die in de gestructureerde data aanwezig zĳn, om vervolgens waarschĳnlĳkheden of verwachtingen aan die relatie te koppelen zodat patronen en afwĳkingen geïdentificeerd kunnen worden. Het succes van een dergelĳke toepassing van kunstmatige intelligentie hangt af van twee aspecten: • De beschikbare data moeten adequaat zĳn. Ze moeten die feiten (rollen, interacties, bevoegdheden enzovoort) over de organisatie bevatten die nodig zĳn om relevante patronen vast te kunnen stellen. • Het kan op een andere manier (menselĳke intelligentie) niet efficiënter. Menselĳke interventie nodig voor analyse gestructureerde data Bĳ alle toepassingen met kunstmatige intelligentie blĳft menselĳke interventie

procesverantwoordelĳken. Ook de weerbarstige praktĳk vergt duidelĳke afbakening in de analyse en, gegeven het gestructureerde karakter van de data, kan de inbreng van de menselĳke intelligentie relatief eenvoudig vertaald worden in analyse van grote hoeveelheden gestructureerde data.

6. Uitsluitend ongestructureerde data? Kunstmatige intelligentie is bĳ uitstek geschikt Het ontdekken van patronen in ongestructureerde data vergt inzicht in het onderwerp De situatie dat er uitsluitend sprake is van ongestructureerde data is een totaal andere dan de situatie dat er sprake is van uitsluitend gestructureerde data. Het ontdekken van patronen in ongestructureerde data (bĳvoorbeeld categorieën van documenten met soortgelĳke inhoud of correspondentie over een bepaald onderwerp) vergt inzicht in het onderwerp(en) dat beschreven wordt in de ongestructureerde dataset. Kunstmatige intelligentie kan op basis van analyses van de gehanteerde semantiek relaties tussen documenten identificeren. Dit is een

techniek die accountants kunnen toepassen indien bĳvoorbeeld correspondentie over bepaalde transacties geïdentificeerd moet worden. Geraffineerdheid kunstmatige intelligentie een pre voor complexe analyse De kracht van de toepassing van kunstmatige intelligentie voor ongestructureerde data ligt niet alleen in het feit dat het voor een mens niet proportioneel is om honderden, duizenden en soms miljoenen documenten handmatig te analyseren. Een dergelĳke toepassing van kunstmatige intelligentie is tevens waardevol omdat de geraffineerdheid van de techniek een pre is in een dergelĳk complexe analyse zonder structuur. Daar komt bĳ dat de bevindingen eenvoudig te bevatten zĳn (een categorie is bĳvoorbeeld wel of niet relevant) en iteratieve analyse mogelĳk maakt (het systeem leert indien aangegeven wordt welke documenten wel en niet relevant zĳn). Tevens is de kracht van kunstmatige intelligentie in dit scenario dat de techniek léért van de voorhanden dataset. Zodoende is de toepassing onafhankelĳk van de taal en worden patronen geïdentificeerd die vooraf onbekend waren (bĳvoorbeeld het gebruik van bepaalde terminologie die vooraf onbekend is).

7. Combinatie gestructureerd en ongestructureerd? Menselĳke intelligentie stuurt en anticipeert Een combinatie van gestructureerde en ongestructureerde data moet steeds vaker geïnterpreteerd worden. Bĳvoorbeeld een bank die bepaalde transacties uitvoert waarvan de correspondentie inzicht geeft in de omstandigheden waarin dit is gebeurd. Of een projectontwikkelaar die voorzieningen verantwoordt nadat dit in een vergadering is besloten en zodoende de context blĳkt uit de opgemaakte notulen (inclusief de verschillende versies daarvan). In navolging van voorgaande kan kunstmatige intelligentie succesvol toegepast worden wanneer de menselĳke intelligentie sturing kan geven en kan

Spotlight Jaargang 18 - 2011 uitgave 4 37

anticiperen op tussentĳdse bevindingen. Een kritische succesfactor is een multicompetente samenwerking tussen professionals die de techniek, de praktĳk en de doelstelling van de analyse bevatten.

Figuur 1. Common Data Model

Data Mining

Common Data Model

Data Cleansing & Profiling

8. Conclusie Het inzetten van kunstmatige intelligentie betekent niet dat de menselĳke intelligentie aan de kant gezet kan worden: het wordt opgenomen in een iteratief mens-computerproces. Het succes van kunstmatige intelligentie hangt af van het slim inzetten: kunstmatige en menselĳke intelligentie zĳn niet uitwisselbaar, maar vullen elkaar aan waarbĳ de menselĳke intelligentie het voortouw neemt. Een uitzondering is de beschreven analyse van grote hoeveelheden ongestructureerde data; de geraffineerdheid van kunstmatige intelligentie kan in een dergelĳk scenario het verschil maken en analyses uitvoeren die anders als niet proportioneel worden beschouwd. Verder moet de menselĳke intelligentie gestimuleerd blĳven om relevante analyses te kunnen blĳven geven. Vooral bĳ gestructureerde data zĳn de mogelĳke analyses niet beperkt door de techniek, maar door onze eigen creativiteit. Een nieuw initiatief op het gebied van gestructureerde data is ‘proces mining’: het analyseren van het bedrĳfsactiviteiten aan de hand van beschikbare data (‘logging’). Een dergelĳke analyse kan helpen met het identificeren van (opzettelĳke) afwĳkingen van patronen die relevant kunnen zĳn voor de accountantscontrole.

38


Data Gathering Disparate Systems

Multiple Locations

G/L

A/P, A/R

Multiple Company Codes

Different Business Units

Structured Data

Data Analysis Matching Logic Payroll

Extract Transform Load

Risk Scoring

P-Card

In-depth analysis of large volumes of data

High-risk Reports Interactive Research Ad-hoc reports

Global Databases

Semi-Structured Data

Raw Data

Een gerelateerd aandachtsgebied voor het uitvoeren van relevante analyses is de overgang van 1-dimensionaal naar multidimensionaal analyseren. Dan wordt niet uitsluitend gekeken naar transacties die bĳvoorbeeld in het weekend plaatsvinden en/of een autorisatieniveau overschrĳden, maar deze analyse wordt gecombineerd met andere relevante aspecten waardoor de context van een transactie betrokken wordt (wat doen andere personen in de gelĳke positie, wat zĳn gemiddelde bedragen en gaat een transactie samen met andere ‘red flags’, zoals doorbreken van functiescheiding). Kunstmatige intelligentie kan ons helpen met het uitvoeren van dergelĳke analyses; in het algemeen is kunstmatige intelligentie nuttig bĳ complexe, herhalende en informatieintensieve taken en in gestandaardiseerde omgevingen; voor mission-critical taken

Data Enrichment

Actionable Information

en inzake besluitvorming moet men zich afvragen of men dit over zou willen laten aan kunstmatige intelligentie. De menselĳke intelligentie beschikt over voldoende creativiteit die zich met voldoende kennis van de techniek kan laten vertalen in effectieve en relevante data-analyses.

Kunstmatige intelligentie nuttig bĳ complexe, herhalende en informatie-intensieve taken

Recommend Documents