&
FINANCE
CONTROL
Informatiemanagement
D eci sion-managementsyste men
VISUAL ANALYTICS Decision-managementsystemen helpen bij beslissingsprocessen. Hoe werken dit soort systemen precies, wat kunnen ze wel en wat niet? De auteur maakt met een voorbeeld de achterliggende principes duidelijk. Daarna gaat hij in op de mogelijke rol van visual analytics, en hoe dit de mogelijkheden van decision-managementsystemen verder kan verbeteren en verfijnen.
DOOR BERTJAN BROEKSEMA
O
ndernemingen kunnen hun besluiten automatiseren met behulp van een decision-managementsysteem (DMS). Dit heeft onder andere als voordeel dat besluiten niet meer onderhevig zijn aan menselijk falen zoals door verveling of voorkeur. Daardoor worden processen uniformer en beter schaalbaar. Dit betekent echter niet dat deze processen zich volledig moeten onttrekken aan menselijk toezicht. Het opschalen van processen kan als gevolg hebben dat kleine effecten, die weinig invloed hebben op kleine schaal, ineens grote betekenis krijgen. De vraag is echter hoe we op een betekenisvolle manier inzicht kunnen krijgen in zulke effecten. In dit artikel geef ik een kort overzicht van de componenten van een DMS om inzicht te geven in welke data gegenereerd worden. Vervolgens geef ik aan de hand van een voorbeeld aan welke uitdagingen een DMS met zich meebrengt. Daarna introduceer ik visual analytics (VA) en hoe VA gebruikt kan worden als een mogelijke oplossingsrichting voor de genoemde uitdagingen.
Decision-managementsystemen Waar business process modeling (BPM) gebruikt wordt om end-to-end bedrijfsprocessen te modelleren en te automatiseren, is een DMS bedoeld om besluiten die onderdeel zijn van zo’n proces te automatiseren. Om geschikt te zijn voor automatisering, moeten besluiten bepaalde eigenschappen bezitten. Allereerst moeten ze repetitief zijn. Daarnaast moeten ze onderhevig zijn aan kleine veranderingen door omstandigheden zoals een verschuivende markt of veranderende wetgeving.
14
|
De generieke aanpak van een DMS maakt dat het toegepast kan worden in een veelheid aan contexten. Een aantal voorbeelden van terugkerende vragen die beantwoord kunnen worden met geautomatiseerde systemen zijn: ~ Is de verstrekte informatie valide? ~ Wat is de prijs voor een product of dienst voor een specifiek klant waarbij regulatie ook een rol speelt? ~ Is het risico voor het afgeven van een specifieke hypotheek aanvaardbaar? ~ Is een gegeven bank- of creditkaarttransactie frauduleus? In een bedrijfsproces kunnen besluitvormingsprocessen soms geheel of gedeeltelijk worden geautomatiseerd. In figuur 1 zien we bijvoorbeeld het sterk vereenvoudigde proces voor de aanvraag van een autoverzekering. Allereerst wordt bepaald of iemand in aanmerking komt voor de verzekering (DM 1). Als dit het geval is, wordt een prijs berekend aan de hand van de geselecteerde opties en eigenschappen van de aanvrager (DM 2). Anders wordt de aanvraag genegeerd of handmatig verwerkt. Componenten DMS Voordat we kunnen praten over de uitdagingen die een DMS met zich meebrengt, moeten we eerst een globaal idee hebben van hoe een DMS werkt. De belangrijkste componenten van een DMS zijn: het domeinmodel, domeininstanties, de beslissingslogica en de executie-engine. Domeinmodel: Het domeinmodel is een beschrijving van alle concepten die onderdeel zijn van het te nemen besluit. Het
AUGUSTUS 2014
&
FINANCE
CONTROL
$(manual)
Process manually
$(not eligible)
Send rejection message
$(eligible)
Insurance quote request
DM 1: Determine eligibility
DM 2: Calculate insurance quote
Send insurance offer
Figuur 1 Een vereenvoudigd voorbeeld van een bedrijfsproces waarin bepaalde besluiten geautomatiseerd zijn (bron: Broeksema, 2013)
omvat zowel de concepten die de invoer beschrijven voor het besluit, als de concepten die het besluit zelf representeren. Het beschrijft bijvoorbeeld in het hiervoor genoemde scenario van de autoverzekering, zaken als aanvrager (met eigenschappen zoals leeftijd, aantal jaar rijbewijs) en gewenste verzekering (met eigenschappen als eigen risico). Het model beschrijft normaal gesproken alleen concepten en eigenschappen die worden gebruikt bij het maken van het besluit. Dus, als de kleur van een auto niet van belang is in zowel DM1 als DM2 (zie figuur 1), zal het concept ‘Auto’ deze eigenschap niet bevatten.
Het is duidelijk dat het domeinmodel nooit de volledige complexiteit van de werkelijkheid kan modelleren Domeininstanties. Concrete objecten met eigenschappen zoals beschreven in het domeinmodel, noemen we domeininstanties. Als het domeinmodel een ‘Auto’ beschrijft met de eigenschappen merk, type en bouwjaar, dan is een Opel Astra uit 2004 een instantie. Een individueel besluit wordt gekarakteriseerd door alle instanties die als invoer dienen (auto, aanvrager, type verzekering), als wel door de instanties die de eigenlijke besluiten representeren (geldigheid in DM1, calculatie en aanbod in DM2).
AUGUSTUS 2014
Beslissingslogica. De beslissingslogica is een verzameling ALS(...)DAN(...)-regels. Deze regels bepalen wat, gegeven een domeininstantie die dient als invoer, welk besluit genomen moet worden. De regels zijn geformuleerd in termen van het domeinmodel, bijvoorbeeld: ALS aanvrager.leeftijd > 18 EN aanvrager.leeftijd < 24) DAN aanvrager.risicofactor = 3 Sommige van deze regels zijn alleen van toepassing in enkele besluiten, terwijl andere altijd toegepast worden. Hoewel deze regels individueel in veel gevallen relatief eenvoudig zijn, wordt het geheel complex als deze uit honderden of duizenden regels bestaat. Temeer omdat deze regels verschillende domeinen beslaan zoals wet- en regelgeving, risicomanagement en marketing. Ook het samenspel tussen de verschillende regels is niet eenvoudig inzichtelijk te maken door alleen naar individuele regels te kijken. Businessactiviteit modelleren Met een DMS kan op een geautomatiseerde manier gereageerd worden op gebeurtenissen die gerelateerd zijn aan het domein. Een autoverzekering is aangevraagd, een creditkaart of banktransactie is uitgevoerd, een pakket is ontvangen, enz. Om op een rationele manier te reageren op zulke
|
15
W W W. F I N A N C E - C O N T R O L . N L
&
FINANCE
gebeurtenissen moet de informatie die relevant geacht wordt voor het besluit verzameld worden. Welke informatie verzameld wordt, is zoals eerder vermeld, vastgelegd in het domeinmodel. Het is duidelijk dat het domeinmodel nooit de volledige complexiteit van de werkelijkheid kan modelleren. Dit is dan ook niet waar businessanalisten in de context van decision automation naar streven. Door gebruik te maken van hun kennis van het domein, het bedrijfsbeleid en wet- en regelgeving, kiezen ze wat gemodelleerd wordt en wat niet. Er zijn verschillende redenen waarom bepaalde informatie niet gemodelleerd wordt: het kan onwettig zijn bepaalde informatie vast te leggen, het kan onbelangrijk geacht worden, het wordt over het hoofd gezien of het is niet bekend tijdens de modelleringsfase. Dat niet alles gemodelleerd kan worden is een noodzakelijk, maar tegelijk ook interessant aspect. De beslissingslogica kan namelijk alleen redeneren over zaken die vastgelegd zijn in het domeinmodel. Dus, een regel kan alleen over de leeftijd van een persoon gaan, als het concept ‘Persoon’ in het domeinmodel ook een eigenschap ‘leeftijd’ heeft. Regels van de beslissingslogica zorgen voor de afhandeling van interne en externe beperkingen. Interne/externe regels Externe beperkingen komen van buiten het bedrijf en kunnen niet of minimaal beïnvloed worden. Hiervan zijn verschillende voorbeelden te noemen, zoals wetgeving, al dan niet specifiek voor het domein van de bedrijfsvoering. Een ander voorbeeld is fysieke beperkingen: een pakket kan alleen per luchtpost verstuurd worden als de infrastructuur aanwezig is op de relevante locaties. Wanneer de werkelijkheid verandert, bijvoorbeeld wanneer nieuwe wetgeving van kracht wordt, moeten de regels van de domeinlogica aangepast worden om hierin te voorzien. Voor interne regels, ofwel regels die bedrijfsbeleid vastleggen, ligt de situatie anders. Het beleid weerspiegelt namelijk hoe een bedrijf in een gegeven situatie een balans maakt tussen risico’s en bedrijfsdoelen. Regels die beleid implementeren maken daarom de aannames die gedaan worden in de bedrijfsvoering expliciet. Bijvoorbeeld, de eerder gegeven regel over de relatie tussen leeftijd en risicofactor, maakt de aanname dat jongere automobilisten een hoger risico vormen expliciet. In tegenstelling tot regels die externe beperkingen afhandelen, kunnen regels die beleid vastleggen op elk moment veranderd worden. Het veranderen van deze regels is een manier om de balans tussen risico en business-performance af te stemmen. Deze adaptieve controle helpt bedrijven om een strategisch voordeel te behalen of te behouden en om zich snel aan te passen aan veranderende marktbehoeftes.
16
|
CONTROL
Realistische modellen bestaan uit honderden concepten en duizenden regels. Deze complexiteit leidt tot drie hoofdproblemen: ~ Het is moeilijk na te gaan of alle aannames in het model correct zijn. ~ De wisselwerking tussen aannames en externe beperkingen wordt complexer en als gevolg moeilijker te begrijpen. ~ Het wordt moeilijker na te gaan of concepten en regels die geen onderdeel uitmaken van het model alsnog toegevoegd moeten worden. In de loop van de tijd worden besluiten genomen door een DMS, wat resulteert in een verzameling van feiten. Deze feiten, de invoer en het genomen besluit, kunnen gebruikt worden om eerdergenoemde aannames en wisselwerking te analyseren en te verifiëren. De besluiten worden echter uitgevoerd zonder menselijk toezicht en op een enorme schaal, soms miljoenen per dag. Ongewenste resultaten kunnen daardoor aggregeren en grote invloed hebben op de business-performance of een
Met het automatiseren van beslissingen verschuift niet automatisch ook de verantwoordelijkheid ongewenst risico creëren. De vraag is: hoe kan een analist geholpen worden om uit te vinden of en hoe het model van de realiteit (domein en regels) afwijkt van de realiteit? Visual analytics voor DMS Er zijn verschillende manieren mogelijk om deze problematiek aan te pakken. Een mogelijkheid is het gebruik van dashboards, waarop relevante meetwaarden weergegeven worden. Dit kan worden gecombineerd met automatische signalering als meetwaarden onder of boven gestelde grenzen komen. Een nadeel van deze aanpak is dat het alleen aangeeft dat er iets mis is en niet veel informatie geeft over hoe het model aangepast moet worden. Een tweede aanpak is het gebruik van analytische methoden om waarden in het model automatisch aan te passen op basis van genomen besluiten. Dit zou moeten zorgen voor een constante optimalisatie van de performance. Echter, deze methode kan, net zoals de regels, alleen werken met dat wat gemodelleerd is. En zoals we eerder zagen, is niet alles gemodelleerd. Waar we naar op zoek zijn is een proces waarbij automatische analytische methoden gecombineerd worden met de mogelijkheid voor een analist om zijn kennis in te brengen. Dit brengt ons bij VA.
AUGUSTUS 2014
&
FINANCE
Wat is visual analytics? Keim (Keim e.a., 2010) definieert VA als volgt: ‘Visual analytics combines automated analysis techniques with interactive visualizations for an effective understanding, reasoning and decision making on the basis of very large and complex datasets.’ Deze definitie bevat verschillende componenten. Het ontdekken van patronen en anomalieën in visuele beelden is iets waarin een mens in de meeste gevallen beter is dan computers. Dit is een van de hoofdredenen om gegevens te visualiseren. Wanneer de gegevens uit grote hoeveelheden data bestaan is het vaak niet meer mogelijk om alle data tegelijk te visualiseren. Daarom worden geautomatiseerde analytische technieken toegepast om een gecomprimeerde weergave van de data te krijgen, die de meest belangrijke structuren toont. Met behulp van interactieve methoden kunnen vervolgens irrelevante data gefilterd worden of ingezoomd worden op een specifieke selectie van de data. De combinatie van automatische analytische methoden en interactieve visualisatie helpt een analist om complexe informatie te synthetiseren en inzicht te verkrijgen. Het maakt het mogelijk om te verifiëren of verwachte patronen zich voordoen en om onverwachte patronen te ontdekken. Dit inzicht helpt bij het redeneren over de problematiek die onderzocht wordt. Hierbij worden dus niet alleen de gegevens in het systeem gebruikt, maar krijgt de analist ook de kans om zijn eigen kennis aan het analytisch proces toe te voegen. Decision exploration lab Hoe werkt dit in de praktijk? In mijn proefschrift (Broeksema, 2013) beschrijf ik het decision exploration lab, een VA-omgeving specifiek voor de analyse van geautomatiseerde besluiten. Deze omgeving combineert statistische analyse van de do-
AUGUSTUS 2014
CONTROL
Figuur 2 Decision exploration lab, een voorbeeldtoepassing van visual analytics in de context van DMS (bron: Broeksema, 2013)
meininstanties met analyse van de uitgevoerde besluitregels. Zo kunnen niet alleen patronen en uitzonderingen ontdekt worden, maar deze kunnen gelijk gekoppeld worden aan de logica die hiermee verband houdt. Een overzicht van deze omgeving is te zien in figuur 2 en bevat de volgende componenten: A. conceptboom: gedefinieerde concepten, eigenschappen en waarden die ze kunnen aannemen; B. conceptmap: visualiseert waarden van geselecteerde concepteigenschappen; C. regel-executieview: laat relevante regel-executie-eigenschappen zien. In deze context maken we onderscheid tussen twee soorten concepten: invoerconcepten (bijvoorbeeld een bestuurder met eigenschappen als leeftijd, geslacht en aantal ongelukken) en uitvoerconcepten, waarvan er in dit voorbeeld slechts één is: eligibility (oftewel, in aanmerking komen voor een verzekering). Dit uitvoerconcept resulteert in een van de volgende waarden voor elke aanvraag: komt in aanmerking (eligible), handmatige controle (manual), afwijzing (ineligible). Alle waarden in de conceptboom van de concepten die de gebruiker heeft geselecteerd, worden automatisch geanalyseerd en daarna geplot als een cel in de conceptmap. Dit resulteert initieel in een conceptmap met een cel voor elke mogelijke waarde. Waarden die dicht bij elkaar geplot worden hebben een sterke relatie. We zien bijvoorbeeld in figuur 2 dat de leeftijdscategorie 18-20 correleert met personen die nog studeren. Dat wil zeggen, het is waarschijnlijk dat een aanvrager met
|
17
W W W. F I N A N C E - C O N T R O L . N L
&
FINANCE
een leeftijd tussen de 18 en 20 jaar student is. Naarmate de afstand tussen waarden groter wordt, wordt de relatie zwakker. Bijvoorbeeld: mensen in de leeftijdscategorie >= 80, worden (bijna) nooit voor handmatige controle aangemerkt. Waarden van invoerconcepten worden in blauw weergegeven en waarden van uitvoerconcepten worden in groen weergegeven. Omdat groepen van gecorreleerde waarden interessanter zijn dan individuele waarden, kunnen waarden samengevoegd worden in de conceptmap. Dit gebeurt interactief met behulp van de slider. Waarden die dicht bij elkaar liggen worden samengevoegd in een cel op basis van de afstand bepaald door de slider. Een cel kan meerdere waarden bevatten, zowel waarden van in- als van uitvoerconcepten. Als er een of meer waarden van een uitvoerconcept in een cel valt, kleurt de cel groen. In dit scenario wil de analist onderzoeken waarom meer aanvragen als niet-geldig (ineligible) worden aangemerkt dan aanvankelijk gepland. Om zijn analyse te starten selecteert de analist de concepteigenschappen van Driver en het beslissingsconcept ‘Eligible’. De eigenschappen van de ‘VehicleCoverage’-concepten laat hij achterwege omdat hij weet dat geldigheid van een aanvraag alleen is gebaseerd op de eigenschappen van een aanvrager. Nadat hij de concepten heeft geselecteerd wordt de conceptmap vernieuwd met de resultaten van de statistische analyse. De histogrammen in de hoeken van de conceptmap geven aan welke concepteigenschappen statistisch van belang zijn en helpen om de selectie verder te reduceren. Gebruikmakend van de slider, groepeert de analist de verschillende waarden om een beter overzicht te krijgen van welke waarden aan elkaar gerelateerd zijn. Hij vindt in het centrum aanvragers in de leeftijdscategorie 18-25 die nog studeren. De groene cellen representeren gegroepeerde concepteigenschappen waarin ook een besluiteigenschap inzit. Elke van de drie mogelijke uitkomsten (eligible, ineligible, manual) is ruwweg even waarschijnlijk voor studenten, wat maakt dat deze cel ertussenin valt. Om het proces te optimaliseren zou deze cel dichter bij een van de volgende uitkomsten moeten komen te liggen: eligible, manual. Dit zou namelijk betekenen dat meer studenten uiteindelijk ook een aanbod krijgen. De analist selecteert daarom de cel en kijkt vervolgens naar de regel-executiestatistieken. Daar vindt hij zoals verwacht dat bepaalde profielen meer en andere minder aanwezig zijn in de selectie van besluiten (zie figuur 2). Deze regels controleren op leeftijd en het is daarom niet verrassend dat bijvoorbeeld de regel voor profiel 3 vele malen vaker uitgevoerd is dan verwacht zou mogen worden. Vervolgens ziet de analist dat voor studenten regels voor rijden onder invloed en verhoogd risico vaker uitgevoerd worden dan statistisch gezien verwacht mag worden. De analist weet dat beide regels resulteren in het weigeren van de aan-
18
|
CONTROL
vraag en beseft dat hier ruimte voor verbetering is. Hoewel in de meeste gevallen weigering de meest veilige optie is, zou van mensen in deze leeftijdscategorie aangenomen kunnen worden dat hun rijstijl verantwoordelijker wordt naarmate ze ouder worden. Met dit inzicht zou de analist daarom kunnen beslissen om in deze gevallen niet de aanvraag te weigeren maar handmatig te behandelen. Samenvatting Dit artikel gaf een korte introductie op decision-managementsystemen. (In Taylor en Raden 2004 en Taylor 2011 zijn uitgebreide beschrijvingen van DMS te vinden.) Er is uitgelegd welke componenten een typisch DMS heeft en hoe het gebruikt kan worden om businessactiviteit mee te modelleren en te automatiseren. Dit brengt met zich mee dat veel kennis die voorheen impliciet was nu expliciet wordt gemaakt in een domeinmodel en besluitlogica. Echter, niet alle kennis is impliciet gemaakt. Zodoende is het nodig dat menselijk inzicht kan worden benut bij het optimaliseren van geautomatiseerde beslissingen. Visual analytics is een aanpak die automatische analytische methoden combineert met interactieve visuele representaties. Dit maakt het mogelijk voor analisten om grote hoeveelheden data te analyseren en verklaringen te vinden voor een bepaald fenomeen. Analisten kunnen in dit proces hun eigen inzicht inbrengen. Een korte illustratie hiervan is gegeven met behulp van een scenario uit de autoverzekeringsbranche. Met het automatiseren van beslissingen verschuift niet automatisch ook de verantwoordelijkheid. Computerprogramma’s blijven mensenwerk en behoeven zodanig ook menselijk toezicht. De verandering van schaal vraagt wel om nieuwe middelen. Visual analytics voorziet in de bouwstenen voor deze nieuwe middelen. Literatuur ~ B. Broeksema (2013) The Decision Exploration Lab, PhD thesis, University of Groningen, http://research.broeksemaatjes.nl/phdthesis/thesis.pdf, waarin meer over de problematiek die bij het gebruik van deze systemen speelt en hoe VA gebruikt kan worden om deze problemen aan te pakken. ~ D.A. Keim e.a. (red.) (2010) Mastering the Information Age – Solving Problems with Visual Analytics, Eurographics Association. ~ J. Taylor (2011) Decision Management Systems: A Practical Guide to Using Business Rules and Predictive Analytics, IBM Press. ~ J. Taylor en N. Raden (2004) Smart Enough Systems, Prentice Hall.
Bertjan Broeksema (
[email protected]) is research scientist visual analytics bij het Centre de Recherche Public Gabriel Lippmann (CRPGL) in Belvaux, Luxemburg. Het CRPGL is een publiek onderzoeksinstituut dat zich richt op wetenschappelijk onderzoek en technologische ontwikkeling.
AUGUSTUS 2014