CREATIEF MET DATA
Patrick Swart Michel Blaauw
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
1
Hoe big data het zakelijke landschap verandert
Agenda -
Over GEA DATA Een data analyse van onszelf Rondvraag: hoe ‘data driven’ ben je al? Wat is ‘big data’ eigenlijk: het speelveld en de data maturity index Cases . Case 1: Ja, data science kan een best seller voorspellen . Case 2: Ja, data science zorgt voor meer contractverlengingen - De ‘data driven’ organisatie: een team samenstellen en starten - Interactief/discussie . Welke positie neem je in op de ‘data maturity index’?
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
2
Hoe big data het zakelijke landschap verandert
Wie is GEA?
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
3
Hoe big data het zakelijke landschap verandert
GEADATA portfolio
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
4
Hoe big data het zakelijke landschap verandert
Wie ben ik?
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
5
Hoe big data het zakelijke landschap verandert
Wie ben ik?
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
6
Hoe big data het zakelijke landschap verandert
Data ‘self assesment’
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
7
Hoe big data het zakelijke landschap verandert
Data self assesment…
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
8
Hoe big data het zakelijke landschap verandert
Data self assesment…
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
9
Hoe big data het zakelijke landschap verandert
Data self assesment…
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
10
Hoe big data het zakelijke landschap verandert
Data self assesment…
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
11
Hoe big data het zakelijke landschap verandert
Data mining you…
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
12
Hoe ‘data driven’ zijn jullie eigenlijk?
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
13
Hoe ‘data driven’ zijn jullie?
Hoe ‘data driven’ vind je jouw organisatie?
Welke stappen hebben jullie o.h.g.b. data analyse en data science al gezet?
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
14
Wat is ‘big data’ eigenlijk? Het speelveld & de data maturity index 8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
15
Big data is eigenlijk de verkeerde term
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
16
Het verbindende vakgebied heet ‘data science’ Data science
Big Data
Machine Learning
Econometrie
Data mining
Artificial Intelligence
Text analytics/ NLP
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
Programming
Visualisation
Wiskunde/ statistiek
17
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
18
Het doel is het creëren van ‘actionable insights’ en het worden van een ‘data gedreven’ organisatie
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
19
Hoe ziet deze ontwikkeling er van een afstand uit?
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
20
Met big data een bestseller
Case 1: kun je een bestseller voorspellen?
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
21
Met big data een bestseller
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
22
Met big data een bestseller
Bestsellers en badsellers OMZET 1000K
800K
600K
400K
200K
0K 100K
200K
300K
400K
500K
600K
700K
800K
900K
1000K KOSTEN
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
23
language detection similarity descriptive analysis readability lexicon diversity sentiment analysis keyword analysis named entity extraction tags # sequals j/n statistics readability reference books books from same author demografic data spychografic data
ONLINE RETAILERS BOL.com Amazon.com Goodreads Crimezone Boekenliefde etc... page views visitor data
Wat we weten van een boek
order history touchpoints audience classifications delivery data online sales user profiles media mentions sentiment analysis weight measures publisher (house)
frequence blogs reviews newsgroups influencers
title additional ISBN code ISBN codes (versions) author NUR code (classification) line spacings fontsize pages lay-out typifications languages amount of words translations y/n Mb/Kb prices hard cover folded y/n prices print pocket prices e-book
ratings comments GOOGLE search history metadata royalties
creation costs marcom costs production costs distribution costs storage costs
value chain costs cost allocations
book returns (reversed logistics) sales per day_week_month turn-over per day_week_month Retail cash register data cash conversions
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
per day 24
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
25
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
26
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
27
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
28
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
29
Met big data een bestseller
Resumé: wat kunnen we er dan mee? -
om de voorspelbaarheid van succes te verbeteren om het risico op badsellers te reduceren een duidelijke portfolio strategie te kiezen het creeren van een recept voor marketing en sales inspanningen de werklast voorspelbaar te maken timing van de uitgeefactiviteiten optimaliseren productie- en distributiekosten te synchroniseren met de actuele behoefte kwaliteitstoetsing op generieke kenmerken benchmarks: hoe presteer ik zelf t.o.v. de concurrentie? besparen van tijd en geld en een betere besteding reduceren royalty kosten en voorschotten minder waste (meer marge)
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
30
Met big data een bestseller
Bestsellers en badsellers: 3 strategieën 1. Bestseller uitgeverij: acquireert een beperkt aantal titels, zeer kapitaalintensief focus op bepaalde thema’s en een zeer sterk promotieapparaat om succes af te dwingen (vergelijk artiesten management/voetbal makelaar) 2. Midden uitgeverij wordt veel geïnvesteerd in acquisitie en promotie (met lagere budgetten) in een beperkt aantal titels, zonder ‘self-publish’ opdracht van auteurs. Bij het bereiken van een bepaalde afzetdrempel kan een titel worden overgeheveld naar de bestseller uitgeverij en komt die strategie in werking 3. Doe-het-zelf uitgeverij: auteurs betalen services of doen veel zelf, nadruk op online. De nadruk ligt in het schaalbaar maken van dienstverlening en daar geld mee te verdienen (de ’0’ te houden). Scouting is een belangrijke rol: bij bepaalde afzetten kan een titel transfereren naar Midden uitgeverij of zelfs Bestseller uitgeverij 8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
31
Met big data een bestseller
Was 50 tinten grijs te voorspellen?
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
32
Met big data churn minimaliseren
Case 2: contract opzeggen ja/nee
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
33
Van ‘Sense & Respond’ naar ‘Predict & Act’
2016
2014
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
34
Welke stappen maken we? • • • • •
Centralisatie van alle relevante data Het voorspellen van klantgedrag Het optimaliseren van klant retentie en voorkomen van churn Het A/B testen van features van digitale producten Het automatisch redigeren van nieuws pagina's op basis van algoritmes • Het automatisch produceren van bedrijfs- en financiële nieuws artikelen (machine writing)
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
35
Het optimaliseren van klant retentie en voorkomen van churn
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
36
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
37
Welke stappen • Verzamelen van alle historische abonnement data • Hieraan gekoppeld wordt alle data die mogelijk relevant is voor de keuze die de klant maakt (zeg op/blijf) • Pas een logistieke regressie (of een ander algoritme) toe op deze data set. Dit kwantificeert welke variabele hoeveel invloed heeft op de kans dat een klant blijft of opzegt • Stop deze logica in een model en pas dit toe op het klantenbestand. Alle klanten krijgen nu een score tussen de 0 (blijft) en de 1 (gaat weg). • Elke maand wordt de top 2000 van de klanten die mogelijk weggaan gebeld met vier verschillende interventies waar ze uit kunnen kiezen als ze minimaal een jaar blijven.
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
38
Resultaat (na 6 maanden) • Oude situatie – Ongeveer 20% churn – Callcenter conversie: 17-25% • Nieuwe situatie – 8% churn – Callcenter conversie: 84-92% – Door het aanbieden van vier interventies, verkrijgen we meer data over de voorkeuren/smaken van de klant. Waardoor we in de toekomst nog meer grip op het gedrag van de klant krijgen.
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
39
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
40
Naar een ‘data gedreven’ organisatie
Zomaar wat ‘nieuwe’ functies: •Data Scientist •Data Engineer •Machine Learning Scientist •Business Analytics Specialist •Data Visualiser •Data architect •Data change agent •Data Modelers •Statistician •Data steward Alles draait om creativiteit en domein expertise 8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
41
Naar een data gedreven organisatie Focus komt volledig te liggen op hetgeen de organisatie uniek maakt. Een data gedreven organisatie bestaat niet uit een grote hoeveelheid ‘data werkers’.
Vooral strategische functies zijn van belang voor een data gedreven organisatie: - Borgen domein expertise is essentieel - Multi-disciplinaire teams (juiste balans) - Creativiteit wordt steeds meer een key-asset - Strategische denkers en voortrekkers (regie) Uitwisselbare functies worden ingekocht (of ingericht op minimale capaciteitsbehoefte) - Dus ook de data analisten en specialisten op verschillende data gebieden (machine learning, algoritme specialisten, data visualisatie experts, etc…)
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
42
Hoe ziet een core data team er dan uit?
creatieve strateeg aanjager
data scientist
data analist
data visualiser
Data engineer
veel domeinkennis verbinder opereert met mandaat van directie linking-pin business
lead data scientist data strategie linking pin technologie
stuurt eventueel andere analisten aan verzamelt data voert analyses uit
presentaties vormgeving dashboards
soms code kloppen borgt performance opslag vraagstukken ontsluiting data
strategische functie
strategische functie minimaal 1
inrichten op minimale capaciteit in huis
inrichten op minimale capaciteit in huis
inrichten op minimale capaciteit in huis
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
43
Enkele uitgangspunten -
Het mag geen ICT of Business Intelligence feestje zijn Het is echt multi-disciplinair, dus ook de data science projecten Je hebt een core-team met een flexibele schil Data science projecten zijn altijd business case gedreven: waarom doe je het ook alweer - De business is daarom altijd nauw betrokken (business betaald en bepaald) - Een top down benadering is noodzakelijk (data science is van strategische waarde, het heeft altijd bedrijfsbrede impact) - Je moet doorgaans allianties sluiten (want je beschikbare data is vrijwel nooit volledig/compleet) - Continue leercurve (steeds nieuwe inzichten, oplossingen en methodieken) - Het combineren van interne met externe bronnen geeft nieuwe inzichten en nieuwe context aan de vraagstelling
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
44
• onomkeerbaar proces
• welk effect heeft het op jouw business?
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
45
De essentie van elke transitie…
Visie
+
Vaardigheden
+
Vaardigheden
+
Visie
+
Visie
+
Vaardigheden
+
Visie
+
Vaardigheden
+
Visie
+
Vaardigheden
+
Prikkels
Prikkels
Prikkels
Prikkels
Prikkels
+
Middelen
+
Plan van aanpak = Transitie
+
Middelen
+
Plan van aanpak = Verwarring
+
Middelen
+
Plan van aanpak = Ongerustheid
Middelen
+
Plan van aanpak = Weerstand
Plan van aanpak = Frustratie
+
+
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
Middelen
= Tredmolen
46
Maturity index van de ‘data driven organisatie’
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
47
Positie op de maturity index -
Waar staat je organisatie Sense & Respond
WHAT HAPPENED
WHY DID IT HAPPEN
Predict & Act
WHAT WILL HAPPEN
WHAT IS THE BEST THAT COULD HAPPEN
-
Welke te nemen stappen zie je
-
Wat ga je morgen al op de agenda zetten, wat neem je mee naar huis?
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
48
Any further or data related questions?
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
49
GEADATA aanbod
Accelerator workshop ‘creatief met data’ Voor meer info over de inhoud en opzet: Patrick Swart 06 520 71 825 of kijk op geadata.nl (vanaf 1 november)
8 oktober 2015 – Xplor – Enterprise Information Management - Zaltbommel
50