'Big Data' en de toekomst van de Sociale Zekerheid (pure speculatie door Ronald Jongeneel)
Nieuwegein, April 2016
07-04-2016
1
Wat is Big Data? (1) Wikipedia: een verzameling van gegevenssets die zo groot en complex is dat het niet mogelijk is haar op de gebruikelijke wijze te verwerken.
Gartner (IT research company): high-volume, high-velocity and high-variety information assets that demand cost-effective, innovative forms of information processing for enhanced insight and decision making.
Oracle (IT company): The derivation of value from traditional relational database-driven business decision making, augmented with new sources of unstructured data.
07-04-2016
2
Wat is Big Data? (2) Microsoft: The process of applying serious computing power to seriously massive and often highly complex sets of information.
Dan Ariely (professor of Psychology): It's like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it.
The Devil's Data Dictionary Big Data = Kilo, Mega, Giga, Tera, Peta, Exa, Zetta, Yotta, Yadda , Yadda, Yadda.
07-04-2016
3
Hoe ontstaat Big Data? - Uit mobieltjes en tablets Wifi / Bluetooth voor micro-lokaties (looproutes door winkels) GSM-lokaties, data-lekkage via apps of door fabrikanten van devices - Bewakingscamera's (al dan niet met gezichtsherkenning) - Parkeerautomaten, verkeerscamera's, OV-kaarten - Surf-gedrag (op welke device dan ook) - Toegangspasjes - iDeal-betalingen, ATM-data, andere bankdata - Smart-TV's, internet-providers - Facebook-profielen, Tweets, Linked-in Connections, etc. - Pacemakers & pillenboxen met wifi. - Fotocamera's met geo-tagging & wifi. - e-Readers (welk boek, hoe lang, wanneer, wanneer afgehaakt) - Chips in huisdieren - Slimme gasmeters, electriciteitsmeters, thermostaten & koelkasten - Smart Watches, Health Logging - Paspoort-/Rijbewijs-/Visa-aanvragen 07-04-2016
4
Hoe Big is Big?
Byte Kilobyte Megabyte Gigabyte Terabyte Petabyte Exabyte Zettabyte Yottabyte Brontobyte Geobyte 07-04-2016
5
Wordt Big Data Bigger?
07-04-2016
6
Eigenschappen van Big Data (1): correlatie, geen causatie Wel een verband tussen (numerieke) grootheden, maar geen oorzakelijk gevolg. Goed genoeg voor business opportunities, maar geen (wiskundig of rechtsgeldig) bewijs. Dit gaat in het publieke discours vaak fout: Brandweerwagens worden vaak aangetroffen op plaatsen waar vuur is (correlatie). Dus brandweerwagens veroorzaken schade (foute causatie). Agressieve jongens spelen meer 'first-person shooter games' (correlatie). Dus de games veroorzaken het bedrag (mogelijk foute causatie). Het plegen van moorden leidt tot het gebruik van Internet Explorer (foute causatie). of Het gebruik van Internet Explorer leidt tot het plegen van moorden (iets minder onwaarschijnlijk, maar vermoedelijk toch ook een foute causatie). 07-04-2016
7
Eigenschappen van Big Data (2): privacy is een probleem ► informed consent (het 'vinkje') geldt alleen voor primaire gebruiksdoel van data, maar veel Big Data toepassingen worden pas later verzonnen. Sherlock Holmes:
It is a mistake to theorize before one has data. One starts to twist facts to suit theories, instead of theories to suit facts.
Aedhmar Hynes :
The very point of looking to Big Data is to identify patterns that create answers to questions you didn't even know to ask.
(Text 100 Global PR)
► opting out ('uitschrijven') is vrijwel niet meer te doen. want: geen social media, geen online bestellingen, geen gift vouchers of bonuskaarten, alleen cash reizen en shoppen, browsen alleen via Tor ► het anonimiseren van data kan vaak weer teniet worden gedaan, door te combineren met andere (big) data. Thelma Arnold & the 'AOL Search Data Leak' Ronald Coase
:
Torture the data, and it will confess to anything.
(Nobel Prize in Economics, 1991)
07-04-2016
8
Eigenschappen van Big Data (3): propensities (neigingen) - Filosofische inslag: met Big Data kan steeds meer gedrag worden voorspeld. Waar blijft dan de vrije wil? Gaan we mensen afrekenen op hun propensities (neigingen)? Dus voor misdaden die ze nog niet hebben begaan? Als we niet opletten zal het steeds meer die kant op gaan.
07-04-2016
9
Bestaande toepassingen (1): health - Negen dagen voordat de WHO de Ebola-epidemie signaleerde, werd ze al voorzien door HealthMap, waar men volautomatisch tienduizenden sites doorzoekt (sociale media, lokaal nieuws, overheidswebsites, artsen-websites en nog veel meer). Idem Google Flu trends (gebaseerd op Google zoekopdrachten).
07-04-2016
10
Bestaande toepassingen (2): commerce - Walmart zag dat een hurricane-warning leidde tot hogere verkopen van Pop-Tarts in de omgeving. Nu plaatst men Pop-Tarts displays bij de kassa als het lokale weerbericht daar aanleiding toe geeft. Dat leidt tot (nog veel meer) extra omzet. Een verklaring voor dit gedrag is niet gevonden (en ook niet nodig).
07-04-2016
11
Bestaande toepassingen (3): commerce - Target Discount Stores verzond een mailing over babyspullen aan een tiener. De boze vader kwam klagen, maar later bleek de mailing tóch terecht (ook al wist die man dat toen nog niet). Vermoedelijk gebaseerd op een wijziging in aankoopgedrag (geswitched van badprodukten mét een geurtje naar geurloze varianten: indicatie van zwangerschap).
07-04-2016
12
Bestaande toepassingen (4): commerce - Fastfood-keten met digitale menu-borden in de Drive Through lane. De items op het menu worden aangepast aan de drukte: Veel wachtende klanten (auto's) Weinig wachtende klanten (auto's)
07-04-2016
: produkten die snel kunnen worden uitgeserveerd. : produkten met een hogere winstmarge, ook als die een langere bereidingstijd vragen.
13
Bestaande toepassingen (5): maintenance - De minuscule vibraties in apparatuur (motoren van vliegtuigen of auto's, robots, etc) veranderen door slijtage. Middels continue monitoring kan men het optimale moment bepalen voor onderhoud of reparatie. Te vroeg kost (onnodig veel) geld. Te laat leidt tot kostbare (of catastrofale) break downs.
(Nu we het toch over auto's hebben: denk ook aan de Autopilot. Die zendt continue data naar Headquarters om op basis daarvan de software te kunnen verbeteren ('Fleet Learning')). 07-04-2016
14
Bestaande toepassingen (6): banking - Veel mensen krijgen geen krediet, omdat hun kredietwaardigheid niet kan worden vastgesteld op tradionele wijze (zeker in de 3e wereld). - Een Credit Risk Profile kan (mede) worden afgeleid uit het gebruik van de mobiel (hoeveel sms, calls, data-gebruik, welke apps, waar en wanneer, etc.). Helaas, de exacte algoritme is bedrijfsgeheim.
07-04-2016
15
Bestaande toepassingen (7): crime fighting De politie van Los Angeles en Santa Cruz gebruikt software die voorspelt waar misdaad te verwachten is, en stemt daar de patrouilleroutes op af. Resultaat: 20% minder misdaad in de betreffende regio's. Het model is gevoed met 13.000.000 misdaden van de laatste 80 jaar. Daaruit zijn patronen afgeleid (relaties tussen plaats en tijd van misdaden). Die patronen worden gebruikt voor voorspellingen van plaats en tijd.
07-04-2016
16
Bestaande toepassingen (8): disaster relief Regionale voedseltekorten voorspellen op basis van de analyse van - marktprijzen, - weerberichten (droogtes), - migratie-bewegingen, - historische regionale productie, - seizoensvariaties.
(en zo nog duizenden voorbeelden) 07-04-2016
17
Hoe zou Big Data kunnen worden ingezet bij de Sociale Zekerheid? 1- Fraude-detectie 2- Onderuitputting signaleren 3- Gericht hulpaanbod 4- Verfijning van de wetgeving 5- Effectiviteit van wetgeving meten
07-04-2016
18
Hoe zou Big Data kunnen worden ingezet bij de Sociale Zekerheid? 1- Fraude-detectie Vergelijk de administratieve situatie & gezinssamenstelling (alleenstaand/samenwonend, inkomen, bezit) met werkelijk gedrag zoals af te leiden uit Big Data. Dit vindt nu al plaats (stroomverbruik, autobezit), en dat zal alleen maar toenemen. Er is uitgebreid besproken (vooral door mannen) welke rol de leeftijd van een auto moet spelen in relatie tot het merk, bij het al-dan-niet-signaleren van 'te onderzoeken dossiers': - een bijstandsgerechtigde met nieuwe Fiat is het melden waard - geldt dat ook voor een 10 jaar oude Fiat? (die kost bijna niets) - hoe zit dat met een 10 jaar oude Bentley? (die is nog steeds duur)
07-04-2016
19
Hoe zou Big Data kunnen worden ingezet bij de Sociale Zekerheid? 2- Onderuitputting 'vanzelf' signaleren In feite het omgekeerde van Fraude-detectie. Constateer dat een burger op meer rechten aanspraak kan maken dan ze nu doet, door gegevens uit diverse bron met elkaar te combineren en eventueel te extrapoleren. Bijvoorbeeld: 'Volgens onze gegevens zijn uw inkomen en bezittingen van dien aard dat u in aanmerking kan komen voor de 'Aanvullende Inkomensvoorziening voor Ouderen'. Dat hoeft geen keiharde conclusie te zijn, maar kan ook tot een vermoeden leiden, dat verder (eventueel handmatig) moet worden onderzocht. In feite is de 'Bevorderde Aanvraag Anw' ook al zoiets (en wellicht zelfs onze andere bevorderde aanvragen).
07-04-2016
20
Hoe zou Big Data kunnen worden ingezet bij de Sociale Zekerheid? 3- Gericht hulpaanbod (a) Op basis van persoonlijke factoren (zoals bijvoorbeeld het inkoop-patroon volgens de AH-klantenkaart en/of data van de 'slimme koelkast') vaststellen van een gericht aanbod (zoals een uitnodiging voor een cursus 'gezond koken').
07-04-2016
21
Hoe zou Big Data kunnen worden ingezet bij de Sociale Zekerheid? 3- Gericht hulpaanbod (b) Op basis van een lage mate van uithuizigheid, laag gebruik van telecommunicatie-kanalen, of het hoge aantal uren dat de smart-tv een teleshop-kanaal toont, aanbieden van een uitnodiging voor de plaatselijke kaartclub of bloemschikvereniging.
07-04-2016
22
Hoe zou Big Data kunnen worden ingezet bij de Sociale Zekerheid? 3- Gericht hulpaanbod (c) Op basis van bewegingssensoren in huis inspelen op (acute) gezondheidsklachten.
Dit alles lijkt op het 'gericht adverteren' dat Google & FaceBook al jaren pogen op het web, maar dan door een 'big brother' met een in beginsel positieve insteek.
07-04-2016
23
Hoe zou Big Data kunnen worden ingezet bij de Sociale Zekerheid? 4- Verfijning van de wetgeving Naarmate meer bekend wordt van burgers, kan de overheid wetgeving verfijnen, zowel uit positieve als negatieve overwegingen (bezuinigingen): 'sociale zekerheid op maat'. Een WW-uitkering volledig afgestemd op je persoonlijke financiele situatie (rekening houdend met je woonkosten en andere vaste lasten). Wellicht inclusief 'gericht hulpaanbod': automatisch afgeleide adviezen over uitgavenpatroon, kansrijke vacatures (afgeleid uit eigenschappen en historie) of kansverhogende cursussen (idem). Of een Kinderbijslag afgestemd op de kosten van de creche (en de afstand ernaar toe, en hoe die wordt overbrugd) en het gedrag van de ouders (werkend of niet, aantal uren, overlap, lokatie), etc. 07-04-2016
24
Hoe zou Big Data kunnen worden ingezet bij de Sociale Zekerheid? 5- Effectiviteit van wetgeving meten (a) Big Data maakt het mogelijk de (bedoelde en onbedoelde) effecten te meten van wetgeving (ook die m.b.t. sociale zekerheid). Bijvoorbeeld: 'inkomensafhankelijkheid' van uitkeringen moet mensen stimuleren tot het aannemen van betaald werk. Organisaties ontplooien initiatieven om mensen (o.a. sommige Anw-ers) daarbij te helpen. - Maar gaan deze mensen ook echt aan het werk? In welke mate? - En zo nee, moeten we ze dan op die manier blijven benaderen? (die inspanningen kosten natuurlijk ook geld).
07-04-2016
25
Hoe zou Big Data kunnen worden ingezet bij de Sociale Zekerheid? 5- Effectiviteit van wetgeving meten (b) Nog een stap verder: wellicht kan in de toekomst uit Big Data worden afgeleid aan welke wetgeving m.b.t. sociale zekerheid er uberhaupt behoefte is. Bijvoorbeeld: als uit analyse zou blijken dat mensen in de bijstand die 'hun huis moeten opeten' meestal een 'zwaar beroep' hebben uitgeoefend, en de politiek zou dit niet wenselijk vinden, dan zou ze met aanvullende wetgeving kunnen komen, bijvoorbeeld de PPZB, het 'PréPensioen Zware Beroepen'. Aan de andere kant: effectiviteit kan nooit het enige criterium voor wetgeving zijn.
07-04-2016
26
Een beetje Big Data van de SVB. De relatie tussen kindernamen en huizenprijzen (CBS). Ook hier geldt: Correlatie, geen Causatie. Op plaatsen met hogere huizenprijzen heten kinderen vaker Gijsbert & Pleun (correlatie). Maar we weten niet hoe dat komt (causatie). Het zou kunnen dat gefortuneerde ouders vaker deze namen kiezen. Het zou ook kunnen dat je huis meer waard wordt als je je kind zo noemt.
07-04-2016
27
Tot slot (discussie) - In hoeverre is dit allemaal gewenst? Zijn we hier alert genoeg op? - Er wordt toch al met risicoprofielen gewerkt? Is Big Data niet gewoon meer van het zelfde? - Veranderende verwachtingen - Minder privacy-zorgen bij jongeren - Het College Bescherming Persoonsgegevens wil dat dataverzamelaars duidelijk aangeven wat ze verzamelen en met welk doel. Vooral dat laatste wordt moeilijk… - Aanvullende wetgeving nodig?
07-04-2016
28