Big data en de bonuskaart Miranda Seegers 1618071 Seminar blok D 2014/2015 Docent Rob van den Idsert JDE-SCON.3V-13
Inhoud Inleiding 3 Hoofd- en deelvragen 4 Deelvraag 1: Definitie en technieken van big data
5
Deelvraag 2: De bonuskaart als big data
11
Deelvraag 3: De bonuskaart en het recht op privacy
14
Deelvraag 4: De toekomst van big data en bonuskaart
17
Conclusie 21 Literatuur
22
Bijlage A- Reflectie
24
2- Big data en de bonuskaart
Inleiding Big data. Een groots onderwerp die de laatste tijd vol in de aandacht staat. De term wekte mijn interesse toen ik zag dat het als nieuwe Minor aangeboden werd. Waarom had ik als media student nog nooit gehoord van big data? En waarom klinkt het als een ongrijpbaar begrip? Na een korte zoektocht door het wereld wijde web wist ik dat ik meer wilde leren over het gebruik van data voor marketingdoeleinden. Toch was dit begrip nog te breed. Ik heb getwijfeld over de verdieping van mijn vraag, omdat big data ook wordt ingezet in de gezondheidszorg. Draagbare techniek zoals sporthorloges die gezondheid bijhouden zijn ook in opkomst, en gaan in een adem samen met big data. Tot iemand mij wees op de bonuskaart. Sinds 1998 is de Albert Heijn een grote speler als het gaat om het verzamelen van big data. Ik heb uiteindelijk gekozen voor de hoofdvraag: Op welke manier helpt big data de Albert Heijn om klanten beter te bereiken? Door deze vraag te beantwoorden wil ik meer leren over big data en privacy, maar ook in hoeverre ikzelf onbewust data genereer voor de Albert Heijn wanneer ik mijn boterhammen en wasverzachter sta af te rekenen.
Seminar Miranda Seegers -3
Hoofd en deelvragen Voor ik mijn definitieve hoofd- en deelvragen had vastgesteld heb ik een paar andere hoofdvragen laten vallen. Het specificeren van het onderwerp vond ik vrij lastig. Uiteindelijk wist ik dat ik de invloed van de bonuskaart op het bereiken van klanten wilde onderzoeken. Daarbij wilde ik weten wat big data precies is en hoe de Albert Heijn zijn bonuskaart tot nu toe had ingezet. Uiteindelijk ben ik gekomen op de volgende hoofdvraag met bijbehorende deelvragen: Op welke manier helpt big data de Albert Heijn om klanten beter te bereiken? Deelvraag 1: Wat is de definitie van big data en welke technieken zijn er? Deelvraag 2: Op welke manier zet Albert Heijn de bonuskaart in als big data? Deelvraag 3: In hoeverre botsen de bonuskaart en het recht op privacy? Deelvraag 4: Wat is de toekomst voor de bonuskaart? Zijn er ontwikkelingen die de bonuskaart gaan vervangen?
4- Big data en de bonuskaart
Deelvraag 1 Big data is voor veel mensen een onbekend begrip. Daarom is het belangrijk om te beginnen bij de exacte definitie. Maar bestaat die eigenlijk wel? Hoe wordt big data beschreven en uit welke technieken bestaat big data? Kan big data alleen in grote schaal ingezet worden? Is big data een hype?
Wat is de definitie van big data? De definitie van big data vastleggen in één zin is onmogelijk. Data is een heel omvattend woord die ook op verschillende manieren geïnterpreteerd kan worden. Dimitri Tokmentzis (2013) beschrijft big data niet als een omvang, maar als een ontwikkeling. Hij vindt dat big data twee componenten bevat: computertechnologie en statistiek. “Allereerst de computertechnologie: de steeds geavanceerder hard- en software die het mogelijk maakt meer data te verzamelen, te bewerken en te bewaren. Het tweede component is de statistiek die het mogelijk maakt om in een verzameling losse data betekenis te vinden.” Andere big data experts beschrijven de term big data met een andere kijkwijze. Een opsomming van interessante beschrijvingen: “De term Big Data verwijst naar wat je op grote schaal kan doen en die op een kleinere schaal niet mogelijk zijn, en waarmee je nieuwe inzichten verkrijgt of nieuwe vormen van economische waarde creëert op een manier die invloed heeft op onder andere markten, organisaties en de relatie tussen burgers en overheden.” Mayer–Schönenberg & Cukier (2013, p. 15) “Data are becoming the new raw material of business”… “Given enough raw data, today’s algorithms and powerful computers can reveal new insights that would previously have remained hidden.” (The Economist 2010) “Data and data sets are not objective; they are creations of human design. We give numbers their voice, draw inferences from them, and define their meaning through our interpretations. Hidden biases in both the collection and analysis stages present considerable risks and are as important to the big data equation as the numbers themselves.” Bottles, Begoli & Worley (2014, p. 10)
Seminar Miranda Seegers -5
Experts zijn het dus niet eens over de precieze definitie van big data. Wel zijn ze het eens over de volgende vier termen die big data omvatten: Volume, Velocity (snelheid), Variety (hoeveelheid verschillende bronnen) en Veracity (onzekerheid van data). Volume: Volume gaat over de hoeveel data er is opgeslagen en gebruikt kan worden. Op dit moment wordt er per seconde meer data gecreëerd dan twintig jaar geleden in een heel jaar gecreëerd werd. (Baane, 2013). Juist door de enorme hoeveelheid data kunnen er uitgebreide analyses gemaakt worden over een bepaald onderwerp in plaats van noodgedwongen met kleinere verzamelingen te werken. (Mayer–Schönenberg & Cukier, 2013, p. 33). Velocity: Velocity gaat over de snelheid waarmee de big data verwerkt wordt. Het gaat daarbij niet zozeer om het niet kunnen opslaan van de big data, we hebben de technieken om grote hoeveelheden data op te slaan. Het gaat bij velocity ook over de verwerking van big data en de snelheid daarvan. O’Reilly Media (2012) beschreef op Forbes.com waarom data soms niet meer relevant is wanneer de verwerking te lang duurt. Het voorbeeld dat zij geven is: ‘Zou je de weg oversteken met een snapchat als gids die vijf minuten geleden gemaakt is?’ Facebook bericht voorstellen en aanbevelingen bij een online kassa zijn twee simpele voorbeelden waarom velocity belangrijk is voor big data. Hoe langer het duurt, hoe minder belangrijk en relevant de gegevens zijn. Variety: De hoeveelheid verschillende bronnen wordt benoemd met Variety. IBM maakte een infographic (2014) die stelde dat er elke maand dertig mijard contentberichten worden gedeeld op Facebook. Verder spreken ze over 2011, toen er wereldwijd 160 miljard gigabyte aan data opgeslagen was aan zorggegevens, er elke maand vier miljoen uur aan video bekeken werd op Youtube en er elke dag 400 miljoen Tweets de wereld ingestuurd werden. Al die verschillende bronnen en daarmee verschillende data hebben informatie over verschillende onderwerpen en zijn op verschillende manieren te analyseren. Veracity: Hoeveel procent van de data is te gebruiken en betrouwbaar? Veracity gaat over de bruikbaarheid en ‘puurheid’ van de data die we gebruiken om te analyseren. Mayer–Schönenberg & Cukier, (2013, p. 24) beschrijven Veracity op de volgende manier: “Big data-gegevens zijn vaak rommelig, varieren in kwaliteit en bevinden zich verspreid over talloze servers overal ter wereld. Bij big data nemen we 6- Big data en de bonuskaart
vaak genoegen met een algemene tendens in plaats van dat we een verschijnsel tot op de centimeter, de cent of het molecuul doorgronden. Wat we aan precisie op microniveau kwijtraken, winnen we aan inzicht op macroniveau.” Een goed voorbeeld van veracity is bijvoorbeeld een big data analyse waarin onderzoeken zijn gebruikt gesponsord door belanghebbenden. Wanneer er honderd onderzoeken zijn gebruikt over de schadelijkheid van telefoonstraling, allemaal gesponsord door
Hoe kan big data in grote schaal ingezet worden? Google en Facebook zijn goede voorbeelden van bedrijven die big data in grote schaal inzetten. Zij ‘ontvangen’ zoveel data per dag, dat ze formules kunnen opstellen die voorspellende informatie geven over epidemieën, gezondheidszorg, veiligheid van steden en nieuwe trends. Zo maakte Google een programma die real-time kon aangeven waar een epidemie zich aan het verspreiden is. In Amerika gebruikte de gezondheidsorganisatie dat programma in 2009 om de H1N1-crisis de kop in te drukken. En met succes. Big data is uitstekend geschikt om in te zetten op grote schaal. Bij het verwerken van grote hoeveelheden data kan er gezocht worden naar correlaties die we niet zouden vinden als we die hoeveelheid data niet voor handen hadden. Mayer– Schönenberg & Cukier, (2013, p. 98). Waar we voorheen onderzoek deden op basis van hypotheses die we probeerden te bevestigen door te zoeken naar data, kunnen we nu conclusies trekken uit data over onderwerpen waar we nog niet over nagedacht hadden. In theorie is het mogelijk om een ideale stad op te zetten alleen bestaand uit big data gegevens. Door files en wegen over de hele wereld te analyseren, worden de wegen zo aangelegd dat file nooit voorkomt. Door te analyseren hoe vaak mensen ziek worden en welke kansen zij hebben op bepaalde ziektes worden ziektekosten veel lager, en wordt men snel preventief behandelt. Door gegevens van criminelen over de hele wereld naast elkaar te leggen, en te berekenen aan welk profiel of levensstijl iemand voldoet om meer kans te hebben om in het criminele circuit te raken, worden potentiele criminelen in de gaten gehouden en begeleid. Een perfecte stad, zonder file, criminaliteit en ziekten, zou met een optimaal gebruik van big data op grote schaal in theorie mogelijk zijn.
Seminar Miranda Seegers -7
Hoe kan big data in kleine schaal ingezet worden? Big data is heel erg geschikt om in kleine schaal in te zetten. Gegevens over heel veel mensen geven inzicht in bijvoorbeeld gedrag en gezondheid van groepen. Gegevens over één individu geven inzicht over koopgedrag, karakter en voorkeuren van die ene persoon. De verzamelde data over één individu kan ingezet worden voor customer centric marketing. Persoonlijke marketing werkt het beste wanneer een bedrijf een volledig profiel heeft van de klant. Dat volledige profiel wordt het vaakst gewonnen door de inzet van big data. Een middel dat ingezet kan worden om een customer centric marketing profiel op te zetten is het customer centricity model van SAS. (Baane, 2013).
Afbeelding 1: Customer Centric Marketing model van SAS. (Baane, 2013) Het lezen en toepassen van het model: Who they are: Gegevens die makkelijk te verkrijgen zijn, zoals geslacht, leeftijd en woonplaats. What they receive & how they respond: De contact historie die veel bedrijven bijhouden worden onderverdeeld in de twee blauwe bolletjes. Wat is er naar een 8- Big data en de bonuskaart
klant gecommuniceerd en welke respons gaven ze daar op. Their value, their loyalty en their potential: Hoe lang geleden heeft de klant iets gekocht? Hoeveel geeft de klant gemiddeld uit aan het product? Hoe lang spendeert de klant op de website? Hoe vaak komt hij terug op de site voordat hij een aankoop doet? Hoe groot is de kans dat hij opnieuw een aankoop doet? De gegevens die antwoord geven op deze vragen vallen onder de paarse bollen die inzicht geven waarde, loyaliteit en potentie van een klant. How they interact: De gegevens die verzameld worden in de groene en oranje bollen bestaan uit big data. De groene bol, how they interact, gaat over het gedrag van de klant online. Hoe reageert de klant online en welke veranderingen in zijn gedragspatroon waarop je als bedrijf kan anticiperen zijn zichtbaar? What they say & who they influence: profieldata die verzameld wordt over de klant online, via sociale media. Deze gegevens moeten legaal worden verkregen en worden aangevuld met diverse analitycs. Belangrijk aan deze twee ‘bollen’ is dat er sentiment-technieken bestaan om iemands emotionele reactie op onderwerpen te meten. Er wordt geanalyseerd hoe iemand reageert door woorden te filteren uit een reactie op internet. Woorden als ‘mooi’, ‘leuk’, ‘stom’ en ‘matig’ worden gecategoriseerd en verwerkt. Sentiment-technieken werken nooit voor de volle 100 procent omdat de computer sarcasme niet kan filteren. Daarom worden ze vaak gebruikt in combinatie met mood-detection. Deze techniek filtert hoofdletters, kleine letters, leestekens en de hoeveelheid uitroeptekens die de persooon in kwestie gebruikt in zijn of haar bericht. Door de combinatie van beide technieken ziet het systeem het verschil in de zinnen: ‘Mooi is dat zeg!’ en ‘MOOI IS DAT ZEG!!!!!’. Wanneer een bedrijf voldoende persoonlijke gegevens over het gedrag van de klant heeft verzameld, kan er persoonlijke marketing ingezet worden. Toch zitten er nog heel wat haken en ogen aan. Volgens een interview van Emerce met Ruben Niet (2015), moet er moet rekening gehouden worden met de volgende factoren: -Bedrijven werken met verschillende big data systemen, die niet altijd goed met elkaar samen werken. -Er zijn niet voldoende mensen die het kennisniveau hebben om uitgebreide persoonlijke marketingcampagnes van moeilijk niveau op te zetten. Seminar Miranda Seegers -9
-Bedrijven hebben een bepaald volume en budget nodig om goedwerkende persoonlijke marketing in te zetten. -De consument heeft een negatieve houding tegenover persoonlijke marketing omdat het tot nu toe nog niet goed uitgevoerd is. Het wekt nu nog veel irritatie op. -Er zijn heel veel regels omtrent privacy die het verzamelen van de gegevens voor een goede persoonlijke marketing campagne tegenhouden.
Is big data een hype? Big data wordt door veel experts tot hype benoemd, terwijl andere experts heilig geloven in het voortbestaan van het gebruik van big data. Big data is niet iets nieuws. Het Engelse woord data betekend ‘gegeven dingen’, ‘feiten’ en komt uit het Latijn. Hoewel het analyseren van data via computersystemen vrij nieuw is, is het analyseren van big data geen hype. In 1839 was Matthew Maury al in staat om logboeken van schepen naast gegevens te leggen die hij uit interviews haalde met kapiteinen. Hij inventariseerde kaarten en barometers. Na het analyseren van alle gegevens verdeelde hij de Atlantische Oceaan in vierkanten van lengte- en breedte- graden en plaatste zijn gegevens in de kaart. Na het optimaliseren en werven van nog meer gegevens had hij in 1855 1,2 miljoen gegevens verzameld en verwerkt. Hij veranderde daarmee de manier van navigeren op zee. Mayer–Schönenberg & Cukier, (2013, p. 108 t/m 113). Maury is niet de eerste die big data analyseerde in het verleden, zonder het gebruik van computers die data opslaan en verwerken. De term big data werd nog niet aan de onderzoeken gehangen, maar het was wel degelijk het verzamelen en verwerken van big data. Waarom noemen veel experts het dan toch een hype? Dat komt door de enorme aandacht en groei die big data nu ondergaat. Het wordt door velen aangeprezen als de onoverkomelijk toekomst, terwijl er nog heel wat haken en ogen aan de technieken zitten. Niet voor niets wordt de term veracity gebruikt, waarbij gemeten wordt of de data wel te vertrouwen is. Op dit moment is big data nog in een vorm waar fouten op de loer liggen. Over jaren kan er pas gezegd worden of het inderdaad onze manier van onderzoeken en leven kan beïnvloeden.
10- Big data en de bonuskaart
Deelvraag 2 Vorig jaar voerde de Albert Heijn een nieuwe bonuskaart in. Was dat omdat de vorige bonuskaart toch niet de data kon geven die Ahold gewenst had? Wat wil de Albert Heijn eigenlijk bereiken met de bonuskaart en in hoeverre valt dat onder big data?
Hoe werkt de bonuskaart? Sinds 1998 maakt Albert Heijn gebruik van de bonuskaart. Iedereen die bij de kassa van de supermarktketen staat, laat zijn kaart scannen voor extra kortingen. Daarmee verzamelde Albert Heijn koopgegevens van duizenden mensen. Vorig jaar voerde Albert Heijn een nieuwe bonuskaart in. Roderick van der Haagen, projectleider bij de invoering van de kaart, wordt door collectief Achter De Feiten geciteerd in het NRC (2015). “Het biedt die vertrouwde persoonlijke service van vroeger, maar dan in een nieuw jasje.” (para. 1). Het doel van de bonuskaart is daarbij dat het de persoonlijke service vervangt. De nieuwe kaart geeft geregistreerde klanten per e-mail extra korting op basis van hun eerdere aankoopgedrag. Het ‘nieuwe jasje’ waar Van der Haagen over spreekt komt in de vorm van datasets die opgeslagen liggen in ‘Pallas’, het datacenter van Albert Heijn. Door berekeningen die gemaakt worden door de computer weet die meer over elke klant dan een medewerker ooit zou kunnen. De koopgegevens van elk individu worden 27 maanden opgeslagen in het datacenter. Persoonlijke gegevens worden gekoppeld aan bepaalde producten, die iets vertellen over gedrag. Zo ‘weet’ de Albert Heijn dat witte bolletjes vaak gekocht worden in combinatie met chocoladepasta. Wanneer een klant alleen een wit bolletje koopt kan hij reclame ontvangen over chocoladepasta, omdat het waarschijnlijk is dat hij dat ook gaat kopen. Maar dat niet alleen, de Albert Heijn weet door al die gegevens welke chipsmerken worden gekocht door studenten, hoeveel procent huishoudgeld nieuwe ouders meer besteden aan eten en of er meer lekkers wordt gekocht in het weekend. Kort samengevat: Door het koopgedrag van duizenden mensen te analyseren, maakt Albert Heijn voorspellingen over het koopgedrag van een persoon. Op basis van die voorspelling worden er persoonlijke aanbiedingen aangeboden.
Tot op welke hoogte heeft Albert Heijn de bonuskaart al benut? Toch staat in het artikel van Achter De Feiten ook vermeld dat Albert Heijn gefaald heeft in deze strategie, er moest immers een nieuwe kaart komen. Ook Duivenstein beschrijft dat. (2012.) “Albert Heijn haalt dus met haar huidige kortingsactie nog niet het onderste uit de kan.” Sinds de invoering van de oude bonuskaart had de Albert Heijn voldoende middelen, zowel qua techniek als Seminar Miranda Seegers -11
kennis over Big Data. Een voorbeeld daarvan is het printen van persoonlijke aanbiedingen op de kassabon. Albert Heijn heeft die techniek nooit benut, terwijl dat al mogelijk was sinds 1998. Ook gebruikt de Albert Heijn zijn data nog niet om processen in de winkel te verbeteren. De techniek om inkoop te bepalen op basis van de hoeveelheid verkochte producten en voorspellingen voor de te verkopen producten bestaat. Toch wordt alles nog met de hand geteld. Waarom Albert Heijn die technieken nooit benut heeft wordt genoemd in het NRC. (2015). Het NRC citeert toenmalige projectleider bonuskaart Frans Melenhorst. “Het management vond dat dezelfde korting voor alle bonuskaarthouders voldoende opleverde. Ik liet een goudmijn achter, maar er was simpelweg onvoldoende inzicht in de voordelen van persoonlijke marketing”. Duivenstein ziet als mogelijke oorzaak van het niet volledig benutten van de kaart de verbanden die Albert Heijn nog niet gelegd heeft. “Combineer deze gegevens vervolgens met de bonuskaart, de pinpas en de Appie-applicatie op de iPhone en de supermarktketen weet precies wat haar klanten de afgelopen week op het menu hadden staan. Sterker nog, aan de hand van deze data zijn ze zelfs in staat om te voorspellen wat er de volgende week gegeten gaat worden.” De Albert Heijn heeft de bonuskaart dus benut om koopgegevens te verzamelen, en de bonus daar op af te stemmen. Ook krijgen bonuskaarthouders mail met persoonlijke aanbiedingen. Ondanks dit gebruik van de bonuskaart heeft Albert Heijn een boel mogelijkheden laten liggen,
Waarom is er een nieuwe Bonuskaart uitgebracht? Dat de Albert Heijn veel kan doen met zijn bonuskaart is duidelijk, maar waarom heeft het bedrijf een nieuwe bonuskaart uitgebracht terwijl ze voor jaren aan gegevens hadden staan? Het gebruik van Big Data biedt vele kansen, maar brengt ook gevaren met zich mee. In het geval van de Albert Heijn nam het gevaar de overhand, en waren de gegevens die verzameld waren niet meer bruikbaar. Big data kan namelijk alleen ingezet worden als de data betrouwbaar en correct is (veracity). Dat was bij de vorige bonuskaart niet meer het geval. Omdat klanten onderling bonuskaarten uitwisselden, raakte de gegevens ‘vervuild’. Een vervuilde database zorgt voor minder nauwkeurige voorspellingen. Ook gebruikten caissières een persoonlijk bonuskaart nummer wanneer de klant een bonuskaart vergeten was. Die gegevens werden ook opgeslagen, terwijl ze aan niemand verbonden waren. Persoonsgerichte 12- Big data en de bonuskaart
marketing was niet meer mogelijk omdat de database niet meer in staat was de beste aanbieding aan de juiste persoon te hangen. Onjuiste persoonlijke marketing wekt juist irritatie op, waardoor het doel van de kaart kwam te vervallen. De oplossing was een nieuwe bonuskaart. Iedereen zou een persoonlijke kaart krijgen gekoppeld aan zijn of haar eigen gegevens en voorkeuren. Vervuiling in het nieuwe systeem zou daarmee ook worden voorkomen. Om te zorgen dat de bonuskaart niet opnieuw uitgewisseld zou kunnen worden was het plan om elke bonuskaart aan een persoonlijk email-adres te koppelen. Helaas voor Albert Heijn zat het College Bescherming Persoonsgegevens (CBP) in de weg. (AD, 2013). Zij bepaalden dat klanten expliciet toestemming moeten geven om de nieuwe kaart te koppelen aan persoonsgegevens. Wie dat niet doet krijgt een ‘gewone’ bonuskaart en bijvoorbeeld geen aanbiedingen via de mail. Hoewel meerdere partijen tegen de invoering van de nieuwe bonuskaart waren door de dunne lijn tussen handige kaart en schending van privacy (meer over de bonuskaart en privacy in deelvraag 3) voert de Albert Heijn de nieuwe kaart alsnog in op 21 oktober 2013. (Ah, 2014).
Seminar Miranda Seegers -13
Deelvraag 3 Big data gebruik en privacy botsen nog wel eens met elkaar. Dat geldt ook voor de Bonuskaart. Welke privacykwesties zorgen voor een minder groot klantenbestand in het verleden, in het heden en in de toekomst?
Verleden Recht op privacy en big data hebben al een lange tijd een lastige relatie met elkaar. Big data stelt ons in staat om vragen te beantwoorden, maar die vragen worden beantwoord met gegevens over duizenden individuen. Volgens de wetgeving mag Albert Heijn alle koopgegevens die worden vergaard met de bonuskaart voor maximaal 27 maanden opslaan. Albert Heijn heeft dus voor iets meer dan twee jaar aan koopgegevens per persoon opgeslagen. Het moment van introductie van de nieuwe bonuskaart is op het gebied van privacybezwaren heel boeiend. Partijen als PrivacyFirst en het CBP (College Bescherming Persoonsgegevens) gingen zich verzetten tegen het invoeren van de kaart. Het CBP maakte een 96 pagina’s tellend onderzoeksverslag (CBP, 2012) over wetgeving persoonsgegevens en de bonuskaart. De punten waar zij tegen aanliepen waren: -Bij de registratie van de bonuskaart was het vakje ‘Ja’ al aangevinkt. Dit vakje gaf aan dat de Albert Heijn persoonlijke gegevens mocht gebruiken voor persoonlijke aanbiedingen. -Nergens stond vermeld dat wanneer een persoon zijn anonieme bonuskaartnummer zou intypen via AH.nl of via de App Appie, de bonuskaart de anonieme status zou verliezen. Gegevens uit de app of de site zouden automatisch gekoppeld worden aan de kaart. Stichting Privacy First kwam naar buiten met het volgende statement (AD, 2013): “Dit vinden wij een vorm van oneerlijke handelspraktijken. Het komt erop neer dat je extra korting krijgt als je je gegevens afstaat. Dat kan niet door de beugel.” Gelijktijdig beantwoordde staatssecretaris Teeven in 2013 vragen over privacy schending door de bonuskaart. De vragen werden gesteld door PvdA Kamerleden Oosenbrug en Mei Li Vos. Zij waren bang dat persoonlijke gegevens achterhaald konden worden door verloren bonnetjes. Teeven antwoord daarop dat het een onrealistisch scenario is, omdat de eerste vijf nummers van de bonuskaart 14- Big data en de bonuskaart
verborgen zijn op kassabonnen. Ook bevestigde hij dat persoonsgegevens niet achterhaald kunnen worden bij verloren bonuskaarten. Om bij die gegevens te komen moet er eerst ingelogd worden met gebruikersnaam en wachtwoord via de website of de app. Interessant is dat niet alleen het College Bescherming Persoonsgegevens en stichting Privacy First zich zorgen maken over privacy, maar dat het ook een politiek punt is geworden. Uiteindelijk heeft de Albert Heijn alles aangepast om aan de wet te voldoen en is de nieuwe bonuskaart ingevoerd. Albert Heijn’s houding in dit proces was heel meegaand, hoewel de aanpassingen niet in hun voordeel liggen.
Heden Na het invoeren van de nieuwe bonuskaart kwam app ontwikkelaar Jan van Kampen met het volgende probleem voor de Albert Heijn: hij lanceerde de app AHnoniem. Mensen die hun bonuskaartnummer invoeren in de app krijgen aan de kassa een willekeurig bonuskaartnummer. Op die manier ontwijken ze het opslaan van koopgegevens. De gegevens die de Albert Heijn ontvangt via die bonuskaartnummers zijn dan waardeloos. (Telegraaf, 2014). Albert Heijn ondernam al snel stappen tegen de app, en dreigde er een rechtszaak van te maken. Ze claimden dat ze dat deden omdat de app het logo en de naam van de supermarktketen gebruikte. Toch is het een plausibele aanname om te zeggen dat deze app dezelfde onbruikbare gegevensstroom zou veroorzaken die de eerste bonuskaartgegevens onbruikbaar maakte. Wanneer deze app voor de Iphone in de App Store zou verschijnen, zou dat een ramp zijn voor de bruikbaarheid van de gegevens. Albert Heijn had met het stopzetten van de app waarschijnlijk meer belang dan alleen het feit dat hun naam en logo gebruikt werd.
Afbeelding 2: Het logo van de app AHnoniem.(Telegraaf, 2014) Seminar Miranda Seegers -15
Toekomst Wanneer de Albert Heijn beter weet om te gaan met de data die ze verkrijgen door de bonuskaart, kunnen ze beter direct marketing gaan inzetten. Dat biedt voor de verkoop en persoonlijke aanspraak tonnen voordelen, maar qua privacy zit er ook een groot nadeel aan. De kans dat er eenzelfde ‘ongeval’ zal gebeuren als de Target een paar jaar geleden had, is bijna onvermijdelijk. Zij stuurden coupons voor babyspullen naar het adres van mensen die volgens de opgeslagen data over koopgedrag zwanger zouden zijn. Die coupons werden ook bezorgd op het adres van een tienermeisje. Haar vader was woedend op de Target, omdat ze zijn dochter aan zouden sporen voor het krijgen van baby’s. Niet veel later bleek het meisje in kwestie al zwanger te zijn. Uit de data analyse van haar koopgedrag bleek dat ze zwanger was, maar dat nieuws had ze nog niet aan haar vader verteld. Wanneer mensen advertenties opgestuurd krijgen over informatie die ze liever niet delen met de buitenwereld, voelen ze zich bekeken en werkt de direct marketing averechts. Ook voor de Albert Heijn is het verbeteren van de bonuskaart en de privacy die mensen eisen een dunne lijn. Target heeft die privacy kwestie opgelost door willekeurige reclame naast hun direct marketing te plaatsen. Zij weten uit koopgegevens dat iemand zwanger is, maar sturen geen kaart meer met: ‘gefeliciteerd met uw zwangerschap’ omdat men dan vindt dat er een inbreuk op hun privacy gepleegd wordt. In plaats daarvan sturen ze een boekje naar de persoon in kwestie met babykleertjes en wijnglazen. Op een andere bladzijde staat een kinderbedje, met daarnaast een advertentie voor een fiets. Door mensen te laten geloven dat de gezonden reclame willekeurig is, gaat er niemand klagen over recht op privacy. Terwijl niemand het door heeft verkopen ze toch meer babyspullen door de reclame aan zwangere vrouwen. Zelfs wanneer ze naast de persoonlijke reclame ook ‘onnozele’ reclame plaatsen, verkopen ze meer door direct marketing. Dit soort ‘geniepige’ tactieken moet de Albert Heijn ook gaan toepassen in de toekomst, wanneer de bonuskaart op zo’n goede manier benut wordt dat men het gevoel heeft dat Albert Heijn te veel weet.
16- Big data en de bonuskaart
Deelvraag 4 Om deze deelvraag te beantwoorden is de eerste vraag die ik ga beantwoorden: wat is de toekomst van big data? Welke ontwikkelingen zijn er aan de gang die de bonuskaart zouden kunnen vervangen of verbeteren? En wat is mijn toekomstvisie voor deze ontwikkelingen?
Wat is de toekomst van big data? Big data is een ontwikkeling die veel banen kan opleveren. In 2013 studeerde in Amerika de eerste data analyse student af. De voorspelling is dat big data de komende jaren heel veel IT banen gaat creëren. Er is een grote behoefte aan mensen die om kunnen gaan met big data. (Hafkamp, 2013). Aan de andere kant bestaat er ook de angst dat big data veel ‘menselijke banen’ over zal nemen. Onderzoekers, app makers en zelfs het personeel in een supermarkt kunnen minder nodig zijn door de inzet van big data. Dat big data veel banen op gaat leveren is een positieve ontwikkeling. Een andere positieve ontwikkeling is het terugdringen van zorgkosten door big data. Deze ontwikkeling is op verschillende niveau’s gaande, maar zal ik uitleggen aan de hand van de HealthKit en ReacherachKit case. Lamers (2014) schreef in het tijdschrift Create over Apple’s gezondheidsrevolutie en de Healthkit. Apple wil revolutionair zijn op het gebied van de gezondheidszorg. Daarom introduceren ze met het nieuwe besturingssysteem IOS8 de app Health, met bijbehorend framework HealthKit. Deze app verzameld gezondheidsinformatie die opgeslagen staat op de telefoon. De gigantische hoeveelheid gezondheidsapps die op een telefoon staan, delen de informatie die ze bevatten nog niet met elkaar. Health doet dat wel. Die combineert de gegevens van bijvoorbeeld Nike+ Running met een calorie teller zoals FatSecret. De app kan ook gegevens bijhouden van externe apparaten met Wi-Fi of Bluetooth, zoals weegschalen en hartslagmeters. Wanneer al deze gegevens samengekoppeld zijn kan de gebruiker zijn gezondheid checken onder de kopjes: Conditie, Voeding, Slaap en Diagnose. De app houdt onder voeding bijvoorbeeld bij hoeveel iemand al van een bepaalde vitamine heeft binnengekregen die dag. Apple werkt samen met zorginstellingen die al die data kunnen interpreteren. De gegevens worden veilig naar gezondheidsinstellingen gestuurd, zodat mogelijke ziektes en aandoeningen snel worden geconstateerd.
Seminar Miranda Seegers -17
Daarnaast werkt Apple ook samen met de Zorgpatch. Een pleister van ongeveer tien centimeter die de hele dag op het lichaam gedragen kan worden. De pleister meet je hartslag, celademhaling, inspanning, stappen, energieverbruik, huidtemperatuur en houding bij. Deze pleister is geen ‘big data droom’ meer, maar wordt al gebruikt bij bijvoorbeeld de Alpe D’HuZes. Apple gaat nog een stapje verder met de ReasearchKit. Alle gegevens die worden verwerkt en opgeslagen in de Healthkit zijn beschikbaar voor onderzoekers. De medische gegevens van mensen over de hele wereld zijn op die manier beschikbaar voor big data onderzoeken. Een voorbeeld uit het tijdschrift Create in 2015 is het naast elkaar leggen van gezonheidsgegevens van astmapatiënten in Nederland. Aan de hand van symptomen die wel of niet optreden kunnen doctoren mensen uitsluiten van onderzoeken, of juist adviseren om een bepaald onderzoek te doen.
Afbeelding 3: Apple Health kit (Forbes.com, 2015) Helaas zit er ook een nadeel aan de mogelijkheden van big data in de toekomst. Wanneer mensen met hun Healthkit op de telefoon op straat lopen, kunnen die gegevens gestolen worden. Er bestaan onderhuidse chips die je kan laten 18- Big data en de bonuskaart
zetten met daarop je visitekaartje of bijvoorbeeld de sleutel tot het openen van je garage. Het is hackers nu ook gelukt om met zo’n chip onder de huid Smartphones te kraken en informatie te stelen. (Quest, 2015). Wanneer al die big data gestolen wordt, kunnen daar zeker nadelige gevolgen aan zitten. Verzekeraars die gestolen data in handen krijgen, kunnen mensen een verzekering weigeren op basis van gezondheid gegevens die ze bezitten. Big data creëert mogelijkheden en banen voor de toekomst. Op het gebied van bijna alles kan big data revolutionair zijn: gezondheidszorg, huisvesting, technologie en marketing zijn daar maar enkele voorbeelden van. Toch zitten er ook gevaren aan. Big data kan namelijk ook ingezet worden voor negatieve
Wat zijn de ontwikkelingen die invloed hebben op de bonuskaart? Dat big data de wereld gaat veranderen is zeker, maar welke ontwikkelingen gaan de bonuskaart vervangen? Voorspellingen zijn natuurlijk niets meer dan een vermoeden van wat er gaat gebeuren, maar wanneer de voorspellingen uit komen ziet 2020 er voor ons heel anders uit dan nu. De verwachting is namelijk dat in 2020 het aantal data dat we per dag genereren 400% meer is dan in 2015. Ook is er een enorme ontwikkeling in ‘the internet of things’. De koelkast zal doorgeven aan de supermarkt dat de boter op is, en meteen een nieuw pakje bestellen. Ook bestaat de techniek om te registreren wat men in de winkel wel en niet in zijn boodschappenkar legt. Data over merkvoorkeur wordt in de winkel opgeslagen, samen met de koopgegevens bij de kassa. Interessant voor de Albert Heijn is de toekomst voor gepersonaliseerde emailmarketing. Berichten ontvangen op basis van aankoopgedrag, surfgedrag, omnichannel klikgedrag en klantherkenning. Albert Heijn zou bijvoorbeeld recepten kunnen sturen op basis van wat er in de koelkast ligt, en gegevens over persoonlijkheid die ze in hun bezit hebben. Een luie student krijgt bijvoorbeeld geen ingewikkelde recepten opgestuurd. Of het pasje als bonuskaart gaat verdwijnen is niet te voorspellen, maar dat het gebruik ervan gaat veranderen wel. Omdat er steeds meer technieken beschikbaar zijn, zoals registratie van keuzes die worden gemaakt in de winkel, en mensen steeds meer wennen aan de technologie om hun heen, wordt er ook verwacht dat winkels persoonlijk zijn. Over een aantal jaar komt Albert Heijn niet meer weg met alleen bonuskorting voor iedereen. Er wordt Seminar Miranda Seegers -19
dan ook verwacht dat ze persoonlijk adverteren, inspelen op wat men nodig heeft en klaarstaan voor persoonlijke wensen. Ik denk dat de Albert Heijn die verwachtingen kan waarmaken, en door persoonlijke marketing in te zetten klanten aan zich blijft binden.
Wat is mijn visie op de toekomst? Waar gaat de Albert Heijn heen tussen nu en dertig jaar? Ik denk dat de ontwikkeling omtrent big data en gezondheid zich ook verspreid richting de supermarkt. Healthkit van Apple is nog maar het begin van de ontwikkeling die gaat komen. Gezondheidsgegevens van elke klant staan altijd beschikbaar, ook in de supermarkt. Wanneer ik een pakje boter wil halen bij de Albert Heijn, zal de koeling mij merk A aanbevelen, omdat mijn cholesterolgehalte wat hoog is de laatste tijd. Daarnaast verteld mijn device die in verbinding staat met mijn koelkast mij dat mijn partner net de melk opgemaakt heeft thuis, en er nieuwe gehaald moet worden. Door de gegevens die de Albert Heijn heeft verzameld over mij weten ze dat ik bij de kassa nog een koopje aanschaf, als het display van het rek mij wijst op de gezondheidsvoordelen van het product. Vooral de aanbevelingen die de stellingen over etenswaren kunnen geven vind ik heel interressant. Ik zie voor me dat mijn telefoon weet dat de laaste tijd slecht slaap, en mij daarom kamillethee aanbeveeld. Hij weet wat ik lekker vind, en stelt producten voor die mij optimaal gezond en fit houden zodat mijn gezondheid goed blijft.
20- Big data en de bonuskaart
Conclusie Door de deelvragen te beantwoorden wilde ik antwoord kunnen geven op de hoofdvraag: Op welke manier helpt big data de Albert Heijn om klanten beter te bereiken? Op dit moment helpt big data de Albert Heijn vooral met het koppelen van koopgegevens van alle klanten. Zij die product A kopen, kopen ook vaak product B. Deze kennis wordt omgezet in email-marketing met persoonlijke aanbiedingen die de Albert Heijn verstuurd. Hoewel de Albert Heijn klanten op die manier probeert te bereiken zetten ze big data nog niet voldoende in om het maximale eruit te halen. In het verleden en heden bezat Albert Heijn de technieken en kennis om big data toe te passen, maar hebben daar nog geen gebruik van gemaakt. Ook werd het ze moeilijk gemaakt door het moeten inzetten van een nieuwe bonuskaart door vervuilde gegevens. Privacy en big data dansen op een dun lijntje, en door de regelgeving wordt het bemoeilijkt om big data in te zetten voor persoonlijke marketing. In de toekomst kan de supermarkt klanten beter bereiken door het inzetten van persoonlijke marketing op basis van koopgegevens, merkvoorkeur, en big data kennis over de levensstijl van de klant. De ontwikkeling van big data kan er zelfs voor zorgen dat Albert Heijn klanten alleen nog maar bereikt door het gebruik van persoonlijke gegevens, maar die toekomst is nog ver weg.
Seminar Miranda Seegers -21
Literatuur Webpublicaties Achter De Feiten. (2015, januari). Een kaart vol met ‘Big Data’. NRC Handelsblad. Ontleend aan http://www.nrc.nl/handelsblad/van/2015/januari/03/een-kaartvol-met-big-data-1452795 Albert Heijn. Geschiedenis van Albert Heijn. Ontleend aan http://www.ah.nl/ over-ah/geschiedenis/detail Algemeen Dagblad. (2013, oktober). Kritiek op Albert Heijn om vernieuwde bonuskaart. Ontleend aan http://www.ad.nl/ad/nl/5597/Economie/article/ detail/3524016/2013/10/09/Kritiek-op-Albert-Heijn-om-vernieuwdebonuskaart.dhtml Baane, K. (2013, mei). Big Data, hoe pas je het toe? Ontleend aan http://www. frankwatching.com/archive/2013/05/17/big-data-hoe-pas-je-het-toe/ College Bescherming Persoonsgegevens. (2012, februari). Onderzoek naar de verwerking van persoonsgegevens door Albert Heijn B.V. in het kader van de AH Bonuskaart/het voordeelprogramma Mijn Bonus. Ontleend aan: https:// cbpweb.nl/sites/default/files/downloads/rapporten/rap_2012-ah-bonuspersoonsgegevens.pdf Duivenstein, S. (2012, januari). Is Albert Heijn de nieuwe Big Brother? Ontleend aan http://www.frankwatching.com/archive/2012/01/03/is-albert-heijn-denieuwe-big-brother/ Economist. (2010, februari). Data, Data Everywhere. Ontleend aan http://www. economist.com/node/15557443 Hafkamp, M. (2013, juli). Big data is toekomst voor banen die nu nog niet bestaan. Ontleend aan: http://www.nu.nl/zakelijk-opinie/3514523/big-data-toekomst.html Kamerstuk Rijksoverheid. (2013, oktober). Beantwoording Kamervragen over privacyschendingen door middel van bonuskaart Albert Heijn. Ontleend aan: http://www.rijksoverheid.nl/documenten-en22- Big data en de bonuskaart
publicaties/kamerstukken/2013/10/22/antwoorden-kamervragen-overprivacyschendingen-door-middel-van-de-bonuskaart-van-albert-heijn.html Metz, M. (2015, mei). Hoe kun je met een chip in je hand rondneuzen in andermans smartphone? Ontleend aan: http://www.quest.nl/artikel/hoe-kunje-met-een-chip-in-je-hand-rondneuzen-in-smartphones-van-anderen O’Reilly Media. (2012, januari). Volume, Velocity, Variety: What you need to know about big data. Ontleend aan: http://www.forbes.com/sites/ oreillymedia/2012/01/19/volume-velocity-variety-what-you-need-to-knowabout-big-data/2/ Telegraaf. (2014, mei). Softwareontwikkelaar trekt AHnoniem in. Ontleend aan: http://www.telegraaf.nl/binnenland/22631507/__Ontwikkelaar_trekt_ AHnoniem_in__.html Tokmetzis, D. (2013, november). Wat is Big Data? De correspondent. Ontleend aan https://decorrespondent.nl/296/Wat-is-Big-Data-/14414312-a609db7d Tuk, Y. (2015, maart). Persoonlijke marketing is met automation in aantocht. Ontleend aan: http://www.emerce.nl/achtergrond/persoonlijke-marketingautomation-aantocht
Boeken Bottles, K., Begoli, E. & Worley, B. (2014, juli). Understanding the Pros and Cons of Big Data Analytics. Physician Executive. Mayer-Schönberg, V., & Cukier, K. (2013). De big data revolutie. Amsterdam, Nederland: Maven Publishing.
Tijdschriften Lamers, S. (2014). Apple’s volgende revolutie: Gezondheid. ICreate, 60, 22-27.
Seminar Miranda Seegers -23
Bijlage A- Reflectie De start van het maken van dit onderzoeksverslag ging niet zo soepel. In de eerste weken dwaalde ik nog erg in de keuze van mijn onderwerp. Vlak voor de meivakantie besloot ik het onderwerp big data te gaan behandelen en flink te werken aan seminar die week. Helaas belandde ik in het ziekenhuis en liep ik een nog verdere afstand op. Ik heb even getwijfeld of ik wel zou beginnen aan Seminar onderzoek, maar heb besloten om het toch te proberen. Omdat ik elke dag een aantal uur moest werken aan het verslag leverde het stress op, maar ik heb ook geleerd dat het doen van onderzoek een stuk makkelijker gaat wanneer het onderwerp boeit. De volgende keer zou ik om tijdsdruk door onvoorziene omstandigheden te voorkomen toch eerder beginnen, ook al wist ik nog niet precies wat mijn onderwerp zou zijn. In tegenstelling tot andere onderzoeken die ik gedaan heb, heb ik veel geleerd over één bepaald onderwerp. Ik wil mij in de toekomst verder verdiepen in big data en de invloeden op het CMD vakgebied. Toch vond ik het lastig om niet te veel uit te weiden over het algemene onderwerp: big data. Ik merkte dat ik te veel zijsporen bij mijn onderzoek betrok en daardoor de rode draad verloor. Daarom heb ik de eerste deelvraag opnieuw ingedeeld en geschreven. Het blijft nu meer bij de definitie van big data. Als ik weer een Seminar moest maken zou ik het op een andere manier doen. Ik weet nu hoe specifiek een vraag moet zijn om makkelijk onderzoek te doen dat de diepte in gaat. Algemene woorden moeten gewist worden uit de onderzoeksvraag. Omdat het toch best moeilijk is wil ik blijven oefenen met het opstellen van onderzoeksvragen om het onder de knie te hebben wanneer ik een afstudeeronderzoek moet doen.
24- Big data en de bonuskaart