Big Data – Effectief de informatieberg te lijf!
Datum aanmaak
2-8-2012
Auteurs
Martin Schepers
Inhoudsopgave 1 2 3
Inleiding ............................................................................................ 3 Wat is Big Data?.................................................................................. 3 Big Data Analytics & Big Data opslag ...................................................... 3 3.1 3.2
4 5 6 7
Waarom Big Data? ............................................................................... 5 Sleutel tot concurrentievoordeel ............................................................ 5 Tien generieke misvattingen ................................................................. 7 Zelf aan de slag met Big Data ............................................................... 9 7.1 7.2 7.3 7.4
8
© 2012 AnchorMen
Big Data Analytics ........................................................................ 3 Big Data opslag ........................................................................... 4
Inventariseer gegevens ................................................................. 9 Laat de business leidend zijn ......................................................... 9 Werk aan technologiekennis ........................................................ 10 Bereid medewerkers voor ............................................................ 10
Big Data: De zaken op een rijtje .......................................................... 10
Effectief de informatieberg te lijf!
Pagina 2 van 11
1
Inleiding Zowel binnen als buiten het vakgebied van de informatica geldt het als een hot issue. Het wordt zelfs al de derde technologische golf genoemd. We hebben het natuurlijk over Big Data, het voor commerciële, beleidsmatige of wetenschappelijke doeleinden slim verzamelen, vinden, combineren en interpreteren van immens grote hoeveelheden data. Hoeveelheden die de opslagcapaciteit van bestaande tools en systemen ver te boven gaan. Big Data lijkt het antwoord op het probleem van onze data overkill. Een korte verkenning.
2
Wat is Big Data? Wat is Big Data? Een vraag die lastig te beantwoorden is. Niet alleen bestaat er zoals bij elk jong vakgebied of nieuwe ontwikkeling - geen eenduidige definitie van Big Data, het is een moving target. Dat wil zeggen dat het continu onderhevig is aan nieuwe ontwikkelingen en inzichten. Kort gezegd draait Big Data om het hanteerbaar maken en houden van enorme hoeveelheden data en databronnen die met traditionele (SQL-gebaseerde) tools niet meer zijn om te zetten in informatie of fysiek of logisch zijn op te slaan in een bestaand systeem. Het is niet alleen moeilijk het paraplubegrip Big Data in een sluitende definitie onder te brengen, doordat elke organisatie weer anders is, verschilt ook de interpretatie van het begrip. Waar voor sommige organisaties honderden gigabytes al aanleiding vormen om professioneel datamanagement te overwegen, daar spreken weer andere organisaties pas van Big Data wanneer er sprake is van tienduizenden terabytes. Data zijn niet alleen ‘big’ doordat het er zo veel zijn, ook de enorme verscheidenheid en de complexiteit spelen een rol. In beide gevallen levert het problemen op in termen van het zoeken naar en verzamelen van data, de opslag ervan, het delen, analyseren of visualiseren. En dat terwijl bestaande systemen en databases eenvoudigweg niet meer in staat zijn om die immense hoeveelheid en verscheidenheid behapbaar te maken en aan te wenden voor gebruik. Voor de goede orde: 80% van alle data is ongestructureerd.
3
Big Data Analytics & Big Data opslag Voor een beter begrip van Big Data is het belangrijk onderscheid te maken tussen twee toepassingen ervan: Big Data Analytics en Big Data opslag. Twee toepassingen die onlosmakelijk met elkaar verbonden zijn.
3.1
Big Data Analytics We spreken van Big Data Analytics wanneer data aan drie randvoorwaarden voldoen. Allereerst zijn de data uitsluitend relevant voor een gebruiker wanneer ze snel beschikbaar zijn. In de tweede plaats moeten de data uit verschillende
© 2012 AnchorMen
Effectief de informatieberg te lijf!
Pagina 3 van 11
bronnen afkomstig zijn. Het derde kenmerk is dat de data flexibel verrijkt kunnen worden door toevoeging van andere gestructureerde data. Kort samengevat beschikken data over volume, variety en velocity. Met dit in het achterhoofd zijn bekende voorbeelden van Big Data: Google Analytics, Google’s analysetool en Amazon`s product recommendation engine waarbij op basis van eerdere bezoeken aan de site of surfgedrag een bezoeker real time producten wordt aangeboden die aansluiten bij datgene dat hij koopt of waar hij naar op zoek is. Ter illustratie. Amazon`s database met transacties is geen Big Data: de data zijn uniform, gearchiveerd en hebben weinig potentie om waarde aan de business toe te voegen. Echter, Amazon`s database met klik- en aankoopgedrag die het mogelijk maakt direct een klant een aanbieding op maat te doen wanneer deze de site opnieuw bezoekt, is wel Big Data. Immers, de data zijn pluriform, divers, direct beschikbaar en kunnen waarde creëren.
3.2
Big Data opslag Voor Big Data Analytics zijn andere datasystemen vereist dan de bestaande datawarehousing oplossingen zoals we die kennen. Systemen voor Big Data opslag moeten snel, schaalbaar, flexibel en in staat zijn om zowel gestructureerde als ongestructureerde data te integreren. In de praktijk nemen dergelijk systemen steeds vaker de vorm aan van gedistribueerde netwerken van pc`s en servers. Dit maakt de systemen namelijk schaalbaar. Zo kan opslag- of rekencapaciteit eenvoudig worden toegevoegd en hoeft een gebruiker niet elk jaar opnieuw een zwaardere computer aan te schaffen. Wat Big Data software in feite doet is het in stukken knippen van data en deze kopiëren en verdelen naar meerdere locaties binnen het netwerk. Dankzij dit verdelen beschikt een Big Data netwerk over vier bijzondere eigenschappen die conventionele netwerken en systemen niet hebben:
Snelheid. Wanneer data worden opgevraagd werken de relevante onderdelen van het netwerk parallel mee aan het lokaliseren en aanleveren van die data.
Redundantie. Alle data zijn op minstens twee fysieke locaties in het netwerk beschikbaar.
Flexibiliteit en altijd online. Anders dan klassieke IT-systemen hoeft een systeem nooit offline voor onderhoud. Gedistribueerde Big Data netweken hebben geen zogeheten single point of faillure.
Horizontale schaalbaarheid. De snelheid, hoeveelheid data en benodigde capaciteit hebben altijd een lineair verband. Meer hardware betekent altijd meer capaciteit en snelheid
Er zijn veel verschillende platforms waar Big Dataoplossingen op kunnen draaien. Een van de belangrijkste en grootste platforms die voor Big Datasystemen gebruikt worden is Hadoop, een open source platform van Apache. Daarnaast worden de (open source) Big Data plaforms Apache Cassandra en MongoDB veel gebruikt. Niet alleen worden deze drie platforms gedragen door de grote social
© 2012 AnchorMen
Effectief de informatieberg te lijf!
Pagina 4 van 11
media clubs als Facebook, Twitter en Yahoo, achter elk platform zit een grote en actieve open source community.
4
Waarom Big Data? Het antwoord is eenvoudig: omdat onze systemen de grote hoeveelheden informatie en data die op ons afkomen niet meer kunnen behappen. Big Data is het noodzakelijke antwoord op de explosie van data en informatie die de afgelopen jaren heeft plaatsgevonden. Het is een verhaal van moeilijk te bevatten superlatieven. In de afgelopen twee jaar werd zo`n 90% van de wereldwijde data gecreëerd. Weliswaar verdubbelde sinds de jaren 80 het wereldwijde vermogen om informatie op te slaan elke 40 maanden, sinds 2012 wordt dagelijks voor 2,5×1018 bytes aan data gecreëerd terwijl wereldwijd het volume van businessdata elke 1,2 jaar verdubbelt. In toenemende mate maakt onze samenleving gebruik van data-intensieve technologieën en wordt daar ook afhankelijk van in het functioneren. Tegelijkertijd weten we ons steeds minder goed raad met de immense hoeveelheden data die gegenereerd worden. En nog gegenereerd gaan worden. Ter illustratie: wereldwijd hebben 4,6 miljard een telefoonabonnement en hebben tussen de 1 en 2 miljard mensen toegang tot het internet. Meer dan ooit tevoren interacteren mensen met data en informatie, en het einde is nog lang niet in zicht. Tussen 1990 en 2005 werden meer dan een miljard mensen zo welvarend dat ze tot de middenklasse worden gerekend, wat op zijn beurt weer leidde tot een verdere groei van data. Vooral de laatste jaren is het aantal databronnen enorm gegroeid met de opkomst van social media en het gebruik van mobiele apparaten, schaalvergroting, het gebruik van betere en relatief goedkope meetinstrumenten zoals smart sensors of RFID, de toename van logging rondom geautomatiseerde processen en het sterk gestegen aantal internettransacties. Kort samengevat veroorzaken grote hoeveelheden data twee problemen. Enerzijds wordt het steeds lastiger om al die data logisch of fysiek op te slaan, anderzijds wordt het steeds moeilijker om zin en onzin te scheiden en de werkelijk relevante data en informatie te vinden en te filteren uit de dagelijkse informatielawine die op ons afkomt. Ten slotte is het natuurlijk een vorm van kapitaalvernietiging dat er niet adequaat gekapitaliseerd kan worden op die toename van data en databronnen - wat in potentie een schat aan toegevoegde waarde herbergt.
5
Sleutel tot concurrentievoordeel Ons onvermogen om die dagelijkse Mount Everest aan data te verwerken, vormt een formidabele beperking. Niet alleen voor overheden, wetenschappers of voor wie adequaat wil zoeken op het internet, maar ook voor financials en het bedrijfsleven. Big Data kan immers een onderscheidende factor zijn voor een onderneming in een sterk concurrerend landschap. Volgens adviesbureau McKinsey verhoogt effectief gebruik van data en Analytics de productiviteit, winstgevendheid en marktwaarde van bedrijven met 5 a 6%. En dat betekent dat in sommige industrieën en sectoren strategische inzet van data-analyse het
© 2012 AnchorMen
Effectief de informatieberg te lijf!
Pagina 5 van 11
verschil kan maken tussen winst en verlies. Uit een studie van het Massachusetts Institute of Technology blijkt zelfs dat bedrijven die op een slimme manier gebruik maken van Analytics 260% meer kans hebben om tot de best presterende bedrijven in hun sector te behoren. Plus dat ze anderhalf keer meer omzet kunnen realiseren. Big Data is dus van vitaal belang voor het voortbestaan van een onderneming. Concurrentievoordeel of onderscheidend kan vele gezichten hebben: een beter begrip van klantvoorkeuren, verhoogde opbrengsten, kostenreductie, inzicht in jurisprudentie, verscherpte marketing door behavioral targeting, ontwikkeling van nieuwe producten, diensten of businessmodellen, analyse van sentiment of van het virtuele winkelwagentje en het zoeken naar en aggregeren van relevante gebeurtenissen in een logfile. Maar Big Data Analytics kunnen ook bijdragen aan het bedrijfsresultaat doordat het fraudedetectie vergemakkelijkt of financiële processen verbetert. Zo veel bedrijven, zo veel Big Data toepassingen: elke branche kent zijn succesverhalen. Een kleine greep:
© 2012 AnchorMen
Zo bieden sommige hotelketens hun bezoekers een luxere kamer wanneer ze positief tweeten over het hotel. Zonder Big Data Analytics een heilloze weg: per minuut worden er zo`n 98.000 Tweets gepost;
Een exploitant van windmolens analyseerde 2,8 petabytes aan klimaatdata waarmee het bedrijf in staat was om de reactietijd van windturbines op weersvoorspellingen van weken naar uren terug te brengen en zo de energieopbrengst te maximaliseren;
Luchtvaartmaatschappij KLM boekt grote successen met haar zogeheten Meet & Seat-methode waarbij de LinkedIn of Facebook-account van reizigers aan hun zitplaats gelinkt kan worden en ze zelf interessante medereizigers kunnen uitkiezen;
Het Amerikaanse warenhuis Target voorspelt op basis van analyses van oriëntatie- en aankoopgedrag of vrouwelijke klanten zwanger zijn en in welke week ze gaan bevallen. Target speelt daar vervolgens behendig op in door op de juiste momenten babyproducten in de aanbieding te doen;
Lowe bestudeerde de relatie tussen betrokkenheid, beloning, managementeffectiviteit en omzet van al haar winkels. Het bedrijf beschikt nu over een gevalideerd model dat managers helpt bij het nemen van beslissingen over leiderschap, organisatieontwerp en opleidings- en trainingsprogramma's. De effecten op de omzet per winkel zijn groot. Wanneer een winkel onderpresteert kan het HR-analytics team snel achterhalen op welk punt actie ondernomen moet worden;
Een verzekeringsmaatschappij ontwikkelde een aantal maatstaven die het aannemen van de beste salesmensen ondersteunen. Bij een analyse ontdekte de maatschappij een groot aantal niet voor de hand liggende factoren die met goede salesprestaties correleren. De werving werd hierop aangepast wat leidde tot een productiviteitsverbetering met 20%;
Ontmoedigend voor de betrokken wetenschappers, maar zeer illustratief: het decoderen en in kaart brengen van het menselijke genoom nam 10 jaar in beslag. Met Big Data had de klus naar schatting in een week geklaard kunnen zijn;
Effectief de informatieberg te lijf!
Pagina 6 van 11
6
Het voorraadmanagementsysteem van het Amerikaanse Wal-Mart vertelt leveranciers precies hoe de verkoop van hun producten verloopt. Sommige grote leveranciers zijn zelfs volledig verantwoordelijk gemaakt voor het voorraadbeheer en verkopen hun product pas bij Wal-Marts kassa`s. Niet alleen stroomlijnt Wal Mart de keten door leveranciers van waardevolle informatie te voorzien, door uitbesteding van het voorraadbeheer elimineert de onderneming het risico van onverkochte voorraden;
De Zwitserse telecomaanbieder Cablecom merkte dat veel klanten hun abonnement na 13 maanden opzegde. Analyse toonde aan dat de afdeling Klantenservice in de negende maand opmerkelijk meer telefoontjes ontving van klanten die later zouden opzeggen. Cablecom bood daarop klanten in de zevende maand een speciale aanbieding aan wanneer ze hun abonnement verlengden. Het klantverloop werd daarmee binnen een jaar teruggebracht van 20% naar 5%.
Tien generieke misvattingen Elk concept of vakgebied dat nog in de kinderschoenen staat, heeft te maken met hardnekkige misvattingen en vooroordelen. Dat geldt natuurlijk ook voor Big Data. Een paar van de meest voorkomende misvattingen en vooroordelen op een rijtje: Misvatting 1: Big Data is een pure IT-aangelegenheid. Het tegendeel is waar. Big Data is eerder een taak van de business dan voor de IT. Immers, Big Data draait om het stellen van de juiste vragen vanuit de business. En dus hoort de meeste knowhow ook vanuit de business te komen en niet vanuit IT. Wat overigens niet wegneemt dat IT een belangrijke component van Big Data is. Het is echter essentieel om van meet af aan de business bij Big Data te betrekken - Big Data moet immers toepassingen voor business gebruik opleveren. Misvatting 2: De techniek er nog niet klaar voor. Ook deze bewering kan naar het rijk der fabelen verwezen worden. Technisch gezien kan op dit moment bijna iedere vraag vanuit de business met behulp van Big Data technologie beantwoord worden. De techniek is er, het probleem is dat nog niet altijd de juiste vragen gesteld worden of dat de techniek niet op de juiste manier toegepast wordt. Misvatting 3: Big Data is een kwestie van implementatie. Net als bij elke andere systeemimplementatie geldt ook bij Big Data dat de implementatie ervan eigenlijk pas het begin is. Een goed Big Datasysteem wordt continu ververst en doorontwikkeld en is daardoor eigenlijk nooit af. Misvatting 4: Big Data betekent een forse investering in hardware. Big data behoeft echter geen nieuwe hardware want het draait op commodity hardware terwijl de meeste benodigde software open source is. Wel moet ervoor gezorgd worden dat de infrastructuur en storage op Big Data toegerust zijn. Daarbij moet wel opgemerkt worden dat Big Data meestal om zulke groten aantallen/hoeveelheden gaat dat er eigenlijk altijd meerdere fysieke machines nodig zijn. Traditionele enkelvoudige serveroplossingen kunnen problemen opleveren. Weliswaar draaien Big Data platforms op dezelfde hard- en software en hoeft de traditionele serveroplossing op zich geen beperking te zijn, de flexibiliteit
© 2012 AnchorMen
Effectief de informatieberg te lijf!
Pagina 7 van 11
en capaciteit van bestaande infrastructuren kunnen ontoereikend zijn. Bedrijven die beginnen met Big Data en een dataset gaan aanleggen, zullen daar een infrastructuur voor moeten creëren en moeten niet zomaar aannemen dat de bestaande infrastructuur het `er wel even bij` kan. Misvatting 5: Big Data is hetzelfde als Business Intelligence. Er bestaan grote verschillen tussen Big Data en Business Intelligence. Allereerst werd Business Intelligence jaren terug gedreven vanuit leveranciers, terwijl Big Data nu vooral gedreven wordt door de markt. Een ander verschil is dat de query’s bij Business Intelligence bedoeld zijn voor één database of voor één machine. Bij Big Data wordt de taak juist afgevuurd op een reeks aan servers en speelt ongestructureerde data een veel grotere rol. Business Intelligence, het analyseren van neutrale gegevens tot bruikbare informatie, is eerder een onderdeel van Big Data, dat zich vooral toelegt op het hanteerbaar maken van enorme hoeveelheden gegevens. Misvatting 6: Big Data levert vooral iets op voor het bedrijf zelf. Big Data kan zichzelf niet alleen snel terugverdienen door een betere besluitvorming, veel informatie is verhandelbaar. Zo heeft Nike een app waarmee hardlopers hun prestaties en de afgelegde route kunnen aflezen. Op een populair traject kunnen ze daarmee echter ook zien waar de meeste lopers pauzeren. Die data kunnen interessant zijn voor een horeca-uitbater die daarop wil inspelen. Misvatting 7: Big Data is een one man show. Helaas bestaat de ideale Big Dataexpert niet. Wie serieus met Big Data aan de slag wil, moet met een uitgebalanceerd team werken dat bestaat uit een datawetenschapper, een dataanalist, een informatiespecialist en een ontwikkelaar om alles op te zetten en draaiende te houden. Misvatting 8: Big Data moet groots aangepakt worden. Het is een hardnekkig misverstand dat Big Data hetzelfde betekent als ‘Big Project’. Hoewel een Big Data systeem uiteindelijk sterk kan groeien, kunnen IT-managers er al klein en onafhankelijk mee beginnen. Het is zaak om vooral niet alles tegelijk te willen doen. Verstandig is om te experimenteren met een actuele vraag die binnen de business speelt. Maar een Big Data oplossing dient niet toegepast te worden omwillen van onderzoekend leren. De overhead is dusdanig dat er wel concrete aanleiding uit diversiteit, hoeveelheid of complexiteit van data moet zijn. Dit pleit overigens sterk voor een projectaanpak aan de hand van SCRUM/Agile-achtige werkmethoden. Misvatting 9: Big Data wordt nog nauwelijks toegepast. Hoewel Big Data hier en daar nog een hoog hypegehalte kent, is de bewering verre van waar. Naast de reeds genoemde voorbeelden zijn in Nederland veel bedrijven te vinden die intensief gebruik maken van Big Data zoals netwerkbeheerder Alliander, Rabobank, de politie, Bol.com en energieleverancier Essent. Het grootste misverstand is te denken dat “het allemaal niet zo`n vaart zal lopen”. Big Data is een harde realiteit en conservatieve IT-beslissers die dat ontkennen zou wel eens een zelfde lot beschoren kunnen zijn als fotofabrikant Kodak die niet tijdig het belang van digitale fotografie onderkende. Misvatting 10: Big Data is een alternatief voor een conventionele database zoals MySQL of MSSQL. Een Big Data oplossing is fundamenteel anders van opzet en toepassing dan een traditionele database. Elke dataset die in een normale database te beheren is, is eigenlijk uit te sluiten als Big Data probleem. Big Data oplossingen komen meestal voort uit uitbreidingen of combinaties van bestaande
© 2012 AnchorMen
Effectief de informatieberg te lijf!
Pagina 8 van 11
datasets met voorheen als onbeheersbare bestempelde data. Of komen voort uit nieuwe manieren van denken en meten waardoor onbeheersbare grote datasets ontstaan. Met betrekking tot dataopslag kennen Big Data oplossingen altijd een hybride opzet. Dit is een randvoorwaarden wil de totaaloplossing goed functioneren. Er wordt dus gewerkt met combinaties van zowel SQL als NoSQL
7
Zelf aan de slag met Big Data Elk bedrijf, groot of klein, kan een begin maken met Big Data. Voor IT-managers gelden wel vier do’s en dont’s wanneer ze de basis te leggen voor het effectief werken met Big Data en om te anticiperen op de toekomst.
7.1
Inventariseer gegevens Vrijwel elke organisatie heeft in potentie toegang tot een continue stroom van ongestructureerde data, of deze nu komen van sociale netwerken, eigen marktonderzoek of van sensoren op een productievloer. Dat een organisatie deze stortvloed aan informatie produceert, betekent echter niet automatisch dat er richtlijnen bestaan om elke byte te bewaren en te gebruiken. Het is dan ook vaak aan de IT-manager om te bepalen welke data wel en welke niet opportuun zijn voor de organisatie en niet toe te geven aan de neiging alles te willen bewaren. In eerste instantie is een inventarisatie van intern gegenereerde dan ook noodzakelijk, daarna kunnen eventueel externe databronnen aangewend worden om kennislacunes aan te vullen, zodat IT de organisatie van bruikbare inzichten kan voorzien. Is die inventarisatie een feit, dan kan IT beginnen met enkele zeer gerichte projecten waarmee heldere, bruikbare resultaten geleverd worden, in plaats zich van meteen in grootschalige en allesomvattende Big Data projecten te storten.
7.2
Laat de business leidend zijn Voor een initiatief dat zo groot en gevarieerd is als Big Data is samenwerking tussen business en IT randvoorwaardelijk. Zo werden veel van de eerste echte Big Data initiatieven buiten IT in gang gezet. Denk hierbij aan marketingafdeling die de datastromen van de sociale media bestudeert om meer inzicht te krijgen in klantwensen en aankooptrends. Toch blijft het de verantwoordelijkheid van de IT om de regie te nemen over zaken als data sharing en data federation concepten die essentiële componenten zijn van een Big Data strategie. IT-managers moeten er van uit gaan dat Big Data initiatieven grote veranderingen met zich meebrengen in server en opslag infrastructuur en in informatiemanagement architectuur. Het is dus zaak dat ze hun systemen moeten uitbreiden om de sterk groeiende hoeveelheid gestructureerde en ongestructureerde data te kunnen huisvesten en verwerken. En dat betekent weer dat er gezocht moet worden naar een aanpak om systemen zowel uitbreidbaar als schaalbaar te maken, en dat er een roadmap ontwikkeld moet worden voor de integratie van alle ongelijksoortige systemen die de Big Data analyse zal voeden. Veel organisaties beschikken immers nog steeds over ongelijksoortige, alleenstaande systemen voor bijvoorbeeld payroll, klantenbeheer en marketing. CIO's moeten dus echt een
© 2012 AnchorMen
Effectief de informatieberg te lijf!
Pagina 9 van 11
strategie klaar hebben om deze ongelijksoortige, alleenstaande systemen samen te brengen en zo ‘een systeem van systemen’ te bouwen.
7.3
Werk aan technologiekennis Werken met Big Data betekent ook dat CIO`s en IT-managers moeten werken aan hun technologische kennis. Veel van de bij Big Data gebruikte technologieën zijn relatief onvolwassen open source technologieen en tools waarvoor mensen met specifieke vaardigheden en kennis vereist zijn. Een basaal inzicht in deze technologieën en tools is noodzakelijk om weloverwogen beslissingen te nemen over Big Data initiatieven.
7.4
Bereid medewerkers voor Veel IT-organisaties hebben een pijnlijk gebrek aan analytisch talent dat geschikt is om de volgende stappen te zetten in Big Data. Zo voorspelt McKinsey dat tegen 2018 alleen al in de VS vraag zal zijn naar 140.000 tot 190.000 extra experts in statistische methodes en data-analysetechnieken. Een van de functies waar mensen voor gezocht zullen worden: die van datawetenschapper. Voorts voorziet McKinsey dat er aan de business of de technische kant van ondernemingen nog eens 1,5 miljoen managers met specialistische datavaardigheden zoals voorspellende analyses en statistieken moeten komen. Niet alleen in termen van werving en selectie van talent ligt er een uitdaging, ITmanagers moeten zelf ook veranderen willen ze in deze nieuwe wereld een rol van betekenis blijven spelen. Waren in het verleden de beste technologieleiders informatiebeheerder en deels infrastructuur ontwerper, de IT managers van de toekomst zullen een combinatie zijn van datawetenschappers en business proces engineers. Zijn CIO’s nu gewend een infrastructuur te managen op basis van een gegeven instructieset vanuit de business, in de toekomst moeten ze in staat zijn kansen te herkennen en van daaruit innovatief gebruik van informatie te stimuleren.
8
© 2012 AnchorMen
Big Data: De zaken op een rijtje
De hoeveelheid, complexiteit en diversiteit van data leidt in toenemende mate tot problemen op het gebied van zoeken, verzamelen, selecteren, opslaan, analyseren en interpreteren van data;
Partijen die niet optimaal kunnen kapitaliseren op de sterke groei van relevante informatie, missen niet alleen zakelijke kansen, maar kunnen ook achterstand op de concurrentie oplopen;
Big Data is een nieuwe manier om effectief met grote hoeveelheden informatie om te gaan, zowel op het gebied van opslag als in de analyse ervan;
Big Data oplossingen draaien op open source platformen zoals Hadoop, Cassandra en Mongo DB;
Effectief de informatieberg te lijf!
Pagina 10 van 11
De bestaande infrastructuur van traditionele servers en relationele databases kan problemen opleveren. Weliswaar draaien Big Data platforms op dezelfde hard- en software en hoeft de traditionele serveroplossing op zich geen beperking te zijn, de flexibiliteit en capaciteit van bestaande infrastructuren kunnen ontoereikend zijn. Bedrijven die beginnen met Big Data en een dataset gaan aanleggen, zullen daar een infrastructuur voor moeten creeren en moeten niet zomaar aannemen dat de bestaande infrastructuur het `erbij` kan.
Big Data oplossingen kunnen leiden tot een betere marketing door een beter begrip van klantvoorkeuren, verhoogde opbrengsten, kostenreductie, inzicht in jurisprudentie, behavioral targeting, ontwikkeling van nieuwe producten, diensten of businessmodellen, analyse van sentiment of van het virtuele winkelwagentje, het zoeken naar en aggregeren van relevante gebeurtenissen in een logfile, betere fraudedetectie en verbetering van financiële processen.
Wilt u meer weten over Big Data of een vrijblijvend advies over welke Big Data oplossing van AnchorMen interessant is voor uw bedrijf? Neem dan contact met ons op. Onze mensen. staan u graag te woord. U kunt ook rondkijken op onze website bigdata.anchormen.nl.
Over AnchorMen AnchorMen is een kwaliteitsleverancier van Business Web Apps en heeft de ambitie specialist te zijn op het gebied van Big Data diensten. Met een focus op resultaat, flexibiliteit en kwaliteit willen onze gedreven professionals u helpen enorme datasets te grijpen, op te slaan, te beheren en te analyseren. En u daarmee ondersteunen om actief in te spelen op de hedendaagse snelheid van veranderingen. AnchorMen is een technisch gedreven IT organisatie met een helder verhaal en een no nonsens houding. Bij het realiseren van Big Data oplossingen hanteren we dan ook een project gebaseerde en flexibele aanpak. Op basis van diverse standaard- en maatwerkoplossingen en aan de hand van een beproefde werkwijze bieden we u de helpende hand om met Big Data te werken. Vestiging Amsterdam Panamalaan 2K 1019 AZ Amsterdam 020 - 773 19 72 Vestiging Groningen (hoofdkantoor) Praediniussingel 41 9711 AE Groningen 050 - 311 52 22 bigdata.anchormen.nl
© 2012 AnchorMen
Effectief de informatieberg te lijf!
Pagina 11 van 11