Vereenvoudig e-discovery en compliance in het Big Data-tijdperk Een holistische benadering van informatiebeheer zorgt voor kostenvoordelen en beter risicobeheer voor juridische afdelingen en compliance-teams Emily Wojcik Product Marketing Manager
White Paper
Inhoud De Big Data-uitdaging ................................................................................................ 3 Overbrug de kloof tussen Big Data en archivering ..................................................... 4 Gezamenlijk optrekken op het gebied van dataconvergentie ..................................... 4 Zorgt Big Data voor een groot informatiebeheerprobleem? De tien belangrijkste vragen ................................................................................................... 6 CommVault Simpana OnePass™ .............................................................................. 7 Over CommVault ........................................................................................................ 8
Copyright © 2013 CommVault 2013 | All Rights Reserved
PAGE | 2
White Paper De Big Data-uitdaging De aanhoudende groei van Big Data blijft zorgen voor problemen bij organisaties die worstelen met de vraag hoe zij al die data het best kunnen bewaren, ontsluiten, doorzoeken en uiteindelijk (volgens wet- en regelgeving) verwijderen. Big Data is een punt van zorg voor verschillende betrokkenen in een organisatie: van de IT-afdeling tot Juridische Zaken. De IT-afdeling zit met de vraag hoe zij Big Data het best ondersteunt. Juridische Zaken moet Big Data geschikt zien te maken voor het toch al kostbare e-discovery-proces. Het grootste probleem van Big Data is het 1 enorme volume, veroorzaakt door een sterk groeiend aantal apparaten, databronnen en applicaties. IDC voorspelt dat er alleen al in 2013 4.200 petabytes aan nieuwe opslag nodig is om de datagroei voor te blijven. Groei wordt voor een belangrijk deel veroorzaakt door nieuwe dataretentie-eisen en wet- en regelgeving, zoals HIPAA en de Amerikaanse Freedom of Information Act (FoIA). Deze regelgeving eist van bedrijven dat ze sommige data voor een langere periode of zelfs voor onbepaalde tijd bewaren. 2
Volgens IDC , genereerden we in 2010 wereldwijd meer dan een zettabyte (ZB) aan data. Dat is een miljoen petabytes. In 2014 zal het aantal van 72 ZB bereikt zijn. Deze groei wordt deels gevoed door de snelle uitbreiding van door machines gegenereerde data. En een toenemend gebruik van geautomatiseerde handels- en transactiesystemen, intelligente meters en andere slimme instrumenten gecombineerd met miljoenen call-detail records (CDR’s) van mobiele telefoons en tablets, zorgen voor een immense groei van automatisch gegenereerde data. We zien tegelijkertijd een constant groeiende stroom van ongestructureerde data (bijvoorbeeld afbeeldingen en audio- en videobestanden) en semi-ongestructureerde bestanden (zoals e-mails, logbestanden etc.). Deze zorgen voor nog meer beheercomplexiteit. Hoe is al deze data het beste op te slaan, te organiseren, te beschermen en uiteindelijk te verwijderen? Vooral de noodzaak om data uit allerlei bronnen in de juiste context te bewaren, maakt dat voor organisaties steeds complexer. Al deze data kan zeer waardevol zijn, maar zonder een moderne databeheerstrategie kan een databerg ook enorme risico’s opleveren. Het doorzoeken van grote volumes Big Data om de juiste informatie te vinden, kan een organisatie miljoenen kosten. Zo geeft Big Data nieuwe invulling aan de uitdrukking ‘een speld in een hooiberg zoeken’. Het is duidelijk dat exponentiële datagroei, een grote diversiteit van datatypes en sterkere eisen aan retentie en discovery zorgen voor de ‘perfect storm’ als we geen werk maken van een holistische benadering voor Big Databeheer. Dat begint met een strategischer kijk op databack-ups en archivering, en het inzetten van geïntegreerde oplossingen. Dan zijn storagekosten te verlagen en compliance-risico’s te verminderen. Daarnaast is het nodig om ook naar de toekomst te kijken. Er is technologie nodig die inspeelt op de eisen van de business en voorziet in een flexibele en aanpasbare datastrategie. Daarmee is meer waarde te halen uit kritische informatie zonder de beperkingen van een technologie-lock-in.
1 2
Directions 2012, IDC’s 47th Annual Business Forecast, ‘The Race to Value Capitalizing on Big Data Hot Spots’, Rick Villars, maart 2012. IDC Whitepaper: ‘Rethinking your Data Retention Strategy to Better Exploit the Big Data Explosion’, Rick Villars, Marshall Amaldas, oktober 2011.
Copyright © 2013 CommVault 2013 | All Rights Reserved
PAGE | 3
White Paper Overbrug de kloof tussen Big Data en archivering Nog teveel organisaties hebben hun back-up en archivering in losse ‘silo’s’ ondergebracht. Dit is om verschillende redenen niet erg praktisch. Voor het beheren van deze silo’s zijn verschillende typen hard- en software nodig. Dat leidt tot dubbele kopieën. Daarnaast leidt wet-en regelgeving om data te bewaren en te kunnen doorzoeken, tot nog meer silo’s en in het slechtste geval tot het oneindig bewaren van data, omdat de organisatie geen overzicht meer heeft van welke data precies is opgeslagen. . De grote variëteit van databronnen – zoals audio, video op desktops, laptops en mobiele apparatuur – zorgt voor nog meer hoofdpijn in termen van kosten en risico’s. Deze problematiek wordt nog verergerd doordat dataprotectie en dataopslag bij organisaties vaak gescheiden is. In de meeste gevallen zijn storage- en back-upbeheerders verantwoordelijk voor de dataprotectie. Zij kijken dan ook vooral naar de impact van Big Data op back-upwindows, recovery-SLA’s en infrastructuurkosten. Informatiebeheerders richten zich echter vooral op de effecten van Big Data op retentie, discovery en informatie-governance policies. Zij kijken vaak niet naar de operationele effecten van die 3 policies, wat zorgt voor een kloof tussen beiden. Volgens Gartner vult back-up archivering aan en vice versa. Toch spreken back-upbeheerders en informatiearchitecten niet dezelfde taal. Daarnaast spelen tools en technologieën vaak in op slechts een van beide disciplines. Hoewel back-up en archivering verschillende doelen dienen, is de functionaliteit van beide vergelijkbaar: beide processen zorgen voor een kopie van de originele data voor herstel of opslag. Gartner voorspelt dan ook dat de mogelijkheid om back-up en archivering holistisch te benaderen, de belofte in zich heeft van aanmerkelijke 4 kostenvoordelen en voordelen op het gebied van risicobeheer . De convergentie van back-up en archivering is een opkomend concept. Het krijgt steeds meer aandacht van organisaties die op zoek zijn naar manieren om het aantal kopieën voor back-up en archivering te reduceren. Ook willen ze meer lijn brengen in policies voor datatoegang. Gezamenlijk optrekken op het gebied van dataconvergentie Gezien de beperkte budgetten en schaarse middelen en het belang van goed informatiebeheer, lijkt de mantra van dit moment: ‘meer doen met minder’. Dat is onder andere mogelijk door back-up en archivering samen te voegen. Dit betekent wel het combineren van teams zodat te voldoen is aan de eisen van alle betrokkenen in een organisatie. De eerste stap is het creëren van meer begrip over hoe gebruikers, applicaties en kritische bedrijfsprocessen toegang nodig hebben tot data gedurende de levenscyclus ervan. Dit vraagt om samenwerking tussen de business en de ITafdeling die verantwoordelijk is voor zowel recovery als discovery. Deze groep moet gezamenlijk onderzoek doen naar alle policies en procedures voor het verplaatsen, kopiëren, catalogiseren en ontsluiten van data voor back-ups, retentie, recovery, discovery en plaatsing. Dit proces leidt ertoe dat veel drempels voor gestroomlijnde toegang tot individuele en bedrijfsdata zichtbaar worden. Tegelijkertijd is het mogelijk om vast te stellen waar een beperkt inzicht in vitale data leidt tot ongewenste compliance- en governance-risico’s. Een andere bekende uitkomst van dit reviewproces is de eyeopener dat er op verschillende plekken verschillende kopieën van data te vinden zijn: op fysieke en virtuele servers, in de cloud, in back-up-repositories, in juridische en IT-archieven, en op desktops en mobiele apparatuur van medewerkers. Hoewel deduplicatie kan zorgen voor het terugdringen van redundante kopieën, is het grootste voordeel te behalen uit het consolideren van data in een enkelvoudige datastore. Die is gebaseerd op een standaardhardware- en/of software-infrastructuur voor back-up en archivering. Het concept van een enkelvoudige data-repository die redundantie en silovorming voorkomt, is om verschillende redenen aantrekkelijk. Een holistische benadering ‘vangt’ de data eenmalig en hergebruikt die vervolgens voor bescherming en bewaring. Deze aanpak is cruciaal om de juiste data op het juiste moment in handen te geven van de juiste mensen, zodat de data waarde oplevert voor de business. Daarnaast biedt een repository snelle e-discoveryzoekmogelijkheden voor juridische teams. Een enkelvoudige opslag zorgt er ook voor dat bij een zoekopdracht alle databronnen betrokken worden en snel beschikbaar zijn voor een externe deskundige. Verder levert een centrale aanpak voordelen op bij het verwijderen van data en het voorkomen van dubbele kopieën. Voldoende kennis van grote datapools om hier relevante subsets uit te halen voor pro- en reactieve e-discovery, leidt ook tot grote kostenvoordelen en risicovermindering.
3 4
Gartner, ‘Does Integrated Backup and Archiving Make Sense?’, Dave Russell en Sheila Childs, maart 2012. Idem.
Copyright © 2013 CommVault 2013 | All Rights Reserved
PAGE | 4
White Paper Een bijkomend voordeel van een convergente dataprotectie- en retentiestrategie is gecentraliseerde rapportage. Daarmee zijn door de business en de IT-afdeling beter gefundeerde beslissingen te nemen en betere analyses te maken. Organisaties verbeteren ook het inzicht in de bedrijfsvoering door ingebouwde informatie- en analysetools die inzicht bieden in de rol van data voor de organisatie. Het belangrijkste voordeel is de mogelijkheid om een balans te creëren tussen het opslaan van te weinig en teveel data. Beide scenario’s zorgen voor risico’s. Met het juiste inzicht en de juiste tools is het mogelijk vast te stellen of alle databronnen binnen de organisatie bekend zijn. Dat geldt vooral voor de randen van het netwerk met laptops en mobiele apparatuur die vaak over het hoofd worden gezien. Met robuuste rapportage- en voorspellingstools is het makkelijker om forecasts, analyses en budgetten te maken met het oog op Big Data. Daarbij zijn geen concessies nodig op het gebied van integriteit, beveiliging, toegankelijkheid en accountability van data. Rapportage is in te zetten als tool in het e-discovery-proces en te gebruiken als methodiek voor datacollectie en -bewaring tijdens een juridisch geschil, een navraag van toezichthouders of een intern onderzoek.
De voordelen van de inzet van een geïntegreerde informatiebeheerstrategie hebben effect op alle geledingen in de organisatie, ook buiten de IT-afdeling. Met name de afdeling Juridische Zaken is in staat om de resultaten van een zoekopdracht met een muisklik te bewaren voor juridisch gebruik. Een ander voordeel ligt in lagere juridische kosten en risico’s, gecombineerd met nieuwe inzichten in bewijs eerder in het discovery-proces, door het elimineren van dubbele kopieën, waardoor kritische data sneller beschikbaar is. Medewerkers die verantwoordelijk zijn voor compliance, ervaren meer gemak bij het voldoen aan wet- en regelgeving door een beter overzicht van bestanden, gesynchroniseerde retentie, vereenvoudigde plaatsing en eenvoudiger supervisie, monitoring en auditing. Eindgebruikers werken makkelijker samen door het delen van passieve content binnen de gehele organisatie. In de wereld van Big Data is elke mogelijkheid om de tsunami van data te reduceren, een stap in de goede richting. Bedrijven die nog steeds back-ups gebruiken voor langetermijnretentie, zullen in de nabije toekomst steeds meer problemen ondervinden bij het ontsluiten van grote hoeveelheden informatie voor discovery en compliance. Daarnaast zijn er nog de extra risico’s van het opslaan van data in gescheiden silo’s, zonder de voordelen van een enkelvoudig platform voor bedrijfskritisch zoeken. Bedrijven die vooruitkijken en wel een omvattende benadering kiezen voor back-up en archivering, profiteren van alle voordelen van een toekomstvaste oplossing voor het beheren van back-ups en archieven. Daarbij is er altijd toegang tot verouderde bedrijfskritische data.
Copyright © 2013 CommVault 2013 | All Rights Reserved
PAGE | 5
White Paper Zorgt Big Data voor een groot informatiebeheerprobleem? De tien belangrijkste vragen 1.
Zijn uw bestandssystemen te groot voor een back-up?
2.
Gebruikt u back-ups voor recovery en langetermijnretentie?
3.
Verzamelt u back-up- en archiefdata in aparte productsilo’s?
4.
Kunt u tijdig voldoen aan interne en externe verzoeken op het gebied van discovery en/of compliance? Welke juridische of businessmiddelen zijn nodig om dezelfde taak uit te voeren?
5.
Zijn uw back-up- en archiefpolicies in lijn met elkaar en geautomatiseerd?
6.
Hebt u dubbele data in uw back-up- en archiefkopieën? Welke onnodige beheerkosten levert dat op?
7.
Hoe beheert uit alsmaar uitdijende data? Verzamelt u data uit alle bronnen inclusief remote desktops, laptops en mobiele apparaten? Wat is het risico als u kritische data aan de rand van het netwerk mist?
8.
Hebt u voldoende inzicht in vitale data om u te helpen bij belangrijke beslissingen of assessments?
9.
Kunt u nauwkeurig voorspellen welke impact Big Data heeft op uw back-up-, recovery- en retentieinfrastructuureisen in de nabije toekomst?
10. Is uw afdeling Juridische Zaken in staat om zelf te werken aan e-discovery-verzoeken? Gebeurt dat handmatig, terwijl er geschikte technologie beschikbaar is om dat anders te doen? Wanneer u een van deze vragen met ‘ja’ hebt beantwoord, is de kans groot dat u heel binnenkort te maken krijgt met een groot back-up- of archiveringsprobleem.
Copyright © 2013 CommVault 2013 | All Rights Reserved
PAGE | 6
White Paper CommVault Simpana OnePass™ CommVault biedt hulp. De OnePass™ feature in de Simpana-software speelt in op de uitdagingen van Big Data en biedt als eerste een convergent proces voor back-up, archivering en rapportering vanuit een enkele datacollectie en gemeenschappelijke infrastructuur. De noodzaak om kosten te beheersen bij archivering blijft nog wel enige tijd bestaan. Met de aanpak van CommVault voor convergente archivering, back-up en rapportage binnen één platform zijn kosten te verlagen, is de productiviteit te vergroten en data waardevol te maken. Reference Copy is in dit verband een contentgebaseerde retentiemogelijkheid met policygedreven regels voor krachtige retentie. Gebruikers kunnen de data die zij willen bewaren, en de manier van bewaren, zelf ontwerpen en op maat maken. Voor IT-teams betekent dit, dat de storage geoptimaliseerd is, aangezien alleen relevante data wordt opgeslagen. Voor juridische en compliance-teams is risicobeheer mogelijk, want alleen data die zakelijke, bewijs- of compliance-waarde biedt, wordt bewaard. Data die daar niet aan beantwoordt, is vanuit een bron te verwijderen. Alle TM beheerde data staat in de ContentStore . Die voorziet in een schaalbare, hardwareagnostische, virtuele repository gecombineerd met een intelligente index. Deze ondersteunt gelijktijdig dataprotectie, archivering en storageinfrastructuurrapportages (zie figuur 1). Vergelijking van drie aparte workflows met Simpana OnePass™
Figuur 1: Aparte policies en processen creëren verschillende data-repositories, wat leidt tot hogere kosten en meer risico. Simpana OnePass voorziet in enkelvoudige collectie voor rapportage, back-up en archivering.
Copyright © 2013 CommVault 2013 | All Rights Reserved
PAGE | 7
White Paper Door het leveren van back-up, archivering, zoeken en analyses vanuit één enkelvoudige applicatie en enkelvoudig platform biedt CommVault een betrouwbaar fundament voor een langetermijninformatiestrategie. De keus voor Simpana OnePass en voor CommVault levert de volgende voordelen op voor iedereen die betrokken is bij informatiebeheer: van IT tot en met Juridische Zaken. Lagere kosten, minder complexiteit en verbeterde bedrijfsvoering Elimineren van point solutions door deze te vervangen door het revolutionaire convergente platform van CommVault. Terugdringen van infrastructuurkosten en overall supportkosten. Consolideren van beheer en policies in één console voor maximale productiviteit. Reduceren van infrastructuurbelasting door minder verkeer en minder belasting van het bestandssysteem. Betere disk-I/O. Kleiner back-upwindow en betere serverprestaties. Hogere productiviteit van gebruikers en beheerders met optimale systeemprestaties en transparante eindgebruikerstoegang. Voldoen aan discovery- en compliance-eisen en verminderen van risico’s
Stroomlijnen van opslag, juridisch bewaren en algemene discovery voor juridische teams dankzij een ‘single query’ data-repository en centraal verwijderpunt. Reduceren van Big Data-volume en elimineren van dataredundantie tijdens reviewproces voor het verlagen van kosten van derden. Voorzien in kosteneffectieve langetermijnretentie om tegemoet te komen aan informatieregels van de overheid. Analyseren van data met ingebouwde rapportages om goed gefundeerde beslissingen te nemen over capaciteitsgebruik en datarelevantie voor retentie of verwijdering. Verbeterde toegang tot bedrijfsinformatie en hogere productiviteit.
Over CommVault Beter en effectiever invulling geven aan de huidige en toekomstige behoeften op het vlak van datamanagement. Dit is de visie op basis waarvan CommVault Singular Information Management-oplossingen voor krachtige databescherming, universele beschikbaarheid en vereenvoudigd beheer van data in complexe opslagomgevingen ontwikkelt. Organisaties hebben met de unieke single-platformarchitectuur van CommVault ongekende controle over datagroei en de kosten en risico’s. De Simpana-softwaremodules van CommVault werken naadloos samen en delen hun code en functieset. Hierdoor bieden ze krachtige mogelijkheden voor databack-up, archivering, replicatie, zoeken en resource-beheer. Elke dag opnieuw kiezen bedrijven voor de ongeëvenaarde efficiency, prestaties, betrouwbaarheid en controle die alleen CommVault levert. CommVault heeft zijn hoofdkantoor in het Amerikaanse Oceanport, New Jersey.
For more information about Simpana® software modules and solutions, and for up-to-date system requirements, please visit www.commvault.com www.commvault.com • 888.746.3849 • mailto:
[email protected] CommVault Worldwide Headquarters • 2 Crescent Place • Oceanport, NJ 07757 Phone: 888.746.3849 • Fax: 732.870.4525 CommVault Regional Offices • United States • Europe • Middle East & Africa • Asia-Pacific • Latin America & Caribbean Canada • India • Oceania © 1999-2013 CommVault Systems, Inc. All rights reserved. CommVault, CommVault and logo, the “CV” logo, CommVault Systems, Solving Forward, SIM, Singular Information Management, Simpana, Simpana OnePass, CommVault Galaxy, Unified Data Management, QiNetix, Quick Recovery, QR, CommNet, GridStor, Vault Tracker, InnerVault, QuickSnap, QSnap, Recovery Director, CommServe, CommCell, IntelliSnap, ROMS, CommVault Edge, and CommValue, are trademarks or registered trademarks of CommVault Systems, Inc. All other third party brands, products, service names, trademarks, or registered service marks are the property of and used to identify the products or services of their respective owners. All specifications are subject to change without notice.